Горошко Е.И.
Глава 4 Качественные методы анализа данных ассоциативного эксперимента
В целях изучения структуры ассоциативного поля и формализации процессов ассоциирования используются количественные методы анализа данных. К таким методам можно отнести методы математической статистики (корреляционный, факториальный, дисперсионный анализ), количественные методики измерения значений (эксперимент К. Нобла) и некоторые способы вычисления количественных характеристик ассоциативного поля (стереотипность реакций, объем ассоциативного поля и прочее).
При количественном анализе данных ассоциативного эксперимента ассоциативное поле, полученное на слово - стимул, может быть рассмотрено как упорядоченное множество взаимосвязанных частот. Взаимосвязь его элементов обуславливается их отношением к одному и тому же слову – стимулу, а упорядоченность поля носит концентричный характер: наиболее частотные реакции образуют ядро поля, единичные составляют периферию (Овчинникова, Штерн 1989).
Собственно первая математическая модель ассоциативного эксперимента была построена в работе А.И. Титовой (Титова 1975). По мнению автора, эксперимент по свободному ассоциированию представляет элементарную порождающую модель, которая позволяет изучать некоторые стороны речевой деятельности. Поэтому вполне возможно строгое обоснование закономерностей ассоциативного процесса - построение математической модели ассоциативного эксперимента и оценка в рамках этой модели надежности результатов и полноты словаря ассоциативных норм (Титова 1975, с.32).
Реконструируя математическую модель САЭ, автор рассматривает появление реакций как некоторое множество случайных событий. Одинаковые реакции информантов объединяются в одно событие. Тогда исходное множество преобразуется в систему событий А1, А2, Аi, , на которую для построения модели накладывается ряд ограничений:
- Реакции испытуемых определяются их индивидуальным опытом, формирующимся в процессе речевой деятельности и познания окружающего мира;
- Опыт речевой деятельности непрерывно накапливается, меняясь качественно и количественно;
- Количество возможных различных реакций на заданный стимул является достаточно большой, но конечной величиной (Титова 1975, с.с.32-33).
Автор также выстраивает свою модель, вводя следующее ограничение: состав испытуемых и условия проведения экспериментов должны быть достаточно однородны, т.к., например, при “произвольном подборе испытуемых воспроизводимость (устойчивость) результатов в серии экспериментов будет весьма сомнительной. Поэтому в вероятностном смысле ассоциативные нормы могут существовать только для тех испытуемых, речевой опыт которых накапливается в одинаковых условиях” (Там же). Таким образом, автор строит свою модель исходя из условий однородности выборки и условий проведения эксперимента, хотя, на наш взгляд, возможно и создание модели и без этих элиминирующих принципов.
Основываясь на предпосылке, что в САЭ нельзя гарантировать одинаковую вероятность появления одинаковых реакций у различных испытуемых, относительная частота появления соответствующей реакции при неограниченном увеличении числа испытуемых должна сходится по вероятности к среднему из вероятностей её появления у всех испытуемых (теорема Пуассона). Это отражается практически в увеличении дисперсии частот реакций у различных групп испытуемых по сравнению с тем гипотетическим случаем, в котором тождественные реакции различных испытуемых имели бы одинаковую вероятность появления.
Автор полагает, что если рассматривать данные ассоциативного эксперимента как случайную функцию от количества испытуемых, то тогда её модель изоморфна одной из важнейших схем теории вероятности – схеме последовательности независимых переменных. И тогда моделью полной характеристики ассоциативных связей слова – стимула будет распределение вероятностей Pi на множестве N различных реакций, а вероятность появления i - ой - реакции у n - испытуемых w раз будет рассчитываться по формуле:
где Qi = I – Pi
Если же учитывать простую асимптотическую зависимость, которая позволяет с заданной точностью определить указанные вероятности, то биноминальное распределение можно заменить на нормальное, т.к. в нашем случае от опыта к опыту не меняется средняя вероятность появления реакции:
где
Отклонение случайного значения частоты события Ai от своего среднего значения, выраженное в средних квадратичных отклонениях:
С помощью этой формулы мы можем оценить надежность оценки вероятности Pi , получаемой экспериментально. Для этого используется интеграл от выражения
- функция Лапласа, значение которой могут быть рассчитаны и сведены в таблицу:
К примеру, на стимул – прилагательное “яблоко” из 1000 испытуемых 417 отреагировали словом “красное”.
Следовательно, оценка относительной частоты , дисперсия , а среднее квадратичное отклонение
Задавшись теперь надежностью оценки, например, 0,9, находим соответствующий доверительный интервал. Считая отклонения в большую и меньшую стороны равновероятным, по таблице функции Лапласа ищется аргумент, которому соответствует ее значение . Это — 1,645. Тогда искомое отклонение будет равно 1,645 х 0,01483 = 0,0244, т.е. с вероятностью 0,9 оцениваемая вероятность лежит на интервале 0,417 ± 0,0244. Необходимое количество испытуемых при заданном доверительном интервале определяется по этой же схеме повторением вычислений в обратном порядке (Титова 1975, с. 35).
Отсюда следует, что расчеты по формуле:
при гарантийной вероятности Р2 = 0,99 дают следующую искомую величину для оценки необходимого количества испытуемых в ассоциативном эксперименте при относительной частоте Е = 0,1 – N = 1000 человек. Теперь становиться вполне понятным, почему объем ассоциативной выборки (ассоциативные нормы) равен тысяче испытуемым.
При проведении ассоциативного эксперимента также важно оценить устойчивость ассоциативных норм, т.е. вероятность того, что две реакции с частотами W1 W2, при повторении эксперимента будут зарегистрированы с частотами, пропорции которых сохранятся . Это может произойти, если вероятность будет меньше некоторого выбранного критического значения, также определяемого при помощи функции Лапласа:
Р12 = 0,5 + Ф0 (Х),
где
При этом:
Если мы получаем значение вероятности, превышающее 0,9, то рассматриваемые ранги местами не поменяются, т.е. соотношение частот сохранится.
Результаты, полученные А.И. Титовой, показали, что расчет устойчивости ранговой структуры спектров ассоциаций по показателю устойчивости (Pij) не противоречит расчету по методу рангового градиента ( w). Более того, в практическом использовании расчеты по методу рангового градиента, как показал опыт исследовательницы, доступнее и проще (Титова 1975).
Устойчивость всей ранговой структуры ассоциаций измеряется с помощью энтропии по формуле:
где S – количество различных реакций.
Кроме того, энтропией, вычисленной непосредственно по средним вероятностям появления реакции, можно оценить слово - стимул как дискретный источник информации, т.е. измерять, по К. Шеннону в некотором смысле, как много информации создается таким процессом, или, лучше, с какой скоростью она создается (Шеннон 1963, с. 259).
Формула измерения энтропии выглядит таким образом:
Вопрос стереотипности реакций затрагивается во многих исследованиях и является достаточно важным показателем особенностей вербального поведения испытуемых (Залевская 1979, Гасица 1990, Новикова 1998). Крайне широко этот показатель используется при межъязыковых сопоставлениях (Залевская 1979). Показатель или уровень стереотипности реакций может измеряться несколькими способами:
- высчитывается процент, который от общего количества реакций составляют три наиболее частые или самая частая реакция;
- вычисляется среднее количество разных реакций на предъявленный в эксперименте стимул (Залевская 1979, с.6).
В дополнение к показателю стереотипности вводится коэффициент разброса, под которым понимается соотношение минимального и максимального показателей стереотипности (Ершова 1998).
Уровень стереотипности реакций как параметр регистрации особенностей ассоциативного поведения информантов, так и показатель типологических различий между языками использовался при изучении:
- наличия изменений в уровне стереотипности реакций носителей одного и того же языка в одной стране (Jenkins, Russell, 1960);
- реакций детей разных возрастных групп (Kashu 1971, Marsalova 1972, 1974, Гасица 1990);
- реакций информантов из различных социальных и половозрастных групп (Rosenzweig 1964, Горошко 1997, 1998, 1999, 2000);
- данных ассоциативных экспериментов в разных языках (Залевская 1979);
- особенностей ассоциативного поведения испытуемых при экспериментальной установке реагировать “как все”, т.е. записывать ту реакцию, которую дало бы большинство носителей данного языка на предлагаемый стимул (Kurcz 1966).
Наиболее полно способы измерения уровня стереотипности реакций приведены в работе Н.А. Гасицы “Ассоциативная структура значения слова в онтогенезе”, посвященной, в том числе, и количественному вопросу данной проблемы (Гасица 1990).
Сначала автор подобно А.И. Титовой рассчитывает энтропию структуры реакций по формуле К. Шеннона:
где pi - статистическая оценка вероятности появления i-ой реакции на данный стимул (из опрошенных N человек реакция A появилась в ni случаях).
Собственно информация уменьшается с ростом вероятности появления реакции, и наоборот, самая частотная реакция содержит более значимую информацию. Более того, чем разнообразнее структура по количеству и группам реакций, тем больше H, чем более стереотипны реакции на стимул, тем меньше H. Определенная таким способом энтропия является величиной абсолютной. Это дает возможность сравнивать стимулы только между собой по показателю H, не имея данных о том, каково максимальное и минимальное значение H, то для большей наглядности результата исследования Н.А. Гасица ввела понятие относительной энтропии структуры реакций S, которая высчитывается по формуле:
где H - абсолютная энтропия структуры реакций данного стимула, Hmax - максимальная энтропия данной структуры, возможная при равновероятном распределении реакций (в случае, если все реакции встретились 1 раз) и определяемая через количество разных реакций R таким способом:
Далее Н.А. Гасица вводит понятие относительной энтропии, определяемое как отношение абсолютной энтропии к максимальной. Оценить стереотипность получаемых ответов можно сделать, сравнив данную величину с единицей.
Полагая, что на показатели стереотипности набора реакций в ассоциативном поле существенно влияют единичные реакции, Н.А. Гасица вводит еще два показателя Z и P - так называемые индексы степени ассоциативной направленности слова, чтобы максимально нейтрализовать влияние единичных реакций.
Чтобы подсчитать Z, нужно найти значение “отношения суммы квадратов численных значений ассоциаций к квадрату суммы численных значений ассоциации в дистрибуции”, а именно:
,
- Na - сумма численных значений ассоциаций (количество испытуемых),
- ai - численное значение ассоциации (частота реакции).
Результатом такого действия является положительное число, не превосходящее 1.
Значение Z возрастает с увеличением однозначности появления ассоциации в структуре реакции. При этом под увеличением однозначности понимается уменьшение количества разных реакций в дистрибуции или увеличение неравновероятности их появления. Таким образом, Z количественно характеризует некоторые внутренние особенности дистрибуций реакций на определенный стимул. На его основе производится оценка эквивалентности дистрибуции на разные стимулы.
Чтобы эффективно оценить ассоциативные данные, Н.А. Гасица использовала также модифицированную формулу определения степени ассоциативной направленности слова или индекс P, которая является характеристикой ассоциативного поля, отражающей способность стимула вызвать одну или возможно меньшее количество одинаковых реакций у испытуемых. Она характеризует, таким образом, стереотипность ответов испытуемых на данный стимул. Рассматриваемый индекс также как и Z изменяется от 0 до 1, увеличиваясь с возрастанием стереотипности ответов.
Вывод Р базируется на выражении для косинуса угла между радиусами-векторами точек А и В в некотором пространстве:
где ai и bi - соответственно i-компонента (координата) векторов А и В.
между вектором, все компоненты котором равны i, и вектором, компоненты которого равны ri составляет:
Его минимальная величина будет в том экстремальном случае, когда все ri, кроме одной, равны 0 (или пренебрежительно малы по сравнению с единственной rn):
и зависит от количества реакций R.
Для того, чтобы индекс Р был равен I в этом экстремальном случае и превращался в 0 при равенстве ri (количества ответов для всех реакций):
модифицируем выражение в:
Подставим количество испытуемых и, упростив выражение, получаем:
где: N - количество испытуемых;
R - количество разных реакций;
M - модуль, равный:
где ri - количество ответов на все реакции.
Отдельную проблему представляет и вопрос о полноте словаря ассоциативных норм. Этот вопрос можно переформулировать иначе: “Как оценить возможное количество различных реакций на заданный стимул?”
Если использовать функцию Лапласа и считать, что вероятности Р1, Р2, ..., Рn распределены равномерно, то количество различных состояний случайного процесса порождения ассоциаций будет пропорционально его размаху. Размах же распределения одномерной плотности вероятности может быть высчитан по формуле:
где R’ - размах: наиболее существенной части распределения, а M{S(n)} - в нашем случае среднее количество ассоциаций в эксперименте с n - испытуемыми. Для того чтобы воспользоваться приведенной выше формулой, нужно построить по частотному списку реакций информантов рандомизированную зависимость ширины спектра ассоциаций от количества информантов, полагая распределение ассоциаций с одинаковыми частотами на интервале (0, ) равномерным. Так как необходимым условием появления в эксперименте всех возможных реакций является отсутствие единичных реакций, то отнесем к наиболее существенной части распределения частоты u> 3. Тогда соотношение реакций с частотами wi = 1 и wi = 2 будет характеризовать степень полноты словаря ассоциативных норы. Следовательно, в качестве отправной точки на рандомизированной кривой M{S(n)} мы можем взять M{S(n/3)}. В этом случае:
т.к. производная от M{S(n)} в данной точке численно равна тангенсу угла наклона к горизонтальной оси касательной к M{S(n)} в этой же точке, и окончательно
- где а - количество различных реакций;
- а1 - количество единичных реакций;
- а2 - количество реакций с частотой 2.
Среднее квадратичное отклонение этой оценки будет:
(Титова 1975, с. 37-39).
Оценка направленности распределения реакций в ассоциативном поле с помощью энтропии предлагается и в работе И.Г. Овчинниковой и А.С. Штерн (Овчинникова, Штерн 1989), где предлагается определять ассоциативную силу стимула как величину, обратную мере неопределенности (энтропии):
V как величина, обратная энтропии, отражает меру ассоциативной определенности, понимаемую как способность слова-стимула вызывать определенные частотные реакции. Чем больше значение H у стимула, тем меньшей ассоциативной силой оно обладает. В работе также приводятся границы варьирования v ста девяноста шести стимульных слов, входящих в САНРЯ.
Было подсчитано, что в целом v изменяется от 0,13 бит до 0,3 бит, средняя V русского слова таким образом равна 0,2 бит. По материалам САНРЯ, самая большая ассоциативная сила (0,32) у прилагательного “настоящий”, а самая маленькая у прилагательного “большой” (Овчинникова, Штерн 1989, с.113).
Далее исследовалось распределение энтропийных оценок, которое является похожим на нормальное, что говорит об отсутствии какого-либо одного сильного фактора, влияющего на ассоциативную силу слова. С помощью дисперсионного анализа определены факторы, влияющие на ассоциативную силу V русского слова. Было установлено, что V зависит:
- от принадлежности слова к определенной части речи (наименьшей ассоциативной силой обладают глаголы);
- от количества ЛСВ слова (чем больше у слова ЛСВ, тем выше V);
- от количества семантических множителей (семантических признаков) слова (чем их больше, тем выше V);
- от степени конкретности значения слова (V выше у слов с конкретным значением);
- частотность слова абсолютно не влияет на его ассоциативную силу.
Аналогичная проблема рассматривалась и в работах В.В. Левицкого, исследующего ассоциативный набор слова и факторы, оказывающих влияние на его однородность (Левицкий 1971, 1992). Под ассоциативным набором слова (АНС) В.В. Левицкий понимает ассоциативное поле или же совокупность всех реакций на некоторый стимул. Ученый высказывает гипотезу, что АНС может быть подвержен влиянию целой группы факторов, в т.ч. и случайных. Свойство ассоциативного поля (а точнее стимульного слова) порождать одинаковые (устойчивые) реакции и различные В.В. Левицким было обозначено как гомогенное. Гомогенность АНС измеряется с помощью формулы:
где M – искомая величина,
- сумма различных слов реакций,
N – число участников эксперимента.
Исследуя влияние на параметр гомогенности целого ряда факторов (например, профессии, возраста и пола) и, проверяя полученный результат статистически, ученый пришел к выводу, что самым гомогенными стали реакции филологов, а подъязык биологов был самым неоднородным. Выяснилось также, что женские ассоциативные поля по своей природе более однородны, чем мужские. Что бы проверить корреляцию нескольких факторов (влияние части речи предъявляемого слова – стимула, языка и прочее) величины коэффициентов гомогенности были проранжированы и сравнены путем вычисления коэффициентов ранговой корреляции с величинами, характеризующими частотность и число значений слова (Левицкий 1992, С.60). Было установлено, что ни частотность слова, ни количество его значений не влияют на однородность ассоциативного поля. Последнее утверждение, как мы видим, противоречит результатам, полученным в работе И.Г. Овчинниковой и А.С. Штерн (1989), и, по-видимому, нуждается в дальнейшей проверке, что подчеркивает и сам автор исследования.
Количественные методы анализа были использованы Л.В. Барсук при межъязыковом сопоставлении идентификационных стратегий некоторых широкозначных слов – коррелятов (Барсук 1991). Исследование было проведено на базе 13 языков из различных языковых семей. Было выявлено 7 типов идентификационных стратегий слов и для каждого слова – коррелята был построен характер распределения идентификационных стратегий и подсчитан средний коэффициент парной корреляции.
(Барсук 1991, с.57)
По приведенной таблице можно судить, что самая распространенная стратегия опознания слова – его описание, т.е. идентификация коррелята непосредственно через его признаки. Затем следует субординантная опознавательная стратегия. Причем вне зависимости от типа языка идентификация объекта через его признак, судя по количественным показателям, превалирует. Степень совпадения стратегий рассчитывается с помощью коэффициента парной корреляции. Стратегия расчета следующая: сначала сравниваются стратегии у двух отдельно взятых слов – коррелятов и на их основе по приведенной ниже формуле рассчитывается этот коэффициент:
Где r – коэффициент парной корреляции;
x и y - значение вариационных рядов;
n – число значений в ряду.
(Барсук 1991, с.59)
Л.В. Барсук приводит и расчет среднего коэффициент парной корреляции для каждого слова, или, иначе говоря, коэффициент корреляции данного слова со всеми другими словами данной группы слов-коррелятов в среднем. Для этого нужно сложить все 12 коэффициентов в ряду и разделить сумму на 12, т.е. вычислить среднее арифметическое. Средние коэффициенты для каждого слова-коррелята приведены в крайнем правом столбце таблицы. При этом чем больше величина среднего коэффициента, тем типичнее характер распределения идентификационных стратегий данного слова для группы коррелятов. Следовательно, наиболее типичным является распределение идентификационных стратегий, наблюдаемое у французского слова fleur, наименее типичным - у английского слова flower, взятого из ассоциативного тезауруса Киша (АТНАЯ).
Использование количественных методик позволило автору работы сделать вывод “о достаточно высокой степени совпадения особенностей идентификации аналогичных понятий у носителей разных языков в условиях ассоциативного эксперимента” (Барсук 1991, с.60).
Количественный метод анализа был применен и для выяснения того факта, на сколько ассоциативные ядра (самые частотные реакции) могут пересекаться. Для этого было введено понятие “коэффициента пересечения ассоциативного ядра” и проанализирован целый ряд ассоциативных ядер по совпадению самых частотных реакций в поле. Была выполнена и противоположная задача – высчитывалась степень расхождения реакций в ассоциативных полях (Григорьев, Кленская 2000). Для её вычисления была предложена такая формула:
где W – показатель близости между 1-й и 2-й группами испытуемых;
K – общее количество различных ассоциаций в группах;
fi1, fi2 – частоты i – той ассоциации в первой и второй группах.
Данная формула работает в случаях, когда объем выборок – одинаков. Если же мы имеем дело с выборками разного объема, то тогда формула приобретает вид:
где N1 и N2 – объем первой и второй выборок.
При этом, как следует из предлагаемой формулы, значение W может колебаться от 0 (в случаях, когда ни одна реакция в ассоциативных полях не совпадает) до 1 (когда мы по сути дела “работаем” с тождественными полями). Данный показатель был применен авторами исследования к изучению ассоциативного поведения эстонско-русских билингвов и эстонских монолингвов.
Количественные методы успешно применяются и для изучения структуры всего корпуса ассоциативного тезауруса (Караулов, Коробова 1993, Караулов 1994б, 1996, Соколова 1999).
Так, заслуживает внимание квантитативно - системный подход к ассоциативному тезаурусу ребенка, предложенный в диссертационном исследовании Т.В. Соколовой (Соколова 1999). В основу подхода положена частотность реакции как лингвистической категории, на которой строится квантитативно - системное описание. Здесь с помощью количественной методологии решаются вопросы:
Какое количество минимальных смысловых единиц (семантем) необходимо ребенку для составления “языковой наивной картины мира?
Какова их структурная организация?
Каково распределение семантем в системе тезауруса?
В какой мере частотное устройство ассоциативного тезауруса ребенка соответствует обычным частотным “взрослым” словарям? (Соколова 1999, с.30).
Анализируя ранговое и спектральное распределение частот реакций, исследовательница выстраивает модель частотной структуры тезауруса. Он представлен 122 рангами, образующими 25 рядов. Т.В. Соколова вводит также понятие “стратификации” – аналитической операции по расчленению ассоциативного тезауруса на страты в зависимости от частоты единиц, “компрессии” - степени сжатия банка ассоциативных реакций до комплекта минимальных семантических единиц – семантем, “грамматикализации семантем” - развертывание лексем в реакции, “реккурентности” - степени рассредоточенности (покрытия) и “ассоциативного распределения” – совокупности реакций на полученный вербальный стимул, обозначающий фрагмент “наивной” языковой картины мира (Соколова 1999). Последнее понятие синонимично понятию ассоциативного поля или ассоциативного набора слова.
Модель выглядит таким образом:
Ассоциативный тезаурус ребенка состоит из некой совокупности концептов (самых частотных реакций). Самые распространенные детские стратеги реагирования – это молчание или отказ от ответа. Одной из самых частотных ассоциаций стало слово “играть”, и, по мнению Т.В. Соколовой, оно является центром вербальной ассоциативной сети ребенка и именно концепт “игры” выступает как мерило ценности всего окружающего в данном возрасте.
“Ядро русского языкового сознания”, вычлененное по материалам, полученным от взрослых испытуемых (данные АТСРЯ) - человек – дом – хорошо – большой – говорить - формируется на самых ранних этапах онтогенеза. Эти слова образуют основу внутреннего лексикона ребенка, проявляясь в наиболее частотных реакциях детей.
3. Механизм ассоциирования в онтогенезе может быть описан с помощью двух стратегий ассоциативного поведения - собственно семантического и до-семантического ассоциирования. Причем стратегия до – семантического ассоциирования носит регулярный и продуктивный характер. Т.В. Соколова установила, что “семантические отношения в составе тезауруса развиваются за счет сокращения дейктического обобщенно-указательного способа номинации и роста собственно номинативного типа ассоциирования. Ведущими способами семантического ассоциирования следует считать синтагматические и тематические, системообразующей категорией при ассоциировании следует признать категорию предметности, выражаемую именем существительным” (Соколова 1999, с. 59).
По мнению Т.В. Соколовой, ассоциативный тезаурус ребенка является структурным образованием, в котором происходит формирование ядра: его составляют наиболее частотные квантитативно сильные единицы - их 54. Они “отображаются” в 11099 реакциях, что составляет около половины массива реакций. Такое количественное соотношение свидетельствует об актуализации данных единиц. С помощью этих слов ребенок пытается называть и каким-либо образом обозначать предметы в мире, реализуя деривационные возможности данных единиц, осваивает способы общей и частной категоризации явлений действительности. При этом, по выражению Т.М. Соколовой, ядро ассоциативного тезауруса ребенка функционально оказывается несколько смещенным - за счет единиц (их количество 755), осваиваемых ребенком, что представляет основную стратегию языкового развития ребенка на данном этапе - расширение его энциклопедической компетенции.
Представление ребенка рассматривается через содержание, структуру и модель ассоциативного распределения. Выделяются группы общих, специфичных для определенной группы и сугубо индивидуальные группы реакций. При этом структурирование ассоциативного распределения носит генетически универсальный характер.
Модель ассоциативного распределения состоит из трех блоков: первый, квантитативно сильный (2/3 от числа ответов), блок занимает семантическое ассоциирование, два других блока (в совокупности 1/3 ответов) представляют до-семантические факторы формирования механизма ассоциирования (Соколова 1999, с.с. 59 – 60).
Особо хочется отметить, что при построении квантитативно – системной модели описания ассоциативного детского тезауруса был создан и использован как прямой ассоциативный словарь (от стимула к реакции), где все ассоциативные поля “привязываются” к стимульному списку слов, так и обратный (от реакции к стимулу), когда фиксируется каждое вхождение реакции в любое ассоциативное поле, полученное в результате проведения САЭ (Соколова 1997).
Материалы всего ассоциативного корпуса АТСРЯ стали и объектом количественных исследований в работах Ю.Н. Караулова (Караулов 1994а, 1994б, 1996, 1999а, 1999б). Анализируя Ассоциативно-вербальную сеть, под которой автор понимает “совокупность отношений между словами, словоформами и их сочетаниями, которую можно наблюдать на материале достаточно большого ассоциативного словаря, снабженного как минимум, двумя входами: от стимулов к реакциям и от реакций к стимулам” (Караулов 1994, с.15), ученый вводит понятие “золотого сечения” структуры ассоциативного поля. Исходя из того факта, что все реакции в ассоциативном поле могут быть упорядочены по частоте их встречаемости, Ю.Н. Караулов полагает, что определенное соотношение этих показателей может выявить содержательные характеристики ассоциативной статьи (поля). Так, отношение разных ответов к общему числу ответов служит некоторым показателем лексического разнообразия поля, а отношение единичных ответов к разным должно, по мнению Ю.Н. Караулова, свидетельствовать о его лексическом богатстве (Караулов 1994, с.23).
Если за N обозначить общее число реакций, а за Nразн - число разных ответов и N1 считать количество единичных реакций, то лексическое разнообразие A может быть вычислено по формуле:
В свою очередь, лексическое богатство выражается с помощью отношения:
Подсчитав эти простые коэффициенты, ученый обратил внимание на две вещи: численную близость обоих показателей друг к другу и на колебание их значений вокруг “сакраментального” числа 0,618, характеризующее “гармоническое деление”, или “золотое сечение”, т.е. деление отрезка в среднем и крайнем отношении, когда меньший отрезок а относится к большему отрезку в относится так же, как больший - к их сумме:
Решив это уравнение, мы и получим “сакраментальное” 0,618, т.к.
Эта “божественная пропорция” занимала умы огромного числа теоретиков и практиков искусства в течение многих столетий (Петров, Прянишников 1979; Давыдов, Садковская 1990). Как мы видим, “не обошла” она и лингвистов.
Ю.Н. Караулова интерпретирует идею золотого сечения ассоциативного поля в отношении лексического разнообразия и богатства статьи ассоциативного тезауруса, связывая её с “оценкой полноты завершенности, целостности этого образования как усредненного фрагмента реальной ассоциативно-вербальной сети, существующей в голове носителя языка” (Караулов 1994, с.24). По его мнению, золотая пропорция может вполне отражать структурную гармонию частей и целого и служить показателем некоторого оптимума в их соотношении, их баланса. Другими словами, показатели золотого сечения в пропорциях его числовых характеристик могут отражать стабильность его структуры как единицы владения языком, или языковой способности его носителя, являясь чисто внешним по отношению к его содержанию параметром (Новикова 1998, с.18). Ю.Н. Караулов также пришел к выводу, что оптимальным количественным составом поля как единицы владения языком следует считать число реакций в пределах 400 – 500 единиц, т.е. именно в этом случае указанные показатели (лексическое богатство и разнообразие) приближаются к показателю золотого сечения.
Ещё одной статистической закономерностью в структуре ассоциативного поля, по мнению Ю.Н. Караулова, обладает ранговый показатель частот реакций. Было подсчитано, что число рангов напрямую связано с количеством реакций. Чем больше это количество, тем больше число рангов в нем. При этом описываемая зависимость характеризуется неким постоянством: при составе поля в 100 реакций число рангов колеблется в пределах 5-8, поле в 500 реакций “укладывается” в 16 – 18 рангов, а поле, образующее ассоциативную норму (1000 реакций), распределяет свои частоты по 21-23 рангам. Исключение из этих двух закономерностей (пропорции “золотого сечения” и корреляции числа реакций с количеством рангов частот) составляют ассоциативные поля, получаемые от стимулов с семантически связанным значением (Новикова 1998, с.19-20).
В работе, посвященной исследовательским задачам, которые могут решаться в области изучения статистической структуры ассоциативно-вербальной сети на корпусе всего АТСРЯ, Ю.Н. Караулов указывает такие:
- продолжение проверки гипотезы о золотом сечении в структуре ассоциативного поля;
- продолжение проверки гипотезы о том, что показатель частотных "сгущений" в ассоциативном поле, т.е. количество разных частот в статье, по которым распределяются все реакции, стремится к постоянной величине и равен приблизительно 15—17;
- сопоставление типов частотных реакций с типами единичных и определение степени разнообразия последних, т.е. в каком количестве появляются в составе единичных такие типы моделей двух слов, которых не было в числе частотных. К примеру, на слов “обольстить” реакция “девушку” встречается 49 раз, а реакция “принцессу” - только один раз, хотя это реакции одного типа. Или, например, ассоциативная пара “обольстить – словами” встречается 4 раза, а “обольстить – сказками” - только один, при этом они могут быть отнесены к одному типу, а такие реакции на стимул “обольстить” — в два счета (1), сразу (1) не имеют соответствия среди частотных и т.п. Каковы эти выходящие за рамки частотных типы? Зависит ли их наличие и количество от характера стимула, а если зависит, то как?
- проверка закономерности в соотношении частоты первой реакции в ассоциативном поле с числом единичных ответов в той же статье;
- проверка зависимости между степенью семантической связанности стимула и реакций в ассоциативном поле, с одной стороны, и показателями частоты первой реакции, с другой, а также с соотношением первой частоты с общим числом ответов;
- анализ соотношения максимального и минимального показателей частоты первой реакции; соотношение maximum и minimum для разных реакций в поле; соотношение maximum и minimum отказов; соотношение maximum и minimum единичных ответов. Для каждого из типов соотношений выявить особенности (семантические, синтаксические, когнитивные или прагматические) стимулов (Караулов 1996, с.217).
И все эти сформулированные исследовательские задачи к настоящему моменту времени остались лишь задачами и требуют настоятельного решения. К сожалению, при анализе работ в данной области нами не было найдено не единой работы, пытающейся хоть как-то решить поставленные вопросы.
Выводы:
Обзор работ по использованию количественных методик при обработке данных САЭ показал их эффективность и настоятельную необходимость при проверке определенных гипотетических выводов.
- Построенная математическая модель свободного ассоциативного эксперимента позволяет оценить:
- Достаточное для обеспечения заданной надежности экспериментальных данных количество испытуемых (примерно 1000 человек);
- Устойчивость ранговой структуры ассоциаций;
- Энтропию слов – стимулов, т.е. прогнозировать степень стереотипности ответов испытуемых на определенное слово – стимул;
- Среднее квадратичное отклонение частот реакций на стимул, т.е. возможность определения того, что некое слово как реакция на некий стимул в следующем эксперименте может появиться с зафиксированной частотой в таких – то пределах;
- Предельную ширину спектра ассоциации или возможное количество различных ассоциаций при неограниченном увеличении числа информантов;
- Способность стимула вызывать определенные частотные реакции, и факторы, влияющие на это.
- Анализ особенностей ассоциативных структур слов – стимулов позволил установить, что количество возможных различных реакций на заданное слов – стимул ограничено. Это позволяет судить об устойчивости более общих явлений в языке, чем ассоциации.
- Уровень стереотипности реакций как параметр регистрации особенностей ассоциативного поведения информантов, так и показатель типологических различий между языками использовался при изучении изменений в уровне стереотипности реакций носителей одного и того же языка в одной стране, реакций детей разных возрастных групп, реакций информантов из различных социальных и половозрастных групп, данных ассоциативных экспериментов в разных языках и особенностей ассоциативного поведения испытуемых при экспериментальной установке реагировать “как все”, т.е. записывать ту реакцию, которую дало бы большинство носителей данного языка на предлагаемый стимул. Данный показатель является эффективным “измерителем” особенностей ассоциативного поведения испытуемых и определения факторов, на него влияющих.
- Крайне успешно количественные методы анализа данных работают в “пространстве ассоциативных тезаурусов”, т.е. на большем и по-разному упорядоченном количестве ассоциативного материала – ассоциативных “баз данных”. С помощью количественного анализа были установлены определенные статистические закономерности в структуре ассоциативного поля: идея “золотого сечения” и существование связи между количеством реакций в ассоциативном поле и его рангами.
- Идея “золотого сечения” “воплощается” в пропорциях числовых характеристик ассоциативного поля (его богатства и разнообразия), отражающих стабильность его структуры как единицы владения языком. При этом оптимальным количественным составом поля как единицы владения языком следует считать число реакций в пределах 400 – 500 единиц, т.е. именно в этом случае указанные показатели (лексическое богатство и разнообразие) приближаются к показателю золотого сечения.
- Ещё одной статистической закономерностью в структуре ассоциативного поля обладает ранговый показатель частот реакций. Было подсчитано, что число рангов напрямую связано с количеством реакций. Чем больше это количество, тем больше число рангов в нем. При этом описываемая зависимость характеризуется неким постоянством: при составе поля в 100 реакций число рангов колеблется в пределах 5-8, поле в 500 реакций “укладывается” в 16 – 18 рангов, а поле, образующее ассоциативную норму (1000 реакций), распределяет свои частоты по 21-23 рангам.
- К сожалению, статистические методы проверки гипотез и валидности тех или иных результатов исследования, в последнее время крайне редко применяются в ассоциативных исследованиях в сравнении с использованием качественных методов. И эта тенденция всё усиливается. Прекрасные программные продукты, созданные для статистической обработки данных, и успешно апробированные в социальных науках, например SPSS, не находят своего применения в психолингвистических исследованиях, использующих в качестве инструментария САЭ. Часто результаты, получаемые на основе качественного анализа данных, в лучшем случае проходят лишь арифметическую обработку. Иногда масштаб проведения эксперимента (например, крайне малое количество испытуемых) не является репрезентативным и не позволяет корректно экстраполировать выводы и строить на их основе теоретические умозаключения. На наш взгляд, вопрос “подкрепления” качественного анализа некоторыми количественными “подтверждениями” способствовал бы только повышению надежности данных, получаемых за счет САЭ, а, следовательно, и выводов, базирующихся на их основе.
Примечания
-
Бит- мера измерения информации.
-
Различия между частотами одинаковых и неодинаковых реакций измерялись с помощью критерия хи – квадрат.
-
Номера столбцов обозначают следующие стратегии 1 – суперординантная стратегия, 2 – координационная, 3 – описательная стратегия (через признаки), 4 – субординантная стратегия, 5 – другие: звуко-буквенные аналоги, моторные ассоциации, идентификации по линии другого ЛСВ или омонима, 6 – не установленные стратегии, 7 – отказ от ответа.
-
Данное понятие прямо противоположно понятию “компрессии”.
-
Мы думаем, что это явление можно объяснить и экстралингвистическими причинами: принцессы в реальной жизни встречаются реже, чем девушки.
-
SPSS (Statistical Packet for Social Sciences) – универсальная статистическая система программ, поддерживающая процесс анализа данных на любом уровне и предназначенная для реализации полной последовательности шагов анализа данных: от просмотра, создания таблиц и вычисления дескриптивных статистик до сложного статистического анализа и проверки выдвигаемых гипотез.