Сидоренко Е.В. »Методы математической обработки в психологии. Глава 6-9»

ГЛАВА 6 МЕТОД РАНГОВОЙ КОРРЕЛЯЦИИ
6.1. Обоснование задачи исследования согласованных действий
Первоначальное значение термина "корреляции" - взаимная связь (Oxford Advanced Learner's Dictionary of Current English, 1982). Когда говорят о корреляции, используют термины "корреляционная связь" и "корреляционная зависимость".
Корреляционная связь - это согласованные изменения двух признаков или большего количества признаков (множественная корреляционная связь). Корреляционная связь отражает тот факт, что изменчивость одного признака находится в некотором соответствии с изменчивостью другого (Плохинский Н.А., 1970, с. 40). "Стохастическая связь имеется тогда, когда каждому из значений одной случайной величины соответствует специфическое (условное) распределение вероятностей значений другой величины, и наоборот, каждому из значений этой другой величины соответствует специфическое (условное) распределение вероятностей значений первой случайной величины" (Суходольский Г.В., 1972, с. 178).
Корреляционная зависимость - это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.
Оба термина - корреляционная связь и корреляционная зависимость - часто используются как синонимы (Плохинский Н.А.,1970; Суходольский Г.В.,1972; Артемьева Е.Ю., Мартынов Е.М.,1975 и др.). Между тем, согласованные изменения признаков и отражающая это корреляционная связь между ними может свидетельствовать не о зависимости этих признаков между собой, а зависимости обоих этих признаков от какого-то третьего признака или сочетания признаков, не рассматриваемых в исследовании.
Зависимость подразумевает влияние, связь - любые согласованные изменения, которые могут объясняться сотнями причин. Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной связи, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого, но находится ли причина изменений в одном из признаков или она оказывается за пределами исследуемой пары признаков, нам неизвестно.
Говорить в строгом смысле о зависимости мы можем только в тех случаях, когда сами оказываем какое-то контролируемое воздействие на испытуемых или так организуем исследование, что оказывается возможным точно определить интенсивность не зависящих от нас воздействий. Воздействия, которые мы можем качественно определить или даже измерить, могут рассматриваться как независимые переменные. Признаки, которые мы измеряем и которые, по нашему предположению, могут изменяться под влиянием независимых переменных, считаются зависимыми переменными. Согласованные изменения независимой и зависимой переменной действительно могут рассматриваться как зависимость.
Однако, учитывая, что число градаций, или уровней, зависимой переменной обычно невелико, целесообразнее применять в такого рода исследованиях не корреляционный метод, а методы выявления тенденций изменения признака при изменении условий, например, критерии тенденций Н Крускала-Уоллиса и L Пейджа (см. Главы 2 и 3) или метод дисперсионного анализа (см. Главы 7 и 8).
Если в исследование включены независимые переменные, которые мы можем по крайней мере учитывать, например, возраст, то можно считать выявляемые между возрастом и психологическими признаками корреляционные связи корреляционными зависимостями. В большинстве же случаев нам трудно определить, что в рассматриваемой паре признаков является независимой, а что - зависимой переменной.
Учитывая, что термин "зависимость" явно или неявно подразумевает влияние, лучше пользоваться более нейтральным термином "корреляционная связь".
Корреляционные связи различаются по форме, направлению и степени (силе).
По форме корреляционная связь может быть прямолинейной или криволинейной. Прямолинейной может быть, например, связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии. Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи (см. Рис. 6.1). При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности.

По направлению корреляционная связь может быть положительной ("прямой") и отрицательной ("обратной"). При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака - низкие значения другого (см. Рис. 6.2). При отрицательной корреляции соотношения обратные.

При положительной корреляции коэффициент корреляции имеет положительный знак, например r=+0,207, при отрицательной корреляции - отрицательный знак, например r=0,207.
Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции.
Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции. Максимальное возможное абсолютное значение коэффициента корреляции r=1,00; минимальное r=0.
Используется две системы классификации корреляционных связей по их силе: общая и частная. Общая классификация корреляционных связей (по Ивантер Э.В., Коросову А.В., 1992):
1) сильная, или тесная при коэффициенте корреляции r>0,70;
2) средняя при 0,503) умеренная при 0,304) слабая при 0,205) очень слабая при r<0,19.
Частная классификация корреляционных связей:
1) высокая значимая корреляция при г, соответствующем уровню статистической значимости р<0,01;
2) значимая корреляция при г, соответствующем уровню статистической значимости р<0,05;
3) тенденция достоверной связи при г, соответствующем уровню статистической значимости р<0,10;
4) незначимая корреляция при г, не достигающем уровня статистической значимости .
Две эти классификации не совпадают. Первая ориентирована только на величину коэффициента корреляции, а вторая определяет, какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки. Чем больше объем выборки, Тем меньшей величины коэффициента корреляции оказьюается достаточно, чтобы корреляция была признана дортоверной. В результате при Малом объеме выборки может оказаться так, что сильная корреляция окажется недостоверной. В то же время при больших объемах выборки Даже слабая корреляция может оказаться достоверной.
Обычно принято ориентироваться на вторую классификацию, поскольку она учитывает объем выборки. Вместе с тем, необходимо помнить, что сильная, или высокая, корреляция - это корреляция с коэффициентом r>0,70, а не просто корреляция высокого уровня значимости.
В качестве мер корреляции используются:
1) эмпирические меры тесноты связи, многие из которых были получены еще до открытия метода корреляции, а именно:
а) коэффициент ассоциации, или тетрахорический показатель связи;
б) коэффициенты взаимной сопряженности Пирсона и Чупрова;
в) коэффициент Фехнера;
г) коэффициент корреляции рангов;
2) линейный коэффициент корреляции r,
3) корреляционное отношение
·;
4) множественные коэффициенты корреляции и др.
Подробное описание этих мер можно найти в руководствах Ве-нецкого И.Г., Кнльдишева Г.С.(1968), Плохинского Н.А.(1970), Су-ходольского Г.В.(1972), Ивантер Э.В., Коросова А.В.(1992) и др.
В психологических исследованиях чаще всего применяется коэффициент линейной корреляции r Пирсона. Однако этот метод является параметрическим и поэтому не лишен недостатков, свойственных параметрическим методам (см. параграф 1.8). Параметрическими являются, также методы определения корреляционного отношения и подсчета множественных коэффициентов корреляции. Кроме того, эти методы, как правило, требуют машинной обработки данных. По этим причинам они остаются за пределами нашего рассмотрения.
Все эмпирические меры тесноты связи, кроме коэффициента ранговой корреляции, могут быть заменены методами сопоставления и сравнения, изложенными в Главах 2-5.
Ведь что, в сущности, мы доказываем, когда обосновываем различия в долях двух выборок, характеризующихся исследуемым эффектом? Мы показываем, что если испытуемый относится к одной из выборок, то скорее всего он будет характеризоваться какими-то определенными значениями исследуемого признака, а если он относится к другой из двух выборок, то он будет характеризоваться (с большой степенью вероятности) другими значениями исследуемого признака. Фактически мы исследуем сопряженные изменения двух признаков: отнесенность к той или иной выборке и определенные значения исследуемого признака.
Что мы доказываем, с другой стороны, когда два распределения признака оказываются сходными или, наоборот, статистически достоверно различающимися между собой? Мы доказываем, что в обеих выборках частоты встречаемости разных значений признака распределяются согласованно или, наоборот, несогласованно.
Мы, правда, скорее определяем меру рассогласованности, чем согласованкости, но все же часто метод
·2 относится к числу методов, выявляющих степень согласованности или даже связи.
Методы выявления тенденций уже напрямую заменяют меры эмлирической сопряженности, позволяя нам проследить возрастание значений признака при изменении условий. Фактически мы отвечаем на вопрос о том, согласованно ли изменяются условия и значения исследуемого признака.
Быть может, современному психологу не очень просто отказаться от метода подсчета корреляций. Это очень привычно - подсчитывать корреляции. Исторически сложилось так, что этот метод является одним из основных методов статистической обработки. Главное преимущество корреляционного анализа состоит в том, что можно сразу провести множественное сопоставление признаков. Например, "нам необходимо определить, с чем связана успешность в какой-либо деятельности. Исследователь может предполагать, что она связана с уровнем интеллектуального развития, с некоторыми из личностных факторов 16-факторного опросника Кеттелла, а может быть, с уровнем эмпатии, тревожности или фрустрационной толерантности, с возрастом самого испытуемого или возрастом матери в момент его рождения и т.д. и т.п. В итоге он получает связи, отражающие среднегрупповые тенденции сопряженного изменения признаков. Но дело как раз в том, что у каждого отдельного испытуемого успешность в данном виде деятельности может определяться разными психологическими характеристиками или разными их сочетаниями. Метод корреляций отдает предпочтение группе, а не отдельному индивиду.
Против этого можно возразить, что и все остальные статистические методы отдают предпочтение среднегрупповым, а не индивидуальным тенденциям. Однако это не совсем так. Например, метод тенденций L Пейджа определяет степень согласованности индивидуальных тенденций, критерий
·2, Фридмана степень совпадения или несовпадения индивидуальных соотношений рангов, биномиальный критерий m -степень отклонения индивидуальных значений от заданных или среднестатистических и т.п.
Прежде чем переходить к корреляциям, исследователю необходимо проанализировать полученные данные с помощью критериев сравнения и сопоставления еще и по другой причине. Возможно, размах вариативности признака в обследованной выборке окажется слишком узким, чтобы можно было распространять полученную корреляцию на весь возможный диапазон его значений. Например, может оказаться так, что в обследованной группе по какому-либо из факторов 16-факторного личностного опросника Кеттелла получены лишь низкие и средние значения, и в то же время выявлена значимая положительная связь этого личностного фактора с успешностью профессиональной деятельности. Не учитывая истинного размаха значений в данной выборке, можно экстраполировать полученную связь и на высокие значения фактора, что может оказаться ошибкой. Во->первых, связь данного фактора с успешностью деятельности может на самом деле быть криволинейной, как в рассмотренном выше случае связи уровня мотивации с эффективностью выполнения задания (см. Рис. 6.1). Во-вторых, не исключено, что самым важным результатом исследования является как раз факт низких и средних значений данного личностного фактора в обследованной выборке, а исследователь не обратил на него внимания, привычно отдав предпочтение корреляционной матрице, а не таблице первичных данных.
Математическая обработка должна начинаться с использования "самых простых приемов с совершенно понятной для исследователя сутью производимых преобразований" (Дворяшина М.Д., Пехлецкий И.Д., 1976, с. 45). Учитывая большие возможности методов первичной обработки данных, изложенных в Главах 2-5, не исключено, что этими приемами математическая обработка может и заканчиваться. Эти методы дают и основание для достоверных выводов, и материал для выдвижения новых гипотез, и стимул к новым размышлениям.
И все же, если исследователь хочет применить метод корреляций, в настоящем пособии предлагается использовать коэффициент ранговой корреляции Спирмена. Основанием для выбора этого коэффициента служат:
а) его универсальность;
б) простота;
в) широкие возможности в решении задач сравнения индивидуальных или групповых иерархий признаков.
Универсальность коэффициента ранговой корреляции проявляется в том, что он применим к любым количественно измеренным или ранжированным данным. Простота метода позволяет подсчитывать корреляцию "вручную". Уникальность метода ранговой корреляции состоит в том, что он позволяет сопоставлять не индивидуальные показатели, а индивидуальные иерархии, или профили, что недоступно ни одному из других статистических методов, включая метод линейной корреляции (Плохинский НА., 1970, с. 167).
Коэффициент ранговой корреляции рекомендуется применять в тех случаях, когда нам необходимо проверить, согласованно ли изменяются разные признаки у одного и того же испытуемого и насколько совпадают индивидуальные ранговые показатели у двух отдельных испытуемых или у испытуемого и группы.
6.2. Коэффициент ранговой корреляции rs Спирмена
Назначение рангового коэффициента корреляции
Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и направление корреляционной связи между двумя признаками или двумя профилями {иерархиями) признаков.
Описание метода
Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы. Такими рядами значений могут быть:
1) два признака, измеренные в одной и той же группе испытуемых;
2) две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков (например, личностные профили по 16-факторному опроснику Р. Б. Кеттелла, иерархии ценностей по методике Р. Рокича, последовательности предпочтений в выборе из нескольких альтернатив и др.);
3) две групповые иерархии признаков;
4) индивидуальная и групповая иерархии признаков.
Вначале показатели ранжируются отдельно по каждому из признаков. Как правило, меньшему значению признака начисляется меньший ранг.
Рассмотрим случай 1 (два признака). Здесь ранжируются индивидуальные значения по первому признаку, полученные разными испытуемыми, а затем индивидуальные значения по второму признаку.
Если два признака связаны положительно, то испытуемые, имеющие низкие ранги по одному из них, будут иметь низкие ранги и по другому, а испытуемые, имеющие высокие ранги по одному из признаков, будут иметь по другому признаку также высокие ранги. Для подсчета rs необходимо определить разности (d) между рангами, полученными данным испытуемым по обоим признакам. Затем эти показатели d определенным образом преобразуются и вычитаются из 1. Чем меньше разности между рангами, тем больше будет rs, тем ближе он будет к +1.
Если корреляция отсутствует, то все ранги будут перемешаны и между ними не будет никакого соответствия. Формула составлена так, что в этом случае rs, окажется близким к 0.
В случае отрицательной корреляции низким рангам испытуемых по одному признаку будут соответствовать высокие ранги по другому признаку, и наоборот.
Чем больше несовпадение между рангами испытуемых по двумя переменным, тем ближе rs к -1.
Рассмотрим случай 2 (два индивидуальных профиля). Здесь ранжируются индивидуальные значения, полученные каждым из 2-х испытуемым по определенному (одинаковому для них обоих) набору признаков. Первый ранг получит признак с самым низким значением; второй ранг - признак с более высоким значением и т.д. Очевидно, что все признаки должны быть измерены в одних и тех же единицах, иначе ранжирование невозможно. Например, невозможно проранжировать показатели по личностному опроснику Кеттелла (16PF), если они выражены в "сырых" баллах, поскольку по разным факторам диапазоны значений различны: от 0 до 13, от 0 до 20 и от 0 до 26. Мы не можем сказать, какой из факторов будет занимать первое место по выраженности, пока не приведем все значения к единой шкале (чаще всего это шкала стенов).
Если индивидуальные иерархии двух испытуемых связаны положительно, то признаки, имеющие низкие ранги у одного из них, будут иметь низкие ранги и у другого, и наоборот. Например, если у одного испытуемого фактор Е (доминантность) имеет самый низкий ранг, то и у другого испытуемого он должен иметь низкий ранг, если у одного испытуемого фактор С (эмоциональная устойчивость) имеет высший ранг, то и другой испытуемый должен иметь по этому фактору высокий ранг и т.д.
Рассмотрим случай 3 (два групповых профиля). Здесь ранжируются среднегрупповые значения, полученные в 2-х группах испытуемых по определенному, одинаковому для двух групп, набору признаков. В дальнейшем линия рассуждений такая же, как и в предыдущих двух случаях.
Рассмотрим случай 4 (индивидуальный и групповой профили). Здесь ранжируются отдельно индивидуальные значения испытуемого и среднегрупповые значения по тому же набору признаков, которые получены, как правило, при исключении этого отдельного испытуемого - он не участвует в среднегрупповом профиле, с которым будет сопоставляться его индивидуальный профиль. Ранговая корреляция позволит проверить, насколько согласованы индивидуальный и групповой профили.
Во всех четырех случаях значимость полученного коэффициента корреляции определяется по количеству ранжированных значений N. В первом случае это количество будет совпадать с объемом выборки п. Во втором случае количеством наблюдений будет количество признаков, составляющих иерархию. В третьем и четвертом случае N - это также количество сопоставляемых признаков, а не количество испытуемых в группах. Подробные пояснения даны в примерах.
Если абсолютная величина rs достигает критического значения или превышает его, корреляция достоверна.
Гипотезы
Возможны два варианта гипотез. Первый относится к случаю 1, второй - к трем остальным случаям.
Первый вариант гипотез
H0: Корреляция между переменными А и Б не отличается от нуля.
H1: Корреляция между переменными А и Б достоверно отличается от нуля.
Второй вариант гипотез
H0: Корреляция между иерархиями А и Б не отличается от нуля.
H1: Корреляция между иерархиями А и Б достоверно отличается от нуля.
Графическое представление метода ранговой корреляции
Чаще всего корреляционную связь представляют графически в виде облака точек или в виде линий, отражающих общую тенденцию размещения точек в пространстве двух осей: оси признака А и признака Б (см. Рис. 6.2).
Попробуем изобразить ранговую корреляцию в виде двух рядов ранжированных значений, которые попарно соединены линиями (Рис. 6.3). Если ранги по признаку А и по признаку Б совпадают, то между ними оказывается горизонтальная линия, если ранги не совпадают, то линия становится наклонной. Чем больше несовпадение рангов, тем более наклонной становится линия. Слева на Рис. 6.3 отображена максимально высокая положительная корреляция (rв=+1,0) - практически это "лестница". В центре отображена нулевая корреляция - плетенка с неправильными переплетениями. Все ранги здесь перепутаны. Справа отображена максимально высокая отрицательная корреляция (rs=-1,0) -паутина с правильным переплетением линий.
Рис. 6.3. Графическое представление ранговой корреляции:
а) высокая положительная корреляция;
б) нулевая корреляция;
в) высокая отрицательная корреляция

Ограничения коэффициента ранговой корреляции
1. По каждой переменной должно быть представлено не менее 5 наблюдений. Верхняя граница выборки определяется имеющимися таблицами критических значений (Табл.XVI Приложения 1), а именно N
·40.
2. Коэффициент ранговой корреляции Спирмена rs при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпадающих значений. В случае, если это условие не соблюдается, необходимо вносить поправку на одинаковые ранги. Соответствующая формула дана в примере 4.
Пример 1 - корреляция между двумя признаками
В исследовании, моделирующем деятельность авиадиспетчера (Одерышев Б.С., Шамова Е.П., Сидоренко Е.В., Ларченко Н.Н., 1978), группа испытуемых, студентов физического факультета ЛГУ проходила подготовку перед началом работы на тренажере. Испытуемые должны были решать задачи по выбору оптимального типа взлетно-посадочной полосы для заданного типа самолета. Связано ли количество ошибок, допущенных испытуемыми в тренировочной сессии, с показателями вербального и невербального интеллекта, измеренными по методике Д. Векслера?
Таблица 6.1
Показатели количества ошибок в тренировочной сессии и показатели уровня вербального и невербального интеллекта у студентов-физиков (N=10)
Испытуемый
Количество ошибок
Показатель вербального интеллекта
Показатель невербального интеллекта

1
Т.А.
29
131
106

2
П.А.
54
132
90

3
Ч.И.
13
121
95

4
Ц.А.
8
127
116

5
См.А.
14
136
. 127

6
К.Е.
26
124
107

7
К.А.
9
134
104

8
Б.Л.
20
136
102

9
И.А.
2
132
111

10
Ф.В.
17
136
99

Суммы
192
1309
1057

Средние
19,2
130,9
105,7

Сначала попробуем ответить на вопрос, связаны ли между собой показатели количества ошибок и вербального интеллекта.
Сформулируем гипотезы.
H0: Корреляция между показателем количества ошибок в тренировочной сессии и уровнем вербального интеллекта не отличается от нуля.
H1: Корреляция между показателем количества ошибок в тренировочной сессии и уровнем вербального интеллекта статистически значимо отличается от нуля.
Далее нам необходимо проранжировать оба показателя, Приписывая меньшему значению меньший ранг, затем подсчитать разности между рангами, которые получил каждый испытуемый по двум переменным (признакам), и возвести эти разности в квадрат. Произведем все необходимые расчеты в таблице.
В Табл. 6.2 в первой колонке слева представлены значения по показателю количества ошибок; в следующей колонке - их ранги. В третьей колонке слева представлены значения по показателю вербального интеллекта; в следующем столбце - их ранги. В пятом слева представлены разности d между рангом по переменной А (количество ошибок) и переменной Б (вербальный интеллект). В последнем столбце представлены квадраты разностей - d2.
Таблица 6.2
Расчет d2 для рангового коэффициента корреляции Спирмена rs при сопоставлении показателей количества ошибок и вербального интеллекта у студентов-физиков (N=10)
Испытуемый
Переменная А
количество ошибок
Переменная Б
вербальный интеллект.
d (ранг А -
- ранг Б)
J2


Индивидуальные
значения
Ранг
Индивидуальные
значения
Ранг











1
ТА.
29
9
131
4
5
25

2
ПА.
54
10
132
5.5
4,5
20.25

3
Ч.И.
13
4
121
1
3
9

4
Ц.А.
8
2
127
3
-1
1

5
См.А.
14
5
136
9
-4
16

6
К.Е.
26
8
124
2
6
36

7
К.А.
9
3
134
7
-4
16

8
Б.Л.
20
7
136
9
-2
4

9
И.А.
2
1
132
5,5
-4,5
20,25

10
Ф.В.
17
6
136
9

9

Суммы

55

55
0
156,5

Коэффициент ранговой корреляции Спирмена подсчитывается по формуле:

где d - разность между рангами по двум переменным для каждого испытуемого;
N - количество ранжируемых значений, в. данном случае количество испытуемых.
Рассчитаем эмпирическое значение rs:

Полученное эмпирическое значение гs близко к 0. И все же определим критические значения rs при N=10 по Табл. XVI Приложения 1:

Ответ: H0 принимается. Корреляция между показателем количества ошибок в тренировочной сессии и уровнем вербального интеллекта не отличается от нуля.
Теперь попробуем ответить на вопрос, связаны ли между собой показатели количества ошибок и невербального интеллекта.
Сформулируем гипотезы.
H0: Корреляция между показателем количества ошибок в тренировочной сессии и уровнем невербального интеллекта не отличается от 0.
H1: Корреляция между показателем количества ошибок в тренировочной сессии и уровнем невербального интеллекта статистически значимо отличается от 0.
Результаты ранжирования и сопоставления рангов представлены в Табл. 6.3.
Таблица 6.3
Расчет d2 для рангового коэффициента корреляции Спирмена rs при сопоставлении показателей количества ошибок и невербального интеллекта у студентов-физиков (N=10)
Испытуемый
Переменная А
количество ошибок
Переменная Е
;
невербальный интеллект
d (ранг А
ранг Б)
d2


Индивидуальные
Ранг
Индивидуальные
Ранг




значения

значения




1
Т.А.
29
9
106
6
3
9

2
П:А.
54
10
90
1
9
81

3
Ч.И.
13
4
95
2
2
4

4
Ц-А. „
8
2
116
9
-7
49

5
См.А.
14
5
127
10
-5
25

6
К.Е.
26
8
107
7
1
1

7
К.А.
9
3
104
5
-2
4

8
Б.Л.
20
7
102
4
3
9

9
И.А.
2
1
111
8
-7
49

10
Ф.В.
17
6
99
3
3
9

Суммы

55

55
0
240


Мы помним, что для определения значимости rs неважно, является ли он положительным или отрицательным, важна лишь его абсолютная величина. В данном случае:
rs эмпОтвет: H0 принимается. Корреляция между показателем количества ошибок в тренировочной сессии и уровнем невербального интеллекта случайна, rs не отличается от 0.
Вместе с тем, мы можем обратить внимание на определенную тенденцию отрицательной связи между этими двумя переменными. Возможно, мы смогли бы ее подтвердить на статистически значимом уровне, если бы увеличили объем выборки.
Пример 2 - корреляция между индивидуальными профилями
В исследовании, посвященном проблемам ценностной реориента-ции, выявлялись иерархии терминальных ценностей по методике М. Рокича у родителей и их взрослых детей (Сидоренко Е.В., 1996). Ранги терминальных ценностей, полученные при обследовании пары мать-дочь (матери - 66 лет, дочери - 42 года) представлены в Табл. 6.4. Попытаемся определить, как эти ценностные иерархии коррелируют друг с другом.
Таблица 6.4
Ранги терминальных ценностей по списку М.Рокича в индивидуальных иерархиях матери и дочери

Ряд1:
Ряд 2:



Терминальные ценности
Ранг ценностей в
Ранг ценностей в
d
d2


иерархии матери
иерархии дочери



1 Активная деятельная жизнь
15
15
0
0

2 Жизненная мудрость
1
3
-2
4

3 Здоровье
7
14
-7
49

4 Интересная работа
8
12
-4
16

5 Красота природы и искусство
16
17
-1
1

6 Любовь
11
10
1
1

7 Материально обеспеченная жизнь
12
13
-1
1

8 Наличие хороших и верных друзей
9
11
-2
4

9 Общественное признание
17
5
12
144

10 Познание
5
1
4
16

11 Продуктивная жнзнь
2
2
0
0

12 Развитие
6
8
-2
4

13 Развлечения
18
18
0
0

14 Свобода
4
6
-2
4

15 Счастливая семейная жизнь
13
4
9
81

16 Счастье других
14
16
-2
4

17 Творчество
10
9
1
1

18 Уверенность в себе
3
7
-4
16

Суммы
171
171
0
346

Сформулируем гипотезы.
H0: Корреляция между иерархиями терминальных ценностей матери и дочери не отличается от нуля.
H1: Корреляция между иерархиями терминальных ценностей матери и дочери статистически значимо отличается от нуля.
Поскольку ранжирование ценностей предполагается самой процедурой исследования, нам остается лишь подсчитать разности между рангами 18 ценностей в двух иерархиях . В 3-м и 4-м столбцах Табл. 6.4 представлены разности d и квадраты этих разностей d.
Определяем эмпирическое значение rs по формуле:

где d - разности между рангами по каждой из переменных, в данном случае по каждой из терминальных ценностей;
N - количество переменных, образующих иерархию, в данном случае количество ценностей.
Для данного примера:

По Табл. XVI Приложения 1 определяем критические значения:

Ответ: H0 отвергается. Принимается H1. Корреляция между иерархиями терминальных ценностей матери и дочери статистически значима (р<0,01) и является положительной.
По данным Табл. 6.4 мы можем определить, что основные расхождения приходятся на ценности "Счастливая семейная жизнь", "Общественное признание" и "Здоровье", ранги остальных ценностей достаточно близки.
Пример 3 - корреляция между двумя групповыми иерархиями
Джозеф Вольпе в книге, написанной совместно с сыном (Wolpe J., Wolpe D., 1981) приводит упорядоченный перечень из наиболее часто встречающихся у современного человека "бесполезных", по его обозначению, страхов, которые не несут сигнального значения и лишь мешают полноценно жить и действовать. В отечественном исследовании, проведенном М.Э. Раховой (1994) 32 испытуемых должны были по 10-балльной шкале оценить, насколько актуальным для них является тот или иной вид страха из перечня Вольпе. Обследованная выборка состояла из студентов Гидрометеорологического и Педагогического институтов Санкт-Петербурга: 15 юношей и 17 девушек в возрасте от 17 до 28 лет, средний возраст 23 года.
Данные, полученные по 10-балльной шкале, были усреднены по 32 испытуемым, и средние проранжированы. В Табл. 6.5 представлены ранговые показатели, полученные Дж. Вольпе и М. Э. Раховой. Совпадают ли ранговые последовательности 20 видов страха?
Сформулируем гипотезы.
H0: Корреляция между упорядоченными перечнями видов страха в американской и отечественных выборках не отличается от нуля.
H1: Корреляция между упорядоченными перечнями видов страха в американской и отечественной выборках статистически значимо отличается от нуля.
Все расчеты, связанные с вычислением и возведением в квадрат разностей между рангами разных видов страха в двух выборках, представлены в Табл. 6.5.
Таблица 6.5
Расчет d для рангового коэффициента корреляции Спирмена при сопоставлении упорядоченных перечней видов страха в американской и отечественной выборках
Виды страха
Ранг в американской выборке
Ранг в российской
выборке
d
d2

1
Страх публичного выступления
1
7
-6
36

2
Страх полета
2
12
-10
100

3
Страх совершить ошибку
3
10
-7
49

4
Страх неудачи
4
6
-2
4

5
Страх неодобрения
5
9
-4
16

6
Страх отвержения
6
2
4
16

7
Страх злых люден
7
5
2
4

8
Страх одиночества
8
1
7
49

9
Страх крови
9
16
-7
49

10
Страх открытых ран
10
13
-3
9

И
Страх дантиста
11
3
8
64

12
Страх уколов
12
19
-7
49

13
Страх прохождения тестов
13
20
-7
49

14
Страх полиции ^милиции)
14
17
-3
9

15
Страх высоты
15
4
11
121

16
Страх собак
16
11
5
25

17
Страх пауков
17
18
-1
1

18
Страх искалеченных людей
18
8
10
100

19
Страх больниц
19
15
4
16

20
Страх темноты
20
14
6
36

Суммы
210
210
0
802

Определяем эмпирическое значение rs:

По Табл. XVI Приложения 1 определяем критические значения гs при N=20:

Ответ: H0 принимается. Корреляция между упорядоченными перечнями видов страха в американской и отечественной выборках не достигает уровня статистической значимости, т. е. значимо не отличается от нуля.
Пример 4 - корреляция между индивидуальным и среднегрупповым профилями
Выборке петербуржцев в возрасте от 20 до 78 лет (31 мужчина, 46 женщин), уравновешенной по возрасту таким образом, что лица в возрасте старше 55 лет составляли в ней 50%, предлагалось ответить на вопрос: "Какой уровень развития каждого из перечисленных ниже качеств необходим для депутата Городского собрания Санкт-Петербурга?" (Сидоренко Е.В., Дерманова И.Б., Анисимова О.М., Витенберг Е.В., Шульга А.П., 1994). Оценка производилась по 10-балльной шкале. Параллельно с этим обследовалась выборка из депутатов и кандидатов в депутаты в Городское собрание Санкт-Петербурга (n=14). Индивидуальная диагностика политических деятелей и претендентов производилась с помощью Оксфордской системы экспресс-видеодиагностики по тому же набору личностных качеств, который предъявлялся выборке избирателей.
В Табл. 6.6 представлены средние значения, полученные для каждого из качеств в выборке избирателей ("эталонный ряд") и индивидуальные значения одного из депутатов Городского собрания.
Попытаемся определить, насколько индивидуальный профиль депутата К-ва коррелирует с эталонным профилем.
Таблица 6.6
Усредненные эталонные оценки избирателей (п=77) и индивидуальные показатели депутата К-ва по 18 личностным качествам экспресс-видеодиагностики
Наименование качества
Усредненные эталонные оценки избирателей
Индивидуальные показатели депутата К-ва





1. Общий уровень культуры
8,64
15

2. Обучаемость
7,89
7

3. Логика
8,38
12

4. Способность к творчеству нового
6,97
5

5.. Самокритичность
8,28
14

6. Ответственность
9,56
18

7. Самостоятельность
8,12
13

8. Энергия, активность
8,41
17

9. Целеустремленность
8,00
19

10. Выдержка, самообладание
8,71
9

И. Стойкость
7,74
16

12. Личностная зрелость
8,10
11

13. Порядочность
9,02
12

14. Гуманизм
7.89
10

15. Умение общаться с людьми
8,74
8

16. Терпимость к чужому мнению
7.84
6

17. Гибкость поведения
7,67
4

18. Способность производить благоприятное впечатление
7,23
8

Таблица 6.7
Расчет d2 для рангового коэффициента корреляции Спирмена между эталонным и индивидуальным профилями личностных качеств депутата
Наименование качества
Ряд 1:
ранг качества в эталонном профиле
Ряд 2: ранг качества в индивидуальном профиле
d
d2

1 Ответственность
1
2
-1
1

2 Порядочность
2
8,5
-6,5
42,25

3 Умение общаться с людьми
3
13,5
-10,5
110,25

4 Выдержка, самообладание
4
12
-8
64

5 Общий уровень культуры
5
5
0
0

6 Энергия, активность
6
3
3
9

7 Логика
7
8,5
-1,5
2,25

8 Самокритичность
8
6
2
4

9 Самостоятельность
9
7
2
4

10 Личностная зрелость
10
10
0
0

И Целеустремленность
И
1
10
100

12 Обучаемость
12,5
15
-2,5
6,25

13 Гуманизм
12,5
И
1,5
2,25

14 Терпимость к чужому мнению
14
16
-2
4

15 Стойкость
15
4
11
121

16 Гибкость поведения
16
18
-2
4

17 Способность производить благоприятное впечатление
17
13,5
3,5
12,25

18 Способность к творчеству нового
18.
17
1
1

Суммы
171
171
0
487,5

Как видно из Табл. 6.6, оценки избирателей и индивидуальные показатели депутата варьируют в разных диапазонах. Действительно оценки избирателей были получены по 10-балльной шкале, а индивидуальные показатели по экспресс-видеодиагностике измеряются по 20-ти балльной шкале. Ранжирование позволяет нам перевести обе шкалы измерения в единую шкалу, где единицей измерения будет 1 ранг, а максимальное значение составит 18 рангов.
Ранжирование, как мы помним, необходимо произвести отдельно по каждому ряду значений. В данном случае целесообразно начислять большему значению меньший ранг, чтобы сразу можно было увидеть, на каком месте по значимости (для избирателей) или по выраженности (у депутата) находится то или иное качество.
Результаты ранжирования представлены в Табл. 6.7. Качества перечислены в последовательности, отражающей эталонный профиль.
Сформулируем гипотезы.
H0: Корреляция между индивидуальным профилем депутата К-ва и эталонным профилем, построенным по оценкам избирателей, не отличается от нуля.
H1: Корреляция между индивидуальным профилем депутата К-ва и эталонным профилем, построенным по оценкам избирателей, статистически значимо отличается от нуля. Поскольку в обоих сопоставляемых ранговых рядах присутствуют
группы одинаковых рангов, перед подсчетом коэффициента ранговой
корреляции необходимо внести поправки на одинаковые ранги Та и Тb:

где а - объем каждой группы одинаковых рангов в ранговом ряду А,
b - объем каждой группы одинаковых рангов в ранговом ряду В.
В данном случае, в ряду А (эталонный профиль) присутствует одна группа одинаковых рангов - качества "обучаемость" и "гуманизм" имеют один и тот же ранг 12,5; следовательно, а=2.
Tа=(23-2)/12=0,50.
В ряду В (индивидуальный профиль) присутствует две группы одинаковых рангов, при этом b1=2 и b2=2.
Ta=[(23-2)+(23-2)]/12=1,00
Для подсчета эмпирического значения rs используем формулу

В данном случае:

Заметим, что если бы поправка на одинаковые ранги нами не вносилась, то величина rs была бы лишь на (на 0,0002) выше:

При больших количествах одинаковых рангов изменения г5 могут оказаться гораздо более существенными. Наличие одинаковых рангов означает меньшую степень дифференцированное™ упорядоченных переменных и, следовательно, меньшую возможность оценить степень связи между ними (Суходольский Г.В., 1972, с.76).
По Табл. XVI Приложения 1 определяем критические значения г, при N=18:

Ответ: Hq отвергается. Корреляция между индивидуальным профилем депутата К-ва и эталонным профилем, отвечающим требованиям избирателей, статистически значима (р<0,05) и является положительной.
Из Табл. 6.7 видно, что депутат К-в имеет более низкий ранг по шкалам Умения общаться с людьми и более высокие ранги по шкалам Целеустремленности и Стойкости, чем это предписывается избирательским эталоном. Этими расхождениями, главным образом, и объясняется некоторое снижение полученного rs.
Сформулируем общий алгоритм подсчета rs.
АЛГОРИТМ 20
Расчет коэффициента ранговой корреляции Спирмена rs.
1. Определить, какие два признака или две иерархии признаков будут участвовать в сопоставлении как переменные А и В.
2. Проранжировать значения переменной А, начисляя ранг 1 наименьшему значению, в соответствии с правилами ранжирования (см. п.2.3). Занести ранги в первый столбец таблицы по порядку номеров испытуемых или признаков.
3. Проранжировать значения переменной В, в соответствии с теми же правилами. Занести ранги во второй столбец таблицы по порядку номеров испытуемых или признаков.
4. Подсчитать разности d между рангами А и В по каждой строке таблицы и занести в третий столбец таблицы.
5. Возвести каждую разность в квадрат: d2 . Эти значения занести в четвертый столбец таблицы.
6. Подсчитать сумму квадратов
·d2.
7. При наличии одинаковых рангов рассчитать поправки:

где а - объем каждой группы одинаковых рангов в ранговом ряду А;
b - объем каждой группы одинаковых рангов в ранговом ряду В.
8. Рассчитать коэффициент ранговой корреляции г5 по формуле:
а) при отсутствии одинаковых рангов

б) при наличии одинаковых рангов

где
·d2 - сумма квадратов разностей между рангами*
Та и Tb, - поправки на одинаковые ранги;
N - количество испытуемых или признаков, участвовавших в ранжировании.
9. Определить по Табл. XVI Приложения 1 критические значения гs для данного N. Если rs превышает критическое значение или по крайней мере равен ему, корреляция достоверно отличается от 0.

ГЛАВА 7 ДИСПЕРСИОННЫЙ АНАЛИЗ
7.1. Понятие дисперсионного анализа
Дисперсионный анализ - это анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов. В зарубежной литературе дисперсионный анализ часто обозначается как ANOVA, что переводится как анализ вариативности (Analysis of Variance). Автором метода является Р. А. Фишер (Fisher R.A., 1918, 1938).
Задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака вычленить вариативность троякого рода:
а) вариативность, обусловленную действием каждой из исследуемых независимых переменных;
б) вариативность, обусловленную взаимодействием исследуемых независимых переменных;
в) случайную вариативность, обусловленную всеми другими неизвестными переменными.
Вариативность, обусловленная действием исследуемых переменных и их взаимодействием, соотносится со случайной вариативностью. Показателем этого соотношения является критерий F Фишера1.

В формулу расчета критерия F входят оценки дисперсий, то есть параметров распределения признака, поэтому критерий F является параметрическим критерием.

___________________
1 Критерии F Фишера и метод углового преобразования Фишера, дающий нам критерий
·*, - это совершенно различные методы, имеющие разное предназначение и разные способы вычисления.

Чем в большей степени вариативность признака обусловлена исследуемыми переменными (факторами) или их взаимодействием, тем выше эмпирические значения критерия F.
В дисперсионном анализе исследователь исходит из предположения, что одни переменные могут рассматриваться как причины, а другие - как следствия. Переменные первого рода считаются факторами, а переменные второго рода - результативными признаками. В этом отличие дисперсионного анализа от прямолинейного корреляционного анализа, в котором мы исходим из предположения, что изменения одного признака просто сопровождаются определенными изменениями другого.
В дисперсионном анализе возможны два принципиальных пути разделения всех исследуемых переменных на независимые переменные (факторы) и зависимые переменные (результативные признаки).
Первый путь состоит в том, что мы совершаем какие-либо воздействия на испытуемых или учитываем какие-либо не зависящие от нас воздействия на них, и именно эти воздействия считаем независимыми переменными, или факторами, а исследуемые признаки рассматриваем как зависимые переменные, или результативные признаки. Например, возраст испытуемых или способ предъявления им информации считаем факторами, а обучаемость или эффективность выполнения задания - результативными признаками.
Второй путь предполагает, что мы, не совершая никаких воздействий, считаем, что при разных уровнях развития одних психологических признаков другие проявляются тоже по-разному. По тем или иным причинам мы решаем, что одни признаки могут рассматриваться скорее как факторы, а другие - как результат действия этих факторов. Например, уровень интеллекта или мотивации достижения начинаем считать факторами, а профессиональную компетентность или социометрический статус - результативными признаками.
Второй путь весьма уязвим для критики. Допустим, мы предположили, что настойчивость - значимый фактор учебной успешности студентов. Мы принимаем настойчивость за воздействующую переменную (фактор), а учебную успешность - за результативный признак. Против этого могут быть выдвинуты сразу же два возражения. Во-первых, успех может стимулировать настойчивость; во-вторых, как, собственно, измерялась настойчивость? Если она измерялась с помощью метода экспертных оценок, а экспертами были соученики или преподаватели, которым известна учебная успешность испытуемых, то не исключено, что это оценка настойчивости будет зависеть от известных экспертам показателей успешности, а не наоборот.
Допустим, что в другом исследовании мы исходим из предположения, что фактор социальной смелости (фактор Н) из 16-факторного личностного опросника Р.Б. Кеттелла - это та независимая переменная, которая определяет объем заключенных торговым представителем договоров на поставку косметических товаров. Но если объем договоров определялся по какому-то периоду работы, скажем трехмесячному, а личностное обследование проводилось в конце этого периода или даже после его истечения, то мы не можем со всей уверенностью отделить здесь причину от следствия. Есть очень сильное направление в психологии и психотерапии, которое утверждает, что личностные изменения начинаются с действий и поступков: "Начни действовать, и постепенно станешь таким, как твои поступки". Таким образом, психолог, представляющий это направление, возможно, стал бы утверждать, что причиной должен считаться достигнутый объем договорных поставок, а результатом - повышение социальной смелости.
Только наше исследовательское чутье может подсказать нам, что должно рассматриваться как причина, а что - как результат. Однако не всегда эти ощущения у разных исследователей совпадают, поэтому нужно быть готовым к тому, что наши выводы могут быть оспорены другими специалистами, которые рассматривают данный предмет с иной точки зрения и видят в нем иные перспективы. Впрочем, спорность выводов - постоянный спутник психологического исследования.
Постараемся быть оптимистичными и представим себе, что существует все же какое-то совпадение взглядов на психологические причины и следствия. На Рис. 7.1 представлены два варианта рассеивания показателей учебной успешности в зависимости от уровня развития кратковременной памяти. Из Рис. 7.1(а) мы видим, что при низком уровне развития кратковременной памяти оценки по английскому языку, похоже, несколько ниже, чем при среднем, а при высоком уровне выше, чем при среднем. Похоже, что кратковременная память может рассматриваться как фактор успешности овладения английским языком. С другой стороны, Рис. 7.1(6) свидетельствует о том, что успешность в чистописании вряд ли так же определенно зависит от уровня развития кратковременной памяти.
О том, верны ли наши предположения, мы сможем судить только после вычисления эмпирических значений критерия F.


Рис. 7.1. Рассеивание индивидуальных средних оценок по английскому языку (а) и чистописанию (б) у учеников с низким, средним и высоким уровнями развития кратковременной памяти

Низкий, средний и высокий уровни развития кратковременной памяти можно рассматривать как градации фактора кратковременной памяти.
Нулевая гипотеза в дисперсионном анализе будет гласить, что средние величины исследуемого результативного признака во всех градациях одинаковы.
Альтернативная гипотеза будет утверждать, что средние величины результативного признака в разных градациях исследуемого фактора различны.
В зарубежных руководствах чаще говорят о переменных, действующих в разных условиях, а не о факторах и их градациях (Greene J., D'Olivera M, 1982, р. 91-93).
Дело в том, что градация подразумевает ступень, стадию, уровень развития. Говоря о градациях фактора, мы явно или неявно подразумеваем, что сила его возрастает при переходе от градации к градации. Между тем, схема дисперсионного анализа применима и в тех случаях, когда градации фактора представляют собой номинативную шкалу, то есть отличаются лишь качественно. Например, градациями фактора могут быть: параллельные формы экспериментальных заданий; цвет окраски стимулов; жанр музыкальных произведений, сопровождающих процесс работы; традиционные или специально подобранные православные тексты в сеансах аутогенной тренировки; разные формы заболевания; разные экспериментаторы; разные психотерапевты и т. д.
Если градации фактора различаются лишь качественно, их лучше называть условиями действия фактора или переменной. Например, действие аутогенной тренировки при условии использования текстов православных молитв или эффективность психокоррёкционных воздействий при разных формах хронических заболеваний у детей3.
Экспериментальные данные, представленные по градациям фактора, называются дисперсионным комплексом. Данные, относящиеся к отдельным градациям - ячейками комплекса.
Дисперсионный анализ позволяет нам констатировать изменение признака, но при этом не указывает направление этих изменений. Нам необходимо специально графически представлять полученные данные по градациям фактора, чтобы получить наглядное представление о направлении изменений.
Подобного рода задачи, как мы помним, позволяют решать непараметрические методы сравнения выборок или условий измерения, а именно критерий Н. Крускала-Уоллиса и критерий
·2r Фридмана (см. параграфы 2.4 и 3.4). Однако это касается только тех задач, в которых исследуется действие одного фактора, или одной переменной. Задачи однофакторного дисперсионного анализа, действительно, могут эффективным образом решаться с помощью непараметрических методов. Метод дисперсионного анализа становится незаменимым только когда мы исследуем одновременное действие двух (или более) факторов, поскольку он позволяет выявить взаимодействие факторов в их влиянии на один и тот же результативный признак. Именно эти возможности двухфакторного дисперсионного анализа послужили причиной, по которой изложение этого метода включено в настоящее руководство.
Несмотря на то, что нас интересует прежде всего двухфакторный дисперсионный анализ, который нельзя заменить другими методами, начнем рассмотрение мы с однофакторного дисперсионного анализа: во-первых, для того, чтобы выдержать определенную последовательность и логику в изложении; во-вторых, для того, чтобы на реальном примере продемонстрировать возможность замены этого метода непараметрическими методами.
См. исследование Е. Б. Кулевой, 1991. См. исследование Н.В.Корольковой, 1994.
Итак, начнем рассмотрение дисперсионного анализа с простейшего случая, когда исследуется действие только одной переменной (одного фактора). Исследователя интересует, как изменяется определенный признак в разных условиях действия этой переменной. Например, как изменяется время решения задачи при разных условиях мотивации испытуемых (низкой, средней, высокой) или при разных способах предъявления задачи (устно, письменно, в виде текста с графиками и иллюстрациями), в разных условиях работы с задачей (в одиночестве, в одной комнате с экспериментатором, в одной комнате с экспериментатором и другими испытуемыми) и т.п. В первом случае переменной, влияние которой исследуется, является мотивация, во втором - степень наглядности, в третьем - фактор публичности.
Преимущество однофакторного дисперсионного анализа по сравнению с непараметрическими методами Н Крускала-Уоллиса и
·2r Фридмана - неограниченность в объемах выборок. Ограничения дисперсионного анализа достаточно условны. Например, требование нормальности распределения признака можно обойти по крайней мере двумя путями: при слишком скошенном, островершинном или плосковершинном распределении можно, во-первых, нормализовать данные, а во-вторых... просто вообще по этому поводу "не волноваться", как советуют, например, А.К. Kurtz и S.T. Мауо (1979, р.417).

7.2. Подготовка данных к дисперсионному анализу
1) Создание комплексов
Лучше всего для каждого испытуемого создать отдельную карточку, куда были бы занесены данные по всем исследованным признакам. Дело в том, что в процессе анализа у исследователя могут измениться гипотезы. Потребуется создавать, быть может, не один, а множество дисперсионных комплексов, различающихся как по факторам, так и по результативным признакам. Карточки помогут нам быстро создавать новые дисперсионные комплексы. Благодаря карточкам мы сразу увидим, равномерно ли распределяются данные по градациям в случае, если за фактор мы решили принять один из исследованных психологических признаков. С помощью карточек мы можем помочь себе выделить три, четыре или более градаций этого фактора, например, уровни мотивации, настойчивости, креативности и др.
2) Уравновешивание комплексов
Комплекс, в котором каждая ячейка представлена одинаковым количеством наблюдений, называется равномерным. Равномерность комплекса позволяет нам обойти требование равенства дисперсий в каждой из ячеек комплекса (Шеффе Г., 1980).
Равномерные комплексы позволяют также избежать значительных трудностей, которые неизбежно возникают при обсчете неравномерных, или неортогональных, комплексов. В настоящем руководстве приведены алгоритмы расчета лишь для равномерных комплексов. С методами обсчета неравномерных комплексов можно ознакомиться у НА. Плохинского (1970), Г.В. Суходольского (1972), Г. Шеффе (1980).
В случае, если в разных градациях комплекса оказалось неравное количество наблюдений, необходимо отсеять некоторые из них. Если в комплексе со связанными выборками кто-либо из испытуемых не был подвергнут одному из условий действия переменной (градаций фактора), то его данные исключаются. Если же комплекс включает независимые выборки, каждая из которых была подвергнута определенному условию воздействия (градации фактора), то "лишние" испытуемые в какой-либо из ячеек комплекса отсеиваются путем случайного выбора необходимого количества карточек.
3) Проверка нормальности распределения результативного признака.
Дисперсионный анализ относится к группе параметрических методов и поэтому его следует применять только тогда, когда известно или доказано, что распределение признака является нормальным (Суходольский Г.В., 1972; Шеффе Г., 1980 и др.). Строго говоря, перед тем, как применять дисперсионный анализ, мы должны убедиться в нормальности распределения результативного признака. Нормальность распределения результативного признака можно проверить путем расчета показателей асимметрии и эксцесса и сопоставления их с критическими значениями (Пустыльник Е.И., 1968* Плохинский Н.А., 1970 и др.).
Произведем необходимые расчеты на примере параграфа 8.3, в котором анализируется длительность мышечного волевого усилия.
Действовать будем по следующему алгоритму:
а) определим показатели асимметрии и эксцесса по формулам Н.А. Плохинского и сопоставим их с критическими значениями, указанными Н.А. Плохинским;
б) рассчитаем критические значения показателей асимметрии и эксцесса по формулам Е.И. Пустыльника и сопоставим с ними эмпирические значения;
в) если эмпирические значения показателей окажутся ниже критических, сделаем вывод о том, что распределение признака не отличается от нормального.
Таблица 7.1
Вычисление показателей асимметрии и эксцесса по показателю длительности попыток решения анаграмм

хi
(хi – 13 EMBED Equation.3 1415)
(хi – 13 EMBED Equation.3 1415)2
(хi – 13 EMBED Equation.3 1415)3
(хi – 13 EMBED Equation.3 1415)4

1
11
0,94
0,884
0.831
0,781

2
13
2,94
8,644
25,412
74,712

3
12
1.94
3,764
7,301
14,165

4
9
-1,06
1,124
-1,191
1,262

5
10
-0.06
0,004
-0,000
0,000

6
11
0,94
0,884
0,831
0,781

7
8
-2,06
4,244
-8.742
18,009

8
10
-0,06
0,004
-0,000
0,000

9
15
4,94
24,404
120,554
595,536

10
14
3,94
15,524
61,163
240,982

И
8
-2,06
4,244
-8,742
18,009

12
7
-3.06
9,364
-28,653
87,677

13
10
-0.06
0,004
-0,000
0,000

14
10
-0,06
0.004
-0,000
0,000

15
5
-5,06
25,604
-129,554
655,544

16
8
-2,06
4,244
-8,742
18,009

Суммы
161

102,944
30,468
1725,467

Для расчетов в Табл. 7.1 необходимо сначала определить среднюю арифметическую по формуле:

где хi - каждое наблюдаемое значение признака;
n - количество наблюдений. В данном случае:

Стандартное отклонение (сигма) вычисляется по формуле:

где хi - каждое наблюдаемое значение признака; 13 EMBED Equation.3 1415– среднее значение (среднее арифметическое); n - количество наблюдений. В данном случае:

Показатели асимметрии и эксцесса с их ошибками репрезентативности определяются по следующим формулам:

где (хi – 13 EMBED Equation.3 1415) - центральные отклонения;

· - стандартное отклонение;
п - количество испытуемых. В данном случае:





Показатели асимметрии и эксцесса свидетельствуют о достоверном отличии эмпирических распределений от нормального в том случае, если они превышают по абсолютной величине свою ошибку репрезентативности в 3 и более раз:

Мы видим, что оба показателя не превышают в три раза свою ошибку репрезентативности, из чего мы можем заключить, что распределение данного признака не отличается от нормального.
Теперь произведем проверку по формулам Е.И. Пустыльника. Рассчитаем критические значения для показателей А и Е:




Итак, оба варианта проверки, по Н.А. Плохинскому и по Е.И. Пустыльнику, дают один и тот же результат: распределение результативного признака в данном примере не отличается от нормального распределения.
Можно выбрать любой из двух предложенных вариантов проверки и придерживаться его. При больших объемах выборки, по-видимому, стоит производить расчет первичных статистик (оценок параметров) на ЭВМ.

4) Преобразование эмпирических данных с целью упрощения расчетов
Н.А. Плохинский указывает на возможность следующих преобразований:
1) все наблюдаемые значения можно разделить на одно и то же число k, например перевести показатели из миллиметров в сантиметры и т.п.;
2) все наблюдаемые значения можно умножить на одно и то же число k, например для того, чтобы избавиться от дробных значений;
3) от всех наблюдаемых значений можно отнять одно и то же число А, например наименьшее значение;
4) можно сделать двойное преобразование: из каждого значения вычесть число А, а полученный результат разделить на другое число k.
При всех этих преобразованиях результативного признака показатели соотношения дисперсий получаются точными и не требуют никаких поправок.
Средние величины изменяются, но их можно восстановить, умножая среднюю величину на число k или деля ее на k (варианты 1 и 2) или прибавляя к средней число А (вариант 3) и т. п. Стандартное отклонение изменяется только при введении множителя или делителя; полученный результат затем придется либо разделить на число к, либо умножить на него (Плохинский Н.А.,1964, с.34-36; Плохинский Н.А., 1970, с.71-72).
В последующих трех параграфах будет рассмотрен метод одно-факторного анализа в двух вариантах:
а) для дисперсионных комплексов, представляющих данные одной и той же выборки испытуемых, подвергнутой влиянию разных условий (разных градаций фактора);
б) для дисперсионных комплексов, в которых влиянию разных условий (градаций фактора) были подвергнуты разные выборки испытуемых.
Первый вариант называется однофакторным дисперсионным анализом для связанных выборок, второй - для несвязанных выборок.
Все предложенные алгоритмы расчетов предназначены для равномерных комплексов, где в каждой ячейке представлено одинаковое | число наблюдений.
7.3. Однофакторный дисперсионный анализ для несвязанных выборок
Назначение метода
Метод однофакторного дисперсионного анализа применяется в тех |случаях, когда исследуются изменения результативного признака под [влиянием изменяющихся условий или градаций какого-либо фактора. В данном варианте метода влиянию каждой из градаций фактора подвергаются разные выборки испытуемых. Градаций фактора должно быть не менее трех4.
Непараметрическим вариантом этого вида анализа является критерий Н Крускала-Уоллиса.
Описание метода
Работу начинаем с того, что представляем полученные данные в виде столбцов индивидуальных значений. Каждый из столбцов соответствует тому или иному из изучаемых условий (см. Табл. 7.2).
После этого нам нужно просуммировать индивидуальные значения по столбцам и суммы возвести в квадрат.
Суть метода состоит в том, чтобы сопоставить сумму этих возведенных в квадрат сумм с суммой квадратов всех значений, полученных во всем эксперименте.
___________
4 Градаций может быть и две, но в этом случае мы не сможем установить нелинейных зависимостей и более разумным представляется использование более простых критериев (см. главы 2 и 3).

Гипотезы
H0: Различия между градациями фактора (разными условиями) являются не более выраженными, чем случайные различия внутри каждой группы.
H1: Различия между градациями фактора (разными условиями) являются более выраженными, чем случайные различия внутри каждой группы.
Графическое представление метода для несвязанных выборок
На Рис. 7.2 показана кривая изменения объема воспроизведения слов при разной скорости их предъявления (см. Пример). Метод дисперсионного анализа позволяет определить, что перевешивает - тенденция, выраженная этой кривой, или вариативность признака внутри групп, которая на графике схематически изображена в виде диапазонов изменения признака от минимального значения к максимальному значению в каждой группе.

Рис. 7.2. Кривая изменения объема воспроизведения при повышении скорости предъявления слов; по каждому условию показаны диапазоны изменения признака (по данным Greene J., D'Olivera M., 1989)

Ограничения метода однофакторного дисперсионного анализа для несвязанных выборок
1. Однофакторный дисперсионный анализ требует не менее трех градаций фактора и не менее двух испытуемых в каждой градации.
2. Должно соблюдаться правило равенства дисперсий в каждой ячейке дисперсионного комплекса. Условие равенства дисперсий выполняется при использовании предлагаемой схемы расчета за счет выравнивания
количества наблюдений в каждом из условий (градаций). Правомерность этого методического приема была обоснована Г.Шеффе (1980).
3. Результативный признак должен быть нормально распределен в исследуемой выборке.
Правда, обычно не указывается, идет ли речь о распределении I признака во всей обследованной выборке или в той ее части, которая [составляет дисперсионный комплекс.
Характерно, что зарубежные руководства, в общем ссылаясь на необходимость нормального распределения данных для дисперсионного анализа, при рассмотрении конкретных схем и примеров к этому вопросу уже не возвращаются и никаких данных о распределении признака в выборке в целом или в той ее части, которая составляет дисперсионный комплекс, не приводят (см; McCall R., 1970; Welkowitz J., Ewen R.B., | Cohen J., 1982; Greene J., D'Olivera M., 1989).
Рассмотрим схему дисперсионного однофакторного анализа для несвязанных выборок, предлагаемую в руководстве J.Greene, M.D'Olivera (1989) с использованием примера этих авторов.
Пример
Три различные группы из шести испытуемых получили списки из десяти слов. Первой группе слова предъявлялись с низкой скоростью -1 слово в 5 секунд, второй группе со средней скоростью - 1 слово в 2 секунды, и третьей группе с большой скоростью - 1 слово в секунду. Было предсказано, что показатели воспроизведения будут зависеть от скорости предъявления слов. Результаты представлены в Табл. 7.2.

Таблица 7.2 Количество воспроизведенных слов (по: J.Greene, M.D'Olivera, 1989,p.99)


№ испытуемого
Группа 1: низкая скорость
Группа 2: средняя скорость
Группа 3: высокая скорость

1
8
7
4

2
7
8
5

3
9
5
3

4
5
4
6

5
6
6
2

6
8
7
4

Суммы
43
37
24

Средние
7,17
6,17
4,00

Общая сумма
104


Поскольку сопоставляются разные группы, любые различия в показателях между разными условиями предъявления слов - это в то же время различия между группами испытуемых. Однако всякие различия между испытуемыми внутри каждой группы объясняются какими-то Другими, не относящимися к делу переменными, будь то индивидуальные различия между отдельными испытуемыми или неконтролируемые факторы, заставляющие их реагировать различным образом. Критерий F позволяет проверить гипотезы:
H0: Различия в объеме воспроизведения слов между группами являются не более выраженными, чем случайные различия внутри каждой группы.
H1: Различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы. Используя экспериментальные значения, представленные в Табл. 7.2, установим некоторые величины, которые будут необходимы для расчета критерия F.

Таблица 7.3 Расчет основных величин для однофакторного дисперсионного анализа



Отметим разницу между
·(хi2), в которой все индивидуальные значения сначала возводятся в квадрат, а потом суммируются, и (
·хi) 2где индивидуальные значения сначала суммируются для получения об- j щей суммы, а потом уже эта сумма возводится в квадрат.
Последовательность расчетов представлена в Табл. 7.4.
Часто встречающееся в этой и последующих таблицах обозначение SS - сокращение от "суммы квадратов" (sum of squares). Это сокращение чаще всего используется в переводных источниках (см., например: Гласе Дж., Стенли Дж., 1976).
SSфакт означает вариативность признака, обусловленную действием исследуемого фактора; SSобщ - общую вариативность признака; SSCA -вариативность, обусловленную неучтенными факторами, "случайную" или "остаточную" вариативность.
MS - "средний квадрат", или математическое ожидание суммы квадратов, усредненная величина соответствующих SS.
df - число степеней свободы, которое при рассмотрении непараметрических критериев мы обозначили греческой буквой v.
Таблица 7.4
Последовательность операций в однофакторном дисперсионном анализе для несвязанных выборок

Вывод: H0 отклоняется. Принимается H1. Различия в объеме [воспроизведения слов между группами являются более выраженными, [чем случайные различия внутри каждой группы (р<0,01). Итак, скорость предъявления слов влияет на объем их воспроизведения5. Вернемся к графику на Рис. 7.2. Мы видим, что, скорее всего, значимость различий объясняется тем, что показатель воспроизведения при самой высокой скорости предъявления слов (условие 3) гораздо ниже соответствующих показателей при средней и низкой скорости.
7.4. Дисперсионный анализ для связанных выборок
Назначение метода
Метод дисперсионного анализа для связанных выборок применяется в тех случаях, когда исследуется влияние разных градаций фактора или разных условий на одну и ту же выборку испытуемых.
Градаций фактора должно быть не менее трех.
Непараметрический вариант этого вида анализа - критерий Фридмана
·2r.
Описание метода
В данном случае различия между испытуемыми - возможный самостоятельный источник различий. В схеме однофакторного анализа для несвязанных выборок различия между условиями в то же время отражали различия между испытуемыми. Теперь различия между условиями могут проявиться только вопреки различиям между испытуемыми.
Фактор индивидуальных различий может оказаться более значимым, чем фактор изменения экспериментальных условий. Поэтому нам необходимо учитывать еще одну величину - сумму квадратов сумм индивидуальных значений испытуемых.
____________
5 Г.В. Суходольским (1972) предложена формула расчета дисперсионного отношения, которая позволяет получить более строгий результат:

где n - среднее количество наблюдений в каждой градации.
В данном случае Fамп=6,942 (р<0,01). Эта величина действительно ниже, чем в цитируемом примере. Однако для первого знакомства с дисперсионным анализом исследователям, обрабатывающим свои данные самостоятельно, в практических целях достаточно использовать приведенный алгоритм расчетов, используемый и в большинстве других руководств (Плохинский Н.А., 1960; Венецкий И.Г., Кильдишев ГС, 1968; Ивантер Э.В., Коросов А.В.; 1992, Kurtz A.K., Mayo S.T, 1979 и др.).

Графическое представление метода
На Рис. 7.3 представлена кривая Изменения времени решения анаграмм разной длины: четырехбуквенной, пятибуквенной и шестибуквенной. Однофакторный дисперсионный анализ для связанных выборок позволит определить, что перевешивает - тенденция, выраженная этой кривой, или индивидуальные различия, диапазон которых представлен на графике в виде вертикальных линий – от минимального до максимального значения.


Рис. 7.3. Изменение времени работы над разными анаграммами у пяти испытуемых; вертикальными линиями отображены диапазоны изменчивости признака в разных условиях от минимального значения (снизу) до максимального значения (сверху)

Ограничения метода дисперсионного анализа для связанных выборок
1. Дисперсионный анализ для связанных выборок требует не менее трех градаций фактора и не менее двух испытуемых, подвергшихся воздействию каждой из градаций фактора.
2. Должно соблюдаться правило равенства дисперсий в каждой ячейке комплекса. Это условие косвенно выполняется за счет одинакового количества наблюдений в каждой ячейке комплекса. Предлагаемая схема расчета ориентирована только на такие равномерные комплексы.
3. Результативный признак должен быть нормально распределен в исследуемой выборке.
В приводимом ниже примере показатели асимметрии и эксцесса составляют:

Таким образом, распределение показателей 5-ти, человек, составляющих дисперсионный комплекс, несколько отличается от нормального: . Однако в целом по выборке распределение нормальное:

По-видимому, необходимо удовлетвориться тем, что в выборке в целом результативный признак распределен нормально. Случайно отобранные 5 человек распределением своих оценок демонстрируют некоторое отклонение. Однако, если бы мы выбирали испытуемых таким образом, чтобы распределение их оценок подчинялось нормальному закону, это нарушило бы правило рандомизации - случайности отбора объектов без учета значений результативного признака при отборе (Плохинский Н.А., 1970).
Данные этого примера нам уже знакомы. Они использовались для иллюстрации непараметрического критерия Фридмана
·2r. Использование здесь этого же примера позволит нам сопоставить результаты, получаемые с помощью непараметрических и параметрических методов.
Пример
Группа из 5 испытуемых была обследована с помощью трех экспериментальных заданий, направленных на изучение интеллектуальной, настойчивости (Сидоренко Е. В., 1984). Каждому испытуемому индивидуально предъявлялись последовательно три одинаковые анаграммы: четырехбуквенная, пятибуквенная и шестибуквенная. Можно ли считать, что фактор длины анаграммы влияет на длительность попыток ее решения?
Сформулируем гипотезы. Наборов гипотез в данном случае два. Набор А.
H0(a): Различия в длительности попыток решения анаграмм разной длины являются не более выраженными, чем различия, обусловленные случайными причинами.
H1(A): Различия в длительности попыток решения анаграмм разной длины являются более выраженными, чем различия, обусловленные случайными причинами. Набор Б.
Н0(Б): Индивидуальные различия между испытуемыми являются не более выраженными, чем различия, обусловленные случайными причинами.
Н1(Б): Индивидуальные различия между испытуемыми являются более выраженными, чем различия, обусловленные случайными причинами.
Длительность попыток решения анаграмм (сек)
Таблица 7.5
Код имени
Условие 1:
Условие 2:
Условие 3;
Суммы

испытуемого
четырехбуквенная
пятибуквенная
шестибуквенная
по испытуемым


анаграмма
анаграмма
анаграмма


1. Л-в
5
235
7
247

2. П-о
7
604
20
631

3. К-в
2
93
5
100

4. Ю-ч
2
171
8
181

5. Р-о
35
141
7
183

Суммы по столбцам
51
1244
47
1342


Установим все промежуточные величины; необходимые для расчета критерия F.

Таблица 7.6
Расчет промежуточных величин для критерия F в примере об анаграммах
Обозначение
Расшифровка обозначения
Экспериментальное значение

Тс
суммы индивидуальных значений по каждому из условий (столбцов)
51; 1244; 47


· Т2с
сумма квадратов суммарных значений по каждому из условий

· Т2с =512+12442+472

n
количество испытуемых
n=5

с
количество значений у каждого испытуемого
(т. е. количество условий)
с=3

N
общее количество значений
N=15

Тn
суммы индивидуальных значений по каждому
испытуемому
247; 631; 100; 181; 183


· Т2n
сумма квадратов сумм индивидуальных значений по испытуемым
2472+6312+1002+1812+1832

(
· x i)2
квадрат общей суммы индивидуальных значений
(
· x i)2=13422

1/N * (
· x i)2
константа, которую нужно вычесть из каждой суммы квадратов
1/N * (
· x i)2 =1/N *13422

xi
каждое индивидуальное значение



· x2i
сумма квадратов индивидуальных значений



Мы по-прежнему помним разницу между квадратом суммы и суммой квадратов
Последовательность расчетов приведена в Табл. 7.7.
ГЛАВА 8 ДИСПЕРСИОННЫЙ ДВУХФАКТОРНЫЙ АНАЛИЗ
8.1. Обоснование задачи по оценке взаимодействия двух факторов
Двухфакторный дисперсионный анализ позволяет нам оценить не только влияние каждого из факторов в отдельности, но и их взаимодействие. Может оказаться, что одна переменная значимо действует на исследуемый признак только при малых (или, напротив, больших) значениях другой переменной. Например, повышение вознаграждения может повышать скорость решения задач у высокоинтеллектуальных испытуемых и понижать ее у низкоинтеллектуальных. Усиление наказания может снижать количество агрессивных реакций у девочек и повышать его у мальчиков. Или, скажем, внушение может влиять на младших школьников, но не влиять на подростков. Один фактор может "заморозить" или, напротив, "катализировать" действие другого.
В исследовании К.А. Harris и К.В. Morrow изучалась такая личностная черта, как доминантность взрослых мужчин и женщин: Авторы предполагали, что доминантность должна быть выше у людей, которые были первенцами в своих семьях, и ниже у средних и тем более младших детей. Оказалось, что влияние каждого из двух исследуемых факторов - пола и порядка рождения - незначимо, а взаимодействие факторов значимо (см. Рис. 8.1). У мужчин доминантность, как и предполагалось, с увеличением порядка рождения снижается, а у женщин, напротив, повышается. Авторы объясняют это двояко: тем, что младшие девочки в семьях могут пользоваться особым предпочтением остальных членов семьи или тем, что повышенной доминантностью они отвечают на свое подчиненное положение в детстве (
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
Рис. 3.1. Изменения показателей Доминантности (шкала Калифорнийского личностного опросника) в зависимости от порядка рождения у мужчин (сплошная линия) и женщин (пунктирная линия) (по: Harris А. К., Morrow К. В., 1992, р. 115)

Если нами установлено значимое взаимодействие факторов, то это зачастую важнее, чем действие каждого из факторов в отдельности. Некоторые исследователи предлагают вообще игнорировать в таких случаях "основные эффекты" каждого из взаимодействующих факторов и рассматривать только взаимодействие (McCall R., 1970, р. 250).
Специалист по возрастной и дифференциальной психологии знает, что "основных эффектов", или общих закономерностей, в действительности достаточно мало. Почти всегда требуется поправка на возраст испытуемых, их пол, профессиональную принадлежность, способ восприятия, тип энергетической мобилизации и т.п. К счастью, петербургская-ленинградская школа психологии благодаря, в первую очередь, Б.Г., Ананьеву, никогда не была "бесполой" или "вневозрастной" (см., например, Ананьев Б.Г., 1968). Именно поэтому дисперсионный анализ в большей степени отвечает ленинградскому дифференциально-психологическому подходу в экспериментальных исследованиях. Он помогает нам выявлять все более и более частные и точные закономерности и приближает нас к установлению закономерностей индивидуальных стилей.
Двухфакторный дисперсионный анализ предъявляет особые требования к формированию комплексов. Комплекс должен представлять собой симметричную систему: каждой градации фактора А должно соответствовать одинаковое количество градаций фактора В. Например, для исследования А.К. Harris, К.В. Morrow (см. Рис. 8.1) это означает, что и среди мужчин должны были быть старшие, средние и младшие дети, и среди женщин должны быть старшие, средние и младшие дети, причем для равномерного комплекса необходимо, чтобы в каждой ячейке комплекса было одинаковое количество испытуемых. Понятно, конечно же, что это значительно усложняет исследование и требует тщательного предварительного планирования его.
Подробности работы лучше рассматривать на примерах, поэтому перейдем к моделям двухфакторного дисперсионного анализа: а) для несвязанных выборок; б) для связанных выборок.
8.2. Двухфакторный дисперсионный анализ для несвязанных выборок
Назначение метода
Данный вариант двухфакторного дисперсионного анализа применяется в тех случаях, когда исследуется одновременное действие двух факторов на разные выборки испытуемых, т. е. когда разные выборки, испытуемых оказываются под воздействием разных сочетаний двух факторов. Количество выборок определяется количеством ячеек дисперсионного комплекса.
Описание метода
Суть метода остается прежней, но в двухфакторном дисперсионном анализе мы можем проверить большее количество гипотез. Расчеты гораздо сложнее, чем в однофакторных комплексах.
Используемый в данном руководстве алгоритм расчетов предназначен только для равномерных комплексов. Если комплекс получился неравномерным, необходимо случайным образом отсеять несколько испытуемых.
Работу начинаем с построения специальной таблицы, отражающей весь дисперсионный комплекс. Подробности лучше сразу рассматривать на примере.
·Пример
Рассмотрим пример из руководства J.Greene, M.D.'Olivera (1989).
Четырем группам испытуемых предъявлялись списки из 10 слов:
группе 1 - короткие слова с большой скоростью;
группе 2 - короткие слова с медленной скоростью;
группе 3 - длинные слова с большой скоростью;
группе 4 - длинные слова с медленной скоростью.
В каждой группе было по 4 испытуемых, всего N=16. Предсказывалось, что между факторами длины слов и скоростью их предъявления будет наблюдаться значимое взаимодействие: при большой скорости предъявления лучше будут запоминаться короткие слова, а при медленной скорости - длинные слова. Результаты экспериментов представлены в Табл. 8.1.

Таблица 8.1
Количество воспроизведенных слов при разной длине слов и разной скорости их предъявления (по J.Greene, M.D'Olivera, 1989)
Переменная (фактор) В скорость предъявления слов
Переменная (фактор) А - длина слов
Суммы по переменной В (ТB)



A1 - короткие слова
A2 - длинные слова



В1 (большая скорость)
9867
30
5334
15
45

B2 (малая скорость)
4335
15
7567
25
40

Суммы по переменной А (ТA)

45

40
85

Заметим, что в отечественных руководствах чаще предлагается другая, более привычная для нас, форма таблиц для двухфакторных дисперсионных комплексов (Табл. 8.2). При такой форме легче "увидеть" комплекс в целом.

Таблица 8.2
Двухфакторный дисперсионный комплекс по оценке влияния фактора А (длина слов) и фактора В (скорость предъявления слов) на количество воспроизведенных слов
Градации фактора А
А1 - короткие слова
A2 – длинные слова

Градации фактора В
B1
B2
B1
B2


9
8
6
7
4
3
3
5
5
3
3
4
7
5
6
7

Суммы по ячейкам
30
15
15
25

Суммы по градациям фактора А
ТA1=45
ТA2=40.

Суммы по градациям фактора В
ТB1==30+15=45
ТB2==15+25=40

Как видим, при такой форме таблицы легче подсчитать суммы по ячейкам (в столбик), но труднее разобраться с суммами по градациям каждого из факторов. В данном случае оказалось, что они совпали:
ТA1= ТB1; ТA2= ТB2.
В дальнейшем при использовании алгоритма расчетов будем опираться на Табл. 8.1.
Сформулируем гипотезы. Это будут гипотезы, касающиеся влияния фактора А отдельно от фактора В (как бы при "усредненных" его значениях), гипотезы о влиянии фактора В отдельно от фактора А и гипотезы о влиянии взаимодействия градаций факторов А и В.
1 комплект гипотез
H0: Различия в объеме воспроизведения слов, обусловленные действием фактора А, являются не более выраженными, чем случайные различия между показателями.
H1: Различия в объеме воспроизведения слов, обусловленные действием фактора А, являются более выраженными, чем случайные различия между показателями.
2 комплект гипотез
H0: Различия в объеме воспроизведения слов, обусловленные действием фактора В, являются не более выраженными, чем случайные различия между показателями.
H1: Различия в объеме воспроизведения слов, обусловленные действием фактора В, являются более выраженными, чем случайные различия между показателями.
3 комплект гипотез
H0: Влияние фактора А на объем воспроизведения слов одинаково при разных градациях фактора В, и наоборот.
H1: Влияние фактора А на объем воспроизведения слов различно при разных градациях фактора В, и наоборот.
Используя экспериментальные значения, представленные в Табл. 8.1, установим некоторые величины, которые будут необходимы для расчета критериев F.

Таблица 8.3
Величины, необходимые для расчета критериев F в двухфакторном дисперсионном анализе для несвязанных выборок


Напомним, что при подсчете
· x i2 все индивидуальные значения сначала возводятся в квадрат, а потом суммируются, а при подсчете (
· x i)2 все индивидуальные значения сначала суммируются, а затем их общая сумма возводится в квадрат.
Последовательность расчетов представлена в Табл. 8.4.

Таблица 8.4
Последовательность операций в двухфакторном дисперсионном анализе для несвязанных выборок


Вывод: Но принимается в комплектах гипотез 1 и 2. Различия в объеме воспроизведения слов, обусловленные в отдельности факторами А и В, не являются более выраженными, чем случайные различия между показателями. H0 отвергается для взаимодействия факторов (3 комплект). Принимается H1. Влияние фактора А на объем воспроизведения слов различно при разных градациях фактора В, и наоборот (р
·0,01).
Итак, оказывается, что факторы длины слов и скорости их предъявления в отдельности не оказывают значимого действия на объем воспроизведения. Значимым оказывается именно взаимодействие факторов: короткие слова лучше запоминаются при быстрой скорости предъявления, а длинные - при медленной скорости предъявления (см. Рис. 8.2). Таким образом, предположение, высказанное авторами, нашло статистически значимое подтверждение (р
·0,001).


Рис. 8.2. Кривые изменения объема воспроизведения при повышении скорости предъявления коротких (сплошная линия) и длинных слов (пунктирная линия)


Ограничения двухфакторного дисперсионного анализа для несвязанных выборок
1. У каждого фактора должно быть не менее двух градаций.
2. В каждой ячейке комплекса должно быть не менее двух наблюдаемых значений для выявления взаимодействия градаций.
3. Количества значений во всех ячейках комплекса должны быть равны для обеспечения равенства дисперсий в ячейках комплекса и для использования приведенного выше алгоритма расчетов; для неравномерных комплексов можно использовать алгоритмы Н.А. Плохинского (1970).
4. Комплекс должен представлять собой симметричную систему: каждой градации фактора А должно соответствовать одинаковое количество градаций фактора В.
5. Результативный признак должен быть нормально распределен в исследуемой выборке, в противном случае значимые различия будет выявить гораздо труднее и применение метода будет не вполне корректным.
6. Факторы должны быть независимыми. В рассмотренном примере скорость предъявления слов и их длина - внешне независимые факторы. В других случаях независимость факторов может быть подтверждена отсутствием корреляционной связи между переменными, выступающими в качестве факторов.
8.3. Двухфакторный дисперсионный анализ для связанных выборок
Назначение метода
Данный вариант двухфакторного дисперсионного анализа применяется в тех случаях, когда исследуется действие двух факторов на од-ну и ту же выборку испытуемых.
Описание метода
Допустим, мы измерили одни и те же показатели у одних и тех же испытуемых несколько раз - в разное время, в разных условиях, с помощью параллельных форм методики и т. п., и нам необходимо провести множественное сравнение показателей, изменяющихся при переходе от условия к условию. Критерий L Пейджа для анализа тенденций изменения признака и критерий
·2r Фридмана неприменимы, так как необходимо определить тенденцию изменения признака под влиянием двух факторов одновременно. Это позволяет сделать только дисперсионный анализ.
Фактически в данной модели дисперсионного двухфакторного анализа проверяются 4 гипотезы: о влиянии фактора А, о влиянии фактора В, о влиянии взаимодействия факторов А и В и о влиянии фактора индивидуальных различий.
В данном варианте дисперсионного анализа нам потребуются две рабочие таблицы, которые позволят рассчитывать сумму по разным комбинациям ячеек комплекса. Рассмотрим это на примере, являющемся продолжением примера из п. 3.3.
Пример
В выборке курсантов военного училища (юноши в возрасте от 18 до 20 лет) измерялась способность к удержанию физического волевого усилия на динамометре. В первый день эксперимента у них, наряду с другими показателями, измерялась мышечная сила каждой из рук. На второй день эксперимента им предлагалось выдерживать на динамометре мышечное усилие, равное '/2 максимальной мышечной силы данной руки. На третий день эксперимента испытуемым предлагалось проделать то же самое в парном соревновании на глазах у всей группы. Пары соревнующихся были подобраны таким образом, чтобы сила обеих рук у них примерно совпадала. Результаты экспериментов представлены в Табл. 8.5. Можно ли считать, что фактор соревнования в группе каким-то образом влияет на продолжительность удержания усилия? Подтверждается ли предположение о том, что правая рука более "социальна"?

Таблица 8.5
Длительность удержания усилия (сек/10) на динамометре правой и левой руками в разных условиях измерения (n=4)


Код имени испытуемого
Наедине с экспериментатором (A1)
В группе сокурсников (A2)


Правая рука
Левая рука
Правая рука
Левая рука

1 Л-в
2 С-с
3 С-в
4 К-в
11
10
15
10


13
11
14
10


12
8
8
5


9
10
7
8

Заметим, что единицы измерения в Табл. 8.5 - это секунды, но в каждом случае количество секунд уменьшено в 10 раз. Это законный способ преобразования индивидуальных значений, направленный на облегчение расчетов. Для того, чтобы не оперировать трехзначными числами, мы можем разделить их на какую-либо константную величину или уменьшить их на какую-либо константную величину (подробнее см п. 7.2).
Преобразуем таблицу индивидуальных значений в две рабочие таблицы двухфакторного дисперсионного комплекса для связанных выборок (Табл. 8.6 и 8.7). Мы видим, что здесь приведены суммы индивидуальных значений отдельно по градациям фактора А (вне группы - в группе) и по градациям фактора В (правая рука - левая рука), по сочетаниям градаций А1В1, А1В2, А2В1, А2В2, а также суммы всех индивидуальных значений каждого испытуемого и общие суммы.

Таблица 8.6 Двухфакторный дисперсионный комплекс по оценке влияния фактора А (вне группы - в группе) и фактора В (правая - левая рука) на длительность удержания физического волевого усилия (сек/10) - вариант I
Код имени испытуемого
A1 - вне группы
А2 - в группе
Индивидуальные суммы всех 4-х значений


B1
B2
Индивидуальные суммы по A1
(В1+В2)
B1
B2
Индивидуальные суммы по А2 (В1+В2)


1. Л-в
2. С-с
3. С-в
4. К-в
11
13
12
9
10
11
8
10
21
24
20
19
15
14
8
7
10
10
5
8
25
24
13
15
46
48
33
34

Суммы по ячейкам
45
39

44
33


Суммы по града-
циям At и А?
84

77


Общая сумма
161


Таблица 8.7
Двухфакторный дисперсионный комплекс по оценке влияния факторов А и В на длительность физического волевого усилия (сек/10) - вариант II
Код имени испытуемого
B1 – правая рука
B2 – левая рука
Индивидуальные суммы всех 4-х значений


A1
A2
Индивидуальные суммы по B1
(A1+A2)
A1
A2
Индивидуальные суммы по B2 (A1+A2)


1. Л-в
2. С-с
3. С-в
4. К-в
11
13
12
9
15
14
8
7
26
27
20
16
10
11
8
10
10
10
5
8
20
21
13
18
46
48
33
34

Суммы по ячейкам
45
44

39
33


Суммы по града-
циям At и А?
89

72


Общая сумма
161


Мы видим, что в Табл. 8.7 фактически только две ячейки комплекса поменялись местами: A1B2 и A2B1. Это позволяет нам с большей легкостью подсчитать суммы по градациям B1 и В2. Если бы 'мы пользовались только Табл. 8.6, то нам пришлось бы подсчитывать их "через столбец" и, кроме того, трудно было бы их куда-то подходящим образом записать. В дальнейшем при расчетах мы всякий раз будем указывать, к какой таблице лучше обратиться для извлечения нужных сумм, первой (I) или второй (II).
Установим некоторые величины, которые будут необходимы для расчёта критериев F.

Таблица 8.8
Величины, необходимые для расчета критериев F в двухфакторном дисперсионном анализе для связанных выборок


Теперь при расчетах будем лишь подставлять уже подсчитанные значения тех или иных величин. В случае, если какой-то из шагов в алгоритме расчетов будет не вполне ясен, можно вернуться к Табл. 8.8 и восстановить процедуры расчетов, или к Табл. 8.6 и Табл. 8.7, для того, чтобы вспомнить, почему мы подставляем в формулу ту или иную конкретную величину.
_____________
На самом деле в эксперименте участвовало 20 человек. В дисперсионный комплекс случайным образом отобраны 4 из них в целях упрощения расчетов. Результаты дисперсионного анализа по такой "усеченной" выборке совпадают с данными обработки всей выборки с помощью критерия
·2r.

Таблица 8.9
Последовательность операций в двухфакторном дисперсионном анализе для связанных выборок


Мы видим, что влияние факторов А и В, как каждого в отдельности, так и в их взаимодействии, незначимо. В то же время фактор индивидуальных различий между испытуемыми (Fи) оказался значимым (р<0,05). Мы видим из формы приведенного алгоритма, что этот индивидуальный источник вариативности с самого начала учитывается практически как третий фактор вариативности признака. Критерий F для факторов А и В вычисляется как отношение вариативности между градациями факторов к вариативности между испытуемыми в этих градациях.
На Рис. 8.3 индивидуальные изменения величин длительности физического волевого усилия представлены графически.


Рис. 8.3. Индивидуальные изменения длительности физического волевого усилия по четырем испытуемым

Как видно из Рис. 8.3, у одного испытуемого выше показатели по левой руке, у трех других - по правой. При измерении вне группы индивидуальные кривые ближе друг к другу, при измерениях в группе они расходятся. Можно было бы говорить об увеличении разброса индивидуальных значений при измерении длительности физического волевого усилия в группе, в атмосфере соревнования. Однако, несмотря на название, дисперсионный анализ выявляет влияние фактора не на рассеивание индивидуальных значений, а на среднюю их величину. Влияние же фактора на рассеивание признака можно уловить с помощью других критериев, в том числе непараметрических (Суходольский Г.В., 1972, с.341).
И все же представим

Приложенные файлы

  • doc 8959992
    Размер файла: 5 MB Загрузок: 0

Добавить комментарий