17.Погребицкая М.В. Математические методы в пси..


Министерство образования и науки Республики Казахстан
Северо-Казахстанский государственный университет им. М. Козыбаева
-3810011684000
1209675104140М.В. Погребицкая
00М.В. Погребицкая

825548895МАТЕМАТИЧЕСКИЕ МЕТОДЫ
В ПСИХОЛОГИИ
00МАТЕМАТИЧЕСКИЕ МЕТОДЫ
В ПСИХОЛОГИИ

Учебно-методическое пособие
для студентов психологических и
педагогических специальностей

Петропавловск 2004
ББК 88
УДК 311:189.9
П 43
Издается по решению
Учебно-методического Совета
СКГУ им. М.Козыбаева
(протокол № 9 от 24.06.2004г.)
Рецензент:
кандидат физико-математических наук, доцент Е. Акжигитов
Погребицкая М.В.
П 43 Математические методы в психологии: Учебно-методическое пособие. – Петропавловск, СКГУ, 2004.- 228 с.
Учебно-методическое пособие содержит системное изложение математических методов в применении к задачам экспериментальных психологических исследований. В доступной форме, не требующей значительной подготовки, рассматриваются основные методы обработки данных, включая непараметрические критерии оценки различий и корреляционный анализ. Приведены многочисленные примеры такой обработки и предложены многовариантные лабораторные работы для развития практических навыков решения задач.
Пособие предназначено для студентов психологических и педагогических специальностей, а также может быть использовано студентами, обучающимися по кредитной и дистанционной технологиям, исследователями в области психологии, социологии, педагогики, медицины и биологии.
УДК 311:189.9
Погребицкая М.В., 2004
Северо-Казахстанский государственный университет им. М.Козыбаева, 2004
СОДЕРЖАНИЕ
От автора……………………………………………………... 7
Введение……………………………………………………... 9
Раздел I. ОПИСАТЕЛЬНАЯ СТАТИСТИКА Тема 1. Измерения в психологии……………………….. 15
Признаки и переменные…………………………. 15
Шкалы измерения………………………………… 16
Вопросы и упражнения…………………………... 18
Тема 2. Представление данных………………………… 20
Группировка данных……………………………… 20
Табулирование данных………………………….. 21
Ранговый порядок ………………………………... 23
Распределение частот…………………………… 25
Статистические ряды…………………………….. 27
Понятие распределения и гистограммы……… 29
Вопросы и упражнения…………………………... 33
Тема 3. Меры центральной тенденции………………... 34
Мода………………………..……………………….. 34
Медиана………………………..…………………... 36
Среднее………………………..…………………… 38
Мода, медиана и среднее значение объединенных групп……………………………… 40
Интерпретация моды, медианы и среднего….. 41
Выбор меры центральной тенденции…………. 42
Вопросы и упражнения…………………………... 45
Тема 4. Меры изменчивости…………………………….. 46
Размах………………………..…………………….. 47
Дисперсия и стандартное отклонение………… 47
Стандартизированные данные…………………. 51
Вопросы и упражнения…………………………... 53
Тема 5. Распределение признака. Нормальное распределение…………………………………… 55
Параметры распределения……………………... 55
Нормальное распределение……………………. 56
Асимметрия………………………………………... 60
Эксцесс………………………..……………………. 61
Применение нормального распределения…… 62
Вопросы и упражнения…………………………... 64
Тема 6. Понятие выборки………………………………… 65
Полное и выборочное исследования………….. 66
Зависимые и независимые выборки…………... 67
Требования к выборке…………………………… 67
Репрезентативность выборки…………………... 69
Формирование выборки…………………………. 71
Определение объема выборки…………………. 72
Вопросы и упражнения…………………………... 76
Раздел II. ОБЩИЕ ПРИНЦИПЫ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ Тема 7. Статистические гипотезы и критерии………. 78
Статистические гипотезы………………………... 79
Статистические критерии……………………….. 81
Параметрические и непараметрические методы……………………………………………… 83
Уровни статистической значимости…………… 85
Правило отклонения нулевой и принятия альтернативной гипотезы……………………….. 86
Мощность критериев……………………………... 89
Вопросы и упражнения…………………………... 90
Тема 8. Классификация психологических задач, решаемых с помощью статистических методов………………………..…………………... 92
Классификация задач……………………………. 92
Принятие решения о задаче и методе обработки ………………………..………………… 97
Вопросы и упражнения…………………………... 98
Раздел III. СТАТИСТИЧЕСКИЕ КРИТЕРИИ Тема 9. Корреляционный анализ……………………….. 100
Понятие корреляционной связи………………... 100
Коэффициент ранговой корреляции rs Спирмена………………………..…………………. 105
Коэффициент линейной корреляции Пирсона 110
Расчет уровней значимости коэффициентов корреляции………………………..……………….. 114
Коэффициент корреляции ……………………. 115
Вопросы и упражнения…………………………... 118
Тема 10. Выявление различий в уровне исследуемого признака………………………... 120
Постановка задачи……………………………….. 120
Q - критерий Розенбаума………………………... 122
S - критерии тенденций Джонкира……………... 126
Вопросы и упражнения…………………………... 131
Тема 11. Оценка достоверности сдвига в значениях исследуемого признака………………………... 132
Постановка задачи……………………………….. 132
Т - критерий Вилкоксона…………………………. 136
Вопросы и упражнения…………………………... 140
Тема 12. Критерии согласия распределений и многофункциональные критерии…………… 141
Постановка задачи……………………………….. 141
2 критерий Пирсона……………………………… 142
- критерий Колмогорова-Смирнова………….. 160
Критерий * - угловое преобразование Фишера……………………………………………... 167
Вопросы и упражнения…………………………... 175
Заключение………………………..………………………… 176
Приложение 1. Статистические таблицы критических значений………………………..……………………………… 179
Приложение 2. Лабораторные работы по дисциплине «Математические методы в психологии» ………………. 194
Приложение 3. Описание статистических функций табличного процессора Microsoft Excel………………….. 210
Приложение 4. Применение пакета анализа табличного процессора Microsoft Excel для решения статистических задач………………………..……………… 220
Приложение 5. Литература………………………………... 227
ОТ АВТОРА
34290010350500
Применение математических методов для обработки экспериментального материала в психологии – неотъемлемая часть профессиональных навыков современного психолога.
Математические методы – это мощный инструмент, позволяющий успешно ориентироваться в море экспериментальных данных и избегать логических и содержательных ошибок в работе психолога.
Наиболее естественным путем, которым математика проникает в психологию, является математическая статистика, применение которой позволяет психологу обосновывать экспериментальные планы, обобщать данные экспериментов, выявлять различия между группами испытуемых, находить зависимости между экспериментальными данными, строить статистические прогнозы.
Настоящее учебно-методическое пособие призвано решить следующие задачи:
повысить уровень математической культуры студентов-психологов;
привить навыки самостоятельной работы в условиях кредитной технологии и дистанционного обучения;
дать представление об основных статистических
процедурах;
научить студентов самостоятельно проводить первоначальную статистическую обработку экспериментальных данных;
сформировать основы статистического мышления студентов;
научить студентов правильно выбирать методы обработки экспериментальных данных и оценивать полученные результаты;
научить студентов грамотно подготавливать данные для работы со статистическими пакетами на ЭВМ;
привить навыки использования инструментов среды Microsoft Excel для нахождения различного рода статистик.
Материал для пособия подобран с учетом требований Государственных общеобязательных стандартов образования РК к содержанию первой части дисциплины «Математические методы в психологии» по специальностям 520930 «Психология», 020940 «Психология», 031440 «Педагогика и психология», 050106 «Педагогика и психология» и 050503 «Психология».
Большинство рассматриваемых в руководстве методов являются непараметрическими, что расширяет их возможности применения в психологии по сравнению с традиционными параметрическими методами. Пособие содержит большое количество практических примеров и задач.
В руководство включены также 10 многовариантных лабораторных работ, выполнение которых возможно с применением и без применения статистических пакетов на ЭВМ. В одном из приложений приводятся описания статистических функций табличного процессора Excel, входящего в состав пакета программ Microsoft Office. Приложение 4 содержит рекомендации к использованию встроенного пакета анализа в Excel.
92265518732500
ВВЕДЕНИЕ
3422659334500
В настоящее время использование математических методов в развитии новых психологических теорий стало необходимостью. Математические процедуры входят в такие разделы психологии, как психометрика, психодиагностика, дифференциальная психология, психогенетика. Многие психологические концепции подвергаются сомнению на основании того, что они не подтверждены статистически.
С другой стороны, психологу можно совершать открытия, не привлекая математики. Существует множество теорий в психологии, сформулированных без поддержки математики, например, теория психоанализа, бихевиоральная концепция, аналитическая психология.
Психология отличается от многих наук тем, что не имеет собственных единиц измерения и берет их «напрокат», например, у физики (секунды, миллиметры, градусы). Тем не менее, применение математического аппарата в большинстве исследований проще, чем доказательство, что в этом не было необходимости. В любом случае математика систематизирует мышление и позволяет выявить закономерности, на первый взгляд, не всегда очевидные.
Можно выделить три стадии процесса математизации психологической науки.
Первая стадия – это применение математических методов для анализа и обработки результатов экспериментов и наблюдений и установление простейших количественных закономерностей (психофизический закон, экспоненциальная кривая научения).
Вторая стадия заключалась в попытке моделирования психических процессов и явлений с помощью готового математического аппарата, разработанного ранее для других наук.
Третий этап математизации (современный этап) характеризуется разработкой специализированного математического аппарата для исследования и моделирования психических процессов и явлений, формирования математической психологии как самостоятельного раздела теоретической (абстрактно-аналитической) психологии.
В основе предмета «Математические методы в психологии» лежит «математическая статистика» – наука о случайных явлениях, включающая описание случайных явлений, проверку гипотез, изучение причинных зависимостей.
Распространенное отношение к статистике – смесь благоговения с цинизмом, подозрением и презрением. Однажды кто-то заметил: «Есть маленькая ложь, есть большая ложь, а есть статистика». Необоснованное применение методов статистики может повлечь за собой ситуацию, в которой человек, держа голову в холодильнике, а ноги в печи, говорит: «В среднем я чувствую себя прекрасно». Отказ от широко распространенного мнения о статистике – это не только путь к новым открытиям и закономерностям в различных областях познания, но и лучшая защита от цифрового абсурда.
Первоначально статистикой (statistics) называлось изучение государственных дел. В XVII в. в Европе горстка математиков проводила небольшие частные исследования, которые впоследствии оформились в теорию вероятностей. Эти исследования, проведенные, в частности, Блезом Паскалем (1623-1662гг.) и Пьером Ферма (1601-1665гг.), выполнялись по просьбе Шевалье де Мере, азартного игрока, которому было особенно важно понять природу удачи.
На первоначальное развитие статистических методов оказало влияние их происхождение. У статистики были «мать», которой нужно было представлять регулярные отчеты правительственных подразделений (слова «штат» и «статистика» происходят от одного латинского корня –status), и «отец» – честный карточный игрок, который полагался на математику, усиливавшую его ловкость – умение брать решающие взятки в азартных играх. От «матери» ведут свое происхождение счет, измерение, описание, табулирование, упорядочение и проведение переписей, т.е. все то, что привело к современной описательной статистике. От предприимчивого интеллектуала – «отца» – в конечном счете, возникла современная теория статистического вывода, непосредственно базирующаяся на теории вероятностей. Недавнее дополнение, называемое планированием экспериментов, опирается в основном на сочетание теории вероятностей с несколько элементарной, но удивительной логикой.
Начала статистической теории измерений положены Карлом Фридрихом Гауссом – королем математиков, как его называли современники, – в первой половине XIX века в связи с его занятиями астрономией и геодезией. С 1807 г. и до самой смерти в 1855 г. Гаусс заведовал кафедрой математики Геттингенского университета и одновременно был директором обсерватории в Геттингене. В его основном труде по астрономии «Теория движения небесных тел» содержится способ определения орбит планет по наблюдениям, который опирается на развитую им же классическую теорию ошибок измерений. Таким образом, метрология оказывается тесно связанной со статистической теорией измерений.
Естественно было ожидать, что дальнейшее развитие математической статистики будет стимулироваться новыми проблемами метрологии.
Важной сферой применения методов математической статистики является массовое производство. Первые идеи в этой области принадлежат одному из директоров крупных пивоваренных заводов Гиннеса в Англии. В начале XX в. он прочитал книгу по теории вероятностей и подумал, что «из этого можно делать деньги». Позвав к себе Уильяма Госсета, младшего служащего завода, директор предложил ему поехать в единственный в то время центр статистических исследований в Лондоне для учебы под руководством крупнейшего статистика, биолога и философа Карла Пирсона, основателя журнала «Биометрика».
У.Госсет проявил инициативу и выдающиеся способности и вскоре приступил к самостоятельным исследованиям. Их результаты были весьма значительны: одни представляли несомненную ценность для пивоварения, другие – большой теоретический интерес. Естественно возникла проблема их публикации. Но устав пивоваренной компании Гиннеса запрещал работникам публикацию результатов исследований. Однако компания дала согласие на публикацию работ по теоретическим вопросам статистики (что было нарушением устава), но решила не связывать результаты с именем одного из служащих компании, дабы конкуренты не могли догадаться о пользе, которую несет статистика для пивоварения. В результате научный мир был изумлен рядом первоклассных статей в журнале «Биометрика», опубликованных начиная с 1908 г. под псевдонимом «Student», что значит «Студент», но в нашей литературе принято писать «Стьюдент». Эти работы совершили переворот в статистике, так как они содержат неклассическую постановку задачи и точное ее решение.
Сейчас положение совершенно иное: не только плодотворно развиваются области психологии, широко использующие математические методы, но даже на психологических факультетах и в ряде гуманитарных, биологических и медицинских вузов читается обязательный курс математики, включающий элементы математической статистики.
Основными разделами математической статистики считаются разделы описательной статистики, теория статистического вывода, планирование и анализ экспериментов.
Описательная статистика включает в себя табулирование, представление и описание совокупностей данных. Эти данные могут быть либо количественными, как, например, измерения роста и веса, либо качественными, как, например, пол и тип личности. Описательная статистика упорядочивает и систематизирует имеющуюся информацию, облегчает понимание изучаемого явления.
Наиболее ярким примером статистического описания служат результаты переписи населения, представленные в виде соответствующих таблиц, графиков и показателей распределения населения по демографическим и социальным признакам.
Всякая большая группа испытуемых, относительно которых мы хотим провести исследование и собираемся делать выводы, называется генеральной совокупностью.
Выборка – это часть испытуемых, выделенная из генеральной совокупности для проведения эксперимента.
Теория статистического вывода – это формализованная система методов решения задач, в которой выводятся свойства генеральной совокупности данных путем исследования выборки.
Например, директор крупного концерна хочет определить долю сотрудников, которые положительно относятся к введению нового графика работы. Излишне было бы опрашивать каждого сотрудника, если бы можно было надежно определить такую долю по выборке минимальным объемом, скажем, в 100 человек. Но какова доля тех сотрудников, которые положительно отнеслись в этой выборке из 100 человек, по отношению к доле во всей совокупности сотрудников? Ответ можно получить благодаря теории статистического вывода. Таким образом, задача статистического вывода состоит в том, чтобы предсказать свойства всей совокупности, зная свойства только выборки из этой совокупности. Эти выводы делаются и производятся с помощью методов описательной статистики посредством описания как свойств выборок, так и совокупностей.
Планирование и анализ экспериментов представляет собой третью важную ветвь статистических методов, разработанную для обнаружения и проверки причинных связей между переменными.
К особенностям применения математических методов обработки в психологии относятся следующие утверждения:
чем ближе к реальности экспериментальные данные, тем надежнее результат математического исследования;
при использовании математических методов для анализа и обработки результатов экспериментов и наблюдений большую часть успеха исследования составляют определение типа решаемой задачи и выбор метода решения;
важную часть решения задачи занимает интерпретация полученного результата.
РАЗДЕЛ I
228600125095ОПИСАТЕЛЬНАЯ СТАТИСТИКА
00ОПИСАТЕЛЬНАЯ СТАТИСТИКА

2286004191000
34290091440Тема 1. Измерения в психологии
Тема 2. Представление данных
Тема 3. Меры центральной тенденции
Тема 4. Меры изменчивости
Тема 5. Распределение признака.
Нормальное распределение
Тема 6. Понятие выборки
00Тема 1. Измерения в психологии
Тема 2. Представление данных
Тема 3. Меры центральной тенденции
Тема 4. Меры изменчивости
Тема 5. Распределение признака.
Нормальное распределение
Тема 6. Понятие выборки


ТЕМА 1
34290010350500
ИЗМЕРЕНИЯ В ПСИХОЛОГИИ
114300571500
1.1 ПРИЗНАКИ И ПЕРЕМЕННЫЕ
Существует множество определений «измерения», несколько отличающихся друг от друга. Общим во всех определениях является следующее: измерение – это приписывание числовых форм объектам или событиям в соответствии с определенными правилами (например, вес, рост, IQ). Измерить рост человека – значит приписать число расстоянию между макушкой человека и подошвой его ног, найденному с помощью линейки. Измерение коэффициента интеллектуальности человека – это присвоение числа характеру ответной реакции, возникающей у него на группу типовых задач.
Измеряемые психологические явления называют признаками (переменными или наблюдениями). Такими явлениями могут быть решения задачи, показатель интеллектуальности, уровень тревожности, количество допущенных ошибок в тесте.
Переменные в психологии считаются случайными, т.к. нельзя определить заранее, какое значение они принимают.
Математическая обработка подразумевает оперирование с показателями переменных, полученных в психологических исследованиях.
Показатель (уровень или наблюдаемое значение) – это количественная характеристика измеряемого психологического явления. Значения признака определяются при помощи специальных шкал измерения.
114300571500
1.2 ШКАЛЫ ИЗМЕРЕНИЯ
С. Стивенсом предложена классификация из 4 типов шкал измерения:
номинативная, или номинальная, или шкала наименований;
порядковая, или ординальная шкала;
интервальная, или шкала равных интервалов;
шкала равных отношений.
Номинативная шкала – это шкала, классифицирующая по названию: nomen (лат.) – имя, название. Название же не измеряется количественно, оно лишь позволяет один объект отличить от другого. Номинативная шкала – способ классификации объектов и субъектов, распределение их по ячейкам классификации.
Например, классификация объектов по следующим признакам:
пол (мужской, женский);
цвет глаз (голубой, зеленый и т.д.);
клинические диагнозы;
автомобильные номера;
номера на футболках.
Шкала, состоящая только из двух групп объектов, называется дихотомической, например: «иностранец – соотечественник»; «проголосовал «за» – проголосовал «против»»; «имеет братьев или сестер – единственный ребенок в семье» и т.п.
Единица измерения в номинативной шкале – количество наблюдений или частота, например, в группе 12 женщин и пять мужчин. Точнее, единица измерения – это одно наблюдение. В этой шкале используется лишь отличие классов, но ничего не утверждается относительно того, больше или меньше у объекта А измеряемого свойства в сравнении с объектом В.
Порядковая шкала – это шкала, классифицирующая по принципу «больше – меньше». Если в шкале наименований было безразлично, в каком порядке располагаются классы, то порядковая шкала подразумевает расположение объектов в каком-либо порядке или распределение на классы. К типичным примерам порядковой шкалы можно отнести военные ранги, школьные классы, шкалу человеческих ценностей.
В порядковой шкале должно быть не менее трех классов, например, «подходит для должности – подходит с оговорками – не подходит».
В порядковой шкале не известно истинное расстояние между классами. Чем больше в шкале классов, тем больше возможностей для математической обработки полученных данных и проверки статистических гипотез. Оптимальное количество классов – 12-15.
От классов легко перейти к числам, если условимся считать, что высший класс получает ранг 1, средний – ранг 2, низший – ранг 3, или наоборот. Присвоение каждому классу числового значения – ранга называется ранжированием.
Единица измерения в порядковой шкале – расстояние в 1 класс или 1 ранг, при этом расстояние между классами и рангами может быть разным. Из арифметических операций возможна проверка на соответствие и сравнение.
Интервальная шкала – это шкала, классифицирующая по принципу «больше на определенное количество единиц – меньше на определенное количество единиц». Каждое из возможных значений признака отстоит от другого на равном расстоянии. Например, шкала по Цельсию, шкала по Фаренгейту, исчисление лет по годам, шкалы в единицах стандартного отклонения, процентильные шкалы.
Числа, приписываемые в процессе интервального измерения, имеют свойства однозначности и упорядоченности. Число, присвоенное предмету, представляет собой количество единиц измерения, которое он имеет. Сегодня температура 16 по Цельсию, вчера была 13. Сегодня на 3 теплее, чем вчера. Если завтра температура будет 22, то вчера и сегодня имеют больше сходства с точки зрения температуры, чем вчера и завтра.
Основная особенность интервальных шкал, – что свойства предмета не пропадают, если результат измерения равен нулю; например, 0С не обозначает отсутствие температуры.
Из арифметических операций возможна проверка на соответствие, сравнение и сложение.
Шкала равных отношений – это шкала, классифицирующая объекты и субъекты пропорционально степени выраженности измеряемого свойства. В шкалах отношений классы обозначаются числами, которые пропорциональны друг другу. Главное отличие шкалы равных отношений – наличие абсолютной точки отсчета, т.е. если результат измерения равен нулю, то это говорит об отсутствии измеряемого свойства.
Примером переменных, измеряемых в шкале равных отношений, могут являться абсолютная температура по Кельвину, рост, время, вес.
К переменным в этой шкале применимы все арифметические операции.
114300571500
? ВОПРОСЫ И УПРАЖНЕНИЯ
Дайте определения следующим понятиям:
измерение, признаки и показатели в психологии;
номинативная шкала;
дихотомическая шкала;
порядковая шкала;
шкала отношений;
интервальная шкала.
Приведите примеры переменных и показателей в психологии.
В исследовании фиксировалась скорость решения новой задачи учащимися 1-го класса. Результаты исследования:
Верещагина – 4 минуты;
Голодов – 2 минуты;
Андреева – 3,5 минуты.
Выделите в этой ситуации признак и показатели.
Отнесите каждое из следующих измерений к одному из типов шкал:
метрическая система измерений расстояний;
числа, кодирующие темпераменты;
телефонные номера;
результаты контрольной работы по чтению (количество прочитанных слов в минуту);
числовая ось;
умение водить машину;
школьные оценки.
Перечислите, какие математические операции можно производить с показателями вышеперечисленных шкал.
Может ли показатель в какой-нибудь шкале отнести одновременно к двум классам.
Группу испытуемых разделили на два класса:
стаж работы до 10 лет;
стаж работы более 10 лет.
Можно ли отнести это разбиение к порядковой шкале?
К какому типу шкал относиться часто используемый в психологии семантический дифференциал Ч. Осгуда для измерения социальных установок, ценностных ориентацией и т.п.:
-3 -2 -1 0 +1 +2 +3
абсолютно не согласен не знаю абсолютно согласен
101409514287500

ТЕМА 2
34290010350500
ПРЕДСТАВЛЕНИЕ ДАННЫХ
Любой метод исследования, будь то наблюдение, опрос или анализ документов, позволяет получить разнообразную информацию об изучаемом объекте. Обработать и обобщить эту информацию – значит получить новые знания, сделать их доступными для других специалистов, использовать для выработки рекомендаций при принятии решений. С этой целью сведения, полученные в ходе исследования, нужно преобразовать в форму исходных данных для обработки.
Принципы упорядочения, преобразования и отображения эмпирических психологических данных включают: во-первых, подготовку данных к статистической обработке (группировку, табулирование), во-вторых, графическое представление данных (в форме гистограмм, полигона и кумуляты), в-третьих, статистическую обработку данных.
114300571500
2.1 ГРУППИРОВКА ДАННЫХ
Группировка – это объединение вариант в интервалы, границы которых устанавливаются произвольно и непременно указываются. Получаемая в итоге величина называется частотой появления признака. Группировка данных – это суммирование частоты появления признака или некоторых значений признаков в изучаемом массиве объектов по определенным позициям. Математический смысл обработки исходных данных при использовании метода группировки заключается в суммировании данных по частоте появлений некоторых значений.
Наиболее легким из известных методов обработки является метод простой группировки данных. Например, результаты тестирования студентов 1-го курса по философии распределились следующим образом:
1 – ответили на «отлично» – 10 чел.;
2 – ответили на «хорошо» – 34 чел.;
3 – ответили на «удовлетворительно» – 94 чел.;
4 – получили «неудовлетворительно» – 18 чел.;
5 – не участвовали в тестировании – 12 чел.
114300571500
2.2 ТАБУЛИРОВАНИЕ ДАННЫХ
Наиболее распространенной формой группировки экспериментальных данных являются статистические таблицы. Таблицы бывают сложные и простые. К простым относятся таблицы, применяемые при альтернативной группировке, когда одна группа испытуемых противопоставляется другой; например, здоровые – больным, высокие люди – низким и т.п. Пример простой таблицы приведен ниже (см. таблицу 2.1). В ней представляются результаты обследования мануальной асимметрии у 110 учащихся 3-6-х классов.
Таблица 2.1
Классы Праворукие Леворукие Сумма
3 и 4 43 6 49
5 и 6 44 17 61
Сумма 87 23 110
Усложнение таблицы рекомендуется использовать, когда измерение изучаемых признаков производится в номинативной или порядковой шкале.
Усложнение таблицы происходит за счет возрастания объема и степени дифференцированности представленной в них информации. К сложным таблицам относятся так называемые многопольные таблицы, которые могут использоваться при выяснении причинно-следственных отношений между варьирующими признаками. Примером сложной таблицы служит таблица 2.2, в которой представлены классические данные Ф.Гальтона, иллюстрирующие наличие положительной зависимости между ростом родителей и их детей. Таблица организована таким образом, что позволяет оценить частоту встречаемости в популяции однозначно фиксируемых соотношений роста родителей и роста ребенка.
Таблица 2.2
Рост родителей Рост детей в дюймах Всего
60,7 62,7 64,7 66,7 68,7 70,7 72,7 74,7 74 4 4
72 1 4 11 17 20 6 62
70 1 2 21 48 83 66 22 8 251
68 1 15 56 130 148 69 11 430
66 1 15 19 56 41 11 1 144
64 2 7 10 14 4 37
Всего 5 39 107 255 387 163 58 14 928
Правильно составленные таблицы – это большое подспорье в экспериментальной работе, позволяющее одновременно осуществлять разные варианты группировки полученных данных.
114300571500
2.3 РАНГОВЫЙ ПОРЯДОК
Ранжирование – это расположение данных в порядке возрастания или убывания.
Ранжирование может быть простым и принудительным. При простом ранжировании количество рангов меньше количества ранжируемых признаков. Например, если разделить группу людей, претендующих на должность менеджера, по признаку соответствия предъявляемым требованиям, ранг 1 получат претенденты, соответствующие предъявляемым требованиям, ранг 2 – претенденты частично соответствующие требованиям, ранг 3 – претенденты, не соответствующие требованиям.
В этих случаях не всегда можно все признаки уместить в несколько рангов. Признаки, имеющие один ранг, могут сильно отличаться.
Принудительное ранжирование используется в случае, когда количество рангов равно количеству признаков.
При принудительном ранжировании разные ранги могут искусственно преувеличивать расстояние между рангами. В разных группах один испытуемый может иметь ранг, отличный от того, какой он имел бы в другой группе.
Правила принудительного ранжирования
Наименьшему числовому значению начисляется ранг 1.
Наибольшему числовому значению – ранг, равный n – количеству ранжируемых величин.
Если несколько числовых значений равны, то им начисляется ранг, равный среднему значению из тех рангов, которые они получили бы, если бы не были равны.
Правильность начисления рангов проверяется формулой:
,(2.1)
где – сумма всех рангов,
n – количество ранжируемых величин.
Не рекомендуется ранжировать более 20 величин, поскольку в этом случае ранжирование в целом окажется малоустойчивым.
При необходимости ранжирования достаточно большого числа объектов их следует объединять по какому-либо признаку в достаточно однородные классы, а затем уже ранжировать полученные классы.
Пример начисления рангов для результатов тестирования представлен в таблице 2.3.
Таблица 2.3
Нумерация результатов
(механическое ранжирование) Фамилия Результат Ранг
1 Сорокин А. 71 1
2 Андрейченко Н. 73 2
3 Алексеев Л. 75 4
4 Иванов В. 75 4
5 Ростова А. 75 4
6 Липова О. 84 6
7 Кочеткова А. 87 7
8 Васильев Н. 88 8,5
9 Шепетов А. 88 8,5
10 Гроз И. 90 10
Сумма =SUM(ABOVE) 55
В примере встречаются три значения 75, в обычной нумерации они получили бы ранг 3, 4, 5. Таким образом, каждое из них получает ранг, равный .
Для проверки правильности начисления рангов найдем:
, .
114300571500
2.4 РАСПРЕДЕЛЕНИЕ ЧАСТОТ
При описании общей картины результатов теста список студентов из таблицы можно сократить, классифицируя баллы по распределению частот, иногда называемому распределением.
Числа, показывающие, сколько раз варианты встречаются в данной совокупности, называются частотами, или весами вариант. Они обозначаются fi и имеют индекс «i», соответствующий номеру переменной.
Частость (относительная частота) – доля каждой частоты fi в общем объеме выборки n:
.(2.2)
В таблице 2.4 приведен пример нахождения частоты и частости результатов тестирования из таблицы 2.3.
В случае большого диапазона разброса данных имеет смысл обобщение данных в виде группирования по интервалам. Правила выбора количества интервалов не существует, но предпочтительно группировать по 12-15 интервалам (классам).
Ширина интервалов (класса) должна быть одинаковой и равной
,(2.3)
где h – ширина интервалов;
k – количество классов;
Xmax – максимальное значение из данных;
Xmin – минимальное значение из данных.
Таблица 2.4
Баллы
Хi Частота
fi Частость
wi
71 1 0,1
73 1 0,1
75 3 0,3
84 1 0,1
87 1 0,1
88 2 0,2
90 1 0,1
Сумма 10 1,0
Количество классов выбирается таким образом, чтобы ширина была целым числом.
Задача 2.1
Данные из таблицы 2.4 необходимо разбить на интервалы, найти середины интервалов, а также частоту и частость в интервалах.
Максимальный балл равен 90 баллам, минимальный – 71. Ширина определяется по формуле (2.3):
.
Для того чтобы ширина была целым числом, количество интервалов должно быть или 4, или 5, или 10.
Найдем ширину интервалов при количестве интервалов, равном пяти:
.
Определение середины интервала состоит в усреднении зафиксированных границ интервала. Например, для первого интервала середина будет (74+71)/2=72,5. Занесем все вычисления в таблицу 2.5.

Таблица 2.5
Интервал Середина интервала Частота Относительная частота
71-74 72,5 2 0,2
75-78 76,5 3 0,3
79-82 80,5 83-86 84,5 1 0,1
87-90 88,5 4 0,4
Сумма 10 1,0
114300571500
2.5 СТАТИСТИЧЕСКИЕ РЯДЫ
Особую форму группировки данных представляют так называемые статистические ряды, или числовые значения признака, расположенного в определенном порядке.
В зависимости от того, какие признаки изучаются, статистические ряды делят на атрибутивные, вариационные, ряды динамики, регрессии, ряды ранжированных значений признаков и ряды накопленных частот. Наиболее часто в психологии используются вариационные ряды, ряды регрессии и ряды ранжированных значений признаков.
Вариационным рядом распределения называют двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной выборке. Например, результаты вступительного тестирования оказались следующими: 71, 75, 84, 75, 87, 84, 75, 88, 90, 88. Как видим, некоторые цифры попадаются в данном ряду по несколько раз. Следовательно, учитывая число повторений, данные ряда можно представить в более удобной, компактной форме:
Варианты xi 73 71 75 87 84 88 90 (2.4)
Частоты вариант fi 1 1 3 1 1 2 1 Это и есть вариационный ряд. Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами, или весами, вариант. Они обозначаются строчной буквой латинского алфавита и имеют индекс «i», соответствующий номеру переменной в вариационном ряду.
Общая сумма частот вариационного ряда равна объему выборки, т.е.
.
Частоты можно выражать и в процентах. При этом общая сумма частот или объем выборки принимается за 100%. Процент каждой отдельной частоты или веса подсчитывается по формуле:
.(2.5)
Процентное представление частот полезно в тех случаях, когда приходится сравнивать вариационные ряды, сильно различающиеся по объемам. Например, при тестировании школьной готовности детей города, поселка городского типа и села были обследованы выборки детей численностью 1000, 300 и 100 человек соответственно. Различие в объемах выборок очевидно. Поэтому сравнение результатов тестирования лучше проводить, используя проценты частот.
Приведенный выше ряд (2.4) можно представить по-другому. Если элементы ряда расположить в возрастающем порядке, то получится так называемый ранжированный вариационный ряд:
Варианты xi 71 73 75 84 87 88 90 (2.6)
Частоты вариант fi 1 1 3 1 1 2 1 Подобная форма представления (2.6) более предпочтительна, чем (2.4), поскольку лучше иллюстрирует закономерность варьирования признака.
Частоты, характеризующие ранжированный вариационный ряд, можно складывать или накапливать. Накопленные частоты получаются последовательным суммированием значений частот от первой частоты до последней.
В качестве примера вновь обратимся к ряду 2.6. Преобразуем его в ряд 2.7, в котором введем дополнительную строчку и назовем ее «кумуляты частот».
Варианты xi 71 73 75 84 87 88 90 Частоты вариант fi 1 1 3 1 1 2 1 (2.7)
Кумуляты частот 1 2 5 6 7 9 10 11430010795000
2.6 ПОНЯТИЕ РАСПРЕДЕЛЕНИЯ
И ГИСТОГРАММЫ
В статистике под рядом распределения понимают распределение частот по вариантам. Измеренные величины признака в выборке варьируют в пределах от минимального до максимального значения. Этот предел разбивают на так называемые классовые интервалы, которые, в зависимости от конкретных данных, могут быть как равными по величине, так и неравными.
Существует четыре общих метода графического представления распределения частот: гистограмма, полигон распределения и сглаженная кривая, кумулятивный полигон.
Если по оси абсцисс – OX откладывать величины классовых интервалов, а по оси ординат – OY – величины частот, попадающих в данный классовый интервал, то получается так называемая гистограмма распределения частот. При этом над каждым классовым интервалом строится колонка или прямоугольник, площадь которого оказывается пропорциональной соответствующей частоте. Пример построения гистограммы представлен на рисунке 2.1.

Рис.2.1. Гистограмма результатов тестирования 43 абитуриентов.
Гистограмма представляет собой графическое изображение данного частотного распределения. Виды распределения представлены на рисунке 2.2.
Построение полигона распределения во многом напоминает построение гистограммы. В гистограмме каждый столбец заканчивается горизонтальной линией, причем на высоте, соответствующей частоте в этом разряде. А в полигоне он заканчивается точкой над серединой своего разрядного интервала на той же высоте. Далее точки соединяются отрезками прямых (см. рисунок 2.3). – это и будет полигон распределения.
Если эти же точки соединить плавной линией – получим сглаженную кривую распределения (см. рисунок 2.4).
Если по оси OY откладывать кумуляты частот, то получим кумулятивный полигон (см. рисунок 2.5).

а) Обычный тип б) Гребенка

в) Положительно г) Распределение с
скошенное распределение обрывом слева

д) Плато е) Двухпиковый тип

ж) Распределение с изолированным пиком
Рис. 2.2. Виды гистограмм.

Рис.2.3. Полигон распределения,
представляющий результаты тестирования 43 абитуриентов.

Рис.2.4. Кривая распределения результатов тестирования 43 абитуриентов.

Рис.2.5. Кумулятивный полигон.

9969572009000
? ВОПРОСЫ И УПРАЖНЕНИЯ
Дайте определение следующим понятиям: группировка данных, ранжирование, ранг, частота, частость, статистический и вариационный ряды, распределение, гистограмма, полигон распределения и сглаженная кривая.
В исследовании
Эта задача – на построение группового распределения частот. Следующие данные представляют собой оценки 75 взрослых людей в тесте на определение коэффициента интеллектуальности Стенфорда-Бине:
141 104 101 130 148
92 87 115 96 91
100 133 124 123 92
132 118 98 107 101
97 124 118 107 146
110 111 138 129 121
106 135 97 108 108
107 110 101 105 129
105 110 116 123 113
83 127 112 105 114
127 114 113 139 106
95 105 95 106 105
В задаче:
сгруппируйте результаты наблюдений;
определите частоту и частость показателей;
выберите интервал группирования разрядов;
постройте распределение сгруппированных частот, полигон распределения и сглаженную кривую.
Проведите ранжирование следующих результатов наблюдений: 10, 12, 11, 13, 12, 7, 8, 6, 11, 8, 12, 14, 11.
101409533972500
ТЕМА 3
34290010350500
МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
Свойства совокупности данных можно представить в форме графиков или таблиц. Часто график или таблица говорят больше, чем мы хотим или должны знать, а передаваемая информация может оцениваться временем, потребным на сообщение. Поэтому обычно используется для описания совокупности данных только два-три свойства. Эти свойства (например, «значение», наиболее часто встречающееся среди результатов, или разброс значений) могут быть описаны показателями, известными как «статистики свертки», «методы оценки средних величин» или «меры центральной тенденции».
Термин «статистики» совокупности данных используется при описании выборочной совокупности данных. Если речь идет о генеральной совокупности, то ее показатели именуются «параметрами».
114300571500
3.1 МОДА
Наиболее просто получаемой мерой центральной тенденции является мода. Мода – это значение во множестве наблюдений, которое встречается наиболее часто.
В совокупности значений (1, 2, 2, 7, 8, 8, 8, 10) модой является 8, потому что оно встречается чаще любого другого значения. Мода представляет собой наиболее частое значение (в данном примере 8), а не частоту этого значения (в примере равную 3).
Однако не всякая совокупность значений имеет единственную моду в строгом понимании этого определения, поэтому рабочее определение моды содержит особенности и соглашения.
В случае, когда все значения в группе встречаются одинаково часто, принято считать, что группа оценок не имеет моды. Так, в группе (0,2; 0,2; 2,3; 2,3; 4,1; 4,1) моды нет.
2. Когда два соседних значения имеют одинаковую частоту и они больше частоты любого другого значения, мода есть среднее этих двух значений. Итак, мода группы значений (0,1, 1, 2, 2, 2, 3, 3, 3, 4) равна 2,5.
3. Если два несмежных значения в группе имеют равные частоты и они больше частот любого значения, то существуют две моды. В группе значений (5, 7, 7, 7, 10, 11, 12, 12, 12, 17) модами являются и 7 и 12. В таком случае говорят, что группа оценок является бимодальной.
Замечание
Большие множества данных часто рассматриваются как бимодальные, когда они образуют полигон частот, похожий на спину бактриана – верблюда двугорбого, даже если частоты на двух вершинах не строго равны. Это незначительное искажение определения вполне оправданно, ибо термин «бимодальный» допустим и удобен для описания. Можно условиться различать большие и меньшие моды.
Наибольшей модой в группе называется единственное значение, которое удовлетворяет определению моды. Однако во всей группе может быть и несколько меньших мод. Эти меньшие моды представляют собой, в сущности, локальные вершины распределения частот.
Например, на рисунке 3.1 наибольшая мода наблюдается при значении 6, а меньшие – при 3,5 и 10.

Рис. 3.1. Распределение частот тестовых оценок с наибольшей модой 6 и меньшими модами 3,5 и 10.
114300571500
3.2 МЕДИАНА
Медиана (Md) – значение, которое делит упорядоченное множество данных пополам, так что одна половина значений оказывается больше медианы, а другая – меньше.
Вычисление медианы
1. Если данные содержат нечетное число различных значений, то медиана есть среднее значение для случая, когда они упорядочены. Например, в группе (17, 19, 21, 24, 27) медиана равна 21.
2. Если данные содержат четное число различных значений, то медиана есть точка, лежащая посредине между двумя центральными значениями, когда они упорядочены. В группе (3, 11, 16, 20) медиана вычисляется как (11+ 16)/2 = 13,5.
3. Если в данных есть объединенные классы, особенно в окрестности медианы, возможно, потребуется табулирование частот.
В таких случаях придется интерполировать внутри разряда значений.
Задача 3.1
Пусть, например, 36 значений, упорядоченных от 7,0 до 10,5, имеют следующее распределение:
Значение Частота Накопленная частота
10,5 2 36
10,0 3 34
9,5 2 31
9,0 6 29
8,5 10=5+5 23
22713950008,0 8 13
7,5 4 13 5
7,0 1 1
n=36 Оценкой медианы будет величина n/2, равная 18-му значению снизу. Медиана будет находиться по формуле:
-48260125730фактическая нижняя граница интервала
медианы
ширина интервала медианы

Частота, накопленная к интервалу медианы
Частота в интервале медианы
+
Md =
·
00фактическая нижняя граница интервала
медианы
ширина интервала медианы

Частота, накопленная к интервалу медианы
Частота в интервале медианы
+
Md =
·

(3.1)
В задаче 3.1:
фактическая нижняя граница интервала равна 8,25;
ширина интервала медианы равна 0,5;
оценка медианы n/2 = 36/2 =18;
частота, накопленная к интервалу медианы, равна13;
частота в интервале медианы равна 10.
Подставляя найденные значения в формулу (3.1), получим:
Md = 8,25 + 0,5 (18-13) /10 = 8,5.
114300571500
3.3 СРЕДНЕЕ
Третья мера – среднее выборочное, называемое иногда «средним», «арифметическим средним» или «математическим ожиданием».
Среднее выборочной совокупности п значений определяется как

или:
. (3.2)
Если даны значения и частоты их повторения, то среднее значение определяется формулой:
. (3.3)
Найдем, например, среднее для значений из задачи 3.1:

Если даны значения в интервале, тогда за xi берутся середины интервалов.
Соответствующим параметром генеральной совокупности будет средняя генеральной совокупности , которая вычисляется по формуле (3.4), аналогичной формуле (3.2):
, (3.4)
где N – численность или объем генеральной совокупности.
Свойства среднего
Сумма всех отклонений от среднего значения равна нулю:
. (3.5)
Если константу прибавить к каждому значению, то среднее увеличится ровно на эту константу:
. (3.6)
Если каждое значение умножить на константу с, то среднее увеличится в с раз:
. (3.7)
Сумма квадратов отношений значений от их среднего значения меньше суммы квадратов отклонений от любой другой точки:
. (3.8)
11430010795000
3.4 МОДА, МЕДИАНА И СРЕДНЕЕ ЗНАЧЕНИЕ ОБЪЕДИНЕННЫХ ГРУПП
Мы можем знать средние, медианы и моды для трех разных классов школы и желать найти те же характеристики для объединения всех трех классов. Пусть известны средние и числа учащихся для трех классов А, В и С:

Среднее объединенных групп находится по формуле:
. (3.9)
В нашем случае среднее групп А, B и С будет
.
Мода и медиана для объединенных групп вычисляется заново.
11430010795000
3.5 ИНТЕРПРЕТАЦИЯ МОДЫ, МЕДИАНЫ И СРЕДНЕГО ЗНАЧЕНИЯ
Каждая мера центральной тенденции имеет интересную интерпретацию в терминах ошибок, возникающих из-за того, что единственная статистическая характеристика заменяет все значения в группе. Приведем интерпретацию для моды, медианы и среднего.
Смысл, в котором мода является наиболее представительным значением или значением, которое наилучшим образом «заменяет все значения», вполне ясен. Если мы вынуждены выбрать одно число для замены любого из значений, то совпадение было бы максимальное число раз, если бы выбранное число было модой группы.
Интерпретация медианы группы не столь очевидна.
Медиана представляет собой такую точку на числовой оси, для которой сумма абсолютных (то есть без учета знака) разностей всех значений меньше суммы разностей для любой другой точки:
(3.10)
Если вместо каждого значения выбрать медиану, то достигается минимальная ошибка – при условии, что «ошибка» определяется как сумма абсолютного отличия каждого значения от оценки.
Если взамен каждого значения берется среднее, обеспечивается минимальная ошибка – при условии, что «ошибка» определяется как сумма квадратов разностей каждого значения с оценкой.
11430010795000
3.6 ВЫБОР МЕР ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
Выбор меры центральной тенденции требует некоторых размышлений:
1. Мода наиболее просто вычисляется. Для очень больших групп данных это достаточно стабильная мера центра распределения. Во многих распределениях значительного числа измерений, используемых в педагогике и психологии, мода близка к двум другим мерам – медиане и среднему.
В малых группах мода может быть совершенно нестабильной. Мода группы (1, 1, 1, 3, 5, 7, 7, 8) равна 1; но если одна из единиц превратится в нуль, а другая – в два, то мода станет равной 7.
2. Медиана занимает промежуточное положение между модой и средним с точки зрения ее вычисления, если последнее осуществляется вручную.
На медиану не влияют величины «больших» и «малых» значений. Например, в группе из 50 данных медиана не изменится, если наибольшее значение утроится.
3. На величину среднего влияют значения всех результатов, медиана и мода не требуют для определения всех значений.
Если одно какое-нибудь значение меняется на с единиц, изменится в том же направлении на с/п единиц.
На величину среднего особенно влияют результаты, которые можно назвать «выбросами», то есть данные, находящиеся далеко от центра группы оценок.
4. Некоторые множества данных просто «не имеют центральной тенденции», что часто вводит в заблуждение при вычислении только одной меры центральной тенденции. Особенно это справедливо для групп, имеющих более чем одну моду.
5. Центральная тенденция групп данных, содержащих крайние значения, возможно, наилучшим образом измеряется медианой, когда гистограмма унимодальна. Одно крайнее значение может сместить среднее группы гораздо дальше того места, которое вообще стоит рассматривать как центральную область.
Например, если 9 человек имеют доходы от 4500 до 5200 тенге со средним 4900 тенге, а доход десятого составляет 20000 тенге, то средний доход для 10 лиц будет 6410 тенге. Эта цифра не позволяет судить обо всей группе, хотя она выглядела внушительно для руководителя маленькой фирмы (чье жалованье составляет 20000 тенге), который хочет охарактеризовать среднюю зарплату по платежной ведомости. В этом примере в качестве меры центральной тенденции следовало бы избрать медиану. Демографы, экономисты и журналисты часто выбирают для отчетов «доход по медиане», поскольку стремятся избежать только что описанной ситуации.
6. В унимодальных выборках, которые симметричны, среднее, медиана и мода совпадают. На рисунке 3.2 полигон частот показывает, что среднее, медиана и мода равны 50.

Рис.3.2. Симметричная унимодальная группа данных
Отсутствие полной симметрии в полигоне частот или гистограмме обычно оказывает определенное влияние на соотношение между средним, медианой и модой. Предположим, что преобладающее большинство данных некоторой группы расположено выше вершины полигона частот, как, например, на рисунке 3.3:
1943100540385001403985623570Mo Md
00Mo Md
171450035115500205740057975500
Рис.3.3. Несимметричный полигон частот
На рисунке 3.3 мода (Мо) равна 100, медиана (Md) составляет 105, а среднее = 107,2. Если большинство оценок окажется ниже вершины полигона частот, то среднее станет минимальным, медиана больше, а мода максимальной.
Замечание
Существует много других способов определения «центрального значения» в группе данных, например среднее геометрическое и среднее гармоническое.
Среднее геометрическое находится по формуле:
.
Среднее гармоническое используется иногда для усреднения группы отношений:
.
Среднее геометрическое и среднее гармоническое редко встречаются в литературе по педагогике и психологии.
114300571500
? ВОПРОСЫ И УПРАЖНЕНИЯ
Дайте определение моде, медиане и среднему значению.
Найдите среднее, медиану и моду следующих множеств:
2, 7, 4, 5, 2;
3, 1, 0, 7, 2, 6, 2, 6;
1, 7, 3, 8, 3, 3, 9, 11, 9, 12, 9, 12, 13
22, 15, 16, 21, 24, 24, 27, 28, 30, 30, 31 , 31, 31, 34, 36.
Пусть к каждому из 15 значений последнего множества из упражнения 2 прибавлено 4. Чему будут равны среднее и медиана этих увеличенных значений?
В классе А – 10 учащихся, среднее и медиана результатов контрольной работы равны соответственно 4,2 и 4. В классе Б – 20 учащихся, среднее и медиана результатов контрольной работы которых равны 4,3 и 4,5 соответственно. Чему равны среднее и медиана 30 значений , полученных в результате объединения оценок в классах А и Б?
На какую меру центральной тенденции влияют значения всех результатов?
92265550673000
ТЕМА 4
34290010350500
МЕРЫ ИЗМЕНЧИВОСТИ
Меры центральной тенденции говорят о концентрации группы значений на числовой шкале. Каждая мера дает такое значение, которое «представляет» в каком-то смысле все оценки группы. В этом случае пренебрегают различиями, существующими между отдельными значениями. Для измерения вариации оценок внутри группы требуются другие описательные статистики.
Всякая научная деятельность связана с понятием изменчивости. Когда есть много необъяснимых причин вариабельности, прогнозы не будут очень точными. Зато, когда объяснения причин различий людей и вещей представлены в виде некоторой модели, неопределенность можно уменьшить, а часть вариации устранить.
Например, если бы было совсем неизвестно, почему люди различаются между собой по умственному развитию, то попытка прогнозировать интеллект наталкивалась бы на большую неопределенность; некоторые люди выглядели бы «смышлеными», а другие – «глупыми», и никто не знал бы, почему. Однако если известно, что наследственность и окружающая среда оказывают количественное влияние на IQ, то информация о происхождении ребенка и его воспитании в раннем детстве позволила бы дать более точный прогноз его умственного развития в зрелости. Другими словами, вариабельность IQ у лиц со сходной наследственностью и окружающей средой меньше, чем у людей вообще.
114300571500
4.1 РАЗМАХ
Размах (иногда эту величину называют разбросом выборки) измеряет на числовой шкале расстояние, в пределах которого изменяются оценки, и обозначается буквой R. Это самый простой показатель, который можно получить для выборки, – разность между максимальным и минимальным значениями вариационного ряда, т.е.
(4.1)
Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина R, и наоборот.
Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный.Для того чтобы более четко представлять характер варьирования выборок, следует обратиться к их распределениям.
11430010795000
4.2 ДИСПЕРСИЯ И СТАНДАРТНОЕ ОТКЛОНЕНИЕ
Значения отклонений, то есть значения вида , несут информацию о вариации выборочной совокупности значений. Совокупность с большой неоднородностью будет иметь несколько больших отклонений. Каковы были бы отклонения, если бы все значения и совокупности равнялись 8? Среднее было бы 8, следовательно, каждое отклонение было бы 8 – 8 = 0. В предельно однородной совокупности, которая в принципе достижима, все отклонения равны нулю. Некоторая комбинация отклонений могла бы быть полезной мерой вариации.
Если бы нам требовалось просуммировать все отклонения, то характеризовала ли бы эта сумма вариацию исходных данных? Нет, поскольку эта сумма всегда точно равна нулю:
.
Для обхода этого факта мы можем возвести в квадрат каждое отклонение и найти сумму квадратов. Следовательно, для данной совокупности мера вида

будет большой, когда данные неоднородны, и малой для однородных. Чтобы избавиться от знаков, мы могли бы обойтись без квадратов отклонений; мы могли бы просто рассматривать эти отклонения как положительные (взятые по их абсолютной величине). Это привело бы к другой мере вариации, называемой средним отклонением.
Величина суммы квадратов зависит также от того, сколько имеется данных Чем больше п, тем больше сумма. Если хотят сравнить изменчивость двух совокупностей, которые отличаются по объему, то возникает ограничение. Оно снимается после деления суммы на n-1 и называется выборочной дисперсией:
, (4.2)
где – выборочная дисперсия;
xi – значение признака;
– выборочная средняя;
n – объем выборки.
Задача 4.1
Для нахождения дисперсии группы показателей (1,3,3,0,4,7) удобно вычисления оформить в виде таблицы 4.1.
Таблица 4.1

1 -2 4
3 0 0
3 0 0
0 -3 9
4 1 1
7 4 16
Сумма 0 30
При значение выборочной дисперсии находится по формуле (4.2):
.
Важная характеристика дисперсии заключается в том, что с ее помощью можно сравнивать выборки, различные по объему.
Однако сама дисперсия, как характеристика отклонения от среднего, часто неудобна для интерпретации. Так, например, предположим, что в эксперименте измерялся рост в сантиметрах, тогда размерность дисперсии будет являться характеристикой площади, а не линейного размера.
Для того чтобы приблизить размерность дисперсии к размерности измеряемого признака, применяют операцию извлечения квадратного корня из дисперсии. Полученную величину называют выборочным стандартным отклонением:
. (4.3)
Формулы (4.2) и (4.3) предназначены для вычисления статистик выборки. В них фигурируют значения: n – объем выборочной совокупности и – выборочное среднее.
Рассмотрим аналогичные формулы для вычисления соответствующих параметров генеральной совокупности.
Формула для вычисления генеральной дисперсии будет иметь вид:
, (4.4)
где 2 – генеральная дисперсия;
xi – значение признака;
– генеральная средняя;
N – объем генеральной совокупности.
Аналогом формулы (4.3) для генеральной совокупности является
. (4.5)
Свойства дисперсии
1) Прибавление константы С к каждому значению не влияет на дисперсию:
.

2) Умножение каждого значения на С увеличивает дисперсию в С2 раз:
.
114300571500
СТАНДАРТИЗИРОВАННЫЕ ДАННЫЕ
Часто желательно описать место некоторого значения в совокупности, измеряя его отклонение от среднего всех значений в единицах стандартного отклонения.
Например, данная совокупность 100 значений имеет среднее 18,75, а стандартное отклонение 2,60. Если вам известно лишь, что среди этих 100 значений есть одно, равное 20, то его относительное положение в множестве 100 значений видно не сразу.
Любое множество п данных со средним и стандартным отклонением Sx можно преобразовать в другое множество со средним 0 и стандартным отклонением 1 таким образом, что преобразованные значения будут непосредственно выражаться в отклонениях исходных значений от среднего, измеренных в единицах стандартного отклонения. Новые значения называют значениями z:
. (4.6)
Значение z не только удобное средство информации о положении некоторого значения, связанного со средним и измеренного в единицах стандартного отклонения, но и шаг вперед к преобразованию множества X в произвольную шкалу с удобными характеристиками среднего и стандартного отклонения. Сами оценки z могут не подходить для некоторых целей. Отрицательные оценки, например, могут оказаться неудобными, а множество z будет, конечно, содержать дроби. Преобразование самих z позволяет устранить эти несущественные трудности.
Известно, что значения cz, полученные умножением каждого z на константу с, будут иметь стандартное отклонение с, а для cz+d среднее равно
.
Существует множество шкал измерения (произвольные средние и стандартные отклонения), которые распространены в педагогике и общественных науках. Множество данных можно расположить на любой шкале, то есть им можно приписать желаемые среднее (d) и стандартное отклонение (с), пользуясь выражением
yi = czi + d. (4.7)
Например, оценки интеллектуального теста часто преобразуются в шкалу со средним 100 и стандартным отклонением 15 или 16. Значения Т, полученные с помощью 10z+50, находят широкое применение.
Задача 4.2
Множество значений (0, 3, 4, 5, 6, 9, 10, 12,13, 15) необходимо перевести в шкалу со средним значением 100 и стандартным отклонением 15.
Решение
Найдем среднее значение по формуле (3.2) и стандартное отклонение по формуле (4.3):
;
.
По формуле (4.6) для каждого xi найдем значение zi . Вычисление оформим в виде таблицы 4.2.
Таблица 4.2
xi zi yi
0 -1,586 76,208
3 -0,968 85,478
4 -0,762 88,567
5 -0,556 91,657
6 -0,350 94,747
9 0,268 104,017
10 0,474 107,107
12 0,886 113,287
13 1,092 116,376
15 1,504 122,556


Подставляя каждое полученное значение zi в формулу (4.7) и при условии, что с=15 (новое стандартное отклонение) и d=100 (новое среднее значение), мы получим значения уi в новой шкале.
114300571500
? ВОПРОСЫ И УПРАЖНЕНИЯ
Дайте определение размаху, выборочной дисперсии, генеральной дисперсии, стандартному отклонению. Воспроизведите формулы для их нахождения.
Что характеризует выборочная дисперсия.
Вычислите для множества: 22, 15, 16, 21, 24, 24, 27, 28, 30, 30, 31 , 31, 31, 34, 36 размах, дисперсию, стандартное отклонение.
В каких случаях можно проводить сравнение разных выборок по дисперсиям?
Выборочные дисперсии результатов контрольной работы в классе 7«А» и 7«Б» соответственно равны 0,44 и 1,38. Какой вывод можно сделать при сравнении результатов контрольной работы в двух классах?
Дисперсия каждой из групп A и В равна 5. Будет ли дисперсия 10 значений, полученных путем объединения групп, меньше, больше или равна 5?
Группа А: 13, 11, 10, 9, 7
Группа В: 28, 26, 25, 24, 22
Множество значений (-4, -2, 0, 1, 1, 3, 7, 12, 14, 15, 17) переведите в шкалу со средним значением 10 и стандартным отклонением 5.

ТЕМА 5
34290010350500
РАСПРЕДЕЛЕНИЕ ПРИЗНАКА. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
114300571500
5.1 ПАРАМЕТРЫ РАСПРЕДЕЛЕНИЯ
Распределением признака называется закономерность встречаемости разных его значений (Плохинский Н.А., 1970, с. 12).
Параметры распределения – это его числовые характеристики, указывающие, где «в среднем» располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака. Наиболее практически важными параметрами являются математическое ожидание, дисперсия, показатели асимметрии и эксцесса.
В реальных психологических исследованиях мы оперируем не параметрами, а их приближенными значениями, так называемыми оценками параметров. Это объясняется ограниченностью обследованных выборок. Чем больше выборка, тем ближе может быть оценка параметра к его истинному значению. В дальнейшем, говоря о параметрах, мы будем иметь в виду их оценки.
В психологических исследованиях чаще всего ссылаются на нормальное распределение.
114300571500
5.2 НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к средней величине, – достаточно часто. Нормальным такое распределение называется потому, что оно очень часто встречалось в естественно-научных исследованиях и казалось «нормой» всякого массового случайного проявления признаков.
Это распределение следует закону, открытому тремя учеными в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции (Плохинский Н.А., 1970, с.17). График нормального распределения представляет собой привычную глазу психолога-исследователя так называемую колоколообразную кривую.
Задача 5.1
Как оценить вероятность того, что n независимых событий с вероятностью Р получения одного из двух исходов обеспечат r удач?
Первым, кто решил эту задачу был де Муавр (1667-1754г.г.). Он пытался решить следующую задачу.
Предположим, что монета подбрасывается 10 раз. При 10 бросаниях монеты «орел» может выпасть 2 раза, а может и 8 раз. Какова вероятность того, что в результате получится 0 «орлов» или 1 «орел»?
Вероятности появления 0,1,2,…. 10 «орлов» в результате 10 бросаний монеты графически представлены на рисунке 5.1

Рис.5.1. График распределения вероятности получения определенного числа «орлов» при бросаниях правильной монеты.
Задача, которую пытался решить де Муавр, состояла в том, чтобы найти уравнение кривой, близкой к данной графической интерпретации.
Де Муавру удалось показать, что искомое уравнение кривой имеет вид:
, (5.1)
где u – высота кривой;
≈ 3,142;
е ≈ 2,718;
– соответствует среднему распределению частот выборки, определяет положение кривой относительно числовой оси;
– стандартное отклонение распределения, определяющее положение и регулирующее размах.
Графический вид нормального распределения при =0 и при =1 приведен на рисунке 5.2.
Такого рода кривая называется единичной нормальной кривой и имеет площадь, равную 1. Она выбрана как стандарт для нормального распределения. Меняя значения , , можно сдвигать конкретную нормальную кривую по числовой оси вверх и вниз и менять размах.

Рис.5.2. Нормальная кривая для =0 и =1
На рисунке 5.3 представлен графический вид нормального распределения при =1 и разном значении , а на рисунке 5.4 графический вид нормального распределения при =0 и разном значении .
Для нахождения ординаты какого-нибудь значения единичной нормальной кривой используются специальные статистические таблицы (таблица 1 Приложения 1).
Фактически существует бесконечное множество нормальных кривых, отличающихся друг от друга значениями , . Важное общее свойство семейства нормальных кривых заключается в доле площади между двумя точками, выраженными в стандартном отклонении:
68% площади под кривой лежит в пределах одной от среднего в любом направлении, т.е. 1;
95% площади под кривой лежит в пределах двух от среднего в любом направлении, т.е. 2;
99,7% площади под кривой лежит в пределах трех от среднего в любом направлении, т.е. 3.
1548130114300=-1 =0 =1
00=-1 =0 =1

Рис. 5.3. Нормальная кривая для =1 при разном значении
1379855102870 =0,5
=1
=2
00 =0,5
=1
=2

Рис. 5.4. Нормальная кривая для =0 при разном значении .
114300571500
5.3 АСИММЕТРИЯ
В тех случаях, когда какие-либо причины благоприятствуют более частому появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторонней, или положительной, асимметрии (рис. 5.5) в распределении чаще встречаются более низкие значения признака, а при правосторонней, или отрицательной (рис. 5.5), – более высокие.


Рис.5.5. Асимметрия распределений:
а) левая, положительная;
б) правая, отрицательная.
Показатель асимметрии вычисляется по формуле (5.2):
. (5.2)
Коэффициент асимметрии изменяется в пределах:
- < A < . При А=0 распределение считается симметричным, при A>0 распределение имет «скошенность» влево, а при А<0 распределение «скошено» вправо.
114300571500
5.4 ЭКСЦЕСС
В тех случаях, когда какие-либо причины способствуют преимущественному появлению средних или близких к средним значений, образуется распределение с положительным эксцессом (рис. 5.6). Если же в распределении преобладают крайние значения, причем одновременно и более низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двухвершинное (рис. 5.6).
Показатель эксцесса определяется по формуле (5.3):
, (5.3)
-3 < E < .



Рис. 5.6.Эксцесс: а) положительный эксцесс;
б) отрицательный эксцесс.
11430010795000
5.4 ПРИМЕНЕНИЕ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
Де Муавр изобрел нормальную кривую для частного применения, то есть для получения простого приближенного решения в приложениях теории вероятностей. Конечно, он никогда не представлял себе, что его открытие найдет применение практически в каждом разделе современной науки. Действительно, нормальное распределение получило удивительно широкое распространение.
Нормальное распределение играет важную роль как в описательной статистике, так и в теории статистического вывода.
Нормальная кривая является отличной аппроксимацией распределений частот большого числа наблюдений при множестве переменных. Полигоны частот роста взрослых мужчин и женщин подобны нормальной кривой.
Психометрические тесты общих и специальных умственных способностей часто дают распределения оценок, удовлетворительно согласующиеся с нормальным распределением.
Довольно хорошо известно, что значения IQ интеллектуального теста Стенфорда-Бине распределены приблизительно нормально со средним =100 и стандартным отклонением σ=16 для обычных людей. Тесты образовательной подготовки, строящиеся в соответствии с такими же психометрическими принципами, что и тесты способностей, обычно имеют полигоны частот, напоминающие нормальную кривую.
У многих учащихся иногда складывается неправильное представление, что существует необходимая связь между нормальным распределением – идеальным описанием некоторых распределений частот – и практически любыми данными. Нормальная кривая – это изобретение математика, довольно хорошо описывающее полигон частот измерений нескольких различных переменных. Никогда не была – да и не будет – получена совокупность данных, которые были бы точно нормально распределены. Но иногда полезно, допуская незначительную ошибку, утверждать, что значения переменной «нормально распределены».
Параметры распределения оказывается возможным определить только по отношению к данным, представленным, по крайней мере, в интервальной шкале. Как мы убедились ранее, физические шкалы длин, времени, углов являются интервальными шкалами, и поэтому к ним применимы способы расчета оценок параметров, по крайней мере, с формальной точки зрения. Параметры распределения не учитывают истинной психологической неравномерности секунд, миллиметров и других физических единиц измерения.
На практике психолог-исследователь может рассчитывать параметры любого распределения, если единицы, которые он использовал при измерении, признаются разумными в научном сообществе.
114300571500
? ВОПРОСЫ И УПРАЖНЕНИЯ
Дайте определение следующим понятиям: распределение признака, параметры распределения, единичная нормальная кривая.
Дайте характеристику следующим распределениям: нормальному, с левосторонней асимметрией, с правосторонней асимметрией, с положительным эксцессом, с отрицательным эксцессом.
Что характеризует в уравнении нормальной кривой значения и ?
Воспроизведите формулы: уравнения нормальной кривой, асимметрии и эксцесса.
Используя таблицу 1 Приложения 1, найдите ординаты единичного нормального распределения для каждого значения x: 1,00; -1,00; 2,25; -0,15.
101409573279000
ТЕМА 6
34290010350500
ПОНЯТИЕ ВЫБОРКИ
Психолог-экспериментатор в большинстве случаев изучает какую-то определенную выборку людей, которая всегда отбирается из большей по численности группы. Такая объемлющая группа называется в статистике генеральной совокупностью. Таким образом, генеральная совокупность – это любая группа людей, которую психолог изучает по выборке. Теоретически считается, что объем генеральной совокупности не ограничен. Практически же объем генеральной совокупности всегда ограничен и может быть различным в зависимости от предмета наблюдения и той задачи, которую предстоит решать психологу.
Выборкой называется любая подгруппа элементов (испытуемых, респондентов), выделенная из генеральной совокупности для проведения эксперимента. При этом отдельный индивид из выборки, с которым работает психолог, называется испытуемым (респондентом).
Объем выборки, обычно обозначаемой буквой n, может быть любым, но не меньшим чем два респондента. В статистике различают малую (п < 30), среднюю (30 < п < 100) и большую выборки (п > 100).
11430010795000
6.1 ПОЛНОЕ И ВЫБОРОЧНОЕ ИССЛЕДОВАНИЯ
Если психологическому исследованию (наблюдению, измерению, эксперименту) подвергаются все представители изучаемой генеральной совокупности, то такое исследование называют полным, или сплошным.
Предполагается, что, в соответствии с задачами, гипотезами и планом, полное обследование генеральной совокупности позволяет получить исчерпывающую информацию об изучаемых в ней психологических закономерностях. Однако в отечественной и зарубежной психологии еще никогда не проводилось сплошного исследования по той причине, что на практике определить размеры той или иной генеральной совокупности и, тем более, исследовать её – задача нереальная и, кроме того, в определенной степени избыточная. Если выборка испытуемых по своим характеристикам репрезентативна генеральной совокупности, то есть основания полученные при её изучении результаты распространить на всю генеральную совокупность. Нельзя упускать из вида также и то, что работа психолога, по существу, представляет собой сложный вид деятельности, требующий высокой профессиональной компетентности и нередко много времени для работы с каждым испытуемым.
Если психолог производит выбор ограниченного числа элементов из изучаемой (генеральной) совокупности, то такое исследование называют частичным, или выборочным.
Выборочный метод является основным в экспериментальной работе психолога при изучении генеральных совокупностей. Его преимущество перед полным (сплошным) исследованием всех элементов генеральной совокупности заключается в том, что он сокращает как время, так и затраты труда, а главное – позволяет получать информацию о таких группах, полное обследование которых принципиально невозможно или нецелесообразно.
11430010795000
6.2 ЗАВИСИМЫЕ И НЕЗАВИСИМЫЕ ВЫБОРКИ
Выборки называются независимыми (несвязными), если процедура эксперимента и полученные результаты измерения некоторого свойства у испытуемых одной выборки не оказывают влияния на особенности протекания этого же эксперимента и результаты измерения этого же свойства у испытуемых (респондентов) другой выборки.
И, напротив, выборки называется зависимыми (связными), если процедура эксперимента и полученные результаты измерения некоторого свойства, проведенные на одной выборке, оказывают влияние на другую. Следует подчеркнуть, что одна и та же группа испытуемых, на которой дважды проводилось психологическое обследование (пусть даже разных психологических качеств, признаков, особенностей), по определению оказывается зависимой, или связной выборкой.
114300571500
6.3 ТРЕБОВАНИЯ К ВЫБОРКЕ
К выборке применяется ряд обязательных требований, определенных, прежде всего, целями и задачами исследования. Планирование эксперимента должно включать в себя учет как объема выборки, так и ряда ее особенностей. Так, в психологических исследованиях важно требование однородности выборки. Оно означает, что психолог, изучая, например, подростков, не может, включать в эту же выборку взрослых людей. Напротив, исследование, выполненное методом возрастных срезов, принципиально предполагает наличие разновозрастных испытуемых. Однако и в этом случае должна соблюдаться однородность выборки, но уже по другим критериям, в первую очередь таким, как возраст, пол. Основаниями для формирования однородной выборки могут служить разные характеристики, такие, как уровень интеллекта, национальность, отсутствие определенных заболеваний и т.д., в зависимости от целей исследования.
В общей статистике имеется понятие повторной и бесповторной выборки, или, иначе говоря, выборки с возвратом и без возврата. В качестве примера приводится, как правило, выбор шара, доставаемого из какой-либо емкости. В случае выборки с возвратом каждый выбранный шар опять возвращается в емкость и, следовательно, может быть выбран снова. При бесповторном выборе однажды выбранный шар откладывается в сторону и больше не может участвовать в выборке. В психологических исследованиях можно найти аналоги подобного рода способам организации выборочного исследования, поскольку психологу нередко приходится несколько раз тестировать одних и тех же испытуемых при помощи одной и той же методики. Однако, строго говоря, повторной в этом случае является процедура тестирования. Выборка испытуемых при полной тождественности состава в случае повторных исследований всегда будет иметь некоторые отличия, обусловленные функциональной и возрастной изменчивостью, присущей всем людям. Подобная выборка по характеру проведения процедуры является повторной, хотя смысл термина здесь, очевидно, иной, чем в случае с шарами.
Важно подчеркнуть, что все требования, предъявляемые к любой выборке, сводятся к тому, что на ее основе психологом должна быть получена наиболее полная, неискаженная информация об особенностях генеральной совокупности, из которой взята эта выборка. Иными словами, выборка должна как можно более полно отражать характеристики изучаемой генеральной совокупности.
114300571500
6.4 РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ
Состав экспериментальной выборки должен представлять (моделировать) генеральную совокупность, поскольку выводы, полученные в эксперименте, предполагается в дальнейшем перенести на всю генеральную совокупность. Поэтому выборка должна обладать особым качеством – репрезентативностью, позволяющей распространить полученные на ней выводы на всю генеральную совокупность.
Репрезентативность выборки очень важна, тем не менее по объективным причинам соблюдать её крайне сложно. Так, хорошо известен факт, что от 70% до 90% всех психологических исследований поведения человека проводились в США в 60-х годах XX века с испытуемыми – студентами колледжей, причем большинство из них были студентами психологами. В лабораторных исследованиях, выполняемых на животных, наиболее распространенным объектом изучения являются крысы. Поэтому неслучайно психологию называли раньше «наукой о студентах-второкурсниках и белых крысах». Студенты колледжей составляют всего 3% от общей численности населения США. Очевидно, что выборка студентов нерепрезентативна в качестве модели, претендующей на представительство всего населения страны.
Репрезентативная выборка, или, как еще говорят, представительная выборка, – это такая выборка, в которой все основные признаки генеральной совокупности представлены приблизительно в той же пропорции и с той же частотой, с которой данный признак выступает в данной генеральной совокупности. Иными словами, репрезентативная выборка представляет собой меньшую по размеру, но точную модель той генеральной совокупности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно с большой долей уверенности считать применимыми ко всей генеральной совокупности. Это распространение результатов называется генерализуемостью.
В идеале репрезентативная выборка должна быть такой, чтобы каждая из основных изучаемых психологом характеристик, черт, особенностей личности и т.п. была бы представлена в ней пропорционально этим же особенностям в генеральной совокупности. Согласно этим требованиям процедура формирования выборки должна иметь внутреннюю логику, способную убедить исследователя, что при сравнении с генеральной совокупностью она действительно окажется репрезентативной, представительной.
Нарушение принципов случайного выбора порой приводило к серьезным ошибкам. Стал знаменитым своей неудачей опрос, проведенный американским журналом «Литературное обозрение» относительно исхода президентских выборов в США в 1936 году.
Кандидатами на этих выборах были Ф.Д.Рузвельт и А.М.Ландон. В качестве генеральной совокупности редакция журнала использовала телефонные книги. Отобрав случайно 4 миллиона адресов, она разослала по всей стране открытки с вопросом об отношении к кандидатам в президенты. Затратив большую сумму на рассылку и обработку открыток, журнал объявил, что на предстоящих выборах президентом США с большим перевесом будет избран Ландон. Результат выборов оказался противоположным этому прогнозу.
Здесь были совершены сразу две ошибки – во-первых, телефонные книги сами по себе дают не репрезентативную выборку из населения страны, хотя бы потому, что абоненты – в основном зажиточные главы семейств. Во-вторых, прислали ответы не все, а люди, не только достаточно уверенные в своем мнении, но и привыкшие отвечать на письма, т.е. в значительной части представители делового мира, которые и поддерживали Ландона. Если бы редакция критически подошла к своей работе, она поняла бы, что методика опроса страдает изъянами.
Явление, подобное только что описанному, когда выборка представляет не всю генеральную совокупность, а лишь какой-то ее слой, какую-то ее часть, называется смещением выборки. Смещение – один из основных источников ошибок при использовании выборочного метода.
Однако для тех же самых президентских выборов социологи Дж.Гэллап и Э.Роупер правильно предсказали победу Рузвельта, основываясь только на 4 тысячах анкет. Причиной этого успеха, прославившего его авторов, было не только правильное составление выборки. Они учли, что общество распадается на социальные группы, которые более однородны, в том числе по своим политическим взглядам. Поэтому выборка из слоя может быть относительно малочисленной с тем же результатом точности. Имея результаты обследования по слоям, можно характеризовать общество в целом. Сейчас такая методика является общепринятой.
В своей конкретной деятельности психолог действует следующим образом: устанавливает подгруппу (выборку) внутри генеральной совокупности, подробно изучает эту выборку (проводит с ней экспериментальную работу), а затем, если позволяют результаты статистического анализа, распространяет полученные выводы на всю генеральную совокупность. Это и есть основные этапы работы психолога с выборкой.
Начинающий психолог должен иметь в виду часто повторяющуюся ошибку: каждый раз, когда он осуществляет сбор любых данных любым методом и из любого источника, у него всегда появляется соблазн распространить свои выводы на всю генеральную совокупность. Для того чтобы избежать подобной ошибки, надо не просто обладать здравым смыслом, но, прежде всего, хорошо владеть основными понятиями математической статистики.
114300571500
6.5 ФОРМИРОВАНИЕ ВЫБОРКИ
Возникает закономерный вопрос: как сформировать репрезентативную выборку? С точки зрения статистики, репрезентативность выборки означает, что представленное в выборке распределение изучаемых признаков соответствует (с определенной долей погрешности) их распределению в генеральной совокупности.
Опишем два метода, обеспечивающие репрезентативность выборки.
Первый метод – формирование простой случайной выборки. В этом случае выборка состоит из элементов, отобранных из генеральной совокупности таким образом, чтобы каждый элемент этой совокупности имел равные возможности (равную вероятность) попасть в выборку. Полученная таким образом выборка называется простой случайной выборкой.
Получить простую случайную выборку можно путем обычной жеребьевки (по аналогии с лотереей) или с помощью специальных таблиц случайных чисел. В последнем случае элементы генеральной совокупности перенумеровываются и из таблицы случайных чисел, открытой на произвольной странице, выписываются номера элементов, которые должны быть взяты в выборку. Данная процедура трудно осуществима, поскольку для ее реализации необходимо учитывать каждого представителя генеральной совокупности.
Второй метод основывается на понятии стратифицированной случайной выборки. Для этого необходимо разбить элементы генеральной совокупности на страты (группы) в соответствии с некоторыми характеристиками. Например, при обследовании спроса на некоторый товар генеральную совокупность желательно разбить на группы, различающиеся по величине дохода, социальной принадлежности или даже по месту жительства (город, деревня). Если произведена подобная разбивка совокупности и случайная выборка производится отдельно из каждой группы (страты), то полученная в итоге выборка носит название стратифицированная случайная выборка.
114300571500
6.6 ОПРЕДЕЛЕНИЕ ОБЪЕМА ВЫБОРКИ
Как определяется объем выборки? Подчеркнем, что он зависит, прежде всего, от задач исследования. Психолог может изучать единичные случаи, если те по каким-либо причинам представляют особый интерес для науки. Так, например, строится работа с одаренными детьми, каждый из которых, как правило, имеет свои неповторимые особенности. Предметом отдельного исследования могут служить также редкие или уникальные случаи нарушения развития. В частности, пристальное внимание известного ученого П.К. Анохина и его сотрудников было сосредоточено на изучении особенностей функционирования организма сросшихся сиамских близнецов Маши и Даши (это пример так называемой минимальной выборки).
Когда психолог ставит целью изучение характеристик, присущих многим представителям генеральной совокупности, возникает вопрос о наиболее приемлемом объеме выборки. В этих случаях очевидно, что больший объем выборки позволяет получить более надежные результаты. Объем выборки зависит также от степени однородности изучаемого явления. Как правило, чем более однородно изучаемое явление, тем меньше может быть объем выборки. Например, психолог изучает выраженность уровня маскулинности-феминности у мастеров спорта по хоккею. Поскольку подобная группа спортсменов представляет собой достаточно однородную выборку, то ее объем может быть весьма небольшим, например, в пределах одной команды – 12-20 человек.
Кроме того, объем выборки зависит от тех статистических методов, которые предполагается использовать. Одни методы требуют большого количества испытуемых в выборке, другие могут применяться при относительно небольшом их количестве. Например, некоторые непараметрические критерии различий могут использоваться при сравнении групп численностью в 5-7 человек, а факторный анализ наиболее адекватен, если объем выборки составит около 100 человек.
Для психологических исследований рекомендуется использовать экспериментальную и контрольную группы, так чтобы численность обеих сравниваемых групп была не менее 30-35 испытуемых в каждой.
В целом для определения объема выборки в социальных системах можно выделить следующие методы:
вольный подход по «методу научного тыка»; например, определяется, что достаточное количество опрошенных для получения надежных результатов в социологии или педагогике должно быть 5 или 10% от совокупности. Анализ литературных источников, посвященных расчетам объемов выборок, ни теоретически, ни эмпирически не подтверждает такие объемы;
принято считать, что при n 60 выборка большая или репрезентативная, но такое деление тоже весьма условно;
по аналогии с другими исследованиями, например, известно, что при социологических опросах выборка составляет 1000–1200 человек, соответственно назначается и размер данной выборки;
с учетом стоимости затрат; когда сумма, что может быть использована на исследования, определена заблаговременно;
на основе статистического анализа, когда объем выборки определяется, исходя из условий надежности и достоверности полученных результатов.
Для определения статистически обоснованного объема выборки различные источники дают одну формулу, основанную на уже известных характеристиках распределения:
(6.1)
где n – объем выборки,
σ – стандартное отклонение,
N – объем генеральной совокупности,
– предельная ошибка репрезентативности, задается обычно в пределах от 0,01 до 0,10 с наиболее частым употреблением 0,05 (5%);
t – табулированная константа, табличные значения этой величины следующие: t=1,96, при =0,05; t=2,58, при =0,01.
Если о характеристиках статистических величин ничего не известно, то дисперсия может быть оценена по правилу «шести сигм»:
(6.2)
где хmax – максимальное значение шкалы измерения,
хmin – минимальное значение шкалы,
K – значение, установленное по таблице 6.1 (по Плохинскому, 1970).
Таблица 6.1
n 2-5 6-15 16-49 50-200 201-1000 >1000
K 2 3 4 5 6 7
Для исследования в социальных системах можно использовать также таблицу 6.2
Таблица 6.2
PRIVATEОбъем генеральной совокупности N, (ед.) 500 1000 2000 3000 4000 5000 10000 100000
Объем
выборки, n (ед.) 222 286 333 350 360 370 385 398 400
В завершение приведем несколько рассуждений об оптимальном объеме выборок.
Рассмотрим следующий пример, заимствованный из Nisbett, etal., 1987. Имеются 2 больницы. Предположим, что в первой из них ежедневно рождается 120 детей, во второй только 12. В среднем отношение числа мальчиков, рождающихся в каждой больнице, к числу девочек 50/50. Однажды девочек родилось вдвое больше, чем мальчиков. Спрашивается, для какой больницы данное событие более вероятно? Ответ очевиден для статистика, однако он не столь очевиден неискушенному. Конечно, такое событие гораздо более вероятно для маленькой больницы. Объяснение этого факта состоит в том, что вероятность случайного отклонения (от среднего) возрастает с уменьшением объема выборки.
Если связь между переменными «объективно» слабая (т.е. свойства выборки близки к свойствам генеральной совокупности), то не существует иного способа проверить такую зависимость, кроме как исследовать выборку достаточно большого объема. Даже если выборка, находящаяся в вашем распоряжении, совершенно репрезентативна, эффект не будет статистически значимым, если выборка мала. Аналогично, если зависимость «объективно» (в генеральной совокупности) очень сильная, тогда она может быть обнаружена с высокой степенью значимости даже на очень маленькой выборке.
Другой пример. Представьте, что вы бросаете монету. Если монета слегка несимметрична и при подбрасывании орел выпадает чаще «решки» (например, в 60% подбрасываний выпадает орел, а в 40% «решка»), то 10 подбрасываний монеты было бы недостаточно, чтобы убедить кого бы то ни было, что монета асимметрична, даже если был бы получен, казалось, совершенно репрезентативный результат: 6 «орлов» и 4 «решки». Не следует ли отсюда, что 10 подбрасываний вообще не могут доказать что-либо? Нет, не следует, потому что если эффект, в принципе, очень сильный, то 10 подбрасываний может оказаться вполне достаточно для его доказательства. Представьте, что монета настолько несимметрична, что всякий раз, когда вы ее бросаете, выпадает «орел». Если вы бросаете такую монету 10 раз и всякий раз выпадает «орел», большинство людей сочтут это убедительным доказательством того, что с монетой что-то не то. Другими словами, это послужило бы убедительным доказательством того, что в генеральной совокупности, состоящей из бесконечного числа подбрасываний этой монеты «орел» будет встречаться чаще, чем «решка». В итоге этих рассуждений мы приходим к выводу: если зависимость сильная, она может быть обнаружена даже на малой выборке.
114300571500
? ВОПРОСЫ И УПРАЖНЕНИЯ
Дайте определение следующим понятиям: выборка и генеральная совокупность; выборочное и сплошное исследования; зависимые и независимые выборки; выборки повторные и бесповторные.
Дайте характеристики следующим выборкам: однородная, простая, случайная, стратифицированная, репрезентативная.
Перечислите и охарактеризуйте методы формирования выборки и методы определения ее объема.
Психолог ставит целью своего исследования доказать различия в результативности обучения чтению в двух группах первоклассников, обучающихся по разным методикам. Определите для исследования требования к выборкам учащихся.
1014095658368000
РАЗДЕЛ II
457200154940ОБЩИЕ ПРИНЦИПЫ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ
00ОБЩИЕ ПРИНЦИПЫ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

4654551905000525780263525Тема 7. Статистические гипотезы и
критерии
Тема 8. Классификация психологических
задач, решаемых с помощью
математических методов
00Тема 7. Статистические гипотезы и
критерии
Тема 8. Классификация психологических
задач, решаемых с помощью
математических методов


ТЕМА 7
34290010350500
СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ И КРИТЕРИИ
114300571500
7.1 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ
Полученные в экспериментах выборочные данные всегда ограничены и носят в значительной мере случайный характер. Именно поэтому для анализа таких данных и используется математическая статистика, позволяющая обобщать закономерности, полученные на выборке, и распространять их на всю генеральную совокупность.
Полученные в результате эксперимента на какой-либо выборке данные служат основанием для суждения о генеральной совокупности. Однако в силу действия случайных вероятностных причин оценка параметров генеральной совокупности, сделанная на основании экспериментальных (выборочных) данных, всегда будет сопровождаться погрешностью, и поэтому подобного рода оценки должны рассматриваться как предположительные, а не как окончательные утверждения. Подобные предположения о свойствах и параметрах генеральной совокупности получили название статистических гипотез. Как указывает Г.В. Суходольский: «Под статистической гипотезой обычно понимают формальное предположение о том, что сходство (или различие) некоторых параметрических или функциональных характеристик случайно или, наоборот, неслучайно» [11].
Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются ли экспериментальные данные и выдвинутая гипотеза, допустимо ли отнести расхождение между гипотезой и результатом статистического анализа экспериментальных данных за счет случайных причин. Таким образом, статистическая гипотеза – это научная гипотеза, допускающая статистическую проверку, а математическая статистика – это научная дисциплина, задачей которой является научно обоснованная проверка статистических гипотез.
Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные.

Нулевая гипотеза (H0) – это гипотеза об отсутствии различий. Если мы хотим доказать значимость различий, то нулевую гипотезу требуется опровергнуть, иначе требуется подтвердить.
Альтернативная гипотеза (Н1) – гипотеза о значимости различий. Это то, что мы хотим доказать, поэтому иногда ее называют экспериментальной гипотезой.
Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные испытуемые получают хотя и различные, но уравновешенные по трудности задания или что экспериментальная и контрольная выборки не различаются между собой по каким-то значимым характеристикам. Однако чаще нам все-таки требуется доказать значимость различий, ибо они более информативны для нас в поиске нового.
Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.
Направленные гипотезы – если предполагается в одной группе значения признака выше, а в другой ниже:
Н0: Х1 не превышает Х2,
Н1: Х1 превышает Х2.
Ненаправленные гипотезы – если предполагается что различаются формы распределения признака в группах:
Н0: Х1 не отличается от Х2,
Н1: Х1 отличается Х2.
Если мы заметили, что в одной из групп индивидуальные значения испытуемых по какому-либо признаку, например по социальной активности, выше, а в другой ниже, то для проверки значимости этих различий нам необходимо сформулировать направленные гипотезы.
Если мы хотим доказать, что в группе А под влиянием каких-то экспериментальных воздействий произошли более выраженные изменения, чем в группе Б, то нам тоже необходимо сформулировать направленные гипотезы.
Если же мы хотим доказать, что различаются формы распределения признака в группах А и Б, то формулируются ненаправленные гипотезы.
Проверка гипотез осуществляется с помощью критериев статистической оценки различий.
Принимаемый вывод носит название статистического решения. Подчеркнем, что такое решение всегда вероятностно. При проверке гипотезы экспериментальные данные могут противоречить гипотезе Н0, тогда эта гипотеза отклоняется. В противном случае, т.е. если экспериментальные данные согласуются с гипотезой Н0, она не отклоняется. Часто в таких случаях говорят, что гипотеза Н0 принимается. Отсюда видно, что статистическая проверка гипотез, основанная на экспериментальных выборочных данных, неизбежно связана с риском (вероятностью) принять ложное решение. При этом возможны ошибки двух родов. Ошибка первого рода произойдет, когда будет принято решение отклонить гипотезу Н0, хотя в действительности она оказывается верной. Ошибка второго рода произойдет, когда будет принято решение не отклонять гипотезу Н0, хотя в действительности она будет неверна. Очевидно, что и правильные выводы могут быть приняты также в двух случаях. В таблице 7.1 обобщено вышесказанное.
Таблица 7.1
Результат
проверки
гипотезы Н0 Возможные состояния проверяемой гипотезы
Верна гипотеза Н0 Верна гипотеза Н1
Гипотеза Н0
отклоняется Ошибка первого рода Правильное решение
Гипотеза Н0
не отклоняется Правильное решение Ошибка второго рода
Не исключено, что психолог может ошибиться в своем статистическом решении; как видим из таблицы 7.1, эти ошибки могут быть только двух родов. Поскольку исключить ошибки при принятии статистических гипотез невозможно, то необходимо минимизировать возможные последствия, т.е. принятие неверной статистической гипотезы. В большинстве случаев единственный путь минимизации ошибок заключается в увеличении объема выборки.
114300571500
7.2 СТАТИСТИЧЕСКИЕ КРИТЕРИИ
Статистический критерий – это решающее правило, обеспечивающее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью [11].
Статистические критерии обозначают также метод расчета определенного числа и само это число.
Когда мы говорим, что достоверность различий определялась по критерию * (критерий – угловое преобразование Фишера), то имеем в виду, что использовали метод * для расчета определенного числа.
Когда мы говорим, далее, что *=1,36, то имеем в виду определенное число, рассчитанное по методу *. Это число обозначается как эмпирическое значение критерия.
По соотношению эмпирического и критического значений критерия мы можем судить о том, подтверждается ли или опровергается нулевая гипотеза.
В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть критерии (например, критерий Манна-Уитни или критерий знаков), в которых мы должны придерживаться противоположного правила.
В некоторых случаях расчетная формула критерия включает в себя количество наблюдений в исследуемой выборке, обозначаемое как n. В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице мы определяем, какому уровню статистической значимости различий соответствует данная эмпирическая величина. Примером такого критерия является критерий *, вычисляемый на основе углового преобразования Фишера.
В большинстве случаев, однако, одно и то же эмпирическое значение критерия может оказаться значимым или незначимым в зависимости от количества наблюдений в исследуемой выборке (n) или от так называемого количества степеней свободы, которое обозначается как v или как df.
Число степеней свободы v равно числу классов вариационного ряда минус число условий, при которых он был сформирован. К числу таких условий относятся объем выборки (n), средние и дисперсии.
Допустим, группу из 50 человек разделили на три класса по принципу:
умеет работать на компьютере;
умеет выполнять лишь определенные операции;
не умеет работать на компьютере.
В первую и вторую группы попало по 20 человек, в третью – 10.
Мы ограничены одним условием – объемом выборки. Поэтому, даже если мы потеряли данные о том, сколько человек не умеют работать на компьютере, мы можем определить это, зная, что в первом и втором классах – по 20 испытуемых. Мы не свободны в определении количества испытуемых в третьем разряде, «свобода» простирается только на первые две ячейки классификации:
.
11430010795000
7.3 ПАРАМЕТРИЧЕСКИЕ И НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ
Критерии делятся на параметрические и непараметрические.
Параметрические критерии – критерии, включающие в формулу расчета параметры распределения, то есть средние и дисперсии.
Непараметрические критерии – критерии, не включающие в формулу расчета параметров распределения и основанные на оперировании частотами или рангами.
И те и другие критерии имеют свои преимущества и недостатки. Возможности и ограничения параметрических и непараметрических критериев приведены в таблице 7.2 [9].
Таблица 7.2
Параметрические критерии Непараметрические критерии
1. Позволяют прямо оценить различия в средних, полученных в двух выборках (t - критерий Стьюдента) 1. Позволяют оценить лишь средние тенденции, например, ответить на вопрос, чаще ли в выборке А встречаются более высокие, а в выборке Б – более низкие значения признака (например, критерии Розенбаума, угловое преобразование Фишера и др.)
2. Позволяют прямо оценить различия в дисперсиях (например, критерий Фишера) 2. Позволяют оценить лишь различия в диапазонах вариативности признака (например, критерий Фишера)
3. Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный анализ), но лишь при условии нормального распределения признака 3. Позволяют выявить тенденции изменения признака при переходе от условия к условию при любом распределении признака (критерий тенденций Пейджа и критерий Джонкира)
4. Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ) 4. Эта возможность отсутствует
5. Экспериментальные данные должны отвечать двум, а иногда трем условиям:
а) значения признака измерены по интервальной шкале;
б) распределение признака является нормальным;
в) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса 5. Экспериментальные данные могут не отвечать ни одному из этих условий:
а) значения признака могут быть представлены в любой шкале, начиная от шкалы наименований;
б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке;
в) требование равенства дисперсий отсутствует
Таблица 7.2. Продолжение
Параметрические критерии Непараметрические критерии
6. Математические расчеты довольно сложны 6. Математические расчеты по большей части просты и занимают мало времени (за исключением критериев 2 и )
7. Если условия, перечисленные в п.5, выполняются, параметрические критерии оказываются несколько более мощными, чем непараметрические 7. Если условия, перечисленные в п.5, не выполняются, непараметрические критерии оказываются более мощными, чем параметрические, так как они менее чувствительны к «засорениям»
11430010795000
7.4 УРОВНИ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ
Уровень значимости – это вероятность отклонения нулевой гипотезы, в то время как она верна.
Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время как она верна, как уже указывалось, называется ошибкой I рода (). Если вероятность ошибки – это ,, то вероятность правильного решения – 1-. Чем меньше , тем больше вероятность правильного решения.
Исторически сложилось так, что в психологии принято считать низшим уровнем статистической значимости 5%-ый уровень ( 0,05), достаточным – 1%-ый уровень ( 0,01), высшим – 0,1%-ый уровень ( 0,001).
Замечание
В таблицах критических значений обычно приводятся значения критериев, соответствующих уровням статистической значимости: 0,05 и 0,01, иногда 0,001. Для некоторых критериев в таблицах указан точный уровень значимости их разных эмпирических значений. До тех пор, однако, пока уровень статистической значимости не достигнет =0,05, мы еще не имеем права отклонить нулевую гипотезу. В настоящем пособии будем придерживаться следующего правила отклонения гипотезы об отсутствии различий (Н0) и принятия гипотезы о статистической достоверности различий (H1).
11430010795000
7.5 ПРАВИЛО ОТКЛОНЕНИЯ НУЛЕВОЙ И ПРИНЯТИЯ АЛЬТЕРНАТИВНОЙ ГИПОТЕЗЫ
Если эмпирическое значение критерия равняется критическому значению, соответствующему 0,05, или превышает его, то Н0 отклоняется, но мы еще не можем определенно принять Н1.
Если эмпирическое значение критерия равняется критическому значению, соответствующему 0,01, или превышает его, то Н0 отклоняется и принимается Н1.
Исключения составляют критерий знаков G, критерий Т Вилкоксона и критерий U Манна-Уитни. Для них устанавливаются обратные соотношения.
Для облегчения процесса принятия решения можно всякий раз вычерчивать «ось значимости»:

«Ось значимости» представляет собой прямую, на левом конце которой располагается 0, хотя он, как правило, не отмечается на самой этой прямой, и слева направо идет увеличение числового ряда. По сути дела это привычная школьная ось абсцисс ОХ декартовой системы координат. Однако особенность этой оси в том, что на ней выделено три участка, «зоны». Левая зона называется «зоной незначимости», правая – «зоной значимости», а промежуточная – «зоной неопределенности». Границами всех трех зон являются критическое значение, соответствующее 0,05 (обозначается как Ч0,05 ) и критическое значение, соответствующее 0,01 (обозначается как Ч0,05 ).
Вправо от критического значения Ч0,01 простирается «зона значимости» – сюда попадают эмпирические значения, превышающие Ч0,01, и, следовательно, значимые. В этом случае принимается альтернативная гипотеза H1:

Влево от критического значения Ч0,05 простирается «зона незначимости» – сюда попадают эмпирические значения, которые ниже Ч0,05 следовательно, незначимы, и в этом случае принимается гипотеза Н0 об отсутствии различий:

Если эмпирическое значение попадает в «зону неопределенности», то отклоняется гипотеза о недостоверности различий (Н0), но гипотеза об их достоверности (Н1) не принимается:

Практически, однако, исследователь может считать достоверными уже те различия, которые попадают в «зону неопределенности», заявив, что они достоверны при 0,05, или указав точный уровень значимости полученного эмпирического значения критерия, например: =0,02.
Уровень статистической значимости или критические значения критериев определяются по-разному при проверке направленных и ненаправленных статистических гипотез.
При направленной статистической гипотезе используется односторонний критерий, при ненаправленной гипотезе – двусторонний критерий. Двусторонний критерий более строг, поскольку он проверяет различия в обе стороны, и поэтому то эмпирическое значение критерия, которое ранее соответствовало уровню значимости 0,05, теперь соответствует лишь уровню 0,10.
Задача 7.1
Пусть критические значения критерия Q-Розенбаума соответственно равны 6 и 9 и обозначаются как Q0,05=7 и Q0,01=9. Принята следующая стандартная форма записи критических значений:
.
Допустим, эмпирическое значение критерия равно 8: Qэмп=8. На «оси значимости» эмпирическое значение заключено в эллипс:

Эмпирическое значение критерия в нашей задаче попадает в область между Q0,05 и Q0,01, и мы можем считать различия достоверными при 0,05.
114300571500
7.6 МОЩНОСТЬ КРИТЕРИЕВ
Мощность критерия – это его способность выявлять различия, если они есть. Иными словами, это его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.
Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как она неверна, называется ошибкой II рода.
Вероятность такой ошибки обозначается как . Мощность критерия – это его способность не допустить ошибку II рода, поэтому мощность равна 1- .
Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут быть решены с помощью разных критериев: при этом обнаруживается, что некоторые критерии позволяют выявить различия там, где другие оказываются неспособными это сделать, или выявляют более высокий уровень значимости различий. Возникает вопрос: а зачем же тогда использовать менее мощные критерии? Дело в том, что основанием для выбора критерия могут быть не только мощность, но и другие его характеристики, а именно простота, более широкий диапазон использования, применимость по отношению к неравным по объему выборкам, большая информативность результатов.
114300571500
? ВОПРОСЫ И УПРАЖНЕНИЯ
Дайте определение следующим понятиям:
статистическая гипотеза;
нулевая и альтернативная гипотезы;
статистический критерий;
ошибка первого рода, ошибка второго рода;
степень свободы;
уровень статистической значимости;
мощность критерия.
Охарактеризуйте параметрические и непараметрические методы.
Воспроизведите правило отклонения нулевой гипотезы или принятия альтернативной.
Критические значения 2 (критерий Пирсона) по статистическим таблицам соответственно равны:
.
Исходя их критических значений, сформулируйте принятие решения (выберите соответствующую гипотезу – H0 или Н1) для следующих эмпирических значений:
;
;

.
92265572580500
ТЕМА 8
34290010350500
КЛАССИФИКАЦИЯ ПСИХОЛОГИЧЕСКИХ ЗАДАЧ, РЕШАЕМЫХ С ПОМОЩЬЮ СТАТИСТИЧЕСКИХ МЕТОДОВ
114300571500
8.1 КЛАССИФИКАЦИЯ ЗАДАЧ
Множество задач психологического исследования предполагает те или иные сопоставления. Мы сопоставляем группы испытуемых по какому-либо признаку, чтобы выявить различия между ними по этому признаку (рис.8.1). Мы сопоставляем то, что было «до» с тем, что стало «после» наших экспериментальных или любых иных воздействий, чтобы определить эффективность этих воздействий (рис. 8.2). Мы сопоставляем эмпирическое распределение значений признака с каким-либо теоретическим законом распределения (рис.8.3) или два эмпирических распределения между собой (рис.8.4), с тем чтобы доказать неслучайность выбора альтернатив или различия в форме распределений.
Мы, далее, можем сопоставлять два признака, измеренные на одной и той же выборке испытуемых, для того чтобы установить степень согласованности их изменений, их сопряженность, корреляцию между ними (рис.8.5). Наконец, мы можем сопоставлять индивидуальные значения, полученные при разных комбинациях каких-либо существенных условий, с тем чтобы выявить характер взаимодействия этих условий в их влиянии на индивидуальные значения признака (рис.8.6).
07556500
Показатели группы АПоказатели группы В
27432001219200080010012192000
Признак 1
16002001905000 ?
148590036830Выявление различий по одному признаку в разных группах
00Выявление различий по одному признаку в разных группах

Рис. 8.1. Графическая интерпретация задачи
на определение эффективности воздействия.
015367000
Показатели группы А
2971800349250Эффективность воздействия признаков
00Эффективность воздействия признаков
240030054038500137160010287000Признак 1
До изменения
137160013843000 ?
Признак 1
После изменения
Рис. 8.2. Графическая интерпретация задачи на определение
эффективности воздействия.
017399000
Распределение Теоретическое показателей группы А распределение
914400450850027432004508500
Признак 1
171450017018000 ?
148590074930Соответствие теоретическому закону распределения
00Соответствие теоретическому закону распределения

Рис. 8.3. Графическая интерпретация задачи на выявление различий
между эмпирическими распределениями.
017399000
Распределение Распределение
показателей группы А показателей группы В
800100450850028575005397500
Признак 1
171450017018000 ?
1600200121920Соответствие теоретическому закону распределения
00Соответствие теоретическому закону распределения

Рис. 8.4. Графическая интерпретация задачи на выявление различий
между эмпирическими распределениями.
022860000
Показатели группы А
2971800110490Степень согласованности или взаимосвязь
00Степень согласованности или взаимосвязь
Признак 1

1371600-367030002400300-4000500137160015684500 ?
Признак 2
Рис. 8.5. Графическая интерпретация задачи
на определение степени согласованности признаков
-11430022860000
Показатели группы А
171450015811500297180076200Сопоставление индивидуальных значений при изменении условий
00Сопоставление индивидуальных значений при изменении условий
Условие 1

1371600157480001371600-37909500 ?
Условие 2
Рис. 8.6. Графическая интерпретация задачи на сопоставление
индивидуальных значений при изменении условий
Краткая классификация задач и методов их статистического решения представлена в таблице 8.1. [9]
Таблица 8.1
Задачи Условия Методы
1. Выявление различий в уровне исследуемого признака а) 2 выборки испытуемых Q - критерий Розенбаума
U - критерий Манна-Уитни
* - критерий (угловое преобразование Фишера)
критерий Макнамары
б) 3 и более выборок испытуемых S - критерий тенденций Джонкира
Н - критерий Крускала-Уоллиса
2. Оценка сдвига значений исследуемого признака а) 2 замера на одной и той же выборке испытуемых Т - критерий Вилкоксона
G - критерий знаков
* - критерий (угловое преобразование Фишера)
t – критерий Стьюдента
б) 3 и более замеров на одной и той же выборке испытуемых r2 - критерий Фридмана
L - критерий тенденций Пейджа
t - критерий Стьюдента
3. Выявление различий в распределении признака а) при сопоставлении эмпирического распределения с теоретическим 2 - критерий Пирсона
- критерий Колмогорова-Смирнова
m - биномиальный критерий
t – критерий Стьюдента
б) при сопоставлении двух эмпирических распределений 2 - критерий Пирсона
- критерий Колмогорова-Смирнова
* - критерий (угловое преобразование Фишера)
Таблица 8.1. Продолжение
Задачи Условия Методы
4. Выявление степени согласованности изменений а) двух признаков коэффициент корреляции Пирсона
- коэффициент корреляции Кендалла
R – бисериальный коэффициент корреляции
- корреляционное отношение Пирсона
rS - коэффициент ранговой корреляции Спирмена
rxy - коэффициент линейной корреляции Пирсона
Линейная и криволинейная регрессия
б) двух иерархий или профилей rS - коэффициент ранговой корреляции Спирмена
rxy - коэффициент линейной корреляции Пирсона
Множественная и частная корреляция
Линейная, криволинейная и множественная регрессия
Факторный и кластерный анализы
5. Анализ изменений признака под влиянием контролируемых условий а) под влиянием одного фактора S - критерий тенденций Джонкира
L - критерий тенденций Пейджа
Однофакторный дисперсионный анализ Фишера
Критерий Линка и Уоллеса
Критерий Немени
Множественное сравнение независимых выборок
б) под влиянием двух факторов одновременно Двухфакторный дисперсионный анализ Фишера
11430010795000
8.2 ПРИНЯТИЕ РЕШЕНИЯ О ЗАДАЧЕ И МЕТОДЕ
Если данные уже получены, то принятие решения о задаче и методе обработки (на основе таблицы 8.1) будет заключаться в следующем:
по первому столбцу таблицы 8.1 определить, какая из задач стоит в исследовании;
по второму столбцу таблицы 8.1 определить условия решения задачи (сколько выборок обследовано или какое количество групп);
определить соответствующий метод по третьему столбцу таблицы 8.1. Рассмотреть критерии метода и определить, какой целесообразно использовать.
Если исследование только планируется, то для принятия решения о задаче и методе обработки необходимо:
определить, какая модель кажется наиболее подходящей для доказательства научных предположений;
ознакомиться с описанием метода, примерами и задачами;
рассмотреть ограничения критерия и возможность сбора необходимых данных:
объем выборки;
наличие нескольких выборок, различающихся по какому-либо признаку, например, по возрасту и т.п.;
провести исследование, обработать полученные данные по заранее выбранному алгоритму;
если ограничения выполнить не удалось, обратиться к предыдущим шагам, когда данные уже получены.
114300571500
? ВОПРОСЫ И УПРАЖНЕНИЯ
Определите тип следующих задач и метод их решения:
Был измерен уровень усидчивости при выполнении домашнего задания у группы мальчиков и группы девочек одного возраста. Усидчивее ли девочки, чем мальчики, при выполнении домашнего задания?
Поведение школьников зависит от внушения и возраста: можно предположить, что высокая степень внушения оказывает влияние на младших школьников, но не влияет на старших.
В группе дошкольной гимназии по результатам наблюдений за детьми 5-летнего возраста были проранжированы 10 основных мотивов поведения, вызывающих споры и разногласия. Эти же 10 мотивов было предложено проранжировать группе воспитателей. Отличается ли последовательность мотивов в группе детского сада и в представлениях воспитателей?
В выборке из 20 испытуемых измерялся уровень устойчивости внимания в обычном состоянии и состоянии алкогольного опьянения при помощи методики «Перепутанные линии». Можно ли утверждать, что алкогольное опьянение влияет на уровень устойчивости внимания?
101409562928500
РАЗДЕЛ III
37401513970СТАТИСТИЧЕСКИЕ КРИТЕРИИ
00СТАТИСТИЧЕСКИЕ КРИТЕРИИ

3676658001000
46545553340Тема 9. Корреляционный анализ
Тема 10. Выявление различий в уровне исследуемого признака
Тема 11. Оценка достоверности сдвига в значениях исследуемого
признака
Тема 12. Критерии согласия
распределений и
многофункциональные
критерии
00Тема 9. Корреляционный анализ
Тема 10. Выявление различий в уровне исследуемого признака
Тема 11. Оценка достоверности сдвига в значениях исследуемого
признака
Тема 12. Критерии согласия
распределений и
многофункциональные
критерии

ТЕМА 9
34290010350500
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
114300571500
9.1 ПОНЯТИЕ КОРРЕЛЯЦИОННОЙ СВЯЗИ
Психолога нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых группах. Например, могут ли учащиеся с высоким уровнем тревожности демонстрировать стабильные академические достижения, или с чем больше связан уровень умственного развития учащихся – с их успеваемостью по математике или литературе и т.п.?
Термин «корреляция» был введен в науку выдающимся английским естествоиспытателем Френсисом Гальтоном в 1886 г.
Первоначальное значение термина «корреляция» – взаимная связь (Oxford Advanced Learner's Dictionary of Current English, 1982). Когда говорят о корреляции, используют термины «корреляционная связь» и «корреляционная зависимость».
Корреляционная связь – это согласованные изменения двух признаков или большего количества признаков (множественная корреляционная связь). Корреляционная связь отражает тот факт, что изменчивость одного признака находится в некотором соответствии с изменчивостью другого. С другой стороны, корреляционная связь может говорить не о зависимости признаков между собой, а о зависимости этих признаков от другого (других). Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной связи, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого, но находится ли причина изменений в одном из признаков или она оказывается за пределами исследуемой пары признаков, нам неизвестно.
Корреляционная зависимость – это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.
Зависимость подразумевает влияние, связь – любые согласованные изменения, которые могут объясняться сотнями причин.
Говорить в строгом смысле о зависимости мы можем только в тех случаях, когда сами оказываем какое–то контролируемое воздействие на испытуемых или так организуем исследование, что оказывается возможным точно определить интенсивность не зависящих от нас воздействий.
Независимые переменные – воздействия, которые можно качественно определить или даже измерить.
Зависимые переменные – признаки, которые измеряются и могут изменяться под влиянием независимых переменных.
Согласованные изменения независимой и зависимой переменных действительно могут рассматриваться как зависимость.
Корреляционные связи различаются по форме, направлению и степени (силе).
По форме корреляционная связь может быть линейной и криволинейной.
Линейная связь – если с увеличением или уменьшением одной переменной, вторая переменная в среднем либо также растет, либо убывает (рис. 9.1, 9.2). Например, прямолинейной можно назвать связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии.
Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи. При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности (рис.9.3).
54483006921500По направлению корреляционная связь может быть положительной («прямой») и отрицательной («обратной»).
При положительной (прямой) корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака – низкие значения другого (рис. 9.1).
При отрицательной (обратной) корреляции высокие значения одного признака соответствуют более низким значениям другого (рис. 9.2).

Рис.9.1.Линейная положительная связьРис.9.2. Линейная отрицательная связь

Рис. 9.3. Криволинейная связь Рис. 9.4. Случайная связь
Степень (сила или теснота) корреляционной связи определяется по величине коэффициента корреляции, обозначающегося часто как r. Величина коэффициента корреляции находится в диапазоне от -1 до +1.
Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.
Если коэффициент корреляции по модулю оказывается близким к 1, то это соответствует высокому уровню связи между переменными.
Используются две системы классификации корреляционных связей по их силе: общая и частная.
Общая классификация корреляционных связей (по Ивантер Э.В., Коросову А.В., 1992):
сильная, или тесная
средняя
умеренная
слабая
очень слабая при r > 0,70;
при 0,50 < r < 0,69;
при 0,30 < r < 0,49;
при 0,20 < r < 0,29;
при r < 0,19.
Частная классификация корреляционных связей:
высокая значимая корреляция – при r, соответствующем уровню статистической значимости 0,01;
значимая корреляция – при r, соответствующем уровню
статистической значимости 0,05;
тенденция достоверной связи – при r, соответствующем уровню статистической значимости 0,10;
незначимая корреляция при r, не достигающем уровня статистической значимости.
Две эти классификации не совпадают. Первая ориентирована только на величину коэффициента корреляции, а вторая определяет, какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки. Чем больше объем выборки, тем меньшей величины коэффициента корреляции оказывается достаточно, чтобы корреляция была признана достоверной. В результате при малом объеме выборки может оказаться так, что сильная корреляция окажется недостоверной. В то же время при больших объемах выборки даже слабая корреляция может оказаться достоверной.
Обычно принято ориентироваться на вторую классификацию, поскольку она учитывает объем выборки. Вместе с тем необходимо помнить, что сильная, или высокая, корреляция – это корреляция с коэффициентом r>0,70, а не просто корреляция высокого уровня значимости.
Переменные могут быть измерены в разных шкалах, именно это определяет выбор соответствующего коэффициента корреляции. В таблице 9.1 представлены соотношения между шкалами [3].
Таблица 9.1
Тип шкалы Мера связи
Переменная А Переменная В Интервальная или отношений Интервальная или отношений rxy – коэффициент линейной корреляции Пирсона
Порядковая, интервальная или отношений Порядковая, интервальная или отношений rS - коэффициент ранговой корреляции Спирмена
Порядковая Порядковая - коэффициент корреляции Кендалла
Дихотомическая Дихотомическая коэффициент корреляции Пирсона
Дихотомическая Порядковая Rrb – рангово-бисериальный коэффициент корреляции
Дихотомическая Интервальная или отношений Rбис – бисериальный коэффициент корреляции
Интервальная Порядковая Не разработан
Все эмпирические меры тесноты связи, кроме коэффициента ранговой корреляции, могут быть заменены методами сопоставления и сравнения.
11430010795000
9.2 КОЭФФИЦИЕНТ РАНГОВОЙ КОРРЕЛЯЦИИ rS СПИРМЕНА
Назначение критерия ранговой корреляции Спирмена
Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и направление корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков.
Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы. Такими рядами значений могут быть [11]:
1) Два признака, измеренные в одной и той же группе испытуемых.
Здесь ранжируются индивидуальные значения по первому признаку, полученные разными испытуемыми, а затем индивидуальные значения по второму признаку.
Если два признака связаны положительно, то испытуемые, имеющие низкие ранги по одному из них, будут иметь низкие ранги и по другому, а испытуемые, имеющие высокие ранги по одному из признаков, будут иметь по другому признаку также высокие ранги.
В случае отрицательной корреляции низким рангам испытуемых по одному признаку будут соответствовать высокие ранги по другому признаку, и наоборот.
2) Две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков (например, личностные профили по 16-факторному опроснику Р. Б. Кеттелла, иерархии ценностей по методике Р. Рокича, последовательности предпочтений в выборе из нескольких альтернатив и др.).
Здесь ранжируются индивидуальные значения, полученные каждым из 2-х испытуемых по определенному (одинаковому для них обоих) набору признаков. Первый ранг получит признак с самым низким значением; второй ранг – признак с более высоким значением и т.д. Очевидно, что все признаки должны быть измерены в одних и тех же единицах, иначе ранжирование невозможно.
Если индивидуальные иерархии двух испытуемых связаны положительно, то признаки, имеющие низкие ранги у одного из них, будут иметь низкие ранги и у другого, и наоборот. Например, если у одного испытуемого фактор Е (доминантность) имеет самый низкий ранг, то и у другого испытуемого он должен иметь низкий ранг, если у одного испытуемого фактор С (эмоциональная устойчивость) имеет высший ранг, то и другой испытуемый должен иметь по этому фактору высокий ранг и т.д.
3) Две групповые иерархии признаков.
Здесь ранжируются среднегрупповые значения, полученные в 2-х группах испытуемых по определенному, одинаковому для двух групп, набору признаков. В дальнейшем линия рассуждений такая же, как и в предыдущих двух случаях.
4) Индивидуальная и групповая иерархии признаков.
Здесь ранжируются отдельно индивидуальные значения испытуемого и среднегрупповые значения по тому же набору признаков, которые получены, как правило, при исключении этого отдельного испытуемого, – он не участвует в среднегрупповом профиле, с которым будет сопоставляться его индивидуальный профиль. Ранговая корреляция позволит проверить, насколько согласованы индивидуальный и групповой профили.
Во всех четырех случаях значимость полученного коэффициента корреляции определяется по количеству ранжированных значений N. В первом случае это количество будет совпадать с объемом выборки п. Во втором случае количеством наблюдений будет количество признаков, составляющих иерархию. В третьем и четвертом случае N – это также количество сопоставляемых признаков, а не количество испытуемых в группах.
Возможны два варианта гипотез. Первый относится к первому случаю, второй – к трем остальным случаям.
Первый вариант гипотез
Н0: Корреляция между переменными А и B не отличается от нуля.
Н1: Корреляция между переменными А и B достоверно отличается от нуля.
Второй вариант гипотез
Н0: Корреляция между иерархиями А и B не отличается от нуля.
Н1: Корреляция между иерархиями А и B достоверно отличается от нуля.
(Курсивом в гипотезах выделены и подчеркнуты слова, которые меняются при формулировке гипотез к конкретной задаче.)
Условия для применения коэффициента корреляции Спирмена
Сравниваемые переменные должны быть получены в порядковой, интервальной шкалах или в шкале отношений.
Характер распределения коррелируемых величин не имеет значения.
Число варьирующих признаков должно быть одинаковым и находиться в пределах от 5 до 40.
В случае если есть много повторяющихся рангов, то необходимо вносить поправку на одинаковые ранги.
Алгоритм подсчета коэффициента ранговой корреляции Спирмена rs
Определить два признака или две иерархии А и B.
Проверить, выполняются ли ограничения, и сформулировать гипотезы.
Проранжировать значения переменной А, начисляя ранг 1 наименьшему значению, в соответствии с правилами ранжирования. Занести ранги в первый столбец таблицы по порядку номеров испытуемых или признаков.
Проранжировать значения переменной В и занести ранги во второй столбец таблицы.
Подсчитать разности d между рангами А и B по каждой строке таблицы и занести в третий столбец таблицы.
Вычислить d2. Эти значения занести в четвертый столбец таблицы.
Вычислить d2.
При наличии одинаковых рангов рассчитать поправки:
(9.1)
(9.2)
где a1, a2, … – объем каждой группы одинаковых рангов в ранговом ряду А,
b1, b2, … – объем каждой группы одинаковых рангов в ранговом ряду B.
Рассчитать коэффициент ранговой корреляции r по формуле:
а) при отсутствии одинаковых рангов:
; (9.3)
б) при наличии одинаковых рангов:
. (9.4)
Определить по таблице критические значения rs для данного n. Для процесса принятия решения вычертить «ось значимости». Если r превышает критическое значение или по крайней мере равен ему, корреляция достоверно отличается от 0.
Задача 9.1
Психолог выясняет, как связаны между собой индивидуальные показатели готовности к школе, полученные до начала обучения в школе, у 11 первоклассников по 100-бальной шкале и их средняя успеваемость в конце учебного года по 5-бальной шкале.
Решение
Для решения задачи были проранжированы показатели готовности к школе и средняя успеваемость первоклассников. Данные и результаты решения занесены в таблицу 9.2.
Гипотезы к задаче
Н0: Корреляция между показателем готовности к школе и средней успеваемостью в конце учебного года не отличается от нуля.
Н1: Корреляция между показателем готовности к школе и средней успеваемостью в конце учебного года статистически значимо отличается от нуля.
Таблица 9.2
Испытуемый Показатели готовности к школе Средняя успеваемость в конце учебного года d d2
Значения Ранг Значения Ранг 1 65 3 4,3 2 1 1
2 70 5 4,7 7 -2 4
3 71 6 4,75 8 -2 4
4 50 1 4,35 3 -2 4
5 68 4 4,5 4 0 0
6 83 11 4,68 6 5 25
7 78 9 5 11 -2 4
8 62 2 3,5 1 1 1
9 75 8 4,9 10 -2 4
10 72 7 4,6 5 2 4
11 80 10 4,8 9 1 1
Суммы =SUM(ABOVE) 774 =SUM(ABOVE) 66 =SUM(ABOVE) 50,08 =SUM(ABOVE) 66 =SUM(ABOVE) 0 =SUM(ABOVE) 52
Значение эмпирического критерия находим по формуле (9.3):
.
Определим критические значения rs при n = 11 по таблице 2 Приложения 1:
.
Подчеркнем, что в таблице критических значений все величины коэффициентов корреляции даны по абсолютной величине. Знак коэффициента учитывается только при его интерпретации.
«Ось значимости»

Ответ
rs эмп =0,76, нулевая гипотеза отклоняется и принимается альтернативная гипотеза (=0,01). Корреляция между показателем готовности к школе и средней успеваемостью в конце учебного года отличается от нуля. Можно утверждать, что показатели школьной готовности и итоговые оценки первоклассников связаны положительной корреляционной зависимостью – чем выше показатель школьной готовности, тем лучше учится первоклассник.
11430010795000
9.3 КОЭФФИЦИЕНТ ЛИНЕЙНОЙ КОРРЕЛЯЦИИ ПИРСОНА
Точную формулу ля подсчета коэффициента корреляции разработал ученик Френсиса Гальтона – Карл Пирсон. Коэффициент корреляции Пирсона характеризует наличие только линейной связи между признаками, обозначаемыми, как правило, символами X и Y. Формула расчета коэффициента корреляции построена таким образом, что, если связь между признаками имеет линейный характер, коэффициент Пирсона точно устанавливает тесноту этой связи. В случае с криволинейной корреляцией могут получиться отличные результаты, поэтому всегда необходима графическая интерпретация.
Условия для применения коэффициента корреляции Пирсона
Сравниваемые переменные должны быть получены в интервальной шкале или шкале отношений.
Распределения переменных X и Y должны быть близки к нормальному.
Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.
Таблицы уровней значимости для коэффициента корреляции Пирсона рассчитаны от n = 5 до n = 1000. Оценка уровня значимости по таблицам осуществляется при числе степеней свободы v= n – 2.
Формула для подсчета коэффициента корреляции такова:
, (9.5)
где хi – значения, принимаемые переменной X;
yi – значения, принимаемые переменной Y.
Задача 9.2
20 школьникам были даны тесты на определение преобладания наглядного или вербального мышления. Измерялось среднее время решения заданий теста в секундах. Психолога интересует вопрос: существует ли взаимосвязь между временем решения наглядно-образных задач и вербальных заданий? Переменная X обозначает среднее время решения наглядно-образных задач, а переменная Y – среднее время решения вербальных заданий тестов.
Решение
Представим исходные данные в виде таблицы 9.3, в которой введены дополнительные столбцы, необходимые для расчета коэффициента корреляции Пирсона.
Таблица 9.3
№ испытуемых Среднее время решения
наглядно-образных
заданий Среднее
время
решения
вербальных заданий X Y X X Y Y
X Y 1 19 17 323 361 289
2 32 7 224 1024 49
3 33 17 561 1089 289
4 44 28 1232 1936 784
5 28 27 756 784 729
6 35 31 1085 1225 961
7 39 20 780 1521 400
8 39 17 663 1521 289
9 44 35 1540 1936 1225
10 44 43 1892 1936 1849
11 24 10 240 576 100
12 37 28 1036 1369 784
13 29 13 377 841 169
14 40 43 1720 1600 1849
15 42 45 1890 1764 2025
16 32 24 768 1024 576
17 48 45 2160 2304 2025
18 42 26 1092 1764 676
19 33 16 528 1089 256
20 47 26 1222 2209 676
Сумма 731 518 20089 27873 16000
Гипотезы к задаче
Н0: Корреляция между временем решения наглядно-образных задач и вербальных заданий не отличается от нуля.
Н1: Корреляция между временем решения наглядно-образных задач и вербальных заданий статистически значимо отличается от нуля.
Рассчитываем эмпирическую величину коэффициента корреляции Пирсона по формуле (9.3):
.
При нахождении критических значений для вычисленного коэффициента линейной корреляции Пирсона число степеней свободы рассчитывается как v = n - 2. В нашем случае n = 20, поэтому n – 2 = 20 – 2 = 18. По таблице 3 Приложения1 находим:
.
«Ось значимости»

Ответ
rxy эмп = 0,669. Ввиду того, что величина расчетного коэффициента корреляции попала в «зону значимости», гипотеза H0 отвергается и принимается гипотеза H1 (при 0,01). Корреляция между временем решения наглядно-образных заданий и вербальных задач статистически значимо отличается от нуля. Полученная положительная зависимость говорит о том, что чем выше среднее время решения наглядно-образных задач, тем выше среднее время решения вербальных заданий, и наоборот.
11430010795000
9.4 РАСЧЕТ УРОВНЕЙ ЗНАЧИМОСТИ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ
Многие коэффициенты корреляции не имеют стандартных таблиц для нахождения критических значений. В этих случаях поиск критических значений осуществляется с помощью t-критерия Стьюдента по формуле:
, (9.6)
где rэмп – коэффициент корреляции, рассчитанный по какому-либо методу;
п – число коррелируемых признаков.
Величина Тф проверяется на уровень значимости по таблице 4 Приложения 1 для t-критерия Стьюдента. Число степеней свободы в этом случае будет равно v = n - 2.
C помощью формулы (9.6) можно проводить оценку уровней значимости и коэффициентов корреляции Пирсона и Спирмена. Проведем, в частности, проверку уровня значимости коэффициента корреляции, полученного при решении задачи 9.2 и равного 0,669. Коэффициент попал в «зону значимости», согласно таблице 3 Приложения 1. Вычисляем уровень значимости этого коэффициента по формуле (9.6):
=3,818.
Число степеней свободы v = n - 2; в нашем случае при п = 20 v = 20 - 2 = 18. По таблице 4 Приложения 1 находим критические значения критерия Стьюдента, они равны:
.
«Ось значимости»

Полученная величина Тф, как и в случае решения задачи 9.2, попала в «зону значимости».
114300571500
9.5 КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ
При сравнении двух переменных, измеренных в дихотомической шкале, мерой корреляционной связи служит так называемый коэффициент , или, как назвал эту статистику ее автор К. Пирсон, – «коэффициент ассоциации».
Величина коэффициента лежит в интервале +1 и -1. Он может быть как положительным, так и отрицательным, характеризуя направление связи двух дихотомически измеренных признаков.
Условия применения критерия
Сравниваемые признаки должны быть измерены в дихотомической шкале.
Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.
Для оценки уровня достоверности коэффициента следует пользоваться формулой (9.4) и таблицей 4 Приложения 1 для t-критерия Стьюдента при v = n - 2.
Задача 9.3
Влияет ли семейное положение на успешность учебы студентов-мужчин?
Решение
Для решения этой задачи психолог выясняет у каждого из 12 студентов-мужчин, во-первых, женат он или холост, соответственно проставляя каждому 1 – женат или 0 – холост, и, во-вторых, насколько успешно тот учится: успешной учебе проставляется код 0, при наличии академической задолженностий проставляется код 1. Для решения данные лучше свести в таблицу 9.5.
Таблица 9.5
№ п/п
X – семейное положение
0 – холост, 1 – женат Y – успешность обучения
1 – неуспешно, 0 – успешно
1 0 0
2 1 1
3 0 1
4 0 0
5 1 1
6 1 0
7 0 0
8 1 1
9 0 0
10 0 1
11 0 0
12 1 1
Построим так называемую четырехпольную таблицу, или таблицу сопряженности (таблица 9.6).
Таблица 9.6
Значение
признаков Семейное положение Сумма
Холостые Женатые Плохо учится a = 2 b = 4 6
Учится хорошо c = 5 d = 1 6
Сумма 7 5 12
В общем виде формула вычисления коэффициента эмп выглядит так:
. (9.7)
Подставляем данные таблицы 9.6 в формулу 9.7, получаем:
.
Поскольку для этого коэффициента корреляции нет таблиц значимости, рассчитываем его значимость по формуле (9.6):
.
Число степеней свободы в нашем случае будет равно v= п -1 = 12 -2 = 10. По таблице 4 Приложения 1 для v = 10 находим критические значения критерия Стьюдента, они равны:
.
Строим «ось значимости»:

Ответ
Значение величины Тф попало в «зону незначимости». Иными словами, психолог не обнаружил никакой связи между успешностью обучения и семейным положением студентов. Или, в терминах статистических гипотез, гипотеза H1 отклоняется, и принимается гипотеза Н0 о сходстве коэффициента корреляции с нулем.
Отметим, что кодирование, т.е. приписывание чисел 0 или 1 тому или иному признаку, было произвольным. Можно было проставить холостым 1, значение коэффициента при этом не изменилось бы.
114300571500
? ВОПРОСЫ И УПРАЖНЕНИЯ
Дайте определение следующим понятиям:
корреляционная связь и корреляционная зависимость;
зависимые и независимые переменные;
линейная и криволинейная связи;
положительная (прямая) и отрицательная (обратная) корреляции;
степень и сила корреляционной связи.
В каких случаях можно воспользоваться общей классификацией корреляционных связей по их силе, а в каких частной?
Что из себя могут представлять ряды значений, между которыми находится коэффициент корреляции?
Перечислите ограничения, которые накладывают на выборки данных следующие критерии:
коэффициент ранговой корреляции;
коэффициент линейной корреляции Пирсона;
коэффициент сопряженности.
Психолог просит супругов проранжировать семь личностных черт, имеющих определяющее значение для семейного благополучия. Задача заключается в том, чтобы определить, в какой степени совпадают оценки супругов по отношению к ранжируемым качествам. Определите критерий для нахождения коэффициента корреляции в этом случае и сформулируйте нулевую и альтернативную гипотезы.
Определите связь между ранговыми оценками качеств личности, входящими в представление человека о своем «Я реальном» и «Я идеальном». Результаты исследования занесены в таблицу:
Качества личности Я реальное Я идеальное
Ответственность 7 1
Общительность 1 5
Настойчивость 3 7
Энергичность 2 6
Жизнерадостность 5 4
Терпеливость 4 3
Решительность 6 2
101409556070500
ТЕМА 10
34290010350500
ВЫЯВЛЕНИЕ РАЗЛИЧИЙ В УРОВНЕ ИССЛЕДУЕМОГО ПРИЗНАКА
114300571500
10.1 ПОСТАНОВКА ЗАДАЧИ
Очень часто перед исследователем в психологии стоит задача выявления различий между двумя, тремя и более выборками испытуемых.
Это может быть, например:
задача определения психологических особенностей хронически больных детей по сравнению со здоровыми, юных правонарушителей по сравнению с законопослушными сверстниками;
выявление различий между работниками государственных предприятий и частных фирм;
выявление различий между людьми разной национальности или разной культуры;
выявление различий между людьми разного возраста в методе «поперечных срезов».
Иногда по выявленным в исследовании статистически достоверным различиям формируется «групповой профиль» или «усредненный портрет» человека той или иной профессии, статуса, соматического заболевания и др.
В последние годы все чаще встает задача выявления психологического портрета специалиста новых профессий: «успешного менеджера», «успешного политика», «успешного торгового представителя», «успешного коммерческого директора» и др. Такого рода исследования не всегда подразумевают участие двух или более выборок. Иногда обследуется одна, но достаточно представительная выборка численностью не менее 60 человек, а затем внутри этой выборки выделяются группы более и менее успешных специалистов, и их данные по исследованным переменным сопоставляются между собой.
Сопоставление уровневых показателей в разных выборках может быть необходимой частью комплексных диагностических, учебных, психокоррекционных и иных программ. Оно помогает обратить внимание на те особенности обследованных выборок, которые должны быть учтены и использованы при адаптации программ к данной группе в процессе их конкретного воплощения.
Критерии, которые рассматриваются в данной теме, предполагают, что мы сопоставляем независимые выборки, то есть две или более выборки, состоящие из разных испытуемых. Тот испытуемый, который входит в одну выборку, уже не может входить в другую. Если мы обследуем одну и ту же выборку испытуемых, несколько раз подвергая ее аналогичным измерениям («замерам»), то перед нами – так называемые связанные, или зависимые, выборки данных.
Решение о выборе того или иного критерия в задачах этого типа принимается на основе того, сколько выборок сопоставляется и каков их объем (таблица 10.1).
Таблица 10.1
Количество выборок (с) Объемы выборок
(n1 , n2 ,…) Методы
2 n1 n2 и n1, n2 11 Q - критерий Розенбаума
2 3 n1, n2 60 или n1=2, n2 5 U - критерий Манна-Уитни
От 3 до 6 n1 = n2=…,
2 n1, n2,,… 10 S - критерий тенденций Джонкира
3 {n1 , n2 , n3 } 5 H - критерий Крускала-Уоллиса
c > 6 и/или ni > 10 114300571500
10.2 Q – КРИТЕРИЙ РОЗЕНБАУМА
Назначение критерия Розенбаума
Критерий используется для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых.
Критерий позволяет быстро оценить различия между двумя выборками по какому-либо признаку. Если критерий Q не выявляет достоверных различий, это еще не означает, что их действительно нет. В этом случае стоит применить критерий φ*– Фишера. Если Q – критерий выявляет достоверные различия между выборками с уровнем значимости 0,01, можно ограничиться только им. Критерий применяется в тех случаях, когда данные представлены в порядковой шкале.
Гипотезы
Н0: Уровень признака в выборке 1 не превышает уровня признака в выборке 2.
Н1: Уровень признака в выборке 1 превышает уровень признака в выборке 2.
Условия применения критерия Q – Розенбаума
Измерение может быть проведено в шкале порядка, интервалов или отношений.
Выборки должны быть независимыми.
В каждой из выборок должно быть не меньше 11 испытуемых (n1, n2 11 и n1 n2).
Должны соблюдаться следующие ограничения:
если n1, n2 50, то должно выполняться n1 - n2 10;
если 51 n1, n2 100, то должно выполняться
n1 - n2 20
если n1, n2 100, то допускается, чтобы одна из выборок была больше другой не более чем в 1,5-2 раза.
Диапазоны разброса значений в двух выборках не должны совпадать между собой, в противном случае применение критерия бессмысленно.
Алгоритм подсчета критерия Q – Розенбаума
Проверить, выполняются ли ограничения.
Упорядочить значения отдельно в каждой выборке по степени убывания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше.
Сформулировать гипотезы.
Определить максимальное значение в выборке 2.
Подсчитать S1 – количество значений в выборке 1, которые выше максимального значения в выборке 2.
Определить минимальное значение в выборке 1.
Подсчитать S2 – количество значений в выборке 2, которые ниже минимального значения выборки 1.
Подсчитать эмпирическое значение критерия по формуле
Qэмп= S1 + S2. (10.1)
По таблице 5 Приложения 1определить критические значения Q для данных n1 и n2.
Для процесса принятия решения вычертить «ось значимости».
Задача 10.1
У двух групп учащихся из городской школы (14 человек) и городского лицея (12 человек), используя тест Векслера, были измерены показатели интеллекта. Можно ли утверждать, что учащиеся из городского лицея превосходят учащихся из городской школы по показателям интеллекта.
Решение
Индивидуальные показатели интеллекта по двум группам представлены в таблице 10.2 в порядке возрастания. Так как показатели в группе учащихся лицея выше, то эту группу считаем первой.
Таблица 10.2

№ показателей выборка 1 – учащиеся
городского лицея выборка 2 – учащиеся
городской школы
1 130 125
2 128 125
3 127 121
4 127 112
5 127 112
6 126 100
7 124 88
8 124 84
9 112 82
10 112 78
11 100 72
12 100 13 99 14 94 Гипотезы к задаче
H0: Учащиеся лицея не превосходят учащихся школы по показателям интеллекта.
H1: Учащиеся лицея превосходят учащихся школы по показателям интеллекта.
Максимальный показатель во второй выборк – 125. Количество показателей первой выборки, которые больше максимального показателя второй выборки: S1 = 6.
Минимальный показатель в первой выборке – 94. Количество показателей второй выборки, которые меньше минимального показателя первой выборки: S2 = 5.
Эмпирическое значение критерия определяем по формуле (10.1):
Qэмп = S1 + S2 = 6 + 5 = 11.
По таблице определяем критические значения Q для n1 = 14, n2 = 12:
.
«Ось значимости»

Ответ
Qэмп=11, нулевая гипотеза отклоняется и принимается альтернативная гипотеза. Учащиеся лицея превосходят учащихся школы по показателям интеллекта (<0,01).
114300571500
10.3 S – КРИТЕРИЙ ТЕНДЕНЦИЙ ДЖОНКИРА
Назначение критерия S Джонкира
Критерий S предназначен для выявления тенденций изменения признака при переходе от выборки к выборке при сопоставлении трех и более выборок.
Критерий S позволяет упорядочить обследованные выборки по какому-либо признаку: изменение свойств памяти с возрастом, обучаемость детей по социальным группам.
В результате можно утверждать, что на первом месте по выраженности исследуемого признака стоит выборка, например, Б, на втором – А, на третьем – В и т.д. Интерпретация полученных результатов будет зависеть от того, по какому принципу были образованы исследуемые выборки. Здесь возможны два принципиально отличных варианта.
1. Если выборки различаются по качественным признакам (профессии, национальности, месту работы и т. п.), то можно упорядочить их по количественно измеряемому признаку (креативности, гибкости и т.п.).
2. Если выборки различаются по количественному признаку (возрасту, стажу работы, социометрическому статусу и др.), то упорядочить их можно по другому количественному признаку. Т.е. фактически установить меру связи между двумя количественными признаками.
Гипотезы
Н1:Тенденция возрастания значений признака при переходе от выборки к выборке является случайной.
Н0:Тенденция возрастания значений признака при переходе от выборки к выборке не является случайной.
Условия применения критерия S Джонкира
Измерение может быть проведено в шкале порядка, интервалов или отношений.
Выборки должны быть независимыми.
Количество элементов в каждой выборке должно быть одинаковым. Если число наблюдений неодинаково, то необходимо уравнивать
Нижняя граница применимости критерия: не менее трех выборок и не менее двух элементов в каждом наблюдении. Верхняя граница определяется таблицей 5 Приложения 1 – не более 6 выборок и не более 10 элементов в каждой выборке. Во всех других случаях следует пользоваться критерием H Крускала-Уолисса.
Алгоритм подсчета критерия S – Джонкира
Проверить, выполняются ли ограничения
Упорядочить выборки слева направо в порядке возрастания значений исследуемого признака, опираясь на средние значения. Сформулировать гипотезы.
Занести данные в таблицу, оставив свободные столбцы рядом со значениями.
Начиная с крайнего левого столбца подсчитать для каждого индивидуального значения количество превышающих его значений во всех столбцах справа (Si). Полученные суммы записать рядом с каждым индивидуальным значением.
Подсчитать суммы полученных показателей по столбцам.
Подсчитать общую сумму Si, просуммировав все суммы по столбцам. Эту общую сумму обозначить как A.
Подсчитать максимально возможное количество превышающих значений (B), которое мы получили бы, если бы все значения справа были выше значений слева:
, (10.11)
где с – количество выборок,
n – количество наблюдений в каждой выборке.
Определить эмпирическое значение S по формуле:
. (10.12)
По таблице 6 Приложения 1 определить критические значения S для данных n и с.
Для процесса принятия решения вычертить «ось значимости».
Задача 10.1
В выборке из 28 мужчин-руководителей проводилось обследование с помощью 16-факторного личностного опросника Р.Б. Кетелла (форма А). В таблице приведены индивидуальные значения испытуемых по фактору N. Данные сгруппированы по возрастным группам. Можно ли утверждать, что есть определенная тенденция изменения значений фактора N при переходе от группы к группе?
Индивидуальные значения по фактору N16PF в 4 возрастных группах руководителей внесены в таблицу 10.3.
Таблица 10.3
№№
испытуемых 1 группа 2 группа 3 группа 4 группа
26-31год 32-37лет 38-42года 46-52года
1 2 11 8 11
2 10 7 12 12
3 5 8 14 9
4 8 12 9 9
5 10 12 16 10
6 7 12 14 14
7 12 9 10 13
Суммы 54 71 83 78
Среднее 7,71 10,14 11,86 11,14
Решение
Сначала необходимо проверить, есть ли возможность применить критерий Джонкира.
В данном случае количество групп (с) меньше 6, количество испытуемых в каждой группе (n) меньше 10, при этом все группы численно равны. Следовательно, критерий S применим.
Изменим последовательность расположения групп, упорядочив их по нарастанию значений фактора N, для чего придется поменять местами 4-ю и 3-ю группы.
Гипотезы к задаче
Н0:Тенденция возрастания значений по фактору N при переходе от группы к группе в последовательности 1-2-4-3 является случайной.
Н1:Тенденция возрастания значений по фактору N при переходе от группы к группе в последовательности 1-2-4-3 не является случайной.
Расчеты для нахождения эмпирического значения критерия отражены в таблице 10.4.
Таблица 10.4
№№
испытуемых Группа 1 Группа 2 Группа 4 Группа 3
26-31год 32-37лет 46-52года 38-42года
Значения Кол-во более высоких значений справа Значения Кол-во более высоких значений справа Значения Кол-во более высоких значений справа Значения
1 2 21 7 14 9 5 8
2 5 21 8 13 9 5 9
3 7 20 9 10 10 4 10
4 8 18 11 7 11 4 12
5 10 12 12 5 12 3 14
6 10 12 12 5 13 3 14
7 12 5 12 5 14 1 16
Суммы 54 109 71 59 78 25 83
Среднее 7,71 15,57 10,14 8,43 11,14 3,57 11,86
Определим величину A: .
Теперь определим величину B по формуле (10.11):
.
Определим эмпирическое значение S по формуле (10.11):
.
По таблице 6 Приложения 1 определим критические значения для данного количества групп (с=4) и данного количества испытуемых в каждой группе (n=7):
.
«Ось значимости»

Ответ
Sэмп=92, Н0 отклоняется. Тенденция возрастания значений по фактору N не является случайной (при 0,05). Фактор N имеет тенденцию возрастать при переходе от первой группы ко второй, а затем к четвертой; самые высокие значения приходятся на третью возрастную группу.
114300571500
? ВОПРОСЫ И УПРАЖНЕНИЯ
Перечислите ограничения, которые накладывают на выборки критерий Розенбаума и критерий Джонкира.
Четыре группы испытуемых выполняли тест Бурдона в разных экспериментальных условиях. Задача состоит в том, чтобы установить, зависит ли эффективность выполнения теста от условий или, иными словами, существуют ли статистически достоверные различия в успешности выполнения теста между группами. В каждую группу входило пять испытуемых. Число ошибок показателя переключаемости внимания в процентах дано в таблице:
№ п/п 1 группа 2 группа 3 группа 4 группа
1 45 34 23 21
2 12 24 34 26
3 11 40 35 27
4 34 25 50 22
5 15 27 32 25
Суммы =SUM(ABOVE) 118 =SUM(ABOVE) 152 =SUM(ABOVE) 177 =SUM(ABOVE) 125

10140955905500
ТЕМА 11
34290010350500
ОЦЕНКА ДОСТОВЕРНОСТИ СДВИГА В ЗНАЧЕНИЯХ ИССЛЕДУЕМОГО ПРИЗНАКА
114300571500
11.1 ПОСТАНОВКА ЗАДАЧИ
В психологических исследованиях часто бывает важно доказать, что в результате действия каких-либо факторов произошли достоверные изменения («сдвиги») в измеряемых показателях.
Сдвиг – это разность между вторым и первым замерами показателей измеряемого признака у одного испытуемого. Сдвиги могут быть как отрицательными, так и положительными. Сдвиги, которые кажутся преобладающими, называют типичными, а сдвиги более редкого, противоположного направления – нетипичными.
В зависимости от условий измерения различают сдвиги временные, ситуационные, умозрительные, структурные и сдвиги под влиянием экспериментального воздействия.
Временной сдвиг – сопоставление показателей, полученных у одних и тех же испытуемых по одним и тем же методикам, но в разное время.
Многократные обследования одних и тех же лиц на протяжении достаточно длительного отрезка их жизненного пути называются лонгитюдинальным исследованием.
Ситуационный сдвиг – сопоставление показателей, полученных по одним и тем же методикам, но в разных условиях измерения (например, «покоя» и «стресса»).
Умозрительный сдвиг – сопоставление показателей, измеренных в обычных и воображаемых условиях. Например, можно попросить испытуемого «представить себе», что он оказался в других условиях измерения: в будущем, в позиции других людей, которые оценивают его как бы со стороны, в состоянии разгневанного отца и т. п.
Структурные сдвиги – сопоставление между собой разных показателей одних и тех же испытуемых, если они измерены в одних и тех же единицах, по одной и той же шкале. Например, можно исследовать экзаменационную успешность по разным дисциплинам.
Сдвиг под влиянием – сопоставление показателей, измеренных до и после экспериментального воздействия. Например, что проведенный тренинг способствует развитию кратковременной памяти.
В случае, если сдвиги окажутся статистически достоверными, это позволит утверждать, что экспериментальные воздействия были существенными, или эффективными. Однако сдвиг может объясняться и действием других, неучтенных причин. Для избежания заблуждения необходимо введение контрольной группы.
При отсутствии контрольной группы сдвиг в экспериментальной группе может объясняться действием самых разных причин: временем суток, в которое производились замеры, или важным для испытуемых событием, которое произошло между замерами.
Если же в экспериментальной группе сдвиги окажутся достоверными, а в контрольной группе – недостоверными, то это, действительно, может свидетельствовать об эффективности воздействий.
Если контрольная группа отсутствует, изменения можно изучать с помощью двух или более экспериментальных групп, различающихся по условиям и способам воздействия на них. Группы могут отличаться по экспериментальным условиям, условиям жизни, географическому расположению и т.п. Сопоставление групп, различающихся по этим признакам, позволит уточнить специфическое действие экспериментальных или естественно действующих факторов, хотя при этом следует помнить, что воздействие неучтенных факторов может оказаться еще более мощным.
В некоторых исследованиях отсутствует возможность измерения двух замеров на одной и той же выборке. Тогда допускается сопоставление показателей разных выборок, уравновешенных по всем значимым для исследования признакам. Такими признаками могут быть: пол, возраст, профессия, уровень образования и т.п.
Другой вариант «уравновешивания» – введение параллельных форм теста. В тех случаях, когда на результатах повторных замеров могут сказаться эффекты научения, приходится «до» измерять реакции испытуемого с помощью одного инструмента, а «после» – с помощью другого. В результате на измерениях может отразиться и действие фактора времени, и различия в параллельных формах теста. Создать параллельную форму методики не менее трудно, чем подобрать «уравновешенную» группу испытуемых.
В таблице 11.1 приведена классификация сдвигов и критериев оценки их статистической достоверности:
Таблица 11.1
Виды сдвигов Условия Критерии оценки достоверности сдвига
Кол-во замеров Кол-во групп временные
ситуационные
умозрительные
структурные
сдвиги под влиянием экспериментальных воздействий, если нет контрольной группы 2 1 G - критерий знаков;
Т - критерий Вилкоксона
3 и более 1 L - критерий тенденций Пейджа;
r2 - критерий Фридмана
сдвиги под влиянием экспериментальных воздействий при наличии контрольной группы
2 2 Вариант 1 - сопоставление значений «до» и «после» отдельно по экспериментальной и контрольной группам:
G - критерий знаков;
Т - критерий Вилкоксона
Вариант 2 – сопоставление сдвигов в двух группах:
Q - критерий;
U - критерий Манна-Уитни;
*- критерий Фишера
3 и более 2 Сопоставление значений отдельно по экспериментальной и контрольной группам:
L - критерий тенденций Пейджа;
r2 - критерий Фридмана
114300571500
11.2 T – КРИТЕРИЙ ВИЛКОКСОНА
Назначение Т – критерия Вилкоксона
Критерий применяется для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых.
Он позволяет установить не только направленность изменений, но и их выраженность. С его помощью мы определяем, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом.
Гипотезы
Н0:Интенсивность сдвигов в типичном направлении исследуемого признака не превосходит интенсивности сдвигов в нетипичном направлении.
H1:Интенсивность сдвигов в типичном направлении исследуемого признака превышает интенсивность сдвигов в нетипичном направлении.
Условия применения Т – критерия Вилкоксона
Измерение может быть проведено во всех шкалах, кроме шкалы номинальной.
Выборка должна быть связной.
Число элементов в сравниваемых выборках должно быть равным.
Минимальное количество испытуемых, прошедших измерения в двух условиях, – 5 человек. Максимальное количество испытуемых – 50 человек.
Нулевые сдвиги из рассмотрения исключаются, и количество наблюдений n уменьшается на количество этих нулевых сдвигов. Можно обойти это ограничение, сформулировав гипотезы, включающие отсутствие изменений, например: «Сдвиг в сторону увеличения значений превышает сдвиг в сторону уменьшения значений и тенденцию сохранения их на прежнем уровне».
Алгоритм подсчета T – критерия Вилкоксона
Проверить ограничения.
Вычислить разность между индивидуальными значениями во втором и первом замерах («после» – «до»).
Определить, что будет считаться «типичным» сдвигом, и сформулировать соответствующие гипотезы.
Перевести сдвиги в абсолютные величины.
Проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг. Проверить совпадение полученной суммы рангов с расчетной.
Подсчитать сумму рангов нетипичных сдвигов – Т.
Определить критические значения Т для данного n по таблице 7 Приложения 1.
Для процесса принятия решения вычертить «ось значимости». При построении «оси значимости» необходимо внимательно отнестись к тому, что «зона значимости» в данном случае простирается влево, а «зона незначимости» справа. Таким образом, если Тэмп меньше или равен Ткр, сдвиг в «типичную» сторону по интенсивности достоверно преобладает.
Задача 11.1
Психолог проводит групповой тренинг. Его задача – выяснить, будет ли эффективен данный конкретный вариант тренинга для повышения уровня коммуникабельности. Уровень коммуникабельности измеряется с помощью теста до тренинга и после.
Решение
Результаты измерения уровня коммуникабельности у группы испытуемых и результаты решения приведены в таблице 11.2.
Типичными сдвигами в этой задаче являются сдвиги в сторону увеличения – их больше. Нетипичными – в сторону уменьшения.
Таблица 11.2
Код имени Уровень коммуникативных навыков Разность Абсолютное значение
разности Ранговый
номер
разности
До
тренинга После тренинга 1 10 10 0 0 2 12 14 2 2 2,5
3 7 6 -1 1 1
4 10 13 3 3 4
5 9 13 4 4 5
6 10 8 -2 2 2,5
7 7 13 5 5 6
8 6 12 6 6 7
Сумма =SUM(ABOVE) 28
Гипотезы к задаче
Н0:Интенсивность сдвигов в сторону увеличения уровня коммуникабельности не превышает интенсивности сдвигов в сторону его уменьшения.
Н1:Интенсивность сдвигов в сторону увеличения уровня коммуникабельности превышает интенсивность сдвигов в сторону его уменьшения.
Сумма рангов нетипичных сдвигов:
Tэмп=1+2,5=3,5.
По таблице определяем критические значения T для n=7 (8 наблюдений уменьшаются до 7 за счет исключения показателей с нулевым сдвигом):
.
Построим «ось значимости», простирающуюся в данном случае влево, т.е. слева расположена «зона значимости», а справа «зона незначимости»:

Ответ
Tэмп=3,5, принимается гипотеза H0. Интенсивность сдвигов в сторону увеличения уровня коммуникабельности не превышает интенсивности сдвигов в сторону его уменьшения. Таким образом, сдвиг в сторону увеличения коммуникативного навыка после проведения тренинга является случайным.
114300571500
? ВОПРОСЫ И УПРАЖНЕНИЯ
Дайте определение сдвигу.
Дайте характеристики следующим видам сдвигов: временные, лонгитюдинальные, ситуационные, умозрительные, структурные, сдвиги под влиянием.
Охарактеризуйте понятия «уравновешенные группы» и «параллельные формы теста». Для чего они используются?
С какой целью используются исследования на контрольных группах?
Группе студентов из 20 человек были предложены два параллельных психологических теста. На первый тест студенты отвечали утром, на второй вечером, в конце учебного дня. Можно ли утверждать, что время выполнения теста влияет на конечный результат? Результаты тестирования занесены в таблицу:
№ испытуемого Результат тестирования утром Результат тестирования вечером
1 93 56
2 97 61
3 68 25
4 45 19
5 98 65
6 72 60
7 69 35
8 91 50
116649532194500
ТЕМА 12
34290010350500
ВЫЯВЛЕНИЕ РАЗЛИЧИЙ В РАСПРЕДЕЛЕНИИ ПРИЗНАКА
114300571500
12.1 ПОСТАНОВКА ЗАДАЧИ
Распределения могут отличаться по средним, дисперсиям, асимметрии, эксцессу и по сочетаниям этих параметров.
Анализ реально полученных в исследованиях распределений может позволить подтвердить или опровергнуть данные теоретического предположения. Например, сравнение распределения ответов на вопрос анкеты в двух группах людей может подчеркнуть различие этих групп или доказать их идентичность.
Если окажется, что распределения достоверно различаются, это может стать основой для классификации задач и типологии испытуемых.
Сравнение распределений может быть двух типов:
сравнение эмпирического распределения признака с теоретическим (например, с равномерным или нормальным);
сравнение эмпирических распределений признаков между собой.
Традиционные для отечественной математической статистики критерии определения расхождения или согласия распределений – это метод 2 Пирсона и критерий Колмогорова-Смирнова.
Оба эти метода требуют тщательной группировки данных и довольно сложных вычислений. Кроме того, возможности этих критериев в полной мере проявляются на больших выборках. Тем не менее, они могут оказаться незаменимыми в задачах, требующих доказательства неслучайности предпочтений в выборе из нескольких альтернатив, и в задачах, требующих обнаружения точки максимального расхождения между двумя распределениями, которая затем используется для перегруппировки данных с целью применения критерия * (углового преобразования Фишера).
114300571500
12.2 2 КРИТЕРИЙ ПИРСОНА
Назначение критерия Пирсона
Критерий 2 применяется в двух целях:
для сопоставления эмпирического распределения признака с теоретическим – равномерным, нормальным или каким-то иным;
для сопоставления двух, трех или более эмпирических распределений одного и того же признака.
Критерий 2 отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.
Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале.
Чем больше расхождение между двумя сопоставляемыми распределениями, тем больше эмпирическое значение 2.
Гипотезы для сравнения эмпирического и
теоретического распределений
Н0:Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения.
Н1:Полученное эмпирическое распределение признака отличается от теоретического распределения.
Гипотезы для сравнения двух эмпирических
распределений
Н0: Эмпирическое распределение 1 не отличается от эмпирического распределения 2.
Н1:Эмпирическое распределение 1 отличается от эмпирического распределения 2.
Гипотезы для сравнения более двух эмпирических
распределений
Н0: Эмпирические распределения 1, 2, 3, ... не различаются между собой.
Н1: Эмпирические распределения 1, 2, 3, ... различаются между собой.
Условия применения критерия Пирсона
Измерение может быть проведено в любой шкале.
Выборки должны быть случайными и независимыми.
Количество наблюдений в выборках должно быть более 30. С увеличением объема выборки точность критерия повышается.
Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5.
Сумма наблюдений по всем интервалам должна быть равна общему количеству наблюдений.
Таблица критических значений критерия 2 рассчитана для числа степеней свободы v, которое каждый раз рассчитывается по определенным правилам.
Необходимо вносить «поправку на непрерывность» при сопоставлении распределений признаков, которые принимают всего 2 значения. При внесении поправки значение 2 уменьшается.
Алгоритм подсчета критерия 2
Основная расчетная формула критерия 2 выглядит так:
, (12.1)
гдеfэj – эмпирические частоты;
fT – теоретическая частота;
k – количество разрядов признака.
Расчеты критерия 2 удобнее заносить в таблицу, состоящую из шести столбцов, в соответствии со следующими шагами:
Оформить таблицу, где
первый столбец – наименования разрядов;
второй – эмпирические частоты;
третий – теоретические частоты;
четвертый – разность между эмпирической и теоретической частотой по каждому разряду (строке);
пятый – полученные разности в квадрате;
шестой – результаты деления квадратов разностей на теоретическую частоту.
Найти сумму шестого столбца. Полученную сумму обозначить как 2.
Определить число степеней свободы v = k-1, где k – количество разрядов признака. Если сравниваются эмпирические распределения значений, число степеней свободы находится следующим образом: v = (k-1) (c-1), где k – число строк, а с – число столбцов. Если v=1, то необходимо внести поправку на «непрерывность».
Определить по таблице 8 Приложения 1 критические значения для данного числа степеней свободы v.
Для процесса принятия решения вычертить «ось значимости».
Критерий 2 – один из наиболее часто использующихся в психологических исследованиях, поскольку он позволяет решать большое число разных задач.
Рассмотрим ряд примеров решения задач с использованием основной формулы критерия 2 и его модифицированных формул:
сравнение эмпирического распределения с теоретическим (равномерным) – задача 12.1;
сравнение эмпирического распределения с теоретическим (нормальным) – задача 12.2;
сравнение двух эмпирических распределений – задача 12.3;
сравнение распределений, в случае если признак принимает всего 2 значения (степень свободы v=1), – задача 12.4;
сравнение двух эмпирических распределений в выборках одинакового объема с большим количеством переменных – задача 12.5;
сравнение двух эмпирических распределений в выборках разного объема с большим количеством переменных – задача 12.6.
Задача 12.1
В одной из школ города выяснялась успешность обучения алгебре учащихся десятого класса. Для этого в классе была проведена контрольная работа. Проверялось предположение о равномерном распределении оценок за контрольную работу. Результаты контрольной работы в таблице 12.1.
Таблица 12.1
Оценки «5» «4» «3» «2» Всего взглядов
Количество оценок 14 5 8 5 32
Необходимо сопоставить полученные эмпирические частоты с теоретическими частотами. Если успеваемость в классе не будет отличаться от равномерного распределения, то количества оценок между «5», «4», «3», «2» будут распределены примерно одинаково.
Решение
Гипотезы к задаче
Н0:Распределение оценок по контрольной работе не отличается от равномерного распределения.
Н1:Распределение оценок по контрольной работе отличается от равномерного распределения.
Теоретическая частота при сопоставлении эмпирического распределения с равномерным определяется по формуле:
fтеор = n / k, (12.2)
где n – количество наблюдений;
k – количество разрядов признака.
Для приведенной задачи fтеор = 32 / 4 = 8. Если бы все оценки распределялись равномерно, то оценку «5» получили бы 8 учащихся, как и оценки «4», «3», «2».
В методе 2 вычисления производятся с точностью до сотых, а иногда и до тысячных долей единицы.
Оформим вычисления расчет критерия 2 при сопоставлении эмпирического распределения оценок по контрольной работе с равномерным распределением в таблицу 12.2.
Таблица 12.2
Разряды Эмпирическая частота, fэj Теоретическая частота, fТ fэj- fТ (fэj- fТ)2 (fэj- fТ)2/ fТ
«5» 14 8 6 36 4,50
«4» 5 8 -3 9 1,13
«3» 8 8 0 0 0,00
«2» 5 8 -3 9 1,13
Сумма 32 32 0 54 6,75
Сумма разностей между эмпирическими и теоретической частотами (сумма по четвертому столбцу) всегда равна 0. Если это равенство не соблюдается, это означает, что в подсчете частот или разностей допущена ошибка.
Согласно формуле (12.1) сумма шестого столбца и есть .
Для нахождения критических значений критерия 2 необходимо обратиться к таблице 8 Приложения 1, определив предварительно число степеней свободы v. В нашем случае k (число вариантов оценок) = 4, следовательно, v = 4 – 1 = 3. По таблице 8 Приложения 1 находим:
.
Построим «ось значимости». Чем больше отклонения эмпирических частот от теоретических, тем больше будет величина . Поэтому «зона значимости» располагается справа, а «зона незначимости» – слева.

Ответ
2эмп = 6,75, принимается H0. Распределение оценок по контрольной работе не отличается от равномерного распределения.
При решении задач с равновероятным распределением теоретических частот не было необходимости использовать специальные процедуры их подсчета. Однако на практике чаще возникают задачи, в которых распределение теоретических частот не имеет равновероятного характера. В этих случаях для подсчета теоретических частот используются специальные формулы или таблицы. Рассмотрим задачу, в которой в качестве теоретического будет использоваться нормальное распределение.
Задача 12.2
У 267 человек был измерен рост. Вопрос состоит в том, будет ли полученное в этой выборке распределение роста близко к нормальному (задача взята из учебника Г.Ф. Лакина «Биометрия», 1990).
Данные разбиты на 9 интервалов шириной 3 см. В задаче указаны середины интервалов и эмпирическая частота. Среднее значение , стандартное отклонение = 4,06.
Решение
Гипотезы к задаче
Н0:Распределение роста 267 человек не отличается от равномерного.
Н1:Распределение роста 267 человек отличается от равномерного.
Для каждого выделенного интервала первоначально подсчитывается нормированные частоты по формуле:
, (12.3)
где xi – середины интервалов;
– среднее;
– среднеквадратичное отклонение.
Подсчитав эти величины, занесем их в таблицу 12.3, в третий столбец
Затем по величинам нормированных частот по таблице 1 Приложения 1 находим ординаты нормальной кривой – , для каждой zi. Ординаты заносим в четвертый столбец таблицы 12.3.
Таблица 12.3
Центры интервалов
xi Эмпирические частоты
fэi Ординаты нормальной кривой
Расчетные теоретические частоты

155 3 -2,77 0,0086 1,7
158 9 -2,03 0,0508 10,0
161 31 -1,29 0,1736 34,3
164 71 -0,55 0,3429 67,7
167 82 0,19 0,3918 77,3
170 46 0,93 0,2589 51,1
173 19 1,67 0,0989 19,5
176 5 2,41 0,0219 4,3
179 1 3,15 0,0028 0,6
Сумма 267 267
Теоретические частоты находятся по формуле:
, (12.4)
где n – общая величина выборки (n=267);
– величина интервала (=3);
– среднеквадратичное отклонение.
После подсчета эти величины заносятся в пятый столбец таблицы 12.3.
Дальнейшие расчеты проводим на основе стандартной таблицы 12.4.
Согласно формуле (12.1) сумма шестого столбца и есть .
Таблица 12.4
Разряды Эмпирическая частота, fэj Теоретическая частота, fТ fэj- fТ (fэj- fТ)2 (fэj- fТ)2/ fТ
155 3 1,7 1,3 1,69 0,99
158 9 10,0 -1 1 0,10
161 31 34,3 -3,3 10,89 0,32
164 71 67,7 3,2 10,24 0,15
167 82 77,3 4,4 19,36 0,25
170 46 51,1 -5,2 27,04 0,53
173 19 19,5 -0,4 0,16 0,01
176 5 4,3 0,6 0,36 0,08
179 1 0,6 0,4 0,16 0,27
Сумма 267 267 0 =SUM(ABOVE) 2,7
В случае оценки равенства эмпирического распределения нормальному число степеней свободы определяется особым образом: из общего числа интервалов вычитается число 3. В данном случае: 9-3=6. Таким образом, число степеней свободы будет равно v=6. По таблице 8 Приложения 1 находим:
.
«Ось значимости»

Ответ
, принимается Н0. Распределение роста 267 человек не отличается от равномерного.
Задача 12.3
Одинаков ли уровень подготовленности учащихся в классе из задачи 12.1 и в классе, где при изучении этой темы применялась другая методика? Результаты второй группы учащихся представлены в таблице 12.5.
Таблица 12.5
Оценки «5» «4» «3» «2» Всего взглядов
Количество оценок 15 6 9 6 36
Решение
Гипотезы к задаче
Н0:Распределение оценок по контрольной работе в первой группе учащихся не отличается от распределения оценок во второй группе учащихся.
Н1:Распределение оценок по контрольной работе в первой группе учащихся отличается от распределения оценок во второй группе учащихся.
Для подсчета теоретических частот можно составить специальную таблицу (12.6). Для каждой эмпирической частоты определяется своя теоретическая частота. Это обусловлено тем, что количество учащихся в группах разное и необходимо учитывать эту пропорцию.
Рассчитаем эту пропорцию. Всего оценок в группе получено 68, из них в первой группе – 32 и во второй – 36. Доля оценок в первой группе составит 32/68 = 0,47; доля оценок во второй группе – 36/68 = 0,53.
Таблица 12.6
Разряды Эмпирические частоты Суммы Теоретические частоты
В первой группе Во второй группе В первой группе Во второй группе
«5» 14 15 29 13,63 15,37
«4» 5 6 11 5,17 5,83
«3» 8 9 17 7,99 9,01
«2» 5 6 11 5,17 5,83
Сумма 32 36 68 32 36
Итак, во всех строках оценки первой группы должны были бы составлять 0,47 всех оценок по данной строке, а оценки во второй группе – 0,53 всех оценок. Теперь, зная суммы оценок по каждой строке, можно рассчитать теоретические частоты для каждой ячейки таблицы.
Для оценок первой группы:
f1 теор = 290,47 = 13,63;
f2 теор = 110,47 = 5,17;
f3 теор = 170,47 = 7,99;
f4 теор = 110,47 = 5,17.
Для оценок второй группы:
f1 теор =290,53=15,37;
f2 теор =110,53=5,83;
f3 теор =170,53=9,01;
f4 теор =110,53=5,83.
Общая формула подсчета f теор будет выглядеть так:
556895-444500
f теор = Сумма частот по соответствующей строке . Сумма частот по соответствующему столбцу
Общее количество наблюдений
Теперь оформим вычисление в таблицу 12.7, аналогичную таблице 12.2, представив во втором и третьем столбцах эмпирические и теоретические частоты сначала первой группы, затем второй.
Таблица 12.7
Ячейки таблицы частот Эмпирическая частота, fэj Теоретическая частота, fТ fэj- fТ (fэj- fТ)2 (fэj- fТ)2/ fТ
1 14 13,63 0,37 0,137 0,010
2 5 5,17 -0,17 0,029 0,006
3 8 7,99 0,01 0,000 0,000
4 5 5,17 -0,17 0,029 0,006
5 15 15,37 -0,37 0,137 0,009
6 6 5,83 0,17 0,029 0,005
7 9 9,01 -0,01 0,0001 0,000
8 6 5,83 0,17 0,029 0,005
Сумма 68 68 0 0,041
Число степеней свободы при сопоставлении двух эмпирических распределений определяется по формуле (12.3):
v = (k-1) (с-1), (12.3)
где k – количество разрядов признака (строк в таблице эмпирических частот);
с – количество сравниваемых распределений (столбцов в таблице эмпирических частот).
В данном случае количество разрядов – это количество вариантов оценок, т.е. 4. Количество сопоставляемых распределений с=2. Итак, для данного случая v = (4-1) (2-1) =3.
Определяем по таблице Приложения критические значения для v=3:
.
«Ось значимости»

Ответ
, Н0 принимается. Распределение оценок по контрольной работе в первой группе учащихся не отличается от распределения во второй группе учащихся.
Если в задаче требуется сопоставление одновременно трех и более распределений, то принцип расчетов такой же, как и при сопоставлении двух эмпирических распределений.
В случае если число степеней свободы v=1, т. е. если признак принимает всего 2 значения, необходимо вносить поправку на непрерывность.
Задача 12.4 [11]
В исследовании порогов социального атома профессиональных психологов просили определить, с какой частотой встречаются в их записной книжке мужские и женские имена коллег-психологов. Попытаемся определить, отличается ли распределение, полученное по записной книжке женщины-психолога X, от равномерного распределения. Эмпирические частоты представлены в таблицы:
Мужчин Женщин Всего человек
22 45 67
Решение
Гипотезы к задаче
Н0:Распределение мужских и женских имен в записной книжке Х не отличается от равномерного распределения.
Н1:Распределение мужских и женских имен в записной книжке Х отличается от равномерного распределения.
Количество наблюдений n=67; количество значений признака k=2. Рассчитаем теоретическую частоту:
fтеор = n/k = 67/2 = 33,5.
Число степеней свободы v = k – 1 =1.
Далее все расчеты производятся по известному алгоритму, но с одним добавлением: перед возведением в квадрат разности частот необходимо уменьшить абсолютную величину этой разности на 0,5. Расчеты внесем в таблицу 12.8.
Таблица 12.8
Разряды Эмпирическая
частота, fэj Теоретическая
частота, fТ fэj- fТ (fэj- fТ-0,5) (fэj- fТ-0,5)2 (fэj- fТ-0,5)2

Мужчины 22 33,5 -11,5 11 121 3,61
Женщины 45 33,5 11,5 11 121 3,61
Сумма 67 67 0 7,22
Таким образом, =7,22.
Дляv=1 определяем по таблице 8 Приложения 1 критические значения:
.
«Ось значимости»

Ответ
=7,22, Н0 отклоняется, принимается H1. Распределение мужcких и женских имен в записной книжке психолога Х отличается от равномерного распределения (α<0,01).
Задача 12.5
Психолог сравнивает два эмпирических распределения, в каждом из которых было обследовано 200 человек по тесту интеллекта. Различаются ли между собой эти распределения?
Решение
Гипотезы к задаче
Н0:Распределения уровней интеллекта в двух равных выборках не отличаются между собой.
Н1:Распределения уровней интеллекта в двух равных выборках статистически значимо отличаются между собой.
Представим эмпирические данные в виде таблицы 12.9, в которой приведены также предварительные расчеты, необходимые для получения .
Таблица 12.9
Уровни интеллекта Частоты f1 f2 f1+ f2 f1 f2
f1+ f2
f1 f2 60 1 1 1 2 0,50
70 5 3 25 8 3,13
80 17 7 289 24 12,04
90 45 22 2025 67 30,22
100 70 88 4900 158 31,01
110 51 69 2601 120 21,68
120 10 7 100 17 5,88
130 1 2 1 3 0,33
140 0 1 0 1 0,00
Сумма 200 200 =SUM(ABOVE) 104,79
Для случая равенства числа испытуемых в первой и второй выборках расчет производится по формуле (12.4):
, (12.4)
где f1 – частоты первого распределения;
f2 – частоты второго распределения;
n – число элементов в каждой выборке.
Произведем расчет по формуле 12.4, основываясь на результатах таблицы 12.9:
.
В данном случае число степеней свободы v = (k-1)(c-1) =(9-1) (2-1) = 8, где k – число интервалов разбиения, а с – число столбцов. В соответствии с таблицей 8 Приложения 1 находим:
.
«Ось значимости»

Ответ
, принимается Н1. Распределения уровней интеллекта в двух равных выборках статистически значимо отличаются между собой (<0,05).
Задача 12.6
Психолог сравнивает два эмпирических распределения, в каждом из которых было обследовано по тесту интеллекта разное количество испытуемых. Различаются ли между собой эти распределения?
Решение
Гипотезы к задаче
Н0:Распределения уровней интеллекта в двух неравных выборках не отличаются между собой.
Н1:Распределения уровней интеллекта в двух неравных выборках статистически значимо отличаются между собой.
Представим эмпирические данные в виде таблицы 12.10, в которой приведены также предварительные расчеты, необходимые для получения .
Таблица 12.10
Уровни интеллекта Частоты f1 f2 f1+ f2 f1 f2
f1+ f2
f1 f2 60 1 0 1 1 1,00
70 8 0 64 8 8,00
80 23 1 529 24 22,04
90 30 11 900 41 21,95
100 38 18 1444 56 25,79
110 12 14 144 26 5,54
120 7 3 49 10 4,90
130 4 4 16 8 2,00
140 1 1 1 2 0,50
150 0 1 0 1 0,00
Сумма 124 53 91,72
В этом случае расчет производится по формуле 12.5:
, (12.5)
где f1 – частоты первого распределения;
f2 – частоты второго распределения;
n1, n2 – число элементов в первой и второй выборках;
N – сумма числа элементов в обеих выборках.
Произведем расчет по формуле 12.5:
.
В данном случае число степеней свободы v = (k-1)(c-1) =(10-1) (2-1) = 9, где k – число интервалов разбиения, а с – число столбцов. В соответствии с таблицей 8 Приложения 1 находим:
.
«Ось значимости»

Ответ
, принимается Н1. Распределения уровней интеллекта в двух неравных выборках статистически значимо отличаются между собой (<0,01).
11430012573000
12.3 – КРИТЕРИЙ КОЛМОГОРОВА-СМИРНОВА
Назначение критерия
Критерий предназначен для решения тех же задач, что и критерий 2. Иначе говоря, с его помощью можно сравнивать эмпирическое распределение с теоретическим или два эмпирических распределений между собой. Разница между критериями в том, что при применении 2 сопоставляются частоты двух распределений, а при применении критерия сравниваются накопленные частоты по каждому разряду.
Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.
Если различия между двумя распределениями существенны и в какой-то момент разность накопленных частот достигнет критического значения, можно признать различия статистически достоверными. В формулу критерия включается эта разность. Чем больше эмпирическое значение , тем более существенны различия.
Гипотезы
Н0: Различия между двумя распределениями недостоверны (судя по точке максимального накопленного расхождения между ними).
Н1: Различия между двумя распределениями достоверны (судя по точке максимального накопленного расхождения между ними).
Ограничения критерия Колмогорова-Смирнова
Измерение может быть проведено в шкале интервалов и отношений.
Выборки должны быть случайными и независимыми.
Желательно, чтобы суммарный объем двух выборок был больше или равен 50.
Сопоставление эмпирического распределения с теоретическим иногда допускается при n 5.
Разряды должны быть упорядочены по нарастанию или убыванию какого-либо признака (дни недели, 1-й, 2-й, 3-й месяцы после прохождения курса терапии, повышение температуры тела, усиление чувства недостаточности и т. д.). Во всех тех случаях, когда разряды представляют собой не упорядоченные по возрастанию или убыванию какого-либо признака категории, следует применять метод 2.
Задача 12.7
В выборке учащихся одиннадцатых классов городских школ проводилось тестирование по математике. Распределение результатов тестирования представлено в таблице 12.11.
Таблица 12.11
Доля правильных ответов, % Количество учащихся, получивших результат в данном интервале
0-20% 4
21-40% 15
41-60% 18
61-80% 7
81-100% 1
Можно ли утверждать, что распределение результатов тестирования по математике учащихся городских школ отличается от равномерного распределения?
Решение
Н0: Эмпирическое распределение результатов тестирования по математике учащихся городских школ не отличается от равномерного распределения.
Н1:Эмпирическое распределение результатов тестирования по математике учащихся городских школ отличается от равномерного распределения.
Эмпирические частости для данного распределения рассчитываются по формуле:
, (12.6)
где fj – частота результата в интервале j;
n – общее количество учащихся (наблюдений).
Теоретические частости рассчитываются по формуле:
, (12.7)
где k – количество интервалов (разрядов).
Для нашей задачи
.
Для наглядности расчеты оформим в таблицу 12.12.
Для сопоставления накопленных эмпирических и теоретических частостей находим разность между ними и заносим ее в восьмой столбец.
Определим по восьмому столбцу, какая из абсолютных величин разности является наибольшей. Она будет обозначаться dmax. В данном случае dmax=0,222
Таблица 12.12
Доля правильных ответов, % Частота Частость Накопленная частость Разность
эмпирическая теоретическая эмпирическая теоретическая эмпирическая теоретическая 0-20% 4 9 0,089 0,200 0,089 0,200 -0,111
21-40% 15 9 0,333 0,200 0,422 0,400 0,022
41-60% 18 9 0,400 0,200 0,822 0,600 0,222
61-80% 7 9 0,156 0,200 0,978 0,800 0,178
81-100% 1 9 0,022 0,200 1,000 1,000 0,000
Сумма 45 45 1 1 0,533
Теперь необходимо обратиться к таблице 9 Приложения 1 для определения критических значений dmax при n=45:
.
«Ось значимости»

Ответ
dmax=0,222, принимается Н1. Эмпирическое распределение результатов тестирования по математике учащихся городских школ отличается от равномерного распределения (при <0,05).
Задача 12.8
В выборке учащихся одиннадцатых классов районных школ проводилось тестирование по математике при помощи теста, аналогичного тесту для городских школ (задача 12.7). Распределение результатов тестирования представлено в таблице 12.13.
Таблица 12.13
Доля правильных ответов, % Количество учащихся, получивших результат в данном интервале
0-20% 5
21-40% 11
41-60% 5
61-80% 4
81-100% 0
Можно ли утверждать, что распределение результатов тестирования по математике учащихся городских школ отличается от распределения результатов учащихся районных школ?
Решение
Гипотезы к задаче
Н0:Распределение результатов тестирования по математике учащихся городских школ не отличается от распределения результатов учащихся районных школ.
Н1:Распределение результатов тестирования по математике учащихся городских школ отличается от распределения результатов учащихся районных школ.
Поскольку в данной задаче сопоставляются накопленные эмпирические частости по каждому разряду, то теоретические частости не вычисляются.
Критерий находится по формуле:
, (12.7)
где п1 – количество наблюдений в первой выборке;
n2 – количество наблюдений во второй выборке;
dmax – наибольшее из абсолютных величин разности накопленных эмпирических частостей.
По таблице 10 Приложения 1 определить, какому уровню статистической значимости соответствует полученное значение . Если >1,36, различия между распределениями можно считать достоверными. Последовательность выборок может быть выбрана произвольно.
Основные расчеты для нашей задачи оформляются в таблицу 12.14.
Максимальная разность между накопленными эмпирическими частостями составляет 0,218 и попадает на второй разряд.
Таблица 12.14
Доля пра-вильных ответов, % Эмпирические частоты Эмпирические частости Накопленные эмпирические частости Разность
f1 f2 f1* f2* f1* f2* f1*-f2*
0-20% 4 5 0,089 0,200 0,089 0,200 0,111
21-40% 15 11 0,333 0,440 0,422 0,640 0,218
41-60% 18 5 0,400 0,200 0,822 0,840 0,018
61-80% 7 4 0,156 0,160 0,978 1,000 0,022
81-100% 1 0 0,022 0 1,000 1,000 0
Сумма 45 25 =SUM(ABOVE) 1 1 В соответствии с формулой подсчитываем эмп по формуле (12.7):
.
По таблице 10 Приложения 1 определяем уровень статистической значимости полученного значения: =0,59.
«Ось значимости»

На оси указаны критические значения , соответствующие принятым уровням значимости: 0,05=1,36, 0,01=1,63.
Ответ
, принимается H0. Распределение результатов тестирования по математике учащихся городских школ не отличается от распределения результатов учащихся районных школ.
11430012573000
12.4 КРИТЕРИЙ * - УГЛОВОЕ ПРЕОБРАЗОВАНИЕ ФИШЕРА
Многофункциональные статистические критерии – это критерии, которые могут использоваться по отношению к самым разнообразным данным, выборкам и задачам. С помощью этого рода критериев можно решать задачи на сопоставление уровней исследуемого признака, сдвигов и сравнение распределений. При этом данные могут быть представлены в любой шкале, выборки могут быть независимые и связанные.
К многофункциональным статистическим критериям относятся угловое преобразование Фишера (* критерий Фишера), применяемое в случае наличия двух выборок, и биноминальный критерий m для задач с одной выборкой.
Применение многофункциональных критериев позволяет определить, какая доля наблюдений в данной выборке характеризуется интересующим нас эффектом и какая доля этим эффектом не характеризуется.
В качестве эффектов могут выступать:
качественные признаки (выражение согласия с предложением, выбор правой дорожки из двух и т.д.);
количественные признаки (уровень оценки, превышающий проходной балл, решение задачи менее чем за 20 секунд и т.п.);
соотношение значений или уровней признаков (преимущественное появление крайних признаков).
Назначение критерия *
Критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости интересующего исследователя эффекта.
Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий исследователя эффект.
Суть углового преобразования Фишера состоит в переводе процентных долей в величины центрального угла, который измеряется в радианах. Большей процентной доле будет соответствовать больший угол , меньшей доле – меньший угол, но соотношения здесь нелинейные:
,
где Р – процентная доля, выраженная в долях единицы.
При увеличении расхождения между углами 1 и 2 и увеличении численности выборок значение критерия возрастает. Чем больше величина *, тем более вероятно, что различия достоверны.
Критерии * используется часто в сочетании с критерием Колмогорова-Смирнова в целях достижения максимально точного результата.
Гипотезы
Н0:Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 не больше, чем в выборке 2.
Н1:Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 больше, чем в выборке 2.
Условия применения критерия *
Измерение может быть проведено в любой шкале.
Характеристики выборок могут быть любыми.
Ни одна из сопоставляемых долей не должна быть равной нулю.
Нижняя граница – в одной из выборок может быть только 2 наблюдения, при этом во второй должно быть не менее 30 наблюдений. Верхняя граница не определена.
Должны соблюдаться следующие соотношения в численности двух выборок:
если n1 = 2, то n2 30;
если n1 = 3, то n2 7;
если n1 = 4, то n2 5;
если n1 5, то n2 5 (любые сочетания).
Задача 12.8
Психолог провел эксперимент, в котором выяснилось, что из 20 учащихся с экспериментальной задачей справились 11 (55%) человек, а из 25 человек второй группы успешно справились с задачей 10 (40%). Различаются ли две группы учащихся по успешности решения новой экспериментальной задачи?
Решение
Гипотезы к задаче
Н0:Доля лиц, справившихся с задачей, в первой группе не больше, чем во второй.
Н1:Доля лиц, справившихся с задачей, в первой группе больше, чем во второй.
По таблице 11 Приложения 1 находим величины 1 и 2, соответствующие процентным долям в каждой группе:
1(55%)=1,671,
2(40%)=1,369.
Подсчитаем эмпирическое значение * по формуле (12.8):
, (12.8)
где1 – угол, соответствующий большей процентной доле;
2 – угол, соответствующий меньшей процентной доле;
n1 – количество наблюдений в выборке 1;
n2 – количество наблюдений в выборке 2.
В нашем случае
.
По таблице 12 Приложения 1 определяется, что = 1,007 соответствует уровню значимости >0,10.
Можно установить и критические значения , соответствующие принятым в психологии уровням статистической значимости:
.
«Ось значимости»

Ответ
= 1,007, принимается H0. Доля лиц, справившихся с задачей, в первой группе не больше, чем во второй.
Критерий Фишера с равным успехом может использоваться и при сравнении распределений количественных признаков. В данном варианте использования критерия сравнивается процент испытуемых в одной выборке, которые достигают определенного уровня значения признака, с процентом испытуемых, достигающих этого уровня, в другой выборке.
Задача 12.9
Будет ли уровень тревожности у подростков-сирот более высоким, чем у сверстников из полных семей?
Для решения этой задачи психолог проводил анализ выраженности уровня тревожности в группе сирот и в группе детей из полных семей при помощи опросника Тейлора. 40 баллов и выше рассматривались как показатель высокой тревожности (Практическая психодиагностика: Методики и тесты. – Изд-во БАХРАХ-М.2000.С.164)
Решение
В первой группе из 10 человек очень высокий уровень тревожности наблюдался у 7 испытуемых (70%), во второй группе из 13 человек он был обнаружен у 3 испытуемых (23,1%). Можно ли считать подобные различия статистически значимыми?
Гипотезы к задаче
Но:Доля лиц с высоким уровнем тревожности, в первой группе детей не больше, чем во второй.
Н1:Доля лиц с высоким уровнем тревожности, в первой группе детей больше, чем во второй.
По таблице 11 Приложения 1 определяем величины , соответствующие процентным долям «эффекта» в каждой из групп:
1(70%)=1,982 ,
2(23,1%)=1,003.
Подсчитываем по формуле (12.8):
.
Критические величины этого критерия нам уже известны:
.
«Ось значимости»

Ответ
= 2,32, принимается H1. Доля лиц с высоким уровнем тревожности, в первой группе детей больше, чем во второй.
Если выборки сопоставляются по каким-либо количественно измеренным показателям, встает проблема выявления той точки распределения, которая может использоваться как критическая при разделении всех испытуемых на тех, у кого «есть эффект», и тех, у кого «нет эффекта».
Для того чтобы максимально повысить мощность критерия *, нужно выбрать точку, в которой различия между двумя сопоставляемыми группами являются наибольшими. Точнее всего мы сможем сделать это с помощью алгоритма расчета критерия , позволяющего обнаружить точку максимального расхождения между двумя выборками.
Рассмотрим задачу, демонстрирующую использование критерия * в сочетании с критерием Колмогорова-Смирнова.
Задача 12.10
Рассмотрим решение задачи 12.8 с момента определения максимальной разности между двумя накопленными эмпирическими частостями.
Максимальная разность dmax=0,218 оказывается накопленной во второй категории результатов. Попробуем использовать верхнюю границу данной категории в качестве критерия для разделения обеих выборок на подгруппу, где «есть эффект», и подгруппу, где «нет эффекта».
Будем считать, что «эффект есть», если данный учащийся получил результат от 41 до 100%, и «эффекта нет», если данный учащийся получил от 0 до 40%.
Полученное распределение результатов представлено в таблице 12.16:
Таблица 12.16

Доля правильных ответов, % Эмпирические частоты выбора данной категории результата
Учащиеся
городских школ (n1=45) Учащиеся
районных школ (n2=25) Суммы
от 0 до 40% 19 16 35
от 41 до 100% 26 9 35
Суммы 45 25 70
Полученную таблицу мы можем использовать, проверяя разные гипотезы путем сопоставления любых двух ее ячеек.
Доля лиц, получивших результат в пределах от 41 до 100%, среди учащихся городских школ составляет 57,8% (26/45=0,578), среди учащихся районных школ – 36% (9/25=0,36).
Для применения критерия * переформулируем вопрос в нашей задаче: можно ли считать, что доля учащихся, получивших результат в пределах 41-100%, среди учащихся городских школ больше, чем среди учащихся районных школ?
Гипотезы к задаче
Н0:Доля учащихся, получивших результат в пределах 41-100%, среди учащихся городских школ не больше, чем среди учащихся районных школ.
Н1:Доля учащихся, получивших результат в пределах 41-100%, среди учащихся городских школ больше, чем среди учащихся районных школ.
По таблице определяем величины , соответствующие процентным долям «эффекта» в каждой из групп:
1(57,8%)=1,727 ,
2(36,0%)=1,287 .
Подсчитываем по формуле 12.8:
.
Критические величины этого критерия:
.
«Ось значимости»

Ответ
*эмп =1,764, Н0 отвергается. Доля учащихся, получивших результат в пределах 41-100%, среди учащихся городских школ больше, чем среди учащихся районных школ (=0,039).
114300571500
? ВОПРОСЫ И УПРАЖНЕНИЯ
Перечислите типы задач, которые решаются с помощью критерия 2 Пирсона.
Перечислите ограничения, которые накладывают на выборки данных следующие критерии: 2 Пирсона, Колмогорова-Смирнова, угловое преобразование Фишера.
В эксперименте испытуемый должен произвести выбор левого или правого стола с заданиями. В инструкции психолог подчеркивает, что задания на обоих столах одинаковы. Из 150 испытуемых правый стол выбрали 94 человека, а левый 56. Можно ли утверждать, что подобный выбор левого или правого стола равновероятен, или он обусловлен какой-либо причиной, неизвестной психологу?
110553538925500
ЗАКЛЮЧЕНИЕ
34290010350500
Изучение методов многомерного анализа – следующая ступень применения математических методов в психологии, не вошедшая в это пособие.
Можно выделить две основные причины, связанные со спецификой психологических явлений, приводящие к необходимости использовать сложные математические методы в их изучении:
многосторонность психологических явлений, которая вынуждает исследователя использовать систему показателей;
невозможность прямого замера многих психологических явлений и использование для этого косвенных показателей.
Применяя на практике систему показателей нескольких психологических явлений, психолог сталкивается с задачей объяснить и интерпретировать структуру связи психологических переменных. При этом перед исследователем могут встать следующие задачи.
Во-первых, установить факты непосредственных связей психологических явлений и их направление. Для этого используют регрессионный и дисперсионный анализы.
Регрессионный анализ, имеет своей целью, связать одну конкретную психологическую переменную c другой.
Дисперсионный анализ – система статистических методов исследования влияния независимых качественных переменных (факторов) на изучаемую зависимую количественную переменную по дисперсии.
Во-вторых, выявить факты парных связей и установить глубинные групповые взаимосвязи между психологическими явлениями. Для этого используют корреляционный, факторный, кластерный и дискриминантный анализы.
Корреляционный анализ, главное назначение которого – выявить взаимовлияние психологических переменных между собой, был описан в теме 9 данного пособия.
Факторный анализ – метод статистического анализа психологической информации, применяемый при исследовании статистически связанных признаков с целью выявления латентных факторов.
Дискриминантный анализ – метод многомерной статистики для различения (дифференциации) и диагностирования психологических явлений, отличия между которыми не очевидны.
Кластерный анализ – это математическая процедура многомерного анализа нахождения «расстояния» (меры различия) между объектами по всей совокупности параметров и изображения их отношений графически. Смысл кластеризации состоит в последовательном объединении объектов в так называемые кластеры, т.е. группы, где сходства между объектами выше, чем с другими объектами или кластерами – группами объектов.
Латентной переменной (фактором) называется величина, которую непосредственно измерить нельзя и для которой не известны уравнения связи с какими-либо явными переменными. Большинство психических явлений, безусловно, должно рассматриваться как латентные переменные. Во многих случаях мы не знаем о них ничего, кроме того, что они существуют и, обусловливая жизнедеятельность, проявляются в действиях (реакциях) индивида. Сами эти действия представляют собой явные переменные, так как их можно объективно измерить, прямо или косвенно.
Явной переменной называется величина, которую можно непосредственно или косвенно измерить. Например, можно непосредственно измерить длительность зрительно-моторной реакции секундомером. Величину процесса торможения в коре головного мозга можно косвенно измерить посредством электроэнцефалограммы. Длительность зрительно-моторной реакции, величина процесса торможения – это явные переменные. Отметим, что при косвенных измерениях переменной X через переменную Y должно быть известно в явном виде уравнение X = f(Y). Причем, явная или латентная переменная – это переменная, которую мы хотим оценить. Такую переменную называют зависимой переменной, или откликом. Переменная, используемая для оценки отклика, называется независимой переменной, или фактором.
Основная функция методов многомерного анализа – выявление скрытой, или латентной, структуры психологического явления, выступающей в качестве модели.
101409534671000
ПРИЛОЖЕНИЕ 1
Статистические таблицы критических значений
3429009525000
Таблица 1
Значение функции
(ординаты единичной нормальной кривой)
x
Сотые доли х
0
1
2
3
4
5
6
7
8
9
0,0
3989
3989
3989
3988
3986
3984
3982
3980
3977
3973
0,1
3970
3965
3961
3956
3951
3945
3939
3932
3925
3918
0,2
3910
3902
3894
3885
3876
3867
3857
3847
3836
3825
0,3
3814
3802
3790
3778
3765
3752
3739
3726
3712
3697
0,4
3683
3668
3653
3637
3621
3605
3589
3572
3555
3538
0,5
3521
3503
3485
3467
3448
3429
3410
3391
3372
3352
0,6
3332
3312
3292
3271
3251
3230
3209
3187
3166
3144
0,7
3123
3101
3079
3056
3034
3011
2989
2966
2943
2920
0,8
2897
2874
2850
2827
2803
2780
2756
2732
2709
2685
0,9
2661
2637
2613
2589
2565
2541
2516
2492
2468
2444
1,0
2420
2396
2371
2347
2323
2299
2275
2251
2227
2203
1,1
2179
2155
2131
2107
2083
2059
2036
2012
1989
1965
1,2
1942
1919
1895
1872
1849
1826
1804
1781
1758
1736
1,3
1714
1691
1669
1647
1626
1604
1582
1561
1539
1518
1,4
1497
1476
1456
1435
1415
1394
1374
1354
1334
1315
1,5
1295
1276
1257
1238
1219
1200
1182
1163
1145
1127
1,6
1109
1092
1074
1057
1040
1023
1006
0989
0973
0957
1,7
0940
0925
0909
0893
0878
0863
0848
0833
0818
0804
1,8
0790
0775
0761
0748
0734
0721
0707
0694
0681
0669
1,9
0656
0644
0632
0620
0608
0596
0584
0573
0562
0551
2,0
0540
0529
0519
0508
0498
0488
0478
0468
0459
0449
2,1
0440
0431
0422
0413
0404
0396
0387
0379
0371
0363
2,2
0355
0347
0339
0332
0325
0317
0310
0303
0297
0290
2,3
0283
0277
0270
0264
0258
0252
0246
0241
0235
0229
Таблица 1. Продолжение
x
Сотые доли х
0
1
2
3
4
5
6
7
8
9
2,4
0224
0219
0213
0208
0203
0198
0194
0189
0184
0180
2,5
0175
0171
0167
0163
0158
0154
0151
0147
0143
0139
2,6
0136
0132
0129
0126
0122
0119
0116
0113
0140
0107
2,7
0104
0101
0099
0096
0093
0091
0088
0086
0084
0081
2,8
0079
0077
0075
0073
0071
0069
0067
0065
0063
0061
2,9
0060
0058
0056
0055
0053
0051
0050
0048
0047
0046
3,0
0044
0043
0042
0040
0039
0038
0037
0036
0035
0034
3,1
0033
0032
0031
0030
0029
0028
0027
0026
0025
0025
3,2
0024
0023
0022
0022
0021
0020
0020
0019
0018
0018
3,3
0017
0017
0016
0016
0015
0015
0014
0014
0013
0013
3,4
0012
0012
0012
0011
0011
0010
0010
0010
0009
0009
3,5
0009
0008
0008
0008
0008
0007
0007
0007
0007
0006
3,6
0006
0006
0006
0005
0005
0005
0005
0005
0005
0004
3,7
0004
0004
0004
0004
0004
0004
0003
0003
0003
0003
3,8
0003
0003
0003
0003
0003
0002
0002
0002
0002
0002
3,9
0002
0002
0002
0002
0002
0002
0002
0002
0001
0001
4,0
0001
0001
0001
0001
0001
0001
0001
0001
0001
0001
Таблица 2
Критические значения выборочного коэффициента корреляции рангов

n 0,05 0,01 n 0,05 0,01 n 0,05 0,01
5 0,94 – 17 0,48 0,62 29 0,37 0,48
6 0,85 – 18 0,47 0,60 30 0,36 0,47
7 0,78 0,94 19 0,46 0,58 31 0,36 0,46
8 0,72 0,88 20 0,45 0,57 32 0,36 0,45
9 0,68 0,83 21 0,44 0,56 33 0,34 0,45
10 0,64 0,79 22 0,43 0,54 34 0,34 0,44
11 0,61 0,76 23 0,42 0,53 35 0,33 0,43
12 0,58 0,73 24 0,41 0,52 36 0,33 0,43
13 0,56 0,70 25 0,49 0,51 37 0,33 0,43
14 0,54 0,68 26 0,39 050 38 0,32 0,41
15 0,52 0,66 27 0,38 0,49 39 0,32 0,41
16 0,50 0,64 28 038 0,48 40 0,31 0,40
Таблица 3
Критические значения
выборочного коэффициента линейной корреляции rxy Пирсона

v=n-2 0,05 0,01 v=n-2 0,05 0,01 v=n-2 0,05 0,01
5 0,75 0,87 20 0,42 0,54 60 0,25 0,33
6 0,71 0,83 21 0,41 0,53 70 0,23 0,30
7 0,67 0,80 22 0,40 0,52 80 0,22 0,28
8 0,63 0,77 23 0,40 0,51 90 0,21 0,27
9 0,60 0,74 24 0,39 0,50 100 0,20 0,25
10 0,58 0,71 25 0,38 0,49 125 0,17 0,23
11 0,55 0,68 26 0,37 0,48 150 0,16 0,21
12 0,53 0,66 27 0,37 0,47 200 0,14 0,18
13 0,51 0,64 28 0,36 0,46 300 0,11 0,15
14 0,50 0,62 29 0,36 0,46 400 0,10 0,13
15 0,48 0,61 30 0,35 0,45 500 0,09 0,12
16 0,47 0,59 35 0,33 0,42 700 0,07 0,10
17 0,46 0,58 40 0,30 0,39 900 0,06 0,09
18 0,44 0,56 45 0,29 0,37 1000 0,06 0,09
19 0,43 0,55 50 0,27 0,35 Таблица 4
Критические значения
t-критерия Стьюдента при различных уровнях значимости
v v
0,05 0,01 0,001 0,05 0,01 0,001
1 12,71 63,66 64,66 18 2,10 2,88 3,92
2
4,30
9,92
31,60 19 2,09
2,86
3,88
3
3,18
5,84
12,92 20 2,09
2,85
3,85
4
2,78
4,60
8,61 21 2,08
2,83
3,82
5
2,57
4,03
6,87
22 2,07
2,82
3,79
6
2,45
3,71
5,96 23 2,07
2,81 3,77
7
2,37
3,50
5,41 24 2,06
2,80
3,75
8
2,31
3,36
5,04 25 2,06
2,79
3,73
9
2,26
3,25
4,78 26 2,06
2,78
3,71
10
2,23
3,17
4,59 27 2,05
2,77
3,69
11
2,20
3,11
4,44 28 2,05
2,76
3,67
12
2,18
3.05
4,32 29 2,05
2,76
3,66
13
2,16
3,01
4,22 30 2,04
2,75
3,65
14
2,14
2,98
4,14 40 2,02
2,70
3,55
15
2,13
2,95
4,07 60 2,00
2,66
3,46
16
2,12
2,92
4,02 120 1,98
2,62
3,37
17
2,11
2,90
3,97 1,96 2,58 3,29
Таблица 5
Критические значения критерия Q-Розенбаума
для уровней статистической значимости 0,05 и 0,01
n 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
=0,05
11 6 12 6 6 13 6 6 6 14 7 7 6 6 15 7 7 6 6 6 16 8 7 7 7 6 6 17 7 7 7 7 7 7 7 18 7 7 7 7 7 7 7 7 19 7 7 7 7 7 7 7 7 7 20 7 7 7 7 7 7 7 7 7 7 21 8 7 7 7 7 7 7 7 7 7 7 22 8 7 7 7 7 7 7 7 7 7 7 7 23 8 8 7 7 7 7 7 7 7 7 7 7 7 24 8 8 8 8 8 8 8 8 8 8 7 7 7 7 25 8 8 8 8 8 8 8 8 8 7 7 7 7 7 7 26 8 8 8 8 8 8 8 8 8 8 7 7 7 7 7 7
n 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
=0,01
11 9 12 9 9 13 9 9 9 14 9 9 9 9 15 9 9 9 9 9 16 9 9 9 9 9 9 17 10 9 9 9 9 9 9 18 10 10 9 9 9 9 9 9 19 10 10 10 9 9 9 9 9 9 20 10 10 10 10 9 9 9 9 9 9 21 11 10 10 10 9 9 9 9 9 9 9 22 11 11 10 10 10 9 9 9 9 9 9 9 23 11 11 10 10 10 10 9 9 9 9 9 9 9 24 12 11 11 10 10 10 10 9 9 9 9 9 9 9 25 12 11 11 10 10 10 10 10 9 9 9 9 9 9 9 26 12 12 11 11 10 10 10 10 10 9 9 9 9 9 9 9
Таблица 6
Критические значения критерия S-Джонкира
для количества групп (с) от трех до шести и количества испытуемых в каждой группе от двух до десяти
c n
2 3 4 5 6 7 8 9 10
=0,05
3 10 17 24 33 42 53 64 76 88
4 14 26 38 51 66 82 100 118 138
5 20 34 51 71 92 115 140 166 194
6 26 44 67 93 121 151 184 219 256
=0,01
3 25 32 45 59 74 90 106 124
4 20 34 50 71 92 115 140 167 195
5 26 48 72 99 129 162 197 234 274
6 34 62 94 130 170 213 260 309 361
Таблица 7
Критические значения критерия T Вилкоксона
для уровней статистической значимости
n n

0,05 0,01 0,05 0,01
5 0 - 28 130 101
6 2 - 29 140 110
7 3 0 30 151 120
8 5 1 31 163 130
9 8 3 32 175 140
10 10 5 33 187 151
11 13 7 34 200 162
12 17 9 35 213 173
13 21 12 36 227 185
14 25 15 37 241 198
15 30 19 38 256 211
16 35 23 39 271 224
17 41 27 40 286 238
18 47 32 41 302 252
19 53 37 42 319 266
20 60 43 43 336 281
21 67 49 44 353 296
22 75 55 45 371 312
23 83 62 46 389 328
24 91 69 47 407 345
25 100 76 48 426 362
26 110 84 49 446 379
27 119 92 50 466 397
Таблица 8
Критические значения критерия 2 для уровней статистической
значимости α 0,05 и α 0,01 при разном числе степеней свободы v
v α v α v α
0,05 0,01 0,05 0,01 0,05 0,01
1 3,841 6,635 35 49,802 57,342 69 89,391 99,227
2 5,991 9,210 36 50,998 58,619 70 90,631 100,425
3 7,815 11,345 37 52,192 59,892 71 91,670 101,621
4 9,488 13,277 38 53,384 61,162 72 92,808 102,816
5 11,070 15,086 39 54,572 62,428 73 93,945 104,010
6 12,592 16,812 40 55,758 63,691 74 95,081 105,202
7 14,067 18,475 41 56,942 64,950 75 96,217 106,393
8 15,507 20,090 42 58,124 66,206 76 97,351 107,582
9 16,919 21,666 43 59,304 67,459 77 98,484 108,771
10 18,307 23,209 44 60,481 68,709 78 99,617 109,958
11 19,675 24,725 45 61,656 69,957 79 100,749 111,144
12 21,026 26,217 46 62,830 71,201 80 101,879 112,329
13 22,362 27,688 47 64,001 72,443 81 103,010 113,512
14 23,685 29,141 48 65,171 73,683 82 104,139 114,695
15 24,996 30,578 49 66,339 74,919 83 105,267 115,876
16 26,296 32,000 50 67,505 76,154 84 106,395 117,057
17 27,587 33,409 51 68,669 77,386 85 107,522 118,236
18 28,869 34,805 52 69,832 78,616 86 108,648 119,414
19 30,144 36,191 53 70,993 79,84 87 109,773 120,591
20 31,410 37,566 54 72,153 81,069 88 110,898 121,767
21 32,671 38,932 55 73,311 82,292 89 112,022 122,942
22 33,924 40,289 56 74,468 83,513 90 113,145 124,116
23 35,172 41,638 57 75,624 84,733 91 114,268 125,289
24 36,415 42,980 58 76,778 85,950 92 115,390 126,462
25 37,652 44,314 59 77,931 87,166 93 116,511 127,633
26 38,885 45,642 60 79,082 88,379 94 117,632 128,803
27 40,113 46,963 61 80,232 89,591 95 118,752 129,973
28 41,337 48,278 62 81,381 90,802 96 119,871 131,141
29 42,557 49,588 63 82,529 92,010 97 120,990 132,309
30 43,773 50,892 64 83,675 93,217 98 122,108 133,476
31 44,985 52,191 65 84,821 94,422 99 123,225 134,642
32 46,194 53,486 66 85,965 95,626 100 124,342 135,807
33 47,400 54,776 67 87,108 96,828 34 48,602 56,061 68 88,250 98,028 Таблица 9
Критические значения dmax соответствующие уровням
статистической значимости ,05 и 0,01
при сопоставлении эмпирического распределения с теоретическим
п Максимальный модуль разности накопленных частостей dmax п Максимальный модуль разности накопленных частостей dmax
=0,05 =0,01 =0,05 =0,01
5 0,6074 0,7279 50 0,1921 0,2302
10 0,4295 0,5147 60 0,1753 0,2101
15 0,3507 0,4202 70 0,1623 0,1945
20 0,3037 0,3639 80 0,1518 0,1820
25 0,2716 0,3255 90 0,1432 30 0,2480 0,2972 100 0,1358 40 0,2147 0,2574 >100
Таблица 10
Критерий Колмогорова-Смирнова для сопоставления эмпирического распределения с теоретическим (при п>50) или двух эмпирических
распределений между собой (при п>50): уровни статистической значимости разных значений эмп

0 1 2 3 4 5 6 7 8 9
- десятичные знаки («0,» опущен)
0,3 99999 99998 99995 99991 99983 99970 99949 99917 99872 99807
0,4 99719 99603 99452 99262 99027 98741 98400 97998 97532 96998
0,5 96394 95719 94969 94147 93250 92282 91242 90134 88960 87724
0,6 86428 85077 83678 82225 80732 79201 77636 76042 74422 72781
0,7 71124 69453 67774 66089 64402 62717 61036 59363 57700 56050
0,8 54414 52796 51197 49619 48063 46532 45026 43545 42093 40668
0,9 39273 37907 36571 35266 33992 32748 31536 30356 29206 28087
1,0 27000 25943 24917 23922 22957 22021 21114 20236 19387 18566
1,1 17772 17005 16264 15550 14861 14196 13556 12^39 12345 11774
1,2 11225 10697 10190 09703 09235 08787 08357 07944 07550 07171
1,3 06809 06463 06132 05815 05513 05224 04949 04686 04435 04196
1,4 03968 03751 03545 03348 03162 02984 02815 02655 02503 02359
1,5 02222 02092 01969 01852 01742 01638 01539 01446 01357 01274
1,6 01195 01121 01051 00985 00922 00864 00808 00756 00707 00661
1,7 00618 00577 00539 00503 00469 00438 00408 00380 00354 00330
1,8 00307 00285 00265 00247 00229 00213 00198 00186 00170 00158
1,9 00146 00136 00126 00116 00108 00100 00092 00085 00079 00073
2,0 00067 00062 00057 00053 00048 00045 00041 00038 00035 00032
2,1 00030 00027 00025 00023 00021 00019 00018 00016 00015 00014
2,2 00013 00011 00010 00010 00009 00008 00007 00007 00006 00006
2,3 00005 00005 00004 00004 00004 00003 00003 00003 00002 00002
2,4 00002 00002 00002 00001 00001 00001 00001 00001 00001 00001
Таблица 11
Таблицы для углового преобразования Фишера
Величины угла (в радианах) для разных процентных долей:
=2arsinP
%
доля %, последний десятичный знак
0 1 2 3 4 5 6 7 8 9
=2arsinP
0,0 0,000 0,020 0,028 0,035 0,040 0,045 0,049 0,053 0,057 0,060
0,1 0,063 0,066 0,069 0,072 0,075 0,077 0,080 0,082 0,085 0,087
0,2 0,089 0,092 0,094 0,096 0,098 0,100 0,102 0,104 0,106 0,108
0,3 0,110 0,111 0,113 0,115 0,117 0,118 0,120 0,122 0,123 0,125
0,4 0,127 0,128 0,130 0,131 0,133 0,134 0,136 0,137 0,139 0,140
0,5 0,142 0,143 0,144 0,146 0,147 0,148 0,150 0,151 0,153 0,154
0,6 0,155 0,156 0,158 0,159 0,160 0,161 0,163 0,164 0,165 0,166
0,7 0,168 0,169 0,170 0,171 0,172 0,173 0,175 0,176 0,177 0,178
0,8 0,179 0,180 0,182 0,183 0,184 0,185 0,186 0,187 0,188 0,189
0,9 0,190 0,191 0,192 0,193 0,194 0,195 0,197 0,197 0,198 0,199
1 0,200 0,210 0,220 0,229 0,237 0,246 0,254 0,262 0,269 0,277
2 0,284 0,291 0,298 0,304 0,311 0,318 0,324 0,330 0,336 0,342
3 0,348 0,354 0,360 0,365 0,371 0,376 0,382 0,387 0,392 0,398
4 0,403 0,408 0,413 0,418 0,423 0,428 0,432 0,437 0,442 0,446
5 0,451 0,456 0,460 0,465 0,469 0,473 0,478 0,482 0,486 0,491
6 0,495 0,499 0,503 0,507 0312 0,516 0,520 0,524 0,528 0,532
7 0,536 0,539 0343 0,547 0,551 0,555 0,559 0,562 0,566 0,570
8 0,574 0,577 0,581 0,584 0,588 0,592 0,595 0,599 0,602 0,606
9 0,609 0,613 0,616 0,620 0,623 0,627 0,630 0,633 0,637 0,640
10 0,644 0,647 0,650 0,653 0,657 0,660 0,663 0,666 0,670 0,673
11 0,676 0,679 0,682 0,686 0,689 0,692 0,695 0,698 0,701 0,704
12 0,707 0,711 0,714 0,717 0,720 0,723 0,726 0,729 0,732 0,735
13 0,738 0,741 0,744 0,747 0,750 0,752 0,755 0,758 0,761 0,764
14 0,767 0,770 0,773 0,776 0,778 0,781 0,784 0,787 0,790 0,793
15 0,795 0,798 0,801 0,804 0,807 0,809 0,812 0,815 0,818 0,820
16 0,823 0,826 0,828 0,831 0,834 0,837 0,839 0,842 0,845 0,847
17 0,850 0,853 0,855 0,858 0,861 0,863 0,866 0,868 0,871 0,874
18 0,876 0,879 0,881 0,884 0,887 0,889 0,892 0,894 0,897 0,900
19 0,902 0,905 0,907 0,910 0,912 0,915 0,917 0,920 0,922 0,925
20 0,927 0,930 0,932 0,935 0,937 0,940 0,942 0,945 0,947 0,950
Таблица 11. Продолжение
%
доля %, последний десятичный знак
0 1 2 3 4 5 6 7 8 9
=2arsinP
21 0,952 0,955 0,957 0,959 0,962 0,964 0,967 0,969 0,972 0,974
22 0,976 0,979 0,981 0,984 0,986 0,988 0,991 0,993 0,996 0,998
23 1,000 1,003 1,005 1,007 1,010 1,012 1,015 1,017 1,019 1,022
24 1,024 1,026 1,029 1,031 1,033 1,036 1,038 1,040 1,043 1,045
25 1,047 1,050 1,052 1,054 1,056 1,059 1,061 1,063 1,066 1,068
26 1,070 1,072 1,075 1,077 1,079 1,082 1,084 1,086 1,088 1,091
27 1,093 1,095 1,097 1,100 1,102 1,104 1,106 1,109 1,111 1,113
28 1,115 1,117 1,120 1,120 1,124 1,126 1,129 1,131 1,133 1,135
29 1,137 1,140 1,142 1,144 1,146 1,148 1,151 1,153 1,155 1,157
30 1,159 1,161 1,164 1,166 1,168 1,170 1,172 1,174 1,177 1,179
31 1,182 1,183 1,185 1,187 1,190 1,192 1,194 1,196 1,198 1,200
32 1,203 1,205 1,207 1,209 1,211 1,213 1,215 1,217 1,220 1,222
33 1,224 1,226 1,228 1,230 1,232 1,234 1,237 1,239 1,241 1,243
34 1,245 1,247 1,249 1,251 1,254 1,256 1,258 1,260 1,262 1,264
35 1,266 1,268 1,270 1,272 1,274 1,277 1,279 1,281 1,283 1,285
36 1,287 1,289 1,291 1,293 1,295 1,297 1,299 1,302 1,304 1,306
37 1,308 1,310 1,312 1,314 1,316 1,318 1,320 1,322 1,324 1,326
38 1,328 1,330 1,333 1,335 1,337 1,339 1,341 1,343 1,345 1,347
39 1,349 1,351 1,353 1,355 1,357 1,359 1,361 1,363 1,365 1,367
40 1,369 1,371 1,374 1,376 1,378 1,380 1,382 1,384 1,386 1,388
41 1,390 1,392 1,394 1,396 1,398 1,400 1,402 1,404 1,406 1,408
42 1,410 1,412 1,414 1,416 1,418 1,420 1,422 1,424 1,426 1,428
43 1,430 1,432 1,434 1,436 1,438 1,440 1,442 1,444 1,446 1,448
44 1,451 1,453 1,455 1,457 1,459 1,461 1,463 1,465 1,467 1,469
45 1,471 1,473 1,475 1,477 1,479 1,481 1,483 1,485 1,487 1,489
46 1,491 1,493 1,495 1,497 1,499 1,501 1,503 1,505 1,507 1,509
47 1,511 1,513 1,515 1,517 1,519 1,521 1,523 1,525 1527 1329
48 1,531 1,533 1,535 1,537 1,539 1341 1,543 1,545 1547 1,549
49 1,551 1,553 1,555 1,557 1,559 1,561 1,563 1,565 1,567 1,569
50 1,571 1,573 1,575 1,577 1,579 1,581 1,583 1,585 1387 1389
51 1,591 1,593 1,595 1,597 1,599 1,601 1,603 1,605 1,607 1,609
52 1,611 1,613 1,615 1,617 1,619 1,621 1,623 1,625 1,627 1,629
53 1,631 1,633 1,635 1,637 1,639 1,641 1,643 1,645 1,647 1,649
54 1,651 1,653 1,655 1,657 1,659 1,661 1,663 1,665 1,667 1,669
55 1,671 1,673 1,675 1,677 1,679 1,681 1,683 1,685 1,687 1,689
Таблица 11. Продолжение
%
доля %, последний десятичный знак
0 1 2 3 4 5 6 7 8 9
=2arsinP
56 1,691 1,693 1,695 1,697 1,699 1,701 1,703 1,705 1,707 1,709
57 1,711 1,713 1,715 1,717 1,719 1,721 1,723 1,725 1,727 1,729
58 1,731 1,734 1,736 1,738 1,740 1,742 1,744 1,746 1,748 1,750
59 1,752 1,754 1,756 1,758 1,760 1,762 1,764 1,766 1,768 1,770
60 1,772 1,774 1,776 1,778 1,780 1,782 1,784 1,786 1,789 1,791
61 1,793 1,795 1,797 1,799 1,801 1,803 1,805 1,807 1,809 1,811
62 1,813 1,815 1,817 1,819 1,821 1,823 1,826 1,828 1,830 1,832
63 1,834 1,836 1,838 1,840 1,842 1,844 1,846 1,848 1,850 1,853
64 1,855 1,857 1,859 1,861 1,863 1,865 1,867 1,869 1,871 1,873
65 1,875 1,878 1,880 1,882 1,884 1,886 1,888 1,890 1,892 1,894
66 1,897 1,899 1,901 1,903 1,905 1,907 1,909 1,911 1,913 1,916
67 1,918 1,920 1,922 1,924 1,926 1,928 1,930 1,933 1,935 1,937
68 1,939 1,941 1,943 1,946 1,948 1,950 1,952 1,954 1,956 1,958
69 1,961 1,963 1,965 1,967 1,969 1,971 1,974 1,976 1,978 1,980
70 1,982 1,984 1,987 1,989 1,991 1,993 1,995 1,998 2,000 2,002
71 2,004 2,006 2,009 2,011 2,013 2,015 2,018 2,020 2,022 2,024
72 2,026 2,029 2,031 2,033 2,035 2,038 2,040 2,042 2,044 2,047
73 2,049 2,051 2,053 2,056 2,058 2,060 2,062 2,065 2,067 2,069
74 2,071 2,074 2,076 2,078 2,081 2,083 2,085 2,087 2,090 2,092
75 2,094 2,097 2,099 2,101 2,104 2,106 2,108 2,111 2,113 2,115
76 2,118 2,120 2,122 2,125 2,127 2,129 2,132 2,134 2,136 2,139
77 2,141 2,144 2,146 2,148 2,151 2,153 2,156 2,158 2,160 2,163
78 2,165 2,168 2,170 2,172 2,175 2,177 2,180 2,182 2,185 2,187
79 2,190 2,192 2,194 2,197 2,199 2,202 2,204 2,207 2,209 2,212
80 2,214 2,217 2,219 2,222 2,224 2,227 2,229 2,231 2,234 2,237
81 2,240 2,242 2,245 2,247 2,250 2,252 2255 2,258 2,260 2,263
82 2,265 2,268 2,271 2,273 2,276 2,278 2,281 2,284 2,286 2,289
83 2,292 2,294 2,297 2,300 2,302 2,305 2,308 2,3Ю 2,313 2316
84 2319 2,321 2,324 2,327 2,330 2,332 2,335 2,338 2,341 2,343
83 2,346 2,349 2,352 2,355 2,357 2,360 2,363 2,366 2,369 2,372
86 2375 2,377 2,380 2383 2,386 2,389 2,392 2395 2,398 2,401
87 2,404 2,407 2,4Ю 2,413 2,416 2,419 2,422 2,425 2,428 2,431
88 2,434 2,437 2,440 2,443 2,447 2,450 2,453 2,456 2,459 2,462
89 2,465 2,469 2,472 2,475 2,478 2,482 2,485 2,488 2,491 2,495
90 2,498 2301 2,505 2,508 2312 2315 2,518 2,522 2,525 2,529
Таблица 11. Продолжение
%
доля %, последний десятичный знак
0 1 2 3 4 5 6 7 8 9
=2arsinP
91 2,532 2,536 2,5Э9 2,543 2,546 2,550 1554 2,557 2,561 2,564
92 2,568 2,572 2,575 2,579 2,583 2,587 2391 2,594 2,598 2,602
93 2,606 2,610 2,614 2,618 2,622 2626 2,630 2,634 2,638 2,642
94 2,647 2,651 2,655 2,659 2,664 2,668 2,673 2,677 2,681 2,686
95 2,691 2,295 2,700 2,705 2,709 2,714 2,719 2,724 2,729 2,734
96 2,739 2,744 2,749 2,754 2,760 2,765 2,771 2,776 2,782 2,788
97 2,793 2,799 2,805 2,811 2,818 2,824 2,830 2,837 2,844 2,851
98 2,858 2,865 2,872 2,880 2,888 2,896 2,904 2,913 2,922 2,931
99,0 2,941 2,942 2,943 2,944 2,945 2,946 2,948 2,949 2,950 2,951
99,1 2,952 2,953 2,954 2,955 2,956 2,957 2,958 2,959 2,960 2,961
99,2 2,963 2,964 2,965 2,966 2,967 2,968 2,969 2,971 2,972 2,973
99,3 2,974 2,975 2,976 2,978 2,979 2,980 2,981 2,983 2,984 2,985
99,4 2,987 2,988 2,989 2,990 2,992 2,993 2,995 2,996 2,997 2,999
99,5 3,000 3,002 3,003 3,004 3,006 3,007 3,009 3,010 3,012 3,013
99,6 3,015 3,017 3,018 3,020 3,022 3,023 3,025 3,027 3,028 3,030
99,7 3,032 3,034 3,036 3,038 3,040 3,041 Э,044 3,046 3,048 3,050
99,8 3,052 3,054 3,057 3,059 3,062 3,064 3,067 3,069 3,072 3,075
99,9 3,078 3,082 3,085 3,089 3,093 3,097 3,101 3,107 3,113 3,122
100 3,142 Таблица 12
Уровни статистической значимости разных значений критерия * Фишера
равно или меньше (последний десятичный знак)
равно или меньше 0 1 2 3 4 5 6 7 8 9
0,00 2,91 2,81 2,70 2,62 2,55 2,49 2,44 2,39 2,35 0,01 2,31 2,28 2,25 2,22 2,19 2,16 2,14 2,11 2,09 2,07
0,02 2,05 2,03 2,01 1,99 1,97 1,96 1,94 1,92 1,91 1,89
0,03 1,88 1,86 1,85 1,84 1,82 1,81 1,80 1,79 1,77 1,76
0,04 1,75 1,74 1,73 1,72 1,71 1,70 1 ,68 1,67 1,66 1,65
0,05 1,64 1,64 1,63 1,62 1,61 1,60 1,59 1,58 1,57 1,56
0,06 136 1,55 1,54 1,53 1,52 1,52 1,51 1,50 1,49 1,48
0,07 1,48 1,47 1,46 1,46 1,45 1,44 1,43 1,43 1,42 1,41
0,08 1,41 1,40 139 1,39 1,38 137 1,37 136 1,36 1,35
0,09 134 1,34 1,33 132 132 131 131 1,30 1,30 1,29
0,10 1,29 922655472186000
ПРИЛОЖЕНИЕ 2
Лабораторные работы по дисциплине
«Математические методы в психологии»
4572002349500
Лабораторная работа №1
Представление данных
Задание 1. Данные статистического ряда упорядочить (сортировать) и проранжировать.
Задание 2. Определить оптимальное количество интервалов, ширину интервалов, разбить ряд на интервалы, найти середину каждого интервала, частоту и частость показателей в интервалах, построить гистограмму и полигон распределения.
xi Варианты
1 2 3 4 5 6 7 8 9 10 11 12
x1 11 11 10 12 13 13 13 14 14 15 15 16
x2 11 11 4,9 12 12 1 2 14 14 15 15 15
x3 6 7 7 8 8 9 9 9 9,9 10 11 11
x4 1,4 2 11 3 3 4 4 6 5 5 6 6
x5 3 4 5 5 5 5 6 6 7 7 8 8
x6 8 8 5 9 9 9,7 10,6 11 11 11 12 12
x7 2 2 11 3,0 3 4 4 4,7 5 6 6 6
x8 2 2,4 15 3 4 4 5 5 5 6 6 7
x9 7,7 8 9 9 9 10 11 11 11,0 12 12 12
x10 11 12 12 12 12,9 13 14 14,1 15 15 15,4 16
x11 9 10 10 11 11 11 12 12 13 13 14 14
x12 2 2 2 3 3 4 4 5 5 3 2 2
x13 8 9 9 10 10 10 8 8 12 12 13 11
x14 8 8,9 9 10 8 11 7 11 11,9 12 12,7 13
x15 3 3 3,9 4 1 2 11 12 12 13 10 10
x16 10 10 11 11 6 11 2 12 13 13
x17 6 9 10 13 2 10 10
x18 9 6 6 2
Рекомендации для выполнения лабораторной работы на компьютере:
для нахождения ранга показателя использовать функцию в среде Excel РАНГ;
для нахождения частоты показателей использовать функцию в среде Excel ЧАСТОТА.
Лабораторная работа №2
Графическое представление данных
Задание. Работники 7 цехов машиностроительного завода отвечали на вопрос «В какой степени Вас устраивает Ваша теперешняя работа?». Ответы должны были даваться согласно следующим альтернативам:
- работой вполне доволен;
- скорее доволен, чем не доволен;
- трудно сказать, не знаю, безразлично;
- скорее недоволен, чем доволен;
- совершенно недоволен работой.
Распределение ответов представлено в таблице по вариантам. Подсчитать количество работников, участвующих в анкетировании по каждому цеху. Построить:
обычную гистограмму распределения ответов, гистограмму с накоплением, нормированную гистограмму, отражающие распределения результатов по каждому цеху;
круговую диаграмму по общему распределению ответов;
диаграмму на выбор.
Цех Вариант 1  Вариант 2 Вариант 3
Альтернативы
ответов Альтернативы
ответов Альтернативы
ответов
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
№1 12 66 48 66 24 25 26 27 48 22 4 22 16 22 21
№2 60 42 72 72 50 32 62 62 72 14 20 14 24 24 17
№3 26 48 70 54 16 38 60 44 70 16 10 16 28 18 13
№4 48 60 54 54 38 50 44 44 54 20 16 20 18 18 12
№5 60 72 96 60 50 62 70 50 96 24 20 24 32 20 25
№6 42 63 84 55 32 53 74 45 84 21 14 21 28 20 12
№7 72 54 60 78 62 44 50 68 60 18 24 18 20 26 10
Цех Вариант 4  Вариант 5 Вариант 6
Альтернативы
ответов Альтернативы
ответов Альтернативы
ответов
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
№1 16 22 12 66 24 66 24 25 26 27 85 80 25 24 27
№2 24 24 60 42 50 72 50 32 62 62 70 24 40 21 59
№3 28 18 26 48 16 54 16 38 60 44 80 45 90 12 43
№4 18 18 48 60 38 54 38 50 44 44 98 90 90 14 51
№5 32 20 60 72 50 60 50 62 70 50 74 16 10 14 59
№6 28 20 42 63 32 55 32 53 74 45 10 25 17 15 47
№7 20 26 72 54 62 78 62 44 50 68 90 99 11 21 67
Цех Вариант 7  Вариант 8 Вариант 9
Альтернативы
ответов Альтернативы
ответов Альтернативы
ответов
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
№1 12 66 24 66 24 24 25 26 27 85 80 26 27 66 66
№2 60 42 50 72 50 50 32 62 62 70 24 62 62 42 42
№3 26 48 16 54 16 16 38 60 44 80 45 60 44 48 48
№4 48 60 38 54 38 38 50 44 44 98 90 44 44 60 60
№5 60 72 50 60 50 50 62 70 50 74 16 70 50 72 72
№6 42 63 32 55 32 32 53 74 45 10 25 74 45 63 63
№7 72 54 62 78 62 62 44 50 68 90 99 50 68 54 54
Цех Вариант 10 Вариант 11 Вариант 12
Альтернативы
ответов Альтернативы
ответов Альтернативы
ответов
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
№1 20 85 80 25 24 27 63 51 58 14 12 66 24 25 27
№2 10 70 24 40 21 59 47 67 66 12 60 42 50 32 59
№3 50 80 45 90 12 43 49 69 55 14 26 48 16 38 43
№4 80 98 90 90 14 51 57 46 54 12 48 60 38 50 51
№5 46 74 16 10 14 59 66 83 53 10 60 72 50 62 59
№6 70 10 25 17 15 47 61 75 64 11 42 63 32 53 47
№7 12 90 99 11 21 67 55 59 56 8 72 54 62 44 67
Рекомендации для выполнения лабораторной работы на компьютере:
вышеперечисленные графики построить с помощью диалогового окна Мастера диаграмм в Excel.
Лабораторная работа № 3
Описательная статистика
Задание. Для статистического ряда из лабораторной работы №1 найти числовые характеристики: сумму показателей, среднее, максимальное и минимальное значения, медиану, моду, количество элементов больше среднего значения, дисперсию, стандартное отклонение, асимметрию и эксцесс.
Рекомендации для выполнения лабораторной работы на компьютере:
числовые характеристики статистического ряда найти с использованием статистических функций диалогового окна Мастер функций в Excel;
найти меры описательной статистики с использованием инструмента «Описательная статистика» встроенного пакета Анализ данных в Excel .
Лабораторная работа №4
Корреляционный анализ
Задание для вариантов 1-6. Выборке студентов предлагалось ответить на вопрос: «Какой уровень развития каждого из перечисленных качеств необходим для преподавателя вуза?». Оценка производилась по 10-бальной шкале. Параллельно с этим обследовалась выборка из преподавателей. Индивидуальная диагностика производилась по тому же набору личностных качеств, который предъявлялся выборке студентов.
В таблице представлены средние значения, полученные для каждого из качеств в выборке студентов («эталонный ряд»), и индивидуальные значения одного из преподавателей.
Определить, насколько индивидуальный профиль преподавателя Н-ва коррелирует с эталонным профилем.
Данные для вариантов 1-6 (Х1 – усредненные эталонные оценки, Х2 – индивидуальные показатели преподавателя Н-ва):
№ Наименования качеств Варианты
1 2 3 4 5 6
Х1 Х2 Х1 Х2 Х1 Х2 Х1 Х2 Х1 Х2 Х1 Х2
1 Профессионализм 9,45 8,45 9,55 8,55 7,16 8,65 9,75 8,75 9,85 9,85 9,95 6,8
2 Способность к творчеству 9,41 7,55 9,51 7,65 7,22 7,75 9,71 7,85 9,81 9,39 8,23 6,23
3 Умение общаться 8,99 9,45 9,09 9,55 7,32 9,65 9,29 9,75 9,39 8,85 8,99 7,85
4 Самокритичность 8,64 8,15 8,74 8,25 7,76 8,8 9,07 8,45 9,04 8,55 7,23 9,56
5 Выдержка 8,77 7,12 8,87 7,22 8,65 7,56 8,94 9,45 8,56 7,95 8,23 8,23
6 Общий уровень культуры 8,45 6,65 8,55 6,75 8,84 8,56 8,75 6,95 8,85 7,55 9,12 6,89
7 Энергия, активность 7,56 8,99 7,66 9,09 8,97 9,19 7,86 9,29 7,96 7,52 8,5 8,96
8 Гибкость поведения 7,12 7,12 7,22 7,22 9,19 7,32 7,42 7,42 7,52 7,52 8,6 9,25
9 Целеустремленность 7,02 6,3 7,12 6,4 9,61 6,5 7,32 7,5 7,42 7,05 9,5 9,45
10 Ответственность 6,96 7,15 7,06 7,25 9,65 7,35 7,26 7,45 7,36 6,7 7,1 8,11
11 Самокритичность 8,56 7,23 7,56 8,23 8,12 9,23 8,12 7,14 6,14 8,96 9,23 8,12
12 Порядочность 9,23 8,14 8,56 9,45 8,25 8,46 9,75 8,23 7,23 8,64 9,16 8,95
Задание для варианта 7-12. В исследовании, моделирующем деятельность шофера, группе испытуемых на тренажере было предложено пройти трудный участок дороги. Связано ли количество аварийных ситуаций, допущенных испытуемыми, со стажем вождения автомобиля?
Данные для вариантов 7-12 (Х1 – количество аварийных ситуаций, Х2 – стаж вождения автомобиля):

№ Наименования качеств Варианты
1 2 3 4 5 6
Х1 Х2 Х1 Х2 Х1 Х2 Х1 Х2 Х1 Х2 Х1 Х2
1 Т.А. 1 10 3 3,5 0 3,5 3 15 1 15 0 10
2 П.А. 2 15 5 6,5 1 2,5 5 12 2 10 0 15
3 Ч.И. 5 2,5 0 13 1 6,3 0 10 5 1 1 2,5
4 Ц.А. 3 4,5 1 10 2 1,2 1 8,9 3 2 1 4,5
5 С.А. 1 10 2 12 2 12 2 6,3 1 9 1 10
6 К.Е. 2 8,9 5 5 2 5 5 5 2 8 2 8,9
7 В.А. 0 9 6 7 3 4,2 6 4,2 0 7 2 9
8 П.Р. 0 8 2 10 5 10 2 3,5 0 4,5 3 8
9 Ф.Р 1 7 1 8,9 5 8,9 1 2,5 1 2,5 5 2
10 О.Л. 6 2 2 15 6 15 2 1,2 6 2 6 1
11 Л.П 1 10 3 3,5 0 3,5 3 15 1 15 0 10
12 Н.К. 2 15 5 2,5 1 2,5 5 12 2 10 0 15
13 Д.В. 5 2,5 0 16 1 6,3 0 10 5 4 1 12,5
14 И.С. 7 15 4 7 1 12 7 1 6 4 2 11
Рекомендации для выполнения лабораторных работ на компьютере:
коэффициент корреляции Спирмена найти с использованием формул в Excel;
коэффициент корреляции Пирсона найти с использованием статистической функции диалогового окна Мастер функций – Пирсон;
найти коэффициент корреляции с использованием инструмента «Корреляция» встроенного пакета Анализ данных в Excel.
Лабораторная работа №5
Оценка достоверности различий между двумя
выборками по уровню признака
Задание для вариантов 1-6. В исследовании изучалась проблема психологического барьера при устройстве на работу у выпускников технических и гуманитарных специальностей. В эксперименте участвовали n1 выпускников технических специальностей и n2 – гуманитарных. Испытуемые должны были оценить по 100 бальной шкале интенсивность внутреннего сопротивления, которое им приходится преодолеть, чтобы устроиться на работу. В таблице приведены показатели интенсивности сопротивления, выраженные в баллах.
Можно ли утверждать, что выпускникам гуманитарных специальностей приходится преодолевать субъективно более мощное сопротивление?
Данные для вариантов 1-6 (Х1 – данные по техническим специальностям, Х2 – данные по гуманитарным специальностям):
n1,
n2 Варианты
1 2 3 4 5 6
Х1 Х2 Х1 Х2 Х1 Х2 Х1 Х2 Х1 Х2 Х1 Х2
1 81 70 82 72 84 71 63 73 80 76 83 72
2 80 66 81 68 83 67 63 69 79 78 82 68
3 73 66 74 68 76 67 61 69 73 66 75 68
4 72 63 73 65 75 64 60 66 72 63 74 65
5 72 63 73 65 75 64 54 66 72 63 74 65
6 69 61 70 63 72 62 47 64 69 61 71 63
7 69 60 70 62 72 61 43 63 68 60 71 62
8 65 54 66 56 68 55 41 57 68 54 67 56
9 65 47 66 49 68 48 40 50 65 47 67 49
10 62 43 63 45 65 44 39 46 62 43 64 45
11 60 41 61 43 63 42 38 44 60 41 62 43
12 54 40 55 42 57 41 38 43 54 40 56 42
13 54 39 55 41 57 40 35 42 54 39 56 41
14 43 38 44 40 46 39 30 41 43 38 45 40
15 30 38 31 40 33 39 27 41 30 38 32 40
16 26 35 27 37 29 36 25 38 26 35 28 37
17 26 30 27 32 31 33 26 30 32
18 27 24 29 28 30 27 29
19 25 27 26 28 25 27
20 23 25 24 26 23 25
21 17 19 18 20 17 19
21 10 10 11 10 10 12
23 9 9 9 9 Задание для вариантов 7-12. В исследовании изучалась проблема различия уровня тревожности двух групп детей: из благополучных и неблагополучных семей. В эксперименте участвовали n1 детей из благополучных семей и n2 – из неблагополучных. В таблице приведены показатели уровня тревожности, выраженные в 100-бальной шкале. Можно ли утверждать, что уровень тревожности детей из благополучных семей отличается от уровня тревожности детей из неблагополучных семей?
Данные для вариантов 7-12 (Х1 – данные по детям из неблагополучных семей, Х2 – данные по детям из благополучных семей):
n1,
n2 Варианты
7 8 9 10 11 12
Х1 Х2 Х1 Х2 Х1 Х2 Х1 Х2 Х1 Х2 Х1 Х2
1 83 70 80 72 63 71 84 73 82 76 81 72
2 82 66 79 68 63 67 83 69 81 78 80 68
3 75 66 73 68 61 67 76 69 74 66 73 68
4 74 63 72 65 60 64 75 66 73 63 72 65
5 74 63 72 65 54 64 75 66 73 63 72 65
6 71 61 69 63 47 62 72 64 70 61 69 63
7 71 60 68 62 43 61 72 63 70 60 69 62
8 67 54 68 56 41 55 68 57 66 54 65 56
9 67 47 65 49 40 48 68 50 66 47 65 49
10 64 43 62 45 39 44 65 46 63 43 62 45
11 62 41 60 43 38 42 63 44 61 41 60 43
12 56 40 54 42 38 41 57 43 55 40 54 42
13 56 39 54 41 35 40 57 42 55 39 54 41
14 45 38 43 40 30 39 46 41 44 38 43 40
15 32 38 30 40 27 39 33 41 31 38 30 40
16 28 35 26 37 25 36 29 38 27 35 26 37
17 30 26 32 31 33 27 30 26 32
18 27 29 28 30 24 27 29
19 25 27 26 28 25 27
20 23 25 24 26 23 25
21 17 19 18 20 17 19
21 10 10 11 10 10 12
23 9 9 9 Рекомендации для выполнения лабораторных работ на компьютере:
при решении задачи использовать команду Сортировка в меню Данные в среде Excel.
Лабораторная работа №6
Оценка достоверности различий между несколькими выборками по уровню признака
Задание. В выборке из 28 мужчин-руководителей проводилось обследование с помощью 16-факторного личностного опросника Р.Б. Кетелла (форма А). В таблице приведены индивидуальные значения испытуемых по фактору N. Данные сгруппированы по возрастным группам. Можно ли утверждать, что есть определенная тенденция изменения значений фактора N при переходе от группы к группе?
Вариант 1  Вариант 2    Вариант 3 
Гр.1 Гр.2 Гр.3 Гр.4 Гр.1 Гр.2 Гр.3 Гр.4 Гр.1 Гр.2 Гр.3 Гр.4
4 22 16 22 12 66 48 66 24 25 26 27
20 14 24 24 60 42 72 72 50 32 62 62
10 16 28 18 26 48 70 54 16 38 60 44
16 20 18 18 48 60 54 54 38 50 44 44
20 24 32 20 60 72 96 60 50 62 70 50
14 21 28 20 42 63 84 55 32 53 74 45
24 18 20 26 72 54 60 78 62 44 50 68
Вариант 4 Вариант 5 Вариант 6
Гр.1 Гр.2 Гр.3 Гр.4 Гр.1 Гр.2 Гр.3 Гр.4 Гр.1 Гр.2 Гр.3 Гр.4
20 110 80 105 39 129 99 124 27 63 51 58
100 70 120 120 119 89 139 139 59 47 67 66
50 80 120 90 69 99 139 109 43 49 69 55
80 98 90 90 99 117 100 108 51 57 46 54
100 120 160 100 119 139 179 114 59 66 83 53
70 105 140 100 89 124 159 119 47 61 75 64
120 90 100 115 139 109 119 134 67 55 59 56
Вариа7 Вариант 8 Вариант 9
Гр.1 Гр.2 Гр.3 Гр.4 Гр.1 Гр.2 Гр.3 Гр.4 Гр.1 Гр.2 Гр.3 Гр.4
16 22 12 66 24 25 27 63 51 58 3 48
24 24 60 42 50 32 59 47 67 66 19 25
28 18 26 48 16 38 43 49 69 55 37 21
18 18 48 60 38 50 51 57 46 54 23 17
32 20 60 72 50 62 59 66 83 53 19 41
28 20 42 63 32 53 47 61 75 64 25 18
20 26 72 54 62 44 67 55 59 56 15 21
Вариант 10 Вариант 11 Вариант 12
Гр.1 Гр.2 Гр.3 Гр.4 Гр.1 Гр.2 Гр.3 Гр.4 Гр.1 Гр.2 Гр.3 Гр.4
24 15 16 17 3 48 35 41 39 129 99 124
40 22 52 70 19 25 15 12 119 89 139 139
6 28 50 34 37 21 19 21 69 99 139 109
28 40 34 34 23 17 12 20 99 117 100 108
40 25 26 27 19 41 57 26 119 139 179 114
22 43 64 35 25 18 11 29 89 124 159 119
52 34 40 58 15 21 19 10 139 109 119 134
Лабораторная работа №7
Оценка достоверности сдвига
Задание. Психолог проводит с младшими школьниками коррекционную работу по формированию навыков внимания, используя для оценки результатов корректурную пробу. Задача состоит в том, чтобы определить, будет ли уменьшаться количество ошибок внимания у младших школьников после специальных коррекционных упражнений.
В таблице представлены соответствующие экспериментальные данные до и после проведения коррекции.
Код имени участника 1 вариант 2 вариант 3 вариант 4 вариант
Первое измере-ние Второе измере-ние Первое измере-ние Второе измере-ние Первое измере-ние Второе измере-ние Первое измере-ние Второе измере-ние
1 6 7 5 6 5 7 6 5
2 3 5 1 4 4 5 3 1
3 4 8 4 7 5 6 4 4
4 4 6 4 5 5 5 4 4
5 6 4 4 5 4 5 6 4
6 6 8 5 7 3 6 6 5
7 3 7 5 8 2 5 3 5
8 6 5 5 7 3 5 6 5
9 6 7 5 5 5 5 6 5
10 5 7 6 7 5 6 5 6
11 6 5 6 4 3 3 6 6
12 6 7 3 6 4 5 13 4 5 3 3 14 4 6 Код имени участника 5 вариант 6 вариант 7 вариант 8 вариант
Первое измере-ние Второе измере-ние Первое измере-ние Второе измере-ние Первое измере-ние Второе измере-ние Первое измере-ние Второе измере-ние
1 8 9 7 8 7 9 8 7
2 5 7 3 6 6 7 5 3
3 6 10 6 9 7 8 6 6
4 6 8 5 6 7 7 6 6
5 8 6 6 7 7 5 7 6
6 7 9 7 9 5 8 8 5
7 5 9 7 10 4 7 5 6
8 8 7 7 9 5 7 6 7
9 9 9 7 7 7 6 8 7
10 7 9 8 9 6 8 7 8
11 8 6 7 6 5 5 8 8
12 7 9 5 8 6 7 8 5
13 7 8 4 4 6 3
14 5 6 Код имени участника 9 вариант 10 вариант 11 вариант 12 вариант
Первое измере-ние Второе измере-ние Первое измере-ние Второе измере-ние Первое измере-ние Второе измере-ние Первое измере-ние Второе измере-ние
1 7 8 6 7 6 8 7 6
2 4 6 2 5 5 6 4 2
3 5 9 5 8 6 7 5 5
4 5 7 4 5 6 6 5 5
5 7 5 5 6 6 5 7 5
6 6 8 6 8 4 7 7 4
7 4 8 6 9 3 6 4 6
8 7 6 6 8 4 6 5 6
9 7 8 6 6 6 6 7 6
10 6 8 7 8 6 7 6 7
11 7 6 7 5 4 4 7 7
12 4 7 5 6 7 4
13 5 6 8 5
14 7 6
Лабораторная работа №8
Оценка достоверности расхождения или
согласия распределений (критерий Пирсона)
Задание. Тест Мюнстерберга для измерения избирательности перцептивного понимания в адаптированном варианте М.Д. Дворяшиной (1976) предъявлялся студентам факультета психологии университета и артистам драматического театра. Материал методики состоит из бланка с набором букв русского алфавита, в случайном порядке перемежающихся. Среди этого фона скрыто 24 слова разной степени сложности: «факт», «хоккей», «любовь», «конкурс», «психиатрия» и т.п. Задача испытуемого – возможно быстрее отыскать их и подчеркнуть. Отличается ли от равномерного распределения распределение количества ошибок в выборке студентов? Совпадают ли распределения количества ошибок (пропусков слов) в двух выборках?
Разряды 1 вариант 2 вариант 3 вариант 4 вариант
Студ. Арт. Студ. Арт. Студ. Арт. Студ. Арт.
0 пропусков 21 28 21 7 10 7 15 10
1 пропуск 20 36 20 6 20 6 20 8
2 пропуска 10 7 11 7 11 8 17 12
3-4 пропуска 12 18 12 6 10 6 10 9
5-6 пропусков 20 11 20 1 24 1 24 1
7-9 пропусков 23 5 23 5 23 5 23 5
Разряды 5 вариант 6 вариант 7 вариант 8 вариант
Студ. Арт. Студ. Арт. Студ. Арт. Студ. Арт.
0 пропусков 1 10 10 2 10 5 2 5
1 пропуск 4 8 14 8 14 3 4 3
2 пропуска 4 12 14 8 14 6 1 5
3-4 пропуска 8 9 8 1 8 1 8 1
5-6 пропусков 8 1 8 1 8 1 8 1
7-9 пропусков 10 5 10 2 10 2 10 2
Разряды 9 вариант 10 вариант 11 вариант 12 вариант
Студ. Арт. Студ. Арт. Студ. Арт. Студ. Арт.
0 пропусков 5 10 5 10 20 7 14 7
1 пропуск 2 8 2 8 41 10 30 5
2 пропуска 4 12 4 12 12 12 10 12
3-4 пропуска 8 9 8 9 18 5 18 5
5-6 пропусков 5 1 8 1 14 5 16 5
7-9 пропусков 1 5 10 5 15 7 15 7
Рекомендации для выполнения лабораторных работ на компьютере:
эмпирическое значение критерия 2-Пирсона находится с использованием формул в среде Excel;
для подтверждения правильности расчетов эмпирическое значения критерия 2 – Пирсона находят с помощью статистических функций в два шага:
сначала используется статистическая функция ХИ2ТЕСТ, результатом которой будет вероятность для распределения Пирсона;
вторым шагом используется статистическая функция ХИ2ОБР, результатом которой и будет эмпирическое значение 2 –Пирсона.
Лабораторная работа №9
Оценка достоверности расхождения или согласия распределений (критерий - Колмогорова-Смирнова)
Задание. Рассмотрим распределение красного цвета в 8-цветном тесте М. Люшера. Можно ли утверждать, что распределение красного цвета по 8-и позициям в выборке A у здоровых испытуемых отличается от равномерного распределения? Можно ли утверждать, что распределение красного цвета в выборке A и выборке B не различается?
Разряды - позиции цвета 1 вариант 2 вариант 3 вариант 4 вариант
A B A B A B A B
1 22 98 10 92 12 50 12 19
2 25 100 15 98 12 10 14 10
3 13 116 16 116 21 60 11 34
4 8 87 25 82 8 10 6 10
5 15 91 12 91 6 10 4 10
6 10 112 8 112 8 112 5 12
7 9 97 14 97 14 97 10 97
8 8 86 9 86 9 10 9 10
Разряды - позиции цвета 5 вариант 6 вариант 7 вариант 8 вариант
A B A B A B A B
1 22 92 10 98 12 19 12 50
2 25 98 15 100 12 10 14 55
3 13 116 16 116 21 34 16 58
4 8 82 25 87 8 10 21 60
5 15 91 12 91 6 10 18 44
6 10 112 8 112 8 12 15 40
7 9 97 14 97 14 97 10 20
8 8 86 9 86 9 10 9 10
Разряды - позиции цвета 9 вариант 10 вариант 11 вариант 12 вариант
A B A B A B A B
1 12 59 10 98 8 48 10 92
2 14 46 15 100 10 55 15 98
3 16 42 16 116 15 58 16 116
4 21 35 25 87 21 55 25 82
5 18 20 12 91 18 30 12 91
6 15 24 8 112 15 40 8 112
7 10 28 14 97 10 20 14 97
8 8 86 9 86 9 10 9 10
Рекомендации для выполнения лабораторных работ на компьютере:
эмпирическое значение критерия – Колмогорова-Смирнова находится с использованием формул в среде Excel.
Лабораторная работа №10
Многофункциональный критерий Фишера
Задание. В выборке студентов факультета психологии Санкт-Петербургского университета с помощью «карандашного» теста определялось преобладание левого (количество А) или правого (количество В) глаза в прицельной способности глаз. Совпадают ли эти данные с результатами обследования 100 студентов медицинских специальностей, представленными в другом эксперименте?
1 вариант 2 вариант 3 вариант 4 вариант 5 вариант 6 вариант
А В А В А В А В А В А В
Студенты-психологи 6 8 8 6 5 8 19 25 16 18 7 8
Студенты медики 19 81 75 25 15 85 45 55 68 32 40 60
7 вариант 8 вариант 9 вариант 10 вариант 11 вариант 12 вариант
А В А В А В А В А В А В
Студенты-психологи 5 7 7 5 4 7 18 24 15 17 6 7
Студенты медики 68 32 40 60 19 81 75 25 15 85 45 55
Рекомендации для выполнения лабораторных работ на компьютере:
эмпирическое значение критерия Фишера находится с использованием формул в среде Excel.
922655325882000
ПРИЛОЖЕНИЕ 3
Описание статистических функций
табличного процессора Microsoft Excel
4572002349500
ЧАСТОТА
Вычисляет частоту появления значений в интервале значений и возвращает массив цифр. Функция ЧАСТОТА может быть использована, например, для подсчета количества результатов тестирования, попадающих в интервалы результатов. Поскольку данная функция возвращает массив, она должна задаваться в качестве формулы массива.
Синтаксис
ЧАСТОТА(массив_данных;массив_карманов)
Массив_данных  – это массив или ссылка на множество данных, для которых вычисляются частоты. Если массив_данных не содержит значений, то функция ЧАСТОТА возвращает массив нулей.
Массив_карманов  – это массив или ссылка на множество интервалов, в которые группируются значения аргумента массив_данных. Если массив_карманов не содержит значений, то функция ЧАСТОТА возвращает количество элементов в аргументе массив_данных.
Замечания
ЧАСТОТА вводится как формула массива после выделения интервала смежных ячеек, в которые нужно вернуть полученный массив распределения.
Количество элементов в возвращаемом массиве на единицу больше числа элементов в массив_карманов. Дополнительный элемент в возвращаемом массиве содержит количество значений, больших чем максимальное значение в интервалах. Например, при подсчете трех диапазонов значений (интервалов), введенных в три ячейки, убедитесь в том, что функция ЧАСТОТА возвращает значения в четырех ячейках. Дополнительная ячейка возвращает число значений в массив_данных, больших чем значение границы третьего интервала.
ЧАСТОТА игнорирует пустые ячейки и тексты.
Формулы, которые возвращают массивы, должны быть введены как формулы массивов.
Пример
Предположим, что на рабочем листе перечислены результаты тестирования в баллах. Баллы 79, 85, 78, 85, 83, 81, 95, 88 и 97 введены в ячейки A1:A9 соответственно. Тогда аргумент массив_данных содержит столбец этих баллов. Аргумент массив_карманов будет другим столбцом, задающим интервалы, в которые должны быть сгруппированы данные В данном примере массив_карманов – это интервал ячеек C4:C6, который будет содержать значения 70, 79, 89. Если ввести функцию ЧАСТОТА как формулу массива, то можно подсчитать количество результатов тестирования, попадающих в интервалы 0-70, 71-79, 80-89 и 90-100. В этом примере предполагается, что все баллы – целые числа. Следующая формула вводится как формула массива после выделения четырех вертикально смежных ячеек для результата. Четвертое число (2) представляет собой счетчик значений (95 и 97), которые больше чем граница наибольшего интервала (89).
ЧАСТОТА(A1:A9;C4:C6) равняется {0:2:5:2}
______________________________
РАНГ
Возвращает ранг числа в списке чисел. Ранг числа - это его величина относительно других значений в списке. (Если список отсортировать, то ранг числа будет его позицией.)
Синтаксис
РАНГ(число;ссылка;порядок)
Число   - это число, для которого определяется ранг.
Ссылка   - это массив или ссылка на список чисел. Нечисловые значения в ссылке игнорируются.
Порядок   - это число, определяющее способ упорядочения.
Если порядок равен 0 (нулю) или опущен, то Microsoft Excel определяет ранг числа так, как если бы ссылка была списком, отсортированным в порядке убывания.
Если порядок - это любое ненулевое число, то Microsoft Excel определяет ранг числа так, как если бы ссылка была списком, отсортированным в порядке возрастания.
Замечания
РАНГ присваивает повторяющимся числам одинаковый ранг. Однако наличие повторяющихся чисел влияет на ранг последующих чисел. Например, для списка целых, если число 10 появляется дважды и имеет ранг 5, то 11 будет иметь ранг 7 (и никакое число не будет иметь ранг 6).
Примеры
Если ячейки A1:A5 содержат числа 7, 3,5, 3,5, 1 и 2 соответственно, то:
РАНГ(A2;A1:A5;1) равняется 3;
РАНГ(A1;A1:A5;1) равняется 5.
МАКС
Возвращает наибольшее значение из набора значений.
Синтаксис
МАКС(число1;число2; ...)
Число1, число2, ...   - это от 1 до 30 чисел, среди которых ищется максимальное значение.
Можно задавать аргументы, которые являются числами, пустыми ячейками, логическими значениями или текстовыми представлениями чисел. Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, вызывают значения ошибок.
Если аргумент является массивом или ссылкой, то в нем учитываются только числа. Пустые ячейки, логические значения или текст в массиве или ссылке игнорируются. Если логические значения или текст не должны игнорироваться, следует использовать функцию МАКСА.
Если аргументы не содержат чисел, то функция МАКС возвращает 0 (ноль).
Примеры
Если ячейки A1:A5 содержат числа 10, 7, 9, 27 и 2, то:
МАКС(A1:A5) равняется 27;
МАКС(A1:A5;30) равняется 30.
______________________________
МИН
Возвращает наименьшее значение в списке аргументов.
Синтаксис
МИН(число1;число2; ...)
Число1, число2, ...  – это от 1 до 30 чисел, среди которых ищется минимальное значение.
Можно задавать аргументы, которые являются числами, пустыми ячейками, логическими значениями или текстовыми представлениями чисел. Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, вызывают значения ошибок.
Если аргумент является массивом или ссылкой, то учитываются только числа. Пустые ячейки, логические значения или тексты в массиве или ссылке игнорируются. Если логические значения или тексты игнорироваться не должны, следует пользоваться функцией МИНА.
Если аргументы не содержат чисел, то функция МИН возвращает 0.
Примеры
Если ячейки A1:A5 содержат числа 10, 7, 9, 27 и 2, то:
МИН(A1:A5) равняется 2;
МИН(A1:A5; 0) равняется 0;
МИН подобна функции МАКС. См. также примеры к функции МАКС.
______________________________
СРЗНАЧ
Возвращает среднее (арифметическое) своих аргументов.
Синтаксис
СРЗНАЧ(число1; число2; ...)
Число1, число2, ...   - это от 1 до 30 аргументов, для которых вычисляется среднее.
Замечания
Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения, учитываются.
Совет.   Вычисляя средние значения ячеек, следует учитывать различие между пустыми ячейками и ячейками, содержащими нулевые значения, особенно если не установлен флажок Нулевые значения на вкладке Вид (команда Параметры, меню Сервис). Пустые ячейки не учитываются, но нулевые ячейки учитываются.
Примеры
Если ячейки A1:A5 имеют имя Баллы и содержат числа 10, 7, 9, 27 и 2, то:
СРЗНАЧ(A1:A5) равняется 11;
СРЗНАЧ(Баллы) равняется 11;
СРЗНАЧ(A1:A5; 5) равняется 10;
СРЗНАЧ(A1:A5) равняется СУММ(A1:A5)/СЧЁТ(A1:A5) и равняется 11;
Если ячейки C1:C3 имеют имя ДругиеБаллы и содержат числа 4, 18 и 7, то:
СРЗНАЧ(Баллы; ДругиеБаллы) равняется 10,5.
______________________________
МЕДИАНА
Возвращает медиану заданных чисел. Медиана - это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана.
Синтаксис
МЕДИАНА(число1;число2; ...)
Число1, число2, ...   - это от 1 до 30 чисел, для которых определяется медиана.
Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа. Microsoft Excel проверяет все числа, содержащиеся в аргументах, которые являются массивами или ссылками.
Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения учитываются.
Замечания
Если в множестве четное количество чисел, то функция МЕДИАНА вычисляет среднее двух чисел, находящихся в середине множества. См. второй из следующих примеров.
Примеры
МЕДИАНА(1; 2; 3; 4; 5) равняется 3
МЕДИАНА(1; 2; 3; 4; 5; 6) равняется 3,5, среднее 3 и 4
______________________________
МОДА
Возвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. Также как и функция МЕДИАНА, функция МОДА является мерой взаиморасположения значений
Синтаксис
МОДА(число1;число2; ...)
Число1, число2, ...   - это от 1 до 30 аргументов, для которых вычисляется мода. Можно использовать один массив или одну ссылку на массив вместо аргументов, разделяемых точкой с запятой.
Замечания
Аргументы должны быть числами, именами, массивами или ссылками, которые содержат числа.
Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения учитываются.
Если множество данных не содержит одинаковых данных, то функция МОДА возвращает значение ошибки #Н/Д.
В наборе значений мода – это наиболее часто встречающееся значение; медиана – это значение в середине массива; среднее - это среднее арифметическое значение. Ни одно из этих чисел не характеризует в полной мере то, в какой степени центрированы данные. Пусть данные сгруппированы в трех областях, одна половина данных близка к некоторому малому значению, а другая половина данных близка к двум другим большим значениям. Обе функции, СРЗНАЧ и МЕДИАНА, могут вернуть значение из относительно пустой середины, а функция МОДА скорее всего вернет доминирующее малое значение.
Пример
МОДА({5,6; 4; 4; 3; 2; 4}) равняется 4.
______________________________
СЧЁТ
Подсчитывает количество чисел в списке аргументов. Функция СЧЁТ используется для получения количества числовых ячеек в интервалах или массивах ячеек.
Синтаксис
СЧЁТ(значение1; значение2; ...)
Значение1, значение2, ...   - это от 1 до 30 аргументов, которые могут содержать или ссылаться на данные различных типов, но в подсчете участвуют только числа.
Учитываются аргументы, которые являются числами, пустыми значениями, логическими значениями, датами, или текстами, изображающими числа; аргументы, которые являются значениями ошибки или текстами, которые нельзя интерпретировать как числа, игнорируются.
Если аргумент является массивом или ссылкой, то подсчитываются только числа в этом массиве или ссылке. Пустые ячейки, логические значения, тексты и значения ошибок в массиве или ссылке игнорируются.
Примеры
СЧЁТ(A1:A7) возвращает 3;
СЧЁТ(A4:A7) возвращает 2;
СЧЁТ(A1:A7, 2) возвращает 4.
______________________________
СЧЁТЕСЛИ
Подсчитывает количество ячеек внутри диапазона, удовлетворяющих заданному критерию.
Синтаксис
СЧЁТЕСЛИ(диапазон; критерий)
Диапазон   – это диапазон, в котором нужно подсчитать ячейки.
Критерий   – это критерий в форме числа, выражения или текста, который определяет, какие ячейки надо подсчитывать. Например, критерий может быть выражен следующим образом: 32, "32", ">32", "яблоки".
Замечания
Microsoft Excel предлагает дополнительные функции, которые можно применять для анализа данных с использованием условий. Например, для вычисления суммы значений, попадающих в интервал, заданный текстовой строкой или числами, используйте функцию СУММЕСЛИ. Для получения формулы, возвращающей в зависимости от выполнения условия одно из двух значений, например вознаграждение по указанному объему продаж, используйте функцию ЕСЛИ.
Примеры
Пусть ячейки A3:A6 содержат "яблоки", "апельсины", "персики", "яблоки" соответственно:
СЧЁТЕСЛИ(A3:A6;"яблоки") равняется 2.
Пусть ячейки B3:B6 содержат 32, 54, 75 и 86 соответственно:
СЧЁТЕСЛИ(B3:B6;">55") равняется 2.
______________________________
ДИСП
Оценивает дисперсию по выборке.
Синтаксис
ДИСП(число1;число2; ...)
Число1, число2, ...   - это от 1 до 30 числовых аргументов, соответствующих выборке из генеральной совокупности.
Замечания
ДИСП предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, вычисляйте дисперсию, используя функцию ДИСПР.
Логические значения, такие как ИСТИНА или ЛОЖЬ, а также текст игнорируются. Если они не должны игнорироваться, пользуйтесь функцией рабочего листа ДИСПА.
Пример
Предположим, что из инструментов, отштампованных одной и той же машиной, выбраны наугад 10 штук и испытаны на излом. Значения выборки (1345, 1301, 1368, 1322, 1310, 1370, 1318, 1350, 1303, 1299) сохранены в ячейках A2:E3 соответственно. Тогда функция ДИСП оценивает дисперсию сопротивления на излом для всех инструментов.
ДИСП(A2:E3) равняется 754,3.
______________________________
СТАНДОТКЛОН
Оценивает стандартное отклонение по выборке. Стандартное отклонение – это мера того, насколько широко разбросаны точки данных относительно их среднего.
Синтаксис
СТАНДОТКЛОН(число1; число2; ...)
Число1, число2, ...   – это от 1 до 30 числовых аргументов, соответствующих выборке из генеральной совокупности. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.
Логические значения, такие как ИСТИНА или ЛОЖЬ, а также текст игнорируются. Если текст и логические значения игнорироваться не должны, следует использовать функцию рабочего листа СТАНДОТКЛОНА.
Замечания
СТАНДОТКЛОН предполагает, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, то стандартное отклонение следует вычислять с помощью функции СТАНДОТКЛОНП.
Стандартное отклонение вычисляется с использованием "несмещенного" или "n-1" метода.
Пример
СТАНДОТКЛОН(A2:E3) равняется 27,46.
______________________________
СКОС
Возвращает асимметрию распределения. Асимметрия характеризует степень несимметричности распределения относительно его среднего. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение распределения в сторону отрицательных значений.
Синтаксис
СКОС(число1;число2; ...)
Число1, число2, ...   - это от 1 до 30 аргументов, для которых вычисляется асимметричность. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.
Замечания
Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.
Если имеется менее трех точек данных или стандартное отклонение равно нулю, то функция СКОС возвращает значение ошибки #ДЕЛ/0!.
Пример
СКОС(3;4;5;2;3;4;5;6;4;7) равняется 0,359543
ЭКСЦЕСС
Возвращает эксцесс множества данных. Эксцесс характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Положительный эксцесс обозначает относительно остроконечное распределение. Отрицательный эксцесс обозначает относительно сглаженное распределение.
Синтаксис
ЭКСЦЕСС(число1;число2; ...)
Число1, число2, ...   - это от 1 до 30 аргументов, для которых вычисляется эксцесс. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой.
Замечания
Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.
Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.
Если задано менее четырех точек данных или если стандартное отклонение выборки равняется нулю, то функция ЭКСЦЕСС возвращает значение ошибки #ДЕЛ/0!.
Пример
ЭКСЦЕСС(3;4;5;2;3;4;5;6;4;7) равняется -0,1518
______________________________
ХИ2ТЕСТ
Возвращает тест на независимость. ХИ2ТЕСТ возвращает значение для распределения хи-квадрат.  Критерий  хи-квадрат  используется для определения того, подтверждается ли гипотеза экспериментом.
Синтаксис
ХИ2ТЕСТ(фактический_интервал;ожидаемый_интервал)
Фактический_интервал   – это интервал данных, которые содержат наблюдения, подлежащие сравнению с ожидаемыми значениями.
Ожидаемый_интервал   – это интервал данных, который содержит отношение произведений итогов по строкам и столбцам к общему итогу.
Заметки
Если фактический_интервал и ожидаемый_интервал имеют различное количество точек данных, то функция ХИ2ТЕСТ возвращает значение ошибки #Н/Д.
Критерий  хи-квадрат сначала вычисляет  хи-квадрат  статистики, а затем ХИ2ТЕСТ возвращает вероятность для  хи-квадрат  статистики и степеней свободы df, где df = (r - 1)(c - 1).
______________________________
ХИ2ОБР
Возвращает значение, обратное к односторонней вероятности распределения хи-квадрат. Если вероятность = ХИ2РАСП(x;...), то ХИ2ОБР(вероятность;...) = x. функция используется для сравнения наблюдаемых результатов с ожидаемыми, для того чтобы решить, была ли исходная гипотеза обоснованной.
Синтаксис
ХИ2ОБР(вероятность;степени_свободы)
Вероятность – это вероятность, связанная с распределением хи-квадрат.
Степени_свободы – это число степеней свободы.
Заметки
Если какой-либо из аргументов не является числом, то функция ХИ2ОБР возвращает значение ошибки #ЗНАЧ!.
Если вероятность < 0 или вероятность > 1, то функция ХИ2ОБР возвращает значение ошибки #ЧИСЛО!.
Если степени_свободы не целое, то оно усекается.
Если степени_свободы  <  1 или степени_свободы  ≥  102, ХИ2ОБР возвращает значение ошибки #ЧИСЛО!.
922655466344000
ПРИЛОЖЕНИЕ 4
Применение пакета анализа
для решения статистических задач
в табличном процессоре Microsoft Excel
4572002349500
В состав Microsoft Excel входит набор средств анализа данных (называемый пакет анализа), предназначенный для решения сложных статистических и инженерных задач. Для проведения анализа данных с помощью этих инструментов следует указать входные данные и выбрать параметры; анализ будет проведен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон. Другие инструменты позволяют представить результаты анализа в графическом виде.
Пакет анализа позволяет решать в диалоговом режиме 19 задач, наиболее часто встречающихся в классической математической статистике.
Для активизации Пакета анализа необходимо выполнить команду Сервис - Надстройки и выбрать Пакет анализа, после этого в меню Сервис появится строка Анализ данных.
Чтобы запустить пакет анализа:
в меню Сервис выберите команду Анализ данных (рисунок 1 Приложения 1);
в списке Инструменты анализа выберите нужную строку;
введите входной и выходной диапазоны, затем выберите необходимые параметры.
Надстройки, установленные в Microsoft Excel, остаются доступными, пока не будут удалены.

Рис.1. Инструменты анализа данных
Инструменты анализа данных:
однофакторный дисперсионный анализ;
двухфакторный дисперсионный анализ с повторениями;
двухфакторный дисперсионный анализ без повторений;
корреляция;
ковариация;
описательная статистика;
экспоненциальное сглаживание;
двухвыборочный F-тест для дисперсии;
анализ Фурье;
гистограмма;
скользящее среднее;
генерация случайных чисел;
ранг и персентиль;
регрессия;
выборка;
парный двухвыборочный t-тест для средних;
двухвыборочный t-тест с одинаковыми дисперсиями;
двухвыборочный t-тест с различными дисперсиями;
двухвыборочный z-тест для средних.
Рассмотрим применение инструментов анализа данных: Описательной статистики и Корреляции.
Описательная статистика
Описательная статистика применяется для генерации одномерного статистического отчета, содержащего информацию о центральной тенденции и изменчивости входных данных.
Алгоритм применения инструмента Описательная статистика:
Установите входной диапазон - ссылку на ячейки, содержащие анализируемые данные. Ссылка должна состоять как минимум из двух смежных диапазонов данных, организованных в виде столбцов или строк.
Выберите форму группирования По столбцам или По строкам.
Установите переключатель для создания заголовков.
Установите флажок, если в выходную таблицу необходимо включить строку для уровня надежности. В поле введите требуемое значение. Например, значение 95% вычисляет уровень надежности среднего со значимостью 0,05.
Установите флажок, если в выходную таблицу необходимо включить строку для k-го наибольшего значения для каждого диапазона данных. В соответствующем окне введите число k. Если k равно 1, эта строка будет содержать максимум из набора данных.
Установите флажок, если в выходную таблицу необходимо включить строку для k-го наименьшего значения для каждого диапазона данных. В соответствующем окне введите число k. Если k равно 1, эта строка будет содержать минимум из набора данных.
Укажите выходной диапазон.
Установите флажок, если в выходном диапазоне необходимо получить по одному полю для каждого из следующих видов статистических данных.
На рисунке 2 Приложения 4 представлено заполненное диалоговое окно, в котором в параметре «Входной интервал» указан диапазон с исходными значениями ряда X.

Рис. 2. Диалоговое окно инструмента Описательная статистика.
Результаты применения инструмента Описательная статистика представлены на рисунке 3 Приложения 4.

Рис. 3. Результаты применения инструмента Описательная статистика.
Корреляция
Коэффициент корреляции выборки представляет собой ковариацию двух наборов данных, деленную на произведение их стандартных отклонений.
Алгоритм применения инструмента Корреляция:
Укажите входной диапазон - два смежных диапазона данных, организованных в виде столбцов или строк.
Установите переключатель в положение По столбцам или По строкам в зависимости от расположения данных во входном диапазоне.
Установите переключатель в положение Метки в первой строке, если первая строка во входном диапазоне содержит названия столбцов. Установите переключатель в положение Метки в первом столбце, если названия строк находятся в первом столбце входного диапазона. Если входной диапазон не содержит меток, то необходимые заголовки в выходном диапазоне будут созданы автоматически.
Укажите выходной диапазон – ссылку на левую верхнюю ячейку выходного диапазона или переключатель, чтобы открыть новый лист в книге и вставить результаты анализа, начиная с ячейки A1, или установите переключатель, чтобы открыть новую книгу и вставить результаты анализа в ячейку A1 на первом листе в этой книге.
На рисунке 4 Приложения 4 представлено заполненное диалоговое окно, в котором в параметре «Входной диапазон» указан диапазон с исходными значениями переменных X, Y и Z.

Рис. 4. Диалоговое окно инструмента Корреляция
Результаты применения инструмента Корреляция можно увидеть на рисунке 5 Приложения 4.
Из полученной корреляционной матрицы следует, что коэффициент корреляции между переменными X и Y равен 0,703882, между X и Z равен 0,615052, между Y и Z равен 0,66794.


Рис. 5. Результаты применения инструмента Корреляция
Применение других инструментов Пакета анализа аналогично рассмотренным примерам.
922655384048000
ПРИЛОЖЕНИЕ 5
Литература
4572002349500
Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. М.: Прогресс, 1976.
Гмурман В.Е. теория вероятности и математическая статистика. М.: Высшая школа, 1999.
Ермолаев О.Ю. Математическая статистика для психологов. М.: Московский психолого-социальный институт, 2003.
Калинина В.Н., Панкин В.Ф. Математическая статистика. М.: Высшая школа, 1998.
Кендэл М. Ранговые корреляции. М., 1975.
Кулачаев А.П. Методы и средства анализа данных в среде WINDOWS. М.: НПО «Информатика и компьютеры», 1998.
Купер К. Индивидуальные различия. М. Высшая школа, 1990.
Плохинский Н.А. Биометрия. 2-е изд. М.: МГУ, 1970.
Рунион. Р. Справочник по непараметрической статистике. М.: Финансы и статистика, 1982.
Сидоренко Е.В. Методы математической обработки в психологии. Санкт-Петербург, 1996.
Суходольский Г.В. Математико-психологические модели деятельности. СПб.: Социально-психологический центр, 1994
Суходольский Г.В. Основы математической статистики для психологов, Л.: ЛГУ, 1972.
Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. / Под ред. В.В. Фигурнова. М.: Финансы и статистика, 1995.
Тарасов С.Г. Основы применения математических методов в психологии. СПб, 1998.
Марина Владимировна Погребицкая
МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ
Учебно-методическое пособие
для студентов психологических и педагогических специальностей
-2051055334000
-174625762000
922655676656000

Приложенные файлы

  • docx 7303271
    Размер файла: 2 MB Загрузок: 0

Добавить комментарий