Анализ данных

1.Математизация наук, уровни математизации.
Социология - одна из тех наук, развитие которой невозможно без постоянного притока эмпир. материала, который содержит информацию о социальных реальностях, процессах, явлениях, о различных состояниях социальной системы.
Как наука социология призвана выстраивать модели соц. действительности.
Математика в той или иной степени применяется практически во всех науках.
Другой вопрос, насколько она глубоко исследуется. Т.о. математика, точнее математизация- степень использования математики в той или иной науке.
Окчурин И.А. выделил этапы математизации:
1)простая количественная обработка эмпирических данных (на данном этапе устанавливаются только математические закономерности)
2)модальный (сущность состоит в попытке сформировать новые теоретические концепции)
3)переход от математической модели к развитию математической теории
Социология находится на 2 уровне.
Сущ-ют ситуации, когда математические теории не работают для изучения той или иной области реальности. Тогда рождается новая ветвь математики. В отношении нашей науки мы пока не можем говорить о появлении такой дисциплины, как математическая социология. Но, некоторые сдвиги существуют, а именно - теория измерения, многомерное шкалирование, детерминационный анализ, латентно-структурный анализ Лазопельда. Автором детерминационного анализа является С.В.Чесноков. Этот термин он ввел в 1972 в практику обработки анализа данных под именем квазифункционального соответствия, а в 1975 переименовал его.


2 Методологические принципы анализа данных в социологии.(по Толстовой)
Переход А – абстрактирование от реальности на основе взглядов исследователя. На формирование об объекте и предмете исследования, выделение основных понятий и связывающих закономерностей. Переход В – процесс концептуализации, формирование эмпирической системы. Переход С – операционализация понятий. Переход Д – происходит определение измеряемых объектов посредством построения корректировки, а также реализации процедуры измерения, построения математической системы. Переход Е – реализация методов анализа данных. Переход F - интерпретация результатов применения методов. Возможность применения математики возникает, когда исследователь абстрагируется от многих конкретных черт изучаемого объекта и предполагает адекватные сути решаемой задачи, формализацию рассматриваемого явления, то есть, прежде чем приступить к математическому анализу данных и даже прежде чем их получить, необходимо сформулировать определенное представление о характере подлежащего к изучению явления. Совокупность представлений – априорная модель этого явления. Этих представлений должно быть достаточно, чтобы на их основе можно было разработать способы сбора данных, подходы к интерпретации, формальный аппарат для непосредственного анализа данных, принципы интерпретации результатов. Это априорное знание позволяет перейти к построению концептуальной схемы, которая представляет собой уточненные показатели интересующего явления. В основе построения концептуальной модели лежит процесс операционализации, то есть выражение интересующих нас понятий, через наблюдаемые признаки. Для завершения построения концептуальной схемы необходимо выбрать конкретный способ измерения, а также значения меры измеряемых показателей. Совокупность измеренных значений выбранных признаков представляет собой первичную формальную модель изучаемого явления, в рамках которой применяется процедура анализа данных с расчетом выбранных ранее формальных показателей, то есть изучение формальных закономерностей.


20.Описательные статистические процедуры в пакете СПСС: общая характеристика

Статистика подразделяется на 2 раздела описательная (дескриптивная) и аналитическая. Методы 2х разделов обладают комплексом методов для проверки соответствующих типов гипотез. Все статистические процедуры в пакете СПСС располагаются в меню анализ. Методы описательных статистик находятся в одноименном меню. Наиболее популярный – частотный анализ (построение простых распределений). Главное диалоговое окно частотного анализа помимо стандартных областей ( списка всех переменных массива, списка выбранных данных). В области дополнительных опций имеет поддиалоговые окна statistics, charts( графики). Рассмотрим возможности дополнительных меню, подозрительных окон. Меню статистики обладает возможность запуска вычисления описательно- статистических процедур для выбранных переменных. Они визуально разделены на 4 области:
1 область: Вычисление процентилей ( квартилей, детили). Можно вычислить квартили(25%, 50%, 75%)
2. Вычисление мер центральной тенденции , рассчитывают Мо, ср.значение, медиана, сумма всех значений.
3. содержит в себе меры разброса – входит минимальные и мах значения, размах стандартного отклонения, дисперсия, стандартная ошибка средней
Стандартная ошибка средней - в интервале шириной, равной удвоенной стандартной ошибке отложенному вокруг средн. значения располагается среднее значение генеральной совокупности с вероятностью 67%.
4. содержит характеристики распределения (иссеметрия)
После выбора переменных для частотного анализа в окне out put выводится
-сводная инфа по данным(количество отвеченных и миссингов)
-tabl простого распределения
-результаты расчета статистик (если были указаны)
-диаграммы( если была заданна в дополнительном диалоговом окне)


3. Структура методологии анализа данных(по Татаровой)
Понимание необходимости использования математических методов при разработке фундаментальных и прикладных проблем социологии еще недостаточно, чтобы использование этих методов стало эффективным. Однако, конкретная деятельность по проработке этих методов должна направляться определенными методологическими принципами. Методология – система знаний о способах достижения нового знания. В широком смысле, методология в той или иной науке включает в себя теорию, общенаучные методы. В узком смысле - система методов информации, ее анализа, интерпретаций и объяснений. Говоря о подходе Татаровой, мы будем рассматривать методологию в ее узком смысле, причем в русле эмпирической социологии. Эмпирической социологией в отличие от теоретической обозначается та часть социологии, где знание о социальной реальности доказательно и последовательно получается на основе эмпирических данных или социологической информации. Методология анализа данных представляет собой структуру взаимосвязанных элементов: 1. типы данных в контексте различия исследовательских задач (государственная статистика; данные, полученные посредством опросников сложной структуры; данные о бюджете времени; текстовые данные.) 2. Приемы, подходы сборов данных, подходы к измерению (одномерное и многомерное шкалирование; формирование индексов ранжирования; проектированная техника.) 3.восходящая стратегия анализа данных (логика и методы проверки описательных гипотез; поиск эмпирических закономерностей, начиная с простых и заканчивая сложными для формирования объяснительных гипотез.)4. Нисходящая стратегия анализа данных (логика и методы проверки объяснительных гипотез)5. Метометодики (типологический анализ, факториальный анализ, причинный анализ.)
В процессе освоения такой области знания, как методология анализа данных, возникают определенные трудности, которые обусловлены проблемами: 1. Многозначный характер исследования понятий в социологии: Анализ – в самом общем виде, анализ можно определять, как расчленение, разложение целого на элементы. А синтез – объединение в целое. В эмпирической социологии анализ же включает в себя как процедуру разложения, так процедуру и объединения. Формализация - методологи под формализацией понимают логические схемы модели, а математики – использование математических методов. Операционализация – с точки зрения методологии – процесс введения операционального определения. Для методистов – переход от теоретических понятий и далее к эмпирическим индикаторам. Метод – методом можно называть подходы к изучению социального; методы получения информации; отдельные техники, приемы с бора измерения; математические методы; метод как логическая схема. Причины многозначности появления термина:
1.наличие в социологии внутреннего разделения труда (методологи, методисты, социологи различных уклонов)
2. положение социологии относительно других наук(социология находится на стыке многих наук- философия, математика и т.д.)
3.структурное деление, характерное для социологии(эмпирическое знание, отраслевое знание)
2)наличие статистич и гуманитарного подходов парадигмы при исследовании соц.реальности. В статистическом подходе предполагается то, что массовое я-я имеют статистический характер, т.е. мы можем утверждать, что явление познано, если мы изучаем достаточное кол-во проявлений этого феномена. В данном подходе индивид есть представитель некой общности, носитель инфы о соц.феномене, индивиды при этом взаимозаменяемы и их индивид. Особенности не представляют интереса для социолога. В рамках данного подхода появляется понятие» как гипер сов-ть» -это общность, которую мы наблюдаем. Репрезентативность выборки позволяет распространить эмпирические закономерности, полученные в ней на всю ген. сов-ть
Доверительный интервал- интервал значения(для выборки) характеристики, в котором находится истинное значение для выборки.
Ошибка выборки- характеристика, отражающая отклонение от ген.сов-ти. Находясь в рамках данного подхода, социолог использует определённые методы сбора инфы, как правило опрос посредством жёстко с сформулированного опросника. Для формирования выборки исследования гос.статистики.
Сторонники 2 подхода считают, что с помощью жёстко формализованных методов нельзя заглянуть в глубину социального. Каждый индивид не повторим. Ключевые функции ис-я понимание и объяснение. Наиболее трудным в рамках данного подхода я-я переход от глубины индивидуального к общим закономерностям.
3)сложность процесса получения знаний в эмпирич социологии
В отличии от большинства наук перед социологией стоят цели :понимание, описание, объяснение, предсказание.
4)необходимость постоянного соотношения научного и обыденного понимания терминов
5) наличие ложных проблем
~ поиск одного решающего фактора для объяснения и описания некоторого соц.феномена
~ представление о целом, как о сумме частей(познание социального по частям не даёт знание о целом)
~ противопоставление кол-ва качества
~ поиск глобальных законов
~ поиск ответа на вопрос куда мы идём

4. Поле проблематизации методологии анализа данных
Трудности стоит рассматривать с точки зрения след условий:
1.специфическая структура объекта наук:
~соц.явления обладаю более сложной структурной нежели природные, обладают многофакторными обусловностями, динамичной природой и более вероятностным характером.
~ объект совпадает с субъектом
2.специфика получаемой информации об объекте( неэкспериментальный характер, т.е. в рамках нашей науки мы не можем создать лабораторные условия и учесть влияние всех факторов)
3.специфика метода сбора и обработки информации об объекте (специфика сбора заключ. в проблеме измерения: на сколько точно мы зарегистрировали явл отражением именно той грани реальности, которую мы пытаемся измерить. Специфика заключается в заимственности её методов из естественно-научного арсенала, зачастую калькулирование использование специф.эмпирической инфы.
4. субъективнй фактор исследования(недостаточный уровень математической подготовки, неадекватное использование методов обработки и анализа, поверхностная интерпретация результата)


5. Этапы социологического исследования: общая характеристика, проблемы и задачи.
Программа (проблема, предмет, объект, цели, задачи, концептуальная схема, инструменты, выборка, терминология) (стрелочка) обратная связь (стрелочка) анализ информации (стрелочка) подготовка к обработке (стрелочка) интерпретация (стрелочка) отчёт.
Традиционное соц (количественное ) исследование - это линейный процесс, состоящий из последовательной реализации 4 этапов: разработка программы исследования, сбор информации, обработка и анализ полученной информации,
написание итогового документа (отчёт).
Обработка информации (в рамках 3этапа социологического исследования)- это сжатие полученного массива информации, т.е. приведение сырых данных (первичная соц. Инфа) к виду годному для анализа
Анализ данных - это процесс доказательства или опровержения рабочих гипотез
Анализ данных - совокупность действий определяется исследователем в процессе изучения полученных тем или иным образом данных с целью формирования определённых представлений, о характере явления описываемого этими данными. Анализ данных - процедура поиска статистических закономерностей. Интерпретация- приписывание определённым формальным результатам содержательных значений. Это может быть с точки зрения теорий, так и с субъективной позиции исследователя. На 3 этапе соц. Ис-ия необходимо осуществить процедуру подготовки к обработке соц. Инфы. Эта процедура часто упускается исследователем, что отражается на результатах анализа и качестве интерпретации.



6. Обработка и анализ информации как этап социологического иисследования. В рамках подготовки осущест-т действия: -формируют отдельные массивы данных по каждому из используемых методов. -проверка кач-ва по заполнению массива. Проверка осущ-ся по 4ем направлениям: 1 проверка на надёжность(отклонение от выборки, проверка на случайные ошибки интервьюера 2 проверка на полноту. Критерий оценки заполнения м/б специфичны в каждом ис-ии, однако существует 2ва правила:-более 30%неответов на основные вопросы анкеты -не заполненная паспортичка 3 проверка на технологичность, анализ всевозможных отклонений от заполнения блока анкеты, вопросы, к-е мешают вводу инфо на комп. 4 оценка кол-ва доброкачественных анкет. Осущ-ся подсчёт оставшихся после выбрасывания анкет( исходя из предыдущих требований) и принимается решение о их достаточности или необходимости добора инфо. Либо выравнивания массива по основным параметрам выборки. -принятие решения об закрытии открытых вопросов. Ис-ль может принять решение о преобразовании открытых вопросов в номин шкалу. Либо возможно осуществление качест анализа. -кодирование инфо. Приписывание обычному языку анкет условных обозначений. Кодами выступают числа; они соответствуют номеру вопросов в анкете -создание макет анкеты, представление структуры анкеты в виде сис-мы кодов и интерпритации их.


7. Математико-статистические методы в социологии. Специфика их использования.
В рамках соц исследования имеются особенности:
1)статистические методы применяются на уровне конкретных прикладных ис-ий
2)выводы таких исследований носят вероятностный характер(т.е. ис-ие показывает тенденцию явления в целом, а поведение всегда представляет собой некоторое отклонение от средних.
3)прогнозы построения по результатам ис-ия также носят вероятностный характер. Использованы рез-ты выборочной совокупности для построения прогнозов. Сов-ть изучается за относительно короткий промежуток времени, которого не всеглда достаточно для построения адекватных процессов.
Несмотря на применение стат.процедуры решают круг задач.
Круг задач:
- компактное описание информации , измерение связей, взаимосвязей
-описание уже измеренных связей и взаимосвязей
-появление латентных факторов, оказывающих влияние на изучаемое явление
-построение квалификации признака или соц. объектов
-появление основных тенденций в развитии явления и построения на их основе прогнозов


8. Подготовка к обработке социологической информации.
В рамках подготовки осуществляются действия:
1.Формируют отдельные массивы данных по каждому из используемых методов.2. Проверка качества по заполнению массива; проверка осуществляется по 4 критериям: А) проверка на надежность (отклонение от выборки, проверка на случайные ошибки интервьюера.) Б.Проверка на полноту – представляет собой фиксирование не ответов. Критерии оценки заполнения массива могут быть специфичны в каждом исследовании. Однако существуют 2 правила: 1. Более 30% не ответов на основные вопросы анкеты. 2. Незаполненная паспортичка. В. Проверка на технологичность. Г. Оценка количества доброкачественных анкет. Осуществляется подсчет оставшихся после выбраковывания анкет (исходя из предыдущих требований) и принимается решение о их достаточности или необходимости добора информации. Либо выравнивание массива по основным параметрам выборки.3.принятие решения о закрытии открытых вопросов . Исследователь может принять решение о преобразовании открытых вопросов в номинальную шкалу. Либо возможно осуществление качественного анализа.
4.кодирование информации .Приписывание обычному языку анкет условных обозначений. Кодами выступают числа, они соответствуют N вопросов в анкете
5. создание макет-анкеты в специализированной программе. Макет-анкета- представление структуры анкет в виде системы кодов и интерпретации их.


9.Обработка информации. Возможности обработки с помощью ПК.
Развитие современных технологий значительно облегчило механическую и техническую работу социолога. На смену ручной обработки результатов эмпирических исследований пришли большие возможности компьютерной обработки. Применение специализированных компьютерных программ позволяет социологу анализировать большие объемы информации различного уровня сложности, многократно выдвигать и проверять гипотезы. Компьютерные технологии позволяют создавать базу данных по результатам исследования, хранить информацию, строить множество математических моделей на их основе. Условно можно разделить все программы обработки данных на общематематические и специализированные. К первым относятся мэйпл, матлап. Они решают широкий спектр математических задач, имеют возможности расширения спектора функций за счет программирования. В большей степени удобны для математика, а не для социолога. Социологи используют специализированные SPSS, Statistica. Statistiсa (91 год США ) – основана на графически – ориентированном подходе, на максимальной визуализации, результата расчета, как посредством графиков, так и специфических. Статистика принята решать широкий круг исследовательских задач. Главные из которых: построение корреляционных матриц и независимых переменных, внесение искусственных изменений в обрабатываемые данные, регрессионный анализ, кластерный анализ. Стандартные возможности программы можно существенно расширить за счет программирования на языке basic. SPSS – история пакета начинается в 1965г. 2 студента – Норман Най и Дми Вент. Они решают разработать собственный продукт. Первый появляется в 1966 г. В 1967г. Группу пополняет – Хедлай Халл. В 1970г. Най открывает SPSS. Программа постоянно совершенствуется. В 1988 г. Появляется 8-ая версия. Сейчас уже существует 18 версий. С недавнего времени переименовывается в PASW. SPSS имеет специфический интерфейс. Он аналогичен традиционным базам данных, таблицам, однако, имеет свою специфику. Окно редактора, в которой ведется основная работа (Data Veenv) имеет 2 рабочие области. Variable – область, в которой описываются переменные построчно. View – содержит коды переменных по каждой единице анализа. Каждая строчка – коды ответов респондента на каждый вопрос анкеты. Все результаты отсчета выводятся в отдельном окне. Out Put – его можно сохранять, как отдельный файл и открывать отдельно от массива данных.Файлы самого архива данных имеют расширение SPO, SPV. SPSS является модульной программой, то есть имеет базовый элемент, на базе которого можно надстраивать дополнительные модели, расширяя тем самым возможности программы.


10. СТАТИСТИЧЕСКИЙ ПАКЕТ СПСС. ОБЩАЯ ХАРАКТЕРИСТИКА.
SPSS – история пакета начинается в 1965г. 2 студента – Норман Най и Дми Вент. Они решают разработать собственный продукт. Первый появляется в 1966 г. В 1967г. Группу пополняет – Хедлай Халл. В 1970г. Най открывает SPSS. Программа постоянно совершенствуется. В 1988 г. Появляется 8-ая версия. Сейчас уже существует 18 версий. С недавнего времени переименовывается в PASW. Интерфейс программы имеет электронные таблицы, как ECXEL. Однако, имеет свою специфику. Окно редактора, в котором ведется основная работа имеет 2 рабочие области: Data view, Veriable view. Veriable view- область, которая описывается построчно. Data view- содержит коды переменных по каждой единице анализа. Каждая строчка- коды ответов респондентов на каждый вопрос анкеты. Все результаты отсчета выводятся в отдельном окне. SPSS явл-я модульной программой, т.е имеет базовый элемент, на базе которого можно надстраивать дополнительный модуль, расширяя тем самым возможности программы. Основу программы SPSS составляет SPSS Base, обеспечивающий доступ к данным, управлениям данных, подготовки данных к анализу, анализ данных и создание предварительного отчета. Модули: 1. SPSS OUTVANCED Statistic. Используется для анализа сложных взаимосвязей при помощи мощных инструментов, одномерного и двумерного анализа. Призван рассматривать ряд узкоспециализированных задач: анализ выживаемости пациента, исследования в области фармакологии, маркетинговые исследования для определения отношения к товару. 2. SPSS categories – с помощью процедур данного пакета исследуются категориальные данные. Категориальные данные не имеют явного количественного выражения и нуждаются в особых приемах при обработке и анализе. 3. Complex Samples – данный модуль предназначен для работы с результатом выборочного обследования и позволяет делать более точный прогноз для генеральной совокупности. 4. SPSS Conjoint – узкоспециализированный пакет, который осуществляет совместный анализ. Как правило, применяется в маркетинговых исследованиях для изучения влияния конкретных атрибутов товаров на предпочтение покупки. 5. Tables – специальный модуль для работы с таблицами, позволяет создавать, форматировать и редактировать, позволяет наблюдать за внешним видом таблицы в процессе их построения, создавать интерактивные таблицы. 6. Data Preparation – позволяет осуществлять процедуру подготовки исходных данных к обработке и анализу. Выявляет нетипичные и ошибочные значения, изучает структуру пропущенных данных, построение первичных распределений.


11. ОСНОВНЫЕ ОПЕРАЦИИ ПАКЕТА СПСС. ГЛАВНОЕ МЕНЮ ПРОГРАММЫ.
Основные операции пакета СПСС содержаться в главном меню, расположенном в верхней области редактора. Команды главного меню можно разделить на 2 типа: прямые и опосредованные
Команды прямого действия непосредственно запускают процедуры. Опосредованные - дают доступ к спискам дополнительных команд. Стандартные операции: 1.Файл - содержит все основные процедуры, позволяющие создавать новые, открывать уже имеющиеся, сохранять, печатать и так далее.Все команды меню «файл» прямые. 2. Правка(edit) – используется для корректировки содержимого окна редактора данных, который позволяет вставлять, искать, редактировать элементы. 3.Вид(view)- содержит команды с помощью которых осуществляется индивидуальная настройка редактора данных. В том числе изменяются шрифты. Только для SPSS: 1. Дата (данные)- осуществляют изменения в самих данных, а именно объединение данных из разных файлов, создание независимых подвыборок.
Поиск данных в массиве, сортировка данных по разным параметрам. 2. Transform(преобразование)- используется для перерасчета выбранных переменных, а также создания новых переменных. 3. Analize(Анализ) – содержит все статистические процедуры пакета от простых описательных до многомерных, это основное направление. 4)Grafs(графики)- выведение отдельных выполненных графиков. 5. Meutirities(сервис) – можно получить инфу о переменных текущего массива о массиве в целом, истории, выполнения сценария. 6. Window(окно) – позволяет открывать, закрывать окна. 7. Help(справка)- описание процедур, уроки, слайдовое сопровождение




12. ЭТАПЫ РАБОТЫ С ФАЙЛОМ ДАННЫХ
Работу СПСС можно представить как ряд последующих этапов:
1 этап: происходит создание нового или открытие уже имеющегося файла данных. При этом, если мы используем уже готовый массив, подразумевается, что он прошел этап обработки, корректно введен и отредактирован.
2 этап: Осуществляется выбор статистической процедуры и ее запуск в соответствующем диалоговом окне (с учетом дополнительных параметров статистической обработки)
3 этап: Интерпретация результатов, выделенных в окне out put.






13. Понятия переменной. Типы переменных. Правила описания переменной
Единица анализа - элементарная часть объекта исследования.
Переменная- элементарный показатель признака, характеризующий одно из изучаемых свойств в единице анализа. Ключевые характеристики переменной с одной стороны для каждой единицы анализа, она имеет одно вполне определенное значение, а с другой стороны не все единицы анализа имеют одинаковое значение переменной.
В программе СПСС переменные задаются (описываются) в спец.окне variable view (переменные). Переменные описываются в перспективе следующих свойств: 1)NAME(ИМЯ). К имени переменной предъявляется ряд требований:
имена могут содержать латинские буквы и цифры; допускается использование символов: нижнее подчеркивание, @,#. Нельзя ставить пробел, !, ?, *.
имя должно начинаться с буквы; последним символом не может быть подчеркивание ; длина имени не должна превышать 8 символов; имена переменных не чувствительны к регистру; как правило имена n-x соот-т № вопроса в анкете. 2) ТИП ПЕРЕМЕННОЙ (TYPE) SRSS предлагает 8 типов, но подходит социологам 2 :Numeric (числовая) и string ( текстовая) 3)WIDTH (формат столбца) 4)DECIMALS (десятичная, кол-во знаков после запятой)
5)LABEL(МЕТКА) позволяет нам описать переменную более подробно. Метка может содержать до 256 символов. Соответствует формулировке вопросов анкеты. 6)VALUES (метки значений)- задается числовой код и содержание значения. 7)MISSING (пропущенные данные)- может быть неуказан, следовательно все значения переменных считаются годными для анализа. Либо мы можем их задать: 1 способ: Задается интервал и одно дискретное значение. Например для пятичленной шкалы может быть указан интервал от 6 до 100 и дискретное значение. 2 способ: Задаем 3 дискретных значения
Эти значения выступают: - 0 ( нет ответа); 99 ( вопрос не относится к респонденту); 98 ( неправильная инфа)
Данные – не заданные пользователем – пустые ячейки в массиве называются system. 8) COLUMNS (cтолб) 9)ALIGMENT (выравнивание) 10)MEASURA (шкала измерения) -шкалы, к-е указаны в переменных ( номинальная, порядковая, метрическая). Многие социологи пренебрегают указанием типа шкалы при описании переменной и оставляют метрическую шкалу. Однако важно помнить, что для разного типа шкал используются разные статистические процедуры. Для номинальной: используется простое распределение , оценка центральной тенденции с помощью моды, при характеристике связей, оценка критериям Хи^2, коэф-т Крамера, коэф. Чупрова.( Она устанавливает отношения ра­венства между явлениями, которые включены в один класс. группировка по мотивам увольнения с работы: (а) не устраивал заработок; (b) не­удобная сменность; (с) плохие гигиенические условия труда; (d) неинтересная работа и т. д. Упорядочить эти пункты невозможно ) Для порядковых: тоже самое + медиана. Оценка квартильного диапазона для характеристики связей используются коэф-ы ранговой корреляции.( ПОPЯДКОВАЯ ШКАЛА ЯВЛЯЕТСЯ УПОPЯДОЧЕННОЙ НОМИНАЛЬНОЙ ШКАЛОЙ, УСТАНАВЛИВАЮЩЕЙ PАВЕНСТВО МЕЖДУ ОБЪЕКТАМИ ПО ВЫБPАННЫМ ПPИЗНАКАМ И ОТНОШЕНИЯ ПОPЯДКА.Например, Ваше образование.Можно поставить >" и "< )
Для метрической: мода, медиана, среднее арифметическое, дисперсия, стандартное отклонение. При оценке взаимосвязи используются методы парной множественной корреляции.( устанавливает отношение между пунктами не про­сто в понятиях больше-меньше, но позволяет фиксировать величину интервала.)





14. Способы работы с файлом данных в пакете СПСС. Устройство диалогового окна любой статистической процедуры.

В программе СПСС можно работать 2-мя способами
- диалоговые окна – элементы интерфейса обеспечивают процедуру обработки данных, содержание базовых данных
-язык syntax – дает возможность самостоятельно задавать алгоритмы расчета. Диалоговое окно содержит следующие базовые данные: Рисунок
1.список всех переменных в массиве. 2. область выбранных переменных, над которыми будет производиться та или иная работа
3. область stand кнопок. Запускают статистическую процедуру, с помощью кнопки пейст можно изменить что-то в окне синтаксис.
Resert – обнуляет все изменения в диалоговом окне. Canst – осущ-т выход без сохранения. 4. область дополнительных процедур. Особенность – наличие многоточия после названия, с помощью них открывается дополнительные диалоговые окна, в к-х можно детализировать статистическую процедуру, установить тот, или иной формат данных, построить график.



15.пропущенные правила работы с пропущенными данными.
В данных часто встречаются так называемые пропущенные значения - они возникают из-за отсутствия ответов в некоторых наблюдениях,ошибок при измерениях или в результате неправильных вычислений. Каждое такое значение заменяется в SPSS специальным кодом-системным кодом пропущенного значения. Пользователь может выбрать специальный код для обозначения пропущенных значений (например, код 9 для шкалы со значениями от 1 до 7). В подобном случае необходимо сообщить системе коды пропущенных значений, чтобы в дальнейшем иметь возможность исключить их из анализа (кроме тех случаев, когда вы захотите специально включить эти значения в обработку).


16. Переменные с множественным выбором: дихотомические и категориальные.
Переменная, которая соответствует вопросам с несколькими вариантами выбора называется множественная. Она бывает: дихотомическая и категориальная. Как правило, в случае с дихотомическими переменными речь идёт о некотором событии, которое может произойти или не произойти. Дихотомическая (что из бытовой техники есть у вас дома (выберите вариант ответа).В ней варианты ответа не ограничены. В программе SPSS что выбирают, ставим 1, что не выбирают 0. Категориальная - выбор ограничен .Создаётся столько одинаковых переменных сколько можно выбрать. (От чего зависит изменение в универе (выбрать не более 3х субъектов)) категориальные - Переменные, принимающие значения из некоторого ограниченного набора категорий. Они обычно связаны с неисчисляемыми признаками, такими как названия (товаров, услуг и др.), имена людей, исходы событий (да/нет) и т.д. Категориальными всегда являются выходные переменные в классификационных моделях (метки классов). Как правило, значения категориальных переменных являются строковыми. Но иногда могут использоваться и числа, если, например, некоторое наименование кодируется числовым значением.



18 Модификация данных : вычисление новых переменных. Для проведения анализа часто бывает необходимо выполнить преобразование данных. На основе первоначально собранных данных можно создать новые переменные и изменить кодирование. Подобные преобразования называются модификацией данных. В SPSS существует много возможностей для модификации данных Вычисление новых переменных:Выберите в меню команды Преобразовать –Вычислить.Откроется диалоговое окно Вычислить переменную. В поле Target Variable (Выходная переменная) указывается имя переменной, которой присваивается вычисленное значение. В качестве выходной переменной может служить уже существующая или новая переменная. В поле (Численное выражение вводится выражение, применяемое для определения значения выходной переменной. 3 этом выражении могут использоваться имена существующих переменных, константы, арифметические операторы и функции. В поле Выходная переменная указывается имя переменной, которой присваивается вычисленное значение. В качестве выходной переменной может служить уже существующая или новая переменная. В поле Численное выражение вводится выражение, применяемое для определения значения выходной переменной. Щелкните на кнопке Тип и метка. Откроется диалоговое окно Вычислить переменную: Тип и метка .В диалоговом окне щелкните на кнопке ОК. В файл данных добавляется новая переменная траляля. Теперь ее, как и прочие переменные, можно применять для вычислений. Для SPSS нет разницы, введены ли значения переменных через редактор данных или вычислены по формуле.

19.Перекодирование значений. Перекодирование данных можно выполнить вручную или автоматически. Ручное перекодирование: проанализируем результаты опроса. Нас интересует процентное распределение правые-левые. перекодирование производится следующим образом: Выберите в меню команды Transform (Преобразовать) Recede (Перекодировать). Выберите в подменю в другие переменные. Введите в поле Имя текст lire. Щелкните на кнопке Изменить. Введите в поле Label обозначение: «Политический спектр». Чтобы установить значения, которые следует перекодировать, щелкните на кнопке Старые и новые значения. Для осуществления каждого перекодирования надо указать значение или диапазон входной переменной и соответствующее значение выходной переменной. Перекодирование завершается щелчком на кнопке Add. Введите старые и новые значения согласно следующей таблице: 1->2 2->2 3->1 4->1 5->1 6->2 Установите следующие параметры: тип переменной численный, ширина 1, десятичные разряды 0. Укажите следующие метки значений: 0 = не определено .1 = левые.2 = правые. Автоматическое перекодирование: В редакторе данных отобразятся значения строковой переменной недуги , соответствующие характеру жалоб пациентов. Они состоят не более чем из двадцати символов. Выберите в меню команды Преобразовать - Автоматическое перекодирование. Перенесите строковую переменную в поле Переменная > Новое имя.

22.Вычисление перекрестных группировок.
Группировки можно строить по 2м и более признакам. Их называют перекрестными группировками.
Основные задачи, решаемые с помощью перек-х группировок:
- поиск связей; установление зависимостей м/переменными
- поиск тенденции динамики процесса
Алгоритм построения таблицы перекрестных группировок:
1) формулировка гипотезы о наличии связи или тенденции
2) В соответствии с гипотезой выбираем зависимую/независимую переменную. Для независимой пер-й отводится верхняя строка, соответственно, зависимая располагается сбоку.
3) Переводим абсолютные частоты в %, считая, что кол-во объектов в каждой по независимо переменной = 100%, т.к. сравнение в абсолютных цифрах не корректно, т.к. в каждой группе может быть разное число респондентов.

23. Описательные статистические процедуры в пакете SPSS: меры центральной тенденции.
Для одномерных случайных величин можно найти целый ряд статистических закономерностей. Важной характеристикой при описании поведения отдельных признаков и соответствующих им переменных являются меры средней тенденции. Все они – это некоторое значение рассматриваемого признака, которое должно характеризовать всю совокупность (как бы подменять ее). Такие значения переменной, которые выступают точечной оценкой выборочной или генеральной совокупности, называются статистикой. Среднее арифметическое. Говоря о среднем значении переменной,мы предполагаем, что значение данного показателя достаточно хорошо описывает поведение анализируемой переменной (т.е. выступает в качестве модели). Только в случае, когда все значения переменной одинаковы, среднее значение абсолютно точно отражает поведение признака. Во всех других случаях среднее значение как модель является неточным. Мода. Для номинальных переменных мерой центральной тенденции может выступать только мода. Это наиболее часто встречающееся значение переменной. Мода не имеет какого- либо показателя разброса. Определенной характеристикой может считаться лишь само процентное значение модальной величины. Медиана. Для переменных, измеренных на порядковом уровне, основной мерой центральной тенденции является медиана. Медиана – это значение признака, которое делит вариационный ряд, отвечающий этому признаку, пополам. Вариационный ряд – последовательность значений признака, расположенных в порядке их возрастания. Таким образом, медиана обладает тем свойством, что половина всех выборочных значений признака меньше ее, а половина – больше. Эта мера центральной тенденции имеет смысл только для порядковых и метрических шкал (для номинальных она не подходит, поскольку ее интерпретация будет бессмысленна с содержательной стороны). Например, мы имеем 11 измеренных значений: 3, 7, 8, 5, 4, 6, 3, 9, 2, 8, 4. Вариационный ряд будет представлять собой упорядоченную в порядке возрастания совокупность значений – 2, 3, 3, 4, 4, 5, 6, 7, 8, 8, 9. В этом случае медиана равна 5. Если вариационный ряд содержит четное число измерений, например: 12 – 2, 3, 3, 4, 4, 5, 6, 7, 8, 8, 8, 9, то медиана будет равна среднему арифметическому двух центральных значений: Ме= (5+6)/2=5,5. Так, например, по результатам исследования 2004 г. определим степень выраженности качества «надежный» у Президента РФ. Респондентам предлагалось по 7-балльной шкале оценить, в какой мере Президенту присуще данное качество, где 1 – практически не характерно, 7 – полностью присуще. Ответы распределились следующим образом. Медиана – это такое значение переменной, меньше которого отметили 50 % респондентов. В данном случае градации 1, 2, 3, 4, 5, 6 отметили 52,5 % респондентов, следовательно, градация 6 – медиана



24. Процедура поиска связей и взаимосвязей между признаками:критерий хи-квадрат.
Выберите в меню команды Анализ- Дескриптивные статистики -Таблицы сопряженности. Кнопкой Сброс удалите возможные настройки. Щелкните на кнопке Ячейки. В диалоговом окне установите, кроме предлагаемого по умолчанию флажка Observed, еще флажки Expected и Standardized. Подтвердите выбор кнопкой Continue. Щелкните на кнопке Статистика. Установите (Хи-квадрат). Щелкните на кнопке Continue, а в главном диалоговом окне на ОК. Вы получите следующую таблицу сопряженности. Корректность проведения теста хи-квадрат определяется двумя условиями: во-первых, ожидаемые частоты < 5 должны встречаться не более чем в 20 % полей таблицы; во-вторых, суммы по строкам и столбцам всегда должны быть больше нуля. 25. Процедура поиска связей и взаимосвязей между признаками: корреляционный анализ. Определим при помощи программы коэффициенты корреляции для двух метрических переменных: «доход» и «возраст» респондентов. Вычисление коэффициентов корреляции в SPSS может производиться двумя способами. Первый способ (традиционный) – вычисление через команду «Correlations» диалогового окна «Crosstabs: Statistics», расположенную в его правом верхнем углу. Второй способ – вычисление коэффициентов корреляции осуществляется через команды: Analyze > Correlate > Bivariate. После активизации вышеуказанных команд открывается диалоговое окно «Bivariate Correlations», в котором необходимо выбрать коррелируемые переменные и коэффициенты для последующего расчета. Вычисленные коэффициенты в окне программы «Output» будут представлены в виде двух таблиц. В данном случае компьютер вычисляет указанные коэффициенты, коррелируя друг с другом выбранные переменные. Так, в каждой ячейке таблиц 5.8 и 5.9 приводятся значение коэффициента корреляции, его значимость и число ответов на вопрос. Мы видим, что рассмотренные способы расчета коэффициентов корреляции в SPSS дают идентичную информацию, но визуально представлены по-разному. Итак, коэффициент корреляции Пирсона между переменными «доход» и «возраст» статистически не значим. Следовательно, можно говорить о слабой прямой связи с вероятностью 72,5 % (r = 0,039 при ? = 0,275). Коэффициент ранговой корреляции Спирмена подтверждает наличие слабой прямой связи с вероятностью 80,4 % (rs = 0,046 при ? = 0,196). Подводя итог, отметим, что при использовании коэффициента кореляции переменные должны быть измерены, по крайней мере, на интервальном уровне. Кроме того, связь, фиксируемая этим показателем, носит линейный характер, т.е. коэффициент корреляции не может отражать более сложные формы взаимосвязей. В нелинейном случае его имеет смысл рассматривать как индикатор, показатель тенденции и лишь отчасти как меру тесноты этой связи.


21.Описательнык статистические процедуры в пакете СПСС:частотный анализ Первым этапом статистического анализа данных, как правило, является частотный анализ. Частотные таблицы: Выберите в меню команды Анализ,- Дескриптивные статистики затем Частоты. Вычисление медианы: с помощью команд меню Анализ -Частоты создайте частотную таблицу. Если задать вычисление среднего значения и медианы, мы получим следующий результат.Медиана делит пополам. Графическое представление: Результаты частотного распределения можно представить графически. примера столбчатая .Выберите в меню команды Анализ- Дескриптивные статистики, Частоты, Диаграммы). Откроется диалоговое окно Частоты: Диаграммы. Выберите в группе Тип диаграммы пункт Столбчатая диаграмма, а в группе Значения диаграммы пункт (Проценты). Подтвердите выбор кнопкой Продолжить.





26.Формы представления социологической информации. Графики. Возможности их построения в пакете SPSS. Помимо табличного представления частотных распределений обычно используют и различные методы графического представления, которые хорошо представлены в SPSS. Диаграммы в качестве метода построения одномерных частотных распределений повышают наглядность полученных закономерностей и могут быть использованы для презентации результатов исследований. Для построения графиков и диаграмм в диалоговом окне «Frequencies» (рис. 3.1.) необходимо нажать на клавишу Charts. В результате откроется окно «Frequencies: Charts». Диалоговое окно «Frequencies: Charts» Здесь можно задать тип графика и значения, на основе которых будет построена диаграмма. По умолчанию активизирована функция None (нет графика). В данном диалоговом окне можно построить: столбчатую диаграмму Bar charts, круговую диаграмму Pie charts или гистограмму Histograms. При построении гистограммы можно одновременно отобразить кривую нормального распределения для определения характера поведения признака, поставив флажок около функции «With normal curve». В качестве значений графиков могут выступать частоты (в абсолютных числах) или их процентные эквиваленты. После выбора типа и значений диаграммы надо нажать на клавишу «Continue», которая находится в верхнем правом углу. После чего в приложении «Output» будет построена таблица и диаграмма частотного распределения. Если вы не желаете, чтобы на экран выводилась таблица частотного распределения, то в окне «Frequencies» (рис. 3.1) уберите флажок напротив функции «Display Frequency tables». Самый распространенный метод графического представления одномерных распределений – это гистограмма, или столбиковая диаграмма. Каждый столбик соответствует интервалу значений переменной. Высота столбика отражает частоту попадания наблюдавшихся значений переменной в определенный интервал (рис. 3.7). Еще один популярный способ графического представления, обычно используемый для номинальных и порядковых шкал, – это круговая диаграмма (рис. 3.8). Каждый сектор круговой диаграммы представляет дискретную категорию переменной. Величина сектора пропорциональна частоте категории для данной выборки. Тип диаграммы, который следует выбирать для каждого отдельного случая, зависит от эстетических пристрастий и не имеет какого-либо существенного значения. Помимо построения графиков в программе SPSS предусмотрена возможность их редактирования. Для этого в приложении «Output» на поле построенного графика щелкните правой клавишей мыши. В результате откроется следующее меню. В этом меню, выбрав функцию SPSS Chart Object > Open, откройте окно редактора графиков. Данное окно откроется поверх первоначального графика (рис. 3.9). В нем можно изменить подписи данных, цвет заливки, поставить значения переменной, изменить положение графика в плоскости и т.д.

15

Приложенные файлы

  • doc 8821858
    Размер файла: 119 kB Загрузок: 0

Добавить комментарий