Статистические методы.

⇐ ПредыдущаяСтр 3 из 4Следующая ⇒

Статистические методы, применяемые в прикладном политическом исследовании, можно упорядочить по двум основаниям: 1) по уровням измерения и 2) по количеству переменных.

Принято выделять три уровня измерения: номинальный, порядковый и интервальный.

Наиболее слабой формой числового выражения является номинальная шкала. Например, при заполнении бланков переписи населения от нас требуется определить свою этно - национальную принадлежность. Каждой этнической группе при этом может быть присвоено числовое (1, 2, 3 и т.д.) либо буквенное (а, б, в и т.д.) обозначение. Данные обозначения не содержат никакой информации по поводу сопоставимых качеств той или иной национальности, например, обладает ли группа большей близостью к группе А, выраженной в каком-либо свойстве либо физическом качестве, в сравнении с группой Д. Для номинальной шкалы присвоение числового значения лишено всякого внутреннего содержания и не предназначено для математической обработки. Некоторые явления сопоставимы, так что мы можем упорядочить их согласно некоторому свойству, однако не можем с точностью определить расстояние между ними. Так, мы можем ранжировать респондентов по уровню образования (незаконченное среднее — среднее -незаконченное высшее — высшее), однако мы не можем сказать, что респондент А в 2,35 раза более образован, чем респондент Б. Очевидно, тем не менее, что порядковое измерение обладает большей математической силой, чем номинальное.

Интервальная шкала дает нам наиболее содержательное и гибкое измерение, позволяя определить не только порядок расположения случаев относительно друг друга, но и расстояние между ними. Так, респонденты могут быть распределены по уровню дохода, выраженного в денежных единицах, при этом мы можем в точности определить, какова разница между доходами любых двух случаев. Для номинальной шкалы требуется наличие двух условий: стандартной единицы измерения и нулевой точки отсчета.

Математическое преимущество интервальных измерений очевидно, и это преимущество определяет стремление аналитиков к конструированию интервальных шкал в исследованиях социальных, политических, экономических и иных явлений (табл. 4).

Таблица 4. Уровни измерения.

Тип шкалы	Отношения
Номинальная	a=b
Порядковая	a=b, a>b
Интервальная	a=b, a>b, a-b=c, a=bc

В зависимости от количества переменных принято выделять одномерные, двухмерные и многомерные измерения.

Для различных уровней измерения применяются соответственно различные измерительные методики и процедуры. Чем выше уровень измерения и чем больше количество переменных, тем более сложные методы анализа можно применять.

Для описания распределения признаков по значениям одной переменной используют два типа статистических процедур.

Первый — измерение средней тенденции — помогает нам выявить наиболее типичные значения, которые наилучшим способом представляют весь комплекс признаков по данной переменной. Второй — измерение дисперсии — показывает, как колеблется (варьирует) отклонение от среднего значения, насколько это среднее репрезентативно для всей совокупности.

Стандартным способом измерения средней тенденции для номинального уровня служит мода, для порядкового — медиана и для интерваного — среднее геометрическое. Соответствующими способами измерения дисперсии являются коэффициент вариации, квантильный размах и стандартное отклонение.

Для двухмерных измерений имеет значение связь между переменными. Если знание значений одной переменной по определенному случаю позволяет сделать некоторые предположения относительно соответствующих значений другой переменной, между этими переменными существует связь.

Возникает вопрос: насколько сильна эта связь? В статистике для этого существует показатель коэффициент связи, который обозначает степень возможности определения значений одной переменной для любого случая, базируясь на значении другой.

Второе измерение, которое имеет отношение к анализу двух переменных, — статистическая значимость, определяющая, насколько вероятна связь, зафиксированная между двумя признаками в выборке.

В зависимости от выбранного уровня измерения стандартными способами измерения связи между двумя переменными являются лямбда, гамма и коэффициент корреляции.

Многомерные измерения, в свою очередь, предполагают, что все переменные выражены в интервальных значениях. Таким образом, для
номинального и порядкового уровней многомерных методик измерения не существует.

К многомерным методам относятся множественная регрессия, факторный анализ, пат-анализ и др.

Множественная регрессия (применяемая в многомерном измерении) — процедура, обеспечивающая подсчет независимого воздействия
изменений в значениях каждой независимой переменной на значение
зависимой переменной и предсказания значения зависимой переменной на основе знания совместного влияния независимых переменных
Она имеет формулу: •

У = а + b1Х1 + b2X2 +... + bnХn + е,

где У — значение зависимой переменной; a — среднее значение Y, если каждая независимая переменная равна нулю; b1 — среднее изменение У на единицу изменения X1, когда воздействие остальных переменных постоянно; X1 — значение первой независимой переменной; е — погрешность, означающая любое колебание У, не вызванное изменением независимой переменной.

Расчет множественной регрессии (как и в случае двухмерной регрессии) строится на методе наименьших квадратов, т.е. графически линия регрессии должна проходить через множество точек таким образом, чтобы уменьшить до минимума сумму квадратов расстояний каждой точки до этой линии. Разница в том, что в случае множественной регрессии мы имеем не «линию», а множество математически обоснованных точек в многомерном пространстве.

Частный коэффициент регрессии b описывает единичный вклад каждой независимой переменной в определение значений зависимой переменной.

Данный коэффициент (однако методика расчета которого выходит за рамки нашего разговора) позволяет осуществить процедуру контролирования (фиксации) переменных, которая является важным шагом во всех формах многомерного анализа.

Контроль в многомерном анализе определяется как поддержание значений некоторой переменной на постоянном уровне при изучении зависимостей между двумя (и более) другими переменными.

Если коэффициент b близок к нулю, мы можем заключить, что непосредственной связи между двумя переменными нет. Это условие является необходимым при осуществлении факторного анализа.

Факторный анализ — применяемый в политическом анализе метод многомерной математической статистики, позволяющий на основе измерения парных корреляций между признаками получать набор новых, укрупненных переменных, которые не могут быть измерены напрямую; их и называют факторами. Число факторов F 'всегда меньше числа исходных признаков.

Для объяснения корреляций между наблюдаемыми признаками можно выдвинуть гипотезу, состоящую в том, что имеется несколько латентных факторов, действием которых и объясняется корреляция между нашими наблюдаемыми признаками. Предполагается, что совокупность этих факторов едина для всех наблюдаемых признаков. Такие факторы называют общими.

Естественно предположить, что кроме тех изменений наблюдаемых признаков, которые вызваны действием общих латентных факторов, существуют индивидуальные изменения каждого наблюдаемого признака, вызываемые, например, случайными ошибками при их измерении. Причины, вызывающие невзаимосвязанные изменения исходных признаков, называются специфическими (или характерными) факторами.

Что представляют собой общие факторы? Измерить их непосредственно мы не можем. Более того, мы не знаем заранее, что собой представляют эти факторы, сколько их. Однако предполагается, что они существуют.

Общие факторы имеют разное влияние на изменение того или иного наблюдаемого признака. Вес общего фактора, определяющий степень его влияния на изменение данного наблюдаемого признака, называется факторной нагрузкой на признак.

Именно действием указанных латентных факторов определяются все корреляции между нашими наблюдаемыми признаками. Это означает, что фиксация значений латентного фактора должна привести к ликвидации связи между наблюдаемыми признаками.

Основное положение факторного анализа (ФА) заключается в том, что каждый наблюдаемый признак можно представить в виде линейной комбинации факторов (в данном случае мы рассматриваем только линейный ФА, нелинейные модели практически не используются из-за сложности).

Значения факторных нагрузок, как правило, являются результатом вычислительной процедуры ФА, т. е. предметом интерпретации.

Нарушение принципов теории измерения является одной из типичных и, к сожалению, распространенных ошибок в практике прикладных политических исследований. Причины этого кроются в методологических и психологических обстоятельствах. С одной стороны, как было показано выше, явления политической реальности, значимые для аналитика, с трудом поддаются квантификации (количественному выражению) и часто не могут быть адекватно выражены с соблюдением условий, соответствующих интервальному уровню. Такая ситуация встречается в практике экспертных оценок, когда от экспертов требуется высказать оценку в значениях некоторой порядковой шкалы (например, от 1 до 5).

При этом психологически объяснимое стремление аналитика использовать в своей работе современные методы высокого уровня - коореляционный, факторный анализ и т.д. — побуждает порой вводить в соответствующие стандартные формулы значения, которые в принципе не могут быть использованы таким образом (в частности, значения ранговых шкал). Действительно, ведь ранжирование объектов содержит лишь информацию о том, какой из объектов более предпочтителен, и не содержит информации о том, насколько или во сколько раз один объект предпочтительнее другого.

Может быть, в некоторых заведомо очевидных ситуациях даже такая обработка экспертной информации может дать правдоподобный результат. Однако в реальных ситуациях такая обработка информации не может считаться достоверной.

Часто исследователям приходится изучать взаимодействие объектов, разделенных во времени. Средством для этого является анализ временных рядов.

Временные ряды — это просто комплекс наблюдений, в которых одна и та же переменная измеряется повторно через определенные интервалы.

Типичное применение анализа временных рядов — исследование по схеме «до введения стимула — после введения стимула». В данном случае мы имеем дело с так называемым прерванным временным рядом. (Пример: уровень преступности до и после изменения в практике правоохранительной деятельности.)

Одна из проблем, с которой может при этом столкнуться аналитик, — регрессия к среднему. Данный эффект проявляется в том, что объекты исследования, имеющие в определенный момент крайние значения по зависимой переменной, при последующих измерениях стремятся вернуться к значениям, близким к среднему значению, независимо от того, подвергались ли они воздействию некоторой гипотетической независимой переменной. Если такая регрессия к среднему происходит в момент исследования, можно ошибочно принять естественную регрессию за результат воздействия независимой переменной. Это может представлять особую проблему в тех случаях, когда объекты исследования подвергаются воздействию независимой переменной именно потому, что у них появляются необычные значения зависимой переменной (пример с преступностью).

Чтобы исключить естественную регрессию, можно применить метод контролируемых временных рядов.

Суть метода контролируемых временных рядов в том, что мы собираем данные о другом объекте (или множестве объектов), который во всех существенных отношениях сходен с исследуемым объектом, но не подвергался воздействию независимой переменной; и этот объект (или группа объектов) используется в качестве контрольного при оценке результатов воздействия независимой переменной (например, один или несколько городов, в которых не вводились новации в практике правоохранительных органов).

Контент-анализ.

Документированные источники используются в прикладном политическом анализе различным образом: одни извлекают из них цитаты высказывания, иллюстрации, подкрепляющие ту или иную точку зрения; другие извлекают содержащиеся в них количественные данные (результаты голосований, статистические данные и т.д.). Контент-анализ не позволяет извлекать количественные оценки из обширных документированных источников, не содержащих информации в числовом выражении.

Например, аналитик может обратиться к материалам СМИ, посвященным избирательной кампании, с целью выяснения различий в тональности (степени доброжелательности) освещения отдельных кандидатов. Такая работа предполагает переработку сотен газетных статей и новостных материалов в небольшой набор цифр, характеризующих данный предмет исследования.

Суть методики контент-анализа заключается в конструировании набора взаимоисключающих и исчерпывающих категорий, характеризующих предмет исследования, с последующей фиксацией частоты, с которой данные категории встречаются в изучаемых документах.

Первый шаг в проведении контент-анализа предполагает осуществление выборки документов. Если аналитика интересуют политические ценности кандидатов, в выборку следует включать партийные программы и выступления кандидатов; если предметом исследования являются национальные и расовые стереотипы в обществе, выборка может формироваться из записей телевизионных передач, литературных ихудожественных текстов и т.д. Определившись с общим характером необходимых источников, аналитик затем осуществляет выборку в соответствии со стандартными требованиями, указанными ниже.

Второй шаг в контент-анализе заключается в формировании списка категорий содержания, по которым будет осуществляться замер. Такой список может включать:

- актуальные общественные проблемы;

- альтернативные позиции по отношению к этим проблемам;

- имена политиков, названия политических партий и организаций;

- целевые группы, к которым обращаются кандидаты/партии/ор-
ганизации;

- эмоциональные характеристики тональности:

- поддержка — порицание,

- виновность — невиновность,

- сочувствие — равнодушие и т.д.

Данный шаг представляет собой наиболее важную и творческую часть контент-анализа.

Третий шаг заключается в выборе единицы анализа. Например, по каждому документу аналитик может фиксировать:

- каждое слово,

- каждую тему,

- каждый персонаж,

- каждое предложение,

- каждый абзац,

- документ в целом.

При определении единицы анализа аналитик исходит из соображения идентифицируемости данной единицы (так, слова, абзацы и предложения технически легче идентифицировать, чем «темы» и «сообщения»), а также соответствия категориям контента (так, чтобы установить отражение тех или иных «проблем» в средствах массовой информации, новостное «сообщение» будет более адекватной единицей анализа, чем «слово» или «предложение», в то время как для измерения эмоциональной тональности подходит именно «предложение» и «слово»).

Наконец, необходимо выбрать систему измерения категорий:

- наличие или отсутствие упоминания данной категории;

- частота упоминания;

- продолжительность времени/объем текста, посвященного данной

категории;

- интенсивность присутствия и др.

Слабым местом контент-анализа можно считать значительные временные издержки, необходимые для его проведения. Однако с развитием компьютерных технологий, формированием обширных полнотекстовых электронных баз данных (РгоQuest, JStore) и распространением гипертекстовых технологий эти проблемы отходят в прошлое.

Дата добавления: 2015-12-17; просмотров: 23; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 1 234 Следующая ⇒

Мы поможем в написании ваших работ!