Статистические методы.



Статистические методы, применяемые в прикладном политическом исследовании, можно упорядочить по двум основаниям: 1) по уровням измерения и 2) по количеству переменных.

Принято выделять три уровня измерения: номинальный, порядковый и интервальный.

Наиболее слабой формой числового выражения является номинальная шкала. Например, при заполнении бланков переписи населения от нас требуется определить свою этно - национальную принадлежность. Каж­дой этнической группе при этом может быть присвоено числовое (1, 2, 3 и т.д.) либо буквенное (а, б, в и т.д.) обозначение. Данные обозначения не содержат никакой информации по поводу сопоставимых качеств той или иной национальности, например, обладает ли группа большей близостью к группе А, выраженной в каком-либо свойстве либо физическом качестве, в сравнении с группой Д. Для номинальной шкалы присвоение числового значения лишено всякого внутреннего содержания и не предназначено для математической обработки. Некоторые явления сопоставимы, так что мы можем упорядочить их согласно некоторому свойству, однако не можем с точностью определить расстояние между ними. Так, мы можем ранжировать респондентов по уровню образования (незаконченное среднее — среднее -незаконченное высшее — высшее), однако мы не можем сказать, что респондент А в 2,35 раза более образован, чем респондент Б. Очевидно, тем не менее, что порядковое измерение обладает большей матема­тической силой, чем номинальное.

Интервальная шкала дает нам наиболее содержательное и гибкое измерение, позволяя определить не только порядок расположения слу­чаев относительно друг друга, но и расстояние между ними. Так, рес­понденты могут быть распределены по уровню дохода, выраженного в денежных единицах, при этом мы можем в точности определить, ка­кова разница между доходами любых двух случаев. Для номинальной шкалы требуется наличие двух условий: стандартной единицы измере­ния и нулевой точки отсчета.

Математическое преимущество интервальных измерений очевидно, и это преимущество определяет стремление аналитиков к конструиро­ванию интервальных шкал в исследованиях социальных, политиче­ских, экономических и иных явлений (табл. 4).

Таблица 4. Уровни измерения.

Тип шкалы Отношения
Номинальная a=b
Порядковая a=b, a>b
Интервальная a=b, a>b, a-b=c, a=bc

 

В зависимости от количества переменных принято выделять одномерные, двухмерные и многомерные измерения.

Для различных уровней измерения применяются соответственно различные измерительные методики и процедуры. Чем выше уровень измерения и чем больше количество переменных, тем более сложные методы анализа можно применять.

Для описания распределения признаков по значениям одной переменной используют два типа статистических процедур.

Первый — измерение средней тенденции — помогает нам выявить наиболее типичные значения, которые наилучшим способом предста­вляют весь комплекс признаков по данной переменной. Второй — измерение дисперсии — показывает, как колеблется (варьирует) отклонение от среднего значения, насколько это среднее репрезентативно для всей совокупности.

Стандартным способом измерения средней тенденции для номинального уровня служит мода, для порядкового — медиана и для интерваного — среднее геометрическое. Соответствующими способами измерения дисперсии являются коэффициент вариации, квантильный размах и стандартное отклонение.

Для двухмерных измерений имеет значение связь между переменными. Если знание значений одной переменной по определенному случаю позволяет сделать некоторые предположения относительно со­ответствующих значений другой переменной, между этими перемен­ными существует связь.

Возникает вопрос: насколько сильна эта связь? В статистике для этого существует показатель коэффициент связи, который обозначает степень возможности определения значений одной переменной для любого случая, базируясь на значении другой.

Второе измерение, которое имеет отношение к анализу двух переменных, — статистическая значимость, определяющая, насколько ве­роятна связь, зафиксированная между двумя признаками в выборке.

В зависимости от выбранного уровня измерения стандартными способами измерения связи между двумя переменными являются лямбда, гамма и коэффициент корреляции.

Многомерные измерения, в свою очередь, предполагают, что все переменные выражены в интервальных значениях. Таким образом, для
номинального и порядкового уровней многомерных методик измерения не существует.

К многомерным методам относятся множественная регрессия, факторный анализ, пат-анализ и др.

Множественная регрессия (применяемая в многомерном измерении) — процедура, обеспечивающая подсчет независимого воздействия
изменений в значениях каждой независимой переменной на значение
зависимой переменной и предсказания значения зависимой переменной на основе знания совместного влияния независимых переменных
Она имеет формулу: •

У = а + b1Х1 + b2X2 +... + bnХn + е,

где У — значение зависимой переменной; a — среднее значение Y, если каждая независимая переменная равна нулю; b1 — среднее изменение У на единицу изменения X1, когда воздействие остальных переменных постоянно; X1 — значение первой независимой переменной; е — погрешность, означающая любое колебание У, не вызванное изменением независимой переменной.

Расчет множественной регрессии (как и в случае двухмерной регрессии) строится на методе наименьших квадратов, т.е. графически линия регрессии должна проходить через множество точек таким образом, чтобы уменьшить до минимума сумму квадратов расстояний каждой точки до этой линии. Разница в том, что в случае множественной регрессии мы имеем не «линию», а множество математически обоснованных точек в многомерном пространстве.

Частный коэффициент регрессии b описывает единичный вклад ка­ждой независимой переменной в определение значений зависимой пе­ременной.

Данный коэффициент (однако методика расчета которого выходит за рам­ки нашего разговора) позволяет осуществить процедуру контролирова­ния (фиксации) переменных, которая является важным шагом во всех формах многомерного анализа.

Контроль в многомерном анализе определяется как поддержание значений некоторой переменной на постоянном уровне при изучении зависимостей между двумя (и более) другими переменными.

Если коэффициент b близок к нулю, мы можем заключить, что непосредственной связи между двумя переменными нет. Это условие яв­ляется необходимым при осуществлении факторного анализа.

Факторный анализ — применяемый в политическом анализе метод многомерной математической статистики, позволяющий на основе измерения парных корреляций между признаками получать набор новых, укрупненных переменных, которые не могут быть измерены на­прямую; их и называют факторами. Число факторов F 'всегда меньше числа исходных признаков.

Для объяснения корреляций между наблюдаемыми признаками можно выдвинуть гипотезу, состоящую в том, что имеется несколько латентных факторов, действием которых и объясняется корреляция между нашими наблюдаемыми признаками. Предполагается, что совокупность этих факторов едина для всех наблюдаемых признаков. Та­кие факторы называют общими.

Естественно предположить, что кроме тех изменений наблюдае­мых признаков, которые вызваны действием общих латентных фак­торов, существуют индивидуальные изменения каждого наблюдаемо­го признака, вызываемые, например, случайными ошибками при их измерении. Причины, вызывающие невзаимосвязанные изменения исходных признаков, называются специфическими (или характерны­ми) факторами.

Что представляют собой общие факторы? Измерить их непосредственно мы не можем. Более того, мы не знаем заранее, что собой представляют эти факторы, сколько их. Однако предполагается, что они существуют.

Общие факторы имеют разное влияние на изменение того или ино­го наблюдаемого признака. Вес общего фактора, определяющий сте­пень его влияния на изменение данного наблюдаемого признака, на­зывается факторной нагрузкой на признак.

Именно действием указанных латентных факторов определяются все корреляции между нашими наблюдаемыми признаками. Это озна­чает, что фиксация значений латентного фактора должна привести к ликвидации связи между наблюдаемыми признаками.

Основное положение факторного анализа (ФА) заключается в том, что каждый наблюдаемый признак можно представить в виде линей­ной комбинации факторов (в данном случае мы рассматриваем только линейный ФА, нелинейные модели практически не используются из-за сложности).

Значения факторных нагрузок, как правило, являются результатом вычислительной процедуры ФА, т. е. предметом интерпретации.

Нарушение принципов теории измерения является одной из типичных и, к сожалению, распространенных ошибок в практике прикладных политических исследований. Причины этого кроются в методологических и психологических обстоятельствах. С одной стороны, как было показано выше, явления политической реальности, значимые для аналитика, с трудом поддаются квантификации (количественному выражению) и часто не могут быть адекватно выражены с соблюдением условий, соответствующих интервальному уровню. Такая ситуация встречается в практике экспертных оценок, когда от экспертов требуется высказать оценку в значениях некоторой порядковой шкалы (например, от 1 до 5).

При этом психологически объяснимое стремление аналитика ис­пользовать в своей работе современные методы высокого уровня - коореляционный, факторный анализ и т.д. — побуждает порой вводить в соответствующие стандартные формулы значения, которые в прин­ципе не могут быть использованы таким образом (в частности, значе­ния ранговых шкал). Действительно, ведь ранжирование объектов со­держит лишь информацию о том, какой из объектов более предпочти­телен, и не содержит информации о том, насколько или во сколько раз один объект предпочтительнее другого.

Может быть, в некоторых заведомо очевидных ситуациях даже та­кая обработка экспертной информации может дать правдоподобный результат. Однако в реальных ситуациях такая обработка информации не может считаться достоверной.

Часто исследователям приходится изучать взаимодействие объек­тов, разделенных во времени. Средством для этого является анализ вре­менных рядов.

Временные ряды — это просто комплекс наблюдений, в которых одна и та же переменная измеряется повторно через определенные ин­тервалы.

Типичное применение анализа временных рядов — исследование по схеме «до введения стимула — после введения стимула». В данном случае мы имеем дело с так называемым прерванным временным рядом. (Пример: уровень преступности до и после изменения в практике пра­воохранительной деятельности.)

Одна из проблем, с которой может при этом столкнуться анали­тик, — регрессия к среднему. Данный эффект проявляется в том, что объекты исследования, имеющие в определенный момент крайние значения по зависимой переменной, при последующих измерениях стремятся вернуться к значениям, близким к среднему значению, независимо от того, подвергались ли они воздействию некоторой гипотетической независимой переменной. Если такая регрессия к среднему происходит в момент исследования, можно ошибочно принять естественную регрессию за результат воздействия независимой переменной. Это может представлять особую проблему в тех случаях, когда объекты исследования подвергаются воздействию независимой переменной именно потому, что у них появляются необычные значения зависимой переменной (пример с преступностью).

Чтобы исключить естественную регрессию, можно применить метод контролируемых временных рядов.

Суть метода контролируемых временных рядов в том, что мы собираем данные о другом объекте (или множестве объектов), который во всех существенных отношениях сходен с исследуемым объектом, но не подвергался воздействию независимой переменной; и этот объект (или группа объектов) используется в качестве контрольного при оценке результатов воздействия независимой переменной (например, один или несколько городов, в которых не вводились новации в практике правоохранительных органов).

Контент-анализ.

Документированные источники используются в прикладном политическом анализе различным образом: одни извлекают из них цитаты высказывания, иллюстрации, подкрепляющие ту или иную точку зрения; другие извлекают содержащиеся в них количественные данные (результаты голосований, статистические данные и т.д.). Контент-анализ не позволяет извлекать количественные оценки из обширных доку­ментированных источников, не содержащих информации в числовом выражении.

Например, аналитик может обратиться к материалам СМИ, посвященным избирательной кампании, с целью выяснения различий в тональности (степени доброжелательности) освещения отдельных кандидатов. Такая работа предполагает переработ­ку сотен газетных статей и новостных материалов в небольшой набор цифр, характеризующих данный предмет исследования.

Суть методики контент-анализа заключается в конструировании набора взаимоисключающих и исчерпывающих категорий, характеризующих предмет исследования, с последующей фиксацией частоты, с которой данные категории встречаются в изучаемых документах.

Первый шаг в проведении контент-анализа предполагает осуществление выборки документов. Если аналитика интересуют политические ценности кандидатов, в выборку следует включать партийные про­граммы и выступления кандидатов; если предметом исследования являются национальные и расовые стереотипы в обществе, выборка мо­жет формироваться из записей телевизионных передач, литературных ихудожественных текстов и т.д. Определившись с общим характером необходимых источников, аналитик затем осуществляет выборку в соответствии со стандартными требованиями, указанными ниже.

Второй шаг в контент-анализе заключается в формировании списка категорий содержания, по которым будет осуществляться замер. Такой список может включать:

- актуальные общественные проблемы;

- альтернативные позиции по отношению к этим проблемам;

- имена политиков, названия политических партий и организаций;

- целевые группы, к которым обращаются кандидаты/партии/ор-
ганизации;

- эмоциональные характеристики тональности:

- поддержка — порицание,

- виновность — невиновность,

- сочувствие — равнодушие и т.д.

Данный шаг представляет собой наиболее важную и творческую часть контент-анализа.

Третий шаг заключается в выборе единицы анализа. Например, по каждому документу аналитик может фиксировать:

- каждое слово,

- каждую тему,

- каждый персонаж,

- каждое предложение,

- каждый абзац,

- документ в целом.

При определении единицы анализа аналитик исходит из соображения идентифицируемости данной единицы (так, слова, абзацы и пред­ложения технически легче идентифицировать, чем «темы» и «сообще­ния»), а также соответствия категориям контента (так, чтобы установить отражение тех или иных «проблем» в средствах массовой информации, новостное «сообщение» будет более адекватной единицей анализа, чем «слово» или «предложение», в то время как для измерения эмоциональной тональности подходит именно «предложение» и «слово»).

Наконец, необходимо выбрать систему измерения категорий:

- наличие или отсутствие упоминания данной категории;

- частота упоминания;

- продолжительность времени/объем текста, посвященного данной

категории;

- интенсивность присутствия и др.

Слабым местом контент-анализа можно считать значительные временные издержки, необходимые для его проведения. Однако с развити­ем компьютерных технологий, формированием обширных полнотексто­вых электронных баз данных (РгоQuest, JStore) и распространением гипертекстовых технологий эти проблемы отходят в прошлое.


Дата добавления: 2015-12-17; просмотров: 23; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!