Типы шкал и процедура шкалирования



Номинальное шкалирование – такое шкалирование, при котором возможна произвольная кодировка вариантов ответов анкеты как цифрами, так и буквами.

В этом случае сравнение, например, цифр («больше» – «меньше») не имеет никакого смысла. Таким образом, тип кодировки вариантов ответа не имеет значения.

1-Путин з-Зюганов
2-Зюганов я-Явлинский
3-Явлинский п-Путин.

 

1- уверен а- уверен
2- сомневаюсь б- сомневаюсь
3-затрудняюсь ответить в-затрудняюсь ответить.

При номинальном шкалировании возможно лишь сравнение частот.

Порядковое шкалирование – такое шкалирование, при котором имеет смысл присвоение значений вариантам ответов и имеет смысл порядок такого присвоения.

1- Очень плохо
2- Плохо
3-Удовлетворительно
4 - Хорошо

 

 В этом случае возможно говорить о «равенстве – неравенстве» переменных и о соотношениях «больше – меньше».

Любые другие выражения, например, разности значений (4 – 1 = 5 – 2) не имеют смысла.

Интервальное шкалирование – шкалирование, при котором имеет смысл присвоение значений вариантам ответов, при котором переменным присваиваются не дискретные числа, а интервалы значений.

  

1 – 5000-10000

2 – 1000-15000

3 – 1500-2000

4 – 20000-30000

 В этом случае возможно сравнение значений переменных, о соотношениях, а также о расстояниях между альтернативами. 

Количественное шкалирование – шкалирование, при котором переменным присватываются дискретные числа

Примеры определения  операций, к которым относятся переменные различных шкал:

Шкала Переменная Значения переменной Применяемые операции
Номина-льная Пол (дихотомическая) 1-мужской, 2-женский

Частотный анализ.

Группировка по категориям переменных.

Ранговая корреляция (для дихотомических).

 Сравнение выборок.

Номина-льная Семейное положение 1-холост, 2-состою в браке, 3-вдов, 4- разведен
Ппорядковая   Занятия спортом   1-не занимаюсь, 2-изредка, 3- периодически, 4-интенсивно   Частотный анализ, медиана, среднее значение. Выявление корреляции с другими переменными (коэффициент ранговой корреляции). Для сравнения различных выборок переменных возможно применение непараметрических тестов.
Порядковая   Месячный доход 1 = до 3000 $, 2 = 3001 - 5000 $, 3 = более 5000 $,

Частотный анализ, медиана, среднее значение. Выявление корреляции с другими переменными (коэффициент ранговой корреляции).

 

Для сравнения различных выборок переменных возможно применение непараметрических тестов.

 

Любые статистические методы без ограничений

Интер-вальная Коэффициент интеллекта (IQ)
Количес-твенная Возраст  

Эмпирическая значимость статистических шкал

Статистическая шкала Эмпирическая значимость
Номинальная Нет
Порядковая Порядок чисел
Интервальная Разность чисел
Шкала отношений Отношение чисел

На практике, в том числе в SPSS, различие между переменными, относящимися к интервальной шкале и шкале отношений обычно несущественно. 

Если переменные, относящиеся к номинальной шкале не являются дихотомическими, вычисление коэффициентов ранговой корреляции не имеет смысла.

 


Часть 2. Описательная статистика

Меры средней тенденции и разброса вариаций значений признака.

Признак– некоторое общее для всех изучаемых объектов качество, конкретные проявления которого меняются от объекта к объекту и могут быть измерены.

Значение признака – конкретное проявление того или иного признака.

 В анализе данных важное значение имеет построение частотных таблиц, предназначенных для описания данных, их компактного представления и формулировки предварительных выводов относительно исследуемых вопросов.

 абсолютная частота  относительная частота (относительно всех опрошенных, %)   относительная частота (относительно выбравших данный вариант ответа, %)  кумулятивная частота
число переменных с определенным значением признака. процент респондентов среди всех опрошенных имеет то или иное значение признака. процент респондентов, исключая тех, кто не ответил, имеет то или иное значение признака. процент случаев (исключая тех, кто не ответил), которые имеют значение меньше или равное определенной градации.

 

Меры центральной тенденции указывают на расположение среднего, или типичного, значения признака, вокруг которого предположительно сгруппированы остальные наблюдения.

Модаэто такое значение признака, которое встречается чаще всего.

Мода рассчитывается для любого типа шкал.

Например, в представленном ниже числовом ряде модальным будет являться значение 3.

3, 4, 5, 3, 3, 3, 4, 4, 5, 3, 3

Числовой ряд может содержать не обязательно одну, но и две, и три моды. Например,

1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4

содержит две моды «1» и «2».

Медиана  – это значение признака, которое делит ранжированный вариационный ряд на две равные части, так что  50% наблюдений оказывается меньше медианы,  а 50% наблюдений – больше медианы.

Медиана – это 3-й квартиль распределения.

Например: 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3, 3.

Медианное значение равняется 2.

Если число переменных в группе наблюдений четное, то медианой будет среднее двух центральных значений. 

Среднее арифметическое отношениесумы всех значений наблюдений к общему числу наблюдений:

,

где Хi – наблюдаемые значения, n – число наблюдений.

Суть данной меры в том, что сумма расстояний от среднего арифметического до объектов, имеющих большее значение, равна сумме расстояний до объектов, имеющих меньшее значение. Поэтому, естественно, что мы можем ее использовать только для шкал, где вычисление расстояний между объектами имеет смысл, то есть для числовых шкал.

Для номинальных дихотомических признаков, закодированных нулями и единицами, можно считать среднее арифметическое (и соответственно дисперсию), нужно лишь уметь правильно интерпретировать полученный результат. Например: 0 – мужчины; 1 – женщины. Тогда среднее значение будет равно k/n, где k – число женщин (или признаков равных 1).

Если `Х = 0, значит в нашей выборке одни мужчины.

Если `Х = 1, значит в нашей выборке одни женщины.

Если `Х = 0,5, значит половина женщин и половина мужчин.

Если 0 <`Х < 0,5 – в совокупности женщин меньше 50%.

Если 0,5 <`Х < 0 – в совокупности женщин больше 50%.

 При  работе с мерами центральной тенденции следует учитывать, что для каждого типа шкал следует вычислять различные меры центральной тенденции.

номинальных переменные мода
порядковые переменные медиана
количественные переменные среднее значение
дихотомические переменные среднее значение

 

Следует учитывать, что меры центральной тенденции адекватно отражают реальную ситуацию только для однородной совокупности, а выбор и расчет таких мер определяется общей формой распределения.

Важной мерой вариации является понятие квартиля.

Первый квартиль отсекает 25% наблюдений с наименьшим значением признака, второй (медиана) – 50% наблюдений, третий квартиль – 75% наблюдений.

Квартильный размах   интервал, в котором вокруг медианы сосредоточилось 50% респондентов.

Квартильный размах  является единственной мерой вариации для порядковых шкал.

Дисперсия позволяет судить об отклонениях каждого отдельного наблюдаемого значения от среднего. Чем меньше значение дисперсии, тем более однородной является совокупность.

Для дихотомических признаков дисперсию можно интерпретировать следующим образом: дисперсия равна нулю, если все объекты либо обладают, либо не обладают анализируемым свойством, т.е. если совокупность однородна, а ее максимальное значение   достигается в случае равномерного распределения.

Стандартное отклонение – величина, равная квадратному корню из дисперсии.

 Для любого нормального распределения, не менее 68% наблюдений будут попадать в промежуток ± одно стандартное отклонение от среднего арифметического значения, для ± трех стандартных отклонений внутри указанного интервала окажутся не менее 99,97% наблюдений.

 


Дата добавления: 2018-04-04; просмотров: 451; Мы поможем в написании вашей работы!






Мы поможем в написании ваших работ!