Мера разброса: определение, основные виды с примерами, место и роль в изучении собранных данных, основные направления работы с ними.



Для более полного описания результатов эмпирического исследования используются меры разброса данных, характеризующие степень индивидуальных отклонений от центральной тенденции. Это самый простой показатель, который можно получить для выборки - разность между максимальной и минимальной величинами данного конкретного вариационного ряда. Мера разброса данных позволяет сравнивать между собой разные группы. Чем сильней варьирует измеряемый признак, тем больше величина разброса данных и наоборот.

Например, если изучаемый признак – возраст, то две совокупности людей из 6-ти человек каждая, характеризующиеся следующими значениями возраста, будут иметь одинаковое среднее арифметическое:

10, 10, 10, 50, 50, 50

30, 30, 30, 30, 30, 30.

В то же время совершенно ясно, что практически для любой социологической задачи это будут совсем разные совокупности. И узнать это можно, только как-то оценив степень разброса значений возраста в каждой из них: в первой – разброс большой, во второй – он отсутствует. Способов оценки степени разброса существует много. Выбор их в первую очередь зависит от типа используемых шкал.

Необходимо отметить, что данная мера крайне неточна и неустойчива. Единственный необычно высокий или низкий результат может повлиять на величину размаха.

Из математической статистики известно, что самой известной мерой разброса количественного признака является его дисперсия:

(напомним, что в знаменателе величина объема выборки уменьш. на единицу для того, чтобы сделать соответствующую точечную выборочную оценку дисперсии несмещенной; s – ср. квадратическое отклонение).

(Из другого учебника)Дисперсия характеризует насколько частные значения отклоняются от средней величины в данной выборке. Чем больше дисперсия, тем больше отклонение или разброс данных. Дисперсия определяется по следующей формуле (так же на всякий случай):

где - дисперсия - выражение, означающее, что для всех значений x от первого до последнего в данной выборке вычисляется разность между частными и средними значениями, эти разности возводятся в квадрат и суммируются

n - объем выборки )

Для порядковых шкал обычно используют какие-либо разницы между квантилями. Например, употребительной мерой является квартильный размах: Q3 - Q1. Но, строго говоря, это некорректно, поскольку для порядковой шкалы разности между шкальными значениями не являются осмысленными.

Максимальным разброс целесообразно считать при равномерном распределении. Чем ближе распределение к равномерному – тем разброс больше, чем дольше от равномерного – тем разброс меньше. Известны по крайней мере две меры разброса, опирающиеся на этот принцип – мера качественной вариации и энтропийный коэффициент разброса. (пример с цветом свитеров).

Ясно, что для номинальных признаков некорректным является использование всех приведенных выше мер разброса. Попытаемся понять, как можно интерпретировать такой разброс. Предположим, что в аудитории сидят 100 человек, на которых могут быть надеты свитеры пяти разных расцветок: синие, красные, белые, желтые и зеленые. Вероятно, естественно предполагать, что разброс значений признака “цвет свитера человека” минимален (отсутствует), когда все люди одеты в свитеры одного цвета. Максимальным же разброс естественно считать в том случае, когда все цвета встречаются одинаково часто: 20 человек одеты в синие свитера, 20 человек – в красные и т.д. Другими словами максимальным разброс целесообразно считать при равномерном распределении. Чем ближе распределение к равномерному – тем разброс больше, чем дольше от равномерного – тем разброс меньше. Известны по крайней мере две меры разброса, опирающиеся на этот принцип – мера качественной вариации и энтропийный коэффициент разброса.

 

 


Дата добавления: 2018-02-15; просмотров: 2067; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!