Меры центральной тенденции: медиана



Медиа́на (от лат. mediāna — середина) в математической статистике — число, характеризующее выборку (например, набор чисел).

Термин был впервые введен Гальтоном, 1882.

Если все элементы выборки различны, то медиана — это такое число выборки, что ровно половина из элементов выборки больше него, а другая половина меньше него. В более общем случае медиану можно найти, упорядочив элементы выборки по возрастанию или убыванию и взяв средний элемент. Например, выборка {11, 9, 3, 5, 5} после упорядочивания превращается в {3, 5, 5, 9, 11} и её медианой является число 5. Если в выборке чётное число элементов, медиана может быть не определена однозначно: для числовых данных чаще всего используют полусумму двух соседних значений (то есть медиану набора {1, 3, 5, 7} принимают равной 4)

Меры центральной тенденции: среднее арифметическое. Среднее и выбросы.

Сре́днееарифмети́ческое (в математике и статистике) множества чисел — сумма всех чисел, делённая на их количество. Является одной из наиболее распространённых мер центральной тенденции.

Предложена (наряду со средним геометрическим и средним гармоническим) ещё пифагорейцами.

Частными случаями среднего арифметического являются среднее (генеральной совокупности) и выборочное среднее (выборки).

Заметим, что имеется несколько других «средних» значений, в том числе среднее степенное, среднее Колмогорова, гармоническое среднее, арифметико-геометрическое среднее и различные средне-взвешенные величины (например, среднее арифметическое взвешенное, среднее геометрическое взвешенное, среднее гармоническое взвешенное).

В статистике выбросы – это значения, резко отличающиеся от других значений в собранном наборе данных. Выброс может указывать на аномалии в распределении данных или на ошибки при измерениях, поэтому зачастую выбросы исключаются из набора данных. Исключив выбросы из набора данных, можно прийти к неожиданным или более точным выводам

 

 

Понятие мер изменчивости

Меры изменчивости – статистические показатели вариации (разброса) признака (переменной) относительно среднего значения, степени индивидуальных отклонений от центральной тенденции распределения; позволяют судить о достоверности и однородности полученной эмпирически совокупности данных, существенности сходств и различий в распределении и сравниваемых группах распределений, точности проведенных измерений.

В качестве наиболее часто используемых мер изменчивости следует назвать размах, дисперсию, стандартное отклонение.

Размах – это разница между максимальным и минимальным значениями.

Для определения размаха выборку необходимо сначала уорядочить. Например, в массиве данных {8, 9, 11, 12, 12, 13, 14, 17, 19, 19, 20, 20} размах будет равен разности между наибольшим и наименьшим значениями, то есть 20 – 8 = 12. но если бы выборка была неупорядочена и имеет большой объем, было бы трудно найти минимальное и максимальное значения.

Дисперсия – это мера разброса данных относительно среднего значения.

Стандартное отклонение представляет собой квадратный корень из дисперсии.

По ряду причин этот показатель является более удобным чем дисперсия.

Меры изменчивости: размах. Размах и выбросы

Размах (иногда эту величину называют разбросом выборки) измеряет на числовой шкале расстояние, в пределах которого изменяются оценки, и обозначается буквой R. Это самый простой показатель, который можно получить для выборки, – разность между максимальным и минимальным значениями вариационного ряда.

Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина R, и наоборот.

Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный.            Для того чтобы более четко представлять характер варьирования выборок, следует обратиться к их распределениям.

Размах вводит в заблуждение, если одно из значений есть выброс. В статистике выбросы – это значения, резко отличающиеся от других значений в собранном наборе данных. Выброс может указывать на аномалии в распределении данных или на ошибки при измерениях, поэтому зачастую выбросы исключаются из набора данных. Исключив выбросы из набора данных, можно прийти к неожиданным или более точным выводам.

 

 

Меры изменчивости: дисперсия

Один из способов измерения рассеяния данных заключается в том, чтобы определить степень отклонения каждого наблюдения от средней арифметической. Очевидно, что чем больше отклонение, тем больше изменчивость, вариабельность наблюдений.

Однако мы не можем использовать среднее этих отклонений как меру рассеяния, потому что положительные отклонения компенсируют отрицательные отклонения (их сумма равна нулю). Чтобы решить эту проблему, мы возводим в квадрат каждое отклонение и находим среднее возведенных в квадрат отклонений; эта величина называется вариацией, или дисперсией.

Квадратный корень из дисперсии называется стандартным отклонением.

Следует отличать теоретическую (генеральную) дисперсию — меру изменчивости бесконечного числа измерений (в генеральной совокупности, популяции в целом) и эмпирическую, или выборочную, дисперсию — для реально измеренного множества значений признака. Выборочное значение в статистике используется для оценки дисперсии в генеральной совокупности.

Свойства дисперсии:

1. Если значения измеренного признака не отличаются друг от друга (равны между собой) — дисперсия равна нулю. Это соответствует отсутствию изменчивости в данных.

2. Прибавление одного и того же числа к каждому значению переменной не меняет дисперсию


Дата добавления: 2018-08-06; просмотров: 965; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!