Построить по исходным данным вариационный ряд.



Лабораторная работа № 6

Методы проверки данных на нормальность

 

Для правильного выбора адекватных описательных статистик и метода статистического анализа необходимо определить, как распределены количественные данные. В математической статистике выделяют большое число видов распределений. На практике часто ограничиваются делением рас-пределений на два класса: нормальные и ненормальные распределения.

Графиком нормального распределения (рис. 1) является симметричная колоколообразная кривая, которая задается уравнением:

Кривая нормального распределения полностью определяется средней арифметической и стандартным отклонением –

 

Рис. 1. График нормального распределения

 

Для нормального распределения значения средней и медианы примерно равны.

Для ненормальных распределений соотношение средней и медианы выглядит следующим образом (рис.2):

 

Рис. 2. Среднее и медиана для ненормальных распределений

 

Очевидно, что интерпретация среднего значения для ненормального распределения не даст ответов на поставленные вопросы. Поэтому для ненормальных распределений интерпретируют медиану.

 

Проверка на нормальность.

Для проверки количественных данных на нормальность используются следующие методы:

Графические

1.1. Гистограмма

 

Нормальное распределение Ненормальное распределение

 

 

1.2. Ящик с усами

Идея построения диаграммы ящик с усами представлена на Рис. 3.

 

Рис.3. Идея построения «ящика с усами»

 

 

2. Аналитические

Для аналитической проверки на нормальность существует огромное число тестов, например, критерий Хи-квадрат, критерий Колмогорова, Шапиро-Уилка и другие. Рассмотрим критерий Жарка-Бера (Jarque-Bera). Идея этого критерия заключается в том, что по данным выборки оценивается скошенность (асимметрия) и «вытянутость» фактического распределения и сравнивается с нормальным.

За оценку асимметрии распределения отвечает коэффициент асимметрии:

(здесь i x – середины интервалов группировки, ).

В пакете Microsoft Excel за вычисление коэффициента асимметрии отвечает функция =СКОС(исходная выборка).

 

 

За оценку «вытянутости» распределения отвечает эксцесс:

 

(здесь i x – середины интервалов группировки, ).

 

В пакете Microsoft Excel за вычисление эксцесса отвечает выражение =ЭКСЦЕСС(исходная выборка)

 

1) Выдвинуть гипотезу о нормальном распределении выборки. H0

2) Вычислить фактическое значение критерия по формуле:

 

 

3) Определить табличное значение критерия на основе специальных таблиц критических значений Пирсона на уровне значимости 0,05 и числе степеней свободы Уровень значимости– это вероятность ошибиться, утверждая, что распределение ненормальное. Общепринятым является вероятность ошибки не превышающая 5%.

Число степеней свободы, в данном случае, отвечает за количество параметров в формуле критерия: там участвуют асимметрия и эксцесс.

4) Если J-B>табличного значения критерия, то гипотеза H0 о нормальном распределении выборки отклоняется, т.е. распределение не является нормальным.

Если J-В<табличного значения критерия, то гипотеза H0 о нормальном распределении выборки принимается, т.е. распределение является нормальным.

 

Важно! Если объем выборки N< 30, то считают, что данные распределены ненормально. Но если известно, что выборка извлечена из нормально распределенной совокупности, то тогда можно говорить о нормальности.

 

Задание №1

Данные обобъемах продаж колбасы «ХХ» по месяцам, млн. р.

Построить по исходным данным вариационный ряд.

Рис. 4. Интервальный вариационный ряд

 


Дата добавления: 2018-11-24; просмотров: 172; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!