Показатель эксцесса (островершинности)



Семестр 1

Группировка статистических данных и ее роль в анализе информации

 

Равный интервал, величина интервала - , m – число групп

Формула Стерджесса (величина интервала) - , n – число наблюдений

Абсолютные, относительные, средние величины

Относительные величины

Относительные величины (ОВ) динамики характеризуют изменение явления во времени. (Коэффициент роста)

Темп роста – с переменной базой - yn– уровень явления за период(например, выпуск продукции по кварталам года)

С постоянной базой - , yk – постоянная база сравнения

ОВ планового задания -

ОВ выполнения плана -

ОВ динамики -

ОВ структуры характеризуют долю отдельных частей в общем объеме совокупности (удельный вес) -

ОВ координации отражают отношение численности двух частей единого целого, т. е. показывают, сколько единиц одной группы приходится в среднем на одну, на 10 или на 100 единиц другой изучаемой совокупности.

ОВ координации -

ОВ наглядности (сравнения) отражают результаты сопоставления одноименных показателей, относящихся к одному и тому же периоду времени, но к разным объектам или территориям (например, сравнивается годовая производительность труда по 2-м предприятиям)

ОВ сравнения -

 

Средние величины

Степенные средние общего типового расчета:

 

 

Значе-ниеk

Наименование средней

Формула средней

Простая Взвешенная
-1 Гармоническая ,
0 Геометрическая
1 Арифметическая ,
2 Квадратическая

гарм. < геом< арифм< квадрат, x=w/f

Гармоническая простая – когда небольшая совокупность и индивидуальные значения не повторяются. Используется, если исчисляем среднюю из обратных величин.

Средняяквадратическая – для расчета среднего квадратического отклонения, являющегося показателем вариации признаков

Средняя геометрическая простая – для вычисления среднего коэффициента роста (темпа) в рядах динамики, если промежутки, к которым относятся коэффициенты роста, одинаковы.

 

Статистические распределения и их характеристики

Мода – значение признака, которое наиболее часто встречается в совокупности

, - нижняя граница модального интервала (интервал с наибольшей частотой), - величина интервала, - частота в модальном интервале.

Медиана – значение признака, которое лежит в середине ранжированного ряда и делит этот ряд на две равные по численности части.

 - положение медианы

, - нижняя граница медианного интервала, - накопленная частота интервала, предшествующего медианному, - частота медианного интервала.

Квартель

,

,

Дециль

, (от 1/10 до 9/10)

 

Показатели вариации (колеблемости) признака

Среднее линейное отклонение – на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.

-для несгруппированных данных (первичного ряда):

-для вариационного ряда:

Среднееквадратическое отклонение

-для несгруппированных данных:

-для вариационного ряда:

Дисперсия

-для несгруппированных данных:

-для вариационного ряда:

Коэффициент вариации (используется для характеристики однородности совокупности по исследуемому признаку)

 - до 17% – совокупность совершенно однородна, 17%-33% - достаточно однородна, >33% - неоднородна.

 

Сложение дисперсий

Величина общей дисперсии ( ) характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц данной совокупности

, - общая средняя арифметическая для всей совокупности

Межгрупповая дисперсия ( ) отражает систематическую вариацию, т. е. различия в величине изучаемого признака, которые возникают под влиянием фактора, положенного в основу группировки

, - средняя в каждой группе, - число единиц в каждой группе

Средняя внутригрупповая дисперсия ( ) характеризует случайную вариацию, возникающую под влиянием других, неучтенных факторов, и не зависит от условия (признака-фактора), положенного в основу группировки.

, где - дисперсия по отдельной группе

или

Равенство:

Корреляционное отношение

, >0,5 – связь между групповым фактором и результирующим признаком – тесная, <0,5 – связь слабая

 

Показатель асимметрии

, - центральный момент третьего порядка

Средняя квадратическая ошибка: , n – число наблюдений

Если , асимметрия существенна и распределение признака в генеральной совокупности не является симметричным. Если , асимметрия несущественна, ее наличие объясняется влиянием случайных обстоятельств.

 - правосторонняя асимметрия, - левосторонняя асимметрия.

 

Показатель эксцесса (островершинности)

, - центральный момент четвертого порядка

>0 – высоковершинное, < 0 – низковершинное ( = -2 – предел)

Средняя квадратическая ошибка: n – число наблюдений

Кривые распределения

Кривая линия, которая отражает закономерность изменения частот в чистом, исключающем влияние случайных факторов виде, называется кривой распределения.

Плотность распределения (расчет теоретических частот)

, - нормированное отклонение

,  - определяется по таблице (приложение 1)

 

Критерий согласия К. Пирсона (для проверки близости теоретического и эмпирического распределений, для проверки соответствия эмпирического распределения закону нормального распределения)

f – эмпирические частоты в интервале, f – теоретические частоты в интервале

Критерий согласия Романовского

, m – число групп, m-3 – число степеней свободы при исчислении частот нормального распределения

Если к<3, то можно принять гипотезу о нормальном характере эмпирического распределения

 

Критерий Колмогорова

, D – максимальное значение разности между накопленными эмпирическими и теоретическими частотами, n – сумма эмпирических частот

 

Распределение Пуассона (теоретические частоты)

, n – общее число независимых испытаний, λ – среднее число появления редкого события в n одинаковых независимых испытаниях, m – частота данного события, е=2,71828

 

 

Выборочное наблюдение

N – объем генеральной совокупности

n – объем выборочной совокупности (число единиц, попавших в выборку)

- генеральная средняя (среднее значение признака в генеральной совокупности)

- выборочная средняя

р – генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности)

w – выборочная доля

- генеральная дисперсия

- выборочная дисперсия

- среднее квадратическое отклонение признака в генеральной совокупности

S – среднееквадратическое отклонение признака в выборочной совокупности.

 

Неравенство Чебышеба

При неограниченном числе наблюдений, независящих друг от друга из генеральной совокупности с вероятностью сколь угодно близкой к 1, можно утверждать, что расхождение между выборочной и генеральной средней будет сколь угодно малой величиной .

Теорема Ляпунова

Дает количественную оценку ошибки. При неограниченном объеме из генеральной совокупности с Р расхождения выборочной и генеральной средней равна интегралу Лапласа

, - нормированная функция Лапласа (интеграл Лапласа)

 

Р – гарантированная вероятность

t – коэффициент доверия, зависящий от Р

 

Р 0,683 0,954 0,997
t 1 2 3

- предельная ошибка выборки

, - стандартная среднеквадратическая ошибка

, - предельная (максимально возможная) ошибка средней, t – коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки

, - предельная (максимально возможная) ошибка доли

Средняя ошибка (n>30) при случайной повторной выборке:

,

При случайной бесповторной выборке:

,

 


Дата добавления: 2018-04-15; просмотров: 339; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!