Особенности построения статистических группировок на основе количественного признака.



Если группировочный признак является дискретным и число его вариантов невелико, то единицы наблюдения разбивают на группы по этим вариантам (годы студентов по году обучения, группы рабочих по квалификационному разряду). Если число вариантов велико (число занятых на предприятии), то их объединяют в интервал. Так же поступают, если признак непрерывный.

Интервалы формируют так, чтобы в каждый попало достаточное число единиц наблюдения.

Это необходимо д/обеспечения точности необходимого анализа.

Чтобы не получить "пустые" интервалы - удаляют "аномальные" наблюдения. Значение признака упорядочивают по величине и удаляют по краям те, которые сильно отличаются от смежных значений.

При большом числе единиц (n>30) оптимальное число вариантов определяют по формуле Стерджесса:

К = 1 + 3,322 * lgn

При незначительной вариации признака интервалы делают равными

h = (Xmax - Xmin) / K

X - максимальное и минимальное значение признака

Если вариация имеет нормальный хар-р,то

G (сигма) - среднеквадратичное отклонение

Xmin = Xcp - 3G

Xmax = Xcp + 3G

X cp - среднее значение признака.

Если вариация значительна, то, как правило, она имеет ассиметричный характер. (Пр: с ростом выручки от реализации число предприятий уменьшается)

В таких случаях целесообразны неравные интервалы, изменяющиеся:

1) в арифметической прогрессии:

h i+1 = hi + a

a не равна 0, a = const

a>0 - интервалы возрастают

a<0 – убывают

2) в геометрической

h i+1 = hi*q

q – положительная константа

q не равно нулю и единице

q>1 – интервалы возрастают

0<q<1 – интервалы убывают

Если изменение груп. признака приводит к появлению нового качества, то границы интервалов ставят там, где новое качество сменяет старое.В этом случае число интервалов и их ширина являются произвольными.

При непрерывных значениях признакаправая и левая границы смежных интервалов совпадают ( Пр: интервалы стоимости основных фондов 1000 р)

100-200

200-300

Непонятно к какому интервалу отнести 200. Для устранения неопределенности справа от первого интервала ставят знак (+) или (-)

(+) значит,что правая граница включена в интервал, если (-), то нет.

Это правило распространяется на все спорные границы. При дискретном признаке такая неопределенность не возникает, например , по числу работников:

50-100

101-200

201-300

Границы интервалов могут быть как закрытыми(с двумя границами), так и открытыми (с одной границей - например до 100; 800 и более).

Ширину таких интервалов определяют исходя мз общей тенденции измененя ширины всех интервалов.

Если такой тенденции нет, то ширину полагают равной ширине смежного интервала.

 

Ряды распределения статистических величин, основные понятия и классификация. Примеры.

 

Если простая группировка содержит только данные о числе единиц в каждой группе, то такую группировку называют рядом распределения.

Различают:

1) аттрибутивные ряды, когда признак является аттрибутивным (качественным)

Пр.: 

группы предприятий по форме собственнсти - число предприятий

государственные - 120

АО - 510

частные - 370

Итого 1000

2) вариационные, когда признак - количественный

Элементы вариационного ряда:

а) варианты - отдельные значения или интервалы значений признака

б) частоты - числа, показывающие сколько раз встречается тот или иной вариант

Вариационные ряды делятся на

*дискретные (дискрен. груп. признак) иеет отдельн. значение.

* интервальные - имеет интервальное значение

Дискретный:

группы квартир по числу комнат - число квартир

1 - 10

2 - 40

3 - 20

4 - 10

Итого - 80

Интервальный

группы пр-тий по величине баланс. приб, тыс. руб - число предприятий

1000-2000 -- 40

2000-3000 -- 80

3000-4000 -- 20

Итого -- 140

Показатели структуры статистического ряда распределения, варианты их расчета.

Для характеристики структуры вариационных рядов рассчитывают моду (Мо) и медиану (Ме)

Мода - значение признака, наиболее часто встречающееся в ряду.

 

Медиана - делит ряд таким образом, что одна половина единиц наблюдения имет значение признака не более, чем медиана, другая - не менее.

В дискретном ряду мода равна варианту с наибольшей частотой. Медиана равна значению первого варианта, для которого накопленная частота превышает сумму всех частот.

Накопленная частота получается суммированием частоты рассматриваемого варианта и частот всех предшествующих этапов.

В интервальном ряду сначала определяют интервал, где находится мода и медиана.

при равных интервалах, модальный интервал определяется так же как в дискретном ряду ( по максим. частоте), при неравных - их частоту заменяют на плотность распределения.

Pi = Fi / Hi
Fi - частота i-того интервала

Hi- ширина интервала

Pi - плотность распределения
При этом модальным будет тот интервал, плотность которого максимальна.

Медианный интервал определяют так же как едиану в дискретном ряду.

Конкретные значения моды и медианы рассчитывают по формулам.

Мода при равных интервалах:

X мо - начало мод. интервала

Hмо - ширина

F мо - частота

F Мо-1 - частоты интервалов перед модальным

 F Мо+1 - и после него

Неравные интервалы :

Р мо - плотность распределения мод интервала

Медиана.

H ме - ширина

X ме - начало

F ме - частота

Fj - частота каждого j-того интервала

SМe-1 -- накопленная частота интервала перед медианным интервалом.

 


Дата добавления: 2021-01-21; просмотров: 59; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!