Задачи статистического изучения явлений во времени



ТЕМА 1.5. ПОКАЗАТЕЛИ ВАРИАЦИИ

 

1.5.1. Понятие вариации.

1.5.2. Показатели вариации.

1.5.3. Правило сложения дисперсии.

 

Понятие вариации

 

Вариация— это наличие различий у отдельных единиц сово­купности по какому-либо признаку.

Эта категория занимает особое место в статистической науке, ибо именно наличие вариации единиц совокупности предопределяет необходимость статистики. Если бы отдельные единицы сово­купности имели они и те же значения признаков (например, рост, возраст у всех живущих людей был бы одинаковый), то для изу­чения данной совокупности по этим признакам достаточно было бы изучить только одну единицу совокупности. Однако зачастую значения признаков колеблются, изменяются при переходе от од­ной единицы к другой. Как правило, вариация является порожде­нием следующих причин:

— своеобразие условий, в которых происходит развитие от­дельных единиц совокупности;

— неравномерность развития отдельных единиц.

Например, причиной вариации роста у отдельно взятых людей является генетическая особен­ность каждого организма (основная причина), особенности питания, экологическая обстановка и т.д.; вариация урожайности может быть вызвана климатическими, почвенными особенностями зоны про­израстания, режима и возможности полива, качеством посадочного материала и т.д.

Вариация существует во времени и в пространстве.

Под вариаци­ей в пространстве понимается колеблемость значений признака по отдельным территориям (урожайность пшеницы в разных ре­гионах).

Под вариацией во времени подразумевается объективное измене­ние значений признака в разные периоды (или моменты). Напри­мер, со временем изменяется средняя продолжительность пред­стоящей жизни, доходность предприятий отрасли, уровень по­требностей людей и т.д.

Изучение вариации имеет важное значение, так как вариация ха­рактеризует степень однородности совокупности. Однородность совокупности — необходимое условие при расчете большинства статистических показателей, в частности средних величин.

Показатели вариации

 

Показатели вариации являются необходимым дополнением при расчете средних величин, так как определяют степень однород­ности совокупности.

Система показателей вариациивключает следующее:

— размах вариации;

— среднее абсолютное (линейное) отклонение;

— среднее квадратическое отклонение;

— дисперсия;

— коэффициент вариации.

Значение показателей вариации:

— характеризуются размеры вариации признака;

— показатели вариации дополняют систему средних величин, в которой затушевываются индивидуальные различия;

— показатели вариации позволяют охарактеризовать уровень однородности совокупности;

— с помощью показателей вариации, путем сравнения вариа­ции у отдельных признаков (разных), есть возможность измерить взаимосвязь между этими признаками.

Первый показатель, так называемый размах вариации,— наи­более простой из показателей, характеризует абсолютные разме­ры изменения признака и определяется как разница максимально­го и минимального значений признака:

Несмотря на простоту расчета, этот показатель имеет важный не­достаток — учитывает только два приграничных значения. В случае аномальности одного или двух приграничных значений, он может исказить действительную вариацию совокупности.

Для того чтобы избавиться от этого недостатка, рассчитывают отклонение каждой индивидуальной величины от средней по со­вокупности. Таким образом, учитывается значение каждой еди­ницы совокупности. Для того чтобы охарактеризовать это откло­нение одним числом, рассчитывают среднюю из этих значений. Данный показатель носит название среднее абсолютное (линей­ное) отклонениеи определяется следующим образом:

- простой вид;

 - взвешенный вид (для сгруппированных данных);

где  d(L) — среднее абсолютное (линейное) отклонение;

 х — индивидуальное значение признака (варианта);

— среднее из значений признака;

 п — численность совокупности;

 f — частота.

Среднее линейное отклонениехарактеризует средний размер отклонений индивидуальных значений признака от средней вели­чины. Таким образом, он характеризует абсолютные размеры ва­риации, имеет те же единицы измерения, что и признак, вариа­цию которого характеризует.

Недостаток: ввиду того, что применяется модуль, затруднено проведение математических операций. Поэтому он применяется редко.

Для того чтобы избавиться от недостатка предыдущего показате­ля, разницу между индивидуальным значением и средней возве­дем в квадрат и затем извлечем корень квадратный из полученно­го среднего значения. Полученный показатель будет называться среднее квадратическое отклонение:

- простая.

- взвешенная.

Играет ту же роль, что и среднее абсолютное отклонение, но, имеет перед ним одно преимущество, а именно, с ним проще проводить математические операции. Ввиду этого в 90 случаях из 100 используется этот показатель.

Еще более удобный для математических преобразований показа­тель вариации — дисперсия,который представляет собой сред­нее квадратическое отклонение в квадрате:

- простая,

- взвешенная.

 

С помощью дисперсии и среднего квадратического отклонения измеряются взаимосвязи между различными признаками. Кроме того, по этим показателям можно сравнивать совокупности в смысле их однородности по одинаковым признакам.

Вывод об однородности совокупности позволяет сделать коэффициент вариации, который может быть рассчитан несколькими способами в зависимости от исходной информации:

- характеризует средний процент отклонений индивидуальных значений признака от средней величины.

,

,

,

где V – коэффициент вариации;

σ – среднее квадратическое отклонение;

d (L) – среднее линейное отклонение;

ХМОмода (структурная средняя);

ХМЕмедиана  (структурная средняя).

Коэффициент вариации имеет большое значение. Он позволяет сравнивать уровень вариации по различным признакам и используется для характеристики однородности совокупности. Если коэффициент вариации меньше 33%, то совокупность однородна.

 

Пример расчета показателей вариации.

Распределение студентов вуза по возрасту характеризуются следующими данными (табл. 1):

Таблица 1

Возраст студентов, лет Число студентов очно-заочного отделения, чел. Число студентов дневной формы обучения, чел. Хi,лет
17—20 5 60 12,5
20—23 36 120 21,5
23—25 48 90 24,0
25—28 52 55 26,5
28—30 80 10 29,0
30 и старше 99 3 31,0

Рассчитайте показатели, характеризующие вариацию возраста студентов для каждой формы

обучения. Сравните полученные результаты.

Рассчитаем показатели вариации, характеризующие совокупность студентов очно-заочной формы

обучения.

1. Размах вариации:

R = xmax – xmin = 31 - 18,5 = 12,5 (лет)

2. Средняя арифметическая:

3. Среднее линейное отклонение:

Возраст отдельно взятого студента отклоняется от среднего по совокупности возраста — 27 лет — на 3 года. То есть можно утверждать, что возраст наибольшего числа студентов не будет выходить за границы интервала: от 24,3 до 30,4 лет.

27,36 - 3,07 < 27,36 < 27,36+ 3,07.

Среднее квадратическое отклонение:

Среднее квадратическое отклонение также характеризует абсолютную величину отклонения индиви­дуального значения от средней. Как правило, значение среднего квадратического отклонения больше среднего линейного отклонения.

Дисперсия:

=13,899

Характеризует квадрат отклонений индивидуального значения от средней величины.     Коэффициент вариации:

Средний процент отклонений индивидуальных значений от средней величины составляет 13,6%. Со­вокупность однородна. Сделаем аналогичные расчеты по совокупности студентов дневного отделения. Получаем следующие результаты:

R = 12,5

= 21,69

d(L) = 3,40

σ =  = 4,74

σ2=22,54

V = 21,9%

На основании приведенных расчетов можно сделать вывод о том, что совокупность студентов очно-заочного отделения более однородная.

 

Расчет показателей вариации — достаточно трудоемкий процесс. В некоторых случаях, когда имеется ряд показателей с равноот­стоящими моментами времени или равноинтервальный ряд рас­пределения, расчет может быть упрощен. Сокращенные способы расчета дисперсии базируются на знании свойств дисперсии. Свойства дисперсии:

— если от всех значений варианты х отнять (прибавить) по­стоянное число А, то дисперсия не изменится;

— если каждое значение варианты разделить (умножить) на постоянную величину к, то дисперсия уменьшится (увеличится) в к2 раз.

Сокращенные способы расчета дисперсии:

1.

2. Способ моментов – применяется только в случае равенства интервалов.

, где i – величина интервала;

- момент 2-го порядка, , где х - момент 1-го порядка.

 

Пример.

Имеются следующие данные о распределении семей по уровню среднедушевого дохода (табл. 2).

                                                        Таблица 2

Средний душевой доход, руб. Число семей в группе х, х' x'f x'2f
До 200 10 150 -4 -40 160
200—300 35 250 -3 -105 315
300-400 68 350 -2 -136 272
400—500 70 450 -1 -70 70
500—600 75 550 0 0 0
700—800 30 650 1 30 30
800 и более 12 750 2 24 48
Итого 300     -297 895

 

Как правило, в качестве константы А выбирается варианта с наибольшей частотой (для максимально­го упрощения расчетов). Наибольшая частота равна 75, значит А = 550.

.

На основании приведенных расчетов можно сделать вывод о том, что совокупность семей однородна. Однако коэффициент вариации приближается к верхней границе (33%), превышение которой свидетельствует о неоднородности совокупности. То есть в данной совокупности достаточно высокий уровень вариации. Средний душевой доход по всей совокупности семей составляет 451руб., а среднее отклонение от этого уровня — 141 руб. Поэтому можно констатировать достаточно высокую разницу между уровнем дохода отдельно взятых семей и, как следствие этого — на­чавшийся процесс расслоения общества. Дополнительные выводы можно сделать, рассчитав структурные средние — моду и ме­диану.

Правило сложения дисперсии

 

Если данные представлены в виде аналитической группировки, в статистике рассматривают три вида дисперсии:

— общая дисперсия;

— дисперсия средняя из внутригрупповых;

— межгрупповая дисперсия.

Общая дисперсияизмеряет вариацию признака х во всей сово­купности под влиянием всех факторов, обусловливающих эту ва­риацию.

Межгрупповая дисперсия(факторная) объясняет вариацию, вы­званную признаком, положенным в основу группировки. Средняя из внутригрупповых дисперсия(остаточная) объясня­ет ту часть вариации, которая вызвана действием (влиянием) на признак х всех остальных признаков (факторов), кроме группировочного.

Правило сложения дисперсиизаключается в том, что общая дисперсия равна сумме межгрупповой и средней из внутри­групповых дисперсий:

,

где - межгрупповая дисперсия;

   - средняя из внутригрупповых дисперсия.

Расчет средней из внутригрупповых проводится в два этапа. Пер­воначально рассчитываются дисперсии по каждой группе, как квадрат отклонений индивидуальных значений признака в группе от средней, рассчитанной в пределах группы:

, ,

где пi — численность i-ой группы.

На втором этапе по средней арифметической взвешенной рассчи­тывается средняя из внутригрупповых дисперсия:

Межгрупповая дисперсия определяется как квадрат отклонений средних, рассчитанных по каждой группе от средней, рассчитан­ной в пределах всей совокупности, взвешенных численностью группы:

Правильность расчетов дисперсии при помощи правила сложения дисперсии можно подтвердить расчетом общей дисперсии по обычной формуле.

Поскольку правило сложения дисперсии позволяет разложить дисперсию на дисперсию, возникающую под влиянием фактор­ного признака (группировочного), и остаточную дисперсию, оно широко используется при изучении взаимосвязей между призна­ками.

На основе правила сложения дисперсии в статистике разработаны меры связей между факторным и результативным признаками: коэффициент детерминации и эмпирическое корреляционное от­ношение.

Коэффициент детерминацииопределяется как отношение меж­групповой дисперсии к общей дисперсии:

.

Коэффициент детерминации характеризует долю общей колебле­мости результативного признака, которая вызвана признаком, по­ложенным в основу группировки.

Эмпирическое корреляционное отношениехарактеризует тесно­ту связи между признаками и определяется следующим образом:

 

Пример использования правила сложения дисперсии.

Имеются данные о распределении мага­зинов по объему товарооборота (табл. 3):

Таблица 3

Товарооборот, тыс. руб. Число магазинов в группе Издержки обращения, тыс. руб.
1000—1200 3 20,30,40
1200—1500 5 45, 60, 90, 40, 80
1500—2500 4 80,85,98,100

Определите общую дисперсию, используя правило сложения дисперсии.         

= 527,9 + 197,3 = 725,13

Для проверки правильности расчетов определим общую дисперсию обычным способом:

Это значит, что 72,8% вариации издержек обращения объясняется признаком, положенным в основу группировки, то есть товарооборотом. Соответственно, 27,2% вариации результативного признака может быть объяснено прочими факторами, не учтенными в группировке:

  

Эмпирическое корреляционное отношение — показатель тесноты связи. Он характеризует уровень согласованности в изменениях факторного признака» (объем товарооборота) и результативного признака (величина издержек обращения).

Эмпирическое корреляционное отношение показывает степень влияния товарооборота на издержки обращения. Иногда дают ве­роятностную интерпретацию: с вероятностью 0,853 мы можем предсказать изменения издержек обращения, зная изменение то­варооборота.

Значения эмпирического корреляционного отношения лежат в диапазоне от 0 до 1: О - 0,3 — слабая связь;

0,3 - 0,7 — умеренная;

0,7 - 1,0 — сильная.

Выводы:

1. Наличие вариации обусловливает необходимость статистики. Статистика изучает толь­ко варьирующие явления.

2. Показатели вариации характеризуют однородность совокупности и служат необходи­мым дополнением при расчете средней величины.

3. Для упрощения расчетов основного показателя вариации — дисперсии — применяют сокращенные способы расчета дисперсии, основанные на свойствах дисперсии.

4. На основании дисперсии (правило сложения дисперсии) рассчитывается эмпириче­ское корреляционное отношение и коэффициент детерминации, которые служат для харак­теристики взаимосвязи между признаками.

 

Библиографический список

основной      

1. Общая теория статистики: Учебник / Под ред. чл.-корр. РАН И.И.Елисеевой.— М: Финансы статистика, 2000.— С. 74—117.

2. Практикум по теории статистики: Учеб. пособие / Под ред. проф. Р.А. Шмойловой.— М: Финан­сы и статистика, 1999.— С. 122—129.

3. Статистика: Курс лекций / Под ред. В.Г. Ионина.— Новосибирск: Издательство НГАЭиУ, 1996.— С. 59—84.

4. Теория статистики: Учебник / Под ред. проф. Р.А. Шмойловой.— М., 1996.

дополнительный                            

1. Лунеев В.В. Юридическая статистика: Учебник.— М.: Юристь, 1999.— С. 272—276.

2. Савюк Л.К. Правовая статистика: Учебник.— М.: Юристь, 1999.— С. 412—416.


ТЕМА 1.6. РЯДЫ ДИНАМИКИ

 

1.6.1. Задачи статистического изучения явлений во времени.

1.6.2. Ряды динамики, их классификация.

1.6.3. Правила построения рядов динамики.

1.6.4. Показатели анализа рядов динамики.

1.6.5. Способы выравнивания динамических рядов. Экстраполя­ция и интерполяция.

 

Задачи статистического изучения явлений во времени

 

Для полной статистической характеристики явления или процес­са необходимо рассмотреть изменение его характеристик во вре­мени, то есть в динамике, с целью выяснения закономерностей развития данного явления, процесса. В ходе изучения динамики любого явления должны быть решены следующие задачи:

— характеристика интенсивности изменений во времени ста­тистических показателей (от периода к периоду);

— определение средних показателей во времени;

— выявление закономерностей изменения явлений во времени;

— экстраполяция, интерполяция;

— анализ факторов, определяющих изменения показателей во времени.

Эти задачи решаются с помощью построения и анализа динами­ческих рядов.

 


Дата добавления: 2018-02-15; просмотров: 294;