Сложение дисперсий изучаемого признака.

Понятие вариации.

Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака.

Средняя величина, как уже отмечалось - это абстрактная, обобщающая характеристика признака изучаемой совокупности, но она не показывает строения совокупности, которое весьма существенно для ее познания. Средняя величина не дает представления о том как отдельные значения признака группируются относительно средней, сосредоточенны ли они вблизи или значительно отклоняются нее. В тех случаях, когда отдельные значения признака близко расположены к средней арифметической и мало от нее отличаются, средняя хорошо представляет совокупность.

Для характеристики колеблемости отдельных значений признака в статистике используют показатели вариации. Изучая с помощью данных показателей силу и характер вариации можно оценить насколько однородной является совокупность в количественном, а иногда и в качественном отношении, а следовательно определить насколько характерной для данной совокупности является средняя величина.  

 

2. Показатели вариации.  

для характеристики размера вариации признака используются абсолютные и относительные показатели.

К абсолютным показателям вариации относятся:

*  размах колебаний;

*  среднее линейное отклонение;

*  среднее квадратичное отклонение;

*  дисперсия;

*  квартильное отклонение.

Размах колебаний (размах вариации):

R=xmax - xmin.

Данный показатель улавливает только крайние отклонения признака и не отражает отклонений всех вариант в совокупности. Однако легкость вычисления и простота истолкования результатов обусловили широкое применение этого показателя.

Чтобы дать обобщающую характеристику распределению отклонений вычисляют среднее линейное отклонение, которое учитывает различие всех единиц изучаемой совокупности.

Среднее линейное отклонение определяется как средняя арифметическая модуля отклонения каждого значения признака от средней:

а) для несгруппированных данных (первичного ряда):

;

б) для вариационного ряда:

.

На практике меру вариации более объективно отражают показатель дисперсии и среднее квадратическое отклонение. СКО является мерилом надежности средней. Чем меньше значение этого показателя, тем лучше средняя арифметическая отражает собой всю совокупность.

Среднее квадратическое отклонение и дисперсия:

а) для несгруппированных данных (первичного ряда):

; ;

б) для вариационного ряда:

; .

 

Формула для расчета дисперсии может быть преобразована:

.

Квартильное отклонение применяется вместо размаха вариации, чтобы избежать недостатков, связанных в использованием крайних значений:

.

Квартиль - значения признака, которые делят ранжированный ряд на четыре равные по численности части. Таких величин три: первая квартиль Q1, вторая квартиль Q2 , третья квартиль Q3 . Вторая квартиль является медианой. Вычисление квартилей аналогично вычислению медианы.

Для дискретного ряда:

,

где k - номер квартили.

В интервальном ряду распределения сначала определяют интервал, в котором лежит квартиль, а затем определяют ее численное значение по формуле:

.

При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической используются относительные показатели вариации. Они вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане) и чаще всего выражаются в процентах.

 

Относительные показатели вариации:

*  коэффициент осцилляции:

;

*  относительное линейное отклонение:

;

*  коэффициент вариации:

*  относительный показатель квартильной вариации:

 

Наиболее часто применяется коэффициент вариации. Его применяют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

 

Сложение дисперсий изучаемого признака.

Изучая дисперсию интересующего нас признака в пределах исследуемой совокупности, нельзя оценить влияние отдельных факторов, определяющих колеблемость индивидуальных значений (вариант) признака. Это можно сделать при помощи метода группировок, когда единицы изучаемой совокупности подразделяются на однородные группы по признаку-фактору. При этом кроме общей средней для всей совокупности вычисляются средние по отдельным группам (групповые средние) и три показателя дисперсии:

*  общая дисперсия;

*  межгрупповая дисперсия;

*  средняя внутригрупповая дисперсия.

Величина общей дисперсии (s02) характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц данной совокупности, определяется по формуле:

,

где x0 - общая средняя арифметическая для всей изучаемой совокупности, m - число групп.

Межгруппрвая дисперсия (дисперсия групповых средних d2) характеризует систематическую вариацию, т. е. те различия в величине изучаемого признака, обусловленные влиянием фактора, положенного в основу группировки. Межгрупповая дисперсия определяется по формуле:

,

где nj - число единиц в j-й группе;

xj - частная средняя по j-й группе.

Вариацию, обусловленную влиянием прочих, неучтенных факторов характеризует в каждой группе внутригрупповая дисперсия:

,

а по совокупности в целом - средняя из внутригрупповых дисперсий (средняя внутригрупповая дисперсия):

.

Указанные дисперсии взаимосвязаны между собой следующим равенством (правило сложения дисперсий): величина общей дисперсии равна сумме межгрупповой дисперсии и средней внутригрупповой дисперсии:

.

 


Дата добавления: 2021-03-18; просмотров: 40; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!