Вариационные ряды и их графическое представление  



Установление статистических закономерностей, присущих случайным массовым явлениям, основано на изучении статистических данных- сведений о том, какие значения принял в результате наблюдений интересующий нас признак (случайная величина Х).*

Расположение выборочных значений случайной величины в порядке неубывания называется ранжированием.

Значение случайной величины, соответствующее отдельной группе сгруппированного ряда наблюдаемых данных, называется вариантой, а изменение этого значения - варьированием.

Численность отдельной группы сгруппированного ряда наблюдаемых данных называется частотой или весом варианты. Если i-индекс варианты, то  – число измеренных значений i-той варианты.

Отношение  к общей сумме частот всех вариант  называется относительной частотой варианты и обозначается

=  

Накопленной частотой  варианте  называется общее число вариант, имеющих значения признака, меньше или равные  данному, то есть

                                  X  

Различают дискретные вариационные ряды и интервальные.

Дискретным вариационным рядом распределения (распределениям частот) называется ранжированная совокупность вариант  с соответствующими им частотами или относительными частотами.

Интервальным вариационным рядом  (интервальным распределением частот) называется упорядоченная последовательность интервалов варьирования случайной величины с соответствующими частотами или относительными частотами попаданий в каждый из них значений случайной величины.

Для выбора оптимальной величины интервала применяют формулу Стерджесса:

                               h=  ,

где  –максимальная варианта выборки; -минимальная варианта выборки; -объем выборки.

Величина R=  называется размахом варианты или размахом вариационного ряда.

Величина N=  –число классов.

Вариационные ряды графически могут быть изображены в виде полигона и гистограммы. Графическое изображение ряда распределения позволяет наиболее просто, наглядно отразить основную тенденцию вариации признаков.

Гистограмма используется для графического и представления распределений непрерывно варьирующих признаков и состоит из примыкающих друг к другу прямоугольников. Основание каждого прямоугольника равно ширине интервала класса, а высота его такова, что площадь прямоугольника пропорционально частоте попаданий в данный интервал.

Полигон частот образуется ломаной линией, соединяющей точки срединным значениям интервалов классов и частотами этих интервалов.

При составлении выводов по построенным графикам гистограммы и полигона об однородности выборки по заданному признаку, учитывают следующие моменты:

1. Если гистограмма и полигон по своему виду близки к виду графика нормального распределения, то группа однородна.

2. Если графики низкие и растянутые, то группа возможно, однородна, но некомпактна.

3. Если графики имеют 2 и более вершины, то группа неоднородна по данному признаку, ее необходимо разбить на подгруппы.

Пример 1. Определить однородность группы из 10 исследуемых в результатах прыжка в длину с места с помощью построения графиков вариационных рядов, если данные выборки таковы:

, см ~ 260; 255; 240; 250; 250; 264; 250; 262; 252; 258. (n=10)

Решение.

1.Проранжируем данный вариационный ряд в порядке неубывания:

, см ~ 240; 250; 250; 250; 252; 255; 258; 360; 262; 264.

2.Расчитаем размах вариационного ряда:

R=264-240=24(см).

3.Расчитаем число классов:

N=1+lq n=1+3,32 1=4,32 5

4.Расчитаем интервал классов по формуле:

h= = см

5.Для графического представления данных вариационного ряда построим рабочую таблицу и произведем необходимые расчеты:

№ класса Границы классов Среднее значение классов Частота класса Накопленная частота
1 240-245 242,5 1 1
2 245-250 247,5 0 1
3 250-255 252,5 4 5
4 255-260 257,5 2 7
5 260-265 262,5 3 10

 

Где среднее значение классов = +

6.Построим графики гистограммы и полигона данного вариационного ряда и сделаем вывод.

 

 

Вывод: т.к. графики гистограммы и полигона имеют три вершины, то группа  по результатам прыжка в длину с места неоднородна, в тренировочном процессе ее следует разделить на три подгруппы с каждой из которых вести занятия по индивидуальным планам.

 

3. Числовые характеристики выборки.

Показатели положения.

а) Выборочная средняя (средняя арифметическая).

Выборочным средним называется такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю (с учетом знака отклонения).

Для несгруппированных данных выборочное среднее рассчитывается как частное от деления суммы всех значений вариант рассматриваемой совокупности на их число:

= или  ,

где -варианты выборки; - объем выборки; -сумма n чисел , где индекс i=

Если данные сгруппированы, то

 ,

где-n-объем выборки; k-число интервалов; -частоты интервалов; -среднее значение интервалов.

Выборочное среднее для сгруппированных данных называют также взвешенным средним, подчеркивая этим, что  суммируются с коэффициентами (весами), равными частотами попадания в интервалы группировки.

Свойства выборочного среднего.

1. Если все варианты ряда уменьшить (увеличить) на одно и то же число, то среднее арифметическое уменьшится (увеличится) на то же число.

2. Если все варианты ряда уменьшить (увеличить) в одно и то же число раз, то среднее арифметическое уменьшится (увеличится) во столько же.

3.  Сумма отклонений вариант ряда от выборочной средней равна нулю

Пример 2. Найти выборочную среднюю в пр.1

, см ~ 260; 255; 240; 250; 250; 264; 250; 262; 252; 258. (n=10)

=255,5

б) Медиана.

Медианой (Ме)-называется такое значение признака Х, когда одна половина значений экспериментальных данных меньше ее, а вторая половина- больше.

1) Если число данных n в выборке нечетно, то медиане соответствует ранг:

 

Например:n=9

8; 12; 12; 14; 16; 18; 20; 22; 22.

= =5 , следовательно, Ме=16

2) Если число данных n в выборке четно, то медиана выбирается равной среднему арифметическому из двух значений, занимающих в этом месте по порядку

Например : n=10

6; 10; 11; 12; 12; 14; 18; 19; 20; 20.

= =5,5 , следовательно, Ме= =13,5.

3)В интервальном вариационном ряду вначале определяют медианный интервал.

Медианным будет тот интервал, в котором накопленная частота впервые окажется больше  (n – объем выборки)

Внутри медианного интервала медиана определяется по формуле:

Ме=  ,

где - -нижняя граница медианного интервала;  - половина объема выборки; - ширина интервалов группировки;  - накопленная частота интервала, предшествующего медианному; - частота медианного интервала.

Пример 3. По сгруппированным данным пр.1найти медиану.

7  ,следовательно, медианный интервал (255-260)

=255; = 10=5 ; =5; =5; =2

Ме =  = 255.

в) Мода(Мо) представляет собой значении признака, встречающееся в выборке наиболее часто.

8; 12; 12; 12; 14; 16; 18; 20; 22.     Мо=12.

Интервал группировки с наибольшей частотой называется модальным.

В интервальном вариационном ряду мода определяется по формуле:

Мо=

где- - нижняя граница модального класса; - частота модального класса; - частота интервала, предшествующего модальному;  -частота интервала, последующего модальному;  - ширина интервалов группировки.

Пример 4. По сгруппированным данным пр.1найти моду.

Модальный интервал (250-255), т.к.

=250; =5; =4; =0; =2

Мо= =250+5 =253,3

3.2 Показатели рассеяния (вариации)

Простейшим показателем вариации является вариационный размах R, равный разности между наибольшим и наименьшим значением ряда:

R=

Дисперсия вариационного ряда есть средняя арифметическая квадрата отклонения (средний квадрат отклонения) значений признаков ряда от их средней арифметической.

Эта числовая характеристика служит для того, чтобы оценить, как рассеяны возможные значения случайной величины вокруг ее средней арифметической.

Дисперсия, вычисляемая по выборочным данным, называется выборочной дисперсией.

Выборочную дисперсию вычисляют по формулам:

1) Для несгруппированых данных:

 ,

где  - сумма квадратов отклонений значений признака  от среднего арифметического ; n-объем выборки.

2) Для сгруппированых данных в интервальном вариационном ряду:

где  -среднее значение интервалов группировки;  

взвешенная сумма квадратов.

На практики используют формулы:

где для несгруппированных данных :

      

где для сгруппированных данных :

 ,  .

Пример 5.

9 12 13 14 15 16 17 19 21 23 27 1 2 3 6 5 3 2 1 1 1 1 9 24 39 84 75 48 34 19 21 23 27 81 288 207 1176 1125 768 578 361 441 529 729
26 403 6583

 

= =253,19-240,25=12,94

Свойства дисперсии.

1.Если все значения вариант уменьшить на постоянную величину, то дисперсия не изменится.

2. Если все значения вариант увеличить (уменьшить) в С раз, то дисперсия увеличится (уменьшится) в  раз.

Стандартное отклонение – вариационного ряда есть арифметическое значение корня квадратного из дисперсии

При сопоставлении (или сравнении) разноименных признаков вводится относительный показатель, называемый коэффициентом вариации или коэффициентом изменчивости признака, который вычисляется по формуле:

                                   V= %

Коэффициент вариации является относительной мерой рассеивания признака.

Чем меньше значение коэффициента вариации, тем однороднее совокупность по изучаемому признаку.

№5. Лекция. Статистическое исследование зависимостей. Корреляционный анализ и регрессионный анализ.

1.Статистические гипотезы и их виды.

2.Корреляционный анализ и регрессионный анализ.

1.Статистические гипотезы и их виды


Дата добавления: 2018-04-15; просмотров: 786; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!