Вариационные ряды и их характеристики



Математическая статистика

Слово «статистика» происходит от итальянского слова stato, которое означает государство. Соответственно термин «статистика» относился к лицу, вовлеченному в государственные дела, а статистика поначалу отождествлялась со сбором данных, полезных для государства. В указанном выше смысле статистика возникла в XVI в. в Италии, а затем распространилась во Францию, Голландию и Германию. Переписи населения и имущества появились гораздо раньше в античные времена. Сегодня статистика не ограничивается информацией о состоянии государства, а проникает практически во все сферы человеческой деятельности. Приведем лишь несколько примеров. Для предсказания результатов выборов проводятся предварительные выборочные опросы избирателей, для прогнозирования потребительского спроса изучаются предпочтения определенных групп населения к тому или иному виду товаров. Физиологи проводят эксперименты для определения лечебного эффекта различных препаратов при борьбе с определенным видом заболеваний. Инженеры, занимающиеся контролем качества продукции, основываясь на проверке небольшого числа изделий, могут сделать заключение о проценте брака во всей производимой продукции. Экономисты, наблюдая различные индексы экономического состояния в течение определенного периода времени, используют эту информацию для прогноза состояний экономики в будущем.

Статистика разрабатывает методы сбора, систематизации, анализа, интерпретации и отображения результатов наблюдений массовых случайных явлений с целью выявления существующих в них закономерностей. Математическая статистика создает математический аппарат анализа массовых экономических и социальных явлений.

Сбор статистических данных производится по специальным правилам статистического наблюдения.

Совокупность предметов или явлений, объединенных каким-либо общим признаком или свойством качественного или количественного характера, называется объектом наблюдения. Всякий объект статистического наблюдения состоит из отдельных элементов - единиц наблюдения.

Результаты статистического наблюдения представляют собой числовую информацию - данные Статистические данные — это сведения о том, какие значения приняли интересующие аналитика признаки. Значения признака при переходе от одного элемента к другому изменяются (варьируют), поэтому в статистике .различные значения признака также называют вариантами, а совокупность значений признаков, расположенных в порядке возрастания или убывания, - вариационным рядом.

Если значения признака (например, вес, масса, объем, заработная плата, производительность труда) выражаются числами, то признак называется количественным.

Если же признак характеризует некоторое свойство или состояние элементов совокупности, например, профессия, квалификация, сорт продукции и др., то признак называют качественным.

После того как статистические данные собраны, их группируют для отражения общего смысла и анализируют. Статистический анализ, как правило, предполагает обобщение результатов, полученных путем анализа собранных данных, на всю их совокупность, т. е. генерализацию данных. Например, всем известны переписи населения, когда о каждом человеке по специальной программе собирается информация о возрасте, поле и т.д. Однако такого рода наблюдения очень трудоемки и требуют больших затрат времени и средств. Зачастую сплошное наблюдение просто невозможно. При проверке качества продукции зачастую происходит ее разрушение (вскрытие консервов), прибор работает до полного износа с целью проверки срока службы и т.д. При изучении покупательского спроса, текущих цен на рынке нужно ли опрашивать всех покупателей, всех продавцов? Как правило, в таких случаях исследуется лишь часть совокупности - выборочная совокупность (выборка).

По результатам изучения вариации признака в выборочной совокупности делают вывод об этом признаке во всей генеральной совокупности. Результат представляет собой вывод, сделанный на основании выборки, и распространяется на генеральную совокупность, из которой выборка была получена путем случайного отбора. В этом смысле статистика есть наука о выводе.

Почему мы подчеркиваем роль статистического вывода и в числе первых понятий статистики рассматриваем генеральную и выборочную совокупности? Разве недостаточно собрать данные и интерпретировать их? Конечно, если интерес исследователя ограничивается лишь тем набором данных, с которым он работает, то этого достаточно для определенных выводов. Если же необходимо извлечь содержательные заключения, которые распространялись бы и на признаки, лежащие за пределами данных, ограниченных выборкой, то статистический вывод - единственный путь, позволяющий сделать это. Например, в процессе маркетинговых исследований большой интерес представляет выяснение влияния рекламы какого-либо продукта на объем его продаж. Данные случайно выбранных продаж и данные о рекламе по какой-либо фирме могут иметь интерес сами по себе, но информация об этом намного полезнее, если позволяет сделать заключение о процессах, лежащих в основе взаимоотношении между стоимостью рекламной кампании фирмы и объемом продаж. Понимание истинных взаимоотношений между рекламой и возможностями расширения продаж для фирмы позволяет прогнозировать объем продаж для любого уровня рекламы и, следовательно, обеспечить рекламу, которая максимизирует прибыль. Банк может интересовать популярность нового вида банковских услуг. Для выяснения этого исследователь может случайным образом отобрать группу людей, обслуживающихся в банке, и выяснить их мнение об этих услугах. Выводы исследования затем можно распространить на всех вкладчиков банка.

Существует множество забавных историй о статистике. Приведем одну из них. Знаменитый воздухоплаватель начала века Малколм Форбс во время полета на одном из своих воздушных шаров сбился с курса и вынужден был приземлиться в неизвестном месте посередине кукурузного поля. Приземлившись, он заметил человека, который шел по направлению к нему. Форбс спросил его: «Сэр, не подскажете ли Вы мне, где я?». Прохожий ответил: «Конечно, Вы находитесь в корзине посередине кукурузного поля». В ответ Форбс спросил прохожего еще раз: «Вы случайно не статистик?». Мужчина изумился: «Как Вы догадались!?» - «Очень просто, - ответил Форбс, - Ваша информация краткая, точная и абсолютно бесполезная». Цель нашего курса - убедить Вас, что информация, являющаяся результатом хорошего статистического анализа, всегда краткая, точная и никогда не бывает бесполезной. Главную идею, суть статистики, наверное, лучше всех отразил знаменитый английский экономист Джон Мэйнард Кейнс «Лучше быть приблизительно правым, чем абсолютно точно ложным».

 

Вариационные ряды и их характеристики

6.1. Понятия вариационного ряда, частоты, относительной частоты (частости)

Пример 6.1. Рассмотрим в качестве изучаемого признака число продаж каждого из 26 случайно выбранных продавцов универмага:

16, 12, 15, 15, 23, 9, 15, 13, 14, 14, 21, 15, 14, 17, 27, 15, 16, 12, 16, 19, 14, 16, 17, 13, 14, 14.

Расположим значения признака в порядке возрастания (или убывания). Обозначив изучаемый признак X, запишем в общем виде: х1, х2, ..., х n (п = 26), где х1, х2, ..., х n - упорядоченные значения признака, которые, в статистике называются вариантами. Варианты, расположенные в возрастающем (или убывающем) порядке, т. е. ранжированные, и составляют вариационный ряд: 9, 12, 12, 13, 13, 13, 14, 14, 14, 14, 14, 14, 15, 15, 15, 15, 15, 16, 16, 16, 17, 17, 19, 21, 23, 27.

В нашем примере варианты: 12, 13, 14, 15, 16 и 17 повторяются.

Абсолютные числа, показывающие, сколько раз встречаются те или иные варианты в ряду, называются частотами (весами), они обозначаются n1, n2, ..., nm, где m - число групп в вариационном ряду (m < п).

Определение. Вариационным рядом называется ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими им весами (частотами или частостями).

Вариационный ряд можно представить в виде таблицы.

Таблица 6.1. Общий вид вариационного ряда

Значения признака (х i) х1 х2 х m
Частоты (ni) n1 n2 nm

 

В табл. 6.1  = п.

Для данных примера 6.1 вариационный ряд представлен в табл. 6.2.

Таблица 6.2. Данные о числе товаров, проданных 26 продавцами универмага

Число продаж (х i) 9 12 13 14 15 16 17 19 21 23 27
Число продавцов (ni) 1 2 3 6 5 3 2 1 1 1 1

 

В полученном ряду k= 11, n =  = 26.

Чаще для анализа полезнее пользоваться не абсолютными, а относительными значениями частот, которые получаются путем деления каждого значения ni на общую сумму всех частот.

Отношение частоты того или иного варианта к сумме всех частот ряда называется частостью или относительной частотой:

                                                (6.1)

Для примера 6.1 вариационный ряд частостей (относительных частот) представлен в табл. 6.3.

Таблица 6.3. Вариационный ряд частостей числа товаров, проданных 26 продавцами

Число продаж (х i) 9 12 13 14 15 16 17 19 21 23 27
Доля продавцов (wi) 0,04 0,08 0,11 0,23 0,19 0,11 0,08 0,04 0,04 0,04 0,04

 

Сумма всех частостей равна 1,т. е. . Частости могут быть выражены в процентах, тогда их сумма равна 100%.

После того как результаты статистического наблюдения упорядочены в виде вариационного ряда, можно начинать их анализ. Табл. 6.2 и 6.3 указывают на то, что основная часть продавцов осуществила от 14 до 16 продаж; возможно, менеджеру отдела необходимо провести дальнейший анализ для того, чтобы выяснить причины низкой производительности остальных продавцов.

6.2. Дискретные и интервальные вариационные ряды

Вариация признака может быть дискретной или непрерывной.

Признак называется дискретно варьируемым, если его отдельные значения (варианты) отличаются друг от друга на некоторую конечную величину (обычное целое число). Вариационный ряд таких признаков называется дискретным вариационным рядом.

Вариационный ряд в примере 6.1 является дискретным. Другие примеры: тарифный разряд рабочего, цена товара, число семян в 10-граммовом пакете и т. д.

Не всегда значения, принимаемые тем или иным признаком, отличаются друг от друга на какую-то конечную величину. Существует множество признаков, значения которых отличаются друг от друга на сколько угодно малую величину, т. е. признак может принимать любые значения в некотором интервале. Такие признаки называются непрерывно варьирующими. К подобным признакам можно отнести различные индексы экономического состояния, среднедушевые доходы, процент дневной выработки рабочего, массу одного семени и т. п. Построение вариационного ряда путем перечисления всех. возможных значений признаков и их частот может оказаться невозможным, так как одинаковые значения величин встречаются редко, а число вариантов может быть очень большим (теоретически бесконечным). Наиболее простой способ «сжатия» этих данных - группировка их в некоторые интервалы с определенными границами.

Предположим, что в компьютере большого предприятия находятся данные о среднемесячной заработной плате 5000 работников. В таком случае можно, например, представить эти данные в следующих интервалах группировки: заработная плата от 100,00 до 300,00 руб., от 300,00 до 500,00 руб. и т. д., а затем, рассчитав число работников, имеющих заработную плату в заданных интервалах, определить их частоты и частости. В интервалах указанного типа запись верхней границы предыдущего интервала совпадает с нижней границей последующего. Предполагается, что каждому интервалу принадлежит лишь один из его концов: либо во всех случаях левый, либо во всех случаях правый. Обычно данные, полученные в результате наблюдения непрерывно варьирующего признака, представляют в виде интервального вариационного ряда. Частоты, как уже было сказано, в таком ряду относятся не к отдельному значению признака, а ко всему интервалу. При такой группировке, конечно, теряется часть информации о признаках, но вариационный ряд становится компактным. Значением признака в интервальном ряду часто считают середину интервала.

Пример 6.2. Менеджер большого универмага записал суммы денег, которые израсходовали 184 покупателя, посетившие отдел верхней одежды в день сезонной распродажи по сниженным ценам. Зная минимальную и максимальную стоимость покупки, менеджер сгруппировал данные о суммах, израсходованных на покупки в следующем виде:

Таблица 6.4. Распределение покупателей по интервалам расходов на покупку товаров

Покупатели

Интервалы расходов, тыс. руб.

100-300 300-500 500-700 700-900 900-1100 1100-1300
Количество покупателей (ni), чел. 30 38 50 31 22 13
Доля покупателей (wi) 0,163 0,207 0,272 0,168 0,120 0,071

 

6.3. Границы интервалов

В интервальных вариационных рядах в каждом интервале различают нижнюю и верхнюю границы интервала: нижняя граница интервала – xi(min), верхняя граница интервала - xi(max). Тогда длина (величина) интервала обозначается ki и определяется по формуле:

ki = xi(max) - xi(min)                                                     (6.2)

В примере 6.2 ki = 300 - 100 = 200.

При построении интервальных рядов в каждый интервал включаются варианты, числовые значения которых больше нижней границы интервала и меньше (или равны) верхней границы (или наоборот). Разумеется, надо стремиться строить интервалы так, чтобы избегать попадания значительного числа случаев на границы интервалов. Иногда в начале и в конце ряда встречаются и открытые интервалы - интервалы, имеющие одну границу: либо нижнюю, либо верхнюю. Например, дано распределение территорий России по вводу в действие инвестиций в 1996 г. (январь - сентябрь 1996 г. в % к январю - сентябрю 1995 г.):

Интервалы Число регионов
До 60 10
60-70 29
70-80 21
80-90 13
90-100
Свыше 100 6

Для установления границ крайних интервалов часто поступают так: последнему интервалу предшествует интервал от 90 до 100. Его интервальная разность равна 10. Следовательно, условно считаем правую границу последнего интервала равной 100 + 10 = 110. Аналогично рассуждая, получим, что начало первого интервала равно 50.

Для выбора оптимальной величины интервала (при которой вариационный ряд с равными интервалами будет не очень громоздким) применяют формулу Стэрджеса:

k =                                                     (6.3)

где п - число единиц совокупности; xmax, xmin - наибольшее и наименьшее значения вариантов ряда соответственно.

Для данных примера 6.1 xmax = 27, xmin = 9 и по формуле (6.3) имеем:

k =  = 3,095 » 3.

Преобразованные в интервальный ряд данные примера 6.2 имеют следующий вид:

Интервалы продаж 9-12 12-15 15-18 18-21 21-24 24-27
Число продавцов (ni) 3 9 10 2 1 1

Интервальные вариационные ряды бывают с равными и неравными интервалами.

Иногда при группировке с равными интервалами сначала определяют число интервалов (групп) z при заданном объеме совокупности, пользуясь формулой

z = 2 Ln n,                                                   (6.4)

и тогда

k =                                          (6.5)

Для примера 6.1 z = 2 Ln n = 2 Ln26 = 6,5162 » 6, k = (27 - 9)/6 = 3, что совпадает с результатом, полученным по формуле (6.5).

6.4. Плотность вариационного ряда или плотность распределения

Одной из характеристик вариационного ряда является плотность распределения.

Плотность распределения - это отношение частот (или частостей) к величине интервала. Плотность распределения показывает, сколько единиц совокупности приходится на единицу вариации признака.

Различают абсолютную плотность:

f(a)i =                                                     (6.6)

и относительную плотность распределения:

f(o)i =                                                    (6.7)

Вычислим абсолютную плотность распределения по данным примера 6.2 в третьем интервале:

f(a)3 =  = 50 / (700 - 500) = 0,25.

Если два любых, равных по величине, интервала вариационного ряда имеют одинаковые частоты, то можно сказать, что частоты вариационного ряда распределены равномерно. Если же частоты распределены по различным участкам вариационного ряда неравномерно, то, зафиксировав определенное значение варианта х, найдем частоту интервала вариационного ряда от х + Dх. Обозначим ее nх, х + Dх. Отношение nх, х + Dх/Dх уже не является постоянной величиной, а зависит от точки, в которой начинается интервал, т. е. от х и величины интервала Dх. Это отношение и характеризует плотность ряда в интервале от х до х + Dх. Чтобы охарактеризовать более точно распределение частот на отрезке от х до х + Dх, следует уменьшить Dх. В результате получим плотность вариационного ряда в точке х:

yz = .

Теперь уже величина плотности не будет зависеть от длины участка Dх.

Если вместо частоты возьмем частость wх, х+Dх, то получим относительную плотность распределения: f(o)i = wх, х + Dх /Dх.

 

6.5. Накопленные частоты или частости

Для характеристики свойств вариационного ряда наряду с понятием частоты часто используется понятие накопленной частоты.

Накопленные частоты (или частости) показывают, сколько значений признака (или какая их доля) не превышает заданного значения х. Для интервального ряда - это сумма частот всех интервалов, предшествующих данному (включая данный). Накопленные частоты можно рассчитывать в восходящем порядке (частоты вариантов суммируются сверху вниз) и нисходящем порядке (частоты вариантов суммируются снизу вверх).

Таблица 6.5. Накопленные частоты для данных примера 6.2

Интервалы расходов (х)

Интервалы, тыс руб.

100-300 300-500 500-700 700-900 900-1100 1100-1300
Число покупателей ni 30 38 50 31 22 13
Накопленные частоты в восходящем порядке 30 68 118 149 171 184
Накопленные частоты в нисходящем порядке 184 154 116 66 35 13

Накопленная в восходящем порядке частота третьего интервала указывает, что 118 покупателей приобрели товары на сумму, не превышающую 700 тыс. руб. Накопленная в нисходящем порядке частота этого же интервала указывает на то, что 116 покупателей приобрели товары на сумму не менее 500 тыс. руб.

Итак, накопленной частотой , соответствующей варианту xi, называется общее число вариантов, имеющих значения признака, меньшие или равные данному, т. е. для которых X £ xi.

 

6.6. Графические методы изображения вариационных рядов

Вариационные ряды графически могут быть изображены в виде полигона, гистограммы, кумуляты и огивы. Графическое изображение ряда распределения позволяет наиболее просто, наглядно отразить основную тенденцию вариации признаков.

Полигон распределения(многоугольник) строится в прямоугольной системе координат. На оси абсцисс отмечаются точки, соответствующие значениям вариантов. Из них восстанавливаются ординаты (перпендикуляры), длины которых соответствуют частоте или частости этих вариантов (точнее, плотности распределения). Вершины ординат соединяются прямыми линиями.

Рис. 6.1. Полигон распределения числа продаж по данным примера 6.2

При построении графика следует пользоваться правилом «золотого сечения»: график должен быть расположен в прямоугольнике, в котором высота будет относиться к ширине как 5:8.

Чаще всего полигоны применяются для изображения дискретных вариационных рядов частот или частостей. В случаях построения полигона для интервальных рядов ординаты, пропорциональные частоте или частости интервала, восстанавливаются перпендикулярно оси абсцисс в точке, соответствующей середине данного интервала. Для замыкания крайние ординаты соединяются с серединой интервалов, в которых частоты или частости равны 0.

Гистограмма распределения строится аналогично полигону в прямоугольной системе координат. В отличие от полигона при построении гистограммы на оси абсцисс откладываются не точки, а отрезки, изображающие интервалы, а вместо ординат строят прямоугольники с высотой, пропорциональной частотам, частостям или плотностям интервалов (в случае, если интервалы не равные).

Если в ряду с равными интервалами соединить прямыми отрезками середины верхних сторон прямоугольников, то получим полигон распределения.

Как видим, гистограмма - удобный способ представления частот сгруппированных данных в графическом виде. Мы построили гистограмму по абсолютным частотам; аналогично строится гистограмма относительных частот (частостей).

Рис. 6.2. Гистограмма данных для примера 6.2

Кумулятивная кривая (кривая сумм) получается при изображении вариационного ряда с накопленными частотами или частостями в прямоугольной системе координат (рис. 6.3).

При построении кумуляты дискретного признака на ось абсцисс наносят значения признака (варианты). Ординатами служат вертикальные отрезки, длины которых пропорциональны накопленным частотам (или частостям) вариантов. Соединяя вершины ординат прямыми отрезками, получаем ломаную линию (кривую) - кумуляту (см. рис. 6.3).

При построении кумуляты интервального вариационного ряда нижней границе первого интервала соответствует частота (частость), равная 0, а верхней — вся частота (частость) интервала. Верхней границе второго интервала соответствует накопленная частота первых двух интервалов (т. е. сумма частот этих интервалов). Верхней границе последнего интервала соответствует накопленная частота (частость), равная сумме всех частот.

Рис. 6.3. Кумулята для данных примера 6.2 (см. табл. 6.4)

Огива строится аналогично кумуляте с той лишь разницей, что на оси абсцисс наносят накопленные частоты (частости), а на оси ординат - значения признака.

Рис. 6.4. Огива для данных примера 6.2

 

ЗАДАНИЕ

Дано распределение признака X (случайной величины X), полученной по n наблюдениям. Необходимо построить полигон (гистограмму), кумуляту и огиву.

1. X – число сделок на фондовой бирже за квартал; n=400 (инвесторов).

xi 0 1 2 3 4 5 6 7 8 9 10
ni 146 97 73 34 23 10 6 3 4 2 2

 

2. X – месячный доход жителя региона (в руб.); n=1000 (жителей).

xi Менее 500 500-1000 1000-1500 1500-2000 2000-2500 Свыше 2500
ni 58 96 239 328 147 132

 

3. X – удой коров на молочной ферме за лактационный период (в ц); n=100 (коров).

xi 4-6 6-8 8-10 10-12 12-14 14-16 16-18 18-20 20-22 22-24 24-26
ni 1 3 6 11 15 20 14 12 10 6 2

 

6.7. Средняя арифметическая вариационного ряда и ее свойства

Самая известная и наиболее употребляемая в экономическом анализе характеристика вариационного ряда - это среднее значение вариационного ряда (средняя арифметическая).

Средняя арифметическая взвешенная - это отношение суммы произведений значений вариантов на соответствующие частоты к сумме всех частот:

 

 =  (6.8)             или             (6.9)

где ni - частоты вариационного ряда;

wi - частости;

m - число групп с одинаковыми значениями признака.

Формулы (6.8) и (6.9) применяют в случае, если вариационный ряд сгруппирован по одинаковым значениям вариантов. Повторяющиеся варианты ряда умножаются («взвешиваются») на соответствующие частоты, поэтому эти формулы в статистике называют средней арифметической взвешенной.

Для расчета средней можно использовать и не взвешенные данные, тогда формула средней арифметической будет иметь вид:

                                              (6.10)

Средняя арифметическая простая равна частному от деления суммы значений всех вариантов на число всех вариантов в ряду.

Когда вычисляется средняя для генеральной совокупности то она обозначается  или греческой буквой m. Обозначим числа элементов в генеральной совокупности N, а не n.

Среднюю арифметическую для данных примера 6.1 можно найти по формуле (6.10):

 = (х1 + х2 + х3 + ... + х n)/п = (9 + 12 + 12 + 13 +13 +13 +14+14+14+14 + 14 + 14 + 15 + 15 + 15 + 15 +15 + 16+16 +16 +17 + 17 + 19 + 21 + 23 + 27)/26 = 15,5.

Или по формуле средней арифметической взвешенной:

 = (9×1 + 12×2 + 13×3 + 14×6 + 15×5 + 16×3 + 17×2 + 19×1 + 21×1 + 23×1 + 27×1)/26 = 15,5.

Напомним, если находится средняя арифметическая интервального вариационного ряда, то за значение признака для каждого интервала часто условно принимают его середину, т. е. центр интервала.

Для данных примера 6.2:

 = [(100 + 300)/2]×30 + [(300 + 500)/2]×38 + [(500 + 700)/2]×50 + [(700 + 900)/2]×31 + [(900 + + 1100)/2)]×22 + +[(1100+ 1300)/2]×13 = 617,39.

Среднюю арифметическую часто называют мерой центральной тенденции, так как она является характеристикой центра распределения данных вариационного ряда.

Представим числа из примера 6.1 как маленькие шарики на числовой оси (рис. 6.5). Отметим на оси среднюю арифметическую. Если представить, что все шарики имеют одинаковую массу и находятся на предназначенных для них местах числовой оси, то средняя будет балансом, точкой опоры на числовой оси, по обе стороны которой суммы масс шариков будут равны между собой. Что характеризуют эта мера и какова её достоинства и недостатки?

Средняя суммирует всю информацию и является центром массы, где вся масса - сумма масс всех шариков.

Средняя арифметическая весьма чувствительна к положению крайних значений ряда. Что случится со средней, если увеличить значение x26 с 27 до 100?

= (9 + 12 + 12 + 13 + 13 + 13 + 14 + 14 + 14 + 14 + 14 + 14 + 15 + 15 + 15 + 15 + 15 + 16 + + 16 + 16 + 17 + 17 + 19 + 21 + 23 + 100)/26 » 18,3.

= 15,5

 

Рис. 6.5. Мера центральной тенденции

Итак, средняя увеличилась почти на три единицы при сдвиге вправо только одной точки x26. Тем не менее средняя арифметическая имеет существенные преимущества перед другими мерами центральной тенденции. Средняя арифметическая основывается на информации, содержащей все значения вариационного ряда.

В экономической литературе, статистических справочниках часто встречаются ряды, в которых крайние интервалы открыты Для подсчета средней арифметической в таких рядах прибегают либо к приему, описанному в параграфе 6.3, т.е. приравнивают величину последнего интервала к величине предпоследнего интервала, а величину первого - к величине последующего что может привести к искажениям, либо применяют достаточно сложные методы и приемы определения длины открытого интервала, основанные на экстраполяции (искусственном продолжении ряда).

Свойства средней арифметической

1. Средняя арифметическая постоянной величины равна этой постоянной, т. е.  = с, где с = const.

2. Если все варианты ряда уменьшить (увеличить) на одно и то же число (с), то средняя арифметическая уменьшится (увеличится) на то же число.

Пример 6.3. По данным табл. 6.2 (пример 6.1) проверить второе свойство, уменьшив все значения вариантов на 15. Составим рабочую таблицу (табл. 6.6):

Таблица 6.6. Расчет средней арифметической для проверки второго свойства

xi - 15 = xi¢ ni xi¢ni
-6 1 -6
-3 2 -6
-2 3 -6
-1 6 -6
0 5 0
1 3 3
2 2 4
4 1 4
6 1 6
8 1 8
12 1 12
S 26 13

 

3. Если все варианты ряда уменьшить (увеличить) в одно и то же число раз, то средняя арифметическая уменьшится (увеличится} во столько же раз.

Пример 6.4. Если найти центры интервалов в табл. 13.4 (пример 13.2), то получим вариационный ряд:

xi 200 400 600 800 1000 1200
ni 30 38 50 31 22 13

Средняя арифметическая этого ряда равна 617,39. Проверим третье свойство, уменьшив все значения вариантов в 200 раз. Составим вспомогательную расчетную таблицу (табл. 6.7).

Таблица 6.7. Проверка третьего свойства по данным примера 6.2

xi¢¢ = xi/200 ni xi¢¢ni
1 30 30
2 38 76
3 50 150
4 31 124
5 22 110
6 13 78
S 184 568

Значит, " =  = 568/184 » 3,0869565, т. е.  = /200 или (3,0869565)×(200) » 617,39.

4. Если частоты (частости) средней взвешенной разделить или умножить на постоянное число, то средняя арифметическая не изменится.

Пример 6.5. Умножим в табл. 6.2 (пример 6.1) все частоты ni на 2, получим новый вариационный ряд:

xi 9 12 13 14 15 16 17 19 21 23 27
ni 2 4 6 12 10 6 4 2 2 2 2

Вычислим среднюю арифметическую по формуле (6.8):  = 15,5.

5. Если вариационный ряд состоит из l непересекающихся групп наблюдений, то средняя арифметическая всего ряда равна взвешенной средней арифметической групповых (частных) средних. Причем весами являются объемы групп ( N1, N2, …, Nl), где l - число групп.

Пример 6.6. Вычислить частные (внутригрупповые) средние числа продаж (табл. 6.2) для данных примера 6.1, разделив вариационный ряд на две части: в первую группу включить продавцов с числом продаж до 15, а во вторую - продавцов с числом продаж свыше 15:

xi ni xini xi ni xini
9 1 9 16 3 48
12 2 24 17 2 34
13 3 39 19 1 19
14 6 84 21 1 21
15 5 75 23 1 23

S

17

231

27 1 27
S 26 403

1 =  = 231/17 = 13,588235;

2 =  = 172/9 = 19,1111;

 =  » 15,5.

6. Сумма отклонений вариантов ряда от средней арифметической равна нулю.

Пример 6.7. Проверим это свойство на данных примера 6.2.

Центры интервалов (xi) ni xini xi - (xi - ) ni
200 30 6000 -417,3913 -12521,739
400 38 15200 -217,3913 -8260,8694
600 50 30000 -17,3913 -869,565
800 31 24800 182,6087 5660,8697
1000 22 22000 382,6087 8417,3914
1200 13 15600 582,6087 7573,9131
S 184 113600 - 0

7. Сумма квадратов отклонений вариантов ряда от средней арифметической меньше, чем сумма квадратов отклонений вариантов от любого другого числа  < .

ЗАДАНИЕ


Дата добавления: 2020-11-29; просмотров: 533; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!