Решение типовых задач (тема 8, 9)



Пример 1. Имеются следующие данные об успеваемости студентов факультета по статистике: 4, 2, 5, 5, 3, 4, 3, 2, 5, 5, 4, 4, 3, 3, 4, 2, 1, 1, 1, 3, 4, 4, 4, 5, 5, 4, 2, 2, 3, 3.

Для анализа распределения студентов по успеваемости: 1) постройте дискретный ряд распределения; 2) дайте графическое изображение ряда; 3) исчислите структурные средние ряда (двумя способами) и показатели формы распределения; 4) проверьте гипотезу о соответствии эмпирического распределения нормальному закону распределения.

Решение

1. Для построения дискретного вариационного ряда необходимо подсчитать количество появления каждой оценки, т.е. частоту появления признака. Дискретный ряд представлен в таблице 5.1.

Таблица 5.1

Распределение студентов по успеваемости

Успеваемость (балл), х Число сту- дентов, f Накопленные частоты, S нак x f x2 f
1 3 3 3 3 88,875
2 5 8 10 20 15,787
3 7 15 21 63 0,086
4 9 24 36 144 1,8136
5 6 30 30 150 46,3333
Итого 30 - 100 380 152,8949

2. Графически дискретный вариационный ряд может быть представлен в виде полигона (рис.5.1), кумуляты (рис.5.2) распределения. Полигон строится в прямоугольной системе координат.

 

 

 

 


         

 

              полигон распределения               теоретическая кривая нормального распределения Рис. 5.1. Распределение студентов по успеваемости.  

 

 


         

По оси абсцисс откладываются значения дискретного признака, а по оси ординат – частоты распределения. Полигон часто замыкается, - для этого крайние вершины соединяются с точками на оси абсцисс, отстоящими на одно деление в принятом масштабе (в данном примере х = 0 и х = 6).

     Кумулята – это линейный график накопленных частот. Для построения кумуляты дополнительно рассчитываются накопленные частоты (S НАК), - они представлены в таблице 5.1, и в прямоугольной системе координат строится их график (рис.5.2).

 

 

 


Рис. 5.2. Кумулята распределения студентов по успеваемости

 

    3. Cтруктурными средними выступают мода и медиана.

    Модальное значение признака, т.е. Мо = 4 (балла). Графически – это вершина полигона распределения (рис.5.1).

    Медиана равна 3 балла, так как SНАК = =15 для признака, равному 3. Графически медиана определяется с помощью кумуляты распределения. Для ее определения сумму ординат (сумму частот) делят пополам, т.е. . Через полученную точку проводится прямая параллельно оси абсцисс до пересечения ее с кумулятой. Абсцисса точки пересечения является медианной величиной распределения (рис. 5.2).

.

        

Пример 2. Известно распределение коммерческих банков области по размеру прибыли.

 

Размер прибыли, млн.грн До 10,0 10,0 – 20,0 20,0 - 30,0 30,0 - 40,0 40,0 - 50,0 Свыше 50,0 Ито- го
Количество банков 20 40 25 45 50 20 200

 

Оцените уровень вариации банков по размеру прибыли, рассчитав абсолютные и относительные показатели вариации. Сделайте выводы.

Решение

1. Для определения абсолютных показателей вариации необходимо закрыть открытые интервалы и перейти от интервального ряда к дискретному (табл.5.3. гр. 3)

Таблица 5.3

Вспомогательные расчеты для определения показателей вариации

 

Размер прибыли,млн.грн Количество банков, f Середина интервала,х xf x 2 x 2 f
1 2 3 4 5 6 7 8
до 10,0 20 5 100 52,5 1378,125 25 500
10,0-20,0 40 15 600 650 10562,5 225 9000
20,0-30,0 25 25 625 156,25 976,5625 625 15625
30,0-40,0 45 35 1575 168,75 632,8125 1225 55125
40,0-50,0 50 45 2250 687,5 9453,125 2025 101250
Свыше50,0 20 55 1100 475,0 11281,25 3025 60500
Итого 200,0   6250 2190 46687,5   242000

 

Рассчитываем следующие абсолютные показатели вариации: размах вариации (R); среднее линейное отклонение ( ), дисперсию ( ) и среднее квадратическое отклонение( ).  60 – 0= = 60 (млн. грн.) Размер отклонений величины максимальной прибыли от минимальной по всей совокупности банков составляет 60 млн.грн.

Для расчета и определим средний размер прибыли по всей совокупности банков.

 млн.грн;  млн.грн.

Индивидуальные размеры прибыли в среднем по всей совокупности банков отклонялись в ту и другую сторону от своего среднего значения на 10,95 млн. грн.

Дисперсию определим двумя способами:

- по формуле среднего квадрата отклонений  = = 233,44

- по формуле “разности средних”:

- (31,25) 2 = 1210 – 976,56 = 233,44.

Среднее квадратическое отклонение:  млн.грн.

    Размеры прибыли каждого из 200 банков отклонялись в ту и другую сторону от среднего значения на 15,28 млн. грн.

    Определим теперь относительные показатели вариации:

- коэффициент осцилляции: ;

- относительное линейное отклонение:  %;

- коэффициент вариации:

Анализируемый вариационный ряд распределения банков по размеру прибыли является статистически неоднородным, так как коэффициент вариации больше 33%. Об этом свидетельствует другие показатели вариации, например, коэффициент осциляции показывает, что разность между крайними значениями признака почти в 2 раза больше ( или 192 %) их среднего значения.

Среднее значение показателя прибыли по данной совокупности банков (  тыс.грн) не является надежной или типической ее характеристикой.

 

Пример 3. Распределение семей по среднедушевым доходам следующее (таблица 5.4). Определите средние и структурные характеристики распределения семей по размеру среднедушевого дохода.

Решение

1а. Определяем структурные характеристики ряда распределе-ния, т.е. моду медиану, квартили, децили по рассмотренным выше формулам этих характеристик для интервальных вариационных рядов.

Для выбора соответствующего интервала предварительно опре-делим накопленные частоты , (табл. 5.4, гр. 4).

Модальный интервал – это интервал с наибольшей частотой , тогда грн.

Большинство семей имеют среднедушевые доходы в размере 196,67 грн. Медианным является интервал , т.к. для него первая накопленная частота больше половины объема совокупности, т.е. 120>100. Тогда медиана будет равна: грн.

Половина семей имеют среднедушевые доходы, не превышаю-щие доходы 202 грн., а у другой половины семей среднедушевые доходы, соответственно, выше 202 грн.

Интервал, в котором будет находиться первый квартиль( ) рас-пределения, , т.к. ему соответствует первая накопленная час-тота , большая ; а интервал, в котором находится третий квартиль( ), будет , т.к. ему соответствует > .

Тогда соответствующие квартили будут равны:

грн;  грн.

Среднедушевые доходы, не превышающие 180 грн., получают не менее четверти (25%) из всей совокупности семей, а в размере, не превышающем 230грн., не менее 75% всех семей.

Более детальная характеристика распределения может быть получена на основе децилей распределения. Интервалы соответствующих децилей определяются аналогично по соответствующим накопленным частотам. Например, находим первую , - это будет ; тогда соответствующий ей интервал будет тем интервалом, в котором находится первый дециль (d 1) – и т.д.

Рассчитаем соответствующие децили:

 грн;        грн;

 грн;  грн;

 грн;  грн;

 грн;   грн;

 грн. Первый дециль показывает, что у 10% семей с самым низким среднедушевым доходом самый высокий размер среднедушевого дохода составляет 160 грн., а девятый дециль, - что среди 10% семей с самым высоким уровнем дохода – нижняя его граница составляет 254 грн.

Пример 5. Налоговой инспекцией одного из районов города проверено 172 коммерческих киоска и в 146 из них выявлены финансовые нарушения. Определите среднее значение, дисперсию и среднее квадратическое отклонение альтернативного признака, т.е. доли киосков, у которых выявлены финансовые нарушения.

Решение

 Определяем долю коммерческих киосков, у которых выявлены финансовые нарушения: . Тогда доля киосков, у которых отсутствуют финансовые нарушения, будет: .

Среднее значение альтернативного признака: . Дисперсия альтернативного признака составит:  = 0,85 · 0,15 = 0,128, а среднее квадратическое отклонение: .


Дата добавления: 2018-09-23; просмотров: 2942; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!