Решение типовых задач (тема 8, 9)
Пример 1. Имеются следующие данные об успеваемости студентов факультета по статистике: 4, 2, 5, 5, 3, 4, 3, 2, 5, 5, 4, 4, 3, 3, 4, 2, 1, 1, 1, 3, 4, 4, 4, 5, 5, 4, 2, 2, 3, 3.
Для анализа распределения студентов по успеваемости: 1) постройте дискретный ряд распределения; 2) дайте графическое изображение ряда; 3) исчислите структурные средние ряда (двумя способами) и показатели формы распределения; 4) проверьте гипотезу о соответствии эмпирического распределения нормальному закону распределения.
Решение
1. Для построения дискретного вариационного ряда необходимо подсчитать количество появления каждой оценки, т.е. частоту появления признака. Дискретный ряд представлен в таблице 5.1.
Таблица 5.1
Распределение студентов по успеваемости
Успеваемость (балл), х | Число сту- дентов, f | Накопленные частоты, S нак | x f | x2 f | |
1 | 3 | 3 | 3 | 3 | 88,875 |
2 | 5 | 8 | 10 | 20 | 15,787 |
3 | 7 | 15 | 21 | 63 | 0,086 |
4 | 9 | 24 | 36 | 144 | 1,8136 |
5 | 6 | 30 | 30 | 150 | 46,3333 |
Итого | 30 | - | 100 | 380 | 152,8949 |
2. Графически дискретный вариационный ряд может быть представлен в виде полигона (рис.5.1), кумуляты (рис.5.2) распределения. Полигон строится в прямоугольной системе координат.
|
|
|
По оси абсцисс откладываются значения дискретного признака, а по оси ординат – частоты распределения. Полигон часто замыкается, - для этого крайние вершины соединяются с точками на оси абсцисс, отстоящими на одно деление в принятом масштабе (в данном примере х = 0 и х = 6).
Кумулята – это линейный график накопленных частот. Для построения кумуляты дополнительно рассчитываются накопленные частоты (S НАК), - они представлены в таблице 5.1, и в прямоугольной системе координат строится их график (рис.5.2).
Рис. 5.2. Кумулята распределения студентов по успеваемости
3. Cтруктурными средними выступают мода и медиана.
Модальное значение признака, т.е. Мо = 4 (балла). Графически – это вершина полигона распределения (рис.5.1).
Медиана равна 3 балла, так как SНАК = =15 для признака, равному 3. Графически медиана определяется с помощью кумуляты распределения. Для ее определения сумму ординат (сумму частот) делят пополам, т.е. . Через полученную точку проводится прямая параллельно оси абсцисс до пересечения ее с кумулятой. Абсцисса точки пересечения является медианной величиной распределения (рис. 5.2).
.
Пример 2. Известно распределение коммерческих банков области по размеру прибыли.
|
|
Размер прибыли, млн.грн | До 10,0 | 10,0 – 20,0 | 20,0 - 30,0 | 30,0 - 40,0 | 40,0 - 50,0 | Свыше 50,0 | Ито- го |
Количество банков | 20 | 40 | 25 | 45 | 50 | 20 | 200 |
Оцените уровень вариации банков по размеру прибыли, рассчитав абсолютные и относительные показатели вариации. Сделайте выводы.
Решение
1. Для определения абсолютных показателей вариации необходимо закрыть открытые интервалы и перейти от интервального ряда к дискретному (табл.5.3. гр. 3)
Таблица 5.3
Вспомогательные расчеты для определения показателей вариации
Размер прибыли,млн.грн | Количество банков, f | Середина интервала,х | xf | x 2 | x 2 f | ||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
до 10,0 | 20 | 5 | 100 | 52,5 | 1378,125 | 25 | 500 |
10,0-20,0 | 40 | 15 | 600 | 650 | 10562,5 | 225 | 9000 |
20,0-30,0 | 25 | 25 | 625 | 156,25 | 976,5625 | 625 | 15625 |
30,0-40,0 | 45 | 35 | 1575 | 168,75 | 632,8125 | 1225 | 55125 |
40,0-50,0 | 50 | 45 | 2250 | 687,5 | 9453,125 | 2025 | 101250 |
Свыше50,0 | 20 | 55 | 1100 | 475,0 | 11281,25 | 3025 | 60500 |
Итого | 200,0 | 6250 | 2190 | 46687,5 | 242000 |
Рассчитываем следующие абсолютные показатели вариации: размах вариации (R); среднее линейное отклонение ( ), дисперсию ( ) и среднее квадратическое отклонение( ). 60 – 0= = 60 (млн. грн.) Размер отклонений величины максимальной прибыли от минимальной по всей совокупности банков составляет 60 млн.грн.
|
|
Для расчета и определим средний размер прибыли по всей совокупности банков.
млн.грн; млн.грн.
Индивидуальные размеры прибыли в среднем по всей совокупности банков отклонялись в ту и другую сторону от своего среднего значения на 10,95 млн. грн.
Дисперсию определим двумя способами:
- по формуле среднего квадрата отклонений = = 233,44
- по формуле “разности средних”:
- (31,25) 2 = 1210 – 976,56 = 233,44.
Среднее квадратическое отклонение: млн.грн.
Размеры прибыли каждого из 200 банков отклонялись в ту и другую сторону от среднего значения на 15,28 млн. грн.
Определим теперь относительные показатели вариации:
- коэффициент осцилляции: ;
- относительное линейное отклонение: %;
- коэффициент вариации:
Анализируемый вариационный ряд распределения банков по размеру прибыли является статистически неоднородным, так как коэффициент вариации больше 33%. Об этом свидетельствует другие показатели вариации, например, коэффициент осциляции показывает, что разность между крайними значениями признака почти в 2 раза больше ( или 192 %) их среднего значения.
Среднее значение показателя прибыли по данной совокупности банков ( тыс.грн) не является надежной или типической ее характеристикой.
|
|
Пример 3. Распределение семей по среднедушевым доходам следующее (таблица 5.4). Определите средние и структурные характеристики распределения семей по размеру среднедушевого дохода.
Решение
1а. Определяем структурные характеристики ряда распределе-ния, т.е. моду медиану, квартили, децили по рассмотренным выше формулам этих характеристик для интервальных вариационных рядов.
Для выбора соответствующего интервала предварительно опре-делим накопленные частоты , (табл. 5.4, гр. 4).
Модальный интервал – это интервал с наибольшей частотой , тогда грн.
Большинство семей имеют среднедушевые доходы в размере 196,67 грн. Медианным является интервал , т.к. для него первая накопленная частота больше половины объема совокупности, т.е. 120>100. Тогда медиана будет равна: грн.
Половина семей имеют среднедушевые доходы, не превышаю-щие доходы 202 грн., а у другой половины семей среднедушевые доходы, соответственно, выше 202 грн.
Интервал, в котором будет находиться первый квартиль( ) рас-пределения, , т.к. ему соответствует первая накопленная час-тота , большая ; а интервал, в котором находится третий квартиль( ), будет , т.к. ему соответствует > .
Тогда соответствующие квартили будут равны:
грн; грн.
Среднедушевые доходы, не превышающие 180 грн., получают не менее четверти (25%) из всей совокупности семей, а в размере, не превышающем 230грн., не менее 75% всех семей.
Более детальная характеристика распределения может быть получена на основе децилей распределения. Интервалы соответствующих децилей определяются аналогично по соответствующим накопленным частотам. Например, находим первую , - это будет ; тогда соответствующий ей интервал будет тем интервалом, в котором находится первый дециль (d 1) – и т.д.
Рассчитаем соответствующие децили:
грн; грн;
грн; грн;
грн; грн;
грн; грн;
грн. Первый дециль показывает, что у 10% семей с самым низким среднедушевым доходом самый высокий размер среднедушевого дохода составляет 160 грн., а девятый дециль, - что среди 10% семей с самым высоким уровнем дохода – нижняя его граница составляет 254 грн.
Пример 5. Налоговой инспекцией одного из районов города проверено 172 коммерческих киоска и в 146 из них выявлены финансовые нарушения. Определите среднее значение, дисперсию и среднее квадратическое отклонение альтернативного признака, т.е. доли киосков, у которых выявлены финансовые нарушения.
Решение
Определяем долю коммерческих киосков, у которых выявлены финансовые нарушения: . Тогда доля киосков, у которых отсутствуют финансовые нарушения, будет: .
Среднее значение альтернативного признака: . Дисперсия альтернативного признака составит: = 0,85 · 0,15 = 0,128, а среднее квадратическое отклонение: .
Дата добавления: 2018-09-23; просмотров: 2942; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!