Указания по выполнению и оформлению
Задание на лабораторную работу
"Моделирование и статистическая обработка выборки"
- Получение выборки объема n нормально распределенной случайной величины.
Номер зачетной книжки: 130905508
N(a,
a=8,
n=108
№ | Значения | № | Значения | № | Значения | № | Значения | ||
1 | 6,498839 | 28 | 12,32836 | 55 | 11,78857 | 82 | 15,21877 | ||
2 | 1,611584 | 29 | 19,87827 | 56 | 10,33356 | 83 | 14,51952 | ||
3 | 9,221287 | 30 | 4,725467 | 57 | 12,37304 | 84 | 8,564802 | ||
4 | 14,38237 | 31 | 16,30728 | 58 | 10,97871 | 85 | 8,009754 | ||
5 | 13,99175 | 32 | -0,06199 | 59 | 1,14075 | 86 | 10,26851 | ||
6 | 16,66567 | 33 | 10,69474 | 60 | 2,421307 | 87 | 7,872426 | ||
7 | -2,91794 | 34 | 12,51096 | 61 | 11,46997 | 88 | 2,726625 | ||
8 | 6,829094 | 35 | 17,59458 | 62 | 9,613182 | 89 | -0,87403 | ||
9 | 13,47511 | 36 | 7,577415 | 63 | 3,300811 | 90 | 12,14166 | ||
10 | 2,566497 | 37 | 5,381025 | 64 | 6,795261 | 91 | 10,22112 | ||
11 | 4,548979 | 38 | 11,37569 | 65 | 8,657678 | 92 | 11,08953 | ||
12 | -0,45216 | 39 | 6,093381 | 66 | 10,78899 | 93 | 9,067366 | ||
13 | -1,23455 | 40 | 11,78806 | 67 | 8,693575 | 94 | 2,865345 | ||
14 | 3,111853 | 41 | 0,779067 | 68 | 3,445194 | 95 | 14,19098 | ||
15 | 4,132465 | 42 | 3,763812 | 69 | 17,42423 | 96 | 6,443934 | ||
16 | -2,58966 | 43 | 0,392145 | 70 | 10,43599 | 97 | 3,800391 | ||
17 | 5,160376 | 44 | 6,185615 | 71 | 8,361194 | 98 | 3,894359 | ||
18 | 5,979762 | 45 | 7,837604 | 72 | 12,14921
| 99 | 5,855036 | ||
19 | 8,674265 | 46 | 8,140585 | 73 | 12,31004 | 100 | 5,733192 | ||
20 | 6,172535 | 47 | 6,38642 | 74 | 4,817343 | 101 | 5,381025 | ||
21 | 6,365047 | 48 | 18,97251 | 75 | 3,384042 | 102 | 12,24715 | ||
22 | 6,148797 | 49 | -0,71241 | 76 | 13,55594 | 103 | 10,56604 | ||
23 | 14,71321 | 50 | 4,317615 | 77 | 1,994106 | 104 | 4,958479 | ||
24 | 7,573578 | 51 | -4,8879 | 78 | 0,205539 | 105 | 14,5249 | ||
25 | 7,069212 | 52 | 15,23835 | 79 | 11,55662 | 106 | -0,80468 | ||
26 | 5,433963 | 53 | 1,601182 | 80 | 11,19203 | 107 | 10,75286 | ||
27 | 17,86106 | 54 | 4,7321 | 81 | 19,02844 | 108 | 7,41864 |
- Нахождение числовых характеристик выборки:
1. выборочное среднее
844,8019=7,82224
2. выборочная дисперсия
= *3086,436=28,57811
3. исправленная выборочная дисперсия
28,8452
4. среднеквадратичное отклонение
S=
5. исправленное среднеквадратичное отклонение
6. выборочные начальные моменты порядка 2, 3, 4
9694,68=89,76555
125064,8=1158,008
1786793=16544,38
7. выборочные центральные моменты порядка 3, 4
945,0299=8,750277
219776,2=2034,965
8. выборочный коэффициент асимметрии
9. выборочный коэффициент эксцесса
10. мода
=4,4121+
11. медиана
= =7,67
12. выборочные квантили порядка 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9
= =7,67
|
|
- Графическое представление выборки:
Вариационный ряд
№ п\п | Значения | № п\п | Значения | № п\п | Значения | № п\п | Значения | ||
1 | -4,8879 | 28 | 4,132465 | 55 | 7,577415 | 82 | 11,78806 | ||
2 | -2,91794 | 29 | 4,317615 | 56 | 7,837604 | 83 | 11,78857 | ||
3 | -2,58966 | 30 | 4,548979 | 57 | 7,872426 | 84 | 12,14166 | ||
4 | -1,23455 | 31 | 4,725467 | 58 | 8,009754 | 85 | 12,14921 | ||
5 | -0,87403 | 32 | 4,7321 | 59 | 8,140585 | 86 | 12,24715 | ||
6 | -0,80468 | 33 | 4,817343 | 60 | 8,361194 | 87 | 12,31004 | ||
7 | -0,71241 | 34 | 4,958479 | 61 | 8,564802 | 88 | 12,32836 | ||
8 | -0,45216 | 35 | 5,160376 | 62 | 8,657678 | 89 | 12,37304 | ||
9 | -0,06199 | 36 | 5,381025 | 63 | 8,674265 | 90 | 12,51096 | ||
10 | 0,205539 | 37 | 5,381025 | 64 | 8,693575 | 91 | 13,47511 | ||
11 | 0,392145 | 38 | 5,433963 | 65 | 9,067366 | 92 | 13,55594 | ||
12 | 0,779067 | 39 | 5,733192 | 66 | 9,221287 | 93 | 13,99175 | ||
13 | 1,14075 | 40 | 5,855036 | 67 | 9,613182 | 94 | 14,19098 | ||
14 | 1,601182 | 41 | 5,979762 | 68 | 10,22112 | 95 | 14,38237 | ||
15 | 1,611584 | 42 | 6,093381 | 69 | 10,26851 | 96 | 14,51952 | ||
16 | 1,994106 | 43 | 6,148797 | 70 | 10,33356 | 97 | 14,5249 | ||
17 | 2,421307 | 44 | 6,172535 | 71 | 10,43599 | 98 | 14,71321 | ||
18 | 2,566497 | 45 | 6,185615
| 72 | 10,56604 | 99 | 15,21877 | ||
19 | 2,726625 | 46 | 6,365047 | 73 | 10,69474 | 100 | 15,23835 | ||
20 | 2,865345 | 47 | 6,38642 | 74 | 10,75286 | 101 | 16,30728 | ||
21 | 3,111853 | 48 | 6,443934 | 75 | 10,78899 | 102 | 16,66567 | ||
22 | 3,300811 | 49 | 6,498839 | 76 | 10,97871 | 103 | 17,42423 | ||
23 | 3,384042 | 50 | 6,795261 | 77 | 11,08953 | 104 | 17,59458 | ||
24 | 3,445194 | 51 | 6,829094 | 78 | 11,19203 | 105 | 17,86106 | ||
25 | 3,763812 | 52 | 7,069212 | 79 | 11,37569 | 106 | 18,97251 | ||
26 | 3,800391 | 53 | 7,41864 | 80 | 11,46997 | 107 | 19,02844 | ||
27 | 3,894359 | 54 | 7,573578 | 81 | 11,55662 | 108 | 19,87827 |
Статистический ряд
Значения | Частота | Значения | Частота | Значения | Частота | Значения | Частота | ||
-4,8879 | 1 | 4,132465 | 1 | 7,837604 | 1 | 11,78857 | 1 | ||
-2,91794 | 1 | 4,317615 | 1 | 7,872426 | 1 | 12,14166 | 1 | ||
-2,58966 | 1 | 4,548979 | 1 | 8,009754 | 1 | 12,14921 | 1 | ||
-1,23455 | 1 | 4,725467 | 1 | 8,140585 | 1 | 12,24715 | 1 | ||
-0,87403 | 1 | 4,7321 | 1 | 8,361194 | 1 | 12,31004 | 1 | ||
-0,80468 | 1 | 4,817343 | 1 | 8,564802 | 1 | 12,32836 | 1 | ||
-0,71241 | 1 | 4,958479 | 1 | 8,657678 | 1 | 12,37304 | 1 | ||
-0,45216 | 1 | 5,160376 | 1 | 8,674265 | 1 | 12,51096 | 1 | ||
-0,06199 | 1 | 5,381025 | 2 | 8,693575
| 1 | 13,47511 | 1 | ||
0,205539 | 1 | 5,433963 | 1 | 9,067366 | 1 | 13,55594 | 1 | ||
0,392145 | 1 | 5,733192 | 1 | 9,221287 | 1 | 13,99175 | 1 | ||
0,779067 | 1 | 5,855036 | 1 | 9,613182 | 1 | 14,19098 | 1 | ||
1,14075 | 1 | 5,979762 | 1 | 10,22112 | 1 | 14,38237 | 1 | ||
1,601182 | 1 | 6,093381 | 1 | 10,26851 | 1 | 14,51952 | 1 | ||
1,611584 | 1 | 6,148797 | 1 | 10,33356 | 1 | 14,5249 | 1 | ||
1,994106 | 1 | 6,172535 | 1 | 10,43599 | 1 | 14,71321 | 1 | ||
2,421307 | 1 | 6,185615 | 1 | 10,56604 | 1 | 15,21877 | 1 | ||
2,566497 | 1 | 6,365047 | 1 | 10,69474 | 1 | 15,23835 | 1 | ||
2,726625 | 1 | 6,38642 | 1 | 10,75286 | 1 | 16,30728 | 1 | ||
2,865345 | 1 | 6,443934 | 1 | 10,78899 | 1 | 16,66567 | 1 | ||
3,111853 | 1 | 6,498839 | 1 | 10,97871 | 1 | 17,42423 | 1 | ||
3,300811 | 1 | 6,795261 | 1 | 11,08953 | 1 | 17,59458 | 1 | ||
3,384042 | 1 | 6,829094 | 1 | 11,19203 | 1 | 17,86106 | 1 | ||
3,445194 | 1 | 7,069212 | 1 | 11,37569 | 1 | 18,97251 | 1 | ||
3,763812 | 1 | 7,41864 | 1 | 11,46997 | 1 | 19,02844 | 1 | ||
3,800391 | 1 | 7,573578 | 1 | 11,55662 | 1 | 19,87827 | 1 | ||
3,894359 | 1 | 7,577415 | 1 | 11,78806 | 1 |
13. группировка данных
R= 19,87827-(-4,8879)=24,76617
≈n=> ≈108=>r≈8
h= =
Сгруппированный статистический ряд
Интервалы | Частоты |
[-4,8879; -1,7879) | 3 |
[-1,7879; 1,3121) | 10 |
[1,3121; 4,4121) | 16 |
[4,4121; 7,5121) | 24 |
[7,5121; 10,6121) | 19 |
[10,6121; 13,7121) | 20 |
[13,7121; 16,8121) | 10 |
[16,8121; 19,9121) | 6 |
Таблица частот группировки выборки
i |
|
|
|
|
|
|
|
1 | -4,8879 | -1,7879 | 3 | -3,3379 | 3 | 0,086111 | 0,027778 |
2 | -1,7879 | 1,3121 | 10 | -0,2379 | 13 | 0,287037 | 0,12037 |
3 | 1,3121 | 4,4121 | 16 | 2,8621 | 29 | 0,459259 | 0,268519 |
4 | 4,4121 | 7,5121 | 24 | 5,9621 | 53 | 0,688889 | 0,490741 |
5 | 7,5121 | 10,6121 | 19 | 9,0621 | 72 | 0,54537 | 0,666667 |
6 | 10,6121 | 13,7121 | 20 | 12,1621 | 92 | 0,574074 | 0,851852 |
7 | 13,7121 | 16,8121 | 10 | 15,2621 | 102 | 0,287037 | 0,944444 |
8 | 16,8121 | 19,9121 | 6 | 18,3621 | 108 | 0,172222 | 1 |
-накопленные частоты
14. гистограмма частот
15. полигон частот
16. кумулята
17. эмпирическая функция распределения.
- Статистическое оценивание параметров.
Получение оценок параметров:
18. метод моментов
Теоретические моменты случайной величины зависят от параметра, а выборочные моменты зависят от элементов выборки. Но выборочные моменты приближенно равны теоретическим. Таким образом, приравнивая их, получим уравнения, связывающие параметр и элементы выборки
19. Метод максимального правдоподобия,
Оценка , обеспечивающая по параметру максимум функции правдоподобия, называется оценкой максимального правдоподобия параметра .
Функция правдоподобия для исходной случайной величины, распределенной по нормальному закону, имеет следующий вид:
Логарифмическая функция правдоподобия:
.
Частные производные по и приравняем к нулю:
Докажем, что точка - точка максимума.
Найдем вторые производные функции правдоподобия L в точке .
Матрица вторых производных примет вид
и имеет отрицательную определенность согласно критерию Сильвестра, так как
Значит полученные значения являются максимумом функции правдоподобия L
Исследование свойств полученных оценок:
20. несмещенность
Оценки и асимптотически не смещены, так как получены методом максимального правдоподобия.
Оценка называется несмещенной оценкой параметра , если
Оценка называется асимптотически несмещенной оценкой параметра , если
Проверка оценки параметра на несмещенность
M =a
оценка не смещена.
Проверка оценки параметра на несмещенность
Подставив в последнее выражение
,
Получим . Оценка смещена.
Очевидно, что при достаточно большой выборке, и является несмещенной оценкой параметра .
21. Состоятельность
Оценки и состоятельны, так как получены методом максимального правдоподобия.
При достаточно большой выборке, т.е. при и для .
Проверка оценки параметра на состоятельность
Согласно неравенству Чебышева и , получим .
Очевидно, при оценка состоятельна.
Проверка оценки параметра на состоятельность
Согласно неравенству Чебышева
и , при . Получим при . Оценка состоятельна.
22. Эффективность
Оценки и асимптотически эффективны, так как получены методом максимального правдоподобия.
Несмещенная оценка параметра называется эффективной оценкой , если выполняется , где .
Проверка оценки параметра на эффективность
, , .
По определению . Следовательно, оценка асимптотически эффективна.
Проверка оценки параметра на эффективность
, , оценка смещена, неэффективна.
,
,
при .
С другой стороны,
при . Следовательно, оценка асимптотически эффективна.
23. Оптимальность
Несмещенная оценка называется оптимальной оценкой параметра , если она эффективна
Проверка оценки параметра а на оптимальность:
Оценка а оптимальна, т.к. она эффективна
Проверка оценки параметра на оптимальность
А) Оценка не оптимальна тк она не эффективна
Б) Оценка оптимальна тк она эффективна
24. Нормальность
Проверка оценки параметра а на нормальность
оценка а нормальна.
Проверка оценки параметра на нормальность
Используем Центральную предельную теорему (ЦПТ):
Если случайные величины независимы, одинаково распределены и имеют конечные математические ожидания и дисперсии то при n
где - функция стандартного нормального распределения
- Интервальное оценивание параметров:
25. Построение доверительных интервалов для каждого из параметров уровней значимости 0.05 и 0.01.
Доверительным интервалом с уровнем значимости α параметра θ называется интервал Ι = [ Ι1 ; Ι2], для которого выполняется условие:
Р(Ι1 θ Ι2) = 1 – α
1) Доверительный интервал для параметра a
Выберем статистику , где - распределение Стьюдента с n-1 степенью свободы. Выбор этой статистики обусловлен тем, что она не зависит от σ.
Поскольку распределение Стьюдента симметрично относительно 0, то
Разрешим левую часть относительно a
Следовательно, доверительный интервал для a с уровнем значимости α
Доверительный интервал для параметра a с уровнем значимости α=0.01
Доверительный интервал для параметра a с уровнем значимости α=0.05
2) Доверительный интервал для параметра
Выберем статистику , где - распределение Пирсона с n-1 степенью свободы. Тогда:
Разрешим левую часть относительно :
Следовательно, доверительный интервал для с уровнем значимости α
Доверительный интервал для с уровнем значимости α=0.01
Доверительный интервал для с уровнем значимости α=0.05
6. Проверка гипотез:
26. Проверка гипотезы о виде распределения
Проверку гипотезы о нормальности распределении генеральной совокупности можно произвести с помощью критерия согласия χ2 – Пирсона. С этой целью рассчитывается следующая статистика:
где k – количество интервалов группировки признака, ni – частота i-го интервала, pi – теоретические вероятности попадания нормально распределенной случайной величины с параметрами , S в i-ый интервал.
Если расчетное значение статистики ρ< (r – число параметров распределения, ε – уровень значимости) то гипотеза о нормальном распределении генеральной совокупности принимается, иначе – отклоняется. Для проверки всех гипотез примем уровень значимости α=0.05
Рассчитаем статистику ρ для заданной выборки.
№ | Начало интервала | Конец интервала | |||||
1 | -4,8879 | -1,7879 | 3 | 0,027400148 | 2,959216 | 0,040784 | 0,000562 |
2 | -1,7879 | 1,3121 | 10 | 0,075537594 | 8,15806 | 1,84194 | 0,415876 |
3 | 1,3121 | 4,4121 | 16 | 0,150116755 | 16,21261 | -0,21261 | 0,002788 |
4 | 4,4121 | 7,5121 | 24 | 0,21510027 | 23,23083 | 0,769171 | 0,025467 |
5 | 7,5121 | 10,6121 | 19 | 0,222252659 | 24,00329 | -5,00329 | 1,042894 |
6 | 10,6121 | 13,7121 | 20 | 0,16559669 | 17,88444 | 2,115557 | 0,25025 |
7 | 13,7121 | 16,8121 | 10 | 0,088964191 | 9,608133 | 0,391867 | 0,015982 |
8 | 16,8121 | 19,9121 | 6 | 0,034455276 | 3,72117 | 2,27883 | 1,395547 |
Сумма | - | - | 108 | 0,979423583 | - | - | 3,149367 |
Критическое значение для уровня значимости α=0,05 равно 11,07. Таким образом, поскольку 3,149367 ρ< , то гипотеза о нормальном распределении генеральной совокупности не отвергается.
27. Проверка гипотез о каждом из параметров.
1. Гипотеза о среднем
Возьмем гипотезы:
8
Тогда
Таким образом, , то есть принимается.
ВЫВОД: Можно считать, что данная выборка имеет a=8
2. Гипотеза о дисперсии
2.1.Возьмем гипотезы:
Тогда
Таким образом, , то есть .
ВЫВОД: Можно считать, что данная выборка имеет =5
Таким образом, поскольку ρ< , то гипотеза о нормальном распределении генеральной совокупности не отвергается.
7. Принятие статистического решения:
28. Теоретические числовые характеристики
Теоретическое среднее
Теоретическая дисперсия
28,57811
=S=5,34585
Теоретические центральные моменты порядка 3, 4
Теоретические начальные моменты порядка 2, 3, 4
28,57811,
28,57811+6,1187=89,7655
Теоретический коэффициент асимметрии
Теоретический коэффициент аксцесса
Теоретическая мода
Теоретическая медиана
⇒
⇒
⇒ =0
Теоретические квантили порядков 0,1, 0,2 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9
Параллельную таблицу теоретических и выборочных числовых характеристик
Теоретические характеристики | Значения | Выборочные числовые характеристики | Значения |
a A E | S |
29. построить на одном чертеже и в одном масштабе график плотности, гистограмму и полигон
30. Вывод о распределении генеральной совокупности
Анализ результатов проверки статистических гипотез позволяет сделать вывод о том, что гипотеза о нормальном распределении не отвергается с уровнем значимости a=0,05 (т.к. значение не попало в критическую область).
Значит, генеральную совокупность можно моделировать с помощью нормального закона распределения с параметрами:
a=
5,34585
31. в случае если гипотезы о выбранной статистической модели отвергаются, предложить другую модель.
Указания по выполнению и оформлению
Выборку надо представить в трех видах: первичном (в порядке получения), в виде вариационного ряда, группированного ряда. Кроме результатов, должны быть приведены все расчетные формулы и определения, описаны методы. Для сортировки и вычисления характеристик можно использовать Excel или другие пакеты.
Отчет о выполнении работы может быть написан от руки в тетради или на листах формата А4, или распечатан. Минимальные требования: он должен быть достаточно аккуратным, на обложке указывается название работы, фамилия и имя студента, номер группы, год.
Работа оценивается по 100-балльной шкале, вес – 15%.
Срок сдачи работы: до 1 июня.
Замечание
Выложены примеры выполнения лабораторных работ. Обратите внимание, что задания в них разные и ни одно полностью не совпадает с данным заданием. Поэтому их ни в коем случае не надо копировать. Однако они могут быть полезными.
Доверительный интервал для параметра a с уровнем значимости α=0.01
Доверительный интервал для параметра a с уровнем значимости α=0.05
2) Доверительный интервал для параметра
Выберем статистику , где - распределение Пирсона с n-1 степенью свободы. Тогда:
Разрешим левую часть относительно :
Следовательно, доверительный интервал для с уровнем значимости α
Доверительный интервал для с уровнем значимости α=0.01
Дата добавления: 2018-05-30; просмотров: 141; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!