Указания по выполнению и оформлению

Задание на лабораторную работу

"Моделирование и статистическая обработка выборки"

 

  1. Получение выборки объема n  нормально распределенной случайной величины.

Номер зачетной книжки: 130905508

N(a,

a=8,

n=108

Значения

Значения

Значения

Значения

1

6,498839

28

12,32836

55

11,78857

82

15,21877

2

1,611584

29

19,87827

56

10,33356

83

14,51952

3

9,221287

30

4,725467

57

12,37304

84

8,564802

4

14,38237

31

16,30728

58

10,97871

85

8,009754

5

13,99175

32

-0,06199

59

1,14075

86

10,26851

6

16,66567

33

10,69474

60

2,421307

87

7,872426

7

-2,91794

34

12,51096

61

11,46997

88

2,726625

8

6,829094

35

17,59458

62

9,613182

89

-0,87403

9

13,47511

36

7,577415

63

3,300811

90

12,14166

10

2,566497

37

5,381025

64

6,795261

91

10,22112

11

4,548979

38

11,37569

65

8,657678

92

11,08953

12

-0,45216

39

6,093381

66

10,78899

93

9,067366

13

-1,23455

40

11,78806

67

8,693575

94

2,865345

14

3,111853

41

0,779067

68

3,445194

95

14,19098

15

4,132465

42

3,763812

69

17,42423

96

6,443934

16

-2,58966

43

0,392145

70

10,43599

97

3,800391

17

5,160376

44

6,185615

71

8,361194

98

3,894359

18

5,979762

45

7,837604

72

12,14921

99

5,855036

19

8,674265

46

8,140585

73

12,31004

100

5,733192

20

6,172535

47

6,38642

74

4,817343

101

5,381025

21

6,365047

48

18,97251

75

3,384042

102

12,24715

22

6,148797

49

-0,71241

76

13,55594

103

10,56604

23

14,71321

50

4,317615

77

1,994106

104

4,958479

24

7,573578

51

-4,8879

78

0,205539

105

14,5249

25

7,069212

52

15,23835

79

11,55662

106

-0,80468

26

5,433963

53

1,601182

80

11,19203

107

10,75286

27

17,86106

54

4,7321

81

19,02844

108

7,41864

  1. Нахождение числовых характеристик выборки:

1. выборочное среднее

844,8019=7,82224

2. выборочная дисперсия

 = *3086,436=28,57811

3. исправленная выборочная дисперсия

28,8452

4. среднеквадратичное отклонение

S=

5. исправленное среднеквадратичное отклонение

6. выборочные начальные моменты порядка 2, 3, 4

9694,68=89,76555

125064,8=1158,008

1786793=16544,38

7. выборочные центральные моменты порядка 3, 4

 

945,0299=8,750277

219776,2=2034,965

8. выборочный коэффициент асимметрии

 

9. выборочный коэффициент эксцесса

10. мода

 =4,4121+

11. медиана

= =7,67

12. выборочные квантили порядка 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9

= =7,67

 

 

  1. Графическое представление выборки:

Вариационный ряд

№ п\п

Значения

№ п\п

Значения

№ п\п

Значения

№ п\п

Значения

1

-4,8879

28

4,132465

55

7,577415

82

11,78806

2

-2,91794

29

4,317615

56

7,837604

83

11,78857

3

-2,58966

30

4,548979

57

7,872426

84

12,14166

4

-1,23455

31

4,725467

58

8,009754

85

12,14921

5

-0,87403

32

4,7321

59

8,140585

86

12,24715

6

-0,80468

33

4,817343

60

8,361194

87

12,31004

7

-0,71241

34

4,958479

61

8,564802

88

12,32836

8

-0,45216

35

5,160376

62

8,657678

89

12,37304

9

-0,06199

36

5,381025

63

8,674265

90

12,51096

10

0,205539

37

5,381025

64

8,693575

91

13,47511

11

0,392145

38

5,433963

65

9,067366

92

13,55594

12

0,779067

39

5,733192

66

9,221287

93

13,99175

13

1,14075

40

5,855036

67

9,613182

94

14,19098

14

1,601182

41

5,979762

68

10,22112

95

14,38237

15

1,611584

42

6,093381

69

10,26851

96

14,51952

16

1,994106

43

6,148797

70

10,33356

97

14,5249

17

2,421307

44

6,172535

71

10,43599

98

14,71321

18

2,566497

45

6,185615

72

10,56604

99

15,21877

19

2,726625

46

6,365047

73

10,69474

100

15,23835

20

2,865345

47

6,38642

74

10,75286

101

16,30728

21

3,111853

48

6,443934

75

10,78899

102

16,66567

22

3,300811

49

6,498839

76

10,97871

103

17,42423

23

3,384042

50

6,795261

77

11,08953

104

17,59458

24

3,445194

51

6,829094

78

11,19203

105

17,86106

25

3,763812

52

7,069212

79

11,37569

106

18,97251

26

3,800391

53

7,41864

80

11,46997

107

19,02844

27

3,894359

54

7,573578

81

11,55662

108

19,87827

Статистический ряд

Значения

Частота

Значения

Частота

Значения

Частота

Значения

Частота

-4,8879

1

4,132465

1

7,837604

1

11,78857

1

-2,91794

1

4,317615

1

7,872426

1

12,14166

1

-2,58966

1

4,548979

1

8,009754

1

12,14921

1

-1,23455

1

4,725467

1

8,140585

1

12,24715

1

-0,87403

1

4,7321

1

8,361194

1

12,31004

1

-0,80468

1

4,817343

1

8,564802

1

12,32836

1

-0,71241

1

4,958479

1

8,657678

1

12,37304

1

-0,45216

1

5,160376

1

8,674265

1

12,51096

1

-0,06199

1

5,381025

2

8,693575

1

13,47511

1

0,205539

1

5,433963

1

9,067366

1

13,55594

1

0,392145

1

5,733192

1

9,221287

1

13,99175

1

0,779067

1

5,855036

1

9,613182

1

14,19098

1

1,14075

1

5,979762

1

10,22112

1

14,38237

1

1,601182

1

6,093381

1

10,26851

1

14,51952

1

1,611584

1

6,148797

1

10,33356

1

14,5249

1

1,994106

1

6,172535

1

10,43599

1

14,71321

1

2,421307

1

6,185615

1

10,56604

1

15,21877

1

2,566497

1

6,365047

1

10,69474

1

15,23835

1

2,726625

1

6,38642

1

10,75286

1

16,30728

1

2,865345

1

6,443934

1

10,78899

1

16,66567

1

3,111853

1

6,498839

1

10,97871

1

17,42423

1

3,300811

1

6,795261

1

11,08953

1

17,59458

1

3,384042

1

6,829094

1

11,19203

1

17,86106

1

3,445194

1

7,069212

1

11,37569

1

18,97251

1

3,763812

1

7,41864

1

11,46997

1

19,02844

1

3,800391

1

7,573578

1

11,55662

1

19,87827

1

3,894359

1

7,577415

1

11,78806

1

13. группировка данных

R= 19,87827-(-4,8879)=24,76617

≈n=> ≈108=>r≈8

h= =

Сгруппированный статистический ряд

Интервалы

Частоты

[-4,8879; -1,7879)

3

[-1,7879; 1,3121)

10

[1,3121; 4,4121)

16

[4,4121; 7,5121)

24

[7,5121; 10,6121)

19

[10,6121; 13,7121)

20

[13,7121; 16,8121)

10

[16,8121; 19,9121)

6

 

Таблица частот группировки выборки

i

   

      

     

 

    

1

-4,8879

-1,7879

3

-3,3379

3

0,086111

0,027778

2

-1,7879

1,3121

10

-0,2379

13

0,287037

0,12037

3

1,3121

4,4121

16

2,8621

29

0,459259

0,268519

4

4,4121

7,5121

24

5,9621

53

0,688889

0,490741

5

7,5121

10,6121

19

9,0621

72

0,54537

0,666667

6

10,6121

13,7121

20

12,1621

92

0,574074

0,851852

7

13,7121

16,8121

10

15,2621

102

0,287037

0,944444

8

16,8121

19,9121

6

18,3621

108

0,172222

1

 -накопленные частоты

14. гистограмма частот

 

15. полигон частот

16.  кумулята

 

17. эмпирическая функция распределения.

 

 

  1. Статистическое оценивание параметров.

Получение оценок параметров:

18. метод моментов

Теоретические моменты случайной величины зависят от параметра, а выборочные моменты зависят от элементов выборки. Но выборочные моменты приближенно равны теоретическим. Таким образом, приравнивая их, получим уравнения, связывающие параметр и элементы выборки

 

19. Метод максимального правдоподобия,

Оценка , обеспечивающая по параметру  максимум функции правдоподобия, называется оценкой максимального правдоподобия параметра .

Функция правдоподобия для исходной случайной величины, распределенной по нормальному закону, имеет следующий вид:

 

 

 

Логарифмическая функция правдоподобия:

 

.

 

Частные производные по  и  приравняем к нулю:

 

 

 

Докажем, что точка  - точка максимума.

 

Найдем вторые производные функции правдоподобия L в точке .

 

 

Матрица вторых производных примет вид

 

 

и имеет отрицательную определенность согласно критерию Сильвестра, так как

Значит полученные значения являются максимумом функции правдоподобия L

 

Исследование свойств полученных оценок:

20. несмещенность

Оценки  и  асимптотически не смещены, так как получены методом максимального правдоподобия.

Оценка  называется несмещенной оценкой параметра , если

Оценка  называется асимптотически несмещенной оценкой параметра , если

Проверка оценки параметра  на несмещенность

M =a

  оценка  не смещена.

Проверка оценки параметра  на несмещенность

Подставив в последнее выражение

,

Получим . Оценка смещена.

Очевидно, что при достаточно большой выборке,  и является несмещенной оценкой параметра .

21. Состоятельность

Оценки  и  состоятельны, так как получены методом максимального правдоподобия.

При достаточно большой выборке, т.е. при  и для .

Проверка оценки параметра   на состоятельность

Согласно неравенству Чебышева и , получим .

Очевидно, при оценка  состоятельна.

Проверка оценки параметра  на состоятельность

Согласно неравенству Чебышева

и ,     при . Получим   при . Оценка  состоятельна.

22. Эффективность

Оценки  и  асимптотически эффективны, так как получены методом максимального правдоподобия.

Несмещенная оценка   параметра   называется эффективной оценкой , если выполняется , где .

Проверка оценки параметра  на эффективность

, , .

 

 

 

По определению . Следовательно, оценка  асимптотически эффективна.

Проверка оценки параметра  на эффективность

, , оценка  смещена, неэффективна.

,

,

при .

 

С другой стороны,

 

 

при . Следовательно, оценка  асимптотически эффективна.

23. Оптимальность

Несмещенная оценка  называется оптимальной оценкой параметра , если она эффективна

Проверка оценки параметра а на оптимальность:

Оценка а оптимальна, т.к. она эффективна

Проверка оценки параметра на оптимальность

А) Оценка  не оптимальна тк она не эффективна

Б) Оценка   оптимальна тк она эффективна

24. Нормальность

Проверка оценки параметра а на нормальность

 оценка а нормальна.

Проверка оценки параметра на нормальность

Используем Центральную предельную теорему (ЦПТ):

Если случайные величины  независимы, одинаково распределены и имеют конечные математические ожидания и дисперсии то при n

 

 

где  - функция стандартного нормального распределения

 

  1. Интервальное оценивание параметров:

25. Построение доверительных интервалов для каждого из параметров уровней значимости 0.05 и 0.01.

Доверительным интервалом с уровнем значимости α параметра θ называется интервал Ι = [ Ι1 ; Ι2], для которого выполняется условие:

Р(Ι1   θ  Ι2) = 1 – α

1) Доверительный интервал для параметра a

Выберем статистику , где  - распределение Стьюдента с n-1 степенью свободы. Выбор этой статистики обусловлен тем, что она не зависит от σ.

Поскольку распределение Стьюдента симметрично относительно 0, то

Разрешим левую часть относительно a


Следовательно, доверительный интервал для a с уровнем значимости α

 

 

Доверительный интервал для параметра a с уровнем значимости α=0.01

 

Доверительный интервал для параметра a с уровнем значимости α=0.05

 

2) Доверительный интервал для параметра

Выберем статистику , где  - распределение Пирсона с n-1 степенью свободы. Тогда:


Разрешим левую часть относительно :


 

Следовательно, доверительный интервал для с уровнем значимости α

 

 

Доверительный интервал для  с уровнем значимости α=0.01

 

 

 

 

 

Доверительный интервал для  с уровнем значимости α=0.05

 

 

 

 

6. Проверка гипотез:

26. Проверка гипотезы о виде распределения

Проверку гипотезы о нормальности распределении генеральной совокупности можно произвести с помощью критерия согласия χ2 – Пирсона. С этой целью рассчитывается следующая статистика:

 

где k – количество интервалов группировки признака, ni – частота i-го интервала, pi – теоретические вероятности попадания нормально распределенной случайной величины с параметрами , S в i-ый интервал.

Если расчетное значение статистики ρ<  (r – число параметров распределения, ε – уровень значимости) то гипотеза о нормальном распределении генеральной совокупности принимается, иначе – отклоняется. Для проверки всех гипотез примем уровень значимости α=0.05

Рассчитаем статистику ρ для заданной выборки.

Начало интервала Конец интервала

1

-4,8879

-1,7879

3

0,027400148

2,959216

0,040784

0,000562

2

-1,7879

1,3121

10

0,075537594

8,15806

1,84194

0,415876

3

1,3121

4,4121

16

0,150116755

16,21261

-0,21261

0,002788

4

4,4121

7,5121

24

0,21510027

23,23083

0,769171

0,025467

5

7,5121

10,6121

19

0,222252659

24,00329

-5,00329

1,042894

6

10,6121

13,7121

20

0,16559669

17,88444

2,115557

0,25025

7

13,7121

16,8121

10

0,088964191

9,608133

0,391867

0,015982

8

16,8121

19,9121

6

0,034455276

3,72117

2,27883

1,395547

Сумма

-

-

108

0,979423583

-

-

3,149367

 

Критическое значение  для уровня значимости α=0,05 равно 11,07. Таким образом, поскольку 3,149367  ρ< , то гипотеза о нормальном распределении генеральной совокупности не отвергается.

 

27. Проверка гипотез о каждом из параметров.

1. Гипотеза о среднем

Возьмем гипотезы:

8

       Тогда

Таким образом, , то есть  принимается.

ВЫВОД: Можно считать, что данная выборка имеет a=8

2. Гипотеза о дисперсии

2.1.Возьмем гипотезы:

       Тогда

Таким образом, , то есть .

ВЫВОД: Можно считать, что данная выборка имеет =5

Таким образом, поскольку ρ< , то гипотеза о нормальном распределении генеральной совокупности не отвергается.

 

7. Принятие статистического решения:

28. Теоретические числовые характеристики

Теоретическое среднее

 

Теоретическая дисперсия

28,57811

=S=5,34585

Теоретические центральные моменты порядка 3, 4

Теоретические начальные моменты порядка 2, 3, 4

28,57811,

  28,57811+6,1187=89,7655

 

 

 

 

Теоретический коэффициент асимметрии

 

Теоретический коэффициент аксцесса

 

Теоретическая мода

 

Теоретическая медиана

 ⇒

 ⇒

  =0

Теоретические квантили порядков 0,1, 0,2 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9

 

 

Параллельную таблицу теоретических и выборочных числовых характеристик

Теоретические характеристики Значения Выборочные числовые характеристики Значения
a             A E             S  

 

29. построить на одном чертеже и в одном масштабе график плотности, гистограмму и полигон

 

 

 

30. Вывод о распределении генеральной совокупности

Анализ результатов проверки статистических гипотез позволяет сделать вывод о том, что гипотеза о нормальном распределении не отвергается с уровнем значимости a=0,05 (т.к. значение не попало в критическую область).

Значит, генеральную совокупность можно моделировать с помощью нормального закона распределения с параметрами:

a=

5,34585

 

31. в случае если гипотезы о выбранной статистической модели отвергаются, предложить другую модель.

 

Указания по выполнению и оформлению

Выборку надо представить в трех видах: первичном (в порядке получения), в виде вариационного ряда,  группированного ряда. Кроме результатов, должны быть приведены все расчетные формулы и определения, описаны методы. Для сортировки и вычисления характеристик можно использовать Excel или другие пакеты.

 Отчет о выполнении работы может быть написан от руки в тетради или на листах формата А4, или распечатан. Минимальные требования: он должен быть достаточно аккуратным, на обложке указывается название работы, фамилия и имя студента, номер группы, год.

Работа оценивается по 100-балльной шкале, вес – 15%.

Срок сдачи работы: до 1 июня.

Замечание

Выложены примеры выполнения лабораторных работ. Обратите внимание, что задания в них разные и ни одно полностью не совпадает с данным заданием. Поэтому их ни в коем случае не надо копировать. Однако они могут быть полезными.

 

 

           

 

Доверительный интервал для параметра a с уровнем значимости α=0.01

 

Доверительный интервал для параметра a с уровнем значимости α=0.05

 

2) Доверительный интервал для параметра

Выберем статистику , где  - распределение Пирсона с n-1 степенью свободы. Тогда:


Разрешим левую часть относительно :


 

Следовательно, доверительный интервал для с уровнем значимости α

 

 

Доверительный интервал для  с уровнем значимости α=0.01

 


Дата добавления: 2018-05-30; просмотров: 141; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!