Confidence Intervals for Col_1
Лабораторная работа № 1
ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ
Цель работы: ознакомиться с основными понятиями математической статистики и методикой проведения первичного исследования статистических данных.
Задание: При проведении экспериментов фиксировались значения случайной величины X, характеризующей стоимость строительно-монтажных работ на участке, у.е.. Произвести первичную обработку полученных опытных данных с целью изучения свойств случайной величины Х.
Пример выполнения лабораторной работы №1.
1) Составим расчетную таблицу, в которой запишем вариационный ряд (элементы выборки в порядке неубывания признака) и произведем расчеты, необходимые для вычисления числовых характеристик.
Таблица 1.1 – Расчетная таблица
Номер п/п | Выборка, у.е. | Вариацион-ныйряд, у.е., |
| |||||
1 | 126 | 85 | -42,160 | 1777,466 | -74937,950 | 3159383,959 | ||
2 | 105 | 89 | -38,160 | 1456,186 | -55568,042 | 2120476,502 | ||
3 | 134 | 89 | -38,160 | 1456,186 | -55568,042 | 2120476,502 | ||
4 | 134 | 97 | -30,160 | 909,626 | -27434,308 | 827418,732 | ||
5 | 152 | 100 | -27,160 | 737,666 | -20034,998 | 544150,537 | ||
6 | 97 | 102 | -25,160 | 633,026 | -15926,924 | 400721,410 | ||
7 | 128 | 104 | -23,160 | 536,386 | -12422,690 | 287709,512 | ||
8 | 128 | 104 | -23,160 | 536,386 | -12422,690 | 287709,512 | ||
9 | 153 | 105 | -22,160 | 491,066 | -10882,014 | 241145,424 | ||
10 | 128 | 105 | -22,160 | 491,066 | -10882,014 | 241145,424 | ||
11 | 116 | 106 | -21,160 | 447,746 | -9474,297 | 200476,122 | ||
12 | 89 | 109 | -18,160 | 329,786 | -5988,906 | 108758,542 | ||
13 | 105 | 113 | -14,160 | 200,506 | -2839,159 | 40202,496 | ||
14 | 121
| 114 | -13,160 | 173,186 | -2279,122 | 29993,252 | ||
15 | 104 | 116 | -11,160 | 124,546 | -1389,929 | 15511,606 | ||
16 | 120 | 118 | -9,160 | 83,906 | -768,575 | 7040,150 | ||
17 | 155 | 118 | -9,160 | 83,906 | -768,575 | 7040,150 | ||
18 | 183 | 119 | -8,160 | 66,586 | -543,338 | 4433,642 | ||
19 | 150 | 120 | -7,160 | 51,266 | -367,062 | 2628,162 | ||
20 | 154 | 121 | -6,160 | 37,946 | -233,745 | 1439,869 | ||
21 | 140 | 121 | -6,160 | 37,946 | -233,745 | 1439,869 | ||
22 | 140 | 123 | -4,160 | 17,306 | -71,991 | 299,484 | ||
23 | 85 | 123 | -4,160 | 17,306 | -71,991 | 299,484 | ||
24 | 137 | 126 | -1,160 | 1,346 | -1,561 | 1,811 | ||
25 | 104 | 128 | 0,840 | 0,706 | 0,593 | 0,498 | ||
26 | 134 | 128 | 0,840 | 0,706 | 0,593 | 0,498 | ||
27 | 146 | 128 | 0,840 | 0,706 | 0,593 | 0,498 | ||
28 | 118 | 132 | 4,840 | 23,426 | 113,380 | 548,759 | ||
29 | 106 | 134 | 6,840 | 46,786 | 320,014 | 2188,892 | ||
30 | 141 | 134 | 6,840 | 46,786 | 320,014 | 2188,892 | ||
31 | 136 | 134 | 6,840 | 46,786 | 320,014 | 2188,892 | ||
32 | 141 | 134 | 6,840 | 46,786 | 320,014 | 2188,892 | ||
33 | 100 | 136 | 8,840 | 78,146 | 690,807 | 6106,735 | ||
34 | 121 | 137 | 9,840 | 96,826 | 952,764 | 9375,197 | ||
35 | 118 | 139 | 11,840 | 140,186 | 1659,798 | 19652,002 | ||
36 | 89 | 140 | 12,840 | 164,866 | 2116,874 | 27180,666 | ||
37 | 123 | 140 | 12,840 | 164,866 | 2116,874 | 27180,666 | ||
38 | 139 | 141 | 13,840 | 191,546 | 2650,991 | 36689,717 | ||
39 | 132 | 141 | 13,840 | 191,546 | 2650,991 | 36689,717 | ||
40 | 158 | 143 | 15,840 | 250,906 | 3974,345 | 62953,620 | ||
41 | 114 | 146 | 18,840 | 354,946 | 6687,175 | 125986,379 | ||
42 | 151 | 150 | 22,840 | 521,666 | 11914,842 | 272134,998 | ||
43 | 123 | 151 | 23,840 | 568,346 | 13549,359 | 323016,721 | ||
44 | 119
| 152 | 24,840 | 617,026 | 15326,916 | 380720,591 | ||
45 | 143 | 153 | 25,840 | 667,706 | 17253,513 | 445830,768 | ||
46 | 134 | 154 | 26,840 | 720,386 | 19335,150 | 518955,413 | ||
47 | 160 | 155 | 27,840 | 775,066 | 21577,826 | 600726,684 | ||
48 | 109 | 158 | 30,840 | 951,106 | 29332,097 | 904601,862 | ||
19 | 113 | 160 | 32,840 | 1078,466 | 35416,810 | 1163088,050 | ||
50 | 102 | 183 | 55,840 | 3118,106 | 174115,017 | 9722582,533 | ||
Итого | 6358 | 6358 | 0 | 21562,720 | 41605,690 | 25342680,292 |
2) Найдем размах выборки = = 183-85 = 98 у.е.
3) Вычислим длину интервала = = 14.
4) Границы интервалов:
= 85, = 85+14 = 99,
= 99+14 = 113, = 113+14 = 127,
= 127+14= 141, = 141+14 = 155, = 155+14= 169, =169 +14 =183 .
5) Построим интервальный статистический ряд:
Таблица 1.2 – Интервальный статистический ряд
Границы интервалов , у.е. | Частоты | Частости |
[85, 99] | 4 | 4/50 |
(99 , 113] | 9 | 9/50 |
(113,127 ] | 11 | 11/50 |
(127, 141] | 16 | 16/50 |
(141, 155] | 7 | 7/50 |
(155, 169] | 2 | 2/50 |
(169, 183] | 1 | 1/50 |
итого | 50 | 1 |
6) Вычислим числовые характеристики.
В качестве оценки математического ожидания используется среднее арифметическое наблюденных значений. Эта статистика называется выборочным средним.
.
По интервальному статистическому ряду определяется модальный интервал, в который попало наибольшее число элементов выборки, и в качестве точечной оценки моды может использоваться среднее значение этого интервала.
|
|
.
Для определения выборочного значения медианы используется вариационный ряд. В нашем случае объем выборки = 50 – четное число, т.е. в качестве оценки медианы примем
= .
В качестве оценки дисперсии используется статистика = .
Оценка среднего квадратического отклонения
= .
Оценка коэффициента вариации .
Оценка коэффициента асимметрии .
Оценка коэффициента эксцесса
.
7) Построим гистограмму частот.
Рисунок 1.3 – Гистограмма частот
8) Построим интервальные оценки для неизвестных истинных значений и .
Объем выборки составилn = 50. Требуется с доверительной вероятностью определить интервальные оценки:
а) для средней стоимости строительно-монтажных работ на участке;
б) для дисперсии стоимости строительно-монтажных работ на участке;
в) для среднего квадратического отклонения стоимости строительно-монтажных работ на участке.
а) Средняя стоимость строительно-монтажных работ на участкехарактеризуется генеральной средней a. Требуется найти интервальную оценку параметраa с доверительной вероятностью .
Применяем формулу
,
где , , , , значение определяем по таблицам распределения Стьюдента для и . . Подставим найденные значения в формулу:
|
|
у.е.
Таким образом, с вероятностью можно гарантировать, что средняя стоимость строительно-монтажных работ на участкенаходится в пределах: .
б) определим интервальную оценку для дисперсии стоимости строительно-монтажных работ на участке.
Интервальная оценка дисперсии
.
По таблице процентных точек -распределения (см. приложение Г) найдем
;
.
Следовательно, .
Значит с доверительной вероятностью можно утверждать, что истинное значение дисперсии будет находиться в интервале
в) С доверительной вероятностью можно утверждать, что истинное значение среднего квадратического отклонения s будет находиться в интервале
7) Произведем первичную обработку полученной выборки с помощью ЭВМ:
Summary Statistics for Col_1
Count | 50 |
Average | 127,16 |
Median | 128,0 |
Mode | 134,0 |
Variance | 440,056 |
Standarddeviation | 20,9775 |
Coeff. ofvariation | 16,4969% |
Minimum | 85,0 |
Maximum | 183,0 |
Range | 98,0 |
Stnd. skewness | 0,276588 |
Stnd. kurtosis | -0,251092 |
Рисунок1.4 – Компьютерныйрасчет
Confidence Intervals for Col_1
95,0% confidence interval for mean: 127,16 +/- 5,96175 [121,198; 133,122]
95,0% confidence interval for standard deviation: [19,0704; 29,7078]
The StatAdvisor
This pane displays 95,0% confidence intervals for the mean and standard deviation of Col_1. The classical interpretation of these intervals is that, in repeated sampling, these intervals will contain the true mean or standard deviation of the population from which the data come 95,0% of the time. In practical terms, we can state with 95,0% confidence that the true mean Col_1 is somewhere between 121,198 and 133,122, while the true standard deviation is somewhere between 17,5232 and 26,1408.
Вывод. В результате исследования выборки значений непрерывной случайной величины, характеризующей стоимость строительно-монтажных работ на участке, получили следующие результаты, у.е: минимальная стоимость строительно-монтажных работ на участке – 85, максимальная – 183, средняя стоимость строительно-монтажных работ на участке– 127,16, наиболее вероятная стоимость строительно-монтажных работ на участке – 134, средневероятнаястоимость строительно-монтажных работ на участке – 128, среднеквадратическое отклонение стоимости строительно-монтажных работ на участкеот среднего значения составило 20,978. Оценка коэффициента вариации составила 16,5%, что указывает на небольшуюколеблемость признака относительно среднего значения, оценка коэффициента асимметрии составила 0,090, оценка коэффициента эксцесса составила -0,329. С доверительной вероятностью можно гарантировать, что средняя стоимость строительно-монтажных работ на участкенаходится в пределах: , истинное значение дисперсии будет находиться в интервале , истинное значение среднего квадратического отклонения s будет находиться в интервале
Порядок выполнения работы
1 Изучить теоретические сведения.
2 Получить у преподавателя выборку значений случайной величины.
3 Произвести вручную первичную обработку статистических данных:
– построить вариационный ряд;
– построить сгруппированный или интервальный статистический ряд и его графическое изображение;
– вычислить точечные оценки числовых характеристик изучаемой случайной величины.
4 Произвести первичную обработку полученной выборки с помощью ЭВМ:
– записать выборку на диск ;
– вычислить оценки числовых характеристик;
– построить гистограмму частот исследуемой выборки;
– построить интервальные оценки для неизвестных истинных значений и .
5 Сравнить результаты, полученные при ручном расчёте и расчёте на ЭВМ.
6 Сделать вывод о свойствах изучаемой случайной величины.
Контрольные вопросы
1 Что называется случайной величиной? Какие типы случайных величин вы знаете?
2 Что называется генеральной совокупностью?
3 Что называется выборкой? Какими свойствами должна обладать выборка?
4 Какая выборка называется репрезентативной?
5 Что называется вариационным рядом?
6Укажите последовательность проведения первичной обработки статистических данных.
7 Что называется выборочной статистикой; статистической оценкой параметра? Что представляют собой точечные и интервальные оценки?
8 Какие требования предъявляются к статистическим оценкам?
9 Какие статистики используются в качестве точечных оценок основных числовых характеристик? Какими свойствами они обладают?
Варианты заданий для ЛАБОРАТОРНых РАБОТ
по МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ
Номера предприятий, которые необходимо выбрать, для выполнения лабораторных работ №1 – № 3 определяются с помощью двух последних цифр шифра студента +40 значений, признак выбирается по начальной букве студента. Например, если фамилия начинается на В, две последние цифры шифра студента 22, то выбираем с 22 по 71 строку со 2-го столбца по признаку «Вес железобетонных перекрытий».
Дата добавления: 2018-05-12; просмотров: 227; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!