Выборочная дисперсия. Формула для вычисления дисперсии.



 

Для того, чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения хnср, вводят сводную характеристику – выборочную дисперсию.

Выборочная дисперсия Dв – среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения х выб ср.

Если все значения x1, x2, xn признака выборки объема n различны, то Dв=(СУММА(i=1, n) (xi-xnср выб)^2)/n.

Если же все значения признака х1, х2, xn имеют соответственно частоты n1, n2 nk причем n1+n2+nk=n, то Dв=(СУММА(i=1, k) ni*(xi-xnсрвыб)^2)/n, т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответствующим частотам.

КРОМЕ дисперсии для хар-тики рассеяния значений признака выб совокуп-ти вокруг своего сред знач-я пользуются сводной хар-тикой – СКО.

ФОРМУЛА для вычисления дисперсии

ТЕОРЕМА. Дисперсия равна среднему квадратов значений признака минус квадрат общей средней: D=(x^2)ср – [xср]^2

ДОК-ВО. Dв=(СУММА(ni*(xi-xср)^2)/n = (СУММА(ni*(xi^2-2xi*xср+(x ср)^2))/n=(СУММАni*(xi^2))/n – 2*x|*(СУММАni*xi)/n+[x|]^2*(СУММА ni)/n=(x^2)| - 2*x|*x| + [x|]^2 = (x^2)ср – [xср]^2

Где x| = (СУММАni*xi)/n; (x^2)| = (СУММАni*xi^2)/n

 

Точность оценки, доверительная вероятность, доверительный интервал.

Точечной называют оценку, которая определяется одним числом. При выборке малого объема точечная оценка может значит-но отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальная – оценка, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.

Интервальная оценка – интервал, который покрывает оцениваемый параметр.

Q* тем точнее определяет параметр Q, чем меньше абсолютная величина разности |Q-Q*|. Если б>0 и |Q-Q*|<б, то б называется точностью оценки, и оценка тем точнее, чем меньше б.

Надежность оценки Q по Q* (доверительная в-ть) – в-ть гамма, с которой осуществляется нер-во |Q-Q*|<б. Обычно надежность оценки задается наперед, причем в кач-ве гамма берут число, близкое к 1. Наболее часто задают надежность, равную 0,95; 0,99 и 0.999.

Пусть в-ть того, что |Q-Q*|<б, равна гамма. P[|Q-Q*|<б] = гамма.

Заменим нер-во |Q-Q*|<б равносильным ему нер-вом –б<Q-Q*<+б, или Q*–б<Q<Q*+б.

Имеем P[Q*–б<Q<Q*+б]=гамма. Это соотношение следует понимать так: в-ть того, что интервал (Q*–б; Q*+б) заключает в себе (покрывает) неизвестный параметр Q, равна гамма.

Доверительным называют интервал (Q*–б; Q*+б), который покрывает неизвестный параметр с заданной в-тью гамма.

 

Доверительный интервал для оценки математического ожидания нормального распределения при известном и неизвестном среднем квадратическом отклонении.

 

1. При известном СКО

xвыб| - t*СКО/SQRn<a<xвыб| + t*СКО/SQRn

t – аргумент ф-ии Лапласа, такой, что Ф(t)=гамма/2

2. При неизвестном СКО

xвыб| - tгамма*s/SQRn<a<xвыб| + tгамма* s/SQRn

tгамма – табулированный параметр, который находится в приложении tгамма (n; гамма).

 

Функциональная, статистическая и корреляционная зависимости. Основные задачи теории корреляции.

 

Зависимость м/д переменными Х и У называется функциональной, если существует ф-ия y=f(x) по которой каждому значению х принадлежащему Х ставится в соответствие единственное значение у.

Статистической называют зависимость м/д Х и У, при которой изменение одной из величин влечет изменение распределения другой.

Частным случаем стат зависимости явл-ся зависимость корреляционная, при которой изменение среднего значения другой.

Корреляционной зависимостью признака У от Х называют функциональную зависимость условного среднего ух| от х, т.е. ух|=f(x) – выборочное уравнение регрессии.

ух| - среднее арифметическое наблюдавшихся значений У, соответствующих Х=х.

Постановка задачи:

1. Существует ли связь м/д 2мя и более переменными

2. Какой тип она имеет

3. Насколько она сильна

4. Какой прогноз можно сделать, основываясь на этой связи

ЗАДАЧИ

1. Оценить тесноту (силу) корреляционной связи. Корреляция – стат метод, позволяющий определить, существует ли взаимосвязь м/д переменными и насколько она сильна.

2. Установить форму корреляционной связи, т.е. вид ф-ии регрессии (линейная, квадратическая, показательная…)

Регрессия – стат метод, который используется для описания характера связи м/д переменными.

 

 


Дата добавления: 2018-05-13; просмотров: 397; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!