Выборочная дисперсия. Формула для вычисления дисперсии.
Для того, чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения хnср, вводят сводную характеристику – выборочную дисперсию.
Выборочная дисперсия Dв – среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения х выб ср.
Если все значения x1, x2, xn признака выборки объема n различны, то Dв=(СУММА(i=1, n) (xi-xnср выб)^2)/n.
Если же все значения признака х1, х2, xn имеют соответственно частоты n1, n2 nk причем n1+n2+nk=n, то Dв=(СУММА(i=1, k) ni*(xi-xnсрвыб)^2)/n, т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответствующим частотам.
КРОМЕ дисперсии для хар-тики рассеяния значений признака выб совокуп-ти вокруг своего сред знач-я пользуются сводной хар-тикой – СКО.
ФОРМУЛА для вычисления дисперсии
ТЕОРЕМА. Дисперсия равна среднему квадратов значений признака минус квадрат общей средней: D=(x^2)ср – [xср]^2
ДОК-ВО. Dв=(СУММА(ni*(xi-xср)^2)/n = (СУММА(ni*(xi^2-2xi*xср+(x ср)^2))/n=(СУММАni*(xi^2))/n – 2*x|*(СУММАni*xi)/n+[x|]^2*(СУММА ni)/n=(x^2)| - 2*x|*x| + [x|]^2 = (x^2)ср – [xср]^2
Где x| = (СУММАni*xi)/n; (x^2)| = (СУММАni*xi^2)/n
Точность оценки, доверительная вероятность, доверительный интервал.
Точечной называют оценку, которая определяется одним числом. При выборке малого объема точечная оценка может значит-но отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
|
|
Интервальная – оценка, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.
Интервальная оценка – интервал, который покрывает оцениваемый параметр.
Q* тем точнее определяет параметр Q, чем меньше абсолютная величина разности |Q-Q*|. Если б>0 и |Q-Q*|<б, то б называется точностью оценки, и оценка тем точнее, чем меньше б.
Надежность оценки Q по Q* (доверительная в-ть) – в-ть гамма, с которой осуществляется нер-во |Q-Q*|<б. Обычно надежность оценки задается наперед, причем в кач-ве гамма берут число, близкое к 1. Наболее часто задают надежность, равную 0,95; 0,99 и 0.999.
Пусть в-ть того, что |Q-Q*|<б, равна гамма. P[|Q-Q*|<б] = гамма.
Заменим нер-во |Q-Q*|<б равносильным ему нер-вом –б<Q-Q*<+б, или Q*–б<Q<Q*+б.
Имеем P[Q*–б<Q<Q*+б]=гамма. Это соотношение следует понимать так: в-ть того, что интервал (Q*–б; Q*+б) заключает в себе (покрывает) неизвестный параметр Q, равна гамма.
Доверительным называют интервал (Q*–б; Q*+б), который покрывает неизвестный параметр с заданной в-тью гамма.
Доверительный интервал для оценки математического ожидания нормального распределения при известном и неизвестном среднем квадратическом отклонении.
|
|
1. При известном СКО
xвыб| - t*СКО/SQRn<a<xвыб| + t*СКО/SQRn
t – аргумент ф-ии Лапласа, такой, что Ф(t)=гамма/2
2. При неизвестном СКО
xвыб| - tгамма*s/SQRn<a<xвыб| + tгамма* s/SQRn
tгамма – табулированный параметр, который находится в приложении tгамма (n; гамма).
Функциональная, статистическая и корреляционная зависимости. Основные задачи теории корреляции.
Зависимость м/д переменными Х и У называется функциональной, если существует ф-ия y=f(x) по которой каждому значению х принадлежащему Х ставится в соответствие единственное значение у.
Статистической называют зависимость м/д Х и У, при которой изменение одной из величин влечет изменение распределения другой.
Частным случаем стат зависимости явл-ся зависимость корреляционная, при которой изменение среднего значения другой.
Корреляционной зависимостью признака У от Х называют функциональную зависимость условного среднего ух| от х, т.е. ух|=f(x) – выборочное уравнение регрессии.
ух| - среднее арифметическое наблюдавшихся значений У, соответствующих Х=х.
Постановка задачи:
1. Существует ли связь м/д 2мя и более переменными
|
|
2. Какой тип она имеет
3. Насколько она сильна
4. Какой прогноз можно сделать, основываясь на этой связи
ЗАДАЧИ
1. Оценить тесноту (силу) корреляционной связи. Корреляция – стат метод, позволяющий определить, существует ли взаимосвязь м/д переменными и насколько она сильна.
2. Установить форму корреляционной связи, т.е. вид ф-ии регрессии (линейная, квадратическая, показательная…)
Регрессия – стат метод, который используется для описания характера связи м/д переменными.
Дата добавления: 2018-05-13; просмотров: 397; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!