Ожидаемое значение случайной переменной,
Ее дисперсия и среднее квадратическое отклонение
Важную роль играют две количественные характеристики случайной переменной х: математическое ожидание (ожидаемое значение) и дисперсия. Ожидаемое значение, которое обычно обозначают m, m или Е(х) находится по формуле
( 2.1 )
Подчеркнем, что m – это константа, вокруг которой рассеяны возможные значения q случайной переменной х.
Дисперсия s2, Var(x) – это математическое ожидание квадрата отклонения случайной переменной х от её ожидаемого значения:
( 2.2 )
Положительный квадратный корень из дисперсии именуется средним квадратическим отклонением (СКО), или стандартным отклонением. Размерности s и х совпадают. Величина s (как и s2) служит характеристикой неопределенности (изменчивости) х. Формула ( 2.2) может быть преобразована к виду
s2 = Е(х2) - m2 ( 2.3 )
который часто используется для расчётов вручную. Из формул (2.1) - (2.2) видно, что для отыскания величин m, s нужно знать закон распределения Px(q) случайной переменной х. Часто это закон неизвестен, и тогда можно оценить (приближенно определить) характеристики m, s2 по результатам n независимых наблюдений (опытов) { х1, х2, …, хn}. В этом наборе каждая компонента хi – это случайная переменная с одним и тем же законом распределения Px(q), при этом величины хi являются независимыми.
Можно выделить три уровня параметров случайной величины:
|
|
1. Результаты замеров реально существующей константы. Примеры: масса протона, период полураспада (или вероятность распада) радиоактивного изотопа, вероятность падения монеты орлом кверху. Эти константы объективно существуют, и, проводя эксперименты, мы можем приближаться к ним, достигая заданной точности. Увеличивая число бросков монеты, мы можем сделать оценку вероятности выпадения орла сколь угодно близкой к 1/2. В экономике и социологии абсолютных констант не существует, нет абсолютно точных взаимозависимостей величин, как в физике. Существуют константы, устанавливаемые правительством, например, ставка налога, но они не являются фундаментальными, могут меняться, и их не оценивают с использованием статистики и эконометрики.
2. Роль абсолютных констант, характеризующих экономику и социальную сферу страны и региона играют параметры генеральных совокупностей – всех доступных значений по стране или региону. Примеры: средний доход домохозяйств, процент заболевших гриппом. В принципе, эти параметры можно измерить во время переписей населения или тотальных проверок (при условии достоверной информации), но такие технологии дороги, а исследуемые параметры непрерывно меняются. Поэтому для оценки параметров природных и социально-экономических объектов служат случайные выборки.
|
|
3. Случайные выборки. Было доказано, что если замеры х независимы, то наилучшая оценка математического ожидания Е(х) – среднее значение по выборке
( 2.4 )
а наилучшая оценка дисперсии s2
( 2.5 )
Почему n-1, а не n? Дело в том, что в формулах (2.2) и (2.3) используется не математическое ожидание Е(х), которое мы не знаем, а его оценка – среднее значение , вычисляемое по выборке Х{ х1, х2, …, хn}, поэтому смещённое относительно Е(х) и расположенное ближе к центру значений множества { х1, х2, …, хn}. Если делить на n, получим заниженную оценку дисперсии. n в формулах (2.2), (2.3) и n-1 в формуле ( 2.5 ) – это число степеней свободы, независимых суммируемых переменных. Поскольку вычислено по { х1, х2, …, хn}, одно из выражений в скобках в формуле ( 2.5 ) мы можем вычислить, зная n-1 значений х.
|
|
Что такое наилучшая оценка, или наилучшая технология оценки (estimator) математического ожидания случайной величины? Каковы её критерии?
1. Несмещенность. Применяя правильную технологию расчёта, мы не получим в результате обработки серии замеров статистически значимого отклонения от реального значения оцениваемого параметра.
2. Эффективность. Если в формуле (2.5) мы используем вместо другую величину, полученную по другой формуле, то оценка дисперсии S будет больше. Значит, среднее значение обеспечивает наиболее эффективную оценку математического ожидания Е(х). Эффективность может вступить в противоречие с несмещённостью. Например, исключение переменных из эконометрических моделей может привести к уменьшению дисперсий оцениваемых параметров и к их смещению относительно истинных значений.
3. Consistency. В российских учебниках это слово переводят как “состоятельность”, но правильнее говорить о сходимости. Это значит, что увеличивая количество замеров в серии n, мы можем получить разность оценок исследуемого параметра меньше любого e (вспомнили матанализ?), то есть наши оценки сходятся к какому-то пределу.
|
|
Дата добавления: 2018-05-12; просмотров: 224; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!