Ожидаемое значение случайной переменной,



Ее дисперсия и среднее квадратическое отклонение

 

Важную роль играют две количественные харак­теристики случайной переменной х: математическое ожидание (ожидаемое значение) и дисперсия. Ожидаемое зна­чение, которое обычно обозначают   m, m или Е(х) находится по формуле

        ( 2.1 )

Подчеркнем, что m –  это константа, вокруг которой рассеяны возможные значения q случайной переменной х.

Дисперсия s2, Var(x) –  это математическое ожидание квадрата отклонения случайной переменной х от её ожидаемого значения:

 

       ( 2.2 )

 

 

Положительный квадратный корень из дисперсии  именуется средним квадратическим отклонением (СКО), или стандартным отклонением. Размерно­сти s и х совпадают. Величина s  (как и s2) служит характеристикой неопределенности (изменчивости) х. Формула ( 2.2) может быть преобразована к виду

s2 = Е(х2) - m2                       ( 2.3 )

который часто используется для расчётов вручную. Из формул (2.1) - (2.2) видно, что для отыскания величин m, s    нужно знать закон распределения Px(q) случайной пере­менной х. Часто это закон неизвестен, и тогда можно оценить (приближенно определить) характеристики m, s2 по результатам n независимых наблюдений (опытов) { х1, х2, …, хn}. В этом наборе каждая компонента хi –  это случайная пере­менная с одним и тем же законом распределения Px(q), при этом величины хi  являются независимыми.

Можно выделить три уровня параметров случайной величины:

1. Результаты замеров реально существующей константы. Примеры: масса протона, период полураспада (или вероятность распада) радиоактивного изотопа, вероятность падения монеты орлом кверху. Эти константы объективно существуют, и, проводя эксперименты, мы можем приближаться к ним, достигая заданной точности. Увеличивая число бросков монеты, мы можем сделать оценку вероятности выпадения орла сколь угодно близкой к 1/2. В экономике и социологии абсолютных констант не существует, нет абсолютно точных взаимозависимостей величин, как в физике. Существуют константы, устанавливаемые правительством, например, ставка налога, но они не являются фундаментальными, могут меняться, и их не оценивают с использованием статистики и эконометрики.

2. Роль абсолютных констант, характеризующих экономику и социальную сферу страны и региона играют параметры генеральных совокупностей – всех доступных значений по стране или региону. Примеры: средний доход домохозяйств, процент заболевших гриппом. В принципе, эти параметры можно измерить во время переписей населения или тотальных проверок (при условии достоверной информации), но такие технологии дороги, а исследуемые параметры непрерывно меняются. Поэтому для оценки параметров природных и социально-экономических объектов служат случайные выборки.

3. Случайные выборки. Было доказано, что если замеры х независимы, то наилучшая оценка математического ожидания Е(х) – среднее значение по выборке

         

    ( 2.4 )

 

а наилучшая оценка дисперсии s2

                                                                                           

                                                  ( 2.5 )                                                                                                                                                               

 

Почему n-1, а не n?     Дело в том, что в формулах (2.2) и (2.3) используется не математическое ожидание Е(х), которое мы не знаем, а его оценка – среднее значение , вычисляемое по выборке Х{ х1, х2, …, хn}, поэтому смещённое относительно Е(х) и расположенное ближе к центру значений множества { х1, х2, …, хn}. Если делить на n, получим заниженную оценку дисперсии. n в формулах (2.2), (2.3) и n-1 в формуле ( 2.5 ) – это число степеней свободы, независимых суммируемых переменных. Поскольку   вычислено по { х1, х2, …, хn}, одно из выражений в скобках в формуле ( 2.5 ) мы можем вычислить, зная n-1 значений х.

Что такое наилучшая оценка, или наилучшая технология оценки (estimator) математического ожидания случайной величины? Каковы её критерии?   

1. Несмещенность. Применяя правильную технологию расчёта, мы не получим в результате обработки серии замеров статистически значимого отклонения от реального значения оцениваемого параметра.

2. Эффективность. Если в формуле (2.5) мы используем вместо  другую величину, полученную по другой формуле, то оценка дисперсии S будет больше. Значит, среднее значение обеспечивает наиболее эффективную оценку математического ожидания Е(х). Эффективность может вступить в противоречие с несмещённостью. Например, исключение переменных из эконометрических моделей может привести к уменьшению дисперсий оцениваемых параметров и к их смещению относительно истинных значений.

3. Consistency.  В российских учебниках это слово переводят как “состоятельность”, но правильнее говорить о сходимости. Это значит, что увеличивая количество замеров в серии n, мы можем получить разность оценок исследуемого параметра меньше любого e (вспомнили матанализ?), то есть наши оценки сходятся к какому-то пределу.

 


Дата добавления: 2018-05-12; просмотров: 224; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!