Формулы ошибок простой случайной выборки



Понятие о выборочном наблюдении

Наиболее совершенным и научно обоснованным способом несплошного наблюдения является выборочное наблюдение, получившее в настоящее время широкое применение в работе органов государственной статистики, научно-исследовательских лабораторий, институтов, предприятий. Его использование позволяет лучше организовать наблюдение, обеспечивает быстроту проведения, экономию труда и средств на получение и обработку информации.

Выборочное наблюдение при строгом соблюдении условий случайности и достаточно большой численности отобранных единиц репрезентативно (представительно); по результатам изучения определенной части единиц с достаточной для практики степенью точности можно судить о всей совокупности. Однако вычисленные по материалам выборочного наблюдения статистические показатели не будут точно совпадать с соответствующими характеристиками для всей совокупности (генеральной совокупности). Величина этих отклонений называется ошибкой наблюдения, которая складывается из ошибок двоякого рода: ошибки регистрации (точности) и ошибки репрезентативности.

Ошибки регистрации свойственны любому наблюдению (сплошному и несплошному). Они вызываются несовершенством измерительных приборов, недостаточной квалификацией наблюдателя, неточностью подсчетов и т. п. Однако при выборочном наблюдении они значительно меньше, так как в этом случае используются более квалифицированные и подготовленные кадры.

Ошибки репрезентативности свойственны только несплошным наблюдениям. Они характеризуют размер расхождений между величинами показателя, полученного в выборочной и генеральной совокупности в условиях одинаковой точности единичных наблюдений. Ошибки репрезентативности могут быть систематическими и случайными. Систематические ошибки возникают при нарушении установленных правил отбора единиц. Случайные ошибки репрезентативности обязаны своим возникновением недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности.

Величина случайной ошибки определяет надежность данных выборочного наблюдения, их пригодность для суждения о генеральной совокупности. При помощи формул теории вероятностей можно рассчитать возможную максимальную случайную ошибку — вероятный (стохастический) предел ошибки.

Максимально возможная ошибка это такая величина отклонения выборочной средней (доли) от генеральной, вероятность превышения которой вследствие случайных причин в условиях данной выборки очень мала.

Величина случайной ошибки репрезентативности зависит от:

1. степени колеблемости изучаемого признака в генеральной совокупности;

2. способа формирования выборочной совокупности;

3. объема выборки.

По степени охвата единиц исследуемой совокупности различают большие и малые выборки. От объема выборки зависит не только величина тех предельных значений, за которые с данной вероятностью не выйдет ошибка выборочной средней, но и способы определения этих пределов. К безусловно малым относятся выборки объемом менее 30 единиц.

По способу формирования выборочной совокупности различают следующие виды выборочного наблюдения: простая случайная (собственно случайная) выборка, типическая (районированная, или стратифицированная), серийная, механическая, комбинированная, ступенчатая, многофазная выборка.

Совокупность единиц, из которых производится отбор, принято называть генеральной совокупностью. Совокупность отобранных единиц из генеральной совокупности называется выборочной совокупностью.

N — объем генеральной совокупности (число входящих в нее единиц);

п — объем выборочной совокупности (число единиц, попавших в выборку);

 — генеральная средняя (среднее значение признака в генеральной совокупности);

хср. — выборочная средняя (среднее значение признака в выборочной совокупности);

р — генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности);

w — выборочная доля (доля единиц, обладающих данным признаком в выборочной совокупности);

σ2 — генеральная дисперсия (дисперсия признака в генеральной совокупности);

S2 - выборочная дисперсия (дисперсия признака в выборочной совокупности);

σ — среднее квадратическое отклонение признака в генеральной совокупности;

S — среднее квадратическое отклонение признака в выборочной совокупности.

 

Простая случайная выборка

При простой случайной выборке отбор единиц в выборочную совокупность производится непосредственно из всей массы единиц генеральной совокупности в форме случайного отбора, при котором каждой единице генеральной совокупности обеспечивается одинаковая вероятность (возможность) быть выбранной. Единица отбора совпадает с единицей наблюдения. Случайный отбор осуществляется путем применения жеребьевки (лотереи) или путем использования таблиц случайных чисел.

Случайный отбор может быть проведен в двух формах: в форме возвратной (повторной) выборки и в форме безвозвратной (бесповторной) выборки. При повторном отборе вероятность попадания каждой единицы генеральной совокупности остается постоянной, так как после отбора какой-то единицы она снова возвращается в генеральную совокупность и может быть выбранной. При бесповторном отборе выбранная единица не возвращается в генеральную совокупность и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастает).

Применение простой случайной повторной выборки на практике весьма ограниченно; обычно используется бесповторная выборка.

Теорема Чебышева утверждает принципиальную возможность определения генеральной средней по данным случайной повторной выборки. Теорема Чебышева дополняется теоремой Ляпунова, которая позволяет рассчитать максимальную ошибку выборочной средней при данном достаточно большом числе независимых наблюдений. Согласно этой теореме при достаточно большом числе независимых наблюдений в генеральной совокупности с конечной средней и ограниченной дисперсией вероятность того, что расхождение между выборочной и генеральной средней ср. - )не превзойдет по абсолютной величине некоторую величину tµ, равна интегралу Лапласа. Это можно записать так:

 

Ф( t ) =  ,

где Ф (t) — интеграл Лапласа (удвоенная нормированная функция Лапласа).

Величина tµ , обозначаемая  называется предельной ошибкой выборки. Следовательно,

 ;  ,

где  — предельная (максимально возможная) ошибка средней;

 — предельная (максимально возможная) ошибка доли;

µ — величина средней квадратической стандартной ошибки (стандартная или средняя ошибка) средней или доли;

t — коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки.

В зависимости от принятой вероятности Р определяется значение коэффициента кратности (t) по удвоенной нормированной функции Лапласа (см. статистические таблицы – Удвоенная нормированная функция Лапласа).

Величина средней (стандартной) ошибки в условиях большой выборки (п > 30) рассчитывается по известным из теории вероятностей формулам:

а) при случайной повторной выборке:

 ,

б) при случайной бесповторной выборке:

,

 

При расчете ошибок возникает существенное затруднение: величины σ и р для генеральной совокупности неизвестны. Эти величины в условиях большой выборки заменяют величинами S (выборочная дисперсия) и w (выборочная доля), рассчитанными по выборочным данным. В табл. 4.1 приведены формулы расчета ошибок простой случайной выборки.

Табл. 4.1

Формулы ошибок простой случайной выборки

 

Способ отбора единиц

Повторный бесповторный
Средняя ошибка µ для средней   для доли
Предельная ошибка Для средней     Для доли = t    = = t  = t

 

Формулы предельной ошибки позволяют решать задачи трех видов.

1. Определение пределов генеральных характеристик с заданной степенью надежности (доверительной вероятностью) на основе показателей, полученных по данным выборки.

Доверительные интервалы для генеральной средней:

хср. ±

хср. -  ≤  ≤ хср. + .

Доверительные интервалы для генеральной доли:

р = w

w -  ≤ р ≤ w +

Пример.1.

Из партии электроламп взята 20%-я случайная бесповторная выборка для определения среднего веса спирали. Результаты выборки следующие (табл. 4.5).

Таблица 4.5

Вес (мг), х 38-40 40-42 42-44 44-46
Число спиралей, f 15 30 45 10

 

Определить с вероятностью 0,95 доверительные пределы, в которых лежит средний вес спирали для всей партии электроламп.

Решение

Доверительные интервалы для генеральной средней с вероятностью Р:

хср. -  ≤  ≤ хср. + .

где хср. — средний уровень признака по выборке:

 

хср. =  = (39*15+41*30+43*45+45*10)/(15+30+45+10) = 4200/100 = 42,0 мг;

t , N = 100/0.2 = 500.

При вероятности Р = 0,95 t = 1,96 (по статистическим таблицам).

 = ((39 - 42)2 • 15+(41 - 42)2 • 30+(43 -42)2 • 45+(45 - 42)2 • 10)/100 = 300/100 = 3,0.

t  = 1,96 *  = 0,3 мг

Доверительные интервалы для генеральной средней с вероятностью Р = 0,95:

42,0-0,3 42,0+0,3,   41,7 мг  42,3 мг

Пример. 2.

На заводе электроламп из партии продукции в количестве 16 000 шт. ламп взято на выборку 1600 шт. (случайный, бесповторный отбор), из которых 40 шт. оказались бракованными.

Определить с вероятностью 0,997 пределы, в которых будет находиться процент брака для всей партии продукции.

Решение

Определяется доля бракованной продукции по выборке:

w = 40/1600 = 0.025, или 2,5%.

При вероятности Р = 0,997 имеем t = 3,0 (по таблицам). Размер предельной ошибки:

 

=3,0 = 3,0*0,0037=0,011 или 1,1%.

Доверительные интервалы для генеральной доли с вероятностью Р= 0,997:

2,5 – 1,1≤ р ≤ 2,5+1,1, 1,4% ≤ р ≤ 3,6%

 

 

2. Определение доверительной вероятности того, что генеральная характеристика может отличаться от выборочной не более, чем на определенную заданную величину.

Доверительная вероятность Р является функцией от t, определяемой по формуле

t =

По величине t определяется доверительная вероятность Р c использованием стат. таблиц.

 

Пример. 3.

По городской телефонной сети в порядке случайной выборки (механический отбор) произвели 100 наблюдений и установили среднюю продолжительность одного телефонного разговора 5 мин при среднем квадратическом отклонении 2 мин.

Какова вероятность того, что ошибка репрезентативности при определении средней продолжительности телефонного разговора не превысит 18с?

Решение

По условию задачи известны:

объем выборки – n=100;

выборочная средняя – хср. = 5 мин

выборочное среднее квадратическое отклонение – S = 2 мин

предельная ошибка выборки -  = 18с = 0,3 мин.

 ;  =  = 0,2мин;       = 0,3/0,2 = 1,5.

Затем по статистическим таблицам на основе значения t = 1,5 определяется вероятность того, что ошибка не превысит заданной величины. При t =1,5 вероятность Р = 0,866.

 

3. Определение необходимого объема выборки, который с практической вероятностью обеспечивает заданную точность выборки.

Для расчета объема выборки необходимо иметь следующие данные:

a) размер доверительной вероятности (Р);

b) коэффициент t , зависящий от принятой вероятности (определяется по стат. таблицам);

c) величину σ2 (или p q , причем q=1-р) в генеральной совокупности; они заменяются величинами, полученными в предшествующих обследованиях или при пробных выборках [S2 или w(l—w)];

d) величину максимально допустимой ошибки (  или );

e) объем генеральной совокупности (N).

Необходимый объем выборки определяется на основе допустимой величины ошибки:

 = t  ,или  = tµр .

В табл. 4.2 приведены формулы для расчета численности простой случайной выборки.

Табл.4.2


Дата добавления: 2020-11-23; просмотров: 250; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!