Формулы ошибок типической выборки



Средняя ошибка (µ)

Способ отбора единиц

повторный бесповторный
Для средней: а) при пропорциональном разме­щении единиц б)       при оптимальном раз­мещении единиц
Для доли: а) при пропорциональном разме­щении единиц б)       при оптимальном раз­мещении единиц

 

Как видно из приведенных выше формул, величина стандартной ошибки типической выборки зависит только от точности определения групповых средних, т. е. от величины внутригрупповых дисперсий. Согласно правилу сложения дисперсий общая дисперсия слагается из межгрупповой дисперсии и средней из внутригрупповых дисперсий. Отсюда следует, что ошибка типической случайной выборки меньше, чем ошибка простой случайной выборки.

Предельная (максимально возможная) ошибка типической выборки:

 = t  ,  = tµр .

Необходимый объем выборки определяется на основе формулы и величины допустимой ошибки.

 

Серийная выборка

Сущность серийной выборки заключается в том, что вместо случайного отбора единиц совокупности осуществляется отбор групп (серий, гнезд). Внутри отобранных серий производится сплошное наблюдение. Серии (гнезда) состоят из единиц, связанных между собой или территориально, или организационно, или, наконец, во времени. Отбор серий может производиться в порядке повторного и бесповторного отбора. Серии могут быть равновеликими и неравновеликими. На практике чаще применяется серийный отбор с равными сериями.

Стандартная ошибка при равновеликих сериях определяется по формулам, представленным в табл. 4.4.

Табл. 4.4

Средняя ошибка (µ)

Способ отбора серий

повторный бесповторный
Для средней
Для доли

 

В табл. 4.4 приняты следующие условные обозначения:

 - межгрупповая выборочная дисперсия средней:

,

где  - средний уровень признака в серии;

 - средний уровень признака для всей выборочной совокупности;

m – число равных серий в выборочной совокупности;

M – число равных серий в генеральной совокупности.

 - межгрупповая выборочная дисперсия доли:

,

где wiдоля единиц, обладающих данным признаком в серии;

w 0доля единиц, обладающих данным признаком во всей выборочной совокупности.

Ошибка серийной выборки больше, чем при любом другом способе отбора. Тем не менее серийный отбор широко применяется на практике, что объясняется его организационными преимуществами.

 

Механическая выборка

Механическая выборка заключается в отборе единиц из генеральной совокупности через равные промежутки из определенного расположения их в генеральной совокупности (по алфавиту, в пространстве, последовательности появления во времени).

При организации механического отбора возникают две задачи:

· определение «шага отчета» (расстояния между отбираемыми единицами);

· выбор единицы, с которой надо начинать отчет.

«Шаг отчета» определяется путем деления численности генеральной совокупности на численность выборочной совокупности : N/n.

Выбор начала отчета рекомендуется производить путем случайного отбора из единиц первого интервала — первого «шага отчета». Механический отбор может осуществляться в самом процессе наблюдения, и его удобно применять тогда, когда выборочно наблюдается масса постепенно возникающих перед наблюдателем единиц (например, производят проверку каждой 10-й, 20-й и т. д. детали, обработанной на станке).

Если в генеральной совокупности единицы располагаются случайным образом по отношению к изучаемому признаку, то механический отбор можно рассматривать как разновидность случайного бесповторного отбора. Поэтому для оценки ошибки механической выборки применяются формулы случайной бесповторной выборки, приведенные ранее.

Комбинированная выборка

Комбинированная выборка предполагает использование нескольких способов выборки. Можно комбинировать, например, серийную выборку и случайную. В этом случае, разбив генеральную совокупность на серии (группы) и отобрав нужное число серий, производят случайную выборку единиц в серии. Такая комбинированная выборка может быть повторной (для групп и единиц) и бесповторной.

Средняя ошибка комбинированной выборки определяется по формулам (условные обозначения даны раньше):

При повторном отборе - ,

 

При бесповторном отборе -

 

Многоступенчатая выборка

Многоступенчатая выборка предполагает извлечение из генеральной совокупности сначала укрупненных групп единиц, затем групп, меньших по объему, и так до тех пор, пока не будут отобраны те группы (серии) или отдельные единицы, которые будут подвергнуты наблюдению. Выборка может быть двухступенчатой, когда генеральная совокупность разбивается на группы и производится отбор групп, а затем внутри групп — отбор единиц наблюдения. На обеих ступенях отбор может вестись в случайном порядке.

В отличие от типического отбора, где отбор производится из всех без исключения групп, при многоступенчатом отборе производится отбор самих групп, и, следовательно, не все они попадают в выборку.

Число ступеней отбора может быть и более двух. Если число ступеней отбора больше двух, то средняя ошибка выборки определяется по формуле

µ =  ,

где µ1, µ2, µ3, …….- средние ошибки выборки на отдельных ступенях отбора,

n1, n2, ……. - численность выборок на соответствующих ступенях.

Многофазная выборка

При многофазной выборке выборочные совокупности образуются так, что одни сведения собираются от всех единиц отбора, затем отбираются еще некоторые единицы, которые и обследуются по более широкой программе. Расчет ошибки многофазной выборки производится для каждой фазы в отдельности.

 

Малые выборки

Выборки, при которых наблюдением охватывается небольшое число единиц (n < 30), принято называть малыми выборками. Они обычно применяются в том случае, когда невозможно или нецелесообразно использовать большую выборку (исследование качества продукции, если это связано с ее разрушением, в частности на прочность, на продолжительность срока службы и т. д.).

Предельная ошибка малой выборки определяется по формуле

Средняя (стандартная) ошибка малой выборки:

,

где S2 – дисперсия малой выборки:

,

где хср. – среднее значение признака по выборке,

n-1 – число степеней свободы (n -1 = k ),

t – коэффициент доверия малой выборки, зависящий не только от заданной доверительной вероятности, но и от  численности единиц выборки.

Вероятность того, что генеральная средняя находится в определенных границах, определяется по формуле

,

где S(t)значение функции Стьюдента.

Для расчета коэффициента доверия t определяют значение функции S(t) по формуле

S(t) = (Р+1)/2,

где Р – величина доверительной вероятности.

Затем по таблице распределения Стьюдента (смотри статистические таблицы) в зависимости от значения функции S(t) и числа степеней свободы k (k = n-1) определяют значение t.

Функция S(t) используется также для определения вероятностей того, что фактическое нормированное отклонение  не превзойдет или превзойдет табличное значение.

Вероятность того, что фактическое отношение (tф) не превзойдет по абсолютной величине табличное значение (t), определяется по формуле

.

Вероятность того, что фактическое отношение (tф) превзойдет по абсолютной величине табличное значение (t), определяется по формуле

.

 

Пример. 5.

Из партии электроламп произведена малая выборка (отбор случайный, бесповторный) для определения продолжительности срока службы ламп. Результаты выборки даны в табл. 4.8.

Табл. 4.8.

№1 2 3 4 5 6 7 8 9 10
Срок службы, час    1450 1370 1250 1400 1360 1420 1400 1320 1300 1430

 

На основе приведенных данных требуется:

1) определить доверительные интервалы, в которых заключена средняя продолжительность службы ламп для всей партии, гарантируя результат с вероятностью 0,99;

2) определить вероятность того, что средний срок службы ламп для всей партии отличается от полученного по выборке не более чем на 40 ч.

Решение

1. Доверительные интервалы для генеральной средней:

, ,

Для расчета S использована вспомогательная табл. 4.9.

хср. = 13700/10 = 1370 ч; S =  = 63.42 ч;  = 20,06

Для определения t сначала исчисляется S(t) :

S(t) = (Р + 1)/2 = (0,99 + 1)/2 = 0.995.

Табл. 4.9.

Номер лампы Срок горения x-xср. (х-хср.)2
1 2 3 4 5 6 7 8 9 10 1450 1370 1250 1400 1360 1420 1400 1320 1300 1430 80 0 -120 30 -10 50 30 -50 -70 60 6400 0 14400 900 100 2500 900 2500 4900 3600
Итого 13700 0 36200

 

По статистическим таблицам при к = п - 1 = 10 - 1=9 и S(t) = 0,995 имеем t = 3,2.

Тогда  = хср. ± t * µм.в. = 1370 ± 3,2 * 20,06 = 1370 ± 64,2.

Следовательно, с вероятностью 0,99 можно утверждать, что генеральная средняя колеблется в пределах от 1305,8 до 1434,2 час.

 

2. Для определения вероятности отклонения генеральной средней от выборочной средней не более, чем на 40 ч, имеются следующие данные:

 = 40 ч;   = 20,06 (см. п.1).

Отсюда

tф =  = 40/20,6 = 1,994  2,0.

Пользуясь таблицей распределения Стьюдента, определяется значение функции S(t) при t — 2,0 и k = 10 - 1 = 9, имеем - S(t) = 0,962.

Вероятность того, что отклонение генеральной средней от выборочной средней не превзойдет 40 ч:

 = 2 S(t) - 1 = 2*0,962 – 1 = 0,924

Вероятность того, что ошибка будет превышать 40 ч:

 = 2[1- S(t)] = 2[1-0,962] = 0,076.

Следовательно, вероятность отклонения генеральной средней от выборочной средней по абсолютной величине, превышающей 40 ч, очень мала.


Дата добавления: 2020-11-23; просмотров: 167; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!