Способы распространения выборочных результатов на генеральную совокупность. Предельная ошибка выборки



Выборочное наблюдение

Определение выборочного наблюдения

Виды и схемы отбора

Ошибки выборки

Способы распространения выборочных результатов на генеральную совокупность

Определение необходимого объема выборки

Определение выборочного наблюдения

Статистические исследования очень трудоемки и дороги, поэтому возникла мысль о замене сплошного наблюдения выборочным.

Основная цель несплошного наблюдения состоит в получении характеристик изучаемой статистической совокупности по обследованной ее части.

Выборочное наблюдение– это метод статистического исследования, при котором обобщающие показатели совокупности устанавливаются только по отдельно взятой части на основе положений случайного отбора.

При выборочном методе изучению подвергается только некоторая часть изучаемой совокупности, при этом подлежащая изучению статистическая совокупность называется генеральной совокупностью.

Выборочной совокупностью или просто выборкой можно называть отобранную из генеральной совокупности часть единиц, которая будет подвергаться статистическому исследованию.

Значение выборочного метода: при минимальной численности исследуемых единиц проведение статистического исследования будет происходить в более короткие промежутки времени и с наименьшими затратами средств и труда.

Если в период обследования будут соблюдены все правила его научной организации, то выборочный метод даст довольно точные результаты, и поэтому данный метод целесообразно применять для проверки данных сплошного наблюдения.

Этот метод получил широкое распространение в государственной и вневедомственной статистике, потому что при исследовании минимальной численности изучаемых единиц позволяет тщательно и точно провести исследование.

Изучаемая статистическая совокупность состоит из единиц с варьирующими признаками. Состав выборочной совокупности может отличаться от состава генеральной совокупности, это расхождение между характеристиками выборки и генеральной совокупности составляет ошибку выборки.

Ошибки, свойственные выборочному наблюдению, характеризуют размер расхождения между данными выборочного наблюдения и всей совокупности. Ошибки, возникающие в ходе выборочного наблюдения, называются ошибками репрезентативности и делятся на случайные и систематические.

Если выборочная совокупность недостаточно точно воспроизводит всю совокупность из–за несплошного характера наблюдения, то это называют случайными ошибками, и их размеры определяются с достаточной точностью на основании закона больших чисел и теории вероятностей.

Систематические ошибки возникают в результате нарушения принципа случайности отбора единиц совокупности для наблюдения.

Виды и схемы отбора или формирования выборки

Размер ошибки выборки и методы ее определения зависят от вида и схемы отбора.

Различают четыре вида отбора совокупности единиц наблюдения:

1) случайный;

2) механический;

3) типический;

4) серийный (гнездовой).

1. Случайный отбор– наиболее распространенный способ отбора в случайной выборке, его еще называют методом жеребьевки, при нем на каждую единицу статистической совокупности заготовляется билет с порядковым номером.

Далее в случайном порядке отбирается необходимое количество единиц статистической совокупности. При этих условиях каждая из них имеет одинаковую вероятность попасть в выборку, например тиражи выигрышей, когда из общего количества выпущенных билетов в случайном порядке наугад отбирается определенная часть номеров, на которые приходятся выигрыши. При этом всем номерам обеспечивается равная возможность попасть в выборку.

2. Механический отбор– это способ, когда вся совокупность разбивается на однородные по объему группы по случайному признаку, потом из каждой группы берется только одна единица. Все единицы изучаемой статистической совокупности предварительно располагаются в определенном порядке, но в зависимости от объема выборки механически через определенный интервал отбирается необходимое количество единиц.

3. Типический отбор –это способ, при котором исследуемая статистическая совокупность разбивается по существенному, типическому признаку на качественно однородные, однотипные группы, затем из каждой этой группы случайным способом отбирается определенное количество единиц, пропорциональное удельному весу группы во всей совокупности.

Типический отбор дает более точные результаты, так как при нем в выборку попадают представители всех типических групп.

4. Серийный (гнездовой) отбор.Отбору подлежат целые группы (серии, гнезда), отобранные случайным или механическим способом. По каждой такой группе, серии проводится сплошное наблюдение, а результаты переносятся на всю совокупность.

Точность выборки зависит и от схемы отбора. Выборка может быть проведена по схеме повторного и бесповторного отбора.

Повторный отбор.Каждая отобранная единица или серия возвращается во всю совокупность и может вновь попасть в выборку. Это так называемая схема возвращенного шара.

Бесповторный отбор.Каждая обследованная единица изымается и не возвращается в совокупность, поэтому она не попадает в повторное обследование. Эта схема получила название невозвращенного шара.

Бесповторный отбор дает более точные результаты, потому что при одном и том же объеме выборки наблюдение охватывает большее количество единиц изучаемой совокупности.

Комбинированный отборможет проходить одну или несколько ступеней. Выборка называется одноступенчатой, если отобранные однажды единицы совокупности подвергаются изучению.

Выборка называется многоступенчатой, если отбор совокупности проходит по ступеням, последовательным стадиям, причем каждая ступень, стадия отбора имеет свою единицу отбора.

Многофазная выборка – на всех ступенях выборки сохраняется одна и та же единица отбора, но проводится несколько стадий, фаз выборочных обследований, которые различаются между собой широтой программы обследования и объемом выборки.

Для отобранных единиц рассчитываются обобщенные показатели (средние или относительные) и в дальнейшем результаты выборочного исследования распространяются на всю генеральную совокупность.

Ошибки выборки

В статистике приняты следующие условные обозначения.

Доля выборки– это отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:

,

где N – объем генеральной совокупности;

n – объем выборки.

 

Выборочная доля (w), или частность, определяется отношением числа единиц, обладающих изучаемым признаком m, к общему числу единиц выборочной совокупности (n):

Два основных вида обобщающих показателей, которые используют в выборочном методе – это средняя величина количественного признака и относительная величина альтернативного признака.

В генеральной совокупности доля единиц, которая обладает изучаемым признаком, называется генеральной долей (обозначается р),а средняя величина изучаемого варьирующего признака – это генеральная средняя (обозначается ).

Основной задачей при выборочном исследовании является определение ошибок выборки. Ошибка выборки присуща только выборочным наблюдениям.

Для характеристики надежности выборочных показателей различаютпредельную и среднюю ошибки выборки.

Выборочная средняя и выборочная доля – это случайные величины, принимающие различные значения в зависимости от единиц изучаемой статистической совокупности, которые попали в выборку. Соответственно ошибки выборки – тоже случайные величины и также могут принимать различные значения. Поэтому определяют среднюю из возможных ошибоксреднюю ошибку выборки.

Рассмотрим ошибки при 4-х видах отбора.

1. Собственно-случайная выборка– это отбор единиц из всей генеральной совокупности посредством жеребьевки (например, розыгрыш лотерей) или другим подобным способом (например, по таблице случайных чисел).

Принципом случайности является то, что на включение или исключение объекта из выборки не может повлиять любой фактор, кроме случая.

Собственно-случайный отбор в чистом виде в практике выборочного наблюдения встречается редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного статистического наблюдения.

Средняя ошибка выборки определяется объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, все более точно характеризуем всю генеральную совокупность.

Средняя ошибка выборки зависит от степени варьирования изучаемого признака, в свою очередь степень варьирования характеризуется дисперсией s2. Чем меньше вариация признака и дисперсия, тем меньше средняя ошибка выборки, и наоборот.

При случайном повторном отборе средние ошибки рассчитывают по следующим формулам:

1) для средней количественного признака:

где s2г – средняя величина генеральной дисперсии количественного признака.

2) для доли (альтернативного признака):

В эти формулы входит дисперсия признака в генеральной совокупности. Практически генеральная дисперсия точно не известна, но в теории вероятности доказано, что

,

где s2г – генеральная дисперсия (дисперсия признака в генеральной совокупности);

s2в – выборочная дисперсия того же признака;

Так как величина при достаточно больших n близка к 1, можно считать, что . Тогда средняя ошибка выборки может быть рассчитана:

.

Но в случаях малой выборки (при n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле

.

Прислучайной бесповторной выборке приведенные формулы корректируются на величину . Тогда средняя ошибка бесповторной выборки:

и .

Т.к. nвсегда меньше N, то множитель ( ) всегда меньше 1. Это значит, что средняя ошибка при бесповторном отборе всегда меньше, чем при повторном.

2. Механическая выборка применяется, когда генеральная совокупность каким-либо способом упорядочена (например, списки избирателей по алфавиту, телефонные номера, номера домов, квартир).

Отбор единиц осуществляется через определенный интервал, который равен обратному значению процента выборки. Так при 2% выборке отбирается каждая 50 единица =1/0,02 , при 5% каждая 1/0,05=20 единица генеральной совокупности.

Начало отсчетавыбирается разными способами: случайным образом, из середины интервала, со сменой начала отсчета. Главное при этом – избежать систематической ошибки. Например, при 5% выборке, если первой единицей выбрана 13-я, то следующие 33, 53, 73 и т.д.

 При достаточно большой совокупности механический отбор по точности результатов близок к собственно-случайному. Поэтому для определения средней ошибки механической выборки используют формулы собственно-случайной бесповторной выборки.

3. Для отбора единиц из неоднородной совокупности применяется так называемая типическая выборка. Она используется, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, от которых зависят изучаемые показатели. Например, при обследовании предприятий это могут быть отрасли, подотрасли, при изучении населения – районы, социальные или возрастные группы.

Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.

Типическая выборка дает более точные результаты. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представительство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки.

Следовательно, при нахождении ошибки типической выборки согласно правилу сложения дисперсий ( ) необходимо учесть лишь среднюю из групповых дисперсий. Тогда средняя ошибка выборки:

· при повторном отборе

,

· при бесповторном отборе

, где – средняя из внутригрупповых дисперсий в выборке.

4. Серийный (или гнездовой) отбор применяется в случае, когда генеральная совокупность разбита на серии или группы до начала выборочного обследования. Этими сериями могут быть упаковки готовой продукции, студенческие группы, бригады. Серии для обследования выбираются механическим или собственно-случайным способом, а внутри серии производится сплошное обследование единиц.

Поэтому средняя ошибка выборки зависит только от межгрупповой (межсерийной) дисперсии, которая вычисляется по формуле:

где r – число отобранных серий;

– средняя і-той серии.

Средняя ошибка серийной выборки рассчитывается:

При повторном отборе  

 

При бесповторном отборе  

  , где R – общее число серий.

Средняя ошибка выборки при любом способе отбора зависит главным образом от абсолютной численности выборки и в меньшей степени – от процента выборки.

Предположим, что проводится 225 наблюдений в первом случае из генеральной совокупности в 4500 единиц и во втором – в 225000 единиц. Дисперсии в обоих случаях равны 25. Тогда в первом случае при 5 %-ном отборе ошибка выборки составит:

Во втором случае при 0,1 %-ном отборе она будет равна:

Таким образом, при уменьшении % выборки в 50 раз, ошибка выборки увеличилась незначительно, так как численность выборки не изменилась.
Предположим, что численность выборки увеличили до 625 наблюдений. В этом случае ошибка выборки равна:

Увеличение выборки в 2,8 раза при одной и той же численности генеральной совокупности снижает размеры ошибки выборки более чем в 1,6 раза.

Средняя ошибка выборки показывает возможные отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Если, например средняя продолжительность горения лампочки по выборкесоставила 300 час, а ошибка выборки μ =10 час, то среднюю продолжительность горения всей партии лампочек, из которой взята выборка, можно ожидать в пределах 300 10 час, т.е. от 290 до 310 ч.

Однако то, что генеральная средняя не выйдет за данные пределы, можно утверждать лишь с определенной степенью вероятности р.

Доказано, что утверждение о том, что генеральные характеристики не отклонятся от выборочных на величину большую, чем ошибка выборки μ, всегда имеет постоянную степень вероятности, равную 0,683. Значит, в 683 случаях из 1000 характеристика генеральной совокупности будет отличаться от характеристики выборки не больше, чем на величину μ, но в остальных 317 случаях из 1000 она может отличаться и в большей степени.

Можно повысить вероятность утверждения, расширив пределы отклонений до удвоенной ошибки 2μ. В примере это значит, что средняя продолжительность горения партии лампочек находится в пределах 300 20, т.е. от 280 до 320 часов. Вероятность утвержденияв этом случае равна 0,954, т.е. только в 46 случаях из 1000 отклонение выйдет за пределы . При утроенной μвероятность повышается до 0,997.

  μ 3,28μ
р 0.683 0.954 0.997 0.999

Значит с определенной степенью вероятности можно утверждать, что отклонения выборочных характеристик от генеральных не превысят некоторой величины, которая называется предельной ошибкой выборки:

,

где t – нормированное отклонение – коэффициент доверия, зависящий от вероятности, с которой гарантируется, что предельная ошибка не превысит t – кратную среднюю ошибку.

Значения доверительной вероятности при различных значениях коэффициента доверия представлены в специально составленных таблицах. Наиболее часто применяемые значения:

t 1.0 1.96 2.0 2.58 3.0
Вероятность 0.683 0.95 0.954 0.99 0.997

где t – нормированное отклонение – коэффициент доверия

Предельная ошибка выборки или ошибка репрезентативности D представляет собой разность соответствующих выборочных и генеральных характеристик:

1) для средней количественного признака:

Dх =|  – |,

где  – генеральная средняя;

 – выборочная средняя;

Предельная ошибка выборки позволяет определить доверительные интервалы характеристик генеральной совокупности. Для генеральной средней

или .

Это означает, что с заданной вероятностью можно утверждать, что значение генеральной средней следует ожидать в пределах от до .

2) для доли (альтернативного признака):

Dw =|w – p|,

гдеw– выборочная средняя;

  р – генеральная доля;

Пределы доли признака в генеральной совокупности р.

Предельная ошибка рассчитывается по следующим формулам:

Показатель Повторный случайный отбор Бесповторный случайный отбор
Предельная ошибка количественного признака
Предельная ошибка доли альтернативного признака

Задача

Олигарх купил партию изделий при условии, что не менее 92 % из них отвечает требованиям стандарта. Выборочная контрольная проверка показала, что из 500 отобранных изделий стандартам отвечает 95 %. Приобретет ли олигарх изделия.

Границы определяются

w = 0,95

 

при t = 2, р = 95 ± 2 (93 – 97) %  при t = 3, р = 95 ± 3 (92 – 98) %

Способы распространения выборочных результатов на генеральную совокупность. Предельная ошибка выборки

Конечной целью выборочного наблюдения является характеристика генеральной совокупности.

Основными методами распространения выборочного наблюдения на генеральную совокупность являются прямой пересчет показателей выборки для генеральной совокупности или метод расчета поправочных коэффициентов.

Прямой пересчет есть произведение среднего значения признака на объем генеральной совокупности. Однако большое число факторов не позволяет в полной мере использовать точечную оценку прямого пересчета при распространении результатов выборки на генеральную совокупность.

На практике чаще пользуются интервальной оценкой, которая дает возможность учитывать размер предельной ошибки выборки, которая рассчитана для средней или для доли признака. При этом показатели выборочной доли w или средней храспространяются на генеральную совокупность с учетом предельной ошибки выборки.

Способ поправочных коэффициентов применяется, когда целью выборочного метода является уточнение результатов сплошного учета. Данный способ используется при уточнении данных ежегодных переписей скота у населения.

При этом рекомендуется использовать формулу

где Y1 - численность совокупности с поправкой на недоучет;

Y0 - численность совокупности без этой поправки;

y0 - численность совокупности в контрольных точках по первоначальным данным;

y1 - численность совокупности в тех же точках по данным контрольных мероприятий.

Если нужно уточнить данные сплошного наблюдения при осуществлении контроля за выборочными исследованиями, необходимо определить поправку на недоучет. Метод расчета этой поправки широко применяется при исследовании небольших совокупностей, когда можно рассчитать коэффициент недоучета по каждой категории работников и, уточнив данные, распространить результаты на всю совокупность.

Пример

При проведении сплошного учета гаражей-ракушек в городе было зарегистрировано по южному (Ю) району 1000 гаражей; по северному (С) - 750; восточному (В) - 400.

 

На основе контрольных выборочных мероприятий было установлено следующее количество гаражей, шт.:

Район p при учете p в ходе контроля Коэффициент недоучета
Ю 200 210 1,050
С 150 160 1,066
В 100 110 1,100

Используя формулу способа коэффициентов (или используя рассчитанный коэффициент при выборочном учете), получаем численность гаражей после контроля (У) с поправкой на недоучет:

У(Ю) = 1000 210 : 200 = 1050;

У(С) = 750 160 : 150=800;

У(В) = 400 110 : 100 = 440.

В итоге можно сказать, что на основе способа коэффициентов проверка результатов сплошного наблюдения широко применяется в социальной и экономической статистике, в частности в контроле за коммерческой деятельностью юридических и физических лиц со стороны финансовых организаций.

Задача

Выборочное распределение университета по числу часов работы за компьютером в течение недели характеризуется следующими данными (выборкой было охвачено 900 студентов (15 % от их численности)).

Число часов, час Х Число студентов, чел. f Середина интервала хi х f Si= хi – x Si2 Si2 - fi
до 5 45 2,5 112,5 -15,5 240,25 10811,25
5 - 10 90 7,5 675,0 -10,5 110,25 9922,5
10 - 15 225 12,5 2812,5 -5,5 30,25 6806,25
15 - 20 270 17,5 4725,0 -0,5 0,25 67,5
20 - 30 180 25,0 4500,0 7 49,0 8820
более 30 90 35,0 3150,0 17 289,0 26010
Итого 900   15975     62437,5

 

 С вероятностью не ниже 95 % определить

1. Границы, в которых находится среднее время

2. Границы, в которых находится доля студентов более 15 часов работающих за компьютером

Решение:

Среднее время / границы могут быть определены

1.

, час

, где t = 2– коэффициент доверия

                                   n = 900 человек (15 %) – объем выборки

                                  N = 6000 человек (100%)– объем генеральной совокупности

 = час2

 = 2  ч

 = (18 ±0,5) ч  17,5 – 18,5

2. , w = (60 %)

sр2 = рq = 0,6 х 0,4 = 0,24

 =   (3 %)

 = 60 ± 3, 57 - 63

  


Дата добавления: 2018-02-28; просмотров: 3988; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!