Основные типы вероятностной выборки



Г. Келлерер показывает на ряде примеров, как осуществляется вероятностный метод выборки. При этом он рассматривает четыре ос­новных типа выборки:

- простая,

- стратифицированная,

- территориальная,

- многоступенчатая.

Приводятся следующие примеры простой выборки:

«В одном ведомстве по вопросам труда заведены личные карточки, 8000 шт. (N = 8000), по одной на каждого зарегистрированного человека. Объем выборки определен: n=400. Следуя традиционным путем, нужно было бы положить все карточки в большую емкость и хорошо перемешать, а затем вытащить 400 штук. Тысячи лотерейных билетов, скатанные в одинаковые ролики, можно привести с помощью барабана в случайный порядок, для карточек из картотеки такой способ вряд ли пригоден. Кроме того, карточки при этом были бы приведены в ненужный беспорядок, возможно, даже повреждены.

Выход в этой ситуации лежит в нумерации карточек от 1 до 8000 для последующего применения таблицы случайных чисел. Это табличные ряды, например, из 10 000 цифр, которые расположены в совершенно случайном порядке. Изготовление таких таблиц, - множество их имеется в продаже - наряду с этим возможно также машинным способом...

Применяя такую таблицу - ее можно назвать «урной про запас», - следует действовать так:

Отмечаем начало в любом месте таблицы и постоянно берем четыре следующих, друг за другом числа. Мы получаем, например, 1081, 0412, 6357, 3180, 0089... Тогда в кар­тотеке мы отбираем карточки с порядковыми номерами 1081, 412, 6357, 3180, 89... Номера свыше 8000 мы пропускаем.

Проще обстоит дело при «систематическом методе отбора». Объем выборки n=400 - это двадцатая часть от 8000 карточек в только что приведенном примере. Мы начинаем с какого-нибудь числа в пределах 20, например с 3. Затем после этого номера «3» берется каждая 20-я карточка, так мы получаем номера 3, 23, 43... 7983. Особенно удачен тот метод там, где все элементы совокупности уже пронумерованы и стоят в правиль­ном порядке...

Третий метод - это «способ конечных цифр». Он также предполагает пронумеро­ванную совокупность - от 1 до N. Для того чтобы выбрать из нее 20% всех случаев, следует отобрать все элементы, номера которых оканчиваются, например, на 2 или 9, так как каждая из этих цифр - 2 или 9 - представлена в 10% всей совокупности. Для того чтобы получить 3% всего объема, достаточно выбрать все элементы, порядковый но­мер которых кончается парами цифр 21, или 48, или 73. Преимуществом этого способа является то, что карты не должны лежать в порядке возрастания от 1 до N.

Отбор по буквам или по дням рождения часто также обеспечивает хорошее прибли­жение к настоящей вероятностной выборке. На больших группах населения мы применяем способ выбора лиц, фамилии которых начинаются с определенной буквы, или же всех лиц, которые родились в определенный день - например, 8 декабря какого-нибудь календарного года. Конечно, можно взять также несколько начальных букв или дней рождения, чтобы увеличить объем выборки. При этом мы исходим из в целом получающей подтверждение гипотезы, что нет никакой связи между начальными буквами фа­милии или днем рождения, с одной стороны, и интересующими нас статистическими признаками населения - с другой. Так, мы предполагаем, что календарный день рождения не оказывает влияния на доход соответствующего лица, что 20-25 -летние мужчины в Федеративной Республике Германии, фамилии которых начинаются с буквы Д, так же распределяются по весовым категориям, как и мужчины того же возраста, фамилии ко­торых начинаются с другой буквы».

Стратифицированную выборку применяют тогда, когда генераль­ная совокупность, которую хотят выборочно исследовать, не гомо­генна (не однородна). В этом случае составляют различные страты, об­ладающие большей гомогенностью, и затем проводят дальнейший от­бор внутри этих страт, чтобы уменьшить область рассеивания, которая тем меньше, чем больше гомогенность «исходной массы». Г. Келлерер приводит пример из практики составления переписей сельскохозяйст­венных предприятий, когда, чтобы скорее получить предварительные результаты, осуществляется выборочный анализ.

Территориальную выборку Г. Келлерер описывает на следующем: примере:

«Если требуется, например, провести репрезентативный опрос хотя бы среди квар­тиросъемщиков крупного города А, то сталкиваются с серьезной трудностью - нет спи­ска всех квартиросъемщиков, который можно использовать для составления выбороч­ной совокупности. Но выход есть: вся городская территория на основании плана города с очень крупным масштабом делится, например, на М=2ОО0 кварталов; их нумеруют в форме серпантина от 1 до 2000. Когда будет сделана эта предварительная работа, можно подвергнуть обследованию каждый 20-й квартал. Теперь нам нужно в 100 выбранных кварталах собрать точные данные обо всех квартиросъемщиках. Эта территориальная вы­борка может быть удачной даже тогда, когда у нас есть действительный список всех квартиросъемщиков по двум причинам:

а) «территориальная выборка» ограничивается определенными кварталами и поэ­тому уменьшаются расходы на дорогу и потери времени;

б) список жителей никогда не бывает совершенно точным, так как постоянно происходит пополнение и выезд. В территориальной выборке заложен учет текучести в принципе».

В четвертом основном типе - многоступенчатой выборке - сначала, также выбираются в известной мере «гнезда» из всей генеральной со­вокупности способом систематической случайности, например, отби­раются определенные округа или населенные пункты в стране. Внутри «гнезд» или «ячеек» (англ. spots) отбор происходит по принципам про­стой выборки. В качестве примера двухступенчатой стратифицирован­ной выборки Г. Келлерер приводит исследования «Анализ читатель­ской аудитории», организованные группой из 40 издателей, рекламных агентов и распространителей. Опрос должен был выяснить числен­ность и состав читательской аудитории популярных немецких журна­лов.

«Целью подобного анализа читателей является выяснение численности, географи­ческого распределения, демографической, экономической и социальной структуры чи­тателей целого ряда известных газет...»

«До сих пор специально для этого основанная «Группа по анализу читателей» в Фе­деративной Республике Германии провела четыре крупных исследования читатель­ской аудитории в 1954,1956,1957/58 и 1959/60 годах. Мы описываем применявшийся ме­тод в исследованиях 1956 года». В качестве генеральной совокупности было избрано население всей ФРГ, включая Западный Берлин, в возрасте от 16 до 70 лет, так как эта группа наиболее интересна с точки зрения распространения печати. Для того чтобы, несмотря на глубину поставленного вопроса, получить возможно больше ответов, исследование проводилось в форме интервью. В общей сложности в двухступенчатую стра­тифицированную выборку было включено 17 000 человек. Они отбирались по следую­щей схеме:

а) Сначала вся обследуемая территория была разделена на десять групп «А» и семь групп «Б». Самостоятельные группы «А» образовывали такие большие города, как Гам­бург, Бремен, Западный Берлин. Остальные семь федеральных земель были соответ­ственно разделены на группу «А» (она включала все населенные пункты с числом жите­лей 2000 и больше) и на группу «Б» (населенные пункты с числом жителей меньше 2000). Эта стратификация целесообразна, поскольку условия жизни в населенных пун­ктах с числом жителей меньше 2000 человек отличаются от таковых в крупных населен­ных пунктах. Кроме того, не исключены региональные различия: например, в земле Северный Рейн - Вестфалия особенности читателей не такие, как в Баварии.

б) Внутри групп «А» с учетом географического положения были сформированы «ячейки», куда входило по нескольку общин или части нескольких общин. «Ячейки» охватывали ровно 600 000 человек (таким образом, Гамбург и Западный Берлин были распределены между несколькими «ячейками»). В результате получено 62 «ячейки А». Внутри групп «Б» также были сформированы «ячейки» При этом исследователи объединяли общины по карте в направлении с севера на юг. В каждой «ячейке Б» оказалось примерно 350 000 жителей, всего таких ячеек было 38. Эта работа опиралась на данные ведомственной статистики о количестве жителей в общинах. На первом этапе отбора в каждой из этих 100 ячеек методом простой выборки было вычленено по 8 выборочных районов. При этом строго учитывалось, чтобы каждая община имела возможность по­пасть в выборочную совокупность пропорционально своей величине. Taк, например, община с 12 000 жителей обладала в четыре раза большей вероятностью попасть в вы­борку, чем община с 3000 жителей. Поскольку в результате этого на определенную часть крупных общин приходилось два или больше выборочных района, в целом было получено всего 624 выборочные общины. В каждой из этих отобранных общин с по­мощью местной картотеки населения систематическим способом отбора было выде­лено установленное количество адресов (второй этап выборки).

В 62x8 выборочных районах «ячеек-А» было взято по 25 адресов, а в 38x8 выбороч­ных районах «ячеек-Б» - по 14 1/3 адресов. Так учитывалось, что в каждой «ячейке-А» около 600 тыс. жителей, а в «ячейке-Б» только 350 тыс. На Западный Берлин выпало 747 адресов. Итак, в общей сложности получилось 62х8х25+38х8х14 1/3+747=17 500 адресов.

Они были распределены по сети интервьюеров таким образом, что каждый из по­чти 500 интервьюеров по всей стране и в Западном Берлине получил список домов, ко­торые он должен был посетить. Интервьюеры должны были сперва выяснить объек­тивные данные о лицах в возрасте от 16 до 70 лет в строго указанной последовательно­сти, с учетом пола и возраста. С помощью ряда чисел от 1 до 9 в случайной последова­тельности, который был приложен к каждому адресу, следовало затем определять рес­пондента. Например: следует провести интервью в семье из 4 человек в возрасте от 16 до 70 лет. Если к адресу приложен ряд случайных чисел: 7,5,2,6,1,3,8,9,4, то следовало опрашивать второго члена семьи потому, что 2 - первая цифра, которая в этом ряду слева направо меньше или равна 4. Единицей обследования здесь является не семья, а отдельный человек. Нужно следить за тем, чтобы при выборе опрашиваемого лица ис­ключить любой субъективный момент.

Если соответствующего человека не было дома, то интервьюер должен снова посе­тить его и даже при необходимости несколько раз. Бывает и так, что, несмотря на трое­кратные попытки визитов, все же не удавалось застать этого человека дома. Другая часть опрашиваемых отказывалась от интервью. Этими или другими причинами можно объяснить, что было проведено лишь 14 200 интервью. На практике, таким обра­зом, в выборке появлялись пробелы. …

Метод квот

Выбор по методу квот предполагает, что известны некоторые важ­ные пропорции генеральной совокупности, как, например, распределе­ние по возрастным, профессиональным группам, по величине населен­ных пунктов. По этим данным вычисляются квоты, которые распреде­ляются среди интервьюеров. Те в свою очередь осуществляют выбор респондентов в соответствии с заданными им квотами. На основе дан­ных официальной статистики приходят, например, к утверждению, что 54% всей генеральной совокупности (население ФРГ старше 16 лет включительно) составляют женщины и 46% - мужчины; что 28% насе­ления моложе 30 лет, 24% в возрасте 30-44 лет, 28% в возрасте 45-59 лет и 20% населения старше 60 лет.

Далее известно, сколько процентов проживает в сельских общинах (с населением менее 2000 жителей), сколько в маленьких городках (в городах с населением от 2000 до менее 20 000 жителей), сколько в сред­них городах (с населением от 20 000 до менее 100 000 жителей), сколько в больших городах, а также как население распределяется по различным зем­лям и внутри земель в округах. Известна доля работающих и доля нера­ботающих, известна численность различных профессиональных групп (рабочие, сельскохозяйственные рабочие, служащие, чиновники, фер­меры, независимые предприниматели, представители свободных про­фессий).

Так как правильная уменьшенная модель генеральной совокупно­сти должна быть идентичной, для каждого интервьюера, участвую­щего в опросе, разрабатывается квота: сколько мужчин и женщин сле­дует опросить, сколько представителей различных возрастных групп, сколько работающих, сколько представителей профессиональных групп и сколько неработающих из различных профессий. Когда квоты составлены, то все эти статистические пропорции создают в миниа­тюре картину генеральной совокупности. Правильное распределение по населенным пунктам, землям и районам достигается, как правило, на основании числа заданий интервьюерам в различных областях и раз­личных по размеру населенных пунктах. Репрезентативность по остальным, не предусмотренными квотами признакам обеспечивается усилиями интервьюеров, которые для выполнения заданной квоты должны практически осуществить случайный отбор опрашиваемых…

Сколько процентов следует опрашивать?

Глубоко укоренилось представление, что нужно опрашивать, опре­деленную долю генеральной совокупности, чтобы получить доста­точно надежные результаты. В доказательство бессмысленности ре­зультатов какого-нибудь опроса часто можно прочитать, что будто бы было опрошено всего лишь 0,0001 генеральной совокупности, что будто бы каждый опрошенный должен был высказываться за осталь­ные 20 000 человек - поэтому ясно, что все это чепуха.

Однако в действительности все обстоит иначе. Точность репрезентативного обследования зависит (здесь мы не говорим о чрезвычайно маленьких генеральных совокупностях) не от доли опрошенных в ге­неральной совокупности, а от абсолютного числа опрашиваемых…

Тот факт, что для маленьких или для больших совокупностей требуется одинаковое число интервью, чтобы получить результаты определенной точности, имеет интересные практические последствия. Нельзя, например, удешевить исследование, ограничиваясь опросом в маленьких областях или нескольких городах. В небольших странах, пример в Голландии или Швейцарии, опрос населения должен планироваться практически с таким же количеством интервью, как в США, чтобы с той же точностью узнать мнение населения.

Репрезентативен ли опрос меньше 2000 респондентов?

Так как многие опросы населения ограничиваются 2000 интервью, то возникает представление, что только при 2000 опрошенных можно говорить о репрезентативном исследовании, что при меньшем количестве опрошенных уже не будет репрезентативной выборки.

Следует еще раз напомнить: является выборка репрезентативной или нет, зависит от методически правильного отбора опрашиваемых, а не от числа лиц, которые были опрошены. Даже 100 человек могут представлять собой репрезентативную выборку среди населения Фе­деративной Республики. Разница заключается лишь в величине откло­нений…


Дата добавления: 2016-01-06; просмотров: 18; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!