Стратифицированный случайный отбор.



Выборка с возвращением и без возвращения

Два важных понятия — выборка с возвращением и выборка без возвращения. В ситуации выборки с возвращением возможности наступления всех событий остаются постоянными, так как никакой случай не происходит вслед за появлением любого предыдущего события.

В ситуации выборки без возвращения появление определенного события исключает для него возможность произойти вновь, поскольку данный случай не повторяется. Выборка с возвращением обычно допускает применение теорем сложения и умножения. При выборке без возвращения вероятностная картина существенно меняется и распределение вероятностей принимает форму и свойства гипергеометрического распределения.

 

«закон больших чисел», местом рождения которого является игорный стол. Со времени его первой формулировки, данной Симоном де Пуассоном, прошло более ста лет. В течение этого времени он претерпел многообразные интерпретации. Иные математики обосновывали его преимущественно теоретически, другие главным образом со стороны практической статистики.

В редакции Антуана Огюстена Курно этот закон определяется следующим образом:

1. События, вероятность которых очень невелика, случаются очень редко.

2. Вероятность того, что отклонение относительной повторяемости от соответствующей вероятности не превышает заданную величину, будет тем больше, чем больше объем наблюдаемой серии.

Вывод: при достаточно большом объеме наблюдаемой серии относительная повторяемость соответствующей ей вероятности очень редко отклоняется больше, чем на заданную малую величину.

Ограничение генеральной совокупности:

Кого исследовать?

Сразу после того, как сформулирована задача исследования, следует установить (определить), какой круг лиц должен быть исследован, какую совокупность, “популяцию”, какой “универсум” должны описывать результаты исследования.

Даже для самого обычного опроса населения должны быть, например, определены возрастные границы: нужно ли исследовать мнения части населения, имеющей право голоса, или всех людей старше 16 лет, или, чтобы лучше учесть молодых покупателей, с 14 лет включительно. Следует ли проводить верхнюю возрастную границу, напри­мер: какие газеты читают люди в возрасте от 16 до 70 лет?

Таким образом, имеются многочисленные и разнообразные ограничения генеральной совокупности. Это могут быть, вероятно, одни лишь мужчины или одни лишь женщины, население определенного города или определенной области или жители одной какой-то категории населенных пунктов, например жители деревенских общин, подписчики ежедневной газеты, владельцы автомобилей, люди одной профессии, работники одного предприятия, а также, может быть, их жены. Здесь нужно принять решение - кто интересует исследователей.

 

Условием формирования выборки является, как правило, однозначное объективное определение изучаемой совокупности. Все примеры, перечисленные выше, содержат такие объективные характеристики, хотя, если подходить серьезно, они еще нуждаются в уточнении.

“Подписчики ежедневной газеты”: идет ли речь о главе семьи или о всех взрослых в семье подписчика? “Владельцы легкового автомобиля”: должны ли это быть “владельцы” в юридическом смысле слова или “имеющие в распоряжении” - например, лица, которым предоставлена служебная машина?

 

“Собственно статистическая проблема, - пишет Г. Келлерер о выборочных исследованиях, - возникает в связи со следующими тремя вопросами:

а) каков должен быть объем выборки;

 

Объем выборки. Может показаться, что чем больше выборка, тем лучше, однако это не всегда так. При увеличении выборки можно получить большую точность оценок, чем требуется на самом деле, и т. о. потратить ресурсы впустую. Во мн. случаях сосредоточение ресурсов на извлечении всей информ. из тщательно отобранной выборки дает больше пользы, чем сплошное обследование, когда невозможно ни проконтролировать сбор данных, ни проанализировать их с той тщательностью и полнотой, как при В. и. Если мы располагаем предварительными сведениями об изменчивости изучаемых характеристик, можно определить объем выборки, необходимый для получения их оценок с любым выбранным по нашему усмотрению уровнем точности. Объем генеральной совокупности никак не связан с объемом выборки, требуемым для заданного уровня точности оценок.

 

б) как должен происходить отбор элементов выборки;

“Каждый элемент генеральной совокупности в репрезентативном исследовании должен иметь соизмеримые и отличные от нуля возможности попасть в выборку”

 

 

в) в какой мере можно положиться на результаты выборки, то есть в какой степени они правильно отражают истинное положение вещей?

Репрезентативность.

Виды отбора

Простой случайный отбор.

При простом случайном отборе каждая единица должна иметь равную возможность быть извлеченной из совокупности в каждом выборе, причем каждый выбор должен производиться независимо от всех др.

Нужен перечень единиц генеральной совокупности. Для этого необходимо всю совокупность представить каким-либо образом в форме, доступной для процедуры выборки. Это могут быть либо полные и постоянно обновляемые списки или картотеки на всех членов совокупности

В одном ведомстве по вопросам труда заведены личные карточки, 8000 шт. (N=8000), по одной на каждого зарегистрированного человека. Объем выборки определен: n =400. Следуя традиционным путем, нужно было бы положить все карточки в большую емкость и хорошо перемешать, а затем вытащить 400 штук. Тысячи лотерейных билетов, скатанные в одинаковые ролики, можно привести с помощью барабана в случайный порядок, для карточек из картотеки такой способ вряд ли пригоден. Кроме того, карточки при этом были бы приведены в ненужный беспорядок, возможно, даже повреждены.

Выход в этой ситуации лежит в нумерации карточек от 1 до 8000 для последующего применения таблицы случайных чисел. Это табличные ряды, например, из 10 000 цифр, которые расположены в совершенно случайном порядке. Изготовление таких таблиц - множество их имеется в продаже - наряду с этим возможно также машинным спосо­бом...

Применяя такую таблицу  следует действовать так:

Отмечаем начало в любом месте таблицы и постоянно берем четыре следующих друг за другом числа. Мы получаем, например, 1081,0412,6357,3180,0089... Тогда в картотеке мы отбираем карточки с порядковыми номерами 1081, 412, 6357, 3180, 89... Номера свыше 8000 мы пропускаем.

 

Систематический отбор.

Выбор каждого п-гоэлемента из полного списка (основы выборки) — простой способ получения случайной выборки в том случае, когда последовательность элементов в списке является чисто случайной но отношению к изучаемому признаку. В противоположность этому, способ отбора, когда список элементов упорядочен относительно интересующего исследователей признака, обеспечивает репрезентативность выборки в отношении этой характеристики. Кроме того, он производит эффект стратификации (расслоения), к-рый дает повышение точности оценок при том же объеме выборки.

Проще обстоит дело при “систематическом методе отбора”. Объем выборки n =400 - это двадцатая часть от 8000 карточек в только что приведенном примере. Мы начи­наем с какого-нибудь числа в пределах 20, например с 3. Затем после этого номера “З” берется каждая 20-я карточка, так мы получаем номера 3,23,43.., 7983. Особенно удачен этот метод там, где все элементы совокупности уже пронумерованы и стоят в правильном порядке...

Отбор по буквам или по дням рождения часто также обеспечивает хорошее приближение к настоящей вероятностной выборке. Так, мы предполагаем, что календарный день рождения не оказывает влияния на доход соответствующего лица

 

Стратифицированный случайный отбор.

применяют тогда, когда генеральная совокупность, которую хотят выборочно исследовать, не гомогенна (не однородна). В этом случае составляют различные страты, обладающие большей гомогенностью, и затем проводят дальнейший отбор внутри этих страт. Стратификация (расслоение, районирование) требует разбиение выборки, исходя из нек-рой характеристики. Стратификация может проводиться одновременно по неск. признакам.

Стратифицированный отбор требует, чтобы в дополнение к правильному перечню основы выборки исследователь располагал точной информ. о распределении единиц по стратам и о том, какую долю занимает каждая страта в полной совокупности.

 

Гнездовой и многоступенчатый отбор.

Простой и стратифицированный случайный отбор, особенно при интервьюировании территориально распределенной популяции, требует значительных переездов и, соответственно, больших финансовых расходов. Гнездовой отбор существенно сокращает эти расходы путем разбиения изучаемой совокупности на группы по географическому признаку. Эта методика заключается в наложении масштабной сетки на географическую карту области расселения изучаемой популяции, случайного выбора квадратов (гнезд) сетки, представляющих данную популяцию, и последующем обследовании элементов каждого гнезда. Поскольку в гнезде может оказаться больше единиц, чем нужно для исслед., гнездовой отбор часто используют в качестве первой ступени многоступенчатого отбора.

Территориальную выборку Г. Келлерер описывает на следующем примере:

“Если требуется, например, провести репрезентативный опрос хотя бы среди квартиросъемщиков крупного города А, то сталкиваются с серьезной трудностью- нет списка всех квартиросъемщиков, который можно использовать для составления выборочной совокупности. Но выход есть: вся городская территория на основании плана городе с очень крупным масштабом делится, например, на М=2000 кварталов; их нумеруют в форме серпантина от 1 до 2000. Когда будет сделана эта предварительная работа, можно подвергнуть обследованию каждый 20-й квартал. Теперь нам нужно в 100 выбранных кварталах собрать точные данные о всех квартиросъемщиках.

 

Последовательный отбор.

Если изучаемые характеристики или мнения не изменяются за время проведения исслед. и если есть возможность без особого труда вернуться к эффективному сбору дополнительных данных, последовательный отбор получает ряд преимуществ. Он позволяет использовать к.-л. из вышеупомянутых планов В. и. Каждая последующая выборка добавляется к предыдущим выборкам до тех пор, пока не достигается устойчивость оценок в пределах выбранного диапазона точности. Недавно интерес к этому методу возрос в связи с широким проведением опросов по телефону.

 

Отбор по квотам. Целенаправленный.

По существу, их цель состоит в том, чтобы на уровне выборки создать б. или м. точную копию популяции. Поэтому квоты устанавливаются в отношении важных признаков популяции, к-рые. как полагают, влияют на изучаемую переменную. К часто используемым признакам относятся пол, образование, социоэкономический статус, этническая или расовая принадлежность и местожительство.

Выбор по методу квот предполагает, что известны некоторые важные пропорции генеральной совокупности, как, например, распределение по возрастным, профессиональным группам, по величине населенных пунктов. По этим данным вычисляются квоты, которые распределяются среди интервьюеров. Те в свою очередь осуществляют выбор респондентов в соответствии с заданными им квотами.

На основе данных официальной статистики приходят, например, к утверждению, что 54% всей генеральной совокупности (население Германии старше 16 лет включительно) составляют женщины и 46% - мужчины; что 28% населения моложе 30 лет, 24% в возрасте 30-44 лет, 28% в возрасте 45-59 лети 20% населения старше 60 лет.

при опросе избирателей, в к-ром для выбора округов используется методика гнездового отбора, а для обеспечения репрезентативности каждого округа по возрасту, полу и партийной принадлежности применяется метод квот.

Правильная уменьшенная модель генеральной совокупности должна быть идентичной, для каждого интервьюера, участвующего в опросе, разрабатывается квота: сколько мужчин и женщин следует опросить, сколько представителей различных возрастных групп, сколько работающих, сколько представителей профессиональных групп и сколько неработающих из различных профессий.

Действительная функция квот заключается в том, чтобы способствовать интервьюеру в проведении случайного отбора, при котором каждый член исходной совокупности имеет практически равную с другими возможность попасть в выборку

 

Наиболее важные условия применения метода квот:

1. Необходимы надежные статистические данные для расчета квот.

2. Следует составлять объективные и в то же время специфические квоты, которые побуждают интервьюера при опросе выйти за рамки его собственной социальной среды. Квота должна быть сформулиро­вана таким образом, чтобы интервьюеру было нелегко найти замену опрашиваемому (известная “степень трудности” квот).

3. Вопросник должен освещать несколько тем; он должен во всех социальных группах обеспечить одинаково успешное и приятное ин­тервью.

4. Число заданий интервьюеру должно быть невелико. Каждый ин­тервьюер должен провести самое большее 15 интервью, лучше меньше.

5. Задания должны распределяться таким образом, чтобы каждый интервьюер мог, как правило, проводить интервью в своем районе. Обнаружено, что в случаях, когда интервьюер должен выезжать для опроса и ин­тервьюировать в совершенно незнакомом ему месте, квотный метод не всегда ведет к репрезентативному отбору. В этих случаях лучше применять метод случайного отбора.

6. По возможности большую часть интервью (около 80-90 процен­тов), следует проводить в квартирах. Слишком большое число интер­вью на улице приводит к излишней доле в выборке мобильной части населения, лиц, которые часто находятся вне дома.

7. В руководстве интервьюерами должны быть строго исключены вариации. Это лучше всего обеспечивается при централизованном ру­ководстве интервьюерами.

8. Организацией интервьюеров следует руководить, придержива­ясь одних и тех же требований в течение долгого времени. Сюда отно­сится прежде всего равномерное тематическое использование интер­вьюеров.

 


Дата добавления: 2020-11-27; просмотров: 403; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!