Методы невероятностной выборки



Невероятностная (или неслучайная) выборка – это такой способ отбора единиц выборочной совокупности, принцип которого в корне отличен от случайного. Как и для вероятностного способа отбора, основная цель неслучайного отбора состоит в получении совокупности, репрезентирующей изучаемый объект. Однако, в отличие от вероятностной выборки, статистические выводы обо всем множестве объектов в этом случае делать не совсем правомерно. Эти выводы могут с большей или меньшей степенью вероятности распространяться лишь на генеральную совокупность (которая далеко не всегда совпадает с объектом исследования). Выделяют два основных вида неслучайного отбора: направленный отбор (другие названия – целенаправленный, целевой, выбор по усмотрению) и стихийный. Наиболее распространенными формами направленного отбора считаются: выбор типичных представителей, квотная выборка, гнездовая выборка и метод снежного кома.

В качестве примера использования метода типичных представителей можно было бы привести такой пример из моей студенческой биографии. В конце 60-х гг. в Горьковский университет, где я тогда учился, приехал известный журналист Валерий Аграновский (брат знаменитого в свое время Анатолия Аграновского). Он получил творческое задание от журнала “Юность”: подготовить материал о “самом типичном студенте“ того времени. В результате на страницах этого популярного журнала вскоре появился нашумевший в свое время очерк “Лебедев против Лебедева”, героем которого был студент радиофизического факультета ГГУ Лебедев. Почему именно он? Вначале был отобран наиболее типичный университет страны. По данным Министерства высшего образования, рассчитали среднестатистическую численность студентов приходящуюся на один университет. Затем нашли университет, где численность студентов имела наименьшее отклонение от этого значения – им как раз и оказался Горьковский университет. Среди восьми факультетов ГГУ остановились на радиофизическом, где число студентов в наименьшей степени расходилось со среднестатистической численностью одного факультета. На последнем этапе рассчитывалась уже среднестатистическая успеваемость студентов радиофака, после чего окончательный выбор героя очерка пал на Лебедева, чья успеваемость в последнюю сессию почти точно совпадала с этой среднестатистической.

Квотная выборка представляет собою своеобразную микромодель генеральной совокупности, которая создается на основе определенных заданных параметров объекта (чаще всего – социально-демографических), которые берутся из статистических справочников. Приведем пример расчета выборки по таким параметрам квоты как пол и возраст в реальном социологическом исследовании. Обосновывая репрезентативность выборки при опросе избирателей в ходе избирательной кампании по выборам депутатов Городской думы Нижнего Новгорода, мы опирались на данные Облкомстата о половозрастной структуре населения районов города. Так, половозрастная структура населения Советского района выглядела следующим образом (табл.3.2):

                      Таблица 3.2

Половозрастная структура населения Советского района

Всего

мужчины

женщины

Доля в проц.

мужчины женщины
Все население 168912 76220 92692 45,1 54,9

В том числе по возрастам:

до 1 года 1225 630 595 51,4 48,6
 1 - 6 лет 9213 4710 4503 51,1 48,9
 7 - 9 лет 7031 3561 3470 50,6 49,4
 10 - 15 лет 13498 6884 6614 51,0 49,0
 16 - 19 лет 9399 4678 4721 49,8 50,2
 20 - 24 года 11958 6009 5949 50,3 49,7
 25 - 29 лет 11858 6520 5338 55,0 45,0
 30 - 34 года 12093 5861 6232 48,5 51,5
 35 - 39 лет 14360 6795 7565 47,3 52,7
 40 - 44 года 14112 6598 7514 46,8 53,2
 45 - 49 лет 12779 5840 6939 45,7 54,3
 50 - 54 года 7274 3222 4052 44,3 55,7
 55 - 59 лет 11981 5035 6946 42,0 58,0
 60 - 69 лет 17503 6828 10675 39,0 61,0
 70 лет и старше 14628 3049 11579 20,8 79,2

 

Учитывая, что в состав выборки должны были войти избиратели, т.е. лица в возрасте не моложе 18 лет, мы взяли в качестве основы[48][6] выборки ту часть таблицы, где представлено половозрастное распределение населения от 20 лет (разделить предыдущую строку, выделив из нее лиц 18-19 лет, не представлялось возможным). В итоге распределение половозрастной структуры выборки по числу респондентов в каждой из 20 выбранных половозрастных групп (две по полу и 10 по возрасту) выглядело следующим образом (табл.3.3):

                        Таблица 3.3

Половозрастная структура выборочной совокупности

 

Генеральная совокупность

Выборочная

 совокупность

число

доля (в%%)

 

число респондентов

всего муж. жен. муж. жен. всего муж. жен. всего
Основа выборки 128546 55757 72789 43,4 56,6 100,00 521 679 1200

Возраст (лет)

 20 - 24 11958 6009 5949 50,3 49,7 9,30 56 56 112
 25 - 29 11858 6520 5338 55,0 45,0 9,22 61 50 111
 30 - 34 12093 5861 6232 48,5 51,5 9,41 55 58 113
 35 - 39 14360 6795 7565 47,3 52,7 11,17 63 71 134
 40 - 44 14112 6598 7514 46,8 53,2 10,98 62 70 132
 45-- 49 12779 5840 6939 45,7 54,3 9,94 55 65 119
 50 - 54 7274 3222 4052 44,3 55,7 5,66 30 38 68
 55 - 59 11981 5035 6946 42,0 58,0 9,32 47 65 112
 60 - 69 17503 6828 10675 39,0 61,0 13,62 64 100 163
 70 и старше 14628 3049 11579 20,8 79,2 11,38 28 108 137

 

Таким образом, численность каждой из половозрастных групп в трех последних столбцах таблицы оказалась пропорциональной[49][7] численности каждой из соответствующих групп в генеральной совокупности.

Степень репрезентативности квотной выборки повышается прямо пропорционально степени устойчивости значений тех характеристик, по которым задаются квоты, поэтому признаки, изменяющие свои значения слишком быстро, здесь стараются не применять. Иногда у исследователей возникает соблазн увеличить число контролируемых квотных параметров – в надежде, что это повысит степень достоверности получаемых результатов. Однако на практике это ведет к нарастанию систематической ошибки и затрудняет работу интервьюеров.

При гнездовой выборке (которую иногда называют также кластерной[50][8]) определяются группы или “гнезда” элементов и составляются их списки. Затем из этого списка единиц выборки проектируется выборка. Потом только для этих единиц идентифицируются и отбираются элементы. Возьмем, например, составление опросного списка на 1000 человек (размер выборки) для изучения общественного мнения населения города. Поскольку мы не располагаем списком всех жителей города, мы могли бы начать с получения карты города, чтобы определить все его кварталы и составить их список. Этот список кварталов становится остовом выборки, из которого случайным образом или систематически проводится выборка кварталов. Затем будет спроектирована выборка жилых домов из каждого квартала. Затем будет установлена связь с семьями, проживающими в отобранных домах, и в каждой семье кто-то будет проинтервьюирован для опросного листа. Предположим, что на карте города обозначено 500 кварталов, и из них случайным образом отобрано 25. В этих 25 кварталах идентифицированы 4000 семей. Связь будет установлена с четвертью этих семей, потому что требуется выборка из 1000 индивидов. Эти 1000 семей будут уже отобраны случайным или систематическим образом.

Разновидностью целенаправленной выборки является метод снежного кома. Он обычно применяется для отбора экспертов и редко встречающихся групп респондентов (так называемых “редких элементов”) – например потребителей, обладающих очень высокими доходами или представителей элитных групп. По сути, это техника поиска и отбора респондентов с определенным сочетанием свойств в таких условиях, когда трудно очертить границы генеральной совокупности. Особенность метода состоит в том, что, за исключением первого шага, выбор каждого очередного респондента совершается по указанию респондентов, включенных в выборку на предыдущем шаге. Каждый респондент указывает интервьюеру, где можно найти интересующих его людей (и даже сам связывается с ними и рекомендует интервьюера), и выборка с каждым шагом разрастается, подобно снежному кому.

Мы использовали такую выборку при опросе предпринимателей, когда изучали проблемы малого бизнеса в Нижнем Новгороде. Каждому из интервьюеров было поручено опросить вначале одного знакомого предпринимателя и в конце беседы попросить его порекомендовать двух своих знакомых из числа представителей малого бизнеса (и даже позвонить им, попросив встретиться с интервьюером и ответить на его вопросы). Таким образом, после второго шага интервьюер имел уже три заполненных вопросника, после третьего шага – семь, после четвертого – пятнадцать и т.д.

Стихийные выборки формируются произвольно и часто независимо от самого исследователя. Типовыми примерами стихийного отбора могут служить опросы с помощью средств массовой информации, выборка “первого встречного”, опросы покупателей в залах супермаркетов, пассажиров на остановках и в общественном транспорте и т.д. Одна из особенностей стихийной выборки состоит в том, что мы чаще всего не можем заранее предсказать ее размеров (как, например, при опросах с помощью СМИ – достаточно вспомнить опросы интерактивного телевидения).

Для отбора респондентов (участников дискуссии) в состав фокус-групп также используются методы невероятностной выборки. Это диктуется, прежде всего, требованием однородности группы по такому признаку, как наличие практического опыта. В состав группы отбираются, главным образом, люди, в той или иной степени имевшие дело с обсуждаемой проблемой – участие в общественном движении или мероприятии, приобретение определенного товара или просмотр конкретной телевизионной программы. Понятно, что те, кто таким опытом не обладает, имеют значительно меньший (чаще всего нулевой) шанс попасть в состав фокус-группы. Как правило, при этом применяется также квотная выборка, поскольку желательно, чтобы состав фокус-группы, в соответствии с замыслом и целью исследования, в определенной степени отражал и социально-демографический состав (по полу, возрасту, социально-профессиональному статусу и т.п.) генеральной совокупности, из которой производится отбор.

 

Многоступенчатая выборка

Отметим, что в реальной практике чаще всего применяется многоступенчатая выборка – построенная с применением процедуры поэтапного отбора объектов опроса. При этом совокупность объектов, отобранных на предыдущем этапе (ступени), становится исходной для отбора на следующем. Промежуточные объекты, составляющие выборочную совокупность на высших ступенях, называют единицами отбора. Соответственно различают единицы отбора первой ступени (первичные единицы), единицы отбора вторичной ступени (вторичные единицы) и т.д. Объекты самой нижней ступени, с которых ведется непосредственный сбор информации, называются единицами наблюдения.

Приведем пример многоступенчатой выборки, которую мы рассчитывали в ходе одного из маркетинговых омнибусных[51][9] исследований проводившихся в ряде крупных регионов России в 1995 г. одним из столичных маркетинговых центров (мы принимали в нем участие в качестве субподрядчика). Для г. Нижнего Новгорода объем выборки был задан в 800 человек. В качестве единиц отбора первой ступени были определены три городских района из восьми с объемом выборки 300 респондентов по каждому. Здесь, как и на следующей ступени, был использован метод типичных представителей. Определив среднюю численность населения одного района[52][10], мы остановили свой выбор на трех из них – Канавинском, Советском и Нижегородском, – численность населения которых в наименьшей степени отклонялась от этого среднего значения. За основу выборки на второй ступени были взяты списки избирателей (поскольку абсолютное большинство из них выступают самостоятельными экономическими агентами рынка в качестве покупателей). Здесь в качестве единиц отбора второй ступени были определены по три избирательных участка. Были опять же рассчитаны средние размеры каждого из участков и отобраны те из них, где численность избирателей в наименьшей степени отклонялась от средней. На третьей ступени за основу выборки принимался список избирателей каждого участка. Было определено, что на каждом участке предстоит опросить по сто человек (ni = 100). На этом последнем этапе для окончательного отбора единиц наблюдения применялся метод систематической выборки. Определив шаг выборки, мы получили списки респондентов с домашними адресами. Поскольку во всех районах имелись электронные версии списков избирателей, вся процедура расчета выборки и формирования состава выборочной совокупности[53][11] заняла менее одного дня.

Отметим, что и в приведенном выше примере опроса избирателей в ходе избирательной кампании фактически использовалась как раз многоступенчатая выборка. На первой ступени была произведена выборка типичного представителя по параметрам численности населения района, а на втором рассчитана территориальная квота – по параметрам численности каждого избирательного округа. На последнем этапе была просчитана систематическая выборка по каждой из первичных единиц отбора (округов).

 

Размеры и ошибка выборки

Для исследовательских целей весьма типично подвергать опросу лишь очень небольшую часть той группы людей (генеральной совокупности), которая представляет интерес для исследователей. Она обычно составляет несколько сотен, иногда тысячу респондентов. Поэтому исходным пунктом расчета выборки становится вопрос об определении размеров выборочной совокупности. Численность выборочной совокупности зависит от двух факторов: (1) стоимости сбора информации и (2) стремления к определенной степени статистической достоверности результатов, которую надеется получить исследователь. Конечно, даже не искушенные в статистике и социологии люди интуитивно понимают, что чем больше размеры выборки, т.е. чем ближе они к размерам генеральной совокупности в целом, тем более надежны и достоверны полученные данные. Однако выше мы уже говорили о практической невозможности сплошных опросов в тех случаях, когда они проводятся на объектах, численность которых превышает десятки, сотни тысяч и даже миллионы человек. Понятно, что стоимость проведения опроса (включающая в себя оплату тиражирования инструментария, труда анкетеров, полевых менеджеров и операторов по компьютерному вводу), в существенной степени определяется той суммой, которую готов выделить заказчик, и слабо зависит от самих исследователей. Что же касается второго фактора, то мы остановимся на нем чуть подробнее.

Итак, чем больше величина выборки, тем меньше возможная систематическая[54][12] ошибка. Хотя необходимо отметить, что при желании увеличить точность вдвое, вам придется увеличить выборку не в два, а в четыре раза. Например, чтобы сделать в два раза более точной оценку данных, полученных путем опроса 400 человек, вам потребуется опросить не 800, а уже 1600 человек. Впрочем, вряд ли любое социологическое исследование испытывает нужду в стопроцентной точности. Если, скажем, пивовару необходимо узнать, какая часть потребителей пива предпочитает именно его марку, а не сорт его конкурента, – 60 процентов или сорок, то на его планы никак не повлияет разница между 57, 60 или 63 процентами.

Ошибка выборки может зависеть не только от ее величины, но и от степени различий между отдельными единицами внутри генеральной совокупности, которую мы исследуем. Например, если нам нужно узнать, какое количество пива потребляется, то мы обнаружим, что внутри нашей генеральной совокупности нормы потребления у различных людей существенно различаются (гетерогенная генеральная совокупность). В другом случае мы будем изучать потребление хлеба и установим, что у разных людей оно различается гораздо менее существенно (гомогенная генеральная совокупность). Чем больше различия (или гетерогенность) внутри генеральной совокупности, тем больше величина возможной ошибки выборки. Собственно, указанная закономерность лишь подтверждает то, что нам подсказывает простой здравый смысл. Таким образом, как справедливо утверждает В. Ядов, “численность (объем) выборки зависит от уровня однородности или разнородности изучаемых объектов. Чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы”[55][13].

Определение объема выборки зависит также от уровня доверительного интервала допустимой статистической ошибки. Здесь имеются в виду так называемые систематические ошибки, которые связаны с природой любых статистических погрешностей. В.И. Паниотто приводит следующие расчеты репрезентативной выборки с допущением 5-процентной ошибки[56][14] (табл.3.4):

                           Таблица 3.4


Дата добавления: 2020-12-22; просмотров: 910; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!