Возможные выборки при механическом отборе



№ группы. Респонденты, попавшие в группу.
1. A,E,I.
2. B,F,J.
3. C,G,K.
4. D,H,L.

 

Если посчитать стандартное отклонение для этих четырех выборок и для всех возможных выборок при случайном отборе, то механическая выборка окажется точнее (510 против 786)[8].

Если же отбирать каждого третьего человека, то число возможных выборок окажется равным трем. Они представлены в следующей таблице.

Таблица 6.

Возможные выборки при механическом отборе.

№ группы. Респонденты, попавшие в группу.
1. A,D,G,J.
2. B,E,H,K.
3. C,F,I,L.

 

Здесь механическая выборка оказывается менее точной, чем случайная (1216 против 642).

Механическая выборка может обнаружить систему, что может привести к систематическим ошибкам. Возможности допущения систематической ошибки проиллюстрированы следующими примерами.

Пример:Если неправильно выбрать шаг выборки, то можно получить серьезные искажения полученных результатов. Например, если мы имеем список жителей г. Москвы в алфавитном порядке, то маленький шаг выборки приведет к перебору людей с фамилиями, начинающимися на букву «А» если мы начинаем отбор с начала списка. А если принять во внимание, что среди армян часто встречаются фамилии, начинающиеся на букву «А», то налицо смещение выборки (т.е. число армян в выборке будет завышенным).

Отсюда следует, что шаг выборки нельзя брать произвольно, а надо рассчитывать по указанной выше формуле. В нашем случае это обеспечит пропорциональное попадание в выборку людей с фамилиями, начинающимися на любую букву. Однако даже при правильно рассчитанном шаге выборки нельзя гарантировать невозможность систематической ошибки, т.к. уже в одной процедуре механического отбора заложена система. Это проиллюстрирует следующий пример.

Пример:Например, у нас есть списки всех жителей какого-то города по избирательным участкам. Тогда, делая механическую выборку из каждого списка, мы опять набираем слишком много людей с фамилией на букву «А», т.к. по обыкновению начинаем отбор с начала списка. [2, 169].

Чтобы исправить это обстоятельство, необходимо четко определить начало отбора на каждом избирательном участке. Начало отбора, например, может быть рассчитано по формуле: (к+6)/7, где к-номер избирательного участка (в данном примере от 1 до 700).

Таким образом, по мере роста номера избирательного участка, начало отбора будет сдвигаться «вглубь» списка.

Пример:Допустим, мы имеем город, состоящий из микрорайонов, и у нас есть адреса жителей микрорайонов, причем в списках адреса упорядочены по микрорайонам. Вроде бы ничто не мешает нам сделать механическую выборку.

Однако если предположить, что микрорайоны неоднородны (состоят из центра с элитными квартирами и окраин), объем выборки не очень большой и микрорайоны невелики, то механический отбор может привести к систематической ошибке.

При таких допущениях шаг выборки может «перескакивать» из центрального адреса одного микрорайона в центральный адрес другого, что приведет к тому, что в выборку попадут лишь состоятельные люди (возможен и противоположный вариант).

Из этого следует основной вывод о том, что при отклонении от принципа случайности необходимо четко отслеживать любую возможность возникновения систематической ошибки.

Стратифицированная (районированная) выборка.

Практическая реализация.

При проведении стратифицированного отбора, генеральная совокупность сначала разбивается на группы (страты) по какому-либо признаку. Далее уже в этих выделенных группах проводится случайная или механическая выборка.

Стратифицированная выборка может быть пропорциональной объему группы (в этом случае каждая страта имеет одинаковую долю в выборке) или непропорциональной (в этом случае доля страты в выборке зависит от доли этой страты в генеральной совокупности); также она может проводиться пропорционально колебанию признака в группах[9].

Например, всех представителей генеральной совокупности можно разделить по полу, и затем провести случайный отбор среди мужчин и женщин.

Если мы отберем 50% мужчин и 50% женщин, то это будет пропорциональный отбор. В данном случае мы исходим из того, что мужчин и женщин в генеральной совокупности примерно поровну, а большей точности для нашего исследования не требуется.

Если же мы отберем такой же процент мужчин и женщин, как в генеральной совокупности (например, 49% мужчин и 51% женщин), то это будет непропорциональный отбор.

А если мы знаем, что рассматриваемый нами признак (например, количество выкуриваемых за день сигарет), среди мужчин колеблется несильно, т.е. среди мужчин достаточно мало совсем не курящих и злостных курильщиков, в то время как у женщин наблюдается обратная ситуация, то, чтобы добиться необходимой точности оценки количества выкуриваемых за день сигарет при тех же затратах на проведение опроса, можно опросить меньше мужчин, и за счет этого увеличить число опрашиваемых женщин. Это делается потому, что в данном случае получить оценку количества выкуриваемых за день сигарет у женщин с необходимой точностью является более трудной задачей (из-за сильного колебания признака), чем для мужчин. Этот пример - иллюстрация отбора пропорционально колебанию признака в группах.

Вычисление ошибки выборки.

Формулы для расчета ошибки репрезентативности при пропорциональном стратифицированном отборе даны в таблице 7.

Таблица 7.


Дата добавления: 2018-04-04; просмотров: 130;