Выборка - ceecis.org

advertisement
ВЫБОРКА
Исследования редко охватывают целиком все население. В большинстве случаев при сборе данных,
независимо от методики, проводится выборка из конкретной группы людей, причем таким образом,
чтобы полученная подгруппа была репрезентативной для большой группы. В конечном итоге размеры
и характер выборки определяются в зависимости от затрат, точности (в том числе и того, насколько
точной должна быть информация, чтобы удовлетворить заинтересованные стороны мониторинга и
оценки), природы вопросов для исследования и пределов возможного.
ОСНОВНЫЕ ЭЛЕМЕНТЫ ПРОЦЕДУР ПРОЕКТИРОВАНИЯ ВЫБОРКИ
Нужна ли выборка?
Определите
совокупность
Определите изучаемую совокупность.
Определите, требуется ли контрольная группа.
Определите выборку
Метод
Размер и
состав
Определите, нужно ли и возможно ли собрать данные из всех
источников, или необходимо делать выборку.
Выбор методов выборки и ее размера зависит от следующих факторов:
 того, как и кем будут использоваться результаты мониторинга и оценки,
и особенно требований пользователей относительно вида и уровня
точности и сроков предоставления результатов;
 используемых методов сбора данных – качественных или
количественных;
 наличия персонала, его численности и навыков;
 ограничений по ресурсам и времени – логистика, возможность доступа
(сезон, вопросы безопасности).
Решите, какую выборку будете использовать: вероятностную или нет.
Определите структуру выборки.
Составьте план проведения выборки и выберите ее элементы в
зависимости от:
 Требуемой степени точности
 Степени изменчивости исследуемых параметров в общей
совокупности.
КАТЕГОРИИ ВЫБОРКИ:
ВЕРОЯТНОСТНАЯ И НЕВЕРОЯТНОСТНАЯ
Существуют две категории выборки: вероятностная и невероятностная.
Свойства
Примеры
Вероятностные
выборки
При использовании вероятностных
выборок любой член изучаемой
совокупности имеет равный шанс
войти в состав выборки.




Простая случайная
Систематическая
Стратифицированная
Кластерная
Невероятностные
выборки
При использовании этих методов
выборки отдельные элементы
совокупности имеют неравные и
неизвестные шансы попасть в
выборку.



Целевые
Квоты/Максимальные различия
Удобные
Выборка - 1/5
ВЕРОЯТНОСТНЫЕ ВЫБОРКИ
Существует четыре вида вероятностных выборок:
Простая случайная
выборка (ПСВ)
1 2 3 4 5 6
7 8 9 10 11 12
13 14 15 16 17 18
19 20 21 22 23 24
25 26 27 28 29 30
Систематическая
выборка
123
456
789
123
456
789
123
456
789
123
456
789
123
456
789
123
456
789
Стратифицированная
выборка
AA
AA
AA
AA
BBBB
CCCC
CCCC
Кластерная выборка
Каждому жителю присваивается
свой номер.
С помощью калькулятора,
компьютера или таблиц
случайных чисел выбирают
случайные числа.
Имена всех людей пишут на
бумажках и затем выбирают по
принципу лотереи.
Выбор одного человека всегда
независим от выбора другого.

Составляют список людей (или
домохозяйств).
Список делят на n равных частей
(n – это размер выборки). В
каждой части людям дают
порядковые номера, начиная с
первого.
Методом ПСВ выбирают один
порядковый номер.
Затем из каждой части выбирают
людей под этим номером
(например, если выпал номер
шесть, выбирают шестые номера
из всех частей).

Список людей можно составлять по
определенным принципам (например,
объединяя их по национальной
принадлежности), и тогда можно
гарантировать, что в выборку попадут
представители всех стран.
Разделите совокупность людей
на однородные подгруппы.
Сделайте выборку в каждой
подгруппе.
(Если размер выборки в каждой
подгруппе будет пропорционален
размеру этой подгруппы, позже
не придется определять
удельный вес каждой выборки.)

Обеспечивает представительность даже
при небольшом размере выборки, если
совокупность достаточно велика.
Обеспечивает представительность, если
население очень неоднородно, и простая
выборка может пропустить некоторые
группы.
Эффективна с точки зрения затрат и
экономит время.
Население делят на различные
группы (например, по странам,
провинциям или сообществам).
В некоторых случаях из общего
числа групп выбирают несколько,
иногда случайным образом.
Затем из отобранных групп
выбирают несколько кластеров
(участков).
Все домохозяйства или люди,
которые оказались внутри
выбранных кластеров, образуют
выборку.






Для данного вида выборки разработано
множество статистических тестов.
Оценщикам нужен полный список всех лиц,
которые составляют изучаемую
совокупность.
Применяется при наличии бюджетных
ограничений, недостатке времени, а также
если многочисленное население занимает
обширную территорию, исполнителей
опроса мало, и проще разделить
население на разнородные группы.
Практически все опросы, в проведении
которых участвует ЮНИСЕФ, используют
ту или иную форму кластерной выборки.
Применяется при крупномасштабных
опросах, которые измеряют глобальные
индикаторы (МИКО), когда полных списков
домохозяйств или людей нет, а составлять
их слишком дорого.
Применяется, когда невозможно провести
случайную выборку домохозяйств или
людей по причинам логистики, так как
придется преодолевать значительные
расстояния.
Эти четыре вида выборки можно скомбинировать и провести многостадийную выборку:
 Сначала население делят на различные группы или сектора, используя готовые критерии, и
делают в них выборки.
Выборка - 2/5
 Затем полученные выборки рассматривают как самостоятельные совокупности и делят по
определенным критериям, чтобы получить необходимую выборку.
 На различных этапах этого процесса можно использовать один или несколько методов выборки.
НЕВЕРОЯТНОСТНЫЕ ВЫБОРКИ
Есть три вида невероятностных выборок:
Целевая выборка
Квоты/
максимальные
различия
Удобная выборка
Суть данного метода выборки в том, что место выбирают с определенной целью,
отсюда название «целевая». Критерии целевой выборки могут определяться в
зависимости от условий (например, пола и возраста, культурной и этнической
принадлежности, материального благосостояния, местоположения) или характера
проекта (например, проектные и непроектные площадки, хорошие и плохие
исполнители, этапы реализации). Например, одни контрольные пункты выбирают,
потому что на данных площадках программа реализовывалась очень хорошо, другие
– потому что они во многом похожи на сообщества, охваченные программой, но в них
программа не проводилась.
Этот метод старается охватить как можно больше возможных вариантов, чтобы
выборка была репрезентативной и без случайного выбора элементов. Например, при
оценке реализации программы можно проводить интервью с представителями всех
заинтересованных сторон, включая сотрудников, благополучателей, доноров,
правительственных чиновников и всех остальных, кого затронула программа.
Этот метод был разработан, чтобы давать ответы на вопросы оценки, когда для этого
нельзя использовать небольшие случайные кластеры. Его задачи отличаются от
задач случайной выборки. Для пилотного тестирования или поиска неизвестных
факторов и явлений допустимо, чтобы выборка состояла из желающих участвовать в
исследовании, хотя такая выборка и является нерепрезентативной. Хотя такая
выборка позволяет быстро провести некоторые виды оценки, она наименее строгая.
Метод удобной выборки включает:

Квазислучайный выбор: раскрутите ручку или бутылку, чтобы выбрать
направление от центра, выберите число, чтобы определить, в какой по счету дом
или к какому по счету человеку вы будете обращаться за интервью (помните о
систематической ошибке, которая возникает, если все время держаться центра
или дороги с твердым покрытием).

Произвольный характер: основан на сиюминутном произвольном выборе
(помните, что подсознательные решения могут приводить к систематической
ошибке).

Привязка к месту: Например, опрашивают людей, которые пришли в учреждение
или на рынок (учитывайте возможные систематические ошибки в представлении
разных половых и возрастных групп).

Выборка по принципу снежного кома: первых интервьюируемых просят назвать
своих знакомых, затем берут интервью у названных людей, и так далее
(учитывайте возможные систематические ошибки, так как отдельные подгруппы,
например, имеющие определенную этническую принадлежность или
проживающие в определенных местах, могут быть представлены
непропорционально).
Выборка - 3/5
ПРЕДУПРЕЖДЕНИЕ СИСТЕМАТИЧЕСКИХ ОШИБОК
ВОЗМОЖНЫЕ РИСКИ ПРИ ПРОВЕДЕНИИ НЕСЛУЧАЙНОЙ ВЫБОРКИ
Важно помнить, что при произвольной выборке данных в них может вкрасться систематическая
ошибка. В таблице приведены примеры систематических ошибок, связанных с местом сбора данных
при проведении неслучайной выборки в ходе ассесмента состояния здоровья детей в условиях
кризиса.
Если опрашивать людей…
На улицах или на рынке
В центрах раздачи питания
В больницах и медицинских
центрах
Возле центра деревни или
лагеря
Только в одном районе
лагеря
Вдоль дорог
Возможная
систематическа
я ошибка
Результаты
могут быть
занижены
Результаты
могут быть как
занижены, так и
завышены
Результаты
могут быть
завышены
Результаты
могут быть
занижены
Результаты
могут быть как
занижены, так и
завышены
Результаты
могут быть
занижены
Потому что…
Маловероятно, что больные дети будут на улице.
Не имея данных об уровне смертности, вы «увидите» только
тех, кто выжил.
Они получают пищу. Возможно другие люди, которым нужна
еда, не получают ее. В некоторых ситуациях в центрах
раздачи питания обслуживают только людей, находящихся в
наиболее бедственном положении.
В больницах находятся люди, состояние здоровья которых
хуже, чем у других.
Здесь могут жить более богатые или могущественные люди.
Люди, имеющие схожий статус (или в одинаковом
физическом состоянии) обычно живут вместе.
Здесь могут жить более богатые или могущественные люди.
(Источник: MSF.)
ПРОВЕРКА ВЫБОРКИ
Выборка представителей из большой
совокупности
 Что могло сделать выборку атипичной для
совокупности в целом?
 Есть ли вероятность, что у одних людей было
меньше шансов попасть в выборку, чем у
других?
 Могли ли в процессе выборки возникнуть
систематические ошибки по прагматическим
причинам, например, из-за ограниченности
средств и времени?
Выборка определенных групп или людей по
качественным характеристикам
 Вошли ли в выборку группы или люди, чьи взгляды и
мнения особенно важны или обычно остаются без
внимания, в первую очередь женщины и самые
бедные?
 Какие группы не вошли в выборку и, соответственно, их
взгляды и мнения остались без внимания, и влияет ли
данное обстоятельство на результаты?
 Включает ли выборка все группы, которые могут иметь
различные мнения или взгляды? Помогает ли выборка
лучше понять связи между различными блоками
анализа (например, людьми и организациями)?
Источник: Roche (1999).
Выборка - 4/5
РАСЧЕТЫ РАЗМЕРА ВЫБОРКИ
РАЗМЕР ВЫБОРКИ ДЛЯ ОПРЕДЕЛЕНИЯ ТЕНДЕНЦИЙ
Расчеты размера выборки для оценки соотношений с заданной точностью могут использоваться для
многих индикаторов, которые обычно представляют интерес для программ, поддерживаемых
ЮНИСЕФ. Довольно часто заинтересованные стороны программы хотят получить оценку временных
тенденций.
Однако рассчитать размер выборки, необходимый для выявления тенденций, довольно сложно. На
этом занятии мы не будет рассматривать эту тему подробно, но приведем три общих полезных
правила:
1. Если две выборки совершенно не связаны (например, в ходе двух опросов использовались
совершенно разные кластеры), и точность оценки составляет плюс-минус пять процентов, то
разница между оценками для каждой выборки, которую можно измерить в таком случае,
составляет семь процентов, то есть в 1,4 раза больше, чем существующая допустимая
погрешность.
2. Если при проведении обоих опросов использовали одни и те же кластеры, точность возрастает, и
можно измерить разницу того же размера (например, в пять процентов), что и допустимая
погрешность. При этом предполагается, что корреляция между оценками по кластерам по двум
опросам составляет 0,5.
3. Если опрашиваются точно те же домохозяйства, что и при наблюдении за контрольными
сообществами, можно точно измерить тенденцию. Однако точность будет меньше, если
происходит значительная миграция из кластеров и в них, или если нет точных данных о том, какие
домохозяйства образуют кластер.
Использование одних и тех же кластеров при повторных опросах имеет свои достоинства и
недостатки, которые каждая страна должна взвесить при планировании повторных опросов. Помимо
сокращения размера выборки такой подход упрощает полевые работы, потому что районы работы
уже были закартированы во время первого опроса. С другой стороны, опрос может давать населению
новые знания или повышать его информированности по вопросам здравоохранения, что может
привести к изменению соответствующего поведения (это явление известно как «Хоторнский
эффект»). Поэтому все последующие опросы на данной территории могут искажать реальную
картину, так как местные сообщества, возможно, перестали быть репрезентативными для страны в
целом. Правда, обычно влияние «Хоторнского эффекта» значительно преувеличивают.
РАЗМЕРЫ ВЫБОРКИ ДЛЯ АНАЛИЗА ПОДГРУПП
При анализе подгрупп индикаторы могут подразделять по половым, социально-экономическим и
прочим принципам. Индикаторы, определенные для отдельной подгруппы, будут менее точными, чем
индикаторы, рассчитанные на основании всей выборки.
Чем меньше размер подгруппы, тем менее точной будет оценка.
Ниже приводятся примеры того, насколько в маленьких подгруппах возрастает допустимая
погрешность. Если для всей выборки допустимая погрешность конкретного индикатора составляет
плюс-минус пять процентов, то:

Допустимая погрешность индикаторов для различных гендерных групп (выборка включает по 50
процентов мальчиков и девочек) составит примерно  6.3 процента.

Допустимая погрешность для подгруппы, которая составляет 20 процентов выборки (например,
определенной социально-экономической группы), составит  8.6 процентов.
Видно, что если допустимая погрешность для всей выборки составляет около пяти процентов, то
можно получить достаточно точные индикаторы по гендерным подгруппам, а также по подгруппам,
которые составляют 20 и более процентов всей выборки.
Выборка - 5/5
Download