Руководство по взвешиванию выборки

advertisement
GTSS Global Adult Tobacco Survey (GATS)
Руководство по взвешиванию выборки
Глобальное обследование употребления
табака среди взрослых (GATS)
Руководство по взвешиванию
выборки
Редакция 2.0
Ноябрь 2010 г.
Глобальное обследование употребления
табака среди взрослых (GATS)
Комплексный стандартный протокол
………………………………………………………………………………
Вопросник GATS
Основной вопросник с дополнительными вопросами
Повопросная инструкция
Состав выборки GATS
Руководство по составлению выборки
Руководство по взвешиванию выборки
Проведение выездных работ GATS
Руководство выездного интервьюера
Руководство выездного супервайзера
Руководство по составлению карт и списков
Управление данными GATS
Руководство программиста по программе General Survey System
Инструкции по программированию основного вопросника
План осуществления управления данными
Руководство по обучению управлению данными
Обеспечение качества GATS: руководство и документация
Пакет GATS по анализу и отчетности
Шаблон бюллетеня
Страновой отчет: план табуляции и руководство
Определения показателей
Выпуск и распространение данных GATS
Политика выпуска данных
Распространение данных: руководство по первоначальному выпуску данных
Вопросы по табаку для обследований: комплект ключевых вопросов
из Глобального обследования употребления табака
среди взрослых (GATS)
Рекомендуемая ссылка
Совместная группа Глобального обследования употребления табака среди взрослых. Глобальное
обследование употребления табака среди взрослых (GATS): Руководство по взвешиванию
выборки. Редакция 2.0. Атланта, Джорджия: Центры по контролю и профилактике заболеваний
(CDC), 2010 г..
ii
Благодарность
Сотрудничающие организации по GATS

Центры по контролю и профилактике заболеваний (CDC)

Фонд CDC

Школа общественного здравоохранения Блумберга при Университете Джонса Хопкинса

RTI International

Школа общественного здравоохранения Гиллингса при университете Северной Каролины

Всемирная организация здравоохранения
Финансовая поддержка
Финансовая поддержка оказывается Инициативой Блумберга по сокращению потребления табака,
программой Bloomberg Philanthropies через Фонд CDC.
_______________________________________________________________________________________________________________________
Отказ от ответственности: Мнения, выраженные в данном руководстве, не обязательно отражают мнения сотрудничающих
организаций по GATS.
iii
iv
Содержание
Глава
1.
Страница
Введение .......................................................................................................................................... 1-1
1.1
Обзор Глобального обследования употребления табака среди взрослых ...................... 1-1
1.2
Использование данного руководства ................................................................................... 1-2
2.
Обзор весов выборки GATS......................................................................................................... 2-1
3.
Рекомендуемый подход ................................................................................................................ 3-1
3.1
Базовый вес ............................................................................................................................ 3-2
3.2
Корректировка на неполучение ответов в единице выборки ............................................. 3-5
3.3
Корректировка путем пост-стратификационной калибровки............................................ 3-12
4.
Обеспечение качества весов выборки GATS ........................................................................... 4-1
5.
Библиография................................................................................................................................. 5-1
v
vi
1. Введение
Употребление табака является основной предотвратимой причиной преждевременной
смертности и заболеваемости во всем мире. Примерно 5,4 миллиона человек умирают каждый год
из-за болезней, связанных с табаком - ожидается, что эта цифра увеличится до более восьми
миллионов в год к 2030 году. Если нынешние тенденции сохранятся, употребление табака может
убить миллиард человек к концу этого столетия. Подсчитано, что более чем три четверти из этих
смертей произойдет в странах с низким и средним уровнем дохода. Механизм эффективного и
систематического наблюдения необходим для контроля и борьбы с эпидемией.
Глобальное обследование употребления табака среди взрослых (GATS), компонент
Глобальной системы эпиднадзора за потреблением табака (GTSS), является мировым стандартом
систематического мониторинга употребления табака среди взрослых и отслеживания ключевых
показателей по борьбе против табака. Обследование GATS является национальным
репрезентативным обследованием домашних хозяйств с участием взрослых в возрасте 15 лет и
старше, с помощью стандартного основного вопросника, выборки, процедур сбора и управления
данными, которые были рассмотрены и одобрены
международными экспертами. Обследование GATS
Руководства GATS предоставляют
предназначено для укрепления потенциала стран в области
систематические рекомендации
разработки, осуществления и оценки мер борьбы против
относительно организации и
табака.
проведения обследования.
Чтобы максимально увеличить эффективность
данных, собранных в результате проведения обследования
GATS, было создано несколько руководств. Данные руководства предназначены для того, чтобы
предоставить странам стандартные требования, а также некоторые рекомендации по разработке и
проведению обследования на каждом этапе процесса GATS. Кроме того, они разработаны, чтобы
предложить руководство о том, как каждая страна может адаптировать некоторые элементы
протокола GATS для того, чтобы максимально повысить степень использования данных внутри
страны. Для того чтобы обеспечить согласованность и сопоставимость данных между странами,
настойчиво рекомендуется соблюдать стандартный протокол.
1.1
Обзор Глобального обследования употребления табака среди взрослых
Обследование GATS предназначено для того, чтобы получить оценки по взрослому
населению на национальном и субнациональном уровне в разных странах. Целевая группа
населения включает в себя всех не находящихся в закрытых учреждениях мужчин и женщин в
возрасте 15 лет и старше, которые считают, что эта страна является их обычным местом
проживания. Все члены целевой группы населения будут выбраны из домохозяйств, которые
являются их обычным местом проживания.
Глобальное обследование употребления табака среди взрослых (GATS) 1-1
Редакция 2.0 — ноябрь 2010 г.
Руководство по взвешиванию выборки
Глава 1: Введение
В обследовании GATS используется методология географически сгруппированного
многоэтапного выборочного исследования для определения конкретных домохозяйств, с которыми
будут работать Выездные интервьюеры. Во-первых, страна разделяется на первичные единицы
выборки (PSU), сегменты в этих первичных единицах
выборки, и домашние хозяйства в пределах этих сегментов.
Интервью GATS состоит из двух
Затем производится случайная выборка домохозяйств для
частей: Вопросника для
участия в GATS.
домохозяйства и Индивидуального
Интервью GATS состоит из двух частей: Вопросника
вопросника. Обследование по этим
для домохозяйства и Индивидуального вопросника.
вопросникам будет проводиться с
Обследование по Вопроснику для домохозяйств (бытовой
использованием электронных
скрининг) и Индивидуальному вопроснику (индивидуальное
устройств сбора данных.
интервью) будет проводиться с использованием электронных
устройств сбора данных.
По каждому адресу в выборке, Выездные интервьюеры будут проводить опрос по
Вопроснику для домохозяйства одного взрослого, который в настоящее время проживает в
домохозяйстве. Цели Вопросника для домохозяйства состоят в том, чтобы определить,
соответствует ли выбранное домохозяйство требованиям GATS о правомочности участия, и
составить список или реестр всех, имеющих право на участие в обследовании, членов семьи.
После того, как список имеющих право участвовать в обследовании членов домохозяйства
составлен, один человек будет случайным образом выбран для заполнения Индивидуального
вопросника. В Индивидуальном вопроснике задаются вопросы об общих сведениях; о потреблении
курительного табака; бездымного табака; прекращении употребления; пассивном курении; об
экономике; СМИ и знаниях, отношении и восприятии табака.
1.2
Использование данного руководства
Это руководство предназначено для того, чтобы изложить требования, которым страны
должны следовать при вычислении весовых выборки GATS. В первой главе приводится
справочная информация об обследовании GATS. Последующие главы посвящены ниже
следующему:
•
в Главе 2 определяется вес выборки, указывается, когда в процессе обследования
высчитываются веса, дается обзор обоснования вычислительного процесса и
описывается, как аналитик данных использует информацию о весах.
•
в Главе 3 довольно подробно описывается каждый из этапов рекомендуемого подхода
вычисления весов. Каждый из этих этапов иллюстрируется примером, основанным на
типе респондента, который может встретиться в выборке GATS.
•
в Главе 4 рекомендуется предпринять ряд шагов, чтобы обеспечить получение весов
высокого е качества.
Следует отметить что, хотя в данном руководстве предлагается пошаговый шаблон
вычисления весов обследования, может потребоваться модификация данного вычислительного
шаблона в связи с конкретными условиями стран относительно схемы выборки, нужд анализа и
наличия вспомогательных данных для расчета корректировок. Сотрудничество между
статистиками страны, национальными координаторами CDC и Комитетом по рассмотрению
выборки (SRC) важно для обеспечения качества взвешивания и корректировки выборки.
Глобальное обследование употребления табака среди взрослых (GATS) 1-2
Редакция 2.0 — ноябрь 2010 г.
Руководство по взвешиванию выборки
Глава 1: Введение
2. Обзор весов выборки GATS
Вес выборки представляет собой статистическое измерение, связанное с записью данных
любого респондента обследования в выборках населения, где в полном объеме использовались
методы случайного отбора при произведении выборки. В общих чертах, индивидуальный вес в
выборке обычно представляет собой обратную величину откорректированной вероятности
получения данных от респондента. В большинстве случаев, эта вероятность является просто
изначальной вероятностью респондента быть выбранным исходя из схемы выборки. Эта обратная
вероятность, или базовый вес ( B j ), обычно корректируется для учета непреднамеренного
дисбаланса выборки, возникающего во время процесса проведения обследования1. Может
применяться несколько корректировок веса. Все являются мультипликативными. Если вес не
масштабируется для аналитических целей (например, “калибруется”, чтобы подвести к общей
численности охваченного населения), его значение можно интерпретировать, как количество
членов населения, которое представляет респондент. Могут понадобиться отдельные наборы
весов, когда данные для анализа собираются по разным типам данных или пунктов анализа,
связанных с респондентом. Например, если данные в обследовании домашних хозяйств
собираются по выбранным домохозяйствам и по одному жителю, выбранному случайным образом
в каждом из этих домохозяйств, отдельные наборы весов будут вычисляться для данных по
домохозяйствам и для данных по жителям. Однако, так как в обследовании GATS обрабатываются
только данные уровня индивидуальных респондентов, потребуются весы только индивидуального
уровня.
В то время, как общее статистическое обоснование применения весов для оценки выборок
населения хорошо известно (Horvitz and Thompson, 1952), не существует универсального
протокола их вычисления. Так сложилось отчасти в результате различий выборок по их схеме,
качеству документации о процессах отбора выборки и её комплектации, а также наличия
вспомогательной информации о выборке и населении для выявления и исправления дисбаланса в
выборке, возникающего в результате дифференциального охвата рамками обследования и уровня
неполучения ответов. Таким образом, фактические вычислительные шаги весов выборки могут
отличаться в разных обследованиях. Тем не менее, определенный набор таких шагов,
перечисленных ниже, как правило, применяется при вычислении веса по каждой (т.е. j-ой) записи
данных индивидуального респондента, с окончательным откорректированным весом ( Wj )
значение которого определяется на каждом этапе, как более подробно описано ниже:
1.
Определите базовый вес ( Bj ) чтобы учесть все этапы случайного выбора, в результате
которых получилась данная выборка населения,
2.
( nr )
Откорректируйте на неполучение ответов ( Aj
), чтобы компенсировать дисбаланс выборки,
возникший в результате разной степени успешности в привлечении к участию в выборке,
1
Концепция “дисбаланса” здесь используется просто, чтобы показать, что демографическое представление выборочной
совокупности искажается в некоторой степени факторами, связанными с фазами составления выборки и привлечения к
участию в обследовании. Другими словами, иные репрезентативные выборки, полученные не случайным образом,
несколько менее могут представлять население.
Глобальное обследование употребления табака среди взрослых (GATS) 2-1
Редакция 2.0 — ноябрь 2010 г.
Руководство по взвешиванию выборки
Глава 2: Обзор весов выборки GATS
3.
(cov)
Далее откорректируйте на неполный охват рамками ( Aj
), чтобы откорректировать
дисбаланс, возникший в результате того, что рамки выборки не полностью охватывают
целевое население обследования, и
4.
( cal )
Далее откорректируйте, чтобы калибровать ( Aj
) окончательный набор откорректированных
весов в соответствии с распределением населения по характеристикам, которые тесно
связаны с ключевыми показателями результатов обследования (т.е., поведение в плане
потребления табака в обследовании GATS).
Фактическая последовательность выполняемых шагов при вычислении набора
статистических весов выборки населения является особенно важной, так как веса, вычисляемые
на каждом определенном этапе, зависят от вычисленных результатов каждого предыдущего этапа.
Окончательный вес любого респондента является произведением вычисленных результатов по
данному респонденту по всем шагам в следующей последовательности:
Wj = Bj A(j nr ) A(cov)
A(j cal )
j
(1)
Чтобы понять логику процесса вычисления весов выборки для обследования, где жители
отобранных домохозяйств являются членами целевой группы населения, сначала рассмотрим, что
член населения при обследовании GATS сможет предоставить данные только, если все три из
следующих событий (т.е., F, S, и R) произойдут:
•
Событие F: Домохозяйство данного человека и сам человек включен в список
домохозяйств и членов домохозяйств, который является рамками выборки,
используемыми для выборки GATS;
•
Событие S: Учитывая событие F, домохозяйство данного человека и сам человек
должны быть случайно выбраны для участия в GATS; и
•
Событие R: Учитывая событие S, домохозяйство данного человека и сам человек
должны согласиться, в свою очередь, стать участником GATS и заполнить
соответствующий вопросник.
Вероятность того, что данные человека будут использованы для оценки выборки, является
произведением вероятностей происхождения этих трех событий. Позже мы увидим, что для
завершения шагов (1), (2), и (3) потребуется определить или оценить вероятность событий F, S, и
R. Калибровка выборки (или “пост-стратификация”) служит для контроля, чтобы выборка не
потеряла свою действительность в результате воздействия внешних факторов, не
урегулированных корректировками на неполучение ответов и на охват рамками в Шагах (2) и (3).
Эти факторы могут включать в себя случайные изменения демографического состава выборки по
отношению к переменным, не используемым для определения слоя выборки, а также различные
факторы неполучения ответов и недостаточного охвата, связанные не с теми переменными,
которые определяют корректировочные ячейки, используемые для проведения корректировок в
шагах (2) и (3). Так как делать шаг (3) часто является непрактичным, корректировка на неполный
охват рамками обычно выполняется в рамках проведения калибровки.
Глобальное обследование употребления табака среди взрослых (GATS) 2-2
Редакция 2.0 — ноябрь 2010 г.
Руководство по взвешиванию выборки
Глава 2: Обзор весов выборки GATS
Веса выборки важны для многих ситуаций анализа. Например, они используются при
составлении точечных оценок характеристик населения (например, уровень текущей
распространенности курения), а также при оценке вариантности этих характеристик, хотя другие
особенности схемы выборки (т.е., стратификация, кластерная выборка, выбор без замены) также
важны для определения последней. Таким образом, веса важны для многих вариантов
применения данных, включая описательный анализ и сравнительное тестирование (например, для
существенных различий в уровнях распространенности среди регионов страны). Они также иногда
используются для регрессионного моделирования (например, для выявления предшествующих
факторов курения). Веса, таким образом, часто являются необходимой, но не всегда достаточной
характеристикой схемы выборки для анализа данных обследования. Например, если использовать
только веса, но игнорировать стратификацию и кластерную выборку при оценке вариантности
оценок обследования, сообщаемая вариантность и выводы тестирования гипотез вполне могут
быть неправильными.
Один набор весов подготавливается для каждого набора единиц наблюдения обследования.
В обследованиях часто бывает несколько наборов таких единиц наблюдения. Например, если
согласно плану сбора данных обследования требуется собрать информацию о домохозяйствах
(например, доход, СЭС, расстояние до учреждений, предоставляющих медицинские услуги) и об
отдельных членах этих домохозяйств (например, поведение в плане курения, демография и т.д.),
то отдельный набор весов может понадобиться для каждой единицы наблюдения (т.е. для
домохозяйств и для отдельных людей). Более того, веса могут отличаться по домохозяйствам и
жителям респондентам, если выборка делается в рамках домохозяйства, чтобы выбрать человека,
который предоставит данные индивидуального уровня. Такая разница наблюдалась бы и в GATS,
если бы собирались данные и по домохозяйствам, и по отдельным лицам, так как один
правомочный житель выбирается в каждом участвующем домохозяйстве.
Процесс вычисления весов обычно происходит после сбора данных и как только данные
были обработаны и очищены для аналитика. Они не могут быть получены до завершения
выездных работ, так как они применяются к окончательной выборке респондентов, и их
вычисление зависит от итоговой окончательной информации от сбора данных. Они также должны
быть готовы до начала анализа, так как аналитикам, использующим данные, они понадобятся.
Технические специалисты, участвующие в отборе выборки и помогающие в проведении выездных
работ, обычно лучше всего подготовлены для вычисления весов, в силу их знаний о целевой
группе населения и о том, как составлялась и производилась выборка. По мере необходимости,
центральный персонал GATS может оказывать помощь и поддержку в процессе вычисления весов.
Наконец, для обеспечения качества весов, процесс вычисления весов полностью рассматривается
внешними экспертами, чтобы гарантировать соблюдение соответствующих процедур (см. Раздел
5 руководства GATS Обеспечение качества: руководство и документация).
Глобальное обследование употребления табака среди взрослых (GATS) 2-3
Редакция 2.0 — ноябрь 2010 г.
Руководство по взвешиванию выборки
Глава 2: Обзор весов выборки GATS
Глобальное обследование употребления табака среди взрослых (GATS) 2-4
Редакция 2.0 — ноябрь 2010 г.
Руководство по взвешиванию выборки
Глава 2: Обзор весов выборки GATS
3. Рекомендуемый подход
В этой главе данного руководства довольно подробно изложен трехэтапный подход,
соответствующий основным компонентам, который рекомендуется применять техническим
специалистам внутри стран при вычислении весов их выборки
GATS. Эти этапы или шаги включают в себя следующее:
РЕКОМЕНДАЦИЯ:
вычислите базовый вес каждого респондента выборки,
Следующий трехэтапный подход
откорректируйте базовые веса на дифференциальный
рекомендуется применять для
уровень неполучения ответов в выборке, и откалибруйте
каждой выборки страны GATS:
откорректированные веса в соответствии с известными
(1) вычислите базовый вес каждого
общими данными о населении. Более общее описание
респондента выборки, (2)
каждого из этих шагов можно найти в обзорах Lessler и
откорректируйте базовые веса на
Kalsbeek (1992) и Kalton и Flores-Cervantes (2003). Наш
неполучение ответов, и
подход в описании этих этапов состоит в том, чтобы
(3) откалибруйте
представить реалистичный пример, соответствующий
откорректированные веса в
обследованию GATS для рассмотрения. Рассмотрение
соответствии с известными
каждого из этих трех шагов начинается с перечисления того,
данными о населении
что необходимо для выполнения этого шага, а затем
представлены конкретные формулы, которые рекомендуется
применять для вычисления этого компонента веса, в качестве
части наглядного примера. Альтернативные варианты по некоторым рекомендациям предлагаются
для рассмотрения персоналу GATS в стране, хотя выбор этих альтернатив должен быть
полностью обоснован и сделан в тесном сотрудничестве национальных координаторов стран и
Комитета по рассмотрению выборки (SRC) до их применения.
Описание наглядного примера
Пример, используемый для иллюстрации
НАГЛЯДНЫЙ ПРИМЕР:
вычислительного процесса весов GATS, фокусируется на
Справочная информация о
проблеме определения окончательного откорректированного
вымышленном респонденте GATS
веса в выборке вымышленного индивидуального респондента
(именуемого в дальнейшем, как R) в выборке страны, где
(R)
рандомизация по полу не требовалась. Исходим из того, что
схема выборки, в рамках которой был выбран этот человек,
это стратифицированная трехступенчатая выборка домашних хозяйств с определенной
геополитической зоной в качестве единицы площади переменного размера в качестве первичной
единицы выборки (PSU), примерно равные по размеру области “сегменты”, состоящий примерно
из 200 домохозяйств, в качестве вторичной единицы выборки(SSU), и отдельные домохозяйства,
выбранные в рамках выбранных сегментов. В этом примере мы предполагаем, что не было
никаких пропущенных домохозяйств при создании списка домохозяйств в сегменте респондента R,
и что распределение по полу не было частью процесса выбора респондента R; но на практике эти
вопросы, возможно, придется пересматривать (соответствующие методы решения этих вопросов
представлены ниже в этом руководстве)1. Наконец, мы предполагаем, что респондент R выбран из
1
Дополнительный выбор пропущенных домохозяйств необходим при обнаружении домохозяйств, не включенных в список
рамок выборки путем процедуры пропущенного домохозяйства (например, “полуоткрытый интервал”) и когда количество
таких обнаруженных домохозяйств достаточно велико, чтобы потребовалось проведение случайного дополнительного
выбора домохозяйств, не включенных в список. Распределение по полу должно быть сделано в выборках GATS, когда по
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-1
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
реестра домохозяйства, который был введен в портативный компьютер, который также
использовался для проведения интервью GATS с респондентом R. Другие предполагаемые
детали, касающиеся выбора и получения согласия на участие респондента R, будут упоминаться
при описании каждого шага.
3.1
Базовый вес
Необходимо для выполнения этого вычислительного шага:
•
Хорошо задокументированные вероятности выбора на каждой стадии процесса отбора
выборки, если, предпочтительно, они уже были вычислены.
ИЛИ
•
Специальные знания о том, как вычислить вероятности, соответствующие методам
случайного отбора, примененным на каждом этапе процесса выборки. Этапы выбора
включают в себя: стадии выборки, распределение домохозяйств по полу (при
необходимости), и дополнительный под выбор домашних хозяйств, обнаруженных в
результате процедуры выявления пропущенных домохозяйств, если применимо.
•
Листы выбора и/или компьютерный код выбора программного обеспечения по каждому
этапу процесса произведения выборки, если вероятности выбора должны быть
определены во время вычисления весов.
Вычисление базовых весов на наглядном примере:
Базовый вес респондента в выборке любой вероятности представляет собой просто
единицу, поделенную на общую вероятность выбора респондента в зависимости от проделанных
этапов при выборе респондента. Для вычисления базового веса респондента GATS, таким
образом, потребуется ответ на вопрос: какова была статистическая вероятность того, что при
данной схеме выборки будет выбран данный респондент?
В Руководстве по составлению выборки GATS (Глава 11) описываются следующие
соответствующие компоненты общей вероятности выбора в случае, когда страна следует
рекомендованному поэтапному подходу составления выборки. Индексы α и k (совместно для α ной PSU (первичной единице выборки) и k-ной SSU (вторичной единице выборки), соответственно)
в этом описании совместно соответствующие “области” (сегменту) g, который выбран в результате
двух этапов выборки при выборе респондента R:
pα( 1k )
=
Безусловная вероятность выбора
α -ной PSU (геополитическая единица площади,
где живет R ) и k-ной SSU (сегмент в котором живет R );
pα( 2k )
=
Условная вероятность (при выборе данных PSU и SSU) выбора домохозяйства в
котором живет R;
причинам особенностей культуры страны хотят, чтобы пол интервьюеров совпадал с полом выбранных респондентов, и
будут использоваться группы интервьюеров одного пола, или когда определенная гендерная группа должна быть
представлена большим представительством по статистическим причинам. Каждое выбранное домохозяйство случайным
образом определяется, как “мужское” (только правомочные жители мужчины включаются в реестр выбора респондентов)
или “женское” (только правомочные жители женщины включаются в список).
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-2
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
pα( 3k i)
=
Для вымышленного респондента GATS (R), эта вероятность=1, Однако, требуется
условная вероятность (при данных выборах PSU, SSU, и домохозяйства)
случайного определения домохозяйства респондента R, как “женского”, если
применяется рандомизация по полу;
pα( 4ki)
=
Условная вероятность (при данных выборах PSU, SSU, домохозяйства и
распределения по полу) случайного выбора домохозяйства респондента R, если
его не было в первоначальном списке рамок домохозяйств α k -ного сегмента и
оно было обнаружено в рамках процедуры выявления пропущенных домохозяйств,
в противном случае эта вероятность=1; и
pα( 5ki)j
=
Условная вероятность (при данных выборах PSU, SSU, домохозяйства,
распределения по полу и выбору пропущенного домохозяйства) случайного выбора
респондента R из реестра правомочных жителей домохозяйства респондента R.
Обратите внимание, что каждое из событий выбора, соответствующее этим вероятностям,
должно произойти, чтобы респондент R был выбран в выборку GATS. Тогда безусловная
совместная вероятность выбора R ( α k i j - ного человека) в выборку GATS составляет:
pα kij = pα( 1k ) ⋅ pα( 2k ) ⋅ pα( 3ki) ⋅ pα( 4ki) ⋅ pα( 5kij)
.
(2)
так как вероятность совместных последовательных событий является безусловной вероятностью
первого события в последовательности, помноженного на условные вероятности каждого
последующего события после данных предыдущих событий в последовательности. Таким
образом, объединенный базовый вес респондента R составляет:
Bα k i j =
1
1
= (1 ) ( 2 ) ( 3 ) ( 4 ) ( 5 ) .
pα k i j pα k ⋅ pα k ⋅ pα k i ⋅ pα k i ⋅ pα k i j
(3)
Как видно из уравнения (3), мы должны определить каждый из компонентов безусловной
совместной вероятности выбора респондента R для вычисления базового веса респондента R.
Предполагая, что какая-либо форма выборки без замен с вероятностью выбора пропорциональной
размеру (PPS) используется для выбора PSU (первичных единиц выборки) в рамках первой стадии
слоя выборки, тогда если N i = 2 ,4 6 2 является размером (по количеству домохозяйств согласно
последней переписи) PSU респондента R, I = 2 число выбранных PSU в слое выборки, из которых
было выбрано PSU респондента R, и сумма размеров всех PSU в этом слое составляет
 α Nα = 3 3 8 ,7 5 4 , безусловная вероятность выбора PSU респондента R будет,
pα( 1 ) =
I ⋅ Nα ( 2 ) ⋅ ( 2 ,462 )
=
= 14536
.
x10 −2 .
N
,
338
754
 α
(4)
α
Если SSU (вторичная единица выборки) респондента R является одним из K α = 2 сегментов,
выбранных (без замен) путем простой случайной выборки из S α = 1 2 сегментов PSU (первичной
единицы выборки) респондента R, тогда условная вероятность (при данном выборе PSU) выбора
SSU респондента R составляет,
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-3
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
Kα
2
1
,
=
=
Sα 1 2 6
pk( 1( α) ) =
(5)
и безусловная совместная вероятность выбора PSU и SSU респондента R составляет,

I ⋅ Nα
pα( 1k ) = pα( 1 ) pk( 1( α) ) = 
 N
α
 
α

 ⋅  Kα
 S
  α

. 5 3 6 x1 0 − 2 ) ⋅ ( 1 / 6 ) = 2 .4 2 2 6 x1 0 − 3
 = ( 14

(6)
В Руководстве по составлению выборки GATS описывается два метода выбора
домохозяйств из выбранных сегментов или PSU. Если систематическая выборка используется для
выбора домохозяйств, условная вероятность при выборе каждого домохозяйства составляет 1 K ,
где K представляет собой интервал выбора. Если используется простая случайная выборка для
выбора домохозяйств, эта вероятность представляет собой соотношение размера выборки
домохозяйств в каждом сегменте к общему числу домохозяйств в списке рамок для каждого
сегмента. Если предположить, что H α k = 2 8 домохозяйств выбраны без замены простой
случайной выборкой из Lα k = 2 1 2 перечисленных домашних хозяйств в α k -ном сегменте, в
котором расположено домохозяйство респондента R, тогда условная вероятность выбора
домохозяйства R будет следующей,
pα( 2k ) =
Hα k
28
=
= 01
. 3208 .
212
Lα k
(7)
Поскольку вымышленный респондент находится в стране, где рандомизация по полу не
требовалась, вероятность выбора респондента составляет,
pα( 3ki) = 1
(8)
Отметим, что в общем, когда требуется назначение домохозяйств по полу, и M α k (М) и Fα k
(Ж) соответственно, число H α k = M α k + Fα k , выбранных домохозяйств в α k -ной “зоне” (сегменте)
назначается, как “мужское” и “женское,” тогда для респондентов мужчин,
pα( 3k i) =
Mαk
Hα k
(9)
и для респондентов женщин,
pα( 3k i) =
Fα k
Hα k
(10)
В общем, если респондент был выбран из домохозяйства, которое было обнаружено с
помощью процедуры выявления пропущенных домохозяйств (например, полуоткрытый интервал)
и применяется частота выборки ( ∝ ) при дополнительном выборе домохозяйств путем простой
случайной выборки, тогда вероятность дополнительного выбора для любого (т.е. α ki -ного
выбранного домохозяйства будет,
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-4
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
pα( 4ki) = fα ki .
(11)
Поскольку мы предполагаем, что домохозяйство респондента R было выбрано не в
результате процедуры выявления пропущенных домохозяйств,
pα( 4ki) = 1 .
(12)
Для конкретного случая определения вероятности выбора респондента R в домохозяйстве,
отметим, что респондент был выбран случайным образом среди Rα k i = 4 членов домохозяйства
респондента, которые были включены в реестр домохозяйства. Таким образом, для
домохозяйства,
pα( 5k i)j =
1
1
= = 0 .2 5
Rα ki 4
(13)
Сочетая все вероятности процесса выбора, который привел к выбору респондента R, мы
имеем в итоге то, что безусловная общая вероятность выбора респондента R составляет
pα kij = pα( 1k) ⋅ pα( 2k ) ⋅ pα( 3ki) ⋅ pα( 4ki) ⋅ pα( 5kij) = ( 2.4226 x10 − 3 ) ⋅ ( 013208
.
) ⋅ (1 ) ⋅ (1 ) ⋅ ( 0.25 ) = 7 .9992 x10 − 5 ,
(14)
и базовый вес респондента следующий,
Bα kij =
1
1
=
= 125013081
.
,
pα kij 7 .9992 x10 − 5
(15)
и базовый вес домохозяйства составляет
Bα ki = pα( 5kij) / pα kij = ( 0.25 ) ⋅ (125013081
.
) = 3125.2370
Обратите внимание, что
3.2
∝
обозначается, как
(16)
в последующих разделах руководства.
Корректировка на неполучение ответов в единице выборки
Необходимо для выполнения этого вычислительного шага:
•
Базовый вес каждого респондента GATS.
•
Окончательное расположение относительно привлечения к участию (например, отвечает,
отказ, нет дома, и т.д.) для всех выбранных домохозяйств для использования при
вычислении уровней ответов домохозяйств среди правомочных домохозяйств выборки в
каждом “сегменте” выборки. Это означает, что подсчет количества выбранных,
правомочных для участия в обследовании и участвующих домохозяйств будет необходим
по каждому сегменту выборки. При тех схемах выборки, где домохозяйства выбираются
напрямую в единицах выборки первого этапа, окончательное расположение в каждой
PSU (первичной единице выборки) будет использоваться для корректировки на
неполучение ответов от домохозяйства.
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-5
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
•
Информация об окончательном расположении относительно привлечения к участию, а
также о поле, возрасте и статусе в плане курения (курит в настоящее время или нет) из
реестров домохозяйств по всем выбранным жителям всех участвующих домохозяйств.
Дополнительная имеющаяся информация после выбора PSU такая, как
сельский/городской и регион, может также использоваться для корректировки на
неполучение ответов. Эта вспомогательная информация об отобранной выборке будет
использоваться для вычисления уровня ответов по выбранным переменным подгрупп
взвешивания. Очень важно, чтобы все переменные, используемые для расчетов уровня
ответов, были без пропусков. В том случае, когда статус относительно курения
отсутствует или неизвестен, этому члену реестра должен быть присвоен статус
“некурящего” для корректировки весов индивидуального уровня на неполучения ответов.
Вычисление корректировки на неполучение ответов на наглядном примере:
Смещение оценок на неполучение ответов простых характеристик населения таких, как
среднее, общее количество и доли, основывается исключительно на данных респондентов, и
базовый вес частично определяется путем ковариации на уровне членов населения ( σ π y ) между
склонностью (т.е. вероятностью в стохастическом смысле) j-ного отдельного члена населения
отвечать ( π j ) и измерений обследования ( y j ) относительно того, что в настоящее время
оценивается на основе данных опроса (Lessler and Kalsbeek, 1992)2. Обратите внимание, что мы
временно считаем всех людей членами населения в целом и, таким образом, опускаем знак
домохозяйства (i), членом которого является этот человек.
Для (целевого) населения размера N (предполагается, что это известно) мы можем записать
N
t̂
смещение на неполучения ответов неоткорректированной оценки ( ŷr = r =
N
численности населения
s r y
j j
j
/ pj
j =1
ν
) средней
так как ( Y = t / N ),
Bi as( ˆyr ) =
σπ y
,
π
(17)
где для j-ного члена населения, s j является 0/1показателем события S, p j является общей
{
}
вероятностью выбора (т.е., Pr s j =1 ), r j является 0/1 показателем события R, и π есть среднее
всех склонностей к ответу ( π j ) населения. Корректировка базового веса респондента
обследования на неполучение ответов требует оценки склонности респондента отвечать.
Обратная величина этой оцененной склонности (т.е., 1 деленная на эту цифру) становится
корректировочным коэффициентом на неполучение ответа, который умножается на базовый вес
из предыдущего шага, чтобы получить откорректированный на неполучение ответов вес
респондента.
2
Термин “склонность”, а не “вероятность” используется в связи с уровнем неполучения ответов обследования, так как
предполагаемое стохастическое поведение, а не явная рандомизация определяет результат процесса определения
того, будет член выборки обследования давать ответы или нет.
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-6
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
Точнее, корректировка весов выборки на неполучение ответов требует, чтобы каждое
значение было эмпирически оценено на основании опыта неполучения ответов в выборке.
Мультипликативная индивидуальная корректировка на неполучение ответов является затем
просто обратной величиной оцененной склонности к ответу респондента:
A(j nr ) = πˆ −j 1
(18)
И откорректированный на неполучение ответов вес составляет,
Wj( 2 ) = Bj A(j nr )
(19)
Ключевым вопросом проведения данной корректировки, таким образом, является то, как
оценить склонность отдельных людей к предоставлению ответов. Уровни ответов при
взвешивании подгрупп и прогнозируемые склонности к предоставлению ответов по
соответствующей логистической таблице являются двумя подходами, которые были использованы
для корректировки на неполучение ответов. Так как подход взвешивания подгрупп проще в
реализации, и подход прогнозируемой склонности, как было в общем установлено, не превосходит
его в способности контролировать (не устранять) смещение на неполучение ответов,
рекомендуемым подходом для обследованияr GATS является корректировка с помощью
взвешивания подгрупп.
Оценку склонностей немного сложнее провести в обследовании GATS, так как отказ от
ответа может произойти и на уровне домохозяйства, и на уровне отдельного человека выборки при
получении согласия на участие респондента. Комбинированная склонность к ответу для j-ного
респондента ( π j ) таким образом, имеет два мультипликативных компонента, которые должны
быть оценены отдельно, один для учета склонности домохозяйства респондента отвечать путем
составления реестра членов домохозяйства ( π j
( HH )
) и другой для отражения склонности
респондента отвечать на вопросы интервью GATS, после того, как респондент выбран из реестра
домохозяйства ( π j
( person )
).
Согласно рекомендуемому подходу корректировки на неполучение ответа, каждый
компонент склонности оценивается для j-ного респондента, как уровень ответов членов подгруппы
(т.е., “класса”) выбранных членов выборки с аналогичными характеристиками и тенденциями к
ответу в качестве респондента. Вычисление уровня “ответа” компонента домохозяйства и
компонента индивидуального уровня должны проводиться, следуя рекомендациям по
взвешенному или невзвешенному уровню ответов RR1, как это определено AAPOR (Американской
ассоциацией исследований общественного мнения, 2009) и представлено в Руководстве по
составлению выборки GATS. Взвешенные уровни ответов с использованием базовых весов
являются более предпочтительными по сравнению с невзвешенными уровнями ответов. В
конечном счете, эта прерогатива стран решать, какие уровни использовать. Используя коды
расположения домохозяйств, уровни ответов домохозяйств, вычисляемые отдельно по каждому
сегменту выборки (см. описание ниже) вычисляются, как:
Уровень ответов домохозяйств = [ ]
[ ] [ ] [ ] [ ] [ ] [ ]
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-7
(20)
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
где
1 = Заполнен Вопросник домохозяйства, один человек выбран
2 = Заполнен Вопросник домохозяйства, никто не выбран
3 = Заполнена часть Вопросника домохозяйства, не удалось закончить составление реестра
(неполное интервью)
4 = Вопросник домохозяйства не заполнен, не смогли определить соответствующего
респондента для скрининга
5 = Никого нет дома
6 = Отказ домохозяйства
9 = Другая причина неполучения ответа домохозяйства.
Обратите внимание, что окончательный код расположения домохозяйства 2 исключается и
из числителя, и из знаменателя уровня ответов домохозяйств, так как эти домохозяйства
считаются неправомочными, вне зависимости от того, делается рандомизация по полу или нет.
При приведенном выше вычислении уровня ответов домохозяйств неправомочные
домохозяйства исключены из знаменателя, и это предполагает, что все выбранные домохозяйства
с неизвестной правомочностью (окончательные коды расположения 3, 4, 5, 6, 9) являются
правомочными и имеют право принимать участие в обследовании GATS. Это может привести к
недооценке уровней ответов домохозяйств, если домохозяйства с неизвестной правомочностью в
действительности являются неправомочными. Рекомендуется, чтобы страны оценили эту долю (e)
путем вычисления уровня известной правомочности, который составляет количество известных
правомочных хозяйств (код расположения 1), поделенное на количество известных правомочных
плюс известных неправомочных домохозяйств (код расположения 2):
ehousehold −level =
[1]
[1] + [2]
(21)
Если эта доля для выборки в целом менее 0.90, странам следует откорректировать
компонент домохозяйств с неизвестной правомочностью уровня ответов домохозяйств путем
умножения числа домохозяйств неизвестной правомочности (окончательные коды расположения
3, 4, 5, 6, 9) на коэффициент (e). Следующая формула соответствует вычислению уровня ответов
RR3 согласно AAPOR (2009):
Уровень ответов домохозяйств =
Househould-level response rate =
[1] + e
[1]
[3 + 4 + 5 + 6 + 9 ]
household − level
(22)
( nr , HH )
Соответствующая корректировка взвешивания подгрупп домохозяйств ( Ahi
) будет
вычисляться, как единица, деленная на взвешенный уровень ответов домохозяйств по каждому
сегменту выборки.
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-8
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
Уровень ответов отдельных лиц вычисляется в рамках стратегически сформированных
подгрупп (см. описание ниже) как:
Уровень ответов отдельных лиц =
Person − Level RR =
[11]
[11] + [12] + [14] + [15] + [16] + [17]
(23)
где
11 = Заполненный Индивидуальный вопросник
12 = Неполное интервью
13 = Выбранный человек был позже определен, как неправомочный для участия в GATS
14 = Выбранного респондента нет дома
15 = Отказ выбранного респондента
16 = Выбранный респондент некомпетентен
17 = Другая причина неполучения ответа уровня отдельных лиц.
При приведенном выше вычислении уровня ответов отдельных лиц неправомочные
отдельные лица (окончательный код расположения 13) исключены из знаменателя, и это
предполагает, что все выбранные отдельные лица с неизвестной правомочностью (окончательный
код расположения 14) являются правомочными и имеют право принимать участие в обследовании
GATS. Это может привести к недооценке уровней ответов отдельных лиц, если интервьюеры часто
выбирают респондентов, которые оказываются неправомочными участвовать в обследовании
после начала проведения интервью. Рекомендуется, чтобы страны оценили долю тех
респондентов, которые были выбраны из реестра и действительно имеют право отвечать на
вопросы обследования GATS (e), используя взвешенные частоты кода расположения, как:
e person −level =
[11] + [12] + [15] + [16] + [17]
[11] + [12] + [13] + [15] + [16] + [17]
(24)
Если эта доля для выборки в целом менее 0.90, странам следует откорректировать
компонент отдельных лиц с неизвестной правомочностью уровня ответов отдельных лиц путем
умножения числа отдельных лиц неизвестной правомочности (окончательный код расположения
14) на коэффициент (e). Следующая формула соответствует вычислению уровня ответов RR3
согласно AAPOR (2009):
Уровень ответов отдельных лиц =
Person-level response rate =
[11] + [12] + e
[11]
[14] + [15] + [16 ] + [17]
person − level
( nr , person )
Компонент корректировки уровня отдельных лиц ( Ahj
(25)
) корректировки взвешивания
для j-ного человека в i-ном домохозяйстве будет вычисляться, как единица, деленная на
взвешенный уровень ответов отдельных лиц.
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-9
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
Корректировки, основанные на небольшой подгруппе
или кластеров небольших размеров, могут страдать
значительной изменчивостью и дают слишком большие
значения корректировочных коэффициентов. Поэтому будет
установлена верхняя граница 3.00 для всех вычисляемых
корректировочных коэффициентов взвешивания подгрупп
уровня домохозяйств и отдельных лиц. Значения более 3.00
в любом компоненте корректировочного коэффициента
будет зафиксировано на уровне 3.00.
РЕКОМЕНДАЦИЯ:
Любой компонент корректировочного
коэффициента уровня домохозяйств
или отдельных лиц на неполучение
ответов, который превышает 3.00,
должен быть определен, как равный
3.00.
( nr , HH )
Наконец, соответствующий компонент уровня домохозяйств ( Ahi
( nr , person )
hj
отдельных лиц ( A
) и компонент уровня
) корректировки для j-ного человека в i-ном домохозяйстве должны быть
умножены для получения комбинированного коэффициента корректировки на уровень
( )
неполучения ответа для этого респондента (
).
Выбор характеристик для определения подгрупп (т.е.
“классов” взвешивания) для каждого компонента является
РЕКОМЕНДАЦИЯ:
стратегически важным, так как сокращение отклонения,
Формируйте ячейки подгрупп
связанное с данным подходом, напрямую связано со
взвешивания для компонента уровня
степенью корреляции между уровнем ответов и
отдельных лиц корректировочного
интересующим параметром для этих классов (Kalton, 1983).
коэффициента на неполучение
Взвешиваемые подгруппы в большинстве случаев
ответов по сообщаемому в реестре
определяются путем перекрестной классификации
полу, возрасту и текущему статусу
нескольких категориальных переменных (например,
относительно курения; а также по
классифицированные непрерывные переменные, такие как
регионам, если нужны качественные
возраст, который был разделен на несколько категорий,
региональные оценки.
определенных как возрастные подгруппы). Этими
подгруппами могут быть слои выборки, кластеры выборки,
или подгруппы, определяемые другой известной информацией по всем выбранным членам
выборки. Для выборок GATS, мы рекомендуем, чтобы подгруппы взвешивания для компонента
уровня домохозяйств коэффициента на неполучения ответов определялись набором выбранных
домохозяйств в рамках “сегментов” выборки. Для тех стран, которые выбрали географические
кластеры для прямого перечисления домохозяйств одним этапом, первичные единицы выборки
(PSU) будут подгруппами взвешивания для компонента уровня домохозяйств. Для компоненты
уровня отдельных лиц коэффициента корректировки на неполучение ответов мы рекомендуем,
чтобы подгруппы взвешивания отдельно определялись для каждого региона, по которому
требуются оценки обследования GATS и 8,000 (4000 в зависимости от обстоятельств)
респондентов. Кроме того, для региона комбинация или все следующие переменные подгрупп
взвешивания уровня отдельных лиц должны использоваться для корректировки:
городской/сельский, сообщаемый в реестре возраст (15-24, 25-34, 35-44, 45-54, 55+), пол (мужской,
женский) и текущий статус относительно курения (курящий, некурящий). В случае, если
региональные оценки делаться не будут, подгруппы взвешивания компонента уровня отдельных
лиц могут быть сформированы путем сочетания переменных городской/сельский, пол, возраст и
статус относительно курения.
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-10
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
После того, как подгруппы взвешивания были сформированы по каждому компоненту, две
мультипликативных составляющих корректировочного коэффициента взвешивания подгрупп для
GATS будут вычисляться для респондента R следующим образом. Числителями и знаменателями
в приведенных ниже примерах являются суммы базовых весов. Для компонента уровня
домохозяйств, если все из H α • = 5 6 выбранных домохозяйств в α − th -ной первичной единице
выборки (PSU), в которой расположено домохозяйство респондента R являются правомочными
для участия в обследовании, и сумма базовых весов этих домохозяйств составляет 170,013.3, и
rα( •HH ) = 50 из них согласились принять участие в обследовании (взвешенное общее количество
среди них = 156,261.9), тогда компонент уровня домохозяйств взвешенной корректировки на
неполучение ответа будет вычисляться исходя из опыта взвешенного уровня ответов для выборки
выбранных домохозяйств в PSU или сегменте, в котором расположено домохозяйство
респондента R. Для этого примера, предположим, мы обнаружили, что eуровня домохозяйств
превышает 90%, что позволяет нам использовать приведенную выше формулу 20. Взвешенный
уровень ответов домохозяйств подгруппы взвешивания для респондента R (проживающего в i-ном
домохозяйстве) составляет
(
,
)
(
=
,
)
=∑
(
∝.
)
∑
∝.
=
,
.
,
.
= 0.9191
(26)
Компонент уровня домохозяйств корректировочного коэффициента взвешивания подгрупп
для респондента R (проживающего в i-ном домохозяйстве) тогда будет вычисляться, как
(
,
)
=
(
,
)
=
(
∑ ∝.
)
=
∑ ∝.
.
= 1.088
(27)
где Bhi являются переменными базовых весов для домохозяйств в рамках h-ной подгруппы
взвешивания.
Если менее 90% домохозяйств, предоставляющих информацию о правомочности, были
выявлены, как имеющие право принимать участие в обследовании GATS по всей стране,
компонент домохозяйств неизвестной правомочности умножается на (e) и получаются немного
более высокие уровни ответов и соответственно более низкие корректировки показателей
домохозяйств.
Компонент корректировки уровня домохозяйств (1.088) менее 3.00, так что нет
необходимости ограничивать величину коэффициента корректировки.
Взвешенный уровень ответов уровня отдельных лиц должен быть вычислен с помощью
приведенной выше формулы (23), если коэффициент (e) выбранных лиц, которые имеют право
заполнять вопросник GATS равен 0.90 или более. Если (e) менее 0.90, должна использоваться
формула (25) для вычисления уровня ответов отдельных лиц. Как и в случае компонента
корректировочного коэффициента уровня домохозяйств, компонент корректировки уровня
отдельных лиц для респондента R равен единице, деленной на взвешенный уровень ответов для
подгруппы взвешивания респондента R. Теперь предположим, что респондент R является
городской жительницей, курящей женщиной в регионе X, и она одна из rh = 680 респондентов
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-11
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
(взвешенное количество=119,009,025) среди жителей nh = 771 домохозяйств (взвешенное
значение= 134,935,233) подгруппы взвешивания уровня отдельных лиц, состоящей из жителей
всех выбранных домохозяйств региона X, которые являются городскими жителями, женщинами и
курящими на данный момент. Предположим, кроме того, что взвешенный уровень ответов для
подгруппы взвешивания респондента R составляет
(
,
)
(
=
,
)
∑
=∑
=
,
,
,
,
= 0.8820
(28)
Компонент уровня отдельных лиц корректировочного коэффициента для респондента R ,
таким образом, вычисляется, как
(
,
)
=
(
,
)
=∑
=
∑
= 1.1338
.
(29)
Компонент уровня отдельных лиц корректировочного коэффициента также менее 3.00,
поэтому не требуется ограничивать его значение. Окончательный коэффициент корректировки на
неполучение ответов для респондента R составляет
(
)
=
(
)
=
(
,
)
(
,
)
=
(
,
)
(
,
)
= [1.0880]. [1.1338] = 1.2336
(30)
Взяв величину базового веса и окончательный коэффициент корректировки на неполучение
ответов для респондента R, откорректированный на неполучения ответов вес в выборке
респондента R вычисляется, как
(
3.3
)
=
.
(
)
= [12501.3081]. [1.2336] = 15421.61
(31)
Корректировка путем пост-стратификационной калибровки
Необходимо для выполнения этого вычислительного шага:
•
Численность населения по данным переписи населения, проведенной в период 5 лет до
времени проведения интервью или другого авторитетного источника данных о текущей
численности населения, лиц в возрасте 15 лет и старше в общем, по категориальным
переменным, относящимся к поведению в плане курения, и остающемуся дисбалансу
выборки (например, охват). Возможные переменные калибровки включают в себя пол,
образование, возраст, городской/сельский житель и регион, если имеются в наличии
данные о численности населения регионов, и размеры выборок респондентов достаточно
велики на региональном уровне (рекомендуется 8 000) для получения качественных
региональных оценок.
•
Сопоставимо сформулированные вопросы и категории ответов на вопрос о поле и
образовании респондента в вопроснике GATS.
•
Веса, откорректированные на неполучение ответов (
(
)
) для всех респондентов
выборки
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-12
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
Вычисление пост-стратификационных корректировок с наглядным примером:
В то время, как два типа корректировок на неполучение ответов, которые были только что
описаны, являются эффективными для компенсации дисбаланса выборки, возникающего из-за
переменных, которые используются для определения подгрупп взвешивания и модели
склонностей к ответу, могут существовать и другие важные характеристики выборки, по которым
корректировка не проводилась. Например, могут существовать дополнительные характеристики
отобранной выборки, по которым наблюдаются различные уровни ответов. Также, могут
существовать характеристики населения, по которым имеется различный уровень охвата рамками
обследования, и могут быть различия в размере отобранной выборки по характеристикам,
отличающимся от тех, по которым производилась стратификация процесса отбора выборки.
Обычным решением компенсации этого остающегося дисбаланса является последующая
калибровка выборки, но на этот раз по характеристикам населения из которого эта выборка была
сделана.
Deville and Sarndal (1992) были первыми, кто ввел в обиход термин “калибровка,” в
сочетании со взвешиванием выборки, но подходы ограничения весов существуют уже более 60
лет. В принципе, целью корректировки путем калибровки весов является привести взвешенные
суммы данных выборки в соответствие с аналогичными величинами в целевой группе населения.
Пост-стратификация и балансировка были важными ранними формами калибровки весов, и можно
сказать, являются отдельными способами применения общей схемы калибровки, описанной Deville
and Sarndal (1992). Оба способа используются до сих пор.
Роль калибровки зависит от того, какие другие корректировки, если таковые имеются,
проводятся и оттого, в каком порядке они проводятся. Например, когда порядок проведения всего
трех корректировок состоит в корректировках на неполучение ответов и затем калибровка, тогда
калибровка корректирует любые дисбалансы выборки, которые не были исправлены
корректировкой на неполучение ответов. С другой стороны, если применение коррекции только
путем калибровки является практичным, она становится единственным средством устранения
дисбалансов выборки всех видов.
Окончательный набор весов может быть откалиброван в соответствии с распределением
населения на основе демографических данных из статистически высшего внешнего источника
(например, последней переписи населения или выводов другого современного национального
обследования с оценками численности населения равного или более высокого качества).
Солидные и общепринятые демографические прогнозы могут быть также использованы в качестве
объекта калибровки. В случае, если последняя перепись населения была сделана пять или более
лет назад относительно даты сбора данных GATS, следует обдумать применение других
источников для корректировки данных. Страны, где не имеется или есть только устаревшие
источники для калибровки данных, могут быть не в состоянии выполнить этот корректировочный
шаг. В этом случае необходима консультация национальных координаторов и статистиков из
Комитета по рассмотрению выборки. Этот шаг, по существу, включает в себя корректировку
( nr )
взвешенной выборки (на основе Wj
из выборки GATS) в соответствии с распределением
населения с помощью набора категориальных переменных калибровки одним из двух способов: (1)
путем пост-стратификации (или взвешивания ячеек) по общему или перекрестноклассифицированному распределению населения относительно этих переменных или (2) путем
балансировки (или повторяющегося пропорционального приведения в соответствие ) так, чтобы
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-13
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
поля общего распределения переменных среди населения соответствовали населению. Хотя
различия в окончательных скорректированных весах,
вероятно, будет несколько ниже по сравнению с
РЕКОМЕНДАЦИЯ:
балансировкой, относительно достаточно большие
Формируйте корректировочные
ожидаемые размеры выборок GATS с большей готовностью
ячейки для пост-стратификации по
поддаются пост-стратификации, которая точнее калибрует
сообщенным респондентом данным
выборку соответственно населению и, следовательно,
о поле, возрасте и образовании;
является рекомендуемым подходом калибровки для
также по региону, если необходимы
обследования GATS. Подробные инструкции по
качественные региональные оценки.
использованию пост-стратификации приведены ниже.
Переменная сельское/городское
Статистики страны, заинтересованные в использовании
местожительство должна заменить
процедур балансировки, должны обратиться к координатору
переменную образование при
страны и в Комитет по рассмотрению выборки(SRC) пред
определении ячеек корректировки
тем, как приступить к работе.
при калибровке, когда сравнения по
Как и при проведении других корректировок,
критерию городской-сельский
калибровка является наиболее эффективной, когда
считаются более важными, чем
переменные, используемые для определения контрольных
преимущества калибровки по
распределений, тесно связаны с ключевыми переменными
критерию образования, как
исследования. Хотя лучший набор предикторов часто
предиктору употребления табака.
меняется в зависимости от переменных обследования в
исследованиях, связанных с вопросами здоровья, пол и
образование являются, как правило, хорошими предикторами поведения относительно
употребления табака и, таким образом, являются хорошим вариантом для выборок GATS.
Возраст, сельское/городское местожительство и регион, если размеры выборки достаточны для
получения региональных оценок, также, являются потенциальными переменными для калибровки.
Переменная сельское/городское местожительство должна заменить переменную образование при
определении ячеек корректировки при калибровке, когда сравнения по критерию городскойсельский считаются более важными, чем преимущества калибровки по критерию образования, как
предиктору употребления табака. В конечном счете, окончательный анализируемый вес ( Wj ) для
j -ной записи данных респондента получается из уравнения (1) Wj = Bj Aj
( nr )
A(cov)
A(j cal ) , где
j
(cov)
вычисляется по определенной стратегии калибровки. Обратите внимание, что A j
(
)
= 1 , так как
никаких специальных корректировок не рекомендуется проводить относительно охвата рамками.
Пост-стратификация для калибровки окончательных весов GATS должна осуществляться
следующим образом. Во-первых, должны быть определены корректировочные ячейки путем
перекрестной классификации нескольких категориальных (или сгруппированных) переменных
калибровки, о которых, как правило, известно, что они коррелируют с ключевыми измерениями
употребления табака, которые будут сообщаться по выборкам GATS. Как указывалось ранее,
предикторы переменные, которые мы рекомендуем (как минимум) для калибровки выборки GATS
включают в себя пол респондента (мужчина или женщина) и четыре категории уровня
законченного официального образования респондента. Категории образования должны быть
определены так, чтобы предельное процентное распределение среди категорий было как можно
ближе к равномерному распределению (т.е., приблизительно 25% населения в каждой группе по
данным переписи населения или другого статистически превосходящего внешнего источника).
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-14
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
Возвращаясь к нашему примеру калькуляции весов для вымышленного респондента GATS,
R, который будет отнесен к корректировочной ячейке калибровки, включающей тех в регионе X,
кто также является женщиной и находится в той же категории по уровню образования, как и
респондент R. Если количество членов населения с такими характеристиками на основании
данных последней переписи значится, как Nh =2,724,182 , и взвешенная сумма выборки с такими
характеристиками составляет,
rh
W
( nc )
hj
= 2,919,669.3442 , тогда пост-стратификационная
j =1
(
корректировка (
)
) вычисляется для респондента R и всех других респондентов GATS в
корректировочной ячейке калибровки респондента R , как
(
где
)
=
(
∑
)
=
,
,
,
,
.
= 0.9330,
(32)
N h количество членов населения с такими характеристиками согласно внешнему источнику
H
данных о численности населения, таким образом,
N =  Nh это общее количество населения,
h=1
как указано во внешнем источнике калибровки, и
rh размер выборки респондента в
корректировочной ячейке. Обратите внимание, что
(
)
является одинаковым для всех
респондентов в корректировочной ячейке ‘h’. При проверке набора корректировок (
(
)
) среди
всех корректировочных ячеек в заключении этого шага, вы должны увидеть, что большинство из
них либо немного больше, либо немного меньше 1, где те сегменты населения, которые остались
недостаточно представленными в выборке после корректировки на неполучение ответов, имеют
значения более единицы, и те, которые чрезмерно представлены, имеют значения менее
единицы.
Умножая существующий вес респондента R на корректировочный коэффициент для
(
)
), окончательный откорректированный вес для
корректировочной ячейки респондента R (
респондента R (который добавляется к записи данных респондента R в файле анализа) будет,
=
(
)
.
(
)
= 15421.61 . 0.9339 = 14402.24
(33)
и взвешенная относительная частота распределения выборки и использованием этого
окончательного веса теперь совпадает с соответствующим распределением населения
относительно переменных калибровки; т.е.,
rh
H
rh
 Whj /   Whj = N h / N .
j =1
(34)
h=1 j =1
Это равенство может быть использовано в качестве проверки расчетов по этой корректировке.
Альтернативный подход:
В странах с небольшими размерами выборки респондентов и более непропорциональной
выборкой по регионам, балансировка может быть более практичной альтернативой постстратификации. Балансировка для приведения сумм окончательных откорректированных весов в
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-15
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
соответствие с предельными категориальными общими величинами по набору переменных
калибровки (но не по кросс-класс ячейкам) была впервые предложена Deming и Stephan (1940).
Начиная с того же типа многоходовой конфигурации категориальных переменных калибровки как и
в пост-стратификации, при каждом повторении балансировки задействуются отдельные
категориальные суммы для приведения в соответствие по каждой переменной к равным
соответствующим общим величинам населения данной категории (см. Kalton и Flores-Cervantes,
2003 где приведен пример вычисления в этом случае с двумя калибровочными переменными).
Страны, заинтересованные в использовании балансировки, а не пост-стратификации для
калибровки окончательных весов GATS должны обсудить этот вариант с национальным
координатором своей страны и Комитетом по рассмотрению выборки (SRC).
Глобальное обследование употребления табака среди взрослых (GATS)
Редакция 2.0 — ноябрь 2010 г.
3-16
Руководство по взвешиванию выборки
Глава 3: Рекомендуемый подход
4. Обеспечение качества весов выборки GATS
Чтобы гарантировать, что веса выборки GATS вычисляются последовательно и точно в
каждой стране, у нас есть несколько предложений относительно обеспечения этого в заключение
этого руководства.
Тщательно документируйте отбор выборки и соответствующие вероятности
Важность тщательного документирования процесса отбора на каждом этапе выборки
процесса выборки GATS не может быть переоценена. Поэтому крайне важно, чтобы технический
персонал в каждой стране GATS взял на себя строгие обязательства по ведению данной
документации. Есть несколько способов обеспечения того, чтобы эта документация была полной и
в полном объеме использовалась для вычисления весов. Во-первых, после того, как определен
алгоритм отбора для каждого этапа, сотрудники должны обратиться к авторитетным источникам по
выборке, чтобы найти правильную формулу вычислений для используемой стратегии отбора.
Некоторыми часто используемыми стратегиями отбора для выборок обследований являются
простая случайная выборка, систематическая выборка, последовательная случайная выборка,
ВПР систематическая выборка, ВПР выборка без замен и ВПР выборка с заменами. Источниками
для консультирования могут быть работы Hansen, Hurwitz, и Madow (1953), Kish (1965), Raj (1968),
Cochran (1977), Sukhatme, et al., (1984), и Lohr (1999). Во-вторых, средства для вычисления этих
вероятностей выбора должны быть готовы, чтобы провести правильные вычисления после
осуществления выбора. В практическом смысле это означает, что компьютеризированный выбор
предпочтительней выбору, сделанному вручную, и что компьютерный код для отбора выборки
должен также включать шаги по вычислению и хранению вероятностей выбора в то же самое
время, когда выбираются отдельные члены выборки. Это также означает, что если какие-либо
этапы выборки должны осуществляться вручную, формы, используемые для произведения
выборки, должны обеспечивать то, чтобы вся информация необходимая для расчета вероятности
выбора для этого этапа могла быть получена в тоже время, или позже, если это является более
предпочтительным. В третьих, на технический персонал внутри страны должна быть возложена
общая ответственность, чтобы гарантировать, что вероятности выбора вычисляются правильно,
своевременно, и надлежащим образом сохраняются для использования, когда придет время
расчета весов. В-четвертых, процедуры и формулы, используемые для расчета всех компонентов
весов выборки, должны быть спланированы и достаточно подробно задокументированы заранее
до процесса расчета весов так, чтобы другой компетентный член технического персонала, не
работающий с GATS, мог правильно провести процесс вычисления весов. Этот подготовленный
для страны набор планируемых характеристик вычисления весов GATS должен быть
модифицирован при завершении процесса вычисления весов, чтобы служить в качестве
окончательной документации по весам GATS. И, наконец, документация по процессу взвешивания
должна быть сделана общедоступной для партнеров GATS и Комитета по рассмотрению выборки.
Контролируйте негативный статистический эффект отклонения весов
Kish (1965) показал, что отклонение весов выборки может увеличить вариантность оценок
обследования на коэффициент мультипликативного эффекта (Meff). Например, если
w=12394.0091 есть среднее окончательных откорректированных весов выборки Wj , и
Глобальное обследование употребления табака среди взрослых (GATS) 4-1
Редакция 2.0 — ноябрь 2010 г.
Руководство по взвешиванию выборки
Глава 4: Обеспечение качества
весов выборки GATS
sW2 = (5463.3760 ) есть вариантность этих же самых весов среди членов выборки GATS, частью
2
которой является вымышленный респондент R, тогда
2
Meff w = 1 +
sW2
 5463.3760 
= 1+ 
 = 1.1943
2
w
 12394.0091 
(35)
Некоторыми факторами, способствующими этой вариации, являются особенности схемы
выборки, предназначенные для сокращения вариантности оценок (например, распределение
выборки среди слоев), тогда как другие являются результатом стратегий по контролю смещений в
этих оценках (например, корректировки на неполучение ответов и калибровка выборки).
Эффективный контроль этих отклонений требует определения четкого пути между сокращением
негативного эффекта Meff w на точность оценок, в тоже время, сводя к минимуму изменение в
преимуществах сокращения смещения корректировки весов.
Рекомендуемым подходом работы над эффектом
отклонения весов для выборок GATS будет состоять в том,
чтобы контролировать Meffw для окончательных
откорректированных весов ( Wj ), и консультироваться с
центральным персоналом GATS, если Meff w > 2.00 . Эти
РЕКОМЕНДАЦИЯ:
Контролируйте эффект отклонения
весов путем мониторинга его
мультипликативного эффекта на
вариантность оценок обследования;
консультируйтесь со специалистами
GATS по мере необходимости
консультации могут привести к использованию различных
существующих стратегий (например, отсечение весов) для
ограничения размера корректировки весов или
использование различных стратегий “обрезки” веса.
Например, Kalton и Flores-Cervantes (2003) описывают процесс дальнейшего уменьшения
корректировочных ячеек, чтобы ограничить размер корректировок, производимых окончательным
набором ячеек. Этот превентивный подход может быть использован для контроля за размером
корректировок на неполучение ответов, но может также применяться для ограничения размеров
корректировок калибровки в качестве золотой середины между пост-стратификацией и
балансировкой (см. Deville и Sarndal, 1992). Potter (1988; 1990; 1993), с другой стороны,
рассматривает несколько подходов обрезки, при которых создается несколько наборов
обрезанных весов на основе различных уровней обрезки, и затем выбирается набор обрезанных
весов с минимальной оценочной среднеквадратичной ошибкой для ключевых оценок
обследования. Недостатком является то, что обрезанные веса, которые дают минимальную
оценочную среднеквадратичную ошибку для одной оценки обследования, могут не давать такого
же результата для другой оценки.
Тщательно следуйте вычислительным процедурам и проверкам качества,
рекомендованным в данном руководстве
Целью данного пособия является предоставление руководства в разработке стратегии
вычисления весов в каждой выборке GATS и обеспечение того, что данная стратегия может быть
успешно выполнена так, чтобы аналитики данных GATS могли быть уверены, что веса, которые
они используют, будут способствовать получению наилучших оценок употребления табака
населением. Чтобы помочь достигнуть этой цели, мы предоставили набор конкретных процедур,
следуя которым можно получить веса выборки для данных GATS, которые отвечают самым
Глобальное обследование употребления табака среди взрослых (GATS) 4-2
Редакция 2.0 — ноябрь 2010 г.
Руководство по взвешиванию выборки
Глава 4: Обеспечение качества
весов выборки GATS
высоким стандартам в области научных исследований, и если все страны GATS будут им
одинаково тщательно следовать, это будет способствовать проведению качественных сравнений
выводов обследований разных стран. При описании вычислительных шагов для получения весов,
мы также предложили или подразумевали пути обеспечения качества весов выборки. Они состоят
в следующем:
a.
Попросите кого-нибудь, кто не участвует в вычислении весов GATS, но знаком с
содержанием рекомендованного протокола, изложенного в данном руководстве,
проверить работу тех, кто производит веса в процессе вычислений. Такая проверка
лучше всего может быть сделана после завершения каждого шага (т.е. вычисление
базовых весов, вычисление корректировки на неполучение ответов и вычисление
корректировки калибровки), а не один раз по окончании всего процесса.
b.
Определите, является ли средний размер базовых весов ( B j ), поделенный на средний
( )
размер весов откорректированных на неполучение ответов (
) приблизительно
равным окончательному общему уровню ответовl RR1, как описано в Разделе 3.2 этого
руководства.
c.
Используйте уравнение (34), чтобы подтвердить, что взвешенное распределение с
использованием окончательных откалиброванных весов ( Wj ) соответствует (по каждой
корректировочной ячейке калибровкиl) распределению населения, относительно которого
производилась калибровка весов.
d.
Обратите внимание, что сумма окончательных откорректированных весов ( Wj ) всей
выборки должна совпадать по размеру с общей численностью населения (людей в
возрасте 15 лет и старше) указанной в источнике, использованном для калибровки. Если
таким источником была последняя перепись населения, тогда сумма весов должна
совпадать с численностью населения по последней переписи.
e.
Подтвердите, что корректировки после стратификации (
), производимые по набору
корректировочных ячеек, в основном, немного больше или меньше 1.
(
)
Подготовьте подробный письменный документ, описывающий процесс вычисления весов,
который проводился в действительности
Как и в большинстве видов деятельности обследования, которые планируются, а затем
выполняются, изложенный план (т.е., по существу содержание этого руководства, если
выполняется рекомендуемый процесс вычисления весов)
часто несколько отличается от того, что выполняется на
РЕКОМЕНДАЦИЯ:
самом деле. Отход от запланированных характеристик
Следуйте рекомендованным шагам
может произойти при производстве весов на каждом из трех
шагов вычисления весов. Например, если используется
по взвешиванию и выполняйте
другой авторитетный метод выбора респондента
предлагаемые проверки во время
обследования в рамках домохозяйства, тогда вычисление
вычислений
условной вероятности выбора респондента из участвующего
в GATS домохозяйства будет вычисляться в соответствии с
этим другим методом. Во избежание потери детальной информации об этой важной деятельности,
происходящей до анализа GATS, подробное письменное документирование реального процесса
взвешивания, в основном, изложенное в соответствии с планом этого руководства, должно быть
Глобальное обследование употребления табака среди взрослых (GATS) 4-3
Редакция 2.0 — ноябрь 2010 г.
Руководство по взвешиванию выборки
Глава 4: Обеспечение качества
весов выборки GATS
завершено сразу после расчета весов, а затем этот документ должен стать неотъемлемой частью
документации для всех видов деятельности обследования GATS. Этот документ будет
использоваться для проведения официальной оценки процесса взвешивания и калибровки био
статистиками Комитета по рассмотрению выборки SRU и, в конечном итоге, будет включен в
окончательный страновой отчет каждой страны в качестве свидетельства о методах,
использованных при проведении обследования GATS. Более подробную информацию о формате
и конкретных вычислениях, необходимых для рассмотрения см. пособие GATS Обеспечение
качества: руководство и документация. Публичный выпуск взвешенных выводов данных
страны не должен происходить до того, как документация рассмотрена и официально
сертифицирована, как соответствующая стандартам качества определения весов, как указано в
данном руководстве.
Консультируйтесь с персоналом центрального офиса GATS по вопросам, возникающим в
ходе процесса взвешивания
Наконец, сотрудники центрального офиса GATS готовы
оказывать поддержку процессу расчета весов выборки в каждой
стране GATS. Эта поддержка будет включать в себя
разъяснение процессуальных методов, изложенных в данном
руководстве, а также помощь в устранении ошибок при
непредвиденных процессах при выполнении этих важных задач
обследования.
Глобальное обследование употребления табака среди взрослых (GATS) 4-4
Редакция 2.0 — ноябрь 2010 г.
РЕКОМЕНДАЦИЯ:
Подготовьте письменный документ,
в котором дается детальная
информация о том, как были
рассчитаны веса для страны GATS
Руководство по взвешиванию выборки
Глава 4: Обеспечение качества
весов выборки GATS
5. Библиография
American Association for Public Opinion Research. 2009. Standard Definitions: Final Dispositions of Case Codes and
Outcome Rates for Surveys. 6th edition. AAPOR.
Berry, C. C., Flatt, S. W., and Pierce, J. P. (1996). Correcting Unit Nonresponse via Response Modeling and Raking in
the California Tobacco Survey. Journal of Official Statistics, 12(4), 349-363.
Cochran, W.G. (1977). Sampling Techniques, 3rd Ed., New York: Wiley and Sons.
Deming, W. E. and Stephan, F. F. (1940). On the Least Squares Adjustment of a Sample Frequency Table When the
Expected Marginal Totals are Known. Annals of Mathematical Statistics, 11(4), 427-444.
Deville, J. C. and Sarndal, C. E. (1992). Calibration Estimators in Survey Sampling. Journal of American Statistics
Association, 87, 376-382.
Global Adult Tobacco Survey Collaborative Group. Global Adult Tobacco Survey (GATS): Sample Design Manual,
Version 2.0. Atlanta, GA: Centers for Disease Control and Prevention, 2010.
Global Adult Tobacco Survey Collaborative Group. Global Adult Tobacco Survey (GATS): Field Interviewer Manual,
Version 2.0. Atlanta, GA: Centers for Disease Control and Prevention, 2010.
Global Adult Tobacco Survey Collaborative Group. Global Adult Tobacco Survey (GATS): Field Supervisor Manual,
Version 2.0. Atlanta, GA: Centers for Disease Control and Prevention, 2010.
Global Adult Tobacco Survey Collaborative Group. Global Adult Tobacco Survey (GATS): Quality Assurance: Guidelines
and Documentation, Version 2.0. Atlanta, GA: Centers for Disease Control and Prevention, 2010.
Hansen, M.H., Hurwitz, W.N., and Madow, W.G. (1953). Sample Survey Methods and Theory, Vols. I and II, 1953.
Horvitz, D. G. and Thompson, D. J. (1952). A generalization of sampling without replacement from a finite universe.
Journal of the American Statistical Association, 47, 663-685.
Iannacchione, V. G., Milne, J. G., and Folsom, R. E. (1991). Response Probability Weight Adjustments Using Logistic
Regression. Proceedings of the Section on Survey Research Methods, American Statistical Association, 637-642.
Kalsbeek, W. D., Morris, C., and Vaughn, B. (2001). Effects of Nonresponse on the Mean Squared Error of Estimates
from a Longitudinal Study. Proceedings of the Section on Survey Research Methods, American Statistical
Association
Kalton, G. (1983). Compensating for Missing Survey Data. Ann Arbor, MI: University of Michigan.
Kalton, G. and Flores-Cervantes, I. (2003). Weighting Methods. Journal of Official Statistics, 19(2), 81-97.
Kish, L. (1965). Survey Sampling, Second Printing, New York: Wiley and Sons.
Lepkowski, J. M., Kalton, G., and Kasprzyk, D. (1989). Weighting Adjustments for Partial Nonresponse in the 1984 SIPP
Panel. Proceedings of the Section on Survey Research Methods, American Statistical Association, 296-301.
Lessler, J. T. and Kalsbeek, W. D. (1992). Nonsampling Error in Surveys. New York: Wiley and Sons.
Lohr, S. (1999). Sampling: Design and Analysis, Pacific Grove: Duxbury Press.
Potter, F. J. (1988). Survey of Procedures to Control Extreme Sampling Weights. Proceedings of the Section on Survey
Research Methods, American Statistical Association, 453-458.
Potter, F. J. (1990). A study of procedures to identify and trim extreme sampling weights. Proceedings of the Section on
Survey Research Methods, American Statistical Association, 225-230.
Potter, F. J. (1993). The Effect of Weight Trimming on Nonlinear Survey Estimates. Proceedings of the Section on
Survey Research Methods, American Statistical Association, 758-763.
Raj, D. (1968). Sampling Theory, New York: McGraw-Hill.
Särndal, C.-E., Swensson, B., and Wretman, J. H. a. (1992). Model assisted survey sampling. New York: SpringerVerlag.
Sukhatme, P. V. et al, (1984). Sampling Theory of Surveys with Applications, Ames: Iowa State University Press.
Глобальное обследование употребления табака среди взрослых (GATS) 5-1
Редакция 2.0 — ноябрь 2010 г.
Руководство по взвешиванию выборки
Глава 5: Библиография
Глобальное обследование употребления табака среди взрослых (GATS) 5-2
Редакция 2.0 — ноябрь 2010 г.
Руководство по взвешиванию выборки
Глава 5: Библиография
GLOBAL TOBACCO SURVEILLANCE SYSTEM (GTSS)
Download