Методология
Методы выборки: как получить репрезентативные данные
Понятный разбор основных методов выборки — случайной, стратифицированной, кластерной и квотной — и того, как выбрать подходящий для вашего исследования.
Выборка — это то меньшинство, по которому вы судите о большинстве. Если она построена правильно, опрос 1000 человек расскажет о миллионе. Если нет — даже 10 000 анкет дадут смещённую картину. Разберём, какие методы выборки существуют и когда какой использовать.
Вероятностные и невероятностные выборки
Все методы делятся на две большие группы. В вероятностной выборке у каждого человека есть известный ненулевой шанс попасть в опрос — только такие выборки позволяют корректно переносить выводы на всю совокупность. В невероятностной выборке отбор зависит от доступности или решения интервьюера, и строгие статистические оценки к ней неприменимы.
Простая случайная выборка
Каждый элемент совокупности имеет равные шансы быть отобранным — как при жеребьёвке. Метод прозрачен и даёт несмещённую оценку, но требует полного списка совокупности (основы выборки), которого часто нет.
Стратифицированная выборка
Совокупность сначала делят на однородные группы — страты (например, по региону, полу, возрасту), а затем случайно отбирают внутри каждой. Это гарантирует представленность всех важных групп и повышает точность при том же объёме.
Кластерная выборка
Совокупность делят на естественные группы — кластеры (города, махалли, дома), случайно отбирают часть кластеров и опрашивают всех внутри них. Это дешевле в полевых условиях, но требует большего объёма для той же точности.
Квотная выборка
Интервьюеры набирают респондентов так, чтобы доли по заданным признакам (пол, возраст) совпадали с генеральной совокупностью. Метод быстрый и недорогой, поэтому популярен в маркетинге, но это невероятностный подход — он не защищает от скрытых смещений.
Главный вопрос не «сколько людей опросить», а «как именно их отобрать». Размер выборки влияет на точность, а метод отбора — на саму её корректность.
Частые вопросы
- Сколько респондентов нужно для репрезентативной выборки?
- Для оценки доли в большой совокупности с погрешностью ±3% и уровнем доверия 95% обычно достаточно около 1100 респондентов. Точное число зависит от желаемой погрешности и того, насколько детально вы планируете дробить данные по подгруппам.
- Чем квотная выборка отличается от стратифицированной?
- В стратифицированной отбор внутри групп случайный (вероятностный метод), в квотной интервьюер сам выбирает, кого опросить, лишь бы сошлись квоты (невероятностный метод). Поэтому стратифицированная корректнее статистически.
- Можно ли исправить смещённую выборку взвешиванием?
- Взвешивание частично корректирует известные перекосы (например, по полу и возрасту), но не устраняет смещения по признакам, которые вы не измеряли. Это инструмент донастройки, а не замена правильного отбора.
Об авторе
Методология AISurvey
Методологи AISurvey — о выборках, формулировках вопросов и качестве данных в социальных и маркетинговых исследованиях.
Похожие статьи
Создание первой анкеты в AISurvey: пошаговое руководство
Пошаговое руководство для новичков: от регистрации до сбора первых ответов в поле и выгрузки данных в Excel или Word.
Как спроектировать эффективную анкету: 7 принципов
Семь практических принципов проектирования анкет — от формулировки вопросов до логики переходов, — которые повышают качество данных и снижают отказы респондентов.
Офлайн-сбор данных в поле: лучшие практики
Как организовать надёжный офлайн-сбор данных: подготовка устройств, синхронизация, резервные копии и проверка целостности на каждом этапе.