Коллеги, хотел бы с вами посоветоваться по поводу расчёта выборки.
Вот у меня есть две генеральные совокупности, из которых нужно сделать выборку, по возможности обеспеченную математическим аппаратом (это причина, по которой я не иду по простому пути и не пользуюсь квотами).
Одна из них - это учителя всех школ города. Вторая - все родители учащихся в городе.
Простая случайная выборка в первом случае в принципе возможна - если постараться, то можно получить все имена, выстроить их в список и случайно выбрать из него. Но с точки зрения последующего опроса это неудобно и дорого - возможно, что ради пары-тройки респондентов придётся побывать в каждой школе. Для второго случая простой случайной выборки я вообще не могу представить - там десятки тысяч людей \ семей будет. Поэтому простая случайная или систематическая отменяются. Стратификация не подоходит по тем же причинам - всё равно нужно будет всю генеральную совокупность представлять.
Предположительно можно взять школу как серию для серийной (она же кластерная) выборки, где признак - численность (как семей, так и учителей). Это удобно и возможно, но при таком раскладе непонятно, сколько школ выбирать в выборку и где основание для этого количества? Если бы их было около тысячи - куда ни шло, я бы их опять же по формуле простой случайной выбрал. Но там и сотни не наберётся, формула тут не помогает, а численно около сотни уже не позволяет применять формулы Стьюдента для малых групп.
В рабочей книге социолога примеры чуть ли не берут с потолка (во всяком случае нет обоснования), а все остальные справочники беззастенчиво списаны опять же из рабочей книги. Вот, например, яндекс-словарь: "тем или иным способом извлекаются кластеры". Каким - тем или иным? Можно ли будет потом посчитать и указать ошибку для этого "того или иного"?
Ещё я могу воспользоваться многоступенчатой выборкой - но тут та же самая проблема: сколько школ отбирать на первой ступени, как потом посчитать ошибку? Да и после того, как будет отобрано несколько школ, на второй ступени опять потребуется случайный отбор - если с учителями ещё кое-как можно будет разобраться, то семьи учащихся так просто в список не упорядочишь. Возможно, уместнее на втором этапе будет как раз перейти к стратификации и сделать какие-нибудь очевидные группы, например по доходам?
Может быть у кого-нибудь были похожие ситуации, например, с фирмами или крупными предприятиями? Поделитесь опытом, ежели не трудно.
Вот у меня есть две генеральные совокупности, из которых нужно сделать выборку, по возможности обеспеченную математическим аппаратом (это причина, по которой я не иду по простому пути и не пользуюсь квотами).
Не совсем понятна причина отказа формирования выборки по квотам, скажем, по районам города, либо по другим параметрам. Если надо математическое обоснование, то проведите наблюдение и оцените каждую из школ по интересующим вас исходным признакам (примерная численность учеников, тот же фактор района и т.д.) и проведите кластерный анализ, который разделит все школы на несколько кластеров, из которых составьте вероятностную выборку.
Кластеризация данных - это прием, который не относится к статистическим, так что понятие "ошибка" здесь не используется.
:to_keep_order:
I won't take part in the businessman illusion, I'll take my chance in the real world confusion.
Славочка Фомин пишет:
Не совсем понятна причина отказа формирования выборки по квотам, скажем, по районам города, либо по другим параметрам. Если надо математическое обоснование, то проведите наблюдение и оцените каждую из школ по интересующим вас исходным признакам (примерная численность учеников, тот же фактор района и т.д.) и проведите кластерный анализ, который разделит все школы на несколько кластеров, из которых составьте вероятностную выборку. Кластеризация данных - это прием, который не относится к статистическим, так что понятие "ошибка" здесь не используется.
Кластерная выборка и кластеризация это разные вещи.
Поэтому я предпочитаю пользоваться термином "серийная", чтобы не путаться.
Элементы выборки уже есть - это около сотни школ. Но из сотни элементов по формулам вероятностной выборки придётся брать 50-60 школ, что нереально.
Пытаюсь спросить, каким образом выбрать меньшее число.
Все, понял вопрос. Проверил, что ситуация не очень. :umnik:
К сожалению, все известные мне формулы в этой ситуации будут иметь малый знаменатель, потому что размер генеральной совокупности мал, поэтому объем выборки будет такой большой.
Мое решение:
Если проблема в том, что слишком большие различия признака между элементами выборки, то нужно задуматься о проведении фокус-группы или холл-теста, на мой взгляд.
Если такой проблемы нет, то проводится кластеризация и определяется вероятностная или детерминированная выборка внутри каждого кластера.
Черчилль "Маркетинговые исследования" страница 453, пункт "объем ГС и объем выборки", дана поправка на малые ГС, получится как минимум в 2 раза меньше
еще есть Малхотра в эл виде, могу прислать
Страницы:1
Читают тему (гостей: 1)
есть новые сообщения
нет новых сообщений
Вход
Или авторизируйтесь через:
Используйте свой аккаунт в социальных сетях, чтобы пользоваться сайтом
Основы интернет-маркетинга от IHSBM
У нас есть крутой вебинар со Стеллой Святской, digital head в MARS, и вы можете получить его абсолютно бесплатно!