Выборка

Заглянувший

Сообщений: 2 Баллов: 1 Регистрация: 19-01-2009

19-01-2009 15:14:33

Коллеги, хотел бы с вами посоветоваться по поводу расчёта выборки.

Вот у меня есть две генеральные совокупности, из которых нужно сделать выборку, по возможности обеспеченную математическим аппаратом (это причина, по которой я не иду по простому пути и не пользуюсь квотами).

Одна из них - это учителя всех школ города. Вторая - все родители учащихся в городе.

Простая случайная выборка в первом случае в принципе возможна - если постараться, то можно получить все имена, выстроить их в список и случайно выбрать из него. Но с точки зрения последующего опроса это неудобно и дорого - возможно, что ради пары-тройки респондентов придётся побывать в каждой школе. Для второго случая простой случайной выборки я вообще не могу представить - там десятки тысяч людей \ семей будет. Поэтому простая случайная или систематическая отменяются. Стратификация не подоходит по тем же причинам - всё равно нужно будет всю генеральную совокупность представлять.

Предположительно можно взять школу как серию для серийной (она же кластерная) выборки, где признак - численность (как семей, так и учителей). Это удобно и возможно, но при таком раскладе непонятно, сколько школ выбирать в выборку и где основание для этого количества? Если бы их было около тысячи - куда ни шло, я бы их опять же по формуле простой случайной выбрал. Но там и сотни не наберётся, формула тут не помогает, а численно около сотни уже не позволяет применять формулы Стьюдента для малых групп.
В рабочей книге социолога примеры чуть ли не берут с потолка (во всяком случае нет обоснования), а все остальные справочники беззастенчиво списаны опять же из рабочей книги. Вот, например, яндекс-словарь: "тем или иным способом извлекаются кластеры". Каким - тем или иным? Можно ли будет потом посчитать и указать ошибку для этого "того или иного"?

Ещё я могу воспользоваться многоступенчатой выборкой - но тут та же самая проблема: сколько школ отбирать на первой ступени, как потом посчитать ошибку? Да и после того, как будет отобрано несколько школ, на второй ступени опять потребуется случайный отбор - если с учителями ещё кое-как можно будет разобраться, то семьи учащихся так просто в список не упорядочишь. Возможно, уместнее на втором этапе будет как раз перейти к стратификации и сделать какие-нибудь очевидные группы, например по доходам?

Может быть у кого-нибудь были похожие ситуации, например, с фирмами или крупными предприятиями? Поделитесь опытом, ежели не трудно.

E-mail

Славочка Фомин

Заглянувший

Сообщений: 5 Баллов: 2 Регистрация: 28-08-2007

19-01-2009 16:52:23

Цитата
Вот у меня есть две генеральные совокупности, из которых нужно сделать выборку, по возможности обеспеченную математическим аппаратом (это причина, по которой я не иду по простому пути и не пользуюсь квотами).

Не совсем понятна причина отказа формирования выборки по квотам, скажем, по районам города, либо по другим параметрам. Если надо математическое обоснование, то проведите наблюдение и оцените каждую из школ по интересующим вас исходным признакам (примерная численность учеников, тот же фактор района и т.д.) и проведите кластерный анализ, который разделит все школы на несколько кластеров, из которых составьте вероятностную выборку.
Кластеризация данных - это прием, который не относится к статистическим, так что понятие "ошибка" здесь не используется.
:to_keep_order:

I won't take part in the businessman illusion, I'll take my chance in the real world confusion.

E-mail

Sitry

Заглянувший

Сообщений: 2 Баллов: 1 Регистрация: 19-01-2009

19-01-2009 18:13:32

Цитата

Славочка Фомин пишет:
Не совсем понятна причина отказа формирования выборки по квотам, скажем, по районам города, либо по другим параметрам. Если надо математическое обоснование, то проведите наблюдение и оцените каждую из школ по интересующим вас исходным признакам (примерная численность учеников, тот же фактор района и т.д.) и проведите кластерный анализ, который разделит все школы на несколько кластеров, из которых составьте вероятностную выборку. Кластеризация данных - это прием, который не относится к статистическим, так что понятие "ошибка" здесь не используется.

Кластерная выборка и кластеризация это разные вещи.

Поэтому я предпочитаю пользоваться термином "серийная", чтобы не путаться.

Элементы выборки уже есть - это около сотни школ. Но из сотни элементов по формулам вероятностной выборки придётся брать 50-60 школ, что нереально.

Пытаюсь спросить, каким образом выбрать меньшее число.

E-mail

Славочка Фомин

Заглянувший

Сообщений: 5 Баллов: 2 Регистрация: 28-08-2007

19-01-2009 20:16:33

Все, понял вопрос. Проверил, что ситуация не очень. :umnik:

К сожалению, все известные мне формулы в этой ситуации будут иметь малый знаменатель, потому что размер генеральной совокупности мал, поэтому объем выборки будет такой большой.

Мое решение:
Если проблема в том, что слишком большие различия признака между элементами выборки, то нужно задуматься о проведении фокус-группы или холл-теста, на мой взгляд.
Если такой проблемы нет, то проводится кластеризация и определяется вероятностная или детерминированная выборка внутри каждого кластера.

Надеюсь, что хоть чем-нибудь помог

Изменено: Славочка Фомин - 19-01-2009 20:17:05

I won't take part in the businessman illusion, I'll take my chance in the real world confusion.

E-mail

Гость Гость	#5 20-01-2009 16:55:35 Черчилль "Маркетинговые исследования" страница 453, пункт "объем ГС и объем выборки", дана поправка на малые ГС, получится как минимум в 2 раза меньше еще есть Малхотра в эл виде, могу прислать

Логин:
Пароль:
	Запомнить меня на этом компьютере

Забыли свой пароль?
Регистрация

Вход