ПАРАМЕТРЫ ВЫБОРКИ

advertisement
ПАРАМЕТРЫ ВЫБОРКИ
к.э.н., доцент Золотов Михаил Михайлович
2
ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ POPULATION
• Генеральная совокупность, генеральная выборка (от лат. generis — общий, родовой)(в англ.
терминологии — population) — совокупность всех объектов (единиц), относительно которых
учёный намерен делать выводы при изучении конкретной проблемы.
• Генеральная совокупность состоит из всех объектов, которые имеют качества, свойства,
интересующие исследователя. Иногда генеральная совокупность — это все взрослое
население определённого региона (например, когда изучается отношение потенциальных
избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объекты
исследования. Например, женщины 10-89 лет, использующие крем для рук определённой
марки не реже одного раза в неделю, и имеющие доход не ниже 5 тысяч рублей на одного
члена семьи.
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
3
ВЫБОРКА SAMPLE
• Выборка или выборочная
совокупность — это необходимый
для исследования минимум
результатов (случаев,
испытуемых, объектов, событий,
образцов) отобранных с
помощью определённой
процедуры из генеральной
совокупности.
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
4
РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ
• Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной.
Выборка будет репрезентативной при обследовании большой группы людей, если внутри
этой группы есть представители разных подгрупп, только так можно сделать верные выводы.
• Репрезентати́вность — соответствие характеристик выборки характеристикам популяции или
генеральной совокупности в целом. Репрезентативность определяет, насколько возможно
обобщать результаты исследования с привлечением определённой выборки на всю
генеральную совокупность, из которой она была собрана.
• Также репрезентативность можно определить как свойство выборочной совокупности
представлять параметры генеральной совокупности, значимые с точки зрения задач
исследования.
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
5
ПРИМЕР
• Предположим, совокупность — это все учащиеся школы (600 человек из 20 классов, по 30
человек в каждом классе). Предмет изучения — отношение к курению.
• Выборка, состоящая из 60 учеников старших классов, гораздо хуже представляет
совокупность, чем выборка из тех же 60 человек, в которую войдут по 3 ученика из каждого
класса.
• Главной причиной тому — неравное возрастное распределение в классах. Следовательно, в
первом случае репрезентативность выборки низкая, а во втором случае репрезентативность
высокая (при прочих равных условиях).
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
6
ПАРАМЕТРЫ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ И ВЫБОРКИ
• N – генеральная совокупность, которая подразделяется на страты 𝑁𝑁1 , 𝑁𝑁2 и так далее.
• Страты представляют собой однородные объекты с точки зрения статистических
характеристик (например, население делится на страты по возрастным группам или
социальной принадлежности; предприятия — по отраслям). В этом случае выборки
называются стратифицированными.
• n – объем выборки.
• В основе статистических выводов проведенного исследования лежит распределение
случайной величины Х, наблюдаемые же значения x1, x2, x3, называются реализациями
случайной величины x.
• Распределение случайной величины X в генеральной совокупности носит теоретический,
идеальный характер, а ее выборочный аналог является эмпирическим распределением.
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
7
ВЫБОРКА НЕ ИДЕАЛЬНА
• Для выборки же функцию распределения определить трудно, а иногда невозможно,
поэтому параметры оценивают по эмпирическим данным, а затем их подставляют в
аналитическое выражение, описывающее теоретическое распределение. При этом
предположение (или гипотеза) о виде распределения может быть как статистически верным,
так и ошибочным.
• Но в любом случае восстановленное по выборке эмпирическое распределение лишь грубо
характеризует истинное.
• Важнейшими параметрами распределений являются математическое ожидание 𝝁𝝁 (mean) и
дисперсия 𝝈𝝈𝟐𝟐 (variance) – мера разброса данных.
• Стандартное отклонение (standard deviation), 𝜎𝜎 – степень отклонения данных наблюдений
или множеств от СРЕДНЕГО значения.
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
8
ПРИМЕР ДЛЯ ПОНИМАНИЯ Ч.1
• Вы решили со своими друзьями измерить рост ваших собак (по холке). Математическое
ожидание или среднее значение можно найти по формуле:
• 𝜇𝜇 =
600 + 470 + 170 + 430 + 300
5
= 394
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
9
ПРИМЕР ДЛЯ ПОНИМАНИЯ Ч.2
• Теперь посчитаем отклонение роста каждой собаки от среднего или математического
ожидания, то есть посчитаем дисперсию.
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
10
ПРИМЕР ДЛЯ ПОНИМАНИЯ Ч.3
• Стандартное отклонение это всего лишь квадратный корень из дисперсии.
• 𝜎𝜎 = 21704 = 147,32
• Таким образом, зная стандартное отклонение мы знаем что значит «нормальный рост», и что
является очень высокой и очень маленькой собакой.
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
11
ПОЧЕМУ НУЖНО ДИСПЕРСИЯ ВОЗВЕДЕНА В КВАДРАТ
Если просто сложить цифры, то мы получим 0.
Что не будет показывать на дисперсию.
Поэтому логично взять значения по модулю,
тогда получим 4.
Однако во втором случае при других
значениях дисперсия тоже получается 4,
однако видно, что это не так.
Поэтому необходимо возвести все в квадрат.
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
12
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
13
СУТЬ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ NORMAL DISTRIBUTION
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
14
СТАНДАРТНОЕ ОТКЛОНЕНИЕ STANDARD DEVIATION
Стандартное отклонение – наиболее
распространённый показатель
рассеивания значений случайной
величины относительно её
математического ожидания.
МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ | (С) ЗОЛОТОВ М.М.
Download