словесная формулировка вопросов:
-
определение предмета вопроса
-
использование однозначных слов
-
использование направляющих и искажающих вопросов
-
устранение скрытых альтернатив
-
устранение скрытых допущений
-
устранение обобщений и приблизит.оценок
порядок расположения вопросов:
-
начальные вопросы-интересные, простые, не должны раздражать
-
сначала идут вопросы по осн.инфо
-
общие вопр.должны предшествовать конкретным
-
задавать вопр.в логической последовательности
-
тщательно разрабатывать разветвления и охватывать все возможные варианты
34. Планирование и проведение выборки.
Генеральной совокупностью, популяцией (population), называется совокупность объектов, которые обладают рядом общих характеристик и охватывают полное, с точки зрения маркетолога, множество объектов.
Параметры генеральной совокупности обычно представляют собой количественные соотношения, например процент потребителей, предпочитающих определенный вид зубной пасты. Информацию о параметрах генеральной совокупности можно получить либо после проведения сплошного наблюдения (переписи) всех объектов, либо на основе выборки.
Перепись, сплошное наблюдение (census)
Полное перечисление объектов генеральной совокупности или объектов исследования.
Выборка (sample)
Подмножество объектов генеральной совокупности, отобранное для участия в обследовании.
Характеристики выборки, называемые статистиками, в дальнейшем используются для составления заключения о параметрах генеральной совокупности.
Процесс планирования отбора единиц совокупности состоит из пяти этапов:
1)Определение изучаемой совокупности Совокупность единиц или объектов, обладающих информацией, которую желает получить исследователь, о которой нужно сделать заключение.
2)и3)Принимая решение относительно использования того или иного выборочного метода, маркетолог должен сделать выбор между байесовым и традиционным подходами к отбору единиц генеральной совокупности, повторной и бесповторной выборками, а также вероятностным и детерминированным выборочными методами.
Байесов подход (Bayesian approach)
Метод отбора единиц совокупности, в соответствии с которым они выбираются последовательно. Согласно байесовому подходу, собирается детальная информация о параметрах совокупности, полученная в результате предыдущих исследований, а также о затратах и возможных последствиях, связанных с принятием неправильных решений.
Повторная выборка (sampling with replacement)
Метод отбора, согласно которому единицу совокупности можно неоднократно включать в выборку.
Бесповторная выборка (sampling without replacement)
Метод отбора, согласно которому единицу совокупности нельзя включать в выборку больше одного раза.
4) Объем выборки (sample size) — это количество единиц совокупности, которые нужно изучить. наиболее значимые качественные факторы, определяющие объем выборки: важность принимаемого решения, характер исследования, количество переменных, характер анализа, объем выборки в аналогичных исследованиях, коэффициент охвата, коэффициент завершенности, а также ограниченность ресурсов.
Как правило, для принятия важных решений необходима детальная, максимально точная информация. Ее получение предусматривает создание больших выборок, но при увеличении объема выборки возрастает и стоимость получения каждой дополнительной единицы информации. О точности можно судить по величине такого показателя, как среднеквадратичное отклонение от среднего значения, которое обратно пропорционально квадратному корню из объема выборки. Чем больше увеличивается размер выборки, тем меньшим будет повышение точности полученных результатов.
5)Проведение процесса отбора
Для успешного проведения отбора единиц совокупности необходимо досконально определить все его аспекты, а именно: генеральную совокупность, основу выборки, единицу отбора, выборочный метод, объем выборки. Если единицами отбора являются семьи (домохозяйства), необходимо сформулировать рабочее понятие семьи.
Выборочные методы делятся на две основные категории — детерминированные и вероятностные
Детерминированный отбор (nonprobability sampling)
Выборочный метод, в котором не применяется процедура случайного отбора единиц генеральной совокупности. Этот метод основан на индивидуальных суждениях исследователя.
Вероятностный отбор (probability sampling)
Метод проведения отбора, в соответствии с которым каждая единица генеральной совокупности имеет определенную вероятность включения в выборку.
35. Детерминированный метод выборки.
Детерминированный отбор (nonprobability sampling)
Выборочный метод, в котором не применяется процедура случайного отбора единиц генеральной совокупности. Этот метод основан на индивидуальных суждениях исследователя.
Следующие детерминированные выборочные методы: нерепрезентативный отбор, экспертный отбор, квотный отбор и отбор методом «снежного кома»
Нерепрезентативный отбор (convenience sampling)
При использовании нерепрезентативного отбора исследователи стремятся создать выборку из удобных для отбора единиц генеральной совокупности. Их отбор для включения в выборку проводится главным образом интервьюером.
Нерепрезентативный отбор наиболее экономный с точки зрения временных и финансовых затрат. Респонденты доступны, готовы сотрудничать и их характеристики легко измерить.
данный метод отбора имеет ряд ограничений. Существует большой риск возникновения различных ошибок выборки.
не подходит для маркетинговых исследований, предусматривающих вычисление параметров для всей генеральной совокупности.
Нерепрезентативным отбором не рекомендуется пользоваться при проведении дескриптивного или причинно-следственного анализа, но его можно применять в поисковых исследованиях, направленных на разработку новых идей, понятий или гипотез.
Экспертный отбор (judgemental sampling)
Разновидность нерепрезентативного отбора, в соответствии с которым единицы совокупности целенаправленно отбираются на основе суждений исследователя.
Типичные примеры использования экспертного отбора:
-
отбор пробных рынков для оценки потенциала нового товара;
-
отбор в ходе промышленных маркетинговых исследований специалистов компаний, отвечающих за приобретение оборудования, поскольку их считают представителями компании;
-
отбор избирательных участков для изучения поведения избирателей;
-
отбор универмагов для тестирования новой системы выкладки товаров.
Квотный отбор (quota sampling)
Детерминированный выборочный метод, который представляет собой двухэтапный ограниченный экспертный отбор. Первый этап включает создание контрольных групп, или квот, из единиц совокупности. На втором этапе для отбора единиц используются нерепрезентативный или экспертный методы отбора.
При использовании метода «снежного кома» (snowball sampling) обычно случайным образом подбирают начальную группу респондентов. После проведения опроса респондентов просят помочь выявить других кандидатов, входящих в изучаемую совокупность. В дальнейшем отбор респондентов осуществляется из группы кандидатов, указанных первыми респондентами. Данный процесс, когда респонденты, прошедшие опрос, называют следующих кандидатов, в конце концов, приводит к эффекту «снежного кома»
Главная задача использования метода «снежного кома» — дать оценку редким для генеральной совокупности характеристикам. Основное преимущество этого метода состоит в том, что он существенно повышает вероятность обнаружения в генеральной совокупности объектов с исследуемой характеристикой. Ему также присущи относительно небольшое значение дисперсии выборки и невысокий уровень затрат.
36. Вероятностный метод выборки.
Вероятностный отбор (probability sampling)
Метод проведения отбора, в соответствии с которым каждая единица генеральной совокупности имеет определенную вероятность включения в выборку.
При использовании вероятностного отбора (probability sampling) состав выборки формируется случайным образом. Вполне реально предварительно определить все возможные выборки конкретного объема, которые можно получить из генеральной совокупности, а также вероятность получения каждой выборки.
Вероятностные выборочные методы отличаются между собой степенью эффективности. Эффективность используемого метода отбора показывает соотношение между затратами, связанными с его проведением, и ее точностью. Точность характеризует уровень неопределенности относительно величины измеряемой характеристикой.
Простой случайный отбор (Simple Random Sampling — SRS)
Вероятностный метод отбора, согласно которому каждая единица генеральной совокупности имеет известную и равную вероятность отбора. Каждая единица выбирается независимо от любой другой, и выборка формируется произвольным отбором единиц совокупности из основы выборки.
Для проведения простого случайного отбора исследователь сначала формирует основу выборки, в которой каждой единице совокупности присваивается уникальный идентификационный номер. Затем генерируются случайные числа, чтобы определить номера тех из них, которые будут включены в выборку. Простой случайный отбор имеет очевидные преимущества. Этот метод крайне прост для понимания. Результаты исследования выборки можно распространять на всю изучаемую совокупность.
Однако метод простого случайного отбора имеет как минимум четыре существенных ограничения. Во-первых, часто сложно создать основу выборки, которая позволила бы его использовать. Во-вторых, его результатом может стать большая выборка, либо выборка, элементы которой разбросаны по большой географической территории, что значительно увеличивает время и стоимость сбора данных. В-третьих, результаты применения простого случайного отбора часто характеризуются низкой точностью и большим значением стандартной ошибки, чем результаты применения других вероятностных методов отбора. В-четвертых, после применения SRS может сформироваться нерепрезентативная выборка. Хотя выборки, полученные простым случайным отбором, в среднем адекватно представляют генеральную совокупность, некоторые из них делают это крайне некорректно. Вероятность этого особенно велика при небольшом объеме выборки. Простой случайный отбор нечасто используется в маркетинговых исследованиях. Более популярен метод систематического отбора.
При проведении систематического отбора (systematic sampling) сначала задают произвольную отправную точку, а затем из основы выборки последовательно выбирают каждую i -ю единицу. Интервал выборки i определяется как отношение объема совокупности N к объему выборки n, с округлением результата до ближайшего целого числа. Например, генеральная совокупность состоит из 100 тысяч элементов, а желательный объем выборки равен тысяче респондентов. В этом случае интервал выборки i равен 100. Выбирается случайное число между 1 и 100. Если, например, это число равно 23, то выборка состоит из таких единиц: 23, 123, 223, 323, 423, 523 и т.д.
Систематический отбор дешевле и проще, чем простой случайный, поскольку случайный отбор единиц совокупности осуществляется только один раз. Кроме того, случайные числа не должны соответствовать определенным единицам выборки, как в SRS. Учитывая, что некоторые перечни содержат миллионы единиц совокупности, использование этого метода значительно экономит время, что, в свою очередь, способствует снижению затрат на маркетинговое исследование. Если единицы генеральной совокупности обладают интересным для нас признаком, то систематический отбор дает возможность получить более репрезентативную и достоверную (с меньшей ошибкой выборки) выборку, чем метод SRS. Еще одно важное преимущество: систематический отбор можно применять, даже не зная структуру основы выборки.
Стратифицированный случайный отбор (stratified sampling)
Двухэтапный метод вероятностного отбора, согласно которому генеральная совокупность сначала делится на подгруппы или страты. Затем единицы совокупности случайным образом выбираются из каждой страты. Переменные, используемые для деления совокупности на страты, называются стратификационными переменными. Критерии для их выбора следующие: однородность, неоднородность, взаимосвязанность и стоимость. Элементы, относящиеся к одной страте, должны быть как можно более однородными, а относящиеся к разным — наоборот, как можно более разнородными. Кроме того, стратификационные переменные должны быть тесно связаны с исследуемой характеристикой.
С помощью кластерного отбора (cluster sampling) изучаемая совокупность сначала делится на взаимоисключающие и взаимодополняющие подгруппы, или кластеры (clusters). Затем с помощью вероятностного выборочного метода, такого как SRS, формируется случайная выборка кластеров. В нее включаются либо все единицы отобранного кластера, либо проводится их отбор вероятностным методом. Если в выборку включаются все единицы каждого отобранного кластера, то такой метод называется одноступенчатым кластерным отбором. Если выборка получена с помощью вероятностного отбора из каждого выбранного кластера, такая процедура называется двухступенчатым кластерным отбором.
существуют два вида двухступенчатого кластерного отбора — простой двухступенчатый кластерный отбор с использованием SRS и вероятностный отбор, пропорциональный объему (PPS). Основное различие между кластерным и стратифицированным отбором состоит в том, что в первом случае используются только отобранные подгруппы (кластеры), в то время как при стратифицированном отборе все подгруппы (страты) используются для дальнейшего отбора. Эти методы преследуют разные цели. Цель кластерного отбора — увеличить эффективность отбора, уменьшив затраты на его проведение
Элементы кластера должны быть максимально разнородны, а сами кластеры — как можно более однородными. В идеале каждый кластер должен представлять собой небольшую модель генеральной совокупности. При кластерном отборе основа выборки необходима только для кластеров, которые вошли в выборку.
37. Определение объемов выборки.
Доверительный интервал (confidence interval) — это диапазон, в который попадет истинное значение параметра совокупности при данном уровне достоверности.
Определение объема выборки методом доверительных интервалов основано на их создании вокруг выборочного среднего или выборочной доли с использованием формулы стандартной ошибки. В качестве примера предположим, что исследователь с помощью простого случайного отбора сформировал выборку из 300 семей для того, чтобы оценить ежемесячные расходы семьи на покупки в универмаге, и определил, что средний ежемесячный расход семьи в выборке равен 182 долл. Предыдущие исследования показали, что среднеквадратичное отклонение расходов в исследуемой совокупности равно 55 долл.
Мы хотим найти интервал, в который попадал бы определенный процент выборочных средних. Предположим, мы хотим определить интервал вокруг среднего значения совокупности, который включал бы 95% выборочных средних, опираясь на выборку из 300 семей; 95% выборочных средних можно разделить на две равные части, половина меньше и половина больше среднего, как показано на рис. 1. Вычисление доверительного интервала включает определение области меньше (XL) и больше (ХU) среднего значения (X) величины расходов.
Рис 1. 95%-ный доверительный интервал
Значения коэффициента z, соответствующие XL и ХU, можно рассчитать следующим образом:
Где
Следовательно, минимальное значение X определяется как
а максимальное значение
Доверительный интервал устанавливается как
Теперь установим 95%-ный доверительный интервал вокруг выборочного среднего, равного 182 долл. Для начала мы вычислим стандартную ошибку среднего:
Центральные 95% нормального распределения находятся в пределах ?1,96 значений коэффициента z; 95%-ный доверительный интервал определяется как
Таким образом, 95%-ный доверительный интервал простирается от 175,77 до 188,23 долл. Вероятность нахождения истинного среднего значения наблюдаемой совокупности в пределах от 175,77 до 188,23 долл. составляет 95%.
|
|
38. Метод доверительных интервалов для генерального среднего.
Доверительные интервалы для среднего:
*Предельная ошибка выборки позволяет определять предельные значения характеристик генеральной совокупности при заданной вероятности, т.е. их доверительные интервалы:
`х - D ≤`Х ≤`х + D Это означает: с заданной вероятностью можно утверждать, что значение генеральной средней можно ожидать в пределах от`х - D до`х + D, т. е. что доверительный интервал (`х - D ;`х + D) с заданной вероятностью заключает в себе генеральную среднюю.
Наряду с абсолютной величиной предельной ошибки выборки рассчитывается и относительная ошибка выборки, которая определяется как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности:
Формулы расчета объема выборки: среднее
Расчет необходимого объема выборки строится с помощью формул, выведенных из формул предельных ошибок выборки (D), соответствующих тому или иному виду и способу отбора.
39. Метод доверительных интервалов для генеральной доли.
Определение объема выборки: доля
При изучении альтернативного признака (доли р) объем необходимой численности выборки определяется по следующей формуле:
На стадии проектировки выборочного наблюдения, если невозможно хотя бы приблизительно определить дисперсию альтернативного признака [w(1 - w)], она
принимается равной своему максимуму (0,25).
40.Базовые методы статистического анализа данных. Предварительная обработка данных. Одномерный и многомерный статистический анализ.
41. Вариационный ряд. Частки. Достоверные частки. Накопленные частки.
42. Показатели центра распределения. Среднее. Мода. Медиана. (Статистики, связанные с распределением частот)
Показатели центра распределения
Показатели центра распределения (measures of location) характеризуют положение центра распределения, вокруг которого концентрируются данные. Если всю выборку изменить, добавив определенную фиксированную величину к каждому наблюдению, то среднее, мода и медиана изменятся на аналогичную величину.
Среднее арифметическое или выборочное среднее (mean) — это наиболее часто используемый показатель, характеризующий положение центра распределения. Он применяется для оценки среднего значения в случае, если данные собраны с использованием интервальной или относительной шкалы. Его величина должна отражать некоторое среднее значение, вокруг которого распределена большая часть ответов. Эта величина получается делением суммы всех имеющихся значений переменной на количество значений.
Мода (mode)
Значение переменной, которое чаще всего встречается в выборочном
распределении.
Медиана (median) выборки — это значение переменной в середине ряда данных, расположенных в порядке возрастания или убывания. Положение медианы определяется ее номером. Если количество данных четное, то медиана равна полусумме двух серединных значений. Медиана — это 50-й процентиль. Она характеризует положение центра распределения порядковых данных. Значение переменной, которое приходится на середину распределения частот, т.е. одна половина всех значений больше медианы, а другая — меньше.
Если переменную измеряют по номинальной шкале, то лучше использовать моду. Если переменную измеряют по порядковой шкале, то больше подходит медиана. Если же переменную измеряют по интервальной или относительной шкале, то мода плохо отражает положение центра распределения. Медиана лучше подходит в качестве показателя, характеризующего положение центра распределения, для интервальной или относительной шкалы, хотя и она не учитывает всю информацию о значениях переменной.
Самый лучший показатель для интервальной или относительной шкалы — среднее арифметическое. Он учитывает всю доступную информацию, поскольку для его вычисления используются все значения. Однако среднее арифметическое чувствительно к выбросам значений (экстремально малым или экстремально большим). Если данные содержат выбросы, то среднее не будет хорошим показателем центра распределения и лучше использовать два показателя — среднее и медиану.
43. Показатели вариации данных. Размах. Межквартальный размах. Стандартное отклонение. Коэффициент вариации.
Показатели вариации (изменчивости) (measures of variability), вычисляемые на основании данных, измеряемых с помощью интервальных или относительных шкал, включают размах вариации, межквартильный размах, дисперсию, стандартное отклонение и коэффициент вариации. Статистики, показывающие меру разброса (вариабельность) значений переменной.
Размах вариации (range) отражает разброс данных. Он равен разности между наибольшим и наименьшим значениями в выборке. Поэтому на него непосредственно влияют выбросы значений переменной. Разность между наибольшим и наименьшим значениями переменной в вариационном ряду. Если все значения данных умножить на константу, то значение размаха вариации умножается на ту же константу.
Межквартильный размах (interquartile range) — это разность между 75- и 25-м про-центилями. Для набора точек данных, расположенных в ранжированном ряду, р-м процентилем будет такое значение переменной в ранжированном ряду распределения, чтор% единиц совокупности будут меньше и (100-р)% — больше него. Размах вариации распределения, охватывающий центральные 50% всех наблюдений.
Разность между средним значением переменной и ее наблюдаемым значением называют отклонением от среднего. Дисперсия (variance) — среднее из квадратов отклонений переменной от ее средней величины. Она никогда не может быть отрицательной. Если значения данных сгруппированы вокруг среднего, то дисперсия невелика. И наоборот, если данные разбросаны, то мы имеем дело с большей дисперсией. Если все значения данных умножить на константу, то дисперсия умножится на квадрат константы. Среднеквадратичное (стандартное) отклонение (standard deviation) равно квадратному корню из дисперсии. Таким образом стандартное отклонение выражается в тех же единицах, что и сами данные.
Достарыңызбен бөлісу: |