Выборка. Типы выборок

Один из главных компонентов тщательно продуманного исследования – определение выборки и что такое репрезентативная выборка. Это как в примере с тортом. Ведь не обязательно съедать весь десерт, чтобы понять его вкус? Достаточно небольшой части.

Так вот, торт – это генеральная совокупность (то есть все респонденты, которые подходят для опроса). Она может быть выражена территориально, например, лишь жители Московской области. Гендерно – только женщины. Или иметь ограничения по возрасту – россияне старше 65 лет.

Высчитать генеральную совокупность сложно: нужно иметь данные переписи населения или предварительных оценочных опросов. Поэтому обычно генеральную совокупность «прикидывают», а из полученного числа высчитывают выборочную совокупность или выборку .

Что такое репрезентативная выборка?

Выборка – это чётко определенное количество респондентов. Её структура должна максимально совпадать со структурой генеральной совокупности по основным характеристикам отбора.

Например, если потенциальные респонденты – всё население России, где 54% — это женщины, а 46% — мужчины, то выборка должна содержать точно такое же процентное соотношение. Если совпадение параметров происходит, то выборку можно назвать репрезентативной. Это значит, что неточности и ошибки в исследовании сводятся к минимуму.

Объем выборки определяется с учётом требований точности и экономичности. Эти требования обратно пропорциональны друг другу: чем больше объем выборки, тем точнее результат. При этом чем выше точность, тем соответственно больше затрат необходимо на проведение исследования. И наоборот, чем меньше выборка, тем меньше на неё затрат, тем менее точно и более случайно воспроизводятся свойства генеральной совокупности.

Поэтому для вычисления объема выбора социологами была изобретена формула и создан специальный калькулятор :

Доверительная вероятность и доверительная погрешность

Что означают термины «доверительная вероятность » и «доверительная погрешность »? Доверительная вероятность – это показатель точности измерений. А доверительная погрешность – это возможная ошибка результатов исследования. К примеру, при генеральной совокупности более 500 00 человек (допустим, проживающие в Новокузнецке) выборка будет равняться 384 человека при доверительной вероятности 95% и погрешности 5% ИЛИ (при доверительном интервале 95±5%).

Что из этого следует? При проведении 100 исследований с такой выборкой (384 человека) в 95 процентов случаев получаемые ответы по законам статистики будут находиться в пределах ±5% от исходного. И мы получим репрезентативную выборку с минимальной вероятностью статистической ошибки.

После того, как подсчет объема выборки выполнен, можно посмотреть есть ли достаточное число респондентов в демо-версии Панели Анкетолога . А как провести панельный опрос можно подробнее узнать .


Описание работы калькулятора:

В поле «Объем генеральной совокупности» нужно ввести целое неотрицательное число, равное количеству объектов в совокупности, из которой производится отбор в выборочной совокупности. Например, это может быть количество документов в массиве или, чаще, численность населения, проживающего на определенной территории, или количество людей в целевой группе. На практике часто случаются ситуации, когда выборочная совокупность в 100 и более раз меньше генеральной совокупности. В этом случае генеральная совокупность считается квазибесконечной. Этот параметр установлен по умолчанию (символ «∞» в поле «Объем генеральной совокупности » ).

Далее нужно выбрать (поставить с помощью клика левой кнопки «мыши» точку в нужном кружочке) уровень доверительной вероятности которой будет оценена погрешность выборки или ее объем, то есть поставить с помощью клика левой кнопки «мыши» точку в нужном кружочке. Чем больше заданный уровень доверительной вероятности, тем меньше будет шанс, что реальная погрешность выйдет за пределы теоретической оценки или, что рассчитанный объем выборки будет недостаточным для того, чтобы делать оценки с точностью, не превышающей заданную погрешность. Если доверительную вероятность обозначить P , то вероятность , что оценка погрешности или объема будет неправильной равна 1-Р. При P =0,95 вероятность ошибки равна 0,05 (1 шанс из 20); при P =0,99 эта же вероятность равна 0,01 (1 шанс на 100).

Если Вы хотите рассчитать погрешность выборки определенного объема, то в поле «Объем выборочной совокупности » следует ввести неотрицательное число , равное количеству объектов в выборке . После этого Вы кликнуть левой кнопкой «мыши» кнопку расчет, которая должна стать зеленой после правильного введения Вами исходных данных. В поле «Теоретическая статистическая погрешность » будет выведено число больше 0 и меньше единицы, в котором вместо запятой использована точка «.» (с точностью до 3 знаков после десятичной точки). Если Вы хотите перевести эту погрешность в проценты, просто умножьте число на 100 - перенесите мысленно десятичную запятую на два знака вправо. Так, в приведенном примере по результатам расчета видно, что теоретическая статистическая погрешность случайной вероятностной выборки объемом 1600 единиц с квазибесконечной генеральной совокупности с доверительной вероятностью 0,99 не превышает 0,032 (3,2%).

В том случае, когда необходимо рассчитать объем выборочной совокупности с квазибесконечной генеральной совокупности, достаточной для обеспечения теоретической статистической погрешности не более, чем заданная, Вам нужно заполнить поле «Теоретическая статистическая погрешность» (число от 0 до 1, вместо десятичной запятой «,» – десятичная точка «.» ; проценты нужно перевести в частку от единицы : 3,2%=0,032 т. п.). Также следует задать уровень доверительной вероятности, кликнув левой кнопкой «мыши» точку в нужном кружочке справа от надписи «Доверительная вероятность ». После этого Вам достаточно кликнуть левой клавишей мыши на зеленой кнопке «Расчет» и в поле «Объем выборочной совокупности» Вы увидите результат.

Для ввода новых данных и повторного расчета следует нажать черную кнопку «Очистить » .

После того, как определен метод исследования и разработан инструмент, определяются параметры исследования: тип, состав и свойства выборки и её объем. Для определения типа выборки надо воспользоваться таблицами в лекциях: определить объем и свойства генеральной совокупности, затем выбрать модель выборки..

Таблица объемов выборок позволяет определить объем выборок, исходя из заранее заданного показателя надежности P и заранее заданной допустимой величины ошибки е. Р показывает, какую часть генеральной совокупности максимально сможет охватить выборка (это показывает её надежность), а ошибка показывает, какие минимальные расхождения будут допущены между свойствами генеральной совокупности и свойствами выборки.

Таблица объемов выборок
е P 0,10 0,09 0,03 0,07 0,06 0,05 0,04 0,03 0,02 0,01
0,75
0,80
0,85
0,90
0,91
0,92
0,93
0,94
0,95
0,96
0,965
0,970
0,975
0,980
0,985
0,990
0,991
0,992
0,993
0,994
0,995
0,996
0,997
0,998
0,999


Допустим, мы хотим охватить генеральную совокупность с надежностью не менее 80% и допускаем ошибку нашего исследования не менее 10%. При этом мы ничего не знаем о том, какие значения может принимать исследуемая нами переменная, то есть не имеем никакой априорной информации о генеральной совокупности: ни среднего не знаем, ни возможной дисперсии - ничего. Тогда мы просто ищем соответствующее пересечение в таблице (Р=0,80 , е=0,10): объем выборки составит 41 человек. Таблица составлена из расчета максимального значения дисперсии дихотомической переменной. Видно, что с увеличением точности выборки её объем быстро растет – если в описанном случае мы увидели объем в 41 человек, то для параметров в Р=95% и е=5% (стандартных для большинства исследований) объем составит уже 384 человека. Поэтому таблицей надо пользоваться в случаях, когда генеральная совокупность относительно небольшая и допустимы значительные величины ошибок.

Чтобы обеспечить небольшой объем выборки для относительно большой генеральной совокупности, надо заранее знать параметры распределения изучаемой переменной: среднее значение и дисперсию. При этом можно воспользоваться приведенной ниже номограммой для расчета выборок (номограмма построена для надежности Р=95%, что вполне достаточно). Для использования номограммы надо знать две величины: коэффициент изменчивости v и допустимую величину ошибки е . Коэффициент изменчивости определяется как коэффициент вариации

то есть для его определения надо знать среднее арифметическое и среднее квадратичное отклонение исследуемой переменной.

Для упрощения расчета коэффициента изменчивости надо знать размах вариации, то есть максимальное и минимальное значение, которых может достигать исследуемая переменная. В этом случае расчет v ведется так:

,где X max , X min – максимальное и минимальное значения исследуемой переменной, А - постоянное действительное положительное число (обычно выбирается между 5 и 6).


Пример 1 . Предположим, нам известно, что коэффициент изменчивости исследуемой переменной равен 6%. Найдем объем выборки при допустимой ошибке в 5%. Для этого на левой шкале номограммы, обозначенной v% , ищем точку 6. На правой шкале номограммы, обозначенной ε% , ищем выбранное значение ошибки, составляющее 5%. Отмечаем эти точки на линиях и соединяем их по линейке прямой линией. Смотрим, где эта прямая пересекает центральную шкалу, обозначенную n 1 . Это пересечение совершается в точке 6. Следовательно, объем выборки составит 6 человек.

Пример 2 . Пусть нам известно, что коэффициент изменчивости исследуемой переменной равен 16%. Найдем объем выборки для заданной ошибки в 5%. 16% больше 10%, максимально отмеченных на шкале v% , а шкалы логарифмические, поэтому 16 делим на 10 и на шкале v% номограммы ищем точку 1,6. На правой шкале номограммы ε% ищем выбранное значение ошибки, составляющее 5%. Отмечаем эти точки на шкалах и соединяем их по линейке прямой линией. Смотрим, где прямая пересекает центральную шкалу n 1 . Пересечение совершается в точке 0,4. Поскольку мы уменьшили 16% до 1,6%, то есть в 10 раз, то умножаем 0,4 на 100. Объем выборки составит 40 человек (сравните с указанной выше выборкой в 384 человека для Р=95% и е=5% без учета конкретного значения дисперсии).

Пример 3 . Исследуется потребление студентами сигарет, причем изучаются только те, кто курит сигареты (генеральная совокупность - курящие). Допустимая ошибка составляет 5%. Заранее известно (например, данные взяты из источников вторичной маркетинговой информации), что студенты выкуривают сигареты в количестве от одной пачки сигарет в три дня до двух пачек в день, причем в среднем курящему студенту хватает одной пачки сигарет на день. Тогда соответствующие значения будут составлять X max =2, X min =0,33, а среднее составит 1. Коэффициент изменчивости v составит

и на левой шкале мы откладываем 2,8%, на правой 5%, соединим их и по центральной шкале номограммы получим отметку 1,2 - это значит, что объем выборки должен быть 120 человек.

Пример 4 . Предположим, что при использовании предыдущего примера доступ к целевой репрезентативной группе (курящим) отсутствует. Это значит, что надо включать в выборку как курящих, так и некурящих. В таком случае параметры для расчета будут X max =2, X min =0. Какова будет средняя? Расчет средней по выражению (2+0)/2=1 не является правильным, поскольку прежняя средняя рассчитывалась только для курящих, а сейчас не учтено соотношение размеров групп курящих и некурящих. Например, если доля некурящих составляет 60%, а доля курящих - 40%, то тогда средняя составит 0,4.

Сравним возможные размеры выборок и ошибки исследования:

Если отсутствуют данные о соотношении репрезентативной и нерепрезентативной групп в генеральной совокупности, то расчет коэффициента изменчивости осуществляется через изменение величины А . Как правило, если средняя рассчитывается по выражению (X max +X min )/2, то А уменьшается до 5 и менее.

Как видим, простая случайная выборка для достижения требуемой точности требует значительных объемов. Общий объем выборки можно существенно уменьшить двумя способами:

1) выполняя районирование или стратификацию, то есть выделяя качественно различные группы в генеральной совокупности и размещая выборку именно среди представителей этих групп;

2) выполняя выделение гнезд, то есть разделяя генеральную совокупность на большое количество одинаковых частей и распределяя выборку между этими частями.

При проведении стратифицированной выборки можно поступать следующим образом (см. схему далее).

Первоначально определяется, какой объем априорной информации известен о генеральной совокупности. Для правильно выполненной стратифицированной выборки минимального объема необходимо знать общую численность генеральной совокупности N , число изучаемых страт i , численность каждой страты N i , а внутри каждой страты соответствующее среднее значение изучаемой переменной и её дисперсию. Если все эти параметры известны, то с помощью рассмотренной выше номограммы можно рассчитать объем стратифицированной пропорциональной выборки.

Для этого определяют сначала генеральную дисперсию изучаемой переменной как сумму внутригрупповой и межгрупповой дисперсий, потом определяют генеральное среднее по средним страт, потом определяют коэффициент изменчивости и по номограмме определяют при задании допустимой ошибки общую величину выборки. σ

Генеральная дисперсия равна

где σ 2 р - внутригрупповая дисперсия, а σ 2 m - межгрупповая дисперсия.

Внутригрупповую дисперсию определяют по известным дисперсиям изучаемой переменной внутри каждой страты

где N i - численность i -той страты, σ 2 i - дисперсия i -той страты.

Межгрупповую дисперсию определяют, исходя из известных средних по каждой страте и рассчитанной на их основе генеральной средней:

Если известно число страт, но неизвестен их объем (и/или объем генеральной совокупности), то рассчитывается сначала общий объем выборки указанным способом, а потом он делится на число страт так, чтобы в каждой страте разместилась бы одинаковая доля выборки - это будет стратифицированная равная выборка.

Если неизвестны дисперсии внутри страт, то необходимо знать размах вариации внутри каждой страты, то есть значения X max и X min . Тогда дисперсии страт можно рассчитать, исходя из выражения

Если неизвестна численность страт, то внутригрупповвая дисперсия рассчитывается как простое среднее арифметическое из дисперсий страт.

Если неизвестны средние в каждой страте, но известен размах вариации, то средние внутри страт определяются как средние между крайними значениями изучаемой переменной

Если наличие страт неизвестно, но по генеральной совокупности известны параметры среднего, дисперсии и плотности распределения единиц наблюдения, то осуществляется районная выборка по гнездовому или пропорциональному способам. Если единицы наблюдения размещены по территории, где находится генеральная совокупность, относительно равномерно (коэффициент вариации плотности размещения составляет не более 15-25%), то используется выделение гнезд, каждое из которых вмещает в себя одинаковое число единиц наблюдения. Гнезда выделяются так, что имеют одинаковый размер (например, площадь). Число гнезд определяется пропорционально отношению общего размера выборки n к общему числу единиц наблюдения N . Из каждого гнезда отбирается только одна единица наблюдения, размещение выборки по гнездам осуществляется равномерно-механическим или случайным методом.

Если размещение единиц наблюдения по изучаемой территории неравномерно, то она разделяется на районы с одинаковым числом единиц наблюдения в каждом - это порайонная пропорциональная выборка. Для этого рассчитывается общий объем выборки по номограмме, после чего эта выборка распределяется по районам пропорционально численности единиц наблюдения. Внутри районов в этом случае размещение выборки выполняется либо гнездовым, либо иным способом, аналогично известным процедурам размещения выборок.

Пример 5 . Воспользуемся примером 3, изучающим потребление сигарет. Если нет никаких данных о возможных параметрах изучаемой переменной, то при данных Р=95% , е=5% объем выборки составит 384 человека. Выделим две страты - мужчин и женщин. Пусть априори известно (например, из проведения пилотного исследования), что потребление сигарет в пачках за день составляет у мужчин X max =2, X min =0,33, у женщин X max =3, X min =0,1. Вычислим объем выборки в этом случае

Поскольку о соотношении численностей страт нам ничего не известно, то принимаем, что их численности равны и доли их численностей в генеральной совокупности составляют по 0,5. Тогда внутригрупповая дисперсия будет

а межгрупповая

при генеральном среднем

Тогда генеральная дисперсия будет

и коэффициент изменчивости составит

По номограмме при допустимой ошибке 5% объем выборки составит приблизительно 240 человек (более чем на 140 меньше, чем по таблице). В данном случае эта выборка должна быть разделена на 120 мужчин и 120 женщин.

Если и этот объем выборки слишком велик, то нужно увеличивать количество страт, добиваясь того, чтобы размах вариации в каждой страте был минимален, а размеры страт близки, то есть стремиться к минимуму суммарной дисперсии.

В случае, когда известен размер генеральной совокупности в целом, то возможно корректировать размер выборки на бесповторность следующим образом:

1) для известных v% и e рассчитывается по номограмме размер выборки n 1 ;

2) заданная допустимая ошибка корректируется с учетом размера генеральной совокупности

3) по номограмме для скорректированной ошибки e correct и v% находится новый объем выборки n 2 .

Пример 6. Предположим, что исследование проводится для целевого сегмента объемом 1600 единиц наблюдения при v% =25% и e =5%. По номограмме объем выборки тогда составит 100 единиц наблюдения. Корректируем ошибку с учетом размера выборки

По номограмме скорректированный объем выборки составит (при v% =25% и e =5,2%) 90 единиц наблюдения.

ГЛАВА 1.

В этой части работы студент обрабатывает собранные им данные и делает вывод относительно поставленной задачи: как решить поставленную проблему.

Для обработки студент может использовать MS Excel, SPSS, Statistika for Windows, MatLab, MatCad и другие программы обработки больших массивов данных. Основные задачи, решаемые при использовании этих средств:

верификация данных:

установление законов распределения;

установление взаимосвязей между данными;

классификация и сегментация данных;

прогнозирование развития событий.

Последовательность обработки данных исследования

  1. расчет в рамках анализа двумерных распределений по каждой таблице данных, коэффициента вариации, корреляционного отношения и стандартных отклонений4
  2. расчет корреляционной и ковариационной матриц;
  3. выбор массива данных по заранее заданным условиям;
  4. вычисление распределений (при учете заданных условий);
  5. перекодировка (исправление ошибок в данных);
  6. введение новых показателей (расчет индексов).

Ниже в таблице описаны возможные методы анализа данных. Не следует, разумеется, применять их сразу все. Студент выбирает именно те 1-2 метода, которые наиболее подходят для раскрытия поставленной проблемы.

Количественные методы анализа данных маркетинговых исследований
1.Методы сжатия описательной статистики 2.Методы анализа систем показателей
1.1 Группирование 1.2 Оценка параметров распределения 1.3 Ковариационная и корреляционная матрица
2.1 Ориентация на интегральную качественную характеристику 2.2 Ориентация на количественный признак
2.2.1 Дисперсионный анализ 2.2.2 Корреляционно-регрессионный анализ 2.2.3 Причинный анализ
2.1.1 Без априорной информации об исследуемом признаке 2.1.2 С априорной информацией о классах признака 2.1.3 С априорной информацией о возрастании (убывании) признака)
2.1.1.1 Методы экспертных оценок 2.1.1.2 Анализ матрицы данных.
2.1.3.1 Усиление шкалы по результирующему признаку 2.1.3.2 Оценка существенности показателя (ранговые корреляции)
2.1.1.2.1Факторный анализ 2.1.1.2.2Латентно-структурный анализ 2.1.1.2.3Кластерный анализ 2.1.1.2.4 Методы оценки значимости показателя
2.1.2.1 Методы усиления номинальной шкалы по результирующему признаку 2.1.2.2 Оценка существенности показателей системы
2.1.2.2.1 Методы теории распознавания образов 2.1.2.2.2 Методы теории информации 2.1.2.2.3 Методы теории графов

Для определения основных характеристик в зависимости от применявшихся вопросов могут быть применены слудующие методы анализа измерений по шкалам в вопросах:

Статистические методы выявления связей

Шкала результирующего (итогового) признака Шкала факторного признака (предиктора) Метод статистической обработки
Количественные (И,О,А,Р) Количественные (И,О,А,Р) Регрессии Корреляции
Количественные (И,О,А,Р) Время (И) Динамика временных рядов
Количественные (И,О,А,Р) Неколичественные (К,П) Дисперсионный анализ
Количественные (И,О,А,Р) Ковариационный анализ Типологическая регрессия
Неколичественные (К) Количественные (И,О,А,Р) Дискриминантный анализ Кластерный анализ Таксономия Расщепление смесей
Неколичественные (П) Неколичественные (К,П) Ранговые корреляции Анализ таблиц сопряженности
Количественные и неколичественные Количественные и неколичественные Логические решающие функции
Типы шкал в вопросах: И - интервальная, О - относительная, А- абсолютная, Р - разностная, П - порядковая, К - классификационная (номинальная)

Например, корреляционный анализ для сегментации потребителей выполняется так:

  1. выделяются средние значения, стандартные отклонения, коэффициент вариации, ошибку среднего значения и доверительный интервал;
  2. рассчитывается ковариационная и корреляционная матрица (например, в MS Excel);
  3. вычисляется «близость» объектов в пространстве характеристик (для сегментации);
  4. вычисляются пути максимальной корреляции в целях группировки переменных;
  5. вычисляются пути максимального расстояния по матрице расстояний в целях классификации объектов;
  6. определяются наиболее близкие группы, которые и будут сегментами потребителей;
  7. проверяется мера близости групп (например, корреляционное отношение).

В конце этой главы студент описывает результаты анализа данных, так чтобы были ясны его решения поставленных задач работы, окончатеьные выводы и их формулировки.

Заключение

В этом разделе студент формулирует полное решение проблемы, поставленной в начале своей работы.

Список литературы

Список использованных источников (список литературы) надлежит выполнять в конце текста работы сообразно ГОСТ 7.1-84, например:

Зиннуров У. Г. Основы маркетинговых исследований: Учебное пособие / У. Г. Зиннуров; Уфимск. гос. авиац. техн. ун-т. Уфа, 1996.- 110 с.

Источники в списке располагаются в алфавитном порядке. На все перечисленные источники в работе необходимо сделать ссылки. Постраничные сноски не допускаются.

В случае, если источником являются сайты Интернета, необходимо указывать полностью адрес того сайта (копируя его адресную строку), на котором была получена конкретная информация. При этом приводится дата последнего обращения к этому сайту, например.

Размер выборки требуется определить перед началом большинства количественных исследований. Определение размера выборки не требуется для качественных исследований (обратите внимание, что здесь понимаются формально количественные методы, такие как контент-анализ; простые описательные проекты относятся к количественным). Расчет размера выборки может не выполнять перед проведением предварительных, пилотных исследований (однако такие исследования обычно выполняются перед реальным планированием научного исследования). В случае сомнений, обязательно обратитесь в то учреждение, которое финансирует исследование или включает его в свой план исследований - отсутствие данные о размере выборки одна из наиболее частых причин отказа в утверждении темы

Почему размер выборки важен для исследователя?

При проведении исследований, которые определяют распространенность некоей характеристики в популяции (например, распространенность астмы у детей), расчет размера выборки необходим для того, чтобы полученные оценки имели желаемую степень точности. Например, распространенность заболевания в 10%, полученная на выборке размером в 20 человек будет иметь 95% доверительный интервал от 1% до 31%, что никак нельзя признать ни точно, ни информативной оценкой. С другой стороны, распространенность заболевания в 10%, полученная на выборке размером в 400 человек будет иметь 95% доверительный интервал от 7% до 13%, что может рассматриваться, как достаточно точный результат. оценка размеров выборки позволяет избежать первого из этих двух вариантов.

В исследованиях, направленных на выявление эффекта (например, разность эффективности двух методов лечения, относительный риск заболевания при наличии или отсутствии фактора риска) оценка размера выборки важна для того, чтобы удостовериться в том, что если клинически или биологически важный эффект существует, то он с высокой степенью вероятности будет обнаружен, иными словами анализ даст статистически значимые результаты. Если размер выборки невелик то даже в случае значительных различий между группами будет невозможно доказать, что они являются следствием чего-то иного, кроме как выборочной вариабельности.

Информация необходимая для расчета размера выборки

Методы оценки размера выборки описаны в ряде учебников по статистике, включая Altman, 1991; Bland, 2000; Armitage, Berry и Matthews, 2002. Две книги специализируются на описании методов оценки размеров выборки в разных ситуациях. Для качественных параметров следует проконсультироваться с работой Manchin и соавт. (1998), для качественных - Lemeshow и соавт. (1996). В обеих книгах приведены таблицы, облегчающие расчет размеров выборки. В случае последовательных испытаний, необходимо обратиться к работе Whitehead (1997).Собственно расчеты размера выборки могут быть выполнены с использованием одной из многочисленных компьютерных программ. Так, программа Stata позволяет анализировать размер выборки, необходимый для сравнения средних и пропорций, а также анализа распространенности. Значительно большее количество опций предлагают специализированные пакеты, такие как nQuery Advisor или UnifyPow.

Расчет размера выборки зависит от следующих факторов, которые надо будет сообщить статистику-консультанту:

  • Изучаемые в исследовании переменные, включая их типы
  • Необходимая мощность исследования
  • Необходимый уровень статистической значимости
  • Размер эффекта, который имеет клиническую значимость
  • Стандартное отклонение для количественных переменных
  • Будет ли использоваться одно- или двусторонний тест значимости
  • Дизайн исследования, иными словами является ли исследование:
    • Рандомизированным контролируемым испытанием
    • Кластерным рандомизированным исследованием
    • Исследованием эквивалентности
    • Нерандомизированным исседованием вмешательства
    • Обсервационным исследованием
    • Исследованием распространенности
    • Изучением чувствительности и специфичности теста

При этом потребуется ответить на ряд дополнительных вопросов:

  • Включаются ли в исследование парные данные?
  • Будут ли в исследовании измерены повторно одни и те же переменные у одного и того же человека?
  • Равны ли включаемые в исследование группы по численности?
  • Являются ли данные иерархическими?

Следует принять во внимание, что нерандомизированные исследования различий или взаимосвязей обычно требуют значительно больший размер выборки для того, чтобы принять во внимание при анализе влияние третьих переменных. При этом исследователя интересует абсолютный размер выборки, а не процент, который она составляет от популяции в целом.

Какие статистические термины используются при описании процесса планировании размера выборки

Нулевая и альтернативная гипотезы

Многие типы статистического анализа направлены на сравнение двух видов лечения, процедур или групп пациентов. Численное значение, которое суммирует интересующие исследователя различия называется эффектом. В других исследованиях эффектом может являться коэффициент корреляции, отношение шансов или относительный риск. Затем мы выдвигаем нулевую и альтернативную гипотезы. Обычно нулевая гипотеза гласит, что эффекта нет (различия между группами равны нулю, относительный риск равен единице, корреляционный коэффициент равен нулю), альтернативная гипотеза предполагает, что эффект есть.

Доверительная вероятность (р-оценка)

р-оценка это вероятность наблюдения в исследовании такого же или более сильного эффекта при условии справедливости нулевой гипотезы. Обычно выражается как пропорция (например, р=0.03)

Уровень значимости

Уровень значимости - это пороговое значение для р-оценки, ниже которого нулевая гипотеза должна быть отвергнута и сделано заключение о том, что имеются доказательства эффекта. Обычно уровень значимости устанавливается на значении 5% (Уровень значимости, несмотря на прямую связь с р-оценкой выражается в процентах: 5% уровень значимости эквивалентен р=0.05). Если наблюдаемой значение меньше 5%, то имеется незначительная вероятность, что в исследовании были бы получены такие результаты, если бы истинного эффекта не было. Поэтому принимается гипотеза о наличии эффекта

Уровень значимости 5% также означает, что имеется практически 5% вероятность придти к выводу о наличии эффекта, хотя на самом деле его нет. Иногда более адекватным является использование 1% уровня значимости, особенно если очень важно избежать заключения о том, что эффект существует тогда, когда на самом деле его нет.

Мощность

Мощность - это вероятность того, что нулевая гипотеза будет адекватно отвергнута, иными словами тогда, когда действительно существуют доказательства реальных различий или взаимосвязей. Ее можно рассматривать как "100 процентов минус вероятность пропуска истинного эффекта". поэтому чем выше мощность, тем меньше вероятность пропуска истинного эффекта. Мощность обычно фиксируется на уровне 80%, 90% или 95%. Мощность не должна быть меньше 80%. Если крайне важно, чтобы исследование не пропустило существующего эффекта, надо стремиться достичь мощности 90% или более.

Клинически важный размер эффекта

Это наименьшие различия между средними групп или процентами событий в них (для отношений шансов самый близкий к единице риск), которые еще можно рассматривать как биологически или клинически значимые. Должна быть сформирована выборка такого размера, чтобы если подобные различия существуют, то в исследовании были бы получены статистически значимые результаты.

Односторонний или двухсторонний тест значимости

При двухстороннем тесте нулевая гипотеза заключается в отсутствии различий, а альтернативная гипотеза предполагает, что различия между группами могут идти в любом направлении. При одностороннем тесте альтернативная гипотеза определяет предполагаемое направление различий, например, что терапия лучше, чем плацебо, а нулевая гипотеза включает ситуации, когда эффект препарата и плацебо одинаков и когда препарат приводит к худшему, по сравнению с плацебо, результату.

Если нет серьезных причин для того, чтобы это не делать, следует пользоваться двухсторонней гипотезой. Ожидание того, что различия пойдут в том или ином направлении недостаточное основание для того, чтобы пользоваться односторонним тестом. Исследователи-медики часто оказываются удивлены, если полученный результат идет в разрез с тем, что ожидалось, очень часто подобная находка имеет иные последствия, по сравнению с отсутствием различий и поэтому она должна быть адекватным образом описана. Односторонний тест не позволяет этого сделать. Примеры ситуаций, в которых односторонний тест может оказаться приемлемы приведены в книге Bland и Altman (1994).

Какие переменные должны учитываться при расчете размера выборки

Расчет размера выборки должен базироваться на анализе основной переменной исхода в данном исследовании.

Если в исследование будут включены дополнительные переменные, которые также рассматриваются, как имеющие важное научное значение, то размер выборки должен таковым, чтобы позволить адекватный анализ этих переменных. Для всех важных в научном плане переменных должен быть проведен и представлен расчет размера выборки.

Учет процента отклика и потерь при наблюдении

Расчетный размер выборки указывает количество пациентов в финальной, анализируемой в конце исследования группе. Поэтому количество лиц, которые должны быть вовлечены в исследование должно быть увеличено в соответствии с ожидаемым откликом, потерям при наблюдении, отказом от следования протоколу и другим возможным причинам потери экспериментальных субъектов. Необходимо четко описать взаимосвязь между ожидаемым количеством участников и объемом формируемой выборки.

Соответствие целям исследования и методам статистического анализа

Адекватность размера выборки должна также быть оценена в соответствии с целью исследования. Например, если целью исследования является демонстрация того, что новое лекарство лучше существующего, необходимо добиться того, чтобы размер выборки позволял обнаружить клинически значимые различия между двумя методами лечения. Однако иногда требуется продемонстрировать, что два лекарственных средства клинически эквивалентны. Этот тип исследований часто называют испытанием эквивалентности или "негативным" испытанием. Вопросы определения размера выборки для этих исследований детально описаны в работе Pocock (1983). Размер выборки в исследованиях, направленных на демонстрацию эквивалентности лекарств больше, чем в исследованиях, которые направлены на выявление различий в эффективности. Обязательно следует убедиться в том, что расчеты размеров выборки связаны с целями и задачами исследования и базируются на данных об основной переменной исхода.

Размеры выборки также должны быть адекватны используемым в исследовании методам анализа, поскольку как размер выборки, так и анализ зависят от выбранного дизайна исследования. Обязательно следует удостовериться в том, что предполагаемые методы анализа и расчеты размера выборки совместимы друг с другом.

Примеры расчета размера выборки.

Если планируемое исследование требует оценки одной единственной частоты, сравнения двух средних или сравнения двух частот, расчеты размера выборки (обычно) остаточно просты и поэтому представлены ниже. Однако мы рекомендуем в любом случае проконсультироваться со статистиком по поводу расчетов размера выборки.

Оценка одной единственной частоты

Примечание: приведенная ниже формула базируется на т.н. "методе примерного нормального распределения" и, если только не планируется создавать очень большую выборку, не рекомендуется для оценки частот близких к 0 или 1 (0: или 100%. В подобных случаях следует пользоваться "точными" методами. Подобная ситуация может наблюдаться при изучении чувствительности и специфичности нового метода диагностики, где предполагается наличие частот, близких к 1 (100%). В данном случае следует проконсультироваться со статистиком или, как минимум, воспользоваться специализированными компьютерными программами.

Сценарий: Используя почтовый опросник оценить распространенность нарушений дыхания у пациентов с бронхиальной астмой, находящихся под наблюдением врача общей практики (Thomas и соавт., 2001)

Требующаяся информация:

  • Основная переменная исхода = наличие или отсутствие нарушений дыхания
  • Предполагаемая частота нарушений = 30% (0.3)
  • Требуемая ширина 95% доверительного интервала = 10% (т.е. +/-5% или от 25% до 35%)

Формула для оценки размера выборки одной единственной частоты:

n=15.4*p*(1-p)/W 2

где n - требуемый размер выборки, р - ожидаемая частота результата (в данном случае 0,3) и W - ширина доверительного интервала (в данном случае 0.1)

Подставляя в формулу значения, получаем:

n=15.4*0.3*(1-0.3)/0.1 2 =324

"Для получения доверительного интервала в +/-5% вокруг оценки распространенности в 30% потребуется выборка из 324 человек. Учитывая 70% частоту отклика на предложение участвовать в исследовании, будет распространено 480 опросников"

Сравнение двух частот

Сценарий: Планируется провести рандомизированное плацебо-контролируемое испытание эффективности колонии-стимулирующего фактора для снижения риска сепсиса у недоношенных детей. Ранее проведенное исследование продемонстрировало, что частота развития сепсиса у таких детей составляет 50% в течение 2 недель после рождения и исследователи считают, что снижение этой частоты до 34% будет являться клинически значимым.

Требующаяся информация:

  • Основная переменная исхода= наличие или отсутствие сепсиса у новорожденных через 14 дней после рождения (терапия проводится на протяжении максимум 72 часов после рождения). Это качественная переменная, представленная частотами.
  • Величина значимых различий = 16% или 0.16 (т.е. 50%-34%)
  • Уровень значимости=5%
  • Мощность=80%
  • Тест=двухсторонний

Формула для расчета размера выборки при сравнении двух частот следующая:

n= 2 *[(p 1 *(1-p 1)+(p 2 *(1-p 2)))]/ 2

где n=размер выборки для каждой группы (общий размер выборки в два раза больше)

р 1 =первая частота - в данном случае 0.50

р 2 =вторая частота - в данном случае 0.34

р 1 -р 2 =клинически значимые различия, в данном случае 0.16

Таблица значений для А и В

Уровень значимости

Мощность

Подставляя значения в формулу получим:

n= 2 *[(0.5*0.5+(0.34*0.66)]/ 2 =146

Таким образом, мы получаем количество наблюдений, необходимое для включения в каждую из групп. Общая численность выборки будет в два раза больше, т.е. 292 ребенка

Описание результатов расчета размера выборки может выглядеть следующим образом:

"Выборка в 292 новорожденных (146 в группе лечения и плацебо) будет достаточным для того, чтобы выявить различия в частоте сепсиса 16% с 80% мощностью на 5% уровне достоверности. 16% различия равны разности между 50% частотой сепсиса к 14 дню наблюдения в группе плацебо и 34% частотой в группе лечения."

Сравнение двух средних

Примечание: описанные ниже расчеты справедливы только для случая, когда две группы имеют один и тот же размер.

Сценарий: планируется рандомизированное контролируемое испытание по сравнению краткосрочного психологического лечения в сравнении с обычным лечением для борьбы с суицидальными тенденциями у пациентов, госпитализированных после суицидальной попытки отравления. Суицидальные тенденции измеряются с помощью шкалы Бека. Стандартное отклонение для оценок по этой шкале составляет 7.7 (данные предшествующих исследований) и клинически значимыми считаются различия в 5 баллов по шкале Бека. Предполагается, что из группы лечения выйдут до трети пациентов (Guthrie и соавт., 2001)

Необходимая информация:

  • Основная переменная исхода= шкала суицидальных тенденций Бека. Непрерывная переменная описываемая средними значениями
  • Стандартное отклонение=7.7 баллов
  • Размер клинически значимого эффекта= 5 баллов
  • Уровень значимости=5%
  • Мощность=80%
  • Тест=двухсторонний

Формула для расчета размера выборки при сравнении двух средних следующая:

n= 2 *2*SD 2 /DIFF 2

где n=размер выборки для каждой группы (общий размер выборки в два раза бльше)

SD= стандартное отклонения для основной переменной исхода, в данном случае 7.7

DIFF=клинически важный эффект, в данном случае 5.0

А - зависит от уровня значимости (см. таблицу) - в данном случае 1.96

В - зависит от мощности (см. таблицу) - в данном случае 0.84

Таблица значений для А и В

Уровень значимости

Мощность

Подставляя необходимые значения в формулу получаем:

n= 2 *2*7.7 2 /5.0 2 =38

Таким образом, мы получаем количество наблюдений, необходимое для включения в каждую из групп. Общая численность выборки будет в два раза больше, т.е. 76 человек.

Адекватное описание оценки размеров выборки будет выглядеть следующим образом:

"Для выявления различий в 5 баллов по шкале суицидальных тенденций Бека на 5% уровне значимости с 80% мощностью, принимая стандартное отклонение равным 7.7 баллам, потребуется 38 человек в группу вмешательства и контроля. Это число было увеличено до 60 в группе (общее количество наблюдений 120), для того, чтобы компенсировать потери при наблюдении, составляющие обычно около трети обследуемых"

Примеры неадекватных описаний оценок размера необходимой выборки

Пример 1

"Предшествующее исследование в данной области использовало выборку в 150 человек и получило высоко достоверные результаты (р=0.014), поэтому в данное исследование включается аналогичное количество пациентов"

Предшествующие исследования могли оказаться просто "везучими" в том смысле, что найденные ими значимые результаты являются следствием случайного варьирования выборочных средних. Необходимо рассчитывать размер выборки для данного исследования - включая такие детали, как мощность исследования, уровень значимости, основная изучаемая переменная, размер клинически значимого эффекта, стандартное отклонение (для количественных переменных) и размер каждой группы, если в исследовании будет несколько групп

Пример 2.

"Расчет размера выборки не проводился, поскольку предварительная информация для ее оценки отсутствовала"

Необходимо тщательно проанализировать литературу, чтобы найти информацию, необходимую для расчета размера выборки. Если такой информации нет, можно организовать небольшое предварительное исследование для сбора этой информации.

Если отсутствуют данные о значении стандартного отклонения, расчеты размера выборки могут быть даны в более общем виде, например различия, являющиеся клинически эффективными могут быть описаны не в абсолютных значениях, а в единицах стандартного отклонения.

Вместе с тем, если пишется заявка на грант, направленный на финансирование пилотного исследования для сбора информации, необходимой для расчета размера выборки последующего крупного исследования, то в такой заявке расчет размера выборки не проводится.

"В клинику в течение года поступает 50 пациентов с данным заболеванием. Около 10% из них могут отказаться от участия в исследовании. Поэтому в течение двух лет можно будет набрать выборку размером в 90 человек"

Хотя большинство исследований должны уравновешивать возможности их организации с мощностью, размер выборки не должен определяться на основании только количества доступных для исследования пациентов.

В ситуациях, когда количество пациентов является ограничивающим размер выборки фактором, расчеты все равно должны проводиться для того, чтобы установить а) мощность исследования с данным количеством пациентов по отношению к клинически важным различиям или б) размер эффекта, который может быть выявлен в исследовании данного размера (учитывая его мощность).

В тех случаях, когда доступное количество пациентов слишком мало для того, чтобы выявить клинически значимые различия, можно подумать об увеличении продолжительности исследования или проведения совместного с несколькими исследователями многоцентрового испытания.

Литература

  1. Altman DG. (1991) Practical Statistics for Medical Research. Chapman and Hall, London.
  2. Armitage P, Berry G, Matthews JNS. (2002) Statistical Methods in Medical Research, 4th ed. Blackwell, Oxford.
  3. Bland JM and Altman DG. (1994). One and two sided tests of significance. British Medical Journal 309 248.
  4. Bland M. (2000) An Introduction to Medical Statistics, 3rd. ed. Oxford University Press, Oxford.
  5. Elashoff JD. (2000) nQuery Advisor Version 4.0 User"s Guide. Los Angeles, CA.
  6. Guthrie E, Kapur N, Mackway-Jones K, Chew-Graham C, Moorey J, Mendel E, Marino-Francis F, Sanderson S, Turpin C, Boddy G, Tomenson B. (2001) Randomised controlled trial of brief psychological intervention after deliberate self poisoning. British Medical Journal 323, 135-138.
  7. Lemeshow S, Hosmer DW, Klar J & Lwanga SK. (1996) Adequacy of sample size in health studies. John Wiley & Sons, Chichester.
  8. Machin D, Campbell MJ, Fayers P, Pinol, A. (1998) Statistical Tables for the Design of Clinical Studies, Second Edition Blackwell, Oxford.
  9. Pocock SJ. (1983) Clinical Trials: A Practical Approach. John Wiley and Sons, Chichester.
  10. Thomas M, McKinley RK, Freeman E, Foy C. (2001) Prevalence of dysfunctional breathing in patients treated for asthma in primary care: cross sectional survey. British Medical Journal 322, 1098-1100.
  11. Whitehead, J. (1997) The Design and Analysis of Sequential Clinical Trials, revised 2nd. ed. Chichester, Wiley.

Необходимое количество респондентов зависит от целей опроса и того, насколько важна достоверность результатов. Чем выше достоверность Вы хотите получить, тем ниже должен быть допустимый предел погрешности.

Определения

Численность совокупности

Численность совокупности - это размер всей группы, которую Вы хотите представить в опросе.

  • Совокупность : вся группа, о которой Вы хотите сделать выводы.
  • Выборка : группа, которую Вы опрашиваете.

Подумайте о потенциальном размере Вашей целевой совокупности. Например, если Вы отправляете опрос пользователям iPhone мужского пола, проживающим в определенном регионе, Вам может потребоваться провести небольшое исследование с целью определить, сколько всего мужчин соответствует этим критериям.

Предел погрешности

Предел погрешности указывает, насколько результаты отклоняются от фактических значений. Это процентное значение, означающее, с какой вероятностью мнения и поведение выборки опроса отклоняются от мнения и поведения общей совокупности. Чтобы рассчитать предел погрешности, используйте наш калькулятор предела погрешности .

Чем меньше предел погрешности, тем точнее будет ответ при определенном уровне доверия.

В общем случае, чем больше размер выборки, тем меньше предел погрешности. Чем ближе размер выборки к численности совокупности, тем более репрезентативными будут результаты. И именно поэтому, посмотрев на таблицу ниже, Вы можете заметить, что с уменьшением рекомендованного размера выборки увеличивается допустимая погрешность.

Допустим, мы опросили 400 человек о том, поддерживают ли они президента своей страны, и 55% ответило утвердительно. Если уровень доверия равен 95%, а пределы погрешности составляют ±5%, то при стократном повторении опроса в одних и тех же условиях 95 раз из 100 ответ находился бы в пределах между 50% и 60%.

Уровень доверия

Уровень доверия указывает, насколько достоверными являются полученные результаты. Общепринятые стандарты, используемые исследователями: 90%, 95% и 99%.

Уровень доверия 95% означает, что, если повторить один и тот же опрос при одинаковых условиях 100 раз, 95 раз из 100 результаты будут приблизительно находиться в пределах погрешности.

При определении размера выборки используется z-оценка уровня доверия. Z-оценка - это мера стандартного отклонения определенной доли от средней величины.

Уровень доверия

90% 1,65
95% 1,96
99% 2,58

Процентное значение

Требования к размеру выборки могут меняться в зависимости от процентной доли выборки, которая дает определенный ответ. Например, если в предыдущем опросе было обнаружено, что 75% клиентов выражают удовлетворенность Вашим продуктом, и Вы хотите провести такой опрос снова, можно использовать p = 0,75 для расчета требуемого размера выборки.

Если опрос проводится в первый раз, то, поскольку опросы обычно содержат более одного вопроса (и поэтому оценивать требуется более одного процентного значения), мы рекомендуем использовать p = 0,5 для расчета оптимального размера выборки. Это дает нам примерный размер выборки, который не будет ни слишком консервативным ни слишком свободным.

Ниже приведена таблица, в которой указаны рекомендованные значения численности совокупности* для предела погрешности при уровне доверия 95%.

Численность совокупности Размер выборки для предела погрешности

100 000 и более

* Мы рассчитали рекомендованные размеры выборки по указанной выше формуле. В некоторых случаях размеры выборки были округлены вверх до 5 или 10. Для более точного расчета используйте наш калькулятор размера выборки .

Вы отправляете родителям детей Вашей школы опрос с вопросом о том, поддерживают ли они продление учебного дня. Вопрос имеет варианты ответа «Да» и «Нет».

Общее количество родителей (численность совокупности) - 10 000, и Вас устраивает предел погрешности ±10%. По таблице выше Вы можете определить, что в опросе должно принять участие не менее 100 человек.

70% из 100 опрошенных родителей ответили, что согласны на продление учебного дня. Таким образом, можно предположить, что если бы в опросе участвовали все 10 000 родителей, 60-80% людей поддержало бы продление учебного дня.

Сколько людей следует попросить пройти опрос?

Может определять, какому количеству людей нужно отправить опрос. Чем выше процентная доля ответивших, тем меньше людей необходимо попросить пройти опрос.

Например, если Вам нужно 100 респондентов и Вы ожидаете, что 25% людей, приглашенных принять участие в опросе, ответят на него, Вам необходимо пригласить 400 человек.

СОВЕТ. Если Вам требуется гарантированное количество респондентов, приобретите ответы на опрос в SurveyMonkey Audience. Вы укажете необходимое количество ответов, и мы найдем респондентов, соответствующих Вашим критериям целевой аудитории.




Top