Как рассчитать размер выборки в исследовании — шаги и формулы - Национальный научный центр Фармаконадзора

Почему важно рассчитать размер выборки

Размер выборки (sample size) — это количество участников, необходимых для того, чтобы результаты исследования были достоверными и статистически значимыми.

Если выборка слишком мала — исследование может не выявить реальный эффект (высокий риск ошибки II рода).
Если выборка слишком велика — ресурсы будут потрачены излишне, а статистическая значимость может стать «искусственной».

Основные параметры расчёта

Чтобы рассчитать размер выборки, необходимо определить несколько ключевых показателей:

Уровень значимости (α) — вероятность ошибки первого рода.
- Обычно принимают 0,05 (5 %).
Статистическая мощность (1 − β) — вероятность выявить реальный эффект, если он существует.
- Чаще всего используют 80–90 %.
Ожидаемая разница (эффект) — насколько существенно отличаются сравниваемые группы.
Стандартное отклонение (σ) — степень разброса данных (по результатам пилотных исследований или литературы).
Тип анализа — одновыборочный, парный, двухвыборочный, пропорции или средние значения.

Базовая формула для количественных данных

Для двух независимых групп при сравнении средних используется формула:

$\frac{2 \times (Z_{1-\alpha/2} + Z_{1-\beta})^2 \times \sigma^2}{\Delta^2}$

где:

n — размер каждой группы,
Z₁₋ₐ/₂ — критическое значение нормального распределения при уровне значимости α (например, 1,96 для α = 0,05),
Z₁₋ᵦ — значение для требуемой мощности (например, 0,84 для 80 %),
σ — стандартное отклонение,
Δ — ожидаемая разница между средними значениями.

Пример расчёта

Предположим, исследователь хочет проверить, снижает ли новый препарат уровень холестерина по сравнению со стандартным средством.

α = 0,05
мощность (1 − β) = 0,8
σ = 15 мг/дл
ожидаемое снижение Δ = 10 мг/дл

$\frac{2 × (1.96 + 0.84)^2 × 15^2}{10^2} = 2 × (2.8)^2 × 2.25 = 2 × 7.84 × 2.25 = 35.3$

👉 Нужно по крайней мере 36 участников в каждой группе, то есть 72 участника всего.

Для категориальных данных (доли и проценты)

Если анализируются пропорции, формула будет иной:

$\frac{(Z_{1-\alpha/2})^2 \times p(1-p)}{E^2}$

где:

p — ожидаемая доля события (например, 0,3 для 30 %),
E — допустимая погрешность (например, 0,05).

Как упростить расчёт

Сегодня доступны онлайн-инструменты и программы, позволяющие автоматизировать вычисления:

OpenEpi (openepi.com)
ClinCalc Sample Size Calculator (clincalc.com/stats/samplesize.aspx)
G*Power — бесплатное приложение для Windows и macOS, популярное в биостатистике.

Эти ресурсы позволяют учитывать тип теста, мощность, дизайн и соотношение групп.

Советы исследователям

Всегда проводите предварительный расчёт до начала исследования.
Используйте данные пилотных исследований или литературные значения для оценки σ.
При мультицентровых исследованиях добавляйте 10–15 % участников “в запас” для компенсации выбывших.
При расчётах консультируйтесь со специалистом по биостатистике — это повысит достоверность и снизит риск ошибок.

Итог

Правильный расчёт размера выборки — это основа надёжности и воспроизводимости клинического исследования.
Он обеспечивает баланс между научной точностью и практической реализуемостью, помогая исследователям получать действительно значимые результаты.

Назначить встречу

Наши услуги