Почему важно рассчитать размер выборки
Размер выборки (sample size) — это количество участников, необходимых для того, чтобы результаты исследования были достоверными и статистически значимыми.
Если выборка слишком мала — исследование может не выявить реальный эффект (высокий риск ошибки II рода).
Если выборка слишком велика — ресурсы будут потрачены излишне, а статистическая значимость может стать «искусственной».
Основные параметры расчёта
Чтобы рассчитать размер выборки, необходимо определить несколько ключевых показателей:
-
Уровень значимости (α) — вероятность ошибки первого рода.
-
Обычно принимают 0,05 (5 %).
-
-
Статистическая мощность (1 − β) — вероятность выявить реальный эффект, если он существует.
-
Чаще всего используют 80–90 %.
-
-
Ожидаемая разница (эффект) — насколько существенно отличаются сравниваемые группы.
-
Стандартное отклонение (σ) — степень разброса данных (по результатам пилотных исследований или литературы).
-
Тип анализа — одновыборочный, парный, двухвыборочный, пропорции или средние значения.
Базовая формула для количественных данных
Для двух независимых групп при сравнении средних используется формула:
n=2×(Z1−α/2+Z1−β)2×σ2Δ2n = \frac{2 \times (Z_{1-\alpha/2} + Z_{1-\beta})^2 \times \sigma^2}{\Delta^2}
где:
-
n — размер каждой группы,
-
Z₁₋ₐ/₂ — критическое значение нормального распределения при уровне значимости α (например, 1,96 для α = 0,05),
-
Z₁₋ᵦ — значение для требуемой мощности (например, 0,84 для 80 %),
-
σ — стандартное отклонение,
-
Δ — ожидаемая разница между средними значениями.
Пример расчёта
Предположим, исследователь хочет проверить, снижает ли новый препарат уровень холестерина по сравнению со стандартным средством.
-
α = 0,05
-
мощность (1 − β) = 0,8
-
σ = 15 мг/дл
-
ожидаемое снижение Δ = 10 мг/дл
n=2×(1.96+0.84)2×152102=2×(2.8)2×2.25=2×7.84×2.25=35.3n = \frac{2 × (1.96 + 0.84)^2 × 15^2}{10^2} = 2 × (2.8)^2 × 2.25 = 2 × 7.84 × 2.25 = 35.3
👉 Нужно по крайней мере 36 участников в каждой группе, то есть 72 участника всего.
Для категориальных данных (доли и проценты)
Если анализируются пропорции, формула будет иной:
n=(Z1−α/2)2×p(1−p)E2n = \frac{(Z_{1-\alpha/2})^2 \times p(1-p)}{E^2}
где:
-
p — ожидаемая доля события (например, 0,3 для 30 %),
-
E — допустимая погрешность (например, 0,05).
Как упростить расчёт
Сегодня доступны онлайн-инструменты и программы, позволяющие автоматизировать вычисления:
-
OpenEpi (openepi.com)
-
ClinCalc Sample Size Calculator (clincalc.com/stats/samplesize.aspx)
-
G*Power — бесплатное приложение для Windows и macOS, популярное в биостатистике.
Эти ресурсы позволяют учитывать тип теста, мощность, дизайн и соотношение групп.
Советы исследователям
-
Всегда проводите предварительный расчёт до начала исследования.
-
Используйте данные пилотных исследований или литературные значения для оценки σ.
-
При мультицентровых исследованиях добавляйте 10–15 % участников “в запас” для компенсации выбывших.
-
При расчётах консультируйтесь со специалистом по биостатистике — это повысит достоверность и снизит риск ошибок.
Итог
Правильный расчёт размера выборки — это основа надёжности и воспроизводимости клинического исследования.
Он обеспечивает баланс между научной точностью и практической реализуемостью, помогая исследователям получать действительно значимые результаты.