
Программные продукты расчета размера выборки. Или… на софт надейся, но и сам не плошай.
Обновлено: 4 сент. 2018 г.
Ни один из элементов триал-дизайна так не сближает медицинского писателя и биостатистика как расчет размера выборки…а потом перерасчет…перерасчет… и префинальный перерасчет :)

В жаркий период разработки концепции, жонглирования первичными конечными точками, популяциями и субпопуляциями, получения неожиданных ценных указаний от фармкомпании-разработчика, метания между допустимыми рисками и бюджетными возможностями, когда крайне важно иметь возможность оперативно выполнять расчеты, на помощь приходят они – программные калькуляторы размера выборки.
Должен признаться, долгое время состоял в секте «последователей всемогущего PASSа», и был удивлен, что иноверцы не только существуют, но их оказывается большинство. Так, например, в 2016-2017 годах в США лидером был программный продукт nQuery, в этот период он был использован для расчета размера выборки в большинстве (80-90%) одобренных FDA клинических исследований.
Говоря о софте, следует сразу отметить, что для расчета размера выборки могут быть использованы и классические многофункциональные статистические пакеты с встроенными инструментами оценки мощности:
IBM SPSS – ссылка на сайт
JMP (подразделение SAS) – ссылка на сайт
NCSS – ссылка на сайт
SIGMASTAT – ссылка на сайт
STATISTICA – ссылка на сайт
MatLab – ссылка на сайт
Origin – ссылка на сайт
и др.
Но гораздо более удобными и практичными являются узкоспециализированные самостоятельные программы «мощность-выборка».
Программные продукты расчета размера выборки (данные на август 2018)

* Активные ссылки на сайты разработчиков:
1 - https://www.statsols.com/nquery
2 - https://www.ncss.com/software/pass/
3 - http://www.gpower.hhu.de/en.html
4 - https://www.power-analysis.com/software_overview.htm
5 - https://www.stata.com/new-in-stata/
Как и в случае программного обеспечения из других сфер конкуренция разработчиков неминуемо ведет к универсализации продуктов. Зачастую выпуск обновленных версий основан на активном заимствовании интерфейса и инструментов у более успешных конкурентов.
Особенностью интерфейса nQuery является ввод данных в развернутые таблицы, в которых каждый столбец отведен для отдельного сценария. В то время как в PASS, GPOWER, POWER AND PRECISION выполняется заполнение соответствующих специализированных модулей (боксов).
Для наглядности рассчитаем размер выборки с одинаковыми вводными в двух программах лидерах – nQuery и PASS.
Так выглядят окна ввода и результат расчета:

А вот так графическое представление зависимости «мощность-выборка»:

Провести сравнение на одном и том же компьютере мне не удалось. Так как PASS не устанавливается на MacOS, программа разработана только для Windows. Учитывая в целом схожие функциональные возможности программ, думаю что именно повсеместная распространённость MacOS и определила столь высокую популярность nQuery в США.
До недавнего времени в качестве обоснования размера выборки российский регулятор принимал перечисление значений использованных в расчетах параметров и указание на то, что расчет произведен при помощи соответствующего программного продукта. Сейчас же все чаще эксперты просят представить исходную формулу расчета. Пока сложно сказать позитивная это тенденция или нет и будет ли официальное признание какого-либо софта регулятором. В любом случае необходимое описание методики расчета и ссылки на литературные источники можно позаимствовать из соответствующих разделов интегрированных в nQuery и PASS справочников/путеводителей.
А каким софтом пользуетесь вы? Коллеги, оставляйте свои комментарии – составим свой рейтинг программного обеспечения.
Предметные вопросы по конкретному софту можно обсуждать в соответствующей ветке «Софт» форума сообщества.