Выбор ожидаемых исходов (конечных точек, endpoints) РКИ



Как упоминалось выше, регистрируемые исходы (endpoints) бывают истинные и суррогатные. Истинные исходы отражают наступление реальных клинически значимых событий в жизни исследуемого лица; это могут быть, например, развитие какого-либо заболевания либо его осложнения, выздоровление или смерть больного, неудача лечения, появление побочного эффекта терапии. Суррогатные же исходы – обычно достижение определенного уровня каким-либо показателем, полученным при лабораторных либо инструментальных исследованиях (например, уровня CD4+ лимфоцитов, вирус-нагрузки плазмы крови, холестерина и т.п.). Суррогатные исходы косвенно указывают на развитие тех или иных истинных исходов (например, неудачи лечения или обострения заболевания), но сами таковыми не являются, поскольку представляют собой лишь симптом, вырванный из контекста общего патологического процесса; как правило, они неспецифичны для изучаемого состояния. В целом, не рекомендуется использовать суррогатные исходы вместо истинных; тем не менее, их применение возможно, если достоверно известно, что суррогатный исход надежно коррелирует с истинным и полностью отражает влияние изучаемого воздействия на клинический исход.

Одновременно может анализироваться несколько исходов; в этом случае выделяют более важные первичные исходы (например, развитие заболевания, выздоровление или смерть больного) и менее важные вторичные (нередко – суррогатные: достижение пороговых уровней тех или иных лабораторных показателей, отказ от терапии, завершение курса лечения, появление побочных эффектов терапии и т.д.). Первичные исходы должны соответствовать основной цели проводимого исследования. Два или более независимых события, последовательного или одновременного наступления которых ждет исследователь, могут объединяться в т.н. составной ( composite) исход (например, развитие СПИДа и/или смерть больного).

Ввиду вынужденной кратковременности РКИ в качестве регистрируемых исходов («конечных точек», endpoints) исследования обычно используют подходящие суррогатные маркеры. Более важные для понимания результатов изучаемого вмешательства «истинные» исходы за время проведения РКИ обычно не успевают развиться; особняком стоят случаи сравнения терапевтических схем, используемых для лечения острых заболеваний, где истинный исход (полное выздоровление, хронизация заболевания либо смерть больного) наступает в сроки, сравнимые с общей продолжительностью курса терапии.

Контролируемые исходы необходимо подбирать, исходя из целей и задач планируемого исследования; при этом сами цели и задачи должны быть четко сформулированы, реальны, разумны и достижимы, а квалификации и оснащения исследователей должно гарантированно хватать для надежной регистрации намеченных endpoints, иначе смысла проводить исследование нет.

 

Выбор методов статистической обработки и анализа результатов РКИ

Аналитическая ценность любого РКИ напрямую зависит от полноты и качества регулярного сбора мониторируемых показателей у всех его участников. При анализе необходимо брать в расчет показатели всех пациентов, рандомизированных в ходе исследования. При публикации результатов РКИ необходимо указывать количество его участников: 1) прошедших рандомизацию, 2) получивших сравниваемые вмешательства и 3) покинувших исследование до его завершения. В идеале, должны анализироваться все пациенты, которые при отборе добровольцев в РКИ подошли по критериям включения (включая сюда и анализ документированных причин отказа от участия). Для каждой из сравниваемых групп необходимо представить баланс важных мониторируемых факторов (ковариат) на момент начала исследования (пример см. в таблице ниже):

 

Медиана признака: Кормление грудью n=212 Кормление смесями n=213
возраст 23 23
образование, лет 8 8
гемоглобин (г/л) 110 108
CD4+ (в 1 мкл) 399 415
копий РНК ВИЧ в плазме /мл 47000 38000
Субтип А ВИЧ, % 68 72
Субтип D ВИЧ, % 23 18
Замужем, % 75 78

 

Основа анализа данных РКИ – непосредственное сравнение частоты / выраженности исходов в сравниваемых группах. Поскольку считается, что рандомизация «выравнивает» сравниваемые группы по всем принципиально важным показателям, для их сравнения рекомендуется использовать простые статистические тесты (см. таблицу с рекомендациями ниже). При этом в сложных методах анализа нет необходимости, поскольку вся разница между группами на момент окончания исследования считается проистекающей исключительно из различий в применяемых вмешательствах. Соответственно, нет смысла учитывать прочие факторы, кроме собственно сравниваемых схем терапии.

При публикации результатов необходимо представить читателю «эффективность лечения» (разницу в исходах между сравниваемыми группами), ее 95% доверительный интервал (ДИ) и величину р (т.е. вероятность достоверности нулевой гипотезы).

Обычно при анализе результатов РКИ используется принцип «каждая попытка засчитывается» (intention to treat). Данный принцип включает 2 положения:

1. При анализе результатов учитываются все участники РКИ, прошедшие рандомизацию. Указанное положение может потребовать использования в ходе исследования допущений вида «неявка = неудача вмешательства» и «данные последнего (перед исчезновением больного) обследования = данные на момент окончания исследования»;

2. Даже если доброволец, рандомизированный в одну из сравниваемых групп, в дальнейшем отказался от участия в исследовании до его завершения либо настоял на смене схемы терапии (т.е. переходе в другую группу), анализ производится так, как если бы данный больной входил в ту группу, в которую он был исходно распределен.

Следование принципу «каждая попытка засчитывается» (т.е. «попытка = пытка») позволяет оценить эффект вмешательства в условиях, приближенных к реальным.

Альтернативный, реже используемый принцип учета результатов клинических испытаний носит название «в соответствии с протоколом» (“ per protocol”), или «пролеченные» (“on treatment”). В этом случае финальному анализу подвергаются только данные, полученные от пациентов, идеально соответствующих всем требованиям утвержденного протокола РКИ. Добровольцы, прошедшие рандомизацию, но отказавшиеся в дальнейшем от участия в исследовании по любой причине, а также лица, настоявшие на смене терапии на альтернативную (перешедшие в другую группу сравнения), удаляются из анализируемого массива; при этом изучаемая выборка уменьшается, а мощность исследования падает. Данный подход полезен в том случае, когда необходимо изучить особенности действия принципиально нового препарата либо эффекта от впервые вводимого в практику вмешательства; при этом очень важно, чтобы анализировались только данные, полученные от лиц, действительно получивших данные препарат / вмешательство, причем полным курсом / в полном объеме.

Следует учесть, что принцип “on treatment” не позволяет оценить реальные клинические перспективы нового препарата либо вмешательства, связанные с возможными неудобствами при его приеме, побочными эффектами, снижением качества жизни и т.п.; эти факторы поддаются учету только при использовании подхода “intention to treat”.

 

Для непосредственного сравнения эффективности вмешательств в анализируемых группах рекомендуются следующие статистические методы:

 

Вид данных Параметрический тест Непараметрический тест

Непрерывный ряд данных (количественные и порядковые переменные)

Попарные сравнения (н-р, параметр до- и после вмешательства) в пределах одной группы испытуемых Парный (одновыборочный) t-тест Ранговый знаковый тест Уилкоксона (Wilcoxon)
Непарные данные (одна и та же переменная, две независимые выборки) Непарный (двухвыборочный) t-тест U-тест Манна-Уитни (Mann-Whitney)
Непарные данные (одна и та же переменная, три и более независимые выборки) ANOVA (дисперсионный анализ) Тест Краскела-Уоллиса (Kruskal-Wallis)

Бинарные данные (номинальные переменные)

Сравнение двух и более групп

Тест по критерию Chi-квадрат (χ2), точный тест Фишера

 

Параметрические тесты применимы только для сравнения нормально (по Гауссу) распределенных данных (во всех сравниваемых группах!), непараметрические тесты могут использоваться для сравнения выборок данных с любым характером распределения. В то же время параметрические тесты более чувствительные (менее строгие), а непараметрические - существенно менее чувствительные (т.е. более строгие); при сравнении нормально распределенных данных непараметрическими методами можно не найти значимых различий там, где они в реальности имеются. Ввиду этого перед статистической обработкой данных необходимо выполнять анализ нормальности их распределения (н-р, по методу Колмогорова-Смирно­ва-Лиллиефорса (Lilliefors)), и, если во всех рассматриваемых группах сравниваемые данные окажутся нормально распределенными, необходимо использовать для сравнения именно параметрические методы, в противном случае (т.е. если хотя бы в одной из сравниваемых групп распределение данных окажется отличным от нормального) – только непараметрические. Подробный анализ методов статистической обработки данных выходит за рамки данной главы; интересующимся рекомендуется обратиться к Главе II, а также [6] и [9].

Важный аспект проблемы – расчет оптимального размера выборки исходя из ожидаемого характера распределения сравниваемых данных. Поскольку параметрические методы сравнения являются менее строгими, они требуют меньшего размера сравниваемых групп для нахождения заданных различий (т.е. для обеспечения требуемой разрешающей способности исследования) – по сравнению с непараметрическими методами. Соответственно, если заранее известно, что исследуемый параметр нормально распределен в популяции, можно достичь экономии времени и средств за счет некоторого уменьшения размеров сравниваемых групп; неоправданное же увеличение формируемой выборки (и, соответственно, расходов) нередко крайне болезненно (вплоть до судебных исков) воспринимается спонсорами РКИ.

 

Вообще, в РКИ преимущественно встречаются следующие подходы к статистической обработке данных:

1) Доказать превосходство схемы А над схемой В или наоборот (superiority test),

2) Доказать эквивалентность (сопоставимость) схем/препаратов А и В (equivalence test),

3) Доказать, что схема А не хуже схемы В или наоборот (non-inferiority test).

Тест на превосходство является наиболее типичным случаем анализа данных РКИ. При этом в ходе исследования необходимо доказать, что доверительный интервал эффективности любого из испытуемых препаратов целиком лежит над аналогичным доверительным интервалом другого препарата, что подтверждается вышеприведенными статистическими тестами.

Тест на эквивалентность обычно используется при сравнении лекарств-генериков с оригинальными препаратами, а также при сравнении нового препарата с заданным эффектом с ранее существующим «эталонным» препаратом с аналогичным эффектом. В этом случае предполагается приблизительное равенство терапевтического эффекта, но меньшая токсичность, стоимость либо большее удобство приема нового препарата по сравнению с уже существующим. При таком подходе важен расчет доверительного интервала показателя эффективности, который должен быть как можно более узким, что обеспечивается большим размером сравниваемых групп. Необходимо заранее оговорить «рамки эквивалентности» лечебного эффекта, т.е. такую разбежку его показателей, внутри которой разница между сравниваемыми препаратами будет несущественна для клинициста. В случае эквивалентной эффективности сравниваемых препаратов их доверительные интервалы будут полностью укладываются в диапазон «эквивалентности», а узкие рамки доверительных интервалов в обоих группах при этом гарантируют определенность сделанного вывода о равенстве эффектов.

Тест на эквивалентность обычно требует примерно вдвое большего размера групп сравнения по сравнению с тестом не превосходство.

Тест на отсутствие неполноценности (non-inferiority) идейно схож с тестом на превосходство. Он используется в случае, когда предполагается, что вновь созданный препарат может несколько уступать в эффективности ранее существующему, но будет дешевле, менее токсичен и/или более удобен при приеме. Цель РКИ в данной ситуации – доказать, что эффективность нового препарата не ниже некоторой заранее оговоренной приемлемой планки. Данная цель требует, чтобы доверительный интервал эффективности испытуемого препарата полностью находился над минимально допустимым ее уровнем – «планкой»; соответственно, ДИ должен быть достаточно узким, вследствие чего размер выборки в тесте на отсутствие неполноценности нередко существенно больше, чем в тесте на превосходство.

При проведении любого РКИ всегда имеется вероятность того, что какая-либо из сравниваемых схем лечения окажется существенно хуже другой (т.е. терапевтический ее эффект будет менее выражен, либо частота побочных эффектов значительно выше). Естественно, с того момента, как значимое превосходство одного из сравниваемых вмешательств над другим окажется очевидным для исследователей, лечить больных менее эффективной схемой терапии станет неэтично, и можно поднять вопрос о преждевременном прекращении РКИ. Чтобы сделать такой ход событий возможным, в протоколе РКИ предусматривается промежуточный анализ результатов, проводимый по тем же принципам и теми же методами, что и окончательный. В случае получения статистически высокозначимых (р<0,0001) различий между эффективностью сравниваемых вмешательств исследование может быть преждевременно прекращено. При этом промежуточный анализ должен определенно продемонстрировать, что:

1. новое лечение явно лучше стандартного, либо

2. новое лечение явно хуже стандартного, либо

3. новое лечение явно не лучше стандартного/контрольного (т.н. «остановка вследствие тщетности»). С этической точки зрения, принять решение об остановке РКИ (при наличии обоснованных поводов) необходимо как можно быстрее, особенно в случае (3).

Фазы РКИ с параллельным дизайном схематично показаны на рис. 24. Уменьшение размера шрифтов символизирует уменьшение размеров сравниваемых групп к моменту окончательного анализа полученных данных.

 

 

Рис. 24. Фазы РКИ с параллельным дизайном (пояснения см. в тексте).

 


Дата добавления: 2019-02-22; просмотров: 402; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!