Клиническая эпидемиология. Современные принципы и правила проведение клинических исследований. Понятие нулевой гипотезы, принципы рандомизации и стратифицированность в медицинских исследованиях.
Типы эпидемиологических исследований.
Идеальный эксперимент должен был бы базироваться на целом наборе условий, из которых только один фактор, воздействующий на интересующий нас результат, варьирует. Для того чтобы решить эту задачу, мы должны контролировать условия, которые могут воздействовать не результат. К сожалению, в биологических науках условия, воздействующие на большинство результатов настолько сложные, и настолько непонятные, что их невозможно сделать аналогичными у разных объектов. В исследовании причин возникновения рака, например, невозможно создать условия, которые бы, безусловно, приводили к возникновению рака после фиксированного временного интервала, даже при условии, что популяция состоит из группы клонированных лабораторных мышей. В результате этого всегда будет то, что называется «биологическая вариабельность», которая обозначает вариабельность в наборе условий, приводящих к появлению эффекта.
В биологических экспериментах, соответственно, идеал создания абсолютно одинаковых наборов условий, в которых только один фактор варьирует, является не реалистичным, (хотя многие могут сказать, что эта задача является не реалистичной и для других отраслей науки). Вместо этого экспериментатор пытается создать условия, в которых объем вариабельности факторов, имеющих возможность воздействовать на результат, небольшой, по сравнению с вариабельностью изучаемого ключевого фактора. Таким образом, невозможно сделать так, чтобы все животные в экспериментальной группе ели абсолютно одинаковое количество пищи, вариабельность потребления пищи может вызвать проблему, если она воздействует на результаты исследования. Однако, если эта вариабельность небольшая, то тогда она может и не оказывать очень сильного воздействия на результаты эксперимента. Исследователь обычно удовлетворяется, если вариабельность внешних факторов (иными словами факторов, отличающихся от ключевых исследуемых переменных) слишком мала для того, чтобы серьезно воздействовать на изучаемые результаты.
Эпидемиологические типы исследований корнями своими уходят в концепцию научного эксперимента. Когда эпидемиологические эксперименты возможны, их дизайн находится под контролем тех принципов, которые уменьшают вариабельность внешних факторов, по сравнению с факторами исследования. Эпидемиологические эксперименты включают клинические испытания (когда объектами исследования являются пациенты), полевые исследования (когда испытания проводятся над индивидами в данной общине), и общинные интервенционные исследования (когда воздействие производится на общину в целом). Когда эксперименты не возможны, эпидемиологические эпидемиологи разрабатывают не экспериментальные исследования, которые симулируют состояния (что могло бы произойти, если бы эксперимент был произведен). Не экспериментальные исследования включают когортные исследования, в которых объекты классифицируются (и возможно отбираются) в соответствии со статусом их воздействия и наблюдаются на протяжении определенного времени для того, чтобы оценить заболеваемость. Исследования по типу случай-контроль, в которых пациенты отбираются в соответствии со своим состоянием – больны они или нет – и затем классифицируются в соответствии с их воздействием. Исследования пропорциональной смертности, которые могут рассматриваться как подтип исследования по типу случай-контроль. Одномоментные исследования, включающие изучение распространенности и экологические исследования, в которых единицей наблюдения являются группы людей.
Экспериментальные исследования.
В эксперименте те, кто подвергается воздействию агента или предположительной причины, подвергаются этому воздействию только постольку, поскольку исследователь решил, что необходимо, чтобы это воздействие было приложено к объекту исследования. Более того, причина для назначения специфического воздействия определенному субъекту должна быть только для того, чтобы выполнить протокол исследования – иными словами, единственной причиной для направления в ту или иную группу должно быть соответствие протоколу, а не потребностям объекта исследования. Например, предположим, что врач, изучающий головную боль, прописывает запатентованное лекарственное средство своим более богатым пациентам, а более дешевый вариант – своим бедным пациентам (поскольку предполагаемая большая надежность патентованной версии, с его точки зрения, не стоит значительно больших затрат для тех, кто беден). Если затем врач захочет сравнить эффекты двух лекарственных средств, он не сможет рассматривать себя как человека, проводящего эксперимент, несмотря на то, что сам исследователь отнес людей в ту или иную группу. Для того чтобы провести адекватный эксперимент, он должен был бы назначать лекарственное средство в соответствии с протоколом, который бы снизил вариабельность между группами воздействия по отношению к другим потенциальным причинам головной боли. Распределение воздействия в экспериментальных группах должно помочь исследованию, а не индивидууму. Если исследование проводится для того, чтобы помочь индивидууму, тогда возможно провести не экспериментальное исследование, но оно не должно называться экспериментом. Иногда по отношению к контролируемым исследованиям используется термин квази -эксперимент: в таких исследованиях воздействие было назначено исследователем, но не в соответствии с рандомизированным экспериментальным протоколом (Cook и Campbell1979).
Клинические испытания.
Течение болезни, которую изучает эпидемиология имеет следующие этапы:
Первые три этапа, как правило, относительно хронических дегенеративных болезней имеют длительный период.
Вмешательство в ход болезни включает три компонента:
В клинической медицине использования эпидемиологии следующее:
Клиническое испытание – это эксперимент, при котором пациент используется в качестве объекта исследования. Целью клинического испытания является либо оценка возможного лечения данного заболевания, либо попытка поиска профилактических средств для предотвращения последствий заболеваний, таких как смерть или инвалидизация. Воздействие в клиническом испытании – это не первичные профилактические средства, (поскольку они не предотвращают появление самого заболевания), но они являются методами профилактики последствий исходного заболевания. Например, модификация диеты после того, как индивидуум перенес инфаркт миокарда, может предотвратить повторный инфаркт миокарда или смерть; или же применение химиотерапевтических препаратов у пациентов с онкологическими заболеваниями для предотвращения рецидива злокачественного новообразования.
Объекты в клинических исследованиях должны быть диагностированы как имеющие интересующее заболевание, и они должны быть включены в исследование вскоре после постановки диагноза для того, чтобы распределение на группы воздействия было сделано вовремя. Пациенты, чье заболевание слишком легкое или слишком тяжелое для того, чтобы применять данное лечение (или альтернативное лечение), должны быть исключены из исследования. Определение в группы должно быть произведено таким образом, чтобы минимизировать вариабельность внешних факторов, которые могут воздействовать на сравнение. Например, если некоторые врачи, принимающие участие в исследовании, предпочитают новую терапию, они могут влиять на распределение пациентов в группы, направляя в группу нового лечения своих собственных пациентов или, возможно, пациентов с более тяжелым течением заболевания. Понятно, что если пациенты с более тяжелым течением заболевания чаще будут получать новое лечение, достоверная оценка нового лечения станет невозможной.
Полевые испытания.
Полевые испытания отличаются от клинических испытаний в том, что они работают с индивидами, которые еще не заболели и поэтому не являются пациентами. В то время как пациенты в клинических испытаниях могут страдать от осложнений заболевания, с высокой вероятностью за относительно короткий промежуток времени, риск же возникновения заболевания в первый раз обычно относитально низок. Соответственно, полевые испытания обычно требуют значительно большего количества участников, чем клинические испытания, и поэтому они значительно дороже. Более того, поскольку участники испытаний не являются пациентами, приходящими в некий общий центр для получения лечения, полевые испытания очень часто требуют, чтобы к испытуемым приходили туда, где они обычно находятся (на работу, домой или в школу); или возникает необходимость создания центов, в которых можно производить это исследование, и куда индивидуумы будут обращаться. Это добавляет дополнительную стоимость планам исследования.
Популяционные вмешательства и кластерные рандомизированные испытания.
Полевые исследования, в которых к группам воздействия случайным образом относятся не индивидуумы, а группы пациентов, называются кластерно-рандомизированными. Чем больше размеры группы, которая является рандомизационной единицей по отношению к общему размеру исследования, тем меньше эффект от рандомизации. Если в исследование вовлечены только две популяции, одна из которых получает вмешательство, а другая – нет (как в исследовании по фторированию воды (Ast и соавторы, 1956), не имеет значения, получила ли община, в которой стали фторировать воду, свое воздействие случайно или нет), различия в базовых характеристиках все равно будут теми же самыми, вне зависимости от метода назначения воздействия; под воздействием может оказаться только направление различий. Если количество рандомизированных групп в каждом воздействии достаточно велико, рандомизация приведет к аналогичному распределению исходных характеристик среди групп вмешательств.
Неэкспериментальные исследования.
Целью всех исследований является получение достоверных доказательств по отношению к изучаемой гипотезе. В идеале мы бы хотели, чтобы качество доказательств и экспериментальных исследований было бы также высоко, как и те, что мы получаем от хорошо спланированного эксперимента. В эксперименте, однако, исследователь имеет возможность изменять свое воздействие таким образом, чтобы улучшить достоверность исследования, в то время как в не экспериментальных исследованиях, исследователь не может контролировать воздействия. Если те, кто оказывается под воздействием, имеют больший или меньший риск для возникновения заболевания, по сравнению с теми, кто не оказывается под воздействием, то простое сравнение между подвергшимися воздействию, и не подвергшимися воздействию, не будет адекватно отражать эффект самого воздействия.
Поскольку исследователь не может сам влиять на воздействие в не экспериментальных исследованиях, он (или она) должны полагаться на единственный источник отбора, который у них остается – а именно на пациента. Если парадигмой научного наблюдения является эксперимент, тогда парадигмой не экспериментальных эпидемиологических исследований является «естественный эксперимент», в котором природа эмулирует эксперимент. Наверное, наиболее известным примером прототипа всех известных естественных экспериментов является элегантное исследование холеры в Лондоне, выполненное Джоном Сноу (John Snow). В Лондоне в середине девятнадцатого века имелось несколько водопроводных компаний, которые доставляли питьевую воду жителям города. Естественный эксперимент Сноу состоял в том, что он сравнил смертность от холеры среди людей, которые получали воду от двух основных водопроводных компаний Southwark и Vauxholl, компании, которая прокачивала из реки Темзы воду, загрязненную канализационными стоками, и компании Lambeth, которая в 1852 году изменила место сбора от Hungerford Market на Thames Ditton, получив, таким образом, источник воды без канализационных загрязненний. Вот как Сноу (Snow, 1860) описал это:
Имеется два основных типа не экспериментальных исследований в эпидемиологии. Первый – это когортное исследование (так же называемое исследованием заболеваемости), является прямым аналогом экспериментов. Здесь сравниваются различные группы воздействия, но (как и в случае исследования Сноу) исследователь не назначает воздействия самостоятельно. Другое исследование – это исследование по типу случай-контроль, которое использует дополнительный шаг в формировании группы пациентов в зависимости от результата. Этот дополнительный выборочный шаг может привести к тому, что исследование по типу случай- контроль оказывается значительно более эффективным, чем когортное исследование популяции в целом, но оно приводит к тому, что появляются значительные возможности для систематических ошибок, отсутствующих в типичных когортных исследованиях.
Когортные исследования.
В классическом когортном исследовании исследователь определяет две или более группы людей, которые не имеют заболевания, отличающихся друг от друга воздействием на них потенциальной причины заболевания. Эти группы обозначаются как исследуемые когорты, (название происходит от латинского слова, обозначавшего одну из десяти единиц, составлявших римский легион). В подобных исследованиях имеется, по крайней мере, одна когорта, которую рассматривают как когорту, подвергавшуюся воздействию (индивидуумы, которые находились под воздействием возможной причины заболевания или условий) и другая когорта, которая рассматривается, как не подвергавшаяся воздействию (референтная когорта). Может быть более двух когорт, но каждая когорта будет представлять собой группу с различным уровнем воздействия. Например, профессиональное когортное исследование работников на химическом заводе может включать когорты пациентов на заводе, которые работают в различных подразделениях и в различных цехах этого завода, и каждая когорта подвергается воздействию различного набора химических веществ. Исследователь измеряет и сравнивает заболеваемость в каждой из этих когорт.
Многие когортные исследования начинаются с одной единой когорты, которая гетерогенна по отношению к воздействию. Сравнение заболеваемости делаются внутри подгрупп когорты, определяемой одним, или более воздействием. Примеры могут включать когортные исследования на лицах различных административных или социальных единиц таких, как когорты врачей, или медицинских сестер; или когорты, собранные из сотрудников определенных учреждений, рабочих заводов и т.д.
Исследование по типу случай-контроль.
Исследование по типу случай-контоль лучше всего понять, если мы определим популяцию, как источник, который представляет собой гипотетическую изучаемую популяцию, в которой могло бы быть проведено когортное исследование. Если проводится когортное исследование, то первичной задачей его, было бы идентифицировать числитель для тех, кто подвергся воздействие и для тех, кто воздействию не подвергся и измерить его в человеко-годах наблюдения (или как количество людей в каждой когорте), а затем идентифицировать количество случаев, возникающих в каждой категории или когорте. В исследованиях по типу случай-контоль случаи идентифицируются, и определяется статус их воздействия, точно также как и в когортном исследовании, но знаменатель, из которого могли бы быть рассчитаны показатели заболеваемости, не измеряется. Вместо этого контрольная группа берется из популяции, которая могла бы быть источником и для случаев.
Целью формирования контрольной группы является определение относительного (в противоположность абсолютного) размера знаменателей групп подвергавшихся и не подвергавшихся воздействию в исходной популяции. Из относительного размера знаменателей, мы можем оценить относительные размеры частоты. Таким образом, исследование по типу случай-контроль дает нам относительные показатели эффекта. Поскольку контрольная группа используется для оценки определения воздействия в исходной популяции, основным требованием при отборе контроля является то, что контроли должны выбираться независимо от статуса воздействия.
В целом исследования по типу случай-контоль отличаются от когортных исследований по тому, как отбираются пациенты. Когортное исследование идентифицирует пациентов и наблюдает за ними. Исследование по типу случай-контоль включает в себя дополнительный этап в отборе случаев и контроле из данной популяции. Более детальное обсуждение когортных исследований и исследований по типу случай-контоль будет представлено в главах 6 и 7.
Проспективные и ретроспективные исследования.
Исследования могут быть также классифицированы как проспективные, либо как ретроспективные. Мы определяем проспективное исследование, как исследование, в котором анализ воздействия и измерение других факторов был сделан до того, как возникло заболевание. В ретроспективных исследованиях эти показатели изучаются после того, как заболевание возникло.
Эксперименты – это всегда проспективное когортное исследование, поскольку исследователь вначале распределяет людей между группами воздействия, а затем должен ждать до того момента, пока не произойдет заболевание. С другой стороны, многие профессиональные когортные исследования являются ретроспективными, иными словами пациенты отбираются после того, как возникло заболевание.
Одномоментные исследования.
Исследование, которое включает в качестве объектов всех людей в популяции в некий момент, или репрезентативную выборку всех подобных людей, включая тех, кто имеет заболевание, и имеет своей целью описать популяцию в данный момент, обычно обозначается как одномоментное (или кросс-секционное) исследование. Одномоментное исследование, которое выполняется для того, чтобы определить распространенность, называется исследованием распространенности. Обычно информация о воздействии анализируется вместе с информацией о заболевании, таким образом, чтобы субпопуляции с различным воздействием могли бы быть сравнены в соответствии с распространенностью у них заболеваний.
Одномоментные исследования могут и не иметь этиологических задач. Например, предоставление услуг системы здравоохранения очень часто требует знания того, сколько единиц чего-то потребуется (например, количества больничных коек) без учета причин заболеваний. Тем не менее, данные по распространенности заболеваний очень часто используются для этиологических выводов, поэтому понимание ограничения этих методов является чрезвычайно важным.
Имеются аналитические методы, которые позволяют учитывать потенциальную связь между воздействием и продолжительностью заболевания (например, Simon, 1980b). Этот метод требует, чтобы мы получили даты постановки диагноза для всех случаев, или информацию о распределении продолжительности заболевания на различных уровнях воздействия. Даже при отсутствии связи между воздействием и продолжительностью заболевания, тем не менее, возникают проблемы, которые заключаются в том, что нынешнее воздействие может быть связано с теми воздействиями, которые были в то время, когда оно могло быть этиологически значимым для нынешнего заболевания. Подобное время отделено от настоящего двумя историческими периодами:
1. временем индукции между соответствующим воздействием и возникновением заболевания (которое остается гипотетическим до тех пор, пока не будут получены адекватные данные по времени индукции);
2. временем от возникновения заболевания до момента проведения исследования (которое мы можем измерить, желательно из медицинских записей).
ДОКАЗАТЕЛЬНАЯ МЕДИЦИНА. ВЛИЯНИЕ НОВОЙ МЕДИЦИНСКОЙ ТЕХНОЛОГИИ НА КЛИНИЧЕСКУЮ ПРАКТИКУ И НАУЧНЫЕ ИССЛЕДОВАНИЯ
ПРОБЛЕМА ТЕРМИНОЛОГИИ. Определение понятия доказательная медицина (ДМ) является наиболее интересным вопросом, так как корректное использование любого понятия предполагает правильное понимание обсуждаемого предмета. Основная суть терминологической проблемы заключается в использовании русскоязычного неологизма «ДМ». Перевод фразы «evidence base medicine», как «ДМ», неверен лексически и смещает суть понятия от вероятности изучаемого явления к бинарному понятию доказано-недоказано. Подтверждением этого также является абсолютно неверные переводы на русский язык двух наиболее известных англоязычных руководств по новым медицинским технологиям с акцентом на термине «ДМ». Это частично объясняет, почему в русскоязычном информационном пространстве так стремятся выкрасить научную информацию в два цвета, в соответствии с которыми эффективность лечебного средства оценивается как абсолютно полезное или абсолютно вредное. В противоположность этому современный язык ДМ основан на математических определениях вероятностей явлений.
В последнее время вместо ДМ появился новый термин «научно обоснованная медицина». Этот термин более точно отражает суть ДМ, но с нашей точки зрения содержит элементы тавтологии, так как медицина давно использует научные принципы. В связи с этим иногда ДМ называют наукой, что тоже неверно. Таким образом, необходимо признать ДМ устоявшимся, но несамодостаточным термином.
ДМ возникла как производное индустриальной эпохи, в которой конвейер является основой наиболее производительных технологий. Для этого ДМ пытается унифицировать клинические ситуации и применительно к ним использовать определенные схемы лечения, что, в целом, можно обозначить как технология лечения. Понятие технология определяется как совокупность знаний и сведений о последовательности определенных производственных операций. В ДМ знания – это принципы оценки качества клинической информации и ее применения, сведения – это собственно качественная клиническая информация, а последовательность производственных операций – это главные положения протоколов лечения. По этой причине мы предлагаем везде, где это возможно, использовать словосочетание «технологии ДМ». В этом случае будет ясно, что ДМ это способ медицинской практики, которая основана на определенных теоретических принципах оценки и использования качественной клинической информации.
МЕТОДОЛОГИЧЕСКИЕ ОСНОВЫ ТЕХНОЛОГИЙ ДМ.
Наиболее важные положения КЭ заключаются в том, что клиническое явления в КЭ обозначается в цифровом виде через вероятность при помощи целого ряда эпидемиологических характеристик. Все эти характеристики в цивилизованной модели медицины являются общепринятым языком общения клиницистов.
Наиболее важными научными категориями в КЭ являются понятия случайной и систематической ошибки. Эти понятия пришли в медицину из статистики. Основная задача КЭ заключается в определении принципов планирования и организации клинических исследований, в которых обеспечивается учет случайных и минимизация систематических ошибок.
Конечной точкой оценки результатов в КЭ являются исходы заболеваний, такие как смерть, наличие заболевания по данным набора референтных диагностических тестов, дискомфорт, инвалидизация, неудовлетворенность. Наиболее важно то, что оценка каких либо специальных диагностических тестов без связи с перечисленными исходами не могут быть предметом КЭ. Этот принцип очень важен в современных клинических исследованиях, в которых изучаются эффективность лечения и роль диагностических тестов в определении прогноза этой эффективности. В специальном исследовании Fleming T.R. и DeMets D.L. на примере результатов когортных исследований убедительно показано, как при различных заболеваниях использование суррогатных исходов в качестве критериев эффективности лечения приводит к ошибочным выводам по результатам сопоставления с наступившими клиническими исходами.
Биостатистика является одним из важнейших разделов КЭ, поэтому иногда сущность КЭ пытаются свести к статистическим методам исследования, но это неверно, так как статистика с одной стороны является всего лишь инструментом исследований, а с другой стороны это самодостаточная наука. При организации или оценке результатов клинических исследований наиболее важно выбрать или оценить дизайн исследования, который должен быть адекватен предмету исследования. Качество дизайна исследования характеризует методологическую зрелость ученого, который планирует исследование. В сборнике освежающего курса лекций европейского конгресса анестезиологов 2005 года в публикации по ДМ Smith A. приводит одно интересное замечание по поводу ценности статистики в научных публикациях. Он указывает, что по сравнению со статистикой в статье гораздо более важны используемый метод, способ формирования выборки, методы клинического наблюдения и как пациент представлен в анализе, то есть речь идет о дизайне исследования. Понимание типов дизайнов исследований – это, по сути, понимание сущности клинической эпидемиологии. Мы обозначили эту проблему в отдельной публикации, но анализ этой проблемы требует участие профессионалов эпидемиологов. В то же время некорректное использование статистических методов сводит на нет результат любого клинического исследования. Отечественные проблемы биостатистики прекрасно освещены на сайте «Биометрика» (http://www.biometrica.tomsk.ru) в работах В.П.Леонова. В двух наших публикациях, на конкретных примерах, в том числе по материалам крупного форума анестезиологов Европы, показаны возможности манипулирования мнением читателя при использовании некачественной статистики.
РЕАЛЬНОЕ МЕСТО ТЕХНОЛОГИЙ ДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ В СОВРЕМЕННЫХ ПРИНЦИПАХ ПРИНЯТИЯ КЛИНИЧЕСКОГО РЕШЕНИЯ. Несмотря на то, что технологии ДМ являются в настоящее время основой организации моделей здравоохранения большинства развитых стран, они не могут сразу и не должны полностью заместить прежние принципы клинической практики. Наш анализ использования технологий ДМ в развитых странах со сложившимися традициями изучения КЭ показывает, что при принятии клинического решения врач опирается на целый ряд иных факторов, которые относятся к особенностям медицинского учреждения, уровню подготовки врача, предпочтениями пациента и др.
В модели, как один из компонентов обозначены собственно технологии ДМ, которые описываются ранее приведенной моделью. Остальные структурные составляющие модели являются традиционными факторами, которые реально, в той или иной мере, влияют на принятие клинического решения. Справа определены факторы, которые до возникновения эры ДМ являлись главными в прежней модели клинической практики. Слева в закрашенных блоках обозначены «антипринципы» клинической практики, которые исходят, прежде всего, из международных этических деклараций и выражены такими категориями, как «некомпетентность» и «обман». Эти антипринципы всегда присутствуют в той или иной мере в реальной жизни, и поэтому должны оставаться объектом внимания в аналогичных исследованиях и реальной жизни.
Основным фактором выбора клинического решения остаются предпочтения пациента при полном информировании последнего. Этот принцип подтвержден последними международными декларациями по использованию технологий ДМ, в частности, Сицилийской декларацией, которая одобрена 5.01.2005 [http://www.biomedcentral.com/1472-6920/5/1]. Для стран постсоветского пространства такая модель может вызвать затруднения, так как не только врачи не готовы представить полную информацию пациенту, но и пациенты не склонны самостоятельно принимать решения. Об этом в частности говорится в одной из лекций Gelman S на последнем европейском съезде анестезиологов. На основе специальных исследований автор утверждает, что россияне, филиппинцы и южноамериканцы не приучены принимать решения, в то время как в Северной Америке врач ожидает принятия решения пациентом, и ему неудобно давать прямые рекомендации.
Определение функциональных взаимосвязей между структурными компонентами модели является наиболее интересной и актуальной задачей. Ее решение – удел национальных врачебных ассоциаций. На роль каждого фактора в принятии клинического решения будут влиять законы, и нравы общества. Такая национальная модель с согласованными принципами оценки роли каждого фактора, позволяет провести анализ принятия клинического решения в конкретной ситуации, дать ему профессиональную и этическую оценку. Декларация этой модели в медицинском сообществе будет формировать системное представление о сущности клинического решения.
Таким образом, освоение технологий ДМ несет целый ряд жизненно необходимых для социума изменений в медицину и клиническую науку, во взаимоотношения пациента с врачом и врача с государством. Эти изменения основываются на этических приоритетах здоровья и жизни каждого отдельного человека, требуют от врача и ученого освоения новых знаний путем активного использования новых информационных технологий. Реализация этих изменений в значительной степени зависит от активности в этих вопросах общественных ассоциаций специалистов.