Основы биостатистики во внутренней медицине

advertisement
Реферат на тему:
« Основы биостатистики во внутренней медицине»
АКТУАЛЬНОСТЬ СТАТИСТИКИ В МЕДИЦИНЕ
Статистика в медицине является одним из инструментов анализа
экспериментальных данных и клинических наблюдений, а также языком, с
помощью
которого
сообщаются
полученные
математические
результаты.
Статистическая обработка медицинских исследований базируется на принципе
того, что верное для случайной выборки верно и для генеральной совокупности
(популяции), из которой эта выборка получена. Однако выбрать или набрать
истинно случайную выборку из генеральной совокупности практически очень
сложно. Поэтому следует стремиться к тому, чтобы выборка достаточно адекватно
отражала все возможные аспекты изучаемого состояния или заболевания в
популяции.
ВИДЫ СТАТИСТИЧЕСКИХ ДАННЫХ В МЕДИЦИНЕ
Статистические данные могут быть представлены как количественными
(числовыми непрерывными или дискретными), так и качественными
(категориальными порядковыми или номинальными) переменными.
Количественные (числовые) данные предполагают, что переменная
принимает некоторое числовое значение. Из них выделяют дискретные данные,
которые могут принимать строго определённые значения, в то время как
непрерывные могут быть представлены любыми значениями. Уникальным
примером количественных данных является представление возраста двумя типами:
в виде непрерывной переменной – указывается точный возраст пациента, и в виде
дискретной переменной – указывается только количество полных лет (50,3 года и
50 лет; 50,9 года и 51 год).
Категориальность является основой смыслового понимания качественных
переменных. Категориальные данные применяются для описания состояния
объекта путем присвоения ему номера, соответствующего категории, к которой
этот объект принадлежит. Важным условием для применения категориальных
данных является принадлежность одного объекта исследования только к одной
возможной категории для одного критерия.
Качественные номинальные данные используются в том случае, если
категории не упорядочены. Числа в данном случае являются лишь обозначением
для состояния объекта и не упорядочивают это состояние. Например, по полу: 1 –
мужской, 2 – женский.
Качественные порядковые (ранговые, ординарные) данные – данные, для
которых категории могут быть упорядочены. Например, от плохого самочувствия к
хорошему: 1 – хорошее, 2 – удовлетворительное, 3 – плохое. На практике часто
используется перевод количественных данных в качественное категориальное
упорядоченное представление, особенно при расчётах пороговых значений (cut-off)
для последующих расчётов характеристик риска или прогностической значимости
с использованием таблицы сопряжённости.
ТИПЫ СТАТИСТИЧЕСКОГО АНАЛИЗА ДАННЫХ
В практике обработки результатов проведённых исследований используются два
типа статистического анализа данных — первичный (запланированный) и
вторичный (незапланированный).
Первичный
анализ
данных
—
используется
для
изучения
и
описания
закономерностей, существование которых предполагается исследователем, и
которые
являются
анализируются
собственно
признаки,
гипотезой
изучение
исследования.
которых
учтено
В
при
таком
случае
планировании
исследования, и проверяются заранее сформулированные гипотезы.
Вторичный анализ данных — используется для формирования перспектив
проведённого исследования, поиска, разведки потенциальных закономерностей и
гипотез. В таком случае выполняется «просеивание» незапланированных в
конкретной работе данных, что часто бывает целесообразно уже на первом этапе
знакомства с данными.
ОПИСАТЕЛЬНАЯ СТАТИСТИКА
Одной из основных составляющих любого анализа данных является описательная
статистика (дескриптивная). Её главной задачей является предоставление сжатой и
концентрированной характеристики изучаемого явления в числовом и графическом
виде.
Показатели описательной статистики можно разбить на несколько групп:
- показатели положения, описывающие положение экспериментальных
данных на числовой оси. Примеры таких данных – максимальный и
минимальный элементы выборки, среднее значение, медиана, мода и др.;
- показатели разброса, описывающие степень разброса данных
относительно центральной тенденции. К ним относятся: выборочная
дисперсия, разность между минимальным и максимальным элементами
(размах, интервал выборки) и др.;
- показатели асимметрии: положение медианы относительно среднего
- графические представления результатов – гистограмма, частотная
диаграмма и др.
Наиболее часто употребляемыми критериями для проверки гипотезы о законе
распределения являются критерий Пирсона, критерий χ2 и критерий КолмогороваСмирнова: при отличии распределения признака в изучаемой выборке от
нормального распределения со статистической значимостью менее 0,05 (p<0,05)
распределение признака в выборке признаётся ненормальным, и наоборот.
Основными типами распределений признаков являются: дискретные
(для дискретных признаков – биномиальное, распределение Пуассона,
распределение Бернулли) и непрерывные (для непрерывных признаков –
нормальное
(распределение
Гаусса),
логнормальное,
постоянное,
экспоненциальное, χ2). В соответствии с типом распределения применяется два
принципа статистической обработки: параметрический и непараметрический.
Параметрический
принцип
включает
все
методы
анализа
нормально
распределенных количественных признаков.
Непараметрический принцип используется во всех остальных случаях – для
анализа количественных признаков независимо от вида их распределения и
для анализа качественных признаков.
При нормальном распределении все три показателя (среднее, медиана, мода) более
или менее совпадают, а при асимметричном распределении — нет.
Мода (Мо) — это наиболее частое значение в выборке, или среднее значение
класса с наибольшей частотой. Мода используется чаще всего для того, чтобы дать
общее представление о распределении. В некоторых случаях у распределения
могут быть две моды, в таком случае это свидетельствует о
бимодальном распределении, что указывает на наличие двух относительно
самостоятельных групп.
Медиана (Me, Md) соответствует центральному значению в
последовательном ряду всех полученных значений или среднему значению
наиболее часто встречающихся значений выборки. Медиана используется для
представления дискретных переменных или
количественных непрерывных
переменных с ненормальным распределением.
Среднее арифметическое (М) — это показатель центральной тенденции,
полученный делением суммы всех значений данных на число этих данных.
Среднее арифметическое используется
для представления
количественных
переменных с нормальным распределением.
В медицине объектами наблюдения выступают сложные системы, значительно
различающиеся по своим свойствам, что определяет практическое отсутствие
истинного значения параметра. В действительности,
определяется не точное значение, а диапазон, в который укладывается
большинство значений исследуемого признака. Поэтому оптимальным описанием
ширины распределения в медицинских исследованиях принимается доверительный
интервал с указанием нижней (5%) и верхней (95%) границы.
Наиболее адекватная непараметрическая характеристика ширины – это
квантили. Квантили представляют собой частоту попадания значений переменной
в определённые интервалы. Чаще всего используется разделение на 10 (по 10%)
или на 4 интервала (25%, 50%, 75%). Разделение на четыре квантиля является
одним из наиболее компактных и удобных.
Для качественных данных единственной корректной характеристикой будет
являться
число
объектов
с
данным
конкретным
значением
критерия.
Представляются подобные данные в виде гистограммы или количества объектов с
данным конкретным значением критерия относительно общего количества
объектов.
ИНДУКТИВНАЯ СТАТИСТИКА
Задачей индуктивной статистики является проверка статистических
гипотез о законе распределения, а основной областью применения –
использование в медико-биологических исследованиях для сравнения двух
разных выборок на предмет принадлежности к общей генеральной
совокупности. Принадлежность двух выборок к одной генеральной
совокупности свидетельствует об отсутствии различия между ними.
Для этого формулируются статистические гипотезы:
- Н0 гипотеза об отсутствии различий (нулевая гипотеза);
- Н1 гипотеза о значимости различий (альтернативная гипотеза).
Теория вероятностей в основе своей оперирует понятием допустимой
ошибки, и ошибка является обязательным компонентом статистического
анализа, влияющая на р-значение. Допустимый уровень ошибок, от которого
зависит р-значение, выбирается исследователем. В медико-биологических
исследованиях принято использовать два вида ошибок: ошибка первого рода,
которой соответствует понятие уровня статистической значимости α (альфа),
и ошибка второго рода β (бета), которой соответствует понятие статистической
мощности 1-β.
Ошибка первого рода (уровень значимости α) – допустимость
ошибочного признания различий, то есть альтернативной гипотезы
Ошибка второго рода β (статистическая мощность 1-β) – допустимость
ошибочного отказа от наличия различий или ошибочное признания нулевой
гипотезы, обусловленное недостаточным количеством данных.
При адекватной статистической мощности отсутствие статистических значимых
различий действительно признаётся таковым. При неадекватной мощности нельзя
утверждать об эквивалентности (схожести) групп.
Выборки могут быть независимыми, если идёт сравнение
контрольной и опытной группы, или зависимыми, если обе выборки
представлены одними и теми же пациентами до и после вмешательства.
На основании информации о результатах наблюдений (характеристиках членов
экспериментальной и контрольной групп) вычисляется число, называемое
эмпирическим значением критерия. Это число сравнивается с известным
(заданным таблично) эталонным числом, называемым критическим значением
критерия. Математическим результатом такого сравнения является р-значение.
Главная задача исследователя при использовании индуктивной
статистики заключается в формулировке статистических гипотез и выборе
правильного статистического критерия для проверки этих гипотез.
ОСНОВЫ ДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ
Доказательная медицина (evidence based medicine) - это раздел медицины,
основанный на доказательствах, предполагающий поиск, сравнение, обобщение и
широкое распространение полученных доказательств для использования в
интересах больных.
Все исследования можно подразделить на 2 типа - первичные и вторичные.
К первичным исследованиям относятся:
а)
эксперименты
на
животных
или
добровольцах
в
искусственных
и
контролируемых условиях;
б) клинические испытания, при которых вмешательство, например, лекарственную
терапию, проводят на группе пациентов с последующим ее
наблюдением;
в)
исследования,
при
которых
различные
параметры
(гигиенические,
физиологические, эпидемиологические и т.д.) измеряют в группах людей.
Вторичные исследования — это:
а) обзоры (несистематические – обобщение результатов первичных исследований;
систематические - обобщение первичных исследований
на основе жестких критериев; метаанализ - обобщение количественных данных
нескольких исследований);
б) клинические рекомендации - сформулированные выводы из первичных
исследований, касающихся требований к действиям врача;
в) анализ принятия решений - на основе первичных исследований формирует
подходы к управлению здравоохранением или распределе­
нию ресурсов, позволяет строить "древо" решений, которые принимают врачи,
пациенты или администраторы при выборе способов лечения или при
распределении ресурсов;
г) экономический анализ - на основе результатов первичных исследований делает
вывод о целесообразности финансирования определенных вмешательств.
Достоверность результатов, полученных в ходе различных исследований,
определяется применением международных рекомендаций и стандартов:
на доклиническом этапе исследования — применением международных стандартов
качественной лабораторной практики GLP (Good Laboratory Practice); на
клиническом этапе исследования - применением международных стандартов
качественной клинической практики GCP (Good Clinical Practice), международных
мультицентровых клинических испытаний (ММКИ);
при использовании биостатистики (во время планирования исследования,
обработки и анализа полученных данных) — применением международных
стандартов качественной статистики GSP (Good Statistical Practice);
при производстве, транспортировке, хранении и отпуске лекарств - соблюдением
международных стандартов производства лекарств и аптекарских стандартов GMP
(Good Manufactured Practice), GPhP (Good Pharmaceutical Practice)
О доказательности и информативности результатов, полученных в ходе различных
исследований, можно судить по принятым критериям качества доказательств. Так,
по экспертной оценке Шведского совета по технологии оценивания качества
доказательств в здравоохранении, доказательства по качеству распределяются (по
нарастающей):
• описание отдельных случаев
• результат наблюдений
• поперечные (перекрёстные) исследования
• исследования типа "случай-контроль" (для выявления этиологии заболеваний определение патогенного фактора в прошлом)
• когортные исследования (две или более группы, дополнительные наблюдения за
здоровыми лицами, используют для прогноза заболеваемости)
• нерандомизированные испытания с историческим контролем
• нерандомизированные испытания с одновременным контролем
• рандомизированные двойные слепые контролируемые испытания
• систематические обзоры и метаанализы
Требования к уровню проведения экспериментальных (доклинических) испытаний
можно условно разделить на две составляющие.
Первая - это требования и рекомендации по планированию и проведению
экспериментов, подразумевающие наличие четкой структуры исследования и
соблюдения общепринятых международных норм при его выполнении.
Вторая составляющая требований - это требования к материально-технической
базе при проведении доклинических исследований.
Клинические исследования принято подразделять на следующие фазы:
I фаза - клинико-фармакологическое исследование (служит для изучения
фармакокинетических
свойств
и
подтверждения
безопасности
нового
лекарственного средства (5-10 добровольцев);
II фаза - пилотные (фаза Па) и контролируемые (фаза Пб) исследования (100-200
больных);
Па - поиск дополнительных фармакологических свойств изучаемых веществ;
Пб - контролируемые исследования (контроль исходного состояния, плацебоконтроль, активный контроль); обязательна рандомизация для исключения отличий
больных в группах по половому признаку, возрасту, тяжести заболевания и т.д.
(обычно I и II фазы клинических исследований проводят совместно);
III фаза - расширенные клинические исследования (рандомизация, плацебоконтролируемые, неконтролируемые, иногда многоцентровые);
IV фаза - пострегистрационные исследования - изучение возможностей для
расширения показаний к применению лекарственных средств, усовершенствования
режимов назначения и схем лечения (ретроспективные - проводятся на основании
прошлого опыта, проспективные - планируются на перспективу до начала набора
больных и проводятся по общему протоколу).
Согласно классификации рекомендаций Международного комитета экспертов
АСС/АНА по степени обоснованности, доказательства по
уровню значимости распределяются на классы, а доказанность соответствует
нескольким уровням.
Значение доказательств:
Класс I - доказательства и/или соглашение экспертов о том, что лечебное или
диагностическое вмешательство полезно и эффективно.
Класс II - противоречивые данные и/или расхождение мнений экспертов о
пользе/эффективности лечения или диагностических мероприятий.
IIа - значимость доказательств/мнений скорее в пользу вмешательства.
IIb - польза или эффект менее убедительны.
Класс III - доказательства и/или соглашение экспертов о том, что лечебное или
диагностическое вмешательство неэффективно и может быть опасно.
Уровень доказанности:
А - по крайней мере, два рандомизированных исследования, поддерживающих
рекомендации.
В
-
одно
рандомизированное
исследование
и/или
метаанализ
нерандомизированных исследований, поддерживающих рекомендации.
С - консенсус мнения экспертов.
При распределении пациентов по группам необходимо применять процедуру
рандомизации, предполагающую назначение испытуемых в группы методом
случайной выборки для исключения влияния исходных переменных на конечный
результат лечения. При этом распределение вариантов лечения в случайном
порядке не может быть достигнуто путем беспорядочного отбора. Истинно
случайная процедура отбора может быть осуществлена при помощи не зависящего
от человека метода.
Известно большое количество методов рандомизации.
Простая рандомизация основана на прямом применении датчиков (таблиц)
случайных чисел. Основным недостатком данного метода является формирование
групп, различных по численности больных. Метод последова­
тельных номеров позволяет избежать данного недостатка. Однако численность
групп уравновешивается только к концу процедуры рандомизации.
Метод адаптивной рандомизации поддерживает равное число пациентов в группах
в течение всей процедуры рандомизации, при этом в начале лечения пациенты
распределяются равновероятно, а затем оценивается численность
уже имеющихся групп, и вероятность попасть в группу с большей численностью
снижается для очередного испытуемого.
При блочной рандомизации перед началом исследования пациентов условно
разделяют на равные блоки. Затем блоки случайно распределяют, например,
пользуясь таблицей случайных чисел.
Повысить эффективность процедуры рандомизации и улучшить однородность
групп позволяет стратификационная рандомизация. Стратификация обеспечивает
распределение испытуемых по группам лечения с учетом наиболее значимых
факторов, существенно влияющих на
исход, например, возраста, анамнеза и т.д.
«Золотым стандартом» клинических испытаний признано рандомизированное
двойное слепое плацебо-контролируемое исследование. При этом ключевыми
процессами, обеспечивающими успешность рандомизированных контролируемых
испытаний, являются:
• соответствие плана (дизайна) цели исследования
• четкие критерии включения/невключения
• достаточная выборка, хороню отражающая свойства популяции
• точная установка границ исследования
• адекватный статистический анализ
• публикация результатов в рецензируемых источниках.
Максимально отвечающими жестким требованиям к дизайну, качеству проведения
и
доказательности
полученных
результатов
признаны
крупномасштабные
(международные или национальные) мультицентровые клинические испытания
(ММКИ) - исследования, проводимые по единой методике и программе
одновременно
в
нескольких
лечебных
учреждениях.
Некоторые
авторы
приравнивают результаты подобных исследований к метаанализу.
Метаанализ - методология объединения разнородных и выполненных разными
исследователями испытаний, касающихся одной проблемы, на
основе статистического синтеза и предназначенная для повышения достоверности
оценок одноименных результатов.
Главным
требованием
к
информативному
метаанализу
является
наличие
адекватного систематического обзора. Результаты метаанализа обыч­
но представляют в виде графика и отношения шансов - суммарного показателя,
отражающего выраженность эффекта.
Существует несколько разновидностей метаанализа:
•
кумулятивный
метаанализ
позволяет
построить
кумулятивную
кривую
накопления оценок при появлении новых данных
• проспективный метаанализ - разработка метаанализа планируемых испытаний
• проспективно-ретроспективный метаанализ - объединение новых результатов с
ранее опубликованными
• метаанализ индивидуальных данных основан на изучении результатов лечения
отдельных больных (ограничен изучением основных заболеваний, лечение
которых требует крупномасштабных капиталовложений).
Преимущества
метаанализа
очевидны
-
при
обобщении
испытаний
со
статистически недостоверными доказательствами обеспечивается суммарный
достоверный результат, позволяющий сформулировать точные оценки, вынести
верное клиническое решение и устранить возможные ошибки.
Download