Для клинической практики эндокринолога всегда был крайне важен правильный выбор и интерпретация результатов диагностических тестов, будь то биохимические анализы, рентгенологические методы или данные клинического обследования. Первое описание какого-либо теста в медицинской литературе включает ту или иную степень его валидизации, то есть доказательства того, что данный метод исследования действительно работает. Если клиницист владеет принципами ДМ применительно к диагностике, ему проще оценить информативность разных методов исследования, что еще более важно с точки зрения экономической эффективности. Здесь мы рассмотрим некоторые из принципов ДМ в применении к диагностике и лечению эндокринных заболеваний, включая такие характеристики диагностических методов, как чувствительность и специфичность, характеристические операционные кривые (ХОК), отношения правдоподобия, прогностические значения и диагностическая правильность.
Оценка эндокринных функций начинается с постановки клинического вопроса. Чем более расплывчато сформулирован вопрос, тем труднее получить на него ясный ответ. Один из этапов — это предварительное клиническое предположение о возможности конкретного заболевания. Это предположение («претестовая вероятность) возникает до проведения диагностического обследования и получения его результатов и, вместе с информативными характеристиками диагностического метода и его использования (чувствительность и специфичность, характеристические кривые, отношения правдоподобия, прогностическая ценность и диагностическая точность), позволяет адекватно интерпретировать результат. Биологическим системам свойственна вариация, или изменчивость. Следовательно, диагностические тесты должны учитывать не только вариабельность самих методов как таковых и вариабельность, связанную с их выполнением, но и изменчивость признака в популяциях, на которых данные тесты разрабатывались — причем как в группах больных, так и в группах здоровых лиц. Ключевыми аспектами при анализе какого-либо диагностического теста являются его воспроизводимость и правильность. Воспроизводимость отражает степень совпадения результатов, полученных при каждом повторении конкретного диагностического теста (метода). Она зависит от таких факторов, как вариабельность результатов, полученных одним и тем же наблюдателем, и результатов, полученных разными наблюдателями (например, при оценке физикальных данных или рентгеновского снимка), а в случае биохимических анализов — от таких характеристик, как коэффициенты вариации (КВ) в пределах одного метода определения и коэффициента вариации между разными методами определения. В исследованиях с применением радиоим- мунологического и других методов обычно приводятся КВ внутри одного метода и между разными методами определения. Тем не менее публикаций, в которых содержались бы несколько результатов, полученных у одного и того же пациента (вариация в пределах одного индивидуума), очень немного. Относительно мало изучалась и надежность измерений (т.е., степень изменчивости в пределах одного индивидуума). В одном исследовании было установлено, что для достижения удовлетворительной надежности средних значений базальной концентрации кортизола в плазме их следует определить минимум 3 раза, а в слюне — минимум 18 раз. При оценке показателей в ходе функциональных проб для достижения той же надежности требуется меньшее число дублей (одна или две пробы).
Воспроизводимость зависит от условий проведения теста. При использовании результатов теста в практической работе клиницисты должны видеть разницу между идеальной эффективностью и реальной эффективностью3. В применении к диагностическому обследованию, идеальная эффективность показывает, насколько тест, с научной точки зрения, соответствует искомому клиническому исходу (диагнозу). В отличие от этого, реальная эффективность — это то, насколько данный диагностический тест позволяет установить искомый диагноз в действительной клинической практике.
Большинство крупных исследований проводились в научных учреждениях и тем самым по определению являются исследованиями идеальной эффективности. Реальная же эффективность большинства тестов на практике достаточно глубоко не изучалась. Сравнивая свои собственные результаты с опубликованными или с лабораторными границами нормы, важно принимать во внимание, где проводился тест (например, в больнице или в поликлинике).
Правильность теста показывает, насколько результаты конкретного теста являются истинными показателями изучаемого феномена. Если тест с высокой воспроизводимостью имеет систематическую ошибку, то всякий раз он может давать один и тот же неверный результат. Как и воспроизводимость, правильность зависит от условий проведения: правильность теста в клинической практике может отличаться от таковой в эксперименте, где можно контролировать многие виды влияний извне.
При интерпретации теста его результат обычно сравнивают с диапазоном нормальных значений. Часто величину нормального диапазона получают в референтной популяции, которая предположительно (а лучше это доказать) не страдает заболеванием. Например, при разработке теста, предназначенного для диагностики синдрома Кушинга, в референтную группу должны войти лица с клиническими признаками, позволяющими предполагать синдром Кушинга, но на самом деле не страдающие этим заболеванием. Однако референтные группы могут состоять просто из легко доступных для обследования лиц, а не из тех, которые являлись бы более подходящей для сравнения группой. Важно также отметить, что если границы нормы определяются исходя из нормального (гауссова) типа распределения как среднее ± два стандартных отклонения, то у 5% индивидуумов, не имеющих заболевания, будут получены результаты, лежащие за пределами «нормы». (Кстати, если «норма» установлена по данным нормального распределения величин, то это лишь один из целого ряда подходов к определению «нормы». Некоторые другие включают выбор наиболее репрезентативного или самого частого значения искомого параметра, или значения, наиболее оптимального для выживаемости, или значения, не сопровождающегося никаким отрицательным последствием [например, риском]).
Определение диапазона нормальных значений и диагностическое тестирование. На верхнем графике представлено гауссово (нормальное) распределение тестовых значений в некоей популяции. На среднем графике даны две кривые, описывающие результаты идеального теста. В этом случае результаты здоровых испытуемых и испытуемых, имеющих заболевание, не перекрываются (т.е., нет ни ложноположительных, ни ложноотрицательных результатов). Нижний график иллюстрирует результаты «неидеального» теста. Здоровые испытуемые с показателями теста выше пороговых имеют «патологические» (т.е., ложноположительные) результаты, в то время как у некоторых испытуемых, имеющих заболевание, значения теста находятся ниже пороговых (таким образом, результаты теста у них нормальные, или ложноотрицательные)