Для клинической практики эндокринолога все­гда был крайне важен правильный выбор и интер­претация результатов диагностических тестов, будь то биохимические анализы, рентгенологиче­ские методы или данные клинического обследова­ния. Первое описание какого-либо теста в меди­цинской литературе включает ту или иную степень его валидизации, то есть доказательства того, что данный метод исследования действительно работа­ет. Если клиницист владеет принципами ДМ при­менительно к диагностике, ему проще оценить ин­формативность разных методов исследования, что еще более важно с точки зрения экономической эф­фективности. Здесь мы рассмотрим некоторые из принципов ДМ в применении к диагностике и лечению эндокринных заболеваний, включая такие характеристики диагностических методов, как чув­ствительность и специфичность, характеристиче­ские операционные кривые (ХОК), отношения правдоподобия, прогностические значения и диаг­ностическая правильность.

Оценка эндокринных функций начинается с по­становки клинического вопроса. Чем более рас­плывчато сформулирован вопрос, тем труднее по­лучить на него ясный ответ. Один из этапов — это предварительное клиническое предположение о возможности конкретного заболевания. Это предположение («претестовая вероятность) возни­кает до проведения диагностического обследова­ния и получения его результатов и, вместе с инфор­мативными характеристиками диагностического метода и его использования (чувствительность и специфичность, характеристические кривые, отношения правдоподобия, прогностическая цен­ность и диагностическая точность), позволяет аде­кватно интерпретировать результат. Биологиче­ским системам свойственна вариация, или измен­чивость. Следовательно, диагностические тесты должны учитывать не только вариабельность самих методов как таковых и вариабельность, связанную с их выполнением, но и изменчивость признака в популяциях, на которых данные тесты разрабатывались — причем как в группах больных, так и в группах здоровых лиц. Ключевыми аспекта­ми при анализе какого-либо диагностического тес­та являются его воспроизводимость и правиль­ность. Воспроизводимость отражает степень сов­падения результатов, полученных при каждом повторении конкретного диагностического теста (метода). Она зависит от таких факторов, как ва­риабельность результатов, полученных одним и тем же наблюдателем, и результатов, полученных разными наблюдателями (например, при оценке физикальных данных или рентгеновского снимка), а в случае биохимических анализов — от таких ха­рактеристик, как коэффициенты вариации (КВ) в пределах одного метода определения и коэффи­циента вариации между разными методами опреде­ления. В исследованиях с применением радиоим- мунологического и других методов обычно приво­дятся КВ внутри одного метода и между разными методами определения. Тем не менее публикаций, в которых содержались бы несколько результатов, полученных у одного и того же пациента (вариация в пределах одного индивидуума), очень немного. Относительно мало изучалась и надежность измере­ний (т.е., степень изменчивости в пределах одного индивидуума). В одном исследовании было уста­новлено, что для достижения удовлетворительной надежности средних значений базальной концен­трации кортизола в плазме их следует определить минимум 3 раза, а в слюне — минимум 18 раз. При оценке показателей в ходе функциональных проб для достижения той же надежности требуется меньшее число дублей (одна или две пробы).

Воспроизводимость зависит от условий прове­дения теста. При использовании результатов теста в практической работе клиницисты должны видеть разницу между идеальной эффективностью и ре­альной эффективностью3. В применении к диагно­стическому обследованию, идеальная эффектив­ность показывает, насколько тест, с научной точки зрения, соответствует искомому клиническому ис­ходу (диагнозу). В отличие от этого, реальная эффективность — это то, насколько данный диагно­стический тест позволяет установить искомый диагноз в действительной клинической практике.

Большинство крупных исследований проводились в научных учреждениях и тем самым по определе­нию являются исследованиями идеальной эффек­тивности. Реальная же эффективность большинст­ва тестов на практике достаточно глубоко не изуча­лась. Сравнивая свои собственные результаты с опубликованными или с лабораторными грани­цами нормы, важно принимать во внимание, где проводился тест (например, в больнице или в поли­клинике).

Правильность теста показывает, насколько ре­зультаты конкретного теста являются истинными показателями изучаемого феномена. Если тест с вы­сокой воспроизводимостью имеет систематическую ошибку, то всякий раз он может давать один и тот же неверный результат. Как и воспроизводимость, пра­вильность зависит от условий проведения: правиль­ность теста в клинической практике может отли­чаться от таковой в эксперименте, где можно кон­тролировать многие виды влияний извне.

При интерпретации теста его результат обычно сравнивают с диапазоном нормальных значений. Часто величину нормального диапазона получают в референтной популяции, которая предположи­тельно (а лучше это доказать) не страдает заболева­нием. Например, при разработке теста, предназна­ченного для диагностики синдрома Кушинга, в референтную группу должны войти лица с кли­ническими признаками, позволяющими предпола­гать синдром Кушинга, но на самом деле не стра­дающие этим заболеванием. Однако референтные группы могут состоять просто из легко доступных для обследования лиц, а не из тех, которые явля­лись бы более подходящей для сравнения группой. Важно также отметить, что если границы нормы определяются исходя из нормального (гауссова) типа распределения как среднее ± два стандартных отклонения, то у 5% индивидуумов, не имеющих заболевания, будут получены результаты, лежащие за пределами «нормы». (Кстати, если «норма» ус­тановлена по данным нормального распределения величин, то это лишь один из целого ряда подходов к определению «нормы». Некоторые другие вклю­чают выбор наиболее репрезентативного или само­го частого значения искомого параметра, или зна­чения, наиболее оптимального для выживаемости, или значения, не сопровождающегося никаким от­рицательным последствием [например, риском]).

Определение диапазона нормальных значений и диаг­ностическое тестирование. На верхнем графике представлено гауссово (нормальное) распределение тестовых значений в не­коей популяции. На среднем графике даны две кривые, описы­вающие результаты идеального теста. В этом случае результаты здоровых испытуемых и испытуемых, имеющих заболевание, не перекрываются (т.е., нет ни ложноположительных, ни ложно­отрицательных результатов). Нижний график иллюстрирует результаты «неидеального» теста. Здоровые испытуемые с показателями теста выше пороговых имеют «патологические» (т.е., ложноположительные) результаты, в то время как у неко­торых испытуемых, имеющих заболевание, значения теста нахо­дятся ниже пороговых (таким образом, результаты теста у них нормальные, или ложноотрицательные)