В идеале, результаты диагностического теста у лиц с заболеванием не должны перекрываться с результатами теста у лиц без заболевания. Однако на самом деле происходит иначе. Чувствительность и специфичность, вместе взятые, называют операционными характеристиками. Чувствительность означает возможность правильно идентифицировать лиц с конкретным заболеванием. Чувствительность симптома, или клинического признака, или диагностического теста — это доля пациентов с заболеванием, у которых имеется положительный результат теста, признак или симптом. В отличие от этого, специфичность означает способность правильно идентифицировать лиц без конкретного заболевания. Специфичность теста — это доля здоровых людей, у которых результаты теста являются отрицательными или у кого отсутствует данный симптом или признак.
Таким образом, чувствительность теста равняется числу индивидуумов с заболеванием, у которых имеются положительные результаты теста (истинные положительные [ИП]), деленному на число индивидуумов с заболеванием (истинно положительные плюс ложноположительные [ЛП]). Специфичность равняется числу индивидуумов без заболевания, имеющих отрицательные результаты теста (истинно отрицательные), деленному на число лиц без заболевания (истинно отрицательные плюс ложноположительные [ЛП]). Теоретически чувствительность и специфичность характеризуют сам тест, а не пациентов, у которых он выполняется. Однако на практике это может быть не так. На чувствительность теста может повлиять стадия или степень тяжести заболевания. Специфичность теста может зависеть от характеристик референтной популяции. Для выбора отрезных точек, которые отделяют норму от патологии, нужно использовать адекватные группы, причем в любой публикации по диагностическому тесту они должны быть подробно описаны. Показатели, выбранные в качестве отрезных (разделительных) точек, также влияют на чувствительность и специфичность. Чтобы помочь клиницисту разобраться в отчете по диагностическому тесту, был разработан ряд вопросов.
Ночная супрессивная проба с дексаметазоном часто используется для скрининга на синдром Кушинга. Ее применение иллюстрирует некоторые аспекты диагностического тестирования. Как показано на рисунке 4.3, при объединении результатов нескольких исследований чувствительность теста получается равной 98,1%, а специфичность — 98,9%. Однако данные отдельных исследований варьировали, при этом показатели чувствительности находились в диапазоне от 83% до 100%, а специфичности — от 77% до 100%. Более того, в исследованиях применялись разные методы
определения концентрации кортизола, разные дозы дексаметазона и разные критерии для того, чтобы считать пробу положительной. Строить выводы на объединении подобных данных необходимо с осторожностью. Чтобы применить показатели чувствительности и специфичности теста, полученные в одной исследуемой выборке, к другой, отличающейся, группе, нельзя отклоняться от методов тестирования, использованных в ходе определения отрезной точки теста. Так, например, нужно назначать ту же дозу дексаметазона, использовать тот же метод определения уровня кортизола, время назначения дексаметазона и взятия крови для определения кортизола. Кроме того, изученная выборка должна быть такой же, как новая популяция, в которой проводится тестирование. Чтобы удовлетворялось последнее требование, при формировании изученной выборки нужно было учитывать изменчивость признака у лиц с заболеванием. Для этого необходимо, чтобы индивидуумы, имеющие заболевание, идентифицировались с помощью метода, который на тот момент был наилучшим («золотым») стандартом (независимо от того, какой новый тест изучается), и чтобы выборка включала достаточно широкий «поперечный срез» лиц с заболеванием (например, с легкими и тяжелыми формами болезни, разной этиологией заболевания, а также разного пола, возраста и этнического происхождения). Последнее позволит получить надежный диапазон измеряемых показателей. Столь же важны характеристики референтной группы лиц без заболевания. Хотя все еще считается, что ночная проба с 1 мг дексаметазона обладает великолепной чувствительностью (но менее, чем 100%-ной), серьезной проблемой является ее специфичность. Описаны ложноположительные результаты пробы при приеме целого ряда препаратов, а также при наличии различных терапевтических и хирургических заболеваний, а также психических расстройств.
Еще один метод для характеристики информативности теста — это его диагностическая правильность. Диагностическая правильность определяется как способность теста правильно дифференцировать лиц, имеющих заболевание, от лиц, его не имеющих:
По объединенным данным Сгаро по ночной пробе с 1 мг дексаметазона удалось рассчитать, что диагностическая правильность пробы составляет 98,7%. Помимо характеристик испытуемых, для оценки точности теста крайне важно также и число испытуемых, включенных в выборку. Каждую операционную характеристику, установленную в исследовании, должен сопровождать доверительный интервал (ДИ) — диапазон величин, рассчитанный исходя из размера выборки и стандартной ошибки, который выражает степень доверия (достоверности) (обычно 90%, 95% или 99%), с которой неизвестная истинная чувствительность или специфичность находится именно в этом интервале. ДИ являются показателями точности полученной величины. Диапазон ДИ зависит от двух факторов: 1) числа наблюдения и 2) разброса данных (обычно он измеряется в виде стандартного отклонения). Чем меньше число наблюдений, тем больше диапазон ДИ, и чем больше стандартное отклонение данных, тем больше диапазон ДИ.
Помимо ограничений операционных характеристик теста, связанных с выборками, на которых получали данные, чувствительность и специфичность зависят и друг от друга. Они варьируют в зависимости от отрезной точки, выбранной как граница между положительными и отрицательными результатами теста. В целом, по мере увеличения чувствительности снижается специфичность, а по мере увеличения специфичности уменьшается чувствительность. Этот феномен графически отображается в виде характеристической операционной кривой (ХОК).