Естественный интеллект оказался лучше искусственного

По крайней мере, в деле анализа рентгеновских снимков легких

Искусственный интеллект может повысить диагностическую уверенность рентгенологов, но на него не стоит полагаться при массовых обследованиях людей на наиболее распространенные легочные заболевания. Машинный анализ приводит к гипердиагностике.

Фото: Анатолий Жданов, Коммерсантъ

Анализ рентгеновских снимков — одна из самых первых областей медицины, к которой был привлечен искусственный интеллект. Исследователи из Копенгагена решили выяснить, насколько эффективным стал искусственный интеллект за более чем десятилетие усовершенствования. Фактически ученые устроили состязание между машиной и человеком: со стороны людей выступили 72 рентгенолога, а со стороны машин — четыре коммерческие программы.

Победу одержали люди.

«Рентгенография грудной клетки — самый распространенный метод лучевой диагностики, но для правильной интерпретации снимка необходимы значительная подготовка и опыт,— описал задачу ведущий автор исследования Луис Плеснер.— Искусственный интеллект все чаще привлекается в помощь рентгенологам, но не до конца понятно, насколько машина эффективна в условиях реальной клинической работы. Мы пытались выяснить, какова ее диагностическая точность».

Анализу были подвергнуты рентгенограммы четырех датских больниц за два года. Примерно в трети случаев снимки делались для подтверждения предварительного диагноза.

Задача перед врачами и искусственным интеллектом ставилась одинаковая: они должны были рассмотреть рентгенограммы на предмет трех наиболее распространенных легочных патологий — отека легких, пневмоторакса, плеврального выпота. Врачи оказались значительно более точными: искусственный интеллект дал очень большую долю ложноположительных диагнозов, то есть неверных интерпретаций снимков. Это с одной стороны. С другой, точность выявления заболеваний у машины была заметно ниже, чем у человека. Пневмоторакс искусственный интеллект диагностировал с точностью 56–86%, в то время как точность врачей составила 96%. Отек легких — 40–50% против 91%, плевральный выпот — 62–72% против 95%.

Результаты датчан резко контрастируют с данными из прежних работ на тему сравнения естественного и искусственного интеллекта. Но есть разница в дизайне исследований: датчане позволили и людям, и машине знакомиться с историей болезни пациента и с предыдущими рентгенограммами, то есть следовать обычной клинической практике.

Видимо, именно синтетические навыки позволили врачам настолько уверенно победить, заключает Плеснер.

По материалам статьи.

Ольга Грибова

Вся лента