Самообучающийся эндоскоп поможет в диагностике ранних стадий рака
Компьютерная медицина
Сегодня в мире накоплены огромные массивы графических данных. Видеокамеры подключаются к промышленному, охранному, испытательному, научному и учебному оборудованию; их встраивают в мобильные устройства, очки, линзы; устанавливают в автомобили, самолеты и на космические станции; камерами оснащают роботов различного назначения, чем обеспечивают компьютерное зрение и работу искусственного интеллекта. Важнейшее значение получила графическая и видеоинформация и в медицинской диагностике — при эндоскопических исследованиях внутренних органов.
Точки и картинки
Для сегодняшней онкологической эндоскопии особенно важно увидеть ранние признаки ракового заболевания — иногда еще говорят об оптической биопсии. Выяснилось, что существует связь между архитектоникой (внешне легко распознаваемым построением) и микроструктурой ткани. Конечно, опытный эндоскопист и без подсказки увидит признаки онкологических изменений, но для массового обследования нужен ясный алгоритм, работающий в реальном времени, который позволит распознавать болезнь, пусть и гипердиагностически, эндоскописту без специальной квалификации.
Анализ гигантских массивов данных, в том числе медицинских, невозможен без автоматизации. Компания "Сиамс" при поддержке Министерства образования и науки разрабатывает уникальную технологию автоматической обработки графических и видеоданных; полное ее название — "Умный анализатор структур на панорамных и видеоизображениях", а коротко — "умный эндоскоп" рис. 01.
Умный эндоскоп — это программный продукт. Программа анализирует полученное от видеокамеры эндоскопа изображение рис. 02 и предлагает пользователю несколько близких по смыслу изображений из собственной базы данных. Распознавание идет по паттернам ямочного и капиллярного рисунков слизистой оболочки желудка и (или) толстой кишки. Программа анализирует стоп-кадр, который выполняется определенным образом. Необходима аппаратура высокой четкости — к примеру, эндоскопические стойки Olympus Exera; съемка должна быть проведена в белом свете, или это должно быть узкоспектральное изображение; стоп-кадр делается только после тщательного отмывания слизистой оболочки — и аккуратного, чтобы не допустить травмы исследуемого образования; наконец, снимок должен быть сделан с максимально близкого к образованию расстояния, чтобы были хорошо видны ямочный и капиллярный рисунок.
Пользователь выбирает из предложенных вариантов наиболее похожий и таким образом не только облегчает себе диагностическую задачу — получает мгновенную подсказку, но и всякий раз пополняет базу распознанных изображений. Если ничего похожего в базе еще не было, а новая картинка имеет диагностический смысл, пользователь характеризует изображение как необходимое для занесения в базу данных и вводит для него новый класс. При предъявлении схожего изображения программа сразу предложит отнести его к этому новому классу. Так происходит ее самообучение.
Предусмотрена и ситуация, когда качество распознавания графической или видеокартинки не устраивает саму программу — не соблюдены изложенные выше правила выполнения стоп-кадра и ей сложно отнести изображение к какому-нибудь из классов. Низкая самооценка побуждает программу обратиться за помощью к пользователю — и уже человек относит неясное изображение либо к одному из имеющихся классов, либо вводит для него новый класс.
Для всякого нового изображения пользователь заполняет специальную стандартную форму, в которой указывает орган, где найдено образование, локализацию этого образования, способ съемки и микроструктуру образования. Для описания микроструктуры употребляется диагностический стандарт — например, в случае ямочной структуры толстой кишки это широко известная классификация японского гастроэнтеролога-онколога Син-эй Кудо таб. 01.
таб. 01 Классификация Кудо
Компания умных приборов
Конечная цель разработки — диагностическая поддержка в один шаг, то есть автоматическое распознавание и классифицирование изображений.
Умный анализатор структур состоит из нескольких модулей. Один из них занимается выявлением на изображении типичных признаков (feature extractor); другой — управляет полученными данными (data manager), третий обеспечивает самообучение программы (machine learning module), четвертый — управление обучением (control module). В основе выявления признаков лежит метод SIFT, управление данными — граф---ориентированное, а управление обучением основано на периодической переоценке информативности признаков и формировании стабильного словаря признаков.