"Алгоритм можно применять на миллиардах изображений"
Никита Аронов беседует с основателем компании NtechLab Артемом Кухаренко
Как научить машину узнавать миллиарды лиц и продать иностранной разведке "черный ящик"
В начале ноября российская компания NtechLab признана лучшей на международном конкурсе алгоритмов по распознаванию лиц, организованном агентством IARPA. А это ни много ни мало — технологическое крыло национальной разведки США. "Огонек" писал об этом отечественном достижении (N 45, 2017). Теперь основатель компании NtechLab Артем Кухаренко делится подробностями.
— Получается, вы выиграли конкурс американской разведки?
— IARPA не называет заказчика, но скорее всего оно действовало в интересах государства. Впрочем, совсем не обязательно речь идет о разведчиках. Тестирование алгоритмов требует больших ресурсов, и IARPA такими ресурсами обладает. Это достаточно авторитетная организация, к результатам ее исследований прислушиваются.
— Значит, с вами по результатам конкурса пока никто не связывался и заказать ваши алгоритмы не пытался?
— Напрямую с IARPA у нас переговоров не было. Но после победы в конкурсе к нам обратились около 30 компаний со всего мира. Сейчас мы ведем переговоры в том числе с фирмами, которые занимаются пограничным контролем в США по государственному заказу. Они устанавливают E-gate — терминалы в аэропортах для прохождения паспортного контроля. Достаточно приложить документ к считывающему устройству, и система сравнит лицо пассажира с фотографией в паспорте. Если совпадения не будет, то человека отправят на дополнительную проверку к пограничному персоналу. Это направление развивается очень быстро. Поэтому первой номинацией конкурса, в которой мы выиграли, было задание на точность верификации. Алгоритму давались две фотографии, и он должен был определить: один человек изображен на фото или два разных.
— И что, программы уже справляются с этой задачей лучше человека?
— Точность алгоритма сейчас заведомо выше, чем точность распознавания обычным неподготовленным человеком. Если сравнивать со специалистом, то сказать сложно, сейчас как раз ведутся такие исследования. В любом случае, к специалисту пока у всех больше доверия, чем к программе.
— Вы выиграли и в другой номинации...
— Да, на скорость идентификации, когда есть база в несколько миллионов человек и нужно максимально быстро найти одного из них по фотографии. Наш алгоритм совершает поиск за 500 микросекунд, получается, можно обработать 2 тысячи запросов в секунду на одном ядре обычного процессора. Но интересна даже не сама скорость, а то, что, если увеличить базу поиска в 10 раз, то время поиска увеличится не в 10 раз, как у других программ, а примерно в полтора раза. Такого результата удалось достигнуть за счет специального поискового индекса. И это позволяет применять наш алгоритм на миллиардах изображений. Сейчас у нас есть проект для крупного сервиса знакомств, где приходится обрабатывать больше 1 млрд фотографий.
— Для участия в конкурсе вам надо было предоставить исходный код своего алгоритма?
— Нет. На таких условиях мы не стали бы участвовать. Чтобы вы понимали, как это работает. Сначала мы обучаем нейронную сеть, затем пишем исходный код для работы с уже обученной нейросетью, чтобы с помощью вызовов функций можно было передать пару фотографий с лицами и получить ответ, насколько они похожи. Потом исходный код компилируется и получается продукт, в котором код находится в зашифрованном виде, и расшифровать его нельзя. Именно в таком виде мы отправили наш алгоритм организаторам тестирования, но для задач конкурса ничего и не требуется расшифровывать. Программа работает по принципу "черного ящика": получает запрос, выдает ответ, на входе две фотографии, на выходе — одна цифра. Этого вполне достаточно, чтобы испытать алгоритм на точность и скорость работы. Выяснить, одинаково ли он справляется с распознаванием людей разных рас. Наш алгоритм, например, раньше лучше всего работал на европейцах, но мы добились очень высокой точности идентификации азиатских лиц.
— Но если зайдет речь о государственном заказе, то алгоритм, конечно, придется открыть.
— Дело в том, что наша программа не таит в себе для клиента никакой опасности. Ее можно развернуть в собственном контуре безопасности, грубо говоря, без интернета. Мы заявляем, что на входе программе нужны две фотографии, а на выходе она выдает одно число. И наш клиент может сделать обертку, которая будет проверять, что больше никакой информации из программы действительно не выйдет.
— Государственные клиенты в России от вас тоже не требуют исходного кода?
— В данный момент в этом не было необходимости, так как система в большинстве случаев работает внутри закрытого контура безопасности. Например, по такому принципу проведен успешный пилотный проект с департаментом информационных технологий правительства Москвы. К 1,5 тысячи камер городского видеонаблюдения подключена наша видеоаналитика.
— Однако в США сейчас особенно недоверчиво относятся к России. Вот даже у Касперского требуют открыть исходный код антивирусов. Вы, кстати, не чувствовали негативного настроя во время конкурса в Америке?
— И на этом, и на других американских конкурсах у нас не было никаких проблем. Организаторы — ребята абсолютно открытые и доброжелательные. Кстати, в конкурсе IARPA участвовали все основные российские разработчики алгоритмов распознавания лиц.
Что касается ситуации с Касперским, то мы находимся в принципиально ином положении. Антивирусу, чтобы он работал, надо дать доступ к самой системе. У нас же проблема с безопасностью решается очень просто. Берем изолированный сервер, устанавливаем нашу технологию, и клиент может пользоваться всем функционалом с помощью прикладного приложения. Разворачивают систему вместе с нашими специалистами, которые также настраивают пользовательский интерфейс, а дальше помещают в замкнутый контур безопасности (то есть отрубают интернет). Затем клиенты сами подключают видеокамеры и загружают свою базу изображений. В ритейле это, например, фотографии постоянных покупателей.
— Но вы ведь можете как-нибудь еще помешать американской разведке. Скажем, внести в программу фотографии наших разведчиков, чтобы они не идентифицировались.
— Теоретически можем, конечно, для этого должен быть доступ к фотографиям разведчиков. А кто же нам его даст? А если серьезно, мы международная компания и такие действия нанесут серьезный урон, в том числе приведут к потере доверия клиентов.
— Но вы сами готовы продать вашу программу, скажем, ЦРУ?
— ЦРУ не приходит и не говорит: продайте вашу технологию просто так, а мы ее будем использовать, как захотим. Обращается компания, которая внедряет автоматизированные терминалы в аэропортах и говорит, продайте нам технологию для E-gate, мы ее будем использовать так-то. Мы и продаем ее с расчетом на определенное количество камер и частоту запросов. В такой ситуации никаких проблем в продаже нашей технологии американской компании я не вижу.