Нейросети посмотрят на просвет

Юрий Литвиненко о «водяных знаках» для сгенерированного контента

На этой неделе Google развернула на свои сервисы, позволяющие генерировать текст и видео с помощью нейросетей, технологию SynthID: она вшивает в файлы невидимые человеку пометки. Вопросы маркировки такого контента поднимаются и в России, но в первую очередь властями. И это может во многом определить, как такие маркировки будут работать.

Юрий Литвиненко

Фото: Ирина Бужор, Коммерсантъ

Если решения Google для создания «водяных знаков» на ИИ-контент рассчитаны на специальные программы-детекторы, то, например, член комитета Госдумы по информполитике Антон Немкин видит такую маркировку иначе — по его словам, она должна быть «четкой и заметной для любого пользователя». Говоря о работе над концепцией закона о маркировке ИИ-контента, депутат добавил, что важно определять реальное, «как и в случае с рекламой».

Система обязательной маркировки интернет-рекламы работает в РФ с сентября 2022 года. Еще на этапе обсуждения законодатели продвигали ее как способ четко продемонстрировать пользователю проплаченные посты в соцсетях с помощью указания рекламодателя и специального кода. Еще одна цель — сбор массива информации, которая благодаря Единому реестру интернет-рекламы (ЕРИР) доступна Роскомнадзору, ФАС и ФНС, о договорах, актах, показах. Господин Немкин, кстати, упомянул Роскомнадзор и в контексте маркировки ИИ-контента. По его словам, ведомство могло бы принудительно помечать ИИ-контент. Поскольку те, кто создает его «в деструктивных целях», вряд ли захотят это делать сами.

Полностью перенести логику работы ЕРИР на ИИ-контент вряд ли возможно — в конце концов люди часто делятся последним не по договору, а просто по желанию. Как вариант, можно воспользоваться опытом КНР, единственной страны, чьи органы власти уже опубликовали конкретный стандарт пометки ИИ-контента. Он предполагает проставление как явных пометок (подписей, полупрозрачного текста), так и неявных. В сохраняемые файлы, согласно стандартам, добавляются название сервиса и идентификатор каждой конкретной генерации. Для сравнения: SynthID зашивает лишь ту информацию, которая подтверждает или опровергает сам факт использования ИИ.

Компании из США, вложившись в создание собственных «водяных знаков», предвосхитили запрос властей (в октябре 2023 года президент США Джо Байден поручил изучить «существующие стандарты и инструменты» по маркировке ИИ-контента и выделил на это 240 дней). Развивающие ИИ в России «Яндекс» и «Сбер» пока не сообщали, что работают над подобными системами. В результате перед компаниями возникает риск оказаться в хвосте процесса, который возглавит государство. А оно, как показывает опыт той же КНР, всегда хочет большего, чем предполагает экономическая эффективность.

Вся лента