Может быть использовано против вас в коде
Юрий Литвиненко о тайной тренировке нейросетей
Нейросетевые технологии, которые позиционируются как способ снизить необходимость в человеческом труде, пока лишь повышают его ценность, в том числе потому, что сети все же тренируют на работе мозга живых людей. А он пока явно не заржавел: пользователи все чаще задумываются о том, что каждое их действие можно применить для улучшения алгоритма.
Особенно часто такие опасения возникают в ситуациях, имеющих прямое отношение к работе с искусственным интеллектом (ИИ). Например, среди тех, кто неудачно пытался устроиться работать тренером ИИ — вакансии на такие позиции, в частности, размещают Тинькофф-банк и «Яндекс». Речь идет об описании данных для нейросетей и оценке результатов генерации. Некоторые из тех, кто после многочасового прохождения «тестового задания» получил отказ, полагают, что компания уже использовала результаты задания для целей тренировки — разумеется, бесплатно. Теория подкрепляется тем, что тестовому заданию предшествовал запрос согласия на обработку персональных данных (ПДн), который далеко не все прочитали.
Сомнения возникают не на пустом месте. Практика, например, «конкурсов перевода», на которых каждому претенденту раздали по главе, а в итоге у издателя получилась готовая книжка, хорошо известна. Есть примеры и в других отраслях. Поэтому после того, как приятель поделился такими мыслями в отношении «тестового задания» на вакансию специалиста по улучшению поисковой выдачи в «Яндекс Крауд», я решил разобраться.
В «Яндексе» заверили, что данные нужны только для оценки компетенций кандидата, нигде не используются, а в течение нескольких недель автоматически удаляются, «но это можно сделать и сразу по запросу кандидата». Не выражая сомнений в правдивости «Яндекса», все же хочется понять: а насколько подобная практика была бы законной?
Социальные сети, агрегаторы контента и другие онлайн-платформы по закону о рекомендательных сервисах (вступил в силу в октябре) обязаны раскрывать, как используют данные о действиях пользователей и какие технологии применяют при их обработке. Но системы, которые ничего не рекомендуют, а лишь собирают с него информацию, под действие закона не попадают.
Должны ли операторы сообщать пользователю о факте тренировки им нейросетей? Глава практики защиты персональных данных юрфирмы DRC Ольга Захарова считает, что да — в политике обработки ПДн. Но преподаватель Moscow Digital School, директор по правовым инициативам ФРИИ Александра Орехович полагает, что, если данные обезличиваются и используются для исследовательских целей, согласие не нужно. Будет ли регулятор на практике относить обучение нейросетей к исследовательским целям — тоже неясно, их критерии не установлены. Так что теоретически все может быть вполне законно.