Искусственный интеллект доучился до суда
Каковы шансы правообладателей выиграть иски к разработчикам ИИ
Американский суд поддержал претензии газеты The New York Times к разработчику ChatGPT. Его обвиняют в незаконном использовании статей медиахолдинга для обучения нейросети. Окружной суд Нью-Йорка отклонил часть претензий, заявленных в иске, но федеральный судья подтвердил, что разбирательство может продолжаться. В NYT считают, что OpenAI и ее акционер Microsoft «воровали тексты журналистов», чем нанесли ущерб на миллиарды долларов.
Фото: Игорь Иванко, Коммерсантъ
Фото: Игорь Иванко, Коммерсантъ
Иск был подан еще в 2023 году. Руководство газеты не смогло договориться с OpenAI об использовании медиамассива на коммерческой основе. К тому времени разработчик уже заключил такую сделку с агентством Associated Press. Похожий иск музыкального лейбла на днях обернулся неудачей. Суд Калифорнии постановил, что Universal Music не сумел показать, как именно разработчик искусственного интеллекта Anthropic нанес ей рыночный ущерб. Просьба запретить использование музыкальной библиотеки была отклонена.
Из-за отсутствия правовых норм в сфере ИИ подобные разбирательства сильно затруднены, говорит основатель и гендиректор компании Sistemma Сергей Зубарев: «Мало кто понимает, как это вообще работает. Одним из аргументов со стороны защиты является то, что насмотренность не является копированием. Но робот — это не человек, и для того чтобы ему посмотреть, ему нужно куда-то это сохранить, чтобы потом использовать.
Сложность для стороны, которая хочет защитить свои права, в том, что практически невозможно идентифицировать обучающую выборку, если сами разработчики ее не раскроют.
Постфактум они могут открыть доступ к своим данным, но это векторное поле цифровых массивов, которое ничего не даст даже понимающему человеку, и установить, какие именно данные туда попали, технически очень сложно. Нужно пронаблюдать сам процесс, во время которого происходит обучение ИИ, а это очень дорого. К примеру, стоимость обучения одной из последних моделей Марка Цукерберга была на уровне выше $1 млрд. В нее входили и покупка мощностей, и сбор данных. При этом физически невозможно создать нейросеть, которая бы обучалась на неавторских данных и имела бы очень хорошие показатели. Тогда получится общеобразовательная нейросеть среднего качества, которая сможет отвечать на вопросы, но не будет компетентна практически ни в одном вопросе».
Засудить разработчиков искусственного интеллекта за использование своих библиотек пытаются и фотобанки. Getty Images, например, требовала от Stability AI $1,7 млрд. В компании отмечали, что это они еще занизили сумму ущерба, поскольку оценили каждое нарушение в $150 тыс. Таким образом, учитывая размер библиотеки, разработчик нейросети мог незаконно сэкономить более $1,5 трлн, заявляли в фотобанке. Большинство таких разбирательств в итоге закончится внесудебными компромиссами, полагает IT-эксперт и партнер юридической фирмы Digital & Analogue Partners Юрий Брисов:
«Каждая новая технология, когда появляется на рынке, всегда вступает сначала в жесткую конфронтацию с предыдущей. Доказать напрямую в суде каждый факт нарушения сложно, и обычно новые платформы находят способ все-таки договориться со старыми и интегрировать их наработки в новые. OpenAI первый проявил инициативу и написал всем крупным издательствам, в том числе The New York Times, которое потом с ними судилось, мол, давайте мы вам будем платить за то, что используем ваши тексты. Некоторые, как NYT, не согласились и пошли в суд. Наверное, в итоге обе противоборствующие стороны найдут какой-то компромисс, и, конечно, это уже будут не те деньги, на которые рассчитывают издательства».
В январе разработчик Anthropic уже договорился с лейблом Universal Music об урегулировании части иска. Стороны согласились на то, что модель искусственного интеллекта Claude не будет показывать пользователям тексты песен, защищенные авторским правом, и создавать на их основе материалы.
С нами все ясно — Telegram-канал "Ъ FM".