Боты Apple под запретом
Александр Леви — о блокировке «яблочных» инструментов
Обозреватель “Ъ FM” Александр Леви рассказывает о том, почему крупные компании выступают против использования программ по обучению искусственного интеллекта на базе их контента.
Фото: Ирина Бужор, Коммерсантъ
Компания Meta (признана в РФ экстремистской и запрещена) запретила поисковым ботам Apple (Applebot и Applebot-Extended) использовать данные из Instagram и Facebook (деятельность Meta по функционированию сети в РФ объявлена экстремистской и запрещена) для обучения моделей искусственного интеллекта.
Задачи этих так называемых веб-краулеров или программ по перебору онлайн-контента улучшать работу голосового помощника Siri и поискового инструмента «яблочных» платформ Spotlight, собирая информацию в интернете. В случае с ботом Applebot-Extended речь конкретно об обучении ИИ Apple Intelligence, который планируется внедрять в новые продукты купертиновской команды.
Решение такой крупной компании как Meta (запрещенной в России) еще больше отражает чувствительность права собственности на контент и этические последствия сбора данных в сети для обучения искусственного интеллекта. В отсутствии активных законодательных инициатив ситуация в индустрии регулируется стихийно. В случае с веб-краулерами Apple, например, от их работы отказались также нескольких известных новостных ресурсов и медиа-платформ. Свой запрет выдали, в частности The New York Times, Vox Media, Tumblr, The Atlantic и Conde Nast.
Сам по себе механизм, регулирующий разрешение, устроен почти примитивно. Чтобы остановить работу Applebot-Extended, который, кстати, был запущен относительно недавно, три месяца назад, издателю достаточно прописать в файле бота robots.txt команду Disallow и сохранить файл.
Несмотря на активные запреты на работу поискового робота Apple, текущая ситуация не выглядит драматической. По информации ресурса Wired, бот Applebot-Extended был заблокирован примерно 6% сайтов с высоким трафиком. Из новостных изданий запрет на его работу выдали четверть компаний. Аналогичный веб-краулер компании OpenAI заблокировали в 53% случаев, и 43% изданий отказались от инструментов обучения искусственного интеллекта Google.