Нейросеть пришла в книжный
“Ъ” разобрался, как искусственный интеллект помогает в издательском бизнесе
Российский книжный рынок активно тестирует инструменты, основанные на технологиях искусственного интеллекта (ИИ). С помощью алгоритмов издатели уже озвучивают аудиоверсии книг, придумывают обложки, анализируют продажи, а иногда ИИ даже сам пишет книги. Хотя применение подобных инструментов вызывает много споров и некоторые участники рынка относятся к ним с осторожностью, в будущем, по прогнозу экспертов, часть книг неизбежно будет создаваться с помощью алгоритмов. Также ИИ поможет издателям автоматизировать многие рутинные процессы.
Фото: Kai Pfaffenbach / Reuters
ИИ вместо маркетолога
Участники российского книжного рынка внедряют инструменты на основе ИИ и больших данных в рабочие процессы. Крупнейшая в России издательская группа «Эксмо-АСТ» (включает издательства «Эксмо», АСТ, «Манн, Иванов и Фербер», «Бомбора» и др.) уже использует их для прогнозирования тиража допечаток, рассказал совладелец группы Олег Новиков: «Количество тиража на основании данных о продажах, динамике отгрузок теперь выставляет машина — еще несколько лет назад это определялось экспертно редактором или отдельным специалистом».
Новым направлением применения ИИ и больших данных для группы, по словам Олега Новикова, стал анализ потенциала рукописи. «В данный момент выделено 800 рукописей успешных и неуспешных, по которым также загружены данные продаж. Сейчас идет обучение машины и потом этап проверки. Эти технологии уже реализованы Amazon, лидером в применении ИИ и больших данных в области книг»,— говорит господин Новиков.
Третьим направлением, по его словам, является поиск востребованных ниш и авторов на основе данных запросов на маркетплейсах. Успешным референсом, по его словам, является SEO-издательство Callisto (анализирует данные продаж книг и выпускает книги на их основе), чей оборот еще в 2015 году составил $10 млн. «К сожалению, на данный момент на российском рынке есть проблема со сбором данных запросов о покупках, однако для этапа обучения эта работа для реализации пилота делается вручную. Если мы увидим потенциал, то попробуем наладить взаимодействие с маркетплейсами в этом направлении»,— говорит господин Новиков.
ИИ вместо дизайнера
Издатели также все чаще экспериментируют с ИИ-моделями при создании дизайна обложек новых книг. Один из недавних примеров — книга Эми Липтрот «Момент», выпущенная в этом году издательством Ad Marginem. Дизайнер Анна Сухова рассказывала в Telegram-канале издательства, что сгенерировала изображения для обложки с помощью нейросети, основываясь на цитатах из книги, где героиня проводит бОльшую часть своего времени в интернете: «Мне понравилась эта наивная точность, с которой нейросеть создает изображения, как честно она опирается на текст, и при этом элемент случайности добавляет лиричность».
В «Альпине» рассказали, что применяли ИИ для создания обложки книги «Форма жизни №4» Евгения Черешнева, которая посвящена ИИ. «Но именно применялся — мы не дали ИИ все на откуп»,— уточнил главный редактор издательства «Альпина Паблишер» Сергей Турко. Господин Турко при этом подчеркивает, что ИИ не может заменить дизайнера и придумать обложки для всех новых книг. «Если вы хотите получить ожидаемый, средний дизайн обложки, нейросеть вполне с этим справится. Но нам кажется, что обложка должна быть уникальной, не похожей на другие. ИИ — неплохой инструмент, но именно инструмент, а не хозяин. Даже если нейросеть что-то выдает, это надо критически осмыслить, пропустить через человека, добавить хотя бы щепотку человеческой эмоции, как говорит наш арт-директор Юрий Буга»,— отмечает Сергей Турко.
ИИ вместо диктора
Также алгоритмы начинают широко использоваться для озвучивания аудиоверсий книг. За рубежом ИИ-озвучка аудиокниг близка к тому, чтобы стать мейнстримом. В начале года такая опция появилась в Apple Books. В компании отметили, что инновация позволяет значительно сократить затраты на создание аудиокниг, сделать их доступными даже самым небольшим издательствам.
Российские сервисы также начинают активно применять такие технологии. Как писал “Ъ” 23 марта, книжный сервис «Строки» (принадлежит МТС) в 2023 году планирует озвучить более 10 тыс. произведений с помощью искусственного интеллекта разработки подразделения MTS AI, на первом этапе в работе уже находятся 600 произведений. ГК «ЛитРес» (сервисы «ЛитРес», MyBook, Livelib и др.) также развивает озвучивание аудиокниг с помощью ИИ с 2022 года: группа использует технологию распознавания и синтеза речи SpeechKit, на которой работает голосовой помощник «Алиса» (развивает «Яндекс»).
В сервисах ранее уточняли, что студийная запись живым голосом занимает до нескольких дней с учетом технической обработки и монтажа, тогда как на подготовку первоначальной версии аудиокниг с помощью ИИ уходит только около 30–60 минут. Также за счет ИИ сокращаются расходы на озвучивание одной единицы контента: по оценкам собеседников — минимум в десять раз. Сейчас более 90% книг на российском рынке не имеют аудиоверсии, отмечали в МТС, а их трансформация в аудиоформат, по оценке компании, традиционным способом «заняла бы годы».
Некоторые издатели в то же время говорят, что пока массовое производство аудиоверсий с помощью ИИ они запускать не планируют, так как записанные с помощью ИИ аудиокниги все еще уступают по качеству озвученным людьми. «БОльшую часть книг мы озвучиваем с привлечением дикторов. Для нас создание аудиокниг с помощью ИИ сейчас является скорее исключением, чем правилом. На рынке есть интересные решения, которые позволяют это делать, но на данном этапе такого плана у нас нет. Использование робота действительно имеет плюсы — скорость и цена. Такой способ сокращает затраты и время изготовления, но обратной стороной является соразмерное качество»,— говорит руководитель аудиопроектов Alpina Digital (издательская группа «Альпина») Николай Боронин. Даже хороший ИИ не может полноценно заменить диктора, убежден он: «Сегодня искусственный голос несовершенен, это может негативно сказываться на продажах. Вероятно, в будущем это может измениться, но должно пройти какое-то время. Хотя для некоторых типов литературы ИИ вполне подходит уже сейчас».
Опасения по поводу распространения технологий также возникают у дикторов: как писал “Ъ” 27 января, Союз дикторов просил Госдуму установить регулирование синтеза человеческого голоса с помощью ИИ. Дикторы утверждали, что сталкивались со случаями кражи их голосов (юридически голос никак не защищен от копирования) и говорили, что в целом опасаются снижения доходов на фоне распространения таких технологий.
Без личного участия специалиста, чей голос отобран по специальным параметрам, невозможно добиться качества автоматического озвучивания, то есть опасения дикторов, что их записи могут быть использованы для создания технологии синтеза речи, не в полной мере оправданны, отмечают в пресс-службе «ЛитРеса». «Развитие технологий — это необратимый процесс. Благодаря появлению сервисов озвучивания и синтеза речи расширились возможности для людей с ограниченными возможностями, которые могут воспринимать информацию только на слух»,— говорят в компании. Какими бы профессиональными ни были записи, созданные платформой, авторское озвучивание остается вне конкуренции, особенно для создания аудиокниг по художественным произведениям, признают в группе: «Но при этом расширенные возможности, которые дают технологии, позволяют развиваться аудиоформату высокими темпами».
ИИ вместо писателя
Но больше всего дискуссий вызывает перспектива того, что речевые технологии ИИ могут быть широко внедрены непосредственно в процесс создания книг. Такие возможности начали активно обсуждаться, в частности, после того, как американский разработчик OpenAI в 2020 году представил генератор текста GPT-3. Система основана на принципе языковой модели: алгоритм, обученный на огромном массиве текстов (от литературной классики до постов в соцсетях), определяет, какие слова в какой последовательности располагаются в предложении, и создает оригинальный текст. В марте OpenAI выпустил новый алгоритм GPT-4, и, по данным компании, он превосходит прошлую версию на 40% по достоверности информации.
Книги с ИИ в соавторах уже выходят в России: в конце мая в издательстве Individuum вышел сборник рассказов «Пытаясь проснуться», половина которых написана писателем и художником Павлом Пепперштейном, а другая половина — нейросетью ruGPT-3. В аннотации сообщается, что нейросеть оттачивала свое писательское мастерство, анализируя русскую классику.
«На Amazon уже сегодня продаются сотни книг, написанных с помощью ChatGPT. В основном это комиксы или детские книжки, нередко с иллюстрациями, тоже сгенерированными ИИ. Некоторые американские журналы, куда любой может прислать публикацию, жалуются на огромный наплыв некачественного, очевидно сгенерированного контента, с помощью которого люди пытаются заработать легкие деньги»,— рассказывает управляющий партнер аналитического агентства Spektr Николай Седашов.
В ближайшие годы, по прогнозу эксперта, обычным делом станет использование ИИ для создания детского или массового контента, например простых фантастических рассказов, young-adult и бульварных романов. А через 10–15 лет книгоиздательство и литература в целом, как и многие другие сферы, разделится на два течения. «Одно будет широко использовать ИИ и создавать простые и недорогие продукты для широкого круга потребителей. При этом далеко не обязательно, что они будут хуже, чем современные книги. ИИ упростит написание книг, но в умелых руках качество не пострадает. Второе направление, более дорогое и элитарное, будет применять исключительно человеческий труд. На книгах, сериалах, статьях или музыке будет стоять метка "сделано без участия ИИ", точно так же, как на молочных продуктах сегодня указывают, что они изготовлены без использования заменителей молочного жира»,— рассуждает Николай Седашов. По его словам, в целом в будущем с помощью ИИ издательства автоматизируют многие рутинные процессы, например вычитку и классификацию присланных текстов, также ИИ будет активно применяться для расшифровки рукописей или устной речи из записей или видео и преобразования их в цифровой текст.