Государство в рамках нацпроекта «Цифровая экономика» выделило 180 млн руб. на систему по борьбе с плагиатом в научных статьях. Их получит компания «Антиплагиат», которая планирует направить средства в том числе на разработку технологии, позволяющей находить заимствования из текстов на других языках. Эксперты надеются, что это позволит бороться с волной некачественных публикаций в зарубежных журналах, за которые российские вузы получают гранты на миллиарды рублей в год.
Фото: Дмитрий Лебедев, Коммерсантъ / купить фото
Компания «Антиплагиат», разрабатывающая систему поиска заимствований в русскоязычных текстах, получила грант Российской венчурной компании (РВК) в рамках направления «Искусственный интеллект» (ИИ) нацпроекта «Цифровая экономика» в размере 180 млн руб., сообщили “Ъ” в РВК. Средства будут направлены на создание промышленного решения, которое позволит находить в текстах переводные заимствованные фрагменты независимо от языка первоисточника. Для финансирования проекта компания также выделила собственные средства в размере 50% от суммы гранта, уточнил исполнительный директор «Антиплагиата» Юрий Чехович.
АО «Антиплагиат» зарегистрировано в мае 2005 года, бенефициары компании — ее основатели — физические лица, пояснил господин Чехович. Ее основные заказчики — вузы, научно-исследовательские учреждения, научные издательства и учреждения среднего образования. Сервис индексирует более 800 млн источников на разных языках. Его выручка по итогам 2017 года составила 117,5 млн руб., чистая прибыль — 25,6 млн руб., следует из данных «СПАРК-Интерфакса».
В рамках тестирования технологии «Антиплагиат» уже обнаружил 20 тыс. российских научных статей, содержащих заимствования из англоязычных источников, утверждают в компании. Сейчас система распознает заимствования из источников на русском, английском и казахском и планирует выйти с новым продуктом на зарубежные рынки — в Латинскую Америку, арабские страны, Индию и Восточную Европу. «Мы видим тенденцию, что если раньше заимствования были в основном в рамках русского языка, то с развитием технологий машинного перевода случаи перевода текстов, например, с английского на русский участились»,— отметил господин Чехович.
Технология распознавания переводного плагиата в декабре 2019 года также появилась в системе «Диссернет», которая организована на волонтерских началах сообществом профессиональных ученых. Проект занимается проверкой диссертаций и научных статей на наличие плагиата и не планирует привлекать инвестиции. «Мы не продаем свои услуги, работаем на бесплатной основе, сейчас планируем сбор средств с помощью краудфандинга для обновления сайта»,— отметил сооснователь проекта Андрей Ростовцев.
Проблема переводного плагиата в научных статьях сейчас стоит очень остро, уверен господин Ростовцев. По его словам, «Диссернет» фиксирует десятки тысяч статей, которые засылаются в иностранные журналы, входящие в престижные базы данных — SCOPUS или WoS. «Волна таких публикаций началась после майских указов президента, в числе которых было увеличение доли публикаций российских ученых в иностранных научных изданиях. После этого начали активно расти компании, которые предлагают услуги по подготовке научных статей на иностранном языке, к услугам которых начали прибегать вузы»,— поясняет Андрей Ростовцев. При выполнении нормы по публикациям в зарубежных журналах вузы получают гранты, уточняет он, оценивая потери федерального бюджета от такой деятельности примерно в 10 млрд руб. ежегодно.
Применение ИИ в анализе текста и обработки естественного языка интересует и крупный бизнес. Так, 2 марта МТС сообщила, что совместно со Сколтехом открыла лабораторию ИИ, деятельность которой направлена на создание новых моделей анализа текстов на русском языке. Представитель МТС отмечает, что работа с текстами «стала одним из самых важных направлений развития технологий, а полное понимание смысла текста сейчас является ключевым направлением для научных исследований».