25.01.2023, 10:05

«Яндекс» научил нейросети расшифровывать записи с дореволюционной орфографией

«Яндекс» занялся расшифровкой архивных рукописных документов с помощью нейросетей. Алгоритм оптического распознавания символов учитывает особенности почерка, вышедшие из употребления буквы, а также понимает структуру архивных записей.

Сейчас с помощью функции «Поиск по архивам» можно прочитать свыше 2,5 млн страниц исторических документов с текстовой расшифровкой. Проводить поиск можно с упоминанием фамилии, населенного пункта или любых других слов. Документы можно искать по каталогам или через строку поиска. Доступны фильтры по годам, фондам, архивам и описям. На странице рядом со сканом отображается построчная расшифровка от нейросетей «Яндекса». При наведении на фрагмент текста он подсветится и на цифровой копии.

Обучение нейросетей происходило на основе базы данных из сотен тысяч рукописных строк из текстов XVII–XIX веков под руководством экспертов. Как заявляют в «Яндексе», благодаря работе нейросетей нечитаемый для неподготовленного человека текст почти мгновенно превращается в печатный документ. Первым фондом, представленным в сервисе, стал Главархив Москвы — по его материалам и обучалась нейросеть. Также в базе есть документы Оренбургской и Новгородской областей. Планируется, что в будущем количество доступных отсканированных файлов и хранилищ будет увеличиваться.

Евгений Федуненко

Новости компаний Все

Меню сайта

«Коммерсантъ» для Android

«Яндекс» научил нейросети расшифровывать записи с дореволюционной орфографией

16.02.2026

АО «Альфа-Банк»

Юра Борисов стал амбассадором премиального бизнеса Альфа-банка

16.02.2026

DOGMA

Итоги 2025: выручка DOGMA выросла на 87%, компания вошла в топ–3 застройщиков России

16.02.2026

АО «ТБАНК»

Т-Банк: на Чукотке супруги переводят друг другу больше всего денег

16.02.2026

АО «ТБАНК»

Центральный университет подготовит сборную РФ к Международной космической олимпиаде

Лента