Еще недавно роботы, способные переводить с одного человеческого языка на другой, казались чем-то из области фантастики. Сегодня машины делают это легко, но довольно коряво. Это утверждение касается как платных программ, так и находящихся в свободном доступе онлайн-версий. Так есть ли смысл отдавать деньги?
Показывает и говорит
Под словами "электронный переводчик" чаще всего понимают компьютерную программу. Они могут как находиться в бесплатном доступе на разных сайтах, так и продаваться на дисках с сопроводительной документацией. Работать с электронными переводчиками несложно. При использовании простейших программ вы копируете в специальное окошко исходный текст, выбираете язык перевода, иногда — его тематику. Нажимаете на кнопку и через пару секунд получаете результат.
Усовершенствованные версии интегрируются в меню приложений Microsoft Office и переводят документы Word или, например, презентации Power Point, сохраняя оригинальное форматирование, то есть копировать никуда ничего не надо. К тому же, встроив такую программу в интернет-браузер, можно одним щелчком мыши получить отображение веб-страницы на нужном языке. Такие программы можно приобрести через интернет на страничках производителей, в других виртуальных магазинах, а также купить (но уже с наценкой) в обычных книжных или компьютерных торговых точках.
В сети в бесплатном доступе лежит множество онлайн-версий продуктов тех же производителей — и на их собственных страничках, и на отдельных сайтах. Примером могут служить www.translate.ru отечественной компании ПРОМТ или сервисы Babelfish порталов AltaVista (babelfish.altavista.com) и Yahoo! (babelfish.yahoo.com), функционирующие на базе переводчика американской фирмы Systran. Кроме того, получить программу можно, скачав демоверсию. При этом исчезнет необходимость заходить в интернет, чтобы перевести текст, но каждый раз при запуске документа Word или любого другого приложения со встроенным переводчиком будет всплывать окно с занудной просьбой приобрести платную версию. Через пару дней, по мысли разработчиков, пользователю это до смерти надоедает.
Популярность набирают не только программы, дающие перевод целых кусков текста, но прежде всего электронные словари, такие как Lingvo российской компании ABBYY — одного из ведущих мировых разработчиков программного обеспечения в области распознавания текстов и обработки естественного языка. В последнюю полную версию этого продукта входят 128 отдельных словарей на 10 языках мира. Альтернативой могут служить небольшие двуязычные программы с меньшим количеством слов, но и стоящие гораздо дешевле гиганта от ABBYY за 2450 руб. Принцип работы словарей прост: пользователь вбивает искомое слово в строку поиска и при помощи одного щелчка мыши получает его перевод. Их создатели, как правило, идут по одному из двух возможных путей: либо переносят на цифровые носители уже опубликованные бумажные издания авторитетных авторов, либо сами пишут содержательное наполнение. В интернете существует множество онлайн-версий электронных словарей (того же Lingvo на "Яндексе").
Наконец, автоматический переводчик может быть не только программой, но и гаджетом. Благодаря электронным карманным устройствам можно всегда иметь с собой массу словарей и разговорников. Они рассчитаны прежде всего на путешественника: способны, как правило, "произносить" переведенные слова, а также обладают большим количеством дополнительных функций в виде будильника, органайзера, плеера, обучающих игр или электронного гида по странам, где используется заложенный в них язык. В некоторых гаджетах есть функция распознавания речи: пользователю не надо знать, как пишется слово, достаточно сказать его (зачастую, правда, машине трудно с первой попытки понять говорящего). Программы перевода текстов в карманных устройствах — второстепенная забава: вводить целые предложения при помощи крохотных кнопок неудобно. Софт для машинного перевода в гаджетах — обычно собственного производства. Например, американская компания Ectaco выпускает помимо самих карманных устройств программу-переводчик LingvoSoft. Сама она в чистом виде на российский рынок не попала, а электронные переводчики от Ectaco и других фирм у нас продаются. Цена — от 900 до 20 тыс. руб.— зависит от производителя, количества заложенных словарных статей, а также от размера, веса и способа ввода информации. Так или иначе, лингвистические гаджеты остаются дорогими игрушками, если учесть, что словари и программы перевода, о которых речь шла ранее, выпускаются в версиях для КПК и смартфонов.
Игра в монополию
По оценке аналитиков из IDC, в 2006 году совокупный объем Language & Globalization Software Market, который объединяет машинный перевод, программы для профессиональных переводчиков на базе Translation Memory, электронные словари и ПО для локализации, составил около $200 млн — примерно столько же, сколько российский рынок "живых" переводов. Сегмент машинного перевода сам по себе аналитики не вычленяют. Но показателен объем продаж одной из ведущих компаний в этой сфере, американской Systran: {euro}5 млн за первое полугодие 2007 года. Скромные цифры.
Российская компания ПРОМТ, занимающая почти весь отечественный рынок продаваемых программ-переводчиков, оборотов не раскрывает, но очевидно, что они не выходят за показатели малого бизнеса. Однако интерес к сервисам растет: по словам директора по маркетингу компании ПРОМТ Александра Андреева, за последние девять месяцев посещаемость принадлежащего компании сайта www.translate.ru возросла на 40%.
"По итогам 2006 года увеличение продаж ПРОМТ по сравнению с 2005 годом составило 50%. В текущем году компания ждет такого же роста",— утверждает Валерия Комисарова, руководитель направлений "Интернет и безопасность" издания о высоких технологиях CNews.
А поскольку ПРОМТ практически монополист, получается, что весь небольшой рынок показывает впечатляющие темпы роста. В фирме между тем подчеркивают, что вовсе не обрадованы своей "руководящей и направляющей" ролью: появление конкурентов, которые проводили бы свои рекламные кампании, стимулировало бы общий интерес потребителей. Однако конкуренты пока не выживают. Еще пару лет назад на рынке была представлена система машинного перевода "Сократ" компании "Асеналъ", но сейчас о ней ничего не слышно. "Мы постоянно вкладывали деньги в развитие технологии, а "Сократ" стоял на месте: пока продукт продавался, они существовали, а когда спрос на него упал, им просто пришлось закрыться",— объясняет Александр Андреев.
Цена входного билета на рынок велика: отрасль наукоемкая. "Появляющиеся новички не выдерживают конкуренции",— констатирует Валерий Шепеленко из украинской Trident Software, производителя программ машинного перевода. Сама Trident Software, по словам господина Шепеленко, благодаря работе с национальными языками удерживает более 70% рынка на Украине и в Латвии. Переводчик Pragma от Trident Software едва ли не единственная альтернатива продукции компании ПРОМТ в России. Однако конкуренции между ними почти не возникает. Pragma ориентирован на Восточную Европу и страны СНГ (польский, украинский, латышский и другие языки), а ПРОМТ — на романо-германскую языковую семью. К тому же купить Pragma можно только через интернет, загрузив прямо с сайта разработчика или дистрибутора. А коробку с продукцией ПРОМТ можно взять с полки ближайшего книжного или компьютерного магазина (возможность онлайн-заказа, конечно, тоже есть).
Компании с мировым именем вроде американской Systran пока не всегда могут, а возможно, и не особо стремятся попасть на локальные рынки, где уже существуют свои игроки. Systran у нас тоже можно заказать через интернет, но на зарубежных порталах, и доставка ее обойдется минимум в $30.
Программы перевода на местный язык, как правило, лучше удаются тем разработчикам, кому он родной. "У Systran неплохая пара русский-английский, но англо-русский перевод очень слабый. Им нет смысла идти к нам",— уверен Александр Андреев.
ПРОМТ тем временем пытается активно играть и на зарубежном рынке: с ее решениями работает ряд крупных иностранных игроков, таких как AOL, SAP AG, Siemens AG, NASA, DaimlerChrysler, DHL. Однако компания также сталкивается помимо мировой Systran с локальными конкурентами на местных рынках, например во Франции и Германии. "Многое зависит от того, какие пары перевода содержит продукт, например пара английский-французский в большинстве случаев не сильно актуальна в азиатских странах,— поясняет эксперт Валерия Комисарова.— Все более или менее заметные на мировом рынке игроки предоставляют несколько пар, но на развитых локальных могут неплохо себя чувствовать разработчики софта, работающего с одной-двумя парами". ПРОМТ дает возможность переводить по 24 направлениям, включающим помимо русского 5 основных европейских языков. Systran работает с еще большим количеством, в том числе и с языками народов Азии.
За деньги и бесплатно
ПРОМТ выпускает модификации программ, предназначенные для использования дома и в офисе, а также продукты для профессиональных переводчиков и переводческих бюро. Предлагается несколько модификаций программы — от PROMT 4U, которая позволяет быстро переводить документы, веб-страницы и сообщения ICQ (590-90 руб. в зависимости от количества языков) до PROMT Expert 8.0, цена которой доходит до 24 тыс. руб. Топ-версия пригодна для структур с колоссальным документооборотом и переводческих агентств. Для КПК существует русско-немецко-русский переводчик Pocket PROMT 5.0 (1,5 тыс. руб.) и англо-русско-английский PROMT Mobile 6.0 (620 руб.).
У Pragma украинской компании Trident Software всего одна модификация, которая позволяет переводить между семью языками в любом направлении. Цена в интернете — от 3,1 тыс. руб. за версию, работающую с двумя языками, до 7,7 тыс. руб. за семиязычную программу. "Скоро нашу программу в России можно будет купить не только через сеть",— интригует Валерий Шепеленко, отказываясь, однако, сообщить что-либо более конкретное.
В любом случае производители платных программ уверены, что свободные онлайн-сервисы с их детищами не сравнятся. "Бесплатная интернет-версия решает две задачи: позволяет оценить качество перевода (для тех, кто собирается купить продукт) и перевести пару фраз, если возникла срочная необходимость,— утверждает Александр Андреев.— Для регулярного перевода бесплатную интернет-версию использовать так же нереально, как обедать на дегустации колбасы в супермаркете".
Впрочем, большинство экспертов отмечают справедливость такого подхода, лишь когда речь идет о корпоративных пользователях: им важны сохранение формата, скорость, а также наличие специализированных словарей, содержащихся в платных версиях. А обычный человек, используя метафору господина Андреева, как раз может в этом супермаркете напробоваться колбасы досыта. Не так уж сложно выйти в сеть, когда нужен перевод. Компания Google, кстати, вообще не предлагает никаких переводчиков на продажу — только свой бесплатный онлайн-сервис.
Да и платные переводы тоже далеки от идеала.
Залезть в душу
В основе первых "автоматических толмачей" лежала концепция опосредованного двухуровневого перевода: программа должна была сначала перевести исходный текст на некий упрощенный подъязык, а потом декодировать его на заданном языке, соблюдая грамматические правила и конструкции. Сегодня существует два подхода к автоматизированному переводу: основанный на правилах и так называемый статистический перевод. В первом случае программа шаг за шагом анализирует текст и синтезирует перевод, что напоминает процесс мышления человека. Сначала осуществляется морфологический анализ слов, то есть определяются часть речи, род, число, падеж и другие характеристики, а если вариантов несколько, то фиксируется вся информация. Например, встречая английское lives, программа устанавливает, что это может быть глагол "жить" в третьем лице единственного числа настоящего времени или же форма множественного числа от существительного "жизнь". Следующий этап — синтаксический анализ, в ходе которого машина находит члены предложения — начиная со сказуемого. В конце цикла происходит синтез нового текста. Именно так работают и ПРОМТ, и Systran.
Второй вариант основан на статистическом методе: посредством анализа огромного массива параллельных текстов программа выбирает наиболее часто совпадающие варианты и использует их при переводе. Никаких грамматических правил в нее не заложено — вместо них колоссальная база данных, из которой она черпает информацию о наиболее часто используемых вариантах. К примеру, если в массиве данных встречаются фразы sunny weather и cold weather с переводом "солнечная погода" и "холодная погода", то машина может на основе нехитрых вычислений заключить, что weather обозначает "погода". К тому же лексическими единицами тут являются скорее не отдельные слова, а устоявшиеся словосочетания. На основе как раз такой технологии построен сервис от компании Google — отдельные словосочетания при статистическом переводе получаются более точными и изящными, но грамматика хромает: иногда предложения настолько несогласованны, что невозможно понять их смысл.
Особняком стоит еще один подход — Translation Memory, продукты на базе которого скорее предназначены для профессиональных переводчиков и переводческих агентств. Эта технология основана на сравнении переводимого документа с текстами из предварительно созданной и постоянно пополняющейся базы переводов. Находя совпадения, программа предлагает ранее одобренный вариант. Это позволяет экономить время переводчика, освобождая его от необходимости выполнять одну работу несколько раз. Ведущим разработчиком Translation Memory считается SDL TRADOS, чьим эксклюзивным дистрибутором на территории России выступает все та же ПРОМТ. Кстати, российская компания также выпускает продукты на базе Translation Memory, соединяя ее с собственной технологией машинного перевода.
Нехватка интеллекта
Признавая существующие недостатки, производители систем машинного перевода подчеркивают, что их программы не ориентированы на создание художественного текста. И заменить человека они не смогут даже в долгосрочной перспективе — по крайней мере, пока не будет создан полноценный искусственный интеллект. "Это, может быть, удобный костыль, но мозгов он не заменит",— отзывается от машинном переводе Максим Немцов, занимающийся переводом литературным. Вообще, к машинному переводу в среде профессиональных переводчиков негативное отношение. Профессионалы своих неживых "коллег", как правило, не жалуют: им уровень владения языком позволяет быстро читать и понимать оригинал, а с точки зрения стилистического оформления программы-переводчики скорее навредят, чем помогут.
Но когда срочно нужно перевести большой объем текста, причем главным образом для того, чтобы понять, о чем идет речь,— машинный перевод очень кстати. "Можно прогнать текст через программу, а потом отредактировать. К тому же часто бывает, что договоры подписываются на языке оригинала и официальный русский вариант вообще не нужен",— объясняет Анна, секретарь-переводчик крупного бизнесмена, которая стала часто пользоваться такой системой после того, как спаслась благодаря ей от увольнения.
Очевидно, что с глобализацией число программ-переводчиков будет расти быстрее, чем количество людей-полиглотов. Что вовсе не означает, что учить языки теперь не нужно. Александр Андреев из компании ПРОМТ приводит такую аналогию: сейчас на стройке никому не придет в голову использовать ручной труд при рытье котлована — для этого есть экскаватор. Однако цветы на клумбу высаживают все-таки вручную.