Латвийские новости -> Поймем ли мы когда-нибудь друг друга?



Ну и везет же полиглотам, думаю я, разбирая со словарем инструкцию к французскому чудо-лосьону. Взять бы эту бумажку, засунуть куда следует, нажать кнопку, а с другого конца чтобы вылез перевод на понятный мне язык. Возможно ли такое? И да, и нет.

Провал и частичная реабилитация.

Естественное любопытство, в какой-то мере насущная потребность и, в конце концов, прозаическое задание разобраться в том, на что способны электронные переводчики, поставили меня перед проблемой, которую уже около полувека решают и теоретически, и практически.

Да, хорошо все начиналось. В 50-х годах неуклюжие электронные монстры на простейших примерах демонстрировали, что в принципе машина на перевод способна. Казалось, пройдет еще каких-то десять-пятнадцать лет, и разойдутся по свету сонеты Шекспира, переложенные с английского идеально, согласно непогрешимым законам математической логики. Прошло каких-то пятнадцать лет, и авторитетные государственные комиссии в разных странах объявили, что не стоит тратить деньги на бесполезные эксперименты в области, в которой машина никогда не сравнится с человеком.

Прошло еще пятнадцать лет, и резко возросшие возможности компьютеров вновь подняли интерес к машинному переводу. Но относились к нему уже более трезво. Стало ясно, что машина способна либо выдавать некий полуфабрикат текста, который еще предстоит довести до удобочитаемого вида, либо великолепно справляться с однотипными стандартными документами. Что же до появления машинной версии Шекспира, то до нее так же далеко, как и пятьдесят лет назад. Несложные технические инструкции, прогнозы погоды, типовые договоры - в общем, все то, что часто повторяется и не требует от переводчика суперквалификации - машины успешно переводят уже лет тридцать (причем редактирования практически не требуется).

Есть ли что-нибудь подешевле? Конечно. Это коммерческие пакеты, которые поступают в розничную продажу. При желании можете брать комплект с программой, распознающей текст с листа (если у вас дома есть приличный сканер). Сто, двести, триста долларов - такие деньги найдутся у многих. Но тратить их следует аккуратно, потому что коммерческая система, как и промышленная, делается под какое-то одно направление и в его рамках будет работать хорошо. Но если покупатель приобрел программу со словарем из области бытовых электроприборов и решил с его помощью пропустить через компьютер описание электронной схемы? Что получится на выходе, лучше не видеть.

Так что же, положение безвыходное? Нет, заботясь о потребителе, авторы включают в пакет режим, в котором можно сформировать словарь по своему собственному усмотрению. Можно, конечно, обратиться и к разработчикам, чтобы они сами адаптировали пакет под ваши личные потребности. Но заплатить придется. Сколько? А по доллару за слово не хотите? А сколько слов вам надо? Хотя бы тысяч пять. Вот и считайте...

Главный тормоз.

Выяснив, что к чему, и испытав некоторое разочарование, я прихожу к выводу: машина способна на многое, но что-то ее тормозит. Наверное, дело в запросах клиента. Да, он хочет универсальный инструмент. Ну хорошо, не с десяти языков, хотя бы с одного, но чтобы сразу и о медицине, и о химии, и о бизнесе, и о политике. А реально ли это вообще?

Оказывается, да. Терпение, сейчас немного теории. Машина работает не просто со словарем: там каждому слову приписываются его характеристики, известные по средней школе: какая это часть речи, род, одушевленность - не так уж и много. Всего каких-то трех-четырех параметров хватает, чтобы программа при переводе действовала не хуже человека с приличным средним образованием. Естественно, чем больше параметров используется, тем более совершенным будет результат. Так трудно что ли добавить еще указатель, к какой области относится конкретный эквивалент на другом языке? Скажем, "бочка" - это не только деревянная посудина, но в авиации также название фигуры высшего пилотажа.

Не так уж и сложно, правда? Если бы в автоматическом режиме удалось загнать в память машины сто книг по химии на французском и столько же - на русском, а потом она сама бы себе составила химический словарь, да еще и программу - вот это был бы высший класс! Но это пока еще мечта, хотя и не несбыточная.

Однако в качестве самого главного тормоза выступает соотношение между затратами на перевод, выполненный человеком, и стоимостью перевода компьютерного. В середине 80-х кто-то там "у них" посчитал, что компьютерный перевод имеет смысл, если одна страница переведенного текста стоит не более шести долларов. На Западе или в Японии человеческий труд ценится высоко, потому и дело движется. На бывшей соцтерритории картина прямо противоположная, и вряд ли она скоро изменится.

Что впереди?

Об этом имеет смысл говорить только за границей, желательно за западной, или же в Стране восходящего солнца. Там достаточно денег на всевозможные эксперименты, и работа над переводом несложных устных фраз (наподобие стандартных телефонных переговоров) идет полным ходом. Такие системы уже работают, причем перевод идет сразу на несколько языков.

Как обстоит дело с разработкой логической части программ, судить трудно. У каждого научного коллектива свой подход, и таких подходов очень много. Можно предположить, что в будущем постараются найти компромисс между сложностью алгоритмов и затратами на производство программ, и решение опять-таки будет связано с повышением мощности и памяти ЭВМ. И тогда компьютер сам определит, из какой "оперы" ему предложили что-то перевести, из математики или истории, и сам отберет нужные синонимы и выделит нужные омонимы.

Латвийская мечта.

Определенный интерес к компьютерному переводу у нас появился под влиянием политических событий, в начале 90-х. В части теории наши специалисты, возможно, были не так уж слабы. Появились по крайней мере четыре экспериментальные программы, одна из которых могла переставлять в обратном порядке слова, как это принято в латышском языке - что-то вроде "Связи министерства снабжения отдела бывшего начальника заместитель". Несколько лет назад одна из авторитетных латвийских фирм намеревалась даже создать рабочую версию для английского и латышского языков, но из-за нехватки денег проект оказался замороженным. С середины 90-х годов в Латвии по теме компьютерного перевода было подготовлено также несколько диссертаций, материалы одной из которых, с разрешения автора, и использовались при написании данной статьи.

Как говорится, исходя из вышеизложенного, невелика надежда на то, что в ближайшие годы инструкцию к какому-нибудь хитрому пылесосу с водяным фильтром вы сможете перевести на своем домашнем компьютере. Поэтому учить иностранные языки надо, все равно пригодится. Уж во всяком случае, те же сонеты в оригинале почитать - одно удовольствие...

Источник: Андрей КОЛЕСНИЧЕНКО, Республика

© 2010 lpp.lv