Google Translate - дитя холодной войны?

    • Author, Мэтт Новак
    • Role, BBC Future

Иногда у меня возникает ощущение, что я живу в будущем.

В последний раз это произошло, когда в одном интернет-архиве я наткнулся на статью Los Angeles Times за 1954 год о перспективах компьютерного перевода.

Автор предлагает краткое описание компьютера фирмы IBM - первой машины, способной переводить текст с одного языка на другой - и приводит примеры задач, выполненных этой машиной.

Не сдерживая восторга, автор объясняет, что "искусственный интеллект" получил задание перевести на английский предложение на русском языке: "Мелькают лампочки, тихо потрескивает процессор - и через десять секунд вы уже видите готовый перевод!"

Желая выяснить, не ошибся ли компьютер, я скопировал из статьи русскоязычный текст и быстро перенес его в Google Translate. Да, перевод правильный.

Сегодня для этого не нужен сверхмощный компьютер или доступ к передовой лаборатории. Так же быстро можно было бы перевести текст с другого языка - любого из 63-х, которые поддерживает Google.

Добро пожаловать в будущее!

Мое открытие побудило меня узнать больше об истории этой технологии, которую мы сегодня воспринимаем как должное.

Как оказалось, заинтересованность в машинах-полиглотах и беспрепятственном переводе появилась даже не в 1950-е годы, а гораздо раньше. Вспомним 1629, когда французский философ и математик Рене Декарт предложил серию универсальных символов, на которые можно перевести любой язык. Впрочем, его идея так и не получила продолжения.

В 1933 году изобретатели из Франции и России независимо друг от друга получили патенты на различные способы машинного перевода с использованием бумажной ленты. Но, как это часто бывает, катализатором прогресса стала война.

Страх и отвращение

Электромеханические шифровальные машины, которые использовали во время Второй мировой войны, в послевоенное время сподвигли ученых погрузиться в новые исследования компьютерного перевода.

Одним из пионеров этого движения был американский ученый Уоррен Уивер, директор отдела естественных наук Фонда Рокфеллера. В 1946 году, прочитав статью английского физика Эндрю Бута, он поверил, что эра машинного перевода вот-вот наступит.

Коллеги просили его развить и изложить свои идеи, в результате чего в 1949 году вышел его меморандум "Перевод".

Он считается единственной примечательной публикацией 1940-х годов на эту тему и ставит перед машинным переводом довольно амбициозные цели.

Эта работа, которая была издана тиражом в 200 экземпляров, разошлась среди друзей Уивера (многие из которых работали в правительстве США) и, как говорят, послужила вдохновением для почти всех серьезных исследований в этой области в 1950-е годы.

Однако меморандум Уивера был не единственной движущей силой машинного перевода. Наибольшим импульсом послужила холодная война - и желание Соединенных Штатов свободно читать российскую техническую документацию.

В середине 1950-х годов примерно 50% научных работ в мире публиковались на английском языке. Перевод стоил в среднем 6 долларов (эта сумма с учетом инфляции соответствует нынешним 50-ти). Чтобы переводить узкоспециализированную техническую литературу, переводчик должен очень хорошо разбираться в теме. Для американцев, одержимых желанием быть в авангарде технического прогресса и обойти россиян, такие временные и денежные затраты были неприемлемыми.

Как писал в 1958 году журнал Popular Science ("Популярная наука"), эти научные работы могли содержать тайны "ядерной энергии, межпланетных полетов, сверхмощных батарей, более прочных шин".

"Но есть одна проблема: не многие ученые и инженеры свободно читают на иностранных языках. Нам нужна машина, которая читала бы на одном языке и сразу набирала текст на другом - автоматический переводчик. И мы пытаемся разработать сразу несколько таких машин", - пишет автор.

Одной из первых таких машин был компьютер IBM, о котором я упоминал в начале статьи. Он впервые был представлен в 1952 году, машину называли "самым современным и гибким скоростным компьютером в мире". На нем, среди всего прочего, была установлена программа для перевода. Через два года эта доработанная программа знала 250 слов и шесть грамматических правил. Но этого хватило, чтобы произвести впечатление на журналистов.

25 января 1954 года в журнале Chemical and Engineering News ("Новости химии и инженерии") появилась статья о том, что эта машина сделала "огромный шаг к обеспечению межкультурных коммуникаций".

"Электронно-вычислительная машина IBM 701... была преобразована в электронный переводчик или электронный мозг. Первое достижение этого мозга - перевод на английский язык российской научной литературы в области химии и инженерии. Прибором может управлять даже машинистка без знания иностранных языков", - гласит цитата из этой статьи.

"Перспектив нет"

Популярные научные издания разразились репортажами об этой чудо-машине. В журнале Mechanix Illustrated ("Иллюстрированная механика") за октябрь 1958 года разъяснялось, как работает этот "гигантский мозг".

"Сначала каждое слово из объемного словаря английского языка записывается на магнитную ленту под кодовым номером. Российским, французским или немецким эквивалентам этих слов присваивают те же номера. Затем, чтобы перевести, например, русский текст на английский, машина считывает с ленты кодовые номера российских слов, находит английские соответствия и распечатывает текст на английском языке".

Далее журналист описывает эксперимент, в ходе которого компьютер попросили перевести на русский английскую пословицу "С глаз долой, из сердца вон" (Out of sight, out of mind).

"На выходе получили "невидимый и сумасшедший", - рассказывает он. - Новые компьютеры гораздо более совершенны, однако, несмотря на то, что текст требует правок редактора, машина ежедневно может выполнять до сотни черновых переводов".

Примерно в это же время идея машинного перевода просочилась в массовую культуру. Холодная война и беспокойство по поводу того, что Америка проигрывает научно-техническу и ядерну войну породили циклы юмористических "воскресных комиксов". В частности, в комиксе Closer Than We Think ("Ближе, чем мы думаем") от 21 августа 1960 года авторы намеренно проигнорировали очевидные причины, по которым американское правительство так увлеклось развитием машинного перевода.

"Не за горами тот час, когда вы сможете говорить на английском с японцем, который знает только свой язык, или турком, который не владеет ни каким другим языком, кроме турецкого, - и они вас поймут", - сообщал комикс.

На иллюстрации был изображен иностранный чиновник, прибывший с визитом в Белый дом. Он только что сошел с трапа своего вертолета и жмет руку господину в изысканном костюме, который в другой руке держит "коробку-переводчик". Авторов рисунка вдохновила тогдашняя разработка американских Воздушных сил, объясняет подпись.

"Сейчас это довольно громоздкий прибор, который может обработать до 40 слов в минуту. Однако тенденция к уменьшению его размера, а также применение магнитной пленки открывают широкие перспективы - однажды это устройство сможет понять и воспроизвести переводимый текст в считанные секунды. Тогда люди смогут объясняться где-угодно и на любом языке!"

Впрочем, как это часто бывает, реальность не оправдала высоких ожиданий. К середине 1960-х годов США успели разочароваться в возможностях машинного перевода. А в 1966 году отрасли был нанесен сокрушительный удар. Консультативная комиссия по вопросам автоматической обработки речи (ALPAC) опубликовала отчет, в котором говорилось о недостаточных успехах в сфере анализа русскоязычных документов, которые использовались в военных целях.

Отрасль была обречена: "Машинный перевод не приносит нам пользы, и в ближайшем будущем у него нет никаких перспектив".

Комиссия рекомендовала прекратить исследования и обратиться к услугами переводчиков-людей. И только в 1980-е годы, с появлением дешевой "компьютерной силы", ученые снова всерьез взялись за эти исследования.

Представьте только, насколько совершенным был бы сейчас Google Translate, если бы они не останавливались.