Оглавление блога

среда, 28 декабря 2011 г.

Развернутый ответ на коммент msnre к предыдущему посту:

(слишком длинно получилось, чтобы втискивать это в комменты)

В этом интервью Игорь Ашманов утверждает:

а) "И все же рассчитывать на появление «хорошего» машинного перевода в ближайшие годы безо всякого «истинного понимания смысла» — можно".

Чуть выше он оперирует термином "ответственный" перевод, то есть перевод очень важных документов (или - бесед), где ошибка или неточность может привести к тяжелым последствиям для человека / предприятия / общества. Здесь он уже снизил планку: "хороший" перевод. Что это? Кто и как его "хорошесть" определяет?

Посмотрите мой пост "Непохожий перевод", пример с документом об усыновлении. Без понимания - невозможно.

Вы говорите: "дополнительная проверка человеком во многих случаях обязательна".

Инструкция к компрессору для нефтеперерабатывающего завода. По-английски там написано, что через 20 часов после первого запуска нового, "с иголочки", компрессора нужно слить из него всё отработанное [смазочное] масло (oil) (там его литров 300! - мое прим.) и заменить на новое, чистое. Русский (машинный, правда) перевод: что-то о том, что "отходы нефтепродуктов (oil) нельзя сливать в обычную канализацию, нужно сначала пропустить через очистную установку".

(Не могу, к сожалению, процитировать точнее, я просто держал там несколько минут в руках оба эти текста, английский и русский).

Мой вывод: в тех "многих случаях", когда "дополнительная проверка человеком обязательна", она как раз-таки и невозможна! Ну как русский специалист, не знающий английского, читая этот перевод, может заподозрить даже (не то чтобы догадаться!), что речь ВООБЩЕ о другом? Он просто исправит лексические и синтаксические погрешности русской фразы! А дорогущий импортный новенький компрессор невосстановимо выйдет из строя, проработав всего часов 200.

б) Ашманов пишет, что раз невозможно дать точное определение понятию "понимание", то и шут с ним... Вот, понятие "сознание", "интеллект" тоже определить невозможно, но есть тест Тьюринга...

Есть многое на свете, друг Горацио... Например, невозможно дать точное определение понятию "аккуратная пайка", но каждый радиомеханик с первого взгляда видит, профессионал это паял (который каждый день по 8 часов держит в руках паяльник) или любитель, который берет его в руки раз в 2 недели.

с) "Еще и лингвист". Вот цитата из моей статьи "Переводчик и заказчик перевода: как нам найти друг друга?":

"В любом ремесле (токарь, врач, штукатур) большинство, даже проработав 20 лет, остаются посредственными специалистами, а то и вовсе плохими".

Юлия Латынина, журналист, автор нескольких художественных книг, кандидатскую защитила то ли по филологии, то ли по лингвистике. Послушайте любую ее передачу на радио "Эхо Москвы". Там ошибки в падежах, согласовании - почти в каждой фразе! Просто напрочь отсутствует навык грамотной русской речи, хоть и нейтив (Черномырдин №2)! Ея речь за ея же мыслью просто не поспевает, а автоматизма нет...

Нередко случается: я пытаюсь что-то непонятное уточнить, мне говорят: да не парься ты, переводи, как есть, а они там поймут. Я всегда отвечаю, что если я, переводчик, чего-то не понял, читатель перевода (или собеседник), какой бы он ни был крутой специалист, тем более этого не поймет! Стопудово!

Ну, было пару раз, что я не знал значение какого-то термина, перевел "пословно", то есть, конечно же, неправильно, а они друг друга всё равно поняли. Но ведь я же нашего предупредил: "я не знаю, что это означает, но дословно это будет...". Наш специалист переключил свои мозги в режим "форсаж" и - догадался! А я тут же у итальянца уточнил, правильно ли наш угадал.

Перевод - это задачка, решаемая в два действия:
1. Понял
2. Выразил

См. мой пост: "Пример перевода".
Там, не поняв - просто никак. А понять мне помог не только контекст, но и личный опыт: я просто когда-то, на монтаже оборудования, видел и держал в руках такие кабельные ярлыки.

Ашманов считает, что "понимать" не обязательно? Для "ответственного" перевода достаточно синтаксического анализа фразы + функция "статистического самообучения"?

Добро пожаловать в тупик!

1 комментарий :

msnre комментирует...

>Что это? Кто и как его "хорошесть" определяет?

Как раз здесь можно ввести метрики, определяющие качество перевода. Это же и замечание о Тюринге - критерии оценки ввести можно всегда, просто все зависит от того, насколько сложны они будут :).

"Непохожие переводы" мы трогать не будем - это уж точно пока удел человека.

> в тех "многих случаях", когда "дополнительная проверка человеком обязательна", она как раз-таки и невозможна!

См. внимательно, например, сайты notabenoid.com и translate.by (кстати, лучше бы написал что-нибудь о вот таких краудсорсинговых сервисах перевода - имеют ли они будущее, несмотря на порой низкий, а порой хороший уровень перевода - твое мнение интересно), или то, как сделано в ПРОМТЕ - фактически, подстрочный перевод, где сразу видны ошибки. Сам же понмиаешь, при корректуре перевода можно сделать удобное нахождение ошибок - в случае программ перевода используются дополнительные интерфейсные ухищрения вроде подсветки "спорно" переведенных фраз, вариативночть перевода (переключение вариантов мышкой), выделения фраз в обоих текстах при наведении курсора. Если в эту же систему включить редактора из переводческого бюро, связав в одной системе его и переводчика, то такой обратной связью можно снизить количество ошибок до минимума.

Речь же все-таки не о замене переводчика, а о качественном, понятном на русском переводе с минимальным количеством кривых дословностей, принятых в языке переводимого текста и не принятых в языке, на который надо перевести. Не о Волкове и стране ОЗ, и не о качественных литературных текстах - тут пока прорыва нет.

Но - речь о том, что машинный перевод может быть действительно удобным инструментом для переводчика, который будет облегчать его работу на 30-40%. И речь о том, что для повседневного пользователя, который хочет прочитать статью в Нью-Йорк Таймс, и действительно правильно понять, что там написано.

Вот пример - http://translate.google.ru/translate?hl=ru&sl=en&u=http://en.wikipedia.org/wiki/Barack_Obama&ei=BRT8TrbTLIqLswb9kr2-AQ&sa=X&oi=translate&ct=result&resnum=2&ved=0CC8Q7gEwAQ&prev=/search%3Fq%3Dobama%2Barticle%26hl%3Dru%26newwindow%3D1%26biw%3D1066%26bih%3D750%26prmd%3Dimvns

Сразу видно, что Гугл Транслейт не умеет до конца согласовывать род числительных, да и у глаголов время (он закончил войну в Ираке , увеличение численности войск в Афганистане), профукал где-то экономический словарь ( economic stimulus legislation), в политике не разбирается (Democratic incumbent) - то, с чем профессиональные пакеты перевода справляются.

И Ашманов как раз и занимается развитием и разработкой систем понимания и анализа текста (не только синтаксический разбор и статистический анализ, конечно же) - чтобы различными алгоритмическими хитростями "понимать" текст (определение тематики для подбора словаря, определение контекста, нахождение действующих объектов для определения местоимений и согласования и т.д.). Если это выглядит фантастически, это пока.