Современные Программы Компьютерного Перевода
Современные программы компьютерного перевода
Васиев З.С.
(СамГУ, Узбекистан)
Первые коммерческие продукты машинного перевода, нашедшие практическое использование, появились в середине 80-х годов. Они были реализованы на персональных компьютерах и являлись системами прямого перевода, возможности которых базировались на огромных (по сравнению с первыми системами) словарях, а не на умении анализировать и синтезировать тексты.
Однопользовательская «коробочная» версия продукта RETRANS VISTA фирмы «Виста текнолоджиз» предназначена для автоматизированного перевода текстов с русского языка на английский и обратно. В ней использованы оригинальные алгоритмы сжатии словарных баз и поиска переводных эквивалентов, позволяющих транслировать «на лету» не только фрагменты текста, импортируемые из текстового редактора MS WORLD, но и WEB – страницы.
В словарях RETRANS VISTA хранятся миллионы понятий, к которым относятся не только традиционные устойчивые фразеологические обороты, но, прежде всего, словосочетания, используемые в повседневной речи. Кроме того, есть программа концептуального анализа, автоматически выделяющая из текста новые словосочетания и включающая их в словарь. Основные словари системы RETRANS VISTA содержат термины и фразеологические единицы по естественным и техническим наукам, экономике, бизнесу и политике. Объем политематического машинного словаря – около 3,5 миллионов слов (1,8 миллионов в русско – английской части, 1,6 миллионов – в англо - русской), причем 20% из них являются словами, а 80 % - устойчивыми словосочетаниями со средней «длиной» в 2,2 слова.
Фирма ПРОМТ[1] разработала и поставляет интернет – переводчик PROMT INTERNET TRANSLATION SERVER, обеспечивающий перевод «на лету» Web - страниц, запросов к посиковым системам или к базам данных, представленным в интернете.
Модуль перевода PROMT Internet встраиваются в браузер MICROSOFT INTERNET EXPLORER, образуя средство для синхронного перевода WEB – страниц WEB Viev. При этом можно устанавливать для перевода различные языковые пары: английский – русский; английский – немецкий; английский – испанский; французский – английский; французский – немецкий.
С практической точки зрения, имея в виду качество результирующего текста и его соответствие исходному, программы машинного перевода подразделяют на три категории:
v полностью автоматический перевод;
v автоматизированный машинный перевод при участии человека;
v перевод, осуществляемый человеком с использованием компьютера.
Программы машинного перевода первой из названных категорий являются делом далекого будущего, поскольку в общем виде не решены проблемы автоматического понимания, перевода и синтеза текстов.
Программы второй категории разработчики называют МТ – программы (от Machine translation - машинный перевод). Реально автоматизированный (с участием человека) машинный перевод возможен только в условиях искусственно ограниченного, как по словарному запасу, так и по грамматике, языка.
В качестве реально успешного проекта МТ – программы часто называют немецкую систему Meteo, выполняющую перевод метеопрогнозов с французского языка на английский и обратно.
К МТ – программам относятся и продукты машинного перевода фирмы ПРОМТ, упомянутые выше, в том числе программы для просмотра содержимого WEB – страниц в сети интернет с целью поиска нужного документа.
Программы третьей категории разработчики называют ТМ – программы (от translation memory – память перевода). Эту категорию программ применяют профессиональные переводчики, осознавшие выигрыш от автоматизации их работы с помощью компьютеров. Основу ТМ – программ составляют специализированные словари, соответствующие тематике переводимого текста. При переводе используются конструкции и значения слов и устойчивых словосочетаний, выбранные профессиональным переводчиком и занесенные в словари системы, а полученный текст подвергается интенсивному редактированию. Словари и переведенные фрагменты текстов, запоминаемые в ТМ – системе, могут быть повторно использованы в больших коллективных проектах, ими можно обмениваться. Поэтому ТМ – системы представляют собой важное средство автоматизации труда профессиональных переводчиков.
Часто ТМ – программы используют в сочетании с МТ – программами. Наиболее популярным в мире ТМ – инструментарием является TRANSLATIONS WORKBENCH фирмы TRADOS (для краткости часто также называемый TRADOS).
История машинного перевода насчитывает немногим более 50 лет. За это время сменилось несколько поколений систем машинного перевода – от первых программ, использовавших ограниченные ресурсы универсальных компьютеров первого поколения, до современных коммерческих продуктов, использующих мощные ресурсы серверов и персональных компьютеров, включая ПК, в которых можно размещать карманные словари, а также компьютерные сети.
По мере сияния технических ограничений, налагаемых возможностями компьютеров по производительности и памяти, становилось ясно, что проблема перевода текста с одного естественного языка на другой принципиально не сводится только к перекодировке слов. Для преодоления основных трудностей проблемы машинного перевода должны быть решены задачи автоматизированного представления контекста, смыслового содержания переводимого текста, знаний о понятиях предметной области, к которой относится переводимый текст.
Вместе с тем, современные достижения в области вычислительной техники, информационных технологий и технологий телекоммуникаций позволяют выдвигать на перспективу практические задачи поиска и выбора требуемой информации, представленной а разных языках, из разнородных источников, находящихся в корпоративных и глобальных информационно – телекоммуникационных сетях.
В качестве такой перспективной задачи можно привести системы запросов к информационным ресурсам сетей, например к базам данных, с возможностью формирования ответов по телефону в виде устной речи. Для этого требуется сочетание систем машинного перевода с системами распознавания и синтеза речи.
Традиционно принято выделить 8 типов технологии перевода. В современных профессиональных средах перевода возможности вычислительной техники используются на различных этапах и уровнях. Всего можно выделить восемь способов применения компьютера при переводе (Таблица № 1).
Уровень терминов
Уровень сегментов
До перевода
Выделение терминов
Анализ терминологии
Сегментация текста
Во время перевода
Автоматический поиск терминологии
Поиск языковых пар в памяти переводов. Машинный перевод
После перевода
Проверка соответствия терминологии
Проверка целостности сегментов, формата и грамматики.
Выделение терминов и анализ терминологии.
На этом этапе производится исследование текста с целью выяснения, какие слова или словосочетание «операционная система» то программа должна проанализировать его в качестве возможного термина, даже если в системе уже определены термины «операционный» и «система».
БИБЛИОГРАФИЯ
- Рейтблат А.И. Комментарий в эпоху интернета // Новое литературное обозрение – 2004. - № 66. – с. 82-90.
- Сидоров Е.В. Системная модель коммуникации и параметры текста в переводе // лингвистические проблемы перевода. М., 1982.
- Флорин С. Муки переводческие. – М., 1983. – с. 21.
- Шрейдер Ю.А., Шаров А.А. Систем и модели. М., 1982.
- www.promt.ru
[1] www.promt.ru
Обсудить статью
Как и многие документы и научные работы, письменный перевод текста с иностранного или на иностранный язык должен соответствовать целому ряду требований в своем оформлении. Существует ряд общепринятых правил, касающихся формата текста, перевода имен собственных, использования печатных знаков.
Перевод является интерпретацией сути текста на исходном языке и написанию эквивалентного нового текста на другом языке перевода. Главная его цель заключается в установлении эквивалентных отношений между переводным текстом и исходником. В тоже время оба материала должны иметь один и тот же смысл.
Первый опыт создания программа машинного перевода показал, что необходимо решать эти задачи постепенно и по частям. Слишком много трудностей и неясностей было в том, как нужно формализовать и строить алгоритмы для работы с текстами, какие словари надо вводить в машину, какие лингвистические закономерности следует использовать при машинном переводе и каковы вообще эти закономерности.
Переводчики и переводы, сложности и трудности на сегодняшнем рынке переводов. Как найти хорошего переводчики и не ошибиться?
Может ли «обычный переводчик» выполнить технический перевод, или как выбирать агентство переводов.
Компьютерная вышивка – это один из самых современных способов традиционного, исконно русского украшения одежды и прочих вещей. Изделия, полученные в результате такой работы, отличаются высоким качеством исполнения, поскольку в этом случае практически полностью исключен человеческий фактор.
можете ли вы определить язык документа, если он отличен от вашего родного? Как нам стало известно, большинство людей, обращающихся в бюро переводов, все-таки знают, на каком языке составлен принесенный ими документ. Поэтому дальнейшая информация для тех, кто не знает или не уверен...
Программное обеспечение разделяется на необходимое и второстепенное, которое сильно упрощает работу на ПК. Самой популярной утилитой для просмотра публицистики в электронном формате признан...
Авторская программа по дополнительному образованию детей «Культура и традиции Англии» Данная программа относится к культурологическому направлению и способствует интеллектуальному развитию детей младшего школьного возраста через приобщение их к культуре и традициям Англии.
Проблема интереса к структуре целостной личности занимает одно из важных мест в отечественной психологии и педагогике. Это одна из тех проблем, которую изучали очень интенсивно, но которая во многом продолжает оставаться загадкой.
В данной статье приводится обзор существующих алгоритмах, применяемых в геологии, которые основаны на алгебраической теории информации

Диссертация, как правило, представляется в виде специально подготовленной рукописи, значительно реже — в виде опубликованной монографии. Вместе с диссертацией соискатель должен подготовить автореферат диссертации (краткое изложение основных результатов диссертационной работы).
Психологические исследования финансовых рынков показывают, как на индивидуальном, групповом и глобальном уровнях продуцируются и активно действуют "фантастические объекты", которые периодически почти полностью подчиняют себе рынки — потребительский, информационный, финансовый и политический.
Как мультфильмы действуют на психику и поведение ребенка?Стоит ли родителям опасаться плохого влияния со стороны телевидения?

Трудные моменты обучения в аспирантуре. Полезные ссылки и советы аспирантам и соискателям.
В данной статье рассматриваются структурные особенности современной промышленности. А так же, исходя из анализа отраслей промышленного производства, выявляются факторы, влияющие на их размещение.
Многие специалисты убеждены, что прогресс, достигнутый молодым объединением государств БРИКС уже на начальном этапе своего существования, а главное – динамика и перспективы его развития убедительно свидетельствуют: БРИКС – глобальный форум, который будет во всё большей мере определять вектор мирового развития в XXI веке.
Корпусом материала нашего исследования послужили чтение и перевод восьмидесяти статей узбекских электронных изданий, было выбрано 200 фразеологических единиц.
«Каждое художественное произведение – по словам Ю. Тынянова, - ставит в иерархический ряд равные предметы, а разные предметы заключают в равный ряд. Каждая конструкция перегруппировывает мир»
В далеком 1984 году участник дискуссии «Арифметика и алгебра перевода» в «Литературой газете» Андрей Мальгин обнаружил феномен «обратной связи» - влияния переводимых поэтов на «оригинальное творчество мастера», их переводившего.
Трактовка «таланта» как антипода «точности» в современных спорах о переводческом искусстве имеет, на наш взгляд, как чисто практическую подоплеку, так и глубинные объективные основания, которые, к сожалению, как раз крайне редко становятся предметом аналитического осмысления.
Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж (1791-1871), разработавший в 1836-1848 гг. проект цифровой аналитической машины – механического прототипа электронных, цифровых вычислительных машин, появившихся через 100 лет.
Первый опыт создания программа машинного перевода показал, что необходимо решать эти задачи постепенно и по частям. Слишком много трудностей и неясностей было в том, как нужно формализовать и строить алгоритмы для работы с текстами, какие словари надо вводить в машину, какие лингвистические закономерности следует использовать при машинном переводе и каковы вообще эти закономерности.
Автоматическая память переводов, или просто память переводов (TRANSLATION MEMORY), подразумевает, в первую очередь, просмотр ранее переведенных текстов. Она сравнивает переводимый в текущий момент текст с тем, что хранится в базе «вспоминает» сегменты, которые изменились незначительно, и предлагает использовать их перевод повторно. Разумеется, критерии сходства сегментов могут быть различны, и они играют очень важную роль в расширении возможностей памяти переводов.