Автоматизация работы переводчиков

advertisement
Олег Выгодский
Глеб Яльчик
Автоматизация работы
переводчиков
по опыту работы Центра переводов
технической документации
Центр переводов

Тематика переводов
–
–
–
–


телекоммуникации
оборудование и ПО
электроника
механика
Локализация ПО
Используемые DTP
–
–
–
–
–
–
–
Microsoft Word
Corel Ventura
QuarkXpress
Page Maker
Frame Builder
Frame Maker
Interleaf

Особенности
– большие объемы
(400-600 стр в месяц
на переводчика)
– согласование
терминологии с
заказчиком
– использование MT
– использование TM
– обновление версий
документации
Разделение труда
Исходный
документ
Исходный
Исходный
(в
формате
документ
документ
DTP)
Текст
для
Исходный
Исходный
перевода
документ
Исходный
документ
(ASCII)
документ
Исходный
Исходный
(в
формате
документ
документ
DTP)
Служебная
Исходный
Исходный
информация
документ
документ
Переведенный
Исходный
Исходный
текст
документ
документ
(ASCII)
Разделение труда
процесс перевода
ПакетнаяСам
обработка
документации распадается
 Машинный
перевод
на следующие
базовые
операции
 Постредактирование
 Постобработка

Разделение труда
Исходный
документ
Исходный
Исходный
(в
формате
документ
документ
Текст
для
Исходный
Исходный
перевода
документ
документ
(ASCII)
DTP)
Служебная
Исходный
Исходный
информация
документ
документ
Переведенный
Исходный
Исходный
текст
документ
документ
(ASCII)
Разделение труда
Переведенный
Исходный
Исходный
текст
документ
документ
(ASCII)
По окончании этапа перевода
текст и служебная информация
Перевед.в конечный
Готовый
объединяются
документ
перевод
Исходный
документ
в исходном формате Исходный
Исходный
Исходный
формате
(в
формате
документ
документ
DTP (в
документ
документ
DTP)
Служебная
Исходный
Исходный
информация
документ
документ
DTP)
Этапы процесса перевода
Извлечение текста (разборка)
 Дополнительная фильтрация
 Перевод текста
 Восстановление файла (сборка)
 “Корректирующая” верстка
 Корректура (по бумаге)

Поддерживаемые форматы
RTF
 MIF
 HTML
 SGML
 Interleaf
 TROFF/NROFF

Организация рабочего места
переводчика
Особенности MultiEdit
Многофайловые поиск/замена
 Регулярные выражения
 Цветовое выделение
 Расширяемость

– синхро-просмотр
– дополнительные буферы обмена
– вызов удаленных словарей
Применение машинного
перевода
Основные требования к MT
корректная обработка
грамматических правил
 корректная работа с несколькими
словарями, включая их настройку
 сохранение исходного формата
переводимого текста

Информация, вводимая в
словарь
общая лексика
 базовая терминология
 терминология, специфичная для
переводимой документации
 часто встречающиеся
обороты/фразы/выражения
(т.н. микросегменты)

Примеры микросегментов





it is assumed that - предположим, что
if otherwise not specified - если не
указано иное
note that - следует отметить, что
this command displays/enters/deletes - по
этой команде
отображается/вводится/удаляется
the following window is appeared появляется следующее окно
Для эффективной настройки
словаря необходимо:
знать предмет перевода
 знать основы грамматики
 постоянно пополнять и обновлять
словарь
 сильно не "вредить"

Например, если введено "even if" (даже в том случае,
если), то фраза "The bit selected is even if ...” в нашем
случае будет переведена неправильно:
Выбранный бит - даже в том случае, если...
Анализ словарей по числу слов
Специализ. словари
5643
Генеральный словарь
35447
1709
11937
877
16245
8316
2076
1 слово
2 слова
3 слова
4+ слов
Преимущества системы МТ
упрощение работы по
постредактированию
 управление единообразием
терминологии/стиля
 генерация online-словарей
 упрощение процесса адаптации
нового персонала

Применение
Translation Memory
Функции Translation Memory
использование ранее
переведенных фрагментов
 сохранение терминологии
 сохранение стиля
 сохранение оформления
 увеличение комфортности для
переводчика

фильтрация
сегментация
претрансляция
перевод
сохранение
Принцип TM
Текст
Text
Исходный
included
содержадокумент
Исходный
щийся
Исходный
(в
формате
документ
вin
документ
DTP)
document
документе
Text
Перевод
included
докуменИсходный
Исходный
та
inдокумент
документ
(в
формате
document
DTP)
Слово
содержащийся
стражник
красный
Текст
содержащийся
в
документе
Word
included
watchguard
red
Text
included
in
document
Transit: операции
фильтрация
 сегментация
 претрансляция
 перевод
 верификация
 сохранение

Интеграция MT + TM
Интеграция системы Transit
Исходный
документ
Исходный
Исходный
(в
формате
документ
документ
DTP)
Текст
для
Исходный
Исходный
перевода
документ
Исходный
документ
(ASCII)
документ
Исходный
Исходный
(в
формате
документ
документ
DTP)
Служебная
Исходный
Исходный
информация
документ
документ
Переведенный
Исходный
Исходный
текст
документ
документ
(ASCII)
TRANSIT
Интеграция системы Transit
МТ-перевод
MT
Текст
для
перевода
не распознано
TRANSIT
(ASCII)
сегментация претрансляция
претранслировано
к переводчику
Интеграция системы Transit
Переведенный
Исходный
Исходный
текст
документ
документ
(ASCII)
По окончании этапа перевода
текст и служебная информация
Перевед.в конечный
Готовый
объединяются
документ
перевод
Исходный
документ
в исходном формате Исходный
Исходный
Исходный
формате
(в
формате
документ
документ
DTP (в
документ
документ
DTP)
Служебная
Исходный
Исходный
информация
документ
документ
DTP)
Резюме
Разработанная нами технология
работы по переводу позволяет:
– существенно ускорить процесс
перевода,
– сделать его более комфортным,
– минимизировать ручной труд,
– повысить качество/единообразие
переведенных документов
Наши реквизиты
Центр переводов
С-Петербург, 196105,
ул. Благодатная, д. 2
тел: +7 (812) 322-56-43
факс: +7 (812) 322-56-63
e-mail: olegv@argonaut.spb.ru
Download