Міністерство освіти та науки України
Національний університет „Львівська політехніка ”
кафедра “Електронні прилади”
«Програми автоматичного перекладу»
Ідея використання комп'ютера для автоматичного перекладу текстів виникла ще на початку появи обчислювальної техніки. Для автоматичного перекладу документів з однієї мови на іншу розроблено багато різних програм. Однак через складнощі опису семантики природних мов до цього часу остаточно проблему перекладу ще не вирішено. Проте сучасні засоби автоматизації перекладу досягли такого рівня, який дає змогу ефективно використовувати їх на практиці. Це пов'язано з тим, що в наукових, технічних, економічних та інших текстах, на відміну від художніх, використовується обмежена кількість мовних конструкцій, які більше орієнтовано на однозначну інтерпретацію.
Програми автоматичного перекладу документів доцільно використовувати:
при абсолютному незнанні іноземних мов;
у разі необхідності одержання перекладу швидко, наприклад, при перекладі Web-сторінок;
для створення підрядкового перекладу – чернетки, що використовуються для повноцінного перекладу;
у разі пересилання документів іноземним партнерам.
До засобів автоматизації перекладу можна віднести два типи програм: електронні словники й програми перекладу.
Електронні словники – це засоби для перекладу окремих слів і виразів документа. Деякі з них забезпечують звуковий супровід перекладених слів. Серед найпопулярніших програм даного класу слід відзначити НБАРС – новий великий англо-російський словник, Контекст 3.51, ABBYY Lingvo та ін.
Програми перекладу забезпечують повний цикл перекладу всього документа: введення початкового тексту, переклад на іншу мову, редагування, форматування й збереження перекладеного тексту. Прикладами програм перекладу можуть бути PROMT та Language Master.
Програма PROMT
Цю програму (її більш ранні версії відомо під назвою Stylus) розроблено російською фірмою PROMT. Програма є додатком до операційних систем, таких як Windows 95, 98, NT 4.0, 2000 і може бути інтегрована в комплект програм Microsoft Office, зокрема, у програми Microsoft Word та Excel.
Можливості програми PROMT:
забезпечення перекладу документів з англійської, німецької та французької мов на російську і навпаки;
до неї можна підключати кілька десятків спеціалізованих словників, що забезпечує правильний переклад термінів, які стосуються певної області знань;
динамічне відслідковування напрямку перекладу, тобто визначення мови оригіналу і перекладу;
переклад вмісту буфера обміну, поточного параграфа, виділеного фрагмента тексту або всього тексту;
забезпечення будь-якого з можливих напрямків перекладу, підключення й відключення словників, доповнення та виправлення їх, складання списку зарезервованих слів, які не перекладаються;
робота безпосередньо з програмами розпізнавання текстів, наприклад, FineReader;
не виходячи з програми можна використати відомі способи редагування й форматування оригіналу та перекладу;
забезпечення перевірки орфографії оригіналу і перекладу після встановлення прикладних програм для перевірки правопису (LingvoCorrector, Пропис, Орфо, Hugo).
Головне вікно програми складається з трьох частин: дві призначені для відображення оригіналу тексту і його перекладу, третя – утворює інформаційну панель, де відображаються інформація про перекладений документ і спеціальні настройки. Вікно має стандартні елементи керування вікна Windows –
Для швидкого запуску всіх програм, що входять до складу PROMT, призначений Інтегратор PROMT у вигляді окремої панелі робочого стола Windows. Кнопки панелі Інтегратора, а також пункти контекстного меню, яке викликається клацанням правою клавішею миші на значку Інтегратора, що є на панелі задач, дають змогу вибрати такі функції програми PROMT:
Переклад Clipboard (вміст буфера обміну).
Відкрити файл.
Відкрити WWW-вузол.
Пошук у WWW.
Запустити програму PROMT.
Запустити File Translator – програму перекладу файлів у пакетному режимі.
Запустити WebView – броузер-перекладач, що забезпечує синхронний переклад Web-сторінок при навігації у Internet.
Запустити Quick Translator – програму швидкого перекладу тексту, набраного з клавіатури.
Переклад окремих слів і виділених фрагментів можна здійснити прямо в тексті, навівши на них вказівник миші. Окремі фрагменти тексту можна перекласти без попереднього запуску програми PROMT. Для цього досить, знаходячись в будь-якому текстовому редакторі, наприклад, Notepad або Microsoft Word, скопіювати виділений фрагмент у буфер обміну і викликати функцію Переклад Clipboard Інтегратора PROMT.
Переклад документа за допомогою програми PROMT передбачає проведення кількох етапів:
Введення документа, який необхідно перекласти. Документ може бути завантажений з файлу. Для цього слід виконати стандартну операцію відкриття файлу. Текст для перекладу може також бути набраний на клавіатурі у власному редакторі програми. Для цього треба спочатку створити новий документ за допомогою відповідної команди. Для перекладу введеного з клавіатури тексту без виклику основного вікна програми PROMT можна також скористатися функцією Quick Translator Інтегратора PROMT. У вікні програми Quick Translator, крім перекладу, можна виконати також інші дії з оригіналом і перекладеним текстом: скопіювати переклад у буфер обміну, змінити напрямок перекладу, підключити додаткові словники тощо.
Уточнення параметрів перекладу. Після того, як підготовлено оригінал тексту, що підлягає перекладу, слід визначається напрямок перекладу, тобто з якої мови на яку мову буде здійснюватися переклад, а також уточнити формат тексту оригіналу (формат файлу тексту оригінала, наприклад MS Word файл, форматований текст RTF і т.д.).
Підготовка тексту до перекладу. Вибраний документ відображається в області тексту оригіналу. Перед початком перекладу доцільно перевірити орфографію, оскільки неправильно написані слова будуть сприйматися програмою як невідомі і залишаться без перекладу. У разі необхідності текст можна зберегти для подальшої роботи як документ PROMT. У документі можуть бути слова і словосполучення, які не повинні перекладатися, наприклад, прізвища, назви програмних продуктів (Windows 98, Microsoft Word 2000 тощо). Іноді застосовують транслітерацію – запис із використанням іншого алфавіту, що відповідає написанню або вимові мовою оригіналу (наприклад, прізвище Brown бажано перекласти не як Коричневий, а Браун).
Програми автоматичного переводу розглядаються, як засоби отримання простої чернетки. Якщо подібні потреби є, то використовують подібні програми. Кваліфіковане редагування тексту отриманого автоматичним шляхом, проводиться в декілька раз дорожче, ніж послуги спеціальних перекладачів.
Програмні засоби автоматичного переводу можна умовно розділити на дві основні категорії. Першу категорію представляють комп’ютерні словники. Призначення комп’ютерних словників такі ж, як і в звичайних словників: дати відомості про значення невідомого слова. Перевага комп’ютерних словників складається з швидкості доступу і вигоди автоматичного пошуку виділеного слова. Автоматичний словник дає змогу перекладу слова по написанню виділеної комбінації кнопок. До другої категорії відносяться програми, які дозволяють виконувати автоматичний переклад тексту. Вони сприймають текст на одній мові і видають текст на іншій мові. В ході роботи програма використовує обширні словники, набори граматичних правил та інші засоби, що забезпечують найліпшу (з точки зору програми) якість перекладу. Словник може складатися не тільки з виділеного слова, але й зі словосполучення. Використовуючи ці засоби, програма аналізує граматичну структуру тексту, знаходить зв’язок між словами і намагається побудувати правильний переклад фрази на іншій мові. Чим коротша пропозиція, тим більше шансів на те, що таке речення буде правильним. В довгих реченнях і складних граматичних конструкціях будь-яка система перекладу може дати збій. В Росії найбільш широке розповсюдження отримали програми автоматичного перекладу з англійської на російську, із російської на англійську мову. Це пояснюється головною роллю англійської мови в сфері міжнародного спілкування. Англійська мова досить проста для вивчення, однак її простота несподівано створює допоміжні проблеми для систем автоматичного перекладу. Справа в тім, що однаково написані слова в англійській мові часто відносяться до різних частин мови. Це ускладнює граматичний аналіз речення і призводить до виникнення грубих помилок в автоматичному перекладі.
Автоматичний переклад
Простий переклад вихідного файлу, що містить текст, за допомогою програми Promt 98 виконується дуже легко. Спочатку потрібно завантажити файл з вихідним текстом. Це виконують командою Файл в відкрити або за допомогою відповідної кнопки на панелі інструментів Стандартна. Після вибору імені вихідного файлу програма відкриває діалогове вікно, потім – конвертувати файл. В цьому діалоговому вікні автоматично вибирається формат файлу і необхідний напрям перекладу. Користувачу лишається тільки переконатись в тому, що параметри зазначені вірно і клацнути на кнопці ОК. Вихідний документ завантажується в програму і одночасно відображається, як в області оригіналу, так і в області перекладу. Для виконання перекладу треба дати команду Переклад – весь текст або використати кнопку на панелі інструментів Переклад.
Переклад являє собою складну і повільну операцію. Під час перекладу в основному вікні програми можна дивитись прокручування вихідного документу і заміну прикладів вихідного тексту на іншій мові. До кінця документ можна продивитися, як вихідний текст і текст перекладу, а також виконати їх редагування. Якщо в оригіналі вносяться зміни, можна повторити переклад абзаців. Для цього використовують команду Перекласти поточний абзац або кнопку поточний абзац на панелі інструментів Переклад. В такому випадку всі абзаци перекладу залишаються незмінними.
Переклад Web-сторінок
Більшість користувачів розглядають Web-сторінки Інтернету, як документи, для яких потрібен швидкий переклад, між іншим, без особливих вимог до якості. Абсолютна більшість Web-сторінок написано англійською мовою, і програма Promt 98 має спеціальне положення для швидкого перекладу Web-сторінок – програму Web View. Програму Web View запускають так як інші прикладні Promt 98 – через головне меню або з використанням спеціального значка на панелі індикації. Web View представляє собою браузер, який проводить синхронний перевід Web-сторінок під час роботи в Інтернеті. Функціональні можливості Web View, як засоби перегляду Web відповідає можливостям Інтернет. На відміну від традиційних браузерів вікно програми розбито на дві області. На верхній області відображається вихідна сторінка взята з Інтернету, а в нижній її перевід. У переводі зберігаються гіперпосилання, зображення, побудовані об’єкти. Обидві області абсолютно рівноправні у використанні гіперпосилань присутності документа. Переклад сторінки виконують автоматично вході загрузки. Режим автоматичного перекладу можна відключити. В тому випадку для перекладду сторінки використовують команду Переклад – перевід сторінки. Важливою особливістю програми являється також автоматичний перевід головних слів, використаних при пошуку потрібної інформації в мережі. Коли дають команди Перевід – пошук або клацнути на кнопку пошук в Web, відкривається діалогове вікно пошук в Інтернет, дозволяє сформувати запит до пошукового серверу. Запит формується за заданими правилами.
Головні слова запиту автоматично переводяться в заданому направленні перекладу. Сформований запит відображається на екрані. Цей запит можна направити в любу із декількох доступних програм пошукових систем.
Збереження перекладених документів
Переклад документів звичайно являє собою проміжну операцію, тому система пропонує багато різних варіантів збереження документа. Вибір варіанта збереження залежить від того, як пропонують використати документ в майбутньому.
1. Команда Файл – зберегти документ і кнопка збереже на панелі інструментів. Основна, яка зберігає весь документ у внутрішньому форматі програми. Команда файл – зберегти документ зберігає документ у внутрішньому форматі, але дозволяє вибрати ім’я файлу.
2. Якщо потрібно зберегти тільки результати переводу, треба використовувати під меню файл Збереження. Цим способом зберігають тільки вихідний текст або перевід. У відкритому діалоговому вікні можна вибрати любий із доступних форматів збереженого тексту.
3. Якщо в подальшому редагування переводу в одному із розповсюджених текстових процесорів, вигідно використовувати збереження в режимі білінгви, то це є двох мовний текст.
В цьому режимі записують у файл абзаци оригінала і переводи почергово. Таким чином при послідовному редагуванні оригінала і перевід весь час знаходиться перед очима одночасно. Правда при збереженні білінгви форматування тексту може перетворитися в помилку, тому більша частина даних про форматування відкидається і набір допустимих форматів файлу для збереження скорочений. Другі можливості підменю зберегти включають окремі збереження списків незнайомих слів і списків зарезервованих слів. Список зарезервованих слів можна в подальшому підключити до другого тематично подібного документу.
BX Language acquisition - програма, яка призначена для розширення словарного запасу, шляхом заучування написання і вимови іноземних слів. Заучування слів засноване на накопиченні статистики Ваших відповідей на завдання програми. За кожне правильно виконане завдання Ви отримуєте певну кількість балів. За кожну помилку бали з Вас знімаються. У кожній наступній вправі обов'язково переважатимуть завдання з найменшим балом, деяка кількість нових завдань, а також завдання на повторення вивченого. При наборі певної кількості балів завдання вважається умовно-вивченим. Умовно-вивчені слова пропонуються для повторення по методиці Еббінгауза. Ви маєте можливість настройки балльной системи і системи повторення вивченого матеріалу.
Крім того програма дозволяє заучувати написання і вимову іноземних слів як в режимі питання-відповідь, так і в режимі диктанту. Для прослуховування вимови слів і фраз до програми можна підключити бібліотеки звукових файлів у форматах SAE, ABBYY Lingvo 5-13, English Platinum 2002, каталоги із звуковими файлами у форматах WAV, MP3, OGG, а також Синтезатори мови 4 і 5 поколінь.
Програма дозволяє Вам самостійно складати нові словники із завданнями уручну або автоматично на основі частотного аналізу тексту. Складати словники можна також і за допомогою будь-якого текстового редактора в WIN кодуванню.
У цій версії програми присутня підтримка словників на 33 мовах:
Російському;
Англійському;
Німецькому;
Французькому;
Іспанському;
Італійському;
Турецькому;
Болгарському;
Чеському;
Фінському;
Казахському;
Таджицькому;
Білоруському;
Українському;
Шведському;
Литовському;
Албанському;
Данському;
Нідерландському;
Естонському;
Грецькому;
Ізраїльському;
Угорському;
Хорватському;
Латиському;
Норвезькому;
Польському;
Португальському;
Румунському;
Сербському;
Словацькому;
Тайському;
Узбецькому.
До програми можна підключати словники і інших мов, але при цьому деякі можливості програми будуть обмежені.
English Grammar In Use. Ця програма являє собою курс граматики англійської мови, який складається з 130 уроків, кожен присвячений вивченню певної граматичної теми. Кожен урок складається з двох частин: теоретичної, де на прикладах пояснюється тема уроку, і практичної, використовуваної для перевірки знань.
Hangman. Це гра з відгадування слів чи висловів.
Trolley Dash. Ця програма прекрасно сприяє запам'ятовуванню споживчих товарів в ігровій формі.
Професор Хіггінс. Англійська без акценту! Ця навчальна програма для вивчення англійської мови складається з двох курсів: курсу фонетики і курсу граматики. Учень має можливість порівнювати свою вимову з оригіналом не тільки на слух, але і візуально, за системою графічного відображення звуку на екрані монітора. Курс граматики складається з 130 уроків. Кожен урок розкриває певну граматичну тему.
1С: Освітня колекція. English Platinum 2000. Програма для самостійного вивчення англійської мови. Містить повнометражний фільм англійською мовою My Fair Lady, 78 діалогових уроків, 174 загальноосвітніх тексту. Розділ «Словник» містить 15680 слів, з них 4127 ілюстроване. Навчання проходить послідовно: запам'ятовування слів, перевірка запам'ятовування слів, набір на клавіатурі, відпрацювання вимови. Також містяться навчальні розділи «Граматика» і «Фонетика».
Повноцінні навчальні мультимедійні програми для вивчення англійської мови повинні бути спрямовані на розвиток всіх чотирьох мовних умінь і повинні охоплювати всі шість рівнів. У цьому напрямі використовуються програми English Discoveries, Dynamic English і English Express. Але через досить високу ціну, ці програми доступні не кожному учню.
Курсом є мультимедійний комплекс для самостійного вивчення американської англійської мови. Об'єм учбового матеріалу в курсі достатній для безперервних занять протягом року, а при інтенсивному навчанні можливо освоїти мову за 3-4 місяці.
Методика, розроблена спеціально для комп'ютерного навчання іноземним мовам, великий об'єм ретельно підібраного матеріалу і інтелектуальні засоби контролю створюють всі передумови для вивчення мови.
Діалог. Ви чуєте англійську мову, намагаєтеся її зрозуміти, переводите, говорите, пишете диктанти, паралельно поповнюючи словарний запас і знайомлячись з граматичними формами. Повнометражний фільм My Fair Lady англійською мовою, 78 діалогових уроків, 174 загальноосвітніх тексту познайомлять Вас з виразами, термінами і поширеними словосполученнями.
Словник. Розділ містить 15680 слів, з них 4127 ілюстровано. Навчання проходить послідовно: запам'ятовування слів, перевірка запам'ятовування слів, набір на клавіатурі, відробіток вимови.
Граматика. Система навчання граматиці є систематизованим підручником по граматиці, забезпеченим вправами по заповненню пропущених фрагментів в тексті.
Фонетика. Цей розділ курсу містить вичерпний теоретичний матеріал по фонетиці і практичні заняття по відробітку вимови, інтонації і швидкості мови. Більше 1000 вправ по опрацьовуванню кожного звуку, інтонації, наголосів, швидкості і ритмічності мови.
Індивідуальні установки. Для кожного з користувачів ведеться індивідуальна статистика: дані про проходження курсу і середні бали по різних напрямах. Реєструється як Administrator, можна встановити схему оцінювання і рівень підказок.
Звуковий ряд, слайди і текст допомагають зрозуміти, як говорять в країні, мову якої Ви вивчаєте, уловити відмінність діалектів і просто відчути мову.
Висновок
Одна із задач, яка стоїть перед інформатикою, як наукою стоїть в переводі документообігу із паперової в електронну форму. Цю задачу вирішують шляхом розробки і впровадження апаратних і програмних засобів і методів електронного документообігу. Одним із основних прийомів переводу паперових документів в електронну являється сканування. В результаті сканування створюється графічний образ текстового документа. Для сканування використовують спеціальний прилад, який називається сканером, хоч графічний образ документа можна дістати за допомогою других засобів вводу інформації.