МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ “ЛЬВІВСЬКА ПОЛІТЕХНІКА”
Кафедра “Інформаційні системи та мережі”
К У Р С О В И Й П Р О Е К Т
з дисципліни “Системи автоматизованого перекладу”
на тему:
«Проектування користувацьких електронних словників для ABBYY Lingvo»
Виконав студент групи ФЛ-46
Оцінка
Балів
Дата
Керівник проекту
Львів-2009
Зміст
Вступ
Формулювання задачі……………………………………………………...4
Методи та засоби комп’ютерного перекладу
2.1. Автоматизований переклад………………………………………...5-7
2.2. Засоби автоматизації………………………………………………….7
2.3. Програми перекладу……………………………………………….7-13
2.4. Електронні словники. ABBYY Lingvo…………………………...14-20
3. Проектування алгоритму автоматизованого перекладу……………...21-22
Висновок
Список використаної літератури
Додаток А
Додаток Б
Додаток В
Вступ
Для автоматизованого перекладу документів з однієї мови на іншу розроблено багато різних програм. Однак, через складнощі опису семантики природних мов до цього часу остаточно проблему перекладу ще не вирішено. Слід звернути увагу, що системи автоматизованого перекладу ефективніше застосовувати у наукових, технічних та економічних текстах, аніж в художніх. Недоліком перекладу художніх текстів є те, що в них використовується необмежена кількість мовних конструкцій, які більше орієнтовані на багатозначну інтерпретацію.
Потрібно зазначити, що якість перекладу завжди визначається обсягом та вичерпністю словників, що використовуються, й дотриманням граматичних правил. Отже, один із кроків подолання недоліку неефективного перекладу тексту полягає в тому, щоб користувач сам створив словник, додаючи туди слова, яких немає в словнику програми, тим самим забезпечуючи доцільніший пошук слів, або фраз, а відповідно і адекватніший переклад тексту.
Основною метою даного курсового проекту є використати сучасні засоби автоматизації перекладу на практиці. Застосуємо для перекладу тексту такі програми, як PROMPT, PRAGMA та ABBYY Lingvo. Відкоригувавши недоліки перекладу вручну, співставимо обидва тексти та розкриємо доцільність використання програм автоматизованого перекладу.
1.Формулювання задачі
Основна задача даного курсового проекту полягає у розкритті доцільності та принципу використання програм автоматизованого перекладу. На курсовий проект нам була надана деяка частина художнього тексту, який ми повинні були перекласти, використовуючи програми автоматизованого перекладу. При перекладі ми виконали таку послідовність дій:
переклад тексту за допомогою програми PROMPT;
переклад тексту за допомогою програми Pragma;
збереження перекладеного тексту за допомогою програми Microsoft Word;
редагування недоцільно перекладеного тексту вручну з використанням електронного словника ABBYY Lingvo 12;
розкрити основні переваги та недоліки використання програм автоматизованого перекладу.
2.Методи та засоби комп’ютерного перекладу
2.1.Автоматизований переклад
Автоматизований переклад (АП, англ. Computer-Aided Translation (CAT)) — переклад текстів на комп'ютері з використанням комп'ютерних технологій. Від машинного перекладу (МП) він відрізняється тим, що весь процес перекладу здійснюється людиною, комп'ютер лише допомагає йому створити готовий текст або за менший час, або з кращою якістю.
Ідея створення АП з'явилася з моменту появи комп'ютерів: перекладачі завжди виступали проти стандартної в ті роки концепції МП, на яку було напрямлено більшість досліджень в області комп'ютерної лінгвістики, але підтримували використання комп'ютерів для допомоги перекладачам. У 1960-і роки Європейське об'єднання вугілля та сталі (попередник сучасного Євросоюзу) почало створювати термінологічні бази даних під загальною назвою Eurodicautom. У Радянському Союзі для створення баз такого роду був створений ВІНІТІ.
У сучасній формі ідея АП була розвинена у статті Мартіна Кея 1980 року, який висунув наступну тезу: "by taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human" (комп'ютер бере на себе рутинні операції і звільняє людину для операцій, що вимагають людського мислення).
В даний час найбільш поширеними способами використання комп'ютерів при письмовому перекладі є робота із словниками та глосаріями, пам'ятті перекладів (англ. Translation Memory, TM), що містить приклади раніше перекладених текстів, а також використання так званих корпусів, великих колекцій текстів на одному або декількох мовах, що дає стислий опис того, як слова і вирази реально використовуються в мові в цілому або в конкретній наочній області.
Для локалізації програмного забезпечення часто застосовуються спеціалізовані засоби, наприклад Passolo, які дозволяють перекладати меню та повідомлення у програмних ресурсах і безпосередньо у скомпільованих програмах, а також тестувати коректність локалізації. Для перекладу аудіовізуальних матеріалів (головним чином фільмів) також використовуються спеціалізовані засоби, наприклад, Swift, які об'єднують в собі деякі аспекти пам'яті перекладів, але додатково забезпечують можливість появи субтитрів за часом, їх форматування на екрані, відповідності відеостандартам і т.п.
При синхронному перекладі використання засобів автоматизованого перекладу за необхідністю обмежено. Одним з прикладів є використання словників, що завантажуються на КПК. Іншим прикладів може служити напівавтоматичне витягання списків термінів при підготовці до синхронного перекладу у вузькій наочній області.
У вузьких наочних областях при великій кількості початкових текстів і сталої термінології перекладачі можуть використовувати і машинний переклад, який може забезпечити хорошу якість перекладу термінології і стійких виразів у вузькій області. Перекладач в цьому випадку здійснює пост-редагування отриманого тексту. Більше половини текстів всередині Єврокомісії (головним чином юридичні тести та поточна кореспонденція) перекладаються з використанням МП.
Для автоматичного перекладу документів з однієї мови на іншу розроблено багато різних програм. Однак через складнощі опису семантики природних мов до цього часу остаточно проблему перекладу ще не вирішено. Проте сучасні засоби автоматизації перекладу досягли такого рівня, який дає змогу ефективно використовувати їх на практиці. Це пов'язано з тим, що в наукових, технічних, економічних та інших текстах, на відміну від художніх, використовується обмежена кількість мовних конструкцій, які більше орієнтовано на однозначну інтерпретацію.
Програми автоматичного перекладу документів доцільно використовувати:
при абсолютному незнанні іноземних мов;
у разі необхідності одержати переклад швидко, наприклад, при перекладі Web-сторінок;
для створення підрядкового перекладу - чернетки, що використовується для повноцінного перекладу;
у разі пересилання документів іноземним партнерам.
2.2.Засоби автоматизації
До засобів автоматизації перекладу можна віднести два типи програм: електронні словники й програми перекладу.
Програми перекладу забезпечують повний цикл перекладу всього документа: введення початкового тексту, переклад на іншу мову, редагування, форматування й збереження перекладеного тексту. Прикладами програм перекладу можуть бути PROMT та Language Master.
Електронні словники - це засоби для перекладу окремих слів і виразів документа. Деякі з них забезпечують звуковий супровід перекладених слів. Серед найпопулярніших програм даного класу слід відзначити НБАРС - новий великий англо-російський словник, Контекст 3.51, ABBYY Lingvo та ін.
На цей час розроблено багато варіантів САП. У кожній системі можна виділити позитивні і негативні якості перекладу. Будь-яка система перекладу не може виконати якісний переклад навіть науково-технічного тексту. Для одержання якісного перекладу необхідно виконати редакторське виправлення людиною-перекладачем.
2.3.Програми перекладу
На цей час широко відомі чотири програмних пакети сучасних російсько-українських перекладачів, що задовольняють комерційну потребу користувачів:
Duet;
Рута-Плай;
Language Master (Pragma);
РУАП.
У системі Duet відсутній словник користувача, тому нові слова вводяться безпосередньо в базовий. Якщо користувач необачно введе неправильне слово в цей словник, то виправити таку помилку в данному випадку буде неможливо.
РУТА – система лінгвістичної обробки українських текстів, ПЛАЙ – система перекладу текстів х російської на українську мову та навпаки.
Спочатку «ПЛАЙ» булла орієнтована на пофразовий режим перекладу, тепер вона має удосконалений наскрізний режим – у процесі перекладу спочатку кожного речення розставлені позначки. Якщо клацнути по ній лівою клавішею миші, то одержимо вікно пофразного перекладу і можливість відредагувати невдалу фразу. Вибір варіантів перекладу слів, пропонованих машиною, здійснюється натиском клавіші миші на слові, виділеному зеленим кольором. Це рятує користувача від необхідності переробляти все речення при редагуванні, а дозволяє просто вдало підібрати потрібний еквівалент перекладеного слова. Нові слова в системі вводяться і словник користувача, що в процесі редагування текстів поповнюється новими, а також вилучаються помилково введені слова.
Система РУТА призначена для полегшення лінгвістичної обробки українських текстів у середовищі WINDOWS 98/XP. Після установки програми РУТА встановлюються стандартні для застосувань MS Office функції перевірки правопису (spelling), перевірки граматики (grammar), розстановки переносів (hyphenation) та заміни слів за допомогою словника синонімів (thesaurus), які можуть бути використані при роботі з українськими текстами.
Основний словник програми РУТА містить більше, ніж 160000 основ, забезпечуючи розпізнавання понад 4,5 млн. словоформ української мови. Слова, відсутні в основному словнику, можуть бути внесені користувачем у додатковий словник.
Граматичний контроль українських текстів здійснюється за 75 правилами граматики. Надалі кількість правил граматики буде збільшено.
При використанні програми РУТА у середовищі Microsoft Word користувач може також автоматично розставити переноси в тексті відповідно до правил української граматики.
Надзвичайно корисною є також можливість використання тезаурусу – словника синонімів українських слів та сталих словосполучень. Тезаурус містить понад 5 тисяч синонімічних рядів, близько 30 тисяч слів. Використовуючи тезаурус, можна швидко та коректно змінювати слова та вирази в тексті синонімами (словами і виразами, близькими за значенням), що дозволяє уникнути повторів та монотонності, зробити текст більш промовистим та виразним. Якщо вихідне слово багатозначне, то користувачеві пропонується декілька синонімічних груп, при цьому слова, що входять у кожну з груп, цілком можуть бути замінені одне на одне в контексті. Список синонімів з’являється перед користувачем в тій же граматичній формі, в якій знаходиться вихідне слово, що дозволяє уникнути помилок при заміні слів і конкретному контексті.
Ряд додаткових сервісних можливостей надає програма РУТА в середовищі текстового процесора MS Word. Детальніше про ці можливості можна довідатися з «Довідника користувача». Серед них, наприклад, команда перегляду парадигми слова – списку всіх його можливих граматичних форм. Це сприяє зменшенню кількості граматичних помилок в тексті, дозволяє писати грамматично правильні тексти користувачам, що недостатньо володіють українською мовою.
Для цього в системі є набір підпрограм:
редактор словників користувача (Ruta User Dictionary Editor);
програма «підказування» в режимі on-line (Ruta On-Line Tools), що дозволяє при роботі з будь-яким застосуванням Windows для слів, що вводяться з клавіатури, перевіряти правильність написання, розставлених переносів, або підібрати синоніми для такого слова;
редактор розкладки клавіатури KeyCaps;
простий перекладач буфера обміну ClipBoard.
Перекладач Language Master має найвищий ранг за своїми функціональними можливостями, оскільки здійснює російсько-українсько-англійський переклад у будь-якому напрямку. Система працює в будь-якому середовищі Windows. Технічні вимоги мінімальні: оперативна пам'ять – 8 Мб, вільного місця на твердому диску – 10 Мб для інсталяції 6 напрямків перекладу. У комплект постачання входить словник, перекладач текстів, конвертор текстів DOS-Windows, модулі перевірки орфографії трьох мов і вбудовані драйвери клавіатури. При інсталяції програми використовується спеціальний код розробників, що жорстко прив’язує програму до комп’ютера і не дає можливості зробити копії для тиражування.
Керуюче меню програми-перекладача вбудовується автоматично автоматично в меню Word під назвою «Майстер», що містить такі пункти:
спелінг (перевірка орфографії);
переклад тексту;
переклад слова (електронний словник);
утиліти (робота зі словниками користувача), конвертори текстів DOS-Windows.
При поповненні словника новими словами зазначається, до якої частини мови слово належить і варіанти їхнього застосування. Перед початком перекладу автоматичного визначається мова оригіналу і вибір мови перекладу. Для англійської мови можна вибрати тематику тексту: бізнес, інформатика, загальна. Невідомі слова позначаються червоним кольором, варіанти перекладу – зеленим. Подвійним клацанням миші на цьому слові відкривається список варіантів чи вікно введення нових слів. Обсяги словників – 70000 слів (для перекладу з української на англійську) і 120000 слів (з російської на українську). Переклад у Language Master побудований за модульним принципом: модулі російсько-український, українсько-англійський і т. д.
Найпершим англо-українським перекладачем була програма РУАП, розроблена харківськими фахівцями під керівництвом М.С. Блехмана. Вона працює в будь-яких програмних середовищах. У комплект постачання входить програма-перекладач і редактор словників. Інсталяція виконується в два етапи: спочатку встановлюється перекладач, потім запускається програма деінсталяції, що підключає РУАП у систему Word.
Меню «Переклад» містить:
РУАП – виклик програми перекладу;
Пошук варіантів – у довільному тексті здійснює перехід до слова, що має неоднозначний переклад;
Забрати варіанти – забирає позначки, що вказують на слова, з перекладом яких ви не згодні;
Робоче місце – розкриває каскадом вихідний і похідний текст;
Ввести в словник – вводить у словник невідомі слова.
Перекладач працює як окрема программа і виконує переклад тексту безпосередньо з буфера і файлу у форматі RTF та DOS-Windows.
Це єдина програма перекладу, що може працювати не всередовищі Windows.
Ім’я файлів у РУАП повинні задаватися тільки англійськими літерами.
Перевагою РУАП є робота зі словниками – надається можливість підключати одночасно до чотирьох словників, розставивши їх у тому порядку, в якому повинний здійснюватися пошук слів. Основний словник – обсягом 25000 слів, який може редагуватися, й один словник користувача обсягом 15000 слів фінансової чи економічної тематики.
Перевірка швидкісних і якісних показників описаних вище програм-перекладачів з російської на українську була виконана О. Миловим і С. Моїсенко (Комп’ютерний огляд 16 від 05 97) на тексті комерційного підрозділу – з бізнесу, обсягом у 3000 символів. Результати тестування тексту описувалися такими показниками:
переклад Рута – Плай: 8 хв. 45 сек., 47 унк, 9 незнайомих слів;
переклад Duet: 7 хв. 47 сек., 85 унк, 7 незнайомих слів;
переклад Language Master: 5 хв. 27 сек., 48 унк, 1 незнайоме слово;
переклад РУАП: 10 хв. 40 сек., 77,5 унк, 6 незнайомих слів.
Як одиницю оцінки якості перекладу автори використовували методику тестування, запропоновану М. Сухановою («Мир ПК», січень, 1997). Вона полягає в непрямій оцінці обсягу виправлення машинного перекладу і наступного підрахунку одиниць виправлення – умовних натискань клавіш (унк).
При тестуванні програм перекладу також фіксувався час виправлення, який визначав обсяг роботи. Набір тексту російською мовою обсягом 3000 символів займав 25 хвилин, ручний переклад і його набір склав 34 хвилини. Час перекладу складався з часу, витраченого як безпосередньо на переклад, так і на виправлення отриманого тексту. За дослідженням авторів встановлено, що основна частка виправлень падала на вибір слів із запропонованих варіантів і виправлення закінчень при зміні відмінка, роду чи числа іменника.
Як свідчать показники оцінки швидкості перекладу і обсягу, його виправлення, найбільш успішно це завдання виконує програма-перекладач Language Master, потім – система РУТА – Плай.
Граматичний текст перевірки грамотності перекладу показав, що критичними моментами для машинних перекладачів виступають такі показники: зміна керування виду зв’язку (зміна прийменника і відповідно наступного за ним іменника); зміна відмінка, роду і числа іменників та їхніх означень; переклад активних словників і зміна порядку слів у реченні; переклад ідіом. Саме ці показники і відрізняють машинний перекладач від електронного словника, що працює в режимі підрядкового перекладу тексту.
За граматичними текстами, кількість помилок перекладу, на думку авторів, розподілилася так: Duet – 46, Рута - Плай – 18, Language Master – 15, РУАП – 33.
Типовий набір можливостей САП широкого використання в практиці можемо показати на прикладі опису системи перекладу текстів Prompt Translation Office – 2000.
Prompt Translation Office – 2000 пропонує набір професійних інструментів, що забезпечує переклад основних європейських мов на російську і зворотний (англійську, німецьку, французьку, італійську) залежно від комплектації.
Можливості системи:
Може перекладати, редагувати, працювати зі словниками для всіх мовних напрямків.
Забезпечує зв’язний переклад текстів з урахуванням морфологічних, синтаксичних і семантичних зв’язків.
Система орієнтована на середовище Windows і не потребує спеціальних навичок роботи з машиною.
Передбачено можливість створення власних словників користувача: слова, словосполучення, ідіоми.
Може залишати без перекладу відзначені користувачем слова чи слова іншої мови.
2.4.Електронні словники. ABBYY Lingvo.
AВBYY Lingvo — електронний словник з найбільшою і найсучаснішою словниковою базою на 11 мовах: англійській, німецькій, французькій, італійській, іспанській, португальській, китайській, турецькій, українській, російській та латинській. Близько ста п'ятдесятьох загальнолексичних, тематичних, лінгвокраїнознавчих і тлумачних словників у складі Lingvo є найактуальнішими і найавторитетнішими виданнями у своїх областях.
Електронний словник Lingvo створений російською компанією ABBYY— одним з провідних світових розробників програмного забезпечення у сфері прикладної лінгвістики, розпізнавання документів та введення форм. У 1989 році студент 4 курсу МФТІ Давид Ян і програміст Олександр Москальов починають роботу над комп'ютерною програмою, здатною перекладати слова та словосполучення з англійської мови на російську — електронним словником. Ідея виконати інтерфейс користувача у вигляді системи «карток» (незалежних вікон зі словниковими статтями) на декілька років випереджає свій час. Назва словника — Lingvo — міжнародною мовою есперанто означає «мова». На даний час у групі компаній ABBYY працює понад 650 чоловік. Головний офіс групи знаходиться в Москві. Інші компанії групи розташовані в США (Фрімонт, штат Каліфорнія), Японії (Токіо), Німеччині (Мюнхен), Великобританії (Брекнелл), в Україні (Київ) та в Росії (Москва). Крім того, ABBYY має розгалужену мережу дилерів і партнерів у більш ніж 100 країнах світу на всіх континентах. Продуктами ABBYY в усьому світі користується понад 20 млн. чоловік. З моменту заснування компанія проводить наукові дослідження у сфері інформаційних технологій і прикладної лінгвістики, які забезпечують високу якість створюваних програм. У 2002 році розробники ABBYY були визнані гідними Премії Уряду РФ в області науки і техніки.
У продуктову лінійку ABBYY Lingvo входять версії з різним набором мов і словників як для людей, що активно використовують іноземну мову, так і для тих, хто тільки починає вивчення мови. На сьогоднішній день вона є одним з провідних світових розробників програмного забезпечення у сфері штучного інтелекту, зокрема, розпізнавання документів та обробки природної мови.
Продукти ABBYY Lingvo
ABBYY Lingvo — найповніший електронний словник, що містить сучасну лексику з різних тематичних областей, як універсальну, так і спеціальну. ABBYY FineReader — система оптичного розпізнавання. Ідеальне рішення для тих, кому потрібен найвищий рівень точності розпізнавання і збереження оформлення текстів. ABBYY FineReader швидко і точно переводить паперові документи, PDF-файли і цифрові фотографії документів у формати, що підлягають редагуванню. Отримані результати можна редагувати в додатках Microsoft Office, відправляти електронною поштою або публікувати в Інтернеті. ABBYY PDF Transformer — універсальний інструмент для роботи з PDF-файлами. Він не лише перетворює PDF-файли в звичні, зручні для редагування формати — Microsoft Word, Excel, HTML і TXT, але також дозволяє створювати PDF безпосередньо з додатків Microsoft Office одним клацанням миші. Крім того, програма дозволяє створювати PDF-документи практично з будь-якого додатка.
ABBYY FlexiCapture — могутня система потокового вводу даних і документів, призначена для використання підприємствами різноманітних галузей діяльності в задачах будь-якого масштабу. ABBYY FlexiCapture дозволяє створити єдину точку вводу для різноманітних паперових форм і документів (рахунків, анкет, договорів і т.д.) і автоматично перетворити їх на ефективні електронні дані для інформаційних систем підприємства.
ABBYY FineReader Bank — потужна масштабована система автоматизованого потокового вводу різноманітних банківських документів — платіжних доручень і вимог, інкасових доручень, заяв на одержання кредитних карт тощо.
ABBYY Recognition Server — високопродуктивне серверне рішення для автоматизації процесів розпізнавання і конвертування документів у середніх і великих організаціях. Завдяки серверній архітектурі і гарній масштабованості цей додаток особливо ефективний для обробки великих обсягів документів. ABBYY Recognition Server можна використовувати як готове автономне рішення, або інтегрувати в більш велику систему з обробки і збереження документів. ABBYY FineReader Engine — найпотужніший і найуніверсальніший інструментарій для розробника, зацікавленого в ефективній реалізації функцій розпізнавання та обробки документів у своєму додатку. ABBYY Mobile OCR SDK — компактний, незалежний від використовуваної платформи інструментарій розробника для вбудовування функцій оптичного розпізнавання (OCR), у тому числі зчитування даних з візиток, у мобільні пристрої.
ABBYY Lingvo — це найкоротший шлях до результату: точного перекладу будь-якого слова. Особлива увага в програмі приділяється вивченню іноземних мов — словникові картки дуже докладні і містять усі варіанти перекладу, приклади вживання, транскрипції, наголоси та граматичні форми слова. Спеціальна програма в складі ABBYY Lingvo — Lingvo Tutor допоможе ефективно заучувати нові слова. Основними характерними рисами словника є:
11 мов: англійська, німецька, французька, італійська, іспанська, португальська, китайська, турецька, українська, російська та латинська
149 словників, більше 8,6 мільйонів словникових статей, з них 20 нових словників, у яких більше 1,8 мільйона нових статей
Найсучасніша лексика, 12 оновлених словників зі словами, що увійшли до вжитку протягом 2-х останніх років, наприклад, facebook, youtube, zorbing, coopertition і ін.
Докладний переклад з прикладами вживання, синонімами і транскрипціями
Всесвітньо відомі тлумачні словники англійської мови: Oxford English Dictionary, Oxford American Dictionary, Collins Cobuild Dictionary
Додаток Lingvo Tutor для вивчення іноземних мов
Озвучені носіями мов 15 000 англійських, 10 000 німецьких, 5 000 французьких, 10 000 іспанських і 10 000 українських слів
Озвучено розмовники для 6 мов, у тому числі новий російсько-китайський розмовник
Спливаючий переклад при наведенні курсору миші на слово при читанні тексту, інтернет-сторінок та ICQ.
У ABBYY Lingvo 12 входять тлумачні словники української, англійської і російської мов. Тому ABBYY Lingvo може допомогти не тільки при перекладі, але і в тих випадках, коли потрібно встановити, чи немає іншого значення у знайомого слова, зрозуміти, що означає невідоме слово мови, дізнатися, чи правомірне вживання слова в тому або іншому контексті.
Великий тлумачний словник сучасної української мови видавництва "ПЕРУН" є універсальним довідником по сучасній українській мові. Словник містить близько 250 тис. слів і словосполучень, у тому числі і що увійшли до української літературної мови протягом останнього десятиліття. Окрім загальновживаних слів, в словнику приводяться основні терміни сучасної науки і техніки, а також слова, що визначають явища і реалії виробничого, культурного і повсякденного життя. Новим для тлумачних словників є введення в деякі статті енциклопедичних довідок. "Collins English Dictionary", великий тлумачний словник англійської мови видавництва "Harpercollins Publishers" об'ємом 120 тисяч слів, 8-е видання 2006 року. Це багатюще джерело інформації про лексику англійської мови. Словник відрізняється живими і зрозумілими тлумаченнями. Велика кількість прикладів вживання слів і їх поєднання з іншими словами допомагають зрозуміти нюанси їх вживання і точні відтінки сенсу. "Collins English Dictionary" допоможе навчитися "думати і говорити по-англійськи". Великий сучасний тлумачний словник російської мови. © 2006, Ефремова т.Ф. найбільший серед існуючих тлумачних словників за об'ємом - понад 180 000 словарних статей. Словник словника відображає лексичний склад російської мови рубежу XX-XXI століть. Крім загальновживаної, в словник увійшла і основна термінологічна лексика, зокрема запозичена останніми роками. Груба, жаргонна і лайлива лексика не включалася.
Тлумачні англо-російські словники з складу ABBYY Lingvo допоможуть не тільки перевести термін, але і зрозуміти його точне значення. У ABBYY Lingvo 11 входить 5 словників з серії Economicus. Ці словники підготовлені спільно Інститутом "Економічна школа" і лексикографічною групою відділу прикладної лінгвістики компанії ABBYY і є справді новим поколінням англо-російських економічних словників, що охоплюють всі області економіки і бізнесу. Словники складені в 2003 році, оновлені і доповнені в 2005.
Англо-російський тлумачний словник по виноробству, що входить до складу ABBYY Lingvo, справжня енциклопедію вина і виноробства. У словнику зібрана велика кількість назв вин, сортів винограду, виробників вина, а також терміни, смакові, що описують, і інші якості вин. Словник допоможе прочитати, зрозуміти і перевести все, що повідомляє етикетка на пляшці вина. Сучасна, постійно оновлювана лексика. Найостанніші видання словників. Оновлені версії словників ABBYY. Спільна робота з користувачами. Висока оцінка професіоналів.
Нові словники, що увійшли в Lingvo 12, – це сучасні видання відомих авторів. Серед них – як загальні, так і спеціалізовані і фразеологізми словники. Мова змінюється разом із змінним світом, словник застаріває в середньому за 5 років. Тільки нові словники допоможуть зберегти точність перекладу, врахувати всі новітні особливості іноземної мови. Тому 80% словників, що входять до складу Lingvo 12, — це нові словники (або нові видання тих, що вже добре зарекомендували себе старих словників), видані в паперовому вигляді в 2004-2006 роках. Крім того, відділ лексикографії компанії ABBYY веде постійну роботу по оновленню ряду словників, в першу чергу Lingvo Universal. Lingvo Universal — це англо-російський словник загальної лексики об'ємом 100 000 статей, який був грунтовно перероблений і оновлений спільно з видавництвом "Російська Мова" в 2006 році. У словнику з'явилося близько 1 тис. нових слів, а більше 50 тис. словарних статей було істотно перероблено.
Нові слова і значення постійно додаються у власні словники ABBYY, причому деякі значення в російській лексикографії фіксуються вперше. Саме у Lingvouniversal зустрічається перша словарна фіксація позитивного значення російського слова "амбітний". А такі слова, як "сybercrime", "taikonaut", "Flash mob", "блокбастер" вносяться до словника буквально в режимі реального часу. Велику допомогу лексикографії компанії надають перекладачі, викладачі і просто користувачі, які присилають свої зауваження і побажання, беруть участь в дискусіях на форумах www.Lingvo.ru і www.LingvoDA.ru і навіть створили фан-клуб Lingvo www.LingvoFanClub.info .
Швидкий переклад і пошук по всіх словниках .
Переклад по наведенню курсора миші. Переклад по "гарячим клавішам" з будь-якого застосування. Переклад з будь-якої форми слова. Послівний переклад пропозицій. Пошук слів і словосполучень по всіх словниках. Пошук слів по масці. Пошук синонімів і антонімів. Угрупування словників по тематиках. Проглядання новинних сайтів, читання статей або електронних книг, вивчення документів, спілкування в чатах і на форумах — ось далеко не всі ситуації, в яких зручний і корисний переклад по наведенню курсора миші. Не потрібно відкривати словник, досить просто навести курсор на незнайоме слово. Поряд з курсором з'явиться спливаюча підказка з коротким перекладом і посиланням на докладну словарну статтю в ABBYY Lingvo. Дана можливість особливо зацікавить тих, хто тільки починає вивчати мову.
Можна також отримати швидкий переклад по наведенню миші і натисненню однієї з гарячих клавіш (наприклад, Alt або Shift), або викликати докладну словарну статтю гарячим клавішам Ctrl+ins+ins. ABBYY Lingvo "дізнається" слово в будь-якій його формі. Якщо ви не упевнені в написанні слова, просто натисніть F7 – ABBYY Lingvo підкаже правильне написання.
У ABBYY Lingvo 12 є можливість переводити декілька слів відразу, завдяки функції - послівний переклад. Якщо виділити в документі цілу фразу і натиснути комбінацію "гарячих" клавіш ABBYY Lingvo - Ctrl-ins-ins, відкриється нове вікно. У нім з'являться переклади всіх виділених слів, що найбільш вживаються, — і можливо, сенс вже ясний! Для кожного з перекладених слів можна буде відкрити і окрему словарну картку з перерахуванням всіх значень, транскрипцією, прикладами вживання і вимови. Можливість послівного перекладу буде особливо корисна тим, хто ще не дуже добре знає мова. Притому якщо у вас на "полиці" тільки юридичні словники, то в картці послівного перекладу, що відкрилася, ви побачите значення виділених слів, найчастіше вживані саме в юридичному контексті. Потрібне слово або словосполучення може міститися не тільки в заголовках словарних статей (у словнике), але і де-небудь ще в текстах словника, скажімо, в прикладах використання іншого слова. Пошук в ABBYY Lingvo ведеться по текстах відразу всіх словників і запускається автоматично, якщо слово не знайдене в словнику. Якщо немає упевненості в точному написанні слова, можна скористатися можливістю – "пошук по масці". Ввести слово в рядок введення, використовуючи символи "?" (у випадку якщо необхідно знайти слова з одним пропущеним символом на місці знаку питання) і "*" (у випадку якщо необхідно знайти слова з довільним числом символів на місці зірочки) і натиснути Ctrl+f3. Ця можливість буде корисна тим, хто вивчає мову в тих випадках, коли потрібно знайти однокорінні слова, слова з певним суфіксом або іншою частиною слова. Особливо це актуально при вивченні мови, в якій багато складених форм, зокрема, німецького.
3.Проектування алгоритму автоматизованого перекладу
Алгоритм автоматизованого перекладу тексту:
Збеоеження документа у текстовому редакторі Word. Я здійснила копіювання тексту і вставила його у текстовий редактор Microsoft Word, після чого я відредагувала і відтворила усі параметри його початкового форматування.
Переклад тексту з англійської на українську мову за допомогою системи автоматизованого перекладу Pragma.
Переклад тексту за допомогою Pragma 5.0 передбачає кілька етапів:
Введення документа, який необхідно перекласти.
Документ необхідно завантажити з файлу. Далі шляхом виконання операції копіювання перенести його в поле програми Pragma, активізувавши її, виконавши натискання кнопки програми на панелі інструментів на робочому столі і виборі опції “Fast Translation”.
Підготовка тексту до перекладання.
Перед початком перекладу доцільно перевірити орфографію, оскільки неправильно написані слова програма сприйматиме як невідомі й залишить без перекладу. У документі інколи зустрічаються слова і словосполучення, які варто залишити мовою оригіналу. Це прізвища, назви установ, тощо.
Уточнення параметрів перекладу.
Після введення тексту вибирають бажаний напрямок перекладу.
Переклад тексту.
Програма переклала текст з багатьма помилками. Наявні помилки при перекладі:
неправильний рід, відмінок іменників;
неправильний рід, особа, відмінок прикметників;
неточний підбір слів за семантикою;
неправильний переклад особових займенників.
Внесення слів у словник.
Якість перекладу завжди визначається обсягом та вичерпністю словників, що використовуються й дотриманням граматичних правил. Програма Pragma 5.0 при перекладі передбачає словник, що створюється безпосередньо користувачем. Як правило, цей словник переглядається першим.
Я внесла зміни за допомогою Коректора словника, додавши нові значення слів.
Повторний переклад тексту.
Повторно перекладений текст був кращої якості, оскільки в ньому були вжиті слова, які більше підходять по контексту.
Відредагувала перекладений текст з допомогою електронного словника ABBYY Lingvo.
Висновок
У завданні для курсового проекту (додаток А) мені була дана деяка частина тексту, зразок якої знаходиться у додатку Б. Для полегшення своєї роботи я використала програми автоматизованого перекладу, такі як PROMPT та Pragma. Зразок машинного перекладу показаний в додатку В.
Даний курсовий проект показав мені наскільки доцільно використовувати програми автоматизованого перекладу, розкривши при цьому основні переваги та недоліки використання засобів автоматизації. Основною із переваг використання машинного перекладу є швидкий переклад тексту. Людина-перекладач не в змозі настільки швидко виконати переклад, як це робить програма. Однак, недоліком є неефективний переклад. Сучасні засоби автоматизації є ще недостатньо вдосконаленими.
При виконанні даного курсового проекту мною було виявлено такі помилки машинного перекладу:
неправильний вибір чи відсутність артикля;
неправильний переклад прийменника;
неправильний переклад особового займенника;
неправильний переклад багатозначного іменника;
неправильні закінчення;
дослівний переклад ідіоматичного виразу;
неправильне визначення частини мови.
Використовуючи електронний словник ABBYY Lingvo я відредагувала наявні помилки та зробила текст більш якіснішим. Відкоригований мною текст вручну показаний в додатку Д.
Список використаної літератури
Допомога до ABBYY Lingvo.
Допомога до ProLing Office.
Допомога до Promt98/PromtXT.
Жалдак М.І., Морзе Н.В., Науменко Г.Г. "Основи інформатики та обчислювальної техніки". - Інформатика, № 31-32, "Шкільний світ"/Київ, 2001.
Кочерган М.П. Вступ до мовознавства - К.: Видавничий центр "Академія", 2000 - 368 с.
Ревзин И.И., Розенцвейг В.Ю. Основы общего и машинного перевода. М.: Высш. шк., 1963.
Хархалис Р. Компьютерный перевод иностранных текстов - К.: Терези, 1998 - 193с.
Швейцер А.Д. Теория перевода: Статус, проблемы, аспекты. — М.: Наука, 1988.