Міністерство освіти і науки України
Національний університет «Львівська політехніка»
кафедра ІСМ
Звіт
До лабораторної роботи № 1 на тему:
«Основні принципи оцифрування та перетворення тексту з твердих носіїв в електронний вигляд за допомогою системи оптичного розпізнавання
символів Fine Reader»
З курсу «Комп'ютерні системи обробки текстової та графічної інформації»
Підготував:
Перевірив Андруник В.А
Львів 2017
Мета роботи – Ознайомитися та на практиці засвоїти основні принципи введення (оцифрування) та перетворення текстової інформації з твердого носія в електронний вигляд з допомогою системи оптичного розпізнавання символів Fine Reader. Провести загальне ознайомлення з пакетами мовного розпізнавання тексту та підготувати отримані матеріали для публікації (на прикладі Вісника каф. ІСМ), виконавши аналіз певної предметної області.
Хід роботи
Обрана предметна область – математичне моделювання в інформатиці.
Виконуючи дослідження за даною темою, знаходжу потрібну інформацію у друкованих вісниках чи науково-метричних журналах і оцифровую її за допомогою компактної камери. Для цього кладу книжку, розгорнуту на сторінці 224, на рівний стіл у добре та рівномірно освітленій кімнаті. Використовую камеру телефону Lenovo A536 із автоматичними налаштуваннями та вимкнутим спалахом. Пристрій розташовую над сторінкою, паралельно і по центру, на такій відстані, що дозволяє захопити увесь аркуш, тобто приблизно 20 см. Вручну фокусую зображення на центрі сторінки, фотографую кілька разів. Обираю найякісніше та найчіткіше фото і за допомогою хмарного сервісу OneDrive завантажую зображення на ПК.
/
Рисунок 1. Оцифрована сторінка 223
Ознайомлююся з класифікацією сканерів. Розрізняють 4 види сканувальних пристроїв: ручний, планшетний, барабанний і 3D. Ручний сканер – це портативний пристрій, який дозволяє зчитувати зображення вибірково і являє собою пристрій, який працює завдяки пересуванню людиною зображення (300 до 800 крапок на дюйм). Наприклад, це сканер штрих-кодів або QR-кодів.
У планшетних сканерах об’єкт розміщують на склі планшета сканованою поверхнею вниз. Під склом розташовується рухома лампа, її переміщення забезпечує кроковий електродвигун. Світло, відбите від об'єкта, через систему дзеркал потрапляє на лінійку спеціальних фотоприймачів. Значення вихідних напруг лінійки фотоприймачів через комутатор подають на аналогово-цифровий перетворювач (АЦП). Цифрові коди такого перетворення передаються у комп'ютер. За кожен крок двигуна сканується частинка об'єкта, що потім поєднується програмним забезпеченням драйвера сканера у загальне зображення.
Барабанний сканер – це пристрій, в основі якого лежить барабан, на якому закріплюється оригінал, що обертається зі значною швидкістю. Зчитувальний пристрій розташовується дуже близько до оригіналу, чим досягається високу якість сканування. Використовується в поліграфії.
3D сканер – це пристрій, який дозволяє виконувати зчитування тривимірних об’єктів і оцифровувати їх як тривимірні моделі, що характеризується високою точністю. 3D сканер може бути і ручним, і стаціонарним. Пристрій досліджує відстань до об’єкта у різних точках, залучаючи дві вбудовані камери і підсвітку, після чого програмне забезпечення аналізує отримані дані і на екран виводять готову цифрову модель. В більш сучасних різновидах, відстань вимірюють за допомогою лазерного променю, який рухається над поверхнею об’єкта і вимірюю відстань в різних координатних точках та передає дані на ПЗ. Такі пристрої активно застосовують у медицині, архітектурі, розважальній індустрії, будівництві, культурознавстві, кіно.
Рисунок 2. Схема роботи 3D сканера.
Робота з програмою Fine Reader.
Fine Reader – це омніфонтова система (система розпізнавання символів) оптичного розпізнавання текстів, фактично незалежно від того, якими шрифтами він оформлений. Особливістю програми FineReader є висока точність розпізнавання і мала чутливість до дефектів друку. Процес складається із трьох основних етапів: введення зображення (сканування чи вибір з бібліотеки), розпізнавання, і збереження.
За допомогою програми Fine Reader розпізнаю оцифрований раніше текст.
/
Рисунок 3. Fine Reader в процесі.
Програми мовного розпізнавання Dragon Naturally Speaking Personal Edition і Диктант 2.5 – це одні із найвідоміших та найзручніших програм, що дозволяють перетворювати мовленнєвий потік у текст. Dragon Naturally Speaking Personal Edition підтримується ОС Windows і MacOS і є дуже простим у використанні, адже дозволяє перемикатись між диктуванням, редагуванням та форматуванням, а також дозволяє майже безпомилково розпізнавати мовлення на 8 мовах: британською та американською англійською, французькою, німецькою, італійською, іспанською, датською, та японською.
Диктант 2.5, що між іншим розроблений тією ж Dragon Systems, Inc., це російськомовна адаптація Dragon Naturally Speaking Personal Edition, яку підтримують більшість стандартних додатків операційної системи Windows, починаючи із версії «95» і закінчуючи «10». До того ж, ця програма дозволяє керувати нею ж за допомогою голосових команд, тобто можна обійтись без ручного керування.
Найновіші програми мовного розпізнавання, що підтримуються і Windows, і MacOS – це Simon, Braina, LilySpeech та Jasper Project (English), а українську дозволяють розпізнати такі програми як, напприклад, VoiceTypist. Сучасні смартфони підтримують такі програми як Google Voice, Microsoft Cortana, Siri, Dragon Dictation.
Висновок
Ми ознайомились та засвоїли основні принципи введення та перетворення текстової інформації з твердого носія в електронний вигляд з допомогою системи оптичного розпізнавання символів Fine Reader. Працювали з пакетами мовного розпізнавання тексту та виконали аналіз предметної області.