Вивчення бібліотеки прикладних програм NTLK, для опрацювання текстів природною мовою. Основи програмування на мові Python(частина 1)

Інформація про навчальний заклад

ВУЗ:
Національний університет Львівська політехніка
Інститут:
Не вказано
Факультет:
Не вказано
Кафедра:
Системи автоматизованого проектування

Інформація про роботу

Рік:
2024
Тип роботи:
Звіт до лабораторної роботи
Предмет:
Інформаційні технології

Частина тексту файла (без зображень, графіків і формул):

Міністерство освіти та науки України Національний університет “Львівська політехніка” інститут комп’ютерних наук та інформаційних технологій Кафедра “Системи автоматизованого проектування” Звіт до лабораторної роботи № 1 з курсу «Комп’ютерна лінгвістика» на тему: «Вивчення бібліотеки прикладних програм NTLK, для опрацювання текстів природною мовою. Основи програмування на мові Python(частина 1)» Мета роботи: вивчення основ програмування на мові Python. Короткі теоретичні відомості Python - це проста і потужна об’єктно-орієнтована мова програмування високого рівня з чудовими можливостями для обробки лінгвістичних даних. Natural Language Toolk (NLTK) – набір Python бібліотек, які призначені для аналізу текстів природною мовою. NLTK дозволяє здійснювати символьний та статистичний аналіз текстів, створювати графічні звіти, містить детальну документацію і використовується у проектах з лінгвістики, штучного інтелекту, машинного навчання, автоматизації документообігу. Його можна застосовувати як навчальний комплекс, готовий аналітичний інструмент або платформу для створення прикладних систем опрацювання текстів. Python – інтерпретаційна мова, що дозволяє зекономити час, що витрачається на компіляцію. Інтерпретатор можна використовувати інтерактивно, що дозволяє експериментувати з можливостями мови і створювати фрагменти програм або тестувати окремі функції. Інтерпретатор даної мови програмування можна використовувати як калькулятор, виконуючи різні математичні операції. Текст або частини тексту у програмах на Python представляються за допомогою стрічок (string) і повинен відділятися від решти програми лапками (одинарними, подвійними або потрійними). Змінна, яка називається стрічкою (має тип змінної - стрічка) є дуже важливою при опрацюванні текстів. Усі позиції в стрічці є пронумеровані починаючи з нуля. Для доступу до окремої позиції у стрічці ми записуємо цю позицію у квадратних дужках. Така операція називається індексуванням. Позиція записана в квадратних дужках називається індексом. Цей номер додається до фізичної адреси змінної, яка знаходиться в пам’яті. Для визначення довжини стрічки і відповідно максимального індекса можна порахувати символи і відняти 1, або використати функцію len(). У випадку, коли ми хочемо отримати доступ до більш ніж одного символа ми повинні у квадратних дужках вказати індекс першого символа і останнього розділивши їх двокрапкою. Цей процес називається slicing (зріз). Lists (списки) – тип даних для опису послідовності значень. У Python списки представляються як послідовність, записана через кому і у квадратних дужках. Списки багато в чому подібні до стрічок, але елементами списків на відміну від стрічок можуть бути не тільки окремі символи, але і цілі стрічки та інші списки. Доступ до значень списків отримуємо аналогічно до стрічок. Значення у списках можно змінювати на відміну від стрічок, де значення змінити неможливо. Вміст списків можна міняти в будь-який момент часу і тому списки підтримують набір операцій або методів. Часто при роботі з послідовностями виникає необхідність послідовно працювати з її елементами. Ми можемо це робити використовуючи for цикл. Тексти програм на мові Python Варіант 2 1. [2] Роздрукувати вміст змінної msg двома шляхами, перший набравши назву змінної в інтерпретаторі, другий - використавши команду print.  2. [6] Визначити стрічку s=’colorless’. Використовуючи зрізи та операцію поєднання змінити стрічку до вигляду ‘colourless’.  3. [9] Організуйте доступ до елементів стрічки з визначеним кроком. Результати поясніть.  msg[:6] інтерпритатор виводить на екран символи зі стрічки в діапозоні [0:6] msg[4:7] виводить на екран символи зі стрічки в діапозоні [4:7] msg[:12:2] виводить кожен другий симол з діапазона [0:12] 4. [12] Представити прізвище, ім’я та по батькові як список стрічок. Розділити речення на окремі елементи, межа розділу голосна буква.  5. [15] Створити список phrase1, який складається із значень ім’я , по батькові, прізвище студента. Що відбудеться при спробі ввести в інтерпретатор наступний оператор phrase1[2][2]. Поясніть результат.  На екран виводиться другий символ другої стрічки в списку. 6. [20] Визначіть змінну silly, яка буде містити стрічку ’newly formed bland ideas are inexpressible in an infuriating way’ і напишіть програму перетворення стрічки на список стрічок (кожне слово окрема стрічка). Результати збережіть в змінній bland.  7. [23] Напишіть програму, яка надрукує слова із стрічки silly за абеткою.  Самостійне завдання:  1 – мінімальна кількість слів very, 7 – максимальна кількість слів very. Між словами немає пробілів, оскільки оператор множення і додавання не додає пробіл між словом. і – певне число в змінній а. 2*(7-і) – кількість відступів перед словом very. Висновок На дані лабораторній роботі ознайомилася із мовою програмування Python, яка є потужною об’єктно-орієнтованою мовою програмування високого рівня з чудовими можливостями для обробки лінгвістичних даних. Ознайомилась з типами даних: стрічка, список, кортеж. Навчилась застосовувати операцію поєднання, використовувати зрізи, перетворювати стрічку у список і навпаки, сортувати елементи за абеткою, створювати файл test.py і використовувати його для виконання завдань. Виконала приклади, які були подані у теоретичних відомостях та вправи згідно варіанта індивідуального завдання.
Антиботан аватар за замовчуванням

07.06.2013 20:06-

Коментарі

Ви не можете залишити коментар. Для цього, будь ласка, увійдіть або зареєструйтесь.

Ділись своїми роботами та отримуй миттєві бонуси!

Маєш корисні навчальні матеріали, які припадають пилом на твоєму комп'ютері? Розрахункові, лабораторні, практичні чи контрольні роботи — завантажуй їх прямо зараз і одразу отримуй бали на свій рахунок! Заархівуй всі файли в один .zip (до 100 МБ) або завантажуй кожен файл окремо. Внесок у спільноту – це легкий спосіб допомогти іншим та отримати додаткові можливості на сайті. Твої старі роботи можуть приносити тобі нові нагороди!
Нічого не вибрано
0%

Оголошення від адміністратора

Антиботан аватар за замовчуванням

Подякувати Студентському архіву довільною сумою

Admin

26.02.2023 12:38

Дякуємо, що користуєтесь нашим архівом!