МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ «ЛЬВІВСЬКА ПОЛІТЕХНІКА»
ІНСТИТУТ КОМП’ЮТЕРНИХ НАУК ТА ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ
КАФЕДРА АВТОМАТИЗОВАНИХ СИСТЕМ УПРАВЛІННЯ
Звіт до лабораторної роботи №7
з дисципліни «Методи та системи штучного інтелекту»на тему: «Карти Кохонена. Застосування карт, що самоорганізуються (Self-Organіzіng Maps, SOM) для розв’язання задач кластеризації»
Лабораторна робота №7
Тема роботи: Карти Кохонена. Застосування карт, що самоорганізуються (Self-Organіzіng Maps, SOM) для розв’язання задач кластеризації
Мета роботи: Ознайомитись з програмним пакетом «Deductor» та навчитись використовувати його. Розв’язати задачу кластеризації застосовуючи карти Кохонена.
Короткі теоретичні відомості
Мережі, що називаються картами Кохонена – це один з різновидів нейронних мереж, однак вони принципово відрізняються від розглянутих раніше, оскільки використовують неконтрольоване навчання. Нагадаємо, що при такому навчанні навчальна множина складається лише зі значень вхідних змінних, у процесі навчання немає порівняння виходів нейронів з еталонними значеннями. Можна сказати, що така мережа вчиться розуміти структуру даних.
Ідея мережі Кохонена належить фінському вченому Тойво Кохонену (1982 рік). Основний принцип роботи мереж – введення в правило навчання нейрона інформації щодо його розташування.
В основі ідеї мережі Кохонена лежить аналогія із властивостями людського мозку. Кора головного мозку людини являє собою плоский аркуш і згорнута складками. Таким чином, можна сказати, що вона має певні топологічні властивості (ділянки, відповідальні за близькі частини тіла, примикають одна до одної й все зображення людського тіла відображається на цю двовимірну поверхню).
Завдання, що розв'язуються за допомогою карт Кохонена
Карти, що самоорганізуються, можуть використовуватися для розв’язання таких завдань, як моделювання, прогнозування, пошук закономірностей у великих масивах даних, виявлення наборів незалежних ознак і стиск інформації.
Найпоширеніше застосування мереж Кохонена - рішення завдання класифікації без учителя, тобто кластеризації.
Нагадаємо, що при такій постановці завдання нам задано набір об'єктів, кожному з яких відповідає рядок таблиці (вектор значень ознак). Потрібно розбити вихідну множину на класи, тобто для кожного об'єкта знайти клас, до якого він належить.
У результаті одержання нової інформації про класи можлива корекція існуючих правил класифікації об'єктів.
От два з найбільш розповсюджених застосувань карт Кохонена: розвідницький аналіз даних і виявлення нових явищ.
Розвідницький аналіз даних. Мережа Кохонена здатна розпізнавати кластери в даних, а також встановлювати близькість класів. Таким чином, користувач може поліпшити своє розуміння структури даних, щоб потім уточнити нейромережеву модель. Якщо в даних розпізнані класи, то їх можна позначити, після чого мережа зможе вирішувати завдання класифікації. Мережі Кохонена можна використати й у тих завданнях класифікації, де класи вже задані, - тоді перевага буде в тім, що мережа зможе виявити подібність між різними класами.
Виявлення нових явищ. Мережа Кохонена розпізнає кластери в навчальних даних і відносить всі дані до тих або інших кластерів. Якщо після цього мережа зустрінеться з набором даних, несхожим ні на один з відомих зразків, то вона не зможе класифікувати такий набір і тим самим виявить його новизну.
Хід роботи
1. Запускаю Deductor та ознайомлююсь із його основними можливостями.
Рис. 1 Стартове вікно програми Deductor.
2. Формую власні дані для задачі кластеризації. Дані полягають у кластеризації футболістів за їхньою вагою та зростом.
Рис. 2 Файл з власними даними.
3. Використовуючи файл даних виконую навчання мережі Кохонена відповідно до прикладу з методичних вказівок. Проходжу всі кроки на даних, приділивши більшу увагу налаштуванню параметрів мережі Кохонена.
Рис. 6 В майстрі обробки даних вибір «Карта Кохонена».
Рис. 10 Побудова катри Кохонена.
Рис. 11 Вибір способів відображення даних.
Рис. 12 Налаштування відображення катри Кохонена.
Висновок: В результаті виконання даної лабораторної роботи, я дослідив можливості програми “Deductor”. За допомогою програмного забезпечення Deductor, я ознайомився з картами Кохонена на основі готового прикладу. Потім я створив власні дані, які базуються на кластеризації футболістів враховуючи їх зріст і вагу, опрацювала всі кроки для створення карти Кохонена на них. За допомогою карт Кохонена я прокластеризував футболістів на основі їх певних характеристик та отримала оптимальний результат.