Адміністрація вирішила продати даний сайт. За детальною інформацією звертайтесь за адресою: rozrahu@gmail.com

Інформація про навчальний заклад

ВУЗ:
Національний університет Львівська політехніка
Інститут:
Не вказано
Факультет:
ЗІ
Кафедра:
Не вказано

Інформація про роботу

Рік:
2024
Тип роботи:
Лабораторна робота
Предмет:
Інтелектуальний аналіз даних

Частина тексту файла

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ «ЛЬВІВСЬКА ПОЛІТЕХНІКА» Інститут сталого розвитку ім. В.Чорновола Лабораторна робота №1 З дисципліни «Інтелектуальний аналіз даних в підприємництві і торгівлі» Варіант №4 Робота з системою аналізу даних Weka Класифікація та асоціація даних Мета роботи: оволодіння базовими навичками роботи з системою аналізу даних Weka, ознайомлення з основними алгоритмами класифікації даних та методами складання асоціативних правил. Вступ Waikato Environment for Knowledge Analysis (WEKA), є вільно поширюваним програмним пакетом з відкритим вихідним кодом для аналізу даних. WEKA забезпечує графічний користувальницький інтерфейс для роботи з файлами даних і генерації візуальних результатів (у вигляді таблиць і графіків). Крім того, можливо інтегрувати WEKA, як і будь-яку іншу бібліотеку, у свої власні додатки, наприклад, для автоматизації аналізу даних на стороні сервера, використовуючи стандартний API. Ця програма дає можливість виконувати такі завдання аналізу даних: підготовка даних - попередня обробка; відбір ознак; кластеризація; класифікація, зокрема, дерева рішень; пошук асоціативних правил; регресійний аналіз; візуалізація результатів; Переваги WEKA об'ємний набір алгоритмів з аналізу даних і машинного навчання; відкритий вихідний код; кросплатформеність; простота у використанні; гнучкість у роботі з даними, що вводяться; вільний доступ. Хід роботи Завдання 1 Метод J4.8 Рис.1. Результат роботи класифікаційної моделі J4.8 Рис.2. Перевірка класифікаційного дерева J4.8 / Рис.3. Візуальне подання дерева класифікації J48 Найбільш суттєві дані - це показники класифікації "Correctly Classified Instances" (84.1%) і "Incorrectly Classified Instances" (15.8%). Таблиця Confusion Matrix показує кількість хибно-позитивних (646) і хибно-негативних (112) розпізнавань. Оскільки показник точності нашої моделі – 84.1%, то в первісному розгляді її не можна назвати хорошою. Метод наївного Байєса / Рис.4. Результат роботи класифікаційної моделі наївного Байєса / Рис.5. Перевірка класифікаційного дерева наївного Байєса Найбільш суттєві дані - це показники класифікації "Correctly Classified Instances" (76.3%) і "Incorrectly Classified Instances" (23.6%). Таблиця Confusion Matrix показує кількість хибно-позитивних (586) і хибно-негативних (182) розпізнавань. Оскільки показник точності нашої моделі – 76.3%, то в первісному розгляді її не можна назвати досить хорошою. Метод OneR / Рис.6. Результат роботи класифікаційної моделі OneR / Рис.7. Перевірка класифікаційного дерева OneR Найбільш суттєві дані - це показники класифікації "Correctly Classified Instances" (76.4%) і "Incorrectly Classified Instances" (23.5%). Таблиця Confusion Matrix показує кількість хибно-позитивних (587) і хибно-негативних (181) розпізнавань. Оскільки показник точності нашої моделі - 59,1%, то в первісному розгляді її не можна назвати досить хорошою. Завдання 2 / Рис.8. Огляд результатів у таблиці ранжування. Ми бачимо, що обидва алгоритми J48 і OneR мають по одній перемозі, а ZeroR має два програші. Це добре, це означає, що OneR і J48 є потенційними претендентами. / Рис.9. Відображення показників точності. Бачимо, що обидва алгоритми OneR і J48 біля своїх результатів мають маленьке ―v‖. Це означає, що різниця в точності цих алгоритмів у порівнянні з ZeroR є статистично значущою. Спостерігаємо, що точність цих алгоритмів у порівнянні з ZeroR є вищою, тому можна констатувати, що ці два алгоритми досягають статистично значно кращий результат, ніж ZeroR. Показник для J48 є вищим ніж для OneR, тому далі потрібно дослідити чи різниця між цими двома оцінками точності є значною. / Рис.10. Порівняння показників точності методів J48 та OneR Бачимо, що ZeroR поруч з результатами має «*», це вказує на те що його результати порівняно з J48 статистично відрізняються. Але це ми вже знаємо. Ми не бачимо «*» поруч ...
Антиботан аватар за замовчуванням

27.12.2017 01:12

Коментарі

Ви не можете залишити коментар. Для цього, будь ласка, увійдіть або зареєструйтесь.

Завантаження файлу

Якщо Ви маєте на своєму комп'ютері файли, пов'язані з навчанням( розрахункові, лабораторні, практичні, контрольні роботи та інше...), і Вам не шкода ними поділитись - то скористайтесь формою для завантаження файлу, попередньо заархівувавши все в архів .rar або .zip розміром до 100мб, і до нього невдовзі отримають доступ студенти всієї України! Ви отримаєте грошову винагороду в кінці місяця, якщо станете одним з трьох переможців!
Стань активним учасником руху antibotan!
Поділись актуальною інформацією,
і отримай привілеї у користуванні архівом! Детальніше

Оголошення від адміністратора

Антиботан аватар за замовчуванням

пропонує роботу

Admin

26.02.2019 12:38

Привіт усім учасникам нашого порталу! Хороші новини - з‘явилась можливість кожному заробити на своїх знаннях та вміннях. Тепер Ви можете продавати свої роботи на сайті заробляючи кошти, рейтинг і довіру користувачів. Потрібно завантажити роботу, вказати ціну і додати один інформативний скріншот з деякими частинами виконаних завдань. Навіть одна якісна і всім необхідна робота може продатися сотні разів. «Головою заробляти» продуктивніше ніж руками! :-)

Новини