МІНІСТЕРСТВО ОСВІТИ ТА НАУКИ УКРАЇНИ
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ «ЛЬВІВСЬКА ПОЛІТЕХНІКА»
Кафедра САПР
/
Звіт
до лабораторної роботи № 1
з курсу: «Інтелектуальний аналіз даних»
на тему:
«Базові принципи роботи в Deductor»
1.Мета роботи:ознайомитися з основами роботи з аналітичною платформою Deductor виробництва російської компанії BaseGroup Labs.
2.Короткі теоретичні відомості:
Deductor – це аналітична платформа, призначена для створення логічно завершених прикладних рішень в області аналізу даних. Реалізовані в Deductor технології дозволяють на базі єдиної архітектури пройти всі етапи побудови аналітичної системи: від консолідації даних до побудови моделей і візуалізації отриманих результатів.
Інтерфейс складається з наступних основних частин (рис. 2.1):
меню;
стандартна панель інструментів;
панель закладок або ж просто закладки;
контекстна панель інструментів, склад якої динамічно змінюється залежно від того, яка закладка є активна;
робоча область або область візуалізації даних.
/
Рис.2.1. Будова вікна Deductor Studio
Ключовим поняттям в програмі є проект – це файл з розширенням *.ded, що містить: Послідовності обробки даних – сценарії. Налаштування вузуалізаторів (графіків та діаграм). Спеціальні програмні зміни проекту та службову інформацію.
По структурі файл проект відповідає стандартному xml-файлу.
Всі операції (створення, відкриття та збереження) здійснюються стандартним способом через пункт меню «Файл».Важливо зауважити, що одна копія запущеної програми може одночасно працювати лише з одним проектом.Щоб відкрити два файли Deductor потрібно запустити кілька екземплярів програми і відповідно в них відкрити потрібні файли.
У Deductor Studio вся робота ведеться за допомогою 5 майстрів:
Майстер імпорту.
Майстер експорту.
Майстер обробки.
Майстер візуалізації.
Майстер підключень.
За допомогою майстрів імпорту, експорту і обробки формується сценарій. Сценарій складається з вузлів (рис.2.3). Майстер підключень призначений для створення налаштувань підключень до різних джерел (баз даних чи сховищ даних) та одержувачів даних. Майстер візуалізації налаштовує візуалізатори для конкретного вузла. Візуалізатором називається представлення набору даних в певному вигляді: табличному, графічному, описовому. Приклади візуалізаторів: таблиця, дерево, гістограма, діаграма, OLAP-куб тощо.
Сценарій – це послідовність операцій з даними, представлену у вигляді ієрархічного дерева. В дереві кожна операція утворює вузол, заголовок якого містить:
ім’я джерела даних;
найменування методу обробки, використовувані при цьому поля тощо.
Крім цього, зліва від назви вузла розміщений значок, що відповідає типу операції (рис. 2.3).
/
Рис.2.3 Дерево сценаріїв
Deductor не має власних засобів для введення даних, тому сценарій завжди починається з вузла імпорту з певного джерела. Будь-який новостворений вузол імпорту знаходитиметься на верхньому рівні (підлеглий головному вузлу Сценарію).
!!!Важливо. Після вузла експорту неможливо додати жоден вузол!!!
Крім команд виклику Майстрів, до кожного вузла можна застосувати базові операції:
Відкриття вузла – вузол запускається на виконання, причому виконуються всі материнські вузли (які знаходяться вгорі), а справа відкриваються візуалізатори, настроєні для даного вузла. Для кожного вузла повинен бути налаштований хоча б один візуалізатор. Операція виконується ЛКМ2 по потрібному вузлу.
Налаштування вузла – викликається відповідний Майстер (Майстер імпорту, Майстер обробки або Майстер експорту залежно від типу вузла), для зміни параметрів вузла. Операція виконується: Alt+Enter, або «контекстне меню – Настроить», або кнопка / .
Вирізання вузла – видаляє поточний вузол зі сценарію обробки. Всі його «нащадки» при цьому переміщаються на один рівень вгору і починають підкорятися «материнському вузлу» видаленого вузла. Операція виконується: «контекстне меню – Вырезать узел» або кнопка / на контекстній панелі інструментів.
Вставити вузол – вставляє перед поточним вузлом сценарію новий вузол і викликає для нього Майстер обробки. Вставити вузол перед вузлом імпорту даних не можна. Операція виконується: «контекстне меню – Вставить узел» або кнопка / . Після вставки нового вузла або видалення існуючого вузли-нащадки можуть стати неробочими, залежно від обробки, що виконується новим вузлом.
Копіювання гілки – копіює гілку сценарію починаючи від виділеного і включаючи всі його потомки. Операція виконується: «контекстне меню – Копировать ветвь», або кнопка /, або перетягування мишкою (drag&drop).
Видалення гілки – видаляє вузол сценарію і всі його підвузли. Видалена гілка відновленню не підлягає, тому до даної операції необхідно підходити з обережністю. Операція виконується: Ctrl+Delete, або «контекстне меню – Удалить ветвь», або кнопка /.
Перейменування – дозволяє змінити мітку (назву) поточного вузла. Операція виконується: F2 або «контекстне меню – Переименовать».
Працюючи в Deductor потрібно пам’ятати про ще одну зручну особливість – можливість отримати швидку статистику по масиву даних.
3.Лабораторне завдання:
1. Імпортуйте текстовий файл «data.txt».
2. Створіть 5 вузлів фільтрації .
4.Результати виконання:
Початкова таблиця:
/
Після фільтру:
/
/
Після фільтру
/
/Після фільтру
/
/Після фільтру
/
/Після фільтру
/
/Висновок: на цій лабораторній роботі я ознайомився з основами роботи з аналітичною платформою Deductor.