Національний університет “Львівська політехніка”
Інститут комп'ютерних наук та інформаційних технологій
/
Звіт до лабораторної роботи №2:
«СТВОРЕННЯ СХОВИЩА ДАНИХ В DEDUCTOR»
з курсу “ Інтелектуальний аналіз даних. ”
для базового напрямку “Комп’ютерні науки”
Короткі теоретичні відомості:
Сховище даних Deductor Warehouse – це спеціально організована база даних, що орієнтована на вирішення завдань аналізу даних і підтримки прийняття рішень, забезпечує максимально швидкий і зручний доступ до інформації.
Deductor Warehouse побудований на моделі ROLAP (схема «сніжинка») і може бути розгорнутий на одній з наступних СУБД:
Firebird 1.5 і вище;
MS SQL Server 2000 і вище;
Oracle починаючи з версії 9i;
Можливість роботи зі сховищами даних на СУБД MS SQL Server і Oracle доступна тільки в Deductor Enterprise. Версія програми Deductor Academic підтримує роботу сховища на базі Interbase Firebird.
Призначення сховища даних – своєчасно забезпечити аналітика всією інформацією, необхідною для проведення аналізу, побудови моделей та прийняття рішень. Мета сховища даних – не аналіз даних, а підготовка даних для аналізу та їх консолідація.
В Deductor Warehouse варто виділити наступні об’єкти:
Вимір – це послідовність значень одного з параметрів, що аналізується. Наприклад, для параметра «час» це послідовність календарних днів, для параметра «регіон» – список міст. Кожне значення виміру може бути представлене координатою в багатовимірному просторі процесу, наприклад, товар, клієнт, дата.
Атрибут – це властивість виміру (тобто точки в просторі). Атрибут допомагає користувачеві повніше описати певний вимір. Наприклад, для виміру «Товар» атрибутами можуть бути «Колір», «Вага», «Габарити».
Факт – значення, що відповідає виміру. Факти – це дані, що відображають суть події. Як правило, фактами є числові значення, наприклад, сума і кількість відвантаженого товару, знижка.
Посилання на вимір – це встановлений зв’язок між двома і більше вимірами. Річ у тому, що деякі бізнес-терміни (що відповідають вимірам в сховищі даних) можуть утворювати ієрархії, наприклад, «Товари» можуть включати «Продукти харчування» і «Лікарські препарати», які, у свою чергу, поділяються на групи продуктів та ліків тощо. В цьому випадку перший вимір містить посилання на другий, другий – на третій і так далі.
Часто складно визначитися, що є атрибутом процесу, а що виміром. Універсальних рецептів на всі випадки не існує. Але можна дати загальні рекомендації:
сукупність вимірів процесу повинна однозначно визначати єдиний запис в таблиці процесу («точку» в багатовимірному просторі);
якщо існують ієрархії, то вибір повинен бути на користь виміру;
якщо по об’єкту сховища даних передбачається в майбутньому часто робити «зрізи», то знову краще віддати перевагу виміру.
наявність можливих пропусків (необов’язкове поле) означає, що об’єкт краще зробити атрибутом процесу.
/
Рис.2.1. Структура сховища даних
Результат роботи.
/
/
/
Висновок: на цій лабораторній роботі я ознайомився та вивчив можливості створення та роботи зі сховищем даних в аналітичній платформі Deductor.