Аналітична обробка експериментальних даних на основі баз даних
Сучасний рівень розвитку апаратних і програмних засобів сприяє веденню баз даних оперативної інформації на всіх рівнях управління. У процесі своєї діяльності промислові підприємства, корпорації, відомчі структури, органи державної влади і управління нагромаджують великі об'єми даних, які містять значні потенційні можливості щодо одержання корисної аналітичної інформації. Обробляючи та обґрунтовуючи цю інформацію, можна виявляти завуальовані тенденції, будувати стратегію розвитку, знаходити нові рішення.
За останні роки в світі сформувався ряд нових тенденцій зберігання та аналізу корпоративних даних:
cховища даних (Data Warehause);
oперативна аналітична обробка даних (Оп-Lіпе Апаlуtical Ргосеssing, OLAP); iнтелектуальний аналіз даних - ІАД (Data Міnіng).
В основі концепції аналітичної обробки (ОLАР) лежить багатовимірне представлення даних (термін ОLАР був запропонований Коддом у 1933 р.). За Коддом, багатовимірне концептуальне представлення даних є найбільш природнім з точки зору керівника на об'єкт управління. Воно є множинною перспективою, що містить декілька незалежних вимірів, а також аналіз залежних вимірів та певної сукупності даних. Одночасний аналіз за декількома вимірами даних є багатомірним. Кожен вимір включає напрям консолідації даних, що складається з серії послідовних рівнів узагальнення.
На нинішній день на ринку представлено близько З0 продуктів, що тією чи іншою мірою забезпечують функціональність ОLАР.
У спеціалізованих СУБД, що грунтуються на багатомірному представленні даних (МОLАР), дані організовані не у формі реляційних таблиць, а у вигляді впорядкованих багатомірних масивів (кубів, полікубів).
Безпосереднє використання реляційних БД в якості вихідних даних у системах оперативної аналітичної обробки (RОLАР) дає змогу проводити аналіз безпосередньо над сховищем. Системи RОLАР можуть функціонувати на менш потужних клієнтських станціях, аніж системи МОLАР. Вони забезпечують високий рівень захисту даних, мають реальний досвід роботи з дуже великими базами даних і розвинені засоби адміністрування.
Прикладом RОLАР - оперативної аналітичної обробки реляційних даних - є ІнфоВізор-Аналітик. Одержання значень показників проводиться за результатами SQL-запитів до реляційної бази даних. При цьому результуючими значеннями показників інформаційної моделі можуть бути: а) значення полів чисельної типу бази даних; б) функції агрегації SQL (аvg, соunt, mах, mіn, а також інші функції агрегації, що підтримуються SQL-сервером); в) формули (SQL-вирази, що мають на виході одне чисельне значення).
Результати серії SQL-запитів, сформованої за кожним конкретним оперативним замовленням аналітика (діалоговим запитом), мають ідентичний формат (набір полів ідентифікаторів екземплярів довідників вибраних рівнів узагальнення вибраних атрибутів плюс цільове поле показника). Той факт, що центральна таблиця цієї бази даних є тимчасовою, тобто оперативно створюється і заповнюється за вимогою аналітика у відповідь на його нерегламентований запит, і є основою назви методу ("Концепція віртуальної зірки").
Новизна запропонованого підходу "віртуальної зірки" порівняно з існуючими механізмами, що реалізуються у продуктах ОLАР, полягає в наступному.
Введення понять довідника згрупованих узагальнених атрибутів однорідності дозволяє в рамках однієї інформаційної моделі звертатися до значень трьох типів:
а) чисельного;
б) одержаного в результаті оперативної агрегації в процесі виконання запиту;
в) результатів розрахунку заданих формул.
2. Реалізація гнучкого механізму групування атрибутів у процесі розгляду сформованого гіперкубу дозволяє суттєво знизити його мірність і полегшити сприйняття кінцевим користувачем результуючої інформації. Цей продукт є основним інструментом адміністратора сховища даних. З його допомогою можуть створюватися і редагуватися інформаційні моделі, а також сценарії завантаження інформації із зовнішніх джерел.