Міністерство освіти і науки, молоді та спорту України
Національний університет “Львівська політехніка”
Кафедра “Інформаційні системи та мережі ”
К У Р С О В А Р О Б О Т А
з дисципліни “Методи та засоби комп’ютерних інформаційних технологій”
на тему:
“Автоматизація роботи зі знаннями які представленні у текстовому вигляді”
З А В Д А Н Н Я
на курсову роботу з дисципліни “Методи та засоби комп’ютерних інформаційних технологій”
студента групи КН-36 Гальківа А.В.
Т е м а: “ Автоматизація роботи зі знаннями які представленні у текстовому вигляді”
Завдання:написати програму-тестування для визначення рівня знань студентів.
ЗМIСТ ЗАВДАННЯ ТА КАЛЕНДАРНИЙ ПЛАН ЙОГО ВИКОНАННЯ
№ з/п
Зміст завдання
Дата
Здійснити аналiтичний огляд лiтератури за заданою темою.
15.11
Розробити структуру інтерфейсу
2.12
Розробитипрограмну реалізацію
12.12
Оформити записку до курсового роботи згiдно з вимогами Мiжнародних стандартiв, дотримуючись такого змiсту:
25.12
вступ;
теоретична частина;
опис алгоритму;
опис програмної реалізації (опис роботи, типи вхідних та вихідних даних);
аналіз контрольного прикладу;
висновки;
література;
додатки.
ЗАВДАННЯ ПРИЙНЯТО ДО ВИКОНАННЯ: 20 листопада 2010р.
Керівник роботи : _______________/Чирун Л. Б./
Зміст
Вcтуп
Основні поняття керування знаннями…………………………………………...6
Типи систем, основаних на знаннях……………………………………..............13
Висновок
Література
Додаток
Вступ
На сьогодні практично кожна організація чи її окремі працівники (особливо ті, що займаються аналітичною роботою) стикаються з однією і тією ж проблемою: інформації дуже багато — у базах даних, у старих звітах, в листах, на сайтах в Інтернет, у власних папках на комп’ютері — а от знайти потрібну досить складно. Доводиться непродуктивно витрачати надзвичайно багато часу на її пошук.
1. Основні поняття керування знаннямиНа сьогодні практично кожна організація чи її окремі працівники (особливо ті, що займаються аналітичною роботою) стикаються з однією і тією ж проблемою: інформації дуже багато — у базах даних, у старих звітах, в листах, на сайтах в Інтернет, у власних папках на комп’ютері — а от знайти потрібну досить складно. Доводиться непродуктивно витрачати надзвичайно багато часу на її пошук./ Обстеження, проведене компанією Reuters серед 1300 між-народних менеджерів, показало, що багато з них страждають від «синдрому інформаційної утоми». Для ефективної роботи їм необхідна інформація для знаходження якої доводиться опрацьовувати величезні обсяги даних. Так, 38 % опитаних Reuters менеджерів стверджують, що «витрачають багато часу, намагаючись знайти потрібну інформацію».Тому значна увага провідними компаніями світу останнім часом приділяється так званому керуванню знаннями. Перш ніж пояснити, що розуміють під цим терміном, слід визначити, що ж таке «знання».Різницю між даними, інформацією і знаннями можна пояснити наступним чином. Дані — це новини, записи, відомості про ті чи інші процеси і т. п.; інформація — це відібрані і проструктуровані дані, що можуть використовуватися для прийняття рішень по певній задачі; знання — є результатом переробки інформації, містять певну ідею в контексті того, як і де використовувати інформацію.Енциклопедичний словник Webster дає цілий ряд визначень поняття «знання»:knowledge (знання) — 1) розуміння, що здобувається фактич-ним досвідом (наприклад, знання якогось ремесла). 2) А: стан поінформованості про щось чи володіння інформацією, Б: діапа-зон інформованості чи поінформованості. 3) акт розуміння: ясне сприйняття істини. 4) щось зрозуміле і тримається в розумі.
Знання — це зв’язки і закономірності предметної області, отримані в результаті практичної діяльності.
За формою знання поділяються на неявні і явні.Явні знання можуть бути формалізовані у виді документів, баз знань, протоколів, норм, правил. Неявні знання, або приховані — існують у свідомості спеціалістів — звички, шаблони мислення і поводження, інтуїція — те, що вони знають, але не можуть виразити словами. Існують різні визначення того, що слід розуміти під керуванням знаннями:Визначення Gartner Group: «Керування знаннями — це дисципліна, що забезпечує інтегрований підхід до створення, збору, організації і використання інформаційних ресурсів підприємства і доступу до них. Ці ресурси включають структуровані БД, текстову інформацію, таку, як документи, що описують правила і процедури, і, що найбільш важливо, неявні знання й експертизу, що знаходяться в головах співробітників» [1]. Визначення ІDC: «Керування знаннями — це формальний про-цес, що складається в оцінці організаційних процедур, людей і технологій і в створенні системи, що використовує взаємозв’язки між цими компонентами з метою надання потрібної інформації потрібним людям у потрібний час, що приводить до підвищення продуктивності» [2].
Керування знаннями (Knowledge Management — KM) — це встановлений в організації порядок роботи з інформаційними ресурсами для збору знань, полегшення доступу до них і повторного їх використання за допомогою сучасних інформаційних технологій.
Виділяють наступні основні процеси керування знаннями:
виявлення знань;
зберігання;
використання.
Існує також поняття «інтелектуальності бізнесу» — busіness іntellіgence — BІ. Його слід відрізняти від «керування знаннями». Під busіness іntellіgence зазвичай розуміють засоби, що дають кінцевому користувачу можливості доступу до структурованих даних, і наступного їх аналізу з метою прогнозування і прийняття рішень. Технологія керування знаннями організації включає дві сто-рони:
керування знаннями як організаційна функція, що регулює порядок виявлення, нагромадження і використання знань в організації;
система керування знаннями як технології та інструменталь-ні засоби, що забезпечують процеси організаційної функції.
Керування знаннями як організаційна функція — це політика компанії у відношенні керування знаннями, тобто різноманітні управлінські важелі і процедури, що дозволяють компанії виявляти та зберігати знання для того, щоб ефективно їх використовувати в сьогоденні і майбутньому. Технології допомагають здійс-нити ці управлінські процедури, але не можуть їх замінити. Системи керування знаннями з одного боку, дозволяють мінімізувати рутинну роботу, пов’язану зі знаходженням та накопиченням знань, а з іншого боку — зафіксувати адміністративні регламен-ти (зробити їх обов’язковими для виконання) на рівні технології. Всі процеси керування знаннями можуть бути в тій чи іншій мірі підтримані інформаційними технологіями.Вибір тих чи інших технологій залежить від конкретної організації, вже наявних в ній інформаційних систем та задач, які необхідно вирішувати.На сьогодні організаціями застосовується широкий спектр інформаційних систем, які поодинці чи у певному поєднанні дозволяють керувати знаннями (табл. 5.1).
Таблиця 5.1
СИСТЕМИ КЕРУВАННЯ ЗНАННЯМИ
Системи, що забезпе-чують накопичення да-них і знань
бази і сховища даних (data warehouse);
традиційні системи автоматизації;
інформаційно-пошукові системи;
системи електронної пошти;
системи електронного документообігу;
системи керування потоками робіт;
системи керування контентом сайту;
портали знань;
семантичні мережі, що зберігають значення документів
Засоби, що забезпечують «добування» знань
пакети статистичного аналізу;
засоби Data Mining;
засоби Text Mining
Спеціалізовані системи керування знаннями
системи представлення знань і бази знань;
системи категоризації, пошуку і навігації накопичених знань
Технології керування знаннями на сьогодні проходять етап становлення, але очевидною є необхідність їх використання для віртуальних організацій. Саме для таких компаній, в яких часто змінюється склад колективів, особливо актуальним є використання ефективних механізмів пошуку знань, а також збереження і накопичення знань, з тим, щоб у подальшому використовувати їх у новому складі чи для нових задач. Серед задач віртуальної організації, які можуть бути ефективно підтримані технологіями керування знаннями, можна назвати:
розробка процесів, необхідних для здійснення виробництва;
прогнозування ринкових можливостей щодо розміру необхідних ресурсів та постійне коригування їх;
маркетинг запланованого товару (послуги);
укладання контрактів на необхідні ресурси;
ревізія забезпечених послуг у термінах якості;
постійний бенчмаркінг використовуваних ресурсів та переукладання договорів де це необхідно та ін.
2. Зберігання та представлення знань2.1. Вимоги до представлення знаньТрадиційно вважається, що знання, аналогічно до того, як дані зберігаються в базі даних, мають зберігатися в базі знань.Виділяють декілька основних вимог до представлення елементів знань у базі знань.Внутрішня інтерпретованість (поіменованість) — кожна інформаційна одиниця повинна мати унікальне ім’я, по якому її знаходять. Крім самих інформаційних одиниць в базі знань має зберігатися їх опис (метадані). В даний час СКБД забезпечують реалізацію внутрішньої інтерпретованості. Структурованість — повинна існувати можливість довільного встановлення відносин типу «частина — ціле», «рід — вид» чи «елемент — клас» між окремими інформаційними одиницями.Зв’язність — між інформаційними одиницями повинна бути передбачена можливість встановлення зв’язків (відносин) різного типу. Семантика відносин може носити декларативний чи процедурний характер. Наприклад, декларативні відносини: «одночасно», «причина — наслідок», «бути поруч». Якщо між двома інформаційними одиницями встановлене відношення «аргумент — функція», то воно характеризує процедурне знання, зв’язане з обчисленням визначених функцій. Також розрізняють відносини структуризації, функціональні, каузальні і семантичні відносини. За допомогою перших задаються ієрархії інформаційних одиниць, другі несуть процедурну інформацію, що дозволяє знаходити (обчислювати) одні інформаційні одиниці через інші, треті задають причинно-наслідкові зв’язки, четверті відповідають всім іншим відносинам. Семантична метрика — на множині інформаційних одиниць у деяких випадках корисно задавати відношення, що характеризує ситуаційну близькість інформаційних одиниць, тобто силу асоціативного зв’язку між інформаційними одиницями. Його можна було б назвати відношенням релевантності для інформаційних одиниць. Відношення релевантності при роботі з інформаційними одиницями дозволяє знаходити знання, близькі до вже знайденого. Активність — з моменту появи ЕОМ і поділу використовуваних у ній інформаційних одиниць на дані і команди створилася ситуація, при якій дані пасивні, а команди активні. Усі процеси, що протікають в ЕОМ, ініціюються командами, а дані використовуються цими командами лише в разі потреби. Для ІС ця ситуація не прийнятна. Як і в людини, в ІС актуалізації тих чи інших дій сприяють знання, що маються в системі. Таким чином, виконання програм у ІС повинно ініціюватися поточним станом інфор-маційної бази. Поява в базі фактів чи описів подій, встановлення зв’язків може стати джерелом активності системи [6].
Сукупність засобів, що забезпечують роботу зі знаннями, утворює систему керування базою знань (СКБЗ).
В даний час не існує систем керування базами знань, у яких повною мірою були б реалізовані вищеописані вимоги до представлення знань.
Системою представлення знань (СПЗ) називають засоби, що дозволяють описувати знання про предметну область за допомогою мови представлення знань, організовувати збереження знань у системі (нагромадження, аналіз, узагальнення й організація структурованості знань), вводити нові знання і поєднувати їх з наявними, виводити нові знання з наявних, знаходити необхідні знання, усувати застарілі знання, перевіряти несуперечність накопичених знань, здійснювати інтерфейс між користувачем і знаннями.
Центральне місце в СПЗ займає мова представлення знань (МПЗ). Можливості МПЗ визначаються моделлю представлення знань, що покладена в її основу (іноді ці поняття ототожнюють). 2.2. Моделі представлення знань
Модель представлення знань є формалізмом, покликаним відобразити статичні і динамічні властивості предметної об-ласті (ПО), тобто відобразити об’єкти і відносини ПО, зв’язки між ними, ієрархію понять ПО і зміну відносин між об’єктами.
Модель представлення знань може бути універсальною (застосовною для більшості ПО) чи спеціалізованою (розробленою для конкретної ПО). Найчастіше використовуються наступні основні універсальні моделі представлення знань:
семантичні мережі;
фрейми;
логічні моделі;
продукційні системи й інші.
Семантичні мережі. Мережні моделі формально можна задати у вигляді H = <І, C1, C2, ..., Cn, Г> де І — множина інформаційних одиниць; C1, C2, ..., Cn — множини типів зв’язків між інформаційними одиницями; Г задає зв’язки між інформаційними одиницями, що входять в І, з заданого набору типів зв’язків. Залежно від типів зв’язків, що використовуються у моделі, розрізняють: класифікуючі мережі, функціональні мережі і сценарії. У класифікуючих мережах використовуються відносини структуризації. Такі мережі дозволяють у базах знань вводити різ-ні ієрархічні відносини між інформаційними одиницями. Функціональні мережі характеризуються наявністю функціональних відносин. Їх часто називають обчислювальними моделями, тому що вони дозволяють описувати процедури «обчислень» одних інформаційних одиниць через інші. У сценаріях використовуються каузальні відносини, а також відносини типів «засіб — результат», «знаряддя — дія» і т. п. Якщо в мережній моделі допускаються зв’язки різного типу, то її називають семантичною ме-режею. Фреймові моделі. На відміну від моделей інших типів у фрей-мових моделях фіксується тверда структура інформаційних одиниць, що називається протофреймом. У загальному випадку вона виглядає в такий спосіб: (Ім’я фрейму: Ім’я слота 1 (значення слота 1)Ім’я слота 2 (значення слота 2). . . . . . . . . . . . . . . . . . . . . Ім’я слота N (значення слота N)).Значенням слота може бути практично що завгодно: числа чи математичні співвідношення, тексти природною мовою чи програми, правила виведення чи посилання на інші слоти даного фрейму чи інших фреймів. Як значення слота може виступати також набір слотів більш низького рівня. Фрейму і слотам присвоюють конкретні імена і заповнюють слоти. Таким чином, із протофреймів будують фрейми-екземп-ляри. Наведемо приклад протофрейма:(Список працівників: Прізвище (значення слота 1);Рік народження (значення слота 2);Спеціальність (значення слота 3);Стаж (значення слота 4)).
Фрейм — екземпляр може мати наступний вигляд:(Список працівників: Прізвище (Попов — Сидоров — Іванов — Петров);Рік народження (1965—1946—1925—1937);Спеціальність (слюсар — токар — токар — сантехник);Стаж (5—20—30—25)).Зв’язки між фреймами задаються значеннями спеціального слота з ім’ям «Зв’язок». Логічні моделі. В основі моделей такого типу лежить формаль-на система, що задається четвіркою виду: M = <T, P, A, B>. Множина T є множиною базових елементів різної природи, наприклад слів з деякого обмеженого словника, деталей дитячого конструктора, що входять до складу деякого набору і т.п. Важливо, що для множини T існує деякий спосіб визначення належності чи неналежності довільного елемента до цієї множини. Процедура такої перевірки може бути будь-яка, але за кінцеве число кроків вона повинна давати позитивну чи негативну відповідь на питання, чи є x елементом множини T. Позначимо цю процедуру П(T). Множина P є множиною синтаксичних правил. За ними з елементів T утворюють синтаксично правильні сукупності. Наприклад, зі слів обмеженого словника будуються синтаксично правильні фрази, з деталей дитячого конструктора за допомогою гайок і болтів збираються нові конструкції. Декларується існування процедури П(P), за допомогою якої за кінцеве число кроків можна одержати відповідь на питання, чи є сукупність X синтаксично правильною. У множині синтаксично правильних сукупностей виділяється деяка підмножина A. Елементи A називаються аксіомами. Як і для інших складових формальної системи, повинна існувати процедура П(A), за допомогою якої для будь-якої синтаксично правильної сукупності можна одержати відповідь на питання про належність її до множини A. Множина B є множиною правил виведення. Застосовуючи їх до елементів A, можна одержувати нові синтаксично правильні сукупності, до яких знову можна застосовувати правила з B. Так формується множина виведених у даній формальній системі сукупностей. Якщо мається процедура П(B), за допомогою якої можна визначити для будь-якої синтаксично правильної сукупності, чи є вона виведеною, то відповідна формальна система називається розв’язною. Саме правила виведення є найскладнішою складовою формальної системи. Для знань, що входять у базу знань, можна вважати, що множину A утворять всі інформаційні одиниці, що введені в базу знань, а за допомогою правил виведення з них виводяться нові похідні знання. Продукційні моделі. У загальному випадку під продукцією розуміється вираз наступного виду: (і); Q; P; AЮВ; N, де і — ім’я продукції, за допомогою якого дана продукція виділяється з усієї множини продукцій; Q — характеризує сферу застосування продукції; AЮB — ядро продукції, — інтерпретація ядра продукції може бути різною, зазвичай воно читається: ЯКЩО А, ТО В; Р — умова застосовності ядра продукції, зазвичай Р є логічним виразом (предикат) — коли Р приймає значення «істина», ядро продукції активізується, якщо Р «не істина», то ядро продукції не може бути використане; N — описує післяумови продукції — дії і процедури, які необхідно виконати лише в тому випадку, коли ядро продукції реалізувалося. Якщо в пам’яті системи зберігається деякий набір продукцій, то вони утворюють систему продукцій. У системі продукцій повинні бути задані спеціальні процедури керування продукціями, за допомогою яких відбувається актуалізація продукцій і вибір для виконання тієї чи іншої продукції з числа актуалізованих.
2. Типи систем, основаних на знаннях
Велике різноманіття систем, основаних на знаннях, що існують на даний час, можна прокласифікувати за різними ознаками:1) За способом використання:
індивідуального використання;
колективного використання.
2) За рівнем автоматизації процесів керування знаяннями:
інформаційні системи знань;
інструментальні засоби керування знаннями;
динамічні системи знань.
Інформаційні системи знань (ІKS) зазвичай зберігають знання та керують ними на основі підходу «про всяк випадок потрібно». Знання збираються та в довільній формі зберігаються з тим, що, можливо, вони знадобляться комусь в майбутньому. Типові приклади таких систем: Дані соціологічних досліджень (Case study), бази даних досвіду (Experiens), бази даних кращих практик (Best Practice), каталоги експертів (Expert Diectories) тощо.Інструментальні засоби керування знаннями (KMT) — використовують інформацію і знання, що уже збережені, щоб відповісти на питання, стимулювати розуміння, і навіть визначити місце розташування поки ще недоступного знання. Типові приклади включають: засоби пошуку, портальні додатки і інші засоби філь-трування інформації чи знань.Динамічні системи знань (DKS) — системи, що виявляють за ви-могою, «у контексті», своєчасну та доречну інформацію і знання від людей, коли це необхідно, фіксують їх, а також дозволяють видавати їх у відповідь на ідентифіковану потребу, спільно використовувати існуючі знання і забепечують створення нових знань. Як приклади цього виду систем можна навести деякі типи інстру-ментальних засобів співробітництва, а також деякі спеціалізовані системи керування знаннями.3) За використовуваними технологіями:
системи, основані на Інтернет-порталах;
системи, основані на системах електронного документообігу;
системи, що використовують Text Mining (аналітичні системи) або Data Mining.
На сьогоднішній день компанії-виробники програмного забезпечення пропонують рішення для керування знаннями в яких у тій чи іншій мірі можуть бути поєднані вищевказані основні технології.5.2. Використання порталівдля керування знаннямиПортали знань підприємства (enterprіse knowledge portal — EKP) на сьогодні надзвичайно популярні в Іnternet. Корпоративний портал може вирішувати декілька задач, актуальних з точки зору керування знаннями:
Забезпечення співробітників необхідною інформацією.
Забезпечення контактів з необхідними людьми.
Тобто на порталі може бути здійснене не лише відповідне представлення, каталогізація знань, надання можливості пошуку необхідної інформації, але й можливість персонального обміну знаннями. Слід зазначити, що критичним моментом використання порталу для керування знаннями є каталогізація знань. Тому з цією метою можуть використовуватися спеціалісти, на яких покладатимуться функції категоризації (всі подібні документи повинні мати одну категорію), створення професійного тезаурусу в процесі каталогізації та пошуку потрібних документів. Технологічні можливості, використовувані на порталі, можуть в значній мірі відрізнятися залежно від потреб компанії. Як приклади компаній, що використовують корпоративні портали для керування знаннями, можна навести міжнародні консалтингові компанії, траснаціональні концерни (Shell, Motorola, Ge-neral Motors), гіганти ІТ-індустрії (ІBM, Compaq, Dell, Oracle, SAP). Систематизовані знання з великих сховищ передового досвіду доступні співробітникам цих фірм із будь-якої точки світу і їхні менеджери та фахівці мають можливість у потрібний момент «підглянути» успішний досвід своїх колег з різних галузей і підрозділів, а також зв’язатися з визнаними експертами з конкретної предметної області. Існує велике різноманіття програмних продуктів від різних розробників, зокрема розробників groopware, які підтримують створення порталів знань підприємств. Як приклади, можна назвати рішення від компаній Lotus, Mіcrosoft, а також Hummіng-bіrd (див. п. 5.3).Продукти Lotus для керування знаннямиПрограма компанії Lotus (http://www.lotus.com) Knowledge Dіscovery System (KDS) направлена на те, щоб засобами Іnternet-технологій утворювати віртуальне середовище, де можна здійснювати пошук експертів, носіїв знань і тих документів, у яких корпоративні знання відбиті з найбільшою повнотою.Lotus Knowledge Dіscovery System реалізує формулу керування знаннями «люди, місця й інформація» (People, Places and Thіngs). Як «місця» використовуються портали знань і спільної роботи, а під «інформацією» маються на увазі засоби каталогізації контенту. У своєму нинішньому вигляді KDS складається з двох компонентів: портал знань Lotus K-statіon і сервер керування знаннями Lotus Dіscovery Server. Lotus K-statіon — корпоративний портал знань, що забезпечує засоби створення індивідуальних профілів (віртуальних робочих місць), засоби керування персональними даними й інфор-мацією. Lotus Dіscovery Server збирає, аналізує, класифікує структуровану і неструктуровану інформацію для виявлення зв’язків між змістом, людьми, темами і користувачами в організації. Серед ключових можливостей сервера:
візуальний пошук знань. Пошук і перегляд інформації та даних про експертів за допомогою простої у роботі інтегрованої кар-ти знань. Можна одночасно переглядати інформацію про документи, людей, місця, категорії і їхні взаємозв’язки;
пошук повних відповідей. Ефективний пошук у всій інтрамережі і за її межами, включаючи пошук на Web-сайтах, у системах типу back-end, у додатках Lotus Domіno і багатьох інших міс-цях. Упорядкування результатів пошуку по релевантності;
пошук експертів. Можна з’ясувати, хто є експертом у конкретній області, одержуючи цю інформацію у вигляді профілю інтересів, навичок і досягнень;
автоматичне створення і відновлення карти знань і профілів експертів.
Dіscovery Server виконує також Knowledge Audіt — аудит знань — перегляд і ранжування документів по частоті звертань. Основна увага в рішенні компанії Lotus, таким чином, приділена організації групової роботи й обміну інформацією між співробітниками. Платформа керування знаннями Mіcrosoft.Як зазначається на сайті компанії Mіcrosoft (www.microsoft.com), щоб зробити можливим керування знаннями, необхідно мати дві базові системи:
систему спільної роботи й обміну повідомленнями;
корпоративну інтрамережу.
Головні задачі системи керування знаннями пропонується вирішувати на основі наступних продуктів:
організація спільної роботи — Offіce 2000 і Exchange Server;
керування вмістом — Exchange, Mіcrosoft Sіte Server і Offіce;
аналіз — Mіcrosoft Access і Mіcrosoft Excel, Mіcrosoft OLAP Servіces;
збір, пошук і доставка — Sіte Server 3.0;
відстеження і документообіг — агенти папок і об’єкти мар-шрутизації Exchange.
Конкурентом Exchange Server як засобу організації спільної роботи може бути також Microsoft SharePoint Portal Server (MS SPP Server), який дозволяє створити універсальний корпоративний портал, є засобом керування та маршрутизації документів і могутньою пошуковою машиною. У ньому реалізовані практично усі функції Exchange, крім поштового сервера. Основна увага в підході Microsoft до керування знаннями зосереджена на керуванні документами та їх пошукові.5.3. Спеціалізовані системи керуваннязнаннями від світових лідерівСеред світових лідерів в галузі розробки спеціалізованих систем керування знаннями можна назвати компанії: Hummіngbіrd (http://www.hummіngbіrd.com), Convera (раніше Excalіbur, http://www.convera.com, http://www.convera.su/ru/), Cognіtіve Technolo-gіes (http://www.cognіtіve.ru). Розглянемо основні особливості пропонованих ними систем./Продукти Hummіngbіrd (http://www.hummіngbіrd.com) по керуванню документами і знаннями підтримують широкий спектр апаратно-програмних платформ, роботу з різними джерелами даних (включаючи web-контент) і більш ніж 200 форматами документів. Ці продукти доступні на 20 різних мовах (включаючи російську), що значно перевершує можливості всіх інших поста-чальників. На сьогодні більш ніж 5000 організацій в усьому світі використовують продукти Hummіngbіrd для керування своїми інтелектуальними активами. Усі продукти компанії Hummіngbіrd цілком інтегровані в стратегію корпоративного інформаційного порталу (див. п. 5.2). Логіка роботи з корпоративним порталом полягає в наступному. Користувач за допомогою броузера звертається до HTML-сервера, через який виконується доступ до внутрішньокорпоративних і зовнішніх ресурсів (рис. 5.2). При цьому у вузькому лівому вікні екрана розміщається ієрархічний зміст доступних засобів, а праве є вікном для інформаційного обміну. Склад засо-бів, підтримуваних даним порталом: системи керування докумен-тами (CyberDOCS, Documentum і ін.), поштові служби (Lotus Notes, MS Exchange), ERP-системи (SAP R/3), системи керування знаннями (Fulcrum), а також різноманітні сховища даних і OLAP-системи. Ознайомитись з можливостями Hummingbird EIP можна за адресою http://eip.hummingbird.com//Рис. 5.2. Корпоративний портал від Hummіngbіrd Користувач може також створювати власні папки, у яких він формує свої індивідуальні інтерфейси для інтерактивного спілкування з зовнішніми ресурсами (у тому числі і Web-серверами). Це досягається за допомогою спеціальних програмних компонентів E-Clіp, що забезпечують взаємодію порталу з конкретними ресурсами і додатками, а також набору для розробника E-CLІ Developer Kіt, за допомогою якого можна створювати власні програми. Реалізована підтримка обміну знаннями між співробітниками щодо загального списку «обраних» Web-ресурсів — користувач у будь-який момент може поставити оцінку корисності конкретного сервера і записати свої коментарі. Таким чином, співробітник може орієнтуватись в цих ресурсах, спираючи на думку своїх колег. Клієнт може також запустити механізм фонового опитування й індексації цікавлячих його серверів із різноманітними варіантами автоматичної фільтрації й обробки одержуваних даних. Технології Fulcrum у даний час реалізовані в двох основних продуктах: SearchServer 5.0 і KnowledgeServer 4.0. SearchServer — реалізує функції індексування і пошуку текстової інформації з застосуванням паралельної обробки даних, що служить ядром усього сімейства. Даний продукт призначений у першу чергу для вбудовування в різні користувацькі додатки. Од-нак у нього є і користувацький інтерфейс, що забезпечує перегляд документів за допомогою засобу Fulcrum FullVіew. Технологія повнотекстового пошуку Fulcrum WordSense, основана на семантичних мережах, автоматично перетворює запити на природних мовах у логічну розширену форму. Архітектура даних SearchServer нагадує реляційну базу даних, де інформація структурується за допомогою таблиць, кожен рядок у яких відповідає документу чи об’єкту. Однак на відміну від традиційних СУБД SearchServer не зберігає документи у своїх таблицях фізично, створюючи лише їхній індекс. Адміністрування виконується за допомогою графічного засобу SearchServer Ad-mіnіstrator. Тобто, інформація з різних джерел не завантажується в спеціальну «систему керування знаннями», а навпаки, на мережу джерел накладається єдина інформаційно-пошукова система, що забезпечує прозорий пошук і категоризацію документів. Для взаємодії з додатками незалежних розробників існує програмний інтерфейс спеціальною мовою запитів SearshSQL, реалізований на базі протоколів ODBC і JDBC. Для макетування, розробки і розгортання рішень на базі SearchServer можна викорис-товувати інструмент SearchBuіlder, сумісний з такими популярними середовищами, як Vіsual Basіc, Vіsual C++ і Java. KnowledgeServer — продукт, що вирішує наступні основні завдання:
наскрізний пошук інформації з безлічі джерел даних незалежно від їхнього формату;
інтуїтивний пошук документів, аналогічних заданому шаблону;
представлення всіх інформаційних ресурсів підприємства у виді єдиного систематизованого ієрархічного змісту (Enterprіse Table of Contents);
автоматичне відстеження надходження нових документів по заданих темах за допомогою спеціальних агентів — ProActіve Agents;
автоматичне створення анотацій і категоризація документів.
Масштабована архітектура допускає використання декількох серверів Fulcrum, до яких підключені як робочі місця клієнт-серверного ПО, так і «тонкі» клієнти на основі Web-броузера. Працює сервер Fulcrum у середовищі Wіndows NT, але може також звертатися до даних, розташованим на інших платформах, таких як UNІХ./Для керування знаннями, представленими в текстовому вигляді, компанія Convera (http://www.convera.com, http://www.convera.su/ru/) пропонує програмний продукт RetrіevalWare (RW) з набором додаткових сервісних програм. Сімейство продуктів RW забезпечує пошук, аналіз і виділення інформації за допомогою задання користувачем пошукових запитів природною мовою до інформації, що зберігається як у неструктурованому вигляді так і формалізованих базах даних, розташованої як у локальній мережі організації, так і в мережі Іnternet. Серед основних переваг RW наступні: 1. У RW реалізована можливість асоціативного пошуку на основі семантичної мережі. При цьому можна використовувати кіль-ка семантичних мереж одночасно. Кожен користувач може створювати свої власні семантичні мережі на додаток до загальних. Таким чином забезпечується висока точність витягу інформації і автоматичне знаходження документів (чи записів в БД) не тільки по термінах заданих у запиті, але і по інших термінах, зв’язаним за змістом із заданим. 2. У RW реалізована технологія «нечіткого» пошуку, що дозволяє знаходити інформацію не на основі точного збігу запиту з даними, а на ступені подібності запиту із вмістом у джерелах інформації. 3. RW має можливість включати в єдиний пошуковий простір як інформацію, збережену у файловій системі, так і в СУБД (Oracle, MS SQL, Sybase, Іnformіx, Teradata, ODBC DBS), поштових і корпоративних системах (MS Exchange, Lotus) і системах документообігу (StaffWare, Documentum, FіleNet Panagon). RW забезпечує користувачу перегляд документів більш ніж у 250 фор-матах, серед яких як широко відомі: doc, rtf, txt, pdf, html, так і специфічні формати, наприклад, формати САПР (dxf, dwg). В останній версії RW реалізована можливість пошуку інформації в архівах (ZІР, ...). Система фільтрації, що працює з використанням технології компанії «Outsіde Іn», забезпечує користувачу перегляд документів у їхньому рідному форматі. За допомогою RW можна організовувати доступ і індексувати віддалені сховища даних. Розвинута система безпеки, що успадковує властивості безпеки джерел інформації, у сукупності з Web-технологією дозволяє використовувати RW як засіб для створення територіально розподілених автоматизованих систем. 4. У RW реалізована можливість динамічної рубрикації всієї інформації, що надходить, на основі запитів, створених користувачами. Таким чином, значно скорочується час ознайомлення з новою інформацією, тому що вона надається користувачу в струк-турованому виді, тобто попередньо розкладеною по рубриках. 5. У RW реалізована функція крос-мовного пошуку. Користувачу досить задавати питання рідною мовою, система на основі встановленої відповідності семантичних мереж для різних мов, повертає документи на інших мовах. В даний час проводяться роботи зі створення українського семантичного сервера. 6. RW може автоматично витягати атрибути з текстових документів визначеної структури і поміщати їх у СКБД (створювати формуляри для документів). 7. RW має необмежені можливості масштабування як по обсягах оброблюваної інформації, так і по кількості оброблюваних запитів. 8. RW має додаткові сервісні програми:
RW FіleRoom — для забезпечення роботи з паперовими архівами;
RW Іnternet Spіder — для пошуку в визначених областях Інтернет та Інтранет;
RW WebExpress — для обслуговування провайдерів, забезпечення пошуку по вмісту веб-сайта й електронної торгівлі через Інтернет;
RW CDExpress — для створення портативних баз даних на компакт-дисках, що містять пошуковий механізм RW;
ScreenіngRoom (SR) — засоби керування відео архівом, окрім візуального пошуку дозволяє виділяти з відеозображень текст, що відповідає субтитрам чи телетексту і перетворювати в текст супровідну аудіодоріжку;
RetrіevalWare SDK і Vіsual RetrіevalWare SDK — засоби для системних інтеграторів і розробників програмних систем, що використовують рішення компанії Convera — дозволяють розробляти додатковий функціонал до RW для забезпечення рішення задач конкретної організації.
Серед користувачів продукції компанії «Convera»: уряди — Росії, США, Великобританії, Ізраїлю, Польщі, Чехії, Угорщини і Швеції; патентні відомства — Швейцарії, Англії, США, Узбекистану і Росії (ФИПС); світові банки — Worldbank, ЦБ Росії, Внешторгбанк Росії, Swіss Bank; найбільші організації — НК «Юкос», «Лукойл-Пермь», NASA, Авіа космічний центр Росії, Boeіng Com-pany, General Electrіc, Іntel, Ford Motor Company, AUDІ; ЗМІ — CNN, «The Fіnancіal Tіmes», «Медіа Міст», «ABC News»; фінансові компанії — Vіsa Іnternatіonal. Усього більше 5000 компаній, організацій і підприємств, розташованих у всіх країнах світу.
Висновок
Всі процеси керування знаннями можуть бути в тій чи іншій мірі підтримані інформаційними технологіями.Вибір тих чи інших технологій залежить від конкретної організації, вже наявних в ній інформаційних систем та задач, які необхідно вирішувати.На сьогодні організаціями застосовується широкий спектр інформаційних систем, які поодинці чи у певному поєднанні дозволяють керувати знаннями
Література
Інтернет – ресурси:
http://ubooks.com.ua/books/000275/inx19.php 02.02.2011