Міністерство освіти України
Національний університет “Львівська політехніка”
кафедра “Інформаційні системи та мережі”
КУРСОВА РОБОТА
з курсу
“Системи штучного інтелекту”
на тему: Представлення знань за допомогою фреймів
________________________________________
________________________________________
________________________________________
Виконав: ст. гр. ФЛ-4__
_____________________
Прийняв:
_____________________
Львів – 2010
Національний університет “Львівська політехніка”
Інститут комп’ютерних наук та інформаційних технологій
Кафедра “Інформаційні системи та мережі”
ЗАВДАННЯ
на курсову роботу студентові
_________________________________________________
(прізвище, ім”я, по батькові)
1.Тема роботи______________________________________________________________
2. Термін здачі студентом курсової роботи __________
3. Вихідні відомості до проекту (роботи) ________________________________________________
4. Зміст пояснювальної записки (перелік питань, які належить розробити) __________________________________________________________________________
5. Перелік Ґрафічного матеріалу.______________________________________________
6. Дата видачі завдання ____________________
Керівник ___________________ (підпис керівника).
Завдання прийняв _____________(підпис студента)КАЛЕНДАРНИЙ ПЛАН
Студент Підпис
Керівник роботи Підпис
Зміст
TOC \o "1-3" \h \z \u HYPERLINK \l "_Toc252890524" Зміст PAGEREF _Toc252890524 \h 4
HYPERLINK \l "_Toc252890525" Вступ PAGEREF _Toc252890525 \h 6
HYPERLINK \l "_Toc252890526" Аналітичний огляд літературних та інших джерел — електронні публікації, матеріали Internet тощо PAGEREF _Toc252890526 \h 7
HYPERLINK \l "_Toc252890527" Концепція фреймів PAGEREF _Toc252890527 \h 7
HYPERLINK \l "_Toc252890528" Основна структура фрейму PAGEREF _Toc252890528 \h 8
HYPERLINK \l "_Toc252890529" Фреймові концепції PAGEREF _Toc252890529 \h 9
HYPERLINK \l "_Toc252890530" Інші дослідницькі напрями PAGEREF _Toc252890530 \h 11
HYPERLINK \l "_Toc252890531" Представлення знань PAGEREF _Toc252890531 \h 15
HYPERLINK \l "_Toc252890532" Основні властивості знань. Їх відмінність від даних PAGEREF _Toc252890532 \h 19
HYPERLINK \l "_Toc252890533" Внутрішня інтерпретованість знань PAGEREF _Toc252890533 \h 19
HYPERLINK \l "_Toc252890534" Внутрішня структура зв’язків (структурованість) PAGEREF _Toc252890534 \h 20
HYPERLINK \l "_Toc252890535" Наявність ситуативних зв’язків (зовнішня структура зв’язків) PAGEREF _Toc252890535 \h 22
HYPERLINK \l "_Toc252890536" Шкалювання PAGEREF _Toc252890536 \h 22
HYPERLINK \l "_Toc252890537" Занурення в простір із семантичної метрикою PAGEREF _Toc252890537 \h 23
HYPERLINK \l "_Toc252890538" Наявність активності знань PAGEREF _Toc252890538 \h 23
HYPERLINK \l "_Toc252890539" Напрямки сучасної комп’ютерної технології опрацювання знань PAGEREF _Toc252890539 \h 24
HYPERLINK \l "_Toc252890540" Поняття про фрейм, його структуру та властивості PAGEREF _Toc252890540 \h 25
HYPERLINK \l "_Toc252890541" Виведення на фреймах PAGEREF _Toc252890541 \h 29
HYPERLINK \l "_Toc252890542" Системний аналіз об’єкту дослідження, предметної області PAGEREF _Toc252890542 \h 32
HYPERLINK \l "_Toc252890543" Фрейми PAGEREF _Toc252890543 \h 32
HYPERLINK \l "_Toc252890544" Структура фрейма PAGEREF _Toc252890544 \h 35
HYPERLINK \l "_Toc252890545" Базові елементи фреймів PAGEREF _Toc252890545 \h 36
HYPERLINK \l "_Toc252890546" Основний матеріал PAGEREF _Toc252890546 \h 38
HYPERLINK \l "_Toc252890547" Фреймові моделі PAGEREF _Toc252890547 \h 38
HYPERLINK \l "_Toc252890548" Конкретизація, ієрархія та наслідування фреймів PAGEREF _Toc252890548 \h 39
HYPERLINK \l "_Toc252890549" Поповнення первинних описів на основі фреймових моделей PAGEREF _Toc252890549 \h 39
HYPERLINK \l "_Toc252890550" Приєднані процедури і демони PAGEREF _Toc252890550 \h 41
HYPERLINK \l "_Toc252890551" Типові структури фреймів PAGEREF _Toc252890551 \h 41
HYPERLINK \l "_Toc252890552" Зв’язок між семантичними мережами та фреймами PAGEREF _Toc252890552 \h 42
HYPERLINK \l "_Toc252890553" Мережі подібностей та відмінностей PAGEREF _Toc252890553 \h 42
HYPERLINK \l "_Toc252890554" Сценарії PAGEREF _Toc252890554 \h 43
HYPERLINK \l "_Toc252890555" Фрейми і об’єктно-орієнтовне програмування PAGEREF _Toc252890555 \h 44
HYPERLINK \l "_Toc252890556" Поняття про мову UML PAGEREF _Toc252890556 \h 46
HYPERLINK \l "_Toc252890557" Правила продукцій PAGEREF _Toc252890557 \h 46
HYPERLINK \l "_Toc252890558" Задачі керування PAGEREF _Toc252890558 \h 50
HYPERLINK \l "_Toc252890559" Висновки PAGEREF _Toc252890559 \h 56
HYPERLINK \l "_Toc252890560" Перелік використаних літературних джерел PAGEREF _Toc252890560 \h 57
HYPERLINK \l "_Toc252890561" Додатки PAGEREF _Toc252890561 \h 62
Вступ
Фрейм (англ. frame — «каркас», «рамка») — це структура, що описує деякий складний об'єкт або абстрактний образ або модель для представлення деякої концепції (стереотип сприйняття). Модель містить слоти, визначені фасетами. З такої моделі певної концепції нічого не можна забрати, атрибути моделі можна лише заповнити. Загальну ідею фреймового способу подання знань сформулював Марвін Мінський (англ. Marvin Minsky) стосовно зорового сприйняття об'єктів. За визначенням М. Мінського, фреймом є один з перспективних видів об'єкта сприйняття, який можна формально представити деякою структурою у вигляді графа. Верхня вершина такого графа відповідає найменуванню об'єкта, а підпорядковані вершини — елементам цього об'єкта, що їх видно спостерігачеві з певної точки. Зміна положення об'єкта відносно спостерігача призводить до формування інших фреймів, оскільки видимими тут можуть бути інші елементи. За думкою автора, елементи, які стають при цьому невидимими, не зникають з пам'яті, а запам'ятовуються, що відображається і в формальному записі нових фреймів. Це має вираз в тому, що між такими елементами та найменуваннями нових фреймів встановлюється зв'язок з поміткою про те, він є неявним. В результаті ті самі елементи можуть повторюватися в різних фреймах. Запропонована автором форма запису фреймів дозволяє не дублювати такі елементи, а використовувати їх як спільні термінали для певної групи фреймів. Група фреймів, що пов'язані між собою, утворює систему.
За уявленням М. Мінського, у довгостроковій пам'яті людини зберігається великий набір систем фреймів, що використовуються, наприклад, під час розпізнання людиною зорових образів. З цією метою в пам'яті активується такий фрейм (або система), який найбільше відповідає гіпотезі про об'єкт сприйняття, що й забезпечує високу швидкість його розпізнання та осмислення.
Така уява про фрейми отримала в подальший розвиток та інтерпретацію. Фрейм зараз, як правило, ототожнюється зі стандартною, стереотипною ситуацією, що включає деяку множину конкретних однорідних ситуацій. Залежно від класу ситуацій розрізняють фрейми візуальних образів, фрейми-сценарії, семантичні фрейми і т. ін.
Аналітичний огляд літературних та інших джерел — електронні публікації, матеріали Internet тощо
Концепція фреймів
Цю категорію було введено в 1974 році М. Мінським, відомим дослідником в галузі штучного інтелекту. Концепція фреймів формувалася у контексті відомого Стенфордського Проекту створення інтегрального робота «око-рука», де фрейм мислився як знаряддя для моделювання процесу сцен з дійовими особами, супутніми предметами, фоном тощо. Фрейми означали стереотипні, еталонні сцени, добре відомі людині з життєвого досвіду або спеціальних знань, під які можна було підводити нові, близькі до них сцени, щоб у такий спосіб розпізнавати структуру нових сцен та ситуацій.
Фрейм, за визначенням М. Мінського, є ієрархічно впорядкованою репрезентацією певної стандартної ситуації дійсності. У формальній нотації він може бути представлений у вигляді графової структури, де головна позначає об'єкт (наприклад, «кімната»), а підпорядковані вершини-елементи цього об'єкта, які можна спостерігати з певних позицій . Вважається, що у довгостроковій пам'яті людини зберігається великий набір різноманітних фреймів, що актуалізуються під час пред'явлення нових сцен. Для розпізнавання сцен в пам'яті людини має актуалізуватися саме той фрейм, що якнайбільше відповідає гіпотезі про об'єкт, який сприймається. У такий спосіб здійснюється ідентифікація об'єкта у свідомості людини. Наприклад, інтелектуальна система, що використовує фрейм «кімнати», має змоделювати здатність людини, що входить до кімнати, охопити все єдиним поглядом, скласти уявлення про те, що є у кімнаті, як розставлені меблі, скільки у кімнаті вікон тощо.
Фрейм репрезентує у свідомості людини (або у її комп'ютерній моделі) не лише стереотипну ситуацію, але водночас і зв'язки цієї структури з деякими іншими видами інформації, зокрема, з інформацією про те, як користуватися фреймом та що слід робити, коли сподівання не виправдовується. Один із провідних дослідників у галузі штучного інтелекту Р. Шенк наголошував, що «винахід фрейму» став справжньою сенсацією для штучного інтелекту; ця структура виявилася надзвичайно важливою не тільки для вирішення проблеми розпізнавання візуальних образів, але майже одразу для створення моделей розуміння природної мови.
Основна структура фрейму
Структура фрейму включає три основні типи даних; поняття (назва фрейму), характеристика (назва термінала—вершини нижнього рівня), значення характеристики (заповнювач термінала). У зв'язку з цим можна вважати, що у фреймі реалізовано деякі загальні принципи, що властиві організації без даних, де як одиниці виділяються об'єкти, характеристики та їхні значення, а також семантичним сіткам, у яких розрізняють абстрактний та конкретний рівень. Фрейм надає засоби організації знань у слотах , що містять характеристики та структури. В моделі фрейму—це щось на зразок схеми з категоріями і під категоріями. Фрейм—це абстрактний образ для представлення деякого стереотипу сприйняття. Наприклад, згадування слова «кімната» породжує у слухачів образ кімнати: житлове приміщення з чотирма стінами, стелею, підлогою, вікнами та дверима, площею приблизно 6—20 м².
В теорії фреймів такий образ кімнати називають фреймом кімнати, фреймом також називають і формалізовану модель для представлення образу. З такої моделі не можна нічого забрати, але є можливість заповнення певних дірок в атрибутах, таких, як кількість вікон, колір стін, висота стелі, покриття підлоги та інше. Розрізняють фрейми—взірці або прототипи, які зберігаються в базі даних, та фрейми—екземпляри, котрі створюють для відображення фактичних ситуацій на основі даних, що надійшли. Модель фрейму є достатньо універсальною, оскільки дозволяє відобразити все різноманіття знань через фрейми структури, які використовуються для позначень об'єктів та понять (позика, заклад, вексель); ролей (менеджер, касир, клієнт); сценаріїв (банкротство, зібрання акціонерів, святкування уродин); ситуацій (тривога, аварія, робочий режим пристрою) і т. д.
Ігор мавпа дитина
Це є Людина Дитина Примат
Стать Чоловік Чоловік Чоловік або жінка
Вік Менше 12 років 8 років Ціле число
Місце проживання Де небудь вул.Руська 3 Джунглі
Останнім часом спектр застосування концепції фреймів суттєво розширений: до нього увійшли лінгвістична семантика, когнітивна теорія метафори, прикладна семіотика, теорія репрезентації ментальних станів та дій тощо.
Особлива чутливість до концепції фреймів та успішна асиміляція цієї концепції в лінгвістиці пояснюється тим, що по суті фрейм не є для неї абсолютно новим поняттям. Прямими аналогами або лінгвістичними прообразами такої концепції можна вважати ті лінгвістичні напрями, що займаються відмінковими «рамками» дієслів. Це насамперед відома «глибинно-відмінкова граматика» (Ч. Філлмор), а також концепція ситуаційно-рольового тлумачення лексичних значень та тематичних груп (Ю. Д. Ампресян, О. К. Жолковський, Ю.С. Мартем'янов, В. Ю. Розенцвейг, Ю. К. Щеглов та інші); теорія семантичних полів Й. Трира, концепція репрезентації певних типів лексичних значень мовою думок Lingua mentalis А. Вежблицької тощо. Найбільш значні теоретичні та прикладні результати дає використання фреймів для розроблення систем розуміння природної мови.
Серед теоретичних результатів варто насамперед згадати запропоновану Ч. Філлмором концепцію двох семантик, що спирається на використання фреймів.
Фреймові концепції
Аналізуючи роль фреймів у моделюванні розуміння природної мови, Ч. Філлмор розрізнює дві семантики: семантику, орієнтовану на розуміння (Р-семантику), та семантику, орієнтовану на визначення істинності висловлювань (І-семантику). При цьому Р-семантика оперує поняттям інтерпретуючого опису семантики лексем, граматичних категорій та тексту. Найбільш «концентроване» застосування фрейм знаходить у теорії розуміння Ч. Філлмора, яку він називає Р-семантикою другого рангу. Така семантика включає три компоненти: композиційну семантику (фреймову структуру тексту), практичне міркування, що ґрунтується на використанні фреймових знань (знань про реальність) та забезпечує виявлення імпліцитних семантичних зв'язків між висловлюваннями в тексті; міркування, що спирається на знання про комунікативні наміри, репрезентовані у фреймовій формі. У ситуації міркування природно-мовне виведення розглядається як сукупність операцій над елементами фреймів.
Використанню фреймів у моделях розуміння смислу зв'язаного тексту присвячені дослідження Р. Шенка та його колег. У їх концепції проголошується центральна роль каузального зв'язку в організації смислової структури тексту. Смисл, за Шенком, це концептуальна структура, а експлікатом такої концептуальної структури є каузально зв'язаний ланцюг подій. Події, в яких зливається найбільша кількість каузальних ланцюжків, утворюють понятійний стрижень—фабулу розповіді. Зв'язність тексту має визначатися через каузальну інтерпретацію концептуальних структур, з яких складається текст. Причинні зв'язки, що поєднують певну подію з іншою, мають виявляти смисл цієї події з точки зору більш широкого контексту. Це останнє завдання і виконує фрейм-структура.
Р. Шенк розрізняє два типи фреймових структур: сценарії та плани, що складаються з послідовності елементарних дій. Елементарні дії об'єднані в певні класи, наприклад, клас PTRANS означає «переміщати» (про фізичні об'єкти), клас MTRANS—«переміщати» (про мисленнєві операції), клас MOVE—«рухатися» тощо. Під сценарієм Р. Шенк розуміє детермінований каузальний ланцюг концептуалізацій, що описує стандартний перебіг подій у будь-якій відомій ситуації. Окремі події зв'язані між собою за принципом причинно-наслідкового ланцюга: результатом кожної дії стає ситуація, де є можливою чергова подія. Основна функція сценарію полягає у керуванні процесом виведення наслідків. Сценарії описують стандартні, типові ситуації реальності; вони складаються з назви ситуації, ролей, тобто імен учасників ситуації, переліку причин виникнення певної ситуації та набору сцен, де кожна сцена описана як набір елементарних дій. Так, сцена «вхід до ресторану», що входить до сценарію «Відвідання ресторану», може бути описана як послідовність таких елементарних дій: PTRANS—увійти в ресторан; MTRANS—знайти вільний стілець; MOVE—сісти тощо.
Плани — це засіб, за допомогою якого встановлюється причинно-наслідкові зв'язки між сценаріями. План описує стандартну послідовність дій людини в тому чи іншому випадку; він складається із сцен та сценаріїв, що ведуть до певної мети.
Своєрідний фреймовий підхід розвивається у моделях Є. Чарняка, що оперують «системами знань», налаштованими на розуміння коротких дитячих розповідей та логічне виведення наслідків. Коментуючи історію формування фреймового підходу на матеріалі підходу Є. Чарняка, Х. Ийм та М. Салувеєр підкреслюють, що шлях до визнання фреймів у цьому випадку пролягав через відмову від так званої концепції «демонів», у певному відношенні близьку до концепції фреймів.
Під демонами у теорії розпізнавання образів розуміють певного типу факти та правила, зв'язані з деякими ключовими поняттями та темами. Коли у тексті експліцитно або імпліцитно згадується відповідна тема, зв'язані з нею демони актуалізуються. Їх функція полягає у додаванні інформації, зосередженої у знаннях, до інформації, безпосередньо представленої у тексті. Наприклад, один з демонів, що зв'язаний з поняттям «дощ», є такий: «якщо йде дощ, а Р знаходиться ззовні, то Р стає мокрим». Проте використання демонів породжує багато проблем. Зокрема, якщо у тексті згадується «ключова» тема, вона автоматично «збуджує» всіх зв'язаних з нею демонів. Крім того, виявляється, що демони не дають можливості з'ясовувати часові співвідношення подій. Для подолання таких проблем Є. Чарняк звертається до фрейм-структури. У його трактуванні фрейм складається з так званих «фреймових тверджень», що описують у досить загальних категоріях окремі дії та їх етапи. Кожне речення у розповіді, що аналізується, інтерпретується як реалізація одного або кількох фреймових тверджень. У процесі аналізу тексту конструюється його «фреймове зображення», та ведеться обмін того, які частини фрейму та до якої межі вже реалізовані у тій послідовності подій, що детермінована фреймом. Це дає змогу реконструювати «правильний» хід подій у процесі аналізу розповіді, де окремі події описуються не у жорсткому часовому порядку.
На відміну від наведених вище фреймових концепцій Ч. Філлмора, Р. Шенка, Є.Чарняка, де впевнено проголошується велика креативна спроможність фрейму як категорії репрезентації знань у моделях розуміння природної мови, у праці Й. Уілка «Сім тез про штучний інтелект та природну мову» висловлюється вкрай скептичне ставлення до основних положень та результатів теорії фреймів. Й. Уілкс вважає, що фрейми виявляються надто конкретними структурами, у той час як актуальним завданням досліджень у галузі моделювання розуміння природної мови залишається створення загальної теорії репрезентації знань. Якщо розвивати далі фреймовий підхід у такому ж напрямі, то, на думку Й. Уілкса, потрібно буде постійно розробляти все нові і нові фрейми: від ресторанів та універмагів до виготовлення їжі, садівництва тощо.
Ще однією вадою фреймового підходу Й. Уілкс вважає також відсутність критеріїв для вирішення питання про те, коли варто актуалізовувати знання, які містяться у фреймі ,що тільки вносить плутанину в аналіз тексту. Інакше кажучи, йдеться про заперечення механічного принципу застосування фреймів. На підтвердження своєї думки Й. Уілкс наводить такий приклад: «По дорозі до ресторану «Орфей» Джон зайшов до універмагу. І весь час думав про ритуали ініціації, які він побачив у телепрограмі». Якщо для розуміння цього тексту, розмірковує Й. Уілкс, механічно вжити метод фреймів, то для цих речень були б вибрані чотири великих фрейми: «ресторани», «універмаги», «ритуали ініціації», «телебачення», які навряд чи мають відношення до їх тлумачення.
Інші дослідницькі напрями
Серед інших дослідницьких напрямів, де застосовується метод фреймів, варто зазначити, принаймі, ще два: моделювання процесів метафоризації на когнітивному рівні (А. М. Баранов) та формування прикладної семіотики як нової парадигми штучного інтелекту (Д. О. Поспєлов).
У концепції утворення метафор, розробленій А. М. Барановим, механізм метафоризації розглядається як такий, що функціонує у контексті обміну інформацією, або знаннями між двома концептуальними полями: джерелом, або базою, та полем мети. Для опису внутрішньої структури поля джерела та поля мети у моделі А. М. Баранова використовується метамова фреймів та сценаріїв. Фрейм тут виступає у своєму загальновизнаному значенні як опис типізованої ситуації, що складається зі слотів, де кожний слот репрезентує певний тип інформації, релевантний для фрагмента дійсності, що описується. Мова фреймів є зручною для опису процесів метафоризації саме тому, що це типова метамова репрезентації знань. Яка не робить різниці між лінгвістичною та екстралінгвістичною інформацією. У цьому разі метафоризація може бути представлена як сукупність формальних процедур над двома (у деяких випадках більше, ніж двома) фреймами. Наприклад, метафоричний смисл може ґрунтуватися на перенесенні концептуального змісту фрейму-джерела у однойменний слот цільового фрейму. Іноді новий метафоричний смисл виникає як наслідок цілого комплексу опрацювання знань. Так, формування актуального значення ідіоми «біла ворона» передбачає не тільки заміну слоту «колір» фрейми «ворони» на нехарактерний колір, але й наступну взаємодію фрейму-джерела з цільовим фреймом людини.
Отже, за концепцією А. М. Баранова, процес метафоризації будь-якої складності може бути репрезентований простими операціями над фреймовими структурами знань, а саме, шляхом заміни смислу слоту, перенесення смислу з одного слоту в інший, введення нового слоту у фрейм, знищення або елімінація змісту слоту або усього слоту у цілому, згортання фрейму в один або декілька слотів тощо. Це дає змогу формально описувати процеси метафоризації як операції над фреймами знань, виходячи за межі власне мовного значеня, у чому й полягає перевага когнітивно-фреймового підходу, що свідомо ігнорує межу між лінгвістичним та екстралінгвістичним.
Поняття фрейм-структури також використовується у прикладній семіотиці. Виходячи з універсального характеру фреймів як знаннєвих структур, Д. О. Поспєлов розглядає структуру знака (семантичний трикутник) як своєрідний фрейм.
Предметом когнітивної лінгвістики є моделювання концептів і встановлення особливостей їх мовної реалізації. У зв'язку зі складним характером структурної організації концепту, під ним розуміють знання різного рівня абстракцій, тобто різні формати знання. Концептом може бути і окреме значення, і ціла концептуальна структура чи, іншими словами, когнітивна модель, яка включає інші концепти і задає інші рівні абстракції. Теорія когнітивних моделей ,згідно з Дж. Лакофором, складається з ментальних просторів та когнітивних моделей, які структурують ці простори[3:46]. Ментальний простір—це певна сфера мислення, концепції, яка може охоплювати наше розуміння реальних і гіпотетичних ситуацій, абстрактних категорій. Ментальні простори мають суто когнітивний статус і не існують поза мисленням. Вони структуруються за допомогою різних когнітивних моделей: образно-схематичних, пропозиційних, метафоричних, метонімічних, символічних.
Ч. Філлмор називав ментальні простори фреймами. Фреймова семантика як лінгвістична концепція була вперше запропонована Ч. Філлмором у середині 70-х років і була розвитком його теорії відмінкової граматики. Застосовуючи поняття фрейму, Ч. Філлмор спочатку розумів його суто лінгвістично як систему вибору мовних засобів—слів, граматичних правил і мовних категорій, – які асоціюються з прототипічними сценами або типовими ситуаціями. Пізніше поняття фрейму практикується з когнітивної точки зору як особлива уніфікована конструкція знання чи схематизація досвіду. Ще пізніше Ч. Філлмор визначає фрейми як когнітивні структури, знання яких передбачається концептами, репрезентованими словами .
У сучасній лінгвістиці фрейм визначається таким чином: одиниця знань, яка організована навколо концепту і містить у собі дані про суттєве, типове і можливе для цього концепту в рамках певної культури; структура даних для представлення стереотипної ситуації ; тип когнітивної моделі, що репрезентує знання і думки, пов'язані з конкретними, часто повторюваними ситуаціями, структура знання, що об'єднує численні сфери, які асоціюються з певною лінгвістичною формою ; когнітивна структура, яка існує в феноменологічному полі людини, базується на ймовірних знаннях про типові ситуації, очікуваннях з приводу якостей і відносин реальних і гіпотетичних об'єктів .
Фрейм—це модель культурно зумовленого, канонізованого знання, яке є загальним хоча б для частини суспільства . Фрейм складається з вершини (теми), слотів або терміналів, які заповнюються пропозиціями. Основною одиницею збереження інформації є пропозиція. Фреймова семантика—це засіб когнітивного та семантичного моделювання мови. Вік дає можливість моделювати принципи структурування і відображення певної частини людського досвіду, знань у значеннях мовних одиниць, способи активації загальних знань, які забезпечують розуміння в процесі мовної комунікації. При цьому відсутня чітка межа між мовними значеннями і людським досвідом. Фрейми—це блоки знання, які стоять за значеннями слів і забезпечують їх розуміння. Фреймова семантика наголошує на необхідності пов'язування значення слова з фреймом ,що лежить в його основі. Тим самим вона допускає можливість того, що комуні канти можуть знати значення слова, яке входить в певну лексичну групу, навіть якщо вони навіть не знають ніяких інших слів із цієї групи або деякі з них. Термін «фрейм» використовується в даному випадку як родове поняття—загальний термін для позначення різних типів структур: фреймів, схем, сценаріїв .
Отже, фрейм — це структурована одиниця знання, в якій виділяються певні компоненти і відношення між ними. Він включає систему оцінок, показники істинної ситуації ,культурні, прагматичні, енциклопедичні знання, які фіксуються як у пропозитивній, так і в термінальних частинах, а також концептуальні плани—інструкції для використання фрейму . Деякі фрейми є вираженими—природньо та неминуче виникають у процесі когнітивного розвитку кожного індивіда (наприклад, знання артефактів). Виділяють також фрейми, існування яких повністю залежить від пов'язаних з ними мовних виразів (таких, як одиниці виміру: фут, дюйм і т. д.; назва місяців). Залежно від виду знання, яке відображається у моделі, розрізняють ситуативні та класифікаційні фрейми. Ситуативні фрейми репрезентують знання немовного, ділового характеру, класифікаційні—відображають принципи організації мовної системи (фрейми класів слів, різних типів текстів і т. д.) .
Залежно від виду слотів та їх взаємозв'язків С. А. Жаботинська розрізняє п'ять типів фреймових структур:
Предметноцентричний фрейм, який складається із системи пропозицій, це до одного й того ж логічного суб'єкта приєднується декілька логічних предикатів; у центрі уваги перебуває сам предмет.
Акціональний фрейм, конституентатами якого є декілька предметів, які наділяються семантичними ролями, акцент зміщується на взаємодію одного предмета з іншими.
Партонімічний фрейм, предметні сутності якого співвідносяться між собою як ціле і його частина.
Гіпотонімічний фрейм, у якому предметні сутності поєднуються родо-видовими відношеннями.
Асоціативний фрейм, що ілюструє відношення схожості, яке базується на зближенні концептів у мисленні самого індивіда.
Звернення сучасної лінгвістики до нової за формою, але стародавньої за змістом категорії «фрейм» було, як справедливо стверджує Т. А. ван Дейк, один з «батьків» теорії фреймів, спровоковано модною у 1979-ті роки тенденцією заповнювати мовознавство інструментарієм з галузі штучного інтелекту як самої на той час точної і, адже, як тоді, помилково вважалось майже повсюдно, найоб'єктивнішої науки, до статусу якої, зрозуміло, прагнула і лінгвістика.
Якщо у науці про вказаний інтелект фрейм означав набір конкретних знань, пов'язаних між собою тематично (тобто «ситуацією», або, на старий лад, «типове», «традиційне», «те, що повторюється без змін» тощо) і його появу було викликано, як і з категорією "дискурс", потребами і вимогами особливого (спрощеного) керування електронним мозком тільки у запитально-відповідному режимі «так—ні», то до новітньої, когнітивної лінгвістики цей термін увійшов зі значно зміненим змістом (як типовим набором сем для опису складного, але цілісного явища) і, як увесь її категоріальний апарат, швидко перетворився на поетизм, накопичивши занадто багато протилежних тлумачень, з одного боку, і породивши розмаїття синонімів до самого себе, з іншого.
Скоїлося це через те, що історія поняття «фрейм» і історія терміна «фрейм» нараховували різні хронологічні протяжності. Коли у 1974-ому році «батько» цього терміна М. Мінський, запропонував його до обігу у практиці штучного інтелекту, він мав на увазі лише логічний зміст доброї стародавньої лінгвістичної категорії «широкий контекст», або «фонові знання», бо професійно знав, що сприйняття будь-якого висловлювання зводиться не лише (та й не стільки!) до розуміння словникової і безпосередньої конотативної семантики (вузький контекст) використаних у ньому мовних одиниць, а перш за все до урахування тієї типової ситуації соціального спілкування, яка породила конкретний текст і зумовлює його (тобто широкий контекст). Згадавши через 10 років початок історії вказаного терміна, він знову акцентував вагомість попередніх знань для об'єктивного сприйняття змісту чергового висловлювання: «У своїй роботі я висловив здогад, що розум дані будь-якого сприйняття звичайно інтерпретує у термінах раніше набутих структур, пристосованих до опису,– у фреймах».
І дійсно: коли, наприклад, німець каже по телефону своєму співбесіднику «Auf Wiederhören!», або українець звертається до людини, яка приймає їжу, зі словами «Смачного Вам!», або росіянин зустрічає знайомого висловом «Здраствуйте», то всі три мовця (за різким винятком) мають на увазі зовсім не те, що загальноконвенціонально для мови оригіналу репрезентують наведені словосполучення («до наступного разу, коли ми знову будемо чути один одного»– у німця, «щоб їжа була гарною»– в українця, «бувайте здорові»– у росіянина), а—відповідно—ситуацію прощання, вітання, зустрічі, і, отже, філолог-аналітик має цілковиту підставу розуміти ці сполучення не словниково, а фреймово (ситуативно)—«До зустрічі» у першому випадку, «Приємного апетиту!» у другому та «Доброго ранку (дня тощо)» у третьому.
Представлення знань
Люди мають запас “знань” про світ, в якому вони живуть. Деякі види знань загальновідомі; до них відносяться знання, пов’язані з прийомом їжі чи водінням автомобіля. Інші знання більш спеціальні, наприкладті, що використовуються експертами. Знання звичайно представляються у виглядів фактів, що характерні для навколишнього світу (тобто класів об’єктів і взаємозв’язків між ними), процедур і правил маніпулювання фактами, а також у вигляді інформації про те, коли і як необхідно застосовувати правила і процедури.
Об’єкти групують по класам. Петро, Джон, Фред і Віка можуть розумітися як об’єкти. Їх можна віднести до класу “особистість”. В доповнення до цього Петро, Джон, Фред можуть бути класифіковані як “чоловік”, а Віка – як “жінка”. Явна перевага любої класифікації заключається в тому, що частково вирішується проблема переповнення пам’яті, так як достатньо пам’ятати тільки характеристики класа, а не кожного об’єкту. Ми можемо також визначитивідношення між класами (чи окремими об’єктами). Подібним чином ми можемо визначити відношення “керує (А,В)”, яке означає, що В знаходиться у підлеглому стані відносно А. В якості прикладів такої залежності можуть служити вирази:
Керує (Петро, Джон)
Керує (Джон, Віка)
Керує (Віка, Фред)
які заключають в собі структуру “підзвітність” (інше відношення) між об’єктами Петро – Джон – Віка – Фред. Приведений приклад ілюструє відношення між схожими об’єктами. Між відмінними об’єктами також можуть бути встановлені відношення (наприклад, “володіє (Петро, автомобіль)”). Знання про об’єкти і їх взаємовідношення дозволяють класифікувати ці об’єкти і співвідносити між собою.
Другий етап знання – правила. Вони дають можливість визначити, як вивести нові відмінні властивості класу чи відношення для об’єктів, що раніше не були поділені на класи. Наприклад, якщо ми визначимо відношення “звітується (В,А)” для того, щоби відмітити, що В підзвітний А (можливо, через інших керівників), то зможемо встановити правило :
“звітується (С,А)” є ІСТИНА
ЯКЩО чи “керує (А,С)” є ІСТИНА
ЧИ “керує (А,В)” І “керує (В,С)” є ІСТИНА
Це дуже обмежене правило. Воно може бути застосоване тільки для першого чи другого рівня підзвітності, але в межах обмеження воно дає нам можливість вивести новий приклад відношення “звітується”, який раніше не був відомий. Наприклад, правило дозволяє зробити заключення про те, що “звітується (Віка, Петро)” і “звітується (Фред, Джон)” є ІСТИНА. Внаслідок того що дане правило визначене як двохрівневе, воно не може бути застосоване для отримання висновку “звітується (Фред, Петро)” є ІСТИНА. Для цього нам необхідне більш потужне правило, що має рекурсію :
“звітується (С, А)” є ІСТИНА
ЯКЩО чи “керує (А, С)” є ІСТИНА
ЧИ “керує (А, В)” є ІСТИНА
І “звітується (С, В)” є ІСТИНА
Перша частина приведеного рекурсивного правила відноситься до прямої підзвітності, а друга – до побічної.
Якщо ми задаємо питання “звітується (Джон, Петро)?”, то відповідю буде ІСТИНА, так як істинна перша частина правила “ЯКЩО”. Питання “звітується (Фред, Петро)?” потребує більш складної обробки. Табл.1.1 показує процес подібної обробки із використанням розглянутого правила.
Таблиця 1.1. Приклад відношення “звітується”.
Стовпець 1 характеризує саме питання. Стовпець 2 вміщує деталі перетворення для першого “ЧИ”. В стовці 3 деталізується перетворення для другого “ЧИ”, яке виконується при умові, що результат першого “ЧИ” хибий. Перетворення для другого”ЧИ” в любому випадку закінчується відповідним запитом, який має нове питання, на яке повинна бути дана відповідь.
Відмітимо рекурсивність обробки відношення “звітується”. Ця процедура дуже складна при всій простоті та зрозумілості самого правила. В термінах, що прийняті в програмуванні, вона виражається одним рядком.
Природньо, що представлення якого-небудь процесу обробки знань потребує дуже складного набору правил, і експерти склоні застосовувати правила і процедури, незрозумілі для неспеціалістів. Часто сам експерт не в стані по – справжньому пізнати процес оробки знань, що ним використовується при виведені судження.
Таким чином, ми ввели дві складові – факти і правила. Третя необхідна компонента процесу обробки знань – керуюча структура; вона визначає засіб застосування різноманітних правил. По сутті, люба керуюча структура дозволяє вирішити, яке із правил повинне застосовуватися наступним. В більшості реальних ситуаціях кількість необхідних правил дуже велика, і при цьому можливі різні форми керуючих структур. Правила можна вибирати послідовно або ж деяка підмножина прівил може бути застосована для вибору наступного правила (такі підмножини розуміються як правила більш високого рівня, чи метаправила). Механізм додатку правил в цих ситуаціях, коли потрібно проводити їх вибір, є прерогативою керуючої структури. Наприклад, коли ми розглядали за табл.1.1 хід обробки відповідного правила, існував єдиний шлях, який приводив до відповіді на питання. При нормальних умовах в ієрархії керівництва є множина подібних шляхів, як це зображено на мал.1.1.
Петро
Девід
Джо
Джим
Джон
Джек
Фред
Пошук «спочатку вглуб»
Петро
Джо
Джим
Джон
Джек
Фред
Пошук «спочатку вшир»
Девід
Мал.1.1. Обробка ієрархії відношень.
У визначених точках ми маємо справу із необхідністю вибору шляху, для чого нам потрібний підходячий метод, який задається керуючою структурою. Відомо, що любий метод заснований на логіці підхід забезпечує можливість зробити це (деякі підходи до вирішення даної задачі розглянуті в гл.3), але один із очевидних засобів рішення подібної задачі зводиться до того, що спочатку необхідно пересуватися вздовж самої лівої гілки дерева до тих пір, поки не буде задовільнений запит чи не буде досягнений кінець гілки. В останьому випадку ми повинні “відступити” в попереднью вершину гілки і за допомогою того же методу провести перевірку інших гілок. В результаті, як це зображено на мал.1.1, шлях обробки, що відповідає запиту “звітується (Фред, Петро)?” показаний у вигляді пунктирної лінії. Це називається пошуком “спочатку вглуб”. На цьому ж малюнку зображена і схема пошуку “спочатку вшир”.
Для опису процесу обробки знань можна використовувати як декларативні знання (класи, відношення), так і процедурні знання (правила і керуючі структури). Межа між ними дуже пересувна (строго невизначена). Чим менше знань ми декларуємо, тим більше процедурних знань необхідно, і навпаки. В реальних умовах відмінність між декларативними і процедурними знаннями не має суттєвого значення, так як визначення того чи іншого правила може розглядатися як декларативне знання.
Основні властивості знань. Їх відмінність від даних
Знання, як і дані, несуть певну інформацію, але дані не можуть проводити логічне виведення. Щоб знання мали здатність відтворювати якоюсь мірою знання людини і моделювати процес її міркування, вони повинні мати певні властивості. Існує, як мінімум, 6 таких обов’язкових властивостей знань. Саме ці властивості і вказують на відмінність знань від даних:
внутрішня інтерпретованість знань;
внутрішня структура зв’язків (структурованість);
наявність ситуативних зв’язків (зовнішня структура зв’язків);
шкалювання;
занурення в простір із семантичною метрикою;
наявність активності.
Всі такі властивості надають можливість якомога повніше відобразити не тільки об’єкти ПрО, але й різноманітні зв’язки та відношення між об’єктами. Розглянемо властивості знань.
Внутрішня інтерпретованість знань
При опрацюванні даних в комп’ютері всі дані машина інтерпретує як двійкові числа, над якими виконуються певні операції. Причому дізнатися, що саме стоїть за кодом, машина не може. Інтерпретація даних залишається в голові у програміста. Іншими словами, комп’ютер не знає, що саме він робить, тому перший крок на шляху до знань в тому і полягає, щоб надати комп’ютеру ці відомості, тобто дати можливість йому інтерпретувати як самі дані, так і дії над ними, тобто інтерпретувати смисловий зміст даних.
Нехай комп’ютер розв’язує задачу обліку наявності деталей на складі декого автогосподарства. В пам’яті машини зберігається табличка наступного вигляду:
Припустимо, що спочатку в пам’ять комп’ютера введена частина таблиці, яка є заповнена. Її дані якимось чином розташовані в пам’яті машини. Тоді їх використання є можливим тільки в той спосіб, який передбачений програмістом в його програмі, тому тільки програми зможуть знайти потрібні дані і провести над ним необхідні операції. Якщо ввести в пам’ять всю таблицю, де в її “шапці” перелічені всі 4 атрибути, то кожен атрибут є ім’ям відповідного стовпця таблички. Друга частина такої таблиці складається з рядків, кожен з яких містить 4 елементи. Кожен рядок можна розглядати як відношення між цими елементами. Отже, перший рядок з ім’ям Картер можна описати так:
Картер (<Номер секції, 54>, <Кількість, 200>, <Модель, ВАЗ 2106> )
Круглі дужки виділяють зміст інформаційної одиниці, а кутові дужки – це окремі самостійні одиниці, які називають слотами.
В найзагальнішому вигляді повний запис будь-якої таблиці, представленої як сукупність слотів, буде мати наступний вигляд:
Ім’я інформаційної одиниці (<ім’я першого слоту, значення першого слоту>, <ім’я другого слоту, значення другого слоту>, ... , <ім’я m-го слоту, значення mго слоту>)
В пам’яті машини вся така таблиця зберігається як окрема інформаційна одиниця у вигляді деякого файлу, а БД структурована таким чином, що хоча ще не є БЗ, проте може відповісти на деякі запитання: скільки деталей зберігається в секції 54? Перелічити всі деталі (запчастини), які зберігаються на складі. Чи зберігається на складі розподільчий вал? Для відповіді на такі запитання повинна функціонувати система спілкування, яка має виділяти такі словосполучення, як скільки деталей зберігається, перерахувати всі запчастини та ін. Саме такі словосполучення визначають тип процедур, які необхідно використати при роботі зі збережуваною інформацією. Такий спосіб широко відомий в сучасних БД. Його називають реляційною моделлю подання даних, а БД, які реалізовані у вигляді реляційних таблиць, – реляційними БД.
Внутрішня структура зв’язків (структурованість)
Людина має властивість пізнання світу через виділенні в об’єкті, що пізнається, окремих елементів і зв’язків між ними. Це дозволяє їй сприймати об’єкт як де...