МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
Національний університет “Львівська політехніка”
Прізвище:
Ім’я:
Група:
Кафедра:
Дисципліна:
Перевірив:
Шагала
Василь
КНст-12
САПР
Математичні методи
Дослідження операцій
Файтас О.І.
ЛАБОРАТОРНА РОБОТА № 5 частина 2.Теорія статистичних рішень «ігри з природою».
Мета роботи: Ознайомитися з теорією статистичних рішень, навчитись розв’язувати задачі прийняття рішень за критеріями Вальда, Севіджа, та Гурвіца [6;7].
Короткі теоретичні відомості
У задачах теорії статистичних рішень невідомі умови операцій які залежать не від свідомо діючого «супротивника» (або інших учасників конфлікту), а від об'єктивної дійсності, яку в теорії статистичних рішень прийнято називати «природою». Відповідні ситуації часто називаються «іграми з природою». «Природа» мислиться як якась незацікавлена інстанція, «поведінка» яка невідома, але в усякому разі не зловмисна.
Здавалося б, відсутність свідомої протидії спрощує завдання вибору рішення. Виявляється, ні: не спрощує, а ускладнює. У грі проти свідомого супротивника елемент невизначеності знімається тим, що ми "думаємо" за супротивника, «приймаємо» за нього рішення, саме несприятливе для нас самих. У грі ж з природою така концепція не підходить. Тому теорія статистичних рішень - найбільш «хитка» себто рекомендацій наука.
Розглянемо гру з природою: у нас (сторона А) має можливі стратегій А1,А2, ,.., Ат; що стосується обстановки, то про неї можна зробити П припущень: П1, П2, ..., Пn. Розглянемо їх як «стратегії природи». наш виграш аij при кожній парі стратегій Аi , Пj заданий матрицею (таблиця 1). Потрібно вибрати таку стратегію гравця А (чисту або, може бути, змішану, якщо може бути), яка є більш вигідною в порівнянні з іншими.
Таблиця 1
Найпростіший випадок вибору рішень у грі з природою - це випадок коли (на наше щастя) якась із стратегій гравця А перевершує інші («домінує» над ними), як, наприклад, стратегія А2 у таблиці.2. Тут виграш при стратегії А2 при будь-якому стані природи не менше, аніж при інших стратегіях, а при деяких - більше; значить, все ясно, і потрібно вибирати саме цю стратегію.
Таблиця 2
Якщо навіть в матриці гри з природою немає однієї домінуючої над всіма іншими, все ж корисно подивитися, чи немає в ній дублюючих стратегій П поступаються іншим за всіх умов. Але тут є одна тонкість: так ми можемо зменшити тільки число стратегій гравця А, але не гравця П - адже йому все одно, багато чи мало ми виграємо. Припустимо, що «чистка» матриці проведена, і не дублюючих, ні заведено невигідних гравцю А стратегій в ній немає.
Цілком природно, повинна враховуватися матриця виграшів (aij). Проте в якомусь сенсі картина ситуації, яку дає матриця (аij), неповна і не відображає належним чином переваг і недоліків кожного рішення.
Припустимо, що виграш аij при нашій стратегії Ai та стан природи Пj більше, ніж за нашої стратегії Ak та стан природи Пl: аij>akl. Наприклад, стан природи «нормальні умови» для будь-якої операції вигідніше, ніж «повінь», «землетрус» і т. п. Бажано ввести такі показники, які не просто давали б виграш при даній стратегії в кожній ситуації, але відображали б «вдалість» або «невдалість» вибору даної стратегії в даній ситуації.
З цією метою в теорії рішень вводиться поняття «ризику». ризиком rij гравця А при користуванні стратегією Аi в умовах Пj називається різниця між виграшем, який ми отримали б, якби знали умови Пj і виграшем, який ми отримаємо, не знаючи їх і вибираючи стратегію Аi.
Очевидно, якби ми (гравець А) знали стан природи Пj, ми вибрали б ту стратегію, при якій наш виграш максимальний. Цей виграш, максимальний у стовпці Пj ми вже раніше зустрічали і позначили βj Щоб отримати ризик rij, потрібно з βj обчислити фактичний виграш аij:
Для прикладу візьмемо матрицю виграшів (таблиця 3) і побудуємо для неї матрицю ризиків (ri j) (таблиця 4).
При погляді на матрицю ризиків (таблиця 4) нам ясніше видно деякі риси даної «гри з природою».
Таблиця 3
Таблиця 4
Так, в матриці виграшів (ai j) (таблиця 3) у другому рядку перший і останній елементи були рівні один одному: a21 = а24 = 3. Однак ці виграші зовсім не рівноцінні в сенсі вдалого вибору стратегії: при стані природи П1 ми могли виграти щонайбільше 4, і наш вибір стратегії А2 майже зовсім ідеальний, а ось при стані П4 ми могли б, вибравши стратегію А1, отримати на цілих 6 одиниць більше, тобто вибір стратегії А2 дуже поганий. Ризик - це «плата за відсутність інформації»: в таблиці 4 r21 = 1, r24 = 6 (тоді як виграші aij в тому і іншому випадку однакові). Природно, нам хотілося б мінімізувати ризик, супроводжуючий вибір рішення.
Отже, перед нами - дві постановки задачі про вибір рішення: при одній нам бажано отримати максимальний виграш, при іншій - мінімальний ризик.
Ми знаємо, що найпростіший випадок невизначеності - це «доброякісна» або стохастична невизначеність, коли стану природи мають якісь ймовірності Q1,Q2, ..., Qn і ці ймовірності нам відомі. Тоді природно вибрати ту стратегію, для якої середнє значення виграшу, узяте по рядку, максимально:
Цікаво відзначити, що та ж стратегія, яка звертає в максимум середній виграш, звертає в мінімум і середній ризик:
так що в разі стохастичною невизначеності обидва підходи («від виграшу» і «від ризику») дають одне і те ж оптимальне рішення.
Тоді трішки «зіпсуємо» нашу невизначеність і припустимо, що ймовірності Q1, Q2, ..., Qn в принципі існують, але нам невідомі. Іноді в цьому випадку припускають всі стани природи рівноімовірними (так званий «принцип недостатньої підстави» Лапласа), але взагалі-то це робити не рекомендується. Все-таки зазвичай більш-менш ясно, які стани більші, а які - менш імовірні; Для того щоб знайти орієнтовні значення ймовірностей Q1, Q2, ..., Qn, можна, наприклад, скористатися методом експертних оцінок. Хоч якісь орієнтовні значення ймовірностей станів природи все ж краще, ніж повна невідомість. Неточні значення ймовірностей станів природи в подальшому можуть бути «скориговані» за допомогою спеціально поставленого експерименту. Експеримент може бути як «ідеальним», повністю з'ясовує стан природи, так і неідеальним, де ймовірність станів уточнюються за непрямими даними. Кожен експеримент, зрозуміло, вимагає якихось витрат. Виявляється, «ідеальний» експеримент має сенс проводити тільки у разі, коли його вартість менше, ніж мінімальний середній ризик.
Однак не будемо більше займатися випадком стохастичної невизначеності, а візьмемо випадок «поганої невизначеності», коли ймовірності стану "природи або взагалі не існують, або не піддаються оцінці навіть наближено. Обстановка несприятлива для прийняття «хорошого» рішення спробуємо знайти хоча б не найгірше.
Тут все залежить від точки зору на ситуацію, від позиції дослідника, від того, якими бідами загрожує невдалий вибір рішення, Опишемо кілька можливих підходів, точок зору для вибору рішення.
2.1. Максимінний критерій Вальда. Згідно з цим критерієм гра з природою ведеться як гра з розумним, причому агресивним супротивником, що робить все для того, щоб перешкодити нам досягти успіху. Оптимальною вважається стратегія, при якій гарантується виграш у будь-якому випадку не менший, ніж «нижня ціна гри з природою»:
Якщо керуватися цим критерієм, що втілює «позицію крайнього песимізму», треба завжди орієнтуватися на гірші умови, знаючи напевно, що «гірше цього не буде». Очевидно, такий підхід - природний для того, хто дуже боїться програти, - не є єдино-можливим, але як крайній випадок він заслуговує розгляду.
2.2. Критерій мінімаксного ризику Севіджа. Цей критерій - теж вкрай песимістичний, але при виборі оптимальної стратегії радить орієнтуватися не на виграш, а на ризик. Вибирається в якості оптимальної та стратегія, при якій величина ризику в найгірших умовах мінімальна:
Сутність такого підходу в тому, щоб всіляко уникати великого ризику при прийнятті рішення. У сенсі «песимізму» критерій Севіджа схожий з критерієм Вальда, але самий «песимізм» тут розуміється по іншому.
2.3. Критерій песимізму-оптимізму Гурвіца. Цей критерій рекомендує при виборі рішення не керуватися ні крайнім песимізмом, ні крайнім, легковажним оптимізмом.
Згідно з цим критерієм вибирається стратегія з умови
де χ - «коефіцієнт песимізму», обираний між нулем і одиницею. При χ = 1 критерій Гурвіца перетворюється на критерій Вальда; при χ = 0 - у критерій «крайнього оптимізму», що рекомендує вибрати ту стратегію, при якій найбільший виграш в рядку максимальний. При 0 <χ <1 виходить щось середнє між тим і іншим. Коефіцієнт χ вибирається з суб'єктивних міркувань - чим небезпечніше ситуація, чим більше ми хочемо в ній «підстрахуватися», чим менш наша схильність до ризику, тим ближче до одиниці вибирається χ.
Якщо рекомендації, що випливають з різних критеріїв, співпадають - тим краще, значить, можна сміливо вибрати рекомендований рішення: воно швидше за все «не підведе». Не треба забувати, що в будь-яких завданнях обгрунтування рішень деяке свавілля неминуче - хоча б при побудові математичної моделі, виборі показника ефективності. Вся математика, вживана в дослідженні операцій, не скасовує цього свавілля, а дозволяє лише «поставити його на своє місце».
Таблиця 5
Розглянемо елементарний приклад «гри з природою» 4 X 3, матриця виграшів якої (aij) дана в таблиці 5.
Користуюємось критеріями Вальда, Севіджа і Гурвіца, причому в останньому візьмемо χ = 0,6
1. Критерій Вальда. Підрахуємо мінімум по рядках (див. таблицю 6) і виберемо ту стратегію, при якій мінімум рядка максимальний (дорівнює 25). Це - стратегія А3.
Таблиця 6
2. Критерій Севіджа. Перейдемо від матриці виграшів (таблиця 6) до матриці ризиків (таблиця 7), у правому додатковому стовпці запишемо максимальне в рядку значення ризику γ.
З чисел правого стовпця мінімальна (60) відповідає стратегіям А1 и А2; значить, обидві вони оптимальні по Севіджа.
Таблиця 7
3. Критерій Гурвіца (при χ = 0,6). Знову перепишемо таблицю 5, але на цей раз в правих трьох додаткових стовпцях поставимо: мінімум рядка αi її максимум ωi і величину hi = χαi + (1 — χ)× ×ωi, округленої до цілих одиниць (див. таблицю 8).
максимальне значення hi = 47 відповідає стратегії А3.
Отже, в даному випадку всі три критерії згідно говорять на користь стратегії А3 яку є всі підстави обрати.
Таблиця 8
А тепер візьмемо випадок, коли між критеріями виникає «суперечка». матриця виграшів (аij) (із заздалегідь виписаними стовпцями мінімумів рядків аij максимумами рядків ωi і значеннями hi (при χ = 0,6) дана в таблиці 9.
Таблиця 9
За критерієм Вальда оптимальною є стратегія А1, за критерієм Гурвіца с χ = 0,6 — стратегия А3. Подивимося, що скаже критерій Севіджа. Матриця ризиків з додатковим стовпцем, що містить максимуми рядків γi, дана в таблиці 10.
Мінімальним в останньому стовпці є число 38, так що критерій Севіджа, так само як і критерій Гурвіца, «голосує» за стратегію А3.
Якщо ми дуже боїмося малого виграшу «11», який нас може спіткати при стратегії А3, ну що ж - виберемо стратегію А1Рекомендовану вкрай обережним критерієм Вальда, при якому ми, принаймні, можемо собі гарантувати виграш «19», а може бути, і більше. Якщо ж наш песимізм не так вже похмурий, мабуть, треба зупинитися на стратегії А3, рекомендованої двома з трьох критеріїв.
Таблиця 10
На закінчення зазначимо таке: всі три критерії (Вальда, Севіджа і Гурвіца) були сформульовані для чистих стратегій, але кожен з них може бути поширений і на змішані. Однак змішані стратегії в грі з природою мають лише обмежене (головним чином, теоретичне) значення. Якщо в грі проти свідомого супротивника змішані стратегії іноді мають сенс як «трюк», що вводить в оману противника, то в грі проти «байдужї природи» цей резон відпадає. Крім того, змішані стратегії набувають сенсу тільки при багаторазовому повторенні гри. А якщо вже ми її повторюємо, то неминуче починають вимальовуватися якісь імовірнісні риси ситуацій, і ми ними можемо скористатися для того, щоб застосувати «стохастичний підхід» до задачі, а він, стратегій не дає. Крім того, в ситуаціях з «дурною» невизначеністю, коли нам болісно не вистачає інформації, головне завдання - цю інформацію отримати, а не вигадувати хитромудрі методи, що дозволяють без неї обійтися. Одна з основних задач теорії статистичних рішень - це якраз планування експерименту, мета якого - з'ясування або уточнення якихось даних.
ЛАБОРАТОРНЕ ЗАВДАННЯ
Заданоо матрицю, розробити програмний продукт для вирішення задачі критерієм Вальда, Севіджа та Гурвіца:
Варіант 17. Ступінь оптимізму для критерію Гурвіца, x =0,5
54 74 55 68 77 76
60 70 23 28 90 50
16 6 32 18 31 44
98 52 56 55 70 3
25 6 24 28 27 45
81 31 1 65 62 48
P1
P2
P3
P4
P5
P6
min(a ij)
A1
55
74
55
68
77
76
77
A2
60
70
23
28
90
50
90
A3
16
6
32
18
31
44
44
A4
98
52
56
55
70
3
98
A5
25
6
24
28
27
45
45
A6
81
31
1
65
62
48
81
98
Вибрана стратегія
98
52
56
55
70
3
Вирішення задачі критерієм Вальда
P1
P2
P3
P4
P5
P6
min(a ij)
A1
55
74
55
68
77
76
77
A2
60
70
23
28
90
50
90
A3
16
6
32
18
31
44
44
A4
98
52
56
55
70
3
98
A5
25
6
24
28
27
45
45
A6
81
31
1
65
62
48
81
98
P1
P2
P3
P4
P5
P6
min(a ij)
A1
43
24
43
30
21
22
43
A2
38
28
75
70
8
48
75
A3
82
92
66
80
67
54
92
A4
0
46
42
43
28
95
95
A5
73
92
74
70
71
53
92
A6
17
67
97
33
36
50
97
43
вирішення задачі критерієм Севіджа
P1
P2
P3
P4
P5
P6
min(aij)
max(aij)
y min(aij) + (1-y)max(aij)
A1
55
74
55
68
77
76
55
77
66
A2
60
70
23
28
90
50
23
90
56,5
A3
16
6
32
18
31
44
6
44
25
A4
98
52
56
55
70
3
3
98
50,5
A5
25
6
24
28
27
45
6
45
25,5
A6
81
31
1
65
62
48
1
81
41
A7
0
66
Вибирамо стратегію
A1
55
74
55
68
77
76
вирішення задачі критерієм Гурвіца
КОНТРОЛЬНІ ЗАПИТАННЯ
1. Максимінний критерій Вальда. Згідно з цим критерієм гра з природою ведеться як гра з розумним, причому агресивним супротивником, що робить все для того, щоб перешкодити нам досягти успіху. Оптимальною вважається стратегія, при якій гарантується виграш у будь-якому випадку не менший, ніж «нижня ціна гри з природою»:
Якщо керуватися цим критерієм, що втілює «позицію крайнього песимізму», треба завжди орієнтуватися на гірші умови, знаючи напевно, що «гірше цього не буде». Очевидно, такий підхід - природний для того, хто дуже боїться програти, - не є єдино-можливим, але як крайній випадок він заслуговує розгляду.
2. Критерій мінімаксного ризику Севіджа. Цей критерій - теж вкрай песимістичний, але при виборі оптимальної стратегії радить орієнтуватися не на виграш, а на ризик. Вибирається в якості оптимальної та стратегія, при якій величина ризику в найгірших умовах мінімальна:
Сутність такого підходу в тому, щоб всіляко уникати великого ризику при прийнятті рішення. У сенсі «песимізму» критерій Севіджа схожий з критерієм Вальда, але самий «песимізм» тут розуміється по іншому.
3. Критерій песимізму-оптимізму Гурвіца. Цей критерій рекомендує при виборі рішення не керуватися ні крайнім песимізмом, ні крайнім, легковажним оптимізмом.
Згідно з цим критерієм вибирається стратегія з умови
де χ - «коефіцієнт песимізму», обираний між нулем і одиницею. При χ = 1 критерій Гурвіца перетворюється на критерій Вальда; при χ = 0 - у критерій «крайнього оптимізму», що рекомендує вибрати ту стратегію, при якій найбільший виграш в рядку максимальний. При 0 <χ <1 виходить щось середнє між тим і іншим. Коефіцієнт χ вибирається з суб'єктивних міркувань - чим небезпечніше ситуація, чим більше ми хочемо в ній «підстрахуватися», чим менш наша схильність до ризику, тим ближче до одиниці вибирається χ.
Якщо рекомендації, що випливають з різних критеріїв, співпадають - тим краще, значить, можна сміливо вибрати рекомендований рішення: воно швидше за все «не підведе». Не треба забувати, що в будь-яких завданнях обгрунтування рішень деяке свавілля неминуче - хоча б при побудові математичної моделі, виборі показника ефективності. Вся математика, вживана в дослідженні операцій, не скасовує цього свавілля, а дозволяє лише «поставити його на своє місце».