МІНІСТЕРСТВО НАУКИ І ОСВІТИ УКРАЇНИ
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ «ЛЬВІВСЬКА ПОЛІТЕХНІКА»
Кафедра маркетингу і логістики
Лабораторна робота №3
на тему: «ПОБУДОВА ЛІНІЙНОЇ БАГАТОФАКТОРНОЇ МОДЕЛІ ТА
ДОСЛІДЖЕННЯ ЇЇ АДЕКВАТНОСТІ
»
Варіант №19
Теоретичні відомості
При побудові регресійного рівняння, де результуючий показник залежить від багатьох факторних ознак, слід включати в регресію всі фактори, які мають суттєвий вплив на показник y, а з другого боку необхідно визначати, чи виконується умова лінійної незалежності між факторами x1, x2,......,xn. Якщо між факторними ознаками існує лінійна залежність Хі=aХj, то говорять про те, що між цими факторами існує мультиколінеарність.
Мультиколінеарність означає існування тісної лінійної залежності або сильної кореляції між двома або більше пояснювальними змінними. Вона негативно впливає на кількісні характеристики економетричної моделі або робить її побудову взагалі неможливою.
Так як застосування методу найменших квадратів для оцінки параметрів регресійної залежності можливе лише при відсутності лінійної залежності між факторними величинами, то необхідно позбавитись цього явища. Це пов'язано з тим, що якщо має місце явище мультиколінеарності, тобто умова det[[X]T[Х]] ( 0 не виконується, неможливо отримати надійні оцінки параметрів МНК, тобто незначні зміни вибіркових даних приводять до значних змін оцінки параметрів.
В економетричних задачах для дослідження наявності мультиколінеарності використовується метод Фаррара-Глобера.
Метод Фаррара-Глобера. Для дослідження загальної мультиколінеарності і мультиколінеарності між окремими факторами використовується кореляційна матриця R і обернена до неї матриця Z.
, , (4.1)
де - коефіцієнт кореляції, Rij – алгебраїчні доповнення до відповідних елементів матриці R.
Для дослідження загальної мультиколінеарності використовується (2. Для цього знаходимо визначник кореляційної матриці R і розраховуємо значення
, (4.2)
де n – кількість вибіркових значень, m – порядок кореляційної матриці, що розглядається (кількість незалежних змінних), det R – визначник матриці R.
За заданою ймовірністю р і числом ступенів вільності знаходимо табличне значення . Якщо , то із прийнятою надійністю можна вважати, що загальна мультиколінеарність відсутня. Якщо , то із прийнятою надійністю можна вважати, що між факторами існує мультиколінеарність. Для з’ясування питання, між якими факторами існує мультиколінеарність, використовується F– або t–статистика.
Обчислення F-критеріїв
, (4.3)
де - діагональні елементи Z.
Фактичні значення критеріїв порівнюють з табличними при n-m-1 і m ступенях вільності і заданому рівні значущості . Якщо , то відповідна j-та незалежна змінна мультиколінеарна з іншими.
Для знаходження t–статистики між двома факторами спочатку знаходимо матрицю обернену до кореляційної, потім частинні коефіцієнти кореляції
, (4.4)
де - елементи матриці Z.
Частинні коефіцієнти кореляції характеризують тісноту зв'язку між двома змінними за умови, що інші змінні не впливають на цей зв'язок. Для цих частинних коефіцієнтів знаходиться t – статистика
. (4.5)
Для заданої довірчої ймовірності р і ступенів вільності k=n-m-1 знаходиться критичне значення критерію Стьюдента . Якщо , то з надійністю р можна стверджувати, що між факторами хі і xj існує мультиколінеарність.
Для усунення мультиколінеарності потрібно замінити фактор xj на фактор Якщо після заміни фактора має місце мультиколінеарність, то один із факторів виключають з розгляду.
Заміна чи вилучення незалежних змінних завжди має узгоджуватись з економічною доцільністю, що випливає з мети дослідження.
В загальному випадку багатофакторна лінійна регресія має вид
(4.6)
де - параметри моделі;
- незалежні змінні;
u – випадкові величини (відхилення).
Оцінку параметрів знайдемо за допомогою МНК
(4.7)
Згідно з необхідною умовою екстремуму функції багатьох змінних у точках екстремуму частинні похідні дорівнюють нулю. Знаходячи частинні похідні та прирівнюючи їх до нуля, отримаємо
. (4.8)
Розв'язавши таку систему, отримаємо оцінки параметрів .
Оцінки параметрів можна знайти також за формулою
, (4.9)
де - вектор спостережуваних даних показника;
- матриця спостережуваних значень факторів хі, і=1, m, х0 – фіктивний фактор, всі значення якого дорівнюють 1;
- вектор оцінюваних параметрів.
Адекватність побудованої моделі статистичним даним генеральної сукупності можна перевірити за допомогою F-критерію (критерію Фішера):
, (4.10)
де - коефіцієнт детермінації;
n – кількість спостережень;
m – незалежних змінних у рівнянні регресії;
- ступені вільності.
, (4.11)
де - фактичні значення показника;
– теоретичні значення показника;
– середнє значення.
За статистичними таблицями з ступенями вільності та рівнем ймовірності Р знаходимо критичне значення Fкр. Якщо F>Fкр, то побудована модель адекватна статистичним даним генеральної сукупності.
Інтервал довіри знаходять за формулою
, (4.12)
, (4.13)
, (4.14)
де t – значення t-критерію при ймовірності р і n-m-1 ступенях вільності;
- середньоквадратичне відхилення залишків;
- матриця спостережуваних значень факторів;
- вектор прогнозних значень.
Важливе значення для аналізу мають частинні коефіцієнти еластичності. Для багатофакторної регресії частинний коефіцієнт еластичності показує, на скільки відсотків зміниться показник, якщо один із факторів зміниться на один відсоток при незмінних значеннях інших факторів.
Частинний коефіцієнт еластичності для фактора обчислюється за формулою
(4.15)
Частинний коефіцієнт еластичності показує, як змінюється показник у, якщо фактор змінюється на 1 % при незмінних значеннях інших факторів. Аналогічно отримаємо для інших факторів.
Хід роботи
Таблиця 1
Статистичні дані
№
спосте-реження
Доходи підприємства, тис. грн.
(у)
Витрати на маркетинг,
тис.грн. (х1)
Інвестиції у виробництво,
тис.грн. (х2)
Сукупнівитрати,
тис.грн.
(х3)
1
26,21
4,01
10,11
23,20
2
23,10
4,49
12,53
24,49
3
46,15
4,82
18,61
26,99
4
41,15
5,23
15,78
28,25
5
51,62
5,96
20,20
30,30
6
28,86
5,92
9,56
31,97
7
55,76
6,53
22,75
33,93
8
34,11
6,57
12,36
35,41
9
47,37
7,47
17,98
36,19
10
42,29
7,75
15,36
36,87
11
41,19
7,97
13,64
38,99
12
32,06
8,30
18,14
40,94
13
35,91
8,54
11,34
41,41
14
35,46
8,96
10,45
42,96
15
71,33
8,90
29,26
44,17
Будуємо кореляційну матрицю
МатрицяR
1
0,236
0,991
0,236
1
0,251
0,991
0,251
1
;
Вони є парними коефіцієнтами кореляції незалежних змінних. На основі цих коефіцієнтів можна зробити висновок, що між змінними X1, X2, X3 існуєзв’язок. Потрібно визначити чи є цей зв'язок мультиколінеарним і чи негативно він впливатиме на оцінку економетричної моделі. Для цього потрібно використати метод Феррара—Глобера і в результаті знайти статистичні критерії оцінки мультиколінеарності.
Обернена матриця Z
58,648
0,840
-58,351
0,840
1,079
-1,104
-58,351
-1,104
59,123
Для дослідження загальної мультиколінеарності використовується х2 – критерійз надійністю р = 0,95.
Для цього знаходимо визначник кореляційної матриці R (detR).
Отже, detR = 0,016
Розраховуємо х2 – критерій за формолою 4.2
x2p= - (15-1-((2*3+5)/6)*ln(0,016) = 50,33
Отже, можна зробити висновок, що між незалежними змінними існує мультиколінеарність, тобто тісна лінійна залежність, оскільки - 49,027>7,8.
Для того, щоб з’ясувати між якими факторами існує мультиколінеарність розраховуємо F-критерії за формулою 4.3:
Fкрит.= 3,59
F1 = (58,648- 1)* (11/19) = 211,375.
F2 = (1,079-1)*(11/3) = 0,926.
F3 = (53,123– 1) * (11/3) = 213,117.
Отже, можна зробити висновок, що перша та третя незалежні змінні мультиколінеарні з іншими, оскільки F1>Fкритта F3>Fкрит.
Для знаходження t – статистики між двома факторами знаходимо частинні коефіцієнти, використовуючи показники оберненої матриці Z.
r12.3 = Z12 /