Міністерство освіти і науки України
Національний університет водного господарства та природокористування
Кафедра трудових ресурсів і підприємства
Звіт №4
Мультиколінеарінсть
Мета роботи: набуття практичних навичок тестування наявності мультиколінеарності в економетричних моделях і її усунення
Задачі роботи:
Тестування наявності мультиколінеарності у багатофакторній лінійній регресійній моделі на основі тесту Фаррара – Глобера.
Усунення мультиколінеарності.
Завдання роботи і вихідні дані.
Для деякого регіону виконується економетричне дослідження, метою якого є аналіз реального споживання населення У (млн. грошових одиниць) в залежності від наступних трьох факторів: Х1 - купівля та оплата товарів і послуг, Х2 – заощаджень, Х3 – заробітної плати. Вважається, що залежність між зазначеними економічними показниками може бути представлена економетричною моделю багатофакторної лінійної регресії. Дані вибіркових спостережень наведені нижче у таблиці.
і
У
Х1
Х2
Х3
1
14+К
9+0.1N
7.9+0.1N
16.78+0.1N
2
16+К
10+0.1N
9.04+0.1N
19.68+0.1N
3
15+К
11+0.1N
9.95+0.1N
21.56+0.1N
4
14+К
13+0.1N
9.22+0.1N
22.46+0.1N
5
20+К
13+0.1N
11.12+0.1N
22.5+0.1N
6
19+К
15+0.1N
13.47+0.1N
27.2+0.1N
7
22+К
14+0.1N
13.46+0.1N
28.52+0.1N
8
27+К
16+0.1N
12.57+0.1N
30+0.1N
9
29+К
18+0.1N
12.4+0.1N
29.56+0.1N
10
29+К
16+0.1N
13.2+0.1N
24.23+0.1N
11
30+К
14+0.1N
13.5+0.1N
25+0.1N
12
30+К
20+0.1N
14.52+0.1N
30+0.1N
13
31+К
21+0.1N
14+0.1N
32.15+0.1N
14
28+К
23+0.1N
15+0.1N
32+0.1N
15
31+К
20+0.1N
14.5+0.1N
33+0.1N
Ґрунтуючись на наведених статистичних даних:
За допомогою тесту Феррара – Глобера перевірити наявність мультиколінеаності між пояснюючими змінами моделі.
При наявності мультиколінеаності запропонувати шляхи її вилучення
Висновок
Вихідні дані
І
у
Х1
Х2
Х3
1
39
10,8
9,7
18,58
2
16
10
9,04
19,68
3
15
11
9,95
21,56
4
14
13
9,22
22,46
5
20
13
11,12
22,5
6
19
15
13,47
27,2
7
22
14
13,46
28,52
8
27
16
12,57
30
9
29
18
12,4
29,56
10
29
16
13,2
24,23
11
30
14
13,5
25
12
30
20
14,52
30
13
31
21
14
32,15
14
28
23
15
32
15
31
20
14,5
33
В даній лабораторній роботі виконується дослідження з метою аналізу реального споживання населення y (в млн. грошових одиниць) залежно від наступних трьох факторів: x1 - купівлі та оплати товарів і послуг (в млн. грошових одиниць), x2 – заощаджень (в % від загального доходу) і x3 - заробітної плати (в млн. грошових одиниць).
Таблиця 2.
І
Х1
Х2
Х3
x*1
x*2
x*3
1
10,8
9,7
18,58
-1,26
-1,35
-1,71
2
10
9,04
19,68
-1,47
-1,69
-1,47
3
11
9,95
21,56
-1,21
-1,23
-1,06
4
13
9,22
22,46
-0,69
-1,60
-0,86
5
13
11,12
22,5
-0,69
-0,64
-0,86
6
15
13,47
27,2
-0,17
0,55
0,17
7
14
13,46
28,52
-0,43
0,55
0,46
8
16
12,57
30
0,09
0,10
0,78
9
18
12,4
29,56
0,61
0,01
0,68
10
16
13,2
24,23
0,09
0,42
-0,48
11
14
13,5
25
-0,43
0,57
-0,31
12
20
14,52
30
1,13
1,08
0,78
13
21
14
32,15
1,39
0,82
1,25
14
23
15
32
1,90
1,33
1,21
15
20
14,5
33
1,13
1,07
1,43
Середнє
15,65333
12,37667
26,42933
Стандартне відхилення
3,857783
1,978156
4,590922
Для рівня значимості (=0,05 і ступеня вільності за статистичними таблицями χ2 - розподілу знаходиться табличне значення χ2табл.= 7,8 порівнюючи з фактичним розрахунковим χ2 = 39,78 робимо висновок, що в масиві пояснюючих змінних існує мультиколінеарність.
Часткові коефіцієнти кореляції характеризують щільність зв’язку між двома змінними за умови, що інші змінні xl1, xl2, ... , xlm не впливають на цей зв’язок.
Значення F-критеріїв порівнюємо з табличним при (n–m=12) і (m–1=2) ступенях свободи й рівні значущості α =0,05.
Якщо Fk > Fтабл, то відповідна k-та незалежна змінна мультиколінеарна з іншими. В даному дослідженні F1, F2, F3 > Табл.
Оскільки t12 < tтабл, t13> tтабл, t23 < tтабл, то між першою та третьою незалежними змінними існує мультиколінеарність.
Якщо t-критерій перевищує табличне значення, а це означає що k-та змінна залежить від інших змінних у масиві, необхідно вирішувати питання про її виключення з переліку змінних.