МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
Національний університет «Львівська політехніка»
Інститут прикладної математики та фундаментальних наук
Кафедра прикладної математики
ЛАБОРАТОРНА РОБОТА № 3
з дисципліни «Прикладна економетрика»
Тема:
«Множинна лінійна регресія»
Варіант - 7
Мета роботи: навчитися будувати регресійні моделі з більш ніж однією незалежною змінною, перевіряти незалежні змінні на наявність мультиколінеарності та оцінювати невідомі параметри моделі.
Завдання до роботи
Економічний показник y залежить від трьох факторів (табл.1). Вибір показників здійснити відповідно до варіанту.
На основі статистичних даних за 16 періодів побудувати кореляційну матрицю.
Використовуючи критерій з надійністю P=0,95 оцінити наявність загальної мультиколінеарності.
Якщо існує загальна мультиколінеарність, то, використовуючи t-статистику з надійністю P=0,95, виявити пари факторів, між якими існує мультиколінеарність. Якщо такі пари існують, то один із факторів цієї пари виключити із розгляду.
Використовуючи МНК в матричній формі знайти параметри множинної регресії.
Використовуючи критерій Фішера, з надійністю P=0,95 оцінити адекватність прийнятої математичної моделі статистичним даним.
Якщо модель адекватна статистичним даним, то, використовуючи t-статистику з надійністю P=0,95, оцінити значущість параметрів регресії.
Знайти значення прогнозу показника для заданих значень факторів.
Зробити висновок.
Порядок виконання роботи
Вхідні дані містяться у табл. 1.
Таблиця 1
Вхідні дані
Вартість основних засобів, тис.грн.
х1
Оборотність дебіторської заборгованості, тис. грн,
х2
Виробничі затрати, тис. грн.,
хз
Фінансовий результат, y
2,61
10,32
6,71
7,95
4,97
11,96
8,14
10,75
6,55
13,96
8,95
11,66
9,16
14,62
8,83
13,49
10,68
15,18
10,95
17,44
13,93
17,34
10,92
19,05
16,27
19,21
11,75
21,42
18,74
20,36
14,05
23,85
21,31
22,21
14,09
27,92
22,88
22,84
14,6
27,27
25,13
22,63
14,38
30,04
26,28
24,93
16,57
32,83
27,71
24,94
15,51
31,89
30,01
25,27
15,44
35,21
32,08
26,18
16
37,27
33,74
27,61
17,59
38,99
36,31
29,23
17,97
?
1. Знайдемо кореляційну матрицю, яка визначає зв’язок між трьома факторами.
Для знаходження коефіцієнтів кореляції використовують статистичну функцію CORREL(КОРРЕЛ)(блок1;блок2).
1
0,993774
0,977244
0,993774
1
0,987744
0,977244
0,987744
1
2. Для дослідження загальної мультиколінеарності між факторами використовується - критерій, розрахункове значення якого знаходять за формулою:
розр,
де n – кількість значень факторів; m – число факторів.
Для обчислення визначника матриці скористатися формулою MDETERM(МОПРЕД).
det (K) = 0,000283
розр = -(16-1-(2*3+5)/6)*LN(0,000283) = 107,5511
Табличне значення -критерію знаходять для заданої ймовірності =0,05 і числа ступенів вільності k за допомогою статистичної функції CHISQ.INV(ХИ2ОБР)(;k).
табл. = 7,814727764
Оскількироз = 107,5511> табл. = 7,8147, то з надійністю Р=0,95 можна вважати, що між факторами існує загальна мультиколінеарність.
3. Для з’ясування питання, між якими факторами існує мультиколінеарність, використовується t-критерій.
Необхідно визначити для трьох пар факторів три розрахункових значення статистик t12, t13, t23. Для знаходження t-статистики між двома факторами спочатку знаходиться матриця, обернена до кореляційної матриці . Після чого знаходяться частинні коефіцієнти кореляції , де , , — елементи матриці [Z].
Для цих частинних коефіцієнтів знаходиться t-статистика .
Для знаходження оберненої матриці скористатися функцією MINVERSE(МОБР). Зауважимо, що натискання клавіші Enter не забезпечує введення формули масиву.
85,94356
-100,57
15,34963
-100,57
158,734
-58,5071
15,34963
-58,5071
43,78974
Звідси, = 0,861047, = -0,25021, = -0,70176.
= 5,865499, = -0,89523, = -3,41228.
Для визначення табличного значення t-критерію для ймовірності =0,05 і числа ступенів вільності k скористатись формулою TINV(СТЬЮДРАСПОБР).
= 2,178812827
Після цього кожне з розрахункових значень t12 , t13 , t23 порівнюють з табличним tтабл. Якщо tij > tтабл, то між факторами та існує мультиколінеарність. Для усунення мультиколінеарності один з факторів виключають з розгляду.
Оскільки t12 > tтабл – між факторами існує мультиколінеарність, тому ми виключаємо один з факторів з розгляду. Тому ми викидаємо з розгляду другий фактор – оборотність дебіторської заборгованості.
4. Тепер показник y залежить від двох факторів і . Припустимо, що між y та і існує лінійна залежність:
yˆ = + +
Знайдемо параметри регресії , використовуючи МНК в матричній формі за формулою:
1
2,61
6,71
7,95
1
4,97
8,14
10,75
1
6,55
8,95
11,66
1
9,16
8,83
13,49
1
10,68
10,95
17,44
1
13,93
10,92
19,05
1
16,27
11,75
21,42
1
18,74
14,05
23,85
1
21,31
14,09
27,92
1
22,88
14,6
27,27
1
25,13
14,38
30,04
1
26,28
16,57
32,83
1
27,71
15,51
31,89
1
30,01
15,44
35,21
1
32,08
16
37,27
1
33,74
17,59
38,99
Далі транспонуємо матрицю Х і множимо її на матрицю Х, отримуємо:
16
302,05
204,48
302,05
7218,0529
4352,043
204,48
4352,0433
2781,368
При формуванні матриці Х перший стовбчик буде одиничним, у наступні стовбці заносимо відповідні значення фактора. Для знаходження транспонованої матриці використати формулу TRANSPOSE(ТРАНСП), для обчислення добутку матриць формулу MMULT( МУМНОЖ). Обертаємо отриману матрицю і отримуємо:
5,487736
0,2405865
-0,7799
0,240587
0,0129964
-0,03802
-0,7799
-0,038023
0,117191
Потім перемножуємо транспоновану матрицю та матрицю Y:
387,03
8809,2551
5438,0082
Потім отримуємо матрицю-стовпець оцінок параметрів лінійної регресії:
2,2309839
0,8332792
0,4872959
Отже, = 2,2309839, = 0,8332792, = 0,4872959.
Знайшовши параметри регресії, можна підставити їх в рівняння регресії і знайти розрахункові значення показника y (позначимо їх ).
yˆ = 2,2309839+0,8332792+0,4872959
Значення представлені у табл. 2.
Таблиця 2
Теоретичні та допоміжні значення
( - y̅)
( - y̅)
(y - )
(Y-)²
7,675598
-16,5138
272,7048
0,274402
0,075296
10,33897
-13,8504
191,8337
0,41103
0,168945
12,05026
-12,1391
147,3581
-0,39026
0,152304
14,16664
-10,0227
100,4551
-0,67664
0,457848
16,4663
-7,72308
59,64594
0,973704
0,948099
19,15983
-5,02954
25,29627
-0,10983
0,012064
21,51416
-2,67521
7,156755
-0,09416
0,008867
24,69314
0,503769
0,253783
-0,84314
0,710892
26,85416
2,664789
7,101098
1,065836
1,136007
28,41093
4,221558
17,82155
-1,14093
1,301728
30,17861
5,989231
35,87089
-0,13861
0,019212
32,20406
8,01468
64,2351
0,625945
0,391807
32,87911
8,689736
75,51151
-0,98911
0,97834
34,76154
10,57217
111,7707
0,448458
0,201114
36,75932
12,56994
158,0034
0,510684
0,260798
38,91736
14,72798
216,9135
0,07264
0,005277
387,03
1491,932
6,828598
Прогнозне значення на 17 період: = 41,24406.
Розрахунки проведені правильно, оскільки сума теоретичних значень дорівнює сумі вхідних значень y = 387,03.
5. Оцінимо модель на адекватність, використовуючи критерій Фішера
Табличне значення Фішера знаходимо для ймовірності =0,05 і числа ступенів вільності k1=m, k2=n-m-1 за формулою F.INV(FРАСПОБР).
F = 873,9319, а табличне значення Фішера дорівнює 3,49.
Оскільки, Fpозр = 873,9319> Fтаб = 3,49, то прийнята модель адекватна і її можна використовувати для економічного аналізу.
6. Розглянемо значущість параметрів регресії за допомогою t-статистик, які описуються формулами:
, (9)
де – діагональний елемент матриці ;
– середньоквадратичне відхилення статистичних даних від розрахункових, яке обчислюється за формулою
= 0,891013745.
=1,262481– вплив параметра на показник y не значний, = 9,689572– значний,
=1,886996- вплив параметра на показник y не значний. tтабл. = 2,178812827
Кожне з розрахункових значень t0, t1, t2 порівнюють з табличним tтабл. Якщо ti>tтабл, то вплив параметра на показник значний.
7. Для визначення прогнозного значення показника, необхідно підставити прогнозні значення факторів в рівняння регресії. Прогнозне значення на 17 період: y17= 41,24406.
ВИСНОВКИ
На даній лабораторній роботі я навчився будувати регресійні моделі з більш, ніж однією незалежною змінною, перевіряти незалежні змінні на наявність мультиколінеарності та оцінювати невідомі параметри моделі.
На основі вхідних даних, було побудовану кореляційну матрицю К. Проведено перевірку існування загальної мультиколінеарності між факторами за допомогою - критерія. Оскількироз = 107,5511> табл. = 7,8147, то з надійністю Р=0,95 можна вважати, що між факторами існує загальна мультиколінеарність.
Для з’ясування питання, між якими факторами існує мультиколінеарність, використовується t-критерій. Для трьох пар факторів було визначено три розрахункових значення статистик t12, t13, t23. Після цього кожне з розрахункових значень t12 , t13 , t23 порівнюють з табличним tтабл. Якщо tij > tтабл, то між факторами та існує мультиколінеарність. Для усунення мультиколінеарності один з факторів виключають з розгляду.
Оскільки t12 > tтабл – відповідно між факторами існує мультиколінеарність, тому ми виключаємо один з факторів з розгляду. В даному випадку з розгляду викидаємо другий фактор – оборотність дебіторської заборгованості.
Тепер показник y залежить від двох факторів і . Припустимо, що між y та і існує лінійна залежність, яка описується даним рівнянням множинної регресії:
yˆ = + +. Знайдено параметри рівняння: = 2,2309839, = 0,8332792, = 0,4872959. Знайдені параметри регресії, були підставлені в рівняння регресії і знайдені розрахункові значення показника y (позначимо їх ): yˆ = 2,2309839+0,8332792+0,4872959. На основі отриманого рівняння регресії обчислено теоретичні значення yˆ. Розрахунки проведені правильно, оскільки сума теоретичних значень дорівнює сумі вхідних значень y =387,03.
Проведено оцінку моделі на адекватність, використовуючи критерій Фішера. Оскільки, Fpозр = 873,9319> Fтаб = 3,490294821, то прийнята модель адекватна статистичним даним і її можна використовувати для економічного аналізу.
Оцінено значущість параметрів регресії за допомогою t-статистик. =1,262481– вплив параметра на показник y незначний, = 9,689572– значний, =1,886996- вплив параметра на показник y незначний.
Визначено прогнозне значення показника, шляхом підстановки прогнозних значень факторів в рівняння регресії. Прогнозне значення на 17 період: y17= 41,24406.