Міністерство освіти і науки України
Національний університет «Львівська політехніка»
Інститут економіки та менеджменту
Кафедра прикладної математики
Лабораторна робота № 4
з дисципліни: «Прикладна економетрика»
на тему: «Перевірка гетероскедастичності у лінійній регресійній моделі»
Варіант № 7
Мета роботи: Набуття практичних навичок з перевірки гетеросдекастичності залишків лінійної регресії в економетричній моделі залежності прибутку та витрат на маркетинг.
Теоретичні дані
Гетероскедастичність – це явище, при якому дисперсія залишків є величиною змінною. Якщо дисперсія залишків величина постійна, то має місце гомоскедастичність.
Наприклад, при побудові економетричної моделі, що характеризує залежність між заощадженнями і доходами населення на підставі теоретичної та практичної інформації, можна висунути гіпотезу, що дисперсія залишків за окремими групами населення змінюватиметься і буде пропорційною до середнього доходу цієї групи. Коли розглядати економетричну модель, що характеризує залежність між дивідендами і розміром прибутку або між витратами на харчування і доходом на одного члена сім’ї, витратами на харчування і загальними витратами, то також можна припустити, що дисперсія залишків для окремих груп спостережень змінюватиметься.
Завдання 1
Таблиця 1
Вихідні дані
Витрати на маркетинг
24
3
27
9
6
20
18
16
22
6
21
29
1
0
11
Прибуток
47,6
16,6
51,2
21,8
12,2
49,5
40,5
25,4
35,6
26,2
40,1
47,2
4,6
7,1
23,8
Завдання 2
Для перевірки гетероскедастичності ми використовували два критерії: критерій та критерій Гольдфельда-Квандта.
1. Нами було сформульовано алгоритм перевірки на гетероскедастичність за критеріїєм:
Крок 1. Вихідні дані показника було розбито на груп. При .
Крок 2. За кожною групою обчислено суму квадратів відхилень.
(1)
Sr(I)= 1322,768; Sr(IІ)= 409,492; Sr(IІІ)= 1457,892
Крок 3. Нами було розраховано суму квадратів відхилень у цілому по всій сукупності спостережень
(2)
S=3190,152
Крок 4. Наступним кроком було обчислення критерія
(3)
де – загальна кількість спостережень, – кількість спостережень -ї групи. Значення цього критерію порівнюється з табличним значенням , яке виписується з таблиць критичних значень розподілу при ступенях вільності та ймовірності (наприклад, ).
В процесі проведених розрахунків було визначено, що =2,10244336, у свою чергу =0,102586589 (), значить спостерігається гетероскедастичність.
Завдання 3
2. Параметричний тест Гольдфельда-Квандта можна поділено на такі кроки:
Крок 1. Спостереження (вхідні дані) упорядковувано по зростанню змінної Х (від найменшого до найбільшого значення)
Крок 2. Було відкинуто спостережень, які розміщені в центрі вектора вхідних даних , де - кількість елементів вектора .
С=(4*15)/15=4
Таблиця 1
Вихідні дані для побудови першої економетричної моделі
№
X
Y
Y розрах.
Y-Yрозр.
(Y-Yрозр.)^2
14
0
7,1
6,8
0,3
0,09
13
1
4,6
8,71
-4,11
16,8921
2
3
16,6
12,53
4,07
16,5649
5
6
12,2
18,26
-6,06
36,7236
10
6
26,2
18,26
7,94
63,0436
4
9
21,8
23,99
-2,19
4,7961
Таблиця 2
Вихідні дані для побудови другої економетричної моделі
№
X
Y
Y розрах.
Y-Yрозр.
(Y-Yрозр.)^2
11
21
40,1
39,14
0,96
0,9216
9
22
35,6
40,58
-4,98
24,8004
1
24
47,6
43,46
4,14
17,1396
3
27
51,2
47,78
3,42
11,6964
12
29
47,2
50,66
-3,46
11,9716
Крок 3. На основі вихідних даних було побудовано дві економетричні моделі на базі звичайного МНК для парної лінійної регресії за двома створеними сукупностями спостережень обсягом і (зауважимо, що ).
Крок 4. Знайдено суму квадратів залишків та за першою і другою моделями (тут - розраховане значення показника за допомогою рівняння регресії).
; (4)
де та – кількість спостережень відповідно у першій та другій моделях.
S1= 138,1103; S2= 66,5296;
Рис. 1. Економетрична модель на базі звичайного МНК для парної лінійної регресії за першою сукупністю спостережень
Рис. 1. Економетрична модель на базі звичайного МНК для парної лінійної регресії за другою сукупністю спостережень
Крок 5. Розрахувано критерій Фішера за формулою (5).
Значення цього критерію було прирівняно із табличним значенням , при (6-1;5-1) ступенях вільності.
F*= 0,481713529; Fтабл.= 0,192597783. F*>Fтабл., спостерігається гетероскедастичність і чим більшим є значення , тим більшою є гетероскедастичність залишків.
Завдання 4
Якщо існує гетероскедастичність залишків, то оцінки параметрів моделі, обчислені за МНК будуть неефективними. При цьому формулу для стандартної помилки оцінки застосувати не можна.
Множинна лінійна регресійна модель:
.
За МНК оцінки регресійної моделі обчислюємо за формулою:
, (6)
де – матриця-стовпець оцінок параметрів регресійної моделі;
– матриця спостережуваних значень факторів , ;
- фіктивний фактор, всі значення якого дорівнюють одиниці;
– матриця-стовпець спостережуваних значень показника.
В результаті проведених розрахунків, було знайдено оцінки параметрів регресії: b0= 8,2263278; b1= 1,5305403.
Завдання 5
Шукаємо оцінки параметрів моделі за методом Ейткена відповідно до наступної формули:
. (7)
Діагональна матриця S записується так:
.
де елементи пропорційні до зміни пояснювальної змінної Хі , тобто .
Оцінки параметрів регресійної моделі: b0= 6,004588; b1= 1,681858.
Висновок:
В даній лабораторній роботі я набув практичних навичок з перевірки гетеросдекастичності залишків лінійної регресії в економетричній моделі залежності прибутку та витрат на маркетинг.
Для перевірки гетероскедастичності було використано два критерії; критерій та критерій Гольдфельда-Квандта. В процесі здійснених розрахунків дані критерії показали наявність гетероскедастичності. (F*>Fтабл.)
Для знаходження оцінок параметрів моделі було застосовано метод найменших квадратів та метод Ейткена. Відповідно до МНК b0= 8,2263278; b1= 1,5305403. Метод Ейткена показав, що : b0= 6,004588; b1= 1,681858. Як бачимо, параметри регресії дещо відрізняються між собою, але не суттєво, що свідчить про невелику гетероскедастичність залишків.