Міністерство освіти і науки України
Національний університет «Львівська політехніка»
Інститут економіки та менеджменту
Кафедра прикладної математики
Лабораторна робота № 6
з дисципліни: «Прикладна економетрика»
на тему: «Лінійна регресія. Врахування помилок вимірювання пояснювальних змінних»
Варіант № 7
Львів - 2014
Мета роботи: Набуття практичних навичок із визначення впливу помилок при вимірюванні пояснювальних змінних на параметри лінійної регресії.
Завдання до роботи. Деякий банк отримав дані по руху коштів на депозитних рахунках. На основі цих даних банк бажає отримати прогноз залишків депозитних коштів на період з 06 по 20 вересня 2014р.
1. Побудувати прогноз на основі лінійної регресійної моделі із застосуванням методу найменших квадратів.
2. Побудувати прогноз на основі лінійної регресійної моделі із врахуванням помилок при обчисленні залишку на рахунку.
3. Побудувати графіки, на яких відобразити отримані прогнозні значення.
4. Зробити висновки про результати прогнозування.
Теоретична частина
Кореляція між пояснювальними змінними і залишками є досить серйо-зною перепоною для застосування методу найменших квадратів. Така кореляція може виникнути з різних причин, але основною є накопичення помилок вимірювання пояснювальних змінних.
При існуванні кореляції між пояснювальними змінними і залишками можна застосувати поширений альтернативний метод оцінювання, який називається методом інструментальних змінних.
Розглянемо лінійну регресійну модель .
Припустимо, що існує деяка матриця Z .Тоді оцінку параметрів лінійної регресійної моделі можна записати так:
Дисперсії невідомих параметрів регресії обчилюються за формулою:
де .
Реальна трудність застосування цього методу полягає в знаходженні змінних, які можна використовувати як інструментальні. Істиний розподіл їх встановити практично неможливо, а тому важко переконатися, що вибрані інструментальні змінні справді не корелюють із залишками. Водночас ці змінні повинні мати досить високу кореляцію зі змінними X, бо в іншому разі вибіркові дисперсії для оцінок, здобутих за допомогою інструментальних змінних, будуть дуже великими.
Коротко вимоги до інструментальних змінних Z можна сформулювати так:
1) Z тісно пов’язані з X;
2) Z зовсім не пов’язані із залишками.
Одним із способом визначення інструментальних змінних є критерій Дарбіна.
Дарбін запропонував упорядковувати значення вектора X в порядку зростання і ввів як інструментальну змінну порядковий номер (ранг), тобто числа 1, 2, 3, 4, ... n. Учений показав, що для великих вибіркових сукупностей ефективність застосування такого методу оцінювання досягає майже 96 % від ефективності оцінок МНК, а для сукупностей n = 20 ефективність застосування такого методу оцінювання становить близько 86 %.
Метод Дарбіна можна застосовувати і тоді, коли модель містить кілька пояснювальних змінних. У такому разі спочатку знаходяться відхилення значень кожної змінної од відповідного середнього значення. Потім ці відхилення упорядковуються за зростанням і кожному з них присвоюється порядковий номер.
Хід роботи
Таблиця 1
Дата
X
Y
06.08.14
218
9991,38
09.08.14
221
11452,8
10.08.14
222
12189,9
11.08.14
223
11377,4
12.08.14
224
12075,5
13.08.14
225
11057,4
16.08.14
228
10486,6
17.08.14
229
10871,1
18.08.14
230
10334,4
19.08.14
231
11020,7
20.08.14
232
10183
23.08.14
235
9823,05
24.08.14
236
11179,7
25.08.14
237
10922,1
26.08.14
238
10676,6
27.08.14
239
9783,15
30.08.14
242
10393
31.08.14
243
10027,9
01.09.14
244
9482,1
02.09.14
245
10473,1
03.09.14
246
11411,4
1) Нами була проведена перевірка на наявність гетероскедастичності за допомогою критерію чи можна використовувати МНК.
(1)
(2) (3)
В ході проведених розрахунків було визначено наступні показники: S1 = 4060415,4; S2 = 1794238; S3 = 3496786; S = 9351439,3. Було встановлено, що ( = 1,211; = 5,99). Можна стверджувати, що гетероскедастичність відсутня.
За допомогою методу найменших квадратів знаходимо оцінки параметрів регресійної моделі.
(4)
Y = 21215,9 - 45,336*Х
Таблиця 2
Прогнозні дані залишків коштів на депозитних рахунках до 20 вересня 2014 року
Дата
X
Y
06.08.2014
218
10191,38
09.08.2014
221
11252,78
10.08.2014
222
12289,85
11.08.2014
223
11437,38
12.08.2014
224
12195,45
13.08.2014
225
11197,38
16.08.2014
228
10286,6
17.08.2014
229
10811,08
18.08.2014
230
9934,43
19.08.2014
231
10720,65
20.08.2014
232
10223,03
23.08.2014
235
9793,05
24.08.2014
236
11129,68
25.08.2014
237
11102,05
26.08.2014
238
10836,55
27.08.2014
239
9683,15
30.08.2014
242
10192,98
31.08.2014
243
9827,93
01.09.2014
244
9142,1
02.09.2014
245
10233,1
03.09.2014
246
11451,35
04.09.2014
247
10017,9298
05.09.2014
248
9972,59394
06.09.2014
249
9927,25807
07.09.2014
250
9881,92221
08.09.2014
251
9836,58634
09.09.2014
252
9791,25047
10.09.2014
253
9745,91461
11.09.2014
254
9700,57874
12.09.2014
255
9655,24288
13.09.2014
256
9609,90701
14.09.2014
257
9564,57114
15.09.2014
258
9519,23528
16.09.2014
259
9473,89941
17.09.2014
260
9428,56354
18.09.2014
261
9383,22768
19.09.2014
262
9337,89181
20.09.2014
263
9292,55594
2. Виходячи з того, що вихідні дані можуть мати помилки вимірювання, то для оцінювання параметрів моделі застосуємо метод інструментальних змінних. Визначимо матрицю інструментальних змінних за методом Дарбіна.
(5)
Звідси, y=21215,89 — 45,33587*x.
Прогноз на основі лінійної регресійної моделі із врахуванням помилок при обчисленні залишку на рахунку наведений у табл. 3.
Таблиця 3
Прогнозні значення, знайдені з врахуванням помилок при обчисленні залишку на рахунку
04.09.2014
247
10023,6975
05.09.2014
248
9978,76675
06.09.2014
249
9933,83598
07.09.2014
250
9888,9052
08.09.2014
251
9843,97442
09.09.2014
252
9799,04365
10.09.2014
253
9754,11287
11.09.2014
254
9709,1821
12.09.2014
255
9664,25132
13.09.2014
256
9619,32055
14.09.2014
257
9574,38977
15.09.2014
258
9529,45899
16.09.2014
259
9484,52822
17.09.2014
260
9439,59744
18.09.2014
261
9394,66667
19.09.2014
262
9349,73589
20.09.2014
263
9304,80512
В ході даної лабораторної роботи було визначено коваріаційну матрицю оцінок параметрів моделі.
Для цього було розраховане y теоретичне, і обчислено відхилення (Ui). Отримані результати наведені у табл. 4.
Таблиця 4
Проміжні дані для розрахунку
Дата
X
Y
Y теор.
Ui (Y-Yт)
06.08.2014
218
10191,38
11326,69
-1135,31
09.08.2014
221
11252,78
11191,898
60,8823049
10.08.2014
222
12289,85
11146,967
1142,88308
11.08.2014
223
11437,38
11102,036
335,343856
12.08.2014
224
12195,45
11057,105
1138,34463
13.08.2014
225
11197,38
11012,175
185,205408
16.08.2014
228
10286,6
10877,382
-590,78227
17.08.2014
229
10811,08
10832,451
-21,37149
18.08.2014
230
9934,43
10787,521
-853,09071
19.08.2014
231
10720,65
10742,59
-21,939938
20.08.2014
232
10223,03
10697,659
-474,62916
23.08.2014
235
9793,05
10562,867
-769,81684
24.08.2014
236
11129,68
10517,936
611,74394
25.08.2014
237
11102,05
10473,005
629,044716
26.08.2014
238
10836,55
10428,075
408,475492
27.08.2014
239
9683,15
10383,144
-699,99373
30.08.2014
242
10192,98
10248,351
-55,371405
31.08.2014
243
9827,93
10203,421
-375,49063
01.09.2014
244
9142,1
10158,49
-1016,3899
02.09.2014
245
10233,1
10113,559
119,540922
03.09.2014
246
11451,35
10068,628
1382,7217
(6)
= 523355,34
Коваріаційна матриця:
19094612
-81927,883
-81927,883
351,981495
Було знайдено стандартні помилки оцінок параметрів моделі:
= 4369,7382; = 18,76117.
На рис. 1 відобрадено динаміку прогнозних значень залишку депозитних коштів на рахунку в банку.
Рис.1. Прогноз залишку депозитних коштів на рахунку в банку
ВИСНОВКИ
В даній лабораторній роботі я набув практичних навичок із визначення впливу помилок при вимірюванні пояснювальних змінних на параметри лінійної регресії. Для встановлення доцільності використання методу найменших квадратів, були проведені розрахунки на виявлення гетероскедастичності. Шляхом порівняння критерія та було визначено, що гетероскедастичність відсутня ( ).
За допомогою методу найменших квадратів було отримано наступне рівняння : Y = 21215,9 - 45,336*Х. На основі даного рівняння було розраховано прогнозні дані залишку депозитних коштів до 20 вересня 2014 року (табл. 2).
За допомогою методу інструментальних змінних було виведено рівняння : Y = 21121,599 - 44,93*X. Аналогічно, було побудовано прогнозні значення залишку депозитних коштів (табл. 3).
Порівнюючи дані табл. 2 та табл. 3. можна сказати, що значення відрізняються, проте не суттєво.
На основі даних табл. 4 було побудовано графік, на якому відображено динаміку прогнозних значень залишку депозитних коштів на рахунку в банку.
Окрім того було побудовано коваріаційну матрицю оцінок параметрів моделі. На основі коваріаційної матриці знайдено стандартні помилки оцінок параметрів моделі: = 4369,7382; = 18,76117.
Оскільки стандартна помилка оцінки параметра становить близько 18,8 %, а стандартна помилка вільного члена є меншою за його абсолютну величину в кілька разів, то можна стверджувати, що оцінка параметра не має зміщення щодо його істинного значення.
.