Множинна лінійна регресія

Інформація про навчальний заклад

ВУЗ:
Національний університет Львівська політехніка
Інститут:
Інститут прикладної математики та фундаментальних наук
Факультет:
РТ
Кафедра:
Кафедра прикладної математики

Інформація про роботу

Рік:
2014
Тип роботи:
Лабораторна робота
Предмет:
Економетрика
Група:
ЕФІм-12

Частина тексту файла (без зображень, графіків і формул):

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ Національний університет «Львівська політехніка» Інститут прикладної математики та фундаментальних наук Кафедра прикладної математики          ЛАБОРАТОРНА РОБОТА № 3 з дисципліни «Прикладна економетрика» Тема: «Множинна лінійна регресія» Варіант - 7      Мета роботи: навчитися будувати регресійні моделі з більш ніж однією незалежною змінною, перевіряти незалежні змінні на наявність мультиколінеарності та оцінювати невідомі параметри моделі. Завдання до роботи Економічний показник y залежить від трьох факторів (табл.1). Вибір показників здійснити відповідно до варіанту. На основі статистичних даних за 16 періодів побудувати кореляційну матрицю. Використовуючи критерій  з надійністю P=0,95 оцінити наявність загальної мультиколінеарності. Якщо існує загальна мультиколінеарність, то, використовуючи t-статистику з надійністю P=0,95, виявити пари факторів, між якими існує мультиколінеарність. Якщо такі пари існують, то один із факторів цієї пари виключити із розгляду. Використовуючи МНК в матричній формі знайти параметри множинної регресії. Використовуючи критерій Фішера, з надійністю P=0,95 оцінити адекватність прийнятої математичної моделі статистичним даним. Якщо модель адекватна статистичним даним, то, використовуючи t-статистику з надійністю P=0,95, оцінити значущість параметрів регресії. Знайти значення прогнозу показника для заданих значень факторів. Зробити висновок. Порядок виконання роботи Вхідні дані містяться у табл. 1. Таблиця 1 Вхідні дані Вартість основних засобів, тис.грн. х1 Оборотність дебіторської заборгованості, тис. грн, х2 Виробничі затрати, тис. грн., хз Фінансовий результат, y  2,61 10,32 6,71 7,95  4,97 11,96 8,14 10,75  6,55 13,96 8,95 11,66  9,16 14,62 8,83 13,49  10,68 15,18 10,95 17,44  13,93 17,34 10,92 19,05  16,27 19,21 11,75 21,42  18,74 20,36 14,05 23,85  21,31 22,21 14,09 27,92  22,88 22,84 14,6 27,27  25,13 22,63 14,38 30,04  26,28 24,93 16,57 32,83  27,71 24,94 15,51 31,89  30,01 25,27 15,44 35,21  32,08 26,18 16 37,27  33,74 27,61 17,59 38,99  36,31 29,23 17,97 ?  1. Знайдемо кореляційну матрицю, яка визначає зв’язок між трьома факторами.  Для знаходження коефіцієнтів кореляції використовують статистичну функцію CORREL(КОРРЕЛ)(блок1;блок2). 1 0,993774 0,977244  0,993774 1 0,987744  0,977244 0,987744 1   2. Для дослідження загальної мультиколінеарності між факторами використовується - критерій, розрахункове значення якого знаходять за формулою: розр, де n – кількість значень факторів; m – число факторів. Для обчислення визначника матриці скористатися формулою MDETERM(МОПРЕД). det (K) = 0,000283 розр = -(16-1-(2*3+5)/6)*LN(0,000283) = 107,5511 Табличне значення -критерію знаходять для заданої ймовірності =0,05 і числа ступенів вільності k за допомогою статистичної функції CHISQ.INV(ХИ2ОБР)(;k). табл. = 7,814727764 Оскількироз = 107,5511> табл. = 7,8147, то з надійністю Р=0,95 можна вважати, що між факторами існує загальна мультиколінеарність. 3. Для з’ясування питання, між якими факторами існує мультиколінеарність, використовується t-критерій. Необхідно визначити для трьох пар факторів три розрахункових значення статистик t12, t13, t23. Для знаходження t-статистики між двома факторами спочатку знаходиться матриця, обернена до кореляційної матриці . Після чого знаходяться частинні коефіцієнти кореляції , де , ,  — елементи матриці [Z]. Для цих частинних коефіцієнтів знаходиться t-статистика . Для знаходження оберненої матриці скористатися функцією MINVERSE(МОБР). Зауважимо, що натискання клавіші Enter не забезпечує введення формули масиву. 85,94356 -100,57 15,34963  -100,57 158,734 -58,5071  15,34963 -58,5071 43,78974   Звідси, = 0,861047, = -0,25021, = -0,70176. = 5,865499,  = -0,89523, = -3,41228. Для визначення табличного значення t-критерію для ймовірності =0,05 і числа ступенів вільності k скористатись формулою TINV(СТЬЮДРАСПОБР). = 2,178812827 Після цього кожне з розрахункових значень t12 , t13 , t23 порівнюють з табличним tтабл. Якщо tij > tтабл, то між факторами  та  існує мультиколінеарність. Для усунення мультиколінеарності один з факторів виключають з розгляду. Оскільки t12 > tтабл – між факторами існує мультиколінеарність, тому ми виключаємо один з факторів з розгляду. Тому ми викидаємо з розгляду другий фактор – оборотність дебіторської заборгованості. 4. Тепер показник y залежить від двох факторів  і . Припустимо, що між y та  і  існує лінійна залежність: yˆ = + + Знайдемо параметри регресії , використовуючи МНК в матричній формі за формулою:  1 2,61 6,71 7,95  1 4,97 8,14 10,75  1 6,55 8,95 11,66  1 9,16 8,83 13,49  1 10,68 10,95 17,44  1 13,93 10,92 19,05  1 16,27 11,75 21,42  1 18,74 14,05 23,85  1 21,31 14,09 27,92  1 22,88 14,6 27,27  1 25,13 14,38 30,04  1 26,28 16,57 32,83  1 27,71 15,51 31,89  1 30,01 15,44 35,21  1 32,08 16 37,27  1 33,74 17,59 38,99   Далі транспонуємо матрицю Х і множимо її на матрицю Х, отримуємо: 16 302,05 204,48  302,05 7218,0529 4352,043  204,48 4352,0433 2781,368   При формуванні матриці Х перший стовбчик буде одиничним, у наступні стовбці заносимо відповідні значення фактора. Для знаходження транспонованої матриці використати формулу TRANSPOSE(ТРАНСП), для обчислення добутку матриць формулу MMULT( МУМНОЖ). Обертаємо отриману матрицю і отримуємо: 5,487736 0,2405865 -0,7799  0,240587 0,0129964 -0,03802  -0,7799 -0,038023 0,117191   Потім перемножуємо транспоновану матрицю та матрицю Y: 387,03  8809,2551  5438,0082   Потім отримуємо матрицю-стовпець оцінок параметрів лінійної регресії: 2,2309839  0,8332792  0,4872959   Отже, = 2,2309839, = 0,8332792, = 0,4872959. Знайшовши параметри регресії, можна підставити їх в рівняння регресії і знайти розрахункові значення показника y (позначимо їх  ). yˆ = 2,2309839+0,8332792+0,4872959 Значення  представлені у табл. 2. Таблиця 2 Теоретичні та допоміжні значення  ( - y̅) ( - y̅) (y - ) (Y-)²  7,675598 -16,5138 272,7048 0,274402 0,075296  10,33897 -13,8504 191,8337 0,41103 0,168945  12,05026 -12,1391 147,3581 -0,39026 0,152304  14,16664 -10,0227 100,4551 -0,67664 0,457848  16,4663 -7,72308 59,64594 0,973704 0,948099  19,15983 -5,02954 25,29627 -0,10983 0,012064  21,51416 -2,67521 7,156755 -0,09416 0,008867  24,69314 0,503769 0,253783 -0,84314 0,710892  26,85416 2,664789 7,101098 1,065836 1,136007  28,41093 4,221558 17,82155 -1,14093 1,301728  30,17861 5,989231 35,87089 -0,13861 0,019212  32,20406 8,01468 64,2351 0,625945 0,391807  32,87911 8,689736 75,51151 -0,98911 0,97834  34,76154 10,57217 111,7707 0,448458 0,201114  36,75932 12,56994 158,0034 0,510684 0,260798  38,91736 14,72798 216,9135 0,07264 0,005277  387,03  1491,932  6,828598   Прогнозне значення на 17 період: = 41,24406. Розрахунки проведені правильно, оскільки сума теоретичних значень дорівнює сумі вхідних значень y = 387,03. 5. Оцінимо модель на адекватність, використовуючи критерій Фішера  Табличне значення Фішера знаходимо для ймовірності =0,05 і числа ступенів вільності k1=m, k2=n-m-1 за формулою F.INV(FРАСПОБР). F = 873,9319, а табличне значення Фішера дорівнює 3,49. Оскільки, Fpозр = 873,9319> Fтаб = 3,49, то прийнята модель адекватна і її можна використовувати для економічного аналізу. 6. Розглянемо значущість параметрів регресії  за допомогою t-статистик, які описуються формулами: , (9) де  – діагональний елемент матриці ;  – середньоквадратичне відхилення статистичних даних від розрахункових, яке обчислюється за формулою   = 0,891013745. =1,262481– вплив параметра на показник y не значний, = 9,689572– значний, =1,886996- вплив параметра на показник y не значний. tтабл. = 2,178812827 Кожне з розрахункових значень t0, t1, t2 порівнюють з табличним tтабл. Якщо ti>tтабл, то вплив параметра  на показник  значний. 7. Для визначення прогнозного значення показника, необхідно підставити прогнозні значення факторів в рівняння регресії. Прогнозне значення на 17 період: y17= 41,24406. ВИСНОВКИ На даній лабораторній роботі я навчився будувати регресійні моделі з більш, ніж однією незалежною змінною, перевіряти незалежні змінні на наявність мультиколінеарності та оцінювати невідомі параметри моделі. На основі вхідних даних, було побудовану кореляційну матрицю К. Проведено перевірку існування загальної мультиколінеарності між факторами за допомогою - критерія. Оскількироз = 107,5511> табл. = 7,8147, то з надійністю Р=0,95 можна вважати, що між факторами існує загальна мультиколінеарність. Для з’ясування питання, між якими факторами існує мультиколінеарність, використовується t-критерій. Для трьох пар факторів було визначено три розрахункових значення статистик t12, t13, t23. Після цього кожне з розрахункових значень t12 , t13 , t23 порівнюють з табличним tтабл. Якщо tij > tтабл, то між факторами  та  існує мультиколінеарність. Для усунення мультиколінеарності один з факторів виключають з розгляду. Оскільки t12 > tтабл – відповідно між факторами існує мультиколінеарність, тому ми виключаємо один з факторів з розгляду. В даному випадку з розгляду викидаємо другий фактор – оборотність дебіторської заборгованості. Тепер показник y залежить від двох факторів  і . Припустимо, що між y та  і  існує лінійна залежність, яка описується даним рівнянням множинної регресії: yˆ = + +. Знайдено параметри рівняння: = 2,2309839, = 0,8332792, = 0,4872959. Знайдені параметри регресії, були підставлені в рівняння регресії і знайдені розрахункові значення показника y (позначимо їх  ): yˆ = 2,2309839+0,8332792+0,4872959. На основі отриманого рівняння регресії обчислено теоретичні значення yˆ. Розрахунки проведені правильно, оскільки сума теоретичних значень дорівнює сумі вхідних значень y =387,03. Проведено оцінку моделі на адекватність, використовуючи критерій Фішера. Оскільки, Fpозр = 873,9319> Fтаб = 3,490294821, то прийнята модель адекватна статистичним даним і її можна використовувати для економічного аналізу. Оцінено значущість параметрів регресії  за допомогою t-статистик. =1,262481– вплив параметра на показник y незначний, = 9,689572– значний, =1,886996- вплив параметра на показник y незначний. Визначено прогнозне значення показника, шляхом підстановки прогнозних значень факторів в рівняння регресії. Прогнозне значення на 17 період: y17= 41,24406.
Антиботан аватар за замовчуванням

24.07.2020 10:07-

Коментарі

Ви не можете залишити коментар. Для цього, будь ласка, увійдіть або зареєструйтесь.

Ділись своїми роботами та отримуй миттєві бонуси!

Маєш корисні навчальні матеріали, які припадають пилом на твоєму комп'ютері? Розрахункові, лабораторні, практичні чи контрольні роботи — завантажуй їх прямо зараз і одразу отримуй бали на свій рахунок! Заархівуй всі файли в один .zip (до 100 МБ) або завантажуй кожен файл окремо. Внесок у спільноту – це легкий спосіб допомогти іншим та отримати додаткові можливості на сайті. Твої старі роботи можуть приносити тобі нові нагороди!
Нічого не вибрано
0%

Оголошення від адміністратора

Антиботан аватар за замовчуванням

Подякувати Студентському архіву довільною сумою

Admin

26.02.2023 12:38

Дякуємо, що користуєтесь нашим архівом!