МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
Національний університет «Львівська політехніка»
Інститут прикладної математики та фундаментальних наук
Кафедра прикладної математики
ЛАБОРАТОРНА РОБОТА № 2
з дисципліни «Прикладна економетрика»
Тема:
Кореляційно-регресійний аналіз
Варіант - 7
Виконалв:
cт. гр. ЕФІм-12
Мукан А.Р.
Перевірила:
доц. Гайдучок О.В.
ЛЬВІВ – 2014
ТЕОРЕТИЧНІ ВІДОМОСТІ
На практиці при моделюванні різних процесів, що відбуваються в економіці, техніці, суспільному житті часто доводиться досліджувати взаємозв’язки між різними характеристиками, факторами, показниками. Взаємозв’язок, при якому кожному значенню одного показника відповідає чітко визначене значення другого, називається функціональним. Взаємозв’язок, при якому кожному значенню однієї величини відповідають декілька значень іншої, називається статистичним. Наприклад, одному значенню довжини тіла (зріст) людини може відповідати декілька значень її маси і навпаки.
Статистичний метод, який використовується для дослідження взаємозв’язків, називається кореляційним аналізом. Кореляційний аналіз полягає у визначенні ступеня зв’язку між двома випадковими величинами та .
Графічне зображення результатів спостережень у прямокутній системі координат, де кожна пара результатів відображається точкою, називають діаграмою розсіяння, або кореляційним полем. Візуальний аналіз кореляційного поля дає змогу якісно оцінити форму, спрямованість та тісноту взаємозв’язку.
Спрямованість взаємозв’язку визначається із залежності між результатами вимірів. Якщо у випадку збільшення одного показника збільшується другий − пряма залежність, спрямованість додатня. Збільшення одного результату викликає зменшення другого результату виміру − обернена залежність, спрямованість від’ємна.
Для оцінки тісноти взаємозв’язку в кореляційному аналізі використовується абсолютна величина (модуль) спеціального показника − коефіцієнта кореляції, який обчислюється наступним чином.
Нехай відомі результати n спостережень над двома статистичними змінними X та Y. Результат і-го спостереження задається парою значень .
1. Для визначення ступеня зв’язку між змінними потрібно графічно дослідити дані. Для цього відповідні їм точки наносять на графік. Дані є емпіричними, тому в результаті не отримається чітко виражена лінія, оскільки завжди будуть присутні відхилення залежної змінної, які викликані помилками вимірюваннь, впливом неврахованих величин та випадкових факторів. Якщо на отриманому рисунку взаємозв’язок між величинами близький до лінійного, то будують лінійну регресію. Тобто будується рівняння виду:
(1)
2. Коефіцієнти визначають за формулами:
, (2)
де,
Після знаходження рівняння лінії регресії її наносять на графік із точковими даними.
3. Коефіцієнт кореляції між змінними X та Y обчислюється за формулою
, (3)
де ( середні вибіркові, ( середні квадратичні відхилення ( ( вибіркові дисперсії).
Кореляція – це безрозмірна величина, абсолютне значення якої знаходиться в межах від 0 до 1. Коефіцієнт кореляції дає кількісну оцінку статистичного взаємоз’язку між результатами вимірів.
Основні властивості коефіцєнта кореляції:
.
Залежність між змінними тим сильніша, чим ближче до одиниці.
Знак коефіцієнта кореляції показує спрямованість зв’язку між змінними. Якщо , то має місце пряма залежність, якщо – протилежна.
Якщо досліджувані статистичні змінні незалежні, то .
Для практичних досліджень і висновків користуються такими границями значень коефіцієнта кореляції:
− кореляція відсутня, тобто нема взаємозв’язку між досліджуваними змінними;
− дуже слабкий взаємозв’язок;
− слабший від середнього – середній взаємозв’язок;
− середній – вищий від середнього взаємозв’язок;
− сильний статистичний взаємозв’язок;
− функціональний (жорсткий) взаємозв’язок.
4. Квадрат коефіцієнта кореляції називають коефіцієнтом детермінації. Цей коефіцієнт обчислюють за формулою:
. (4)
Коефіцієнт детермінації визначає міру лінійної залежності, тобто ту частину загальної варіації одного показника, яка пояснюється варіацією іншого показника. Стверджують, що тільки взаємозв’язку результатів вимірів пояснюється їх взаємним впливом, а решта варіативності залежить від інших факторів.
5. Оцінка адекватності прийнятої економетричної моделі проводиться до допомогою критерію Фішера, спостережуване значення обчислюється за формулою
, (5)
де n – кількість спостережень, m – кількість факторів, що впливають на показник (у нашому випадку 1).
Для перевірки гіпотези порівняти два значення – обчислене із табличним. Табличне значення виписується із критичних значень F-розподілу Фішера із ступенями вільності , у нашому випадку
Якщо , то із ймовірністю 0.95 можна вважати, що економетрична модель адекватна статичним даним.
6. Для статичної оцінки значущості коефіцієнта кореляції використовується критерій Ст'юдента. Розрахункове значення обчислюється за формулою ,
де n – кількість спостережень, m – кількість параметрів рівняння регресії (у нашому випадку 2).
Табличне значення виписується із критичних значень розподілу Ст'юдента із ступенями вільності . у нашому випадку
Якщо , то із ймовірністю 0.95 можна вважати, що коефіцієнт кореляції є статично значущим.
ПОСЛІДОВНІСТЬ ВИКОНАННЯ ЛАБОРАТОРНОЇ РОБОТИ
На основі статистичних даних проводимо кореляційно-регресійний аналіз зв’язку між введеними в дію основними фондами підприємств та прибутком:
Встановлюємо форму зв’язку та математичне рівняння зв’язку шляхом побудови графіка кореляційної залежності між основними фондами (фактор x) і прибутком (фактор y).
Знаходимо оцінки параметрів a і b рівняння парної лінійної регресії
Розраховуємо теоретичні значення показника і будуємо теоретичну лінію регресії.
Обчислюємо коефіцієнт кореляції r і оцінюємо щільність зв’язку між фактором x і показником y.
Обчислюємо коефіцієнт детермінації.
За допомогою критерію Фішера з ймовірністю 0.95 оцінюємо адекватність прийнятої економетричної моделі статистичним даним.
Використовуючи t-статистику, оцінюємо значущість коефіцієнта детермінації r з ймовірністю 0.95.
Таблиця 1
Вихідні дані та проміжні розрахунки
№ п-ва
Основні фонди,
Прибуток п-ва,
1
23
67
1541
529
0,85
-14,7
-12,495
2
21
76
1596
441
-1,15
-5,7
6,555
3
0
32
0
0
-22,15
-49,7
1100,855
4
42
178
7476
1764
19,85
96,3
1911,555
5
61
193
11773
3721
38,85
111,3
4324,005
6
21
48
1008
441
-1,15
-33,7
38,755
7
11
24
264
121
-11,15
-57,7
643,355
8
26
132
3432
676
3,85
50,3
193,655
9
14
39
546
196
-8,15
-42,7
348,005
10
27
78
2106
729
4,85
-3,7
-17,945
11
17
46
782
289
-5,15
-35,7
183,855
12
28
117
3276
784
5,85
35,3
206,505
13
24
102
2448
576
1,85
20,3
37,555
14
17
48
816
289
-5,15
-33,7
173,555
15
11
134
1474
121
-11,15
52,3
-583,145
16
25
98
2450
625
2,85
16,3
46,455
17
15
32
480
225
-7,15
-49,7
355,355
18
18
55
990
324
-4,15
-26,7
110,805
19
14
23
322
196
-8,15
-58,7
478,405
20
28
112
3136
784
5,85
30,3
177,255
Середнє значеня
22,15
81,7
2295,8
641,55
-
-
Сума 9722,9
Рис. 1. Кореляційна залежність між основними фондами і прибутком, теоретична лінія регресії
Таблиця 2
Показники для проведення кореляційно-регресійного аналізу зв’язку між основними фондами та прибутком підприємств
Показник
Значення показника
коефіцієнти
3,2210498
10,353746
дисперсії
150,9275
2391,41
середні квадратичні відхилення
12,28525539
48,90204495
коефіцієнт кореляції
r
0,809197652
коефіцієнт детермінації
D
65,48008394
критерій Фішера
F
34,14381161
μr
0,138483685
критерій Ст'юдента
t
5,843270627
ВИСНОВКИ
Провівши кореляційно-регресійний аналіз зв’язку між введеними в дію основними фондами двадцяти підприємств та прибутком можна зробити наступні висновки:
Коефіцієнт кореляції між змінними та становить 0,809, отже наявний сильний статистичний взаємозв’язок. , має місце пряма залежність.
Коефіцієнт детермінації становить 65,48%. Він визначає міру лінійної залежності, тобто ту частину загальної варіації одного показника, яка пояснюється варіацією іншого показника. Отже, тільки 65,48% взаємозв’язку результатів вимірів пояснюється їх взаємним впливом, а решта 34,52 % варіативності залежить від інших факторів.
Критерій Фішера становить 34,1438. Табличне значення у нашому випадку 4,41. Отже, : 34,14384,41, тобто із ймовірністю 0,95 можна вважати, що економетрична модель адекватна статичним даним.
Критерій Ст'юдента становить 5,84327. Табличне значення у нашому випадку 2,10. Отже, : 5,843272,10 , тобто із ймовірністю 0.95 можна вважати, що коефіцієнт кореляції є статично значущим.