Міністерство освіти і науки України
Національний університет “Львівська політехніка”
РЕГРЕСІЙНИЙ АНАЛІЗ
МЕТОДИЧНІ ВКАЗІВКИ
з курсу “Математичні методи оптимального планування”
для студентів спеціальностей
8.080202 “Прикладна математика”
7.080204 та 8.080204 “Соціальна інформатика”
Затверджено
на засіданні кафедри
прикладної математики
Протокол № 3 від 15 жовтня 2009р.
Львів – 2009
Регресійний аналіз: Методичні вказівки з курсу “Математичні методи оптимального планування” для студентів спеціальностей 8.080202 “Прикладна математика”, 7.080204 та 8.080204 “Соціальна інформатика” / Укл.: І.П. Мединський, І.М. Задворняк. – Львів: Видавництво Національного університету “Львівська політехніка”, стор. 26.
Укладачі
Мединський І.П., канд. фіз.-мат. наук, доц.,
Задворняк І.М.,ас.
Відповідальні за випуск
Строчик М.М., канд. фіз.-мат. наук, доц.
Рецензент
Каленюк П.І., д-р фіз.-мат. наук, проф.
1. Знаходження МНК-оцінок
Нехай задано набір кількісних величин і результатів вимірів, які об’єднанні в матрицю емпіричних даних
,
де – вектор результатів вимірів, а – матриця плану експерименту.
Розглянемо задачу побудови функції , яка б проходила через всі задані точки . Якщо вимагати, щоб функція проходила через дві точки, то одержимо задачу побудови прямої лінії. В загальному випадку, тільки поліном високого порядку може пройти через усі точки, але на практиці потрібно відшукати відносно просту функцію (лінійну), яка із задовільною точністю апроксимує статистичну залежність. У загальній постановці задача опису емпіричної залежності за допомогою параметричної функції регресії полягає в тому, що задається функція, що визначена з точністю до кількох параметрів, які підбирають таким чином, щоб одержана функція з максимальною точністю відповідала емпіричним даним. Цю функцію називають емпіричною регресією. Після вибору типу функції необхідно знайти такі значення параметрів , за яких функція регресії буде досить добре, а можливо, і найкращим чином описувати емпіричні дані. Для розв’язування цієї задачі необхідно задати критерій, який би визначав ступінь відповідності емпіричних даних і регресійної залежності. Тобто необхідно враховувати відхилення між вимірами і значеннями функції регресії , .
Якщо позначити відхилення , , то
, (1)
де – точне значення випадкової величини, а – наближене значення випадкової величини, – вектор похибок, – вектор параметрів, – сукупність точок, в яких проводяться спостереження.
Формули (1) можна подати в матричній формі:
. (2)
Рівність (2) визначає вигляд функції регресії, а також те, яким чином входять похибки у модель спостережень. Природно вважати, що вектор розподілений за нормальним законом із параметрами , тобто , а . Для лінійної регресійної моделі використовуватимемо позначення .
У випадку, коли компоненти вектора є некорельованими і мають однакову дисперсію , модель має вигляд і називається класичною лінійною регресійною моделлю. Тут – одинична матриця порядку .
Використовуватимемо позначення для тих точок , в яких функція набуває найменшого значення (якщо воно існує).
Вектор
(3)
називається емпіричною оцінкою невідомих параметрів , отриманих за методом найменших квадратів або МНК-оцінкою. Термін емпірична МНК-оцінка підкреслює, що процедура знаходження МНК-оцінок для лінійної регресійної моделі, взагалі кажучи, не потребує додаткових припущень на вектор . Важливим є те, що для лінійної регресійної моделі МНК-оцінка є розв’язком лінійної системи рівнянь.
Лема 1. Вектор є розв’язком системи рівнянь
. (4)
Д о в е д е н н я.
Розглянемо функцію
. Ця функція визначена на і невід’ємна, а тому вона досягає мінімуму. Знайдемо мінімум функції :
.
Записуючи ці рівняння в матричному вигляді, отримаємо (4). Систему рівнянь (4) називають нормальною.
Якщо матриця невироджена, то говорять, що матриця має повний ранг, тобто , де – кількість параметрів моделі. Лінійну регресійну модель з такою матрицею називають невиродженою або моделлю повного рангу. Стандартною МНК-оцінкою параметрів називають вектор
(5)
Позначимо через множину всіх лінійних незміщених оцінок параметра . Оцінка (5) для класичної лінійної регресійної моделі є незміщеною оцінкою, тобто . Але не кожна лінійна статистика , де – задана матриця, є незміщеною оцінкою . Умови на матрицю визначає наступна лема.
Лема 2. Нехай задана класична лінійна регресійна модель . Тоді умова:
, (6)
є необхідною і достатньою умовою незміщеності статистики .
Д о в е д е н н я.
Знайдемо
. (7)
Нехай , тобто є лінійною незміщеною оцінкою. Тоді з умови маємо рівність
. (8)
Співвідношення (7) справджується для довільного вектора . Підставивши замість в (8) послідовно вектори , одержуємо покоординатно співвідношення (6).
Нехай тепер виконується співвідношення (6). Покажемо, що . На підставі (6) і (7) маємо , тобто .
Нехай – випадковий вектор розміру зі скінченною дисперсією , – стала матриця розміру , – сталий вектор.
Обчислимо дисперсію вектора
(9)
Маємо
.
Отже, для вектора визначеного формулою (9)
. (10)
Знайдемо дисперсію лінійної статистики в моделі . За допомогою (10) одержимо .
У випадку класичної лінійної регресійної моделі , тому
. (11)
Для стандартної МНК-оцінки (5) матриця і, на підставі (11), маємо
.
Отже, дисперсія МНК-оцінки
. (12)
Найкращою лінійною незміщеною оцінкою (НЛН) параметрів (у випадку її існування) називається така оцінка , що для довільного . За яких умов існує оцінка і як вона пов’язана із оцінкою (5)? На це питання дає відповідь теорема Гауса-Маркова, яка є основним результатом для класичної лінійної регресійної моделі.
Теорема 1. Для класичної лінійної регресійної моделі повного рангу МНК-оцінка є НЛН оцінкою невідомих параметрів.
Д о в е д е н н я.
Нехай – довільна незміщена оцінка параметрів , а – МНК-оцінка (5), тобто . На підставі леми 2 маємо рівності і . З цих рівностей випливає, що , де . Дійсно .
Оцінимо дисперсію . Одержимо
.
Оскільки , то з останньої рівності випливає потрібна оцінка для дисперсії .
На практиці дисперсія в моделі є невідомою, тому необхідно користуватися оцінкою дисперсії.
Теорема 2. Статистика є незміщеною оцінкою дисперсії в класичній лінійній регресійній моделі повного рангу.
Д о в е д е н н я.
За допомогою рівностей (2) і (5) для вектора маємо
,
де , причому матриця ідемпотентна, тобто і . Перевіримо це.
.
.
Враховуючи таку властивість, маємо: .
Нагадаємо, що слідом квадратної матриці називається сума її діагональних елементів. Позначимо слід матриці через , тобто , де . Використовуватимемо ще таку властивість сліду матриць. Для матриць і , для яких існує і справджується рівність:
. (14)
Зауважимо, що оператори математичного сподівання та сліду матриці комутують між собою. Таким чином, за допомогою (13) і (14) та властивостей матриці маємо:
.
Отже, .
Наведемо приклади регресійних моделей, знаходження МНК-оцінок та оцінки дисперсії .
1. Лінійна регресія на відрізку:
, , .
; ; , ; .
2. Квадратична регресія на відрізку:
, , .
, ; , ;
.
Знайдемо МНК-оцінку для лінійної регресії на відрізку.
; ; ; ; ; .
У випадку, коли функція регресії має вигляд , , , , , , , . З таблиці нормально розподілених чисел беремо 6 величин: , , , , , . Тобто вважаємо, що результатами експериментів є числа ; ; ; ; ; .
Знайдемо МНК-оцінку параметрів регресії
;
; ;
.
Обчислимо значення статистики . Маємо
.
Отже,
.
2. Перевірка гіпотез про значення параметра лінійної регресії
Перевіримо гіпотезу про те, що тий параметр лінійної регресії дорівнює , тобто гіпотезу , при альтернативній гіпотезі . В даній моделі вектор , тобто розподілений за нормальним законом з математичним сподіванням і дисперсією . У випадку справедливості гіпотези маємо, що та компонента , де – й діагональний елемент дисперсійної матриці. Розглянемо два випадки:
Якщо значення відоме, то для перевірки гіпотези використовують статистику яка розподілена за стандартним нормальним законом;
Якщо значення невідоме, то для перевірки гіпотези використовують статистику яка має розподіл Стьюдента з параметром .
Нехай зафіксоване деяке число , , яким визначається рівень довіри при перевірці гіпотези . Гіпотеза відхиляється, якщо або , де – -квантиль стандартного нормального розподілу. Гіпотеза приймається, якщо або . При цьому ймовірність, що гіпотеза буде відхилена за умови, що вона вірна, дорівнює .
Функція розподілу для стандартного нормального розподілу має такий вигляд:
(15)
Функція розподілу Стьюдента з ступенями вільності визначається формулою:
, (16)
де , .
Для знаходження -квантиля розподілу, який задається функцією розподілу потрібно розв’язати рівняння
, (17)
Рівняння (17) для функції визначеного за формулами (15) і (16) має вигляд:
(18)
і відповідно
. (19)
3. Обчислення МНК-оцінок в моделях неповного рангу
Говорять, що лінійна регресійна модель є моделлю неповного рангу, якщо , де – кількість невідомих параметрів моделі. Лінійні регресійні моделі неповного рангу часто виникають в задачах дисперсійного аналізу. Опишемо спосіб знаходження МНК-оцінок для таких моделей, тобто розв’язку нормальної системи рівнянь
(20)
Припустимо, що ранг матриці рівний, . Вважатимемо, що перші стовпців матриці є лінійно незалежними. Позначимо , , тоді , а , де і .
Оскільки, , то стовпці матриці лінійно залежать від стовпців , тобто існує така матриця , що . Запишемо систему нормальних рівнянь (20) у вигляді
(21)
Перші рядків системи рівнянь (21) мають вигляд
(22)
Решта рівнянь системи (21) є лінійною комбінацією рівнянь (22). Отже, довільний розв’язок системи (22) є розв’язком системи (20). Домноживши вираз (22) зліва на , одержимо:
(23)
Оскільки, -вимірний вектор може бути вибраним довільним чином, то формулою (23) визначається -вимірний многовид розв’язків системи нормальних рівнянь (20).
Розглянемо приклад. Нехай функція регресії має вигляд: ; виміри проводяться в трьох точках ,, . Тоді:
; ; .
Запишемо систему у розгорнутому вигляді:
Третє рівняння є наслідком перших двох. Розв’язавши систему з двох рівнянь отримаємо:
,
Знайдемо тепер МНК-оцінку, використовуючи розглянуту методику.
, ; , де .
Тоді ;
; .
.
Отже, у випадку моделі неповного рангу, система нормальних рівнянь (20) має безліч розв’язків, тому вектор однозначно не визначається. Але виявляється, що значення не залежить від вибору розв’язку рівняння (20). Точніше кажучи, якщо і – два різні розв’язки системи нормальних рівнянь (20), то і , де .
З цього випливає, що довільний розв’язок системи (20) надає мінімум функції , а отже, є МНК-оцінкою. Зворотнє твердження про те, що кожна МНК-оцінка є розв’язком системи (20) є наслідком леми 1.
Для запису розв’язків системи неповного рангу (20) зручно використовувати псевдообернену матрицю . За допомогою псевдооберненої матриці розв’язок системи (20) записується так:
. (21)
Нагадаємо, що матриця називається псевдооберненою, якщо справджується рівність .
Таким чином, у випадку, коли оцінити окремо всі невідомі параметри моделі неможливо, але можна оцінити деякі лінійні комбінації невідомих параметрів. Тобто можна розглядати параметричну функцію вигляду , де – заданий -вимірний вектор.
Параметричну функцію називатимемо оцінюваною, якщо для неї існує лінійна незміщена оцінка вигляду , де . Необхідні і достатні умови оцінюваності параметричної функції визначаються наступною лемою.
Лема 3. Для моделі параметрична функція є оцінюваною тоді і тільки тоді, коли ℒ, де ℒ – сукупність всіх лінійних комбінацій стовпців матриці .
Наведемо твердження, яке випливає із попередніх міркувань та леми 3.
Теорема 3. Нехай задана класична лінійна регресійна модель , і – довільний розв’язок системи нормальних рівнянь (20). Тоді, для оцінюваної параметричної функції є правильними твердження:
Вигляд оцінки не залежить від вибору розв’язку системи нормальних рівнянь;
Статистика є НЛН-оцінкою параметричної функції .
Теорема 3 узагальнюється на випадок векторної параметричної функції , де – матриця розміру , рядки якої є лінійними комбінаціями рядків матриці . У цьому випадку, як випливає з леми 3, існує лінійна незміщена оцінка для , тобто є оцінюваною функцією.
Теорема 4. Нехай виконуються умови теореми 3. Тоді для оцінюваної векторної параметричної функції правильні наступні твердження:
Вигляд оцінки не залежить від вибору розв’язку системи нормальних рівнянь (20);
Статистика є НЛН-оцінкою векторної параметричної функції .
5. Перевірка лінійних гіпотез про значення параметрів нормальної регресії за допомогою F-критерію
Припустимо, що в схемі лінійної регресії вектор вимірів розподілений за нормальним законом , а матриця є матрицею не обов’язково повного рангу. Нехай – матриця розміру , і рядки матриці є лінійними комбінаціями рядків матриці , тобто існує така матриця розміру , що . Тоді за лемою 3 параметричні функції , , є оцінюваними (тут – рядки матриці ). Нехай – МНК-оцінка параметричної функції . За теоремою 3 , де .
Величина називається залишковою сумою квадратів. На підставі результатів попереднього пункту, залишкова сума квадратів і оцінка визначається однозначно.
Наведемо деякі властивості статистик і .
Теорема 5. Для схеми нормальної регресії у випадку, коли статистики і є незалежними випадковими величинами.
Лема 4. Нехай задано схему лінійної регресії . Тоді
,
де - МНК-оцінка векторної параметричної функції , – матриця, для якої справедливе зображення .
Лема 5. Для схеми регресії , в якій матриця розміру має ранг , статистика має розподіл з степенями вільності, тобто .
Задача перевірки загальних лінійних гіпотез про параметри лінійної регресії формулюється таким чином. Нехай задано схему регресії , де матриця має розмір і її ранг рівний , де . Матриця має розмір і ранг () та допускає зображення . Загальну лінійну гіпотезу про параметри моделі запишемо у вигляді
, (22)
де - деякий фіксований вектор висоти.
Для МНК-оцінки векторної параметричної функції виконуються умови леми 4, тобто .
.
Якщо гіпотеза (22) правильна, то статистика
ℱ=,
тобто розподілена за законом Фішера з степенями вільності, де матриця визначається за формулою .
Щільність розподілу Фішера зі ступенями вільності і має вигляд:
де , .
При виконанні гіпотези чисельник статистики ℱ є більшим за знаменник, причому величина відношення залежить від того, наскільки відрізняється від . Отже, великі значення статистики ℱ свідчать про те, що вибіркові дані суперечать гіпотезі .
Розглянемо процедуру знаходження статистики ℱ, яка не потребує знаходження МНК-оцінок параметричної функції . Ця процедура використовує наступну лему.
Лема 6. Нехай задано схему регресії і -матриця допускає зображення . Тоді , де – МНК-оцінка параметричної функції , матриця і , - фіксований вектор, .
Тепер статистику ℱ можна записати у вигляді
ℱ= . (23)
Таким чином, обчислення спостережуваного значення статистики ℱ потребує розв’язання двох задач на екстремум:
, .
Якщо при заданому рівні довіри знайти величину ℱ з умови P(ℱ>ℱ)=, де ℱ~, то гіпотеза приймається, коли ℱ<ℱ і відхиляється, коли ℱ>ℱ.
Задачі перевірки лінійних гіпотез про параметри лінійної регресійної моделі називають ще задачами дисперсійного аналізу.
Лабораторна робота № 1
Тема: Обчислення МНК-оцінки класичної лінійної регресійної моделі на відрізку
Розглядається класична лінійна регресійна модель з поліноміальною функцією регресії 5-го порядку , ; , — вектор похибок, компоненти якого мають нормальний розподіл, тобто , . — сукупність точок, в яких проводяться спостереження. Значення параметрів регресії для кожного варіанту задані в таблиці 1 (2 – 7 стовпці таблиці).
Для виконання роботи можна використовувати пакет прикладних програм Maple.
Хід роботи
1. Задаємо сукупність точок спостережень :
а) набір точок відрізку , що задовольняє умову ;
б) рівномірно розподілений набір точок на відрізку .
Приклад задання рівномірного набору точок , на відрізку :
> with(stats):
> randomize():
> x:=[random[uniform[-1,1]](n)]:
Для задання матриці плану експерименту
можна використати таку конструкцію:
> g:=(i,j)->x1[i]^(j-1):
> F:=matrix(N,6,g);
2. Моделюємо вектор похибок , , де має – нормальний розподіл.
Вектор можна задати таким чином:
> epsilon:=[random[normald[0,1]](n)]:
3. Обчислюємо вектор результатів спостережень , використовуючи дані з таблиці 1 та методику з пунктів 1, 2.
4. Обчислюємо МНК оцінку для вектора .
Для обчислення вектора результатів спостережень та МНК-оцінки можна використати такі функції Maple:
Функції
Значення, яке повертає функція
matrix(n,m,list)
матрицю з n стрічками та m стовпцями і елементами, які задані списком list
vector(n,list)
вектор з n елементами, які задані списком list
multiply(A, B) або evalm(A&*B)
матрицю, яка є добутком матриць А та В
іnverse(А) або evalm(1/A)
матрицю обернену до матриці А
transpose(A)
транспоновану матрицю до матриці А
det(A)
визначник матриці А
rank(A)
ранг матриці А
trace(A)
слід матриці А
Зауваження. Для роботи з матрицями потрібно підключити пакет розв’язування задач лінійної алгебри linalg таким чином:
> with(linalg):
Це треба зробити перед заданням матриць та використанням функцій для роботи з ними.
Звертання до елементів матриці таке ж як і звертання до елементів двовимірного масиву.
5. Порівнюємо дисперсії МНК-оцінок з пунктів 1 а) і 1 б).
6. Порівнюємо функції і
.
Для побудови графіків функцій (зокрема, для порівняння графіків функцій в пункті 6) можна використати таку функцію Maple: plot(f, h, v), параметри якої: f – функція, h – межі зміни , v – межі зміни .
Наприклад:
> plot(sin(x), x=0..2*Pi);
Можна також задати колір, стиль, систему координат тощо для графіка функції. Наприклад
> plot(cos(x), x=0..2*Pi,color=blue, style=point);
Дві функції можна зобразити і на одному графіку. Наприклад
> plot([sin(x),cos(x)], x=0..2*Pi,color=[red,blue], style=[line,point]);
Результати
Програма має вхідні дані: , , , . Потрібно передбачити вивід проміжних даних: матрицю плану , матрицю і її детермінант, МНК-оцінку . Порівняти значення функції регресії для вхідних параметрів і знайдених параметрів .
Форма звіту
Описати поняття, формули, методи і статистичні критерії, що застосовуються в пунктах 1 – 4. Вказати номер свого варіанту та істинне значення . Навести всі проміжні результати і порівняння графіків функцій регресій з пункту 6. Описати програмні засоби, що були використані в роботі.
Контрольні запитання
Дати означення лінійної регресійної моделі повного і неповного рангу.
Описати спосіб побудови МНК-оцінок для таких моделей.
Навести приклади лінійних регресій.
Вказати матрицю плану експерименту, вектор вимірів.
Таблиця 1
№
1
1
–1,4
2
3,2
4
0
2
2
–1
2
–1
3
5,2
2
3
3
1
0,8
2
–2
–0,2
3
0,5
4
2
1,4
0
–3
1
–0,5
–1
5
0,5
0
–1
2,4
1
2
1
6
1
–0,5
0
2
–1
3
0
7
2
–1
3
0
–3
0,5
1
8
–0,5
2
0,2
–1
–1
4
–2
9
1
–2
2
3,7
5,1
–1
–2
10
2
–1
3,3
0
–1
2
2
11
3,5
2
2
2
1
2
2,1
12
4
3
–1
1,1
2
0
1
13
1
1,6
0
–4
2
3
–1
14
2
0
0,2
1
5
–0,5
2
15
0,2
0,2
1
–2,5
3
1
1
16
–1
–1
5
2
–1
–4
2,8
17
2
2
–1,4
1
0
1,5
–1
18
0
2,8
2
4
2
1
3
19
1
3
–0,5
1
2
3
2
20
0
–2
2
2
–1
2
0
21
–0,5
0,5
2
1
3
–1
1
22
3
2
0,4
–1
3
4,5
–2
24
–1,2
2
0
4,8
3,2
–6
–1
25
3,5
–2
2,4
0
–5,4
5,4
3
26
–3,5
3,4
0,8
–5,6
0
3,2
–4
27
4,1
–3,5
5,6
4
0,7
3,7
1,5
28
–4,2
0
11
3,2
3,5
10
9
29
0,8
6,4
–12
0
0
11,8
0
30
0
–6,4
0
5,8
–6,4
–10
–5
31
2,3
0,8
4
0,8
7,5
–0,8
5
32
–2,3
–0,8
–2
10
0
0,7
9
33
7,4
0
3,4
–11
–0,8
5,6
0
34
5
5,6
–7,2
12,7
0
4
3
35
–5
3,5
0
3,5
0,8
3,5
–4
36
6,2
6,7
–2,4
0
7,2
2,4
8
37
–6,1
0
3,5
4,5
0
–6,4
4,5
38
1
–1
0
2,5
3,4
1,2
2
39
0
–2,3
–5,2
2,3
4,6
6,5
3
40
–0,8
7,5
0,8
4
0,8
–2,3
–4
41
–6
3,2
4,2
0
2
–1,6
–4
42
–2
9,3
0
0,8
4
0,8
8
43
–4,3
3,6
0
2,3
0,4
2,6
1,5
44
6,4
–9
0
9,3
0,8
–2,3
8
45
–0,5
2
1
1,5
4,2
1
3
Лабораторна робота № 2
Тема: Перевірка гіпотези про значення параметра нормальної регресії для класичної лінійної регресійної моделі
Для класичної лінійної регресійної моделі з поліноміальною функцією регресії 5-го порядку , перевірити гіпотезу , де – значення з таблиці 1 Додатку 1 (8 – 13 стовпці таблиці). , . Вважати, що параметри такі ж, як і в лабораторній роботі № 1.
Для виконання роботи можна використовувати пакет прикладних програм Maple.
Хід роботи
1. Вхідні дані і МНК-оцінку для вектора беремо з пунктів 1-4 лабораторної роботи №1.
2. Обчислюємо -квантилі з точністю до .
Для задання функції нормального розподілу можна використовувати такий фрагменти коду:
> Phi:=(x,mu,sigma)->int(exp(-(t-mu)^2/(2*sigma^2))/ sqrt(2*Pi*sigma^2),t=-infinity..x);
Для знаходження -квантиля нормального розподілу потрібно розв’язати рівняння (18). Для розв’язання рівняння в пакеті Maple можна використати функцію fsolve(f,x), де f – це рівняння (співвідношення ), а x – невідома змінна. Отже, знайти -квантиль розподілу можна з допомогою такого коду:
> fsolve(Phi(x,0,1)-(1-alpha/2),x);
Функцію розподілу Стьюдента можна задати так:
> F:=(x,m)->int((GAMMA((m+1)/2)/ (sqrt(m*Pi)*GAMMA(m/2)))
/(1+t^2/m)^((m+1)/2), t=-infinity..x);
Для знаходження -квантиля розподілу Стьюдента потрібно розв’язати рівняння (19).
3. Перевіряємо гіпотезу про значення параметра (див. 8 – 13 стовпці таблиці 1 Додатку 1), якщо дисперсія:
а) дорівнює 1;
б) невідома (використовуючи обчислені в пункті 2 квантилі розподілів для знаходження критичних точок при заданому рівні критерію).
4. Знаходимо найменше , при якому гіпотеза приймається (відхиляється).
Результати
Програма має вхідні дані: , , , і значення . Потрібно передбачити вивід проміжних даних: МНК-оцінку , значення квантилів нормального розподілу і розподілу Стьюдента з ступенями вільності, значення статистик і . Зробити висновки стосовно прийняття чи неприйняття гіпотези .
Форма звіту
Описати поняття, формули, методи і статистичні критерії, що застосовуються при перевірці гіпотез. Вказати номер свого варіанту та сформулювати гіпотезу . Навести всі проміжні результати і зробити висновки. Описати програмні засоби, що були використані в роботі.
Контрольні запитання
Дати означення рівномірного і нормального розподілу, квантиля розподілу, похибок I-го роду і II-го роду, рівня значущості критерія, класичної регресійної моделі, нормальної регресійної моделі, МНК-оцінки.
Дати означення класичної регресійної моделі, нормальної регресійної моделі, МНК-оцінки.
Сформулювати статистичні критерії для переірки гіпотези про значення параметрів нормальної регресії, якщо вибіркова дисперсія: а) відома; б) невідома.
Лабораторна робота № 3
Тема: Перевірка лінійних гіпотез про значення параметрів нормальної регресії за допомогою F-критерію
Нехай задана схема лінійної регресії, в якій матриця є не обов’язково повного рангу, а — матриця розміру , і . Використовуючи -критерій перевірити гіпотезу Вважати, що параметри такі ж, як і в лабораторній роботі № 1.
Для виконання роботи можна використовувати пакет прикладних програм Maple (зокрема, запропоновані фрагменти коду з лабораторних робіт №1 і №2) або мови програмування.
Хід роботи
1. Задаємо сукупність точок спостережень , а також їх кратності. Будуємо відповідну матрицю плану експерименту .
2. Моделюємо вектор похибок для вибраної кількості спостережень , де .
3. Обчислюємо вектор результатів спостережень , використовуючи дані з таблиці 1 і пунктів 1, 2.
4. Задаємо матрицю . Для цього необхідно згенерувати чисел за формулою
,
де — номер варіанту, — рівномірно розподілена випадкова величина.
5. Обчислюємо матрицю та вектор , взявши значення із знайдених раніше МНК-оцінок цих параметрів.
6. Обчислюємо значення статистики ℱ двома способами:
а) використовуючи МНК-оцінки,
б) використовуючи залишкову суму квадратів.
7. Знаходимо критичні значення і завершуємо перевірку гіпотези. Ймовірність похибки 1-го роду задаємо:
а) 0,05; б) 0,01.
Для задання функції розподілу Фішера зі ступенями вільності і можна використати такий фрагмент коду:
> F:=(x)->int(GAMMA((k1+k2)/2)*k1^(k1/2)*k2^(k2/2)/(GAMMA(k1/2)*
GAMMA(