РОЗДІЛ 7. ЛІНІЙНІ СИСТЕМИ ЗАГАЛЬНОГО ВИГЛЯДУ.
§1. Ранг матриці.
1. Базисний мінор. Мінор порядку матриці називається базисним, якщо , а всі її мінори порядку дорівнюють нулеві.
Зрозуміло, що матриця може мати декілька базисних мінорів, але всі вони мають один і той самий порядок. Далі, всі мінори, порядок яких перевищує , також дорівнюють нулеві. Доведемо це твердження методом математичної індукції. Припустимо, що всі мінори порядку , , дорівнюють нулеві. Будь-який мінор порядку можна розкласти за елементами якого-небудь рядка. Алгебраїчні доповнення до елементів цього рядка з точністю до знака збігаються з мінорами порядку , які, за припущенням індукції, дорівнюють нулеві, отже, дорівнює нулеві і мінор – го порядку.
2. Теорема про базисний мінор. Будь-який стовпчик –матриці будемо розглядати як вектор –вимірного арифметичного простору, а будь-який її рядок – як вектор –вимірного арифметичного простору.
Теорема. Будь-який стовпчик матриці є лінійною комбінацією стовпчиків, які ввійшли в базисний мінор.
Доведення. Позначимо стовпчики –матриці через , тобто . Нехай базисний мінор матриці має порядок , , і нехай в базисний мінор увійшли стовпчики та рядки з номерами . Треба показати, що будь-який стовпчик , , можна подати як лінійну комбінацію стовпчиків , тобто , або, в координатній формі,
.
Запишемо цю систему рівностей більш компактно:
. (1)
Складемо матрицю
і покажемо, що при всіх , , . Справді, якщо дорівнює одному зі значень , то як такий, що має два однакових рядки. Нехай тепер не дорівнює жодному зі значень . Тоді з точністю до порядку запису рядків та стовпчиків збігається з одним з мінорів порядку матриці . Переставивши місцями, якщо це потрібно, рядки та стовпчики визначника , дістанемо мінор матриці порядку , який дорівнює нулеві за умовою. може відрізнятися від цього мінору хіба що знаком, а тому також дорівнює нулеві. Отже, при всіх , , .
Розкладемо за елементами останнього рядка:
Оскільки , то звідси
.
Отримані рівності збігаються з шуканим розкладом (1) при . Теорему доведено.
Наслідок. Кожен рядок матриці є лінійною комбінацією рядків, які ввійшли в базисний мінор.
Для доведення цього наслідку досить застосувати теорему про базисний мінор до транспонованої матриці.
3. Теорема (обернена до властивості 8º визначників). Якщо для квадратної матриці , то принаймні один рядок цієї матриці є лінійною комбінацією решти її рядків.
Доведення. Якщо для квадратної матриці –го порядку , то порядок базисного мінору цієї матриці не перевищує . Звідси, принаймні один рядок матриці не перетинає базисного мінору. За теоремою про базисний мінор цей рядок є лінійною комбінацією рядків, які ввійшли в базисний мінор, отже, є лінійною комбінацією всіх решти її рядків. Теорему доведено.
4. Ранг матриці. Порядок базисного мінору матриці називається рангом цієї матриці і позначається .
Теорема про ранг матриці. Ранг матриці дорівнює максимальному числу лінійно незалежних стовпчиків цієї матриці.
Доведення. Нехай і – її базисний мінор. Покажемо спочатку, що матриця має не менше, ніж лінійно незалежних стовпчиків. Позначимо через матрицю детермінант якої збігається з базисним мінором матриці , , так що кожний стовпчик матриці є підмножиною елементів відповідного стовпчика матриці . Якби стовпчики матриці , які ввійшли в базисний мінор, були лінійно залежними, то лінійно залежними були б і стовпчики матриці , а тому, за властивістю 8º визначників, . За умовою , тому матриця має не менше, ніж лінійно незалежних стовпчиків.
Покажемо тепер, що матриця має не більше, ніж лінійно незалежних стовпчиків, тобто покажемо, що будь-які стовпчиків, , лінійно залежні. Для цього складемо матрицю з цих стовпчиків. Кожен мінор матриці є одночасно мінором матриці , тому , тобто . Це означає, що принаймні один стовпчик матриці не входить в базисний мінор цієї матриці, а тому , за теоремою про базисний мінор, цей стовпчик є лінійною комбінацією решти її стовпчиків, тобто стовпчики матриці лінійно залежні. Ці міркування справджуються для всіх , зокрема і при . Звідси, в матрицю входить не більше, як лінійно незалежних стовпчиків. Теорему доведено.
5. Теорема про ранг добутку матриць. Ранг добутку двох матриць не перевищує рангу жодного зі співмножників.
Доведення. Для –матриці та –матриці позначимо і покажемо, що . За означенням добутку двох матриць
.
Розгорнемо цей запис для –го стовпчика матриці , :
і перепишемо отриману систему рівностей у матричній формі так:
.
Звідси, кожний стовпчик матриці є лінійною комбінацією стовпчиків матриці . За лемою про лінійні комбінації серед векторів-стовпчиків матриці не може бути більше лінійно незалежних, ніж таких є серед векторів-стовпчиків матриці , тому, за теоремою про ранг матриці, . Повторивши наведені міркування з рядками матриці , отримаємо, що (виконати як вправу). Теорему доведено.
Наслідок. Ранг добутку будь-якої прямокутної матриці зліва чи справа на невироджену квадратну матрицю відповідного порядку дорівнює рангу матриці .
Справді, нехай . Звідси, , а з рівності отримуємо . Таким чином, .
6. Обчислення рангу матриці. Такі перетворення матриці називаються елементарними:
- множення рядка чи стовпчика на ненульове число;
- додавання до рядка (стовпчика) іншого рядка (стовпчика);
- зміна місцями двох рядків (стовпчиків).
Елементарні перетворення не змінюють рангу матриці. Справді, з властивостей визначників випливає, що кожний мінор матриці після виконання одного з елементарних перетворень або не змінює свого значення (при виконанні другого елементарного перетворення), або змінює знак на супротивний (при виконанні третього елементарного перетворення), або збільшує своє значення в разів (при множенні рядка чи стовпчика на число , ). Звідси, після виконання якого-небудь елементарного перетворення жоден ненульовий мінор не може перетворитися в нуль, а жоден нульовий мінор не може змінити свого значення, так що базисний мінор матриці залишається базисним і після виконання елементарного перетворення, а це означає, що ранг матриці не змінився.
Зазначимо, що за допомогою елементарних перетворень отримується найпростіший спосіб обчислення рангу матриці.
Приклад. Обчислити ранг матриці
.
Для знаходження рангу застосуємо елементарні перетворення до матриці . Помножимо другий стовпчик на 2 і результат додамо до першого стовпчика:
.
Помножимо тепер перший рядок на -2 і результат додамо до другого рядка, а потім – на -1 і додамо до третього рядка:
.
Помножимо другий рядок на -2 і додамо до третього:
.
В отриманій матриці всі мінори третього порядку дорівнюють нулеві, але є ненульовий мінор другого порядку
,
тому .
7. Максимальні лінійно незалежні підсистеми векторів. Нехай задано систему векторів , , , –вимірного лінійного простору. Складемо матрицю з координат цих векторів:
і знайдемо базисний мінор матриці . За теоремою про ранг матриці всі вектори, які ввійшли в базисний мінор матриці , лінійно незалежні. Якщо , то вектори лінійно незалежні. Якщо ж , то система векторів лінійно залежна, а максимальну лінійно незалежну підсистему утворюють вектори, які ввійшли в базисний мінор.
Приклад. Знайти максимальну лінійно незалежну підсистему системи векторів , , .
Матриця, складена з координат цих векторів, збігається з матрицею прикладу попереднього пункту. Оскільки , то вектори лінійно залежні. Максимальну лінійно незалежну підсистему складають вектори , які ввійшли в базисний мінор.
§2. Сумісні та несумісні лінійні системи.
1. Критерій сумісності. У першому розділі ми розглянули крамерові системи лінійних рівнянь, - системи, в яких число рівнянь збігається з числом невідомих, до того ж визначник системи не дорівнює нулеві, і показали, що єдиний розв’язок такої системи можна знайти або за правилом Крамера, або методом Гауса.
Перейдемо до дослідження систем лінійних алгебраїчних рівнянь в яких число рівнянь і число невідомих жодним чином не зв’язані між собою. Зокрема, будемо розглядати і такі системи, в яких число рівнянь збігається з числом невідомих, але визначник системи дорівнює нулеві.
Розглянемо систему лінійних рівнянь
, (2)
кількість невідомих в якій може бути меншою, більшою або дорівнювати числу рівнянь. Нагадаємо, що розв’язком системи (2) називається будь-яка сукупність чисел , при підстановці яких в систему (2) замість невідомих, кожне рівняння системи перетворюється в тотожність; система, яка має принаймні один розв’язок, називається сумісною; якщо ж система не має розв’язків, то вона називається несумісною.
Матриця
,
складена з коефіцієнтів при невідомих системи (2), називається матрицею системи, а матриця
,
яка отримується з матриці долученням стовпчика вільних членів, називається розширеною матрицею системи (2).
Теорема Кронекера-Капеллі. Система лінійних рівнянь сумісна тоді і лише тоді, коли ранг матриці системи збігається з рангом її розширеної матриці.
Доведення. Перепишемо систему (2) у такому вигляді
. (3)
Якщо стовпчики системи (3) розглядати як вектори -вимірного лінійного простору і позначити , , , то рівності (3) можна стисло записати у векторній формі:
. (4)
Припустимо, що система (2) має розв’язок . Тоді справджується рівність
,
тобто вектор є лінійною комбінацією векторів , тому . Звідси, , тобто максимальна лінійно незалежна підсистема системи векторів збігається з максимальною лінійно незалежною підсистемою системи векторів . За теоремою про ранг матриці .
Навпаки, нехай тепер . Це означає, що будь-який базисний мінор матриці є базисним і для розширеної матриці . З теореми про базисний мінор випливає, що стовпчик вільних членів є лінійною комбінацією тих стовпчиків матриці , які увійшли в базисний мінор, а тому є лінійною комбінацією всіх стовпчиків матриці :
. (5)
Порівнюючи останню рівність з рівністю (4), доходимо висновку, що набір коефіцієнтів лінійної комбінації (5) є розв’язком системи (2). Теорему доведено.
2. Максимальна лінійно незалежна підсистема. Нехай система (2) сумісна, тобто , . Не зменшуючи загальності, можна вважати, що базисний мінор матриці лежить у верхньому лівому кутку цієї матриці. Цього легко досягти, переставивши місцями рядки та стовпчики розширеної матриці. останніх рівнянь системи (2), які відповідають рядкам розширеної матриці , що не ввійшли в базисний мінор, не є незалежними рівняннями, а є наслідками перших рівнянь. Справді, за теоремою про базисний мінор кожний з останніх рядків розширеної матриці є лінійною комбінацією її перших рядків. Відповідно, кожне з останніх рівнянь системи є лінійною комбінацією перших рівнянь. Кожне з останніх рівнянь напевно перетвориться в тотожність при деяких значеннях невідомих, якщо при цих значеннях перетворюється в тотожність кожне з перших рівнянь. Навпаки, очевидно, що якщо - який-небудь розв’язок системи (2), то цей набір чисел є розв’язком системи, що складається з перших рівнянь.
Підсистема рівнянь системи (2), коефіцієнти яких увійшли в базисний мінор матриці, називається максимальною лінійно незалежною підсистемою системи (2).
Таким чином, система (2) і її максимальна лінійно незалежна підсистема еквівалентні, а тому всі рівняння, які не ввійшли в максимальну лінійно незалежну підсистему, можна опустити.
Приклад. Дослідити задану систему на сумісність та виділити еквівалентну їй максимальну лінійно незалежну підсистему:
.
Складемо розширену матрицю заданої системи
і знайдемо її ранг. Для цього помножимо перший рядок спочатку на -2 і результат додамо до другого рядка, а потім – на -3 і додамо до третього рядка:
Помножимо другий рядок на -1 і додамо до третього рядка:
.
У верхньому лівому кутку лежить ненульовий мінор другого порядку:
,
а у всі мінори третього порядку входить нульовий третій рядок, тому кожен з них дорівнює нулеві. Звідси, . Оскільки вказаний мінор другого порядку є і мінором матриці , то . Звідси, за теоремою Кронекера-Капеллі, задана система сумісна. Базисний мінор лежить у перших двох рядках, тому перших два рівняння лінійно незалежні, а третє рівняння є наслідком перших двох. Отже, задана система еквівалентна своїй максимальній лінійно незалежній підсистемі
§3. Системи лінійних однорідних рівнянь.
1. Підпростір розв’язків. Якщо вільні члени всіх рівнянь лінійної системи дорівнюють нулеві, то така система називається однорідною. Однорідна система
(6)
завжди сумісна. Справді, сукупність нулів є розв’язком системи (6). Цей розв’язок називається нульовим, або тривіальним.
Запишемо однорідну систему (6) у матричному вигляді
, (7)
де
Позначимо через –вимірний арифметичний простір стовпчиків висотою , так що кожний розв’язок однорідної системи можна розглядати як вектор простору .
Теорема. Множина всіх розв’язків лінійної однорідної системи утворює лінійний підпростір арифметичного простору .
Доведення. Множина розв’язків лінійної однорідної системи непорожня, оскільки їй належить нульовий розв’язок. Нехай , - два яких-небудь розв’язки системи (7), тобто , . З властивостей дій над матрицями випливає, що для довільних чисел ,
,
тобто довільна лінійна комбінація розв’язків системи (7) сама є розв’язком цієї системи, а це означає, що множина розв’язків однорідної системи є лінійним підпростором простору . Теорему доведено.
2. Вимірність підпростору розв’язків. Ранг матриці системи лінійних однорідних рівнянь будемо називати рангом цієї системи, а лінійний підпростір її розв’язків будемо позначати .
Лема. Якщо ранг лінійної однорідної системи дорівнює , то підпростір розв’язків цієї системи має лінійно незалежних векторів.
Доведення. Можна вважати, що базисний мінор матриці системи (6) лежить у верхньому лівому кутку. Тоді система (6) еквівалентна підсистемі перших рівнянь
. (8)
Якщо , то детермінант системи (8) не дорівнює нулеві і, за правилом Крамера, система має лише нульовий розв’язок. Отже, в цьому випадку підпростір розв’язків складається лише з нульового вектора, , тому , тобто вимірність підпростору розв’язків збігається з величиною .
Нехай тепер . Залишимо зліва перших доданків кожного рівняння системи (8), а всі решта доданки перенесемо направо:
. (9)
Невідомі назвемо базисними, а всі решта – вільними. Коефіцієнти лівих частин системи (9) утворюють визначник, який збігається з базисним мінором , , тому систему (9) можна розв’язати за правилом Крамера відносно невідомих :
Кожний елемент –го стовпчика визначника є сумою доданків. За властивостями визначників 5º, 7º цей детермінант дорівнює сумі відповідних детермінантів:
Таким чином,
(10)
Долучимо до рівностей (10) ще очевидних рівностей
і запишемо отриману систему рівностей в матричній формі:
(11)
Вільним невідомим можна надавати довільних значень, тому позначимо , , . Крім того, кожну матрицю-стовпчик рівності (11) розглядаємо як вектор лінійного простору , а саму рівність (11) – як векторну рівність:
, (12)
де , , , .
Складемо –матрицю з координат векторів .
.
Легко побачити, що ранг цієї матриці дорівнює максимально можливому значенню , оскільки в цю матрицю входить одинична матриця порядку , детермінант якої не дорівнює нулеві. За теоремою про ранг матриці, вектори лінійно незалежні. Враховуючи, що кожний вектор сукупності є розв’язком однорідної системи (8), то підпростір розв’язків однорідної системи має лінійно незалежних векторів. Лему доведено.
Теорема. Підпростір розв’язків лінійної однорідної системи є –вимірним лінійним простором.
Доведення. Нехай – який-небудь розв’язок системи (6), тобто для компонент цього розв’язку справджуються рівності (10). Покажемо, що система векторів лінійно залежна. Для цього складемо матрицю з компонент цих векторів:
Помножимо кожний з останніх рядків матриці на відповідно і результати додамо до –того рядка. З –тої рівності системи (10) випливає, що в результаті цього додавання –тий рядок матриці стане нульовим. Проробимо описані дії для всіх . В результаті таких елементарних перетворень матриці отримаємо матрицю, перші рядків якої нульові. Оскільки в матрицю входить одинична матриця порядку , то , а це означає, що вектори лінійно залежні. Позаяк вектори лінійно незалежні, то, за теоремою про лінійну залежність, вектор є лінійною комбінацією векторів :
. (13)
За наслідком з леми про лінійні комбінації, підпростір розв’язків системи (6) є –вимірним лінійним підпростором, а вектори є базисом цього підпростору. Теорему доведено.
Сформулюємо наслідок, який випливає з цієї теореми і який надалі буде відігравати важливу роль.
Наслідок. Для того, щоб система лінійних однорідних рівнянь з невідомими мала ненульові розв’язки, необхідно і досить, щоб визначник цієї системи дорівнював нулеві.
Справді, нехай в системі (6) і нехай визначник цієї системи дорівнює нулеві, . Тоді . Звідси, за щойно доведеною теоремою, , тобто система (6) має ненульові розв’язки. Навпаки, якщо ненульовий вектор є розв’язком системи (6), то для будь-якого числа вектор також є розв’язком цієї системи, тобто вимірність підпростору розв’язків не менша від одиниці: . Звідси , що рівносильно тому, що .
3. Загальний розв’язок однорідної системи. Зазначимо, що розв’язок (13) лінійної однорідної системи отримується з рівності (12) при відповідних значеннях параметрів . Іншими словами, будь-який розв’язок однорідної системи можна отримати з рівності (12) певним вибором значень довільних постійних . Саме завдяки цій властивості рівність (12) називається загальним розв’язком лінійної однорідної системи. Базис підпростору розв’язків однорідної системи називається фундаментальною системою розв’язків. Зрозуміло, що будь-який інший базис підпростору розв’язків також буде фундаментальною системою розв’язків.
§4. Неоднорідні системи лінійних алгебраїчних рівнянь.
1. Зв’язок між розв’язками неоднорідної та зведеної однорідної систем лінійних рівнянь. Розглянемо сумісну неоднорідну систему лінійних алгебраїчних рівнянь
. (14)
Системі (14) можна однозначно співставити однорідну систему
, (15)
яка називається зведеною.
Запишемо системи (14), (15) в матричній формі:
,
,
де , , .
Теорема 1. Сума будь-якого розв’язку неоднорідної системи та будь-якого розв’язку зведеної однорідної системи є розв’язком неоднорідної системи.
Доведення. Нехай – який-небудь розв’язок неоднорідної системи , а – розв’язок відповідної зведеної однорідної системи . Підставимо суму в ліву частину системи :
,
тобто є розв’язком системи (14).
Теорема 2. Різниця будь-яких двох розв’язків неоднорідної системи є розв’язком зведеної однорідної системи.
Доведення. Нехай , – два довільні розв’язки неоднорідної системи (14). Підставимо різницю в ліву частину системи :
.
Теорему доведено.
2. Лінійний многовид розв’язків неоднорідної системи. Нехай – який-небудь розв’язок неоднорідної системи (14), а – довільний розв’язок зведеної однорідної системи (15) і розглянемо вектор
. (16)
Зафіксуємо вектор , а вектор будемо змінювати так, щоб він пробігав увесь лінійний підпростір розв’язків зведеної однорідної системи (15). За теоремою 1, кожний отриманий таким способом вектор є розв’язком неоднорідної системи (14). Покажемо, що формула (16) вичерпує всі можливі розв’язки неоднорідної системи (14). Справді, нехай – який-небудь розв’язок системи (14). За теоремою 2, вектор є розв’язком зведеної однорідної системи. Позначимо вектор через , . Тоді , тобто кожний розв’язок неоднорідної системи отримується за формулою (16).
Деталізуємо рівність (16). Нехай ранг зведеної однорідної системи (15) дорівнює і нехай фундаментальна система розв’язків цієї системи складається з лінійно незалежних векторів . Тоді рівність (16) можна переписати у такому вигляді:
. (17)
Рівність (17) задає всі розв’язки неоднорідної системи (14) – кожний розв’язок отримується при певних значеннях числових параметрів . Рівність (17) називається загальним розв’язком неоднорідної системи (14), а її окремий, хоч і довільний розв’язок називається частинним розв’язком. Таким чином, загальний розв’язок лінійної неоднорідної системи є сумою загального розв’язку зведеної однорідної системи та якого-небудь частинного розв’язку заданої неоднорідної системи.
Лінійна оболонка є –вимірним лінійним підпростором розв’язків зведеної однорідної системи, тобто -площиною, що проходить через початок координат. Сума визначає –площину, яка отримується паралельним зсувом підпростору розв’язків на вектор . Саме ця –площина і називається лінійним многовидом розв’язків неоднорідної системи (14).
Приклад. Знайти загальний розв’язок системи лінійних алгебраїчних рівнянь
Випишемо розширену матрицю заданої системи
Шляхом елементарних перетворень матриці отримуємо матрицю
Звідси , тобто система сумісна, до того ж базисний мінор
утворюється коефіцієнтами перших двох рівнянь, а третє рівняння є їх лінійною комбінацією. Таким чином, максимальна лінійно незалежна підсистема виглядає так:
Базисні невідомі залишимо зліва, а вільні невідомі перенесемо направо
і розв’яжемо отриману систему методом Гауса:
Долучимо до отриманих рівностей ще дві очевидні рівності:
Позначивши вільні невідомі через відповідно, перепишемо цю систему рівностей у матричній формі:
.
Будемо розглядати матриці-стовпчики як вектори. Позначимо , , , . Тоді отриману рівність можна переписати у векторній формі
Це і є загальний розв’язок заданої системи. Пара векторів утворює фундаментальну систему розв’язків, а є загальним розв’язком зведеної однорідної системи; вектор є частинним розв’язком заданої системи.
3. Метод найменших квадратів. Нагадаємо, що згідно з теоремою Кронекера-Капеллі, система (2) сумісна тоді і лише тоді, коли . Нехай . Тоді . Звідси, якщо , то така система, як правило, несумісна. З цієї причини, на перший погляд, нема жодного сенсу розглядати системи, в яких число рівнянь перевищує число невідомих. Однак це не так, бо існують задачі, які вимагають розгляду таких систем. Наведемо приклад. Припустимо, що деяка величина лінійно залежить від величин , , але значення постійних коефіцієнтів цієї залежності невідомі. Припустимо додатково, що значення величин можна виміряти, провівши відповідний експеримент. Проведемо серію з експериментів і позначимо результати вимірювання у –тому експерименті через . Тепер можна спробувати знайти невідомі коефіцієнти як розв’язок системи
. (18)
Відповідні теореми теорії ймовірностей гарантують, що кінцевий результат вимірювань буде тим точнішим, чим більше буде проведено незалежних вимірювань. Тому, як правило, система (18) має більше рівнянь, ніж невідомих.
Розглянемо систему
, (19)
для якої . Оскільки система (19) несумісна, то для неї можна знайти лише наближений розв’язок – такі значення невідомих, при яких ліві частини системи (19) якнайменше відрізняються від правих частин. Для більш точної постановки задачі перепишемо систему (19) у такому вигляді:
.
Позначимо , ,, , і будемо вважати, що вектори є векторами –вимірного евклідового простору зі скалярним добутком , , . Тоді ліві частини системи (19) є компонентами вектора . Позначимо . Тоді . Звідси зрозуміло, що вектор буде найменше відрізнятися від вектора лише у тому випадку, коли довжина вектора буде мінімальною, а це можливо лише тоді, коли є ортогональною проекцією вектора на підпростір . Таким чином, для наближеного розв’язання системи (19) потрібно знайти такі значення невідомих , при яких вектор є ортогональною проекцією вектора на підпростір . З попереднього розділу відомо, що ортогональна проекція вектора на підпростір знаходиться зі системи
. (20)
Система (20) називається системою нормальних рівнянь. Таким чином, знаходження наближеного розв’язку системи (19) зводиться до розв’язування нормальної системи (20) рівнянь з невідомими.
Підсумовуючи, можна сказати, що запропонований спосіб розв’язування системи (19) зводиться до мінімізації величини
,
яка називається середньоквадратичним відхиленням і зовнішній вигляд якої спричинився до назви методу.
Приклад. Розв’язати методом найменших квадратів систему рівнянь
.
Згідно з нашими позначеннями, , . Нормальна система складається з одного рівняння
,
тобто , звідки .