МІНІСТЕРСТВО ОСВІТИ, НАУКИ, МОЛОДІ ТА СПОРТУ УКРАЇНИ
ЧЕРКАСЬКИЙ ДЕРЖАВНИЙ ТЕХНОЛОГІЧНИЙ УНІВЕРСИТЕТ
Кафедра комп’ютерних технологій
РОЗРАХУНКОВО-ГРАФІЧНА РОБОТА
з дисципліни:
„Самоорганізація прогнозуючих моделей ”
на тему:
„ Моделювання технологічних процесів на прикладі дослідження процесу зварювання вибухом із застосуванням МГУА ”
ЗМІСТ
Вступ…………………………………………………………………………................3
1. Постановка задачі………………………………………………………...…............4
2.Теоретичні відомості ……………………………………………………………......6
2.1 Регресійний аналіз в MS Excel………………………………………………........6
2.2 Комбінаторний алгоритм МГУА (COMBI)………………………………..........10
3. Побудова регресійної моделі в MS Excel ………………………………..............12
4. Побудова моделі в програмі «IDENT»……………………………………….......15
5. Побудова моделі за комбінаторним алгоритмом в COMBI ………………….…16
Висновки……………………………………………………………………………....17Література…………………………………………………………...………………18
ВСТУП
Метою розрахунково-графічної роботи є спроба виявлення залежності геометричних характеристик хвилястої поверхні між зварювальними плитами від розташування та розміру плит, а також від кількості вибухівки. Паралельно проводиться дослідження властивостей комбінаторного алгоритму МГУА при застосуванні до вищеописаної задачі. Вхідними величинами є товщини основної плити та флаєра, зазор між ними та кількість вибухівки на одиницю маси флаєра. Вихідні величини – це амплітуда та довжина хвилі.
Проведена ідентифікація моделі за допомогою комбінаторного алгоритму МГУА, головна перевага якого полягає у тому, що він виконує повний перебір усіх можливих моделей, усіх можливих лінійних за коефіцієнтами залежностей вихідних величин від вхідних, тому є оптимальним і не має похибки. В якості основного критерію був обраний критерій регулярності, в якості допоміжного – критерій мінімуму зміщення.
Побудова моделей проводилась за допомогою засобів: MS Excel, IDENT, COMBI, Matlab.
Постановка задачі
Для відшукання математичної моделі зварювання вибухом ми скористалися даними таблиці 1. Вибірка має розмір 6×16. Іранські вчені провели структурну ідентифікацію моделі залежності геометрії зварювального шва від товщин плит, відстані між ними та кількості вибухівки трьома різними способами, у одному з яких використовувався дворівневий алгоритм МГУА. Особливість даної роботи полягає у тому, що для відшукання закономірностей використовується комбінаторний алгоритм МГУА, який ґрунтується на самоорганізації моделей. Термін “самоорганізація” означає, що для визначення моделей використовуються дві вибірки даних і, крім того, вони обробляються по черзі. Оцінки коефіцієнтів поліноміальної моделі отримуються на одній вибірці, а структура моделі та кількість її аргументів обираються на другій. За такого способу обробки двох вибірок послідовно враховуються два критерії перебору множини моделей-кандидатів: зовнішній критерій похибки моделі та критерій її зміщення . Зміщення моделі рівне нулеві, якщо модель виявляється на двох вибірках однією і тією ж. Критерії точності та незміщенності не залежать один від одного.
Було вирішено застосувати до даних комбінаторний алгоритм МГУА. Комбінаторний алгоритм має переваги над багаторядним, які полягають у тому, що він використовує для відшукання оптимальної моделі метод повного перебору. Спочатку з усіх можливих лінійних за параметрами моделей обирається невелика множина найточніших, а потім застосовується довизначення оптимальної моделі за критерієм мінімуму зміщення.
Пригадаємо, як відбувається зварювання вибухом (рис 1). Спочатку активується детонатор, що призводить до вибуху. Вибух розганяє флаєр, причому буфер запобігає утворенню механічних, температурних та хімічних пошкоджень флаєра. Розігнана плита флаєра з великою силою зіштовхується із основною плитою і в результаті з’єднується з нею. Таким чином утворюється хімічно чисте з’єднання двох плит. При цьому поверхня зварювання виявляється не рівною, а дещо хвилястою. Довжина та амплітуда хвиль, що утворюються – вихідні величини нашого експерименту, вони мають порядок десяти та ста мікрон відповідно.
Таблиця 1
Початкова вибірка даних
ВИХОДИ
ВХОДИ
Номер випробування
Амплітуда (мікрон)
Довжина хвилі (мікрон)
Зазор (мм)
Кількість вибухівки на одиницю маси флаєра (г)
Товщина флаєра (мм)
Товщина основної плити (мм)
1
10
200
3
0,8
3
6
2
20
230
6
1,5
3
6
3
30
280
6
0,8
6
6
4
35
290
3
1,5
6
6
5
10
200
6
0,8
3
12
6
35
270
3
1,5
3
12
7
16
240
3
0,8
6
12
8
40
310
6
1,5
6
12
9
16
260
6
1,5
3
12
10
25
300
3
1,5
6
12
11
12
220
6
0,8
3
6
12
40
270
3
1,5
3
6
13
20
260
3
0,8
6
6
14
40
300
6
1,5
6
6
15
10
200
3
0,8
3
12
16
20
200
6
0,8
6
12
2.Теоретичні відомості
Регресійний аналіз в MS Excel, IDENT
Регресійний аналіз - розділ математичної статистики, присвячений методам аналізу залежності однієї величини від іншої.
Регресійний аналіз використовується в тому випадку, якщо відношення між змінними можуть бути виражені кількісно у виді деякої комбінації цих змінних. Отримана комбінація використовується для передбачення значення, що може приймати цільова (залежна) змінна, яка обчислюється на заданому наборі значень вхідних (незалежних) змінних. У найпростішому випадку для цього використовуються стандартні статистичні методи, такі як лінійна регресія. На жаль, більшість реальних моделей не вкладаються в рамки лінійної регресії. Наприклад, розміри продажів чи фондові ціни дуже складні для передбачення, оскільки можуть залежати від комплексу взаємозв'язків множин змінних. Таким чином, необхідні комплексні методи для передбачення майбутніх значень.
Мета регресійного аналізу
Визначення ступеня детермінованості варіації критеріальної (залежної) змінної предикторами (незалежними змінними).
Пророкування значення залежної змінної за допомогою незалежної.
Визначення внеску окремих незалежних змінних у варіацію залежної.
Регресійний аналіз не можна використовувати для визначення наявності зв'язку між змінними, оскільки наявність такого зв'язку і є передумова для застосування аналізу.
Для регресійного аналізу в MS Excel є пакет аналізу: <Сервіс>, <Аналіз даних>, <Регресія>
Для регресійного аналізу необхідно ввести:
вхідний інтервал Y інтервал змінної Y;
вихідний інтервал X матриця моделі;
мітки — якщо в діапазон даних включено заголовки стовпчиків потрібно поставити галочку. Дуже рекомендується для полегшення аналізу.
константа нуль — відмічаємо коли вільний член рівняння дорівнює нулю.
рівень надійності — рівень достовірності, стандартно 95%.
параметри виводу — вибираємо, де мають виводитись результати аналізу: на поточному робочому листі, новому чи у новому файлі.
Результати аналізу складаються з трьох складових:
регресійна статистика:
множинний R — коефіцієнт кореляції;
R-квадрат — квадрат кофіцієнту кореляції, показує ступінь пояснення експериментальних даних моделлю;
нормований R-квадрат
,
має зміст „песимістичного прогнозу R-квадрату;
стандартна похибка — середньоквадратичне відхилення моделі;
спостереження — кількість експериментальних точок.
дисперсійний аналіз:
df — кількість ступенів свободи: на регресію, залишкова та загальна;
SS — сума квадратів відхилень між експериментальними та розрахованими згідно моделі значеннями;
MS — дисперсія
F — F-статистика;
значимість F — показує ймовірність можливості хибного висновку на основі одержаних даних.
результати регресійного аналізу:
Y-перетин — вільний член рівняння регресії;
X — член регресійної моделі. Кількість рядочків відповідає кількості функцій у моделі регресії;
коефіцієнти — коефіцієнти при відповідних членах регресійного рівняння;
стандартна похибка — середньоквадратична похибка при визначенні значення відповідного коефіцієнту регресійного рівняння;
t-статистика — t-статистика, показує значимість даного коефіцієнту;
P-значення — ймовірність можливості хибного висновку на основі одержаних даних.
Найкраще середньоквадратичне наближення функції декількох змінних поліномами заданого виду можна знаходити за допомогою програми IDENT.
Вхідні дані:
Req – режим:
req =1 – задаються всі дані;
req =2 – задаються тільки значення функції та вид поліному;
req =3 – задається тільки вид поліному;
Поліном задається у вигляді набору цифрових кортежів, де кожна цифра позначає номер відповідного аргументу (0-вільний член), а всі аргументи відповідного кортежу перемножуються.
num arg,num points- кількість аргументів, кількість точок(майбутніх рівнянь - кількість коефіцієнтів а полінома, включаючи а0);
matrix of arguments-матриця аргументів;
function values- значення функції;
num polynom coeff- кількість коефіцієнтів полінома(і=0-999-можлива степінь полінома);
polynom tip- тип полінома(вигляд) степінь ікса в поліномі.
2.2 Комбінаторний алгоритм МГУА (COMBI)
Блок-схема алгоритму наведена на рис.1. Вхідна вибірка даних являє собою таблицю яка містить N рівнів (точок) спостережень множини з М змінних. Вибірка поділяється на дві частини. Приблизно дві треті точок відносяться до навчальної підвибірки NA, а одна третина точок, що залишилися (таким чином - кожна третя точка) з такою ж варіацією формують перевірочну підвибірку NB. Перед розбиттям точки ранжуються за значенням варіації. Навчальна вибірка використовується для одержання оцінок коєфіциентів полінома, а перевірочна підвиборка використовується для вибору структури оптимальної моделі, для якої зовнішній критерій регулярності AR(s) приймає найменші значення.
(2)
або краще застосовувати критерій перекрестного контролю (cross-validation) PRR(s) (він бере до уваги всю інформацію з вибірки даних та може бути підрахований без перерахування матриці для кожної перевірочної точки):
Для побудови оптимальної моделі крім критеріїв точності використовують критерії незміщеності або узгодженості. Критерії цієї групи відображають вимогу, щоб кращі моделі, отримані на і , мінімально відрізнялися. Мінімум незміщеності коефіцієнтів має вигляд:
.
Найпоширеніша форма цього критерію - мінімум незміщеності рішень:
.
Для тестування моделі на відповідність за критерієм балансу вхідна вибірка даних поділяється на дві частини. Критерій вимагає вибору моделі, яка буде найбільш однаковою обох підвибірках. Критерій балансу буде знаходити єдину оптимальну фізичну модель тільки якщо вхідна вибірка зашумлена. Для отримання гладкої переборної кривої (рис. 1), яка дозволяє визначити правило зупинки переборної процедури, повний пошук проводиться на групах моделей однакової складності. Наприклад, перший рівень може використовувати інформацію з кожної одної колонки вибірки данних таким чином що повний пошук ведеться серед всіх можливих моделей виду:
, . (3)
Нелінійні члени можуть бути враховані як нові вхідні змінні у вибірці даних. Вихідна змінна визначається наперед експериментатором. На наступному рівні перебираються всі моделі виду:
, (4)
Моделі оцінюються на відповідність за критерієм і так далі, поки значення критерію зменшується.
2 3 4 5
Рис. 1. Комбінаторний алгоритм МГВА
1 – вибірка даних;
2 – ряди ускладнення часткових описів;
3 – форми часткових описів;
4 – вибір оптимальних моделей;
5 – додаткове визначення моделі за дискримінаційним критерієм.
Для обмеження часу обчислень було запропоновано під час повного перебору моделей рангувати змінні у відповідності до значень критерію після деякого часу обчислень або кількох рівнів ітерації. Потім процедура повного перебору продовжується для вибраної множини кращих змінних, поки мінімальне значення зовнішнього критерію не буде знайдене. Це дає можливість задавати значно більшу кількість змінних на вході та зберегти ефективні змінні між рівнями для знаходження оптимальної моделі.
Побудова регресійної моделі в MS Excel
Для побудови моделі про нормуємо дані.
Таблиця 1
Початкова вибірка даних
Номер випробування
Зазор (мм)
Кількість вибухівки на одиницю маси флаєра (г)
Товщина флаєра (мм)
Товщина основної плити (мм)
Амплітуда (мікрон)
x1
x2
x3
x4
y
1
3
0,8
3
6
10
2
6
1,5
3
6
20
3
6
0,8
6
6
30
4
3
1,5
6
6
35
5
6
0,8
3
12
10
6
3
1,5
3
12
35
7
3
0,8
6
12
16
8
6
1,5
6
12
40
9
6
1,5
3
12
16
10
3
1,5
6
12
25
11
6
0,8
3
6
12
12
3
1,5
3
6
40
13
3
0,8
6
6
20
14
6
1,5
6
6
40
15
3
0,8
3
12
10
16
6
0,8
6
12
20
max
6
1,5
6
12
40
Нормування
№
x1
x2
x3
x4
y
1
0,50000
0,53333
0,50000
0,50000
0,25000
2
1,00000
1,00000
0,50000
0,50000
0,50000
3
1,00000
0,53333
1,00000
0,50000
0,75000
4
0,50000
1,00000
1,00000
0,50000
0,87500
5
1,00000
0,53333
0,50000
1,00000
0,25000
6
0,50000
1,00000
0,50000
1,00000
0,87500
7
0,50000
0,53333
1,00000
1,00000
0,40000
8
1,00000
1,00000
1,00000
1,00000
1,00000
9
1,00000
1,00000
0,50000
1,00000
0,40000
10
0,50000
1,00000
1,00000
1,00000
0,62500
11
1,00000
0,53333
0,50000
0,50000
0,30000
12
0,50000
1,00000
0,50000
0,50000
1,00000
13
0,50000
0,53333
1,00000
0,50000
0,50000
14
1,00000
1,00000
1,00000
0,50000
1,00000
15
0,50000
0,53333
0,50000
1,00000
0,25000
16
1,00000
0,53333
1,00000
1,00000
0,50000
Перевірка
a0
a1
a2
a3
a4
y
-0,19536
-0,02917
0,84911
0,44583
-0,24250
8,93333
-0,19536
-0,02917
0,84911
0,44583
-0,24250
17,26667
0,302283
-0,142648
0,480296
-0,095365
0,207465
25,87597
0,302283
-0,142648
0,480296
-0,095365
0,207465
21,11571
0,364583333
0
0
0,45
-0,1104167
19,16667
0,364583333
0
0
0,45
-0,1104167
28,16667
0,285714286
0
0
0,45
0
20,42857
0,285714286
0
0
0,45
0
29,42857
Результати регресійної моделі :
Регрессионная статистика
Множественный R
0,811116522
R-квадрат
0,657910013
Нормированный R-квадрат
0,505870018
Стандартная ошибка
0,202781583
Наблюдения
14
Дисперсійний аналіз
df
SS
MS
F
Значимость F
Регрессия
4
0,711747024
0,177936756
4,327216763
0,031724302
Остаток
9
0,370083333
0,04112037
Итого
13
1,081830357
Коэффициенты
Стандартная ошибка
t-статистика
P-Значение
Нижние 95%
Верхние 95%
Нижние 95,0%
Верхние 95,0%
Y-пересечение
-0,19536
0,340552827
-0,573647103
0,580256706
-0,96574116
0,575026873
-0,965741159
0,575026873
Переменная X 1
-0,02917
0,219029143
-0,133163406
0,896994061
-0,52464501
0,466311677
-0,52464501
0,466311677
Переменная X 2
0,84911
0,238002958
3,567632726
0,0060466
0,310707047
1,387507239
0,310707047
1,387507239
Переменная X 3
0,44583
0,219029143
2,035497777
0,072289321
-0,04964501
0,941311677
-0,04964501
0,941311677
Переменная X 4
-0,24250
0,222136094
-1,091673105
0,303337487
-0,74500676
0,260006756
-0,745006756
0,260006756
Побудова моделі за допомогою програми «Ident»
Для побудови моделі було здійснено нормування даних.
regim
1
num arg,num points
4 14
matrix of arguments
0.50000 0.53333 0.50000 0.50000
1.00000 1.00000 0.50000 0.50000
1.00000 0.53333 1.00000 0.50000
0.50000 1.00000 1.00000 0.50000
1.00000 0.53333 0.50000 1.00000
0.50000 1.00000 0.50000 1.00000
0.50000 0.53333 1.00000 1.00000
1.00000 1.00000 1.00000 1.00000
1.00000 1.00000 0.50000 1.00000
0.50000 1.00000 1.00000 1.00000
1.00000 0.53333 0.50000 0.50000
0.50000 1.00000 0.50000 0.50000
0.50000 0.53333 1.00000 0.50000
1.00000 1.00000 1.00000 0.50000
function values
0.25000 0.50000 0.75000 0.87500 0.25000 0.87500 0.40000 1.00000 0.40000 0.62500 0.30000 1.00000 0.50000 1.00000
num polynom coeff
5
polynom tip
0 1 2 3 4
result:
polynom coefficients:
c(0)=0.302283 c(1)=-0.142648 c(2)=0.480296 c(3)=-0.095365 c(4)=0.207465
error=0.25
polynom values in points:
ff(0)=0.719622 ff(1)=0.474719 ff(2)=0.719622 ff(3)=0.599214
ff(4)=0.408149
ff(5)=0.648297 ff(6)=0.527156 ff(7)=0.726537 ff(8)=0.559564
ff(9)=0.714867
ff(10)=0.511882 ff(11)=0.599214 ff(12)=0.823354 ff(13)=0.692802
Побудова моделі за комбінаторним алгоритмом в COMBI
Для побудови моделі було здійснено нормування даних за максимальним значенням для кожної змінної.
21:49:40 5\06\2016
************** Results of the GMDH Combinatorial Algorithm **************
Data file name - data-1.txt
Number of variables M = 5
Number of functions MY = 1
Number of observations N = 14
Mode - Approximation
Main criterion - Unbiased
Second criterion - Disabled
Number of hidden points for validation = 2
Initial data sample (without validation subsample):
ЙНННННСНННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННН
є і 1 2 3 4 -5
ЗДДДДДЕДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДД
є 1 і 0.5000 0.5333 0.5000 0.5000 0.2500
є 2 і 1.0000 1.0000 0.5000 0.5000 0.5000
є 3 і 1.0000 0.5333 1.0000 0.5000 0.7500
є 4 і 0.5000 1.0000 1.0000 0.5000 0.8750
є 5 і 1.0000 0.5333 0.5000 1.0000 0.2500
є 6 і 0.5000 1.0000 0.5000 1.0000 0.8750
є 7 і 0.5000 0.5333 1.0000 1.0000 0.4000
є 8 і 1.0000 1.0000 1.0000 1.0000 1.0000
є 9 і 1.0000 1.0000 0.5000 1.0000 0.4000
є 10 і 0.5000 1.0000 1.0000 1.0000 0.6250
є 11 і 1.0000 0.5333 0.5000 0.5000 0.3000
є 12 і 0.5000 1.0000 0.5000 0.5000 1.0000
є 13 і 0.5000 0.5333 1.0000 0.5000 0.5000
є 14 і 1.0000 1.0000 1.0000 0.5000 1.0000
ИНННННПНННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННН
4 input variables and 1 functions are used:
------------------------------------------------------------
1 2 3 4 -5
Number of points in the training subsample - 7
Number of points in the test subsample - 7
Number of points in the validation subsample - 2
******************************************************************************
L 1 - Local min= 0.106E-01 - Model: 3
L 2 - min= 0.109E-01 - Model: 1 3
L 3 - min= 0.214E-01 - Model: 1 3 4
L 4 - min= 0.735E-01 - Model: 1 2 3 4
Trend of output: y = 0.4744505E+00 + 0.1983516E-01 * t
MSE of naive forecast = 0.7874352E-01
Selected models :
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Main criterion = 0.10590278E-01 Model 1 ( 3)
Additional criterion = 0.10000000+309
Mean square dev. (MSE) = 0.25419942E+00
Mean absolute dev. (MAE) = 0.21938776E+00
Correlation coefficient = 0.404703498
R^2 = 0.163784921
Mean relative dev. (MAPE) = 44.190 %
Ensemble of variables : 3
Polynomial coefficients:
ЙНННННННСНННННННННННННННННННСНННННННННН»
є і Coefficient і Variable є
ЗДДДДДДДЕДДДДДДДДДДДДДДДДДДДЕДДДДДДДДДД¶
є a 0 і 0.2857142857 і ДДД є
є a 1 і 0.4500000000 і X 3 є
ИНННННННПНННННННННННННННННННПННННННННННј
Errors on validation sample: MAPE = 75.71 % MSE =0.6177E-01
Model values calculated on validation subsample (not normilized):
ЙНННННСНННННННННННННСНННННННННННННСННННННННННННННН»
є No. і Calculated і Real value і Abs.deviation є
ЗДДДДДЕДДДДДДДДДДДДДЕДДДДДДДДДДДДДЕДДДДДДДДДДДДДДД¶
є 15 і 0.51071E+00 і 0.25000E+00 і -.26071E+00 є
є 16 і 0.73571E+00 і 0.50000E+00 і -.23571E+00 є
ИНННННПНННННННННННННПНННННННННННННПНННННННННННННННј
Calculated values of output on all subsamples (not normilized):
0.5107142857 0.5107142857 0.7357142857 0.7357142857 0.5107142857 0.5107142857 0.7357142857 0.7357142857 0.5107142857 0.7357142857 0.5107142857 0.5107142857 0.7357142857 0.7357142857 0.5107142857 0.7357142857
* Elapsed computation time - 0:00:01s65 *
* Happy End *
Висновки
Метою даної розрахунково графічної роботи була спроба виявлення залежності геометричних характеристик хвилястої поверхні між зварювальними плитами від розташування та розміру плит, а також від кількості вибухівки. Паралельно проводилися дослідження властивостей комбінаторного алгоритму МГУА при застосуванні до вищеописаної задачі. Вхідними величинами є товщини основної плити та флаєра, зазор між ними та кількість вибухівки на одиницю маси флаєра. Вихідні величини – це амплітуда та довжина хвилі.
Проведена ідентифікація моделі за допомогою комбінаторного алгоритму МГУА, головна перевага якого полягає у тому, що він виконує повний перебір усіх можливих моделей, усіх можливих лінійних за коефіцієнтами залежностей вихідних величин від вхідних, тому є оптимальним і не має похибки. В якості основного критерію був обраний критерій регулярності, в якості допоміжного – критерій мінімуму зміщення.
Література
Єфіменко С.М. Інструментальні засоби для дослідження та застосування методів моделювання за статистичними даними: дис. на здобуття ступеня канд. техн. наук : 05.13.06 «інформ. технології ». – МННЦ ІТС, 2009. – 147 с.
Урик Р.Дж. Основы гидроакустики. Л.: Судостроение, 1978. 370 с.
Mekhtiev A.Sh., Nizamov T.I. Autonomous Hydroacoustic Information System as Hardware for Sea Test-Side // Turkish Journal of Physics, 1996, vol. 20, № 8, p.823-827.