7. СИСТЕМНІ АСПЕКТИ ЗАСТОСУВАННЯ СТОХАСТИЧНОГО ТА ТЕОРЕТИКО-МНОЖИННОГО ПІДХОДІВ ДЛЯ ПОБУДОВИ МОДЕЛЕЙ "ВХІД-ВИХІД".

7.1.                            Основні задачі синтезу моделей "вхід-вихід" статичних систем на
основі експериментальних даних.

7.2.                            Особливості стохастичного підходу.

7.3.                            Основні етапи регресійного аналізу.

7.4.                            Методологія теоретико-множинного, інтервального підходу.

7.5.            Планування насичених експериментів у випадку інтервального
представлення вихідних змінних моделей статичних систем.

7.6.            Методологічні  аспекти  структурно1  щентифшаци  моделей
систем.

7.1. Основні задачі синтезу моделей "вхід-вихід" статичних систем на основі експериментальних даних

Найбільшого поширення серед моделей систем, що будуються в умовах невизначеності, набули статистичні та імовірнісні моделі типу "вхід-вихід", які задають залежність між вихідними показниками системи та и входами. Серед них можна виділити регресійні моделі, якими описують статичні (безінерційні) системи. При цьому висувають припущення, що систему можна описати функціональною залежністю у такому вигляді

y = η(xr,br,zr де y— вихідна змінна; x = (x1,...,xn)T- вектор вхідних змінних, які можна

змінювати в деякій обласп %\ b— вектор параметрів функцй rj; zrвектор

неврахованих або невизначених факторів, шумів, похибок (як правило) випадкової природи та ін.

Переважно кожна вихідна характеристика системи описується окремою функціональною залежністю. Тому надалі не обмежуючи загальності будемо розглядати моделі статичних систем з однією вихідною зміною.

Основою для побудови математичної моделі системи часто є результати експерименту, який можна зобразити у вигляді матриці значень вхідних та вектора значень вихідної змінної у всіх спостереженнях:

57

x11...x1n

х =


Y =


(7.1)

Рядкам матрищХ вщповщають вектори х{ (i = 1,...,N) вхідних змінних,

що при експериментуванні викликають відповідні значення вихідної змінної уг Комбшащю xri, yi називатимемо спостереженням. Загальна кількість комбшацш Af задає кількість спостережень експерименту.

Надалі експериментальні дані будемо розглядати у більш розширеному тлумаченні: - не лише як результат вимірювання значень змінних на реальній системі, але й як результати розрахунків на ЕОМ із застосуванням iMiTauiimoT моделі системи, дані експертного опитування і т.д.

Розглянемо три найпоширеніших задачі, що базуються на даних експерименту у вигляді (7.1) .

Представлення даних X, Y деякою функцією) f(xr, β називають задачею ідентифікації статичної системи. На сьогоднішній день виділяють задачі ідентифікації об'єкта в "широкому" тлумаченні, коли потрібно знайти вид

(структуру) функцй f{x,P) та п параметри β і найпростішу параметричну

задачу ідентифікації. У випадку параметрично1 щентиф1кацй структуру функції вважають відомою. Тоді задача ідентифікації зводиться лише до оцінювання невідомих параметрів. Вона розв'язується просто, якщо функція

f(xr,β) є лінійно-параметричною, тобто записується у такому вигляді

f(xr,βr)= Pi(px{x)+... + Ртсрт{х\                                                                                                   (7.2)

де q\{x\...,(pm{x) - відомі базисні функції; β1,..., βmневідомі параметри.

Очевидно, що в формулі (7.2) функцію f(xr,βr) можна задати деяким

скінченим рядом, наприклад f{x,P) є лінійною чи квадратичною функцією,

поліномом відомого степеня, рядом Фур'є та ін. Якщо функц1я f{x,/3) у

якийсь спосіб знайдена, то модель об'єкта вважається побудованою і для кожного спостереження можна, обчислити значення вихідної змінної

i=f(xri,β),                                                                                                                               (7.3)

тобто одержати вектор ^ i порівняти його з експериментальним вектором Y. Модель узгоджується з даними експерименту X,Y тим краще

чим  менша  різниця


 fi-Y


Унаслідок  цього  задачу  параметричної

ідентифікації  формулюють  так:  "за  даними  експериментуX,, Y  знаючи структуру (7.2) функцй f{x,/3), оцінити п параметри βr за умовою

 (7.4) де Ψ - деякий функціонал, що характеризує узгодження розрахункових

58

та фактичних значень виходу.

Задача щентифжацй ткно пов'язана із задачею планування експерименту. Для забезпечення найбільшої точності оцінок b параметрів Р   при  заданш  кшькост1  спостережень  необхідно  певним  чином

сформувати та реалізувати в процесі експерименту матрицю X значень вхідних змінних. Процедури формування цієї матриці на основі критеріїв, що забезпечують високу точність моделі або п параметр1в розглядаються в рамках теорії планування оптимального експерименту. Як правило, до проведення експерименту, матрицю X плану, що забезпечує певну точність оцінок параметрів, вдається знайти лише у випадку лінійно-параметричної функції виду (1.2). Таким чином задача планування оптимального експерименту формулюється так:  "дано структуру лінійно-параметричної

функцй f{x,/3), область χ можливої зміни вхідних змінних xr, кількість спостережень N, необхідно знайти матрицю плану експерименту X(xr е %) таку, щоб забезпечити найбільшу точність прогнозування моделі або точність оцінок b и параметр1в β ".

Під прогнозуванням моделі в даному випадку розуміємо розрахунок значень виходу y згідно формул (7.2) та (7.3) за фіксованими векторами

х r х поза експериментальними точками, але в межах області експерименту.

У ряді випадків дослідник має достатньо точну, але складну для використання модель об'єкта, зображену у вигляді аналітично заданого виразу у(х,а), таблищ X,Y чи програмно. Остання ситуація виникає при

імітаційному моделюванні складних об'єктів на ЕОМ, коли можна достатньо точно, але в межах похибок заокруглень обчислити відгук yi на довільну

комбінацію входів xri, тобто одержати таблицю X,Y. Такий спосіб моделювання об'єкта часто є єдино можливим, хоча й не завжди зручним для аналізу. За цих умов виникає задача наближення складної моделі об'єкта, заданої  таблицею,  бшын  простішою  математичною  моделлю  у  вигляді

функцй  f{x,P).  Зауважимо,  що  дана  задача  є  подібною  до  задачі

ідентифікації структури моделі. При цьому якість наближення як і в задачі ідентифікації  можна  задати  функціоналом  (7.4).  Спосіб  задання  умов

наближення полягає у забезпечені функцією f(xr,βr) певного значення точності  Ei  для  всіх  табличних  значень  xri.  В  цьому  випадку  задача

 < st, Vjc? .

наближення розв'язується за умов: yif(xri,

Очевидно, що така постановка задачі є реальною за умов одержання таблиці даних X,Y в результаті імітаційного моделювання на ЕОМ з відомими граничними похибками заокруглень εi.

59

7.2. Особливості застосування стохастичного підходу

Для розв'язування розглянутих задач ідентифікації, планування експерименту та наближення складних моделей простішими, часто використовується метод найменших квадратів (МНК). В МНК за критерій узгодження експериментальних і розрахункових даних прийнята сума квадратів відхилень:

За допомогою МНК при розв'язуванні задач1 щентиф1кацй модел1 у вигляді (7.2) оцінку b вектора невідомих параметрівβ отримуємо за формулою:

b = (FTF)1FTYr,                                                                                                                     (7.5)

де

F =


(7.6)

e матрицею значень базисних функцій моделі (7.2), розрахованих в точках експерименту, тобто на основі матриці X.

Дослідження МНК-оцінок b, або оцінок отриманих будь-яким іншим способом, проводиться на основі гіпотез про імовірнісну природу похибок в експериментальних даних, зокрема, методом регресійного аналізу. При проведенні регресійного аналізу розглядають певну модель невизначеності у вигляді похибки в даних. Найбільш вивченим є випадок адитивної випадкової похибки спостережень, такого вигляду:

y(xr) = yo(xr) + e = f(xr,βr) + e,                                             (7.7)

де  )yo(xr  -  істинне  значення  "виходу"  об'єкта,  задане  лінійно-

параметричною функцією (7.2); )y(xr- значення виходу, що спостерігається,

"змішане" з похибкою e.

В класичному лінійному регресійному аналізі вважають, що похибка е в ycix дослідах експерименту має нормальний розподіл з нульовим середнім і незалежним значеннями в серіях дослідів, тобто

M(ei) = 0,Μ(ei2) = σ2,Μ(ei,ej) = 0 i≠ j.                                                                          (7.8)

У  формулі  (7.8)    (.)M  -  означає  математичне  сподівання,  а  σ2-

дисперсію.

В літературі зустрічаються і менш жорсткі обмеження стосовно властивостей випадкової похибки e.

Якщо похибка задовольняє умови (7.7) та (7.8), то МНК-оцінка b є ефективною і незміщеною оцінкою вектора β і має нормальний розподіл з параметрами

60

 cov{b} = де cov{br} - симетрична, розмірності (mxm) коваріаційна матриця оцінок

Ъ , діагональні елементи якої визначають їхні дисперсії.

Коваріаційна матриця залежить від матриці значень базових функцій F і, відповідно, від матриці експерименту Х. Це дозволяє вводити критерії планування  оптимального  експерименту  за  умовою  мш1м1зацй  р1зних

характеристик матриці (FTF)−1. Найбільш вживаними є критерії, пов'язані з

визначником,  слідом  і  максимальним  числом  цієї  матриці,  відповідно, наведеними у такому вигляді

TF)−1,A=  Sp(FT F)−

D = det(FTF)−1,A = Sp(FT F)−1,E = maxλi(FTF)−1                                                                                                           (7.9)

Розглянуті критерії забезпечують характеристики точності оцінок параметрів моделі (7.2). Інші критерії планування експерименту безпосередньо стосуються точності прогнозування регресійної моделі і забезпечують мінімум середнього або максимального значення дисперсії прогнозування на області експерименту. Найбільш поширеними серед них є Q- та G-критерії оптимальності.

На сьогоднішній день задачі планування оптимальних регресійних експериментів є достатньо розробленими. Складено каталоги D-, А-, Е-, Q-,

G-оптимальних планів для випадку, коли функція f(xr, β) є поліном першого

та другого степеня.

Найбільш значних результатів досягнуто при плануванні насичених (N=m) регресійних експериментів, як найчастіше практично застосовуваних і найменш затратних.

7.3. Основні етапи регресійного аналізу:

I.Формулювання гіпотез:

Гіпотеза 1. Залежність між вхідними і вихідними змінними статичної системи описується лінійно-параметричною функцією:

()

Гіпотеза 2. Відомі дані експерименту представляються у вигляді матриці входу вектора виходу, компоненти якого отримуються у відповідності з формулою XY, при цьому похибка e є випадковою, нормально розділеною величиною з нульовим математичним сподіванням M(e) = 0, з постійною дисперсією σ2(e) = const, незалежними значеннями у Bcix спостереженнях 0cov(ei,e j) = 0.

Основним завданням регресійного аналізу є оцінювання невідомих параметрів моделі β і дослідження прогнозних властивостей цієї моделі Оцінки параметрів шукаються серед найкращих лінійних оцінок, тобто за такою формулою:

II. Знаходження оцінок параметрів моделі.

61

Цей  етап  може  виконуватися  із  застосуванням  методу  найменших квадратів за умови виконання гіпотези 2. Отримані оцінки параметрів моделі

-»  F                                                                                                                                                    r

повинні бути ефективними σ2(br)→ Fmin, незміщеними M(br) = β r , n →∞.

III. Аналіз точності оцінок параметрів моделі

Точність  оцінок  параметрів  визначається  коваріаційною  матрицею

D(b) = σ2 (e)• (FT F)−1Діагональні  елементи  цієї  матриці  визначають точність параметрів.

Геометричну інтерпретацію точності можна здійснити за допомогою довірчого еліпсоїда розсіювання

Q

(m,α)


b) = χ2(α,m)},

де α - довірча імовірність.

Чим бшыш розм1ри еліпсоїда розсіювання, тим менша точність оцінок параметрів.

IV.          Аналіз точності моделі

Оцінка точності моделі проводиться за допомогою функції дисперсії похибки прогнозування на основі моделі:

й{х) = фТ {!) D{b)- ф{х).

Якщо похибка e розподілена по нормальному закону, то для оцінки точності можна використати довірчий коридор прогнозування регресійної

модели  1^ = [y)(x) −  d(x) U(α); y)(x) +  d(x) U(α)],  де  U(α) −табличне

значення  нормованого  нормального закону розподілу, яке залежить  від довірчої ймовірності: α = 1 − p.

V.          Перевірка прийнятих гіпотез.

Перевірка адекватності моделі: відповідність прийнятої структури моделі ступенню відображення властивостей системи. При цьому аналізується значущість параметрів моделі за критерієм Стьюдента та адекватності за критерієм Фішера.

Для перевірки гіпотез про адекватність моделі спочатку оцінюємо дисперсію адекватності

i=1

де Nкількість спостережень;

m - кількість параметрів;

i - прогнозне значення виходу.

Тоді оцінюємо дисперсію похибки в даних

де yi - сподіване значення виходу.

Наведена формула справедлива за умови однорідності дисперсії на області експерименту.

Знаходимо  відношення  Sad2/Se2  і  порівнюємо  його  з  табличним 62

значенням F (α, N-m, m) F - розподілу. Якщо F (α, N-m, m) >Sad2/Se2, то

можемо із ймовірністю 1-α стверджувати, що вибрана структура моделі є задовільною, а модель - адекватна.

При аналізі структури моделі використовують також критерій Стьюдента  bi/ S(bi)≥t(α,N),  який  дозволяє  підтвердити  із  заданою

iMOBipmcTio значущість параметру. При цьому, оцінки дисперсій параметрів S(bi)   отримуємо  з  діагональних  елементів  коваріаційної  матриці

D(br) = σ2 (e) • (FT «F)"1, a t(a,N) - знаходимо в таблиці значень розподілу

Стьюдента.

Для перевірки прийнятих стохастичних властивостей похибки в експериментальних даних ("нормальність", "незалежність") використовують відповідно критерій Пірсона та розраховують коваріаційну матрицю оцінок похибок  )D(e. Якщо гіпотеза про "нормальність", або висунутий закон

розподілу похибки не справджується, то неможливо розрахувати довірчий інтервал. У випадку, коли діагональні елементи коваріаційної матриці вибіркових оцінок похибок сильно відрізняються (неоднорідність дисперсії), чи поза діагональні елементи не близькі до нуля (порушення умови "незалежності" спостережень), то для оцінювання параметрів моделі необхідно використати узагальнений МНК:

Ъ = (FTD−1(e)F)−1D(e)FTYr.

Незважаючи на практичну привабливість і наявність відповідного алгоритмічного і програмного забезпечення для реалізації стохастичних методів експериментальної ідентифікації моделей "вхід-вихід" статичних систем, побудованих на гіпотезах про імовірнісну природу похибок, достатньо часто їх застосування пов'язане з такими проблемами. По-перше для розрахунку достовірних оцінок статистичних характеристик об'єкта необхідні достатньо великі вибірки експериментальних даних, які не завжди можна отримати. По-друге існує клас об'єктів, коли припущення про iMOBipHicHy природу, адитивність похибок в експериментальних даних не відповідає реальним властивостям об'єкта. В останньому випадку побудова працездатної математичної моделі на основі стохастичних методів взагалі не можлива.

Достатньо повний аналіз причин обмежень при застосуванні традиційної статистики наведено у працях Орлова О.І.

Про те, що природа не підлягає правилам традиційної імовірності висловлювався відомий вчений в теорії систем і управління Калман Р. У випадку імітаційного моделювання, чи отримання даних в процесі опитування експертів, наприклад, при побудові моделей нових систем, модель з випадковою похибкою не відповідає дійсності. Дані імітаційного моделювання спотворені невипадковими похибками заокруглень, а дані опитування експертів задають інтервали можливих значень показників. Під час повторних опитувань експертів отримаємо однакові, але неточні результати. Аналогічно, при повторному імітаційному моделюванні, при

63

незмінному наборі вхідних даних результат обчислень буде таким самим, хоча й неточним за рахунок похибок заокруглень.

7.4. Методологія теоретико-множинного-інтервального підходу.

Розглянемо основні етапи інтервального аналізу в розширеному

ВИГЛЯД1.

I.Формулювання гіпотез:

Розглянемо основні припущення, на яких базуються методи аналізу інтервальних даних у випадку побудови моделей "вхід-вихід" статичних систем.

У вітчизняній літературі (скоріше всього) щ гшотези вперше були сформульовані в рамках теоретико-множинного підходу до задач параметричної ідентифікації працях Кунцевича В.М., Личака М.М., та дещо у більш розширеному вигляді (без умови адитивності обмеженої похибки) у працях Вощинина О.П.:

Гіпотеза 1. Статична система (об'єкт) описується лінійно-параметричним рівнянням

yo = β 1 х(xr) +... + βm срт(xr),                                                                                       (7.10)

де yo - істинне невідоме значення виходу системи; x е Rn - вектор вхідних зміннихД = (β1,...,βm)T  - вектор невідомих параметрів;

фТ{х) = {(рх{х),..., <рт(х)) T - вектор відомих базисних функцій.

Гіпотеза 2. Результати експерименту представлені у вигляді матриці X значень вхідних змінних і відповідних інтервальних значень вихідної змінної

У-

хп...х^

\п

r=

(7.11)

[••• xin

х =

...X


Nn;

Припускають, що в довільному  i-у спостереженні істинне значення виходу yoi = фТ{) Р нал ежить інтервалу[yi−,yi+], тобто yi < yoi ≤ yi+.

II. Знаходження множини оцінок параметрів моделі.

Завданням аналізу інтервальних даних є оцінювання невідомого вектора

Р так, щоб значення функцй у = фт {х)-]3 в точках експерименту належали відповідним  інтервалам  виходу.  Якщо  оцінка  вектора  β  існує,  то

одержану  функцію  y€(xr) = фт{х)-Ъ  називатимемо  моделлю  статичної системи.

Згідно  сформульованих  гіпотез,  шуканий  вектор   b   повинен задовольняти таку систему N нерівностей з m невідомими :

64

у; <b1<p1(xi) + K+ + bmm(xri)≤yi+;                                                                                                       (7.12)

Оскільки кожна i-та нерівність у системі (7.12) забезпечує належність значення функцй yj(x) в i "тш точщ експерименту, відповідному i -тому інтервалу виходу, то одночасне виконання умов, заданих нерівностями системи, означає існування розв'язку задачі, тобто "проходження" функції (xr) через усі інтервали.

Розглянемо деякі важливі властивості системи (7.12) та и розв'язків. у працях.

Система (7.12) є системою N лінійних нерівностей відносно m невідомих b1,K,bm.

Нелінійність функцій <р,-(х;) в (7.12) не суперечить попередньому твердженню, тому, що при відомому аргументі xt вони стають відомими

коефіцієнтами.

Якщо згадані коефіцієнти позначити через фу = (Pj{xt), то систему (7.12)

можна переписати у такому вигляді

[Ум ^ ФмА + • • • + ФтК ^ Ум, звідки  очевидна  и  лшшшсть.  В  майбутньому  нам  зручно  буде розглядати систему (1.24) в матричному вигляді

f-<F'b<Y+,                                                                                                                              (7.13)

де Y~ =[yT,i = 1,K,N},Yr+ ={yi+ ,i = 1,K,N} - вектори, склад em із верхніх

та нижніх меж інтервалів \yj, yi +, відповідно;

F = {фij,i = 1,N,j = 1,m} - відома матриця значень базисних функцій.

Система (7.13) може не мати жодного розв'язку, тобто бути несумісною або мати багато розв'язків.

Стосовно задач аналізу інтервальних даних, несумісність системи (7.13) означає, що не виконуються припущення методу, тобто або невірно задано

вигляд функції (7.10), або невірно визначеш штервали  [yi−,yi+]. Обидва порушення гіпотез не забезпечують належність значень функцй  у\х)  в

точках експерименту до відповідних інтервалів виходу.

Нехай система (7.13) є сумісною. Позначимо через Ω множину и розв'язків, тобто

 {£| ??}                                                                                         (7.14)

65

Наведемо основні властивості множини оцінок.

1.       У просторі параметрів β1,...,βm множина Ω є опуклий многогранник.

Це означає, що довільна точка множини Ω є розв'язком системи (7.13).

2.       Довільний розв'язок b r системи породжує модель y€(xr) = фТ{х) • Ъ ,

що  "проходить" через усі  інтервали  [yi−,yi+], яку надалі  називатимемо

інтервальною моделлю (статичної системи).

3.          Множина розв'язків Ω породжує множину рівнозначних (з точки зору
наявної інтервальної невизначеності) інтервальних моделей, кожна з яких
задовольняє умовам задачі. При цьому, всі інтервальні моделі знаходяться у
коридорі

[^)] = [yy{x)S{x%                                                                                                                        (7.15)

де  уТ(х) = тщфт(х)-Ь) та  уУ^(х) = гпах\Зт(х)-Ь) - нижня та верхня

межі функціонального коридору.

4.          Істинний невідомий векторβ е одним із розв'язків системи (7.13),

тобто βrΩ. Тому можна стверджувати, що довільна точка множини Ω

може бути істинним вектором параметрів. Ця властивість множини розв'язків Ω дозволяє трактувати и як множину можливих значень невідомих параметрів β 1..., βm.

IIІ. Аналіз точності оцінок параметрів моделі.

Точність оцінок параметрів визначається розмірами області параметрів. Чим "ширша" множина Ω, тим більша невизначеність відносно істинних параметрів статичної системи.

Розмір множини Ω характеризується діаметром d, який визначається як відстань між двома найбшын вщдаленими точками множини:

brs,                                                                                                                                 (7.16)

де bp,bs -відповідні вершини обласп Q.

Діаметр множини Ω тісно пов'язаний з матрицею F системи (7.13). Зокрема, якщо кількість різних точок х{ спостережень у матриці F буде

менша вщ кшькост1 невідомих параметрів m, то множина Ω буде "розірвана". Тобто, якщо rang(,F) <m то d∞. З іншого боку, якщо rang(,F) = m, то діаметр d обмежений.

Наведені математичні властивості множини Ω дозволяють перейти до більш детального розгляду методу, який варто розпочати із найпростішого випадку, що дозволяє графічну ілюстрацію.

Приклад 1.

Нехай кількість невідомих коефіцієнтів у рівнянні (7.10) дорівнює 2. У цьому випадку система (7.12) спрощується і набуває такого вигляду:

у; <фпЬх +... + фi2b2yi+,i = 1,...,N                                                                                           (7.17)

Кожна нерівність системи на площині b1,b2 задає "смугу", обмежену

66

двома прямими, що відповідають межам інтервалів (рисунок 7.1).

 


\"

\~


 X


 п

Ф12 =

\г

_ч

Рис.7.1. Зображення розв'язків рівняння інтервальної системи у просторі параметрів.

Сукупність N нерівностей, тобто перетин усіх "смуг", утворює шукану множину Ω розв'язків системи (7.17), зображену на рис.7.2 для N=3. Координати вершин Ω можуть бути визначені графічно або аналітично, шляхом розв'язування системи лінійних рівнянь. Наприклад, координати

вершини b4 можна знайти як розв'язок системи двох лінійних рівнянь:

Порівняно простий випадок m =2 добре ілюструє загальні властивості множини Ω можливих значень істинних параметрів β1,β2 .

Рис.7.2. Область розв'язків системи (7.13) для N=3.

На  рисунку  7.1  зображена  множина  Ω,  діаметр  якої  дорівнює нескінченості, а рисунок 7.2 ілюструє опуклість множини Ω, структуру і

67

характер впливу на діаметр множини додаткових спостережень. Внутрішню точку b множини Ω можна знайти як центр діагоналі, що з'єднує відповід вершини, тобто: b = 0,5 • \bp + brs.

Приклад 2. (N=m).

Зупинимося на аналізі цього випадку експерименту, який називається насиченим.

В насиченому експерименті, тобто у випадку співпадіння кількості спостережень N в експерименті з кількістю невідомих параметрів m, матриця F системи (7.13) буде квадратною (m×N). Якщо визначник матриці

відмінний від нуля, то можна отримати матрицю F−1, обернену до F і, відповідно, розв'язок такої системи лінійних алгебраїчних рівнянь :

F-bs=Ys,                                                                                                                                   (7.18)

де  Yrs  - вектор, складений з межових значень інтервалів  [yi−,yi+],

наприклад, він може мати такий вигляд Yrs = (y1+ ,у^,у^,---,у^\ Запишемо розв'язок цієї системи у такому вигляді:

ba=F-l-Ya.                                                                                                                                 (7.19)

Вектор bs є однією із вершин многогранника Ω, утвореною перетином відповідних площин, заданих нерівностями (інтервальними рівняннями) системи (7.13).

Аналіз можливих комбінацій межових значень інтервалів виходу об'єкта,  дозволив  побудувати  таблицю  7.1,  з якої  видно,  що  загальна

кількість розв'язків bs складає R = 2m.

Таблиця 7.1 Комбінації межових значень інтервалів

Y

Y

 

Y

Y

 

Y

 

Y

 

Y

У

У

 

У

У

 

У

 

У

 

У

У

У

 

У

У

 

У

 

У

 

У

У

У

 

У

У

 

У

 

У

 

У

 

 

 

 

 

 

 

 

 

 

 

У

У

 

У

У

 

У

 

У

 

У

У

У

 

У

У

 

У

 

У

 

У

68

Для даного випадку важливим є твердження: "При m = N множина Ω є

симетричним опуклим многогранником з 2m кількістю вершин, які визначаються за формулою (7.19)". На рис.7.3 зображений многогранник Ω для т = і 3 m =  .




Q


 = m=3

Рис.7.3. Многогранник Ω для N=m=2 i N=m=3.

Відомо,  що  довільний  відрізок,  який  з'єднує  вершини  bp  і  bs

многогранника, називається його діагоналлю.

При m = N перетин головних діагоналей многогранника Ω збігається з

його центром ваги b , який визначається за формулою

rs =f~1.Y,                                                                                                                       (7.20)

де  Y- вектор є середнім арифметичним усіх векторів складених з межових  значень,  а  його  компоненти  -  середш  штервальш  значения

2, i = 1,K,m,тобто

г\Ш


s=1

Центр ваги множини Ω є одночасно МНК-оцінкою, обчисленою за середньо - інтервальними значеннями yi. Це безпосередньо випливає з формули (1.5), із урахуванням, що при m = N справедливе співвідношення

()FTFj Ft = F−1, із заміною вектора Yr на Y.

Кожна вершина многогранника bs   породжує інтервальну модель

y= <pT(x)-bs, яка проходить через межові точки інтервальних спостережень, як це зображено на рисунку .7.4 для лінійної моделі при т = N = 2.

69

x2                                                                                               x

Рис.7.4. Відображення вершин многогранника параметрів у просторі інтервальних спостережень.

Зображені прямі відповідають ситуаціям, коли, пряма 1№ проходить через точки (x1,y1−), (x2,y2+ ), а пряма 2№ - через точки (x1,y1+), (x2,y2) і т.д. Заштрихований коридор описує всю множину прямих, які можуть бути проведені в межах двох інтервалів.

Зазначимо, що вершини bs многогранника Ω, та його центр ваги b знаходять шляхом розв'язування квадратної системи лінійних рівнянь з однією і тією самою не виродженою матрицею  F  і різними векторами вільних членів. З цією метою можуть бути використаш в1дом1 методи та алгоритми лінійної алгебри.

IV. Аналіз точноси 1нтервально1 моделі.

Властивості множини Ω розв'язків лінійної системи інтервальних рівнянь безпосередньо визначають властивості інтервальних моделей статичних систем та меж функціонального коридору, побудованих на основі цих розв'язків.

Точність інтервальної моделі е и основною характеристикою. Оцінювання точності вимагає певних обчислювальних витрат. Розглянемо точність прогнозування моделі в точці, тобто при фіксованому наборі входів x.

Під прогнозуванням інтервальної моделі, будемо розуміти розрахунок виходу   системи   у{х)   при   заданому   наборі   входів   xr,   поза

експериментальними точками на основі яких будувалась модель, але в межах області експерименту χ. Основною характеристикою точності інтервальної

моделі є похибка прогнозування, яка задається різницею меж коридору (7.15):

А (xr) =

фт (х) -bj- ттуфт (х) Ъ )

Як  випливає прогнозування ∆y(

iнаведеної  формули,  для  визначення  похибки у фіксованій точщ х необхщно розв'язати дві задачі

лінійного програмування

70


\х\Ъ

розв'язки яких знаходиться у вершинах многогранника Ω. Із урахуванням викладеного,  вираз  для  знаходження  похибки  прогнозування  А ^  у

фіксованій точщ х набувае такого вигляду:

Ау^ = jnax т(х) • фр -bs)),x e%                                                                                                 (7.21)

де bP,–bs  вершини опуклого многогранника (множини) Ω. Із виразу (7.21) видно, що значення похибки прогнозування залежить від po3MipiB множини Ω. Зокрема, значення ∆ у^\ в заданій точщ х тим менше,

чим менша відстань між вершинами множини Ω. Якщо bP = bs для всіх ps, тобто множина Ω стискується до точки, то значення похибки ∆

для всіх точок х дор1внюе нулю.

Зменшення розмірів множини Ω, а відповідно, і зменшення похибки прогнозування моделі можливо досягнути шляхом оптимального вибору точок експерименту та зменшенням інтервальних похибок спостережень у вибраних точках.

Для загального випадку показано, що функція (7.21) є кусково-неперервною. Це зумовлено тим, що для різних фіксованих значень x похибка  прогнозування  у  формулі  (7.21)  може  визначатись  різними

векторами bPbs, тобто різними парами вершин многогранника Ω.

Важливим є аналіз властивостей лінійної по вхідних змінних інтервальної моделі y0(xr) = xr -]3. Формула (7.21) у цьому випадку набуває такого вигляду:

 = Мп(хт -(bP-bs)}xcz                                                                                                                      (7.22)

У випадку нормування незалежних змінних у такий спосіб, щоб центр експерименту χ співпадав з нульовою точкою xr0 =(0,...,0)T, функція y(

буде  симетричною  відносно  центру  xr0а  п  максимальне  значення досягається на межі області χ. Якщо область експерименту χ задати як n-

вимірну кулю, радіусом ρ і з центром в точщ х0 = (0,...,0)T

хт-х<р2,                                                                                                                                  (7.23)

то  максимальна  на  області  χ  похибка  прогнозування  лінійної інтервальної моделі обчислюватиметься за формулою:

тах(Ая,)) = р.|й;-й;|,                                                                                                     (7.24)

де  р^-6Л=рр-6яbP'b*ea  >тах- визначае в npocTopi параметр1в

довжину максимальної діагоналі многогранника Ω.

Із формули (7.24) випливає, що для області планування експерименту, заданої  у  вигляді  кулі  радіусом  ρ  максимальне  значення  похибки

прогнозування лінійної моделі дорівнює довжині максимальної діагоналі

71

(діаметруΩ), збільшеній у ρ раз.

Проведений аналіз дозволяє зробити висновок, що функція похибки прогнозування інтервальних моделей, побудованих на основі множини розв'язків системи інтервальних рівнянь (7.12), в загальному випадку є кусковою, що суттєво збільшує обчислювальні витрати на визначення коридору прогнозування. Своєю чергою це спонукає до розробки та застосування методів локалізації розв'язків системи (7.12), що забезпечують аналітичність задання функціональних меж коридору інтервальних моделей.

V. Перевірка гіпотез.

На цьому етапі перевіряється адекватність моделі. Адекватною є модель у якої структура при відомих інтервальних даних забезпечує сумісність системи (7.10).

Аналогічним чином у випадку справдження гіпотези про адекватність моделі проводиться перевірка належност1 штервалам виходу істинного значення, тобто аналізується сумісність системи (7.10). Якщо ця гіпотеза порушується, то необхідно розширити інтервали для вихідної змінної з метою забезпечення сумісності системи (7.10).

7.5. Планування насичених експериментів у випадку інтервального представлення вихідних змінних моделей статичних систем

При розгляді основних положень методів аналізу інтервальних даних висувалося припущення, що у розпорядженні дослідника є такі експериментальні дані, які забезпечують повний ранг (rangF = m) матриці F

розміром (N×m), зокрема, кількість спостережень N у експерименті не менше вщ кшькост1 невідомих параметрів m. При цьому не досліджувалося питання про те, яким чином одержані щ дат. Застосування методів оптимального планування експерименту в задачах ідентифікації дозволяє підвищити точність математичної моделі. Зауважимо, що в цьому випадку задачі називаються активною ідентифікацією.

Переважно розрізняють планування апріорного експерименту і планування послідовного (динамічного) експерименту. У першому випадку план усього експерименту складається до його проведення, у другому -програма реалізації експерименту послідовно уточнюється в міру одержання i залежно від результатів опрацювання результатів попередніх спостережень.

Розглянемо можливості планування оптимального апріорного експерименту з метою побудови моделі статичної системи в умовах інтервальних похибок. При цьому припустимо:

-          модель статичної системи задана лінійно-параметричним рівнянням
відомої структури (7.10) і є можливість змінювати вхідні зм1нш х1,...,хп в

деякій обмеженій області χ, тобто x r χ;

-            шуканий  план  експерименту  включає  N = m  дослідів,  тобто  є
насиченим

72

X=

• • • Хтп

- для довільного x r x задано інформацію про абсолютну інтервальну

похибку ∆(xr) = 0,5 • (y+(xr) − у (X)) . При цьому може бути задана або функція ∆(xr) на χ, або відомо, що інтервальна похибка є постійною, тобто А(Х) = А,\/Х.

Задача полягає у знаходженні апріорного, насиченого плану X, який забезпечує мінімально можливі розміри многогранника Ω, що є областю можливих значень параметрів β1,Km .

Враховуючи, що кожній матриці плану експерименту X відповідає квадратна не вироджена матриця базисних функцій F із системи (7.13), задачу планування зручно трактувати як задачу знаходження матриці F.

Очевидно, що апріорний план експерименту неможливо побудувати, поки не визначено, який зміст вкладається в поняття оптимальності. Тому, розглянемо питання вибору критеріїв оптимальності планів експерименту.

3 постановки задачі випливає, що оптимальний експеримент на відміну від неоптимального, повинен забезпечити більшу точність оцінок параметрів b1,K,bm, тобто менший розмір многогранника Ω.

Очевидно, що до проведення експерименту не можна обчислити вершини brs, оскільки вектори Т~,Т+ штервальних спостережень виходу є невідомими, і отже, не можливо визначити вектор Yrs. Проте, ця обставина не

заважає апріорі визначити розміри многогранника Ω при деякому фіксованому плані і, зокрема, довжину його діагоналей між парами вершин

 \Р  Ц  ФР  bs){bp  bs)  (fpff (Ff F  {fp Приймаючи до уваги,  що  вектори  YpYs  утворюються як можливі

комбінації меж інтервальних даних yi−,yi+,i = 1,K,m (див. табл. 7.3), то компоненти різниці Y rpYrs можуть набувати одного з двох значень 2∆i чи −2∆i - якщо вершини В ,Б3 утворюють головну діагональ (що не належить Hi  одній  із  граней)  многогранника  Ω.  Кількість  головних  діагоналей

дорівнює 2m1.

Використовуючи  вираз  для  довжини  l  довільної  діагоналі,  можна отримати простий вираз для квадрату довжини p -ї головної діагоналі

1% =\ЪР -Ц = ФР -bs)T'{bp -bs) = (fp-ff -(F-'f -F-1 -{fp-fs).

де  F-FTматриця,  яку  надалі  називатимемо  інформаційною;

=(±∆1p ,K ip,K,±∆mp)  - вектор, компонентами якого є відповід

73

інтервальні похибки ∆i, із додатними або від'ємними знаками.

Користуючись аналогією між плануванням регресійних та інтервальних експериментів введено кількісні критерії, що характеризують розміри многогранника Ω, такі як квадрат об'єму V, суму квадратів довжин його діагоналей, квадрат довжини максимальної діагоналі і які визначаються формулами, відповідно

гут—1

ID =V2()Ω;; IA =   ∑                                                                     l

p=1                                                                                       p

Вирази, що зв'язують вказані критерії з інформаційною матрицею мають такий вигляд

ID = 4m • det() • (F • FT ) 1 е) = 4m ГЦПm ) • det(F • FT у1,                                                                     (7.25)

IA = 2m+1 Sp(E (F FT)−1 E),                                                                                             (7.26)

г^ГГ1р,                                                                                                                    (7.27)

р де Е = diag(∆1,...,∆i,...,∆m  - діагональна матриця інтервальних похибок;

Q - означає слід матриці, який дорівнює сумі и д1агональних елементів.

Умови  ID− ,IA,IE-оптимальності планів інтервального експерименту записуються так:

(F-FTyl

Sp(E-(F-FTyx-ET)-

•(F-F )  -Ар----------------------------------------------------------------------------------------- >min.                                            (7.29)

р

Зазначимо, що у розглянутих формулах виключені постійні множники, які не впливають на шуканий оптимальний план.

Наведені критерії дозволили, з одного боку, визначити поняття оптимального плану при аналізі інтервальних даних, а з другого, - отримати співвідношення між інтервальними і регресійними оптимальними планами.

Розглянемо щ сп1ввщношення детальніше.

Коли інтервальна похибка експерименту є постійною, тобто ∆(xr) = ∆ УХе%, тоді матриця  E у формулах (7.29) стає скалярною  (E = A-Iі

перестає впливати на результати мінімізації.

Порівнюючи формули (7.29) для цього випадку з формулами (7.9), відповідно, для D - і А -критеріїв регресійного експерименту, виявляється їх збіг. Це означає, що ID- і IA -оптимальні плани насиченого інтервального експерименту еквівалентні D- і А -оптимальним регресійним планам, побудованим для відповідної моделі (7.10).

Показана еквівалентність планів дозволяє застосовувати результати, отримані для D - і А -оптимальних регресійних планів при побудові ІD- і ІА-

оптимальних планів інтервального  експерименту.  Зокрема,  можуть  бути використані наявні каталоги насичених D- і  А -оптимальних планів для

74

поліноміальних моделей першого та другого порядку.

Між IE -оптимальністю та E -оптимальністю регресійних експериментів

подібної еквівалентності не встановлено, хоча вони і є близькими за фізичним змістом, а саме: E -оптимальний план мінімізує максимальну вісь довірчого еліпсоїда оцінок параметрів регресійної моделі і IE -оптимальний

план мінімізує максимальну діагональ многогранника Ω.

Не менш важливими є плани, які дозволяють зменшити коридор інтервальних моделей, заданий формулою (7.15). Ширину функціонального коридору  А (х), якою визначається точність інтервальної моделі  можна

обчислити як різницю його границь

^Х)+(Х)-?~(Х)-                                                                                                                (7-30)

Це в свою чергу дозволило ввести показники IQ, IG та критерії IQ-, IG-оптимальності планів

IQ = y(xr)d(xr), ig = maxr∆y(xr)                                                                                    (7.31)

Задача знаходження  IQта  IG-оптимальних  планів  є  надзвичайно

складною, через кусочність меж функціонального коридору і, відповідно, функцй А ф. Наближені до IQ - та IG -оптимальних планів можна знайти,

використовуючи таку лему: "Навколо області Ω можна описати еліпсоїд, який пройде через усі її вершини, заданий рівнянням

Qm={brRm(brbr)T -FT 'E-2'F'(B-b) = m}.                                                                                  (7.32)

Із леми витікає, що верхню оцінку А^^ BeQ  функцй AyW  похибки прогнозування інтервальної моделі можна обчислити за такою формулою

(7.33)

Отже, задачі знаходження наближених до IQ- та IG-оптимальних планів записують, відповідно, так:

Fmin.

Дані задачі розв'язуються методами математичного програмування і частково спрощуються, коли область експерименту χ є кубом чи сферою.

Розглянуті критерії можна використовувати виключно для планування оптимальних насичених експериментів (N = m). На практищ кшыасть дослідів може перевищувати кількість невідомих параметрів. В цих умовах побудова апріорних оптимальних планів без врахування додаткових властивостей інтервальних похибок не можлива. Тим часом залишається можливість побудови процедур послідовного планування. При послідовному плануванні експерименту на k-тому кроці процедури шукається не вся матриця F, а тільки и одна стрічка (інші Nm стрічок матриці є відомими), тобто оптимальний за визначеним критерієм набір значень входів хк.

75

7.6. Методологічні аспекти структурної ідентифікації моделей систем.

Синтезу задовільної структури моделей систем в межах стохастичного підходу присвячені чисельні публікації. Розроблет р1зт методи стосовно класу поліноміальних моделей, серед яких слід виділити метод повного перебору усіх можливих структур поліноміальних моделей відомого степеня, методи послідовного виключення параметрів з поліноміальної моделі, послідовного "нарощування" структури поліноміальної моделі (метод включення) і т.д. В межах прийнятої в регресійному аналізі моделі випадкової, нормально розподіленої похибки, щ методи базуються на статистичних критеріях Стьюдента, Пірсона, чи Фішера. Порушення гіпотези про "нормальність" автоматично руйнує теоретичні обґрунтування використання вказаних критеріїв. Бшын ефективними у цьому плат е алгоритми методу групового урахування аргументів. Однак, для оцінки "якості" побудованої моделі, в цих методах також використовуються статистичні оцінки.

За умов обмежених по амплітуді похибок експериментальних даних з невідомими законами розподілу застосування стохастичного підходу для задач структурної ідентифікації стає неможливим. В цих умовах найбільш придатними є методи аналізу інтервальних даних.

При розв'язувані задачі структурноїі дентифікації статичного системи необхідно знайти загальний вигляд функції

Уо=У$)                                                                                                                                       (4-1)

яка  буде  адекватною  моделлю  об'єкта,  де  yo  - істинне  невідоме

значення виходу системи; xrRn- вектор вхідних змінних; n- задає початкову фіксовану кількість вхідних змінних, яку необхідно встановити на основі результатів експерименту.

Для  ідентифікації  залежності   у{х)  використовують  результати

експерименту, як і раніше представлені у вигляді початково заданої матриці X значень вхідних змінних і відповідних інтервальних значень вихідної змінної y (7.11).

У матриці X можливе повторення стрічок, що означатиме повторення спостережень при одних і тих же вхідних змінних. При цьому отримуватимемо вибірку інтервальних оцінок вихідної змінної dj = [yj − ∆;yj + ∆], j = 1,...,N. Припустимо, що ця вибірка є випадковою, але

також включає обмежену не випадкову похибку спостережень. Тобто розглядаємо модель змішаноїі нтервальної похибки ∆ = ∆1+∆2, коли результати спостережень за вихідною змінною задаються у такому вигляді

yi = Уы + еи + еъ»                                                                                                                     (4.3)

де еи - невипадкова обмежена похибка з відомим діапазоном можливих

значень −∆1i ≤e1i ≤∆1i; e2iвипадкова похибка, що має симетричний (у загальному випадку невідомий) розподіл на відомому інтервалі [- А2|.; ∆2i. ].

76

Наведена вище задача ідентифікації залежносп у(х), є достатньо складною і в загальному випадку для отримання и розв'язку необхідно розглянути додаткові умови на клас функцш у(х). Переважно залежність

y(xr) шукають серед лінійно-параметричних рівнянь у такому загальному вигляді

у{х) = фт{х).Ъ,                                                                                                                          (4.4)

де фт (х) - вектор невідомих базисних функцій, відомого класу (наприклад, поліноміальні функції). Розмірність m цих векторів на початку процедури щентифжаци е заданою.

3 врахуванням вище викладеного та співвідношень (7.11), (4.1), (4.4), задача структурної ідентифікації моделі "вхід-вихід" на основі інтервальних даних (7.11) зводиться до знаходження такої множини залежностей (4.4), які забезпечують умови сумісності інтервальної системи лінійних (відносно параметрів) алгебраїчних рівнянь (7.12).

Очевидно, що умови сумісності системи (7.12) можна забезпечити

шляхом ускладнення структури моделі y(xr) = фт (х) Ъ (збільшення кількості

параметрів, входів, ступеня полінома).

При синтезі структури інтервальної моделі системи, важливим питанням є вибір критеріїв оптимальності. Розглянемо це питання детальніше.

3 цією метою повернемося до системи нерівностей (7.12) і вважатимемо, що функція y(xr), яка задає структуру моделі шукається у класі поліномів.

Відомо, що на скінченому наборі вузлів xri(i = 1,...,N), нарощуючи степінь

полінома, завжди можна знайти таку поліноміальну модель, яка задовольняє заданим інтервальним даним.

Нехай знайдена поліноміальна модель y(xr,br) залежить від n змінних x1,...,xn, степеш р і включає m параметрів b1,...,bm. Однак вона може виявитися надто складною для аналізу і прогнозування. Внаслідок цього виникає необхідність знаходження поліноміальної моделі максимально простої структури. У випадку наявності групи моделей із структурою однакової складності, перевагу надаватимемо тій моделі, яка забезпечує найменшу похибку прогнозування  y(xr), задану, наприклад,  IQ- та IG-

критеріями оптимальності планів інтервального експерименту. Залежно від особливостей використання моделі, в поняття "простоти" (складності) структури моделі може вкладатися різний зміст. Найбільш типовими ситуаціями у даному випадку є виконання одша i3 таких вимог: мінімізація степені  полінома  р p → min ;  мінімізація  кількості  вхідних  змінних

моделі nmin; мш1м1запш кшькост1 параметрів поліноміальної моделі m —→ min, за умови забезпечення сумісності інтервальної системи лінійних алгебраїчних рівнянь (7.12)

Отже, для задач синтезу оптимальної структури, залежно від призначення та особливостей застосування інтервальної моделі статичної

77

системи, заданої поліномом, необхідно використовувати одну чи декілька пар критеріїв: мінімізації степені полінома і похибки прогнозування; м1тм1зацп кшькост1 вхідних змінних моделі і похибки прогнозування; м1тм1зацп кшькоси параметр1в поліноміальної моделі і похибки прогнозування. При цьому необхідним є забезпечення сумісності системи (7.12).

У випадку поетапного зважування структур інтервальних моделей по критеріях вибраної пари, очевидно, пріоритетнішими будуть критерії, що мінімізують складність структури, оскільки критерш мш1муму похибки прогнозування інтервальної моделі вимагає значних обчислювальних витрат i на першому етапі, пов'язаному з оцінюванням великої кількості претендентів, його застосування є недоцільним.

Для знаходження оптимальної структури моделі можуть бути використані методи повного перебору можливих структур, послідовного включення і виключення параметрів поліноміальної моделі. Однак, у даному випадку вони будуються на аналізі властивостей системи інтервальних рівнянь.

Суть методу повного перебору в нашому випадку полягає в тому, що складаються всі можливі поліноми, обмежені заданим числом n вхідних змінних і степеню p.

Кожний із можливих поліномів підставляємо в систему (7.12). Виділяємо Ti поліноми, які задовольняють усі нерівності системи і, отже, задані умови точності. Серед них формуємо групу поліномів найпростішої, у розумінні вибраного критерію складності структури. На другому етапі, серед поліноміальних моделей найпростішої структури вибираємо модель з найменшою похибкою прогнозування.

Очевидно,  що  із  зростанням  і  n ,  на  етапі  вибору  поліномів

найпростішої структури, кількість можливих комбінацій суттєво зростає. Внаслідок цього, реалізацію методу повного перебору на практиці можна застосовувати тільки у окремих простих випадках, наприклад, коли вхідні змінні мають фізичний зміст і їхня кількість є достатньо малою.

Зауважимо, якщо вдалося знайти поліном, що наближує дані з необхідною точністю, то додавання до нього довільних членів втрачає зміст, оскільки найкращою є модель, що на множит ycix адекватних моделей є найпростішою. Внаслідок цього, економнішими виявляються методи, побудовані на послідовному включенні або виключенні параметрів поліноміальних моделей.

У методі послідовного виключення вважаємо, що вихідна поліноміальна модель y(xr,br), яка задовольняє інтервальним даним, є задана. Структуру

вихідної моделі можна встановити на основі попереднього аналізу даних чи виходячи із фізичних міркувань. Потім досліджуємо можливості спрощення nie'i моделі, тобто виключення з неї окремих параметрів, спираючись на обраний критерій складності структури. Для виключення "сліпого" перебору необхідна цілеспрямована перевірка гіпотез відносно групи або окремих

78

параметрів. При спрощенні початкової структури моделі y(xr,br) досліджуємо можливість обнуління и окремих параметрів. Це пов'язано з перевіркою гіпотез інтервального аналізу у такому вигляді

H0:bk=0;H0:bt=0                                                                                                                       (4.6)

де Б( - заданий підвектор вектора Б.

В межах інтервального підходу перевірка гіпотез (4.6) спрощується, а саме: гіпотеза H0 приймається, якщо при обнулшш вщповщних параметрів

моделі, система інтервальних рівнянь (7.12) залишається сумісною.

Пояснимо головну ідею відбору претендентів на обнуління, на прикладі моделі, яка містить два параметри b1, b2: у(Х, Б) = Ъхсрх (xr) + Ъ2ср2 (xr).

На рис. 7.5 наведено можливі варіанти розміщення множини розв'язків Q системи (7.12) при и сумкност1 у площшп (^;Z?2).

Аналізуючи рисунки, не важко виявити, що у випадку а) знаки параметрів є додатними b1>0, b2 >0, а у випадку б) вони від'ємні, тобто

b1 < 0, b2 < 0. Це означає, що гіпотеза рівності нулю принаймні одного параметра, виключається. В інших випадках можливе прийняття нульових гіпотез: 0b2 = - випадок в); b1 = 0 - випадок г); b1 = 0 або 0b2 = 0 - випадок д); b1 = 0 і b2 = 0 - випадок е ).

Розглянутий приклад дозволяє сформулювати два правила, які є справедливими для спільного m - вимірного випадку:

-   якщо множина Ω не перетинає межі октантів простору b1,...,bm, то
жоден параметр bj не може бути обнуленим;

-   якщо множина Ω включає нульову точку (випадок е ), то приймається
гіпотеза 0 : b r =, тобто всі параметри можуть бути замінені на нулі.

К   b1

b[                                                                            ъ; Ъ2 а   ,

 

 

к

 

 

П+

 

 

 

 

 

ч/

 

ъ

 

 

 



ь:


а)

Q


П+

г)                                                 д)                                                        ё)

Рис.7.5. Варіанти розміщення множини розв'язків Ω.


79

В багатовимірному випадку таке наочне зображення, як на рис. 7.5, множини Ω є неможливим, що вимагає заміни и локалізаційною множиною. Найбільш придатною в даному випадку є інтервальна локалізація множини розв'язків Ω, тобто описаним m- вимірним прямокутним паралелепіпедом

П+. У багатовимірному випадку прямокутний паралелепіпед  П+  можна задати через межі окремих параметрів bk, тобто інтервальним вектором [В] з

елементами [bk−;bk+]

П+={brbk−≤bk≤bk+,k = 1,...,m}, де Ьк =minbk,bk =maxbk .

ЬеО.                                           ЬеО.

У цьому випадку наближеною оцінкою точності інтервальних моделей може бути об'єм локалізаційного паралелепіпеда

т

v(n+)=u {К-К).

к=\

Із вище сформульованих правил витікає, що інтервальну модель системи y(xr,br) не можна спростити, якщо межі усіх параметрів мають однакові

знаки, а параметр bk можна обнулити, якщо його межі Ьк,Ь£ мають різні знаки.

На основі цього правила можливе застосування методу послідовного виключення, коли відповідно до обраного критерію спрощення структури: мінімізації степені, кількості вхідних змінних чи кількості параметрів поліноміальної моделі, з початкової моделі виключаються параметри, межі яких мають різні знаки. При цьому, якщо відразу декілька параметрів є претендентами на обнуління, недоцільно прирівнювати їх до нуля одночасно, оскільки можлива ситуація несумісності системи інтервальних рівнянь, а після обнуління параметра необхідно заново провести аналіз інтервальних даних і встановити межі решти параметрів.

У методі послідовного включення нарощуємо поліноміальну модель, послідовно переходячи від найпростіших до складніших структур. При додаванні нових параметрів моделі, як і у методі послідовного виключення, користуємося обраним критерієм спрощення структури. Процес зупиняємо як тільки побудована модель задовольняє системі інтервальних рівнянь (4.5) і при цьому усі її параметри є значущими.

Для зменшення кількості ітерацій процесу, найпростішу структуру слід вибирати виходячи із особливостей розподіленого об'єкта, для якого будується інтервальна модель.

Слщ вщмшгги важливу особливість методів послідовного включення та виключення параметрів при синтезі найпростішої структури інтервальної моделі, а саме: найпростіша структура моделі не зал ежить від обраного методу локал1зацй i може бути встановлена на основі застосування найпростішого і найменш витратного з обчислювальної точки зору методу інтервальної локалізації параметрів моделі.

80

Використання вказаної особливості доцільно на другому етапі вибору оптимальної структури інтервальних моделей. Оскільки похибка прогнозування інтервальної моделі визначається розмірами множини локалізації параметрів, то серед сформованої на першому етапі групи поліноміальних моделей найпростішої структури вибираемо штервальт моделі, отримані на основі локалізаційної множини у вигляді m- вимірного прямокутного паралелепіпеда П+ з мінімальним об'ємом V+). Такий підхід дозволить уникнути складних процедур розрахунку значень IQ- та IG-

критеріїв, що задають оцінки похибки прогнозування інтервальної моделі на області експерименту.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23  Наверх ↑