1.4. Методика вычисления оптимального значения задачи

Выясним, как может быть осуществлено вычисление оптимального значения 2* задачи управления многошаговыми процессами в част­ном случае, когда начальное состояние ж о системы фиксировано, или, иными словами, множество Х0 начальных состояний системы сво­дится к единственному элементу Х(,. Проводимые рассуждения поз­волят ближе подойти к пониманию общего принципа оптимальности решения рассматриваемых задач. Для определенности рассмотрим слу­чай поиска максимума.

Рассмотрим прежде всего простейший из многошаговых процессов, включающий два шага управления, N — 2. В этом случае вектор управляющих переменных (и!,и2) содержит две компоненты, и целевая функция 2 является функцией двух переменных Щ,и2:

г = г(и12) = ^(жо.их) + 2201,«2),

где Х\ = /1 (-'Со, щ). Для определения оптимального значения Z* необ­ходимо вычислить максимум целевой функции по обеим управляющим переменным щ, и2:

Z* = тах{21(ж0, щ) + 22(21,142)}.

111,112

Максимум по двум переменным всегда может быть найден путем последовательного вычисления максимумов по каждой из переменных; следовательно,

г* — тах{шах{21 (жо, щ) + 22(ж1 ,«2)}}.

иг иг

(Конечно, для справедливости такого преобразования необходимо, чтобы множества векторов («1,1(2)1 учитываемых при одновременном и при последовательном способах вычисления Z*, полностью совпа­дали). В полученной сумме первое слагаемое ^(жо,^) не зависит от переменной «2, по которой вычисляется внутренний максимум. Сле­довательно, это слагаемое может быть вынесено за знак внутреннего максимума:

тах{21(ж0,«1) + 22(ж1,г42)} = 2:1 (ж0, «О + тах{г212)}.

«2 "2

Таким образом, справедливо равенство

Z* = тах{21(жо, щ) + тах{г2(х1, и2)}}■

и\                                         «2

В результате проведенных преобразований вычисление максимума по двум переменным и\,и2 удалось «разнести» на два последователь­ных вычисления максимума по переменным и2 и и\, т. е. двумерная задача свелась к последовательному решению двух одномерных за­дач. Как правило, одномерная задача существенно проще двумерной (и тем более многомерной), а проведенные преобразования соответствуют общей закономерности: решить несколько задач низшей размерности проще, чем решить одну задачу высшей размерности.

Структура последнего равенства «подсказывает», что вычисле­ние следует разбить на 2 шага — это соответствует структуре мно­гошагового процесса и приводит к более простым выражениям. С этой целью введем новую вспомогательную функцию В\(х\), принимая в ка­честве нее внутренний максимум:

В\{х\) = тъх{г2(х\

г»2

Смысл функции Вх{хх) состоит в том, что она представляет собой максимальное значение частной целевой функции г2 на втором шаге процесса при условии, что перед этим шагом управляемая система находилась в состоянии х\. С учетом введенной функции #1(2:1) можно записать:

г* = тахЬ^жо,«!) + Вх(х\) | хх = /х(х0,их)\.

«1

В данной записи и всюду далее вертикальная черта «|» означает «при условии»: максимум выражения г\(х$,и\) + В\(х\) по переменной щ вычисляется при условии, что х\ не является произвольным, а опре­деляется равенством XI = /х(хо,Щ).

Преобразуем два последних выражения к однотипной форме. Для единообразия обозначений введем две новых функции: функцию В22), тождественно равную нулю: В22) = 0 для всех х2, и функцию Во(хо), определенную только для одного значения Хо и равную оптимальному значению X*, подлежащему вычислению: Во(хо) = 2*. С использо­ванием введенных обозначений полученные выше равенства можно записать следующим образом:

#1(2:1) = тах{г2(х\,и2) + В22) | х2 = /2(2:1,«2)},

112

В00) = тах{г1(хй,иг) + #1(21) | хх = /х(х0,щ)}.

и 1 ^                                                     '

Важно подчеркнуть, что полученные два равенства полностью сов­падают по структуре и отличаются только индексами переменных и функций. Таким образом, проведенные преобразования с использо­ванием введенных вспомогательных функций #00), #1(2:1) и В22) не только позволили упростить вычисления оптимального значения задачи 2* путем снижения размерности, но и привели вычисления к однотипной форме, соответствующей структуре процесса. Расчеты проводятся в порядке убывания индексов: В22) = 0 по определению; с учетом этого равенства далее вычисляется В^хх)-, наконец, вычис­ляется #о(хо) = 2*. На вид последних двух равенств следует обратить особое внимание, поскольку он является характерным для записи об­щего принципа оптимальности.Отметим, что для одношагового процесса при N = 1 можно фор­мально провести такую же логику. Вектор управляющих переменных в этом случае содержит только одну компоненту, и целевая функция 2 является функцией одной переменной щ:

2 = 2(щ) = 21(2:0,^1).

В этом случае решение задачи оптимизации сводится к поиску мак­симума функции одной переменной:

2* = тах{21(жо, «г)},

г»1

причем введение соответствующих вспомогательных функций Дз(жо) = 2* и В\{х\) = 0 позволяет придать последнему соотно­шению уже полученный выше типовой вид (хотя, конечно, для N = 1 такое преобразование не имеет глубокого смысла и является скорее усложнением, чем упрощением задачи).

Рассмотренная методика вычисления оптимального значения за­дачи 2* может быть распространена и на общий случай многошаго­вых процессов. При этом могут быть проведены рассуждения, подоб­ные известному методу математической индукции. Действительно, для N = 1 и ЛГ = 2 способ вычисления 2* уже рассмотрен выше. Предположим, что мы умеем вычислять оптимальное значение задачи для любого процесса, включающего N—1 шаг, и рассмотрим Л^-шаговый процесс. На первом шаге под действием управления щ система из на­чального состояния Хо перейдет в состояние Х\ = /1(20,^1), обеспечив экономический эффект г\(хо,и1). При этом для последующего пере­вода системы из состояния Х\ в конечное состояние XN остается ровно N — 1 шаг. В силу нашего предположения для получаемого «укорочен­ного» на 1 шаг процесса может быть вычислено оптимальное значение задачи — обозначим его через В\ (жх) и назовем условно-оптимальным, поскольку оно относится не ко всему процессу и зависит от выбора состояния х\. В соответствии с аддитивностью критерия для любого фиксированного управления и\ наибольшее значение целевой функ­ции 2 всего Л^-шагового процесса будет равно

гх(х0,щ) + Вх^хх)

(частный экономический эффект на первом шаге плюс максимальный эффект на последующих N — 1 шагах). Следовательно, для вычисле­ния оптимального значения 2* всей задачи (обозначим его для еди­нообразия, как и выше, через Во(х0)) достаточно взять максимум от рассмотренной суммы по всевозможным управлениям щ на первом шаге:

= В0(хо) = тах/^^жо,щ) + В\(х{) \хх = /\(х0,щ)}.

Данное соотношение совпадает по форме с типовыми равенствами, полученными выше для случаев N = 2 и N = 1; конечно, его можно было бы также получить путем строгих аналитических преобразо­ваний, аналогичных проведенным выше для случая N = 2. Следуя подобной методике, мы можем вычислить оптимальное значение задачи для любого многошагового процесса.

Проведенные выкладки можно сопроводить следующими нестро­гими рассуждениями. Как показано выше, проводить оптимизацию многошагового процесса по отдельным шагам независимо нельзя, так что придется проводить ее по всем шагам в совокупности. Однако, на­ходясь на некотором промежуточном шаге, мы не в состоянии повлиять на итоги уже проведенных предшествующих шагов. Таким образом, придется оптимизировать текущий шаг (с экономическим эффектом 2^) с учетом всех последующих шагов, пытаясь предусмотреть их итоги (экономический эффект В,). При этом начинать оптимизацию необ­ходимо с последнего шага, поскольку он не имеет последующих и позволяет провести расчеты наиболее просто.

Последовательное проведение подобных рассуждений приводит к установлению принципа оптимальности, лежащего в основе ме­тода ДП решения задач управления многошаговыми процессами.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 
25 26 27  Наверх ↑