1.7. Замечания по практическому применению метода динамического программирования

Принцип оптимальности Беллмана (*) сформулирован с использова­нием фазовых и управляющих переменных х^ и щ и функций                                             , и, ) и В то же время постановка большинства практических задач не предполагает явного задания каких-либо математических пе­ременных и функций. Следовательно, исходя из экономического содер­жания решаемых задач, необходимо предварительно должным образом ввести требуемые переменные и функции. Это надлежит сделать в сле­дующем порядке.

1.               Определить число N шагов в рассматриваемом управляемом про­цессе. В ряде случаев выбор числа шагов может быть неочевиден и неоднозначен. Например, при введении искусственного разбиения непрерывного процесса на шаги с целью последующего применения метода ДП число шагов "йе задается однозначно, а выбирается с уче­том требуемой точности и оперативности решения, возможностей применяемых вычислительных средств (ЭВМ) и иных факторов.

2.               Установить, какой параметр определяет состояние системы и мо­жет быть выбран в качестве фазовой переменной х, и выявить налагаемые на нее ограничения.

3.               Установить, какой параметр может быть выбран в качестве управ­ляющей переменной и, и выявить налагаемые на нее ограничения.

4.               Составить функцию процесса /, определяющую закон изменения состояния системы.

5. Составить частную целевую функцию г, определяющую экономи­ческий эффект на каждом из шагов процесса.

Выполнение действий, предписанных пп. 1-5, представляет со­бой математическую формализацию экономического содержания за­дачи ДП и называется построением экономико-математической мо­дели задачи; этот этап зачастую является нестандартной частью ре­шения и может представлять определенные сложности. Вслед за про­ведением формализации задачи необходимо проверить справедливость основных допущений метода ДП для возможности его последующего применения. Дальнейшие вычисления проводятся по стандартной рас­смотренной выше схеме. По завершении численного решения необхо­димо вернуться к экономическому смыслу и терминологии исходной задачи, сформулировать окончательный ответ к задаче с использо­ванием соответствующих терминов и дать экономическую трактовку полученного оптимального решения.

Если исходные данные задачи приведены в табличной форме, то при решении задачи методом ДП получаемые результаты расчетов удобно располагать в таблицах следующей структуры:

Вспомогательная таблица

} 4 1 = 1,2, } { = N,N-1, ...,2,1,

в которой представлены все допустимые значения аргумента хг-\ и функции

Основная таблица

2,-1

Щ

Х{

 

Вг(Хг)

Zi + Bi(Xi)

Вг-1(2,-1)

 

 

 

 

 

 

 

 

1 = 1,2,..., N                            г = ЛГ,ЛГ_ 1,...,2,1

(предварительный этап)     (этап условной оптимизации)

Хг-1

 

.В,-1(2,-1)

 

с помощью которой и проводится непосредственно расчет функций Беллмана Вг-\г_]). Вспомогательная и основная таблицы строятся и заполняются для всех г = 1,2,... (т. е. всего строится N экзем­пляров вспомогательных и основных таблиц, отвечающих N шагам процесса; содержание таблиц, конечно, меняется от шага к шагу).Справа от вспомогательной таблицы и снизу под основной таблицей символами «-1|» и » указан порядок заполнения соответствующих фрагментов таблиц, который будет подробно рассмотрен ниже.

Структура основной таблицы строго соответствует структуре функ­ционального уравнения Беллмана (*). Вычисления начинаются с вы­бора значения аргумента хг-\ (столбец 1 таблицы) рассчитываемой функции

Вг-1(^-1).

При расчете вычисляется максимум по управляющей переменной щ (столбец 2). Значения хг-\ и щ в соответствии с формулами

Хг =                     ,щ) и Zi =            щ)

определяют значения Х{ и гг (столбцы 3 и 4). При вычислении мак­симума по щ используется вычисленное ранее значение Вгг) (стол­бец 5), а максимум вычисляется от суммы

2^-1,Щ) + Д(Жг)

(столбец 6). Заканчиваются вычисления расчетом значения функции В{-х(Хг-\) (столбец 7). Основная таблица может содержать несколько строчных фрагментов, соответствующих различным значениям фа­зовой переменной. Х{-\, представленной в первом столбце таблицы.

Особое внимание следует обратить на двойную вертикальную черту, разделяющую основную таблицу на две части. Это разделение связано с тем, что заполнение таблиц разнесено по двум этапам: предвари­тельному этапу и этапу условной оптимизации. На предварительном этапе проводится заполнение первой строки вспомогательной таблицы и левой части (четырех столбцов слева от двойной вертикальной черты) основной таблицы, содержащих значения переменных задачи и частных целевых функций и не связанных непосредственно с вычис­лением функций Беллмана Вгг). Заполнение этих фрагментов таблиц проводится в естественном -порядке при г = 1,2,..., N, что и отмечено символом На этапе условной оптимизации проводится заполнение второй строки вспомогательной таблицы и правой части (трех столб­цов справа от двойной вертикальной черты) основной таблицы, уже непосредственно связанных с вычислением функций Вгг). Заполне­ние этих фрагментов таблиц проводится, как и предписывает принцип оптимальности Беллмана, е обратном порядке при i — М, N—1,... ,2,1, что и отмечено символом «-(]•». На этом же этапе вычисляются условно- оптимальные управления        на которых достигаются промежу­

точные экстремумы. При заполнении основных таблиц соответствую­щие условно-оптимальные значения управляющей переменной будут отмечаться знаком «/» (в отличие от символа «*» для оптимальных значений параметров). Более детальные пояснения будут приведены в следующей главе при рассмотрении конкретных примеров решения методом ДП типовых задач управления многошаговыми процессами.

В заключение главы коротко отметим, что изложенная классическая схема метода ДП может видоизменяться. В частности, порядок расче­тов на этапах условной и безусловной оптимизации может быть изме­нен на противоположный, а предварительный этап совмещен с этапом условной оптимизации. В отдельных случаях подобные модификации могут привести к сокращению объема памяти, требуемой для решения соответствующих задач на ЭВМ. Наиболее просто и естественно такие видоизменения выглядят в задачах теории графов, рассматриваемой в гл. 3 настоящего учебного пособия.

О Контрольные вопросы

1.               Поясните роль и значение математических методов в решении практических задач управления.

2.               Дайте понятие многошагового процесса.

3.               Для решения какого класса задач применяется метод ДП?

4.               Что такое фазовая переменная и в чем состоят ее роль и пред­назначение?

5.               Что такое управляющая переменная и каковы ее роль и пред­назначение?

6.               Что такое функция процесса и в чем заключаются ее предна­значение и экономическое содержание?

7.               Что такое целевая функция и в чем состоят ее предназначение и экономическое содержание?

8.               Сформулируйте понятие допустимого управления и поясните, в чем состоит его смысл.

9.               Сформулируйте понятие оптимального управления и поясните, в чем состоит его смысл.

10.             Дайте понятие траектории и оптимальной траектории.

11.             Дайте понятие оптимального значения задачи.

12.             Сформулируйте и поясните основные допущения метода ДП.

13.             По какой причине оптимизация по нескольким шагам процесса не сводится к независимой оптимизации по отдельным шагам?

14.             Как связаны между собой задачи на поиск максимума и мини­мума?

15.             Почему классические методы поиска экстремальных значений функций многих переменных, основанные на дифференциальном исчислении, не всегда практически применимы?

16.             Что такое условно-оптимальные значения целевой функции и ка­ково их экономическое содержание?

17.             Поясните принцип оптимальности Беллмана.

18.             Запишите основное функциональное уравнение Беллмана.

19.             Поясните, что означает рекуррентный характер функциональ­ного уравнения Беллмана.

20.             В чем заключается принцип инвариантного погружения?

21.             Поясните, что такое условно-оптимальные управления.

22.             Назовите и охарактеризуйте этапы метода ДП.

23.             Поясните, для чего, на каких этапах метода ДП и на сколь дол­гий срок требуется запоминание функций Беллмана и условно- оптимальных управлений.

24.             Укажите основные достоинства и недостатки метода ДП.

25.             В чем заключаются сложности, возникающие при практическом применении метода ДП?

26.             Назовите и охарактеризуйте основные шаги математической фор­мализации задач управления многошаговыми процессами.

Опишите структуру и порядок заполнения таблиц, используемых при проведении метода ДП.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 
25 26 27  Наверх ↑