1.7. Замечания по практическому применению метода динамического программирования

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
25 26 27

Принцип оптимальности Беллмана (*) сформулирован с использованием фазовых и управляющих переменных х^ и щ и функций , и, ) и В то же время постановка большинства практических задач не предполагает явного задания каких-либо математических переменных и функций. Следовательно, исходя из экономического содержания решаемых задач, необходимо предварительно должным образом ввести требуемые переменные и функции. Это надлежит сделать в следующем порядке.

1. Определить число N шагов в рассматриваемом управляемом процессе. В ряде случаев выбор числа шагов может быть неочевиден и неоднозначен. Например, при введении искусственного разбиения непрерывного процесса на шаги с целью последующего применения метода ДП число шагов "йе задается однозначно, а выбирается с учетом требуемой точности и оперативности решения, возможностей применяемых вычислительных средств (ЭВМ) и иных факторов.

2. Установить, какой параметр определяет состояние системы и может быть выбран в качестве фазовой переменной х, и выявить налагаемые на нее ограничения.

3. Установить, какой параметр может быть выбран в качестве управляющей переменной и, и выявить налагаемые на нее ограничения.

4. Составить функцию процесса /, определяющую закон изменения состояния системы.

5. Составить частную целевую функцию г, определяющую экономический эффект на каждом из шагов процесса.

Выполнение действий, предписанных пп. 1-5, представляет собой математическую формализацию экономического содержания задачи ДП и называется построением экономико-математической модели задачи; этот этап зачастую является нестандартной частью решения и может представлять определенные сложности. Вслед за проведением формализации задачи необходимо проверить справедливость основных допущений метода ДП для возможности его последующего применения. Дальнейшие вычисления проводятся по стандартной рассмотренной выше схеме. По завершении численного решения необходимо вернуться к экономическому смыслу и терминологии исходной задачи, сформулировать окончательный ответ к задаче с использованием соответствующих терминов и дать экономическую трактовку полученного оптимального решения.

Если исходные данные задачи приведены в табличной форме, то при решении задачи методом ДП получаемые результаты расчетов удобно располагать в таблицах следующей структуры:

Вспомогательная таблица

} 4 1 = 1,2, } { = N,N-1, ...,2,1,

в которой представлены все допустимые значения аргумента х_г-\ и функции

Основная таблица

2,-1	Щ	Х{		Вг(Хг)	Zi + Bi(Xi)	Вг-1(2,-1)

1 = 1,2,..., N г = ЛГ,ЛГ_ 1,...,2,1

(предварительный этап) (этап условной оптимизации)

Хг-1
.В,-1(2,-1)

с помощью которой и проводится непосредственно расчет функций Беллмана В_г-\ (ж_г_]). Вспомогательная и основная таблицы строятся и заполняются для всех г = 1,2,... (т. е. всего строится N экземпляров вспомогательных и основных таблиц, отвечающих N шагам процесса; содержание таблиц, конечно, меняется от шага к шагу).Справа от вспомогательной таблицы и снизу под основной таблицей символами «-1|» и » указан порядок заполнения соответствующих фрагментов таблиц, который будет подробно рассмотрен ниже.

Структура основной таблицы строго соответствует структуре функционального уравнения Беллмана (*). Вычисления начинаются с выбора значения аргумента х_г-\ (столбец 1 таблицы) рассчитываемой функции

Вг-1(^-1).

При расчете вычисляется максимум по управляющей переменной щ (столбец 2). Значения х_г-\ и щ в соответствии с формулами

Хг = ,щ) и Z_i = щ)

определяют значения Х{ и г_г (столбцы 3 и 4). При вычислении максимума по щ используется вычисленное ранее значение В_г(х_г) (столбец 5), а максимум вычисляется от суммы

2^-1,Щ) + Д(Жг)

(столбец 6). Заканчиваются вычисления расчетом значения функции В{-х(Хг-\) (столбец 7). Основная таблица может содержать несколько строчных фрагментов, соответствующих различным значениям фазовой переменной. Х{-\, представленной в первом столбце таблицы.

Особое внимание следует обратить на двойную вертикальную черту, разделяющую основную таблицу на две части. Это разделение связано с тем, что заполнение таблиц разнесено по двум этапам: предварительному этапу и этапу условной оптимизации. На предварительном этапе проводится заполнение первой строки вспомогательной таблицы и левой части (четырех столбцов слева от двойной вертикальной черты) основной таблицы, содержащих значения переменных задачи и частных целевых функций и не связанных непосредственно с вычислением функций Беллмана В_г(х_г). Заполнение этих фрагментов таблиц проводится в естественном -порядке при г = 1,2,..., N, что и отмечено символом На этапе условной оптимизации проводится заполнение второй строки вспомогательной таблицы и правой части (трех столбцов справа от двойной вертикальной черты) основной таблицы, уже непосредственно связанных с вычислением функций В_г(х_г). Заполнение этих фрагментов таблиц проводится, как и предписывает принцип оптимальности Беллмана, е обратном порядке при i — М, N—1,... ,2,1, что и отмечено символом «-(]•». На этом же этапе вычисляются условно- оптимальные управления на которых достигаются промежу

точные экстремумы. При заполнении основных таблиц соответствующие условно-оптимальные значения управляющей переменной будут отмечаться знаком «/» (в отличие от символа «*» для оптимальных значений параметров). Более детальные пояснения будут приведены в следующей главе при рассмотрении конкретных примеров решения методом ДП типовых задач управления многошаговыми процессами.

В заключение главы коротко отметим, что изложенная классическая схема метода ДП может видоизменяться. В частности, порядок расчетов на этапах условной и безусловной оптимизации может быть изменен на противоположный, а предварительный этап совмещен с этапом условной оптимизации. В отдельных случаях подобные модификации могут привести к сокращению объема памяти, требуемой для решения соответствующих задач на ЭВМ. Наиболее просто и естественно такие видоизменения выглядят в задачах теории графов, рассматриваемой в гл. 3 настоящего учебного пособия.

О Контрольные вопросы

1. Поясните роль и значение математических методов в решении практических задач управления.

2. Дайте понятие многошагового процесса.

3. Для решения какого класса задач применяется метод ДП?

4. Что такое фазовая переменная и в чем состоят ее роль и предназначение?

5. Что такое управляющая переменная и каковы ее роль и предназначение?

6. Что такое функция процесса и в чем заключаются ее предназначение и экономическое содержание?

7. Что такое целевая функция и в чем состоят ее предназначение и экономическое содержание?

8. Сформулируйте понятие допустимого управления и поясните, в чем состоит его смысл.

9. Сформулируйте понятие оптимального управления и поясните, в чем состоит его смысл.

10. Дайте понятие траектории и оптимальной траектории.

11. Дайте понятие оптимального значения задачи.

12. Сформулируйте и поясните основные допущения метода ДП.

13. По какой причине оптимизация по нескольким шагам процесса не сводится к независимой оптимизации по отдельным шагам?

14. Как связаны между собой задачи на поиск максимума и минимума?

15. Почему классические методы поиска экстремальных значений функций многих переменных, основанные на дифференциальном исчислении, не всегда практически применимы?

16. Что такое условно-оптимальные значения целевой функции и каково их экономическое содержание?

17. Поясните принцип оптимальности Беллмана.

18. Запишите основное функциональное уравнение Беллмана.

19. Поясните, что означает рекуррентный характер функционального уравнения Беллмана.

20. В чем заключается принцип инвариантного погружения?

21. Поясните, что такое условно-оптимальные управления.

22. Назовите и охарактеризуйте этапы метода ДП.

23. Поясните, для чего, на каких этапах метода ДП и на сколь долгий срок требуется запоминание функций Беллмана и условно- оптимальных управлений.

24. Укажите основные достоинства и недостатки метода ДП.

25. В чем заключаются сложности, возникающие при практическом применении метода ДП?

26. Назовите и охарактеризуйте основные шаги математической формализации задач управления многошаговыми процессами.

Опишите структуру и порядок заполнения таблиц, используемых при проведении метода ДП.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
25 26 27 Наверх ↑