РефератБар.ру: | Главная | Карта сайта | Справка
Динамическое программирование. Реферат.

Разделы: Экономика и управление | Заказать реферат, диплом

Полнотекстовый поиск:




     Страница: 1 из 1
     <-- предыдущая следующая -->

Перейти на страницу:
скачать реферат | 1 





Курсовая работа по теории оптимального управления экономическими системами.
Тема : Задача динамического программирования.

I.Основные понятия и обозначения.

Динамическое программирование – это математический метод поиска оптимального управления, специально приспособленный к многошаговым процессам. Рассмотрим пример такого процесса.
Пусть планируется деятельность группы предприятий наNлет. Здесь шагом является один год. В начале 1-го года на развитие предприятий выделяются средства, которые должны быть как-то распределены между этими предприятиями. В процессе их функционирования выделенные средства частично расходуются. Каждое предприятие за год приносит некоторый доход, зависящий от вложенных средств. В начале года имеющиеся средства могут перераспределяться между предприятиями : каждому из них выделяется какая-то доля средств.
Ставится вопрос : как в начале каждого года распределять имеющиеся средства между предприятиями, чтобы суммарный доход от всех предприятий заNлет был максимальным?
Перед нами типичная задача динамического программирования, в которой рассматривается управляемый процесс – функционирование группы предприятий. Управление процессом состоит в распределении (и перераспределении) средств. Управляющим воздействием (УВ) является выделене каких-то средств каждому из предприятий в начале года.
УВ на каждом шаге должно выбираться с учетом всех его последствий в будущем. УВ должно быть дальновидным, с учетом перспективы. Нет смысла выбирать на рассматриваемом шаге наилучшее УВ, если в дальнейшем это помешает получить наилучшие результаты других шагов. УВ на каждом шаге надо выбирать “c заглядыванием в будущее”, иначе возможны серьезные ошибки.
Действительно, предположим, что в рассмотренной группе предприятий одни заняты выпуском предметов потребления, а другие производят для этого машины. Причем целью является получение заNлет максимального объема выпуска предметов потребления. Пусть планируются капиталовложения на первый год. Исходя их узких интересов данного шага (года), мы должны были бы все средства вложить в производство предметов потребления, пустить имеющиеся машины на полную мощность и добиться к концу года максимального объема продукции. Но правильным ли будет такое решение в целом? Очевидно, нет. Имея в виду будущее, необходимо выделить какую-то долю средств и на производство машин. При этом объем продукции за первый год, естественно, снизится, зато будут созданы условия, позволяющие увеличивать ее производство в последующие годы.
В формализме решения задач методом динамического программирования будут использоваться следующие обозначения:
N– число шагов.
– вектор,описывающий состояние системы наk-м шаге.
– начальное состояние, т. е. cостояние на 1-м шаге.
– конечное состояние, т. е. cостояние на последнем шаге.
Xk– область допустимых состояний на k-ом шаге.
– вектор УВ наk-ом шаге, обеспечивающий переход системы из состояния xk-1в состояние xk.
Uk– область допустимых УВ наk-ом шаге.
Wk– величина выигрыша, полученного в результате реализацииk-го шага.
S – общий выигрыш заNшагов.
– вектор оптимальной стратегии управления или ОУВ заNшагов.
Sk+1() – максимальный выигрыш, получаемый при переходе из любого состоянияв конечное состояниепри оптимальной стратегии управления начиная с (k+1)-го шага.
S1() – максимальный выигрыш, получаемый заNшагов при переходе системы из начального состоянияв конечноепри реализации оптимальной стратегии управления. Очевидно, что S = S1(), если–фиксировано.
Метод динамического программирования опирается на условие отсутствия последействия и условие аддитивности целевой функции.
Условие отсутствия последействия. Состояние, в которое перешла система за один k-й шаг, зависит от состоянияи выбранного УВи не зависит от того, каким образом система пришла в состояние, то есть




Аналогично, величина выигрышаWkзависит от состоянияи выбранного УВ, то есть



Условие аддитивности целевой функции.Общий выигрыш заNшагов вычисляется по формуле



Определение. Оптимальной стратегией управленияназывается совокупность УВ, то есть, в результате реализации которых система заNшагов переходит из начального состоянияв конечноеи при этом общий выигрышSпринимает наибольшее значение.
Условие отсутствия последействия позволяет сформулировать принцип оптимальности Белмана.
Принцип оптимальности. Каково бы ни было допустимое состояние системы

перед очереднымi-м шагом, надо выбрать допустимое УВна этом шаге так, чтобы выигрышWiнаi-м шаге плюс оптимальный выигрыш на всех последующих шагах был максимальным.
В качестве примера постановки задачи оптимального управления продолжим рассмотрение задачи управления финансированием группы предприятий. Пусть в начале i-го года группе предприятийвыделяются соответственно средства:совокупность этих значений можно считать управлением на i-м шаге, то есть. Управлениепроцессом в целом представляет собой совокупность всех шаговых управлений, то есть.
Управление может быть хорошим или плохим, эффективным или неэффективным. Эффективность управленияоценивается показателемS. Возникает вопрос: как выбрать шаговые управления, чтобы величинаSобратилась в максимум ?
Поставленная задача является задачей оптимального управления, а управление, при котором показательSдостигает максимума, называется оптимальным. Оптимальное управлениемногошаговым процессом состоит из совокупности оптимальных шаговых управлений:


Таким образом, перед нами стоит задача: определить оптимальное управление на каждом шаге(i=1,2,...N) и, значит, оптимальное управление всем процессом.

II. Идеи метода динамического программирования

Мы отметили, что планируя многошаговый процесс, необходимо выбирать УВ на каждом шаге с учетом его будущих последствий на еще предстоящих шагах. Однако, из этого правила есть исключение. Среди всех шагов существует один, который может планироваться без "заглядыва-ния в будущее". Какой это шаг? Очевидно, последний — после него других шагов нет. Этот шаг, единственный из всех, можно планировать так, чтобы он как таковой принес наибольшую выгоду. Спланировав оптимально этот последний шаг, можно к нему пристраивать предпоследний, к предпоследнему — предпредпоследний и т.д.
Поэтому процесс динамического программирования на 1-м этапе разворачивается от конца к началу, то есть раньше всех планируется последний,
N-й шаг. А как его спланировать, если мы не знаем, чем кончился предпоследний? Очевидно, нужно сделать все возможные предположения о том, чем кончился предпоследний,(N —1)-й шаг, и для каждого из них найти такое управление, при котором выигрыш (доход) на последнем шаге был бы максимален. Решив эту задачу, мы найдем условно оптимальное управление (УОУ) наN-м шаге, т.е. управление, которое надо применить, если (N —1)-й шаг закончился определенным образом.
Предположим, что эта процедура выполнена, то есть для каждого исхода
(N —1)-го шага мы знаем УОУ наN-м шаге и соответствующий ему условно оптимальный выигрыш (УОВ). Теперь мы можем оптимизировать управление на предпоследнем, (N— 1)-м шаге. Сделаем все возможные предположения о том, чем кончился предпредпоследпий, то есть(N —2)-й шаг, и для каждого из этих предположений найдем такое управление на(N— 1)-м шаге, чтобы выигрыш за последние два шага (из которых последний уже оптимизирован) был максимален. Далее оптимизируется управ чение на(N —2)-м шаге, и т.д.
Одним словом, на каждом шаге ищется такое управление, которое обеспечивает оптимальное продолжение процесса относительно достигнутого в данный момент состояния. Этот принцип выбора управления , называется принципом оптимальности. Само управление, обеспечивающее оптимальное продолжение процесса относительно заданного состояния, называется УОУ на данном шаге.
Теперь предположим, что УОУ на каждом шаге нам известно: мы знаем, что делать дальше, в каком бы состоянии ни был процесс к началу каждого шага. Тогда мы можем найти уже не "условное", а дейсгвительно оптимальное управление на каждом шаге. |
Действительно, пусть нам известно начальное состояние процесса. Теперь мы уже знаем, что делать на первом шаге: надо применить УОУ, найденное для первого шага и начального сосюяния. В результате этого управления после первого шага система перейдет в другое состояние; но для этого состояния мы знаем УОУ и г д. Таким образом, мы найдем оптимальное управление процессом, приводящее к максимально возможному выигрышу.
Таким образом, в процессе оптимизации управления методом динамического программирования многошаговый процесс "проходится" дважды:
— первый раз — от конца к началу, в результате чего находятся УОУ| на каждом шаге и оптимальный выигрыш (тоже условный) на всех шагах, начиная с данного и до конца процесса;

— второй раз — от начала к концу, в результате чего находятся оптимальные управления на всех шагах процесса.

Можно сказать, что процедурапостроения оптимального управления
методом динамического программирования распадается на две стадии:
предварительную и окончательную. На предварительной стадии для каждого шага определяется УОУ, зависящее от состояния системы (достигнутого в результате предыдущих шагов), и условно оптимальный выигрыш на всех оставшихся шагах, начиная с данного, также зависящий от состояния. На окончательной стадии определяется (безусловное) оптимальное управление для каждого шага. Предварительная (условная) оптимизация производится по шагам в обратном порядке: от последнего шага к первому; окончательная (безусловная) оптимизация — также по шагам, но в естественном порядке: от первого шага к последнему. Из двух стадий оптимизации несравненно более важной и трудоемкой является первая. После окончания первой стадии выполнение второй трудности не представляет: остается только "прочесть" рекомендации, уже заготовленные на первой стадии.

III. Пример задачи динамического программирования

Выбор состава оборудования технологической линии.
Есть технологическая линия , то есть цепочка, последовательность операций.
На каждую операцию можно назначить оборудование только каго-то одного вида, а оборудования, способного работать на данной операции, - несколько видов.

Исходные данные для примера



i

1

2

3




j

1

2

1

2

1

2



10
8

4

5

8

9


12

8

4

6

9

9



20
18

6

8

10

12





     Страница: 1 из 1
     <-- предыдущая следующая -->

Перейти на страницу:
скачать реферат | 1 

© 2007 ReferatBar.RU - Главная | Карта сайта | Справка