Необходимое условие экстремума в классической задаче Лагранжа
Классическая задача Лагранжа является задачей оптимального управления без ограничений на фазовый вектор управления. Постановка задачи: определить непрерывную вектор-функцию
и дифференцируемую вектор-функцию
доставляющие минимум функционалу (10.20) при условиях (10.21) (10.22) (10.23) Здесь F = F(x, u, t) – скалярная дифференцируемая функция своих аргументов, а f = f(x, u, t) – непрерывно-дифференцируемая вектор-функция. Таким образом, ставится задача об отыскании минимума функционала (10.20) при условии, что искомые функции x(t), u(t) удовлетворяют системе уравнений (10.21). Такая постановка задачи аналогична постановке задаче нелинейного программирования с ограничениями-равенствами, решение которой определялось путем введения вспомогательной функции Лагранжа. Дальше будет видно, что эта аналогия имеет глубокие корни. Решение поставленной задачи рассмотрим сначала для случая, когда при t = T ограничения (10.23) отсутствуют (задача со свободным концом). Предположим, что оптимальное решение задачи Лагранжа существует. Обозначим через , вектор-функции, доставляющие минимум функционалу (10.20) и удовлетворяющие системе уравнений (10.21). Введем вектор вспомогательных функций , которые определяются как решение следующей системы дифференциальных уравнений, называемой сопряженной по отношению к системе (10.21): (10.24) где , – транспонированная матрица. Начальные условия для системы (10.24) берутся при t = T в следующем виде: (10.25) т. е. Функции называются сопряженными переменными. Определим далее функцию Гамильтона (10.26) и сформулируем следующую теорему. Теорема (необходимое условие экстремума). Если функции и доставляют минимум функционалу (10.20) при условиях (10.21) и (10.22), то существует такая непрерывная вектор-функция , удовлетворяющая системе уравнений (10.24) и условиям (10.25), что управление в каждый момент времени t является стационарной точкой функции Гамильтона, т. е. выполняются условия (10.27) Заметим, что условие (10.27) представляет собой векторное равенство, в котором
На основании приведенной теоремы можно сделать вывод о том, что оптимальные управления следует искать среди тех функций, которые удовлетворяют системе (10.27). Следует отметить, что система (10.24), определяющая функцию , содержит неизвестные пока функции x(t) и u(t). Фактически все функции x(t), u(t) и взаимосвязаны и определяются как решения следующей системы уравнений, полученной на основании (10.21), (10.24) и (10.27): (10.28) (10.29) (10.30) Уравнения (30) полученной системы перепишем в координатной форме:
(10.31) ……………………..
Функции заданы в условиях задачи, следовательно, в системе (10.31) производные – известные функции. Таким образом, система (10.31) определяет зависимость u от x, и t , т. е. . Учитывая это, записываем уравнение (10.28), (10.29) в виде: (10.32) и получаем систему дифференциальных уравнений относительно 2n функций Для отыскания искомых решений имеем 2n условий: при t = t0 заданные значения x(t0); при t = T (10.33) Если система (10.32) решается точными методами, эти 2n условий используются для определения получающихся при интегрировании 2n произвольных постоянных величин. Однако для большинства практических задач система (10.32) точно не решается. В связи с этим возникает проблема разработки специальных алгоритмов численного решения, учитывающих особенности системы (10.32) и условий (10.33). Замечание 1. Продолжим далее параллель между рассматриваемой задачей и задачей математического программирования с ограничениями-равенствами. Легко видеть, что функция Гамильтона и сопряженные переменные играют ту же роль, что и функция Лагранжа и множители Лагранжа в соответствующей задаче нелинейного программирования. Замечание 2. Мы рассмотрели необходимые условия минимума для задачи со свободным концом. Для других видов задач (с закрепленными концами, с подвижным правым концом и т. д.) необходимые условия формулируются аналогично, лишь меняется вид системы (10.24) и условий (10.25), а также функции Гамильтона (10.26). Принцип максимума Л. С. Понтрягина – необходимое условие оптимальности (с. 175). В классической задаче Лагранжа нет ограничений на управление. Однако в большинстве практических задач множество допустимых управлений имеет сложную структуру. Для таких задач необходимые условия в том виде, как они установлены для классической задачи вариационного исчисления, естественно, непригодны. Их дальнейшим и существенным расширением является принцип максимума, установленный Л. С. Понтрягиным. Рассмотрим формулировку принципа максимума для следующей задачи оптимального управления: Определить вектор-функции и , доставляющие минимум функционалу (10.34) при условиях (10.35) (10.36) , (10.37) где – замкнутое множество. Другими словами, рассмотрим задачу оптимального управления со свободным правым концом и ограничениями на множество допустимых управлений. При этом управление будем разыскивать в классе кусочно-непрерывных функций, а вектор функции – в классе кусочно-дифференцируемых функций. Относительно функций и будем предполагать, что они непрерывны и имеют непрерывные частные производные по переменным Как и в классической задаче Лагранжа, введем сопряженную систему (10.38) с начальными условиями (10.39)
Функцию Гамильтона определим следующим образом: (10.40) Сформулируем теорему, которая выражает принцип максимума для данной задачи. Теорема 1 (принцип максимума). Если управление и траектория доставляет минимум функционалу (10.34) при уравнениях связи (10.35), ограничениях на управление (10.37) и краевых условиях (10.36), то существует такая непрерывная вектор-функция , удовлетворяющая сопряженной системе (10.38) и условию (10.39), что при каждом функция Гамильтона (10.40) достигает в точке максимума по всем , т. е.
(10.41) Из приведенной теоремы следует вывод о том, что оптимальное управление следует искать среди тех, которые удовлетворяют условию (10.41). Определив из (10.41), если это окажется возможным, зависимость , подставляем ее в системы (10.35) и (10.38). В результате приходим к краевой задаче для системы уравнений (10.42) при условиях (10.36), (10.37) ;
Таким образом, схема решения задачи оптимального управления на основе принципа максимума аналогична схеме решения задачи Лагранжа. Различаются они способом определения оптимального управления при максимизации функции Гамильтона. Замечание 1. Если оптимальное управление лежит внутри области допустимых управлений то ограничения задачи (10.37) являются несущественными, и тогда необходимое условие экстремума можно записать в виде (10.27): (10.43) Замечание 2. Мы рассмотрели формулировку принципа максимума для задачи со свободным правым концом. Для других задач оптимального управления формулировка имеет аналогичный вид, меняются лишь условия (10.38) и (10.39).
Ви переглядаєте статтю (реферат): «Необходимое условие экстремума в классической задаче Лагранжа» з дисципліни «Моделювання банківської діяльності»