ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ Практикум для вузов
Составитель Е.П. Белоусова
Издательско-полиграфический центр Воронежского государственного университета 2008
Утверждено научно-методическим советом факультета ПММ 29 февраля 2008 г., протокол № 2
Рецензент С.А. Ткачева
Практикум подготовлен на кафедре прикладной математики и естественнонаучных дисциплин филиала факультета ПММ Воронежского государственного университета г. Лиски.
Рекомендуется для студентов 3 курса.
Для специальности 010501 – Прикладная математика и информатика
2
§ 1. Введение Основная цель вариационного исчисления – получить общие методы отыскания экстремумов для задач, содержащих функции с бесконечным числом степеней свободы. Поэтому нам понадобятся сведения из теории функций нескольких переменных. Пример перехода от конечного числа степеней свободы к бесконечному числу. Рассмотрим натянутую между двумя неподвижными точками цепочку из материальных частиц, последовательно связанных друг с другом одинаковыми пружинками. Пусть на частицы действуют малые поперечные силы, вызывающие отклонение цепочки от ненагруженного состояния равновесия.
Рис. 1 Причем для простоты будем считать, что перемещения частиц перпендикулярны линии ненагруженного состояния, т. е. оси X . Найдем нагруженное состояние равновесия, которое характеризуется отклонениями y1 , y 2 , ..., y n −1 частиц от оси X . Для этого определим потенциальную энергию U цепочки в любом отклоненном состоянии, отсчитывая U от ненагруженного, но уже натянутого состояния цепочки. Эта энергия складывается из двух частей U = U упр + U внеш ,
3
(1)
первая представляет собой работу, затраченную на преодоление упругости пружинок, а вторая – на преодоление внешних сил. Первая пропорциональна удлинению Δl цепочки (2)
U упр = PΔl ,
где P – сила натяжения цепочки; мы будем считать, что эта сила при отклонениях остается постоянной. Удлинение пружинки, соединяющей частицы M i и M i +1 , равно 2
2
Δli = h + ( Δyi ) − h = h( 1 +
( Δyi ) 2 h2
) − h = h( 1 +
( Δyi ) 2 h2
−1) =
2 ( y i +1 − y i ) 2 1 ( Δyi ) = = h⋅ . 2 h2 2h
В силу формулы (2) U упр = P ∑ i
( y i +1 − y i ) 2
2h
=
P ∑ ( y − yi ) 2 . 2 h i i +1
Еще проще находится U внеш = ∑ yi ( − Fi ) = −∑ Fi yi . i
i
Таким образом, в силу (1) получаем U=
P ∑ ( y − yi ) 2 − ∑ Fi yi . 2 h i i +1 i
(3)
В положении равновесия потенциальная энергия должна иметь «стационарное» значение, т. е. бесконечно малые изменения координат должны приводить к изменениям высшего порядка малости в потенциальной энергии. Другими словами, производные от потенциальной энергии по координатам в положении равновесия должны равняться нулю. В самом деле, легко проверить, что производная
∂U равна, с противоположным знаком, общей ∂yi
силе, действующей на i -ю частицу. Так как в правую часть (3) координата yi входит в три члена 4
P [( yi − yi −1 ) 2 + ( yi +1 − yi ) 2 ] − Fi yi , 2h
то P ∂U P = [2( yi − yi −1 ) − 2( yi +1 − yi )] − Fi = − ( yi +1 − 2 yi + yi −1 ) − Fi , ∂yi 2h h
и условие стационарности дает P (4) ( y − 2 yi + yi −1 ) + Fi = 0 (i = 1,2,..., n − 1) . h i +1 Получается система из n − 1 алгебраических уравнений первой степени с n − 1 неизвестными координатами y1 , y 2 ,..., y n −1 . Отметим, что при i = 1
в уравнение (4) входит y 0 , которое надо положить равным нулю (это закрепленная точка), а при i = n − 1 входит y n , которое также надо положить равным нулю. Решив систему (4), найдем искомое положение равновесия. Рассмотрим пример. Пусть все силы Fi = F одинаковы. Перепишем систему (4) в виде hF y 2 − y1 = − + y1 , P hF y3 − 2 y 2 + y1 = − , P hF y 4 − 2 y3 + y 2 = − , P
Складывая первое и второе равенства, первое, второе и третье и т. д., получим hF y 2 − y1 = − + y1 , P y3 − y 2 = −2
hF + y1 , P
hF y 4 − y 3 = −3 + y1 , P 5
Перенеся в первом равенстве y1 из левой части в правую, а за тем проведя ту же процедуру сложения, получим, применяя легко проверяемое равенство 1 + 2 + ... + k =
y2 = −
k ( k + 1) , 2
hF + 2 y1 , P
y3 = −
2 ⋅ 3 hF + 3 y1 , 2 P
y4 = −
3 ⋅ 4 hF + 4 y1 , 2 P
В общем виде yi = −
(i − 1)i hF + iyi . 2 P
(5)
Так как y n должно получиться равным нулю, то −
( n − 1)n hF + ny1 = 0, откуда 2 P
y1 =
( n − 1)hF . 2P
Подставляя в (5) находим окончательно
yi = −
(i − 1)i hF (n − 1)hF i(n − i)hF +i = . 2 P 2P 2P
(6)
(i = 1,2,..., n − 1). Эта формула верна при i = 0 , и при i = n.
Рассмотренная система определяется отклонениями n − 1 ее частиц, т. е. имеет n − 1 степеней свободы. Увеличивая n при заданной длине l цепочки, мы одновременно бесконечно увеличиваем число степеней свободы, и в пределе получаем из цепочки непрерывную струну, которая представляет собой систему с бесконечным числом степеней свободы. Итак, из дискретной, точечной системы частиц мы получаем в пределе сплошную среду с непрерывно распределенной массой. Выясним, как преобразуется в пределе выражение для потенциальной энергии и условие статического равновесия. Будем считать, что внешняя поперечная сила распределена по струне с некоторой плотностью f (x ) , так что 6
на малую длину h струны приходится сила f ( x ) ⋅ h. Перепишем выражение (3) для потенциальной энергии в виде P y − yi 2 U = ∑ [ ( i +1 ) − f i yi ]h . h i 2
При больших значениях n , т. е. малых h , можно заменить отношение
yi +1 − yi h
на yi′ , и потенциал принимает вид P P U = ∑ [ y ′ 2 − fy ]i h = ∑ [ y ′ 2 − fy ]i Δx, i 2 i 2
так как h = Δx. Но это – интегральная сумма, и в пределе при h → 0 она переходит в интеграл l P U = ∫ [ ( y ′ 2 ) − f ( x ) y ]dx. 2 0
(7)
Таким образом, задачу об отыскании формы равновесия натянутой нагруженной струны математически можно сформулировать так: найти функцию y( x) (описывающую форму струны), удовлетворяющую условиям закрепления (8) и придающую интегралу (7) минимально возможное значение. Эта задача относится к вариационному исчислению. Посмотрим теперь, во что в пределе перейдет условие (4) статического равновесия, которое теперь надо переписать в виде y(0) = 0,
y (l ) = 0
y − 2 yi + yi −1 P i +1 + f i = 0. h2
(9)
Для этого напомним, что соотношение yi +1 − 2 yi + yi −1 , h2
при малых значениях h , близко к значению второй производной y ′′ . Таким образом, в пределе, при h → 0 , из (9) мы получаем
7
Py ′′ + f ( x ) = 0, т. е. y′′ = −
1 f ( x), P
(10)
и нам надо найти решение y(x ) этого уравнения, удовлетворяющее условиям (8). Итак, вариационная задача об отыскании минимума интеграла при условиях (8) свелась к решению дифференциального уравнения (10) при тех же условиях. Из физических соображений ясно, что какое-то положение струны, отвечающее минимуму потенциальной энергии, имеется. Но уравнение (10) при условиях (8) имеет лишь единственное решение. Значит, это решение и доставляет интегралу (7) минимум. § 2. Функционал
Рассмотрим вариационную задачу, возникшую в конце XVII века и решенную Лейбницем, Лопиталем и Ньютоном независимо друг от друга.
Рис. 2 Пусть материальная частица M под действием силы тяжести скатывается без трения с нулевой начальной скоростью от точки A до точки B по линии (L ) (рис. 2). Как выбрать эту линию, чтобы падение произошло в минимальное время? Обозначим неизвестное уравнение линии через y = y(x ) . Тогда функция y(x) прежде всего должна удовлетворять условиям y( a ) = y a ,
y (b ) = y b ,
(11)
где y a и yb – ординаты заданных точек A и B. Скорость движения частицы M в любой текущий момент легко определить, исходя из закона сохранения энергии 8
mv 2 = mg ( y a − y ) , откуда v = 2 g ( y a − y ) . 2
Горизонтальная составляющая скорости равна dx dx 1 dx dx ds . = =v =v = 2 g ( ya − y) 2 2 2 dt ds dt ds dx + dy 1 + y′
Выражая отсюда dt и интегрируя, получим полное время падения b
T=∫
1 + y′2
a 2 g ( ya − y)
dx .
(12)
Таким образом, требуется из всех функций, удовлетворяющих условиям (11), выбрать такую, для которой интеграл (12) принимает наименьшее возможное значение. Разобранная задача является типичной задачей вариационного исчисления. К таким задачам относятся задачи на экстремум (максимум или минимум), т. е. задачи, в которых требуется придать экстремальное значение некоторому числовому параметру. Искомой является не число или набор чисел, а функция y(x ) . Такой закон, согласно которому каждой функции из определенного класса функций соответствует значение некоторого числового параметра, называется функционалом. Таким образом, основная задача вариационного исчисления – это задача о нахождении экстремума заданного функционала. Простейшим примером функционала является определенный интеграл. Рассмотрим, например, формулу 1
I = ∫ y 2 dx ( y = y( x )) .
(13)
0
Если вместо y(x ) подставлять разные функции, то будут получаться конкретные числовые значения I . Например, выбрав y1 = x 2 , получим 1
1
0
0
I = ∫ ( x 2 ) 2 dx = ∫ x 4 dx =
выбрав y = x 3 , получим I =
x5 1 1 | = = 0,2 , 5 0 5
1 = 0,143, выбрав y = sin x , получим I = 0,273 и т. д. 7
9
Формула 1
I = ∫ xy ′dx ( y = y( x ); y ′ = 0
dy ) dx
(14)
3
определяет другой функционал. Формула I = ∫ y 2 dx ( y = y( x )) третий и т. д. −1
Функционал (14) – линейный. Это значит, что при сложении функций значения функционала I также складываются 1
1
1
0
0
0
∫ x( y1 + y 2 )′dx = ∫ xy1′ dx + ∫ xy 2′ dx .
Функционал (13) – нелинейный (квадратичный). § 3. Уравнение Эйлера
Вернемся к рассмотренной задаче о равновесии упругой струны под действием внешней силы. Эта задача свелась к нахождению экстремума (или даже просто стационарного значения) функционала в классе функций, удовлетворяющих граничным условиям (8). Попробуем найти решение из условия равенства нулю приращения функционала ΔI ≈ δI (где δI называется вариацией функционала). Для этого сначала посчитаем величину δU . Пусть y получит приращение δy , тогда y ′ получит приращение δ( y ′) . Нетрудно проверить, что δ( y ′) = (δy )′ . В самом деле, если δy = Y ( x ) − y( x ) , то δ( y ′) = Y ′( x ) − y ′( x ) = [Y ( x ) − y( x )]′ = (δy )′ . Отсюда l l P P ΔU = ∫ [ ( y ′ + δy ′) 2 − f ( x )( y + δy )]dx − ∫ [ ( y ′) 2 − f ( x ) y ]dx = 2 2 0 0 l
= ∫ [ Py ′δy ′ + 0
P (δy ′) 2 − f ( x )δy ]dx . 2
Отбрасывая член второго порядка малости, получаем l
δU = ∫ [ Py ′δy ′ − f ( x )δy ]dx . 0
10
Необходимое условие δU = 0 дает условие l
l
0
0
P ∫ y ′δy ′dx − ∫ f ( x )δydx = 0,
(15)
причем это равенство должно выполняться для любой вариации δy , удовлетворяющей условиям δy(0) = 0, δy(l ) = 0 ,
(16)
которые нужны для того, чтобы y + δy удовлетворяла тем же условиям (8), что и y . Для дальнейших выводов из соотношения (15) проинтегрируем первый член по частям, применяя равенства (16) l
l
l
0
0
0
0 = Py ′δy |lx = 0 − P ∫ y ′′δydx − ∫ f ( x )δydx = − ∫ [ Py ′′ + f ( x )]δydx .
Воспользовавшись теперь произвольностью в выборе δy , получим Py ′′ + f (x ) = 0 ,
т. е. уравнение (10). Выведем теперь аналогичное дифференциальное уравнение для функционала более общего вида b
I = ∫ F ( x, y , y ′)dx ( y = y( x ), y ′ = a
dy ), dx
(17)
где F – заданная функция, a, b – заданные пределы интегрирования. Пусть ищется экстремум этого функционала при заданных краевых условиях y( a ) = y a ,
y (b ) = y b .
(18)
Рассуждая, как в только что разобранном примере, получим вариацию функционала (17) b
δI = ∫ [ F y′ ( x, y , y ′)δy + F y′ ′ ( x, y , y ′)δy ′]dx . a
11
Если теперь некоторая функция y(x ) , удовлетворяющая условиям (18), реализует экстремум функционала (17) по сравнению со всеми близкими функциями, удовлетворяющими тем же условиям, то по признаку δI = 0 должно быть b
∫ [ Fy′ ( x, y , y ′)δy + Fy′ ′ ( x, y , y ′)δy ′]dx = 0 .
(19)
a
Это равенство должно выполняться для любой вариации δy , удовлетворяющей соотношениям δy( a ) = 0, δy(b) = 0 ,
(20)
которые нужны для того, чтобы y + δy удовлетворяла тем же условиям (18), что и y . Интегрируя по частям второе слагаемое (19) и применяя соотношения (20), получим b
b
b d d ( F y′ ′ )δydx = ∫ [ F y′ − ( F y′ ′ )]δydx . dx dx a a
0 = ∫ F y′ δydx + F y′ ′ δy |ba − ∫ a
Отсюда в силу произвола в выборе δy вытекает, что последняя квадратная скобка тождественно равна нулю. В самом деле, если взять δy равной этой скобке и лишь вблизи точек a и b заставить быстро спадать до нуля, то b
d
последний интеграл будет приближенно равен ∫ [ F y′ − F y′ ′ ]2 dx . Но он долdx a жен равняться нулю, откуда и следует утверждение. Итак, мы пришли к так называемому уравнению Эйлера F y′ ( x, y , y ′) −
d F ′ ( x , y , y ′) = 0 . dx y ′
Отметим, что в нем при дифференцировании
(21)
d величина y рассматdx
ривается как функция x . Более подробно по правилу дифференцирования сложной функции уравнение Эйлера можно переписать в виде F y′ ( x, y , y ′) − Fx′′y ′ ( x, y , y ′) − F y′′y ′ ( x, y , y ′) y ′ − F y′′′y ′ ( x, y , y ′) y ′′ = 0 .
12
(22)
Здесь частные производные берутся от функции F ( x, y , y ′) уже без учета зависимости от переменных x , y и y ′ . Видно, что (22) – дифференциальное уравнение второго порядка, и потому его общее решение содержит две произвольные постоянные, которые определяются с помощью краевых условий (18). Вернемся теперь к задаче о линии наибыстрейшего спуска. В этом случае надо положить 1 + y′2
F=
2g( ya − y)
.
(23)
Так как в правую часть не входит непосредственно x , то в левой части (22) отсутствует второе слагаемое, и после умножения обеих частей (22) на y ′ его можно переписать в виде ( F − F y′ ′ y ′)′ = 0 . Отсюда, интегрируя, получаем F − F y′ ′ y ′ = c1 ,
(24)
что для конкретного примера (23) дает
1 + y′2 2g( ya − y)
y′
−
1+ y
′2
2 g ( ya − y)
y ′ = c1 ,
т. е. 1 1+ y
′2
= c1 .
2 g ( ya − y)
Для интегрирования этого уравнения введем параметр t по формуле y a − y = r (1 − cost ) , где
r=
1 4 gc12
.
Тогда, преобразуя, получаем 1 1 + y′2
= c1 2 g ( y a − y ) =
13
1 − cos t ; 2
1 + y′2 =
sin 2 t 2 1 + cos t = ; y′2 = ; 1 − cos t 1 − cos t (1 − cos t ) 2
dy sin t 1 − cos t dy = ± r (1 − cos t )dt; ; dx = ± =± dx sin t 1 − cos t x = ± r (t − sin t ) + c 2 .
Это выражение вместе с предыдущим выражением для y дают параметрические уравнения так называемой циклоиды, т. е. линии, которую описывает точка окружности радиуса r , которая катится снизу без скольжения по горизонтальной прямой, проведенной через точку A . Таким образом, линией наибыстрейшего спуска служит циклоида с острием в точке A . Радиус r при этом должен быть подобран так, чтобы первая арка циклоиды прошла через конечную точку. На рис. 3 показано несколько таких арок, из которых через конечную точку проходит четвертая.
Рис. 3 Задания для самостоятельного решения
1.
Найдите решение задач: 1
а) I = ∫ ( y 2 + y ′ 2 )dx → min; y(0) = 0, y(1) = 1 0
14
1
б) I = ∫ yy ′ 2 dx → min; y(0) = p > 0, y(1) = q > 0 . 0
2. В последней задаче найти
∂I непосредственно и по формуле, вы∂p
веденной в тексте. § 4. Простейшая задача вариационного исчисления
Рассматривается задача о нахождении минимума в пространстве непрерывно-дифференцируемых на отрезке [t 0 , t1 ] функций C 1 ([t 0 , t1 ] ) функционала I (u ) =
t1
∫ L(t , u , u )dt → inf
(25)
t0
при условии (26)
u (t 0 ) = a , u (t1 ) = b.
Если u* – точка экстремума задачи (25)–(26), то она удовлетворяет уравнению Эйлера: ∂L d ∂L − = 0. ∂u dt ∂u
(27)
Решения уравнения (27) из пространства C 1 ([t 0 , t1 ]) , удовлетворяющие на концах отрезка условиям (26), называются допустимыми экстремалями. Определение 1: точка u* – слабый локальный минимум, если выполняются следующие условия: ∃ δ > 0 такое, что || u − u* ||< δ ⇒ I (u ) ≥ I (u* ) .
для
любого
допустимого
u
справедливо:
Определение 2: точка u* – сильный локальный минимум, если выполняются следующие условия
15
∃ δ > 0 такое, что для любого u из пространства KC 1 ([t 0 , t1 ]) справедли-
во: || u − u* ||0 < δ ⇒ I (u ) ≥ I (u* ). Здесь KC 1 ([t 0 , t1 ]) – пространство кусочнонепрерывных дифференцируемых функций. Для удобства будем рассматривать норму вида || u ||0 = max |u(t )| . t
Рассмотрим несколько частных случаев уравнения Эйлера. 1. Пусть функция f имеет вид f = f (t , x ). Тогда частные производные ∂f ∂f (t , x ) =0 и = 0. Уравнение Эйлера становится алгебраическим уравнени∂x ∂x
ем, которое либо имеет решение, удовлетворяющее условию (26), либо нет. 2. Пусть функция f имеет вид f = f (t , x ). Тогда, очевидно, что
∂f = 0. ∂x
Уравнение Эйлера в этом случае приобретает вид d ∂f (t , x ) = 0. dt ∂x
Следовательно,
∂f (t , x ) = const . Это дифференциальное уравнение пер∂x
вого порядка. 3. Если f = f ( x, x ) , то уравнение Эйлера приобретает следующий вид f −
∂f x = const . ∂x
Докажем это. Посчитаем производную по времени t от левой части предыдущего уравнения. Получим ∂f d = ( f − x ) = f t + f x x + f x x − f x x − ftx x − f xx ( x ) 2 − f xx xx ∂x dt xx − f xx = x ( f x − xf x) = 0.
Пример 1.
Исследовать на минимум функционал вида 1
I (u ) = ∫ u 2 dt → inf , 0
при условии u(0) = 0, u(1) = 1 . 16
Решение. Введем обозначения. Пусть L = u 2 , тогда
пишем уравнение Эйлера
∂L ∂L = 0, = 2u . Вы∂u ∂u
∂L d ∂L − = 0 . В нашем случае оно имеет вид ∂u dt ∂u
d ( 2u ) = 0 . Решением этого уравнения является линейная функция вида dt u (t ) = c1t + c 2 . Воспользуемся граничными условиями. Тогда из того, что u(0) = 0 −
следует, что c2 = 0 . А из условия u(1) = 1 вытекает, что c1 = 1 . В результате искомая функция имеет вид u (t ) = t , и искомое значение функционала на этой функции равно 1
1
0
0
I (u ) = ∫ (t) 2 dt = ∫ dt = t |10 = 1 .
Покажем, что найденная экстремаль единственна, и она доставляет глобальный минимум функционалу. Придадим точке u* некоторое приращение, т. е. построим новую точку u* + h и посчитаем разность значений функционала
в этих точках. Здесь функция h(t ) обладает свойствами:
h(0) = 0, h(1) = 1 . Кроме того, эта функция принадлежит пространству C 1 ([0,1]) .
Получим 1
1
1
0
0
0
I (u* + h) − I (u ) = ∫ (t + h ) 2 dt − ∫ t2 dt = ∫ (1 + 2u + h 2 − 1)dt = 1
1
1
1
0
0
0
0
= ∫ ( 2u + h 2 )dt = 2( h(1) − h(0)) + ∫ h 2 dt = 2 + ∫ h 2 dt = 2 + ∫ h 2 dt ≥ 0 .
Отсюда следует, что функция u* (t ) = t ∈ C 1 ([0,1]) – единственная экстремаль. Пример 2.
Найти минимум функционала 2
I (u ) = ∫ t 2 u 2 dt → inf , 1
при ограничениях вида u(1) = 3, u( 2) = 1.
17
Решение. В этой задаче функция L имеет вид L = t 2 u 2 . Тогда соответ-
ствующие производные равны
∂L = 0, ∂u
∂L = 2t 2 u . Проинтегрируем уравнение ∂u
d ( 2t 2 u ) = 0 . dt c 1 Искомое решение имеет вид u(t ) = − 1 + c 2 . Воспользуемся граничны2 t ми условиями и получим систему для нахождения коэффициентов c1 и c2 : −
⎧ c1 ⎪⎪ − + c 2 = 3 ⎨ c2 ⎪− 1 ⋅ 1 + c = 1 ⎩⎪ 2 2 2
⎧− c1 + 2c 2 = 6 ⎨− c + 4c = 4 . 2 ⎩ 1
⇒
Вычтем из первого уравнения второе и получим, что c2 = −1, c1 = −8. 4 t
Поэтому искомая функция будет иметь вид u* (t ) = − 1. Рассмотрим новую функцию h(t ) из пространства C 1 ([1,2]) со свойствами h(1) = 3, h( 2) = 1 и зададим приращение u* + h. Вычислим разность значений функционала на этих функциях 2
2
4 I (u* + h ) − I (u ) = ∫ t ( − 1 + h ) dt − ∫ t 2 ( − 1)′ 2 dt = t t 1 1 2
= ∫ (t 2 ( − 1
2 4
′2
2 2 4 + h ) 2 − t 2 ( − ) 2 )dt = ∫ ( −8h + t 2 h 2 )dt = −8( h( 2) − h(1)) + ∫ t 2 h 2 dt = t2 t2 1 1
4
2
= 16 + ∫ t 2 h 2 dt ≥ 0. 1
Следовательно, экстремальной функцией в этой задаче будет u* ( t ) =
4 − 1 из пространства C 1 ([1,2]). t
Пример 3.
Найти минимум функционала 1
I (u ) = ∫ t 2 / 3u 2 dt → inf, 0
при условиях на концах отрезка u(0) = 0, u(1) = 1. 18
Решение. В этом случае функция L имеет вид L = t 2 / 3u 2 . Соответ-
ствующие производные
∂L = 0, ∂u
∂L = 2t 2 / 3u . Необходимо решить уравнение ∂u −
d ( 2t 2 / 3u ) = 0. dt
Функция решения имеет вид u(t ) = c1t 1 / 3 + c2 . Из граничных условий составим систему уравнений для нахождения коэффициентов c1 и c2 . Получим ⎧c ⋅ 0 + c 2 = 0 ⎨ c ⋅1 + c = 1 2 ⎩
⇒
⎧ c1 = 1 ⎨c = 0 . ⎩ 2
Функция u(t ) = t 1 / 3 не принадлежит пространству C 1 ([0,1]) , так как ее производная u(t ) не принадлежит пространству непрерывных функций C ([0,1]). Однако именно она доставляет глобальный минимум в задаче среди всех абсолютно непрерывных функций u(⋅) , удовлетворяющих краевым условиям, для которых интеграл I (u ) конечен (показать самостоятельно). Рассмотрим теперь задачу следующего вида: I (u ) =
t1
∫ L(t , u , u ,..., u
(n)
)dt → inf
(28)
t0
при условиях
u ( j ) (t i ) = aij ,
j = 0,..., n − 1, i = 0,1.
(29)
Надо найти функцию u* (t ) . Если подынтегральная функция содержит производные более высокого порядка, чем первый, то уравнение Эйлера приобретает следующий вид d n ∂L ∂L d ∂L d 2 ∂L d 3 ∂L − + − + ... + ( −1) n = 0. ∂u dt ∂u dt 2 ∂u dt 3 ∂u dt n ∂u ( n )
Пример 1.
Исследовать на минимум функционал 1
I (u ) = ∫ u2 dt → inf, 0
при условиях u(0) = u(1) = 0, u(0) = 0, u(1) = 1. 19
(30)
Решение. В рассматриваемом примере функция L имеет вид L = u2 . Посчитаем ее соответствующие производные. Они будут иметь вид ∂L = 0, ∂u
∂L = 0, ∂u
∂L = 2u. Составим уравнение Эйлера для этой задачи ∂u d2 dt 2
( 2u) = 0.
Решение этого уравнения имеет вид u(t ) =
c1 3 c 2 2 t + t + c3t + c 4 . Посчи12 4
таем входящие в него произвольные постоянные. Воспользуемся граничныc + 2 + c3 = 0 . Так как 12 4 c c u (0) = 0 , то c3 = 0 . Условие u (1) = 1 определяет уравнение 1 + 2 = 1 . Составим 4 2 систему уравнений для нахождения коэффициентов c1 и c2 . Получим
ми условиями. Так как u(0) = u(1) = 0, то c4 = 0 . Тогда
⎧ c1 c 2 =0 ⎪⎪ + 12 4 ⎨c c ⎪ 1 + 2 =1 ⎪⎩ 4 2
⇒
c1
⎧ c1 + 3c 2 = 0 ⎨c + 2c = 4 . 2 ⎩1
Функция
u (t ) и ее производные u (t ), u(t ) имеют вид 2 u(t ) = t − t , u (t ) = 3t − 2t , u(t ) = 6t − 2. Зададим для функции u(t ) приращение 3
2
и посчитаем разность значений исходного функционала. Получим 1
1
1
0
0
1
I (u + h) − I (u ) = ∫ (u + h)′′ 2 dt − ∫ u2 dt = ∫ 4(3t − 1)hdt + ∫ h2 dt = 0 1
1
1
0
1
0
0
0
0
= 4{(3 − 1)h(1) − ( −1)h(0)} − 3∫ hdt + ∫ h2 dt = 8 − 3h(1) + 3h(0) + ∫ h2 dt = 8 + ∫ h2 dt ≥ 0
для
любой
функции
h( t ) ,
удовлетворяющей
h(0) = h(1) = 0, h(0) = h(1) = 1.
Пример 2.
Найти минимальное значение функционала 1
I (u ) = ∫ (u2 − 48u )dt → inf 0
при условии u(1) = u(1) = 0, u(0) = 1, u(0) = −4. 20
условиям
Решение. В этом случае подынтегральная функция имеет вид L = u2 − 48u , а ее производные соответственно
∂L = −48, ∂u
∂L = 0, ∂u
∂L = 2u. Со∂u
ставим уравнение Эйлера − 48 +
Решение
этого
d2 dt 2
уравнения
( 2u) = 0 .
запишется
следующим
образом:
c c u(t ) = t 4 + 1 t 3 + 2 t 2 + c3t + c 4 . Воспользуемся граничными условиями для по12 4
иска коэффициентов, входящих в формулу общего решения. Для этого составим следующую систему уравнений ⎧ c1 c 2 + c3 + c 4 = 0 ⎪1 + + 12 4 ⎪ c1 c 2 ⎪ + c3 = 0 . ⎨ 4+ + 4 2 ⎪ c4 = 1 ⎪ ⎪ c3 = −4 ⎩
Отсюда легко находится, что c1 = −48, c 2 = 24. Поэтому оптимальное решение этой задачи имеет вид u(t ) = t 4 − 4t 3 + 6t 2 − 4t + 1 . Задания для самостоятельной работы 1
1. ∫ ( x − x 2 ) dt → extr; x(0) = x(1) = 0. 0
T0
2. ∫ ( x 2 − x ) dt → extr; x(0) = 0, x(T0 ) = ξ. 0
1
3. ∫
(t 2 x − x 2 ) dt → extr; x(0) = x(1) = 0.
0
1
4. ∫ x2 dt → extr; x(0) = x(0) = x(1) = 0, x(1) = 1. 0
21
§ 5. Задача Больца Определение: задачей Больца называется экстремальная задача без ограничений в пространстве C 1 ([t 0 , t1 ]) – непрерывно дифференцируемых функций (или KC 1 ([t 0 , t1 ]) – кусочно-непрерывных дифференцируемых функций следующего вида: I (u ) =
t1
∫ L(t , u(t ), u(t ))dt + l (u(t 0 ), u(t1 )) → inf, где
t0
L : U ⊂ R 3 → R , l : V ⊂ R 2 → R , I : C 1 ([t 0 , t1 ]) → R ,
при этом промежуток времени фиксирован и конечен, т. е. − ∞ < t 0 < t1 < +∞ . Определение: точка u* – точка локального минимума функции I (u ) в задаче
Больца,
∀ u ∈ C 1 ([t 0 , t1 ] :
если
∃ δ > 0,
такое
что
|| u − u* ||< δ, I (u* ) ≤ I (u ). В качестве векторной нормы здесь
принимаем норму вида || u ||
C1
= max | u(t ) | + max | u (t ) | . t
t
Алгоритм решения задачи
1.
Составим уравнение Эйлера
∂L d ∂L − = 0 и найдем его решения – ∂u dt ∂u
допустимые экстремали. 2. Составим условия трансверсальности: Lu (t 0 ) =
∂l ∂l ; Lu (t1 ) = − . ∂u(t1 ) ∂u(t 0 )
3. Найти допустимые экстремали, т. е. решения уравнения Эйлера, удовлетворяющие на концах отрезка условиям трансверсальности. 4. Доказать, что решением является одна из допустимых экстремалей, или показать, что решения нет. Примеры
1.
Найти решение следующей задачи 1
I (u ) = ∫ (u 2 − u )dt + u 2 (1) → inf . 0
22
Решение. Выпишем все необходимые функции и переменные: L = u − u, l = u 2 (1), t0 = 0, t1 = 1. Частные производные равны соответст2
∂L ∂L = −1, = 2u ∂u ∂u
венно
и
дифференциальное
уравнение
имеет
вид
d 1 (2u ) = 0 . Решая его, получим искомую функцию u = − t 2 + c1t + c2 . dt 4 Выпишем условия трансверсальности −1 −
∂l = 0; ∂u(0)
∂l = 2u(1); ∂u (1)
∂l ∂L (t 0 ) = ; ∂u(0) ∂u
∂L ∂l (t1 ) = − ∂u(1) ∂u
и выпишем систему уравнений ⎧ 2u (0) = 0; ⎨ ⎩2u (1) = −2u (1)
⎧ u (0) = 0; ⇒ ⎨ ⎩u (1) = −u (1).
Найдем произвольные постоянные c1 и c2 из системы
c1 = 0, ⎧ ⎪ ⎨ 1 1 ( c − + = − − + c1 + c2 ) 1 ⎪⎩ 2 4
⎧ c1 = 0, ⎪ ⇒ ⎨ 3 . c = 2 ⎪⎩ 4
В задаче существует единственная допустимая экстремаль вида 1 3 u(t ) = − t 2 + . Зададим приращение функции u (t ) и посчитаем разность ин4 4
тегралов 1
{
}
1
I (u + h) − I (u ) = ∫ (u + h ) 2 − (u + h ) dt + (u + h ) 2 (1) − ∫ (u 2 − u )dt − u 2 (1) = 0
0
1
{
}
+ h 2 − h dt + 2u (1)h(1) + h 2 (1). = ∫ 2uh 0
Применяя формулу интегрирования по частям и учитывая, что u (t ) = −
t2 3 + получим следующее 4 4 1
1
1
0
0
0
| − ∫ 2uhdt + ∫ h 2 dt − ∫ hdt + 2u (1)h(1) + h 2 (1) . = 2uh 1 0
23
t 1 Здесь u (t ) = − ; u = − . 2 2 2. Решить задачу следующего вида 1
I (u ) = ∫ u 2 dt + 4u 2 (0) − 5u 2 (1) → inf 0
при условиях L = u 2 ; l = 4u 2 (0) − 5u 2 (1). Решение. Выпишем все необходимые условия для составления вспомогательного дифференциального уравнения. ∂l ∂l ∂L ∂L = 0; = 2u; = 8u (0); = −10u (1). ∂u ∂u ∂u(0) ∂u(1)
Получим −
d ( 2u ) = 0. Решением этого уравнения является функция dt
u (t ) = c1t + c 2 . Используя условия трансверсальности, составляем систему для
нахождения произвольных постоянных c1 и c2 . Так как ∂l ∂L = ; ∂u (0) ∂u(0)
∂L ∂l =− , то ∂u(1) ∂u(1)
⎧u (0) = 4u(0) ⎧ 2u (0) = 8u(0) . ⇒ ⎨ ⎨ 2 u 1 10 u 1 u 1 5 u 1 ( ) ( ) ( ) ( ) = = ⎩ ⎩
Отсюда считаем произвольные постоянные ⎧ c1 = 4c 2 ⎨c = 5c + 5c 1 2 ⎩1
⎧c = 0 ⇒ ⎨ 1 . ⎩c2 = 0
Поэтому искомая функция имеет вид u(t ) ≡ 0. 3.
Найти решение следующей задачи 1
I (u ) = ∫ (u 2 + u 2 )dt − 2u(1)sh(1) → inf; 0
sh(1) =
24
e1 − e −1 . 2
Решение. Составим вспомогательные функции L = u 2 + u 2 ;
∂L = 2u; ∂u
l = −2u(1)sh(1); ∂l = 0; ∂u(0)
∂L = 2u; ∂u
∂l = −2sh(1). ∂u(1)
Cоставим дифференциальное уравнение 2u −
d ( 2u ) = 0 . Его решение dt
имеет вид u(t ) = c1e t + c2 e −t . Составим систему уравнений для нахождения произвольных постоянных. Она имеет вид c −c = 0 ⎧⎪ ⎧ 2u (0) = 0 ⇒ c1 = c2 . ⇒ ⎨ 1 1 −21 ⎨ ⎪⎩c1e − c 2 e = sh(1) ⎩2u (1) = 2sh(1) e1 − e −1 ) = sh(1) . Тогда 2 1 1 1 1 2c1 = 1 ⇒ c1 = ⇒ c 2 = . Искомая функция имеет вид u* (t ) = e t + e − t = ch(t ). 2 2 2 2
Воспользуемся
Посчитаем
начальным
приращение
условием
2c1 (
функционала.
Оно
1
1
0
0
имеет
I (u + h) − I (u ) = ∫ ((u + h ) 2 + (u + h))dt − 2(u (1) + h(1))sh1 − ∫ (u 2 + u 2 )dt + 2u (1)sh1 = 1
= ∫ ( 2uh + h 2 + 2uh + h 2 )dt − 2sh(1)h(1)(= ) 0
Воспользовавшись тем, что 1
1
1
0
0
0
−1 t −t 1 1 ∫ 2uhdt = 2uh |0 −2∫ uhdt = (e − e )h(1) − ∫ (e + e )h и
u =
1 t 1 (e − e − t ); u = (e t + e − t ) , 2 2
получим 1
1
1
0
0
0
2sh(1)h(1) − 2∫ uhdt + 2 ∫ uhdt + ∫ h 2 dt − 2 sh(1)h(1) ≥ 0.
25
вид
4. Найти решение задачи e
I (u ) = ∫ 2u (tu + u )dt + 3u 2 (1) − u 2 (e) − 4u (e) → inf . 1
Решение. Посчитаем функции L и l и их частные производные. Получим
L = 2u (tu + u ); l = 3u 2 (1) − u 2 (e) − 4u(e);
∂L = 2u; ∂u
∂l ∂l ∂L = 4tu + 2u; = 6u (1); = −2u(e) − 4. ∂u ∂u(1) ∂u(e)
Составим
соответствующее
дифференциальное
уравнение
d ( 4tu + 2u ) = 0. Это уравнение второго порядка, которое путем умножеdt ния на переменную t , можно привести к уравнению Эйлера. Решение этого c уравнения будет иметь вид u(t ) = c1 + c 2 lnt . Соответственно u(t ) = 2 . Состаt
2u −
вим систему уравнений для нахождения произвольных постоянных ⎧ 2u (1) + u(1) = 3u(1) ⎧ 4u (1) + 2u(1) = 6u (1) ⇒ ⇒ ⎨ ⎨ ⎩2eu (e) + u(e) = u (e) + 2 ⎩4eu (e) + 2u(e) = 2u(e) + 4 ⎧c2 = c1 + c2 ln1 ⎧c = 1 ⎧u (1) = u(1) ⎪ ⇒ ⎨ ⇒ ⎨ 1 . c2 ⎨ e =1 ⎩ eu (e) = 1 ⎩c2 = 1 ⎪ e ⎩
Отсюда искомая функция имеет вид u(t ) = lnt + 1. Задания для самостоятельной работы 1
1. I (u ) = ∫ e u ⋅ u 2 dt + 4e u (0) + 32e − u (1) → inf 0 π 2
π 2
π 2
2. I (u ) = ∫ (u 2 − u 2 )dt + u 2 (0) − u 2 ( ) + 4u( ) → inf 0 π
3. I (u ) = ∫ (u 2 + u 2 − 4u sint )dt + 2u 2 (0) + 2u( π) − u 2 ( π) → inf 0
26
§ 6. Оптимальное управление
Задача оптимального управления имеет вид I { x(⋅), u(⋅)} =
t1
∫ f 0 (t , x, u )dt + Φ 0 (t 0 , t1 , x(t 0 ), x(t1 )) → inf,
(31)
t0
x = f (t , x, u ), x ∈ R n , u ∈ R m ,
(32)
Φ i (t 0 , t1 , x(t 0 ), x(t1 )) = 0, i = 1,..., s ,
(33)
где u(t ) – кусочно-непрерывная функция, определенная на отрезке [t 0 , t1 ] такая, что u(t ) ∈ U ⊂ R m , t ∈ [t 0 , t1 ] (34) x(t ) ∈ Ω ⊆ R n , t ∈ [t 0 , t1 ].
(35)
Функция I { x(⋅), u(⋅)} , зависящая от двух функций, называется критерием качества или целевой функцией. Под номером (32) записана управляемая система дифференциальных уравнений. Соотношение (33) задает начальные или краевые условия для системы дифференциальных уравнений (32). Функция u(t ) , удовлетворяющая условию (34), называется допустимым управлением для задачи (31)–(35). Условия (35) – это ограничения на фазовые координаты. Под решением задачи (31)–(35) понимают пару функций (u* (t ), x* (t )) , удовлетворяющую условию (32)–(35) и доставляющую минимальное значение функционалу (31), при условии, что такая пара существует. При этом u* (t ) называется оптимальным управлением, а x* (t ) – оптимальной траекторией, соответствующей этому оптимальному управлению. Принцип максимума Понтрягина
(необходимое условие оптимальности для задачи (31)–(34)). Определим по задаче (31)–(34) функцию, называемую функцией Гамильтона, H (λ 0 , λ, t , x, u ) = λ 0 f 0 + λ, f =
n
∑ λ i f i (t , x , u )
i =0
и введем в рассмотрение еще одну функцию s
l (t 0 , t1 , x(t 0 ), x(t1 ), μ ) = μ 0 Φ 0 (t 0 , t1 , x(t 0 ), x(t1 )) + ∑ μ i Φ i (t 0 , t1 , x(t 0 ), x(t1 )). i =1
27
Теорема: пусть функции f 0 , f , Φ i , i = 0,..., s являются непрерывнодифференцируемыми функциями своих аргументов. Пусть u* (t ) – оптимальное управление, x* (t ) – оптимальная траектория для задачи (31)–(34) или (31)–(35). Тогда существует такой набор множителей * * * * * λ 0 , λ1 (t ),..., λ n (t ), μ1 ,..., μ s , что | λ*0 | + | λ*1 (t ) | +...+ | λ*n (t ) |≠ 0 для t ∈ [t 0 , t1 ] , причем λ0* ≥ 0,
(36)
и при этом выполняются условия: 1. функция λ* (t ) является решением системы дифференциальных уравнений λ* (t ) = −
∂H (λ0* , λ * (t ), t , x* (t ), u* (t )) ; ∂x
(37)
2. выполняется условие трансверсальности λ * (ti ) = (−1)i +1
∂l (t0 , t1 , x* (t0 ), x* (t1 ), μ * ) , i = 0,1; ∂x(ti )
(38)
3. выполняется условие минимума *
*
min H (λ 0 , λ u∈U
(t ), t , x* (t ), u ) = H (λ*0 , λ* (t ), t , x* (t ), u* (t ))
(39)
для всех t ∈ [t 0 , t1 ]. 4.
H (λ*0 , λ* (t i ), t i , x* (t i ), u* (t i )) = ( −1) i
∂l (t 0 , t1 , x* (t 0 ), x* (t1 ), μ* ∂t i
, i = 0,1.
(40)
Условие (4) выписывается, если значения t 0 и t1 не заданы. Задача 1.
Задано движение безинерционной тележки (на нее не действует сила трения). Движение описывается вторым законом Ньютона x =
F , где F – сила тяги двигателя тележки. m 28
Введем обозначение
F m
= u , тогда уравнение примет вид x = u . Задача
управления: необходимо данную тележку перевести из заданного положения в начало координат с нулевой скоростью за минимальное время. Построим математическую модель. Сведем уравнение второго порядка к системе двух уравнений первого порядка ⎧ x1 = x 2 ⎨ x = u ⎩ 2
и поставим граничные условия x1 (0) = x10 , x1 (T ) = 0, x 2 (0) = x02 , x2 (T ) = 0 . Будем считать, что функция управления u(t ) подчинена условию | u (t ) | ≤ 1 . Критерием качества является минимальность времени перехода в нулевое положение, т. е. t
∫ dt = T → min .
0
Опираясь на принцип максимума Понтрягина, определяем две функции H = λ 0 + λ1 x1 + λ 2 u ,
l = μ1 ( x1 (0) − x10 ) + μ 2 ( x 2 (0) − x02 ) + μ 3 x1 (T ) + μ 4 x 2 (T ) .
Выпишем систему дифференциальных уравнений для параметров λ1 и λ 2 : ∂H λ 1 = = 0, ∂x1
∂H λ 2 = − = − λ1 . ∂x 2
Выпишем условия трансверсальности: λ1 (0) = −μ1 , λ1 (T ) = μ 3 , λ 2 (0) = −μ 2 , λ 2 (T ) = μ 4 .
Параметры μ1 , μ 2 , μ 3, μ 4 пока неизвестны. Посчитаем функции λ1 (t ) и λ 2 (t ) . Из предыдущей системы λ1 (t ) = C1 , λ 2 (t ) = −C1t + C 2 . Функция λ 2 (t ) –
линейная и поэтому меняет знак не более одного раза. Воспользуемся условием минимума
29
min |u |≤1 λ*2 (t )u = λ*2 (t )u* (t ) ⇒ u* (t ) = − signλ*2 (t ) .
Отсюда очевидно, что u* (t ) = −λ*2 (t ) = −1 или u* (t ) = λ*2 (t ) = 1 на каких частях промежутка [0, T ] (или на всем промежутке 1 или –1). Смотри рис. 4.
1 Одна точка переключения
T
o –1
Рис. 4
Рассмотрим исходную систему при u = 1 и u = −1 . Пусть сначала u = 1 , тогда ⎧ x1 = x 2 ⎨ x = 1 . ⎩ 2
Разделим первое уравнение на второе и получим семейство парабол. Если u = −1 , то ⎧ x1 = x 2 ⎨ x = −1 . ⎩ 2
Тогда
x2 ~ = − x 2 ⇒ x1 = − 2 + C . 2 dx 2 dx1
30
dx1 dx 2
x 22
= x 2 ⇒ x1 = +C – 2
В результате получаются фазовые траектории двух видов за счет сдвигов одних относительно других. В какой-то момент времени при движении по параболе попадаем в (0,0). Смотри рис. 5. Чтобы попасть в т. А по параболе из другого семейства, надо восстановить параболу того семейства, по которой двигались. Смотри рис. 6. Выше АОВ u = −1 , ниже u = 1 . По этой кривой выписывается уравнение ⎧ 1, если точка (x1 , x2 ) ∈ OB или ( x1 , x2 ) лежит ниже AOB. u* = u* ( x1 , x2 ) = ⎨ ⎩−1, если точка ( x1 ,x 2 ) ∈ OA или ( x1 , x2 ) лежит выше AOB.
Получим управление, подозрительное на оптимальное, но оно зависит не от t , а от ( x1 , x 2 ) , а это уже решение задачи x1 = x 2 ⎧ ⎨ x = u ( x , x ) . * 1 2 ⎩ 2
Рис. 5 Следовательно, x1 = x1* (t ) и x2 = x2* (t ) . Значит, u* (t ) = u* ( x1* (t ), x2* (t )) и получили зависимость от t . Функция u* ( x1 , x2 ) называется синтезирующей функцией оптимального управления. Говорят, что мы решили задачу синтеза оптимального управления, если полученное решение зависит от x1 и x2 .
31
u = −1
A
B u = +1
Рис. 6 Рассмотрим задачу оптимального управления в более общей постановке. Задачей оптимального управления будем называть следующую задачу в пространстве KC 1 ( Δ, R n ) × KC ( Δ, R r ) × R 2 :
32
J 0 ( x(⋅), u (⋅), t 0 , t1 ) → inf
(41) (42) (43) (44) (45)
x (t ) = ϕ(t , x(t ), u (t )) u (t ) ∈ U ∀t ∈ [t 0 , t1 ],
J i ( x(⋅), u (⋅), t 0 , t1 ) ≤ 0, i = 1,..., m1 , J i ( x(⋅), u (⋅), t 0 , t1 ) = 0, i = m1 + 1,..., m,
где t1
J i ( x(⋅), u (⋅), t0 , t1 ) = ∫ f i (t , x(t ), u (t ))dt +ψ i (t0 , x(t0 ), t1 , x(t1 )), i = 0,..., m.
(46)
t0
Здесь Δ – заданный конечный отрезок, t 0 , t1 ∈ Δ , f i : R × R n × R r → R – функции n + r + 1 переменных, ψ i : R × R n × R × R n → R – функции 2n + 2 переменных, ϕ : R × R n × R r → R n – вектор-функция n + r + 1 переменных, U – произвольное множество из R n . Вектор-функция x(⋅) – называется фазовой переменной, u(⋅) – управлением. Уравнение (42), называемое дифференциальной связью, должно выполняться во всех точках непрерывности управления u(⋅) на интервале (t 0 , t1 ) . Правило решения
1. Составить функцию Лагранжа: t1 m
L = ∫ { ∑ λ i f i (t , x, u ) + p(t )( x − ϕ(t , x, u ))}dt + t0
i =0
m
∑ λ i ψ i (t 0 , x(t 0 ), t1 , x(t1 )), λ = (λ 0 ,..., λ m ) .
i =0
2. Выписать необходимые условия оптимального процесса: а) стационарности по x – уравнение Эйлера: ∂L1 ∂x
−
m ∂f d ∂L1 ∂ϕ = 0 ⇔ p (t ) = ∑ λ i i − p(t ) , где dt ∂x ∂x ∂x i =0
L1 =
m
∑ λ i f i + p( x − ϕ) ;
i =0
33
б) трансверсальности по x : ∂L1 ∂x
(t j ) = ( −1) j
m ∂ψ i ∂l , j = 0,1 ⇔ p(t j ) = ( −1) j ∑ λ i , j = 0,1 ∂x(t j ) ∂ x ( t ) i =0 j m
для терминанта l = l (t 0 , x0 , t1 , x1 ) = ∑ λ i ψ i (t 0 , x0 , t1 , x1 ) ; i =0
в) оптимальности по u : m
m
i =0
i =0
min u∈U (∑ λi fi (t , xˆ , u ) − p (t )ϕ (t , xˆ , u )) = ∑ λi fi (t , xˆ , uˆ ) − p (t )ϕ (t , xˆ , u ) или в виде принципа максимума Понтрягина:
max u∈U H (t , xˆ , u , p ) = H (t , xˆ , uˆ , p ) , где m
H (t , x, u , p ) = p (t )ϕ (t , x, u ) − ∑ λi fi (t , x, u ) ; i =0
∂ lˆ г) Hˆ (t j ) = (−1) j +1 , j = 0,1 – условия стационарности по t j ; ∂x(t j ) д) λi J i ( xˆ (⋅), uˆ (⋅), tˆ0 , tˆ1 ) = 0, i = 1,..., m1 – условия дополняющей нежесткости; e) λi ≥ 0, i = 1,..., m1 . 3. Найти x(t ), u(t ) . При этом рассмотреть случаи λ0 = 0, λ0 = 1 . Примеры решения задач Задача 2. 4
J = ∫ ( x 2 + x )dt → inf, x ≤ 1, x(0) = 0 . 0
Перепишем задачу в следующем виде, введя управление 4
J = ∫ (u 2 + x)dt → inf, x = u , u ∈ [−1,1], x(0) = 0 . 0
34
Функция Лагранжа имеет вид 4
L = ∫ (λ 0 (u 2 + x ) + p( x − u ))dt + λx(0) , где f 0 = u 2 + x, ψ 0 = 0, ϕ = u , ψ1 = x(0) . 0
m
∂f i
i =0
∂x
Запишем p (t ) = ∑ λ i
− p (t )
∂ϕ , для нашей задачи получаем p (t ) = λ 0 . ∂x
m
∂ψ i
i =0
∂x(t j )
Условия p(t j ) = ( −1) j ∑ λ i
, j = 0,1 в нашем случае примут вид
p( 0) = λ , p( 4) = 0 .
Далее рассмотрим min u∈[−1,1] (λ 0 u 2 − pu ) = λ 0 u *2 − pu * . Найдем u * . Для этого посчитаем производную выражения (λ 0 u 2 − pu ) и приравняем ее к нулю. Получим u * =
p . 2λ 0
Теперь рассмотрим случаи λ 0 = 0, λ 0 = 1 . А) Положим λ 0 = 0 . Получаем p(t ) = t + C , p(0) = λ, p( 4) = 0 . Откуда вытекает, что λ = const . Нас это не устраивает. Б) Положим λ 0 = 1 . Получаем p(t ) = t + C , p(0) = λ, p( 4) = 4 + C . Откуда C = −4 , а p ( t ) = t − 4 .
⎧ t−4 t−4 , ≤1 ⎪⎪ 2 2 * . u (t ) = ⎨ ⎪sign t − 4 , t − 4 > 1 ⎪⎩ 2 2
Значит,
t−4
⎧ Поскольку x = u , значит x(t ) = ⎪⎨ 2 ,2 ≤ t ≤ 4 . Откуда ⎪⎩ − 1,0 ≤ t < 2
⎧t 2 ⎪ x(t ) = ⎨ 4 − 2t + C1 ,2 ≤ t ≤ 4 . ⎪ − t + C ,0 ≤ t < 2 2 ⎩
Из условия x(0) = 0 получим, что C 2 = 0 . Из условия непрерывности в точке t = 2 , получаем C1 = 1 . Значит, ⎧t 2 ⎪ x(t ) = ⎨ 4 − 2t + 1,2 ≤ t ≤ 4 . ⎪⎩ − t ,0 ≤ t < 2
35
Задача 3. J=
7π 4
∫ x sin tdt → inf, x
≤ 1, x(0) = 0 .
0
Перепишем задачу в следующем виде, введя управление
J=
7π 4
∫ x sin tdt → inf, x = u , u ∈ [−1,1], x(0) = 0 .
0
Функция Лагранжа имеет вид
L=
7π 4
∫ (λ 0 x sin t + p( x − u ))dt + λx(0) , где
0
Запишем
p (t ) =
m
∂f i
i =0
∂x
∑ λi
− p (t )
∂ϕ , ∂x
для
f 0 = x sin t , ϕ = u , ψ = x(0) .
нашей
задачи
получаем
p (t ) = λ 0 sin t . Соответственно p(t ) = −λ 0 cos t + C . m
∂ψ i
i =0
∂x(t j )
Условия p(t j ) = ( −1) j ∑ λ i p( 0) = λ , p(
, j = 0,1 в нашем случае примут вид
7π ) = 0. 4
Теперь рассмотрим случаи λ 0 = 0, λ 0 = 1 . А) Положим λ 0 = 0 . Получаем p(t ) = C , p(0) = λ, p(
7π ) = 0 . Откуда выте4
кает, что λ = const . Нас это не устраивает.
7π ) = 0 . Из пер4 2 7π вого уравнения получаем C = λ + 1 . Из второго C = cos . Откуда λ = − 1, а 2 4 2 . p(t ) = − cos t + 2
Б) Положим λ 0 = 1 . Получаем p(t ) = − cos t + C , p(0) = λ, p(
Далее рассмотрим min u∈[−1,1] ( − pu ) = − pu * . Найдем u * . Для этого посчитаем производную выражения ( − pu )′u = − p . Получаем u * (t ) = signp(t ) при p(t ) ≠ 0 . 36
Значит
Поскольку
⎧ 2 2 − { − cos t + },− cos t + ≥0 ⎪ ⎪ * 2 2 u (t ) = ⎨ ⎪ − cos t + 2 ,− cos t + 2 < 0 ⎪⎩ 2 2 ⎧ 2 2 , cos t ≤ ⎪ cos t − ⎪ 2 2 . u * (t ) = ⎨ ⎪− cos t + 2 , cos t > 2 ⎪⎩ 2 2 π 7π ⎧ ⎪− 1, 4 ≤ t ≤ 4 x = u , значит . x (t ) = ⎨ π ⎪ 1,0 ≤ t ≤ 4 ⎩
или
Откуда
π 7π ⎧ t C , t − + ≤ ≤ ⎪ 1 4 4 . x( t ) = ⎨ π ⎪ t + C ,0 ≤ t ≤ 2 4 ⎩
π 2
Из условия x(0) = 0 и из условия непрерывности получим, что C1 = , C 2 = 0 . Значит, π π 7π ⎧ ⎪− t + 2 , 4 ≤ t ≤ 4 . x( t ) = ⎨ π ⎪ t ,0 ≤ t ≤ 4 ⎩
Задания для самостоятельной работы π
1. ∫ x sin t dt → extr; | x |≤ 1, x( ± π) = 0. −π
T0
2. ∫ ( x 2 + x ) dt → extr; | x |≤ 1, x(0) = 0. 0
T0
3. ∫ ( x 2 + x ) dt → extr; | x |≤ 1, x(T0 ) = ξ. 0 T0
4. ∫ ( x 2 + x 2 ) dt → extr; | x |≤ 1, x(0) = ξ. 0
37
Список литературы 1. Алексеев В.М. Сборник задач по оптимизации : Теория. Примеры. Задачи / В.М. Алексеев, Э.М. Галеев, В.М. Тихомиров. – М. : Мир, 1984. – 288 с. 2. Васильев О.В. Методы оптимизации в задачах и упражнениях / О.В. Васильев, А.В. Аргучинцев. – М. : Физматлит, 1999. – 207 с. 3. Галеев Э.М. Оптимизация : Теория. Примеры. Задачи / Э.М. Галеев, В.М. Тихомиров. – М. : Эдиториал УРСС, 2000. – 317 с. 4. Ильин В.А. Математический анализ 1 : Начальный курс / В.А. Ильин, В.А. Садовничий, Бл.Х. Сендов. – М., 1985. – 660 с. 5. Карманов В.Г. Математическое программирование / В.Г. Карманов. – М. : Физматлит, 2000. – 263 с. 6. Полак Э. Численные методы оптимизации. Единый подход / Э. Полак. – М. : Мир, 1974. – 367 с.
38
Учебное издание
ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ Практикум для вузов Составитель Белоусова Елена Петровна Редактор И.Г. Валынкина
Подписано в печать 20.02.09. Формат 60×84/16. Усл. печ. л. 2,3. Тираж 25 экз. Заказ 1996. Издательско-полиграфический центр Воронежского государственного университета. 394000, г. Воронеж, пл. им. Ленина, 10. Тел. 208-298, 598-026 (факс) http://www.ppc.vsu.ru; e-mail:
[email protected] Отпечатано в типографии Издательско-полиграфического центра Воронежского государственного университета. 394000, г. Воронеж, ул. Пушкинская, 3. Тел. 204-133
39