МАТЕМАТИКА УСТОЙЧИВЫЕ МАТРИЦЫ. СТАБИЛИЗАЦИЯ ЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ В. А. БРУСИН Нижегородский государственный архи...
29 downloads
188 Views
126KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
МАТЕМАТИКА УСТОЙЧИВЫЕ МАТРИЦЫ. СТАБИЛИЗАЦИЯ ЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ В. А. БРУСИН Нижегородский государственный архитектурно-строительный университет
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
STABLE MATRICES. LINEAR DYNAMIC SYSTEMS STABILIZATION V. A. BRUSIN
Definition of a linear dynamic system and its vector-matrix representation are given. Its stability and stabilizability properties are defined. The algorithm of stabilizing linear steady-state feedback construction is given.
© Брусин В.А., 2001
Дано понятие линейной динамической системы и ее описание в векторно-матричной форме. Определены ее свойства устойчивости и стабилизируемости. Приведен алгоритм получения стабилизирующей статической линейной обратной связи. В качестве примера рассмотрена система, состоящая из двух упругосвязанных масс.
122
www.issep.rssi.ru
Линейные системы широко используются для описания движений объектов, изучаемых в физике, механике, теории управления, технике. Ими описываются движения упругих конструкций с элементами маятникового типа, которые совершаются в достаточно близкой окрестности их положения равновесия. В частности, для упругих систем эта достаточная близость определяется рамками действия закона Гука. Линейной динамической системой (ЛДС) в теории управления называют математическую модель управляемого объекта, описание которой может быть представлено в виде системы дифференциальных уравнений относительно функций времени t d ---- x i ( t ) = dt
n
m
∑ a ( t )x ( t ) + ∑ b ij
j=1
j
ik
( t )u k ( t ) , i = 1, 2, …, n, (1)
k=1
где aij(t), bik(t) – кусочно-непрерывные функции, заданные при всех t. Число n называют размерностью ЛДС. Набор x(t) = (x1(t), x2(t), …, xn(t))называется вектором состояния ЛДС (точнее, его текущим в момент t значением), набор функций u(t) = (u1(t), u2(t). …. um(t)) – управлением или управляющей функцией [1]. В дальнейшем мы будем предполагать, что коэффициенты ai j(t), bi k(t) не зависят от t. Такие ЛДС называются стационарными (СЛДС). Кроме того, мы ограничим наше рассмотрение случаем, когда m = 1 (скалярное управление). Для исследования СЛДС и их использования для конкретных задач целесообразно перейти от уравнений (1) к их векторно-матричному аналогу. Для этого мы должны ввести понятие матрицы и дать необходимые свойства. Более подробно о матричной алгебре можно узнать в учебниках по высшей алгебре [2].
С О Р О С О В С К И Й О Б РА З О В АТ Е Л Ь Н Ы Й Ж У Р Н А Л , Т О М 7 , № 1 , 2 0 0 1
МАТЕМАТИКА ВЕКТОРНО-МАТРИЧНАЯ ФОРМА УРАВНЕНИЙ ЛДС
k
называют число, равное
Матрицей размера n × m, где n и m – натуральные числа, называют массив из n × m чисел, расположенных в виде таблицы, состоящей из n строк и m столбцов:
a 11 a 21 … a n1
a 12 a 22 … a n2
… … … …
a 1m a 2m … a nm
.
(2)
Числа aij называются элементами матрицы, при этом первый индекс i указывает на номер строки, а второй индекс j – на номер столбца, в которых находится этот элемент. (Обычно матрицы обозначаются прописными латинскими буквами.) Матрица называется квадратной n-го порядка, если n = m, в противном случае – прямоугольной. Прямоугольная матрица при m = 1, n > 1 называется столбцом, а при n = 1, m > 1 – строкой. (Строки и столбцы обозначаются, как правило, строчными латинскими буквами.) Строки и столбцы называют векторами соответствующей размерности, а их элементы – координатами. Наконец, в случае n = m = 1 мы получаем алгебраическое число – скаляр. Произвольную матрицу A вида (2) можно рассматривать как совокупность ее столбцов: A = (a1 , a2 , …, aj , … a 1j …, am), где aj – j-й столбец : , либо – как совокуп a nj a 1* ность ее строк: A = : , a *i = a i1, a i2, …, a im – i-я a n* строка. Матрицы можно умножать на число: при умножении на какое-либо число все ее элементы умножаются на это число. Матрицы одних и тех же размерностей можно складывать. При сложении двух матриц A и B одной размерности с элементами aij и bij получается матрица C той же размерности с элементами cij = aij + bij . Матрицы согласованной размерности можно умножать друг на друга в определенном порядке. Определим это действие, начиная от частного случая. 1. Произведением строки a = (a1 , a2 , …, ak) на стол b 1 1 бец b = col ( b 1, b 2, …, b k ) = … той же размерности bk
∑a b . i i
Обозначим это число
i=1
〈a, b〉. (Заметим, что изменять порядок сомножителей нельзя, ибо первый множитель – это строка, а второй – столбец.) 2. Пусть теперь A – матрица размера n × m вида (2), а B – матрица размера m × l с элементами bjk , j = 1, 2, … …, m, k = 1, 2, …, l, b 11 B= … b m1
… … …
.
b 1l … b ml
Обозначим через bk = col (b1k , b2k , …, bmk) k-й столбец этой матрицы. Произведением C = AB называют матрицу размера n × l, элементы cik которой (i = 1, 2, …, n, m
k = 1, 2, …, l) равны c ik = 〈 a i, b k〉 =
∑a b ij
jk
.
j=1
Поясним смысл этого действия на примере квадратных матриц 3-го порядка. Предположим, что мы проводим линейную замену старых координат (x, y, z) на “новые” (x', y', z'), а затем эти новые на новейшие (x", y", z") по формулам x' = b 11 x + b 12 y + b 13 z, y' = b 21 x + b 22 y + b 23 z,
(3а)
z' = b 31 x + b 32 y + b 33 z; x" = a 11 x' + a 12 y' + a 13 z', y" = a 21 x' + a 22 y' + a 23 z',
(3б)
z" = a 31 x' + a 32 y' + a 33 z. Матрицы A с элементами aij и B с элементами bjk называются матрицами преобразований координат. Тогда, как легко видеть, матрицей преобразования от старых координат к новейшим является матрица AB. Для произведения матриц справедлив распределительный закон: (AB)C = A(BC) := ABC. Матрица называется единичной, если aii = 1, aij = 0 при i j. Единичную матрицу часто обозначают E. Очевидно, EA = AE = A. Для квадратных матриц можно также определить понятие обратной матрицы. Квадратная матрица A, для которой имеется обратная A −1, называется неособой. (В курсе высшей алгебры [2] дается понятие определителя квадратной матрицы detA. Матрица A −1 существует в том и только том случае, если det A 0.) Так, в примере с заменой координат обратная матрица B −1 к матрице B будет существовать, если 1 Здесь приведена другая форма записи столбца; col – сокращение от слова column – столбец.
Б Р УС И Н В . А . УС Т О Й Ч И В Ы Е М А Т Р И Ц Ы . С ТА Б И Л И З А Ц И Я Л И Н Е Й Н Ы Х Д И Н А М И Ч Е С К И Х С И С Т Е М
123
МАТЕМАТИКА преобразование от старых переменных к новым будет взаимно однозначным, то есть система (3а) дает возможность выразить старые координаты через новые. Матрицей обратного преобразования от новых координат к старым и будет матрица B −1. (Формула прямого вычисления обратных матриц дается в любом курсе высшей алгебры [2].) Очевидно, что произведение прямой и обратной матриц даст единичную матрицу. Таким образом, если обозначить через B и A матрицы коэффициентов преобразований (3а) и (3б), то эти преобразования с учетом упомянутых выше правил можно записать в виде векторно-матричных равенств: x' x = B y' y , z' z x' x –1 y = B y' z' z
,
x" x' = A y" y' , z" z' x' x" –1 y' = A y" z' z"
.
S1(t)
O1
S2(t) S
O2
Рис. 1
m 1 s˙˙1 = k 1 ( u ( t ) – s 1 ( t ) ) + k 2 ( s 2 ( t ) – s 1 ( t ) ),
(7)
m 2 s˙˙2 = k 2 ( s 1 ( t ) – s 2 ( t ) ),
где mi – величина i-й массы, ki – коэффициент жесткости i-го упругого элемента (i = 1, 2). Если ввести обозначения: x 2 = s˙1 ,
k γ 1 = -----1- , m1
x3 = s2 ,
k γ 2 = -----2- , m1
x 4 = s˙2 ,
k γ 3 = -----2- , m2
x˙1 = x 2 ,
(5)
УСТОЙЧИВЫЕ СИСТЕМЫ И МАТРИЦЫ В дальнейшем мы будем рассматривать стационарные ЛДС, когда элементы матриц A и B не зависят от t. Кроме того, ограничимся случаем скалярного управления m = 1. В этом случае матрица B становится столбцом b = col(b1 , b2 , …, bn). И уравнение (5) принимает вид (6)
Пример 1. Рассмотрим систему из двух движущихся вдоль одной оси масс, связанных упругими элементами, подчиняющимися закону Гука, движение которой управляется перемещением u(t) свободного от масс конца упругого элемента (рис. 1). Пусть положение масс и левого конца упругого элемента определяется координатами s1 и s2 , причем начала отсчета этих величин выбраны так, что при s1 = 0, s2 = 0, u = 0 упругие элементы находятся в нейтральном положении – ни растянуты, ни сжаты. В этом случае уравнения движения масс на основе законов Ньютона и закона Гука будут иметь вид
124
u(t)
m2
то эти уравнения можно записать в виде
Матрица A(t) называется матрицей коэффициентов ЛДС.
x˙( t ) = Ax ( t ) + bu ( t ).
O
x1 = s1 , (4)
Введем теперь матрицы A(t) и B(t), составленные из коэффициентов aij(t) и bik(t) системы (1), а также столбцы x(t) = col(x1(t), x2(t), …, xn(t)), x˙( t ) = col ( x˙1 ( t ), x˙2 ( t ) , … …, x˙n ( t ) ), u(t) = col(u1(t), u2(t), …, um(t)). Их элементы будут зависеть от t как от параметра. Тогда, учитывая правила действия с матрицами, систему (1) можно записать в виде одного, но векторно-матричного уравнения x˙( t ) = A ( t )x ( t ) + B ( t )u ( t ).
m1
x˙2 = – ( γ 1 + γ 2 )x 1 + γ 2 x 3 + γ 1 u ( t ),
(8)
x˙3 = x 4 , x˙4 = γ 3 x 1 – γ 3 x 3 . Теперь если положить 0 –( γ 1 + γ 2 ) A= 0 γ3
1 0 0 0
0 γ3 0 –γ 3
0 0 1 0
,
b=
0 γ1 0 0
,
(9)
то мы приходим к уравнению вида (6), эквивалентному исходной системе (7). Вектором состояния этой системы служит столбец x = col ( s 1, s˙1, s 2, s˙2 ), n = 4. Определение. СЛДС вида (6) называется устойчивой, если все решения уравнения x˙( t ) = Ax ( t ),
(10)
получающегося из (6) при u(t) = 0, стремятся к нулю при t ∞: lim x i ( t ) = 0 (i = 1, 2, …, n). В этом случае t→∞
пишут также, что lim x ( t ) = Θ, где Θ – нулевой векторt→∞
столбец col(0, 0, …, 0). Матрица A устойчивой СЛДС называется устойчивой матрицей. Из теории дифференциальных уравнений следует, что устойчивость матрицы A связана с корнями ее характеристического многочлена DA(p) = pn + d1 pn − 1 + … + dn . Характеристическим многочленом матрицы A является многочлен n-й степени pn + d1 pn − 1 + … + dn , такой, что все неизвестные функции x1(t), x2(t), …, xn(t),
С О Р О С О В С К И Й О Б РА З О В АТ Е Л Ь Н Ы Й Ж У Р Н А Л , Т О М 7 , № 1 , 2 0 0 1
МАТЕМАТИКА удовлетворяющие системе (1) или (10) при u(t) = 0, удовлетворяют дифференциальному уравнению n–1
n
xi + d 1 xi
+ … + d n x i = 0,
i = 1, 2, …, n.
Из курса высшей математики [3, 4] известно, что матрица A с постоянными коэффициентами устойчива в том и только том случае, если все корни ее характеристического многочлена имеют отрицательную действительную часть. Рассмотрим способ получения характеристического многочлена на приведенном выше примере (более распространенный способ связан с вычислением характеристического определителя [3, 4]). Будем исходить из первоначальной системы уравнений (7), положив в ней u = 0. Исключая из этих уравнений переменную s2 (или s1), мы приходим к дифференциальному уравнению 4-го порядка (4)
m 1 m 2 s i + [ ( k 1 + k 2 )m 2 + k 2 m 1 ]s i" + k i k 2 s i = 0,
(11)
откуда получаем, что характеристический многочлен матрицы A DA( p) = p + d1 p + d2 p + d3 p + d4, 4
3
2
( k 1 + k 2 )m 2 + k 2 m k 1 k 2 (12) - , d 3 = 0, d 4 = ------------. d 1 = 0, d 2 = -----------------------------------------m1 m2 m1 m2 К такому же уравнению мы бы пришли, если бы процесс исключения проводился в системе (8)). Замечание. Приведем простой способ, которым можно проводить процедуру исключения. Формально заменим операцию взятия производной на операцию умножения на символ p. Тогда система дифференциальных уравнений превращается в систему алгебраических уравнений. Система (8) при u = 0 примет следующий вид: (m1 p2 + k1 − k2)S1 + k2S2 = 0, (m2 p2 + k2)S2 − k2S1 = 0. Исключая из этой системы одно из неизвестных, например S2 , мы получаем уравнение
их положения равновесия они при отсутствии управления будут совершать незатухающие колебания. СТАБИЛИЗАЦИЯ СЛДС С ПОМОЩЬЮ ЛИНЕЙНОЙ ОБРАТНОЙ СВЯЗИ ПО СОСТОЯНИЮ Неустойчивую СЛДС во многих случаях можно стабилизировать, если ею надлежащим образом управлять. Управление может быть программным или может осуществляться с помощью обратной связи [1, 5]. Закон управления вида u(t) = k1x1(t) + k2x2(t) + … + knxn(t),
(13)
где x = col(x1 , x2 , …, xn) – вектор-столбец состояния СЛДС, а k = (k1 , k2 , …, kn) – вектор-строка коэффициентов, называют линейной (статической и стационарной) обратной связью по состоянию, а регулятор, осуществляющий такую зависимость, – линейным (стационарным) регулятором по состоянию [1]. (Естественно, для того чтобы иметь возможность управлять объектом по закону (13), необходимы приборы, измеряющие текущие значения координат вектора состояния.) Возникает вопрос: можно ли сделать СЛДС устойчивой с помощью такой обратной связи? Этот вопрос можно облечь в точную математическую формулировку. Закон управления (13) можно записать в векторной форме как u = kx.
(14)
Подставив соотношение (14) в векторно-матричное управление ЛДС (6), приходим к уравнению замкнутой системы (рис. 2) x˙ = ( A + bk )x = Ax.
(15)
Матрица n-го порядка A, A = ( A + bk ),
(16)
называется матрицей коэффициентов замкнутой системы [1]. Тогда наш вопрос принимает следующую форму.
{m1m2 p4 + [(k1 + k2)m2 + k2m1]p2 + k1k2}S1 = 0. Теперь, если возвратить символу p его первоначальное значение, мы снова приходим к уравнению (12). Существует критерий Рауса–Гурвица, который дает ответ, устойчив многочлен или нет, не находя его корней [3]. Необходимым условием устойчивости многочлена является условие, чтобы все его коэффициенты имели одинаковые знаки. Таким образом, многочлен DA(p) (12) не является устойчивым. Это отражает физически понятный факт, что при отклонении масс от
A, b
u
k
x
Рис. 2
Б Р УС И Н В . А . УС Т О Й Ч И В Ы Е М А Т Р И Ц Ы . С ТА Б И Л И З А Ц И Я Л И Н Е Й Н Ы Х Д И Н А М И Ч Е С К И Х С И С Т Е М
125
МАТЕМАТИКА Задача. Существует ли для заданной пары (A, b) вектор-строка k, такая,что матрица A устойчива? Если да, то как его найти. (Если матрица А гурвицева, то ответ, естественно, положителен и ki = 0 (i = 1, 2, …, n).) Определение (Р. Калман). Пара (A, b) называется стабилизируемой, если существует такой вектор k, при котором матрица A (16) устойчива [1]. Ниже мы дадим ответ на поставленную задачу. Замечание. Представленная здесь формулировка задачи стабилизации по состоянию является частной. Проблема в общей форме формулируется для случая матричных величин B и K.
Оказывается, что при выборе матрицы S' в виде (18) матрицы A˜ и b˜ будут иметь простой вид: A˜ =
0 … 0 –d n
1
…
–d n – 1
(n)
DA( p) = p + d1 p
n–1
+ … + dn.
… … … 0
d1 1 … 0
1 0 … 0
,
(18)
(n – 1)
(19)
Такая замена переменных будет, конечно, взаимно однозначной. Уравнение СЛДС в новых переменных можно получить умножая левую часть уравнения (6) на S −1. Тогда с учетом (19) приходим к уравнению y˙ = A˜ y + b˜ u, –1 A˜ := S AS,
126
–1 b˜ := S b.
+ … + d n y 1 = u ( t ),
k˜ i = d i – d i ,
i = 1, 2, …, n,
u ( t ) = k˜ 1 y 1 + k˜ 2 y 2 + … + k˜ n y n = k˜ y.
(22)
(23)
(n)
(n – 1)
y1 + d 1 y1
+ … + d n y 1 = 0,
поэтому закон изменения y1(t) будет определяться желаемым характеристическим многочленом. Так как он выбран устойчивым, то этот процесс и все его производные будут стремиться к нулю при t ∞ со скоростью не меньшей, чем скорость убывания экспоненциальной функции вида e−λt, ∃λ > 0 2. Производя в (24) обратный переход к старым переменным, получаем (25)
(Очевидно, что при таком переходе асимптотические свойства при t ∞ не изменятся.) Обратная связь с вектором-строкой k = k˜ S и решает поставленную задачу. Все решения замкнутой системы (6), (25) будут стремиться к нулю при t ∞ со скоростью не меньшей, чем скорость убывания экспоненты e−λt. Пример 2. Применим данный алгоритм к системе из примера 1. Положим m1 = m2 = k1 = k2 = 1. Таким образом, 2
(20)
(24)
Тогда из (22)–(24) будет следовать
–1 u ( t ) = k 1 x 1 + k 2 x 2 + … + k n x n = k˜ S x.
где di – коэффициенты многочлена DA(p). Как произведение неособых матриц матрица S также будет неособой. Сделаем замену вектора-столбца x = col(x1 , x2 , …, xn) в СЛДС (6) на вектор-столбец y = col(y1 , y2 , …, yn) по закону y = S −1x.
(21)
Положим
(17)
Предположим, что эта матрица K имеет обратную. В этом случае пара (A, b) называется полностью управляемой по Р. Калману [1] и по известной теореме [1] стабилизируемой. Образуем квадратную матрицу S: dn – 1 S = K dn – 2 … 1
.
и определим
Например, мы могли бы взять этот многочлен в виде (p + λ1)(p + λ2)…(p + λn), λi > 0, (−λi) – его желаемые корни. Составим (n × n)-матрицу K (матрицу Р. Калмана) K = (b, Ab, …, A n − 1b).
0 … 0 1
где di – коэффициенты характеристического многочлена исходной матрицы A.
Зададимся желаемым устойчивым характеристическим многочленом матрицы A n
b˜ =
При этом последнее уравнение системы (21) с учетом первых n − 1 уравнений, как легко заметить, принимает вид дифференциального уравнения y1 + d 1 y1
АЛГОРИТМ НАХОЖДЕНИЯ ВЕКТОРА КОЭФФИЦИЕНТОВ СТАБИЛИЗИРУЮЩЕЙ ОБРАТНОЙ СВЯЗИ
, 1 –d 1 0
...
Если желаемый многочлен имеет n различных корней, то число λ определяется как минимальная по абсолютной величине действительная часть этих корней [1, 3] или как минимальное расстояние от корней до мнимой оси.
С О Р О С О В С К И Й О Б РА З О В АТ Е Л Ь Н Ы Й Ж У Р Н А Л , Т О М 7 , № 1 , 2 0 0 1
МАТЕМАТИКА A=
0 –1 0 1
1 0 0 0
0 1 0 –1
0 0 1 0
,
b=
0 1 0 0
.
Характеристический многочлен будет равен p4 + 3p2 + 1, так что d1 = 0, d2 = 3, d3 = 0, d4 = 1. После вычислений получаем K=
0 1 0 0
1 0 0 0
0 –2 0 1 –1 S =
–2 0 1 0
,
S=
0 0 1 0
0 0 0 1
1 0 –1 0
1 0 1 0 0 1 0 –1
0 1 0 1
1 0 0 0
0 1 0 0
,
.
Предположим, что желательным характеристическим многочленом является (p + 1)4 = p4 + 4p3 + 6p2 + + 4p + 1. В этом случае, согласно (23), k˜ 1 = – 4, k˜ 2 = – 3, k˜ 3 = – 4, k˜ 4 = 0 и искомая обратная связь, согласно (25), будет иметь вид u = – 7x 1 – 3x 2 – 4x 3 – 3x 4 = – 7s 1 – 3s˙1 – 4s 2 – 3s˙2 . ЗАКЛЮЧЕНИЕ Итак, мы привели решение задачи стабилизации линейных динамических систем с помощью линейной обратной связи по состоянию. Это решение позволяет помимо главной цели получать заданное распределение корней характеристического многочлена замкнутой системы. Положительной чертой рассмотренной обратной связи является ее простота. Однако она имеет и существенные недостатки. Далеко не во всех задачах управления реальными объектами текущие значения
всех координат вектора состояний могут быть измерены. Гораздо чаще возникает ситуация, когда только часть этих координат может быть измерена по техническим причинам. Поэтому возникла задача о стабилизации с помощью линейной обратной связи (14), которая зависела бы только от некоторых координат вектора состояния. (Так, в рассмотренном примере может оказаться, что доступны измерению положение и скорость только правой массы или что можно измерять только положения масс, но не их скорости.) При этом корни характеристического многочлена замкнутой системы должны попасть в заданную область в левой части комплексной плоскости. Ясно, что решение такой задачи не всегда возможно. Полного решения этой задачи, несмотря на ее долгую историю, в настоящее время нет. ЛИТЕРАТУРА 1. Андреев Ю.Н. Управление конечномерными линейными объектами. М.: Наука, 1976. 423 с. 2. Смирнов В.И. Курс высшей математики. М.: ГИТТЛ, 1953. Т. 3, ч. 1. 339 с. 3. Понтрягин Л.С. Обыкновенные дифференциальные уравнения. М.: Наука, 1974. 331 с. 4. Мышкис А.Д. Лекции по высшей математике. М.: Наука, 1969. 640 с. 5. Брусин В.А. Об управлении динамическими системами в условиях неопределенности // Соросовский Образовательный Журнал. 1996. № 6. С. 115–121.
Рецензент статьи В.Б. Колмановский *** Владимир Александрович Брусин, доктор физико-математических наук, профессор, зав. кафедрой высшей математики Нижегородского государственного архитектурно-строительного университета, член-корреспондент РАЕН. Область научных интересов – математические проблемы теории устойчивости и теории управления. Автор более 180 научных статей и двух учебных пособий.
Б Р УС И Н В . А . УС Т О Й Ч И В Ы Е М А Т Р И Ц Ы . С ТА Б И Л И З А Ц И Я Л И Н Е Й Н Ы Х Д И Н А М И Ч Е С К И Х С И С Т Е М
127