Е. Э. СТРАШИНИН
ОСНОВЫ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ ЧАСТЬ I
ЛИНЕЙНЫЕ НЕПРЕРЫВНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ
1
Министерство образования Российской Федерации Уральский государственный технический университет
Е. Э. СТРАШИНИН
ОСНОВЫ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ ЧАСТЬ I
ЛИНЕЙНЫЕ НЕПРЕРЫВНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ УЧЕБНОЕ ПОСОБИЕ Научный редактор – профессор, канд. техн. наук Д.В.Астрецов
ЕКАТЕРИНБУРГ 2000 2
УДК 519.71:681.51
Рецензенты: Кафедра автоматизации производственных процессов Уральской государственной горно-геологической академии, проф. В.А.Лукас, зав. кафедрой доктор техн. наук проф. Э.С.Лапин, протокол заседания кафедра от 22 февраля 2000 года. Зав. лабораторией Института электрофизики УрО РАН, доктор физмат. Наук А.М.Искольдский.
Автор: Е..Э.Страшинин Основы теории автоматического управления, Часть 1. Линейные непрерывные системы управления.: Учебное пособие / Е.Э.Страшинин. Екатеринбург: УГТУ, 2000 Предлагаемое учебное пособие содержит первую часть конспекта лекций по двухсеместровому курсу теории автоматического управления, читаемому автором на радиотехническом факультете Уральского государственного технического университета. Первая часть посвящена линейным непрерывным системам управления. Во второй части будут рассмотрены нелинейные и импульсные системы.
3
© Уральский государственный технический университет, 2000 ОТ АВТОРА Вашему вниманию предлагается промежуточная версия первой части конспекта лекций Е.Э.Страшинина по курсу "Теория автоматического управления" - Линейные непрерывные системы автоматического управления. Конспект составлен на базе лекций, читавшихся для студентов специальности 210100 - Управление и информатика в технических системах. Он может быть полезен также для студентов специальности 220100 - Вычислительные машины, комплексы, системы и сети. Автор стремился в некоторой степени восполнить дефицит учебной литературы в области представления основ теории автоматического управления в терминах пространства состояний – то, что уже на протяжении последних двадцати лет называется Современной теорией управления. В Пособии этот подход неразрывно связан с традиционной, классической теорией автоматического управления. Стали классическими прекрасные учебники А.А. Воронова ([16], [17]), А.В. Нетушила ([14], [15]), А.А. Красовского и Г.С. Поспелова [7], В.А. Бесекерского и Е.П. Попова [2]. Некоторая лаконичность в изложении традиционной теории обусловлена наличием достаточно обширного перечня соответствующей учебной литературы и ограничениями на объём Пособия. Автор выражает глубокую признательность студентам группы Р371 Е.Заводчикову, С.Быкову, И.Варнаваскому, А.Головко, А.Муковнину, А.Орлову, Б.Павлову, К.Павлову, А.Сосунову, которые провели очень большую работу по подготовке электронной версии и редактированию конспекта, Валентине Александровне Табуевой и Дмитрию Вячеславовичу Астрецову, которые взяли на себя труд прочитать рукопись и сделать чрезвычайно полезные для автора замечания. Автор заранее благодарен за критические замечания и предложения по совершенствованию Пособия, которые можно направить на кафедру АИТ УГТУ-УПИ или по электронной почте по адресу
[email protected] 4
1. Введение в теорию автоматического управления На рубеже XVIII-XIX веков в эпоху промышленного переворота в Европе начинается новый этап развития автоматики, связанный с внедрением ее в промышленность. 1765 год знаменуется постройкой регулятора уровня котла паровой машины И.И. Ползунова. В 1784 году появляется центробежный регулятор скорости паровой машины Уатта. В это время формируется ряд важных принципов автоматики: принцип регулирования по отклонению Ползунова- Уатта и принцип регулирования по нагрузке Понселе. Первый из них развился в концепцию обратной связи, второй - в теорию инвариантности (Г.В. Щипанов, Н.Н. Лузин, Б.Н. Петров). Идея регулирования по нагрузке может быть проиллюстрирована на примере генератора с последовательным (сериесным) возбуждением (рис.1.1). При изменении нагрузки меняется ток возбуждения, который соответствующим изменением магнитного потока компенсирует дополнительное падение напряжения на внутреннем сопротивлении якоря генератора. Однако, если при этом по каким-либо причинам изменяется скорость вращения якоря генератора, то застабилизировать напряжение на нагрузке в этой схеме уже не удается.
OB1
U B1
Г
Ia
RH ОB2
RП Рис.1.1. Пример регулирования по возмущению От этого недостатка свободна схема, приведенная на рис. 1.2, именно вследствие использования принципа обратной связи. В этой схеме входной потенциометр служит для задания (коэффициент α 1 ) величины стабилизируемого напряжения; потенциометр, подключенный к якорю генератора, позволяет регулировать коэффициент обратной связи α 2 . В этом случае, в отличие от систем регулирования по возмущению, не важно, какая именно причина вызвала изменение регулируемой величины. При изменении напряжения на щётках генератора в соответствии с электрической схемой изменяется напряжение на обмотке воз5
буждения. При отрицательном знаке обратной связи знак приращения напряжения возбуждения противоположен знаку изменения напряжения якоря генератора. В итоге результирующая величина отклонения напряжения генератора уменьшается по сравнению с соответствующим уходом напряжения в системе без обратной связи. +
–
Uз
U0 –
α1
α2
Г
UB +
RH U oc
Рис.1.2. Стабилизация напряжения генератора с использованием обратной связи На этом же принципе построена приведенная на рис.1.3 система стабилизации скорости паровой машины Уатта. На рис.1.4 представлена её функциональная схема. В данной системе с увеличением нагрузочного момента M H падают обороты турбины ω , что приводит к уменьшению расстояния 2 r между грузиками центробежного регулятора. Вследствие этого заслонка поднимается (увеличивается расстояние S ) и растет расход пара Q , подаваемого в турбину. Это приводит к росту числа оборотов турбины ω , а следовательно, к компенсации нагрузочного момента M H . При изменении нагрузки на валу паровой машины после окончания переходных процессов сохраняется так называемая статическая ошибка. Если бы это было не так, то грузики центробежного регулятора, а вместе с ними и заслонка заняли своё первоначальное положение, и не изменившееся в результате количество подаваемого в турбину пара не смогло бы уравновесить изменившийся момент нагрузки. Такая система называется статической. Работа её осуществляется именно за счёт наличия статической ошибки. Рассматриваемая система относится к классу систем прямого действия, то есть таких, в которых для реализации регулятора не используются дополнительные источники энергии. В данном случае это плохо, потому что для мощных установок перемещение тяжёлой заслонки потребует неразумно громоздкого и тяжёлого центробежного регулятора.
6
нагрузка
ω
ТУРБИНА (объект)
MH
ω
H
r
Δl1
Δl2
Задатчик скорости (гайка со взаимнообратной резьбой)
Q
расход пара
S- раскрытие заслонки
Рис. 1.3. Система стабилизации скорости паровой машины
Таким образом, система является статической системой прямого действия. Введём следующие определения: Статической системой называют систему, работающую за счет статической ошибки; Системой прямого действия называют систему, регулятор которой не имеет собственных источников энергии. Описание системы управления может быть представлено в графическом виде. Функциональной схемой называется блок-схема, каждый элемент которой отображает некоторый физический элемент (группу физических элементов) рассматриваемой системы. 7
Структурной схемой называется блок-схема, каждый элемент которой отображает некоторый математический оператор (группу операторов), описывающий рассматриваемую систему. Использование функциональных и структурных схем позволяет более наглядно представить взаимосвязь между отдельными основными и промежуточными переменными объектов и систем управления
MH “Рычаг”
S
Исполнительный механизм
r
Центробежный регулятор
Q
Объект:
Турбина
ω
l1 Задающее устройство
ϕ
З
Регулятор
Рис.1. 4. Функциональная схема системы стабилизации скорости турбины Типовая функциональная схема системы автоматического управления (САУ) представлена на рис.1.5, где: u – управляющий сигнал; y – управляемый сигнал; f – возмущающее воздействие. Кружок с четырьмя секторами является сумматором, причём сигнал, поступающий на зачернённый сектор, изменяет свой знак (вычитается). f Исполнительный механизм
Преобразующие и согласующие устр.
u
y
Объект управления
Корректирующее устройство
Датчик
Задающее устройство Автоматическое управляющее устройство (регулятор)
Рис.1.5. Типовая функциональная САУ
8
Рассмотрим вариант системы стабилизации скорости турбины, в котором сделана попытка устранить недостатки, присущие рассмотренной выше статической системе прямого действия. На Рис.1.6 показан регулятор для этой системы.
ω
r Δlзол
Δl1
Масляный насос
Силовой цилиндр
Δlсц
Золотник
Q
S Рис.1.6. Регулятор системы стабилизации скорости турбины с использованием гидравлического усилителя
9
Для этого в систему введен гидравлический усилитель, включающий в себя золотник, силовой цилиндр и масляный насос. Такая система, в которой энергия регулятора потребляется от отдельного источника, называется системой непрямого действия. При заданной скорости расстояние между грузиками центробежного регулятора равно номинальному значению ( r = r0 ), положение плеча золотника l ЗОЛ также равно номинальному значению ( l ЗОЛ = l ЗОЛ 0 ), при этом поршень золотника полностью перекрывает выходные отверстия, следовательно, положение поршня силового цилиндра неизменно. С увеличением нагрузочного момента M H падают обороты турбины ω , что приводит к уменьшению расстояния r между грузиками центробежного регулятора. В результате изменяется положение поршенька золотника. Это, в свою очередь, приводит к перемещению поршня силового цилиндра, а, следовательно, и к дополнительному приоткрытию заслонки S . Соответственно увеличивается расход пара, возрастает скорость оборотов турбины ω и увеличивается расстояние r . Статика (установившееся состояние) в системе возможна только тогда, когда l 2 = l 20 , то есть, когда полностью перекрыты перепускные отверстия золотникового устройства. Теоретически в этой системе статическая ошибка равна нулю, то есть данная система является астатической. В ней отсутствует статическая связь между скоростью и положением заслонки. Рассмотрим упрощенные уравнения системы. Начнём с уравнения объекта. Очевидно, что изменение скорости турбины может происходить лишь в тех случаях, когда нарушается равновесие между движущим моментом турбины M T и моментом нагрузки M H :
J
d Δω = ΔM T − ΔM Н , dt
(1.1)
где J – суммарный момент инерции, приведённый к валу турбины. С целью упрощения в уравнении (1.1) использованы приращения скорости и моментов. Более подробно такой подход будет рассмотрен в разделе, посвященном линеаризации систем. Будем полагать, что приращение момента турбины пропорционально приращению количества подаваемого пара
ΔMT = K T ΔQ . Запишем уравнение центробежного регулятора. Полагая, что сами отклонения скорости и вызванные ими приращения внутренних переменных регулятора малы, мы можем выразить все зависимости в линейном виде. Тогда приращение скорости раскрытия грузиков и изменение положения поршенька золотника будут связаны линейными зависимостями: 10
Δr = K ω ⋅ Δω ; Δl зол = −K r ⋅ Δr .
(1.2)
Составляя уравнение гидравлического усилителя, учтём, что скорость перемещения поршня силового цилиндра пропорциональна величине открытия перепускных отверстий золотника, то есть приращению Δl зол :
dΔl сц dt
= K зол ⋅ Δl зол .
(1.3)
Приращение координаты штока силового цилиндра повлечет за собой изменение положения заслонки и, следовательно, изменение количества подаваемого в турбину пара:
ΔQ = K сц ⋅ Δl сц .
(1.4)
Продифференцировав уравнение (1.4) и, учитывая уравнения для центробежного регулятора (1.2) и гидравлического усилителя (1.3), получим уравнение для регулятора:
dΔQ = −K P ⋅ Δω , dt
(1.5)
где K P = K СЦ ⋅ K Зол ⋅ K r ⋅ K ω - коэффициент регулятора. Запишем совместно уравнения объекта и регулятора
⎧ d Δω ⎪ dt = K q ⋅ ΔQ − K H ⋅ ΔM H , ⎨ dΔQ ⎪ = −K P ⋅ Δω dt ⎩ продифференцируем первое уравнение и подставим в него второе:
d 2 Δω d Δω d ΔM H = K ( − K ⋅ ) − K . q P H dt dt 2 dt При условии постоянства нагрузки, получаем уравнение свободного движения всей системы
d 2 Δω + K ⋅ Δω = 0 , dt 2
(1.6)
где
K = KP ⋅ Kq . Соответствующее характеристическое уравнение имеет вид: 11
λ2 + K = 0 , его корни -
λ1,2 = ± j K . Таким образом, решение уравнения (1.6) имеет вид:
Δω (t ) = C1e λ1t + C2e λ2 t = A ⋅ Sin( K ⋅ t + ϕ ) ,
(1.7)
где A и ϕ определяются начальными условиями. В результате решения получили, что в данной системе в принципе не существует установившегося (статического) состояния. Следовательно, система неработоспособна. С целью успокоения незатухающих колебаний (1.7) введём в систему демпфер (рис.1.7) и рассмотрим, что в ней происходит при изменении нагрузки. С увеличением нагрузочного момента M H уменьшается скорость вращения турбины ω , что приводит к уменьшению расстояния r между грузиками центробежного регулятора. Это влечет за собой изменение положения поршенька золотника Δl зол , а, следовательно, и изменение положения поршня силового цилиндра. При этом одновременно происходит два процесса. Во-первых, вместе со штоком силового цилиндра опускаются поршень и цилиндр демпфера, уменьшая первоначальное изменение Δl зол . Скорость перемещения поршня демпфера относительно его цилиндра невелика и регулируется с помощью специального дросселя Др. Во-вторых, приоткрывается заслонка, увеличивая количество подаваемого в турбину пара, и начинает расти скорость ω . За счёт первого движения поршни золотника могут перекрыть перепускные отверстия ещё до восстановления номинального значения ω . В то же время пружины стремятся вернуть демпфер в исходное положение, и, в конечном итоге, Δl 2 стремится к нулю. Теперь уже перепускные отверстия золотника будут перекрыты только при номинальной скорости. Следовательно, система с демпфером, как и предыдущая, является астатической. Рассмотрим, как повлияло введение демпфера на незатухающие колебания, выявленные в предыдущем варианте системы. Считая отклонения от номинального режима малыми, запишем уравнения элементов регулятора. Как и раньше,
Δr = K ω Δω ;
Δl 1 = −K r ⋅ Δr ;
d l сц = K зол ⋅ Δl зол . dt
(1.8) (1.9)
12
В отличие от предыдущей системы, в данном случае положение штока золотника зависит не только от центробежного регулятора, но и от демпфера:
n
Демпфер
Др
r
Задающее устройство
lзол l2
l1
Силовой цилиндр
Золотник
Q Δl сц S Рис.1.7. Регулятор системы стабилизации скорости турбины с использованием успокоительного демпфера 13
Δl зол = K 1 ⋅ Δl 1 − K 2 ⋅ Δl 2 .
(1.10)
Упрощенные уравнения демпфера основываются на равенстве сил пружин:
ΔFпр = K пр ⋅ Δl 2 и сил, связанных с перемещением поршня демпфера относительно корпуса:
Fд = K д
d (l сц − l 2 ) . dt
Переходя к преобразованиям Лапласа при нулевых начальных условиях, запишем равенство этих сил в виде:
K д p ⋅ ( Δl сц − Δl 2 ) = K пр ⋅ Δl 2 , или
Kд K ⋅ pΔl 2 + Δl 2 = д ⋅ pΔl сц . K пр K пр Таким образом, изображения перемещений штока силового цилиндра и корпуса демпфера связаны соотношением:
Δl 2 =
Tд p ⋅ Δl сц , Tд p + 1
(1.11)
где постоянная времени демпфера
Tд = K д K пр . Из (1.9) и (1.10) следует:
p ⋅ Δl сц = K зол ⋅ (K 1Δl 1 − K 2 Δl 2 ) а с учётом (1.11) получаем
p ⋅ Δl сц = K зол ⋅ (K 1Δl 1 − K 2
Tд p Δl сц ) , Tд p + 1
откуда
⎛ Tд ⎞ ⎜⎜1 + K зол K 2 ⎟⎟ ⋅ p ⋅ Δl сц = K зол K 1Δl 1 . Tд p + 1⎠ ⎝
(1.12)
Используя равенства (1.8), (1.12) и (1.4) получим связь между входом регулятора Δω и его выходом ΔQ :
14
T1p + 1 K q рег pΔQ = K зол K1( −K r Kω )Δω , Tд p + 1
(1.13)
где
K qрег =
Tд 1+ K зол K 2Tд ; T1 = . 1+ K зол K 2Tд K сц
Если T1 2 , то есть r
r
∑ γ v = 0 , γ ≠ 0 : i = 1, 2, ..., r . i =1
i
i
i
Умножив это уравнение слева на A , получим r
r
∑γ λ v = 0. i =1
Умножим (2.4-18) на
i
i
i
(2.4-18)
λr :
r
r
∑γ λ v = 0 . i =1
i
r
i
(2.4-19) 43
Вычтем (2.4-19) из (2.4-18) и в результате будем иметь
r
r −1
∑ γ (λ − λ )v = 0 . i =1
i
i
r
i
Получается, что число линейно зависимых векторов r − 1 < r . Если согласиться с этим, то дойдём до r = 2 , и круг замкнулся. Таким образом, действительно, все собственные векторы матрицы A являются линейно независимыми, поэтому матрица r r r r V = [v 1 , v 2 , ... , v n ], построенная из векторов базиса {v }, т.е. из правых собственных векторов матрицы A , является невырожденной. Эта матрица называется модальной матрицей. Из перечисленных выше свойств для правых и левых собственных векторов следует равенство:
D TV = E , или DT = V −1 .
(2.4-20)
DT - матрица, строки которой, являются транспонированными векторами r двойственного базиса d , т.е. левыми собственными векторами матрицы A : r ⎡d1T ⎤ ⎢ rT ⎥ d DT = ⎢ 2 ⎥ . (2.4-21) ⎢⋅ ⋅ ⋅⎥ ⎢ rT ⎥ ⎣⎢d n ⎦⎥
{}
2.4.3. Определение функции от матрицы через её левые и правые собственные векторы Все n систем уравнений
r r Av i = λi v i ,
i = 1,2,..., n
могут быть записаны с использованием блочных матриц:
r [ Av 1
r Av 2
r r Av n ] = [λ1v 1
...
r
λ2v 2
r ... λnv n ] .
Учтем, что
r [ Av 1 и
r Av 2 r
... r
[λ1v 1 λ2v 2
r Av n ] = AV , r L λn v n ] =
44
⎡v 11 v 12 ⎢v v 22 = ⎢ 21 ⎢L L ⎢v ⎣ n1 v n 2
L v 1n ⎤ ⎡λ1 0 L v 2 n ⎥ ⎢ 0 λ2 ⎥⋅⎢ L L ⎥ ⎢L L L v nn ⎥⎦ ⎢⎣ 0 0
0⎤ L 0⎥ ⎥ = VΛ , L L⎥ L λn ⎥⎦ L
где Λ - диагональная матрица собственных чисел. Таким образом, получено равенство
AV = VΛ , или
A = V ΛD T .
(2.4-22)
Преобразование A = TCT , где T - произвольная невырожденная матрица, называется преобразованием подобия. Одно из основных свойств этого преобразования заключается в том, что собственные числа подобных матриц (здесь - A и C ) совпадают. Действительно, −1
ϕ A (λ ) = λE − A = λTT −1 −TCT −1 = T λE − C T −1 = ϕ C (λ ) . Говорят, что матрица A приводится к диагональному виду преобразованием
Λ = V −1 AV = DT AV . (2.4-23) Более высокие степени A приводятся к диагональному виду таким же
способом:
Λ2 = V −1AVV −1 AV = V −1 A 2V .....................................................
Λl = V −1A lV или A l = VΛlV −1 . Таким образом, если рассмотреть матричный многочлен
N ( A) = A l + C1 A l −1 + K + C l −1 A + C l E, то
N ( A) = V {Λl + C1Λl −1 + K + Cl −1Λ + C l E }V −1,
или .
0 ⎡N (λ1 ) ⎢ 0 N ( λ2 ) N ( A) = V ⎢ ⋅⋅⋅ ⎢ ⋅⋅⋅ ⎢ 0 0 ⎣
0 ⎤ ⋅⋅⋅ 0 ⎥ −1 ⋅⋅⋅ ⎥V . ⋅⋅⋅ ⋅⋅⋅ ⎥ ⋅ ⋅ ⋅ N (λl )⎥⎦
(2.4-24)
45
Если применить этот результат к характеристическому полиному, то получим
ϕ ( A) = 0,
(2.4-25)
то есть каждая квадратная матрица удовлетворяет своему характеристическому полиному. Это утверждение известно в теории матриц как теорема Кэли-Гамильтона. Для любой функции от матрицы f (A) , которую можно представить в виде конечного или бесконечного степенного полинома, справедливо аналогичное выражение
0 0 ⎤ K ⎡f (λ1 ) ⎢ 0 0 ⎥ T f ( λ2 ) K ⎥ ⋅D , f ( A) = V ⋅ ⎢ ⎢ M M M ⎥ ⎢ ⎥ 0 K f (λn )⎦ ⎣ 0
(2.4-26)
или эквивалентное ему
r rT f ( A) = ∑ f (λi )v i d i . n
(2.4-27)
i =1
Отсюда вытекает, например, один из способов определения матричной экспоненты или соответствующей переходной матрицы:
r rT Φ( t ) = e = ∑ e v i d i . At
n
λ t i
(2.4-28)
i =1
ПРИМЕР 2.4-2. Для объекта, представленного на рис.2.8. в примере 2.41, найдём левые собственные векторы. Если обозначить присоединённую матрицу к матрице A как I {A} , то очевидно равенство
I { A T } = I T { A} . Поэтому 2 0 0 ⎡λ + 3λ + 2 ⎤ ⎥. 2 + 4λ + 3 0 λ I d ( λ ) = I { AT } = ⎢ λ + 1 ⎢ ⎥ 2 ⎢⎣ 1 λ +3 λ + 5λ + 6⎥⎦
Учитывая, что
λ1 = −1; λ2 = −2; λ3 = −3 , имеем:
46
⎡0 0 0⎤ ⎡ 0 0 0⎤ I d (λ1 ) = ⎢0 0 0⎥ ; I d (λ2 ) = ⎢− 1 − 1 0⎥; ⎢ ⎥ ⎢ ⎥ ⎢⎣1 2 2⎥⎦ ⎢⎣ 1 1 0⎥⎦ ⎡ 2 0 0⎤ I d (λ3 ) = ⎢− 2 0 0⎥; ⎢ ⎥ ⎢⎣ 1 0 0⎥⎦ Рассчитаем левые собственные векторы. Учтем при этом (2.4-14). Таким
r
образом, для первого собственного вектора d1 должны выполняться условия
rT rT r d 1 =ν 1 [0 0 1], d 1 v 1 = 2ν 1 = 1,
откуда
ν1 =
1 2
и
r d 1T = [0 0 0.5].
Аналогично получим
⎡0⎤ ⎡ 1 ⎤ r ⎢ ⎥ r d 2 = 1 ; d 3 = ⎢ − 1⎥ . ⎢ ⎥ ⎢ ⎥ ⎢⎣− 1⎥⎦ ⎢⎣0.5⎥⎦ Теперь можно записать выражение для переходной матрицы. Из (2.4-28) имеем
e At
⎡0 0 0.5⎤ ⎡0 1 − 1⎤ ⎡1 − 1 0.5⎤ = ⎢0 0 1 ⎥e −t + ⎢0 1 − 1⎥e − 2t + ⎢0 0 0 ⎥e −3 t ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢⎣0 0 1 ⎥⎦ ⎢⎣0 0 0 ⎥⎦ ⎢⎣0 0 0 ⎥⎦
и окончательно
⎡e −3 t ⎢ e At = ⎢ 0 ⎢⎣ 0
e −2t − e −3 t e −2 t 0
0.5e − t − e −2t + 0.5e −3 t ⎤ ⎥ e −t − e − 2 t ⎥. ⎥⎦ e −t
Рассмотрим ещё несколько примеров. Для
47
0⎤ ⎡− 3 1 A = ⎢ 0 − 2 1 ⎥; ⎢ ⎥ ⎢⎣ 0 0 − 1⎥⎦
λ1 = −1; λ2 = −2 ; λ3 = −3;
имеем
1⎤ ⎡ 0 0 ⎡0 1 − 1⎤ ⎡1 − 1 0.5⎤ ⎢ 2⎥ A = j ⎢0 0 1 ⎥ + j 2 ⎢0 1 − 1⎥ + j 3 ⎢0 0 0 ⎥= ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎦ 0 0 1 0 0 0 0 0 0 ⎢ ⎥ ⎣ ⎦ ⎣ ⎢⎣ ⎥⎦ ⎡ 1 3⎤ 3 2 3 2 − − + ⎢ ⎥ 2 2 ⎢ ⎥ 2 1 − 2 ⎥. = j⎢ 0 ⎢0 ⎥ 0 1 ⎢ ⎥ ⎣ ⎦ Проведём проверку:
⎡ 3⎤ ⎡ 1 2 3 2 3 − − + ⎥ ⎢ 3 ⎢ 2 2 ⎥ ⎢ ⎢ 2 1− 2 ⎥ ⋅ ⎢ 0 j2⎢ 0 ⎥ ⎢0 ⎢0 0 1 ⎥ ⎢ ⎢ ⎦ ⎣ ⎣ 0⎤ ⎡− 3 1 = ⎢ 0 − 2 1 ⎥. ⎢ ⎥ ⎢⎣ 0 0 − 1⎥⎦
2− 3 2 0
3⎤ 1 − 2+ ⎥ 2 ⎥ 2 1− 2 ⎥ = ⎥ 1 ⎥ ⎦
Для той же матрицы найдём A : 5
λ15 = −1, λ52 = −32 , λ53 = −243
и
48
⎡ ⎢0 A 5 = − ⎢0 ⎢ ⎢0 ⎢⎣ ⎡− 243 =⎢ 0 ⎢ ⎢⎣ 0
1⎤ ⎡ 0 1 − 1⎤ ⎡ ⎥ ⎢1 − 1 2 0 1 ⎥ − 32⎢0 1 − 1⎥ − 243 ⎢0 0 ⎢ ⎥ ⎥ ⎢ ⎢ ⎥ 0 1⎥ ⎢0 0 ⎣0 0 0 ⎦ ⎥⎦ ⎢⎣ 211 − 90 ⎤ − 32 31 ⎥. ⎥ − 1 ⎥⎦ 0 0
1⎤ 2⎥ 0⎥ = ⎥ 0⎥ ⎥⎦
2.5. Свойства движений линейных систем 2.5.1. Матричная весовая и переходная функции Пусть заданы уравнения некоторого динамического объекта
r r r x& (t ) = A(t )x + B(t )u(t ) ; r r y (t ) = C (t ) x (t ) .
(2.5-1) (2.5-2)
В соответствии с формулой Коши выражение для вектора выхода t r r r y (t ) = C(t )Φ(t, t 0 )x (t ) + ∫ C(t )Φ(t ,ξ )B(ξ )u(ξ )dξ .
(2.5-3)
t0
Анализируя качество работы объекта, удобно рассматривать движение r y (t ) как сумму свободной составляющей, обусловленной, в основном, свойствами самого объекта, и вынужденной составляющей, несущей отпечаток входного сигнала - вектора управления. Строго говоря, это разделение условно, но очевидно, что свободную составляющую целесообразно отождествить с первым слагаемым правой части равенства (2.5-3). Отсюда следует вывод, что основные свойства объекта определяются его переходной матрицей Φ(t ,t 0 ) , в то время как степень их проявления зависит от вектора начальных условий. Отметим, однако, что первопричиной всякого движения объекта является вектор управления. Это означает, что даже при анализе собственных движений объекта следует учитывать и матрицу управления B(t ) . Обозначим
w y (t ,τ ) = C (t )Φ (t,τ )B (τ ) .
(2.5-4)
Очевидно, что для i -й координаты вектора выхода при нулевых начальных условиях справедливо выражение
49
t nu
y i (t ) = ∫ ∑ w ij (t ,ξ )u j (ξ )dξ . t 0 j =1
Если положить
uk (ξ ) = δ (ξ − τ ) и u j (ξ ) = 0 при j ≠ k , то в соответствии со свойствами лучим
δ -функции по-
y i (t ) = w ik (t ,τ ) . Таким образом, элемент, стоящий в i -ой строке и в k -м столбце матрицы w y (t ,τ ) , можно интерпретировать как реакцию i -ой коорди-
r
наты вектора y (t ) на дельта-функцию δ (t − τ ) в k -ой координате r вектора управления u (t ) . Матрица w y (t ,τ ) называется матричной весовой или матричной импульсной переходной функцией объекта по вектору выхода. Аналогичным образом определяется матричная весовая функция объекта по вектору состояния
w x (t ,τ ) = Φ (t ,τ )B (τ ) .
(2.5-5)
u2 u1
k x1 p
10 2p + 1
x2
Рис. 2.11. К примеру на определение матричной весовой функции Интеграл от матричной весовой функции t
H (t, t 0 ) = ∫ w (t ,τ )dτ
(2.5-6)
t0
называют матричной переходной функцией объекта. Элементы этой матрицы могут рассматриваться как реакции координат вектора выхода (вектора состояния) на единичные функции по соответствующим координатам вектора управления. Если на вход объекта поступает постоянr ный во времени вектор управления u0 × 1(t − t 0 ) , то при нулевых начальных условиях
r r y (t ) = H (t , t 0 )u 0 .
(2.5-7) 50
В качестве примера на рис. 2.12 изображены элементы матричной переходной функции по вектору состояния для системы, представленной на рис. 2.11.
Рис.2.12. Элементы матричной переходной функции для системы, представленной на рис. 2.11 В стационарном случае рассмотренные матрицы являются функцией одного аргумента:
w y (t, t 0 ) = w y (t − t 0 ) = w y (τ ) = Ce Aτ B = CΦ (τ )B
(2.5-8)
и t
H y (t ) = ∫ CΦ (t − τ )Bdτ .
(2.5-9)
0
Это выражение для переходной функции можно упростить. Производя замену аргумента
σ = t −τ , получим 0
H y (t ) = ∫ CΦ(σ )Bdσ σ =t
и окончательно t
H y (t ) = − ∫ CΦ (τ )Bdτ .
(2.5-10)
0
Используя представление переходной матрицы через матричную экспоненту, можно получить 51
3 4 t2 ⎧ ⎫ 2 t 3 t H y (t ) = C ⎨Et + A + A +A + K⎬B . 2 3! 4! ⎩ ⎭
(2.5-11)
Один из наиболее употребимых способов вычисления Φ(t ) и H (t ) состоит в определении (расчете) соответствующих окаймленных матричных рядов. ПРИМЕР 2.5-1. Объект управления задан системой дифференциальных уравнений, которым соответствует схема в переменных состояния, приведенная на рис. 2.13.
x2(0)
x1(0)
x2
x1
u
2
y
2 Рис.2.13. Структурная схема к примеру 2.5-1 Этой схеме соответствуют уравнения
⎧ x& 1 = x 2 , ⎪& ⎨ x 2 = −2 x 2 + u, ⎪y = 2 x + x 1 2. ⎩ Требуется найти переходную матрицу, матричные весовую и переходную функции, реакцию объекта на постоянный входной сигнал. Прежде всего, найдем переходную матрицу. Элемент первой строки и первого столбца этой матрицы можно определить как реакцию координаты x1 на начальные условия x1 (0 ) = 1, x 2 (0 ) = 0 при u = 0 . Решение первого дифференциального уравнения дает
ϕ11 (t ) = x1 (t ) = 1. Аналогично
ϕ 22 (t ) = x 2 (t ) при x 2 (0 ) = 1,
x1 (0 ) = u = 0 .
Решая при этих условиях второе дифференциальное уравнение, получим
ϕ 22 (t ) = e −2t . 52
Очевидно ϕ 21 (t ) = 0 , так как координата x 2 не зависит от x1 . Для того, чтобы определить ϕ12 (t ) , следует взять интеграл t
ϕ12 (t ) = ∫ e −2τ dτ = 0.5(1 − e −2t ). 0
Таким образом,
⎡1 0.5(1 − e −2t )⎤ Φ( t ) = ⎢ ⎥. −2t 0 e ⎣ ⎦
В соответствии с уравнениями объекта
⎡0⎤ ⎡0 1 ⎤ ; ; C = [2 1], A=⎢ B = ⎢ ⎥ ⎥ ⎣1⎦ ⎣0 − 2⎦ поэтому
w y (t ) = CΦ(t )B = 1 и t
H y (t ) = ∫ CΦ (τ )Bdτ = t . 0
При нулевых начальных условиях и u = u 0 = const
y (t ) = u 0 ⋅ t . Если начальные условия ненулевые, то
r y (t ) = CΦ(t )x (0 ) + u 0 (t ) = 2 x 1 (0) + x 2 (0) + u 0 ⋅ t .
При этом t r r r x(t ) = Φ(t )x (0) + H x (t )u0 = Φ(t )x (0) + ∫ Φ(τ )Bdτ ⋅ u0 = 0
1 ⎤ ⎡1 1 ⎡ ⎤ ⎢ t + (e −2t − 1)⎥ −2 t x (0) + (1 − e )x2 (0)⎥ 2 4 +⎢ =⎢ 1 2 ⎥u0 . 1 −2 t −2 t ⎢ ⎥ e x2 (0) (1 − e ) ⎥ ⎣ ⎦ ⎢ ⎦ ⎣ 2 Видно, что в выходной координате участвуют не все составляющие движения, присутствующие в векторе состояния. Еще более характерная ситуация возникнет, если изменить исходные данные. Если положить
53
⎧ x&1 = x 2 ⎪& ⎨x2 = 2x2 + u , ⎪y = −2 x + x 1 2 ⎩ то поведение выходной координаты принципиально не изменится
y (t ) = −2 x 1 (0) + x 2 (0) + u 0 ⋅ t , но процесс по координатам состояния будет неограниченно расти:
1 1 2t 1 ⎤ ⎡ −2t ( ) ( ) x e x e tu 0 ⎥ ( ) ( ) 0 1 0 1 − − + − − 1 2 r ⎢ 2 4 2 x (t ) = ⎢ ⎥. 1 − 2t 2t e x 2 (0) + (e − 1)u 0 ⎥ ⎢ ⎦ ⎣ 2 Такие случаи, когда вектор выхода не отражает характерные свойства объекта, могущие привести к катастрофическим результатам, будут подробно обсуждаться в последующих разделах. 2.5.2. Модальная (спектральная) интерпретация решения векторноматричных дифференциальных линейных стационарных уравнений Рассмотрим сначала движение автономной системы
r r x& (t ) = Ax (t ),
r r x (t ) = x 0 .
(2.5-12)
Пусть все собственные числа матрицы A различны. Тогда ее собственr n ные векторы v i , i = 1,2,..., n образуют базис в пространстве R , то есть являются линейно независимыми. В соответствии с (2.3-5) и (2.4-28) решение уравнения (2.5-12) можно записать в виде n r rr r x (t ) = ∑ e λi t v i d iT x (0) . i =1
Обозначим скаляр
rT r μ i = d i x (0 ) ,
(2.5-13)
тогда
r x (t ) =
n
r
∑ μ i e λi t v i .
(2.5-14)
i =1
Очевидно, что свободное движение вектора состояния объекта является комбинацией движений по собственным векторам матрицы A . Такие движения называют модами системы, а матрицу собственных векторов V - модальной матрицей. Коэффициент μ i соответствует величине возбуждения i - ой моды системы, обусловленной начальными условия54
ми. Иначе говоря, каждая мода возбуждается соответствующим выбором начального состояния. Согласно (2.5-13),
⎡ x1(0) ⎤ ⎢ x (0 )⎥ μ i = [d i 1 d i 2 ... d in ] ⎢ 2 ⎥ = d i 1x1(0) + d i 2 x 2 (0) + ... + d in x n (0) . ⎢ ... ⎥ ⎥ ⎢ ⎣ x n (0)⎦ r Если вектор начальных условий x(0) совпадает по направлению с i - м собственным вектором, то есть
r r x (0 ) = α ⋅ v i ,
то, учитывая, что согласно (2.4-13) и (2.4-14),
rT r d i v i = 1, получаем rT r μ i = d i x (0 ) = α i
и
rT r μ j = d j x (0 ) = 0
r r d iT v j = 0 при i ≠ j и
при
j ≠ i.
Таким образом, при указанном выборе начальных условий, возбуждается только i-ая мода, или «частота». Рассмотрим с этих же позиций движение неавтономного объекта
r r r x& (t ) = Ax(t ) + Bu(t ). Изложенный подход можно использовать и в этом случае, если вектор r Bu(t ) разложить по собственным векторам матрицы A : n r r Bu(t ) = ∑ β i (t ) × v i
..
(2.5-15)
i =1
Для того, чтобы определить скалярные функции
rT части этого равенства слева на d j : n rT r rT r d j Bu(t ) = ∑ β i (t )d j v i ,
β i (t ) , умножим обе
i =1
откуда, учитывая (2.4-13) и (2.4-14), получаем
rT r β i (t ) = d i Bu(t ).
(2.5-16)
Таким образом, в соответствии с формулой Коши (2.3-18) и выражением для переходной матрицы (2.4-28) имеем
55
t n r r At r x (t ) = e x (0 ) + ∫ e A (t −τ ) ⋅ ∑ β i (τ )v i dτ = i =1
0
t n n r r r r λ ( t −τ ) = e x (0 ) + ∫ ∑ e j ∑ β i (τ )v j d Tj v i dτ = At
0 j =1
(2.5-17)
i =1
⎫ r ⎧ λ j t t λ j (t −τ ) r T r d j Bu (τ )dτ ⎬ ⋅ v j . = ∑ ⎨μ i e + ∫ e j =1 ⎩ ⎭ 0 n
r
Если вынуждающая функция u (t ) выбирается таким образом, чтобы r вектор Bu (t ) совпадал с направлением одного из собственных векторов матрицы A , то она будет возбуждать только одну соответствующую моду «частоту».
2.6. Модели стационарных линейных систем в комплексной плоскости на основе преобразования Лапласа 2.6.1. Матрица передаточных функций Известно, что преобразование Лапласа определяется парой преобразований ∞ r r r X ( p ) = L{x (t )} = ∫ x (t )e − pt dt ,
0
r r x (t ) = L−1 X ( p ) =
{
}
C + j∞
1 ∫ 2π ⋅ j C − j∞
r X ( p )e pt dp .
(2.6-1)
Первое из них называется прямым, а второе - обратным. Векторная
r r функция x(t ) называется оригиналом, а X ( p ) - изображением этого
оригинала по Лапласу; p - комплексная переменная преобразования Лапласа. Преобразование Лапласа можно осуществить, если p = σ + jω и σ > σ c , где σ c - абсцисса абсолютной сходимости. Ве-
r
σ C выбирается исходя из требования, чтобы функция x (t )e −σt при σ > σ C была абсолютно интегрируемой.
личина
При вычислении обратного преобразования Лапласа интегрирование ведется на плоскости комплексной переменной p по прямой, параллельной мнимой оси, лежащей на прямой с, причем с выбирается так,
r чтобы все полюсы X ( p ) оказались слева от прямой интегрирования (рис. 2.14). На этом рисунке показано расположение полюсов некоторой
r функции X ( p ) .
56
+j
Плоскость p
σc с
+
Рис.2.14. К вычислению обратного преобразования Лапласа Пусть, как обычно, уравнения объекта имеют вид
r r r x& (t ) = A(t )x(t ) + B(t )u(t ); r r y (t ) = C(t )x (t ). Перейдем к изображениям по Лапласу
r r r r pX ( p) − x(0) = AX ( p ) + BU ( p ); r Y ( p ) = CX ( p ). r
Перенесем AX(p) в левую часть равенства, а x(0) - в правую:
r r r ( pE − A) X ( p ) = x(0) + BU ( p). Отсюда получаем выражение для изображения вектора состояния
r r r −1 −1 X ( p ) = ( pE − A) x (0) + ( pE − A) BU ( p ) .
Сравнивая это равенство с формулой Коши t r r r At x(t ) = e ⋅ x(0) + ∫ e A( t −τ ) ⋅ Bu(τ )dτ , 0
отмечаем, что резольвента матрицы A может рассматриваться как изображение по Лапласу от переходной матрицы (матричной экспоненты):
( pE − A ) −1 = L {e At }. Справедливо равенство
( pE − A) −1 =
I ( p) , ϕ A ( p)
(2.6-2)
57
где I ( p ) - присоединенная матрица для матрицы А, и ϕ A (p ) - характеристический полином матрицы A . I ( p ) и ϕ A (p ) могут быть определены по методу Фаддеева - Леверье. При нулевых начальных условиях
r r X ( p ) = ( pE − A)−1 BU ( p ),
(2.6-3)
Wux ( p ) = ( pE − A) −1 ⋅ B
(2.6-4)
где функция
называется матричной передаточной функцией от вектора управления до вектора выхода или передаточной функцией по каналу «u-x». Аналогично, при нулевых начальных условиях
r r −1 Y ( p ) = C( pE − A) BU ( p ),
(2.6-5)
где функция
Wuy ( p ) = C( pE − A) −1 ⋅ B
(2.6-6)
называется матричной передаточной функцией от вектора управления до вектора выхода или передаточной функцией по каналу «u-y». Функ−1 цию ( pE − A) называют резольвентой матрицы A . С использованием передаточной функции можно записать:
r r X ( p ) = Wux ( p ) ⋅ U ( p ) . r r Y ( p ) = Wuy ( p ) ⋅ U ( p )
(2.6-7)
Принимая во внимание, что изображение по Лапласу δ - функции равно единице, можно представить передаточную функцию как изображение от весовой функции
W ( p ) = L{w (t )}.
(2.6-8)
Передаточная функция является функцией от матрицы A , поэтому в соответствии с (2.4-27) можно записать
r rT C ⋅v i ⋅ d i B Wuy ( p ) = ∑ i =1 ( p − λi )
(2.6-9)
r rT C ⋅ v i ⋅ di B r ⋅ U ( p) . Y ( p) = ∑ i =1 ( p − λi )
(2.6-10)
n
и
n
Графическое изображение последней формулы представлено в виде структурной схемы, изображённой на рис. 2.15. 58
rT d1 B r U ( p)
1 p − λ1
r C v1
rT d2 B
1 p − λ2
r Cv2
rT dn B
1 p − λn
r Cvn
∑
r Y ( p)
Рис. 2.15. Структурная схема системы на базе представления передаточной функции через собственные числа и собственные векторы матрицы динамики ПРИМЕР 2.6-1. Для объекта, схема в переменных состояния которого приведена на рис.2.16, уравнения состояния имеют вид
x&1 = x 2 − u1 ; x& 2 = x 3 + u1 ;
x& 3 = x 2 + u2 ;
y 1 = x1 ; y 2 = x3 .
Им соответствует матрицы
⎡− 1 0⎤ ⎡0 1 0⎤ ⎡ 1 0 0⎤ A = ⎢0 0 1⎥; B = ⎢ 1 0⎥; C = ⎢ ⎥. ⎥ ⎢ ⎥ ⎢ 0 0 1 ⎣ ⎦ ⎢⎣ 0 1⎥⎦ ⎢⎣0 1 0⎥⎦ Характеристический полином имеет вид
ϕ A (λ ) = λ3 − λ . Собственные числа
λ 1 = 0 ; λ 2 = 1; λ 3 = − 1 .
59
u1 x2
x1 x3
u2
y1 y2
Рис.2.16. Структурная схема к примеру 2.6-1 Присоединенная матрица
⎡λ 2 − 1 λ ⎢ I (λ ) = ⎢ 0 λ2 ⎢⎣ 0 λ
1⎤ λ ⎥⎥. λ2 ⎥⎦
Резольвента
⎡1 ⎢λ I (λ ) ⎢⎢ −1 (λE − A ) = = 0 ϕ A (λ ) ⎢ ⎢ ⎢0 ⎣
1 1 ⎤ λ − 1 λ (λ2 −1) ⎥ λ 1 ⎥⎥ . λ2 − 1 λ2 − 1 ⎥ λ ⎥ 1 λ2 − 1 λ2 − 1 ⎥⎦ 2
В соответствии с (2.6-4) передаточная функция по вектору состояния 2 1 ⎤ ⎡− p + p +1 ⎢ p( p 2 − 1) p( p 2 − 1) ⎥ ⎥ ⎢ p 1 −1 ⎥ Wux ( p ) = ( pE − A ) B = ⎢ 2 2 ⎢ p −1 p −1 ⎥ ⎥ ⎢ 1 p ⎥ ⎢ 2 p2 −1 ⎦ ⎣ p −1
и по вектору выхода 2 1 ⎤ ⎡ − p + p +1 ⎢ p( p 2 − 1) p 2 − 1⎥ −1 Wuy ( p ) = C ( pE − A ) B = ⎢ ⎥. 1 p ⎢ ⎥ 2 2 ⎢⎣ p −1 p − 1⎥⎦
Используя присоединенную матрицу, можно найти матрицу правых собственных векторов 60
⎡1 1 1 ⎤ V = ⎢0 1 − 1⎥ . ⎢ ⎥ ⎢⎣0 1 1 ⎥⎦ Присоединенная матрица для A
T
2 ⎡λ − 1 0 2 I d (λ ) = ⎢ λ λ ⎢ ⎢⎣ 1 λ
0⎤ λ ⎥⎥ . λ2 ⎥⎦
Левые собственные векторы
1 0 0 ⎤ r ⎡ ⎤ r ⎡ ⎤ r ⎡ d 1 = ⎢ 0 ⎥; d 2 = ⎢0.5⎥; d 3 = ⎢− 0.5⎥ . ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣⎢− 1⎦⎥ ⎣⎢0.5⎦⎥ ⎣⎢ 0.5 ⎦⎥ Базовые матрицы
⎡1 0 − 1⎤ ⎡0 0.5 0.5⎤ r r r r v 1d 1T = ⎢0 0 0 ⎥ ; v 2 d 2T = ⎢0 0.5 0.5⎥ ; ⎢ ⎥ ⎢ ⎥ ⎢⎣0 0 0 ⎥⎦ ⎢⎣0 0.5 0.5⎥⎦ ⎡0 − 0.5 0.5 ⎤ r r v 3 d 3T = ⎢0 0.5 − 0.5⎥ . ⎢ ⎥ ⎢⎣0 − 0.5 0.5 ⎥⎦ Вычислим коэффициенты суммы (2.6-9):
r r ⎡− 1 − 1⎤ Cv 1d 1T B = ⎢ ⎥; 0 0 ⎣ ⎦
r r ⎡0.5 0.5⎤ Cv 2 d 2T B = ⎢ ⎥; 0 . 5 0 . 5 ⎦ ⎣
r rT ⎡− 0.5 0.5⎤ Cv 3 d 3 B = ⎢ ⎥ ⎣− 0.5 0.5⎦ и получим результат, естественно, совпадающий с уже полученным
Wuy ( p ) =
1 ⎡−1 − 1⎤ 1 1 ⎡1 1⎤ 1 1 ⎡− 1 1⎤ + ⋅ . + ⋅ p ⎢⎣ 0 0 ⎥⎦ p − 1 2 ⎢⎣1 1⎥⎦ p + 1 2 ⎢⎣− 1 1⎥⎦
Практически без дополнительных выкладок получаем
61
⎡− 1 − 1⎤ 1 ⎡1 1⎤ t 1 ⎡− 1 1⎤ −t w y (t ) = ⎢ ⎥ + 2 ⎢1 1⎥ ⋅ e + 2 ⎢− 1 1⎥ ⋅ e . 0 0 ⎣ ⎣ ⎦ ⎣ ⎦ ⎦ Интегрируя весовую функцию, получаем матричную переходную функцию
1 t 1 t ⎡ −t −t ⎤ ( ) ( )⎥ t e 2 e t e e − + − + − + − ⎢ 2 2 H y (t ) = ⎢ ⎥. 1 t 1 t −t −t (e − 2 + e ) (e − e ) ⎥ ⎢ ⎣ 2 ⎦ 2
2.6.2. Основные свойства передаточных функций Понятие передаточной функции лежит в основе классической теории автоматического регулирования. В связи с этим ниже перечисляются основные её свойства, используемые при анализе систем автоматического управления. 1. Элемент i -й строки и j -го столбца матричной передаточной функции равен отношению изображения i -й координаты вектора выхода к j -ой координате вектора управления при нулевых начальных условиях:
Wij (p ) =
Yi ( p ) . U j ( p)
(2.6-11)
Таким образом, nu
Yi ( p ) = ∑W ij ( p )U j ( p ) .
(2.6-12)
j =1
2. Для стационарных объектов с сосредоточенными параметрами элементы матричной передаточной функции - это дробно-рациональные функции комплексной переменной p :
b0 p m + b1p m −1 + ... + bm Wij ( p ) = = Qij ( p ) a0 p n + a1p n −1 + ... + an Rij ( p )
.
(2.6.13)
3. По известной передаточной функции легко восстанавливаются соответствующие дифференциальные уравнения. По данным предыдущего примера
62
1 − p2 + p + 1 Y1 ( p ) = U ( p ) + U 2 ( p) . 1 p( p 2 − 1) p( p 2 − 1) После приведения к общему знаменателю получаем
p 3Y1 (p ) − pY1 (p ) = − p 2U1( p ) + pU1( p ) + U1( p ) + U 2 ( p ) , и в результате имеем
&y&&1(t ) − y& 1(t ) = −u&&1 (t ) + u&1(t ) + u1(t ) + u2 (t ) . 4. Знаменатель передаточной функции - это соответствующий характеристический полином. Полюсы передаточной функции - это корни соответствующего характеристического полинома. 5. Поскольку весовая функция является оригиналом для передаточной, то при всех различных полюсах n
w ij (t ) = ∑ Cl e pl t ,
(2.6.14)
l =1
где pl - полюсы функции; m
Rij ( pl )
b Cl = ' = 0⋅ Q ij ( pl ) a0
∏ (p v =1 n
∏ (p
v =1,v ≠ l
− rv )
l
l
− rv )
;
b0 ,a0 - коэффициенты при старших степенях p
(2.6.15)
числителя и знамена-
теля передаточной функции Wij (p ) ;
rv - нули W ij (p ) . 6. В физически реализуемых системах порядок числителя m элементарной передаточной функции не может превышать порядка ее знаменателя n . 7. В простейших случаях элементарная передаточная функция может быть непосредственно получена из соответствующего дифференциального уравнения. Например, для динамического звена с уравнением
T
dy (t ) du(t ) + y (t ) = T dt dt
путем перехода к изображениям по Лапласу при нулевых начальных условиях получаем
T pY ( p) + Y ( p) = T p U ( p) , откуда
63
W ( p) =
Y ( p) Tp = . U ( p ) Tp + 1
При описании пассивных электрических цепей передаточные функции могут вычисляться в соответствии с правилами электротехники с использованием полных символических сопротивлений. Так, например, для схемы, приведенной на рис.2.17, С
R1
U
R2
Uвых=Y
Рис.2.17. Пассивное дифференцирующее звено
W ( p) =
Y ( p) = U ( p)
R2 1 pC R2 + 1 R1 + pC R1 ⋅
=
R2 ⋅ R1 + R2
R1Cp + 1 . R2 R1Cp + 1 R1 + R2
64
2.7. Комплексный передаточный коэффициент 2.7.1. Способы определения понятия «Комплексный передаточный коэффициент» Известно несколько подходов к введению понятия «Комплексный передаточный коэффициент». Рассмотрим основные из них. ♦ Формальная замена комплексной переменной в передаточной функции. Изображения по Лапласу вектора выхода и вектора управления связаны между собой с помощью передаточной функции
v v Y ( p ) = W ( p )U ( p ) .
(2.7-1)
Если в этом равенстве комплексную переменную p принять чисто мнимой величиной p = jω , то формально получаем следующее равенство
v v Y ( jω ) = W ( jω )U ( jω ) .
(2.7-2)
Здесь комплексный передаточный коэффициент W ( jω ) определяется формально:
W ( jω ) = W ( p ) | p = jω . Строго говоря, эта замена не всегда правомерна. ♦ Использование преобразования Фурье Прямое и обратное преобразования Лапласа выглядят щим образом: ∞
Y ( p ) = ∫ y (t )e dt ; − pt
0
1 C + jω y (t ) = Y ( p )e pt dp ∫ 2πj C − jω
следую-
(2.7-3)
Преобразование Лапласа существует тогда, когда вещественная часть комплексной переменной p удовлетворяет неравенству σ > σ C . Если функция y (t ) , t ∈ [0, ∞ ) является односторонней и абсолютно ин∞
тегрируемой, т.е.
∫0 y (t )dt < ∞ , то её абсцисса абсолютной сходимости
σ C 0 существует δ (ε , t 0 ) > 0 такое, что при
r r x (t 0 ) − x 0 ( t 0 ) ≤ δ
(2.9-2)
удовлетворяется неравенство
r r (2.9-3) x (t ) − x 0 (t ) ≤ ε . r Норма вектора x в простейшем случае совпадает с его евклидовой
длиной n r 2 x = ( ∑ x i )1/ 2 .
(2.9-4)
i =1
Возможно так же использование и других форм нормы, например n r r x = max x i ; x = ∑ x i . i
(2.9-5)
i =1
Введение нормы в пространстве состояний дает возможность ввести понятие близости точек пространства. Устойчивость в смысле Ляпунова r гарантирует, что состояние x(t ) не отклоняется далеко от «номинальноr r го» режима x 0 (t ) при начальном состоянии x (t 0 ) , достаточно близком к
r
номинальному начальному состоянию x 0 (t 0 ) .
r
Решение x 0 (t ) называется асимптотически устойчивым, если оно устойчиво в смысле Ляпунова, и для любого t 0 существует такое что при
r r x ( t 0 ) − x 0 (t 0 ) ≤ ρ
ρ (t 0 ) ,
(2.9-6)
выполняется условие
r r lim x (t ) − x 0 (t ) = 0 . t →∞
(2.9-7)
86
r
Решение x 0 (t ) является асимптотически устойчивым в целом, если оно
r
устойчиво по Ляпунову, и для любых t 0 и x (t 0 )
r r lim x (t ) − x 0 (t ) = 0 .
(2.9-8)
t →∞
Применительно к нелинейным системам, вследствие сложности характерных для них явлений, обсуждается обычно устойчивость решений. В линейных системах ситуация проще, и в этом случае целесообразнее говорить об устойчивости уже не решения, а самой системы. Пусть дано уравнение системы
r. r r x C (t ) = A(t ) x C (t ) + B(t )u(t ) , (2.9-9) r r r и для t 0 , x C 0 (t 0 ) и u 0 (t ) , при t ≥ t 0 известно xC 0 (t ) , то есть справедливо уравнение
r. r r x C 0 (t ) = A(t ) x C 0 (t ) + B(t )u 0 (t ) .
(2.9-10)
r
r
Естественно, что при других начальных условиях xC 1 (t 0 ) решение xC 1 (t ) будет другим
r. r r x C1 (t ) = A(t ) x C1 (t ) + B(t )u 0 (t ) .
(2.9-11)
Вычтем из (2.9-11) уравнение (2.9-10):
r r r d r {x C1 (t ) − xC 0 (t )} = A(t ){xC1 (t ) − xC 0 (t )} dt Обозначив,
(2.9-12)
r r r x (t ) = x C 1 ( t ) − x C 0 ( t ) ,
при начальных условиях
r r r x (t 0 ) = x C 1 ( t 0 ) − x C 0 ( t 0 ) . получим уравнение
r. r x (t ) = A(t )x(t ) , при
r r t = t 0 x = x (t 0 ) .
(2.9-13)
Таким образом, понятие устойчивости решения можно свести к понятию устойчивости линейной системы. Линейная система устойчива в определенном смысле (по Ляпунову, асимптотически, или асимптотически в целом), если тривиальr ное решение x 0 (t ) ≡ 0 устойчиво в этом смысле. Линейная система асимптотически устойчива тогда и только тогда, когда она асимптотически устойчива в целом. 87
Таким образом, исследование вопроса устойчивости решений линейной неавтономной системы сводится к исследованию решения соответствующего однородного дифференциального уравнения, которое определяется матрицей A(t ) и имеет вид:
r r x (t ) = Φ(t , t 0 )x (t 0 ) ; r r y = C(t )Φ(t, t 0 )x (t 0 ) .
(2.9-14) (2.9-15)
Рассмотрим три возможных случая. 1. Φ(t , t 0 ) – ограниченная матрица в интервале [t 0 , ∞ ) , то есть существует такое положительное число М что
Φ ij (t, t 0 ) ≤ M,
t ≥ t 0 ; i , j = 1,2.., n.
Тогда получаем, что
r x (t ) ≤ n 2 M max x i (t 0 ) , i
и условие устойчивости выполняется, если взять, например,
δ≤
ε n 2M
.
2. Переходная матрица удовлетворяет условию
lim Φ(t, t 0 ) = 0 . t →∞
При этом движение, а значит, и сама система являются асимптотически устойчивыми. 3. Φ(t , t 0 ) – неограниченная матрица в интервале [t 0 , ∞ ) . При этом дви-
r
жение неустойчиво, так как для любого x (t 0 ) ≠ 0 :
r lim x (t ) = ∞ . t →∞
Это означает и неустойчивость самой системы. Если система является наблюдаемой и управляемой, (эти понятия будут рассмотрены в п.п. 3.2, 3.3), то устойчивость системы можно исследовать с помощью весовой функции. Система асимптотически устойчива, если
lim w y (t ,τ ) = 0 . t →∞
Итак, линейная система является асимптотически устойчивой, если ее переходная матрица с течением времени стремится к нулевой матрице. Для стационарных систем, то есть для систем с постоянными параметрами, это условие эквивалентно требованию, чтобы все собственные числа матрицы А имели отрицательные действительные части, то есть лежали в левой полуплоскости плоскости комплексной перемен88
ной λ . Это следует из формы представления переходной матрицы через собственные числа и правые и левые собственные векторы матрицы А в соответствии с (2.4-28). Таким образом, анализ устойчивости системы может быть сведен к анализу расположения собственных чисел матрицы А , или, что, то же самое, расположения полюсов передаточной функции полностью управляемой и наблюдаемой системы. В теории автоматического управления разработан ряд методов, называемых критериями устойчивости, позволяющих проанализировать расположение собственных чисел относительно мнимой оси плоскости λ , и не требующих при этом точного решения соответствующего характеристического уравнения. К первой группе этих методов относятся, так называемые, алгебраические критерии, которые путем элементарных вычислений по коэффициентам характеристического полинома позволяют проанализировать устойчивость исследуемой системы с известными значениями ее параметров.
2.9.2. Необходимое условие устойчивости Для устойчивости системы с характеристическим полиномом
ϕ (λ ) = a0 λn + a1λn −1 + ...an −1λ + an
(2.9-16)
необходимо, чтобы при a0 > 0 все коэффициенты характеристического полинома были положительны, то есть a i > 0 при i = 1, 2 , ..., n . Докажем это утверждение. Если λ1 , λ2 ,,,,, λn - нули характеристического полинома (корни характеристического уравнения ϕ ( λ ) = 0 ), то (2.9-16) может быть записано в виде
ϕ (λ ) = (λ − λ1 )(λ − λ2 )...(λ − λn ) . λi
(2.9-17)
Если λi - вещественный корень в левой полуплоскости, то есть = −α i (α i > 0 - положительное вещественное число), то
(λ − λi ) = (λ + α i ) и произведение таких сомножителей даст полином только с положительными коэффициентами. Пусть λi - комплексный корень в левой полуплоскости, то есть λi = −α i + jω i (α i > 0 ). Тогда при всех вещественных коэффициентах характеристического полинома среди его нулей должен быть комплексно сопряжённый: λi +1 = −α i − jω i . Произведение двух соответствующих сомножителей даст полином второй степени с положительными коэффициентами:
(λ − λi )(λ − λi +1 ) = λ2 + 2α i λ + α i2 + ω i2 ) . Следует обратить внимание на то, что рассмотренное условие устойчивости не является достаточным. Если среди коэффициентов ха89
рактеристического полинома имеются отрицательные, то это означает, что соответствующая система неустойчива. Если все коэффициенты положительны, то система может быть как устойчивой, так и неустойчивой. В этом случае необходим дополнительный анализ.
2.9.3. Критерий устойчивости Гурвица. Пусть характеристический полином некоторой системы имеет вид (2.9-16). Сопоставим этому полиному матрицу Гурвица:
⎡ a1 a3 a5 ⎢a a a 2 4 ⎢ 0 ⎢ 0 a1 a3 Gϕ = ⎢ ⎢ ... ... ... ⎢0 0 0 ⎢ ⎣0 0 0
... 0 ... 0 ... 0 ... ... ... an −1 ... an −2
0⎤ 0⎥ ⎥ 0⎥ . ... ⎥⎥ 0⎥ ⎥ an ⎦
(2.9-18)
По главной диагонали стоят коэффициенты полинома, остальные элементы строятся по следующему принципу: вверх от диагонального элемента ставятся коэффициенты полинома в порядке возрастания индексов, вниз - коэффициенты полинома в порядке убывания индексов. Элементы, требующие индексов, больших степени полинома, или отрицательных, устанавливаются нулевыми.
Критерий Гурвица. Для устойчивости системы необходимо и достаточно чтобы при а0>0 были положительны все (n) главные миноры матрицы Гурвица. Рассмотрим примеры конкретизации критерия Гурвица для простейших случаев. • n = 1. Запишем дифференциальное уравнение
a0 ⋅
dy + a1 y = 0 dt
и характеристическое уравнение
a0 λ + a1 = 0 . В данном случае применение критерия Гурвица даёт тривиальный результат
а0 > 0, a1 > 0 . • n = 2. Запишем дифференциальное уравнение 90
d 2y dy a0 ⋅ 2 + a1 ⋅ + a2 y = 0 , dt dt характеристическое уравнение
a0 λ2 + a0 λ + a1 = 0 и матрицу Гурвица
⎡a G=⎢ 1 ⎣a0
0⎤ . a2 ⎥⎦
Как и в предыдущем случае, при a0 > 0 применение критерия Гурвица даёт тривиальный результат:
a1 > 0, a2 > 0 . Отметим, что для систем первого и второго порядка необходимое условие устойчивости является и достаточным. • n = 3. Запишем характеристическое уравнение
a0 λ3 + a1λ2 + a2 λ + a3 = 0 и матрицу Гурвица
⎡ a1 G = ⎢a0 ⎢ ⎢⎣ 0
a3 a2 a1
0⎤ 0 ⎥. ⎥ a3 ⎥⎦
Для устойчивости системы по критерию Гурвица необходимо и достаточно, чтобы при a0 > 0 были положительны первый
Δ 1 = a1 > 0 , второй
Δ2 =
a1 a0
a3 = a1a2 − a0 a3 > 0 a2
и третий
a1 Δ 3 = a0 0
a3 a2 a1
0 0 = a3 Δ 2 > 0 a3 91
главные миноры матрицы Гурвица. С учётом необходимого условия устойчивости (требования положительности всех коэффициентов характеристического уравнения) критерий Гурвица для устойчивости системы третьего порядка требует выполнения неравенства
a1a2 − a0 a3 > 0 .
(2.9-19)
• n = 4. Запишем характеристическое уравнение
a0 λ4 + a1λ3 + a2 λ2 + a3 λ + a 4 = 0 и матрицу Гурвица
⎡ a1 ⎢a G=⎢ 0 ⎢0 ⎢ ⎣0
a3 a2 a1 a0
0 a4 a3 a2
0⎤ 0⎥ ⎥. 0⎥ ⎥ a4 ⎦
Для устойчивости системы по критерию Гурвица необходимо и достаточно, чтобы при a0 > 0 были положительны первый
Δ 1 = a1 > 0 , второй
Δ2 =
a1 a0
a3 = a1a2 − a0 a3 > 0 , a2
a3 a2 a1
0 a 4 = a3 (a1a2 − a0 a3 ) − a 4 a12 > 0 a3
третий
a1 Δ 3 = a0 0 и четвёртый
Δ 4 = a4 Δ 3 > 0 главные миноры матрицы Гурвица. С учётом необходимого условия устойчивости (требования положительности всех коэффициентов характеристического уравнения) критерий Гурвица для устойчивости системы четвёртого порядка требует выполнения неравенства
a3 (a1a2 − a0 a3 ) − a 4 a12 > 0 .
(2.9-20)
Для системы пятого порядка критерий Гурвица выливается в требование выполнения уже двух неравенств: 92
a1a2 − a0 a3 > 0 (a1a2 − a0 a3 )(a3 a4 − a2 a5 ) − (a1a4 − a0 a5 ) > 0 . 2
(2.9-21)
С дальнейшим увеличением порядка систем использование критерия Гурвица становится всё более громоздким и теряет смысл. Если возникает необходимость привлечения вычислительной техники, то в наше время стало проще непосредственное вычисление корней характеристического уравнения. Тем не менее, для систем третьего - четвёртого порядков привлекает простота использования критерия Гурвица. ПРИМЕР 2.9-1. Рассмотрим систему, представленную на рис. 2.40, с входным сигналом v , сигналом ошибки ε , и выходным сигналом y .
v
ε
k (Tp + 1)3
y
Рис 2.40 Структурная схема системы Этой системе соответствует передаточная функция
k k (Tp + 1) 3 Wvy ( p ) = . = 3 3 k T p + 3T 2 p 2 + 3Tp + 1 + k 1+ (Tp + 1) 3 В соответствии со свойствами передаточных функций характеристический полином замкнутой системы имеет вид
ϕ ( p ) = T 3 p 3 + 3T 2 p 2 + 3Tp + 1+ k . По критерию Гурвица система устойчива, если выполняется неравенство
a1a2 − a0 a3 = 9T 3 − T 3 (1 + k ) > 0 . Отсюда, с учётом требования положительности всех коэффициентов характеристического полинома, следует, что система устойчива, если при T > 0 выполняются неравенства
−1< k < 8. Значения параметров, при которых система находится на границе устойчивости, принято называть критическими. В данном примере у кон эффициента k имеется два критических значения - нижнее k кр = −1 и верхнее k кр = 8 . в
93
2.9.4. Частотный критерий устойчивости (критерий Найквиста) Часто рассмотрению подлежат замкнутые системы, структурные схемы которых могут быть приведены к типовому виду, представленному на рис. 2.41. Как правило, передаточная функция разомкнутой системы W (p ) имеет относительно простой вид и несложно определить расположение её полюсов относительно мнимой оси. Таким образом, предполагается, что анализ устойчивости разомкнутой системы проведён. В то же время, анализ устойчивости замкнутой системы представляет собой нетривиальную задачу. Критерий устойчивости Найквиста оперирует с частотными характеристиками, достаточно нагляден и позволяет использовать физические представления о свойствах исследуемой системы. Критерий Найквиста позволяет судить об устойчивости системы в замкнутом состоянии по частотным характеристикам разомкнутой системы. 2.9.4.1. Понятие логарифмического вычета Пусть задана некоторая функция Ψ(p ) , аналитичная всюду в области G , за исключением конечного числа изолированных особых точек. Будем полагать, что все особые точки являются полюсами. Будем полагать также, что граница C области G не содержит ни нулей, ни полюсов функции Ψ(p ) . Рассмотрим логарифмическую производную функции Ψ(p ) :
L ( p) =
′ d [ln Ψ( p)] = Ψ ( p) Ψ( p ) dp
(2.9-22)
и назовем логарифмическим вычетом функции Ψ(p ) в точке p = a вычет в этой точке ее логарифмической производной:
LnRes{Ψ(p), a} = Res {L ( p ), a} .
(2.9-23)
Пусть функция Ψ(p ) имеет в точке p = a ноль порядка k , то есть
Ψ( p ) = ( p − a ) k F ( p ) , где
F (a ) ≠ 0 . Тогда
Ψ ′( p ) = k ( p − a ) k −1 F ( p ) + ( p − a ) k F ′( p ) и
L ( p) =
k F ′( p ) + . p − a F ( p)
(2.9-24)
94
Отметим, что полюсы функций F (p ) и F ′(p ) совпадают. Так как нули аналитической функции изолированы, то в достаточно малом круге p − a < ρ функция F ′( p ) F ( p ) является аналитической и может быть разложена в окрестности точки p = a в ряд Тейлора:
F ′( p ) ∞ = ∑α n ( p − a)n . F ( p ) n =0 С учётом этого (2.9-24) превращается в
L ( p) =
∞ k + ∑α n ( p − a)n . p − a n =0
Эта формула представляет собой разложение в ряд Лорана функции L (p) в окрестности точки p = a . Из этой формулы следует, что точка p = a является полюсом первого порядка функции L (p) и
Res{L ( p ), a} = k .
(2.9-25)
Пусть теперь функция Ψ(p ) имеет в точке p = b полюс кратности s , то есть
Ψ( p ) = ( p − b ) − s J ( p ) , где b не является ни нулём, ни полюсом функции J (p ) . Тогда
Ψ ′( p ) = −s( p − b ) −( s +1) J ( p ) + ( p − b ) − s J ′( p ) и
L ( p) =
J ′( p ) −s + . p − b J ( p)
По аналогии с предыдущим случаем получим, что в окрестности точки
p=b
∞ −s L ( p) = + ∑ β n ( p − b)n , p − b n =0
следовательно,
Res{L ( p ), b} = −s .
(2.9-26)
Таким образом, в нулях и полюсах функции Ψ(p ) ее логарифмическая производная (2.9-22)
L ( p) =
Ψ ′( p ) Ψ( p ) 95
имеет полюсы первого порядка, причем в нуле функции Ψ(p ) логарифмический вычет равен порядку нуля, а в полюсе – взятом со знаком минус порядку полюса. По теореме вычетов имеем
1 Ψ ′( p ) ⎧ Ψ′( p ) , p ⎫ = k − s , dp = Res ∑v ∑ v ∑v v ⎨ v⎬ ∫ 2πj C Ψ( p ) ⎩ Ψ( p ) ⎭ v или окончательно
1 Ψ′( p ) dp = N − Π , ∫ 2πj C Ψ( p )
(2.9-27)
где N – число нулей, а Π –число полюсов функции Ψ(p ) в области G. 2.9.4.2. Принцип приращения аргумента Обозначим
Ψ( p ) = Ψ( p) e jϕ Ψ ( p ) ,
(2.9-28)
ln Ψ( p ) = ln Ψ( p ) + jϕ Ψ ( p ) .
(2.9-29)
тогда
С учётом (2.9-27), получаем:
1 Ψ ′( p ) 1 = dp ∫ ∫ d ( ln Ψ( p)) = 2πj C Ψ( p ) 2πj C 1 1 = d ln Ψ( p ) + djϕ Ψ ( p ) = N − Π. ∫ ∫ 2πj C 2πj C
(2.9-30)
Поскольку в правой части равенства стоит вещественное число, то мнимая часть левой части равенства также равна нулю. Таким образом, если функция Ψ(p ) аналитична в замкнутой области G , ограниченной контуром C , за исключением конечного числа полюсов в области G , и если функция Ψ(p ) не имеет ни полюсов, ни нулей на контуре C , то приращение аргумента функции Ψ(p ) при движении вектора p по замкнутому контуру C определяется выражением
Δϕ ΨC = 2π (N − Π ) .
(2.9-31)
2.9.4.3. Анализ устойчивости замкнутой системы Рассмотрим замкнутую систему с единичной обратной связью (рис. 2.41)
96
ε
v
y
W ( p)
Рис 2.41. Замкнутая система с единичной обратной связью Пусть известно, что среди n полюсов p1, p2 ,..., pn передаточной функции разомкнутой системы
W ( p) =
R( p ) Q( p )
(2.9-32)
имеется v 1 нулевых и v2 чисто мнимых полюсов на верхней полуплоскости плоскости комплексной переменной p (рис 2.42) , то есть + j
G +
C
C
Рис 2.42. Расположение нулей ( ) и полюсов ( ) передаточной функции разомкнутой системы
Q( p ) = p v1 ( p − jω q )v 2 Q1 ( p ) .
(2.9-33)
Образуем функцию
Ψ( p ) = 1 + W ( p ) =
Q( p ) + R ( p ) S ( p ) = , Q( p) Q( p )
(2.9-34)
характерную тем, что ее знаменатель является характеристическим полиномом разомкнутой системы, а числитель – характеристическим полиномом замкнутой. 97
Выберем в качестве области G всю правую полуплоскость плоскости комплексной переменной p . Контур C сформируем из мнимой оси, за исключением точек, совпадающих с полюсами передаточной функции разомкнутой системы, дуг окружностей бесконечно малого радиуса, охватывающих эти полюсы, как показано на рис. 2.42, и окружности бесконечно большого радиуса, охватывающей всю правую полуплоскость. Допустим, в общем случае, что разомкнутая система неустойчива, и её передаточная функция имеет m "неустойчивых" полюсов, то есть m полюсов в правой полуплоскости плоскости комплексной переменной p . Предположим, что замкнутая система также неустойчива, и z – число неустойчивых полюсов передаточной функции замкнутой системы. Тогда, в соответствии с принципом приращения аргумента
Δϕ Ψc = 2π ( z − m ).
(2.9-35)
Если обходить контур C в отрицательном направлении, совпадающим с положительным направлением мнимой оси, то
Δϕ Ψ−C = 2π (m − z ) .
(2.9-36)
Будем сопоставлять изменение комплексной переменной р при перемещении ее вдоль контура C на плоскости p и соответствующее ему изменение функции Ψ(p ) на комплексной плоскости Ψ . Для этого разобьем контур C на несколько характерных участков. На участке I годограф комплексной переменной p изменяется по окружности бесконечно большого радиуса, охватывая всю правую полуплоскость, то есть
pI = ρe jΘ ,
ρ → ∞.
(2.9-37)
Ранее отмечалось, что в физически реализуемых системах порядок числителя передаточной функции не может превышать порядок ее знаменателя. Отсюда следует, что степени полиномов S(p) и Q(p) равны, а значит
S( ρe jΘ ) Ψ| ( p) = lim = const . ρ →∞ Q( ρ e j Θ )
(2.9-38)
Таким образом, приращение фазы функции Ψ(p ) при изменении p вдоль первого участка равно нулю:
Δϕ ΨI = 0 .
(2.9-39)
В качестве участка II выберем мнимую ось плоскости p , то есть
pII = jω
(2.9-40) 98
за исключением тех ее точек, в которых располагаются полюсы разомкнутой системы. Соответствующая этому изменению p функция
Ψ|| ( p ) = Ψ( jω ),
−∞ 0 ошибка с течением времени неограниченно растёт. Таким образом, 111
порядок астатизма системы по отношению к какому-либо внешнему воздействию равен числу интегрирующих звеньев, включенных в обратную связь между координатой ошибки и этим воздействием. Системой с астатизмом l -го порядка по отношению к командному сигналу v называется система автоматического управления, вынужденная ошибка которой при отработке сигнала, выражаемого в виде полинома степени l по t
A0 + A1t + ... +
Al l t , l!
постоянна и пропорциональна величине Al , то есть старшей производной воздействия. При отработке сигнала, выражаемого полиномом меньшей степени, установившаяся ошибка в такой системе равна нулю. Изложенные выше рассуждения приводят к выводу, что с точки зрения стремления к уменьшению ошибки желательно иметь более высокий порядок астатизма и более высокое значение K рег . И то и другое, как правило, вступает в противоречие с требованиями устойчивости. Уже синтез устойчивой системы с астатизмом выше третьего порядка ставит перед разработчиком серьёзные проблемы. ПРИМЕР 2.10-1. Пусть дана система со структурной схемой представленной на рис.2.51. Система обладает астатизмом 1-го порядка, как по командному, так и по возмущающему воздействиям, так как система со−1 держит один интегратор с передаточной функцией p в регуляторе (корректирующем звене). Для данной системы: 1) если f = const и v = const , то ε уст = 0 ; f
v
_Kf__ Tf p+1
ε
K p(1+Tk p) (1+αTk p)p
_____K0_______ T02 p2+2ζ0 T0 p+1
y
Рис.2.51. Иллюстрация к примеру 2.10-1 2) если v = v 1 ⋅ t , v 1 = const , а f – константа или нулевая величина, то кинетическая ошибка
ε уст = ε (∞) =
v1 , K
где добротность 112
K = K p ⋅ Kоб ; 3) если f = f1 ⋅ t , f1 = const , а v - константа или нулевая величина, то
ε уст =
f1 ⋅ Kf ; Kp
4) если v = v 2 ⋅ t , v 2 = const , или f = f2 ⋅ t , f2 = const , то ошибка будет непрерывно нарастать. 2
2
2.10.3. Точность систем при отработке гармонических сигналов Каждый командный сигнал может быть разложен либо в дискретный (ряд Фурье для периодической функции времени), либо в непрерывный спектр гармоник (интегральное преобразование Фурье). Для того, чтобы воспроизвести командный сигнал с малыми искажениями, необходимо точно воспроизвести хотя бы существенные гармоники этого спектра. В интервале этих существенных частот амплитудно-частотная характеристика замкнутой системы (АЧХ) должна быть близка к единице, а фазочастотная (ФЧХ) - к нулю (рис. 2.52). При этом, естественно, полоса пропускания системы должна быть заведомо шире спектра командного сигнала. Для оценки величины ω в рассмотрим спектральную плотность сигнала (спектр мощности): 2
SV (ω) =V( jω)⋅V(−jω) = V(iω) .
(2.10-25)
Ф {v (t )} = V ( jω )
Wvy ( jω )
1
ωB
ω
Рис. 2.52. Спектральная характеристика командного сигнала Ф {v (t } и АЧХ системы Wvy (ω ) Полная энергия сигнала определяется выражением ∞
Е V = ∫ S (ω )d ω .
(2.10-26)
0
113
Величину ω В целесообразно выбрать так, чтобы площадь под кривой S(ω ) на интервале частот [0,ω В ] составляла не менее 90% от площади под этой кривой во всём диапазоне частот от нуля до бесконечности (рис. 2.53).
Sν (ω )
ωв ω Рис. 2.53. К обоснованию выбора величины ω В Применительно к структурной схеме, приведённой на рис. 2.41, для которой частотная функция от командного сигнала к ошибке имеет вид
Wvε ( jω ) =
1 , 1 + W ( jω )
(2.10-27)
этим требованиям соответствует неравенство
1 > 1. Поэтому неравенство (2.10-28) будет всегда выполняться, если 1 < Δ. − 1 + W ( jω )
(2.10-29)
Отсюда следует
W >
1+ Δ 1 ≈ . Δ Δ
(2.10-30)
Таким образом, для точного воспроизведения командного сигнала требуется, чтобы в спектре частот от 0 до ω В выполнялось условие
W >
1 . Δ
(2.10-31) 114
Обычно принимают: Δ = 0.05 ÷ 0.1 . Применительно к ЛАЧХ неравенство (2.10-31) превращается в требование того, чтобы в диапазоне 0 ≤ ω < ω В выполнялось условие
W ( jω ) дБ > (26 ÷ 20 )дБ .
(2.10-32)
2.10.4. Связь между логарифмическими амплитудно-частотными характеристиками и качеством переходных процессов в САУ Между частотными и временными характеристиками систем существует однозначная взаимозависимость. Особенно много внимания уделялось этому вопросу в те времена, когда вычислительная техника была недоступна рядовому инженеру, и он должен был судить о свойствах разрабатываемых систем, пользуясь только косвенными оценками. Часть таких методик косвенных оценок качества по частотным характеристикам представляет интерес и в настоящее время. На эту тему имеется обширная учебная литература. В настоящем пособии затрагивается один фрагмент из этих методик, который позволяет достаточно просто связать качество временных процессов в замкнутых системах с видом амплитудно-частотных логарифмических характеристик соответствующих разомкнутых систем. Здесь следует отметить, что дальнейшее содержание параграфа относится лишь к так называемым неминимальнофазовым системам, то есть к таким, передаточные функции которых не содержат ни нулей, ни полюсов с положительной вещественной частью. Весь диапазон частот при рассмотрении ЛАЧХ (рис. 2.54) разбивают на три поддиапазона: 1) Область низких частот [0 ≤ ω < ω н ]. Этот диапазон определяет в значительной мере точность воспроизведения "медленно" меняющихся воздействий. В этом диапазоне в соответствии с результатами, полученными в предыдущем разделе, должно быть выполнено условие:
⎛ 1 ⎞ ⎧⎪26дБ , если Δ = 0.05 ; L(ω ) ≥ 20 lg⎜ ⎟ = ⎨ ⎝ Δ ⎠ ⎪⎩34дБ , если Δ = 0.02 .
(2.10-33)
Кроме того, вид ЛАЧХ в этой области указывает на порядок астатизма и статическую или кинетическую точность системы. Наклон низкочастотной асимптоты равен − 20 ⋅ ν дБ/дек., где ν - порядок астатизма. Ширина интервала [0, ω н ] позволяет найти ширину спектра частот управляющих воздействий, воспроизводимых системой без каких-либо значительных искажений и позволяет судить о том, какие воздействия для рассматриваемой системы можно считать медленно изменяющимися.
115
2) Диапазон средних частот [ω н , ω к ] – определяет запасы устойчивости и качество системы при воздействии типа ступенчатой функции. В этом интервале находится частота среза ω с , позволяющая оценить время регулирования:
t р ≈ (3 ÷ 4 )
π . ωс
(2.10-34)
Частота среза ω с примерно равна собственной частоте замкнутой системы (частоте, где у замкнутой системы может быть некоторый резонанс).
W ( jω ) дБ 2
1
3
-20дБ/дек
ωн
ωк
ωс
ω
Рис. 2.54. Типовая ЛАЧХ Для удовлетворительного качества переходных процессов необходимо, чтобы ЛАЧХ на этом интервале имела наклон -20дБ/дек, а длина этого интервала примерно равнялась 1дек. На этом интервале определяются запасы устойчивости системы. Рекомендуемые значения этих запасов составляют примерно 10дБ по модулю и 350 - 400 по фазе. 3) Интервал высоких частот
ω > ω c . Этот интервал примерно соответст-
вует W ( jω ) дБ ≤ −16 дБ. На этот интервал приходятся сопрягающие частоты, пренебрежение которыми не оказывает существенного влияния на качество переходных процессов. ПРИМЕР 2.10-2. Дана система с передаточной функцией 2
k 1 + T1p ⎞ W ( p ) = 3 ⎛⎜ ⎟ . p ⎝ 1 + T2 p ⎠ 116
Это система с астатизмом третьего порядка. На рис.2.55 представлена её логарифмическая амплитудно-частотная характеристика. Цифрами 1, 2, 3 обозначены соответственно области низких, средних и высоких частот.
L
1
2
3
-60 дБ/дек
mзум ωн
ϕ
-20 дБ/дек
1/Т1
mзув
ω ср
ω 1/Т2 -60 дБ/дек
0
0
0
-90 0
ϕз
-180
ω
0
-270
Рис. 2.55. Иллюстрация к примеру 2.10-2
2.10.5. Соотношение масштабов во временной и частотной областях 1. Если функция f (t ) преобразуема по Фурье, F ( jω ) = Ф{f (t )} ее преобразование по Фурье и a - положительное вещественное число, то справедливо равенство
⎧ ⎛ t ⎞⎫ Ф ⎨ f ⎜ ⎟ ⎬ = aF ( j ω ) . ⎩ ⎝ a ⎠⎭
(2.10-35)
. Докажем, это. Прямое преобразование Фурье выражается формулой
F ( jω ) =
∞
∫0 f ( t ) ⋅ e
− jω t
dt
Введем новые переменные t = t ⋅ a,
1 F ( jω a ) = a
(2.10-36)
ω=
ω a
. Тогда
⎛ t ⎞ − ja ω ⎛⎜⎝ at ⎞⎟⎠ dt , ∫0 f ⎜ a ⎟ e ⎝ ⎠
∞
117
откуда
aF ( j ω a ) =
⎛ t ⎞ − ja ω ⎛⎜⎝ at ⎞⎟⎠ f dt ∫0 ⎜ a ⎟ e ⎝ ⎠
∞
и равенство (2.10-35) доказано. Таким образом, при растяжении (сжатии) в "а" раз графика функции f (t ) вдоль оси времени, график модуля спектральной характеристики F ( jω ) , во-первых, сжимается (растягивается) вдоль оси частот в "а" раз и, во-вторых, увеличиваются (уменьшаются) в "а" раз его значения. Известно, что чем короче импульс, тем шире его спектр. 2. Изображение по Фурье от переходной функции h(t ) системы с передаточной функцией W (p ) имеет вид
H ( jω ) =
W ( jω ) , jω
(2.10-37)
поэтому сама функция h(t ) может быть определена с помощью обратного преобразования Фурье:
1 +∞W ( jω ) jωt h(t ) = ⋅∫ e dω . 2π −∞ jω
(2.10-38)
По аналогии с пунктом 1 введем новые переменные
t =t ⋅a , ω =
ω a
,
и, подставив их в (2.10-38), получим:
1 +∞ W ( ja ω ) jωt ⎛ t ⎞ 1 +∞ W ( ja ω ) jaω at h⎜ ⎟ = ⋅∫ e da ω = 2π ⋅ ∫ jω e dω . ⎝ a ⎠ 2π − ∞ ja ω −∞ (2.10-39) Таким образом, если частотная характеристика системы, получается путем сжатия (или растяжения) вдоль оси частот частотной характеристики некоторой исходной системы (рис. 2.56), то ее переходная функция соответственно растягивается (или сжимается) вдоль оси времени.
118
t W1
W2
W3
ω Рис. 2.56. Связь между изменением полосы пропускания системы и длительностью её переходной функции
119
2.11. Интегральные критерии качества с позиций общности задач оптимального и модального синтеза При рассмотрении качества систем управления большое место занимает группа интегральных критериев качества. Они достаточно полно изложены в обширной литературе по теории автоматического регулирования и управления. Это – интегралы от координат вектора состояния, вектора управления, ошибки регулирования. Интегральные показатели, или критерии качества непосредственно выходят на синтез оптимального управления. При этом под оптимальностью понимается минимум какого-либо интегрального критерия. Наиболее простой из них – это интеграл от квадрата ошибки отработки командного сигнала на бесконечном интервале времени ∞
J 0 = ∫ ε 2 (t )dt .
(2.11-1)
t =0
Однако, как показала практика, стремление к минимизации такого критерия приводит к чрезмерной колебательности переходных процессов. В связи с этим стали усложнять функционал. Так например, кроме квадрата ошибки с целью уменьшения выбросов в переходных процессах в функционал стали вводить квадрат от её производной ∞
J1 = ∫ (c 0ε 2 (t ) + c1ε& 2 (t ))dt .
(2.11-2)
t =0
Кроме этого, оказалось полезным учитывать величину управляющего воздействия: ∞
J 2 = ∫ (c0ε 2 (t ) + c1ε& 2 (t ) + cU u 2 (t ))dt .
(2.11-3)
t =0
Различные исполнения системы в некоторых случаях стало удобным сравнивать по величине соответствующих интегральных показателей. Такой анализ неизбежно стал перерастать в синтез оптимального управления с различными интегральными критериями. В одной из наиболее общих форм интегральные критерии, используемые оптимальном синтезе, записывают в виде:
r r r r r r J = ∫ ( x T (t )QX x (t ) + 2 x T (t )QXU u (t ) + u T (t )QU u(t ))dt . ∞
(2.11-4)
0
Возникло целое направление в теории оптимальных систем – аналитическое конструирование регуляторов (АКР). Был разработан специальный математический аппарат, обеспечивающий расчёт управления, которое минимизирует функционал вида (2.11-4). Однако, возникла очередная проблема, - проблема выбора значений элементов матриц Q X , Q XU , QU в соответствующих квадратичных 120
формах. Эту задачу в общем виде формализовать не удалось до сих пор. В то же время, при проектировании систем выявилась важная закономерность: эталонные процессы, к которым притягивается движение в системе, должны соответствовать структуре управляемого объекта. Это означает, что уравнения эталонной системы, отображённой на рис. 2.46, должны иметь такой же вид, как и уравнения объекта. Поэтому в качестве эталонной системы можно выбрать систему того же порядка, что и объект, но с собственными числами, а значит, и с характеристическим полиномом, отвечающими требованиям, предъявляемым к замкнутой системе. Рассмотрим способ формирования ошибки ε E , характеризующей отклонение некоторой конкретной системы от эталонной. Пусть эталонная система n однородных дифференциальных уравнений первого порядка приведена к одному дифференциальному уравнению n -го порядка:
xЭ( n ) + γ 1x Э( n −1) + ... + γ n −1xЭ(1) + γ n x Э = 0 .
(2.11-5)
В левую часть равенства (2.11-5) вместо координаты xЭ подставим одну из координат вектора состояния объекта. Скорее всего, при этом равенство нулю нарушится. Получаем уравнение невязки: (n ) ( n −1) (1) xОб + γ 1xОб + ... + γ n −1xОб + γ n xОб = ε E .
(2.11-6)
Переменная ε E характеризует отклонение процессов объекта от эталонных. Она равна нулю на интервале времени t = [0, ∞ ) только лишь в том случае, когда процессы в объекте или в проектируемой системе полностью тождественны процессам в эталонной системе. Учтём уравнение объекта
r r r x& (t ) = Ax(t ) + Bu(t )
(2.11-7)
и приведём уравнение (2.11-6) к такому r виду, чтобы rв него входили только координаты векторов состояния x и управления u :
q x 1x1(t ) + q x 2 x 2 (t ) + ... + q xn x n (t ) + qu 1u1(t ) + qu 2u2 (t ) + ... + qunu unu (t ) = ε E (t ).
(2.11-8)
Это уравнение, используя очевидные обозначения, можно записать иначе:
r r r r q Tx x (t ) + quT u (t ) = ε E (t ) .
(2.11-9)
В соответствии с введённой текущей ошибкой ε E (t ) может быть использован интегральный критерий качества (функционал) ∞
J = ∫ ε E2 (t )dt .
(2.11-10)
0
121
Квадрат ошибки можно записать с помощью квадратичных форм:
r r T r r rT r r T T q q x t x t x t q ( ) ( ) ( ) ⎤ ⎡ q ⎡ ⎤ ⎡ ⎤⎡ ⎤ ⎡ ⎤ ⎡ ε E2 = ⎢ r ⎥ ⎢ r x ⎥ ⎢ r x ⎥ ⎢ r ⎥ = ⎢ r ⎥ ⎢ r x r Tx ⎣u (t )⎦ ⎣q u ⎦ ⎣q u ⎦ ⎣u(t )⎦ ⎣u(t )⎦ ⎣q u q x
r r r q x q uT ⎤ ⎡ x(t )⎤ , r r r q u q uT ⎥⎦ ⎢⎣u(t )⎥⎦
(2.11-11) где
⎡ q x1 ⎤ ⎢q ⎥ r qx = ⎢ x2 ⎥ ; ⎢L⎥ ⎢q ⎥ ⎣ xn ⎦
⎡ q u1 ⎤ ⎢q ⎥ r u2 ⎥. qu = ⎢ ⎢L⎥ ⎢q ⎥ ⎣ u nu ⎦
(2.11-12)
Обозначив
r r r r r r Q X = q Tx q x ; QU = q uT q u ; Q XU = quT qu ,
(2.11-13)
в итоге получаем критерий (2.11-4). В связи с тем, что порядки уравнений объекта и эталонной системы совпадают, в результате оптимального синтеза удастся найти оптимальное управление, при котором минимум функционала окажется равным нулю. Так как при этом для процессов в системе с оптимальным управлением окажется выполнимым равенство (2.11-6) при ε E = 0 , то полученная система будет иметь характеристический полином
ϕ C (λ ) = ϕ Э (λ ) = λn + γ 1λn −1 + ... + γ n −1λ + γ n
(2.11-14)
и, следовательно, собственные числа синтезированной системы совпадут с собственными числами эталона. Таким образом, результаты АКР при таком подходе обеспечивают не только минимум критерия (2.11-4), равный нулю, но и позволяет получить систему с желаемыми собственными числами. Поскольку связь переходных процессов с собственными числами (модами) системы более очевидна и непосредственна, модальный синтез часто оказывается предпочтительнее метода АКР, тем более, что алгоритм модального синтеза существенно проще алгоритмов АКР. ПРИМЕР 1. Для иллюстрации изложенного рассмотрим объект, представленный на рис. 2.9. Уравнения объекта имеют вид:
x& 1 (t ) = x 2 (t ); x& 2 (t ) = −2 x 2 (t ) + x 3 (t );
(2.11-15)
x& 3 (t ) = − x 3 (t ) + u(t ) .
122
Пусть эталонная система (эталонный процесс) определяется уравнением
x Э( 3 ) (t ) + γ 1 x Э( 2 ) (t ) + γ 2 x Э(1) + γ 3 x Э (t ) = γ 3v (t ) ,
(2.11-16)
соответствующим желаемым собственным числам. Из этого уравнения видно, что при постоянном командном сигнале v = v 0 = const в статике
lim( x Э (t )) = x Э уст = v 0 . t →∞
(2.11-17)
Подставив в левую часть равенства (2.11-16) координату объекта x1 (t ) и получим уравнение невязки:
ε E (t ) = x1( 3 ) (t ) + γ 1 x1( 2 ) (t ) + γ 2 x1(1) (t ) + γ 3 x1 (t ) .
(2.11-18)
Заменим производные от координаты x1 на координаты вектора состояния объекта с учётом уравнений (2.11-15):
x1(1) = x 2 ; x1( 2 ) = x 2(1) = −2 x1 + x 3 ;
(2.11-19)
x1( 3 ) = −2 x 2(1) + x 3(1) = 4 x 2 − 3 x 3 + u . В результате уравнение невязки принимает вид
ε E (t ) = γ 3 x1 (t ) + ( 4 − 2γ 1 + γ 2 )x 2 (t ) + (γ 1 − 3)x 3 (t ) + u(t ) ,
(2.11-20)
откуда получаем:
γ3 ⎡ ⎤ r q x = ⎢4 − 2γ 1 + γ 2 ⎥ ; ⎢ ⎥ ⎢⎣ γ 1 − 3 ⎥⎦
q u = 1.
(2.11-21)
Теперь в соответствии с (2.11-13) могут быть вычислены матрицы Q X , QU , Q XU и получен функционал (2.11-4) для использования при решении задачи АКР. В то же время, приравняв нулю ε E (t ) в (2.11-20), можно непосредственно получить выражение для формирования управления u(t ) через координаты вектора состояния объекта. Более того, если потребовать выполнения равенства
x1( 3 ) (t ) + γ 1x1( 2 ) (t ) + γ 2 x1(1) (t ) + γ 3 x1(t ) = γ 3v (t ) ,
(2.11-22)
то с учётом (2.11-20) получим систему с обратной связью по вектору состояния и управлением
r u(t ) = Lx (t ) + k v v (t ) ,
(2.11-23) 123
где фигурируют матрица обратной связи
L = [− γ 3
− 4 + 2γ 1 − γ 2
3 − γ 1]
(2.11-24)
и передаточный коэффициент по командному сигналу
kv = γ 3.
(2.11-25)
Таким образом, без решения задачи АКР получено оптимальное управление, обеспечивающее процессы в замкнутой системе, имеющей собственные числа, соответствующие характеристическому полиному эталонной системы (2.11-14). Кроме того, в полученной системе обеспечена единичная статика по командному сигналу v (2.11-17). В этом примере проиллюстрирована идентичность задачи АКР с надлежащим образом выбранным критерием оптимальности задаче модального синтеза. В следующих разделах будет подробно изложена методика модального синтеза.
124
3. Синтез линейных непрерывных систем 3.1. Выбор корректирующих звеньев. Метод желаемых ЛЧХ Как уже отмечалось, существует связь между частотными характеристиками системы, как в замкнутом, так и в разомкнутом состоянии, и протекающими в ней переходными процессами. На протяжении многих лет инженерами накоплен большой опыт по синтезу систем автоматического управления на базе формирования эталонных, желаемых частотных характеристик соответствующих разомкнутых систем. В литературе имеются обширные таблицы таких эталонных логарифмических амплитудно-частотных характеристик для большого числа типовых передаточных функций объектов управления. В настоящем пособии излагается лишь основная идея такого подхода. Рассматривается одноконтурная система (рис. 3.1). Разомкнутый контур состоит из последовательно включённых неизменяемой части системы (в неё входят объект, привод, датчики, преобразующие и согласующие устройства) с передаточной функцией W 0 ( p ) и корректирующее звено с передаточной функцией W k (p ) .
v
y Wk ( p )
W0 ( p )
Рис. 3.1. Исходная структурная схема Предполагается, что заданы требования к основным показателям качества, обсуждавшимся в п.2.10.1. В соответствии с этим по упомянутым таблицам, или на основе подхода, изложенного в п.2.10.4, строится асимптотическая логарифмическая амплитудно-частотная характеристика (ЛАЧХ) L жел (ω ) разомкнутой системы, удовлетворяющая указанным требованиям. На этом же рисунке строится асимптотическая ЛАЧХ неизменяемой части системы
L0 (ω ) = W0 ( jω ) дБ .
(3.1-1)
Потребуем, чтобы комплексный передаточный коэффициент разомкнутой системы был равен функции, определяемой желаемой ЛАЧХ, то есть
W жел ( jω ) = W k ( jω ) W 0 ( jω )
(3.1-2) 125
или
L жел (ω ) = Lk (ω ) + L0 (ω ) .
(3.1-3)
В соответствии с этим простой операцией графического вычитания легко получить асимптотическую ЛАЧХ корректирующего звена
Lk (ω ) = L жел (ω ) − L0 (ω ) .
(3.1-4)
По ней уже нетрудно восстановить передаточную функцию W k (p ) . ПРИМЕР 3.1-1. Передаточная функция неизменяемой части системы
W
0
( p) =
1 . p ( p + 1)( 0 .1p + 1)
Требования к системе. 1) При отработке командных сигналов, меняющихся со скоростью до 10ед/с, ошибка не должна превосходить 0.1 ед.. 2) Время регулирования t р ≈ 1с. 3) Ошибка воспроизведения гармонических сигналов с амплитудой Av на частотах до 1рад/c должна быть не более 0.05 Av . Последовательность расчёта. 1. Построить асимптотическую ЛАЧХ неизменяемой части системы L0 (ω ) (рис. 3.2).
2. Построить желаемую ЛАЧХ L жел (ω ) . В связи с тем, что согласно п.1 требований к системе при линейно изменяющемся во времени командном сигнале допустима постоянная ошибка, система должна иметь астатизм первого порядка. Поэтому низкочастотная асимптота должна идти с наклоном -20 дБ/дек. В соответствии с (2.10-22) добротность системы
K=
10 [ ед / c ] v1 = = 100 −1c . ε (∞ ) 0.1[ ед ]
Следовательно, низкочастотная асимптота должна пересекать ось частот при ω = 100 рад/с. Частота среза определяется с учётом требуемого времени регулирования из (2.10-34):
ωc =
(3 ÷ 4)π ≈ 10 рад / c . tр
Таким образом, среднечастотный участок желаемой ЛАЧХ на этой частоте пересекает ось абсцисс, имеет наклон -20 дБ/дек имеет протяжённость, равную одной декаде, то есть занимает интервал 126
3.16 ≤ ω ≤ 31.6 . Диапазон частот ω > 31.6 считаем высокочастотным. Наклон высокочастотной асимптоты выбираем равным -60 дБ/дек, - таким же, как наклон высокочастотной асимптоты неизменяемой части системы. Для того, чтобы упростить реализацию корректирующего звена, низкочастотную и среднечастотные асимптоты соединяем отрезком прямой с наклоном -40 дБ/дек. При этом следует учесть требование по точности воспроизведения гармонического сигнала: в соответствии с (2.10-33) на частоте 1 рад/c желаемая ЛАЧХ должна пройти выше уровня 26 дБ.
L[ дБ ] 60
Lk -20 дБ/дек +40 дБ/дек
40
Lk
20 -20 дБ/дек 26 дБ
0.1
0.33
1
L жел
ω 10
3.16
31.6
100
-20 -40 дБ/дек
L0
-40 -60 дБ/дек -60
Рис. 3.2. Иллюстрация к методу желаемых ЛЧХ
3. Построить ЛАЧХ корректирующего звена, производя графическое вычитание отрезков прямых в соответствии с (3.1-4). 127
4. Замерить значения сопрягающих частот асимптотической ЛАЧХ корректирующего звена и записать соответствующее выражение для передаточной функции
Wk ( p) =
1 1 p + 1)( p + 1) 3.16 10 . 1 1 2 p + 1)( p + 1) ( 31.6 0.33
100( p + 1)(
3.2. Управляемость линейных стационарных систем Непрерывная линейная система
r r r x& ( t ) = A x ( t ) + B u ( t )
(3.2-1)
является полностью управляемой тогда и только тогда, когда она может r быть переведена из любого начального состояния x (t 0 ) в произвольный
r
момент времени t 0 в любое конечное состояние x (t1 ) за конечное время
t1 − t 0 .
r
Примем начальные условия нулевыми: x (t 0 ) = 0 . Тогда, в соответствии с формулой Коши t1 r r A ( t −τ ) x ( t 1 ) = ∫ e 1 B u (τ )d τ .
(3.2-2)
t0
Принимая во внимание выражение для матричной экспоненты в виде бесконечного ряда
e
A ( t1 −τ )
A(t 1 − τ ) A 2 (t 1 − τ ) 2 =E+ + + ... , 1! 2!
(3.2-3)
равенство (3.2-2) можно записать в виде t 1( t − τ )2 r t1 r t1 r r 2 x(t1 ) = B ∫ u(τ )dτ + AB ∫ ( t1 − τ )u(t )dτ + A B ∫ 1 u(τ )dτ + ... 2 ! t0 t0 t0
Обозначим:
⎡ α i1 ⎤ 2 ⎢α ⎥ t1 r ( t1 − τ ) r i2 ⎥. αi = ∫ u (τ )d τ = ⎢ i! t0 ⎢ ... ⎥ ⎢α ⎥ ⎣ i , ni ⎦
(3.2-4)
128
r
Представим произведения A B в виде блочных матриц векторов i
β: r r r ⎤ ⎡ A B = ⎢ β i1 β i 2 ...β i n ⎥ . ⎣ ⎦ i
(3.2-5)
Тогда t1
A B∫ i
t0
(t
1
i r −τ ) r u (τ )dτ = β i1 i!
[
r
β i2
r
]
... β i nu =
r
nu
∑ α iν β iν
(3.2-6)
ν =1
и
r x (t 1 ) =
∞
r
nu
∑ ν∑ α ν ⋅ β ν . i =0
=1
i
(3.2-7)
i
r
В результате вектор x (t1 ) может рассматриваться как линейная комбинация векторов
r
β iν , являющихся вектор-столбцами матриц
r B, AB, A2B, A3B, ... . Иначе говоря, конечное состояние x (t1 ) принад-
лежит линейному подпространству, порождаемому вектор-столбцами 2 3 бесконечной последовательностью матриц B, AB, A B, A B, ... . В этой последовательности должна появиться матрица A B , все вектор-столбцы которой линейно зависят от вектор-столбцов предыду2 l −1 щих матриц B, AB, A B, ..., A B. Такая матрица обязательно должна иметь место, так как в линейном n-мерном пространстве не может быть более чем n линейно–независимых векторов. Отсюда же следует, что l ≤ n. Таким образом, можно записать l
A l B = BΛ 0 + AB Λ 1 + ... + A l −1BΛ l −1 ,
(3.2-8)
где Λ i - соответствующие диагональные матричные коэффициенты
⎡λ i 1 0 ⋅ ⋅ ⋅ 0 ⎤ ⎢0 λ ⋅⋅⋅ 0 ⎥ i2 ⎥. Λi = ⎢ ⎢⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⎥ ⎢ ⎥ 0 0 λ ⋅ ⋅ ⋅ ⎣ in ⎦
(3.2-9)
l +1
Очевидно, тем же свойством обладает и матрица A B , так как
A l +1B = AA l = ABΛ 0 + A 2 BΛ 1 + ... + A l −1BΛ l − 2 + A l BΛ l −1 .
(3.2-10)
По индукции можно утверждать то же самое и для всех A B при k ≥ l . k
129
r
Итак, конечное состояние x (t 1 ) принадлежит линейному подпространству, порождаемому вектор-столбцами матриц
B, AB, A 2 B, ... , A n −1B (здесь учтено, что l ≤ n ). Если эти вектор-столбцы не порождают n мерное пространство, то в такой системе можно достичь лишь тех состояний, которые принадлежат подпространству меньшей размерности. Таким образом, критерий управляемости формулируется следующим образом:
r
r
r
Система x& (t ) = Ax (t ) + Bu (t ) полностью управляема тогда и только тогда, когда ранг матрицы управляемости
U = [B AB A2B L An−1B]
(3.2-11)
равен n , то есть полной размерности линейного пространства. При этом говорят, что пара матриц {A, B} полностью управляема. ПРИМЕР 3.2-1. Определить управляемость системы
x&1 = −4x1 + 5x2 − 5U ; x& 2 = 3x1 − 2x2 + 3U ; y = x1 . Для этой системы
⎡− 5⎤ ⎡− 4 5⎤ , A= ⎢ B = ⎢ 3⎥ ⎥ ⎣ ⎦ ⎣ 3 − 2⎦ и матрица управляемости
35⎤ ⎡ −5 U = [A AB ] = ⎢ ⎥. 3 21 − ⎣ ⎦ Определитель этой матрицы равен нулю, она имеет ранг меньше двух, то есть порядка системы, и система является неуправляемой. Отметим, что собственные числа матрицы динамики системы
λ1 = +1;
λ2 = −7 ,
то есть система неустойчива. В тоже время передаточная функция по выходной координате
Wuy ( p ) = −
5 , p+7
130
у неё только один, устойчивый полюс и по ней не видно, что в действительности система неустойчива. Матричная передаточная функция по вектору состояния
5 ⎤ ⎡ − ⎢ p + 7⎥ Wux ( p ) = ⎢ ⎥. 3 ⎥ ⎢ ⎢⎣ p + 7 ⎥⎦ Ей соответствует решение дифференциального уравнения системы
r r ⎡− 5⎤ t −7 ( t −τ ) At x (t ) = e x ( 0 ) + ⎢ ⎥ ⋅ ∫ e u(τ )dτ . 3 0 ⎣ ⎦ Как видно, в вынужденной составляющей решения отсутствует одна неустойчивая - мода. Кроме того, независимо от управляющего сигнала для координат вынужденной составляющей вектора состояния существует линейная связь
x 2В (t ) = −0.6 x1В (t ) . ПРИМЕР 3.2-2. Определить управляемость системы
x&1 = −4x1 + 5x2 − 10U ; x& 2 = 3x1 − 2x2 + 3U ; y = x1 . Для этой системы
⎡− 10⎤ ⎡− 4 5⎤ , A=⎢ B = ⎢ ⎥ ⎥ ⎣ 3⎦ ⎣ 3 − 2⎦ и матрица управляемости
25⎤ ⎡ − 10 U = [A AB ] = ⎢ ⎥. ⎣ 3 − 36⎦ Определитель этой матрицы не равен нулю, она имеет ранг, равный двум, то есть порядку системы, и система является полностью управляемой. Отметим, что в данном случае полюсы передаточной функции
Wuy ( p ) = −
10( p + 1) ( p − 1)( p + 7)
полностью повторяют все собственные числа матрицы A . 131
3.3. Наблюдаемость линейных стационарных систем. В теории автоматического управления большую роль играет задача восстановления вектора состояния по результатам наблюдения за входом и выходом объекта. Непрерывная система
v v v x& (t ) = Ax (t ) + Bu(t ) v v y (t ) = Cx(t )
(3.3-1)
v
называется наблюдаемой, если вектор состояния x (t 0 ) можно опреде-
r
лить, зная y (t ) на некотором интервале времени t = [t 0 , t1 ] . Если это справедливо для любого t 0 , то система называется полностью наблюдаемой. Задачей настоящего параграфа является вывод критерия наблюдаемости. r Достаточно рассмотреть задачу при u(t ) = 0 . Тогда
r r y (t ) = Ce At x (0 ) .
(3.3-2)
В развёрнутом виде - это система алгебраических уравнений
C11 x 1 + C12 x 2 + ... + C1n x n = y 1 (t 1 ) C 21 x1 + C 22 x 2 + ... + C 2 n x n = y 1 (t 1 ) ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
,
(3.3-3)
C ny x 1 + ... + C ny ,n x n = y ny (t n ) в качестве неизвестных в которой выступают координаты вектора состояния. В связи с тем, что, как правило, n y < n , число уравнений оказывается меньше числа неизвестных, и решение невозможно. В соответствии с теоремой Кэли-Гамильтона каждая квадратная матрица удовлетворяет собственному характеристическому уравнению:
An + α1An−1 + ... + α n−1A + α n E = 0 .
(3.3-5)
Поэтому матричная экспонента, являющаяся степенным рядом относительно матрицы A , может быть представлена в виде полинома степени n − 1. С учетом этого равенство (3.3-2) можно записать в виде: 132
n −1 r r y (t ) = ∑ γ l (t ) ⋅ C ⋅ A l x ( 0 ) ,
(3.3-5)
l =0
где γ l (t ) – соответствующие коэффициенты этого полинома. Для i-й составляющей вектора выхода соответственно будем иметь n −1 v v y i (t ) = ∑ γ l (t )(CA l ) i x (0) .
(3.3-6)
l =0
Здесь (CA ) i – i -я строка матрицы (CA ) . l
l
Если набор (CA ) i для i = 1,2,..., n y ; l = 0,1,2,..., n − 1 не содержит полного базиса, то есть n линейно независимых строк, иначе говоря, если матрица l
⎡ C ⎤ ⎢ CA ⎥ ⎢ ⎥ N = ⎢ CA 2 ⎥ ⎢ ... ⎥ ⎢ n −1 ⎥ ⎣CA ⎦
(3.3-7)
имеет ранг, меньший, чем n , то в качестве ненулевого вектора начальr ных условий x (0 ) ≠ 0 может быть выбран вектор, ортогональный всем строкам матрицы N. Тогда в соответствии с (3.3-5) получим, что r y ( t ) = 0 для всех t , т.е. система не наблюдаема.
r
Теперь докажем, что если ранг матрицы N равен n , то x(t 0 ) может быть определен с помощью конечного числа измерений вектора выхода v y (t ) . Обозначим
Γ(t k ) = [γ 0 (t k )E γ 1(t k )E ... γ n−1(t k )E ] ,
(3.3-8)
где Е – квадратная единичная матрица размером [n y × n y ] . Моменты измерения t k выберем таким образом, чтобы для различных значений k элементы γ i (t k ) отличались друг от друга. С учетом введенного обозначения равенство (3.3-5) примет вид
r r y ( t k ) = Γ ( t k )N x ( 0 ) .
(3.3-9)
Известно, что ранг произведения любых двух матриц не превосходит ранга каждого из сомножителей. Ранг матрицы Γ ( t k ) не превосходит числа ее строк n y < n . Проводя многократные измерения на интервале времени переходного процесса системы, построим расширенный вектор выхода 133
r y ⎡ ( t1 ) ⎤ ⎢ yr ( t ) ⎥ r YR = ⎢ 2 ⎥ ⎢ ... ⎥ ⎥ ⎢r ⎣ y ( t n )⎦
(3.3-10)
⎡ Γ( t 1 ) ⎤ ΓR = ⎢ ... ⎥ . ⎢ ⎥ ⎣Γ( t n ) ⎦
(3.3-11)
и обозначим
Матрица Γ имеет n y × n строк. Моменты измерений должны быть выбраны таким образом, чтобы выполнялось условие rank ΓR = n . Как было обусловлено, ранг матрицы N также равен n . Поэтому уравнение
r r ΓR ⋅ N ⋅ x ( 0 ) = Y R
(3.3-13)
содержит n линейно независимых скалярныхv уравнений, то есть оно может быть разрешено относительно вектора x(0) . Таким образом, доказан следующий критерий полной наблюдаемости стационарных линейных систем: Линейная стационарная система вполне наблюдаема тогда и только тогда, когда ранг матрицы наблюдаемости N равен n . ПРИМЕР 3.3-1. . Объект управления задан уравнениями
x&1 = −8 x1 + 3 x 2 + 3u ; x& 2 = − x1 − 4 x 2 + 2u ; y = x1 − 2 x 2 . Этим уравнениям соответствуют матрицы
3⎤ ⎡− 8 ⎡3⎤ A=⎢ B = ; ⎥ ⎢2⎥; C = [1 − 2]. − − 1 4 ⎣ ⎦ ⎣ ⎦ Определитель матрицы управляемости
⎡ U=⎢ ⎣
3 − 15⎤ 2 3⎥⎦
не равен нулю, поэтому система управляема. Матрица наблюдаемости
134
⎡ C ⎤ ⎡ 1 − 2⎤ N=⎢ ⎥=⎢ ⎥ ⎣CA⎦ ⎣− 6 − 5⎦ Её определитель также отличен от нуля, следовательно, система полностью наблюдаема. Для данного объекта нетрудно рассчитать собственные числа
λ1 = −5;
λ 2 = −7 ,
правые
r ⎡1⎤ r ⎡3⎤ v1 = ⎢ ⎥; v 2 = ⎢ ⎥ ⎣1⎦ ⎣1⎦ и левые
rT d1 = [− 0.5 1.5] ;
rT d 2 = [0.5 − 0.5]
собственные векторы. В соответствии с (2.4-27), (2.6-4) и (2.6-6) нетрудно получить передаточные функции по векторам состояния и выхода:
⎡ 1.5 ⎢p + 5 + W x ( p) = ⎢ ⎢ 1.5 + ⎢⎣ p + 5 W y ( p) = −
1.5 ⎤ p + 7⎥ ⎥; 0.5 ⎥ p + 7 ⎥⎦
1.5 0.5 + . p+5 p+7
В данном случае полюсы передаточной функции по выходу полностью отображают собственные числа матрицы динамики. ПРИМЕР 3.3-2. . Объект управления задан уравнениями
x&1 = −8 x1 + 3 x 2 + 3u x& 2 = − x1 − 4 x 2 + 2u
;
y = x1 − 3x 2 .
Матрицы A и B здесь такие же, как и в предыдущем примере, следовательно, объект управляем. Матрица выхода
C = [1 − 3].
Ранг матрицы наблюдаемости
⎡ C ⎤ ⎡ 1 − 3⎤ N=⎢ ⎥=⎢ ⎥ ⎣CA⎦ ⎣− 5 15 ⎦ 135
в данном случае меньше порядка объекта и равен единице, так как второй столбец пропорционален первому. Следовательно, данный объект неуправляем. Правые и левые собственные векторы матрицы динамики и передаточная функция по вектору состояния такие же, как и в предыдущем примере. Передаточная функция по выходу
W y ( p) = −
3 . p+5
У неё отсутствует полюс, равный второму собственному числу матрицы A. Определим свободное движение объекта по вектору состояния и по выходу:
rT r 2 r r λi t r At x (t ) = e x ( 0 ) = ∑ e v i d i x ( 0 ) ; i =1
r y (t ) = Cx (t ).
.
Получаем:
r ⎡− 0.5 1.5⎤ r ⎡1.5 − 1.5 ⎤ r −5t x (t ) = ⎢ x ( 0 ) e + x (0)e −7 t ; ⎢ ⎥ ⎥ ⎣− 0.5 1.5⎦ ⎣0.5 − 0.5⎦ r y (t ) = [1 − 3]x (0)e −5t . Если выбрать
r r ⎡3⎤ x (0 ) = v 2 = ⎢ ⎥ , ⎣1⎦ r r то так как векторы v 2 и d1 взаимно ортогональны, и их скалярное произведение равно нулю, получим
r ⎡3⎤ x (t ) = ⎢ ⎥ e − 7 t , ⎣ 1⎦ в то время как
r y (t ) = 0 .
136
3.4. Замена базиса в линейном конечномерном пространстве Линейное пространство R называется конечномерным, а число n – числом измерений этого пространства или его размерностью ( dimR = n ), если в R существует n линейно независимых векторов, в то время как любые n + 1 векторов в R линейно зависимы. Система из nr линейно r r независимых, заданных в определенном порядке векторов e1 ,e 2 ,..., e n в n -мерном пространстве называется базисом этого пространства. Если каждый из векторов базиса ортогонален любому другому вектору этого базиса, т.е. их скалярные произведения равны нулю, то такой базис называется ортогональным. Если, кроме того, модуль каждого вектора базиса равен единице, то базис называется ортонормированным. r r r r r Векторы x, e1 ,e 2 ,..., e n , где x - любой вектор из R , линейно зависимы, так как их n + 1. Отсюда справедливо равенство:
r
откуда
r
r
r
α 0 x + α1e1 + α 2 e2 + ... + α n en = 0 ,
(3.4-1)
r r r r x = x e1e1 + x e 2 e 2 + ... + x en en .
(3.4-2)
Здесь:
r x e1, x e 2 ,..., x en - координаты вектора x в базисе {e} .
Столбец
⎡ x e1 ⎤ ⎢x ⎥ r xe = ⎢ e2 ⎥ ⎢ ... ⎥ ⎢ ⎥ ⎣ x en ⎦
(3.4-3)
r
называют r координатным столбцом вектора x в этом базисе. x - вектор в пространстве, и только если в этом пространстве выr берем базис, то возникает понятие координатного вектор-столбца x e . Если установим другой базис, то ему будет соответствовать другой координатный вектор-столбец. Пусть в n -мерном пространстве задано два базиса:
r r r {e} : e1, e2 ,..., en
и 137
r r r {f } : f1, f 2 ,..., fn . Так как это векторы одного и того же пространства, то каждый из векторов базиса {f } можно разложить через векторы базиса {e} :
r r r r f1 = fe11e1 + fe 21e2 + ... + fen1en ; r r r r f 2 = fe12 e1 + fe 22 e2 + ... + fen 2 en ;
(3.4-4)
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ r r r r f n = fe1n e1 + fe 2n e2 + ... + fenn en .
Коэффициенты f eik (здесь i –номер координаты, а k –номер раскладываемого вектора) можно представить в виде квадратной матрицы
⎡ fe11 ⎢f Fe = ⎢ e21 ⎢..... ⎢f ⎣ e n1 или
fe12 ... fe1n ⎤ fe22 ... fe2n ⎥ ⎥, ..... ..... .....⎥ fe n2 ... fe nn ⎥⎦
[
r Fe = fe1
r fe2
(3.4-5)
]
r ⋅ ⋅ ⋅ fen .
(3.4-6)
Каждый из столбцов матрицы F e – это координатные столбцы векторов
r r r f1, f 2 ,..., fn базиса {f } в базисе {e} .
С учетом введенных обозначений систему равенств (3.4-4) можно записать в виде
r r r r r r ⎧f1 = [e1 e 2 ... e n ] ⋅ fe1 = [e ] ⋅ fe1 ⎪ r ⎪r f e f [ ] = ⋅ e2 ⎪2 . ⎨ ⎪.......... .......... .......... .......... .......... ⎪r r ⎪f = [e ] ⋅ f en ⎩n
(3.4-7)
Можно ещё более упростить (укрупнить) эти равенства, используя понятия блочных матриц:
[f
r
1
r f2
или, в итоге
] [
r r r ⋅ ⋅ ⋅ f n = [e] ⋅ fe1 [e] ⋅ fe 2
[f ] = [e ] F
e
.
r ⋅ ⋅ ⋅ [e] ⋅ fen
]
(3.4-8) (3.4-9) 138
Матрица F e называется матрицей перехода от базиса {e} к базису {f } . Так как F e невырожденная, то
[e] = [f ] ⋅ E ,
(3.4-10)
Ef = Fe -1
(3.4-11)
f
где матрица называется матрицей перехода от базиса {f } к базису {e} .
r r
ПРИМЕР 3.4-1. Пусть в R2 задан базис {e} векторами e1,e 2 (рис. 3.3).
r f1
r e2
r f2
r e1
Р ис . 3 .3 . Св я зь ме ж д у в ек тора ми р а зли ч ны х ба зис ов Введем базис {f } следующим образом:
r r r f1 = 1 ⋅ e 1 + 1 ⋅ e 2 ; r r r f2 = − 1 ⋅ e 1 + 0 ⋅ e 2 .
Запишем матрицу перехода от базиса {e} к базису {f } :
⎡1 − 1⎤ Fe = ⎢ ⎥. ⎣1 0 ⎦ Найдем обратную матрицу
⎡ 0 1⎤ Fe −1 = ⎢ ⎥ ⎣− 1 1⎦ и, в соответствии с (3.4-10), получаем
r [e1
[
r r e2 ] = f1
]
[
r ⎡ 0 1⎤ r f2 ⋅ ⎢ ⎥ = − f2 ⎣− 1 1⎦
]
r r f1 + f2 .
Этот результат подтверждается анализом рис. 3.3. 139
Рассмотрим, как связаны между r собой компоненты, (координатные столбцы) одного и того вектора x в разных базисах. В соответствии с (3.4-2) и
r r r r x = x e1e1 + x e 2 e2 + ... + x en en
(3.4-12)
r r r r x = x f 1f1 + x f 2 f2 + ... + x fn f n .
(3.4-13)
Приравнивая правые части последних двух равенств, получим
r
а с учётом (3.4-9)
r
[e] ⋅ x e = [f ] ⋅ x f ,
(3.4-14)
r r [e ] x e = [e ]F e x f
(3.4-15)
Окончательно получаем
r r r r xe = Fe xf ; x f = F e − 1 ⋅ x e .
(3.4-16)
3.5. Линейные операторы и матрицы линейных операторов. Отображение A линейного пространства X в линейное пространство Y A : X →Y называют линейным преобразованием или линейным оператором, если оно удовлетворяет двум условиям: а)
r r r r r r A ( x + v ) = A ( x ) + A (v ) для всех x,v ∈ X ;
(3.5-1)
б)
r r r r x v ∈ X и любого α . A (αx ) = αA ( x ) для всех (3.5-2) r rЕсли отображение A переводит вектор x в некоторый другой вектор y : r r A (x) = y , (3.5-3) r r r r то вектор y - называют образом вектора x , а x - прообразом вектора y . n Линейный оператор, отображающий линейное пространство R n само в себя, называется линейным оператором в R .
140
r
r
r
r
Пусть x ∈ R ; y ∈ R и y = A ( x ) . Рассмотрим, как связаны в r r этом случае координаты векторов x и y . Будем ориентироваться снаr r r чала на базис [e] = [e1 e 2 ⋅ ⋅ ⋅ en ]. Очевидно при этом, что n
n
r r n x = ∑ x ek ek ;
(3.5-4)
r r n y = ∑ y ei ei .
(3.5-5)
k =1
i =1
Рассмотрим, прежде всего, как действует оператор A ты базиса. Пусть
на элемен-
r r r r e A (e1 ) = a11e e1 + a21 e2 + ... + ane1en
................................................ r r r r A (ek ) = a1ek e1 + a2ek e2 + ... + anke en
(3.5-6)
................................................. r r r r e A (en ) = a1en e1 + a2en e2 + ... + ann en Из соотношений (3.5-3) и (3.5-4) следует
r y =
r
n
∑ x A (e ) .
(3.5-7)
n r r n y = ∑ x ek ∑ a ike e i .
(3.5-8)
k =1
ek
k
Учтём (3.5-6): k =1
i =1
Сопоставляя это равенство с (3.5-5), получим n r y ei = ∑ aike x ek
, i = 1,2,..., n
(3.5-9)
k =1
Запишем этот результат в матричной форме:
r r y e = Ae ⋅ xe , (3.5-10) r r где, как и раньше y e и x e - координатные вектор-столбцы, соответствующих векторов в базисе [e] , а матрица
141
a12e ... a1en ⎤ e a22 ... a 2en ⎥ ⎥ (3.5-11) ..... ..... .....⎥ e ⎥ a ne2 ... a nn ⎦ называется матрицей оператора A в базисе [e] . Элементы её столбr r цов по построению - это координаты векторов A (e 1 ), A (e 2 )..... базисе [e] . Аналогично вводится понятие матрицы Af того же оператора A в некотором другом базисе [f ] . Рассмотрим теперь, как изменяется матрица оператора A при r r n замене базиса в пространстве R . Пусть, как и прежде y = A ( x ) и матрица Ae , в соответствии с (3.5-10) связывает между собой коордиr r натные столбцы векторов x и y в базисе [e] . ⎡ a11 ⎢a e Ae = ⎢ 21 ⎢..... ⎢ e ⎣a n1 e
Согласно ранее полученным результатам - соотношениям (3.4-16), и
r r x e = Fe ⋅ x f
(3.5-12)
r r y e = Fe ⋅ y f .
(3.5-13)
Из этих двух соотношений и (3.5-10) легко выводится равенство
r r y f = Af ⋅ x f ,
(3.5-14)
Af = Fe −1 ⋅ Ae ⋅ Fe .
(3.5-15)
где
Эта формула позволяет связать между собой матрицы одного и того же оператора в различных базисах. В математике такие матрицы называются подобными. Ранее (п.2.4.3) уже отмечалось, что подобные матрицы имеют одинаковые собственные числа. ПРИМЕР 3.4-2. Пусть имеется базис [e] (рис. 3.4) 1. Зададим оператора A его действием на векторы базиса [e] :
r r r A (e1 ) = e1 + 2e 2 ; r r A (e 2 ) = −e1 .
Тем самым мы определили матрицу оператора A в базисе [e] :
⎡1 − 1⎤ Ae = ⎢ ⎥. 2 0 ⎣ ⎦ 142
r
2. Зададим вектор x в базисе [e] :
r r r x = e1 − e 2 .
r A (e1 )
r y
r e2 r A (e2 )
r f2
r e1
r f1
r x
Рис. 3.4. Действие оператора на вектор Отсюда
r ⎡ 1⎤ xe = ⎢ ⎥ . ⎣ − 1⎦ 3. Рассчитаем координатный вектор, используя (3.5-14):
r r ⎡1 − 1⎤ ⎡ 1 ⎤ ⎡2⎤ y e = Ae xe = ⎢ ⎥ ⋅ ⎢− 1⎥ = ⎢2⎥ . 2 0 ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ 4. Введем новый базис [f ] : r r f1 = −e2 ; r r r f2 = −e1 − e2 . Тогда матрица перехода от базиса [e] к базису [f ] будет иметь вид
⎡ 0 − 1⎤ Fe = ⎢ ⎥. − − 1 1 ⎣ ⎦ 5. Определим матрицу Af оператора A в базисе [f ] :
⎡ 1 − 1⎤ ⎡1 − 1⎤ ⎡ 0 − 1⎤ ⎡ 1 2⎤ Af = Fe −1 AeFe = ⎢ ⋅⎢ ⋅⎢ . =⎢ ⎥ ⎥ ⎥ ⎥ ⎣− 1 0 ⎦ ⎣2 0 ⎦ ⎣− 1 − 1⎦ ⎣− 1 0⎦ 143
r
6. Найдём координатный столбец вектора x в базисе [f ] . В соответствии с рис. 3.4
r r r x = 2f1 − f 2 .
С другой стороны, согласно (3.5-12)
r r xf = Fe −1 ⋅ xe .
(3.5-16)
Оба подхода дают один и тот же результат:
r ⎡2⎤ xf = ⎢ ⎥ . ⎣ − 1⎦
r
В итоге получим координатный столбец вектора y в базисе [f ] :
r r ⎡0⎤ y f = Af x f = ⎢ ⎥ . ⎣ − 2⎦ ПРИМЕР 3.5-1. Дана матрица Ae оператора A в базисе [e] :
⎡0 1⎤ Ae = ⎢ ⎥ ⎣0 0⎦ r r и два вектора - f1 и f 2 , координатные столбцы которых в том же базисе имеют вид:
r ⎡ 1⎤ r ⎡0⎤ f e1 = ⎢ ⎥ ; f e 2 = ⎢ ⎥ , ⎣3⎦ ⎣2⎦ то есть
r r r f1 = e 1 + 2e 2 ; r r f 2 = 3e 2 .
Примем эти векторы в качестве нового базиса и вычислим в нём матрицу Af оператора A . Для этого выполним следующие действия. 1. Составим матрицу перехода от базиса [e] к базису [f ] :
⎡1 0 ⎤ Fe = ⎢ ⎥. 2 3 ⎣ ⎦ 2. Вычислим обратную матрицу:
144
Fe
−1
⎡ 1 =⎢ 2 ⎢⎣− 3
0⎤ 1⎥ . 3 ⎥⎦
3. Вычислим матрицу Af :
⎡ 2 ⎢ Af = Fe −1 ⋅ Ae ⋅ Fe = ⎢ 4 ⎢− ⎣ 3 3.6. Замена базиса в ской системы
3⎤⎥ ⎥. − 2⎥ ⎦
пространстве состояний динамиче-
Пусть заданы уравнения системы
r r r x = A x (t ) + B u (t ) ; r r y (t ) = C x (t ) .
(3.6-1)
Для этой системы могут быть найдены матрицы управляемости
U = [B AB A 2 B ... A n −1B ] ,
(3.6-2)
наблюдаемости
⎡ C ⎤ ⎢ CA ⎥ ⎥, N =⎢ ⎢ ... ⎥ ⎢ n −1 ⎥ ⎣ CA ⎦
(3.6-3)
передаточной функции
W y ( p ) = C( pE − A) −1 B .
(3.6-4)
Могут быть также записаны выражения для векторов состояния и выхода t r r r x (t ) = Φ(t − t 0 )x (t 0 ) + ∫ Φ(t − τ )Bu (τ )dτ ; t0
t r r r y (t ) = CΦ(t − t 0 )x (t 0 ) + ∫ CΦ(t − τ )Bu (τ )dτ .
(3.6-5)
t0
Полученные в предыдущих разделах результаты не были ограничены выбором какого-либо конкретного базиса в пространстве состоя145
ний. Все они были справедливы для любого базиса, в котором записаны матрицы A , B , C , Ф , W , U , N . Для определённости назовём этот базис базисом [e] . В этом случае можно подразумевать, что символы всех векторов и матриц в выражениях (3.6-1) - (3.6-5) снабжены индексом " e ". В дальнейшем нам будет удобно выбирать вполне определенный базис в пространстве состояний X таким образом, чтобы матрицы имели «хорошую», каноническую форму. Такой выбор базиса может оказаться целесообразным, так как, во-первых, канонические представления матриц системы имеют минимальное число ненулевых элементов и поэтому удобны для моделирования и других вычислений, а во-вторых, канонические представления позволяют получить чрезвычайно простые алгоритмы синтеза управления. Рассмотрим перевод уравнений (3.6-1) в некоторый новый базис F . Отметим при этом, что, переходя к новому базису в пространстве состояний, преобразовывая базис для пространства вектора состояний, не будем изменять базис пространства входов и пространства выходов r r системы. Заменим в (3.6-1) x e на x f согласно (3.5-12):
r r r Fe ⋅ x& f = Ae ⋅ Fe x f + Be u ; r r y = C eF e x f . Умножая слева обе части дифференциального уравнения на F чим:
r r r x& f = Fe −1 AeFe x f + Fe −1Be u .
(3.6-6) −1
, полу-
(3.6-7)
Учитывая (3.5-15), и вводя дополнительные обозначения
Af = Fe −1 ⋅ Ae ⋅ Fe ; Bf = Fe −1 ⋅ Be ;
(3.6-8)
C f = C e ⋅ Fe , окончательно получаем уравнения системы в базисе [f ] :
r r x& f = Af + B f ⋅ u (t ); r r y& (t ) = C f ⋅ x (t ).
(3.6-9)
ПРИМЕР 3.6-1. Пусть система задана схемой моделирования, привеr денной на рис. 3.5. Выберем в качестве координат вектора состояний x в исходном базисе [e] выходы интеграторов 1 и 2. В результате получим уравнения системы в исходном базисе: 146
r r r x& e (t ) = Ae x e (t ) + Be ⋅ u (t ); r r y ( t ) = Ce ⋅ x e ( t ) ,
u
1
x e1
2
xe2
y
Рис. 3.5. Схема моделирования в исходном базисе [ e ] где
1 − 1⎤ ; Ae = ⎡ ⎢⎣1 − 1⎥⎦
⎡1⎤ Be = ⎢ ⎥ ; ⎣0⎦
Ce = [0 1].
Зададим матрицу перехода к новому базису:
1 1⎤ Fe = ⎡ , ⎢⎣1 0⎥⎦ которой соответствуют уравнения
r r r f1 = e1 + e2 ; r f2 = e1 .
Вычислим обратную матрицу
0 1⎤ Fe −1 = ⎡ . ⎢⎣1 − 1⎥⎦ В соответствии с (3.6-8) находим
⎡0 1⎤ Af = ⎢ ⎥; ⎣0 0 ⎦
⎡0 ⎤ B f = ⎢ ⎥; ⎣ 1⎦
Cf = [1 0] .
Этим матрицам соответствуют уравнения
x& f1 = x f2 ; x& f2 = u ; y = x f1 , 147
которым, в свою очередь, отвечает схема, приведённая на рис. 3.6.
xf 2
u
xf1
y
Рис. 3.6. Схема моделирования в базисе [f ] Собственные числа системы, естественно, сохранились, так как матрицы А l и Af подобны. Связь между входом и выходом осталась неизменной, а схема моделирования стала заметно проще.
3.7. Вычисление матрицы преобразования базиса в пространстве состояний динамической системы с помощью матриц управляемости и наблюдаемости Пусть матрицы управляемой системы представлены rв двух различных базисах [e] и [f ] в пространстве состояний вектора x :
{Ae , B e }, {Af , B f } . Рассмотрим матрицу управляемости:
U f = [B f
Af B f
Af2 B f
... Afn −1 B f ] .
(3.7-1)
В соответствии с (3.6.-8)
Af Bf = Fe −1 Ae Be : Af2Bf = Fe −1AeFeFe −1AeFeFe −1Be = Fe −1Ae2Be ; ………….
Afk = Fe −1Aek Be .
(3.7-2)
Учитывая эти равенства в (3.7-1), получим выражение для перевода матрицы управляемости из одного базиса в другой:
U f = Fe −1Ue .
(3.7-3)
Умножая это равенство справа на Ue , получаем: T
Uf UeT = Fe −1UeU eT .
(3.7-4)
Если система управляема, то rank U e = rank U f = n . Это значит, что матрица U e имеет n линейно независимых строк и может быть представлена в виде 148
r ⎡z1T ⎤ ⎢ rT ⎥ z Ue = ⎢ 2 ⎥ , (3.7-5) ⎢ ... ⎥ ⎢ rT ⎥ ⎣zn ⎦ r r r где векторы z1, z2 ...zn – линейно независимы. Следовательно, матрица r ⎡z1T ⎤ ⎢ rT ⎥ z r r r UeU eT = ⎢ 2 ⎥ ⋅ [z1 z2 ... zn ], (3.7-6) ⎢ ... ⎥ ⎢ rT ⎥ ⎣ zn ⎦ которая является матрицей Грама, имеет положительный определитель, а значит – невырождена. Следовательно,
Fe −1 = Uf UeT (UeUeT )−1 .
(3.7-7)
Если система имеет скалярный вход (u-скаляр), то матрица B ста-
r
новится вектором (B = b ) , а матрица Ue – квадратной, в управляемой системе – невырожденной. Тогда:
Fe −1 = Uf Ue−1 .
(3.7-8)
Отметим, что в данном рассуждении Fe – матрица перехода от базиса [e] к базису [f ] , поэтому обратная ей - это матрица перехода от базиса [f ] к базису [e] :
Fe −1 = Ef .
(3.7-9)
Рассмотрим другой случай, когда переход от базиса [e] к базису [f ] задан парой матриц
{Ae ,C e }, {Af ,C f } некоторой наблюдаемой системы. Запишем матрицу наблюдаемости (3.3-7) и с учётом (3.6-8) проведём аналогичные предыдущим преобразования:
⎡ C f ⎤ ⎡ C eF e ⎤ ⎢C A ⎥ ⎢C AF ⎥ N f = ⎢ f f ⎥ = ⎢ e e e ⎥ = N eFe . ⎢ ⋅⋅⋅ ⎥ ⎢ ⎥ ⎢C A n −1 ⎥ ⎢C A n −1F ⎥ ⎣ f f ⎦ ⎣ e e e⎦
(3.7-10)
Так как система наблюдаема, то 149
rank (N e ) = rank (N f ) = n и матрица наблюдаемости имеет n линейно независимых столбцов
r N = [z1
r z2
r ⋅ ⋅ ⋅ zn ] ,
а квадратная матрица
rT ⎡ z1 ⎤ ⎢zr T ⎥ r N T N = ⎢ 2 ⎥[z1 ⎢⋅ ⋅ ⋅⎥ ⎢ rT ⎥ ⎣z n ⎦
r z2
r ⋅ ⋅ ⋅ zn ]
не вырождена. Умножим обе части равенства (3.7-10) слева на N e : T
N eT N f = N eT N eFe ,
(3.7-11)
Fe = (N eT N e ) −1 N eT N f .
(3.7-12)
откуда получим
Если система имеет скалярный выход, то
Fe = N e−1N f .
(3.7-13)
3.8. Канонические представления систем 3.8.1. Управляемое каноническое представление системы со скалярным входом Пусть в некотором исходном базисе [h] пространства состояний X записаны уравнения движения объекта со скалярным управлением:
r r& r x h (t ) = Ah x h (t ) + bhu(t ) ; r r y (t ) = Ch x h ( t ) .
(3.8-1) (3.8-2)
Болееr общая запись связывает не координатные столбцы, а сами векторы в x ∈ X с помощью соответствующего оператора A :
r r& r x (t ) = A ⋅ x ( t ) + b ⋅ u ( t ) . (3.8-3) r A ,b управляема, то n векторов Если система r r r b , A b, ... , A n −1b образуют базис в пространстве X в силу того, что rank U = n . Следовательно, в пространстве X в качестве базиса может
{
}
быть выбрана следующая система векторов: 150
r r ⎧e1 = b; ⎪ r ⎪er = A b; ⎪ 2 r ⎪r 2 ⎨e3 = A b ⎪ ⎪............ ⎪r r ⎪en = A n −1b. ⎩
(3.8-4)
Пусть характеристический полином оператора цы в преобразованном базисе имеет вид:
A
, а значит и его матри-
ϕ A (λ ) = λn + αλn −1 + ... + α n −1 λ + λn .
(3.8-5)
Построим ещё один базис - базис [u ] следующим образом:
r r r r r n −2 n −1 u1 = α n −1 b + b + ... + b + b α A α A A 1 123 n −2 { { 123 ; e1
e2
e n −1
r r r r r n −3 n −2 u 2 = α n −2 b + b + ... + b + b α A α A A 1 123 n −3 { { 123 ; e1
e2
en − 2
en −1
r r r r r n −4 n −3 u 3 = α n −3 b + b + ... + b + b α A α A A n−4 { 1 123 { 123 ; e1
e2
en − 3
en − 2
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ r r r r 2 u n −2 = α 2 b + b + b α A A { 1 { {; e1
e2
e3
r r r u n −1 = α 1 b + b A { {; e1
r r un = b {.
e2
(3.8-6)
e1
Проверим, действительно ли это базис? Матрица перехода от базиса [e] к базису [u ] в соответствии с (3.4-4) и (3.4-5) имеет вид:
151
⎡α n −1 ⎢α ⎢ n −2 ⎢α n −3 U e = ⎢⎢ ... ⎢ α2 ⎢ ⎢ α1 ⎢⎣ 1
α n −2 α n −3 α n −3 α n − 4 α n − 4 α n −5
... α 2
α1
... α 1 ... 1
1 0
...
...
...
...
...
α1
1
...
0
0
1
0
...
0
0
0
0
...
0
0
1⎤ 0⎥ ⎥ 0⎥ ...⎥⎥ . 0⎥ ⎥ 0⎥ 0 ⎥⎦
(3.8-7)
Эта матрица является треугольной, её определитель равен проn изведению диагональных элементов, умноженному на (−1) , т.е. не равен нулю. Следовательно, U e не вырождена и система векторов
r r
r
{u1 u 2 ...u n } действительно образует базис в пространстве X. Вычислим теперь представление матрицы оператора [u ] . При этом воспользуемся равенством
r n r r r r u u u A fk = a1k u1 + a2 k u 2 + ... + ank u n = ∑ aiku A (u i ) .
( )
в базисе
(3.8-8)
i =1
С учётом (3.8-6)
r
A
r
r r r r b + ... + α n −1 A b + α n b − α n b = r r + ... + α n −1 A + α n E )b − α n b =
A (u1 ) = A n b + α 1 A
n −1
= ( A n + α 1 A n −1 r r = ϕ A ( A )b − α n b.
(3.8-9)
r r По теореме Кэлли-Гамильтона ϕ A ( A ) = 0 , а значит A (u1 ) = −α n b , отu u куда следует, что an1 = −α n и a i 1 = 0 при i < n , то есть r auT1 = [0 0 ... 0 − α n ] . (3.8-10) Далее действуем аналогичным образом:
r r r r r r n −1 n−2 A (u 2 ) = A b + α 1 A b + ... + α n −2 A b + α n −1b − α n −1 b {r , (3.8-11) 144444442 4444444 3 r un u1
откуда следует, что a12 = 1, a i 2 = 0 при 1 < i < n; an 2 = −α n −1 , то есть u
u
u
r auT2 = [0 1... 0 − α n −1 ] .
Далее:
r r r r r r A (u 3 ) = A n −2 b + α 1 A n −3 b + ... + α n −3 A b + α n −2 b − α n − 2 b , (3.8-12) { r 144444442 4 4 4 4 4 4 4 3 r un u2
152
откуда следует, что u a13u = 0; a 23 = 1; a iu3 = 0 при 2 < i < n; anu3 = −α n −2 ,
то есть
r auT3 = [0 0 1 0 ... 0 − α n − 2 ] .
Вычислим предпоследний столбец матрицы:
r r r r r 2 A (u n −1 ) = A b + α 1 A b + α 2 b − α 2 b , { 1444r2444 3 r un
(3.8-13)
un − 2
откуда следует, что ai,n-1 = 0 для 1 ≤ i < n − 2 , an −2 ,n −1 = 1, a n- 1,n-1 = 0 и u
u
u
u an,n= −α 2 , то есть 1 r auT n −1 = [0 0 ⋅ ⋅ ⋅ 0 1 0 − α n − 2 ] .
Наконец,
r
r
r
r
r
r
A (u n ) = A b + α 1b − α 1b = u n −1 − α 1u n ,
(3.8-14)
откуда следует, что a i,n = 0 для 1 ≤ i < n − 1, и an −1,n = 1, a n,n = −α 2 , то есть u
u
u
rT aun = [0 0 ⋅ ⋅ ⋅ 0 1 − α 1 ].
Таким образом, матрица AU оператора
A
в базисе [u ] имеет вид:
... 0 ⎤ 1 0 ⎡ 0 ⎢ 0 ... 0 ⎥ 0 1 ⎢ ⎥ ... 0 ⎥ 0 0 ⎢ 0 ⎥. AU = ⎢ ... (3.8-15) ... ... ... ... ⎢ ⎥ ⎢ 0 ... 0 ⎥ 0 0 ⎢ ⎥ ... 1 ⎥ 0 0 ⎢ 0 ⎢⎣− α n − α n −1 − α n − 2 ... − α 1 ⎥⎦ r r Так как b = u n , то есть является последним вектором базиса [u ] , то коr ординатный столбец вектора b в этом базисе r buT = [0 0 0 ... 0 0 1] . (3.8-16) r Пара AU , bU называется управляемым каноническим представлением (УКП) системы с одним (скалярным) входом. Матрица AU называется сопровождающей по отношению к полиному ϕ A ( λ) .
{
}
153
Таким образом, мы доказали, что если исходная система управляема, то r в пространстве состояний Х существует базис, в котором пара Α, b имеет управляемое каноническое представление.
{ }
r Если в некотором исходном базисе [h] заданы матрицы AH , bH и,
если система управляема, то для того, чтобы вычислить их (матриц) УКП, достаточно вычислить коэффициенты характеристического полинома ϕ A (λ ) . После этого может быть вычислена матрица преобразования от исходного базиса [h] к УКП в соответствии с (3.7-8):
U H−1 = U U U H−1 .
(3.8-17)
Далее индекс “h” для системы в исходном базисе будем опускать. ПРИМЕР 3.8-1. Для системы
r& r r x = Ax + b u ; r y = Cx
известны матрицы
⎡2 3⎤ r ⎡1 ⎤ A=⎢ ⎥, b = ⎢ ⎥, C = [1 1] . ⎣4 5⎦ ⎣⎢2⎦⎥ Нетрудно вычислить матрицу
⎡1 8 ⎤ U ≡ UH = ⎢ ⎥. 2 14 ⎣ ⎦ Её определитель U = −2 ≠ 0 , откуда следует, что система управляема и, значит, для неё существует УКП. Вычислим характеристический полином:
λ −2 −3 ⎤ ϕ A ( λ ) = λE − A = ⎡⎢ = λ2 − 7λ − { {2 . ⎣ − 4 λ − 5⎥⎦ α1 α2 Это позволяет сразу же записать матрицы A и B в базисе УКП:
0 1⎤ , AU = ⎡ ⎢⎣2 7⎥⎦
r 0 bU = ⎡ ⎤ . ⎢⎣1⎥⎦
Векторно-матричные уравнения системы в УКП имеют вид:
r r r x& u = Au x u + bu u; r y = Cu x u .
154
Для того, чтобы найти матрицу CU , требуется рассчитать матрицу перехода от исходного базиса к базису УКП. Для этого предварительно вычислим
4 ⎤ ⎡− 7 ⎡0 1⎤ = U H−1 = ⎢ и U U ⎥ ⎢ 1 7⎥ . − 1 0 . 5 ⎣ ⎦ ⎣ ⎦ Тогда искомая матрица
4 ⎤ ⎡ 1 − 1/ 2⎤ ⎡1 1⎤ ⎡0 1⎤ ⎡− 1 = = , U H ⎢0 2⎥ . ⎥ ⎢ 1 − 1/ 2⎥ ⎢0 1/ 2 ⎥ 1 7 ⎣ ⎦ ⎦ ⎦ ⎣ ⎣ ⎦⎣
U H−1 = ⎢
После этого в соответствии с (3.6-8) находим
CU = C HU H = [1 3] . 3.8.2. Передаточная функция и структурная схема для системы в УКП Уравнения системы
r r& r xU (t ) = AU xU (t ) + bU u(t )
y = CU xU
(3.8-18)
со скалярным входом u (t ) и скалярным выходом y (t ) , где матрицы AU и
r bU определяются выражениями (3.8-15) и (3.8-16), а матрица CU имеет
вид
CU = [c u1 c u 2 L c un ] ,
(3.8-19)
можно записать в развёрнутом виде :
x& u 1 = x u 2 ; x& u 2 = x u 3 ; x& u 3 = x u 4 ;
(3.8-20)
... ... ... x& u n −1 = x u n ; x& u n = −α n x u 1 − α n −1 x u 2 − ... − α 2 x u n −1 − α 1 x u n + u ; y = c u 1 x u 1 + c u 2 x u 2 + ... + c u n x u n .
(3.8-21)
155
Этим уравнениям соответствует схема, представленная на рис.3.7.
y
u
cu n
c u n −1
xu n
x u n −1
-α 1
-α 2
cu 3
cu 2 xu 2
xu 3 -α n-2
-α n-1
cu 1 xu1 -α n
Рис. 3.7. Схема моделирования системы в УКП
В соответствии с этим рисунком передаточная функция системы имеет вид
W ( p) = =
cu 1p − n + cu 2 p − ( n −1) + ... + cu n −1p −2 + cu n p −1 1 + α1p −1 + α 2 p −2 + ... + α n p −n cu 1 + cu 2 p + ... + cu n −1p n −2 + cu n p n −1 p n + α 1p n −1 + α 2 p n −2 + ... + α n −1p + α n
= (3.8-22)
.
Отметим, что статический передаточный коэффициент
W (0 ) =
cu 1
αn
.
(3.8-23)
3.8.3. Идентификационное каноническое представление системы с одним (скалярным) выходом С помощью рассуждений, аналогичных проведённым в п.3.8.1, можно получить следующие результаты. Если пара матриц {A,C} полностью наблюдаема, то в пространстве состояний Х всегда существует базис, в котором пара {A,C} имеет идентификационное каноническое представление (ИКП):
156
⎡0 ⎢1 ⎢ ⎢0 AI = ⎢⎢... ⎢0 ⎢ ⎢0 ⎢⎣ 0
−αn ⎤ 0 ... 0 0 − α n −1 ⎥ ⎥ 1 ... 0 0 − α n −2 ⎥ ... ... ... ... ... ⎥⎥ ; 0 ... 0 0 − α 3 ⎥ ⎥ 0 ... 1 0 − α 2 ⎥ 0 ... 0 1 − α 1 ⎥⎦ 0 ... 0
0
CI = [0 0 ... 0 0 1] . Отметим, что:
r CIT = bU .
AIT = AU ;
(3.8-24)
(3.8-25)
(3.8-26)
Если в некотором исходном базисе [h] заданы матрицы AH , C H и, если система полностью наблюдаема, то для того, чтобы вычислить их (матриц) ИКП, достаточно вычислить коэффициенты характеристического полинома ϕ A ( λ ) . После этого может быть вычислена матрица преобразования от исходного базиса [h] к ИКП в соответствии с (3.7-13):
I
−1 H
= N H−1N I .
(3.8-27)
Если известна матрица BH при векторе управления в исходном базисе, то с учётом (3.6-8) в базисе ИКП она может быть определена с помощью соотношения
BI = I
−1 H
BH .
(3.8-28)
3.8.4. Передаточная функция и структура для системы в ИКП В соответствии с видом матриц AI и CI уравнения системы со скалярным входом u и скалярным выходом y имеют вид:
⎧ x& i 1 = −α n x i n + bi 1u ; ⎪ x& = x − α x + b u ; i1 n −1 i n i2 ⎪ i2 ⎪ x& i 3 = x i 2 − α n −2 x i n + bi 3 u ; ⎨ ⎪... ... ... ... ... ... ⎪ x& i n −1 = x i n − 2 − α 2 x i n + bi n −1u ; ⎪ ⎩ x& i n = x i n −1 − α 1 x i n + bi n u ;
(3.8-29)
157
y = xi n .
(3.8-30)
Этим уравнениям соответствует структурная схема, представленная на рис. 3.8.
u bi 1
bi 2
bi n −2 xi 2
xi 1
bi n −1
bi n x i n −1
x i n −2
y
xi n -α n
-α n-1
-α 3
-α 2
-α 1
Рис. 3.8. Схема моделирования системы в ИКП В соответствии с этим рисунком передаточная функция системы имеет вид:
W ( p) = =
bi 1 p − n + bi 2 p − ( n −1) + ... + bi n −1 p −2 + bi n p −1 1 + α 1 p −1 + α 2 p −2 + ... + α n p −n bi 1 + bi 2 p + ... + bi n −1 p n −2 + bi n p n −1
p n + α 1 p n −1 + α 2 p n −2 + ... + α n −1 p + α n
= (3.8-31)
.
Отметим, что статический передаточный коэффициент
W (0 ) =
bi 1
αn
.
(3.8-32)
158
3.9. Обратная связь по состоянию, обеспечивающая заданное (желаемое) расположение собственных чисел в замкнутой системе с одним (скалярным) входом Даны уравнения полностью управляемого объекта управления в некотором исходном базисе
r r& r x H (t ) = AH x(t ) + bH u(t ); r y (t ) = C H x H ,
(3.9-1)
каждая координата вектора состояния которого доступна для измерения. Требуется синтезировать такое управление, которое бы обеспечило требуемое качество отработки внешнего командного сигнала v (t ) . Динамические свойства системы управления, в основном, определяются её собственными числами, то есть нулями характеристического полинома n
ϕ A (λ ) = ∏ (λ − λi ) =λn + α 1λn −1 + ... + α n .
(3.9-2)
i =1
Время переходного процесса каждой моды определяется расстоянием до мнимой оси вещественной части; колебательность - соотношением мнимой и вещественной частей соответствующих собственных чисел. Эти зависимости могут быть проанализированы при изучении характеристик типовых звеньев, кроме того, они рассматриваются в обширной учебной литературе по теории автоматического регулирования и управления. В соответствии со структурной схемой, приведённой на рис. 3.9, сформируем сигнал управления объектом в виде:
r u(t ) = LH x H (t ) + k v v (t ) ,
(3.9-3)
где: LH – некоторая матрица-строка обратной связи:
LH = [l h 1
lh2
... l h n ];
(3.9-4)
k v – коэффициент по командному сигналу. Тогда уравнение системы примет вид:
r r r r r x& H (t ) = AH x H (t ) + bH LH x H (t ) + bH k v v (t ) ,
(3.9-5)
r v r& r C x H (t ) = AH x H (t ) + bH k v (t ) ,
(3.9-6)
или
где AH - матрица замкнутой системы в исходном базисе: C
r AHC = AH + bH LH .
(3.9-7) 159
v
u
kv Регулятор
y Объект
r x
L
Рис. 3.9. Структурная схема замкнутой системы Поскольку объект полностью управляем, то существует базис [u ] ,
{ }
r в котором пара A, b имеет управляемое каноническое представление r AU , bU . Поэтому перейдём к записи уравнений системы в базисе УКП.
{
}
В соответствии с (3.4-16) произведём замену
r r x H = U H xU .
Тогда из (3.9-1) получим
r
r
(3.9-8)
r
U H x& U (t ) = AHU H x U (t ) + bH u(t ) ;
(3.9-9)
r y (t ) = C HU H x U .
(3.9-10) −1
Умножив уравнение (3.9-9) слева на U H , будем иметь
r r& r x U (t ) = AU x U (t ) + bU u(t ); , r y (t ) = C U x U ( t ) ,
(3.9-11)
r где AU bU и CU - соответствующие матрицы в УКП. Используя подстановку (3.9-8), из (3.9-3) получим
r u(t ) = LU x U + k v v (t ) ,
(3.9-12)
где матрица обратной связи в базисе УКП
LU = LHU H .
(3.9-13)
В результате, уравнение замкнутой системы в базисе управляемого канонического представления будет иметь вид:
r r r x& U (t ) = AUC x U (t ) + bU ⋅ k v v (t ) .
(3.9-14)
Здесь AU является сопровождающей матрицей по отношению к характеристическому полиному замкнутой системы C
160
n
ϕ AC (λ ) = ∏ (λ − λ3i ) =λn + γ 1λn −1 + ... + γ n ,
(3.9-15)
i =1
поэтому она имеет стандартный вид
⎡ ⎢ ⎢ AUC = ⎢ ⎢ ⎢ ⎢⎣
0
1
0
⋅⋅⋅
0
0
1
⋅⋅⋅
⋅⋅⋅
⋅⋅⋅
⋅⋅⋅
⋅⋅⋅
0
0
0
⋅⋅⋅
−γ n
− γ n −1
− γ n −2
⋅⋅⋅
0 ⎤ 0 ⎥ ⎥ ⋅⋅⋅ ⎥ . 1 ⎥⎥ − γ 1 ⎥⎦
(3.9-16)
С другой стороны, очевидно, что
r A = AU + bU LU . C U
(3.9-17)
Отсюда сразу же следует связь между коэффициентами характеристического полинома (3.9-2) объекта и коэффициентами характеристического полинома (3.9-14) желаемой системы:
− γ i = −α i + l U n −i +1 , i = 1, 2, K, n .
(3.9-18)
Далее обусловлены следующие действия. 1. Задание желаемых собственных чисел замкнутой системы λ13 , λ32 ,..., λ3n . 2. Вычисление коэффициентов характеристического полинома замкнутой системы γ 1 , γ 2 , ...,γ n в соответствии с выражением (3.9-14). 3. Вычисление согласно (3.9-17) коэффициентов матрицы обратной связи в базисе УКП:
lU ,n −i +1 =α i −γ i , i = 1,2,..., n .
(3.9-19)
4. Вычисление в соответствии с (3.9-12) и (3.8-17) матрицы обратной связи в исходном базисе:
LH = LU U U U H−1 .
(3.9-20)
5. Определение величины коэффициента k в соответствии с требованиями по статике. Так например, если требуется обеспечить единичную статику по командному сигналу v , то это значит, что установившееся значение переходной функции h(t ) замкнутой системы должно быть равно единице. Одним из свойств передаточной функции устойчивой системы является равенство: v
lim h(t ) = limWvy ( p ) . t →∞
p →0
(3.9-21)
161
Согласно структурной схеме, приведённой на рис. 3.9, передаточная функция между командным v и выходным y сигналами имеет вид:
Wvy ( p ) = k v ⋅ W ( p ) ,
(3.9-22)
где передаточная функция W (p ) , может быть определена аналогично выражению (3.8-22). Таким образом, получаем:
h( ∞ ) = k v
cU1
γn
= 1,
(3.9-23)
откуда окончательно,
kv =
γn cU1
.
(3.9-24)
162
3.10. Синтез управления в многомерной системе. Задача разделения каналов В предыдущих разделах, посвящённых синтезу, рассматривались объекты со скалярным управлением (входом) и скалярным выходом. На практике встречаются и более сложные объекты. Один из них был упомянут в разделе 2.2. Это смесительный бак, у него две входные величины – два входных потока с различными концентрациями растворённого вещества, и две выходных – концентрация и расход выходного потока. В качестве другого примера может быть взят объект, связанный с перемоткой некоторой полосы с одного рулона на другой. Для этого объекта выходные переменные – это натяжение и линейная скорость перемотки; входные – напряжения или токи приводных двигателей моталки и разматывателя. Наконец, самолёт. В качестве выходных переменных могут выступать углы тангажа, курса и крена; в качестве входных, управляющих, - угловые положения руля высоты, руля направления и элеронов. Как правило, в таких объектах каждая выходная величина зависит от всех входных. В то же время, при синтезе управления такими объектами часто требуется обеспечить не только заданные динамические и статические свойства системы, но и независимое управление по каждой из выходных переменных. Пусть уравнения объекта имеют вид
r r r x& (t ) = Ax (t ) + Bu(t ) ; r r y (t ) = Cx(t ) ,
(3.10-1) (3.10-2)
где размерность вектора состояния [n × 1] , вектор управления и вектор выхода имеют одинаковую размерность [ p × 1] . Такую же размерность r имеет вектор командного сигнала v , поступающий на вход системы. r Требуется синтезировать управление u такое, чтобы: 1) i –я составляющая вектора выхода y i зависела только от i –й составляющей командного сигнала v i ; 2) по каждому из каналов была обеспечена заданная динамика, иными словами, передаточная функция Wvi ,yi (p) =
Yi (p) , имеющая заVi (p)
данные полюсы; 3) для каждого из каналов был обеспечен заданный статический коэффициент передачи.
3.10.1. Разделение исходного объекта на подсистемы интеграторов Представим (3.10-2) в виде 163
⎡C1 ⎤ r r ⎢⎢C2 ⎥⎥ r y = Cx = x, ⎢M⎥ ⎢C ⎥ ⎣ p⎦ где Ci - строки матрицы C . Тогда i -я координата вектора выхода
r y i = Ci x .
Рассмотрим процедуру многократного дифференцирования координат вектора выхода:
r r r y i′ = C i x& = C i A x + C i B u ; r r r y i′′ = C i A 2 x + C i AB u + C i B u ′; r r r r y i( 3 ) = C i A 3 x + C i A 2 B u + C i AB u ( 1) + C i B u ( 2 ) ;
(3.10-3)
L LL LL LL LL LL LL L LL LL LL r r r r y i( m ) = C i A m x + C i A m −1B u + C i A m −2 B u ( 1) + ... + C i B u ( m −1) Сократим запись:
r r m−1 r y i( m) = Ci Am x + Ci Am−1Bu + ∑Ci Am−1−ν Bu (ν )
(3.10-4)
ν =1
Для каждой координаты найдем максимальное число дифференr u цирований, при котором еще не появляется производная вектора , то есть, найдем такие числа m i , что
C i A m i −1B ≠ 0 и C i A m i − 2 B = 0 . Таким образом, получим систему уравнений:
r r y 1( m1 ) = C1 A m1 x + C1 A m1−1B u ; r r y 2( m2 ) = C 2 A m2 x + C 2 A m2 −1B u ; LLLLLLLLLLL r (m ) m r m −1 y p p = C p A p x + C p A p Bu .
(3.10-5)
Запишем эту систему равенств в векторно-матричном виде: m m −1 (m ) ⎡ y 1 1 ⎤ ⎡ C1A 1 ⎤ ⎡ C1A 1 ⎤ ⎢ y ( m2 ) ⎥ ⎢C A m2 ⎥ r ⎢C A m2 −1 ⎥ r ⎢ 2 ⎥=⎢ 2 ⎥x + ⎢ 2 ⎥Bu = −F* xr + B*ur . ⎢ M ⎥ ⎢ M ⎥ ⎢ M ⎥ ⎢ ( mp ) ⎥ ⎢ ⎢ mp ⎥ m p −1 ⎥ ⎣ y 1 ⎦ ⎣C1A ⎦ ⎣C1A ⎦
(3.10-6)
164
Обозначим
⎡ y1 1 ⎤ r ⎢ y 2( m2 ) ⎥ ⎥ q=⎢ ⎢ M ⎥ ⎢ ( mp ) ⎥ ⎣y1 ⎦ (m )
(3.10-7)
и m −1
⎡ C1A 1 ⎤ ⎢C A m2 ⎥ ⎥; F* = − ⎢ 2 ⎢ M ⎥ ⎢ mp ⎥ ⎣C1A ⎦
⎡ C1A 1 ⎤ ⎢C A m2 −1 ⎥ ⎥. B* = ⎢ 2 ⎢ M ⎥ ⎢ m p −1 ⎥ ⎣C1A ⎦
m
(3.10-8)
Тогда (3.10-6) можно переписать в виде
r r r q = −F* x + B* u .
(3.10-9)
B * не
Если задача разделения каналов имеет решение, то матрица вырождена и:
r r r u = B *−1q + B *−1F* x .
(3.10-10)
На рис. 3.10 представлена промежуточная структурная схема, соответствующая уравнениям (3.10-1), (3.10-2) и (3.10-8). →
q
→
u
В*-1
→
→
В
∫
x
C
y
A B*-1 F*
Рис. 3.10. Промежуточная структурная схема Для этой схемы справедливы уравнения
r r r x& = ( A + BB*−1F* )x + BB*−1q ; r r y = Cx .
(3.10-11)
Обозначим
A = A + BB*−1F* ; ∨
B = BB . ∨
−1 *
(3.10-12)
165
Теперь (3.10-11) превратится в
r r r ⎧⎪ x& = A x + B q ; V V ⎨r r ⎪⎩ y = C x ,
(3.10-13)
r
а структурная схема промежуточной системы с входным вектором q примет вид, представленный на рис. 3.11. →
→
q
x
∫
B V
→
y
C
A
V
Рис. 3.11. Структурная схема системы r относительно входного вектора q
r
r
С другой стороны, вектор выхода y связан с вектором q равенством (3.10-7) и поэтому схеме, представленной на рис. 3.11 полностью эквивалентна схема, составленная из p подсистем последовательно включённых интеграторов. Эта схема представлена на рис. 3.12.
q1
∫
∫
∫
∫
y1
m1 интеграторов
qi
∫
∫
yi
mi интеграторов
qp
∫
∫
yp mp интеграторов
Рис. 3.12. Структурная схема объекта, представленного в виде изолированных подсистем интеграторов Общее количество интеграторов не может быть больше n , то есть: 166
p
∑1 m ≤ n . i
i=
Таким образом, система { A , B } (3.10-13), у которой в качестве входного
r V вектора выбран вектор q ,
V
а) развязана по каналам, то есть y i зависит только от q i для всех значений i ; p
б) имеет
∑1 m
i
i=
собственных значений, равных нулю.
Теперь систему { A , B } нужно попытаться привести к удобному баV
V
зису, в котором синтезировать обратную связь, реализующую желаемые собственные числа по каждому каналу. Прежде всего, установим некоторые свойства матриц A и B . АнаV
V
логично (3.10-4) запишем:
y
( mi ) i
r m −1 r mi −1 m −1−ν = C i A x + C i A B q + ∑ C i A i B q (ν ) . mi
V
V
( mi )
С другой стороны, y i
Ci A V
1)
2) Ci A
mi −1
V
mi
[
V
откуда:
C i AV
V
m i −ν
V
V
= 0 для всех i = 1,2,…,p ;
V
Ci A V
ν =1
= q i . Отсюда следует:
r r r mi −1 B q = Ci A b1 b2 V
3) C i A
V
m i −1
m i −1
r bj = 0
V
⎡ q1 ⎤ r ⎢ q2 ⎥ ... bp ⋅ ⎢ ⎥ = qi , V ⎢ M ⎥ ⎢q ⎥ ⎣ ny ⎦
]
r bi = 1;
(3.10-14)
(3.10-15)
(3.10-16)
V
, при
j ≠i ;
(3.10-17)
V
r b j = 0 для ν > 1 и для всех j , i .
(3.10-18)
V
3.10.2. Преобразование базиса в пространстве Rn Перейдём от исходного базиса [e] к новому базису [f ] с помощью некоторой матрицы преобразования F е . При выборе базиса [f ] учтем, следующие обстоятельства: • Объект управляем, поэтому ранг матрицы управляемости 167
r r r r r r r n −1 n −1 U = [b1 b2 ... bp M A b1 ... A bp M ... M A b1 ... A bp ] V V V V V
V
V
V
V
V
(3.10-19)
V
равен порядку системы; • так как каждый канал этой системы с размерностью mi управляем, то столбцы
r r r r r r m1 −1 m p −1 b1, A b , ... , A b , ... , b , A b , ... , A b p p p 1 1 V V V V V
V
V
V
V
V
линейно независимы. Теперь выберем базис [f ] , соответствующий следующим координатным столбцам:
r r r r r r m1−1 m1− 2 fe1 = A b1 ; fe 2 = A b1 ; ...; fe m1 = b1 ; ∨ ∨ ∨
∨
∨
r r r r r r m2 −1 m2 − 2 fe m1+1 = A b2 ; fe m1+2 = A b2 ; ... ; fe m1+m2 = b2 ; ∨ ∨ ∨
∨
(3.10-20)
∨
..................................
r r r r r r m p −1 mp − 2 fe m1+...+mp−1+1 = A bp ; fe e m1+...+mp−2 = A bp ; f e m1+...+mp = bp ; ∨ ∨ ∨
∨
p
Если
< n , то оставшуюся часть векторов базиса [fост ] можно выби-
∑m i =1
∨
i
рать, перебирая оставшиеся столбцы матрицы U :
r m1+1 r r m1 ν 1 −1 A b , A b ,... A b 1 1 1 V V V V
V
V
r до тех пор, пока следующий вектор A b1 не будет выражаться в виде V ν
V
линейной комбинации всех предыдущих векторов базиса. Далее добаr m2 +1 r m2 вим A b2 , A b2 и так далее, пока число векторов базиса не достигV
V
V
V
нет числа n . Тогда матрица преобразования базиса [e] в базис [f ] будет иметь вид
Fe = [A V
m1−1
r r r r r r m −2 m2 −1 L b1 L A 1 b1 L b1 L A b L b b [fост ]]. 2 2 p V ∨
V
V
V
V
V
∨
Рассмотрим вид матрицы B в базисе [f ] . Первый столбец этой
V r матрицы, то есть вектор b1 совпадает с m1 -м столбцом базиса [f ] ; втоr рой столбец матрицы B , то есть вектор b2 совпадает с ( m1 + m2 ) -м столбцом базиса [f ] и так далее. Следовательно,
168
r
⎡ β1 0 r ⎢ ⎢ 0 β2 Bf = ⎢L L ⎢ ⎢0 0 ⎢⎣ 0 0
L L L L L
0⎤ ⎥ 0⎥ L⎥ , r ⎥ βp ⎥ 0 ⎥⎦
(3.10-21)
где
⎫ ⎪ ⎪⎪ ⎬mi строк. ⎪ ⎪ ⎪⎭
⎡0⎤ ⎢0⎥ r ⎢ ⎥ β i = ⎢L⎥ ⎢ ⎥ ⎢0⎥ ⎢⎣ 1 ⎥⎦
(3.10-22)
Теперь обратим внимание на матрицу С . В соответствии с (3.6-8)
Сf = C F
е
r ⎡ C ⎡ 1⎤ C1fe1 r ⎢ ⎢C ⎥ r r r C f 2 = ⎢ ⎥ ⋅ fe1 fe2 L fen = ⎢ 2 e1 ⎢ L ⎢M⎥ ⎢ r ⎢ ⎥ C ⎢⎣Cpfe1 ⎣ p⎦
[
]
L L L L
r C1fen ⎤ r ⎥ C2fen ⎥ . L ⎥ r ⎥ Cpfen ⎥⎦
(3.10-23)
Из этого равенства с учётом (3.10-14), (3.10-16), (3.10-17) получим:
где
⎡s1 0 L 0 0⎤ ⎢ 0 s L 0 0⎥ 2 ⎥, Cf = ⎢ ⎢ M M M M M⎥ ⎢ ⎥ 0 0 0 L s p ⎣ ⎦
(3.10-24)
si = [1 0 L 0] . 14 4244 3
(3.10-25)
mi
Наконец, займемся матрицей Af . Прежде всего, рассмотрим важV
ную интерпретацию элементов матрицы Af . В соответствии с (3.6-8)
Аf = Fе −1 Ае Fе , поэтому
Fе Аf = Ае Fе .
(3.10-26) 169
Левую часть этого равенства можно расписать следующим образом:
⎡a11f a12f L a1fn ⎤ r r r ⎢ ⎥ Fе Аf = fe1 fe2 ... fen ⋅ ⎢ M M M M ⎥= f ⎢⎣anf 1 anf 2 L ann ⎥⎦ r r r r r r f = [a11f fe1 + ... + anf 1fen a12f fe1 + ... + anf 2fen L a1fn fe1 + ... + ann fen ] .
[
]
С другой стороны:
r r Ае Fе = [Ае fe1 L Аеfen ].
Таким образом, получаем:
r r r r Aefei = a1fi fe1 + a2f i fe 2 + ... + anif fen .
(3.10-27)
Это означает, что элементы i -го столбца матрицы Af V
⎡ a1i ⎤ r f ⎢a2f i ⎥ ai = ⎢ ⎥ ⎢L ⎥ ⎢⎣a f ⎥⎦ ni f
r r являются коэффициентами разложения произведения A fei ≡ Ae fei по ∨ ∨ r r r координатным векторам fe1 , fe 2 , ..., fen . r Используя , (3.10-20), сопоставим произведения A fei с координат∨
ными столбцами векторов базиса [f ] :
r r m A fe1 = A 1 b1 ; ∨ ∨ ∨ r r r m1−1 A fe 2 = A b1 = fe1 ; ∨ ∨ ∨ r r r m1− 2 A fe 3 = A b1 = fe 2 ; ∨
∨
(3.10-28)
∨
LLLLLLLL . Так как A fe1 , A fe m1+1 т. д. не совпадают ни с одним из собственных V
V
p
векторов с номерами от 1 до n − ∑ mi − 1, то в соответствующих столбi =1
цах матрицы Af на позициях строк с номерами, большими p , могут наV
ходиться ненулевые элементы. Такие ячейки матрицы помечены симво170
лом " × ". Кроме того, на данном этапе нет смысла рассматривать столбцы этой матрицы с номерами, большими p . В результате получаем выражение для матрицы A в базисе [f ] : ∨
171
Af = V
010…0 001…0 …………. 000…1 000…0
000…0 000…0 …………. 000…0 000…0
: : : : :
000…0 000…0 …………. 000…0 000…0
000…0 0 0 0… 0 ………… 000…0 000…0 …………. 000…0 000…0 …………. 000…0 000…0 *00…0 …………. *00…0
010…0 001…0 …………. 000…1 000…0 …………. 000…0 000…0 …………. 000…0 000…0 *00…0 …………. *00…0
: : : : :
000…0 000…0 …………. 000…0 000…0 …………. 010…0 001…0 …………. 000…1 000…0 *00…0 …………. *00…0
m1
m2
: : : : : : : :
mp
m1
m2
mp
n − ∑ mi n − ∑ mi
Эту же матрицу удобнее записать в блочном виде:
⎡ A11 ⎢ 0 ⎢ A = ⎢ M V f ⎢ 0 ⎢ ⎢⎣ A 01
0 A10 ⎤ 0 A 20 ⎥ ⎥ M M ⎥. (3.10-29) A p p A p 0 ⎥⎥ A 0 p A 00 ⎥⎦ r Разобьём вектор состояния x на систему ( p + 1) частных векторов и обозначим
0 A 22 M 0 A 02
L L M L L
r z ⎡ 1⎤ ⎢ zr ⎥ ⎢ 2⎥ r xf = ⎢ M ⎥ , ⎢ zr ⎥ ⎢ rp ⎥ ⎢⎣ z 0 ⎥⎦
(3.10-30)
172
r
где zi имеет размерность [mi × 1] . Тогда уравнения (3.10-13) в базисе [f ] примут вид:
r ⎡ z&1 ⎤ ⎡ A11 ⎢ r& ⎥ ⎢ ⎢z2 ⎥ ⎢ 0 ⎢ M ⎥ =⎢ M ⎢ r& ⎥ ⎢ ⎢zp ⎥ ⎢ 0 ⎢⎣zr& ⎥⎦ ⎢⎣ A01 0
0 A22 M 0 A02
0 L 0 M M L Ap p L A0 p L
r r A10 ⎤ ⎡ z1 ⎤ ⎡ β 1 r A20 ⎥ ⎢ z 2 ⎥ ⎢ 0 ⎥ ⎢ ⎥ ⎢ M ⎥∗⎢ M ⎥+⎢ M r ⎢ A p 0 ⎥⎥ ⎢z p ⎥ ⎢ 0 ⎢r ⎥ A00 ⎥⎦ ⎢⎣ z 0 ⎥⎦ ⎢⎣ 0
⎡ y 1 ⎤ ⎡s1 0 L 0 ⎢y ⎥ ⎢ 0 s L 0 2 ⎢ 2⎥ = ⎢ ⎢ M ⎥ ⎢M M M M ⎢y ⎥ ⎢ 0 0 L s p ⎣ p⎦ ⎣
0 r
β2 M 0 0
r z ⎡ ⎤ 0⎤ ⎢ r1 ⎥ z 0⎥ ⎢ 2 ⎥ ⎥ ∗⎢ M ⎥. M⎥ ⎢r ⎥ z 0⎥⎦ ⎢ rp ⎥ ⎢⎣z0 ⎥⎦
L 0 ⎤ ⎡ q1 ⎤ ⎥ ⎢ ⎥ L 0 ⎥ ⎢q 2 ⎥ M M ⎥∗⎢ M ⎥; r ⎥ ⎢ ⎥ L βp ⎥ ⎢ M ⎥ L 0 ⎥⎦ ⎢⎣q p ⎥⎦
(3.10-31)
Отсюда следуют уравнения для частных подсистем:
r r r r z& i = A ii z i + A i 0 z 0 + β i q i r (i = 1,2,..., p ) y i = s i zi , p r r r z& 0 = ∑ A0ν zν + A00 z 0 .
(3.10-32)
(3.10-33)
ν =1
Раскроем систему дифференциальных уравнений для i -й подсистемы:
r ⎧z& i 1 = zi 2 + a1i 10 z0 = zi 2 + g i 1 ⎪ ⎪z& i 2 = zi 3 + g i 2 ⎪ ⎪ , ⎨................. ⎪ ⎪z& i ,mi −1 = zi ,mi + g i ,mi −1 ⎪ ⎪⎩z& i ,mi = g i ,mi + q i
{y
i
(3.10-34)
= zi 1
где a - первая строка матрицы Ai 0 . Такой подсистеме соответствует структурная схема, представленная на рис. 3.13. i 10 1
173
gi 2
g i mi qi
∫
zi mi
zi 3
gi1
∫
zi 2
∫
zi 1
yi
Рис. 3.13. Структурная схема частной подсистемы Из сопоставления этой схемы со схемой, приведённой на рис. 3.12, следует: (ν ) а) zi 1 = y i ; ziν = y i при ν > 1;
б) q iν = 0 и Aν 0 = 0 для ν = 1,2,..., p . Таким образом, выходы интеграторов частных подсистем, покаr занных на рис. 3.12, совпали с координатами вектора x в базисе [f ] . Кроме того, все блочные матрицы A00 , A10 ,..., A p 0 в (3.10-29)- нулевые.
3.10.3. Формирование управления Работая в базисе [f ] , мы имеем p изолированных подсистем, сумма выходов которых подаётся на вход общей подсистемы с матриp
цей динамики A00 размерности n − ∑ mi :
r
i =1
r r ⎧z&1 = A11z1 + β 1q1; y 1 = z11 ; ⎪ ⎪................... ⎪ ⎨zr& = A zr + βr q ; y = z ; pp p p p p p1 ⎪ p ⎪ p ⎪zr& = A zr + ∑ A zr . 00 0 0ν ν ⎩ 0 ν =1
(3.10-35)
Соответствующая структурная схем представлена на рис. 3.14.
r
Пары матриц { Aii , β i } для i = 1, 2 , ... , p имеют форму УКП, причем, каждая из матриц A ii имеет только нулевые собственные значения. Это вполне согласуется с тем, что в п. 3.10.1 было произведено преобразование объекта на подсистемы последовательно включённых интеграторов. Сформируем управление q i для i = 1, 2 , ... , p в следующем виде:
r qi = ki v i (t ) + l fi zi (t ) ,
(3.10-36)
174
А11 q1
→
∫
β1
А01 →
z1 ... ..... .... ..... .... ..... .... →
qp
∫
→
βp
zp
∑
A0p
∫
→ z0
A00
Ap,p
Рис. 3.14. Структурная схема объекта в базисе [f ] где
l fi = [l if1
l if2
K
l if,m i ] -
матрица обратной связи для i -й подсистемы в базисе [f ] . Тогда получим следующее дифференциальное уравнение для i -й подсистемы:
r r r r& r z i = Aii z i + β i l fi z i + β i k i v i ,
или
r r r z& i = χ fi z i + β i k i v i .
(3.10-37)
Нетрудно убедиться, что матрица динамики i -й подсистемы в базисе [f ] имеет вид
⎡0 1 ⎢0 0 ⎢ χ fi = ⎢ M M ⎢ ⎢0 0 ⎢⎣l if1 l if2
0 1 M 0 l if3
L 0 ⎤ L 0 ⎥ ⎥ M M ⎥. ⎥ L 1⎥ L l if,mi ⎥⎦
(3.10-38)
Следовательно, определены характеристические полиномы подсистем:
ϕ i ( λ ) = λmi − l if,mi λmi −1 − l if,mi −1λmi −2 − ... − l if1 .
(3.10-39)
Согласно (3.8-22) а также с учетом (3.10-13), (3.10-24) и (3.10-37) запишем выражение для передаточной функции замкнутой i -й подсистемы: 175
Wv i y i ( p ) =
p mi
ki . − l if,mi p mi −1 − ... − l if1
(3.10-40)
Очевидно:
W v i y i (0 ) =
ki . − l if1
(3.10-41)
Задавая расположение полюсов и статику для каждой подсистемы, в итоге получим матрицы:
⎡l f 1 0 L 0 ⎢0 l L 0 f2 Lf = ⎢ M M M ⎢M ⎢0 0 L l f ,p ⎣
0⎤ ⎡k 1 0 L 0 ⎤ ⎢0 k L 0 ⎥ 0⎥ 2 ⎥ ; k=⎢ ⎥. M⎥ ∨ ⎢ M M M M⎥ ⎢0 0 L k ⎥ 0⎥⎦ p⎦ ⎣
(3.10-42)
Возвращаясь в исходный базис для уравнений (3.10-13), получим:
r
LV = Lf Fе −1 .
(3.10-43)
При этом вектор q формируется в соответствии с выражением
r r r q(t ) = LV x(t ) + k∨ v (t ) .
(3.10-44)
Учитывая (3.10-10), окончательно получим:
r r r r r −1 −1 −1 u = B* F* x + B* LV x + B* kV V (t ) = Lx + kV ,
(3.10-45)
где
L = B*−1 (F* + LV );
k = B*−1 kV .
(3.10-46)
На этом можно закончить синтез, если часть системы, оказавшаяся вне обратной связи, имеет допустимые динамические свойства. Если же нет, например, A00 - неустойчива, то приходится идти на то, чтобы ввести
r
обратную связь L0 , по z0 , по крайней мере, через один из каналов (q r ) , оставив полностью развязанными остальные ( p − 1) каналов. В этом случае k r , l fr , l f 0 нужно рассчитывать совместно. Связь L0 должна обесV
печить «надзор» за бывшими ранее без контроля ( n − ∑ mi ) полюсами (собственными числами) системы. Эта часть расчета может быть произведена по обычной методике синтеза системы с одним входом. Результирующая структура в базисе [f ] приведена на рис. 3.15.
176
l f1 А11 v1
k1
q1
V
→
∫
β1
А01 → z1
............................................ →
vi
ki
qi
∫
→
βi
V
zi
A0i
∑
A ii l fi
............................................ →
vp
kp V
qp
∫
→
βp
zp
A0p
App l fp vr
kjr V
qr
→ →
βr
∫
zj
∫
A0r
Arr
A00
l fr l f0
Рис. 3.15. Структурная схема системы в базисе [f ] 3.10.4. Итоговый алгоритм 1) Расчет чисел mi , i = 1,2,..., p :
⎧Ci A m−1B ≠ 0; mi = mmax ⎨ m −2 ⎩Ci A B = 0.
(3.10-47)
177
Эти числа можно также находить непосредственно из схемы в переменных состояния. 2) Вычисление матриц F* ,B* : m m −1 ⎡ C1 A 1 ⎤ ⎡ C1 A 1 ⎤ F* = − ⎢ M ⎥; B* = ⎢ M ⎥B. ⎢ ⎥ ⎢ ⎥ mp m p −1 ⎢⎣C p A ⎥⎦ ⎢⎣C p A ⎥⎦
(3.10-48)
−1
3) Вычисление B* . Если B* - вырождена, то задача разделения каналов не имеет решения. 4) Вычисление матриц A, B : V
V
A = A + BB*−1 F* ; B = BB*−1 . { V V
(3.10-49)
B v
5. Построение матрицы Fe :
r r r r r m −1 m −1 Fe = ⎡⎢ A 1 b1 M...M b1 MM A 2 b2 M...M b2 M...M bp M[fост ]⎤⎥ . V V V V V ⎣V ⎦ V
(3.10-50)
6. Расчет коэффициентов характеристических уравнений каналов, то есть строк l fi . Для этого предварительно должны быть заданы наборы желаемых собственных чисел ( λi 1 , λi 2 , ... , λi mi ) по каждому из каналов, после чего в соответствии с равенством mi
( λ − λ iν ) =λm − l if,m λm −1 − l if,m −1λm − 2 − ... − l if1 ∏ ν =1 i
i
i
i
i
(3.10-51)
следует рассчитать
l fi = [l if1 ... l if,mi ].
(3.10-52)
и сформировать матрицу
⎡l f 1 0 L 0 ⎤ ⎢0 l L 0⎥ f2 ⎥ .. Lf = ⎢ ⎢M M M M⎥ ⎢ ⎥ 0 0 L l fp ⎦ ⎣ 7. Расчет (построение в соответствии с выбранным базисом) матрицы A00 и вычисление ее собственных чисел. 8. Принятие решения о необходимости завязки каналов для коррекции собственных чисел полинома ϕ 0 ( λ ) . В случае необходимости - выбрать канал для коррекции и далее провести для него расчет по ме178
тодике синтеза системы с одним входом. В конечном итоге должна быть получена Lf - полная матрица обратной связи промежуточной системы в базисе [f ] . 9. Расчет матрицы k по заданным коэффициентам Wi (0) : V
k i = −Wi (0)l if1
(3.10-53)
⎡k 1 0 L 0 ⎤ ⎢V ⎥ 0 k 0 L 2 ⎢ ⎥ V kV = ⎢ . M M M M⎥ ⎢ ⎥ ⎢ 0 0 L kp ⎥ ⎣ V ⎦
(3.10-54)
V
и
10. Расчет матрицы обратной связи промежуточной системы в исходном базисе
LV = Lf Fe −1.
(3.10-55)
11. Расчет результирующей матрицы обратной связи
L = B*−1(F* + LV ) .
(3.10-56)
12. Расчет матрицы передаточных коэффициентов по вектору командных сигналов
k = B*−1 kV .
(3.10-57)
Вектор управления формируется традиционным образом:
r r r u ( t ) = L x ( t ) + kv ( t ) .
(3.10-58)
При необходимости может быть синтезирован идентификатор (наблюдатель) неизмеряемых координат вектора состояния.
179
3.11. Основы построения идентификаторов состояния (наблюдателей) 3.11.1. Наблюдатель Люенбергера полного порядка 3.11.1.1. Синтез архитектуры наблюдателя Рассмотрим линейную стационарную систему, которая описывается векторно-матричными дифференциальными уравнениями:
r r r ⎧ x& (t ) = Ax (t ) + Bu(t ); ⎨r r ⎩y (t ) = Cx(t ).
(3.11-1)
Для такой системы существуют алгоритмы модального синтеза, которые позволяют найти управление:
r r r u (t ) = Lx (t ) + kv (t ) ,
(3.11-2)
обеспечивающее заданные динамику и статику системы. Проблема заключается в необходимости использования вектора обратной связи для формирования такого управления. Фактически в распоряжении разраr ботчика системы управления лишь вектор выхода y (t ) . Возникает воr r прос: как, наблюдая за вектором y (t ) , восстановить вектор x (t ) , или
)r
r
найти его оценку x (t ) ? При этом ошибка оценки вектора x (t )
)r r r e ( t ) = x ( t ) − x (t )
(3.11-3)
должна быть относительно малой, и тем более, с течением времени не должна расти. Будем полагать, что разработчику достаточно хорошо известны
) ) )
параметры объекта, то есть оценки A, B, C , матриц A, B, C . Более того, положим
) ) ) A = A, B = B, C = C .
(3.11-4)
В этом случае, если построить аналоговую или цифровую модель объекта в соответствии с уравнениями
)r& )r r x = Ax (t ) + Bu(t ); )r )r y (t ) = Cx (t ) ,
(3.11-5)
как показано на рис. 3.16, то можно было бы ожидать выполнения равенств
)r r )r r x = x и y = y.
(3.11-6)
180
r u
r x
Объект Рис.4
)r x
В Модель объекта
r y
А
Рис. 3.16. Неудачный вариант построителя оценки вектора состояния Однако, априорное знание объекта (в том числе, матриц A , B и C ) является приближённым, параметры его могут дрейфовать во времени, начальные условия для вектора состояния, которые следовало бы подставить в модель, неизвестны. Поэтому в действительности в такой схеме ошибка оценки вектора состояния может иметь склонность к неограниченному росту с течением времени. Американским учёным Д.Г.Люенбергером впервые были изучены структуры работоспособных асимптотических идентификаторов (наблюдателей, восстановителей) вектора состояния, названных позднее его именем. Основополагающая идея состоит в том, чтобы в рассмотренную структурную схему ввести дополнительную обратную связь по ошибке r оценки вектора y , заведомо обеспечивающую асимптотическое затухание ошибки оценки вектора состояния. Внешне структурная схема наблюдателя Люенбергера полного порядка, которая приведена на рис. 3.17, совпадает с одной из форм известного фильтра Калмана. Различие в том, что матрица K , которая в фильтре Калмана называется его именем (матрицей Калмана), в наблюдателе Люенбергера рассчитывается из других соображений.
181
r u
r x& В
r x
∫
r y C
A
объект
r ey
K
)r& x
B
)r x
∫ A
C
)r y
Модель объекта
Наблюдатель
Рис. 3.17. Наблюдатель Люенбергера полного порядка В соответствии с рис.3.17 уравнение наблюдателя будет иметь вид:
(
)
)r& )r )r r r x ( t ) = Ax ( t ) + Bu ( t ) + K y ( t ) − y ( t ) .
(3.11-7)
Получим уравнение для ошибки оценки вектора состояния. Для этого в равенство (3.11-3) подставим выражения для вектора состояния и его оценки из (3.11-1) и (3.11-7):
(
)
)r )r r r r r r e& (t ) = Ax(t ) + Bu (t ) − Ax (t ) − Bu(t ) − K Cx(t ) − Cx(t ) ,
откуда
r r e& (t ) = L ⋅ e(t ) ,
(3.11-8)
L = (A − KC)
(3.11-9)
где называют матрицей динамики наблюдателя. Выражение (3.11-8) является однородным дифференциальным уравнением. Решение его имеет вид:
r r e(t ) = exp(L ⋅ t ) ⋅ e (0) .
(3.11-10)
Поведение ошибки во времени зависит от собственных чисел матрицы наблюдателя L . Выбрав их соответствующим образом, можно достаточно быстро свести ошибку к нулю, и получать от наблюдателя точную оценку вектора состояния. Далее будет показано, что если пара {A, C} наблюдаема, то соответствующим выбором матрицы K можно обеспечить любое желаемое расположение собственных чисел наблюдателя, 182
т.е. матрицы
L
. Практически, собственные значения наблюдателя вы-
)r бираются так, чтобы состояние наблюдателя x сходилось к состоянию
наблюдаемой системы несколько быстрее затухания переходных процессов в желаемой замкнутой системе. Чрезмерное ускорение наблюдателя приводит к затруднениям при его реализации. 3.11.1.2. Алгоритм определения матрицы К для систем со скалярным входом. Если пара {A,C} наблюдаема, то в пространстве вектора состояния существует базис [i ] , в котором эта пара имеет идентификационное каноническое представление (ИКП) {AI , CI }. Обозначим некоторый исходный базис как [h] . В этом базисе дифференциальное уравнение для ошибки оценки вектора состояния имеет вид
r r e&h (t ) = L h eh (t ) .
(3.11-11)
Перейдём к базису ИКП. Используем уже известное соотношение, связывающее координатные столбцы одного и того же вектора в разных базисах
r r eh = I h eI .
(3.11-12)
Используя эту подстановку, запишем
r r I h ⋅ e&I (t ) = L h ⋅ I h ⋅ eI (t ) . Умножив обе части последнего равенства на I
−1 h
, получим
r r e&I (t ) = L I eI , где
L I = I h−1L hI
.
(3.11-13)
L I = AI − K ICI ,
(3.11-14)
h
Кроме того, где
AI = I
−1 h
Ah I h ;
CI = Ch I h ; K I = I
−1
h
Kh.
(3.11-15)
Матрица динамики наблюдателя в базисе ИКП в соответствии с уравнением (3.11-4) имеет вид: . 183
⎡ 0 0 0 K 0 0 −α n ⎤ ⎡ 0 0 K 0 K I1 ⎤ ⎢ 1 0 0 K 0 0 −α ⎥ ⎢ 0 0 K 0 K ⎥ I2 n −1 ⎢ ⎥ ⎢ ⎥ ⎢ 0 1 0 K 0 0 − α n −2 ⎥ ⎢ 0 0 K 0 K I 3 ⎥ LI = ⎢ ⎥ − ⎢K K K K K ⎥ = K K K K K K K ⎢ ⎥ ⎢ ⎥ ⎢ 0 0 0 K 1 0 − α 2 ⎥ ⎢ 0 0 K 0 K In −1 ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ 0 0 0 K 0 1 − α 1 ⎦ ⎣ 0 0 K 0 K In ⎦ ⎡ 0 0 0 K 0 0 − βn ⎤ ⎢1 0 0 K 0 0 − β ⎥ n −1 ⎢ ⎥ = ⎢K K K K K K K ⎥, ⎢ ⎥ ⎢ 0 0 0 K 1 0 − β2 ⎥ ⎢⎣ 0 0 0 K 0 1 − β1 ⎥⎦ где β j – коэффициенты характеристического полинома наблюдателя, которые вычисляются на основании желаемых собственных чисел наN блюдателя λi согласно выражению
ϕ L (λ ) = ∏ (λ − λNi ) =λn + β 1λn −1 + ... + β n . n
(3.11-16)
i =1
Очевидно выражение для элементов матрицы K в базисе ИКП:
k I j = β n +1− j − α n +1− j , j = 1, 2 , ..., n .
(3.11-17)
Перевод матрицы K в исходный или какой-либо другой базис может быть произведён в соответствии с выражением (3.11-15). ПРИМЕР 3.11-1. Построить наблюдатель полного порядка для объекта со структурной схемой, приведённой на рис. 3.18.
u
x2
x1
y
2 Рис. 3.18. Объект для примера 3.11-1 Запишем матрицы объекта в исходном базисе:
⎡0⎤ ⎡− 2 1 ⎤ r r = = A = AH = ⎢ , b b H ⎥ ⎢1⎥ , C = CH = [1 0]. 0 − 1 ⎣ ⎦ ⎣ ⎦ 184
Характеристический полином объекта (матрицы динамики A )
ϕ A (λ ) = (λ − λ1 )(λ − λ2 ) = λ2 + 3λ + 2 , его коэффициенты
α1 = 3 ;
α2 = 2,
нули (собственные числа)
λ1 = −1; λ2 = −2 . Время переходного процесса в объекте определяется наиболее близким к мнимой оси собственным числом λ1 :
t рег ≈
3 = 3c . − λ1 1
Зададим собственные числа наблюдателя
λ1N = λN2 = −3 . Им соответствует характеристический полином наблюдателя:
ϕ L (λ ) = (λ + 3)2 = λ2 + 6λ + 9 , его коэффициенты
β1 = 6 ;
β2 = 9 .
В соответствии с (3.11-17) определяем элементы матрицы K и саму эту матрицу в базисе ИКП:
ki 1 = β 2 − α 2 = 7; k i 2 = β1 − α1 = 3 ;
⎡7⎤ KI = ⎢ ⎥ . ⎣3⎦
Для того, чтобы перевести матрицу K в исходный базис, рассчитаем матрицу наблюдаемости и обратную ей в исходном базисе
⎡ 1 0⎤ NH = ⎢ ⎥; − 2 1 ⎣ ⎦
⎡ 1 0⎤ NH−1 = ⎢ ⎥; 2 1 ⎦ ⎣
учитывая представление в базисе ИКП
⎡0 − 2⎤ CI = [0 1]; AI = ⎢ ⎥, − 1 3 ⎦ ⎣ рассчитаем в этом базисе матрицу наблюдаемости
⎡0 1 ⎤ NI = ⎢ ⎥. 1 − 3 ⎣ ⎦ 185
В соответствии с (3.11-13) вычислим матрицу перехода от исходного базиса [h] к базису ИКП [i ] :
I
H
1⎤ ⎡ 0 . = NH−1NI = ⎢ ⎥ ⎣ 1 − 1⎦
Используя (3.11-15), получим матрицу K в исходном базисе
⎡3 ⎤ KH = I HKI = ⎢ ⎥ . ⎣4⎦ Теперь можно заняться уравнением наблюдателя в исходном базисе. В соответствии с (3.11-9) имеем
⎡− 5 1 ⎤ L H = AH − K HCH = ⎢ ⎥. − − 4 1 ⎦ ⎣ Учитывая (3.11-17), запишем, опуская далее индекс исходного базиса
)r& )r x = L ⋅ x + Bu + Ky .
(3.11-18)
Тогда уравнение наблюдателя будет иметь вид:
⎫⎪ x&ˆ1 = −5xˆ1 + xˆ 2 + 3y &xˆ = −4xˆ − xˆ + 4y + u⎬⎪ . 2 1 2 ⎭ 3.11.2. Наблюдатель пониженного порядка Из предыдущего примера четко видно, что искать xˆ1 было излишне r так, как y = x1 . В тех случаях, когда некоторые координаты вектора y r совпадают с какими-либо из координат вектора x , то очевидно, что рассматриваемый выше наблюдатель – наблюдатель полного порядка выдает излишнюю информацию. Рассмотрим, каким образом можно получить наблюдатель с более простыми алгоритмами, полностью испольr зующими информацию о векторе состояния x , имеющуюся в векторе r r выхода y . В более общем случае, когда вектор y имеет размерность ny , оказывается достаточным построить наблюдатель, порядок которого равен n − ny .
r
r
Пусть вектор y имеет размерность ny и связан с вектором x равенством:
r r y = Cx ,
(3.11-19) 186
или
y 1 = c11x1 + c12 x 2 + ... + c1n x n
⎫ ⎪ y 2 = c 21x1 + c 22 x 2 + ... + c 2 n x n ⎪ ⎬. ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⎪ y ny = c ny ,1x1 + c ny ,2 x 2 + ... + c ny ,n x n ⎪⎭
(3.11-20)
Если x1, x 2 ,..., x n рассматривать как неизвестные, то здесь мы имеем n неизвестных и ny < n уравнений. Таким образом, недостаёт
(n − n ) уравнений. Полагаем, что
rankC = ny , т. е. все строки матрицы r C линейно независимы. Введем (n − ny )- мерный вектор q , дополнив матрицу C до квадратной невырожденной матрицы C p с помощью матрицы Cq : y
Запишем:
откуда следует
Обозначим
⎡C ⎤ Cр = ⎢ ⎥ . ⎣C q ⎦
(3.11-21)
r ⎡y ⎤ ⎡ C ⎤ r ⎢qr ⎥ = ⎢C ⎥ x , ⎣ ⎦ ⎣ q⎦
(3.11-22)
r y r ⎡ ⎤ x = C p−1 ⎢ r ⎥ . ⎣q ⎦
(3.11-23)
C p−1 = [Fy [ n×ny ]
тогда
Fq [n×( n −ny )] ] ,
r r r x = Fy y + Fq q .
(3.11-24)
(3.11-25)
r r Если удастся найти оценку qˆ вектора q , то можно будет вычислить оценку вектора состояния r
r
r r r xˆ = Fy y + Fq qˆ .
(3.11-26)
Так как q = C q x , то
r r r q& = Cq Ax + Cq Bu .
(3.11-27) 187
r
Подставим сюда x из (3.11-26):
r r r r q& = C q AFy y + C q AFq q + C q Bu .
(3.11-28)
r
Построим наблюдатель для вектора q . В последнем уравнении r r векторы u и y выступают в качестве входов. Если попытаться коррек-
)
( r r)
цию наблюдателя ввести традиционным образом: K y − y , то получим:
r r r r yˆ = Cxˆ = CFy y + CFq qˆ .
(3.11-29)
Но из (3.11-21) и (3.11-24) имеем
⎡C ⎤ С pC p−1 = ⎢ ⎥[Fy ⎣Cq ⎦
⎡ CFy Fq ] = ⎢ ⎣Cq Fy
CFq ⎤ = En , Cq Fq ⎥⎦
r r откуда должно следовать: CFy = E ny ; CFq = 0 , то есть, yˆ = y и инфорr
мации о q здесь нет. Поэтому примем:
(
)
)r& )r )r r r )r& q = Cq AFq q + Cq Bu + Cq AFy y + K y& − y .
(3.11-30)
Проведем необходимые преобразования. Так как
r r r y& = Cx& = СAxˆ + СBu , то с учетом (3.11-26) получим:
r r& r r yˆ = CAFy y + CAFq qˆ + CBu .
(3.11-31)
Проследим за поведением ошибки оценки
r r r Δq(t ) = q(t ) − qˆ (t ) .
r Используя полученные выше выражения для q& и 30), получим:
(
r& qˆ - (3.11-28) и (3.11-
)
r r r )r& Δq& = Cq AFq Δq − K y& − y . r r& Вычислим разность y& − yˆ : r r r r r r r y& = Cx& = CAx + CBu = CAFy y + CAFq q + CBu ___
)r )r& )r& )r )r r r y = Cx = CAx + CBu = CAFy y + CAFq q + CBu r r r& r r y& − yˆ = CAFy ( y − yˆ ) + CAFq Δq . 188
r r Так как выше было показано, что yˆ = y , то окончательно получим: r r Δq& (t ) = L q Δq ,
(3.11-32)
где матрица наблюдателя
L q = Cq AFq − KCAFq .
(3.11-33)
Очевидно, что можно «заказать динамику обнуления ошибки», выбирая К ( Cq AFq и CAFq - заданные матрицы). Матрицу К следует выбирать таким образом, чтобы обеспечить заданное расположение собственных чисел наблюдателя. Если, например, ny = 1, то Cq AFq имеет
размер [(n − ny ) × (n − n y )], а CAFq - [1× (n − n y )] и К - [(n − ny ) × 1]. В этом случае задача решается аналогично расчету наблюдателя полного порядка со скалярным выходом. Таким образом, рассчитав собственные значения матрицы Cq AFq , задавшись желаемыми собственными значениями наблюдателя пониженного порядка и получив соответствующие значения коэффициентов его характеристического полинома, легко записать выражение для матрицы K в базисе идентификационного канонического представления. После этого потребуется перевести матрицу К в исходный базис. Если известна пара матриц Cq AFq ,CAFq , то через матрицы наблюдаемости в исходном базисе и в базисе идентификационного канонического представления N h и NI , причем N h должна быть построена с использованием пары матриц Cq AFq ,CAFq , можно найти матрицу перехода от бази-
{
{
}
}
са [i ] к исходному базису [h] . Теперь следует позаботиться о реализуемости алгоритма наблюдателя. Из уравнения (3.11-30) с учетом (3.11-25) получим:
)r& )r r r r q = L q q + (Cq B − KCB )u + (Cq AFy − KCAF y )y + K y& .
(3.11-34)
Это уравнение для реализации не годится, так как в случае его использования пришлось бы осуществлять операции дифференцироваr ния вектора y (t ) . В реальных условиях на вектор выхода объекта, как правило, наложены шумы измерений и другой физической природы. Эти шумы характеризуются широким спектром, и дифференцирование существенно увеличивает шумовую составляющую в выходном сигнале.
r Для того, чтобы не решать задачу измерения y& , введем новую пе-
ременную
r
r
r
ξ = q − ky , тогда
r r r q = ξ + ky .
(3.11-35)
Проведем соответствующую замену в (3.11-34) и в результате получим первое уравнение наблюдателя: 189
r&
r
r
r
ξ = L qξ + (C q B − KCB )u + (L q K + C q AFy − KCAF y )y .
(3.11-36)
Теперь из уравнений (3.11-30) и (3.11-35) имеем:
r r r r r r xˆ = Fy y + Fq qˆ = Fy y + Fqξ + Fq Ky ,
или
r r r xˆ + (Fy + Fq K )y + Fqξ .
(3.11-37)
Это - второе уравнение наблюдателя. Таким образом, получено уравнеr r ние оценки xˆ вектора x с помощью наблюдателя пониженного порядка.
3.11.3. Наблюдатель Люенбергера минимального порядка Рассмотрим ещё один подход к формированию наблюдателя. Так же, как в п.3.11.2 сформируем матрицы Cq , C p и введём вектор
r r q(t ) = Cq x(t ) . (3.11-38) r Оценку вектора q (t ) будем искать как решение уравнения )r& )r r r q q ( t ) = L q (t ) + G y y (t ) + G u u ( t ) ,
(3.11-39)
где L , G и G - некоторые, пока неизвестные r матрицы. Как и прежде, ошибкой оценки вектора q будем считать разность q
y
u
)r r r Δ q (t ) = q (t ) − q (t ) .
(3.11-40)
В соответствии с уравнением объекта и выражением (3.11-38) запишем:
r r r q& (t ) = Cq Ax (t ) + Cq Bu (t ) .
(3.11-41)
r
Найдём дифференциальное уравнение для ошибки Δq(t ) :
r& r r r r r Δ q ( t ) = C q Ax ( t ) + C q B u ( t ) − L q q ( t ) − G y y ( t ) − G u u ( t ) .
(3.11-42)
r
Добавим и вычтем в правой части последнего равенства L q и с учётом (3.11-38) получим: q
r& r r r q Δ q (t ) = L Δ q (t ) + (Cq B − G u )u(t ) + (Cq A − G y C − L q Cq )x (t ) .
(3.11-43)
Положим
G u = Cq B
(3.11-44)
и потребуем выполнения равенства 190
Cq A − G y C − L qCq = 0 .
(3.11-45)
Тогда получим уравнение для ошибки наблюдателя
r& r Δ q ( t ) = L q Δ q (t ) .
(3.11-46)
Если назначить матрицу L так, чтобы её собственные числа лежали в левой полуплоскости достаточно далеко от мнимой оси, то ошибка наблюдателя, имеющая изначально место при ненулевых начальных условиях, будет с соответствующей скоростью стремиться к нулю. Так же быстро вектор q
r )r y ⎡ ⎤ x (t ) = C p−1 ⎢ r ⎥ (3.11-47) q ⎣ ⎦ r будет стремиться к вектору x (t ) . Вытекающее из (3.11-45) уравнение
C q A −L q C q = G y C
(3.11-48)
называется матричным уравнением Люенбергера. Теперь учтём, что задача построения наблюдателя, то есть нахож-
)r
r
дения оценки x вектора состояния x возникла из-за необходимости реализовать управление
r r r u ( t ) = Lx ( t ) + k v v ( t ) .
(3.11-49)
Сама по себе оценка вектора состояния часто не нужна. Поэтому попы-
r
∧
таемся найти r оценку Lx линейной комбинации координат вектора состояния Lx . Будем искать эту оценку в виде
)r r r Lx (t ) = χq(t ) + ηy (t ) . (3.11-50) )r r Так как с течением времени q стремится к q , то с учётом (3.11-38) и ∧
уравнения выхода объекта получим ∧r r r Lx (t ) = χCq x (t ) + ηCx (t ) ,
(3.11-51)
откуда следует
L = χC q + ηC .
(3.11-52)
Таким образом, необходимо решить следующую систему матричных уравнений:
Cq A − L qCq = G y C ;
χC q + ηC = L .
(3.11-53)
191
Эта система всегда имеет решение, если, во-первых, собственные чисq ла матриц L и A не совпадают друг с другом и, во-вторых, размерr q ность вектора q (размерность матрицы наблюдателя L )
s ≥ nu (ν − 1) ,
(3.11-54)
где nu - размер вектора управления; ν - индекс наблюдаемости. Это такое число, для которого матрица
⎡ C ⎤ ⎢ ⎥ ~ ⎢ CA ⎥ N= ⎢ L ⎥ ⎢ ν −1 ⎥ ⎣CA ⎦ имеет ранг, равный n .
(3.11-55)
Таким образом, может быть сформулирован следующий итоговый алгоритм. 1. Найти индекс наблюдаемости ν и размерность наблюдателя s . 2. Задать желаемую динамику наблюдателя и записать матрицу его q динамики L в виде матрицы, сопровождающей свой характеристический полином. y 3. Вычислить матрицы C q , G , χ , η согласно (3.11-53), а также матрицу G согласно (3.11-44). 4. Реализовать алгоритмы регулятора, включая наблюдатель Люенбергера минимального порядка: u
)r& )r r r q q (t ) = L q (t ) + G y y (t ) + G u u (t ) ; )r r r r u (t ) = χq(t ) + ηy (t ) + k v v (t ).
(3.11-56)
192
3.12. Синтез реализуемого управления, обеспечивающий заданные динамические и статические свойства системы управления 3.12.1. Динамические свойства системы с обратной связью и наблюдателем полного порядка Предполагается, что известны уравнения управляемого и наблюдаемого объекта:
rr r r ⎧⎪ x& (t ) = Ax (t ) + b u (t ); ⎨r r ⎪⎩y (t ) = Cx (t ).
(3.12-1)
Кроме того, проведён синтез управления и получены матрица L и коv эффициент k для равенства
r r r u ( t ) = Lx (t ) + k v v (t ) ,
(3.12-2)
обеспечивающего желаемые собственные числа замкнутой системы λз1, λз2 , ... λзn , или нули характеристического полинома замкнутой системы
ϕ AC (λ ) = λn + γ 1λn −1 + ... + γ n −1λ + γ n .
(3.12-3)
Предполагается также, что имеется наблюдатель
)r& )r r r x (t ) = ( A − KC )x (t ) + Bu(t ) + Ky (t ) ,
(3.12-4)
спроектированный таким образом, что его характеристический полином ϕ L (λ ) имеет коэффициенты β 1, β 2 , ... β n , соответствующие некоторой
выбранной совокупности собственных чисел λ1 , λ2 , ..., λn . Учтём, что при формировании управления фактически можно восполь)r r зоваться не самим вектором состояния x , а лишь его оценкой x , то есть N
)r r r u ( t ) = Lx (t ) + k v v (t ) .
N
N
(3.12-5)
Таким образом, рассматривается функциональная схема полной системы (объект, формирователь управления и наблюдатель), представленная на рис. 3.18
193
r v (t )
)r x
r
формирователь u (t ) управления
r y (t )
объект
наблюдатель регулятор
Рис. 3.18. Функциональная схема полной системы Запишем уравнения этой системы, то есть, совместно уравнения объекта с управлением и наблюдателя
r r) r r r ⎧⎪ x& (t ) = Ax (t ) + b Lx(t ) + Bk v v (t ); ⎨ )r& )r )r r r ⎪⎩ x (t ) = ( A − KC )x(t ) + BLx (t ) + Bk v v (t ) + KCx (t ).
(3.12-6)
С использованием блочных матриц получим
r ⎡ x& (t )⎤ ⎡ A ⎢ )r& ⎥ = ⎢ ⎣ x (t )⎦ ⎣KC
r BL ⎤ ⎡ x (t )⎤ ⎡Bk v ⎤ r )r ⎥ + ⎢ v ⎥v (t ) . ⎥ ⎢ A − KC + BL ⎦ ⎣ x (t )⎦ ⎣Bk ⎦
(3.12-7)
Поведение этой системы зависит от собственных чисел матрицы динамики полной системы
⎡ A X =⎢ ⎣KC
⎤ . A − KC + BL ⎥⎦ BL
(3.12-8)
Надо попытаться для X найти некоторую подобную матрицу, такую, чтобы можно было легко определить её собственные числа. Перейдём к подобной матрице с помощью преобразования
Xf = Fh −1X hFh .
(3.12-9)
Матрицу Fh выберем следующей:
⎡E Fe = ⎢ n ⎣E n
0n ⎤ , − E n ⎥⎦
(3.12-10)
где индекс n указывает на размеры соответствующих нулевой и единичных матриц. Легко убедиться, что Fh
⎡E
0 ⎤⎡ A
BL
−1
⎤ ⎡E
= Fh . В результате получим: 0 ⎤
− BL ⎤ ⎡ A + BL . ⎥ 0 A − KC ⎦
n Xf = ⎢ n ⎥ ⎢KC A − KC + BL ⎥ ⎢E − E ⎥ = ⎢ − E E ⎦⎣ n ⎣ ⎣ n n ⎦⎣ n⎦
194
Характеристический полином матрицы деляется следующим образом:
X
не зависит от базиса и опре-
ϕ X (λ ) = det[λE 2 n − X ] = λE n − ( A + BL ) ⋅ λE n − ( A − KC ) . Отсюда следует
ϕX (λ ) = ϕ AC (λ )ϕ L (λ ) .
(3.12-11)
Таким образом, полная система, в которой управление вычисляется в функции оценки вектора состояния, имеет 2n собственных чисел: λз1, λз2 , ... λзn , λN1, λN2 , ... λNn . Собственные числа замкнутой системы сохранили те собственные числа, были заданы при синтезе управления. Отметим, что в полной системе передаточная функция от коr r мандного сигнала v до выходного сигнала y тождественно равна передаточной функции в идеализированной системе без наблюдателя. Это действительно так, потому что по определению передаточная функция связывает изображения соответствующих переменных при нулевых наr чальных условиях. При нулевых начальных условиях выход объекта y и
)r выход наблюдателя y тождественно равны.
3.12.2. Динамические свойства системы с обратной связью управлением и наблюдателем минимального порядка В случае использования наблюдателя минимального порядка в соответствии с (3.11-56) и (3.11-44) уравнения регулятора имеют вид
)r& )r r r q q(t ) = L q(t ) + G y y (t ) + Cq Bu (t ); )r r r r u (t ) = χq(t ) + ηy (t ) + k v v (t ). С учётом управления запишем совместно уравнения объекта и наблюдателя:
)r r& r r r x (t ) = Ax (t ) + BηCx (t ) + Bχq(t ) + Bk v v (t );
)r& )r )r r r r y q q(t ) = G Cx (t ) + Cq BηCx (t ) + L q(t ) + Cq Bχq(t ) + Cq Bk v v (t ).
(3.12-12)
Отсюда матрица динамики полной системы имеет вид:
Bχ ⎡ A + B ηC ⎤ X =⎢ y q ⎥. G C C B η C L C B χ + + q q ⎣ ⎦
(3.12-13)
Перейдём к подобной матрице с помощью преобразования (3.12-9), где
195
⎡E n Fe = Fe −1 = ⎢ ⎣Cq
0 ⎤ . − E s ⎥⎦
(3.12-14)
В результате, учитывая (3.11-52) и (3.11-48), получим:
⎡ A + BL − Bχ ⎤ Xf = ⎢ ⎥. 0 L q ⎦ ⎣
(3.12-14)
Отсюда следуют те же выводы, что и полученные выше для системы с наблюдателем полного порядка.
3.12.3. Результирующий алгоритм синтеза для системы с одним входом и одним выходом 1. Для матрицы объекта A вычислить характеристический полином ϕ A (λ ) и зафиксировать его коэффициенты α1, α 2 , ..., α n . 2. В соответствии с требованиями к динамике замкнутой системы задать з з з желаемые значения собственных чисел λ 1, λ 2 , ... λ n , вычислить n
ϕ AC (λ ) = ∏ (λ + λ3 ) , i =1
то есть найти коэффициенты желаемого характеристического полинома γ 1, γ 2 , ..., γ n . 3. Рассчитать матрицу обратной связи в базисе УКП:
LU = [l u 1 l u 2
⋅ ⋅ ⋅ l u n ], где
l u j = α n +1− j − γ n +1− j .
4. Задать желаемые собственные числа наблюдателя λ1 , λ2 , ..., λn и вычислить коэффициенты характеристического полинома наблюдателя: β 1, β 2 , ... β n . 5. Рассчитать матрицу обратной связи наблюдателя в базисе ИКП: N
N
N
⎡ kI1 ⎤ ⎢k ⎥ ⎢ I2 ⎥ K I = ⎢k I 3 ⎥ , где kI j = β n +1− j − α n +1− j . ⎢ ⎥ ⎢ M ⎥ ⎢⎣ k In ⎥⎦ 6. Рассчитать матрицу перехода от исходного базиса к базису УКП U h = UUU−1 , матрицу выхода в этом базисе CU = CU h и, при наличии
196
требования обеспечить единичную статику, вычислить коэффициент по командному сигналу k = v
γn
CU 1
.
7. Рассчитать матрицу перехода от базиса [u ] (УКП) к базису [i ] (ИКП)
= NI−1 ⋅ NU и обратную ей матрицу. r 8. Рассчитать вектор b в базисе ИКП, используя переход от базиса УКП r r −1 bI = I U bU . 9. Рассчитать матрицу обратной связи L в базисе ИКП, используя переход от базиса [u ] к базису [i ] : LI = LU IU . I
U
10. Записать уравнение наблюдателя в базисе ИКП:
(
)
r r) r r v )r& xI (t ) = AI − K ICI + bI LI xI (t ) + K I y (t ) + bI k v (t ) . 11. Записать уравнение для формирования управления:
)r u(t ) = LI xI (t ) + k v v (t ) .
Уравнения, полученные в пунктах 10 и 11 – это уравнения регулятора. Следует подчеркнуть, что в них используется вектор оценки состояния объекта, записанный не в исходном базисе, а в базисе идентификационного канонического представления.
3.12.4. Итоговые примеры полного синтеза систем управления 3.12.4.1. Система со скалярными входом и выходом и наблюдателем полного порядка Задан объект, представленный структурной схемой на рис. 3.19. x1
x2
u
y 2
Рис. 3.19. Структурная схема объекта Требуется синтезировать реализуемое управление, обеспечивающее единичную статику по командному сигналу, а также динамику основного контура системы и наблюдателя в соответствии с желаемыми собственными числами
λ1з,2 = −5 ± j 5;
λ1N = λN2 = −10.
Ниже приведены промежуточные результаты расчёта. Матрица управляемости объекта и ей обратная в исходном базисе: 197
⎡0 1 ⎤ U=⎢ ⎥; 1 − 1 ⎣ ⎦
⎡1 1⎤ U −1 = ⎢ ⎥. 1 0 ⎦ ⎣
Матрица управляемости объекта и ей обратная в базисе УКП:
⎡0 1 ⎤ UU = ⎢ ; ⎥ ⎣ 1 − 3⎦
⎡3 1⎤ UU−1 = ⎢ . ⎥ ⎣ 1 0⎦
Коэффициенты характеристического полинома объекта, желаемой системы и наблюдателя:
r
⎡3⎤
α = ⎢ ⎥; ⎣2⎦
⎡10 ⎤ ⎥; 50 ⎣ ⎦
r
r
.γ = ⎢
⎡ 20 ⎤
β =⎢ . 100⎥ ⎣
⎦
Матрица обратной связи в базисе УКП:
LU = [− 48 − 7].
Матрица наблюдателя:
⎡98⎤ KI = ⎢ ⎥ . ⎣17 ⎦ Матрица перехода от исходного базиса к базису УКП:
⎡ 1 0⎤ UH = ⎢ ⎥. ⎣2 1⎦ Матрица выхода в базисе УКП:
CU = [1 0] .
Коэффициент по командному сигналу k = 50 . v
Матрица наблюдаемости базисе УКП, обратная ей и та же матрица в базисе ИКП:
⎡ 1 0⎤ NU = NU−1 = ⎢ ⎥, 0 1 ⎦ ⎣
⎡0 1 ⎤ NI = ⎢ ⎥. 1 − 3 ⎦ ⎣
Матрица перехода от базиса ИКП к базису УКП:
⎡0 1 ⎤ UI = ⎢ ⎥ . 1 3 − ⎣ ⎦ Вектор передачи управления в базисе ИКП:
r ⎡1⎤ bI = ⎢ ⎥ . ⎣ − 3⎦ 198
Матрица обратной связи в базисе ИКП:
LI = [− 7 − 27] . Матрица динамики наблюдателя в базисе ИКП:
⎡0 − 100 ⎤ . ⎥ ⎣1 − 20 ⎦
L I = AI − K ICI = ⎢
Результирующие уравнения регулятора:
) ) x&1 = −100 x 2 + u + 98 y ; ) ) ) x& 2 = x1 − 20 x 2 − 3u + 17 y ; ) ) u = −7 x1 − 27 x 2 + 50 v . В этих уравнениях индекс i при координатах вектора оценки состояния опущен. 3.12.4.2. Система со скалярными входом и выходом и наблюдателем пониженного порядка Для объекта, заданного на рис.3.19, построить наблюдатель пониженного порядка. Учесть, что управление объектом строится на основе з собственных чисел замкнутой системы λ1,2 = −5 ± 5 j . Для этого объекта
⎡− 2 1 ⎤ ⎡0⎤ A=⎢ ; B = ⎥ ⎢1⎥ ; C = [1 0], 0 1 − ⎣ ⎦ ⎣ ⎦ собственные числа объекта -
λ1 = −1,
λ2 = −2 .
Порядок объекта n = 2 , размерность выхода ny = 1, следовательно, размерность наблюдателя пониженного порядка nq = 1. Зададимся собственным числом наблюдателя λ1 = −10 (оно должно располагаться на комплексной плоскости левее собственных чисел замкнутой системы). Так как y = x1 , то примем q = x 2 . Тогда Н
⎡ y ⎤ ⎡ 1 0⎤ ⎡ x1 ⎤ ⎢q ⎥ = ⎢0 1⎥ ⎢ x ⎥ . ⎣ ⎦ ⎣ ⎦⎣ 2 ⎦ Таким образом, выбрана матрица
Cq = [0 1] .
199
Ей соответствует невырожденная квадратная матрица
⎡ 1 0⎤ C p = C p−1 = ⎢ ⎥. 0 1 ⎣ ⎦ Соответственно получаем
⎡1⎤ ⎡0⎤ Fy = ⎢ ⎥ ; Fq = ⎢ ⎥ . ⎣0⎦ ⎣1⎦ Теперь в соответствии с (3.11-33) определим
⎡− 2
L q = [0 1] ⋅ ⎢ ⎣0
1 ⎤ ⎡0⎤ ⎡− 2 1 ⎤ ⎡0⎤ − K [ ] = −1 − K . 1 0 ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ − 1⎦ ⎣1⎦ ⎣ 0 − 1⎦ ⎣1⎦
Поскольку назначено
λН = −10 , то
− 1 − К = −10 Таким образом, вид:
L q:
и
К = 9.
L q = −10 , и первое уравнение наблюдателя принимает
ξ& = −10ξ − 72y + u . r
Запишем оценку для x :
r ⎡ xˆ ⎤ ⎡ 1⎤ ⎡0⎤ xˆ (t ) = ⎢ ⎥ y (t ) + ⎢ ⎥ξ = ⎢ 1 ⎥ . ⎣− 9⎦ ⎣1⎦ ⎣ xˆ 2 ⎦ Отсюда
xˆ 2 = 9 y + ξ . Замкнем систему (сформируем управление). В п.3.12.4.1 была рассчитана матрица обратной связи
LU = [− 48 − 7].
Переведем её в исходный базис:
L = LUU e−1 = LUUUU e−1 = [− 34 − 7] . Таким образом, управление принимает вид
u = −34 y − 7 x 2 + 50v . Структурная схема полной схемы с регулятором и с наблюдателем пониженного порядка представлена на рис. 3.20.
200
v
u
50
x1 = y
объект 72
9
) x2
10 7
xˆ 2
34
Рис. 3.20. Структурная схема полной системы для примера 3.12-2 3.12.4.3. Система со скалярными входом и выходом и наблюдателем пониженного порядка Структурная схема объекта представлена на рис. 3.21.
u
x3
x2
x4
x1
y1
y2
2 Рис. 3.21. Структурная схема объекта Ему соответствуют матрицы
⎡0 ⎢0 A=⎢ ⎢0 ⎢ ⎣0
0⎤ ⎡0⎤ ⎢0⎥ 1 0 0 0⎤ 1 1 0⎥ ⎥; B = ⎢ ⎥; C = ⎡ ⎢0 0 0 1⎥ . ⎢1⎥ 0 −1 0 ⎥ ⎦ ⎣ ⎥ ⎢ ⎥ 0 1 − 2⎦ ⎣0⎦ 1
0
Требуется рассчитать управление и построить наблюдатель минимального порядка. Объект имеет собственные числа 201
λ1 = 0; λ2 = +1; λ3 = −1; λ4 = −2 и характеристический полином
ϕ A (λ ) = λ4 + 2λ3 − λ2 − 2λ . Найдём матрицу управляемости:
1 0⎤ ⎡0 0 ⎢0 1 0 1⎥ 2 3 ⎥. U = [B AB A B A B ] = ⎢ ⎢1 − 1 1 − 1⎥ ⎢ ⎥ ⎣0 1 − 3 7 ⎦ Её определитель det U = −6 , то есть отличен от нуля. Это означает, что
объект управляем. Рассчитаем закон управления (матрицу обратной связи), обеспечивающий следующие желаемые собственные числа замкнутой системы:
λ1з = λз2 = λз3 = λз4 = −1, которым соответствует характеристический полином
ϕ Ac (λ ) = λ4 + 4λ3 + 6λ2 + 4λ + 1. Таким образом, имея коэффициенты характеристических полиномов объекта и желаемой замкнутой системы
⎡2⎤ r ⎢ − 1⎥ α = ⎢ ⎥; ⎢ − 2⎥ ⎢0⎥ ⎣ ⎦
⎡4 ⎤ r ⎢6 ⎥ γ =⎢ ⎥, ⎢4 ⎥ ⎢ ⎥ ⎣ 1⎦
можно в соответствии с (3.9-18) рассчитать матрицу обратной связи в базисе УКП:
LU = [− 1 − 6 − 7 − 2] .
Чтобы найти эту матрицу в исходном базисе, нужно знать матрицу U H перехода от исходного базиса к базису УКП. Так как столбцы этой матрицы являются координатными столбцами векторов базиса [u ] (УКП) r r r u1 , u2 , ... , un в исходном базисе [h] , то, используя (3.8-6), можно записать:
202
⎡0⎤ ⎡0⎤ r ⎢0⎥ r r ⎢1⎥ r r u h 4 = bh = ⎢ ⎥ ; u h 3 = AH u h 4 + α 1bh = ⎢ ⎥ ; ⎢1⎥ ⎢1⎥ ⎢ ⎥ ⎢ ⎥ ⎣1⎦ ⎣0⎦ ⎡1⎤ ⎡2⎤ r ⎢2⎥ r r ⎢0⎥ r r r uh 2 = AH uh 3 + α 2 bh = ⎢ ⎥ ; uh1 = AH uh 2 + α 3 bh = ⎢ ⎥ . ⎢ − 2⎥ ⎢0⎥ ⎢ ⎥ ⎢ ⎥ ⎣0⎦ ⎣ − 1⎦ Таким образом, получаем:
⎡2 1 ⎢0 2 UH =⎢ ⎢0 − 2 ⎢ ⎣0 − 1
⎡1 − 1 0 1 ⎤ 0 0⎤ 6 6⎥ ⎢ 2 1 1 −1 ⎥ ⎢0 1 0⎥ − 1 3 3 . ⎥ и UH = ⎢ 1 2 ⎥ 1 1⎥ 0 1 ⎢ 3 3⎥ ⎥ ⎢0 1 0⎦ 1 4 ⎥ − 1 ⎣ 3 3⎦
В соответствии с (3.9-12)
L ≡ LH = LUU H−1 = [− 1 − 29 − 2 − 1 ]. 2 6 6 В соответствии с (3.6-8)
⎡2 1 0 0 ⎤ CU = CU H = ⎢ ⎥. 0 − 1 1 0 ⎣ ⎦ Используя (3.8-22) запишем передаточные функции:
Wu y 1 ( p ) =
1 1 ; Wu y 2 ( p ) = ; p( p + 1)( p − 1) ( p + 1)( p + 2)
Wv y 1 ( p ) = k v
p+2 v p( p − 1) ( ) ; W p = k . v y2 ( p + 1) 4 ( p + 1) 4
В замкнутой системе будет обеспечена единичная статика по координате y 1 , если задать
1 kv = . 2 ~
Теперь перейдём к синтезу наблюдателя. Построим матрицу N : 203
⎡1 ⎢ ~ ⎡ C ⎤ ⎢0 N=⎢ ⎥= ⎣CA⎦ ⎢0 ⎢ ⎣0
0⎤ 0 0 1⎥ ⎥. 1 0 0⎥ ⎥ 0 1 − 2⎦ 0 0
Ранг этой матрицы равен четырём, то есть, порядку объекта. Так как старшая степень блока CA , входящего в неё, равна единице, то индекс наблюдаемости ν = 2 и порядок наблюдателя в соответствии с (3.11-54) s = 1. Это означает, что в данном случае может быть построен наблюдатель первого порядка. Зададим единственное собственное число наN блюдателя λ1 = −4 . Отсюда сразу определяется матрица наблюдателя
L q = −4 .
Раскроем матричное уравнение Люенбергера (3.11-48), имея ввиду, что в данном случае матрица Cq имеет размер [ 4 × 1] . Для этого запишем подробно каждое слагаемое:
Cq A = [c q1 c q 2
cq 3
⎡0 ⎢0 c q 4 ]⎢ ⎢0 ⎢0 ⎣
= [0 c q1 + c q 2
cq2 − cq3 + cq 4
L qCq = [− 4c q1
− 4c q 2
− 4c q 3
1
0
0⎤ 1 1 0⎥ ⎥= 0 −1 0 ⎥ 0 1 − 2⎥⎦ − 2c q 4 ]; − 4c q 4 ];
⎡ 1 0 0 0⎤ G y C = [g y 1 g y 2 ]⎢ ⎥ = [g y 1 0 0 g y 2 ]. 0 0 0 1 ⎣ ⎦ С учётом этих выражений матричное уравнение Люенбергера можно представить в виде системы скалярных уравнений:
4c q1 = g y 1; c q1 + 5c q 2 = 0; c q 2 + 3c q 3 + c q 4 = 0; 2c q 4 = g y 2 . Аналогично поступим со вторым матричным уравнением системы (3.1153), учитывая вытекающие из этого уравнения размерности матриц χ и η: 204
χCq = [χc q1 χc q 2
χc q 4 ];
χc q 3
⎡ 1 0 0 0⎤
ηC = [η1 η2 ]⎢ ⎥ = [η1 0 0 η 2 ] 0 0 0 1 ⎣ ⎦ и
χcq1 + η1 = l1 ; χcq 2 = l 2 ; χcq 3 = l 3 ; χcq 4 + η2 = l 4 . Таким образом, получено восемь уравнений при наличии девяти неизвестных c q1 , c q 2 , c q 3 , c q 4 , g y 1 , g y 2 , η1 , η 2 , χ . Примем χ = 1. После этого легко находятся остальные неизвестные:
145 Cq = ⎡⎢ ⎣ 6 74 ⎣ 3
η = ⎡⎢−
−
29 6
−2
65 ⎤ ; ⎥ 6⎦
290 − 11⎤⎥ ; G y = ⎡⎢ ⎦ ⎣ 3
65 ⎤ . 3 ⎥⎦
В соответствии с (3.11-44) вычисляем
G u = Cq B = −2 . В результате можем записать уравнения регулятора совместно наблюдателем Люенбергера минимального (первого) порядка:
)r& )r 290 65 q(t ) = −4q(t ) − 2u(t ) + y 1 (t ) + y 2 (t ); 3 3 r) 1 74 u (t ) = v (t ) + q (t ) − y 1 (t ) − 11y 2 (t ). 2 3 Этим уравнениям соответствует структурная схема системы управления, приведённая на рис. 3.22.
205
y1
u
v
ОБЪЕКТ
y2
2
65 3
290 3
4
11 74 3 Рис. 3.22. Структурная схема системы управления.
3.12.4.4. Многомерная система с разделением каналов и наблюдателем минимального порядка Задан объект, представленный структурной схемой на рис. 3.23.
u1
y1
x3
x1
2
u2
x2
x4 y2
Рис. 3.23. Структурная схема объекта Объекту соответствуют матрицы
⎡0 ⎢0 A=⎢ ⎢1 ⎢0 ⎣
0 0 0⎤ ⎡1 ⎢0 0 0 0⎥ ⎥; B = ⎢ 1 0 0⎥ ⎢0 ⎢0 1 1 0⎥⎦ ⎣
0⎤ 0 0 1 0⎤ 1⎥ ⎥; C = ⎡ ⎢0 0 0 1⎥ . 0⎥ ⎣ ⎦ ⎥ 0⎦ 206
Расчёт матриц управляемости и наблюдаемости определяет объект как полностью управляемый и наблюдаемый. I. Синтез управления в соответствии с п.3.10. 1. Расчёт чисел m i :
C1 A 0 B = [0 0]; C1 A1B = [1 1]; C 2 A 0 B = [0 0]; C 2 A 1B = [0 1]. Отсюда следует m1 = m 2 = 2 . 2. Вычисление матриц F∗ , B∗ . При m1 = m 2 = 2
⎡ 0 0 0 0⎤ ⎡ 1 1⎤ F∗ = −CA 2 = ⎢ B CAB = = ; ⎥ ∗ ⎢0 1⎥ . − − 1 1 0 0 ⎣ ⎦ ⎦ ⎣ −1
3. Расчёт B∗ .
⎡1 − 1⎤ B∗−1 = ⎢ ⎥. ⎣0 1 ⎦ Поскольку эта матрица существует, задача разделения каналов имеет решение. 4. Вычисление матриц A, B . ∨
∨
⎡1 1 ⎡1 − 1⎤ ⎢− 1 − 1 ⎢0 1 ⎥ −1 ⎢ ⎥ B = BB∗ = ; A = A + B F∗ = ⎢ ∨ ∨ ⎢1 1 ⎢0 0 ⎥ ∨ ⎢0 1 ⎢0 0 ⎥ ⎣ ⎣ ⎦
0 0⎤ 0 0⎥ ⎥. 0 0⎥ 1 0⎥⎦
В соответствии с (3.10-13) этим матрицам отвечают уравнения
x& 1 = x 1 + x 2 + q1 − q 2 ; x& 2 = − x 1 − x 2 + q 2 ; x& 3 = x1 + x 2 ; x& 4 = x 2 + x 3 . Соответственно этим уравнениям
x 3( 2 ) = q1 ; x 4( 2 ) = q 2 , 207
то есть действительно, исходная система разбита на две независимые подсистемы, состоящие из последовательно включённых интеграторов. 5. Построение матрицы F e . В данном случае
[
r Fe = A b1 ∨
r b1
∨
r A b2 ∨
∨
∨
⎡1 ⎢− 1 r b2 = ⎢ ∨ ⎢1 ⎢0 ⎣
]
1 0 − 1⎤ 0 0 1⎥ ⎥. 0 0 0⎥ 0 1 0 ⎥⎦
Новому базису соответствуют матрицы
⎡0 ⎢0 Af = ⎢ ⎢0 ⎢0 ⎣
1 0 0⎤ ⎡0 ⎢1 0 0 0⎥ ⎥ ; Bf = ⎢ 0 0 1⎥ ⎢0 ⎢0 0 0 0⎥⎦ ⎣
0⎤ 0⎥ 1 0 0 0⎤ ⎥ ; Cf = ⎡ ⎢0 0 1 0⎥ . 0⎥ ⎣ ⎦ 1⎥⎦
6. Расчёт матрицы обратной связи промежуточной системы в базисе [f ] . Зададим желаемые собственные числа для первого канала
λ11,2 = −1± j1 и для второго канала
λ21,2 = −5 ± j 5 . Им соответствуют характеристические полиномы
ϕ1(λ ) = λ2 + 2λ + 2; ϕ 2 (λ ) = λ2 + 10λ + 50. Получаем строки матрицы Lf :
l f 1 = [− 2 − 2]; l f 2 = [− 50 − 10] и саму матрицу
0 0 ⎤ ⎡− 2 − 2 Lf = ⎢ ⎥. − − 0 0 50 10 ⎣ ⎦ Пункты 7 и 8 итогового алгоритма расчёта управления для данного случая не нужны, так как в рассматриваемом примере сумма порядков подсистем m1 + m2 равна порядку объекта, и матрица A00 отсутствует. 9. Расчёт матрицы при командном сигнале. Потребуем выполнения равенства 208
Wv 1y 1 (0) = Wv 2 y 2 (0) = 1. Тогда
k1v = 2; k 2v = 50 ∨
∨
и
⎡2 0 ⎤ kv = ⎢ ⎥. ∨ 0 50 ⎣ ⎦ 10. Расчёт матрицы обратной связи промежуточной системы в исходном базисе.
⎡0 0 0 ⎤ ⎢1 ⎡− 2 − 2 −1 ⎢ L∨ = Lf Fe = ⎢ ⎥ 0 − 50 − 10⎦ ⎢0 ⎣0 ⎢0 ⎣
0 1 0⎤ 1 0 0⎥ ⎥= 0 0 1⎥ 1 1 0⎥⎦
0 ⎤ ⎡− 2 − 2 − 2 =⎢ ⎥. 0 10 10 50 − − − ⎦ ⎣ 11. Расчёт результирующей матрицы обратной связи.
8 50 ⎤ ⎡− 1 9 L = B∗−1 (F∗ + L ) = ⎢ ⎥. ∨ − − − − 1 11 10 50 ⎣ ⎦ 12. Расчёт матрицы передаточных коэффициентов по вектору командных сигналов
⎡2 − 50⎤ k v = B∗−1 k v = ⎢ ⎥. ∨ 0 50 ⎣ ⎦ Таким образом, получено управление, использующее координаты вектора состояния объекта:
u1 = − x1 + 9 x 2 + 8 x 3 + 50 x 4 + 2v 1 − 50v 2 ; u 2 = − x1 − 11x 2 − 10 x 3 − 50 x 4 + 50v 2 . II. Синтез наблюдателя в соответствии с п.3.11.3. 1. Расчёт индекса наблюдаемости.
~
Строим матрицу N :
209
⎡0 ⎢ ~ ⎡ C ⎤ ⎢0 N = ⎢ 2−1 ⎥ = ⎣CA ⎦ ⎢1 ⎢0 ⎣
0 1 0⎤ 0 0 1⎥ ⎥. 1 0 0⎥ 1 1 0⎥⎦
Эта матрица имеет 4 линейно независимые строки, её детерминант от-
~
личен от нуля, значит rank (N ) = 4 = n . Следовательно, индекс наблюдаемости объекта ν = 2 и размерность наблюдателя s = 2 . 2. Задание динамики наблюдателя. N Зададим собственные числа λ1,2 = −10 . Соответственно матрица динамики наблюдателя
0 ⎤ ⎡− 10 Lq =⎢ ⎥. 0 − 10 ⎣ ⎦ 3. Решение системы матричных уравнений (3,11-53). y Матрица Cq имеет размерность [2 × 4] , матрицы G , γ , η - [2 × 2] . Следовательно, система скалярных уравнений, соответствующая системе матричных уравнений (3,11-53), содержит 16 уравнений и 20 неизвестных. Таким образом, мы имеем право произвольно задать 4 «лишних» неизвестных. Зададим матрицу χ единичной, то есть
⎡ 1 0⎤ ⎥. 0 1 ⎦ ⎣
χ =⎢
С учётом этого из первого матричного уравнения (3.11-53) получим следующую систему уравнений:
1) cq13 + 10c q11 = 0;
5) c q 23 + 10cq 21 = 0;
2)c q13 + cq14 + 10cq12 = 0;
6) c q 23 + c q 24 + 10cq 22 = 0;
3)c q14 + 10cq13 = g11 ;
7) c q 24 + 10cq 23 = g 21 ;
4)10cq14 = g12 ;
8) 10c q 24 = g 22 .
Второе матричное уравнение (3.11-53) преобразуется в систему скалярных уравнений
9) cq11 = −1;
13) cq 21 = −1;
10) cq12 = 9;
14) cq 22 = −11;
11) cq13 + η11 = 8;
15) cq 23 + η21 = −10; 210
12) cq14 + η12 = 50;
16) cq 24 + η22 = −50.
Совместное решение последних шестнадцати скалярных уравнений позволяет найти все элементы искомых матриц:
− 1000 ⎤ ⎡− 1 9 10 − 100 ⎤ ⎡ − 2 150 ⎤ ⎡ 0 y Cq = ⎢ ; G = ; η = . ⎥ ⎢ ⎥ ⎢ ⎥ ⎣− 1 − 11 10 100 ⎦ ⎣− 20 − 150 ⎦ ⎣200 + 1000 ⎦ Используя (3.11-44), вычислим матрицу
⎡− 1 9 ⎤ . G u = Cq B = ⎢ ⎥ ⎣− 1 − 11⎦ 4. В соответствии с полученными результатами записать уравнения регулятора, включая наблюдатель:
) ) q&1(t ) = −10q1(t ) − 1000 y 2 (t ) − u1(t ) + 9u2 (t ); ) ) q& 2 (t ) = −10q2 (t ) + 200 y 1(t ) + 1000 y 2 (t ) − u1(t ) − 11u2 (t ); ) u1(t ) = q1(t ) − 2y 1(t ) + 150 y 2 (t ) + 2v 1(t ) − 50v 2 (t ); ) u2 (t ) = q2 (t ) − 20 y 1(t ) − 150 y 2 (t ) + 50v 2 (t ).
Результирующая структурная схема замкнутой системы представлена на рис. 3.24.
211
150 -2
10
∑
-1000
∑
-9
-50
v1
u1
2
ОБЪЕКТ
50
v2 -150
y1
∑
y2
u2
-11
-20
10
∑
200 1000
Рис. 3.24. Структурная схема замкнутой системы На рис. 3.25 показана итоговая структурная схема системы управления с использованием передаточных функций. Как и отмечалось выше, передаточные функции, связывающие соответствующие координаты вектора входа и вектора выхода системы не зависят от наличия наблюдателя. Из рисунка хорошо видно, что результирующая система имеет полностью развязанные каналы, по каждому из каналов обеспечены единичная статика и заданные при синтезе собственные числа ( полюсы передаточных функций).
212
v1
v2
2 p 2 + 2p + 2 50 p 2 + 10 p + 50
y1
y2
Рис. 3.25. Итоговая структурная схема системы управления
213
СПИСОК ЛИТЕРАТУРЫ 1.Андреев Ю.Н. Управление конечномерными линейными объектами. –М.: Наука, 1976. –424 с. 2.Бесекерский В.А., Попов Е.П. Теория систем автоматического регулирования. –М.: Наука, 1982. –304 с., ил. 3. Воронов А.А. Устойчивость, управляемость, наблюдаемость М.:Наука, 1979.-335с.,ил. 4.Деруссо П., Рой Р., Клоуз С. Пространство состояний в теории управления. –М.: Наука, 1970. –620 с., ил. 5.Ерофеев А.А. Теория автоматического управления: учебник для вузов. -СПб.: Политехника, 1998. -295 с.: ил. 6.Квакернаак Х., Сиван Р. Линейные оптимальные системы управления. –М.: Мир, 1977. –650 с., ил. 7.Красовский А.А., Поспелов Г.С. Основы автоматики и технической кибернетики, М.-Л.. Госэнергоиздат, 1962, 600 с. с черт. 8.Острём К., Виттенмарк Б. Системы управления с ЭВМ: Пер с англ. –М.: Мир, 1987. –480 с., ил. 9.Попов Е.П. Теория линейных систем автоматического регулирования и управления. –М.: Наука, 1978. –256 с., ил. 10.Попов Е.П. Теория нелинейных систем автоматического регулирования и управления. –М.: Наука, 1979. –256 с., ил. 11.Сборник задач по теории автоматического регулирования и управления: Под ред. В.А.Бесекерского. 5-е изд., перераб. И доп.-М.: Наука, 1978 с.-510с.,ил. 12.Синтез дискретных регуляторов при помощи ЭВМ/В.В.Григорьев, В.Н.Дроздов, В.В.Лаврентьев, А.В.Ушаков–Л.: Машиностроение, Ленингр. отд-ние, 1983. –245 с.. 13.Современная теория управления. / Под ред. Леондеса К.Т. –М.: Наука, 1970. –512 с., ил. 14.Теория автоматического управления. Часть I/ Под ред. Нетушила А.В. –М.: Высшая школа, 1968. –424 с., ил. 15.Теория автоматического управления. Часть II/ Под ред. Нетушила А.В. –М.: Высшая школа, 1972. –432 с., ил. 16.Теория автоматического управления. Часть I/ Под ред. Воронова А.А. –М.: Высшая школа, 1977. –303 с., ил. 17.Теория автоматического управления. Часть II/ Под ред. Воронова А.А. –М.: Высшая школа, 1977. –288 с., ил. 18.Ту, Юлиус Т. Цифровые и импульсные системы автоматического управления. Пер. С англ. М., Машиностроение, 1964. 18. Топчеев Б.И., 19.Ту Ю.Т. Современная теория управления. . –М.: Машиностроение, 1965. –704 с. 20.Циплаков А.П. Задачник по теории автоматического регулирования. М.: Машиностроение,1977 С.-592 с., ил. 214
21.Цыпкин Я.З. Основы теории автоматических систем. –М.: Наука, 1977. –560 с., ил.
215
ОГЛАВЛЕНИЕ 1.
ВВЕДЕНИЕ В ТЕОРИЮ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ .......................5
2.
МЕТОДЫ АНАЛИЗА НЕПРЕРЫВНЫХ СИСТЕМ.............................................20
2.1. 2.2. 2.3.
ПОНЯТИЕ ПРОСТРАНСТВА СОСТОЯНИЙ ....................................................................20 ЛИНЕАРИЗАЦИЯ ИСХОДНЫХ УРАВНЕНИЙ ..................................................................22 ЛИНЕЙНЫЕ СИСТЕМЫ, ЗАДАННЫЕ ОБЫКНОВЕННЫМИ ДИФФЕРЕНЦИАЛЬНЫМИ УРАВНЕНИЯМИ В НОРМАЛЬНОЙ ФОРМЕ КОШИ.......................................................................32 2.3.1. ОДНОРОДНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ .................................................32 2.3.2. РЕШЕНИЕ НЕОДНОРОДНЫХ ВЕКТОРНО-МАТРИЧНЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ .........................................................................................................................36 2.4. НЕКОТОРЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ.............................................................37 2.4.1. СОБСТВЕННЫЕ ЧИСЛА, ХАРАКТЕРИСТИЧЕСКИЙ ПОЛИНОМ, ПРИСОЕДИНЕННАЯ МАТРИЦА ..................................................................................................................37 2.4.2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ ТРАНСПОНИРОВАННОЙ МАТРИЦЫ .................................................................................................................41 2.4.3. ОПРЕДЕЛЕНИЕ ФУНКЦИИ ОТ МАТРИЦЫ ЧЕРЕЗ ЕЁ ЛЕВЫЕ И ПРАВЫЕ СОБСТВЕННЫЕ ВЕКТОРЫ ..................................................................................................................44 2.5. СВОЙСТВА ДВИЖЕНИЙ ЛИНЕЙНЫХ СИСТЕМ ..............................................................49 2.5.1. МАТРИЧНАЯ ВЕСОВАЯ И ПЕРЕХОДНАЯ ФУНКЦИИ ...................................................49 2.5.2. МОДАЛЬНАЯ (СПЕКТРАЛЬНАЯ) ИНТЕРПРЕТАЦИЯ РЕШЕНИЯ ВЕКТОРНО-МАТРИЧНЫХ ДИФФЕРЕНЦИАЛЬНЫХ ЛИНЕЙНЫХ СТАЦИОНАРНЫХ УРАВНЕНИЙ ...................................54 2.6. МОДЕЛИ СТАЦИОНАРНЫХ ЛИНЕЙНЫХ СИСТЕМ В КОМПЛЕКСНОЙ ПЛОСКОСТИ НА ОСНОВЕ ПРЕОБРАЗОВАНИЯ ЛАПЛАСА ..................................................................56 2.6.1. МАТРИЦА ПЕРЕДАТОЧНЫХ ФУНКЦИЙ ....................................................................56 2.6.2. ОСНОВНЫЕ СВОЙСТВА ПЕРЕДАТОЧНЫХ ФУНКЦИЙ .................................................62 2.7. КОМПЛЕКСНЫЙ ПЕРЕДАТОЧНЫЙ КОЭФФИЦИЕНТ ......................................................65 2.7.1. СПОСОБЫ ОПРЕДЕЛЕНИЯ ПОНЯТИЯ «КОМПЛЕКСНЫЙ ПЕРЕДАТОЧНЫЙ КОЭФФИЦИЕНТ» ........................................................................................................65 2.7.2. РЕАКЦИЯ ДИНАМИЧЕСКИХ ЗВЕНЬЕВ НА ГАРМОНИЧЕСКИЕ ВОЗДЕЙСТВИЯ .................66 2.7.3. ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ .............................................................................68 2.8. ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ОБЪЕКТОВ И СИСТЕМ УПРАВЛЕНИЯ ........................71 2.8.1. СОГЛАШЕНИЕ ОБ ОБОЗНАЧЕНИЯХ ........................................................................71 2.8.2. СТРУКТУРНЫЕ СХЕМЫ И ГРАФЫ СТАЦИОНАРНЫХ СИСТЕМ ......................................73 2.9. УСТОЙЧИВОСТЬ СИСТЕМ .........................................................................................86 2.9.1. АСИМПТОТИЧЕСКИЕ СВОЙСТВА СОБСТВЕННОГО ДВИЖЕНИЯ И ВЕСОВОЙ МАТРИЦЫ ЛИНЕЙНОЙ СИСТЕМЫ ................................................................................................86 2.9.2. НЕОБХОДИМОЕ УСЛОВИЕ УСТОЙЧИВОСТИ ............................................................89 2.9.3. КРИТЕРИЙ УСТОЙЧИВОСТИ ГУРВИЦА....................................................................90 2.9.4. ЧАСТОТНЫЙ КРИТЕРИЙ УСТОЙЧИВОСТИ (КРИТЕРИЙ НАЙКВИСТА) ..........................94 2.10. КАЧЕСТВО ПРОЦЕССОВ УПРАВЛЕНИЯ ....................................................................105 2.10.1. ОСНОВНЫЕ ПОКАЗАТЕЛИ КАЧЕСТВА ...................................................................105 2.10.2. ОШИБКИ СИСТЕМЫ РЕГУЛИРОВАНИЯ В УСТАНОВИВШИХСЯ РЕЖИМАХ. СТАТИЧЕСКИЕ И АСТАТИЧЕСКИЕ СИСТЕМЫ .....................................................................................108 2.10.3. ТОЧНОСТЬ СИСТЕМ ПРИ ОТРАБОТКЕ ГАРМОНИЧЕСКИХ СИГНАЛОВ ........................113
216
2.10.4. СВЯЗЬ МЕЖДУ ЛОГАРИФМИЧЕСКИМИ АМПЛИТУДНО-ЧАСТОТНЫМИ ХАРАКТЕРИСТИКАМИ И КАЧЕСТВОМ ПЕРЕХОДНЫХ ПРОЦЕССОВ В САУ..................................115 2.10.5. СООТНОШЕНИЕ МАСШТАБОВ ВО ВРЕМЕННОЙ И ЧАСТОТНОЙ ОБЛАСТЯХ ................117 2.11. ИНТЕГРАЛЬНЫЕ КРИТЕРИИ КАЧЕСТВА С ПОЗИЦИЙ ОБЩНОСТИ ЗАДАЧ ОПТИМАЛЬНОГО И МОДАЛЬНОГО СИНТЕЗА ...............................................................120 3.
СИНТЕЗ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ .........................................125
3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7.
ВЫБОР КОРРЕКТИРУЮЩИХ ЗВЕНЬЕВ. МЕТОД ЖЕЛАЕМЫХ ЛЧХ ..............................125 УПРАВЛЯЕМОСТЬ ЛИНЕЙНЫХ СТАЦИОНАРНЫХ СИСТЕМ ..........................................128 НАБЛЮДАЕМОСТЬ ЛИНЕЙНЫХ СТАЦИОНАРНЫХ СИСТЕМ. .......................................132 ЗАМЕНА БАЗИСА В ЛИНЕЙНОМ КОНЕЧНОМЕРНОМ ПРОСТРАНСТВЕ ...........................137 ЛИНЕЙНЫЕ ОПЕРАТОРЫ И МАТРИЦЫ ЛИНЕЙНЫХ ОПЕРАТОРОВ...............................140 ЗАМЕНА БАЗИСА В ПРОСТРАНСТВЕ СОСТОЯНИЙ ДИНАМИЧЕСКОЙ СИСТЕМЫ ...........145 ВЫЧИСЛЕНИЕ МАТРИЦЫ ПРЕОБРАЗОВАНИЯ БАЗИСА В ПРОСТРАНСТВЕ СОСТОЯНИЙ ДИНАМИЧЕСКОЙ СИСТЕМЫ С ПОМОЩЬЮ МАТРИЦ УПРАВЛЯЕМОСТИ И НАБЛЮДАЕМОСТИ ......148 3.8. КАНОНИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ СИСТЕМ .............................................................150 3.8.1. УПРАВЛЯЕМОЕ КАНОНИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ СИСТЕМЫ СО СКАЛЯРНЫМ ВХОДОМ..................................................................................................................150 3.8.2. ПЕРЕДАТОЧНАЯ ФУНКЦИЯ И СТРУКТУРНАЯ СХЕМА ДЛЯ СИСТЕМЫ В УКП ..............155 3.8.3. ИДЕНТИФИКАЦИОННОЕ КАНОНИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ СИСТЕМЫ С ОДНИМ (СКАЛЯРНЫМ) ВЫХОДОМ..........................................................................................156 3.8.4. ПЕРЕДАТОЧНАЯ ФУНКЦИЯ И СТРУКТУРА ДЛЯ СИСТЕМЫ В ИКП .............................157 3.9. ОБРАТНАЯ СВЯЗЬ ПО СОСТОЯНИЮ, ОБЕСПЕЧИВАЮЩАЯ ЗАДАННОЕ (ЖЕЛАЕМОЕ) РАСПОЛОЖЕНИЕ СОБСТВЕННЫХ ЧИСЕЛ В ЗАМКНУТОЙ СИСТЕМЕ С ОДНИМ (СКАЛЯРНЫМ) ВХОДОМ ...........................................................................................159 3.10. СИНТЕЗ УПРАВЛЕНИЯ В МНОГОМЕРНОЙ СИСТЕМЕ. ЗАДАЧА РАЗДЕЛЕНИЯ КАНАЛОВ .163 3.10.1. РАЗДЕЛЕНИЕ ИСХОДНОГО ОБЪЕКТА НА ПОДСИСТЕМЫ ИНТЕГРАТОРОВ..................163
3.10.2. ПРЕОБРАЗОВАНИЕ БАЗИСА В ПРОСТРАНСТВЕ R ...............................................167 3.10.3. ФОРМИРОВАНИЕ УПРАВЛЕНИЯ ...........................................................................174 3.10.4. ИТОГОВЫЙ АЛГОРИТМ .......................................................................................177 3.11. ОСНОВЫ ПОСТРОЕНИЯ ИДЕНТИФИКАТОРОВ СОСТОЯНИЯ (НАБЛЮДАТЕЛЕЙ)............180 3.11.1. НАБЛЮДАТЕЛЬ ЛЮЕНБЕРГЕРА ПОЛНОГО ПОРЯДКА ..............................................180 3.11.2. НАБЛЮДАТЕЛЬ ПОНИЖЕННОГО ПОРЯДКА ............................................................186 3.11.3. НАБЛЮДАТЕЛЬ ЛЮЕНБЕРГЕРА МИНИМАЛЬНОГО ПОРЯДКА....................................190 3.12. СИНТЕЗ РЕАЛИЗУЕМОГО УПРАВЛЕНИЯ, ОБЕСПЕЧИВАЮЩИЙ ЗАДАННЫЕ ДИНАМИЧЕСКИЕ И СТАТИЧЕСКИЕ СВОЙСТВА СИСТЕМЫ УПРАВЛЕНИЯ .................................................193 3.12.1. ДИНАМИЧЕСКИЕ СВОЙСТВА СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ И НАБЛЮДАТЕЛЕМ ПОЛНОГО ПОРЯДКА .................................................................................................193 3.12.2. ДИНАМИЧЕСКИЕ СВОЙСТВА СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ УПРАВЛЕНИЕМ И НАБЛЮДАТЕЛЕМ МИНИМАЛЬНОГО ПОРЯДКА ..............................................................195 3.12.3. РЕЗУЛЬТИРУЮЩИЙ АЛГОРИТМ СИНТЕЗА ДЛЯ СИСТЕМЫ С ОДНИМ ВХОДОМ И ОДНИМ ВЫХОДОМ .................................................................................................196 3.12.4. ИТОГОВЫЕ ПРИМЕРЫ ПОЛНОГО СИНТЕЗА СИСТЕМ УПРАВЛЕНИЯ ..........................197 n
СПИСОК ЛИТЕРАТУРЫ................................................................................................214
ОГЛАВЛЕНИЕ................................................................................................................216
217