Санкт-Петербургский государственный университет
Г.А.Леонов, М.М.Шумафов
ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ
Санкт-Петербург Издательство С.-Петербургского университета 2002
1
2
Леонов Г.А., Шумафов М.М. Проблемы стабилизации линейных управляемых систем. – СПб.: Изд-во С.-Петербургского университета, 2002. 308 с., 25 ил. Книга посвящена систематическому изложению методов и результатов, развитых для решения проблемы Брокетта. Приводятся методы низкочастотной и высокочастотной нестационарной стабилизации линейных управляемых систем. Получены достаточные, а в некоторых случаях и необходимые условия стабилизации линейных систем. В частности, для двумерных и некоторых типовых трехмерных систем со скалярными входами и выходами получены необходимые и достаточные условия стабилизации. На основе полученных результатов показана возможность низкочастотной и высокочастотной стабилизации верхнего положения равновесия маятника. Результаты распространены на линейные дискретные управляемые системы. Книга рассчитана на специалистов по теории управления, дифференциальным уравнениям и динамическим системам, теоретической и прикладной механике, а также на студентов и аспирантов математических специальностей. Leonov G.A. and Shumafov M.M. Stabilization problems of linear control systems. – SPb.: Isdat. S.-Petersburg university, 2002. 308 p., 25 ill. The book is devoted to systematic description of the methods and results developed for the solution of the Brockett problem. The methods for the low- and high-frequency stabilization of linear controllable systems are given. Sufficient and, in certain cases, necessary conditions of stabilization for linear systems are obtained. In particular, these conditions are obtained for two-dimensional and certain typical three-dimensional systems with scalar inputs and outputs. Using these results, the possibility of the low- and high-frequency stabilization of the pendulum high position are shown. The results obtained are applied to linear discrete controllable systems. The book is intended for the specialists in the control theory, differential equations and dynamic systems, and the theoretical and applied mechanics. It will be also useful for the students and postgraduate students of mathematical specialities.
3
ОГЛАВЛЕНИЕ ВВЕДЕНИЕ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 ГЛАВА I. ПЕРЕДАТОЧНЫЕ ФУНКЦИИ И ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ . . . . . . . . . . . . . . . . . . . . . . . . . . 10 § 1. Описание линейных систем управления . . . . . . . . . . . . . . 10 1. Исходная математическая модель . . . . . . . . . . . . . . . . . . . . . . . . 10 2. Частный случай. Уравнение n-го порядка. . . . . . . . . . . . . . . . 14 § 2. Комплексификация пространства и оператора действующего в нем . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 § 3. Преобразование Лапласа и некоторые его свойства 22 1. Преобразование Лапласа. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2. Основные свойства преобразования Лапласа . . . . . . . . . . . . . 24 § 4. Передаточные функции и частотные характеристики линейных блоков . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 1. Оценка норм вектора состояния и вектора выхода. . . . . . . . 31 2. Определение передаточной функции . . . . . . . . . . . . . . . . . . . . . . 35 3. Случай одного уравнения n-го порядка . . . . . . . . . . . . . . . . . . . 37 4. Определение частотной характеристики . . . . . . . . . . . . . . . . . . 39 ГЛАВА II. УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ . . . . . 43 §1. Управляемость . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 § 2. Специальная форма систем с полностью управляемой парой (A, b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 § 3. Наблюдаемость. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 ГЛАВА III. СТАЦИОНАРНАЯ СТАБИЛИЗИРУЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 § 1. Устойчивость линейной системы с постоянными коэффициентами. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 1. Устойчивость по Ляпунову. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 2. Критерий асимптотической устойчивости линейной системы с постоянной матрицей. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 § 2. Алгебраические критерии устойчивости . . . . . . . . . . . . 86 1. Проблема Рауса–Гурвица . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 2. Необходимое условие устойчивости многочлена . . . . . . . . . . 86 3. Критерий Эрмита-Михайлова . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 4. Критерий Рауса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 4.1. Индексы Коши . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4
4.2. Алгоритм Рауса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 5. Критерий Гурвица . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 § 3. Задача линейной стабилизации . . . . . . . . . . . . . . . . . . . . . . . 111 § 4. Стабилизируемость полностью управляемой системы (стабилизируемость пары (A, b)) . . . . . . . . . . . . . . . . . . 113 1. Вспомогательные утверждения. . . . . . . . . . . . . . . . . . . . . . . . . . 113 2. Теорема о стабилизации . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 § 5. Проблема управления спектром матрицы . . . . . . . . . . 129 § 6. Критерий Найквиста . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 § 7. Стабилизируемость полностью наблюдаемой системы в терминах разрешимости матричного уравнения Лурье-Риккати. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 1. Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 2. Вспомогательные утверждения . . . . . . . . . . . . . . . . . . . . . . . . . . 136 3. Теорема о стабилизируемости тройки (A, b, c) в терминах разрешимости специального уравнения Лурье-Риккати. . . . . . . . . . 141 § 8. Стабилизируемость неполностью управляемых систем . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 ГЛАВА IV. НЕСТАЦИОНАРНАЯ НИЗКОЧАСТОТНАЯ СТАБИЛИЗАЦИЯ ЛИНЕЙНЫХ СИСТЕМ . . . . . . . . . . . . . . . . . . . . . 147 § 1. Постановка задачи. Проблема Брокетта . . . . . . . . . . . . 147 § 2. Линейные системы дифференциальных уравнений с периодической матрицей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 1. Фазовые потоки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 2. Примеры фазовых потоков простейших дифференциальных уравнений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 3. Основные свойства фазового потока . . . . . . . . . . . . . . . . . . . . 153 4. Отображение за период . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 5. Устойчивость отображения монодромии . . . . . . . . . . . . . . . . 160 § 3. Низкочастотная стабилизация верхнего положения равновесия маятника . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 § 4. Проблема Брокетта в классе кусочно-постоянных периодических матриц . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176 1. Основная теорема . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176 2. Случай скалярной функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 § 5. Некоторые предложения, обеспечивающие эффек-
5
тивную проверку "условия вложения многообразий" . . . . 184 § 6. Стабилизация линейной системы в скалярном случае (когда вход и выход — скалярные функции) . . . . . 190 § 7. Проверка "условия вложения многообразий", основанная на импульсном воздействии на неустойчивое интегральное многообразие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 1. Импульсное воздействие на неустойчивое многообразие . 195 2. Случай размерности n − 1 (коразмерности 1) устойчивого многообразия. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 3. Случай размерности n − 2 (коразмерности 2) устойчивого многообразия. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 § 8. Необходимые условия стабилизации . . . . . . . . . . . . . . . . . 211 § 9. Низкочастотная стабилизация двумерных и трехмерных систем . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 1. Двумерные системы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 2. Трехмерные системы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 ГЛАВА V. НЕСТАЦИОНАРНАЯ ВЫСОКОЧАСТОТНАЯ СТАБИЛИЗАЦИЯ ЛИНЕЙНЫХ СИСТЕМ . . . . . . . . . . . . . . . . . . . . . 229 § 1. Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 § 2. Некоторые предварительные факты. . . . . . . . . . . . . . . . . 230 1. Теорема об экспоненциальной устойчивости . . . . . . . . . . . . . 230 2. Теорема об экспоненциальной устойчивости линейной системы с малым параметром . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 3. Экспоненциальная устойчивость линейной системы с большим параметром. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 § 3. Высокочастотная стабилизация верхнего положения равновесия маятника . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 1. Стабилизация с помощью кусочно-постоянных периодических функций. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 2. Стабилизация с помощью непрерывных периодических функций . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 § 4. Высокочастотная стабилизация линейных систем . 245 1. Приведение замкнутой системы к специальной форме . . 246 2. Стабилизация в случае c∗ b 6= 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 3. Стабилизация в случае c∗ b = c∗ Ab = 0 . . . . . . . . . . . . . . . . . . . 250 § 5. Высокочастотная стабилизация двумерных и трехмерных систем . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
6
1. Двумерные системы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255 2. Трехмерные системы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 ГЛАВА VI. ДИСКРЕТНЫЕ СИСТЕМЫ . . . . . . . . . . . . . . . . . . . . . 259 § 1. Линейные дискретные системы . . . . . . . . . . . . . . . . . . . . . . 259 1. Основная математическая модель. . . . . . . . . . . . . . . . . . . . . . . . 259 2. Свойства линейных дискретных систем . . . . . . . . . . . . . . . . . . 260 2.1. Устойчивость . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260 2.2. Пример. Числа Фибоначчи . . . . . . . . . . . . . . . . . . . . . . . . . . 265 2.3. Линейные неоднородные дискретные системы. . . . . . . 267 2.4. Z-преобразование и передаточная функция . . . . . . . . . 268 § 2. Управляемость, наблюдаемость и стабилизируемость . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 1. Управляемость . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 2. Наблюдаемость . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 3. Стабилизируемость. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 § 3. Проблема Брокетта для линейных дискретных систем управления . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277 1. Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277 2. Основная теорема . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278 3. Скалярный случай . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284 4. Стабилизация систем второго порядка со скалярной обратной связью. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 ЛИТЕРАТУРА. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
7
ВВЕДЕНИЕ Проблема стабилизации является классической в теории и практике управления. Достаточно напомнить здесь широко известные проблемы стабилизации паровой машины с регулятором Уатта и стабилизации социума в революционный и постреволюционный периоды. Для решения первой Дж.К.Максвеллом [255], И.А.Вышнеградским [42,289], А.Стодолой [281] и другими известными учеными была разработана теория устойчивости систем регулирования (см. библиографию) и на ее основе были предложены различные стабилизирующие устройства. Для решения второй Наполеоном, Николаем I и Ельциным применялась артиллерия в центре Парижа (1795), Санкт-Петербурга (1825) и Москвы (1993). Теория, которая в этих случаях предлагала бы другие способы стабилизации, еще далека от своего завершения. В настоящее время имеется много книг и обзоров, в которых обсуждается проблема стабилизации управляемых систем (см. библиографию). Недавно появившееся и активно развиваемое направление в теории управления — управление хаосом – имеет в своей основе стабилизацию нестационарных траекторий (см. библиографию). Новым мощным стимулом изучения управляемых систем явилась сформулированная Р.Брокеттом [198] проблема стабилизации линейной стационарной системы путем синтеза нестационарной линейной обратной связи. Настоящая книга посвящена систематическому изложению методов и результатов, развитых для решения проблемы Брокетта. Первые три главы являются вводными. В них излагаются основные понятия линейной теории управления: передаточные функции, частотные характеристики, управляемость, наблюдаемость, стабилизируемость. Приводятся критерии управляемости, наблюдаемости, стабилизируемости линейных стационарных систем. В четвертой главе изложены методы низкочастотной стабилизации. Здесь используются оценки решений линейных систем на устойчивых и неустойчивых многообразиях и синтезируются отображения Пуанкаре, осуществляющие вложения неустойчивых многообразий в устойчивые многообразия. Существование таких отображений является основой для низкочастотной стабилизируемости линейных
8
управляемых систем. Необходимые условия стабилизируемости получены в духе теорем Четаева: строится положительно инвариантный конус, внутри которого все решения стремятся к бесконечности при любой нестационарной обратной связи. Такой подход позволил получить необходимые и достаточные условия низкочастотной стабилизируемости двумерных систем со скалярными входами и выходами. Аналогичное рассмотрение проведено для ряда типовых трехмерных систем. В пятой главе рассмотрены методы высокочастотной стабилизации. Они основаны на широко известном методе усреднения и специальных нестационарных линейных преобразованиях векторов состояния. Здесь излагаются результаты, полученные недавно Моро и Аэлсом [259]. Для двумерных систем со скалярными входами и выходами этот подход дает необходимые и достаточные условия высокочастотной стабилизации. В шестой главе проведено обобщение методов, изложенных в четвертой главе, на дискретные управляемые системы. Авторы пытались сделать изложение замкнутым и как можно более простым. Все используемые в книге факты доказаны. Для понимания книги достаточно знания основных курсов алгебры, анализа и обыкновенных дифференциальных уравнений. По мнению авторов, книга будет полезна специалистам, работающим в области теории управления, дифференциальных уравнений и динамических систем, теоретической и прикладной механики. Она может быть использована в качестве учебного пособия для студентов и аспирантов математических специальностей. Настоящая работа выполнена на кафедре теоретической кибернетики Санкт-Петербургского государственного университета, в лаборатории математического моделирования и теоретической кибернетики Адыгейского государственного университета, в лаборатории управления сложными системами Научно-исследовательского института проблем машиноведения РАН. При написании книги авторы чувствовали постоянную поддержку В.А.Якубовича, Р.Д.Хунагова, А.Х.Гелига, Д.К.Мамия, А.Л.Фрадкова.
9
Мы благодарны также Л.П.Виноградовой, Ю.К.Зотову, Н.К.Кузнецову, С.Н.Пакшину за помощь при окончательном оформлении книги. Настоящая работа частично финансировалась из средств гранта РФФИ (проект № 01-01-00317), гранта поддержки ведущих научных школ (№ 00-15-96028), программы "Университеты России", комплексной программы № 17 "Математическое моделирование интеллектуальных систем и управление нелинейными механическими системами (проект 3.1.4). Санкт-Петербург октябрь 2002 e-mail:
[email protected] [email protected] Г.А.Леонов М.М.Шумафов
ГЛАВА I ПЕРЕДАТОЧНЫЕ ФУНКЦИИ И ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ
§ 1. Описание линейных систем управления 1. Исходная математическая модель. Основное предположение, которое мы делаем здесь, состоит в том, что в качестве основной математической модели для описания линейных систем управления принимаем систему линейных дифференциальных уравнений вида n m X dxi X = aij xj + bik uk , i = 1, . . . , n, dt j=1
ys =
k=1
n X
csi xi ,
s = 1, . . . , `,
i=1
или в векторно-матричной форме dx = Ax + bu, y = c∗ x, (1) dt где A = {aij }, b = {bik }, c = {csi }, i, j = 1, . . . , n, k = 1, . . . , m, s = 1, . . . , ` — вещественные постоянные матрицы порядков n × n, n × m, n × ` соответственно, x = (x1 , . . . , xn )∗ ∈ Rn — вектор фазовых переменных состояния, u = (u1 , . . . , um )∗ ∈ Rm — вектор входных воздействий, y = (y1 , . . . , y` )∗ ∈ R` — вектор выходных переменных. В уравнении (1) векторы u, x и y являются функциями вещественного переменного t, обозначающего время, причем t ∈ [t0 , T ] (T > t0 ), где [t0 , T ] — отрезок времени, на котором происходит управление системой. (Здесь знак ∗ означает операцию транспонирования; в случае комплексных матриц или векторов — эрмитово сопряжение). Таким образом, в модель (1) входят n линейных дифференциальных уравнений 1-го порядка относительно переменных состояния xi (i = 1, . . . , n), m различных управляющих (входных) переменных uk 10
11
(k = 1, . . . , m), а также ` алгебраических соотношений, связывающих ` выходных переменных ys (s = 1, . . . , `) с n переменными состояния xi . Коэффициенты aij , bik , cis называются параметрами системы. Описание системы управления в форме (1) называют описанием в пространстве состояний или в фазовом пространстве. Состояние x(t) и выход y(t) однозначно определяются на промежутке [t0 , T ], если задать начальное состояние x(t0 ) = x0 и вход (управление) u(t) для t ∈ [t0 , T ]. Дадим определение решения системы (1). Для этого сначала напомним определения некоторых понятий из анализа. Ф у н к ц и ю f : [t0 , T ] → C, заданную на промежутке [t0 , T ] ⊂ R (T > t0 ), называют: 1) непрерывной на [t0 , T ]), если она непрерывна в каждой точке τ ∈ (t0 , T ), т.е. lim f (t) = f (τ ) и, кроме того, имеет односторонние t→τ предельные значения в точках t = t0 и t = T , равные соответственно f (t0 ) и f (T ); 2) кусочно-непрерывной на [t0 , T ], если она непрерывна во всех точках интервала (t0 , T ), за исключением, быть может, конечного числа точек разрыва первого рода (скачков) и, кроме того, имеет односторонние предельные значения в точках t = t0 и t = T ; 3) дифференцируемой на [t0 , T ], если она имеет конечную производную f 0 (t) в каждой точке t ∈ (t0 , T ) и, кроме того, существуют односторонние предельные значения производной f 0 (t) в точках t0 и T ; 4) непрерывно дифференцируемой или гладкой на [t0 , T ], если она дифференцируема на [t0 , T ] и производная f 0 (t) непрерывна на [t0 , T ] (под f 0 (t0 ) и f 0 (T ) понимаются соответственно правая и левая про(t0 ) изводные функции f в указанных точках: f 0 (t0 ) = lim f (t)−f , t−t0 t→t0 +0
f 0 (T )
=
(T ) lim f (t)−f t−T T →T −0
);
5) кусочно-гладкой на [t0 , T ], если она дифференцируема во всех точках интервала (t0 , T ), за исключением, быть может, конечного числа точек τ1 < τ2 < · · · < τn таких, что функция f гладкая на каждом сегменте [t0 , τ1 ], [τ1 , τ2 ], · · · , [τn , T ]. В е к т о р - ф у н к ц и ю f : [t0 , T ] → Cn , f (t) = (f1 (t), · · · , fn (t))∗ , заданную на промежутке [t0 , T ] называют:
12
1) непрерывной (непрерывно дифференцируемой или гладкой) на [t0 , T ], если все координатные функции fj : [t0 , T ] → C (j = 1, · · · , n) непрерывны (непрерывно дифференцируемы) на [t0 , T ]; 2) кусочно-непрерывной (кусочно-гладкой) на [t0 , T ], если все координатные функции fj (j = 1, · · · , n) кусочно-непрерывны (кусочногладкие) на [t0 , T ]. Аналогично определяются также непрерывность, гладкость, кусочная непрерывность и кусочная гладкость м а т р и ц ы - ф у н к ц и и (t) F : I → Cn×n , F (t) = (fij )ni,j=1 (здесь I = [t0 , T ] или I = [t0 , +∞) ). Числовую функцию f : [t0 , +∞) → C или вектор-функцию f : [t0 , +∞) → Cn или матрицу-функцию F : [0, +∞) → Cn×n называют кусочно-непрерывной (кусочно-гладкой) на полупрямой [t0 , +∞), если она является кусочно-непрерывной (кусочно-гладкой) на любом принадлежащем ей сегменте. Заметим, что из вышеприведенных определений следует, что любую непрерывную на промежутке [t0 , T ] (или [t0 , +∞)) функцию f можно считать также кусочно-непрерывной на нем (так как в этом случае у функции f вовсе нет точек разрыва). Аналогично, любую непрерывно дифференцируемую (гладкую) на промежутке [t0 , T ] (или [t0 , +∞)) функцию f можно рассматривать также как кусочногладкую на нем (так как в этом случае в определении кусочно-гладкой функции отсутствуют точки τk и, тем самым, число сегментов на которых функция f должна быть гладкой сводится к одному). Множество всех непрерывных, вообще говоря, комплекснозначных функций, определенных на промежутке [t0 , T ] (с обычными операциями сложения и умножения) принято обозначать через C[t0 , T ], а множество всех комплекснозначных функций, определенных на промежутке [t0 , T ] и имеющих на нем непрерывные производные до n-го порядка включительно — через C n [t0 , T ] (аналогичное обозначение применяется и для случая, когда [t0 , T ] заменен на бесконечный промежуток [t0 , +∞)). Так, f ∈ C[t0 , T ] обозначает, что функция f : [t0 , T ] → C непрерывна на [t0 , T ]. Аналогично, f ∈ C n [t0 , T ] обозначает, что функция f : [t0 , T ] → C имеет все производные до n-го порядка включительно, непрерывные на промежутке [t0 , T ]. О п р е д е л е н и е . Под р е ш е н и е м с и с т е м ы (1) в промежутке [t0 , T ] будем понимать любую тройку вектор-функций (u(t), x(t), y(t)), удовлетворяющих условиям:
13
1) функция u(t) определена и кусочно-непрерывна в промежутке [t0 , T ] (для определенности считается, что в точках разрыва, если они есть, функция u(t) непрерывна справа, при этом u(t) называют возможным управлением [·] на отрезке времени [t0 , T ]); 2) функция x(t) определена и непрерывна в том же промежутке [t0 , T ] и удовлетворяет вместе с u(t) уравнению x(t) ˙ = Ax(t) + bu(t)
∀ t ∈ [t0 , T ],
если u(t) непрерывна на [t0 , T ] (в этом случае x(t) — непрерывно дифференцируема), и предыдущему уравнению в интегральной форме Zt x(t) = x0 + [Ax(τ ) + bu(τ ] dτ ∀ t ∈ [t0 , T ], t0
если u(t) имеет точки разрыва первого рода на [t0 , T ] (в этом случае x(t) — кусочно-гладкая); 3) функция y(t) определена и непрерывна на [t0 , T ] и связана с x(t) соотношением: y(t) = c∗ x(t). Замечание. В дальнейшем, иногда будем пользоваться и таким выражением "решение x(t), t ∈ [t0 , T ], системы (1), соответствующее управлению u(t)"или "решение x(t), t ∈ [t0 , T ], системы (1) при заданном входе u(t)"в смысле данного выше определения решения системы (1). Систему (1) схематично можно представить в виде некоторого линейного блока (L), на вход которого подается сигнал u = u(t) и выходом которого является сигнал y = y(t) (рис. 1).
(L) u(t)
—−→
dx = Ax + bu dt x(t0 ) = x0 , y = c∗ x
y(t)
—−→
Рис. 1. Представление системы (1) в виде линейного блока (L)
14
2. Частный случай. Уравнение n-го порядка. Рассмотрим систему управления, описываемую линейным дифференциальным уравнением (в операторной записи) d , (2) N (D)y(t) = M (D)u(t), D := dt где u(t) ∈ C m [t0 , T ], y(t) ∈ C n [t0 , T ], а N (D) и M (D) — многочлены от оператора дифференцирования D с вещественными постоянными коэффициентами Nj , Mk (j = 0, . . . , n; k = 0, . . . , m): N (D) = N0 Dn + N1 Dn−1 + . . . + Nn E M (D) = M0 Dm + M1 Dm−1 + . . . + Mm E. (Здесь E – единичный оператор: Ef (t) = f (t)). Без ограничения общности можно считать, что N0 = 1 (в противном случае можно на этот коэффициент разделить обе части уравнения (2)). Примем следующее естественное предположение (мотивируемое практическими соображениями): m < n. Отметим, что широко распространенные в инженерной практике электрические цепи, содержащие сопротивления, конденсаторы и индуктивности, описываются уравнениями вида (2). Выход y(t) однозначно определяется уравнением (2), если заданы вход u(t) и начальные значения y(t0 ), Dy(t0 ), . . . , Dn−1 y(t0 ) выхода y(t) и его производных вплоть до (n − 1)-й. В (2) сначала оператор M (D) действует на функцию u(t): f (t) = M (D)u(t), а затем y(t) определяется как решение неоднородного линейного уравнения N (D)y(t) = f (t) с начальными условиями y(t0 ) = y0 , y(t0 ) = y1 , . . . , y (n−1) (t0 ) = yn−1 . Таким образом, уравнение (2) и здесь можно представить в виде линейного блока (L), который можно рассматривать как некий оператор, действующий на прямом произведении множества входов {u(t)} и множества начальных состояний {(y0 , y1 , . . . , yn−1 )}: L
{u(t)} × {y 0 } → {y(t)}, y 0 = (y0 , y1 , . . . , yn−1 ).
15
Можно дать и другое описание блока (L), которое позволяет рассматривать в качестве u(t) лишь непрерывные функции: ξ(t0 ) ξ(t ˙ 0) N (D)ξ = u, y = M (D)ξ, ξ 0 = (3) , .. . ξ˙(n−1) (t0 ) где u(t) ∈ C[t0 , T ], ξ(t) ∈ C n [t0 , T ]. Здесь вначале по заданному входу u(t) определяется функция ξ(t) как решение уравнения N (D)ξ = u(t)
(4)
с начальным условием ξ(t0 ) = ξ 0 , а затем к этой функции применяется оператор M (D): y(t) = M (D)ξ(t). Отметим, что если блок (L) задан уравнениями (3) и функция u(t) ∈ C m [t0 , T ], то можно перейти к описанию блока уравнением (2). Действительно, имеем N (D)y = N (D)M (D)ξ = M (D)N (D)ξ = M (D)u. Обратно, если дано описание блока (L) в виде уравнения (2), то можно перейти к описанию в виде уравнений (3). В самом деле, по заданному входу u(t) определим функцию ξ(t) как решение уравнения (4) с начальным условием ξ(t0 ) = ξ 0 . Тогда в силу уравнения (2) N (D)y = M (D)N (D)ξ = N (D)M (D)ξ. Отсюда находим y(t) = M (D)ξ(t) + z(t), где z(t) — решение однородного уравнения N (D)z = 0. Если в качестве z(t) взять z(t) ≡ 0, то получим описание в виде (3). Теперь покажем, что описание линейного блока (L) в виде (2) или (3) является частным случаем описания (L) в виде системы (1). При этом уравнение (2) можно привести к двум частным видам системы (1), соответствующим порознь случаям c = (1, 0, . . . , 0)∗ ,
b = (0, . . . , 1)∗ .
16
Перепишем многочлен M (D) в (2) так (m < n): M (D) = Mm−n Dn + Mm−n+1 Dn−1 + . . . + M−1 Dm+1 + +M0 Dm + M1 Dm−1 + . . . + Mm E, где M−1 , . . . , Mm−n равны 0. При этом предполагаем, что в (2) u(t) ∈ C n [t0 , T ], y(t) ∈ C n [t0 , T ]. Теорема 1 ([124]). Уравнение (2) эквивалентно следующей системе уравнений первого порядка Dx1 = x2 + β1 u, Dx 2 = x3 + β2 u, .............................. (5) Dxn−1 = xn + βn−1 u, Dxn = −Nn x1 − Nn−1 x2 − . . . − N1 xn + βn u, y = x1 в том смысле, что если пара (u(t), y(t)) — решение уравнения (2) (y(t) — решение уравнения (2) при заданном входе u(t)), то пара (u(t), x(t)), где x(t) = (x1 (t), . . . , xn (t))∗ : x1 (t) = y(t), x2 (t) = Dy(t) − β1 u(t), 2 x3 (t) = D y(t) − [β2 u(t) + β1 Du(t)], (6) .. . xn (t) = Dn−1 y(t) − [βn−1 u(t) + . . . + β1 Dn−2 u(t)], есть решение системы (5), причем коэффициенты β1 , β2 , . . . , βn находятся последовательно из системы уравнений β1 = Mm−n+1 , N1 β1 + β2 = Mm−n+2 , N2 β1 + N1 β2 + β3 = Mm−n+3 , .. . (7) Nn−m−1 β1 + Nn−m−2 β2 + . . . + N1 βn−m−1 + βn−m = M0 , .. . Nn−2 β1 + Nn−3 β2 + . . . + N1 βn−2 + βn−1 = Mm−1 , Nn−1 β1 + Nn−2 β2 + . . . + N1 βn−1 + βn = Mm ,
17
и, наоборот, если (u(t); x1 (t), . . . , xn (t)) — решение системы (5), где x1 (t) ∈ C n [t0 , T ] и u(t) ∈ C m [t0 , T ], то пара (u(t), x1 (t)) — решение уравнения (2), где коэффициенты Mk , Nj , βi связаны соотношениями (7) (Mm−n+` = 0, если ` < n − m, ` = 1, 2, . . . , n − m − 1). Д о к а з а т е л ь с т в о. Пусть пара функций (u(t), y(t)) удовлетворяет уравнению (2). Введем новые функции x1 (t), . . . , xn (t) при помощи равенств (6), где коэффициенты βi (i = 1, . . . , n) определяются из соотношений (7). Дифференцируя соотношения (6), получаем Dx1 (t) = Dy(t), Dx2 (t) = D2 y(t) − β1 Du(t), 3 2 Dx3 (t) = D y(t) − β2 Du(t) − β1 D u(t), (8) .. . Dxn (t) = Dn y(t) − βn−1 Du(t) − . . . − β1 Dn−1 u(t). Заменяя в правых частях (8) Dk y(t), k = 1, . . . , n − 1 на основе соотношений (6), а Dn y(t) на основании уравнения (2), получим Dx1 (t) = x2 (t) + β1 u(t), Dx2 (t) = x3 (t) + β2 u(t), .. . Dxn−1 (t) = xn (t) + βn−1 u(t), Dxn (t) = −N1 [xn (t) + βn−1 u(t) + . . . + βn−m−1 Dn u(t) + . . . + +β1 Dn−2 u(t)] − N2 [xn−1 (t) + βn−2 u(t) + . . . + βn−m−1 Dm u(t)+ + . . . + β1 Dn−3 u(t)] − . . . − Nn−1 [x2 (t) + β1 u(t)] − Nn x1 (t)+ +Mm−n Dn u(t) + Mm−n−1 Dn−1 u(t) + M−1 Dm+1 u(t) + M0 Dm u(t)+ + . . . + Mm u(t) + (βn u(t) − βn u(t)) − βn−1 Du(t) − . . . − −βn−m Dm u(t) − . . . − β1 Dn−1 u(t). В последнем равенстве алгебраическая сумма членов, содержащих u(t), Du(t), . . . , Dm u(t) будет равна нулю в силу соотношений (7), т.е. Dxn (t) = −Nn x1 (t) − . . . − N1 xn (t) + βn u(t). Таким образом, пара (u(t), x(t)) является решением системы (5). Допустим, что, наоборот, (u(t), x(t)) — решение системы (5). Тогда из (5) следует, что имеют место равенства (6). Отсюда, подставляя их в последнее уравнение системы (5) и используя соотношения (7),
18
получим соотношение (2), т.е. пара (u(t), y(t)), где y(t) = x1 (t), удовлетворяет уравнению (2). Теорема доказана. Заметим, что система (5) жить 0 1 0 0 0 1 ... ... A = ... 0 0 0 0 0 0 −Nn −Nn−1 −Nn−2
получается из системы (1), если поло 0 0 ... , 1 0 ... 1 . . . −N1 ... ... .. .
β1 .. . b = , . .. βn
1 0 c = .. . . 0
Следующая теорема дает другое представление уравнения (2) в виде системы (1). Теорема 2. Уравнение (2) эквивалентно системе уравнений Dx1 = x2 , .. . Dxn−1 = xn , (9) Dxn = −Nn x1 − Nn−1 x2 − . . . − N1 xn + u, y = Mm x1 + . . . + M1 xm + M0 xm+1 . (При этом предполагается, что функции u(t) и y(t) в (2) и функция x1 (t) в (9) имеют соответствующие степени гладкости). Д о к а з а т е л ь с т в о. Если (u(t); x1 (t), . . . , xn (t)) — решение системы (9), то имеем соотношения N (D)x1 (t) = u(t),
y(t) = M (D)x1 (t),
из которых, как показано выше (см. (3)), следует, что пара (u(t), y(t)) удовлетворяет уравнению (2). Обратно, пусть пара (u(t), y(t)) — решение уравнения (2). Тогда тройка функций (u(t), ξ(t), y(t)) будет решением системы уравнений (3), так как (2) сводится к системе (3). Далее, вводя обозначения ˙ x1 (t) = ξ(t), x2 (t) = ξ(t), . . . , xn (t) = ξ (n−1) (t), из уравнений (3) получим, что система функций (u(t); x1 (t), . . . , xn (t)) удовлетворяет системе уравнений (9). Теорема 2 доказана.
19
Замечание. Система (9) — частный случай системы (1): Mm 0 1 0 ... 0 0 .. 0 1 ... 0 0 . .. .. .. .. .. .. . M0 . . . . . A= , b = , c = . 0 0 0 0 0 1 0 . 0 .. 0 0 ... 1 1 −NN −Nn−1 −Nn−2 . . . −N1 0 Таким образом, из теорем 1 и 2 следует, что если m < n, то описание линейного блока (L) в виде уравнения (2) (или системы уравнений (3)) является частным случаем их описания в форме (1).
§ 2. Комплексификация пространства и оператора, действующего в нем В системе (1) § 1 линейные операторы, обозначим их через A, B и C определяемые соответственно вещественными матрицами A, b и c действуют в вещественном евклидовом пространстве Rn или Rm . В дальнейшем, нам придется иногда рассматривать эти операторы в комплексном расширении их областей определения. Тогда фазовым пространством системы (1) § 1 будет комплексное евклидово пространство Cn т.е. в этом случае векторная переменная x может принимать и комплексные значения. При рассмотрении различных вещественных математических объектов, например, вещественных многочленов, вещественных матриц и т.д. нам приходится так или иначе связывать их с комплексными объектами: комплексными числами, линейными пространствами над полем комплексных чисел и т.д. Причина, как хорошо известно, состоит в алгебраической незамкнутости поля вещественных чисел. Например, если задан вещественный многочлен P (x) (т.е. многочлен с вещественными коэффициентами) от вещественного переменного x, то мы позволяем переменной x принимать наряду с вещественными числами и комплексные числа, так чтобы уравнение P (x) = 0
20
было уже разрешимо в множестве комплексных чисел C. Изначально это уравнение может быть не разрешимым в множестве вещественных чисел R, например, если P (x) = x2 + 1. Таким образом, здесь вещественный объект – многочлен P (x), x ∈ R – мы связываем с полем комплексных чисел C, перейдя от поля R к его расширению – полю C. Последняя операция представляет собой операцию "комплексификации" поля вещественных чисел R. Аналогично обстоит дело и тогда, когда задан вещественный линейный оператор A : Ln → Ln , действующий в n-мерном вещественном линейном пространстве Ln . Если зафиксировать базис в Ln , то действие оператора A в Ln задается формулой y = Ax,
x ∈ Rn ,
где A есть вещественная (n×n)-матрица , представляющая оператор A в этом базисе. Как хорошо известно, для нахождения собственных значений и собственных векторов матрицы A нам приходится рассматривать уравнение (pI − A)x = 0 (p ∈ C), и связанный с ним характеристический многочлен ∆(p) ≡ det (pI − A) матрицы A. (Здесь I — единичная (n × n)-матрица). Многочлен ∆(p), имеет комплексные корни λj (j = 1, · · · , n) — собственные значения матрицы A, а уравнение (pI − A)x = 0 — соответствующие им комплексные решения ξj — собственные векторы матрицы A. Следовательно, и здесь мы тоже сталкиваемся с необходимостью рассмотрения комплексных объектов, хотя изначально все объекты вещественны. Для этого мы переходим от n-мерного вещественного пространства Rn и вещественного оператора, действующего в нем, к их расширениям — n-мерному комплексному линейному пространству Cn и "комплексифицированному"оператору, действующему в Cn . Эта операция — переход от Rn к Cn и от оператора, действующего в Rn к его расширению — оператору, действующему в Cn — называется комплексификацией пространства Rn и соответственно комплексификацией оператора A, действующего в Rn . Перейдем теперь к строгим определениям. Пусть Rn — n-мерное вещественное линейное пространство над полем вещественных чисел.
21
О п р е д е л е н и е 1([16]). К о м п л е к с и ф и к а ц и е й п р о с т р а н с т в а Rn называется n-мерное комплексное линейное пространство, точками которого являются пары (x, y), где x ∈ Rn , y ∈ Rn , обозначаемые x+iy (i — мнимая единица), причем операции сложения и умножения на комплексные числа определяются обычным образом: (x1 + iy1 ) + (x2 + iy2 ) = (x1 + x2 ) + i(y1 + y2 ) (α + iβ)(x + iy) = (αx − βy) + i(βx + αy) Здесь α, β ∈ R, x1 , y1 ; x2 , y2 ; x, y ∈ Rn . Комплексификация пространства Rn обозначается через CRn . Легко проверить, что CRn = Cn . Утверждение 1. Если (e1 , · · · , en ) — базис в пространстве Rn , то векторы e1 + i0, · · · , en + i0 образуют базис в CRn . Предложение 1 доказывается непосредственно с использованием определения CRn . Естественно отождествить векторы x+i0 с x. Поэтому предыдущее утверждение можно переформулировать так: если e = {ek }nk=1 — базис в Rn , то e также базис в CRn . Заметим, что в таком базисе вещественные векторы т.е. векторы из Rn имеют вещественные координаты, а невещественные векторы из CRn — невещественные координаты. Пусть A : Rn → Rm — вещественный линейный оператор, действующий из Rn в Rm . О п р е д е л е н и е 2([16]). К о м п л е к с и ф и к а ц и е й о п е р а т о р а A называется линейный оператор C A : CRn → CRm , определенный следующим образом: C
A(x + iy) = C Ax + i C Ay.
Непосредственно доказывается следующее Утверждение 2. Пусть (e1 , · · · , en ) — базис в Rn , а (ε1 , · · · , εm ) — базис в Rm . Пусть, далее, A — матрица оператора A. Тогда матрицей комплексифицированного оператора C A будет та же самая матрица A. Замечание. Операцией в некотором смысле обратной комплексификации является операция овеществления.
22
Овеществление пространства Cn (см. [16]) есть вещественное линейное пространство, совпадающее с Cn поточечно, в котором сложение элементов и умножение на вещественные числа определено как в Cn , а умножение на комплексные числа не определено. Овеществление пространства Cn обозначается так: RCn . Используя определение пространства RCn можно установить, что RCn — 2n-мерное вещественное линейное пространство, т.е. RCn = R2n , и, что если (e1 , · · · , en ) — базис в Cn , то (e1 , · · · , en ; ie1 , · · · , ien ) — базис в RCn . Овеществление C-линейного оператора A : Cn → Cm ([16]) — это R-линейный оператор R A : RCn → RCm , совпадающий с A поточечно. Имеет место следующее утверждение, которое доказывается непосредственно. Если (e1 , · · · , en ) — базис пространства Cn , (ε1 , · · · , εm ) — базис пространства Cm , а A — матрица оператора A, то матрицей овеществленного оператора R A является вещественная матрица α | −β , β | α где A = α + iβ, α, β — вещественные (m × n)-матрицы.
§ 3. Преобразование Лапласа и некоторые его свойства Для определения важных в теории управления понятий таких, как "передаточная функция", "частотная характеристика"системы, используется интегральное преобразование Лапласа. Поэтому здесь мы напомним определение этого понятия и установим некоторые его свойства. 1. Преобразование Лапласа. Обозначим через F = {f (t)} класс всех комплекснозначных кусочно-непрерывных функций вещественного переменного t, определенных на полупрямой [0, +∞) и удовлетворяющих условию: |f (t)| ≤ Ceγt
при t ≥ 0.
(1)
23
Здесь C и γ — постоянные числа; число C может быть свое для каждой функции из класса F, а число γ — одно и то же для всех f ∈ F. Заметим, что множеству F принадлежат и непрерывные на [0, +∞) функции, удовлетворяющие условию (1). Пусть f ∈ F. Тогда в силу условия (1) несобственный интеграл +∞ Z f (t)e−pt dt, 0
называемый интегралом Лапласа, сходится абсолютно в области D = {p ∈ C : Re p > γ} комплексной плоскости C. При этом сходимость интеграла Лапласа является равномерной относительно p в любой замкнутой полуплоскости D0 ⊂ D, где D0 = {p ∈ C : Re p ≥ γ0 }, γ0 > γ. Последнее следует, в силу (1) из следующей оценки |f (t)e−pt | ≤ Ce−(σ−γ)t ≤ Ce−(γ0 −γ)t (t ≥ 0), √ справедливой для всех p = σ + iν ∈ D0 . Здесь i = −1 — мнимая единица. О п р е д е л е н и е. П р е о б р а з о в а н и е м Л а п л а с а называется оператор L, определенный на множестве F и ставящий в соответствие каждой функции из этого множества функцию F (p) комплексного переменного, заданную в области Re p > γ по следующему правилу: +∞ Z
f (t)e−pt dt.
F (p) ≡ L[f (t)] =
(2)
0
При этом функцию f называют оригиналом, а функцию F (p) — изображением функции f при преобразовании Лапласа L, или Lобразом. Часто само изображение F (p) называют преобразованием Лапласа функции f (t).
24
Замечание 1. Класс функций F, для которых мы определили преобразование Лапласа, можно существенно расширить, взяв вместо кусочно-непрерывных функций суммируемые по Лебегу функции, удовлетворяющие условию (1). Но, в дальнейшем, для наших целей достаточно ограничиться введенным выше классом F. Замечание 2. Преобразование Лапласа можно ввести по формуле (2) и для вектор-функций f : [0, +∞) → Cn , удовлетворяющих аналогичному (1) неравенству kf (t)k ≤ Ceγt
∀ t ∈ [0, +∞)
(3)
где k · k — евклидова норма вектора. В этом случае изображением вектор-функции f будет также вектор-функция F (p), определенная в полуплоскости Re p > γ, причем ее координатные функции Fi (p) будут изображениями соответствующих координатных функций fi (t). Здесь f (t) = (f1 (t), . . . , fn (t)), F (p) = (F1 (p), . . . , Fn (p)). 2. Основные свойства преобразования Лапласа. 1◦ . Оператор L, определенный формулой (2), линеен, т.е. L[c1 f1 + c2 f2 ] = c1 L[f1 ] + c2 L[f2 ] для любых f1 , f2 ∈ F и любых c1 , c2 ∈ R → C Другими словами, L-образ линейной комбинации функций f1 (t) и f2 (t) равен линейной комбинации их L-образов. Свойство 1◦ непосредственно следует из определения L. 2◦ . Если функция f (t) ∈ F ∩ C 1 [0, +∞), то преобразование L определено и для производной df (t)/dt, причем · ¸ df (t) d L ≡ L[Df (t)] = pL[f (t)] − f (0) (D = ). (4) dt dt £ ¤ Аналогично, если f ∈ F ∩ C n [0, +∞), то определено L dn f /dtn и h n i L ddtnf ≡ L[Dn f (t)] = (5) pn L[f (t)] − pn−1 f (0) − pn−2 Df (0) − . . . − Dn−1 f (0). В частности,если Dk f (0) = 0 для всех k = 0, 1, . . . , n − 1, то L[Dn f (t)] = pn L[f (t)].
(6)
25
Действительно, интегрируя по частям, получим Zt 0
¡ ¢¯t df (τ ) −pτ e dτ = f (τ )e−pτ ¯0 + p dτ
Zt f (τ )e−pτ dτ. 0
Так как f ∈ F, то существует предел при t → +∞ правой части и, следовательно, левой части последнего равенства. Отсюда следует существование L[df/dt] и равенство (4). Далее, рассуждая аналогично и применяя формулу (4) последовательно n раз, найдем L[Dn f (t)] = L[D(Dn−1 f (t))] = pL[Dn−1 f (t)] − Dn−1 f (0) = . . . . . . = pn L[f (t)] − pn−1 f (0) − . . . − Dn−1 f (0). Таким образом имеют место (5) и (6). 3◦ . Для любой функции f ∈ F L-образ интеграла
Rt
f (τ ) dτ равен
0
· Zt ¸ 1 L f (τ ) dτ = L[f (t)]. p
(7)
0
В самом деле, применяя оператор L к обеим частям равенства Zt D
f (τ ) dτ = f (t), 0
и используя формулу (4), получим · Zt ¸ pL f (τ ) dτ = L[f (t)]. 0
Отсюда следует (7). 4◦ . Если f ∈ F, , то функция F (p) = L[f (t)] аналитична в области D = {p : Re p > γ}, т.е. имеет в каждой точке области D производную по комплексному переменному p. При этом производную dF (p)/dp можно вычислить путем дифференцирования (2) под знаком интеграла:
26
dF (p) = dp
+∞ Z f (t)(−t)e−pt dt (p ∈ D).
(8)
0
Д о к а з а т е л ь с т в о . Рассмотрим интеграл, получаемый формальным дифференцированием интеграла (2) по p: +∞ Z f (t)(−t)e−pt dt.
(9)
0
Интеграл (9) в силу (1) сходится абсолютно и равномерно относительно p в любой полуплоскости D0 = { Re p ≥ γ0 } ⊂ D, где γ0 > γ. Действительно, для любой точки p = σ + iν ∈ D0 в силу (1) имеем |f (t)(−t)e−pt | ≤ Cte−(σ−γ)t ≤ Cte−(γ0 −γ)t
∀ t ≥ 0.
(10)
Поскольку lim te−
(γ0 −γ)t 2
t→+∞
= 0,
то из (10) находим |f (t)(−t)e−pt | ≤ C1 e−
(γ0 −γ) t 2
∀ t ≥ 0,
где C1 — некоторая положительная константа. Из последней оценки следует абсолютная и равномерная по p сходимость интеграла (9) в D0 . Теперь остается применить к интегралу Лапласа (2) известную теорему из анализа о возможности дифференцирования по параметру под знаком несобственного интеграла, зависящего от параметра. Отсюда следует аналитичность функции F (p) в D и формула (8). 5◦ . Если f ∈ F, то +∞ Z dn F (p) = f (t)(−t)n e−pt dt (n = 1, 2, · · · ) ( Re p > γ). (11) dpn 0
Д о к а з а т е л ь с т в о следует из свойства 4◦ и из абсолютной и равномерной сходимости интеграла (11) при любом n ∈ N. 6◦ . Если L[f (t)] = F (p) (f (t) ∈ F),
27
то
L[eλt f (t)] = F (p − λ),
(12)
где λ ∈ C. Действительно, L[eλt f (t)] = =
+∞ R 0 +∞ R
eλt f (t)e−pt dt = f (t)e−(p−λ)t dt = F (p − λ), Re (p − λ) > γ,
0
т.е. имеет место (12). Сформулируем теперь важную теорему, носящую название теоремы умножения или теоремы Бореля. 7◦ . Теорема умножения. Если функции F (p) и G(p) — L-образы функций f ∈ F и g ∈ F, т.е. F (p) = L[f (t)], G(p) = L[g(t)]
(p ∈ D),
то функция H(p) = F (p) · G(p) (p ∈ D) является L-образом функции Zt h(t) = f (t − τ )g(τ ) dτ,
(13)
0
т.е. H(p) = L[h(t)].
(14)
Д о к а з а т е л ь с т в о. Имеем: R∞ R∞ H(p) = F (p) · G(p) = f (ξ)e−pξ dξ · g(η)e−pη dη = =
R∞ R∞
0
f (ξ)g(η)e−p(ξ+η) dξdη.
0
(15)
0 0
Двойной интеграл в равенстве (15) абсолютно сходится для p ∈ D, так как абсолютно сходятся интегралы Лапласа, определяющие функции F (p) и G(p). Сделаем в двойном интеграле замену переменных интегрирования: ξ + η = t, η = τ . Тогда область интегрирования {(ξ, η) : 0 ≤ ξ < +∞, 0 ≤ η < +∞} на плоскости (ξ, η) перейдет в
28
область E = {(t, τ ) : 0 ≤ t < +∞, 0 ≤ τ ≤ t}. Следовательно, из (15) будем иметь: ZZ f (t − τ )g(τ )e−pt dtdτ.
H(p) = E
Применив к последнему интегралу теорему из анализа о сведении двойного интеграла к повторному, получим Z∞ Zt −pt H(p) = e { f (t − τ )g(τ )dτ } = L[h(t)], 0
0
т.е. справедливо равенство (14). Замечание 1. Функция (13) называется сверткой функций f (t), g(t) и обозначается так: h = f ∗ g. Повторяя рассуждения вышеприведенного доказательства теоремы об умножении с конца к началу, получим следующую теорему, носящую название т е о р е м ы о с в е р т к е : преобразование Лапласа свертки двух функций f ∈ F и g ∈ F равна произведению их L-образов, т.е. L[f ∗ g] = L[f ] · L[g]. Таким образом, преобразование Лапласа переводит операцию свертки двух функций в более простую операцию умножения их L-образов. Замечание 2. Свойства 1◦ —7◦ справедливы также и для векторфункций или матриц-функций, элементы которых принадлежат множеству F. При этом в теоремах умножения и свертки размерности матриц L[f (t)] и L[g(t)] считаются согласованными. Замечание 3. Из формулы (6) и линейности оператора L следует, что L[a(D)f (t)] = a(p)L[f (t)] (16) для любого операторного многочлена степени n d a(D) = a0 Dn + a1 Dn−1 + . . . + an E (D = ), (17) dt ( и любой функции f (t) ∈ Cn [0, +∞), у которой при t = 0 равны нулю значения f (t) и ее производных вплоть до (n − 1)-й f (0) = Df (0) = D2 f (0) = . . . = Dn−1 f (0) = 0.
29
Здесь a(p) есть алгебраический многочлен, получающийся из выражения a(D) заменой D на p, E есть единичный оператор. Равенство (16) эквивалентно следующему операторному равенству (в (16) опускаем “аргумент"f (t)) L a(D) = a(p)L. Последнее соотношение означает, что преобразование Лапласа переводит дифференциальный оператор a(D) в многочлен a(p) — действию оператора a(D) на оригинал отвечает умножение изображения на многочлен a(p), т.е. диаграмма f
a(D)
• −→ L y −→ L[f ] • a(p)
• a(D)f y •
La(D)f = a(p)L[f ]
коммутативна. Из равенства (16) и свойства 1◦ линейности оператора L следует, что преобразование Лапласа переводит линейную комбинацию и произведение двух дифференциальных операторов a(D) и b(D) вида (17) соответственно в линейную комбинацию и произведение соответствующих многочленов от комплексного переменного p ∈ C: ¡ ¢ ¡ ¢ L c1 a(D) + c2 b(D) = c1 a(p) + c2 b(p) L, ¡ ¢ L a(D)b(D) = a(p)b(p)L. Таким образом, преобразование Лапласа устанавливает определенное соответствие между алгеброй дифференциальных операторов вида (17) и алгеброй многочленов от комплексного переменного. На этом факте, в частности, основан так называемый операторный метод решения линейных дифференциальных уравнений с постоянными коэффициентами. Выпишем L-образы некоторых элементарных функций (все они находятся легко с помощью определения (2) и установленных выше
30
свойств преобразования L): 1 1) L[1] = , p
2) L[tn ] =
n!
1 , p−λ ω 5) L[sin ωt] = 2 , p + ω2
4) L[eλt tn ] =
pn+1
(n ∈ N),
n! (n ∈ N), (p − λ)n+1 p 6) L[cos ωt] = 2 , p + ω2 ω p−λ 7) L[eλt sin ωt] = , 8) L[eλt cos ωt] = . 2 2 (p − λ) + ω (p − λ)2 + ω 2 3) L[eλt ] =
(Здесь формулы 1), 2); 5), 6) имеют место в области Re p > 0, а формулы 3), 4); 7), 8) — в области Re p > Re λ). § 4. Передаточные функции и частотные характеристики линейных блоков Здесь мы введем важнейшие для всей теории управления линейных систем понятия передаточной функции и частотной характеристики линейных блоков, описываемых системами вида x˙ = Ax + bu,
y = c∗ x (x ∈ Rn , u ∈ Rm , y ∈ R` ),
(1)
где A, b и c — вещественные постоянные (n × n)−, (n × m)- и (n × `)матрицы соответственно. 1. Оценка норм вектора состояния и вектора выхода. Пусть U = {u(t)} — класс кусочно-непрерывных вектор-функций, заданных на полупрямой [0, +∞) и удовлетворяющих условию ku(t)k ≤ Ceγt
∀ t ∈ [0, +∞),
(2)
C и γ — константы. Как и выше, число C зависит от выбора функции u(t) из множества U , а γ — нет). В качестве входов системы (1) будем рассматривать функции из класса U . Лемма 1. Пусть вход u(t) системы (1) удовлетворяет условию (2). Тогда вектор состояния x(t) и выход y(t) системы (1) тоже удовлетворяют аналогичному условию, т.е. kx(t)k ≤ C1 eγ¯t ,
ky(t)k ≤ C2 eγ¯t
∀ t ∈ [0, +∞).
31
Здесь C1 , C2 — некоторые положительные константы, γ = max{γ, α + ε}, α = max Re λj (A), λj (A) (j = 1, · · · , n) — собj
ственные числа матрицы A, ε > 0 — любое. Доказатальство леммы 1 опирается на следующее утверждение. Лемма 2. (Оценка нормы экспоненты.) Пусть A — постоянная матрица размерности n × n, а α — максимальное значение вещественных частей собственных чисел λj (A) матрицы A. Тогда справедлива следующая оценка keAt k ≤ Cε e(α+ε)t
∀ t ∈ [0, +∞),
(3)
где ε — любое положительное число, а Cε — некоторая положительная константа, зависящая от ε. Если собственные числа матрицы A, обладающие наибольшими вещественными частями, имеют простые элементарные делители т.е. в жордановой нормальной форме матрицы A соответствующие клетки Жордана — простые, то справедлива оценка keAt k ≤ Ceαt Под нормой kBk матрицы B ( )1 2 n P |bjk |2 .
∀t ≥ 0. =
(bjk )nj,k=1 понимается число
j,k=1
Д о к а з а т е л ь с т в о. Пусть λ1 , λ2 , . . . , λm — различные собственные числа матрицы A (m ≤ n) и £ ¤ J = SAS −1 = diag J1 (λ1 ), . . . , Jk1 (λ1 ); . . . J1 (λm ), . . . , Jkm (λm ) — жорданова нормальная форма матрицы A, где λj 1 0 ... 0 0 λj 1 . . . 0 Ji (λj ) = ... . . . . . . . . . ... , (j = 1, . . . , m, i = 1, 2, . . . , kj ), 0 0 0 ... 1 0 0 0 . . . λj P — клетки порядков dij : = n) канонической формы Жордана. i,j
Здесь kj — число жордановых клеток, соответствующих собственному числу λj , а S — некоторая неособая матрица (det S 6= 0). Тогда,
32
разлагая eAt в ряд по степеням At и используя известные свойства клеточно-диагональных матриц, получим спектральное представление матричной экспоненты © ª eAt = exp tS −1 diag [J1 (λ1 ), . . . , Jk1 (λ1 ); . . . J1 (λm ), . . . , Jkm (λm )]S = £ ¤ = S −1 diag etJ1 (λ1 ) , . . . , etJk1 (λ1 ) , . . . , etJ1 (λm ) , . . . , etJkm (λm ) S.
(4)
Нетрудно вычислить матрицы etJi (λj ) . Действительно, представим Ji (λj ) в виде Ji (λj ) = λj I + ∆ij , где I — единичная матрица, а ∆ij 0 1 0 0 ∆ij = ... ... 0 0 0 0
жорданова клетка порядка dij : 0 ... 0 1 . . . 0 .. . . .. . . . . 0 . . . 1 0 ... 0
Учитывая, что λj I коммутирует с любой матрицей, в частности, с ∆ij , запишем etJi (λj ) так: etJi (λj ) = eλj · et∆ij .
(5)
d
Поскольку ∆ijij = 0, то et∆ij = I + t∆ij +
n−1 tdij −1 ∆ij t2 ∆2ij + ··· + . 2 (dij − 1)!
Из (5) и (6) получаем, что ± eλj t teλj t . . . tdij −1 eλj t (dij − 1)! 0 e λj t . . . .. .. .. etJi (λj ) = ... . . . . .. .. 0 . . teλj t λ t j 0 0 ... e
(6)
(7)
33
Из (4) имеем keAt k ≤ kS −1 k · max k exp tJi (λj )k · kSk ≤ i,j
½ dij −1 ν ¾ X t λj t ≤ C0 max |e | ≤ C0 eαt P (t), i,j ν!
(8)
ν=0
где P (t) — некоторый многочлен от t степени d = max(dij − 1), α = i,j
max Reλj (A), j = 1, . . . , m, C0 — некоторая константа. j
Поскольку при любом ε > 0 lim P (t)e−εt = 0,
t→+∞
то eε ∀ t ∈ [0, +∞) |P (t)e−εt | < C eε . Используя последнее неравенство, из для некоторой константы C (8) получим keAt k ≤ C0 e(α+ε)t e−εt P (t) ≤ Cε e(α+ε)t eε . Тем самым, установлена оценка для всех t ∈ [0, +∞), где Cε = C0 C (3). Вторая часть утверждения леммы следует сразу из (8), так как в этом случае многочлен P (t) = const . Лемма 2 доказана. Следствие. Для любой (n × n)-матрицы A det etA = et Tr A , Здесь Tr A =
P i
(t ∈ R).
aii — след матрицы A.
Д о к а з а т е л ь с т в о. Из представления (4) следует, что Y det eAt = det etJi (λj ) . i,j
Из последнего соотношения, с учетом равенства det etJi (λj ) = edij λj t , получим det e
At
=e
t(
P i,j
λj dij )
= etTr A ,
(9)
34
поскольку
P i,j
dij = n, а выражение
P i,j
λj dij представляет собой сумму
всех корней характеристического уравнения det (pI − A) = 0. Следствие доказано. Из равенства (9) следует, что матричная экспонента eAt является неособой матрицей при любом t ∈ R. Д о к а з а т е л ь с т в о л е м м ы 1. Хорошо известно, что решение x(t) уравнения x˙ = Ax + bu можно записать в следующей интегральной форме Коши Zt At
eA(t−τ ) bu(τ ) dτ.
x(t) = e x(0) + 0
Используя оценку (3), из последнего равенства получаем Zt At
keA(t−τ ) k ku(τ )k dτ ≤
kx(t)k ≤ ke k kx(0)k + kbk 0
Zt ≤ Cε kx(0)ke
(α+ε)t
+ CCε kbke
(α+ε)t
e(γ−α−ε)τ dτ ≤ C1 eγ¯t . 0
Здесь γ¯ = max{γ, α + ε}, C1 — некоторая положительная константа. Далее, используя последнюю оценку, будем иметь ky(t)k ≤ kc∗ k · kx(t)k ≤ C2 eγ¯t , где C2 = C1 kck. Тем самым, лемма 1 доказана. Следствие. Существуют преобразования Лапласа U (p) = L[u(t)] ( Re p > γ), X(p) = L[x(t)] ( Re p > γ¯ ), Y (p) = L[y(t)] ( Re p > γ¯ ), где γ — константа, фигурирующая в (2), γ¯ = max{γ, α + ε}, α = max Re λj (A), ε > 0. j
35
2. Определение передаточной функции. Применим преобразование Лапласа к системе (1). Полагая x(0) = 0 и используя свойства преобразования Лапласа (см.§ 3), получаем цепочку равенств: · ¸ L d x(t) = L[Ax(t) + bu(t)], dt ⇒ L[y(t)] = L[c∗ x(t)], ( pL[x(t)] = AL[x(t)] + bL[u(t)], ⇒ ⇒ L[y(t)] = c∗ L[x(t)], ( L[x(t)] = −(A − pI)−1 bL[u(t)], ⇒ ⇒ L[y(t)] = c∗ L[x(t)], ⇒ L[−y(t)] = c∗ (A − pI)−1 bL[u(t)]. (10) Здесь I – единичная (n × n)-матрица. Полученная формула (10) устанавливает связь между преобразованиями Лапласа входа u(t) и выхода y(t) линейного блока (L). О п р е д е л е н и е 1. Матричнозначная функция комплексного переменного p W (p) = c∗ (A − pI)−1 b (11) называется передаточной функцией системы (1) от входа u(t) к выходу (−y(t)). Используя (11), перепишем соотношение (10) так: Y (p) = −W (p)U (p).
(12)
где U (p) = L[u(t)], Y (p) = L[y(t)]. Равенство (12) схематично представлено на рис. 2.
U (p)
—−→—
W (p) = c∗ (A − pI)−1 b
−Y (p)
—−→—
Рис. 2. Передаточная функция системы (1) (m = ` = 1).
Из равенства (12) следует, что в случае, когда вход u(t) и выход y(t) — скалярные функции (m = ` = 1), передаточная функция
36
W (p) с точностью до знака — это отношение лапласова изображения Y (p) выхода y(t) к лапласовому изображению U (p) входа u(t) системы (1). Отметим, что поскольку элементы обратной матрицы (A − pI)−1 суть выражения αij (p) ∆(p)
(i, j = 1, 2, . . . , n),
где αij (p) — некоторые многочлены степени не выше n − 1, а ∆(p) = det(pI−A), то элементами матрицы W (p) являются дробно-рациональные функции βsk (p) (s = 1, . . . , `, k = 1, . . . , m), ∆(p) представляющие собой правильные дроби с одинаковым знаменателем ∆(p) и числителями являющимися βsk (p) — некоторыми многочленами степени меньше, чем n. Полюсами этих функций являются нули многочлена ∆(p), т.е. собственные значения матрицы A. Таким образом, передаточная функция W (p) определена всюду на комплексной плоскости C, за исключением собственных значений матрицы A. Отметим очень важное свойство передаточной функции. Теорема. Передаточная функция W (p) инвариантна относительно невырожденных линейных преобразований. Д о к а з а т е л ь с т в о. Пусть ξ = Sx (det S 6= 0) — невырожденное линейное преобразование. Сделаем в системe (1) замену ξ = Sx. Получим новую систему ξ˙ = SAS −1 ξ + Sbu, y = c∗ S −1 ξ. (13) Передаточная функция W1 (p) системы (13) имеет вид W1 (p) = c∗ S −1 (SAS −1 − pI)−1 Sb. Поскольку (SAS −1 − pI)−1 = (SAS −1 − pSS −1 )−1 = £ ¤−1 = S(A − pI)S −1 = S(A − pI)−1 S −1 , то W1 (p) = c∗ (A − pI)−1 b = W (p).
37
Таким образом, передаточные функции системы (1) и новой системы (13) совпадают. Теорема доказана. 3. Случай одного уравнения n-го порядка. Найдем передаточную функцию линейного блока (L), описываемого уравнением: N (D)y = M (D)u,
D :=
d , dt
(14)
где N (D) = N0 Dn + N1 Dn−1 + . . . + Nn E, M (D) = M0 Dm + Mm−1 Dm−1 + . . . + Mm E, — многочлены от оператора дифференцирования D, а Nj , Mk (j = 0, · · · , n; k = 0, · · · , m) — некоторые вещественные числа, m < n, N0 := 1. В силу теоремы 2 из § 1 уравнение (14) эквивалентно системе (9) § 1. Принимая во внимание специальный вид матрицы A и векторов b и c (см. замечание в конце §1), вычислим выражение c∗ (A − pI)−1 b для системы (9) § 1. Из вида вектора b следует, что для вычисления выражения (A−pI)−1 b необходимо вычислить лишь последний столбец матрицы (A−pI)−1 . Из правила обращения матриц вытекает, что этот столбец составлен из алгебраических дополнений последней строки матрицы −p 1 0 ... ... 0 0 −p 1 0 ... 0 .. .. .. .. .. .. . . . . . . A − pI = , 0 ... 0 −p 1 0 0 ... 0 0 −p 1 −Nn −Nn−1 . . . . . . . . . −N1 − p поделенных на det(A − pI). Искомые алгебраические дополнения равны (−1)n+1 , (−1)n+1 p, . . . , (−1)n+1 pn−1 . Поэтому 1 1 p p 1 1 (A − pI)−1 b = (−1)n+1 .. = − . . det(A − pI) . det(pI − A) .. pn−1 pn−1
38
Из последнего равенства следует, что c∗ (A − pI)−1 b = −
Mm + Mm−1 p + . . . + M0 pm . det(pI − A)
Поскольку det(pI − A) = pn + N1 pn−1 + . . . + Nn , то окончательно получаем равенство c∗ (A − pI)−1 b = −
M (p) N (p)
для указанных выше матриц, заданных в специальной форме. Таким образом, передаточная функция W (p) линейного блока (L), описываемого уравнением (14), равна: W (p) = −
M (p) . N (p)
(15)
Замечание. Равенство (15) можно было получить, применив преобразование Лапласа L непосредственно к уравнению (14). Действительно, полагая начальные условия нулевыми и пользуясь свойствами преобразования Лапласа, из (14) получаем: N (p)L[y(t)] = M (p)L[u(t)]. Отсюда L[−y(t)] = −
M (p) L[u(t)]. N (p)
4. Определение частотной характеристики. Пусть сначала m = ` = 1, т.е. вход u и выход y — скалярные функции. Допустим, что вход u является гармонической функцией: u(t) = B cos ωt (или u(t) = B sin ωt), или в комплексной форме u(t) = U0 eiωt .
(16)
Здесь B, U0 , ω — некоторые вещественные константы, i — мнимая единица. Будем искать вектор состояния x(t) в виде x(t) = P eiωt ,
(17)
39
где P ∈ Cn — некоторый векторный параметр “комплексная амплитуда", подлежащий определению. Подставляя (16) в первое уравнение системы (1), получим (A − iωI)P eiωt = −U0 beiωt . Отсюда P = −U0 (A − iωI)−1 b (18) при условии, что det(A − iωI) 6= 0. Последнее условие выполнено, если собственные числа матрицы A не лежат на мнимой оси. Далее, c учетом (17), (18), получаем y(t) = c∗ x(t) = −c∗ (A − iωI)−1 bU0 eiωt , или −y(t) = W (iω)U0 eiωt . (19) Таким образом, если на вход линейного блока (L), описываемого системой (1), поступает периодический сигнал (16), то при соответствующем начальном состоянии x(0) = P , где P — значение определяемое (18), выходом будет тоже периодический сигнал (19). Коэффициент W (iω) в (19) есть значение передаточной функции W (p) в точках мнимой оси. О п р е д е л е н и е 2. Матричнозначная функция ω → W (iω) W (iω) = c∗ (A − iωI)−1 b,
(20)
где ω ∈ (−∞, +∞) — вещественная переменная, а i — мнимая единица, называется частотной (амплитудно-фазовой) характеристикой системы (1). В случае m = ` = 1 из (19) следует смысл функции (20): |W (iω)| — это отношение амплитуд сигналов на входе и выходе линейного блока (L), а arg W (iω) — разность фаз этих сигналов. О п р е д е л е н и е 3. Образ отображения ω → W (iω) называется годографом частотной характеристики. При m = ` = 1 значениями W (iω) являются комплексные числа, и, поэтому, годографом в этом случае будет некоторая кривая в комплексной плоскости C. В общем случае т.е. когда либо m > 1, либо ` > 1 годографом является некоторая “кривая” в пространстве комплексных матриц порядков ` × m.
40
Пусть в системе (1) m = ` = 1 т.е. вход u и выход y являются скалярными функциями и все собственные значения матрицы A имеют отрицательные вещественные части. Такие матрицы впредь называются устойчивыми или гурвицевыми. Пусть, далее, x1 (t) и x2 (t) — два решения системы (1) с различными начальными условиями x1 (0) = x◦1 , x2 (0) = x◦2 , x◦1 , x◦2 ∈ Rn , и z(t) = x1 (t) − x2 (t). Тогда, очевидно, имеем z(t) ˙ = Az(t),
z(0) = z ◦ , z ◦ = x◦1 − x◦2 .
(21)
Из вида решения z(t) = z0 eAt уравнения (21) и свойств матрицы A получаем, что lim z(t) = 0, t→+∞ т.е. lim (x1 (t) − x2 (t)) = 0. t→+∞
Отсюда следует, что и для соответствующих выходов y1 (t) = c∗ x1 (t) и y2 (t) = c∗ x2 (t) также будет иметь место соотношение lim (y1 (t) − y2 (t)) = 0.
t→+∞
(22)
Так как уравнение (14) является частным случаем описания линейных блоков (L) системами вида (1), то соотношение (22) справедливо также и для описания блока (L) уравнением (14). Из (19) и (22) следует, что для устойчивых линейных блоков (L) при u(t) = eiωt и при любом начальном состоянии x(0) блока (L) справедливо предельное соотношение lim (y(t) + W (iω)eiωt ) = 0.
t→+∞
(23)
Отсюда следует, что для устойчивых блоков (L) частотную характеристику можно определять экспериментально. Для этого нужно на вход блока (L) подать периодический сигнал, например, переменный ток единичной амплитуды и частоты ω u = eiωt . После этого необходимо подождать некоторое время, пока на выходе не установится
41
некоторый периодический сигнал вида y(t) = A(iω)ei(ωt)+iα(iω) — переменный ток амплитуды A(iω) той же частоты ω, что и при входе, но по фазе сдвинутый на α(iω). Из (23) следует, что будут иметь место приближенные равенства A(iω)=|W ˙ (iω)|,
α(iω)=arg ˙ W (iω).
(24)
По формулам (24) однозначно определяется комплексное число W (iω). Затем, прогоняя ω от −∞ до +∞, получим годограф W (iω) на комплексной плоскости. На самом деле, из-за очевидного равенства lim W (iω) = 0, ω→+∞
эту прогонку следует проводить только на конечном промежутке изменения ω. Таким образом, для получения указанным путем частотной характеристики не нужно информации о матрице A и векторах b и c, а в уравнении (14) о коэффициентах многочленов N (p) и M (p). Поскольку многие результаты в теории управления формулируются в терминах частотных характеристик, то для них не требуется описание соответствующих линейных блоков (L) системами дифференциальных уравнений, а нужна только кривая — годограф частотной характеристики на комплексной плоскости. Отметим, что в силу принципа аналитического продолжения частотная характеристика W (iω) позволяет однозначно определить и передаточную функцию W (p).
42
ГЛАВА II УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ §1. Управляемость Пусть объект управления описывается линейной системой x˙ = Ax + bu,
y = c∗ x,
(1)
где A, b, c — вещественные постоянные матрицы порядков n × n, n × m, n × l соответственно, x = x(t), u = u(t), y = y(t) — векторные функции соответственно порядков n, m, `: x ∈ Rn , u ∈ Rm , y ∈ R` . Для фиксированного t ∈ [t0 , T ] (t0 < T ) вектор x = x(t) будем называть состоянием системы, вектор u = u(t) — входом или управлением, вектор y = y(t) — выходом. Точка над символом x обозначает дифференцирование по t. Проблема управления состоит в выборе функции u(t) таким образом, чтобы перевести объект из любого состояния в фазовом пространстве в любое другое состояние за наперед заданное время. Пример. Пусть материальная точка движется вдоль оси x под действием силы f (t). Требуется выбрать силу f (t) так, чтобы точка, занимающая в начальный момент времени положение x0 и имеющая скорость x˙ 0 , через время T остановилась в заданном положении. Примем заданное положение, где материальная точка должна остановиться, за начало координат. Обозначим через x(t) координату материальной точки в момент времени t. Математическая формулировка задачи такова: найти функцию f (t), t ∈ [0, T ], удовлетворяющую условиям: ) m¨ x(t) = f (t), (2) x(0) = x0 , x(0) ˙ = x˙ 0 ; x(T ) = 0, x(T ˙ ) = 0. (Здесь m — масса материальной точки). Введя обозначения x1 = x, x2 = x, ˙ u= лентной системе x˙ 1 = x2 , x˙ 2 = u, x1 (0) = x0 ,
x2 (0) = x˙ 0 ;
1 m
f , перейдем к эквива-
x1 (T ) = 0,
x2 (T ) = 0.
43
Интегрируя уравнения движения, имеем Zt x2 (t) = x˙ 0 + u(s) ds, 0
x1 (t) = x0 + x˙ 0 t +
µ Rt Rτ 0
¶ u(s) ds dτ.
0
Из условий x1 (T ) = 0, x2 (T ) = 0 получаем уравнения (интегральные) для определения u(t): ZT ZT Zτ u(s) ds dτ = −x0 − T x˙ 0 . u(s) ds = −x˙ 0 ; 0
0
0
Будем искать u(t) в виде u(t) = d0 t + d1 , где d0 и d1 — неопределенные коэффициенты, подлежащие определению. Подставляя это выражение в последние два интегральные уравнения, получим алгебраическую систему двух линейных уравнений относительно d0 и d1 2 T d + T d = −x˙ , 0 1 0 2 T 3 d + T 2 d = −x − T x˙ . 6
0
2
1
0
0
Отсюда
¶ µ T x0 + x˙ 0 , 2 ¶ µ 6 2 d1 = − 2 x0 + T x˙ 0 . T 3 Найденное управление u(t) решает поставленную задачу (2). 12 d0 = 3 T
Отметим, что сложность проблемы управляемости состоит в том, что число управлений (размерность m вектора u), как правило, меньше числа управляемых процессов (размерности n вектора x). Дальше мы дадим определение полной управляемости системы (1) и докажем теорему о необходимых и достаточных условиях полной управляемости.
44
О п р е д е л е н и е 1. С и с т е м а (1) называется п о л н ос т ь ю у п р а в л я е м о й (или п а р а (A, b) называется п о л н о с т ь ю управляемой), если для любых векторов x0 ∈ Rn , x1 ∈ Rn и любых t0 < t1 существует такое управление u(t) (являющееся кусочно-непрерывной функцией, заданной на [t0 , t1 ]), что для решения x(t) системы (1) с этим управлением и с начальным условием x(t0 ) = x0 выполнено равенство x(t1 ) = x1 (рис. 3). Можно дать и такое определение полной управляемости системы. О п р е д е л е н и е 10 . С и с т е м а (1) называется п о л н ос т ь ю у п р а в л я е м о й (п а р а (A, b) называется п о л н о ст ь ю у п р а в л я е м о й ), если для любого T > 0 и любого вектора x0 ∈ Rn существует такое управление u(t) (являющееся кусочнонепрерывной функцией, заданной на [0, T ]), что для решения x(t) системы (1) с этим управлением и с начальным условием x(0) = x0 выполнено равенство x(T ) = 0.
Рис. 3. Решение x(t) полностью управляемой системы x(t0 ) = x0 , x(t1 ) = x1 ∀t0 , t1 ∈ R и ∀x0 , x1 ∈ Rn
Определение 1 эквивалентно определению 10 в силу линейности и стационарности системы (1) ( правая часть не зависит явно от t). Действительно, пусть система (1) управляема в смысле определения 10 , и пусть t0 , t1 — любые числа, а x0 , x1 — любые векторы из Rn . Тогда существуют управления u ¯(t) и u ˜(t) такие, что для соответствующих решений x ¯(t) и x ˜(t) системы (1) будут выполнены
45
равенства x ¯(0) = x0 , x ¯(T ) = 0, x ˜(0) = 0, x ˜(T ) = x1 , где T = t1 − t0 . Так как правая часть системы (1) не зависит явно от t, то сдвиг любого её решения вдоль оси t есть снова решение. Следовательно, вектор-функция x(t) = x ¯(t − t0 ) + x ˜(t − t0 ) будет решением системы (1), удовлетворяющим условиям x(t0 ) = x0 , x(t1 ) = x1 с соответствующим управлением u(t) = u ¯(t − t0 ) + u ˜(t − t0 ), т.е. система (1) будет управляема в смысле определения 1. Обратное очевидно. Итак, система (1) полностью управляема, если его вектор состояния x(t) за счет подаваемого на вход управления u(t) можно перевести из произвольного начального состояния x0 в начало координат за любое конечное время. Заметим, что всюду ниже, не оговаривая это особо, будем считать, что пространство Rn и линейные операторы, определяемые вещественными матрицами A, b и c соответственно, комплексифицированы (см. § 2, гл.I). При этом комплексифицированное пространство CRn мы обозначаем через Cn . Теорема. (О критериях полной управляемости [54, 95].) Следующие условия эквивалентны между собой и каждое из них является необходимым и достаточным условием для полной управляемости системы (1): (Iy ) Ранг матрицы R = (b, Ab, . . . , An−1 b)
(3)
порядка n × mn равен n: rank (b, Ab, . . . , An−1 b) = n или, иначе, соотношения z ∗ Ak b = 0
(k = 0, 1, . . . , n − 1)
(4)
для вектора z ∈ Rn могут быть выполнены лишь для z = 0. (IIy ) Пусть Ω — произвольное множество плоскости комплексного переменного, включащее хотя бы одну свою предельную точку. Соотношение z ∗ epA b = 0 ∀ p ∈ Ω, (5)
46
где z ∈ Cn , влечет z = 0. (IIy0 ) Для любых чисел t1 < t2 соотношение z ∗ eAt b = 0
∀ t ∈ (t1 , t2 ),
(6)
где z ∈ Rn , возможно лишь для z = 0. (IIIy ) Пусть Ω — произвольное множество плоскости комплексного переменного p, включающее хотя бы одну свою предельную точку и не содержащее собственных значений матрицы A. Соотношение z ∗ (pI − A)−1 b = 0
(∀ p ∈ Ω),
(7)
где z ∈ Cn , возможно лишь для z = 0 (здесь I — единичная (n × n)матрица). (IIIy0 ) Пусть (t1 , t2 ) ⊂ R — произвольный интервал вещественной оси. Соотношение z ∗ (pI − A)−1 b = 0
(∀ p ∈ (t1 , t2 )),
где z ∈ Rn , возможно лишь для z = 0. (IVy ) Ранг матрицы (d0 , . . . , dn−1 ) (порядка n × nm), где di (i = 0, . . . , n − 1) — вещественные (n × m)-матрицы–коэффициенты многочлена ¡ ¢ det(pI − A) (pI − A)−1 b = dn−1 pn−1 + . . . + d0 , (8) равен n. (Vy ) Для любых чисел t1 < t2 симметрическая матрица Zt2 ∗
eAt bb∗ eA t dt.
K=
(9)
t1
является положительно определенной (соответствующая квадратичная форма z ∗ Kz > 0 ∀ z ∈ Rn , z 6= 0). (V Iy ) Соотношения A∗ z = pz, z ∗ b = 0, выполненные для какоголибо числа p0 ∈ C и вектора z ∈ C, возможны лишь для z = 0, т.е. не существует ненулевого вектора z ∈ Cn , для которого выполнены равенства A∗ z = p0 z, z ∗ b = 0, где p0 — некоторое комплексное число.
47
(V IIy ) Для любого комплексного числа p ранг матрицы (A − pI, b) порядка n × (n + m) равен n. (V IIIy ) Не существует такой неособой вещественной матрицы S порядка n × n, что преобразованные матрицы S −1 AS и S −1 b имеют вид µ ¶ª µ ¶ª n1 n1 A11 A12 b1 −1 −1 S AS = ª , S b= ª . 0 0 A22 (10) n2 n2 |{z} |{z} n1
или S
−1
n2
¶ª µ n1 A11 0 AS = ª , A21 A22 n2 |{z} |{z} n1
S −1 b
µ ¶ª n1 0 = ª . b2 n2
(11)
n2
(сбоку и внизу указаны размерности матриц). Д о к а з а т е л ь с т в о. Для того, чтобы установить указанную в теореме эквивалентность условий, достаточно доказать следующую цепочку импликаций: (V Iy ) ⇐⇒ (V IIy ) ⇐⇒ (полная управляемость) =⇒ =⇒ (IIy ) ⇐⇒ (IIy0 ) =⇒ (IIIy ) ⇐⇒ (IVy ) =⇒ (Iy ) ⇒ (12) ⇒ (Vy ) ⇒ (полная управляемость) ⇐⇒ (V IIIy ), или аналогичную цепочку для отрицания соответствующих утверждений (см. рис. 4): (V IIIy ) ⇐⇒ (полная управляемость) ⇒ (V y ) ⇒ 0 ⇒ (I y ) ⇒ (IV y ) ⇐⇒ (III y ) ⇒ (II y ) ⇐⇒ (II y ) ⇒ ⇒ (полная управляемость) ⇐⇒ (V I y ) ⇐⇒ (V II y )
(13)
48
Рис. 4. К доказательству теоремы 1.
1. Эквивалентность (V Iy ) ⇐⇒ (V IIy ). Условие (V Iy ) означает, что равенства z ∗ (A − p¯I) = 0, z ∗ b = 0 (при любом фиксированном p ∈ C) выполняются лишь для z = 0 или, что то же самое, соотношение z ∗ (A − p¯I, b) = 0, возможно лишь для z = 0, т.е. что ранг матрицы (A − pI, b) равен n для любого p. 0 2. Эквивалентность (II y ) ⇐⇒ (II y ). Утверждение (II y ) означает, что равенство (5) выполнено для некоторого ненулевого вектора z0 ∈ Cn и всех p из некоторого подмножества Ω0 ∈ C комплексной плоскости, содержащего по крайней мере одну свою предельную точку: z0∗ (exp pA)b = 0 ∀ p ∈ Ω0 . (14) Пусть p0 — предельная точка множества Ω0 . Тогда существует последовательность {pk } (k ∈ N), pk ∈ Ω0 , pk = 6 p0 , что lim pk = p0 , k→∞
причем p0 ∈ Ω0 . Для произвольного вектора ξ0 ∈ Cm функция ϕ(p) = z0∗ (exp pA)bξ0
(15)
49
комплексного переменного p будет, очевидно, аналитической (голоморфной) на всей комплексной плоскости C и, поэтому, в силу (14), обладает свойством ϕ(pk ) = 0,
(k = 1, 2, . . .),
ϕ(p0 ) = 0.
(16)
Согласно свойству единственности аналитической функции будем иметь ϕ(p) ≡ 0 на C. Действительно, разлагая функцию ϕ(p) в степенной ряд (он сходится везде, так как ϕ(p) не имеет особых точек) ϕ(p) = d0 + d1 (p − p0 ) + d2 (p − p0 )2 + . . . в окрестности точки p0 , и, учитывая, что d0 = ϕ(p0 ) = 0, в силу (16) получим d1 (pk − p0 ) + d2 (pk − p0 )2 + . . . = 0. (17) Сокращая на (pk − p0 ) и переходя к пределу при k → ∞ (pk → p0 ), из (17) будем иметь: d1 = 0. Поступая аналогично, получим последовательно, что d2 = 0, d3 = 0, . . .. Следовательно, ϕ(p) = 0 ∀ p ∈ C. Отсюда, учитывая, что в (15) ξ0 – произвольный вектор, получаем z0∗ (exp pA)b = 0 ∀ p ∈ C. (18) В частности, (18) имеет место и на любом интервале (t1 , t2 ) ⊂ R вещественной оси R. Поэтому, записав z0 в виде z0 = z1 +iz2 , z1 ∈ Rn , z2 ∈ Rn , будем иметь z1∗ etA b − iz2∗ etA b = 0
∀t ∈ (t1 , t2 ).
Отсюда, очевидно, следует, что z1 etA b = 0,
z2 etA b = 0 ∀ t ∈ (t1 , t2 ) ⊂ R,
причем z1 , z2 ∈ Rn , и либо z1 6= 0, либо z2 6= 0. Последние равенства 0 противоречат соотношению (6), т.е. имеет место (II y ). 0 Обратная импликация (II y ) ⇒ (II y ) очевидна. 0 3. Эквивалентность (III y ) ⇐⇒ (III y ). Эта эквивалентность доказывается совершенно аналогично доказательству предыдущего пункта 2 с введением функции ϕ(p) = z ∗ (pI − A)−1 b,
p ∈ C\{λj (A)},
где z ∈ Cn , λj (A) (j = 1, · · · , n) — собственные значения матрицы A.
50
4. Импликация (II y ) ⇒ (полная управляемость) ≡ (п.упр.). Как было выше показано (см. п.2), утверждение (II y ) влечет равенство (18). Пусть x0 , x1 ∈ Rn — произвольные векторы, а x(t) — решение первого уравнения системы (1) с начальным условием x(t0 ) = x0 . Тогда по формуле Коши Zt1 A(t−t0 ) x(t) = e x0 + eA(t−s) bu(s) ds. t0
Из условия x(t1 ) = x1 находим Zt1 x1 − eA(t1 −t0 ) x0 =
eA(t1 −s) bu(s) ds. t0
Отсюда, с учетом (18), получаем, что для любого управления u(t) Zt1 z0∗ (x1 − eA(t1 −t0 ) x0 ) =
z0∗ eA(t1 −s) bu(s) ds = 0, t0
где, по условию, z0 = 6 0. Равенство z0∗ (x1 − eA(t1 −t0 ) x0 ) = 0 означает, что вектор x1 , получаемый для всевозможных управлений u(t), должен лежать в гиперплоскости z0∗ x = z0∗ eA(t1 −t0 ) x0 , и, тем самым, не может быть любым. А это противоречит свойству полной управляемости системы (1). Таким образом, (II y ) ⇒ ( п.упр.). 5. Импликация (III y ) ⇒ (II y ). Пусть имеет место (III y ), т.е. не выполнено соотношение (7). Это означает, существует такой ненулевой вектор z0 ∈ Cn , что для некоторого множества Ω0 ⊂ C, содержащего хотя бы одну свою предельную точку и не содержащего собственных значений матрицы A, выполнено соотношение z0∗ (pI − A)−1 b = 0 ∀ p ∈ Ω0 . Рассматривая функцию комплексного переменного ψ(p) = z0∗ (pI − A)−1 bξ0 ,
(19)
51
где ξ0 ∈ Cm — произвольный вектор, и повторяя рассуждения, проведенные для функции ϕ(p) (см. п.2), получим в силу свойства единственности аналитической функции, что ψ(p) ≡ 0 для всех точек p комплексной плоскости, за исключением собственных значений λj (A) матрицы A. Имеет место представление (см., например, [184, с.50, § 2, гл.I]), I 1 At (pI − A)−1 ept dp (t ∈ R), (20) e = 2πi Γ
где Γ — окружность, содержащая внутри себя все собственные значения λj (A) матрицы A и ориентированная в положительном направлении (т.е. область, ограниченная Γ, во время обхода Γ остается слева) (i — мнимая единица). Из (20) и (19), где Ω0 = C\{λj (A)}, получаем I 1 ∗ At z0 e b = z0∗ (pI − A)−1 bept dp = 0 ∀ t ∈ R (z0 6= 0). 2πi Γ 0
Отсюда следует свойство (II y ), которое эквивалентно (II y ). Тем самым, установлено свойство (II y ). 6. Импликация (I y ) ⇒ (III y ). Пусть выполнено (I y ), т.е. существует ненулевой вектор z0 ∈ Rn такой, что z0∗ Ak b = 0 (k = 0, 1, . . . , n − 1).
(21)
Пусть det(pI − A) = pn + d1 pn−1 + . . . + dn . По теореме Гамильтона—Кэли [48] An + d1 An−1 + . . . + dn In = On ,
(22)
где On , In — нулевая и единичная (n × n)-матрицы соответственно. Умножая обе части равенства (22) последовательно на A, A2 , . . ., получим An+1 + d1 An + . . . + dn A = On , An+2 + d1 An+1 + . . . + dn A2 = On , (23) ... ... ... ... ... ... ...
52
Из (22) и (23) следует, что матрицы An , An+1 , An+2 , . . . являются линейными комбинациями матриц In , A, A2 , . . . , An−1 : Ak =
n−1 X
(k)
αi Ai
(k = n, n + 1, . . .).
i=0
Поэтому z0∗ Ak b
=
n−1 X
(k)
αi z0∗ Ai b = 0 (k = n, n + 1, . . .).
i=0
Итак, с учетом (21), имеем ∃ z0 ∈ Rn , z0 6= 0 :
z0∗ Ak b = 0 (k = 0, 1, 2, . . .). − A)−1
Разложим матричную функцию R(p) = (pI ням 1/p. Очевидно, µ ¶ A −1 (pI − A)−1 = p−1 I − . p
(24)
в ряд по степе-
Очевидно, что если λ — собственное значение матрицы A, то λ/p — собственное значение матрицы A/p. Поэтому при достаточно больших |p| все собственные значения матрицы A/p будут лежать внутри единичного круга и, следовательно, имеет место разложение ([56]) µ ¶ ∞ X A −1 Ak I− , (25) = I + p−1 A + p2 A2 + . . . = p pk k=0
причем ряд (25) сходится при |p| > |Λ|, где Λ — максимальное по модулю собственное значение матрицы A. Поэтому ∞
R(p) = (pI − A)
−1
1 X Ak = , p pk
(|p| > |Λ|).
(26)
k=0
Учитывая (24), из (26) получаем, что существует ненулевой вектор z0 ∈ Rn : ∞ 1 X −k ∗ k ∗ −1 z0 (pI − A) b = p z0 A b = 0 p k=0
для любого p ∈ ∆, где ∆ — внешность круга радиуса |Λ| с центром в точке 0. Последнее означает, что выполнено (III y ).
53
7. Импликация (V y ) ⇒ (I y ). Прежде всего заметим, что матрица K, определяемая формулой (9), неотрицательно определена. Действительно, для любого z ∈ Rn имеем Zt2 Zt2 ∗ At ∗ At ∗ z Kz = (z e b)(z e b) dt = |z ∗ eAt b|2 dt ≥ 0, ∗
t1
z ∗ Kz
(27)
t1 n
т.е. ≥ 0 ∀z ∈ R . Пусть теперь справедливо (V y ), т.е. существуют такие числа t1 < t2 и существует такой ненулевой вектор z0 ∈ Rn , что z0∗ Kz0 = 0. С учетом последнего равенства, из (27) получаем, что Zt2 |z0∗ eAt b|2 dt = 0. t1
Последнее равенство необходимо влечет тождество z0∗ eAt b ≡ 0 на [t1 , t2 ].
(28)
В силу свойства единственности аналитической функции из (28) следует (см. рассуждения п.2), что справедливо также тождество z0∗ eAt b ≡ 0 на (−∞, +∞).
(29)
Дифференцируя последовательно тождество (29), имеем z0∗ Ak eAt b ≡ 0 ∀ t ∈ (−∞, +∞) (k = 0, 1, 2, . . .).
(30)
Положив в равенстве (30) t = 0, получим z0∗ Ak b = 0 (k = 0, 1, 2, . . .), где z0 6= 0, т.е. не выполняются соотношения (4). Тем самым установлено свойство (I y ). 8. Импликация (п.упр.) ⇒ (V y ). Докажем эквивалентное утверждение: (Vy ) ⇒ (п.упр.). Предположим, что имеет место (Vy ), т.е. K > 0 для любых t1 < t2 . Пусть t0 , t1 ∈ R — произвольные числа, а x0 , x1 ∈ Rn — произвольные векторы. Требуется найти такое управление u(t), t ∈ [t0 , t1 ], чтобы для соответствующего решения x(t) системы (1) были справедливы равенства: x(t0 ) = x0 , x(t1 ) = x1 . (31)
54
Будем искать требуемое управление u(t) в виде ∗ (t
u(t) = b∗ eA
1 −t)
c,
(32)
где c ∈ Rn — некоторый постоянный вектор, подлежащий определению. Тогда, поступая аналогично п.4, имеем: Zt1 x1 − e
A(t1 −t0 )
e
x0 =
A(t1 −s)
∗ A∗ (t1 −s)
bb e
1 −t0 ¶ µ tZ At ∗ A∗ t e bb e dt c, c ds =
t0
0
т.е. получаем уравнение x1 − eAT x0 = KT c,
Z где T = t1 − t0 , KT =
T
(33)
∗
eAt bb∗ eA t dt, для определения вектора c.
0
Так как по условию матрица KT > 0, то det KT 6= 0. Следовательно, существует обратная матрица KT−1 . Из уравнения (33) находим c = KT−1 (x1 − eAT x0 ).
(34)
При указанном выборе управления в виде (32), где c определяется согласно (34), соответствующее решение x(t) удовлетворяет условиям (31). Следовательно, пара (A, b) полностью управляема. 9. Эквивалентность (V III y ) ⇐⇒ (п.упр.). 9.1. Пусть справедливо утверждение (V III y ), т.е. существует неособая матрица S такая, что имеют место равенства (10) или (11). Сделаем в системе (1) линейное преобразование x = Sξ. Получим систему
½
˜ + ˜bu, ξ˙ = Aξ y = c˜∗ ξ,
(35)
где A˜ = S −1 AS, ˜b = S −1 b, c˜ = S ∗ c. Положим ξ = (ξ1 , ξ2 )∗ , где ξ1 и ξ2 — векторы размерностей n1 и n2 соответственно (n1 + n2 = n). Тогда первое уравнение системы (35), примет вид (см. (10), (11)) ( ( ξ˙1 = A11 ξ1 + A12 ξ2 + b1 u, ξ˙1 = A11 ξ1 или ξ˙2 = A22 ξ2 . ξ˙2 = A21 ξ1 + A22 ξ2 + b2 u. (36)
55
Из (36) видим, что ξ2 = ξ2 (t) или ξ1 = ξ1 (t) не зависит от управления u = u(t). Поэтому за счет выбора управления u(t) на интервале (t0 , t1 ) невозможно удовлетворить соответствующее решение ξ(t) условию ξ(t1 ) = ξ 1 при произвольном ξ 1 ∈ Rn . Следовательно, пара ˜ ˜b), значит, и пара (A, b) неполностью управляема. (A, 9.2. Пусть имеет место утверждение ( п.упр.) — пара (A, b) неполностью управляема. Тогда по доказанному выше (см. п.6, п.7) (п.7) (п.6) ( п.упр.) ⇒ (V y ) ⇒ (I y ),
и, следовательно, линейная оболочка L, натянутая на столбцы матрицы R = (b, Ab, . . . , An−1 b) (см.(2)) не совпадает со всем пространством Rn . Так как по теореме Гамильтона-Кэли матрица An является линейной комбинацией матриц In , A, . . . , An−1 (см. (22)), то линейное подпространство L ⊂ Rn инвариантно относительно A. В самом деле, пусть bj ∈ Rn (j = 1, . . . , m) — столбцы матрицы b: b = (b1 , b2 , . . . , bm ), и пусть x ∈ L. Тогда по самому определению L имеем n−1 m XX x= αkj Ak bj , αkj ∈ R. k=0 j=1
Применяя к обеим частям последнего равенства оператор A, и заменяя матрицу An ее выражением из (22) — линейной комбинацией матриц In , A, . . . , An−1 – получаем, что вектор Ax =
m n−1 XX
αkj Ak+1 bj
(αkj ∈ R)
k=0 j=1
тоже является линейной комбинацией векторов матрицы R, т.е. Ax ∈ L. Обозначим через n1 размерность линейного пространства L, а через n2 — размерность прямого дополнения L пространства L до Rn , т.е. Rn = L ⊕ L (n1 + n2 = n). Пусть s1 , s2 , . . . , sn1 и sn1 +1 , sn1 +2 , . . . , sn соответственно базисы в L и L. Образуем матрицы S1 = (s1 , s2 , . . . , sn1 ) и S2 = (sn1 +1 sn1 +2 , . . . , sn ), столбцами которых
56 1 являются векторы базисов {sj }nj=1 и {sj }nj=n1 +1 пространств L и L соответственно. Положим
S = (S1 , S2 ). Тогда столбцы матрицы S, очевидно, образуют базис во всем пространстве Rn . Стало быть, S — неособая матрица. Так как подпространство L инвариантно относительно A, то Asj ∈ L (j = 1, . . . , n1 ), и, поэтому, Asj = α1j s1 + . . . + αn1 j sn1
(j = 1, . . . , n1 ),
(37)
где αij ∈ R (i = 1, 2, . . . , n1 ). Равенство (37) можно записать в виде следующего матричного равенства AS1 = S1 A11 ,
(38)
где A11 — (n1 × n1 )-матрица, j-й столбец которой состоит из чисел α1j , . . . , αn1 j . Рассмотрим теперь Asj , где j = n1 + 1, . . . , n. Так как векторы {sj }, (j = 1, . . . , n1 ; n1 + 1, . . . , n) (столбцы матрицы S) образуют базис в Rn , то имеют место разложения Asj = β1j s1 + . . . + βn1 j sn1 + γn1 +1j sn1 +1 + . . . + γnj sn (j = n1 + 1, . . . , n).
(39)
Равенства (39) можно записать в виде одного матричного равенства AS2 = S1 A12 + S2 A22 ,
(40)
где A12 — некоторая (n1 × n2 )-матрица, j-й столбец которой состоит из чисел β1j , . . . , βn1 j , а A22 — тоже некоторая (n2 × n2 )-матрица с j-м столбцом, состоящим из чисел γn1 +1j , . . . , γnj . По определению L столбцы матрицы b принадлежат L, следовательно bj = δ1j s1 + . . . + δn1 j sn1 (j = 1, 2, . . . , m), (41) где δij ∈ R (i = 1, . . . , n1 ). Равенства (41) эквивалентны матричному равенству b = S1 b1 ,
(42)
где b1 — некоторая (n1 × m)-матрица, j-й столбец которой образован из чисел δ1j , . . . , δn1 j .
57
Матричные равенства (38), (40), (42) можно записать, очевидно, в виде µ ¶ µ ¶ A11 A12 b AS = S , S 1 = b. 0 A22 0 Отсюда следует, что матрицы S −1 AS и S −1 b имеют вид (10). Таким образом, (п.упр) ⇒ (V III y ). 10. Эквивалентность (п.упр) ⇐⇒ (V I y ). 10.1. Пусть имеет место свойство (V I y ), т.е. существуют ненулевой вектор z0 ∈ Cn и число p0 ∈ C такие, что A∗ z0 = p0 z0 ,
z0∗ b = 0.
(43)
Для произвольного комплексного числа p, отличного от собственных значений матрицы A, используя (43), получаем z0∗ (A − pI) = z0∗ (p∗0 − p).
(44)
Из очевидного равенства z0∗ (A − pI)(A − pI)−1 = z0∗ , с учетом (44), имеем z0∗ (A − pI)−1 = z0∗ (p∗0 − p)−1 . Умножая последнее равенство справа на b и используя второе равенство из (43), получим z0∗ (A − pI)−1 = 0, т.е. имеет место свойство (III y ). Следовательно (см. выше п.5 и п.4), (III y ) ⇒ (II y ) ⇒ (п.упр), т.е. пара (A, b) неполностью управляема. 10.2. Пусть система не является полностью управляемой. Тогда в силу вышедоказанного (см. п.9) имеет место свойство (V III y ), т.е. существует такая неособая матрица S, что матрицы A˜ = S −1 AS
и ˜b = S −1 b
имеют вид (10) или (11). Пусть, для определенности, они имеют вид (10) (когда A˜ и ˜b имеют вид (11), рассуждения аналогичны).
58
z20
Пусть p0 ∈ C — какое-либо собственное значение матрицы A∗22 , а 6= 0 — соответствующий ему собственный вектор: A∗22 z20 = p0 z20
(z20 ∈ Cn2 ).
Тогда для вектора z˜0 = (0, z20 )∗ ∈ Rn имеем µ ¶ µ ¶ 0 0 ∗ e A z˜0 = = = p0 z˜0 ; A∗22 z20 p0 z20 Так как
e∗ = S ∗ A∗ (S ∗ )−1 , A
eb ∗ z˜0 = 0.
eb ∗ = b∗ (S ∗ )−1 ,
то A∗ (S ∗ )−1 z˜0 = p0 (S ∗ )−1 z˜0 , Последние равенства означают, что A∗ z0 = p0 z0 ,
b∗ (S ∗ )−1 z˜0 = 0.
b∗ z0 = 0,
где z0 = (S ∗ )−1 z˜0 , причем z0 6= 0 в силу того, что S — неособая матрица, т.е. свойство (V I y ) выполнено. Таким образом, мы показали, что полная управляемость пары (A, b) равносильна выполнению свойства (V Iy ). 11. Эквивалентность (III y ) ⇐⇒ (IV y ). 11.1. Пусть справедливо (IV y ), т.е. rank (d0 , . . . , dn−1 ) < n,
(45)
где d0 , . . . , dn−1 — коэффициенты многочлена (8). Из неравенства (45) следует, что существует ненулевой вектор z0 ∈ Rn такой, что z0∗ d0 = 0, . . . , z0∗ dn−1 = 0.
(46)
z0∗
Умножая обе части равенства (8) слева на и учитывая (46), получим z0∗ (pI − A)−1 b = 0 для всех p, отличных от собственных значений матрицы A, т.е. выполнено свойство (III y ) (за множество Ω можно принять множество C\{λj (A)}, где λj (A) — собственные числа матрицы A). 11.2. Пусть выполнено (III y ), т.е. существует такой ненулевой вектор z0 ∈ Cn , что имеет место равенство (7). Тогда из равенства (8) получаем, что z0∗ dn−1 pn−1 + . . . + z ∗ d0 = 0 ∀ p ∈ Ω,
(47)
59
где Ω ⊂ C — множество, фигурирующее в (IIIy ) теоремы 1. Очевидно, что из (47) следуют равенства (46), которые означают выполнение свойства (IV y ). Таким образом, нами доказана цепочка импликаций (13) и, значит, имеем место (12). Тем самым, теорема 1 доказана полностью. Из теоремы 1 вытекают следующие следствия. Следствие 1. Пусть пара (A, b) полностью управляема. Тогда для любой (n × m)-матрицы s пара (A + bs∗ , b) также полностью управляема. Действительно, по доказанной выше теореме полная управляемость равносильна свойству (IVy ). Поэтому, предполагая, что выполнены равенства (A + bs∗ )∗ z = pz,
b∗ z = 0
для какого-либо p ∈ C и z ∈ Cn , будем иметь: A∗ z = pz,
b∗ z = 0.
Отсюда, используя свойство (V Iy ), получим, что z = 0. Следовательно, пара (A + bs∗ , b) полностью управляема. Следствие 2. Если пара (A, b) полностью управляема, то полe eb), где A e = S −1 AS, eb = S −1 b ностью управляема также и пара (A, (S — произвольная вещественная неособая матрица). Д о к а з а т е л ь с т в о. Составим матрицу e = (eb, A eeb, · · · , A en−1eb). R Легко видеть, что e = S −1 R, R где R — матрица (3). Поскольку при умножении матрицы на неособую матрицу ее ранг не изменяется, то e = rank R. rank R Отсюда, в силу полной управляемости пары (A, b), согласно свойству (Iy ) теоремы будем иметь e = n. rank R e eb) полностью Следовательно, в силу того же свойства (Iy ) пара (A, управляема.
60
Следствие 3. Если пара (A, b) полностью управляема, и λ0 — произвольное собственное число матрицы A, то дефект (разность между порядком матрицы и ее рангом) d матрицы (A − λ0 I) не превосходит ранга матрицы b. В частности, если m = 1, то d = 1. Действительно, пусть r — ранг матрицы b. Предположим, что d > r. Поскольку при умножении матрицы на неособую матрицу ее ранг не изменяется, то rank (A − λ0 I) = rank J, S −1 (A − λ0 I)S
где J = — каноническая (жорданова) форма матрицы (A − λ0 I), S — некоторая неособая матрица. Так как число линейно независимых столбцов у матрицы b равно r, а у матрицы J (и значит, у матрицы (A−λ0 I)) равно n−d, то число линейно независимых столбцов матрицы (A − λ0 I, b) не превосходит r + n − d, т.е. rank (A − λ0 I, b) ≤ r + n − d. (48) Поскольку r + n − d < n, то из (48) следует, что выполнено свойство (V II y ), равносильное неуправляемости пары (A, b), что противоречит условию. Следовательно, d ≤ r, что и утверждалось. Замечание 1. Так как, очевидно, дефект матрицы A − λ0 I равен числу жордановых клеток в канонической форме матрицы A, отвечающих собственному значению λ0 , то в случае m = 1, т.е. когда b — одностолбцовый вектор, из полной управляемости пары (A, b) (в силу следствия 3) следует, что каждому собственному значению λ0 матрицы A отвечает лишь одна жорданова клетка в канонической форме матрицы A. Замечание 2. Из свойства (V IIIy ) вытекает, к какому виду (36) может быть приведена система, если она неполностью управляема. Из (36) видно, что в неполностью управляемой системе всегда может быть выделена подсистема, в которой отсутствует управляющее воздействие.
61
§ 2. Специальная форма систем с полностью управляемой парой (A, b).
Здесь мы покажем, к какому специальному виду можно привести систему x˙ = Ax + bu,
y = c∗ x (x ∈ Rn )
(1)
со скалярным входом u ∈ R и скалярным выходом y ∈ R, где A — (n × n)-матрица, а b и c векторы из Rn , если пара (A, b) полностью управляема. Теорема . Пусть в системе (1) b и c — векторы (т.е. m = ` = 1) и пара (A, b) полностью управляема. Тогда систему (1) невырожденным линейным преобразованием можно привести к следующему виду: x˙ 1 = x2 , . .. (2) x˙ n−1 = xn , x ˙ = −a x − . . . − a x + u, n 1 1 n n y = c1 x1 + . . . + cn xn , где числа aj (j = 1, . . . , n) являются коэффициентами характеристического многочлена det(pI − A) = pn + an pn−1 + . . . + a1 . Д о к а з а т е л ь с т в о. В силу свойства (Iy ) полной управляемости (см. теорему из §1) векторы e = b, n en−1 = (A + an I)b, en−2 = (A2 + an A + an−1 I)b, ... ... ... ... ... ... e1 = (An−1 + an An−2 + . . . + a2 I)b
62
линейно независимы и, следовательно, образуют базис в Rn . Матрица A преобразует векторы этого базиса в следующие: Aen = en−1 − an bn , Aen−1 = en−2 − an−1 en , (3) ... ... ... ... Ae1 = −a1 en (в последнем равенстве использовано тождество Гамильтона—Кэли). Сделаем в системе (1) линейное преобразование x = Sξ,
ξ ∈ Rn (det S 6= 0),
где S – матрица перехода от исходного базиса ε = (ε1 , . . . , εn ) (где εi – единичный вектор, у которого i-ая координата есть 1, а остальные координаты – нули) к новому базису (e1 , . . . , en ). В результате , система в новых координатах ξ примет вид ˜ + ˜bu, y = c˜∗ ξ, ξ˙ = Aξ (4) где A˜ = S −1 AS, ˜b = S −1 b, c˜ = S ∗ c. Из равенств (3) следует, что в (4) 0 1 0 ... 0 0 1 ... A˜ = .. .. .. .. . . . .
0 0 .. .
−a1 −a2 −a3 . . . −an
,
0 0 . ˜b = .. . 0 1
Теперь, сделав переобозначение ξ → x, из (4) получим (2). Теорема 2 доказана. Следствие. Если в системе (1) b и c – векторы, пара (A, b) полностью управляема и u(t) ∈ Cn−1 , то систему (1) можно привести к одному уравнению d N (D)y = M (D)u, D := , dt где N (D) = Dn + an Dn−1 + . . . + a1 , M (D) = cn Dn−1 + . . . + c1 — многочлены от оператора дифференцирования D.
63
Д о к а з а т е л ь с т в о следует из доказанной выше теоремы и теоремы 2 из § 1, гл. I. § 3. Наблюдаемость Перейдем теперь к понятию полной наблюдаемости. Рассмотрим систему x˙ = Ax + bu,
y = c∗ x (x ∈ Rn ,
u ∈ Rm ,
y ∈ R` ),
(1)
где A, b, c — вещественные постоянные матрицы. О п р е д е л е н и е 1. С и с т е м а (1) называется п о л н ос т ь ю н а б л ю д а е м о й (или п а р а (A, c) называется п о л н о с т ь ю н а б л ю д а е м о й ), если для любых t1 < t2 и любых троек вектор-функций (u1 (t), x1 (t), y1 (t)), (u2 (t), x2 (t), y2 (t)), заданных на [t1 , t2 ] и удовлетворяющих (1), из соотношений u1 (t) = u2 (t),
y1 (t) = y2 (t)
∀ t ∈ [t1 , t2 ]
(т.е. равенства входов и выходов) следует x1 (t) = x2 (t)
∀ t ∈ [t1 , t2 ]
(т.е. равенство состояний). Таким образом, система (1) полностью наблюдаема, если по точным измерениям входа u(t) и выхода y(t) можно однозначно определить состояние x(t). Поэтому иногда употребляется термин “восстанавливаемость системы” вместо термина “полная наблюдаемость”. Определение 1 эквивалентно следующему определению. О п р е д е л е н и е 10 . С и с т е м а (1) (или п а р а (A, c)) называется п о л н ос т ь ю н а б л ю д а е м о й , если для любого T > 0 и любой тройки (x(t), u(t), y(t)), заданной на [0, T ] и удовлетворяющей (1), из соотношений u(t) = 0,
y(t) = 0
∀ t ∈ [0, T ]
(2)
следует, что x(t) = 0 Поясним определение 10 .
∀ t ∈ [0, T ].
(3)
64
Ясно, что при u(t) ≡ 0 на [0, T ] и начальном условии x(0) = 0 первое уравнение системы (1) имеет только единственное нулевое решение x(t) ≡ 0 на [0, T ]. Следовательно, соответствующий выход y(t) = c∗ x(t) будет тоже нулевым: y(t) ≡ 0 на [0, T ]. Теперь, обратно: пусть при нулевом входе (u(t) ≡ 0 на [0, T ]) выход y(t) тоже нулевой (y(t) ≡ 0 на [0, T ]). Спрашивается, можно ли определить состояние x(t) однозначно, и будет ли оно нулевым ? Вообще говоря, ответ на этот вопрос отрицателен. Может оказаться так, что состояние x(t) ≡ 0 не является единственным, для которого выход y(t) оказывается нулевым. В последнем случае говорят о ненаблюдаемости системы. Покажем эквивалентность определений 1 и 10 . Ясно, что из полной наблюдаемости системы в смысле определения 1 следует и полная наблюдаемость в смысле определения 10 . Обратно, пусть система (1) полностью наблюдаема в смысле определения 10 . Далее, пусть (u1 (t), x1 (t), y1 (t)) и (u2 (t), x2 (t), y2 (t)) — любые две тройки вектор-функций, фигурирующие в определении 1. Тогда, вычитая из системы тождеств (на [t1 , t2 ]) x˙ 1 (t) ≡ Ax1 (t) + bu1 (t),
y1 (t) ≡ c∗ x1 (t)
x˙ 2 (t) ≡ Ax2 (t) + bu2 (t),
y2 (t) ≡ c∗ x2 (t),
систему получим тождества (на [t1 , t2 ]) ¡ ¢ ¡ ¢ d(x1 (t) − x2 (t)) ≡ A x1 (t) − x2 (t) + b u1 (t) − u2 (t) , dt ¡ ¢ y1 (t) − y2 (t) ≡ c∗ x1 (t) − x2 (t) , т.е. тройка (u0 (t), x0 (t), y0 t)) вектор-функций x0 (t) = x1 (t) − x2 (t),
u0 (t) = u1 (t) − u2 (t),
y0 (t) = y1 (t) − y2 (t)
удовлетворяет системе (1) для t ∈ [t1 , t2 ]. В силу стационарности системы (1) сдвиг любого её решения вдоль оси t есть снова решение, поэтому тройка (η0 (t), ξ0 (t), ζ0 (t)), где ξ0 (t) = x0 (t + t1 ), η0 (t) = u0 (t + t1 ), ζ0 (t) = y0 (t + t1 ), t ∈ [0, T ], T = t2 − t1 .
65
также удовлетворяет системе (1), т.е. ξ˙0 (t) ≡ Aξ0 (t) + bη0 (t),
ζ0 (t) ≡ c∗ ξ0 (t)
на [0, T ]. Пусть выполнены равенства u1 (t) = u2 (t),
y1 (t) = y2 (t) ∀ t ∈ [t1 , t2 ].
Тогда имеют место также равенства η0 (t) = 0, ζ0 (t) = 0 ∀ ∈ [0, T ]. Из последних соотношений в силу полной наблюдаемости системы (1) в смысле определения 10 следует, что ξ0 (t) = 0,
∀ t ∈ [0, T ],
т.е. x1 (t) = x2 (t) ∀ t ∈ [t1 , t2 ]. Следовательно, система (1) наблюдаема в смысле определения 1. Теорема 1. (Теорема двойственности Калмана.) Для полной наблюдаемости пары (A, c) необходимо и достаточно полной управляемости пары (A∗ , c). Таким образом, каждое из условий (Iy )—(V IIIy ) теоремы о критериях полной управляемости из § 1 после замены A и b соответственно на A∗ и c становится необходимым и достаточным условием полной наблюдаемости пары (A, c). Д о к а з а т е л ь с т в о. В силу определения 10 полная наблюдаемость пары (A, c) означает, что для любой тройки функций (u(t), x(t), y(t)), t ∈ [0, T ], удовлетворяющей системе (1) из равенств (2) следует равенство (3). Поскольку x(t) ˙ = Ax(t) ∀ t ∈ [0, T ], eAt x(0)
то x(t) = ∀ t ∈ [0, T ], т.е. для вектора z = x(0), в силу второго равенства (2), выполнено соотношение c∗ eAt z = 0 ∀ t ∈ [0, T ] или
∗
z ∗ eA t c = 0 ∀ t ∈ [0, T ]. (4) Так как матричная экспонента eAt является невырожденной матрицей при любом t (см. следствие 2 из § 2, гл.I), то условие (3): x(t) = eAt z ≡ 0 на [0, T ] равносильно условию z = 0. Поэтому полная
66
наблюдаемость пары (A, c) означает, что соотношение (4) выполняется лишь при z = 0. Таким образом, полная наблюдаемость пары (A, c) равносильна, в силу свойства (IIу0 ) теоремы из § 1, полной управляемости пары (A∗ , c). Теорема 1 доказана. Критерий полной управляемости и полной наблюдаемости системы (1) можно сформулировать в терминах её передаточной функции W (p) = c∗ (A − pI)−1 b. Для этого введем следующее понятие. О п р е д е л е н и е 2. Передаточная функция W (p) называется н е в ы р о ж д е н н о й , если для любого корня p0 многочлена ∆(p) = det(pI − A) существует такой минор µ(p) матрицы W (p), что lim ∆(p)µ(p) 6= 0.
p→p0
(5)
Замечание 1. В случае, когда в системе (1) вход u и выход y — скаляры, т.е. m = ` = 1, данное выше определение означает, что скалярную функцию W (p) нельзя представить в виде отношения многочленов со степенью знаменателя меньше, чем n (где n — порядок матрицы A). Действительно,в этом случае µ(p) = W (p) =
ν(p) , ∆(p)
где ν(p) — многочлен степени не выше n − 1, а ∆(p) — многочлен степени n. По данному выше определению невырожденность W (p) означает, что для любого корня p0 многочлена ∆(p) lim ν(p) = ν(p0 ) 6= 0,
p→p0
т.е. что многочлены ∆(p) и ν(p) не имеют общих корней и, следовательно, степень знаменателя ∆(p) в представлении W (p) не может сделаться меньше, чем n. Замечание 2. В случае, когда W (p) — матрица-строка (m > 1, l = 1) или матрица-столбец (m = 1, l > 1) минорами µ(p) матрицы W (p) являются ее элементы Wi (p) = νi (p)/∆(p), где νi (p) — многочлены степени не выше n − 1. Поэтому условие (5) означает, что для
67
любого корня p0 многочлена ∆(p) найдется такой элемент Wi (p), что lim νi (p) = νi (p0 ) 6= 0.
p→po
Отсюда следует, что матрицу W (p) = ν(p)/∆(p), где ν(p) — матрицастрока или матрица-столбец с элементами νi (p), нельзя представить в виде отношения многочленов матричного и скалярного – со степенью знаменателя меньше, чем n. Ниже нам понадобится следующее алгебраическое утверждение. Лемма Шура. Пусть A, B, C, D — матрицы соответственно порядков n × n, n × m, m × n, m × m. Если det A 6= 0, то µ ¶ A B det = det A · det(D − CA−1 B). (6) C D Если det D 6= 0, то µ ¶ A B det = det D · det(A − BD−1 C). C D
(7)
Д о к а з а т е л ь с т в о. Пусть det A 6= 0. Определим матрицу Q = −A−1 B. По правилу перемножения блочных матриц имеем ¶ µ ¶ µ ¶µ A 0 A B In Q = . C D 0 Im C D − CA−1 B (Здесь In , Im , — единичные (n × n)- и (m × m)-матрицы.) Беря определители обеих частей последнего равенства и применяя к правой части правило Лапласа разложения определителя по n строкам, получим (6). Аналогично и при det D 6= 0, определив матрицу Q = −D−1 C, из соотношения ¶ ¶ µ µ ¶µ A B In 0 A − BD−1 C B , = C D Q Im 0 D приравнивая определители обеих частей и используя правило Лапласа, получим (7). Лемма Шура доказана. Следствие. Пусть K и M — матрицы порядка n × m. Тогда det(In + KM ∗ ) = det(Im + M ∗ K).
68
В частности, в случае m = 1 (когда K и M — векторы-столбцы) имеем det(In + KM ∗ ) = 1 + M ∗ K. Д о к а з а т е л ь с т в о. Применяя формулы (6) и (7), получим µ ¶ Im −M ∗ det = det(In + KM ∗ ), K In µ ¶ Im −M ∗ det = det(Im + M ∗ K). K In Из последних двух равенств вытекает утверждение вышеприведенного следствия. Имеет место следующая Теорема 2. (Критерий полной управляемости и полной наблюдаемости.) Для полной управляемости и полной наблюдаемости системы (1) необходимо и достаточно, чтобы передаточная функция W (p) была невырожденной. Замечание. Теорема 2 в скалярном случае (m = ` = 1) устанавливалась независимо многими авторами. В векторном случае (m + ` > 2) эта теорема установлена А.Н.Чуриловым [170]. Д о к а з а т е л ь с т в о т е о р е м ы 2. 1. Скалярный случай (m = l = 1). Обозначим ∆(p) = det(pI − A),
ν(p) = W (p)∆(p),
V (p) = ∆(p)(pI − A)−1 ,
v(p) = V (p)b.
) (8)
Здесь, очевидно, ∆(p) и ν(p) — скалярные, v(p) — векторный и V (p) — матричный многочлены. Н е о б х о д и м о с т ь. Пусть система (1) полностью управляема и наблюдаема. Предположим, что функция W (p) вырождена, вопреки утверждению теоремы 2. Последнее означает, что в представлении W (p) =
ν(p) ∆(p)
69
многочлены ν(p) и ∆(p) имеют общий корень p0 : ν(p0 ) = 0,
∆(p0 ) = 0.
Векторный многочлен v(p) имеет вид v(p) = pn−1 v0 + . . . + pvn−2 + vn−1 , где коэффициенты v0 , . . . , vn−1 — некоторые постоянные векторы из Rn . Так как пара (A, b) полностью управляема, то векторы v0 , . . . , vn−1 линейно независимы. В самом деле, иначе мы имели бы, что ранг матрицы (v0 , . . . , vn−1 ), столбцами которой являются векторы v0 , . . . , vn−1 меньше, чем n. Записывая этот факт через строки матрицы, будем иметь d∗ vi = 0 (i = 0, . . . , n − 1) для некоторого вектора d 6= 0. Тогда, очевидно, d∗ v(p) = 0 ∀ p ∈ C, т.е. в силу (8) d∗ (pI − A)−1 b = 0 ∀ p ∈ C (так как ∆(p) = 0 лишь в конечном числе точек pk ∈ C, k = 1, . . . , n). Последнее соотношение противоречит свойству (IIIy ) полной управляемости системы (1). Так как (pI − A)v(p) = ∆(p)b, ν(p) = −c∗ v(p), то (p0 I − A)v(p0 ) = 0, c∗ v(p0 ) = 0. (9) В силу доказанной выше линейной независимости векторов v0 , . . . , vn−1 v(p0 ) 6= 0. (10) Соотношения (9) и (10) в силу свойства (V Iy ) полной управляемости означают, что пара (A∗ , c) неполностью управляема, или же по теореме двойственности Калмана, что пара (A, c) неполностью наблюдаема. Получили противоречие. Следовательно, функция W (p) невырождена. Д о с т а т о ч н о с т ь. Пусть теперь W (p) невырождена. Докажем, что тогда пара (A, b) полностью управляема, а пара (A, c) полностью наблюдаема. Предположим противное, т.е. что или пара (A, b) неполностью управляема, или пара (A, c) неполностью наблюдаема. Поскольку в
70
обоих случаях доказательство проводится совершенно аналогично, то допустим, что пара (A, b) неполностью управляема. Тогда по свойству (V IIIy ) существует такая неособая матрица S, e = S −1 AS и eb = S −1 b имеют вид (10) или (11) из § 1. что матрицы A Пусть они имеют вид (10): µ ¶ µ ¶ µ ¶ } n1 A A } n c } n1 b 11 12 1 1 ∗ A˜ = , c˜ = S c = 1 . , ˜b = 0 A22 } n2 c2 } n2 0 } n2 |{z} |{z} n1
n2
e и eb имеют вид (11) из §1, рассуждения ана(Для случая, когда A логичны). В силу свойства инвариантности передаточной функции (см. §2, гл. I) f (p) = c˜ ∗ (A˜ − pI)−1˜b. W (p) = W Обозначим
µ ¶ v¯1 (p) = (A˜ − pI)−1˜b. v¯2 (p)
Тогда из равенства
µ ¶ v¯1 (p) = ˜b v¯2 (p) ¶ µ ¶ ¶µ b v¯1 (p) A12 = 1 0 v¯2 (p) A22 − pI2
(A˜ − pI) или
µ A11 − pI1 0
находим
v¯1 (p) = (A11 − pI1 )−1 b1 , v¯2 (p) = 0,
при условии, что det(A11 − pI1 ) 6= 0,
det(A22 − pI2 ) 6= 0.
Здесь I1 и I2 – единичные матрицы порядков n1 и n2 . Следовательно, µ ¶ v¯1 (p) ∗ ∗ f W (p) = W (p) = (c1 c2 ) · = c∗1 (A11 − pI1 )−1 b1 . v¯2 (p) Итак, мы представили функцию W (p) в виде отношения многочленов со степенью знаменателя n1 < n (n1 — порядок матрицы A11 ). Последнее означает, что функция W (p) вырождена, что противоречит нашему предположению.
71
Аналогично доказывается, что если пара (A, c) неполностью наблюдаема, то W (p) вырождена. Таким образом, если функция W (p) невырождена, то пара (A, b) полностью управляема, а пара (A, c) полностью наблюдаема. Для рассматриваемого случая (m = ` = 1) теорема доказана. 2. Векторный случай (m + ` > 2). Д о с т а т о ч н о с т ь. Предположим, что функция W (p) невырождена, т.е. если p0 — произвольный корень многочлена ∆(p), то существует такой минор µ(p) матрицы W (p) порядка r, что имеет место соотношение lim ∆(p)µ(p) 6= 0. (11) p→p0
Докажем, что тогда система (1) полностью управляема и полностью наблюдаема. Обозначим через b1 , . . . , bm и c1 , . . . , cl столбцы матриц b и c соответственно, а через wij (p) (i = 1, . . . , l; j = 1, . . . , m) – элементы матрицы W (p), так что ¡ ¢ b = (b1 , . . . , bm ), c = (c1 , . . . , cl ), W (p) = wij (p) i=1,...,l; j=1,...,m . Очевидно, wij (p) = c∗i (A − pI)−1 bj . Минор µ(p) имеет вид wi1 j1 (p) . . . wi1 ,jr (p) .. µ(p) = det . .
(12)
wir j1 (p) . . . wir ,jr (p) Введем в рассмотрение матрицу A − pI bj1 c∗ 0 i1 Q(p) = .. . c∗ir
0
. . . bjr ... 0 . ... 0
(13)
Применяя к матрице Q(p) лемму Шура, получаем ∗ c i1 .. −1 det Q(p) = det(A − pI) · det − . (A − pI) (bj1 , . . . , bjr ) (14) c∗ir
72
(для значений p, таких, что det(A − pI) 6= 0). Легко видеть, что определитель матрицы, заключенной в фигурной скобке равенства (14) есть с точностью до знака минор µ(p). Поэтому из (14) имеем det Q(p) = (−1)n+r ∆(p)µ(p).
(15)
Перейдем в равенстве (15) к пределу при p → p0 . Учитывая (11), получим, что det Q(p0 ) 6= 0. (16) Поэтому все n+r строк матрицы Q(p0 ) линейно независимы, а следовательно, линейно независимы и n ее первых строк. Таким образом, rank (A − p0 I, bj1 , . . . , bjr ) = n.
(17)
Отсюда тем более rank (A − p0 I, b) = n. Рассуждая аналогично, мы получим, что ¡ ¢ rank (A − p0 I)∗ , c = n.
(18) (19)
Итак, мы установили, что для произвольного корня p0 многочлена ∆(p) имеют место соотношения (18) и (19). Поскольку для любого p 6= p0 ∆(p) = det(pI − A) 6= 0, то rank (A − pI) = n ∀ p 6= p0 . Следовательно, для любого комплексного p rank (A − pI, b) = n,
(20)
¡ ¢ rank (A − pI)∗ , c) = n. (21) В силу свойства (V IIy ) полной управляемости и соответствующего свойства (V IIн ) полной наблюдаемости (получающегося из (V IIy ) по теореме двойственности Калмана) из соотношений (20) и (21) следует полная управляемость и полная наблюдаемость системы (1). Н е о б х о д и м о с т ь. Допустим теперь, что система (1) полностью управляема и наблюдаема. Покажем, что матричная передаточная функция W (p) невырождена, т.е. что имеет место соотношение (11). Пусть p0 — произвольный корень многочлена ∆(p), а дефект матрицы A − p0 I равен r, т.е. rank (A − p0 I) = n − r.
(22)
Так как det(A − p0 I) = 0, то, очевидно, r ≥ 1. В силу свойства (V IIy ) полной управляемости и (V IIн ) полной наблюдаемости будут иметь
73
место соотношения (18) и (19). Отсюда, с учетом (22), выводим, что существуют r линейно независимых столбцов bj1 , . . . , bjr матрицы b и r линейно независимых столбцов ci1 , . . . , cir матрицы c таких, что имеют место (17) и аналогичное ему равенство ¡ ¢ rank (A − p0 I)∗ , c∗i1 , . . . , c∗ir = n. (23) Рассмотрим матрицу Q(p) и минор µ(p) порядка r, введенные выше по формулам (13) и (12) соответственно. Получим, как и выше, формулу (15). Для доказательства соотношения (11) достаточно установить (16), что равносильно тому, что линейная система Q(p0 )z = 0
(24)
относительно вектора z (порядка n + r) имеет только тривиальное решение z = 0. Запишем (24) в развернутом виде. Пусть z = (ξ1 , . . . , ξn , η1 , . . . , ηr )∗ . Тогда (A − p0 I)ξ + η1 bj1 + . . . + ηr bjr = 0, (25)
где ξ = (ξ1 , . . . , ξn )∗ . Введем матрицы
c∗i ξ = 0, . . . , c∗ir ξ = 0,
(26)
Qjk = (bj1 , . . . , bjk−1 , bjk+1 , . . . , bjr ) (k = 1, . . . , r). В силу (22) и выбора векторов bj1 , . . . , bjr справедливо неравенство rank (A − p0 I, Qjk ) < n. Отсюда следует, что при любом k = 1, . . . , r существует ненулевой вектор zk (порядка n) такой, что zk∗ (A − p0 I) = 0,
zk∗ Qjk = 0.
(27)
При этом, поскольку имеет место равенство (17), то zk∗ bjk 6= 0 (k = 1, . . . , r),
(28)
иначе, все строки матрицы в (17) были бы линейно независимы и, следовательно, нарушалось бы равенство (17). Умножая слева уравнение (25) последовательно на векторы z1∗ , . . . , zr∗ , в силу (27), получим η1 z1∗ bj1 = 0, . . . , ηr zr∗ bjr = 0.
74
Отсюда, учитывая (28), имеем η1 = η2 = . . . = ηr = 0. В силу последних равенств уравнения (25), (26) можно переписать так: ξ ∗ (A − p0 I)∗ = 0, ξ ∗ ci1 = 0, . . . , ξ ∗ cir = 0. (29) Так как имеет место равенство (23), то из (29) следует, что ξ = 0. Таким образом, система (25), (26) (или (24)) имеет только нулевое решение ξ = 0, η1 = 0, . . . , ηr = 0 (или z = 0). Итак, нами установлено соотношение (16), а вместе с ним и (11). Теорема 2 полностью доказана. Следствие. Пусть передаточная функция W (p) системы (1) со скалярным входом u ∈ R и скалярным выходом y ∈ R (m = ` = 1; b, c ∈ Rn ) имеет вид W (p) =
cn pn−1 + cn−1 pn−2 + · · · + c1 , pn + an pn−1 + · · · + a1
где числитель и знаменатель не имеют общих нулей (т.е. W (p) — невырождена.) Тогда систему (1) невырожденным линейным преобразованием переменных можно привести к виду x˙ = x2 , .1 .. y = c1 x1 + · · · + cn xn , x˙ n−1 = xn x˙ = −a x − · · · − a x + u, n 1 1 n n Д о к а з а т е л ь с т в о следует непосредственно из теоремы 2 и теоремы из § 2. Замечание 1. Во второй части (векторный случай) доказательства теоремы 2 нами одновременно установлено, что если система (1) полностью управляема и наблюдаема, то существует такой минор µ(p) порядка r, равный дефекту матрицы A−p0 I, что выполнено (11). Обратное утверждение — если (11) имеет место для минора µ(p) любого порядка, то система (1) полностью управляема и наблюдаема — также доказано выше.
75
Из замечания 1 следует, что при m > 1, или при l > 1 проверку условия невырожденности (5) можно проводить не для всех миноров µ(p) матрицы W (p), а лишь для миноров µ(p), имеющих порядок r, равный дефекту матрицы A − p0 I. Замечание 2. Пусть ρ(b) — ранг матрицы b и ρ(c) — ранг матрицы c, а r — дефект матрицы A − p0 I (p0 — произвольный корень многочлена ∆(p) = det(A − p0 I)). Тогда, в силу следствия 3 теоремы из §1, если r > ρ(b), то система (1) неполностью управляема и, если r > ρ(c), то по теореме двойственности Калмана система (1) неполностью наблюдаема. Поэтому необходимыми условиями невырожденности матричной передаточной функции W (p) являются неравенства r ≤ ρ(b),
r ≤ ρ(c).
(30)
Итак, условие (5) следует проверять лишь для миноров µ(p) порядка r и при выполнении неравенств (30). Поскольку дефект r (равный числу жордановых клеток матрицы A, отвечающих собственному значению p0 ) не превосходит кратности ν0 корня p0 , то в случае когда дефект r не известен, условие (5) следует проверять для миноров µ(p), порядок которых не превосходит min{ρ(b), ρ(c), ν0 }.
76
ГЛАВА III СТАЦИОНАРНАЯ СТАБИЛИЗИРУЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ
§ 1. Устойчивость линейной системы с постоянными коэффициентами Рассмотрим теперь вопрос о том, можно ли сделать систему x˙ = Ax + bu,
y = c∗ x,
(1)
где A, b и c — вещественные постоянные матрицы порядков n × n, n × m и n × ` соответственно, x ∈ Rn — состояние, u ∈ Rm — вход или управление, y ∈ R` — выход, устойчивой за счет выбора управления u, которое формируется как линейная комбинация координат вектора y: u = s∗ y. (2) Здесь s — постоянная (` × m)-матрица. Если существует хотя бы одно такое управление, то систему (1) называют стабилизируемой, а соответствующее управление (2) — стабилизирующим. Всюду в дальнейшем мы рассматриваем только вещественные матрицы, поэтому слово "вещественный"будем далее часто опускать. При рассмотрении отдельных вопросов (например, при доказательстве теоремы 1 настоящего параграфа) мы, не оговаривая это особо, считаем, что исходное пространство и операторы (определяемые матрицами), действующие в нем, комплексифицированы (см. § 2, гл.I), так что рассматриваемые векторные переменные могут принимать, вообще говоря, комплексные значения. Сначала рассмотрим асимптотическую устойчивость разомкнутой системы x˙ = Ax , когда в (1) отсутствует управление (u=0). 1. Устойчивость по Ляпунову. Пусть дана система дифференциальных уравнений, записанная в виде векторного уравнения x˙ = f (t, x),
t ∈ R1 , x ∈ Rn ,
(3)
77
где вектор-функция f (t, x) = (f1 (t, x), . . . , fn (t, x))∗ кусочно–непрерывна по независимой переменной t в интервале It+ = {a < t < +∞} (a ∈ R) и удовлетворяет условию Липшица по зависимым переменным x1 , . . . , xn во всем пространстве Rn , x = (x1 , . . . , xn )∗ . Знак ∗ означает транспонирование. При этих условиях справедлива т е о р е м а с у щ е с т в о в а н и я и е д и н с т в е н н о с т и решений дифференциального уравнения (3) ([16,125,129,149]): для любых t0 ∈ It+ , x0 ∈ Rn существует единственное решение x(t) уравнения (3), определенное на некотором интервале (t0 − α, t0 + α) и удовлетворяющее начальному условию x(t0 ) = x0 , т.е. однозначно разрешима соответствующая задача Коши. При этом под решением x(t) уравнения (3) понимается непрерывная на интервале It+ вектор-функция, удовлетворяющая уравнению (3) в интегральной форме Zt x(t) = x(t0 ) +
f (τ, x(τ )) dτ. t0
Пусть x(t; t0 , x0 ) — решение уравнения (3) с начальным условием x(t0 ; t0 , x0 ) = x0 , определенное на интервале (t0 , +∞) (t0 ∈ It+ ). Нас будет интересовать поведение других решений с близкими начальными условиями. О п р е д е л е н и е 1 ([107]). Решение x(t; t0 , x0 ) (t0 ≤ t < ∞) уравнения (3) н а з ы в а е т с я у с т о й ч и в ы м п о Л я п у н о в у при t → +∞ (или устойчивым), если для [any]любого ε > 0 существует δ = δ(ε, t0 ) > 0 такое, что 1) все решения x = x(t; t0 , y0 ) уравнения (3), удовлетворяющие условию ky0 − x0 k < δ, определены в промежутке [t0 , +∞); 2) для этих решений выполняется неравенство kx(t; t0 , y0 ) − x(t; t0 , x0 )k < ε
для всех
t ∈ [t0 , +∞).
Иными словами, решение x(t; t0 , x0 ) устойчиво, если достаточно близкие к нему в начальный момент времени t0 решения x(t; t0 , y0 )
78
остаются для всех t ≥ t0 в сколь угодно узкой ε-трубке, построенной вокруг решения x(t; t0 , x0 ) (рис. 5).
Рис. 5. Устойчивое решение x(t; t0 , x0 ) cистемы (1).
Можно также сказать, что устойчивость по Ляпунову решения x(t; t0 , x0 ) — это равномерная на промежутке [t0 , +∞) сходимость к x(t; t0 , x0 ) решений x(t; t0 , y0 ), начальные значения y0 которых стремятся к начальному значению x0 рассматриваемого решения x(t; t0 , x0 ) Следует отметить, что сходимость значений решений x(t; t0 , y0 ) при [any]любом фиксированном t ∈ [t0 , +∞) гарантируется теоремой о непрерывной зависимости решения от начального условия; здесь важна именно равномерная сходимость, т.е. независимость δ от t ∈ [t0 , +∞). Замечание 1. Если система (3) линейна по x, т.е. f (t, x) = A(t)x + g(t) (t ∈ R, x ∈ Rn ), матрица-функция A(t) и вектор-функции g(t) кусочно-непрерывны в промежутке It+ , то, как хорошо известно из общего курса дифференциальных уравнений (см., например,[16,125,129,149]), все решения системы (3) продолжаемы на бесконечный интервал It+ . Поэтому для линейных систем в определении 1 устойчивости по Ляпунову условие 1) можно опустить.
79
Замечание 2. Исследование устойчивости решения x(t; t0 , x0 ) (невозмущенного движения) всегда можно свести к исследованию устойчивости тривиального решения (положения равновесия) x = 0. Действительно, полагая z = x − x(t; t0 , x0 ) (z есть отклонение возмущенного движения x(t; t0 , y0 ) от невозмущенного движения x(t; t0 , x0 )), получим дифференциальное уравнение для z: z˙ = g(t, z), (4) где £ ¤ g(t, z) = f (t, z + x(t; t0 , x0 )) − f (t; x(t; t0 , x0 )) . Очевидно, g(t, 0) ≡ 0. Следовательно, уравнение (4) имеет тривиальное решение z = 0, которое соответствует (в новых переменных z) исходному решению x(t; t0 , x0 ). В силу сделанного выше замечания, не умаляя общности, в уравнении (3) всегда можно считать (переобозначив z = x, g = f ) f (t, 0) ≡ 0. Неустойчивость по Ляпунову — это логическое отрицание устойчивости по Ляпунову. О п р е д е л е н и е 2. Решение x(t; t0 , x0 ) (t0 ≤ t < +∞)) уравнения (3) называется н е у с т о й ч и в ы м п о Л я п у н о в у , если 1) либо в [any]любой окрестности точки x0 найдется такая точка y0 , что решение x(t; t0 , y0 ) с начальным условием x(t0 ; t0 , y0 ) = y0 непродолжаемо при t0 ≤ t < +∞; 2) либо для [some]некоторого ε0 > 0 и [any]любого δ > 0 существуют хотя бы одна точка y0δ и момент t∗ = t∗ (δ) > t0 такие, что ky0δ − x0 k < δ и kx(t∗ ; t0 , y0δ ) − x(t∗ ; t0 , x0 )k ≥ ε0 . О п р е д е л е н и е 3 . Решение x(t; t0 , x0 ) (t0 ≤ t < +∞) уравнения (3) называется а с и м п т о т и ч е с к и у с т о й ч и в ы м при t → +∞, если
80
1) это решение устойчиво по Ляпунову; 2) существует число ∆ > 0 такое, что для [any]всякого решения x(t; t0 , y0 ) (t0 ≤ t < +∞) с начальным условием y0 , удовлетворяющим неравенству ky0 − x0 k < ∆, выполняется предельное соотношение lim kx(t; t0 , y0 ) − x(t; t0 , x0 )k = 0. (5) t→+∞
Если в определении 3 ∆ = ∞, т.е. 1) решение x(t; t0 , x0 ) устойчиво по Ляпунову и 2) все решения x(t; t0 , x0 ) (t0 ≤ t < +∞) обладают свойством (5), то решение x(t; t0 , x0 ) называется асимптотически устойчивым в целом (в этом случае областью притяжения решения x(t; t0 , x0 ) является все пространство Rn ). 2. Критерий асимптотической устойчивости линейной системы с постоянной матрицей. Теорема 1. Положение равновесия x = 0 линейной системы x˙ = Ax,
x ∈ Rn ,
(6)
с постоянной матрицей A асимптотически устойчиво в целом тогда и только тогда, когда все собственные числа λj (A) матрицы A лежат в левой полуплоскости: Re λj (A) < 0
(j = 1, . . . , n).
Д о к а з а т е л ь с т в о. 1. Д о с т а т о ч н о с т ь. Пусть λ1 , . . . , λm — различные собственные числа матрицы A (m ≤ n), причем Re λi < 0 (i = 1, . . . , m).
(7)
Решение уравнения (6) с начальным условием x(t0 ) = x0 , x0 ∈ Rn , есть x(t) = eA(t−t0 ) x0 . (8) Используя оценку нормы матричной экспоненты (cм. § 4, гл. I), будем иметь keA(t−t0 ) k ≤ Cν e(α+ν)(t−t0 ) ∀ t ∈ [t0 , +∞) (9)
81
(это неравенство было доказано для t0 = 0, но, очевидно, оно верно также и для любого t0 6= 0), где ν — произвольное положительное число, Cν > 0 — некоторая константа, зависящая от ν, а α = max Re λj . j
В силу (7) α < 0. Выберем ν > 0 так, чтобы α + ν < 0. Тогда из (9) будем иметь keA(t−t0 ) k ≤ M ∀ t ∈ [t0 , +∞), где M — некоторая положительная константа. Отсюда и из формулы (8) получаем kx(t)k ≤ keA(t−t0 ) k · kx0 k ≤ M · kx0 k.
(10)
Пусть ε — произвольное положительное число. Тогда если ε kx0 k < =: δ, M то в силу (10) kx(t)k < ε для всех t ∈ [t0 , +∞). Поэтому тривиальное решение x(t) ≡ 0 (положение равновесия) системы (6) устойчиво по Ляпунову (продолжаемость решения x(t) на бесконечный интервал [t0 , +∞) следует из его вида (8)). Так как в силу (8) и (9) kx(t)k ≤ Cν e(α+ν)(t−t0 ) kx0 k, то, учитывая, что α + ν < 0, получаем lim x(t) = 0.
t→+∞
Следовательно, тривиальное решение x(t) ≡ 0 асимптотически устойчиво в целом. Достаточность условия теоремы доказана. 2. Н е о б х о д и м о с т ь. Пусть положение равновесия x = 0 системы (6) асимптотически устойчиво в целом. Покажем сначала, что Re λj ≤ 0 (j = 1, . . . , m).
(11)
Действительно, допустим, что существует собственное число λr (1 ≤ r ≤ m) такое, что Re λr = αr > 0. Тогда система (6) имеет нетривиальное решение η(t) = eλr t ξr ,
82
где ξr — собственный вектор матрицы A, соответствующий собственному числу λr . Отсюда kη(t)k = |eλr t | · kξr k = eαr t · kξr k → +∞ при t → +∞. Последнее противоречит условию асимптотической устойчивости в целом положения равновесия системы (6). Таким образом, имеют место неравенства (11). Предположим теперь, что найдется хотя бы одно собственное число λs (1 ≤ s ≤ m) такое, что Re λs = 0, т.е. λs = iβs , βs ∈ R (i — мнимая единица). Тогда система (6) имеет решение (комплексное) ϕ(t) = eλs t ξs = (cos βs t + i sin βs t)ξs , где ξs — собственный вектор матрицы A, соответствующий собственному числу λs . Отсюда kϕ(t)k = kξs k 6= 0, и, значит, ϕ(t) 6→ 0 при t → +∞, что противоречит асимптотической устойчивости в целом тривиального решения x(t) ≡ 0. Следовательно, Re λj < 0 (j = 1, . . . , m). Теорема 1 доказана полностью. О п р е д е л е н и е 4. Если каждое решение линейной системы (6) асимптотически устойчиво в целом, то систему (6) называют асимптотически устойчивой в целом. Следующая теорема сводит вопрос об асимптотической устойчивости системы (6) к асимптотической устойчивости нулевого решения x(t) ≡ 0. Теорема 2. Для асимптотической устойчивости в целом линейной системы (6) необходимо и достаточно, чтобы тривиальное решение x(t) ≡ 0 этой системы было асимптотически устойчивым в целом. Д о к а з а т е л ь с т в о. Необходимость условия теоремы очевидна.
83
Докажем достаточность. Пусть тривиальное решение x(t) ≡ 0 асимптотически устойчиво в целом. Если η(t) — некоторое фиксированное, но произвольное решение системы (6), а x(t) — любое другое ее решение, то в силу (8) x(t) = eA(t−t0 ) x0 ,
η(t) = eA(t−t0 ) η0 ,
где x0 ∈ Rn , η0 ∈ Rn и x(t) − η(t) = eA(t−t0 (x0 − η0 ). (Заметим, что разность x(t) − η(t) есть тоже решение системы (6).) Далее, повторяя рассуждения доказательства достаточности теоремы 1 установим, что решение η(t) асимптотически устойчиво в целом. Теорема 2 доказана. Из теорем 1 и 2 следует следующая Теорема 3. (Критерий асимптотической устойчивости линейной системы.) Линейная система (6) асимптотически устойчива в целом тогда и только тогда, когда все собственные числа λj (A) матрицы A имеют отрицательные вещественные части: Re λj (A) < 0 (j = 1, . . . , n). В дальнейшем будем называть матрицу A устойчивой или гурвицевой, если все ее собственные числа λj (A) лежат в левой полуплоскости: Re λj (A) < 0 (j = 1, . . . , n). Отметим, что утверждение теоремы 2 справедливо также и для линейных систем с переменной матрицей: A = A(t). А именно, имеет место Теорема 4. Линейная система x˙ = A(t)x
(12)
с (вещественной) кусочно-непрерывной на интервале It+ = (a, +∞) (a ∈ R) матрицей-функцией A(t) асимптотически устойчива (в целом) тогда и только тогда, когда тривиальное решение x(t) ≡ 0 этой системы асимптотически устойчиво (в целом). Систему (12) (как и (6)) называют асимптотически устойчивой (в целом), если все ее решения асимптотически устойчивы (в целом). Д о к а з а т е л ь с т в о т е о р е м ы 4. Необходимость условия теоремы очевидна. Докажем достаточность. Пусть тривиальное решение x(t) ≡ 0 системы (12) асимптотически устойчиво. Тогда оно устойчиво (по
84
Ляпунову), т.е. по заданному числу ε > 0 можно найти такое δ(ε), что для любого решения x(t) системы (12) с начальным условием x(t0 ) = x0 (t0 ∈ It+ , x0 ∈ Rn ): kx0 k < δ(ε),
(13)
kx(t)k < ε для всех t ∈ [t0 , +∞).
(14)
будем иметь Пусть теперь η(t) — произвольное решение системы (12). Для любого другого решения x(t) системы (12) разность (как легко проверить) z(t) = x(t) − η(t) тоже есть решение этой системы. Следовательно, из неравенства kx(t0 ) − η(t0 )k < δ(ε), в силу (13), (14), вытекает неравенство kx(t) − η(t)k < ε ∀ t ∈ [t0 , +∞). Последнее означает, что решение η(t) устойчиво по Ляпунову (в силу замечания 1 из п.1 все решения x(t) системы (12) продолжаемы на интервал [t0 , +∞) ). Так как для произвольного решения x(t) системы (12) (в силу асимптотической устойчивости x(t) ≡ 0) lim x(t) = 0,
t→+∞
то и lim kx(t) − η(t)k = 0.
t→+∞
Следовательно, решение η(t), а вместе с ним и система (12) (в силу произвольности η(t)), асимптотически устойчиво в целом. Теорема 4 доказана.
§ 2. Алгебраические критерии устойчивости 1. Проблема Рауса–Гурвица В связи с доказанным в § 1 критерием асимптотической устойчивости линейных дифференциальных систем (теорема 3) возникает
85
следующая алгебраическая задача (так называемая проблема Рауса– Гурвица [48,92,113,135,228,276]): требуется узнать, лежат ли все корни данного многочлена в левой полуплоскости комплексного переменного. Другими словами, требуется установить необходимые и достаточные условия, при которых все корни данного алгебраического многочлена имеют отрицательные вещественные части. Эта проблема широко обсуждалась в литературе (подробное и детальное описание алгоритмов, связанных с проблемой Рауса–Гурвица можно найти, например, в [48,86,92,113,135]). Здесь мы докажем наиболее распространенные критерии ЭрмитаМихайлова, Рауса и Гурвица, позволяющие дать положительный ответ на поставленный выше вопрос. 2. Необходимое условие устойчивости многочлена. Установим вначале простое необходимое условие устойчивости многочлена. Рассмотрим многочлен степени n с вещественными коэффициентами a(p) = a0 pn + a1 pn−1 + . . . + an
(ak ∈ R, k = 0, . . . , n).
(1)
О п р е д е л е н и е 1 . М н о г о ч л е н a(p) называется у с т о йч и в ы м или г у р в и ц е в ы м , если все его корни имеют отрицательные вещественные части, т.е. лежат по левую сторону от мнимой оси плоскости комплексного переменного. Устойчивые многочлены обычно называют м н о г о ч л е н а м и (п о л и н о м а м и) Г у р в и ц а. Теорема 1. (Теорема Стодолы.) Если многочлен a(p) в (1) с a0 > 0 устойчив, то все его коэффициенты положительны. Д о к а з а т е л ь с т в о. Пусть pj , p¯j = αj ± iβj (j = 1, . . . , `) — комплексные корни (βj 6= 0) (i – мнимая единица) и ps = γs (s = 1, . . . , r) — вещественные корни многочлена (1). Обозначим через µj (j = 1, . . . , `) кратность корня pj = αj + iβj (так как коэффициенты многочлена a(p) действительны, то сопряженный корень p¯j = αj − iβj имеет тоже ту же кратность µj ). Через νs обозначим кратность вещественного корня ps = γs . Тогда ` X j=1
2µj +
r X s=1
νs = n.
86
Используя известное разложение многочлена a(p) на вещественные линейные двучлены (соответствующие его вещественным корням γs ) и вещественные трехчлены (соответствующие парам сопряженных корней αj ± iβj ), получаем a(p) = a0
` Y
µj
µj
(p − αj − iβj ) (p − αj + iβj )
r Y
(p − γs )νs
s=1
j=1
или a(p) = a0
` Y
2
(p − 2αj p +
j=1
αj2
+
βj2 )µj
r Y
(p − γs )νs .
(2)
s=1
В силу условия теоремы 1 αj < 0, γs < 0. Поэтому коэффициенты во всех двучленах и трехчленах в правой части равенства (2) положительны и, следовательно, положительными будут и коэффициенты многочлена a(p). Теорема 1 доказана. Замечание. Условия теоремы Стодолы являются лишь необходимыми, но вовсе, не достаточными для устойчивости многочлена произвольной степени n > 2. Ниже, в примерах, будет показано, что условия теоремы Стодолы для многочлена второй степени являются и достаточными для его устойчивости, а для многочленов третьей степени — нет, т.е. из положительности его коэффициентов, вообще говоря, не следует его устойчивость. 3. Критерий Эрмита-Михайлова. Пусть m — число нулей (с учетом их кратностей) многочлена (1) с положительной вещественной частью. Предположим, что многочлен a(p) не имеет корней на мнимой оси, т.е. a(iω) 6= 0 ∀ ω ∈ R. Тогда можем определить функцию ϕ(ω) = Arg a(iω), (3) где под Arg p понимается некоторая непрерывная ветвь многозначной функции arg p ± 2kπ, k ∈ Z (arg p — главное значение аргумента: −π < arg p ≤ π). Это означает, что при переходе годографа многочлена a(p) через луч { Re p ≤ 0, Im p = 0} на комплексной плоскости при ω = ω0 берем ту ветвь функции (3), которая обеспечивает непрерывность такого
87
перехода, т.е. непрерывность функции ϕ(ω) в точке ω0 . Не умаляя общности, можно считать, что ϕ(0) = 0. О п р е д е л е н и е 2. Множество точек {p ∈ C : p = a(iω), ω ∈ R} комплексной плоскости C называется годографом многочлена a(p). Иногда этот годограф называют годографом Михайлова или амплитудно-фазовой ¯+∞ характеристикой многочлена a(p). Через ∆ϕ(ω)¯−∞ будем обозначать приращение функции ϕ(ω), когда аргумент ω изменяется от −∞ до +∞. Имеет место следующее утверждение. Теорема 2. Для любого многочлена a(p) = a0 pn + a1 pn−1 + . . . + an , a0 > 0 (ak ∈ R, k = 0, · · · , n), не имеющего корней на мнимой оси (a(iω) 6= 0 ∀ ω ∈ R), справедлива следующая ф о р м у л а Э р м и т а — М и х а й л о в а ¯+∞ ¯+∞ ∆ϕ(ω)¯−∞ ≡ ∆ Arg a(iω)¯−∞ = π(n − 2m), (4) где m — число корней многочлена a(p) в правой полуплоскости с учетом их кратностей. Д о к а з а т е л ь с т в о . Пусть λj (j = 1, · · · , m) и ρ` (` = 1, · · · , n − m) — нули многочлена a(p) с положительными и отрицательными вещественными частями, соответственно (каждый нуль считается столько раз, какова ее кратность). Представив многочлен a(p) в виде произведения a(p) = a0
m Y
(p − λj ) ·
j=1
n−m Y
(p − ρ` ),
`=1
и затем, применив известную теорему об аргументе произведения комплексных чисел (так как по условию теоремы a(iω) 6= 0 для любого ω ∈ (−∞, +∞), то при p = iω, −∞ < ω < +∞, все сомножители правой части последнего равенства ненулевые), получим следующее равенство: +∞ +∞ ∆ϕ(ω)|+∞ −∞ ≡ ∆Arg a(iω)|−∞ = ∆Arg a0 |−∞ + P Pn−m +∞ +∞ + m j=1 ∆Arg (iω − λj )|−∞ + `=1 ∆Arg (iω − ρ` )|−∞ .
Очевидно, ∆Arg a0 |+∞ −∞ = 0.
(5)
88
Вычислим +∞ ∆Arg (iω − λj )|+∞ −∞ , ∆Arg (iω − ρ` )|−∞ .
Для этого сначала рассмотрим на комплексной плоскости числа λj , iω, iω − λj и соответствующие им векторы (рис. 6)
Рис. 6. К доказательству теоремы 2: Re λj > 0.
Вектор, соответствующий числу iω − λj , при увеличении ω от −∞ до +∞ поворачивается монотонно по часовой стрелке, при этом конец этого вектора скользит вверх, все время оставаясь на прямой Re p = − Re λj , так, как это показано на рис.6. Поэтому, ∆Arg (iω − λj )|+∞ −∞ = −π (j = 1, · · · , m). Рассмотрим теперь на комплексной плоскости числа ρ` , iω, iω − ρ` и соответствующие им векторы (рис.7). Вектор, соответствующий числу iω − ρ` , при увеличении ω от −∞ до +∞ поворачивается монотонно против часовой стрелки, причем конец этого вектора скользит вверх, все время оставаясь на прямой Re p = − Re ρ` , так, как это показано на рис.7. Следовательно, ∆Arg (iω − ρ` )|+∞ −∞ = π (k = 1, · · · , n − m).
89
Рис. 7. К доказательству теоремы 2: Re ρ` < 0
Из последних двух равенств и разложения (5) следует, что ∆ϕ(ω)|+∞ −∞ = −mπ + (n − m)π = π(n − 2m). Таким образом, установлена формула (4) и, тем самым, доказана теорема 2. Из теоремы 2 следует Критерий Эрмита—Михайлова. Пусть многочлен a(p) в (1) степени n с a0 > 0 не имеет корней на мнимой оси, т.е. a(iω) 6= 0 ∀ ω ∈ R. Тогда для устойчивости многочлена a(p) необходимо и достаточно, чтобы ¯+∞ ∆ϕ(ω)¯−∞ = nπ. (6) Действительно, полагая m = 0 в формуле (4), получим (6). Замечание 1. В силу вещественности коэффициентов ar (r = 0, . . . , n) многочлена a(p) справедливы следующие равенства: Re a(¯ p) = Re a(p) = Re a(p), Im a(¯ p) = Im a(p) = − Im a(p) (где z¯ — сопряженное для z). В частности, при p = iω имеем Re a(−iω) = Re a(iω), Im a(−iω) = − Im a(iω).
90
Отсюда следует, что годограф многочлена a(p) симметричен относительно вещественной оси (рис.8).
Рис. 8. Годограф многочлена a(p)
Поэтому вместо равенства (6) можно записать следующее условие: ¯+∞ π (7) ∆ϕ(ω)¯0 = n · . 2 Замечание 2. Пусть m = 0, т.е. многочлен a(p) — устойчив (все нули многочлена a(p) расположены в левой полуплоскости.) Тогда, как было отмечено в процессе доказательства теоремы 2, для многочлена a(p) вектор a(iω) при увеличении ω от −∞ до +∞ монотонно поворачивается против хода часовой стрелки на угол n · π2 . Так как a(0) = an > 0 (в силу теоремы Стодолы это необходимо), то годограф Михайлова многочлена a(p), выходя из точки an положительной полуоси { Re p > 0, Im p = 0}, при возрастании ω от 0 до +∞ будет последовательно пересекать полуоси { Re p = 0, Im p > 0}, { Re p < 0, Im p = 0}, { Re p = 0, Im p < 0}, проходя через n квадрантов. Обратно, если годограф Михайлова многочлена a(p) степени n без чисто мнимых корней, выходя из точки a(0) = an > 0 положительной полуоси { Re p > 0, Im p = 0}, при возрастании ω от 0 до +∞ последовательно по одному разу пересекает n − 1 полуосей { Re p = 0, Im p > 0}, { Re p < 0, Im p = 0}, . . . асимптотически стремясь к n-й полуоси, то угол поворота вектора a(iω), очевидно, равен
91
n · π2 , и, следовательно, в силу формулы (7) многочлен a(p) является устойчивым. Примеры. Пользуясь критерием Эрмита—Михайлова, получить условия устойчивости для многочлена: 1) второй степени a(p) = a0 p2 + a1 p + a2 ,
a0 > 0;
2) третьей степени a(p) = a0 p3 + a1 p2 + a2 p + a3 ,
a0 > 0
(где a0 , a1 , a2 , a3 — вещественные числа). 1) (n = 2). Имеем a(iω) = a0 (iω)2 + a1 (iω) + a2 = (a2 − a0 ω)2 + ia1 ω. Из уравнений Re a(iω) = 0 и Im a(iω) = 0 находим значения ω0 и ω1 , соответствующие точкам пересечения годографа Γ = {a(iω), ω ∈ [0, +∞)} многочлена a(p) с полуосями Re p > 0 и Im p > 0. Ими будут, очевидно, r a2 ω0 = 0 и ω1 = a0 соответственно. При этом r a(iω0 ) = a2 ,
a(iω1 ) = ia1
a2 . a0
(8)
В силу теоремы Стодолы для устойчивости многочлена a(p) (n = 2) необходимо, чтобы a1 > 0, a2 > 0. В силу замечания 2, для устойчивости многочлена a(p) необходимо и достаточно, чтобы годограф Γ = {a(iω), ω ∈ [0, +∞)} многочлена a(p), выходя при ω = 0 из точки a2 положительной полуоси Re p > 0 при возрастании ω от 0 до +∞ пересекал один раз полуось Im p > 0, асимптотически стремясь к полуоси Re p < 0 (при этом вектор a(iω) должен поворачиваться монотонно против хода часовой стрелки). При этом, очевидно, что lim arg a(iω) = π. ω→+∞
92
Отсюда и из (8) получаем необходимые и достаточные условия устойчивости многочлена 2-й степени: a0 > 0,
a1 > 0,
a2 > 0.
Мы видим, что для многочленов 2-й степени необходимые условия устойчивости, даваемые теоремой Стодолы, являются также и достаточными. Но для многочленов 3-й степени это уже не так, что будет видно из следующего примера. 2) (n = 3). Имеем a(iω) = (−a1 ω 2 + a3 ) + iω(−a0 ω 2 + a2 ). Как и выше, из уравнений −a1 ω 2 + a3 = 0 и ω(−a0 ω 2 + a2 ) = 0 находим значения ωk (k = 0, 1, 2), соответствующие точкам пересечения годографа Γ многочлена a(p) с полуосями Re p > 0, Im p > 0, Re p < 0. Ими будут соответственно r r a3 a2 ω0 = 0, ω1 = , ω2 = . a1 a0 При этом
a(iω0 ) = a3 , µ ¶ r a3 a0 a3 a(iω1 ) = i a2 − , (9) a1 a1 a1 a2 a(iω2 ) = a3 − . a0 По теореме Стодолы для устойчивости многочлена a(p) (n = 3) необходимо, чтобы a1 > 0, a2 > 0, a3 > 0. Далее, проводя рассуждения аналогичные, как в предыдущем параграфе, из (9) и соотношения 3π , ω→+∞ 2 в силу замечания 2 получаем необходимые и достаточные условия устойчивости многочлена a(p) третьей степени a0 a3 a1 a2 a0 > 0, a1 > 0, a3 > 0, a2 − > 0, a3 − 0,
a1 > 0,
a3 > 0,
a1 a2 > a0 a3 .
Последние условия иногда называются условиями Вышнеградского. Как видим, уже для многочлена 3-й степени одной положительности коэффициентов многочлена не достаточно для его устойчивости — сверх этого требуется еще выполнение неравенства a1 a2 > a0 a3 . 4. Критерий Рауса. Здесь мы изложим метод Рауса для определения числа m корней с положительной вещественной частью вещественного многочлена a(p), следуя в основном [48]. Алгоритм Рауса позволяет для любого вещественного многочлена (т.е. многочлена с вещественными коэффициентами) определить в конечное число арифметических действий, имеет ли данный многочлен m корней в правой полуплоскости Re p > 0 комплексного переменного p. В частном случае m = 0 этот алгоритм дает критерий устойчивости данного многочлена. 4.1. Индексы Коши. Прежде чем приступить к описанию алгоритма Рауса напомним понятие индекса Коши вещественной рациональной функции и приведем теорему Штурма об индексе. О п р е д е л е н и е 3. Р а ц и о н а л ь н о й в е щ е с т в е н н о й ф у н к ц и е й называется функция R, заданная с помощью формулы: R(x) =
g(x) , f (x)
f (x) 6= 0 (x ∈ R),
(10)
где f (x) и g(x) — произвольные вещественные многочлены. Без умаления общности можно считать, что в (10) многочлены f (x) и g(x) взаимно просты, т.е. не имеют общих корней. Точки, в которых рациональная функция (10) не определена, т.е. корни многочлена f (x), называются ее полюсами. Кратностью (или порядком) полюса называется его кратность как корня многочлена f (x). Пусть x0 — полюс кратности ν0 рациональной функции R(x), т.е. f (x) = (x − x0 )ν0 f1 (x), где f1 (x0 ) 6= 0. (Здесь f1 (x) — некоторый многочлен.)
94
Число
g(x0 ) (11) f1 (x0 ) называется главным коэффициентом функции R в полюсе x0 . (Это число отлично от нуля по определению.) Ясно, что A0 = lim (x − x0 )ν0 R(x). A0 =
x→x0
О п р е д е л е н и е 4. И н д е к с о м рациональной функции R(x) в п о л ю с е x0 кратности ν0 называется число Ind x0 R(x), определяемое формулой +1, если ν0 нечетно и A0 > 0; −1, если ν0 нечетно и A0 < 0; (12) Ind x0 R = 0, если ν0 четно, (где A0 — число, определяемое формулой (11)). О п р е д е л е н и е 5. И н д е к с о м К о ш и Ind ba R(x) рациональной функции R(x) на интервале (a, b) (a < b — вещественные числа; либо a = −∞, либо b = +∞) называется сумма индексов этой функции по всем полюсам x0 , лежащим в этом интервале: X Ind x0 R(x). (13) Ind ba R(x) := a<x0 0 или A < 0). Пусть f (x) = a0 (x − x1 )ν1 · · · (x − xq )νq (15)
95
— вещественный многочлен, имеющий m различных корней x1 , · · · , xq с кратностями ν1 , · · · , νq соответственно и среди этих корней только первые ` вещественны (` ≤ q). Тогда легко проверить, что q
`
i=1
j=1
X νj f 0 (x) X νi = = + R1 (x), f (x) x − xi x − xj
(16)
где R1 (x) — вещественная рациональная функция, не имеющая вещественных полюсов. Из (14) и (16) имеем `
Ind ba
f 0 (x) X = sign νi = `. f (x) j=1
Таким образом, имеет место следующее Предложение 1. Число различных вещественных корней многочлена f (x), находящихся внутри интервала (a, b) равно индексу Ind ba
f 0 (x) . f (x)
Как хорошо известно, произвольная вещественная рациональная g(x) функция R(x) = (f (x) — многочлен (15)) представима в виде f (x) " # (j) ` (j) X Aνj A1 R(x) = + ··· + + R1 (x), (17) x − xj (x − xj )νj j=1
(j)
где Aνj (j = 1, · · · , `) — вещественные числа (xj — вещественные корни многочлена f (x), а R1 (x) не имеет вещественных полюсов. Следовательно, из (14) и (17) получаем X Ind ba R(x) = sign A(j) (18) νj . !
a < xj < b νi − нечетно
Одним из методов вычисления индекса Ind ba R(x) является метод , основанный на классической теореме Штурма.
96
О п р е д е л е н и е 6. Ряд вещественных многочленов f1 (x), f2 (x), · · · , fs (x)
(a < x < b)
(19)
называется р я д о м Ш т у р м а в интервале (a, b), если он обладает следующими двумя свойствами по отношению к интервалу (a, b): 1◦ из fk (x) = 0, где x ∈ (a, b), следует fk−1 (x) · fk+1 (x) < 0,
k = 2, · · · , s − 1;
2◦ fs (x) 6= 0 при x ∈ (a, b). Теорема 3. (Теорема Штурма об индексе.) Если (19) — ряд Штурма в (a, b), а V (x) — число перемен знака в этом ряду при фиксированном значении x ∈ (a, b), то V (a) − V (b) = Ind ba
f2 (x) . f1 (x)
(20)
(Здесь под V (a) при a > −∞ понимается значение V (a + ε), где ε > 0 — столь малое число, что в промежутке (a, a + ε] ни одна функция fk (x) (k = 1, · · · , s) ряда (10) не обращается в нуль. Точно так же, если b < +∞, то V (b) := V (b − ε), где ε > 0 определяется аналогично.) Д о к а з а т е л ь с т в о . При изменении x от a до b значение V (x) может изменяться лишь при переходе через нуль какой-либо из функций ряда (19). В силу свойства 1◦ ряда Штурма при переходе через нуль функции fk (x) (k = 2, · · · , s − 1) значение V (x) не может измениться. Поэтому V (x) может измениться только при переходе через нуль функции f1 (x) (поскольку fs (x) имеет постоянный знак на (a, b) в силу свойства 2◦ ), при этом теряется или приобретается одна перемена знака в ряду (19) в зависимости от того, переходит отношение f2 (x)/f1 (x) от −∞ к +∞ или наоборот, т.е. имеет место равенство (20). Теорема 3 доказана. Замечание 1. Теорема Штурма остается в силе и для ряда, получаемого из ряда (19), умножением всех членов fk (x) (k = 1, · · · , s) на один и тот же произвольный многочлен d(x) (полученный ряд называется обобщенным рядом Штурма), поскольку последняя операция не меняет ни правой, ни левой части равенства (20).
97
Замечание 2. Если даны два произвольных многочлена f (x) и g(x) таких, что степень g(x) меньше или равна степени f (x), то при помощи алгоритма Евклида всегда можно построить обобщенный ряд Штурма, который начинался бы с функций f (x) и g(x). Действительно, принимая f1 (x) ≡ f (x), f2 (x) ≡ g(x) и обозначая через −f3 (x) остаток от деления f1 (x) на f2 (x), через −f4 (x) — остаток от деления f2 (x) на f3 (x) и т.д., будем иметь следующую цепочку равенств f1 (x) = q1 (x)f2 (x) − f3 (x), f2 (x) = q2 (x)f3 (x) − f4 (x), ··· ··· ··· ··· (21) fk−1 (x) = qk−1 (x)fk (x) − fk+1 (x), ··· ··· ··· ··· fs−1 (x) = qs−1 (x)fs (x). Последний не равный тождественно нулю остаток fs (x) является наибольшим общим делителем многочленов f (x) и g(x), а также всех многочленов ряда (19), построенного с помощью (21). Если при этом fs (x) 6= 0 при x ∈ (a, b), то полученный ряд (19) в силу (21) является, очевидно, рядом Штурма. Если же многочлен fs (x) имеет корни в интервале (a, b), то ряд (19) является обобщенным рядом Штурма (так как после деления всех членов этого ряда на fs (x) он становится рядом Штурма). Из замечаний 1 и 2 следует, что индекс любой рациональной функции R(x) может быть определен с помощью теоремы Штурма. Для этого достаточно представить рациональную функцию R(x) в виде R(x) = Q(x) +
g(x) , f (x)
(22)
где Q(x), f (x), g(x) — многочлены, причем степень g(x) меньше степени f (x), и применить теорему Штурма к обобщенному ряду, построенному для многочленнов f (x) и g(x) при помощи алгоритма Евклида (21). Таким образом, имеет место Предложение 2. Для любой рациональной функции R(x) (a < x < b) Ind ba R(x) = V (a) − V (b), (23)
98
где V (x) — число перемен знака при фиксированном x ∈ (a, b) в обобщенном ряде Штурма, построенном для многочленов f (x) и g(x) при помощи алгоритма Евклида (21); (здесь f (x) и g(x) — многочлены из (22), а V (a) и V (b) определены как в теореме Штурма). Положив в (23) R(x) = f 0 (x)/f (x), из предложений 1 и 2 получаем, что число вещественных корней многочлена f (x) внутри интервала (a, b) равно V (a) − V (b). Предложение 3. Для любой рациональной функции R(x), удовлетворяющей условиям R(a) = R(b) = 0
(a < b)
справедлива формула Ind ba R(x)
¯b ¯ 1 = − ∆Arctg R(x)¯¯ , π a
(24)
где под ∆Arctg R(x)|ba понимается приращение некоторой непрерывной ветви Arctg R(x) многозначной функции arctg R(x)+kπ (k ∈ Z). В частности, если a = −∞, b = +∞, то формула (24) имеет место для любой правильной рациональной дроби R(x) (т.е. такой дроби, у которой в представлении (22) Q(x) ≡ 0, а степень g(x) меньше, чем степень f (x)). Для доказательства предложения 3 достаточно ввести фазовую функцию Φ(x) = Arctg R(x) (из-за очевидного равенства (см.(22)) Ind ba
µ ¶ g(x) g(x) Q(x) + = Ind ba f (x) f (x)
функцию Φ достаточно ввести для правильной рациональной дроби g(x) ) и принять во внимание тот факт, что при изменении x от a к f (x) b полюсам функции R(x) с переходом от −∞ к +∞ соответствуют пересечения фазовой кривой ξ = f (x),
η = g(x) (a < x < b)
99
(на плоскости переменных (ξ, η)) с осью ξ = 0 в направлении против часовой стрелки, а полюсам с переходом от +∞ к −∞ – по часовой стрелке. 4.2. Алгоритм Рауса. Рассмотрим случай, когда многочлен a(p) в (1) не имеет корней на мнимой оси. В этом случае (см. теорему 2) справедлива формула Эрмита–Михайлова (4). 1. Введем новые (не совсем обычные) обозначения для коэффициентов многочлена a(p) (α0 := a0 6= 0): a(p) = α0 pn + β0 pn−1 + α1 pn−2 + β1 pn−3 + α2 pn−4 + β2 pn−5 + · · · . (25) (Здесь αk = a2k , βk = a2k+1 , k = 0, 1, 2, · · · .) Полагая в (25) p = iω, будем иметь a(iω) = in (f1 (ω) − if2 (ω)), f1 (ω) = α0 ω n − α1 ω n−2 + α2 ω n−4 − · · · f2 (ω) = β0 ω n−1 − β1 ω n−3 + β2 ω n−5 − · · ·
(26) ¾ .
(27)
Воспользуемся индексом Коши. Используя формулы (24), (26) и учитывая, что при умножении многочлена a(p) на произвольное комплексное число приращение ∆ Arg a(iω) не изменяется, будем иметь ¯ 1 a(iω) ¯¯+∞ 1 +∞ ∆ Arg a(iω)|−∞ = ∆ Arg n ¯ = π π i −∞ ¯ f2 (ω) ¯¯+∞ f2 (ω) 1 = Ind +∞ . = − ∆Arctg −∞ ¯ π f1 (ω) −∞ f1 (ω) Отсюда и из форомулы Эрмита–Михайлова (см.(4)) следует, что Ind +∞ −∞
f2 (ω) = n − 2m f1 (ω)
(28)
(где f1 (ω) и f2 (ω) — многочлены (27)). 2.Для определения индекса, стоящего в левой части равенства (28), используем теорему 3 (Штурма). Построим обобщенный ряд Штурма (см. выше, замечание 2 к теореме 3) для многочленов f1 (ω) и f2 (ω) при помощи алгоритма Евклида (21): f1 (ω), f2 (ω), f3 (ω), · · · , fr (ω).
(29)
100
Рассмотрим регулярный случай, когда r = n + 1. В этом случае в ряде (29) в силу равенств (21) степень каждого многочлена fj (ω) (j = 2, · · · , n + 1) меньше на единицу степени предыдущего fj−1 (ω) и, тем самым, степень последнего многочлена fr (ω) (r = n + 1) равна нулю, т.е. fn+1 (ω) = const 6= 0. Поэтому ряд (29) в регулярном случае является обычным рядом Штурма. Поскольку многочлены f1 (ω) и f2 (ω) имеют наибольший общий делитель fn+1 (ω) = const 6= 0, то эти многочлены не обращаются в нуль одновременно, т.е. (см. (26)) a(iω) 6= 0 для всех ω ∈ R и, тем самым, в регулярном случае имеет место формула (28). Используя равенства (21), найдем коэффициенты многочленов f3 (ω), · · · , fn+1 (ω) в ряду (29). Имеем (см. (21)): α0 f3 (ω) = ωf2 (ω) − f1 (ω) = γ0 ω n−2 − γ1 ω n−4 + γ2 ω n−6 + · · · , β0 где α0 β0 α1 − α0 β1 γ0 = α1 − β1 = , β0 β0 (30) α0 β0 α2 − α0 β2 γ1 = α2 − β2 = ,··· . β0 β0 Далее, f4 (ω) =
β0 ωf3 (ω) − f2 (ω) = δ0 ω n−3 − δ1 ω n−5 + · · · , γ0
где δ0 = β1 −
γ0 β1 − β0 γ1 β0 γ0 β2 − β0 γ2 β0 γ1 = , δ1 = β2 − γ2 = , · · · . (31) γ0 γ0 γ0 γ0
Коэффициенты остальных многочленов f5 (ω), · · · , fn+1 (ω) находятся совершенно аналогично. Заметим, что при этом каждый из многочленов в ряду (29) (r = n + 1) является четной или нечетной функцией. Составим теперь с х е м у Р а у с а α0 , β0 , γ0 , δ0 , ···
α1 , β1 , γ1 , δ1 , ···
α2 , β2 , γ2 , δ2 , ···
··· , ··· , ··· , ··· , ···
(32)
101
строящейся, как показывают формулы (30), (31), по следующим правилам: 1) В п е р в у ю с т р о к у таблицы (32) записываются коэффициенты многочлена a(p) (см. (1) и (25)) с ч е т н ы м и номерами. 2) В о в т о р у ю с т р о к у таблицы (32) записываются коэффициенты многочлена a(p) с н е ч е т н ы м и номерами. 3) Ч т о б ы п о с т р о и т ь j-ю с т р о к у (j ≥ 3), нужно из чисел (j − 2)-й строки вычесть числа (j − 1)-й строки, предварительно умноженные на такое число, чтобы начальный элемент (первая разность) обратился в нуль. Затем нужно, отбросив этот нулевой элемент, сдвинуть получившуюся строку на один шаг влево. Очевидно, что регулярный случай (r = n + 1 в (29)) имеет место тогда и только тогда, когда первый столбец в схеме Рауса (32) состоит из n + 1 отличных от нуля чисел. Применяя теорему Штурма к ряду (29) в интервале (−∞, +∞), получаем из (28): V (−∞) − V (+∞) = n − 2m.
(33)
Так как знак fj (+∞) := lim fj (ω) совпадает со знаком старшего ω→+∞
коэффициента, а знак fj (−∞) :=
lim fj (ω) отличается от этого
ω→−∞
знака множителем (−1)n−k+1 (j = 1, · · · , n + 1), то V (+∞) = V (α0 , β0 , γ0 , δ0 , · · · ),
(34)
V (−∞) = V (α0 , −β0 , γ0 , −δ0 , · · · ).
(35)
(Здесь правые части обозначают число перемен знака в соответствующем ряду чисел, стоящих в скобках.) Так как число перемен знака последовательности, состоящей из n+1 чисел, не больше n и равно n, когда знаки всех членов последовательности чередуются, то сумма правых частей равенств (34) и (35) равна n, т.е. V (+∞) + V (−∞) = n.
(36)
Из равенств (33) – (36) получаем m = V (α0 , β0 , γ0 , δ0 , · · · ). Итак, справедлива
(37)
102
Теорема 4. (Теорема Рауса.) Пусть имеет место регулярный случай, т.е. первый столбец в схеме Рауса (32) состоит из n + 1 отличных от нуля чисел. Тогда число корней вещественного многочлена a(p) степени n, лежащих в правой полуплоскости Re p > 0 (p ∈ C) равно числу перемен знака в первом столбце схемы Рауса. Формула (37) при m = 0 дает достаточное условие того, чтобы вещественный многочлен a(p) был устойчив (в регулярном случае). Покажем, что это условие также необходимо для устойчивости многочлена a(p). Пусть все корни многочлена a(p) имеют отрицательные вещественные части (т.е. лежат в левой полуплоскости Re p < 0). Тогда многочлен a(p) не имеет корней на мнимой оси и, следовательно, справедлива формула (28), а значит, и формула (33) (m = 0): V (−∞) − V (+∞) = n. (38) Очевидно, что 0 ≤ V (−∞) ≤ r − 1 ≤ n, 0 ≤ V (+∞) ≤ r − 1 ≤ n (так как числа V (−∞) и V (+∞) определены для ряда (29)). Поэтому равенство (38) возможно лишь тогда, когда r−1 = n, т.е. когда имеет место регулярный случай (r = n + 1) и V (−∞) = n, V (+∞) = 0, т.е. в силу (34) справедлива формула (37), где m = 0. Таким образом, имеет место следующий критерий устойчивости произвольного вещественного многочлена. Критерий Рауса. Для того чтобы все корни вещественного многочлена a(p) имели отрицательные вещественные части (т.е. лежали в левой полуплоскости Re p < 0) необходимо и достаточно, чтобы 1) число элементов первого столбца схемы Рауса (32) было равно n + 1 и 2) чтобы все они были отличными от нуля и одного знака. Как мы видим, а л г о р и т м Р а у с а для выяснения вопроса о том, лежат ли все корни вещественного многочлена a(p) степени n (и положительным старшим коэффициентам a0 (см. (1)) в левой полуплоскости Re p < 0, весьма прост и основывается на составлении с х е м ы (т а б л и ц ы) Р а у с а (32), которая строится по правилам 1), 2), 3) (см. выше). Многочлен a(p) в (1) устойчив тогда и только
103
тогда, когда первый столбец схемы Рауса состоит из n + 1 положительных чисел. 5. Критерий Гурвица. В этом пункте мы получим, пользуясь теоремой 4 (Рауса), критерий устойчивости многочлена a(p) (см. (1)) в том виде, в каком он был установлен А.Гурвицем [228]. При изложении будем следовать [48]. Пусть, как и выше, a(p) — произвольный вещественный многочлен (с положительным старшим коэффициентом), записанным в виде (25). Условимся считать, что коэффициенты αk = a2k и βk = a2k+1 определены при всех k ∈ Z, положив hni αk = 0 при k < 0 или k > , 2 · ¸ n−1 βk = 0 при k < 0 или k > . 2 (Здесь [x] означает целую часть вещественного числа x.) О п р е д е л е н и е 7. М а т р и ц е й Г у р в и ц а многочлена a(p) называется (n × n)-матрица, имеющая вид β0 β1 β2 . . . βn−1 α0 α1 α2 . . . αn−1 0 β0 β1 . . . βn−2 . H= (39) 0 α0 α1 . . . αn−2 0 0 β0 . . . βn−3 ··· ··· ··· ··· ··· (Обратим внимание, что первой (второй) строкой матрицы (39) является вторая (первая) строка схемы Рауса (32).) О п р е д е л е н и е 8. О п р е д е л и т е л я м и Г у р в и ц а ∆1 , · · · , ∆n многочлена a(p) называются последовательные главные миноры матрицы Гурвица H: ¯ ¯ ¯ ¯ ¯ β0 β1 β2 ¯ ¯ β β1 ¯ ¯ ¯ ¯ , ∆3 = ¯α0 α1 α2 ¯ , · · · ∆1 = β0 , ∆2 = ¯¯ 0 ¯ ¯ ¯ α0 α1 ¯ 0 β0 β1 ¯ Ниже нам понадобится понятие эквивалентности двух матриц M1 и M2 в следующем смысле.
104
О п р е д е л е н и е 9. Две матрицы M1 = {αij } M2 = {βij } (i, j = 1, · · · , n) будем называть эквивалентными в том и только в том случае, когда при любом s ≤ n в первых s строках этих матриц соответствующие миноры s-го порядка равны между собой, что будем записывать так: µ ¶ µ ¶ 1 2 ··· s 1 2 ··· s M1 = M2 j1 j2 · · · js j1 j2 · · · js (s = 1, 2, · · · , n; 1 ≤ j1 < j2 < · · · < js ≤ n; здесь 1, 2, · · · , s — номера строк, а j1 , · · · , js — номера столбцов соответствующих миноров s-го порядка. Рассмотрим р е г у л я р н ы й с л у ч а й , когда β0 6= 0, γ0 6= 0, δ0 6= 0 · · · (т.е. все элементы в первом столбце схемы Рауса (32) отличны от нуля). Преобразуем матрицу Гурвица, вычитая из каждой строки с четным номером предыдущую строку, предварительно умноженную на α0 . Тогда в каждой четной строке мы получим, очевидно, соответβ0 ствующим образом сдвинутую третью строку схемы Рауса: β0 β1 β2 . . . βn−1 0 γ0 γ1 . . . γn−2 0 β0 β1 . . . βn−2 . H1 = 0 γ0 . . . γn−3 0 0 0 β0 . . . βn−3 ··· ··· ··· ··· ··· Полученную матрицу H1 снова преобразуем (оставляя без изменения первые две ее строки), вычитая из каждой строки (начиная с β0 . В третьей) с нечетным номером предыдущую, умноженную на γ0 результате в каждой нечетной строке (кроме первой) появится соответствующим образом сдвинутая четвертая строка схемы Рауса: β0 β1 β2 β3 . . . 0 γ0 γ1 γ2 . . . 0 0 δ0 δ1 . . . . H2 = 0 γ0 γ1 . . . 0 0 0 0 δ0 . . . ··· ··· ··· ··· ···
105
На следующем шаге аналогичным образом преобразуем все строки, кроме первых трех. В результате в четных строках, начиная с четвертой, появится пятая строка схемы Рауса. Продолжая этот процесс далее, мы получим из матрицы H треугольную (n × n)-матрицу:
β0 0 R= 0 ···
β1 γ0 0 ···
β2 γ1 δ0 ···
β3 γ2 δ1 ···
... . . . . . . . ···
(40)
Матрицу (40) называют м а т р и ц е й Р а у с а . Матрица Рауса получается (как это видно из сравнений (32) и (40)) из схемы Рауса: 1) отбрасыванием первой строки, 2) сдвигом строк вправо так, чтобы их первые элементы пришлись на главную диагональ, 3) пополнением нулями до квадратной матрицы порядка n × n. Так как при описанных выше преобразованиях матрицы H миноры s-го порядка в первых s строках (s = 1, 2, · · · , n) не изменяют своих значений, то матрицы Гурвица H и Рауса R эквивалентны в смысле определения 9, т.е. µ
1 2 ··· H j1 j2 · · ·
s js
¶
µ
1 2 ··· =R j1 j2 · · ·
s js
¶ (41)
(s = 1, 2, · · · , n; 1 ≤ j1 < j2 < · · · < js ≤ n). Эквивалентность (в смысле определения 9) матриц H и R позволяет выразить все элементы матрицы R, т.е. все элементы схемы Рауса (32), через миноры матрицы H и, следовательно, через коэффициенты αk и βk данного многочлена a(p).
106
Действительно, давая s последовательно значения 1, 2, · · · , n, получим из (41): µ ¶ µ ¶ µ ¶ 1 1 1 H = β0 , H = β1 , H = β2 , · · · , 1 2 3 µ ¶ µ ¶ µ ¶ 1 2 1 2 1 2 H = β 0 γ0 , H = β0 γ1 , H = β0 γ2 , · · · , 1 2 1 3 1 4 µ ¶ µ ¶ µ ¶ 1 2 3 1 2 3 1 2 3 H = β0 γ0 δ0 , H = β0 γ0 δ1 , H = β0 γ0 δ2 1 2 3 1 2 4 1 2 5 ··· ··· ··· ··· ··· (42)
Отсюда имеем следующие выражения для элементов схемы Рауса (32): µ ¶ µ ¶ µ ¶ 1 1 1 β0 = H , β1 = H ,β = H ,··· , 1! 2 ! 2 3 ! 1 2 1 2 1 2 H H H 1 2 1 3 1 4 ! , γ1 = ! , γ2 = ! ,··· , γ0 = 1 1 1 H H H . 1! 1 ! 1 ! 1 2 3 1 2 3 1 2 3 H H H 1 2 4 1 2 5 1 2 3 ! , δ1 = ! , δ2 = ! ,··· , δ0 = 1 2 1 2 1 2 H H H 1 2 1 2 1 2 ··· ··· ··· ··· ··· Из (42) получаем формулы для вычисления определителей ∆1 , · · · , ∆n Гурвица: µ ¶ ¡¢ 1 2 ∆1 ≡ H 11 = β0 , ∆2 ≡ H = β0 γ0 , 1 2 ¶ µ . (43) 1 2 3 = β0 γ0 δ0 , · · · ∆3 ≡ H 1 2 3 Согласно формулам (43) р е г у л я р н ы й с л у ч а й (все числа β0 , γ0 , δ0 · · · отличны от нуля) имеет место тогда и только тогда, когда все определители Гурвица отличны от нуля: ∆1 6= 0, ∆2 6= 0, · · · , ∆n 6= 0.
(44)
107
Из (43), с учетом неравенств (44), находим формулы, выражающие элементы первого столбца схемы Рауса через определители Гурвица: β0 = ∆1 , γ0 =
∆2 ∆3 , δ0 = ,··· . ∆1 ∆2
(45)
Учитывая равенства (45), из формулы (37) получаем, что число m корней многочлена a(p) с положительной вещественной частью равно m = V (α0 , β0 , γ0 , δ0 , · · · ) = V (α0 , ∆1 ,
∆n ∆2 ,··· , ). ∆1 ∆n−1
(46)
С учетом формулы (46) теорема Рауса может быть сформулирована так: Теорема 5 (Рауса–Гурвица). Пусть все определители ∆1 , · · · , ∆n Гурвица отличны от нуля. Тогда число корней вещественного многочлена a(p) степени n, лежащих в правой полуплоскости Re p > 0 (p ∈ C), равно m = V (α0 , ∆1 ,
∆2 ∆n ,··· , ) ∆1 ∆n−1
(47)
(т.е. числу перемен знака в последовательности чисел, стоящих в скобках в правой части равенства (47)). При m = 0 формула (47) выражает достаточное условие устойчивости многочлена a(p) (при выполнении неравенств (44)). Это условие также необходимо для устойчивости многочлена a(p). Действительно, пусть все корни многочлена a(p) лежат в левой полуплоскости. Тогда, в силу критерия Рауса, все числа α0 , β0 , γ0 , δ0 , · · · отличны от нуля и одного знака. Следовательно, согласно (43)–(45) имеет место неравенство (46), где m = 0. Таким образом, установлен следующий критерий устойчивости многочлена a(p). Критерий Гурвица. Для того чтобы все корни вещественного многочлена a(p) степени n с положительным старшим коэффициентом α0 имели отрицательные вещественные части, необходимо и достаточно, чтобы все определители Гурвица были положительными: ∆1 > 0, ∆2 > 0, ∆3 > 0, · · · , ∆n > 0, (48)
108
т.е. (в исходных обозначениях ak (k = 0, 1, 2, · · · , n) коэффициентов многочлена a(p), a0 > 0) ¯ ¯ ¯ ¯ ¯a1 a3 a5 ¯ ¯a1 a3 ¯ ¯ ¯ ¯ ¯ > 0, ¯a0 a2 a4 ¯ > 0, a1 > 0, ¯a0 a2 ¯ ¯ ¯ ¯ 0 a1 a3 ¯ ¯ ¯ ¯ a1 a3 a5 · · · 0 ¯ ¯ ¯ ¯ a0 a2 a4 · · · 0 ¯ (49) ¯ ¯ ¯ 0 ¯ a a · · · 0 1 3 ¯ > 0, · · · , det H ≡ ¯¯ a0 a2 · · · 0 ¯¯ ¯ 0 ¯· · · · · · · · · · · · · · ·¯ ¯ ¯ ¯· · · · · · · · · · · · an ¯ (где принято ak = 0 при k < 0 или k > n ). Условия (48) или, что то же самое, условия (49) называются условиями Гурвица. Замечание 1. Условия (49) иногда называются Р а у с а–Г у р в и ц а .
условиями
Замечание 2. Если коэффициенты многочлена a(p) заданы численно, то формулы (43) дают наиболее простой способ вычисления определителей Гурвица, сводя это вычисление к составлению схемы Рауса. Замечание 3. Для выяснения устойчивости вещественных многочленов, коэффициенты которых заданы как конкретные числа, алгоритм Рауса удобнее критерия Гурвица. Однако для изучения устойчивости многочленов с коэффициентами, зависящими от параметров, удобнее критерий Гурвица. Примеры. 1) Для многочлена второй степени (n = 2) условия Рауса-Гурвица имеют вид ¯ ¯ ¯a1 0 ¯ ¯ ¯ a1 > 0, ¯a0 a2 ¯ > 0 или, что то же самое, a1 > 0,
a2 > 0.
109
Последние совпадают с условиями устойчивости многочлена второй степени, полученными с помощью критерия Эрмита-Михайлова (см. п.3, пример 1)). 2) Для многочлена третьей степени (n = 3) условия Рауса-Гурвица запишутся так: ¯ ¯ ¯ ¯ ¯a1 a3 0 ¯ ¯a1 a3 ¯ ¯ ¯ ¯ > 0, ¯a0 a2 0 ¯ > 0 a1 > 0, ¯¯ ¯ ¯ ¯ a0 a2 ¯ 0 a1 a3 ¯ или a1 > 0, a1 a2 > a0 a3 , a3 (a1 a2 − a0 a3 ) > 0. Вместе с условием a0 > 0 последние неравенства эквивалентны следующим неравенствам a0 > 0,
a1 > 0,
a2 > 0,
a3 > 0,
a1 a2 > a0 a3 ,
которые совпадают с условиями устойчивости многочлена третьей степени, полученными выше в примере 2) (см. п.3) с помощью критерия Эрмита-Михайлова.
§ 3. Задача линейной стабилизации Пусть на вход линейной системы x˙ = Ax + bu,
y = c∗ x (x ∈ Rn , u ∈ Rm , y ∈ R` ),
(1)
где A, b и c — вещественные постоянные матрицы порядков n × n, n × m и n × ` соответственно, подается управление u в зависимости от измеренных сигналов выходов — координат вектора y: u = s∗ y, где s — некоторая, вообще говоря, зависящая от времени t переменная (` × m)-матрица. Тогда говорят о линейном управлении по принципу обратной связи (рис. 9). Если в каждый момент времени измерению доступны все координаты вектора состояния x системы (в этом случае в системе (1) c — единичная (n × n)-матрица, так что y = x), то говорят, что управление построено по принципу полной обратной связи. Если же измерению доступны только проекции вектора состояния x на ` (` < n)
110
линейно-независимых направлений c1 , . . . , c` , то говорят, что управление построено по принципу неполной обратной связи (в этом случае в системе (1) вектор y = c∗ x, где c = (c1 , . . . , cl ) — матрица, столбцами которой являются векторы c1 , . . . , cl ).
Рис. 9. Управление по принципу обратной связи.
Задача линейной стабилизации системы (1) состоит в том, чтобы построить управление u = s(t)∗ y,
y = c∗ x
(2)
с (`×m)-матрицей s(t), при котором система (1), замкнутая обратной связью (2), т.е. система £ ¤ x˙ = A + b(cs(t))∗ x (3) асимптотически устойчива (в целом). Управление (2), решающее задачу стабилизации системы (1), называется стабилизирующим. О п р е д е л е н и е. Система (1) называется с т а б и л и з и р у ем о й (или т р о й к а (A, b, c) называется с т а б и л и з и р у е м о й), если существует хотя бы одно ее стабилизирующее управление (2). В частности, когда в (2) c – единичная матрица, т.е. управление построено по принципу полной обратной связи, то говорят о с т а б и л и з и р у е м о с т и п а р ы (A, b). Если матрица s(t) в (2) постоянная: s(t) ≡ s0 = const , то будем говорить о линейной стационарной стабилизации системы (1),
111
в противном случае — о линейной нестационарной стабилизации системы (1). В случае линейной стационарной стабилизации данное выше определение означает, что система (1) стабилизируема (или тройка (A, b, c) стабилизируема), если существует такая обратная связь (2), где s — постоянная (` × m)-матрица, что замкнутая система (3) асимптотически устойчива, т.е. матрица A + bs∗ c∗ гурвицева. § 4. Стабилизируемость полностью управляемой системы (стабилизируемость пары (A, b)) Здесь мы дадим решение задачи стационарной стабилизируемости для линейной системы x˙ = Ax + bu, x ∈ Rn ,
u ∈ Rm ,
(1)
где A и b — вещественные постоянные (n × n)− и (n × m)-матрицы соответственно, x — вектор состояния, u — вектор управления или входа, m ≥ 1 (выходом y систeмы (1) является вектор состояния, т.е. y = x). Требуется найти (n × m)-матрицу s (вещественную) такую, чтобы матрица A + bs∗ была гурвицевой, т.е. чтобы спектр σ(A + bs∗ ) матрицы A + bs∗ лежал в левой полуплоскости. 1. Вспомогательные утверждения. Докажем вначале некоторые леммы, которые понадобятся нам в дальнейшем. Отметим, что при невырожденном преобразовании переменных x = Qy,
y ∈ Rn ,
(2)
где Q — неособая матрица (det Q 6= 0), система (1) переходит в систему e + ebu y˙ = Ay (y ∈ Rn ), где e = Q−1 AQ, eb = Q−1 b. A Лемма 1. Пусть полностью управляемая система (1) невырожденным преобразованием переменных (2) приведена к виду ( y˙ 1 = λy1 + eb1 u, y1 ∈ R, (3) y˙ 2 = Cy + eb2 u, y2 ∈ Rn−1 ,
112 ∗ где λ ∈ R, C — матрица порядка (n − 1) × n, eb1 = (eb11 , · · · , eb1m ), eb1 ∈ Rm , eb2 — матрица порядка (n − 1) × m, u = (u1 , · · · , um )∗ ∈ Rm , y = (y1 , y2 )∗ . Тогда существует ортогональное преобразование
u = Tv
(v ∈ Rm ),
(T T ∗ = I, I — единичная (m × m)-матрица) такое, что в преобразованной матрице-строке b01 = eb1 T первый элемент b011 6= 0 (здесь b01 = (b011 , · · · , b01m )). Д о к а з а т е л ь с т в о. Пусть eb11 = 0 (если eb11 6= 0, то, полагая T := I, получаем утверждение леммы 1). Тогда в силу полной управляемости системы (1) существует такой номер k ∈ {2, · · · , m}, что eb1k 6= 0. Действительно, в противном случае в системе (3) матрицы коэффициентов при переменных y и u приняли бы вид ¶ } 1 λ 0 A˜ = C1 C2 } n − 1, |{z} |{z} µ
1
µ ¶ eb = 0 } 1 eb2 } n − 1
n−1
и в силу свойства (V IIIу ) теоремы 1 из § 1, гл.II система (1) была бы неполностью управляемой. Введем переобозначения
v1 = uk , vk = u1 , vj = uj
(j 6= 1, k).
Последние равенства можно записать в виде
u = T v,
(4)
113
где (k) .. .. 0 . 1 . 0 .. .. .. . . . . . . . .. .. . . 1 . . . .. .. . . . . T = .. .. 1 . 0 . 0 (k) . . . . .. .. . . .. . . . .. .. .. 1 . . . . . . . . . 0 0 1
(5)
(матрица T порядка m × m получается из единичной Im перестановкой 1-го и k-го столбцов). Очевидно, что у матрицы b0 = ebT элемент b011 = bf 1k 6= 0. Лемма 1 доказана. Замечание. В силу леммы 1, без умаления общности, можно всегда считать, что в (3) eb11 6= 0. Лемма 2. Пусть полностью управляемая система (1) невырожденным преобразованием переменных (2) приведена к виду y˙ 1 = λ1 y1 + λ2 y2 + be1 u, y1 ∈ R, (6) y˙ 2 = λ3 y1 + λ4 y4 + be2 u, y2 ∈ R, y˙ = Dy + be u, n−2 y3 ∈ R , 3 3 где λj ∈ R, (j = 1, 2, 3, 4), D — матрица порядка (n − 2) × n, ebi = (ebi1 , · · · , ebim ), eb∗ ∈ Rm , (i = 1, 2), eb3 — матрица порядка i (n − 2) × m, u = (u1 , · · · , um )∗ ∈ Rm , y = (y1 , y2 ; y3 )∗ . Тогда существует ортогональное преобразование u = T v (v ∈ Rm ; T T ∗ = I) такое, что в преобразованных матрицах — строках b01 = eb1 T, b02 = eb2 T по крайней мере один из первых элементов b011 , b021 отличен от нуля: b011 6= 0 или b021 6= 0 (здесь b0i = (b0i1 , · · · , b0im ), i = 1, 2).
114
Д о к а з а т е л ь с т в о . Оно проводится аналогично доказательству леммы 1. В силу полной управляемости системы (1) согласно свойству (V IIIу ) теоремы 1 из § 1, гл.II должно быть: eb1 6= 0 и eb2 6= 0. Если eb11 6= 0 или eb21 6= 0, то утверждение леммы 2 доказано (T := I). Пусть eb11 = eb21 = 0. Тогда, в силу сказанного выше, по крайней мере одно из чисел ebi2 · · · , ebim (i = 1, 2), скажем ebik , k ∈ {2, · · · , m}, отлично от нуля. Далее, сделав преобразование (4), (5), получим утверждение леммы 2. Лемма 2 доказана. Замечание. В силу леммы 2, без умаления общности, всегда можно считать, что в (6) или eb11 6= 0, или eb21 6= 0. Лемма 3. Пусть
µ ¶ b1 b3 B= b2 b4
µ ¶ α −β C= β α
— матрицы порядков (2 × 2), (bi , α, β ∈ R, i = 1, 2, 3, 4), причем β 6= 0, и по крайней мере один из элементов bi отличен от нуля. Тогда существует такая вещественная матрица µ ¶ r1 r3 R= r2 r4 (ri ∈ R, i = 1, 2, 3, 4), что матрица C + BR имеет только вещественные собственные значения. Д о к а з а т е л ь с т в о очевидно. Действительно, если: 1) b1 6= 0, то положим r1 = r2 = r4 = 0, r3 = β/b1 ; 2) b2 6= 0, то положим r2 = r3 = r4 = 0, r1 = −β/b2 ; 3) b3 6= 0, то положим r1 = r2 = r3 = 0, r4 = β/b3 ; 4) b4 6= 0, то положим r1 = r3 = r4 = 0, r2 = −β/b4 . Во всех четырех случаях 1)—4) матрица C + BR имеет только вещественные собственные значения. Лемма 3 доказана. Совершенно аналогично предыдущей лемме доказывается
115
Лемма 4. Если
µ ¶ µ ¶ b1 α −β B= , C= b2 β α
— матрицы порядков 2 × 1 и 2 × 2 соответственно (bi , α, β ∈ R; i = 1, 2), причем β 6= 0, |b1 | + |b2 | = 6 0, то существует такая вещественная матрица-строка R = (r1 , r2 ), что матрица C + BR имеет только вещественные собственные значения. Следующие две леммы позволяют по заданной матрице с невещественными собственными значениями построить другую матрицу, все собственные значения которой уже вещественны. Лемма 5. Пусть Λ и B — вещественные (n × n)- и (n × m)матрицы соответственно, пара (Λ, B) полностью управляема и все собственные значения матрица Λ невещественны. Тогда существует (m × n)-матрица (вещественная) R такая, что все собственные значения матрицы Λ + BR вещественны. ¯ 1 ; · · · , λ` , λ ¯ ` ; λj , λ ¯j = Д о к а з а т е л ь с т в о . Пусть λ1 , λ αj ± iβj , βj 6= 0 (j = 1, · · · , `; n = 2`) — собственные значения мат¯ j выписывается рицы Λ с учетом их кратностей (каждая пара λj , λ ¯ j ) как корня характеристического столько раз, какова кратность λj (λ уравнения det (pI − Λ) = 0 ). Приведем матрицу Λ к вещественной "нижней"жордановой нормальной форме [48]: e = Q−1 AQ0 = diag {K1 (λ1 ), · · · , Kq (λq )}, (q ≤ `), Λ 0 где Q0 — неособая матрица (det Q0 6= 0), Kσ (λP σ ), (σ = 1, · · · , q) — "нижняя"жорданова клетка размера κσ ≥ 2, ( qσ=1 κσ = n): Cσ O2 . . . O2 O2 E2 Cσ . . . O2 O2 .. . . .. .. , Kσ (λσ ) = ... . . . . O2 O2 . . . Cσ O2 O2 O2 . . . E2 Cσ µ ¶ µ ¶ µ ¶ 0 0 1 0 ασ −βσ , O2 = . Cσ = , E2 = 0 0 0 1 βσ ασ
116
Перенумеровав подряд все (2 × 2)-матрицы Cσ , стоящие вдоль e в виде главной диагонали, перепишем Λ C1 O2 . . . O2 F2 C2 . . . O2 .. . e = O2 F2 . . . , Λ (7) . .. .. . Cl−1 O2 O2 O2 . . . F2 C` где F2 либо двумерная единичная, либо двумерная нулевая матрица. e1 такую, чтобы матрица 1) Построим (m × n)-матрицу R e1 = Λ e +B eR e1 , Λ e = Q−1 B, имела вид: где B 0 µ ¶ D1 0 } 2 e , Λ1 = G 1 Ω1 } n − 2 |{z} |{z} 2
(8)
n−2
где D1 — (2 × 2)-матрица, имеющая два (быть может равных) вещественных собственных значения, Ω1 — (n − 2) × (n − 2)-матрица, ¯ 2 ; · · · λ` , λ ¯ ` , а G1 — некоторая собственные значения которой суть λ2 , λ (n − 2) × 2-матрица. Для этого положим µ 0 ¶ R11 0 } 2 e R1 = 0 0 }m−2 (m ≥ 2), (9) |{z} |{z} 2
n−2
0 R11
0 где (2 × 2)-матрица подлежит определению (в случае m = 1, R11 – матрица-строка размерности 2). Пусть Ã ! e11 B e12 } 2 B e= B e21 B e22 } n − 2 B (m ≥ 2), (10) |{z} |{z} 2
m−2
e11 и B e21 — одностолбцовые матрицы размерностей (в случае m = 1, B 2 × 1 и (n − 2) × 1 соответственно). Так как пара (Λ, B) полностью e11 6= 0. управляема, то в силу леммы 2 (см. замечание) B
117
Из (7), (9), (10) имеем Ã ! e11 R0 C + B 0 }2 1 11 e +B eR e1 = Λ 0 e F + B21 R11 Ω1 } n − 2 | {z } |{z}
(11)
n−2
2
где
,
F2 C2 O2 . . . O2 O2 F2 C3 . . . O2 Ω1 = .. .. . . .. , F = .. . . . . . . O2 O2 O2 . . . C`
(12)
(Ω1 — (n − 2) × (n − 2)-матрица, F — (n − 2) × 2-матрица). 0 такая, По лемме 3 (при m = 1 по лемме 4) существует матрица R11 что матрица e11 R0 C1 + B 11
имеет только вещественные собственные значения. Следовательно, матрица (11) имеет вид (8), где e11 R0 , D1 = C1 + B 11
e21 R0 . G1 = F + B 11
При этом имеем e1 = Λ e +B eR e1 = Q−1 (Λ + B R e1 Q−1 )Q0 . Λ 0 0
(13)
e 1 подобна матрице Так как в силу (13) матрица Λ Λ1 = Λ + BR1 ,
(14)
e1 Q−1 , и, значит, их собственные значения совпадают, то где R1 = R 0 матрица Λ1 имеет два вещественных (быть может равных) и n − 2 невещественных собственных значений, причем в силу следствия 1 теоремы 1 из § 1, гл.II пара (Λ1 , B) полностью управляема, поскольку полностью управляема пара (Λ, B). 2) Далее, в матрице (8), где Ω1 определяется из (12), перестановкой 1-й и 3-й, 2-й и 4-й строк и 1-го и 3-го, 2-го и 4-го столбцов, переставим местами матрицы D1 и C2 , расположенные вдоль главной
118
диагонали. Эта операция, как легко убедиться, равносильна умноe 1 слева и справа на ортогональную матрицу жению матрицы Λ T1 =
0 0 1 0 0 .. . .. . .. .
0 0 0 1 0 .. . .. . .. .
1 0 0 0 0 .. . .. . .. .
0 1 0 0 0 .. . .. . .. .
0 0 0 0 1 .. . . . . .. . .. .
0 0 0 0 0 |
{z 4
} |
... ... ... ... ...
0 0 0 0 0 .. . .. 1 . . . .. . . ... 1 {z
4
n−4
}
n−4
(матрица T1 получается из единичной матрицы перестановкой 1-й e 1 T1 имеет те же собственные и 3-й, 2-й и 4-й строк). Матрица T1 Λ e 1 подобна Λ и T −1 = T ∗ = значения, что и матрица Λ1 (так как Λ 1 1 T1 ), но она, вообще говоря, уже не имеет нижнего треугольного вида (8). Поэтому сделаем над этой матрицей преобразование подобия (с матрицей подобия P1 ) e e 1 = P −1 (T1 Λ e 1 T1 )P1 , (det P1 6= 0) Λ 1 приводящее её к нижнему треугольному виду, например, к вещественной "нижней"жордановой нормальной форме: C2 O2 O2 . . . O2 F2 D e 1 O2 . . . O2 e −1 e1 = Q Λ e 1 Q1 = O2 F2 C3 . . . O2 Λ (15) , 1 . . . . . . . . . . . . . . . O2 O2 O2 . . . C` e 1 — (2×2)-матрица, имеющая только вещественные где Q1 = T1 P1 , D собственные значения (те же, что и матрица D1 ).
119
Пусть
ee ee B B 12 } 2 ee e 11 B = Q−1 1 B = }n−2 ee ee B 21 B 22 |{z} |{z} 2
,
(16)
m−2
ee ee (при m = 1, B 11 и B 21 — одностолбцовые матрицы размерностей 2×1 и (n − 2) × 1 соответственно). Поскольку пара (Λ1 , B) полностью управляема, то в силу следствия 2 теоремы 1 из § 1, гл.II полностью управляемой будет и пара ee e 1 , B). e Поэтому по лемме 2 (см. замечание) B (Λ 11 6= 0. e Как и в п.1) построим (m × n)-матрицу R2 такую, чтобы матрица e e ee e e2 = Λ e1 + B Λ · R2 имела вид e e2 = Λ
µ
D2 0 G2 Ω2 |{z} |{z} 2
¶
}2 }n−2
,
(17)
n−2
где D2 — (2 × 2)-матрица, имеющая два (быть может равных) вещественных собственных значения, Ω2 — (n − 2) × 2-матрица, соб¯ 3 , · · · , λ` , λ ¯ ` , а G2 -некоторая ственные значения которой суть λ3 , λ (n − 2) × 2-матрица. Для этого полагая ¶ µ 00 R11 0 } 2 e R2 = } m−2 0 0 , (m ≥ 2), (18) |{z} |{z} 2
m−2
00 — однострочная матрица размерности 1 × 2), как и (при m = 1, R11 00 в п.1), используя лемму 3 (при m = 1 лемму 4), найдем матрицу R11 такую, чтобы матрица ee 00 C2 + B 11 R11
имела только вещественные собственные значения.
120
e ee e e1 + B С учетом (15), (16) и (18) получаем, что матрица Λ R2 имеет вид (17), где ee 00 D2 = C2 + B 11 R11 , e 1, а Ω2 — матрица, получающаяся из Ω1 (см. (12)) заменой C2 на D ee 00 G2 = F + B 2 R11 . При этом в силу (13) и (14) имеем e e ee e e2 = Λ e1 + B e e e −1 Λ R2 = Q−1 1 (Λ1 + B R2 Q1 )Q1 = −1 e −1 −1 = Q−1 1 Q0 (Λ1 + B R2 Q1 Q0 )Q0 Q1 .
Матрица Λ2 = Λ1 + BR2 , (19) e e2 Q−1 Q−1 , подобна матрице Λ e 2 и, поэтому, имеет четыгде R2 = R 1 0 ре вещественных (среди которых могут быть равные) и n − 4 неве¯ 3 , · · · , λ` , λ ¯ ` , причем согласно щественных собственных значений λ3 λ следствию 1 теоремы 1 из § 1, гл.II пара (Λ2 , B) будет полностью управляемой. Из (19), с учетом (14), имеем Λ2 = Λ + B(R1 + R2 ). Продолжая этот процесс, как и выше, будем последовательно получать матрицы R3 , R4 , · · · , Rk , · · · , и соответственно матрицы Λ3 , Λ4 , · · · , Λk , · · · (аналогичные (14) и (19)), причем матрица Λk будет иметь 2k вещественных и 2(` − k) невещественных собственных значений. Через ` шагов, очевидно, получим матрицу R = R1 + · · · + R` такую, что матрица Λ` = Λ`−1 + BR` = Λ`−2 + B(R`−1 + R` ) = · · · = Λ + BR имеет только вещественные собственные значения. Тем самым, лемма 4 доказана. Совершенно аналогично лемме 5 доказывается Лемма 6. Пусть A и B — произвольные (n × n)- и (n × m)матрицы соответственно, причем пара (A, B) полностью управляема.
121
Тогда существует (m × n)-матрица R такая, что матрица A + BR имеет только вещественные собственные значения. Д о к а з а т е л ь с т в о . Пусть матрица A имеет k вещественных γ1 , · · · , γk и некоторое число ` комплексно-сопряженных ¯ 1 ,· · · λ` ,λ ¯ ` (с учетом их кратностей) собственных чисел, припар λ1 , λ чем k + 2` = n. Тогда, приводя матрицу A к вещественной "нижней"жордановой нормальной форме и записывая ее в аналогичном (7) виде, а затем повторяя рассуждения доказательства леммы 5, получим утверждение леммы 6. 2. Теорема о стабилизации. Приступим теперь к доказательству теоремы о стабилизации. Здесь мы докажем более общее утверждение. Теорема (о стабилизации). Пусть A и b — вещественные (n×n)- и (n×m)-матрицы сответственно, и пара (A, b) полностью управляема. Пусть, далее, µ1 , · · · , µn — произвольные вещественные числа. Тогда существует вещественная (n × m)-матрица s такая, что набор собственных чисел (спектр σ) матрицы A + bs∗ совпадает с набором {µ1 , · · · , µn }, т.е. σ(A + bs∗ ) = {µ1 , · · · , µn }.
(µj ∈ R, j = 1, · · · , n).
В частности, если µj < 0, j = 1, · · · , n, то матрица A + bs∗ гурвицева. Д о к а з а т е л ь с т в о . В силу лемм 5 и 6 существует (n × m)-матрица r0 такая, что все собственные значения матрицы A0 = A + br0∗ будут вещественными, причем в силу следствия 1 теоремы 1 из § 1, гл.II пара (A0 , b) будет полностью управляемой. Пусть λ1 , · · · , λn (λj ∈ R, j = 1, · · · , n) — собственные числа матрицы A0 с учетом их кратностей и µ1 , · · · , µn — произвольные вещественные числа (среди которых могут быть и равные). Доказательство теоремы разобьем на несколько этапов — решений ряда промежуточных задач. 1) {A0 , b; λ1 |µ1 }-задача: построить (n × m)-матрицу s1 такую, чтобы выполнялось соотношение: σ(A0 + bs∗1 ) = {µ1 ; λ2 , · · · , λn },
(20)
122
т.е. чтобы набор собственных чисел матрицы A0 + bs∗1 совпадал с аналогичным набором собственных чисел матрицы A0 , в котором число λ1 заменено на µ1 . Для решения сформулированной задачи с помощью преобразования подобия e0 = Q−1 A0 Q0 , A 0
где Q0 — неособая матрица, приведем матрицу A0 к вещественной "нижней" жордановой нормальной форме, которую запишем в виде: λ1 0 0 ... 0 ε21 λ2 0 ··· 0 ... 0 e0 = ε31 ε32 λ3 (21) A , .. .. .. .. . . . . . . . εn1 εn2 . . . εnn−1 λn где εij (i = 2, · · · , n, 1 ≤ j < i) — числа, равные 0 или 1. Очевидно, e0 ) = σ(A). что спектр σ(A Пусть ! Ã eb11 eb12 } 1 −1 eb = Q b = 0 } n−1 eb21 eb22 . (22) |{z} |{z} 1
m−1
e0 , eb; λ1 |µ1 }-задачу. Для этого ищем соответствуюРешим сначала {A щую матрицу se1 в виде ¶ µ ρ1 0 } 1 se1 = } n−1 0 0 , (23) |{z} |{z} 1
n−1
где число ρ1 подлежит определению. Отсюда, с учетом (21) и (22), имеем Ã ! e λ + b ρ 0 ∗ } 1 1 11 1 e0 + ebe A s1 = } n−1 g1 A1 , (24) | {z } |{z} 1
n−1
123
где g1 = ε1 + ρ1eb21 , ε1 =
λ2
ε21 .. . 0 .. , A = ε32 1 . . . .. .. εn1 εn2 . . . εnn−1 λn
.
Так как пара (A0 , b) полностью управляема, то согласно лемме 1 (см. замечание) eb11 6= 0. Поэтому из уравнения λ1 + eb11 ρ1 = µ1 находим ρ1 =
µ1 − λ1 . eb11
(25)
Из (24) и (25) получаем, что ∗ e0 + ebe σ(A s1 ) = {µ1 ; λ2 , · · · , λn },
(26)
т.е. матрица (23) с числом ρ1 , определяемым из (25), решает e0 , eb; λ1 |µ1 }-задачу. {A Отсюда легко следует, что и матрица s1 = (Q∗0 )−1 se1
(27)
решает исходную {A, b; λ1 |µ1 }-задачу. Действительно, матрицу ∗ e1 = A e0 + ebe A s1 можно представить так: ∗ e1 = Q−1 (A0 + be A s1 Q−1 0 0 )Q0 .
(28)
e1 подобна матрице Так как матрица A A1 = A0 + bs∗1 ,
(29)
где s1 – матрица (27), то из (26) и (28) получаем соотношение σ(A1 ) = {µ1 ; λ2 , · · · , λn }, которое, с учетом (29), совпадает с (20). При этом пара (A1 , b) полностью управляема, так как полностью управляема пара (A0 , b) (см. следствие 1 теоремы 1, § 1, гл.II). 2) {A1 , b; λ2 |µ2 }-задача: построить (n×m)-матрицу s2 такую чтобы σ(A1 + bs∗2 ) = {µ1 , µ2 ; λ3 , · · · , λn }.
(30)
124
Для решения этой задачи сначала сделаем некоторые преобразоe1 . Перестановкой 1-й и 2-й строк, 1-го вания подобия над матрицей A и 2-го столбцов поменяем местами µ1 и λ2 . Это равносильно умноe1 слева и справа на ортогональную матрицу жению матрицы A ¾ 0 1 0 ... 0 2 1 0 0 ... 0 T1 = 0 0 1 . . . 0 . .. .. .. . . .. . . . . . n−2 0 0 0 ... 1 | {z } | {z } 2
n−2
e1 T1 имеет тот же спектр, что и A1 , так как При этом матрица T1 A ∗ e1 подобна A1 . Далее, преобразуем T1 A e1 T1 = T1 = T1 и матрица A в подобную ей матрицу
T1−1
ee −1 e A 1 = P1 (T1 A1 T1 )P1 , (где P1 — неособая матрица), имеющую нижний треугольный вид (например, вещественную "нижнюю"жордановую нормальную форму): λ2 | 0 . . . 0 0 ee −1 e ... 0 A (31) 1 = Q1 A1 Q1 = ε21 | µ1 . . . . .. | .. . . .. 0 0 εn1 | εn2 . . . λn где Q1 = T1 P1 , а ε0ij (i = 2, · · · , n, 1 ≤ j < i) — числа равные 0 или 1. Пусть ª e eb11 | e eb12 1 e e eb = b = Q−1 1 ª e (32) n−1 , eb21 | e eb22 |{z } |{z } 1
m−1
125
e В (32) eb11 6= 0 в силу леммы 1, так как пара (A1 , b) и, следовательно, e1 , eb) полностью в силу следствия 2 теоремы 1, из § 1, гл.II пара (A управляема. ee e e Теперь решим, как и выше в п.1), {A 1 , b; λ2 |µ2 }-задачу. Ищем матрицу se2 такую, чтобы матрица e ee ee es∗ A 2 = A1 + be 2 приняла вид
ª µ2 | 0 1 ee A = ª 2 n−1 , g2 | A2 |{z} |{z} 1
(33)
(34)
n−1
где g2 — некоторая одностолбцовая матрица, а A2 — матрица, собственные значения которой суть µ1 ; λ3 , · · · , λn . Полагая ª ρ2 | 0 1 se2 = ª (35) n−1 , 0 | 0 |{z} |{z} 1
m−1
где ρ2 определяется из аналогичного (25) равенства ρ2 =
µ2 − λ2 e eb11
e (eb11 6= 0),
(36)
и используя (31) и (32) получим, что матрица (33) имеет вид (34), e где g2 = ε02 + ρ2eb21 0 µ1 0 ... 0 ε21 ε0 ... .. 21 λ3 0 ε2 = . , A2 = .. . .. .. . . . 0 εn1 0 0 εn1 . . . εnn−1 λn Из (34) следует, что ee σ(A 2 ) = {µ1 , µ2 ; λ3 , · · · , λn },
(37)
126
ee e e т.е. матрица (35) с ρ2 из (36) дает решение {A 1 , b; λ2 |µ2 }-задачи, откуда в свою очередь следует решение {A1 , b; λ2 |µ2 }-задачи. Действительно, из (33), с учетом (31), (32), (28) и (22), имеем ee −1 e es∗ Q−1 )Q1 = A 2 = Q1 (A1 + be 2 1 ∗
∗
−1 −1 = Q−1 s1 Q−1 s2 Q−1 1 Q0 (A0 + be 0 + be 1 Q0 )Q0 Q1 = = (Q0 Q1 )−1 (A1 + bs∗2 )(Q0 Q1 ), где A1 — матрица, определяемая (29), а
(38)
s2 = (Q∗1 Q∗0 )−1 se2 . ee Так как в силу (38) матрицы A 2 и A2 = A1 + bs∗2 ,
(39)
где A1 — матрица, определяемая (29), подобны, то с учетом (37) получаем σ(A2 ) = {µ1 , µ2 ; λ3 , · · · , λn }, т.е. для матрицы (39) имеет место соотношение (30). Из равенств (39) и (29) имеем A2 = A0 + b(s1 + s2 )∗ , причем пара (A2 , b) полностью управляема, поскольку полностью управляема пара (A0 , b). Продолжая этот процесс решения соответствующих {Ai , b; λi+1 |µi+1 }-задач (i = 0, · · · , n − 1), последовательно заменим каждое собственное значение λj (j = 1, · · · , n) матрицы A0 на соответствующее число µj из заданного набора {µj }nj=1 , получая при этом последовательно матрицы A1 = A0 + bs∗1 , A2 = A0 + b(s1 + s2 )∗ , · · · , An = = A0 + b(s1 + · · · + sn )∗ ,
(40)
где s1 = (Q∗0 )−1 se1 , s2 = (Q∗1 Q∗0 )−1 se2 , · · · , sn = (Q∗n−1 · · · Q∗0 )−1 sen , ª ρj | 0 1 sej = ª µj − λj , ρ = , j n − 1 (j) 0 | 0 b11 |{z} |{z} 1
m−1
(41)
(42)
127
b(j)
(j) (j) ª b11 | b12 1 = (Q0 · · · Qj−1 )−1 b = ª (j) (j) n−1 b | b 21
22
1
m−1
(j)
(b11 6= 0),
|{z} |{z} (43) e (1) e (2) ( в п. 1) и 2) b(1) = eb, b(2) = eb; b11 = eb11 , b11 = eb11 ). При этом очевидно, что для матрицы An из (40) будем иметь σ(An ) = {µ1 , · · · , µn }. Положим s = r0 + Тогда с учетом того, что A0 = A +
n X
sj .
j=1 Br0∗ ,
(44)
(45)
из (44) и (40) получаем
σ(A + bs∗ ) = {µ1 , . . . , µn }, где s – матрица (45). Теорема о стабилизации полностью доказана. Замечание 1. В ходе доказательства теоремы о стабилизации дан конструктивный метод построения стабилизирующей матрицы s. Замечание 2. Полная управляемость системы является (как это следует из доказанной выше теоремы о стабилизации) достаточным условием для ее стабилизируемости, но вовсе не необходимым. Например, система (1), где A — гурвицева матрица, а b = 0, стабилизируема, но неполностью управляема. Замечание 3. Имеются и другие доказательства теоремы о стабилизации (см.[4,54,70,71,73,147]). Однако, все эти доказательства для векторного (когда число m управляющих воздействий больше единицы) и вещественного случая достаточно громоздки. Приведенное выше доказательство теоремы о стабилизации следует работе [99]. § 5. Проблема управления спектром матрицы В § 4 нами доказано, что для произвольных вещественных матриц A и b таких, что пара (A, b) полностью управляема, и произвольного
128
набора {µj }nj=1 вещественных чисел µj существует такая вещественная матрица s, что спектр σ(A + bs∗ ) матрицы A + bs∗ совпадает с набором {µj }nj=1 . В связи с этим возникает следующая задача — так называемая проблема управления спектром матрицы: даны произвольные вещественные матрицы A и b (порядков n × n и n × m соответственно) и произвольный набор {µj }nj=1 чисел µj ∈ C такой, что вместе с (комплексным) числом µj в этот набор входит и комплексно–сопряженное число µ ¯j ; требуется найти вещественную матрицу s (порядка n×m) такую, чтобы σ(A + bs∗ ) = {µ1 , · · · , µn }. (1) Сформулированная выше задача (и более общая задача, когда матрицы A и b — комплексные, а {µj }nj=1 — произвольный набор комплексных чисел) имеет решение (см., например,[4,54,70,71,73,147] ). Однако, следует отметить, что все доказательства соответствующего утверждения достаточно громоздки для случая m > 1. Здесь мы приведем решение проблемы управления спектром для случая m = 1, когда доказательство существования соответствующей матрицы s относительно простое. Теорема (oб управлении спектром матрицы). Пусть A — произвольная вещественная матрица порядка n×n и b — одностолбцовый вектор: b ∈ Rn . Тогда проблема управления спектром мартрицы A разрешима тогда и только тогда, когда пара (A, b) полностью управляема. Д о к а з а т е л ь с т в о . Необходимость. Предположим противное, т.е. что пара (A, b) неполностью управляема. Тогда в силу свойства (V IIIу ) теоремы 1 из § 1, гл.II существует такая неособая матрица Q, что имеют место представления µ ¶ ¶ µ b } n1 A11 A12 } n1 −1 −1 Q b= 1 Q AQ = b2 } n2 , A21 A22 } n2 (2) |{z} |{z} n1
n2
где либо A21 = 0,
b2 = 0,
(3)
A12 = 0,
b1 = 0.
(4)
либо
129
Пусть s ∈ Rn — произвольный вектор. Обозначим A1 = A + bs∗ .
(5)
∗ e1 = A e + ebe A s ,
(6)
e = Q−1 AQ, eb = Q−1 b, A e1 = Q−1 A1 Q, se∗ = s∗ Q0 . A
(7)
Очевидно, что где
∗
Представляя se в виде
∗
∗
∗
se = (e s1 , se2 ), n n 1 2 где se1 ∈ R , se2 ∈ R , и используя равенства (2), из (6), (7) получаем µ ∗ ∗¶ e1 = A11 + b1 se1∗ A12 + b1 se2∗ , (8) A A21 + b2 se1 A22 + b2 se2 где либо в силу (3) ∗
∗
A21 + b2 se1 = 0, A22 + b2 se2 = A22 , либо в силу (4) ∗
∗
A11 + b1 se1 = A11 , A12 + b1 se2 = 0. Поэтому из представления (8) матрицы A следует, что либо ∗
e1 ) = σ(A11 + b1 se1 ∪ σ(A22 ), σ(A либо
∗
e1 ) = σ(A11 ) ∪ σ(A22 + b2 se2 ) σ(A
(9) (10)
соответственно. Из (9) и (10) видно, что на собственные числа матрицы A22 (в случае (3)) и матрицы A11 (в случае (4)) выбор матрицы–столбца s не e1 и, значит, матрица A1 из (5) не влияет. Следовательно, матрица A может иметь произвольно заданный набор {µj }nj=1 чисел, фигурирующий в проблеме управления спектром матрицы A и, тем самым, соотношение (1) не может быть выполнено ни при каком s ∈ Rn . Таким образом, если проблема управления спектром матрицы A разрешима, то необходимо выполнено соотношение (1). Достаточность. Пусть пара (A, b) полностью управляема. Докажем, что для любого вещественного многочлена f (p) = pn + c1 pn−1 + · · · + cn
(cj ∈ R, j = 1, · · · , n)
130
существует вещественная одностолбцовая матрица s такая, что характеристический многочлен матрицы A + bs∗ совпадает с многочленом f (p): det [pI − (A + bs∗ )] = f (p). (11) Отсюда, очевидно, будет следовать достаточность условия теоремы. Обозначим (I — единичная (n × n)-матрица): Ap = pI − A,
∆(p) = det Ap .
Пусть ∆(p) = pn + δ1 pn−1 + · · · + δn
(δj ∈ R, j = 1, · · · , n).
Наша задача — найти такой вектор s ∈ Rn , чтобы выполнялось равенство (11). Используя лемму (для случая m = 1 и c = I) из § 4 настоящей главы, запишем равенство (11) в виде ∆(p)(1 + s∗ A−1 p b) = f (p).
(12)
Поскольку элементами обратной матрицы A−1 p являются дроби, в числителях которых стоят определители (n−1)-го порядка и, значит, многочлены степени не выше n − 1, а в знаменателях — многочлен n-й степени ∆(p), то векторный многочлен A−1 p b можно представить в виде 1 A−1 (d1 pn−1 + d2 pn−2 + · · · + dn ), (13) p b= ∆(p) где d1 , d2 , · · · , dn−1 — вещественные постоянные векторы. С учетом (13), равенство (12) принимает вид s∗ (d0 pn−1 + d1 pn−2 + · · · + dn−1 ) = f (p) − ∆(p).
(14)
Очевидно, в правой части равенства (14) стоит многочлен степени n − 1, т.е. f (p) − ∆(p) = r1 pn−1 + r2 pn−2 + · · · + rn−1 , где rj = cj − δj (j = 1, · · · , n). Поэтому уравнение (14) равносильно следующей системе уравнений относительно координат вектора s: s∗ d1 = r1 , s∗ d2 = r2 , · · · , s∗ dn = rn .
(15)
131
Так как пара (A, b) по условию полностью управляема, то в силу свойства IVу теоремы 1 из § 1, гл.II, ранг матрицы (d∗1 , d∗2 , · · · , d∗n ) системы уравнений (25) равен n, и, тем самым, det (d∗1 , d∗2 , · · · , d∗n ) 6= 0. Следовательно, система уравнений (15) относительно вектора s имеет единственное решение в Rn . Таким образом, однозначно определяется вещественный вектор s ∈ Rn , удовлетворяющий соотношению (11). Тем самым, теорема полностью доказана. § 6. Критерий Найквиста Одним из эффективных критериев стационарной стабилизации линейных систем является критерий Найквиста. Рассмотрим линейную систему x˙ = Ax + bu,
y = c∗ x (x ∈ Rn , u ∈ Rm , y ∈ R` ),
(1)
где A, b, c — постоянные матрицы (порядков (n × n), (n × m), (n × `) соответственно). Требуется найти такую обратную связь u = s∗ y,
(2)
где s — постоянная (` × m)-матрица, чтобы замкнутая система (1), (2) была асимптотически устойчивой. Пусть W (p) — передаточная функция (значения которой суть матрицы порядка ` × m) системы (1) (от входа u к выходу (−y)) W (p) = c∗ (A − pIn )−1 b, (где In — единичная (n × n)-матрица). Пусть, далее, ∆p (p) = det (pIn − A), ∆з (p) = det [pIn − (A + bs∗ c∗ )] — характеристические многочлены матриц A (разомкнутой системы) и A + bs∗ c∗ (замкнутой системы). Следующая лемма устанавливает связь между многочленами ∆р (p) и ∆з (p). Лемма. Имеет место соотношение ∆з (p) = ∆р (p) det(Im + s∗ W (p))
(3)
132
Д о к а з а т е л ь с т в о. Используя следствие из леммы (см. §2, гл. II), получим ∆з (p) = det (pIn − A) · det [In + (A − pIn )−1 bs∗ c∗ ] = = ∆р (p) · det [Im + s∗ c∗ (A − pIn )−1 b] = = ∆р (p) · det (Im + s∗ W (p)). Лемма доказана. Предположим, что как у разомкнутой системы, так и у замкнутой системы характеристические многочлены ∆р (p) и ∆з (p) не имеют корней на мнимой оси. Тогда из формулы (3) следует, что det [Im + s∗ W (iω)] 6= 0 при − ∞ < ω < +∞.
(4)
Следовательно, мы можем определить число k0 (целое) так: k0 =
1 +∞ · ∆ Arg det (Im + s∗ W (iω))|−∞ , 2π
(5)
где A Arg det(·)|+∞ −∞ обозначает приращение функциии ϕ(ω) = Arg det (Im + s∗ W (iω)) при изменении ω от −∞ до +∞ (под Arg z понимается некоторая непрерывная ветвь многозначной функции arg z + 2πk, k ∈ Z, arg z — главное значение аргумента: −π < arg z ≤ π). Обозначим через kр и kз числа собственных значений матриц A и A + bs∗ c∗ , расположенных в правой полуплоскости с учетом их кратностей. Числа kр и kз называются степенями неустойчивости соответственно разомкнутой и замкнутой систем. Теорема. Пусть матрицы A и A + bs∗ c∗ не имеют собственных значений на мнимой оси. Тогда справедливо соотношение kз = kр − k0 .
(6)
133
Д о к а з а т е л ь с т в о. Применим к обеим частям равенства (3) формулу Эрмита—Михайлова (её применимость обеспечивается неравенством (4) и условиями теоремы). В результате получим π(n − 2kз ) = π(n − 2kр ) + 2πk0 , т.е. kз = kр − k0 . Теорема доказана. Из формулы (6) следует Критерий Найквиста. Замкнутая система (1), (2) асимптотически устойчива тогда и только тогда, когда kр = k0 .
(7)
При m = 1 и ` = 1, т.е. когда вход u и выход y являются скалярными функциями (тогда и s∗ — тоже скаляр), условие (4) означает, что точка −(s∗ )−1 не лежит на годографе частотной характерстики W (iω). Число k0 , определяемое формулой (5), есть число оборотов против часовой стрелки вектора [(s∗ )−1 + W (iω)], начало которого находится в точке −(s∗ )−1 , а конец — на годографе W (iω), или, что то же самое, число оборотов годографа W (iω) вокруг точки −(s∗ )−1 при изменении ω от −∞ до +∞. По критерию Найквиста замкнутая система (1), (2) асимптотически устойчива в том и только в том случае, если k0 = kp . В этом и состоит геометрическая интерпретация критерия Найквиста при m = ` = 1 (рис.10).
134
Рис.10. К геометрической интерпретации критерия Найквиста (m = ` = 1) : k0 = 1.
Основная ценность критерия Найквиста состоит в том, что он позволяет судить об устойчивости замкнутой системы (1), (2) только по частотной характеристике W (iω) системы (1), если даже неизвестно аналитическое выражение для функции W (p).
§ 7. Стабилизируемость полностью наблюдаемой системы в терминах разрешимости матричного уравнения Лурье-Риккати 1. Постановка задачи Рассмотрим линейную систему x˙ = Ax + bu,
y = c∗ x (x ∈ Rn , u ∈ Rm , y ∈ R` ),
(1)
где A, b и c — вещественные постоянные матрицы порядков n × n, n × m и n × ` соответственно. В § 5 мы рассмотрели возможность стабилизируемости системы (1) в случае, когда выходом y системы (1) является вектор состояния x, т.е. y = x (c = I — единичная (n × n)-матрица). При этом стабилизирующее управление u было построено по принципу полной обратной связи: u = s∗ x, где s — вещественная (n × m)-матрица, так что замкнутая система x˙ = (A + bs∗ )x,
x ∈ Rn
была асимптотически устойчивой (т.е. матрица A + bs∗ — гурвицевой). Для этого достаточным условием стабилизируемости системы (1) (или пары (A, b)) являлась ее полная управляемость. Здесь мы рассмотрим вопрос о стабилизируемости системы (1) в общем случае, когда матрица c не является единичной, т.е. когда c 6= I (выходом системы (1) является не сам вектор состояния x, а его проекции на ` линейно–независимых направлений c1 , · · · , c` , где ck ∈ Rn (k = 1, · · · , `) — столбцы матрицы c). Мы будем строить управление u по принципу неполной обратной связи u = s∗ y
(y ∈ R` ),
(2)
135
где s — вещественная постоянная (` × m)-матрица, так, чтобы замкнутая система (1), (2), т.е. система x˙ = (A + bs∗ c∗ )x (x ∈ Rn ) была асимптотически устойчивой. Другими словами, наша задача — стабилизировать тройку (A, b, c), т.е. найти вещественную (` × m)-матрицу s такую, чтобы матрица A + bs∗ c∗ была гурвицевой. Прежде чем приступить к решению сформулированной выше задачи, мы сначала докажем два вспомогательных предложения. 2. Вспомогательные утверждения. Следующая лемма хорошо известна. Лемма 1. (Лемма А.М.Ляпунова.) Пусть A — гурвицева (n × n)-матрица, а G — произвольная симметрическая матрица (G∗ = G). Тогда матричное уравнение A∗ X + XA = G
(X ∗ = X)
(3)
относительно симметрической (n × n)-матрицы X имеет и притом единственное решение +∞ Z ∗ X=− eA t GeAt dt.
(4)
0
Если G ≤ 0, то X ≥ 0, причем, при G < 0, X > 0. (Условимся считать, что некоторая матрица Q ≥ 0 или Q ≤ 0, если соответствующая ей квадратичная форма x∗ Qx ≥ 0 или x∗ Qx ≤ 0 для любого вектора x; аналогично, Q > 0 (Q < 0), если x∗ Qx > 0 (x∗ Qx < 0) для любого вектора x 6= 0). Д о к а з а т е л ь с т в о . По лемме об оценке нормы матричной экспоненты (см. § 2, гл.I) имеем keAt k ≤ Gε e(α+ε)t ∀ t ∈ [0, +∞),
(5)
где α = max Re λj (A), λj (A) (j = 1, · · · , n) — собственные числа матj
рицы A, ε — любое положительное число, а Cε — некоторая положительная константа. Так как по условию A — гурвицева и, следовательно, λj (A) < 0 (j = 1, · · · , n), то в силу произвольности ε > 0
136
можно считать α + ε < 0. Тогда, очевидно, из оценки (5) следует, что интеграл (4) сходится. Непосредственной подстановкой выражения (4) в (3) легко проверяется, что (4) — решение уравнения (3). Действительно, учитывая соотношение d A∗ t At ∗ ∗ (e Ge ) = A∗ (eA t GeAt ) + (eA t GeAt )A, dt получаем +∞ +∞ Z Z ∗ ∗ ∗ A∗ t At A X + XA = − A (e Ge ) dt − (eA t GeAt )A dt = 0 +∞ Z
=− 0
0
d A∗ t At ∗ (e Ge ) dt = −eA t GeAt |+∞ = G. 0 dt
Покажем теперь, что решение (4) уравнения (3) единственное. Предположим противное. Пусть Y — другое, отличное от X, решение уравнения (3). Тогда для матрицы Z =Y −X имеем
A∗ Z + ZA = 0. Рассматривая квадратичную форму
(6)
F (x) = x∗ Zx, x ∈ Rn , и вычисляя ее производную F˙ в силу системы x˙ = Ax,
(7)
на основании (6) получаем F˙ = x˙ ∗ Zx + x∗ Z x˙ = x∗ A∗ Zx + x∗ ZAx = x∗ (A∗ Z + ZA)x = 0, т.е.
d F (x(t)) = 0 (∀ t ≥ 0), (8) dt где x(t) — решение уравнения (7) с начальным условием x(0) = x0 , x0 ∈ Rn . Из равенства (8) имеем F (x(t)) ≡ F (x0 ).
(9)
137
Поскольку A — гурвицева матрица, то любое решение уравнения (7) стремится к нулю: limt→∞ x(t) = 0 (это следует из формулы x(t) = eAt x0 для решения уравнения (7)). Поэтому из (9) получаем: F (x0 ) = 0 ∀ x0 ∈ Rn , т.е. x∗0 Zx0 = 0 ∀ x0 ∈ Rn . Отсюда в силу произвольности вектора x0 заключаем, что Z = 0, т.е. Y = X. Таким образом, решение (4) уравнения (3) единственно. Если G ≤ 0, т.е. ξ ∗ Gξ ≤ 0 для любого вектора ξ, то из (4) имеем +∞ Z ξ ∗ Xξ = − (eAt ξ)∗ G(eAt ξ) dt ≥ 0,
(10)
0
т.е. X ≥ 0. Если же G < 0, то с учетом того, что матричная экспонента eAt — неособая матрица (см. следствие леммы 2, из § 2, гл.I ), будем иметь: (eAt ξ)∗ G(eAt ξ) < 0
∀ ξ 6= 0.
Отсюда и из (10) получаем ξ ∗ Xξ > 0 т.е. X > 0. Лемма 1 доказана. Лемма 2. Пусть (n × n)-матрицы A и H, где H = H ∗ , удовлетворяют матричному неравенству A∗ H + HA ≤ −cc∗ ,
(11)
где c — (n×`)-матрица, причем, пара (A, c) полностью наблюдаема. Тогда: 1) матрица A не имеет собственных значений на мнимой оси; 2) матрица A гурвицева тогда и только тогда, когда H > 0. Д о к а з а т е л ь с т в о . 1) Покажем, что матрица A не имеет собственных значений на мнимой оси. Предположим противное: пусть λ0 = iω, (ω ∈ R) — собственное значение матрицы A, а ξ0 6= 0 — соответствующий ему собственный вектор, т.е. Aξ0 = λ0 ξ0 . Тогда вектор-функция ξ(t) = ξ0 eiωt
(12)
138
будет решением уравнения x˙ = Ax (x ∈ Rn ).
(13)
Рассмотрим квадратичную форму V (x) = x∗ Hx и найдем ее производную в силу системы (13). Имеем V˙ = x∗ (A∗ H + HA)x.
(14)
Так как V (ξ(t)) ≡ ξ0∗ Hξ0 = V (ξ0 ), то
dV (ξ(t)) ≡ 0. (15) dt Из матричного неравенства (11) (записанного в виде неравенства соответствующих квадратичных форм) и соотношений (14) и (15) получим 0 ≡ ξ(t)∗ (A∗ H + HA)ξ(t) ≤ −(c∗ ξ0 )∗ (c∗ ξ0 ). (16) Отсюда, с учетом того, что правая часть неравенства (16) неположительна, имеем c∗ ξ0 = 0. (17) Очевидно, что для матрицы B = (A − λ0 I, c∗ ) в силу (12) и (17) справедливо равенство Bξ0 = 0. Отсюда следует, что rank B < n, поскольку ξ0 6= 0. С другой стороны, поскольку пара (A, c) по условию полностью наблюдаема, то по теореме двойственности Калмана (см. § 3, гл.II) пара (A∗ , c) будет полностью управляемой и, следовательно, по свойству (V IIу ) теоремы 1 из § 1, гл.II будем иметь: rank (A − pI, c∗ ) = rank (A∗ − pI, c) = n для любого p ∈ C. Полученное противоречие доказывает утверждение 1) леммы. 2) Пусть A — гурвицева матрица. Возьмем произвольный вектор x0 ∈ Rn . Тогда x(t, x0 ) = eAt x0
139
— решение уравнения (13) с начальным условием x(0) = x0 . Используя оценку нормы экспоненты (см. лемму 2 из § 2, гл.I), будем иметь: lim x(t, x0 ) = 0.
t→+∞
(18)
Учитывая неравенство (11), оценим производную V˙ из (14) (где V = x∗ Hx): V˙ ≤ −kc∗ xk2 . (19) Интегрируя неравенство (19) в пределах от t = 0 до t = ∞ вдоль решения x(t) и учитывая соотношение (18), получим +∞ Z x0 Hx0 = V (x0 ) ≥ kc∗ x(t, x0 )k2 dt.
(20)
0
c∗ x(t, x
Заметим, что 0 ) 6≡ 0. Действительно, в противном случае имели бы x∗0 exp(A∗ t)c ≡ 0, что в силу свойства (IIу0 ) теоремы о критериях управляемости (см. § 1, гл.II) означало бы неполную управляемость пары (A∗ , c) или в силу теоремы о двойственности Калмана неполную наблюдаемость пары (A, c), что противоречит условию леммы 2. Следовательно, правая часть неравенства (20) положительна для любого x0 6= 0. Отсюда следует, что H > 0. Обратно, пусть H > 0. Покажем, что тогда A — гурвицева. Пусть λ — произвольное собственное значение матрицы A, а ξ 6= 0 — соответствующий ему собственный вектор, т.е. Aξ = λξ. Отсюда имеем: ξ ∗ (A∗ H + HA)ξ = (Aξ)∗ Hξ + ξ ∗ H(Aξ) = 2(Re λ)ξ ∗ Hξ.
(21)
Из неравенства (11), учитывая (21), получаем 2(Re λ)ξ ∗ Hξ ≤ −kc∗ ξk2 ≤ 0.
(22)
Так как ξ ∗ Hξ > 0, то из (22) имеем Re λ ≤ 0. Отсюда и из доказанного выше утверждения 1) леммы 2 следует, что Re λ < 0, т.е. матрица A — гурвицева. Лемма 2 доказана. 3. Теорема о стабилизируемости тройки (A, b, c) в терминах разрешимости специального уравнения Лурье-Риккати. Докажем сначала теорему дающую необходимое условие стабилизируемости системы (1).
140
Теорема 1 (необходимое условие стабилизируемости тройки (A, b, c)([237])).Пусть система (1) стабилизируема. Тогда: 1) пары (A, b) и (A∗ , c) стабилизируемы; 2) существуют вещественные (` × m)- и (m × n)-матрицы s и g соответственно, такие, что s∗ c∗ + b∗ H = g,
(23)
H∗
где H = — вещественная неотрицательно определенная (n × n)матрица, являющаяся решением матричного уравнения A∗ H + HA − Hbb∗ H + cc∗ + g ∗ g = 0.
(24)
Д о к а з а т е л ь с т в о . Пусть система (1) стабилизируема. Тогда существует вещественная (` × m)-матрица s такая, что матрица A + bs∗ c∗ гурвицева. Отсюда следует, что пары (A, b) и (A∗ , c) стабилизируемы со стабилизирующими матрицами s∗1 = s∗ c∗ и s∗2 = sb∗ , т.е. выполняется условие 1) теоремы 1. Так как матрица A+bs∗ c∗ гурвицева, то по лемме 1 (А.М.Ляпунова) существует симметрическая матрица H = H ∗ > 0 такая, что (A + bs∗ c∗ )∗ H + H(A + bs∗ c∗ ) = −cc∗ − css∗ c∗ .
(25)
Равенство (25) можно переписать так A∗ H + HA − Hbb∗ H + cc∗ + (s∗ c∗ + b∗ H)∗ (s∗ c∗ + b∗ H) = 0. Отсюда, положив g = s∗ c∗ + b∗ H, получим, что выполнено условие 2) теоремы 1. Теорема 1 доказана. Замечание. Уравнение (24) (квадратное относительно матрицы H ) называется во многих работах по теории управления матричным алгебраическим уравнением Риккати. Очевидно, что уравнению (24) удовлетворяют стационарные решения дифференциального уравнения dH = −Hbb∗ H + (A∗ H + HA) + (cc∗ + gg ∗ ), dt которое по аналогии с обычным дифференциальным уравнением Риккати называют матричным дифференциальным уравнением Риккати. Следующая теорема дает достаточное условие стабилизируемости системы (1).
141
Теорема 2 (о стабилизируемости тройки (A, b, c)).Пусть матрицы A, b и c в системе (1) удовлетворяют следующим условиям: 1) пара (A, b) стабилизируема, а пара (A, c) полностью наблюдаема; 2) существуют вещественные соответственно (`×m)- и (m×n)матрицы s и g, удовлетворяющие соотношениям (23), (24), где H = H ∗ — вещественная положительно определенная матрица. Тогда система (1) стабилизируема. Д о к а з а т е л ь с т в о . Из соотношений (23) и (24), очевидно, следует, что выполнено равенство (25). Отсюда, поскольку css∗ c∗ ≥ 0, получаем неравенство (A + bs∗ c∗ )∗ H + H(A + bs∗ c∗ ) ≤ −cc∗ .
(26)
Так как пара (A, c) полностью наблюдаема, то по теореме двойственности Калмана пара (A∗ , c) и, следовательно, в силу следствия 1 теоремы о критериях управляемости (см. § 1, гл.II) пара (A∗ + csb∗ , c) будет полностью управляемой. Поэтому по той же теореме двойственности Калмана полностью наблюдаемой будет пара (A + bs∗ c∗ , c). Отсюда и из неравенства (26) в силу леммы 2 следует, что A + bs∗ c∗ гурвицева, так как H > 0. Последнее означает, что тройка (A, b, c) стабилизируема. Теорема 2 доказана. Замечание 1. Условия теоремы 2 являются лишь достаточными, но не необходимыми. В работе [237] показано, что условия теоремы 1 являются и достаточными для стабилизируемости системы (1). Как это видно из сравнений условий теорем 1 и 2, условия теоремы 2 несколько более стеснительны, чем условия теоремы 1: вместо стабилизируемости пары (A∗ , c) и неотрицательной определенности матрицы H (в теореме 1) требуется соответственно полная наблюдаемость пары (A, c) и положительная определенность матрицы H (в теореме 2). Замечание 2. Левая часть равенства (25) определяет, очевидно, линейный оператор K в (линейном) пространстве эрмитовых матриц {H} (H ∗ = H): K(H) = (A + bs∗ c∗ )∗ H + H(A + bs∗ c∗ ). В силу леммы 1 (леммы А.М.Ляпунова) уравнение K(H) = G однозначно разрешимо при любой матрице G = G∗ , поскольку A+bs∗ c∗
142
— гурвицева матрица. Поэтому оператор K обратим. Обозначим через L — линейный оператор, обратный к K : L = K−1 . Тогда решение H уравнения (25) можно записать так: H = −L(cc∗ ) − L(css∗ c∗ ). Подставляя это значение H в уравнение (23) (предварительно сделав операцию транспонирования в обеих его частях) получим квадратное уравнение относительно (` × m)-матрицы (cs): L(css∗ c∗ )b − cs = −g ∗ − L(cc∗ )b. (В таком виде записывались так называемые разрешающие уравнения Лурье в векторной форме [3,49,102,103,105]). Таким образом, уравнения (25), (23), а значит, и уравнения (24), (23) сводятся к уравнениям Лурье-Риккати. Очевидно, верно и обратное. В [105] и др. были получены условия разрешимости уравнений Лурье в случаях m = 1, ` = 2, 3, 4, 5. С использованием этих уравнений были найдены решения многих практически важных задач. Для общего случая условием разрешимости уравнений Лурье является так называемое "частотное"условие Якубовича-Калмана [54], которое в случае линейных систем вида (1) совпадает с критерием Найквиста. Замечание 3. Проблема стационарной стабилизации линейных систем вида (1) является одной из самых важных вопросов в теории управления при синтезе линейной обратной связи, поскольку одним из достоинств решения этой проблемы является его аналитически замкнутая форма. Поэтому этой проблеме посвящено большое количество работ, обзор которых можно найти, например, в статьях [196,282] . § 8. Стабилизируемость неполностью управляемых систем В § 4 настоящей главы мы доказали теорему о стабилизации пары (A, b) в предположении её полной управляемости. Приведем теперь теорему, дающую достаточное условие стабилизируемости системы x˙ = Ax + bu,
x ∈ Rn , u ∈ Rm
(1)
(где A и b — постоянные (n × n)- и (n × m)-матрицы соответственно) в случае, когда пара (A, b) не является полностью управляемой. Пусть среди n корней λ1 , · · · , λn (каждый корень выписывается столько раз, какова его кратность) характеристического уравнения
143
det (pI − A) = 0 имеются ровно k таких, у которых вещественные части неотрицательны (а у остальных n − k корней— отрицательны). Тогда систему (1) невырожденным линейным преобразованием переменных x = Qy (y ∈ Rn , Q — неособая матрица) можно привести к виду (за матрицу Q достаточно взять матрицу, приводящую A к вещественной жордановой нормальной форме): ( e1 y1 + eb1 u, y˙ 1 = A e2 y2 + eb2 u, y˙ 2 = A
y1 ∈ Rk , y2 ∈ Rn−k ,
где µ ¶ e1 0 A −1 e≡ A e2 = Q AQ, 0 A
u ∈ Rm ,
à ! e eb ≡ b1 , eb2
(20 ) (200 )
(3)
e1 — (k × k)-матрица, все собственные причем eb1 ∈ Rk , eb2 ∈ Rn−k , A e2 — числа которой имеют неотрицательные вещественные части, а A гурвицева матрица порядка (n − k) × (n − k); eb1 и eb2 — матрицы порядков k × m и (n − k) × m соответственно. Теорема (о стабилизируемости неполностью управляемой системы). Пусть в системе (20 ), (200 ) e1eb1 , · · · , A ek−1eb1 ) = k < n. rank (eb1 , A 1 Тогда система (1) стабилизируема. Д о к а з а т е л ь с т в о . По теореме о стабилизации из § 5, примененной к подсистеме (20 ) системы (20 ),(200 ) существует (вещеe1 +eb1 se∗ гурвицева, ственная) (k×m)-матрица se1 такая, что матрица A 1 ∗ а u = se1 y1 есть стабилизирующее управление для подсистемы (20 ). При таком управлении матрица (полной) системы (20 ), (200 ) имеет вид ¾ e1 + eb1 se∗ | 0 A k 1 ¾ B = . (4) ∗ n-k eb2 se | A2 1 | {z } |{z} k
n-k
144
Характеристический многочлен этой матрицы по теореме Лапласа о разложении определителя по k строкам можно записать так: e1 + eb1 se∗1 )] · det (pI − A e2 ). det (pI − B) = det [pI − (A e1 + eb1 se∗ и A e2 гурвицевы, то в силу последнего Так как матрицы A 1 равенства и матрица B тоже будет гурвицевой. Таким образом, управление ∗
u = se0 y, где
se∗0 = ( se∗1 , 0 ) |{z} |{z}
(5)
k
n−k матрицы se∗1
(e s∗0
— матрица, полученная из дополнением её до (m×n)матрицы нулевой матрицей порядка m × (n − k) является стабилизирующей для всей системы (20 ),(200 )). Чтобы построить стабилизирующее управление для исходной системы (1), перепишем матрицу (4) так: e + ebe B=A s∗ . (6) 0
С учетом равенств (3), представим матрицу (6) в виде B = Q−1 AQ + Q−1 be s∗0 = Q−1 (A + be s∗0 Q−1 )Q.
(7)
Поскольку матрица B гурвицева и, в силу (7), матрицы B и C = A + bs∗ , где
s = (Q∗ )−1 se0 , (8) подобны, то матрица C тоже гурвицева (e s∗0 — матрица (5)). Последнее означает, что пара (A, b) стабилизируема, причем стабилизирующее управление имеет вид u = s∗ x, где s — матрица (8).
145
ГЛАВА IV НЕСТАЦИОНАРНАЯ НИЗКОЧАСТОТНАЯ СТАБИЛИЗАЦИЯ ЛИНЕЙНЫХ СИСТЕМ В следующих двух главах мы будем рассматривать задачу нестационарной линейной стабилизации (соответственно низкочастотной и высокочастотной). § 1. Постановка задачи. Проблема Брокетта Рассмотрим линейную систему x˙ = Ax + bu, y = c∗ x, x ∈ Rn , u ∈ Rm , y ∈ R` ,
(1)
где A, b и c вещественные постоянные (n × n)−, (n × m)− и (n × `)-матрицы соответственно. Р.Брокетт в книге [198] сформулировал следующую задачу: найти (`×m)-матрицу s(t) такую, чтобы система (1), замкнутая обратной связью u = s(t)∗ y,
(2)
была асимптотически устойчивой (в целом). Другими словами, проблема Брокетта формулируется так: дана тройка матриц A, b и c (порядков n × n, n × m и n × ` соответственно). Спрашивается при каких условиях существует матрица s(t) (порядка (` × m)) такая, что система x˙ = (A + bs(t)∗ c∗ )x
(x ∈ Rn )
(3)
является асимптотически устойчивой ? В предыдущей главе нами была рассмотрена задача стабилизации системы (1) с помощью постоянной матрицы s(t) ≡ s = const . В проблеме Брокетта требуется найти переменную стабилизирующую матрицу s = s(t), обладающую указанным выше свойством. Поэтому проблему Брокетта можно переформулировать следующим образом. Насколько введение зависимых от времени t матриц s(t) расширяет возможности стационарной стабилизации ? В задачах стабилизации механических систем часто оказывается необходимым рассматривать более узкий класс стабилизирующих
146
матриц s(t), а именно, периодические матрицы s(t), имеющие нулевое среднее на периоде [0, T ]: ZT s(t) dt = 0.
(4)
0
В настоящей главе рассматриваются алгоритмы построения периодических кусочно-постоянных функций s(t), решающих в ряде случаев проблему Брокетта. При изложении соответствующих результатов будем следовать работам [96,98,245–247]. § 2. Линейные системы дифференциальных уравнений с периодической матрицей Напомним основные факты из теории линейных уравнений с периодическими коэффициентами, которые нам понадобятся в дальнейшем. 1. Фазовые потоки. Понятие фазового потока и фазового пространства являются основными в теории дифференциальных уравнений. Рассмотрим линейную систему x˙ = A(t)x,
t ∈ R, x ∈ Rn
(1)
с кусочно-непрерывной на R периодической с периодом T > 0 матрицей A(t): A(t + T ) = A(t) ∀ t ∈ R. n Пространство R называется фазовым пространством, а прямое произведение Rn+1 = R × Rn — расширенным фазовым пространством системы (1). Пример. Уравнение маятника (при малых колебаниях и отсутствии трения) имеет вид x ¨ + ω 2 x = 0.
q g Частота ω определяется длиной маятника ` : ω = ` (g — ускорение свободного падения). Колебания маятника переменной длины описываются аналогичным уравнением: x ¨ + ω 2 (t)x = 0,
147
которое можно записать в виде системы (1): µ ¶ ½ 0 1 x˙ = x2 , , A(t) = . x˙ 2 = −ω 2 (t)x1 , −ω 2 (t) 0 (Примером маятника переменной длины являются качели.) В случае, когда в (1) матрица A(t) непрерывна, из общего курса дифференциальных уравнений известно, что решение x = ψ(t; x0 , t0 ) уравнения (1) существует, определяется начальным условием ψ(t0 ; x0 , t0 ) = x0 однозначно и зависит от t0 , x0 и t непрерывно, причем все решения уравнения (1) неограниченно продолжаемы вправо и влево, т.е. определены на всей оси (−∞, +∞). В случае, когда A(t) кусочно-непрерывна, а матрица-функция A(t) имеет точки разрыва первого рода (скачки), всю ось (−∞, +∞) можно разбить на счетное число интервалов Ik = (tk−1 , tk ) (k = 1, 2, · · · ), на каждом из которых матрица A(t) непрерывна и, следовательно, решения уравнения (1) определены на интервалах Ik (k = 1, 2, . . .). Далее, в точках разрыва tk , разделяющих интервалы непрерывности Ik , решения "склеиваются". А именно, пусть решение x = ψk (t) определено на Ik = (tk−1 , tk ). Тогда чтобы продолжить это решение на следующий интервал Ik+1 = (tk , tk+1 ), достаточно продолжить сначала решение ψk (t) до точки t = tk , затем взять на интервале Ik+1 то решение x = ψk+1 (t), которое удовлетворяет условию: ψk+1 (tk ) = ψk (tk ). Продолжая этот процесс вправо и, аналогично, влево, получим решение x = ψ(t) уравнения (1), определенное и непрерывное на всей оси (−∞, +∞). Причем это решение обладает теми же свойствами (единственности, непрерывной зависимости от начальных условий), что и в случае непрерывной матрицы A(t) (см.[155,214]). График решения x = ψ(t) системы (1) называется интегральной кривой, а образ отображения ψ : R → Rn — фазовой кривой или траекторией системы (1). Таким образом, траектория системы (1) лежит в фазовом пространстве Rn , а интегральная кривая — в расширенном фазовом пространстве Rn+1 . Пусть x = ψ(t; x0 , t0 ) (t ∈ R) — решение системы (1) с начальным условием ψ(t0 ; x0 , t0 ) = x0
(t0 ∈ R; x0 ∈ Rn ).
(2)
148
О п р е д е л е н и е 1. Преобразованием за время от t0 до t, осуществляемым траекториями системы (1), называется отображение фазового пространства Rn в себя, сопоставляющее начальному условию x0 в момент t0 значение решения x = ψ(t; x0 , t0 ) системы (1) в момент t (рис.10). Это преобразование обозначается так: gtt0 . Таким образом, gtt0 : Rn → Rn : gtt0 x0 = ψ(t; x0 , t0 ) ∀x0 ∈ Rn (t0 , t ∈ R)
(3)
Рис.11. Преобразование gtt0 за время от t0 до t.
Из формулы (3) следует, что, если отождествить каждую гиперплоскость t = t0 в расширенном фазовом пространстве с фазовым пространством Rn , то преобразование gtt12 (t1 , t2 ∈ R) можно рассматривать как отображение (осуществляемое интегральными кривыми системы (1)) гиперплоскости t = t1 в гиперплоскость t = t2 . О п р е д е л е н и е 2. Семейство преобразований {gtt0 , t0 ∈ R, t ∈ R} называется ф а з о в ы м п о т о к о м системы (1) с фазовым пространством Rn . Траектории системы (1) называются траекториями соответствующего ей фазового потока. Замечание. В частном случае, когда в системе (1) матрица A(t) постоянная: A(t) ≡ A (A = const ), преобразования gtt0 зависят лишь
149
от разности t − t0 и совпадают с преобразованием g0t−t0 за время от 0 до t − t0 : gtt0 = g0t−t0 (∀t0 , t ∈ Rn ). (4) Последнее равенство следует из теоремы единственности решений и того факта, что если x = ψ(t) — решение системы x˙ = Ax (A = const ) с начальным условием ψ(t0 ) = x0 , то x = ψ0 (t) ≡ ψ(t + t0 ) — решение этой системы с начальным условием ψ0 (0) = x0 (сдвиг решения вдоль оси t есть снова решение — свойство, которым обладают все решения систем дифференциальных уравнений, правые части которых не зависят от t (автономные системы)). Поэтому для системы x˙ = Ax (x ∈ Rn ) с постоянной матрицей A, в силу (4), можно говорить о преобразовании за время τ = t − t0 или (переобозначив τ → t ) за время t. Преобразование за время t, соответствующее системе (1) с постоянной матрицей A(t) ≡ A, будем обозначать через g t (без нижнего индекса 0), т.е. g t := g0t
(∀t ∈ R),
(5)
и соответственно ее фазовый поток — {g t , t ∈ R} или просто {g t }. 2. Примеры фазовых потоков простейших дифференциальных уравнений. 1. x˙ = 0. Фазовый поток есть g t x = x (x ∈ R). 2. x˙ = 1. Фазовый поток — g t x = x + t (x ∈ R). 3. x˙ = kx. Имеем x(t) = ekt x0 . Поэтому фазовый поток есть kt {e }; g t x = ekt x(∀ x ∈ R). 4. x˙ = y, y˙ = 0. Решение этой системы: x(t) = x0 + ty0 , y(t) = y0 . Поэтому фазовый поток — g t : (x, y) → (x + ty, y) ∀(x, y) ∈ R2 . 5. x˙ = y, y˙ = 1. Решение: x(t) = x0 + y0 t + t2/2, y(t) = y0 + t. Фазовый поток – g t : (x, y) → (x + ty + t2/2, y + t) ∀(x, y) ∈ R2 . 6. x˙ = y, y˙ = −x (уравнения малых колебаний маятника). Решение: ½ x(t) = x0 cos t + y0 sin t, y(t) = −x0 sin t + y0 cos t. Фазовым потоком являются повороты плоскости (x, y) на угол t (эллиптические повороты): µ ¶ cos t sin t t . g = − sin t cos t
150
(Здесь отображение g t отождествляется с матрицей, описывающей его в базисе e1 = (1, 0)∗ , e2 = (0, 1)∗ ). Для любой точки (x, y) ∈ R2 g t : (x, y) → (x cos t + y sin t, −x sin t + y cos t). Траекториями фазового потока являются окружности (аффинные образы эллипсов) — под действием фазового потока точки плоскости движутся по окружностям. 7. x˙ = y, y˙ = x (уравнение малых колебаний перевернутого маятника). Решение: t −t t −t x(t) = x0 e + e + y0 e − e = x0 ch t + y0 sh t, 2 −t 2 −t t t y(t) = x0 e − e + y0 e + e = x0 sh t + y0 ch t. 2 2 Здесь фазовым потоком являются гиперболические повороты: µ ¶ ch t sh t t g = sh t ch t (отображение g t отождествляется с описывающей его матрицей в базисе e1 = (1, 0)∗ , e2 = (0, 1)∗ ). Для любой точки (x, y) ∈ R2 g t : (x, y) → (xch t + ysh t, xsh t + ych t). Траекториями фазового потока являются гиперболы — под действием фазового потока точки плоскости движутся по гиперболам. Преобразование g t (гиперболический поворот) состоит из сжатия в et раз в направлении собственного вектора ξ1 , соответствующего собственному значению λ1 = −1 матрицы g t , и растяжения в et раз в направлении собственного вектора ξ2 , соответствующего собственному значению λ2 = 1. Заметим, что эллиптический и гиперболический повороты сохраняют площади (так как det g t = 1). Замечание . В вышеприведенных примерах гладкое векторное поле, заданное дифференциальным уравнением (или системой), определяло фазовый поток. Возникает вопрос, всякое ли гладкое векторное поле определяет фазовый поток ? Ответ — нет, не всякое. Контрпримером может служить уравнение: x˙ = x2 , x ∈ R. Решение этого уравнения: x(t) = x0/(1 − x0 t). Поэтому g t x = x/(1 − xt). Однако последняя формула не задает фазовый поток – отображение
151
g t определено не всюду: при x = 1/t оно не определено. Причина состоит в некомпактности пространства R. Но если компактифицировать R, дополнив его бесконечно удаленной точкой ∞, и продолжить поле v(x) = x2 гладко с аффиной прямой R на полученную проективную прямую RP, то гладкое векторное поле v(x) = x2 на RP уже определяет фазовый поток. Это следует из следующего общего утверждения [16]: всякое гладкое поле на компактном многообразии (каковым является RP) определяет фазовый поток. 3. Основные свойства фазового потока. Сначала приведем следующую основную теорему из теории линейных уравнений. Теорема 1 ([16]). Множество всех решений {ψ} системы (1) является линейным пространством, изоморфным фазовому пространству Rn этой системы. (Линейные пространства L1 и L2 называются изоморфными, если между их элементами можно установить взаимно–однозначное соответствие, которое согласовано с операциями в L1 и L2 т.е. из x1 ←→ x2 ,
y1 ←→ y2
(x1 , y1 ∈ L1 ; x2 , y2 ∈ L2 )
следует x1 + y1 ←→ x2 + y2 ,
cx1 ←→ cx2
(c — произвольное число).) Д о к а з а т е л ь с т в о т е о р е м ы 1. Первая часть утверждения теоремы очевидна: если ψ1 (t) и ψ2 (t) — решения системы (1), то d [c1 ψ1 (t) + c2 ψ2 (t)] = c1 ψ˙ 1 (t) + c2 ψ˙ 2 (t) = dt = c1 A(t)ψ1 (t) + c2 A(t)ψ2 (t) = A(t)[c1 ψ1 (t) + c2 ψ2 (t)]. Для доказательства второй части теоремы определим отображение Gt , сопоставляющее каждому решению ψ его значение в момент t ∈ R: Gt : {ψ} → Rn , Gt ψ = ψ(t). Очевидно, отображение Gt линейно, так как Gt (c1 ψ1 + c2 ψ2 ) = (c1 ψ1 + c2 ψ2 )(t) = = c1 ψ1 (t) + c2 ψ2 (t) = c1 (Gt ψ1 ) + c2 (Gt ψ2 ).
152
Образ отображения Gt есть все фазовое пространство Rn , поскольку по теореме сущнствования для любого x0 ∈ Rn существует решение ψ с начальным условием ψ(t0 ) = x0 . Далее, если решение ψ 6≡ 0, то значение Gt ψ 6= 0, т.е. ядро (прообраз нулевого элемента) линейного отображения Gt состоит только из нулевого решения ψ ≡ 0, так как по теореме единственности решений, из равенства Gt ψ = 0 будет следовать ψ ≡ 0. Таким образом, Gt есть линейный изоморфизм линейного пространства решений {ψ} на фазовое пространство Rn . Теорема 1 доказана. Следствие 1. Размерность линейного пространства решений системы (1) равна n. Следствие 2. Любая система (1) имеет n линейно независимых решений (как элементов линейного пространства {ψ}) ψ1 , · · · , ψn : ими являются любые решения, образующие базис линейного пространства {ψ}, а именно, решения ψj (j = 1, · · · , n) системы (1), удовлетворяющие начальным условиям, соответственно ψ1 (t0 ) = ε1 , · · · , ψn (t0 ) = εn , где {ε}nj=1 — произвольный базис в пространстве Rn . Система решений {ψj }nj=1 , т.е. базис пространства решений {ψ}, называется фундаментальной системой решений, а матрица, столбцами которой являются координаты решений ψj , называется фундаментальной матрицей решений системы (1). Ясно, что эта матрица при любом фиксированном t ∈ R невырождена (т.е. её определитель отличен от нуля для любого t ∈ R). Следствие 3. Преобразование gtt0 : Rn → Rn , соответствующее системе (1), есть линейный изоморфизм, т.е. линейное обратимое отображение фазового пространства Rn на себя. Д о к а з а т е л ь с т в о . Поскольку отображение Gt , введенное в доказательстве теоремы, является линейным изоморфизмом пространства решений {ψ} на Rn , то существует обратное отображение G−1 t0 : R → {ψ} (являющееся тоже линейным изоморфизмом) сопоставляющее каждому вектору x0 ∈ R решение ψ системы (1) с начальным условием ψ(t0 ) = x0 .
153
Теперь преобразование gtt0 можно, очевидно, представить как композицию (произведение) двух отображений G−1 t0 и Gt , т.е. gtt0 = Gt · G−1 t0
(∀t0 , t ∈ R).
Отсюда следует утверждение следствия 3. Перейдем теперь к свойствам преобразования gtt0 . Из теоремы единственности решений и формулы (3) сразу вытекает следующее о с н ов н о е с в о й с т в о п р е о б р а з о в а н и я gtt0 gtt1 · gtt01 = gtt0
(∀t0 , t1 , t ∈ R).
Предложение 1. Матрицей линейного преобразования (отображения) gtt0 : Rn → Rn (в фиксированном координатном базисе {ei }ni=1 пространства Rn ) является матрица K(t, t0 ) = Ψ(t)Ψ−1 (t0 ),
(6)
где Ψ(t) — фундаментальная матрица решений системы (1). В частности, если матрица Ψ(t) нормирована при t = t0 , т.е. Ψ(t0 ) = I (где I — единичная матрица), то K(t, t0 ) = Ψ(t).
(7)
Таким образом, если отождествить линейное преобразование gtt0 с матрицей, представляющей его в базисе {ei }ni=1 , то gtt0 = K(t, t0 ).
(8)
(Матрица K(t, t0 ) называется матрицей Коши.) Д о к а з а т е л ь с т в о . Пусть Ψ(t) = (ψ1 , · · · , ψn ) — любая фундаментальная матрица решений {ψj }nj=1 системы (1), построенная в силу следствия 2. Так как столбцы матрицы Ψ(t) образуют базис в пространстве решений {ψ} системы (1), то любое решение ψ системы (1) можно представить в виде ψ(t) = Ψ(t)c, где c ∈ Rn — некоторый постоянный вектор. Пусть ψ(t0 ) = x0 . Тогда, полагая в (9) t = t0 , будем иметь x0 = Ψ(t0 )c;
(9)
154
отсюда c = Ψ−1 (t0 )x0 . Следовательно, ψ(t) = Ψ(t)Ψ−1 (t0 )x0 , т.е. ψ(t) = K(t, t0 )x0
(10)
для любого решения ψ(t), удовлетворяющего начальному условию ψ(t0 ) = x0 (здесь K(t, t0 ) — матрица (6) или (7)). Сравнивая равенство (10) с формулой (3), определяющей преобразование gtt0 , получаем (8). Предложение 1 доказано. Замечание 1. В случае, когда (1) — система с постоянной матрицей: A(t) ≡ A, решение ψ системы (1) с начальным условием ψ(t0 ) = x0 , как хорошо известно, имеет вид ψ(t) = eA(t−t0 ) x0 . Отсюда и из равенства (9) (в силу теоремы единственности) получаем K(t, t0 ) = eA(t−t0 ) , т.е. в силу (8) gtt0 = eA(t−t0 ) .
(11)
Из (4), (5) (см. замечание п.1) и равенства (11) следует, что для линейной системы x˙ = Ax (x ∈ R) с постоянной матрицей A преобразование g t за время t равно eAt , т.е. g t = eAt
(∀t ∈ R).
Замечание 2. Во всех вышеприведенных рассуждениях относительно системы (1) нигде не использовался факт периодичности матрицы-функции A(t). Поэтому все сделанные выше выводы (относительно системы (1)) справедливы также и для систем с любой (не обязательно периодической) кусочно-непрерывной матрицей A(t). В следующем утверждении существенно будет использоваться условие периодичности матрицы-функции A(t) в системе (1). Предложение 2. Преобразование gtt12 за время от t1 до t2 не меняется при одновременном увеличении t1 и t2 на величину периода
155
T матричной функции A(t) в системе (1), т.е. +T gtt12+T = gtt12 .
(12)
Д о к а з а т е л ь с т в о . В силу периодичности правой части системы (1), сдвиг ϕ(t) = ψ(t + T ) любого решения ψ(t) на время T (вдоль оси t в расширенном фазовом пространстве Rn+1 ) будет снова решением системы (1): dϕ(t) dψ(t + T ) = = A(t + T )ψ(t + T ) = A(t)ϕ(t). dt d(t + T ) Следовательно, ψ(t2 + T ; x0 , t1 + T ) = ψ(t2 ; x0 , t1 ).
(13)
(Здесь ψ(t; x0 , t1 ) — решение системы (1) с начальным условием ψ(t1 ; x0 , t1 ) = x0 .) Из равенств (13) и (3) следует соотношение (12). Предложение 2 доказано. 4. Отображение за период. Пусть {gtt0 } — фазовый поток системы (1). Рассмотрим преобразование g0T (t0 := 0, t := T ). О п р е д е л е н и е 3. Преобразование g0T , осуществляемое фазовым потоком системы (1) за время одного периода T , называется о т о б р а ж е н и е м з а в р е м я T или о т о б р а ж е н и е м (о п е р а т о р о м ) м о н о д р о м и и (рис.12). Будем обозначать это отображение через H: H = g0T : Rn → Rn
156
Рис.12. Отображение монодромии.
Таким образом, g0T x есть значение в момент t = T решения ψ(t; x) системы (1) с начальным условием ψ(0; x) = x: g0T x = ψ(T ; x), x ∈ Rn .
(14)
Пример. Уравнения малых колебаний маятника ½ ½ x˙ 1 = x2 x˙ 1 = x2 ; x˙ 2 = x1 x˙ 2 = −x1 (обычного и перевернутого соответственно) имеют вид (1) с A(t) ≡ Ak (k = 1, 2), где соответственно µ ¶ µ ¶ 0 1 0 1 A1 = , A2 = . −1 0 1 0 Поэтому за период можно принять любое положительное число. Матрица преобразования H за период T для уравнений обычного маятника имеет вид (см. (14) и пример 6 из п.2: t := T ) µ ¶ cos T sin T H= . − sin T cos T Поэтому преобразование H (отображение монодромии) есть эллиптический поворот (на угол T ).
157
Для уравнений перевернутого маятника матрица преобразования за период (см.(14) и пример 7 из п.2: t := T ) µ ¶ ch T sh T H= . sh T ch T Поэтому здесь отображение монодромии есть гиперболический поворот (на угол T ). Приведем некоторые общие свойства отображения монодромии H. Предложение 3. Преобразование за время nT , где n ∈ N, является n-й степенью отображения монодромии, т.е. g0nT = H n .
(15)
Кроме того, имеет место также соотношение g0nT +τ = g0τ g0nT .
(16)
Д о к а з а т е л ь с т в о . В силу основного свойства преобразования gtt0 (см. п.3), где положено t0 = 0, t := hT + τ , имеем nT +τ g0nT +τ = gnT · g0nT . nT +τ Из последнего соотношения, учитывая равенство gnT = g0τ (см. предложение 2), получаем
g0nT +τ = g0τ g0nT , т.е. имеет место (16). Соотношение (15) очевидно при n = 1. Пусть n = k. Положив в (16) n := k и τ = T , будем иметь (k+1)T
g0
= g0T · g0kT = Hg0kT (k ∈ N).
Отсюда по индукции (15) имеет место для любого n ∈ N. Предложение 3 доказано. Замечание. В доказательствах предложений 2 и 3 нигде не используется факт линейности по x правой части уравнения (1). Поэтому предложения 2 и 3 справедливы для любого уравнения x˙ = f (t, x) с периодически зависящей от времени t гладкой по x правой частью: f (t + T, x) = f (t, x) (x ∈ Rn ).
158
Предложение 4. Отображение H = g0T : Rn → Rn есть линейный изоморфизм, причем матрицей линейного отображения (оператора) H (в координатном базисе {ei }ni=1 пространства Rn ) является матрица K(T, 0) = Ψ(T )Ψ−1 (0), (17) где Ψ(t) — фундаментальная матрица решений системы (1). В частности, если матрица Ψ(t) нормирована при t = 0 (т.е. Ψ(0) = I), то H ≡ g0T = Ψ(T )
(18)
(если отождествить оператор H с её матрицей Ψ(T ) в базисе {ei }ni=1 ). ( Матрица Ψ(T ) называется м а т р и ц е й м о н о д р о м и и .) Д о к а з а т е л ь с т в о . Предложение 4 следует из следствия 3 доказанной в п.3 теоремы 1 и предложения 1 (формулы (17), (18) следуют из (6) и (7), где положено t0 = 0, t = T ). 5. Устойчивость отображения монодромии. Свойству устойчивости нулевого решения системы (1) соответствует аналогичное свойство и для неподвижной точки x0 = 0 (Hx0 = x0 ) отображения монодромии H. О п р е д е л е н и е 4. Неподвижная точка x0 отображения H : Rn → Rn (Hx0 = x0 ) называется у с т о й ч и в о й п о Л я п у н о в у , если для любого ε > 0 существует δ > 0 такое, что для любого x ∈ Rn , удовлетворяющего условию |x − x0 | < δ, выполняется соотношение |H k x − H k x0 | < ε (H k x0 = x0 ) для всех k ∈ N. О п р е д е л е н и е 5. Неподвижная точка x0 отображения H называется асимптотически устойчивой, если она устойчива по Ляпунову и еще выполняется дополнительное условие: для любой точки x ∈ Rn H k x − H k x0 → 0 (H k x0 = x0 ) при k → +∞.
159
Замечание. Определения 4 и 5 аналогичны соответствующим определениям устойчивости по Ляпунову и асимптотической устойчивости тривиального решения для систем дифференциальных уравнений вида x˙ = f (t, x) (см. § 1, гл.III ). Следующая теорема сводит вопрос об асимптотической устойчивости системы (1) к асимптотической устойчивости соответствующего ей отображения монодромии H. Теорема 2. Нулевое решение x(t) ≡ 0 системы (1) устойчиво по Ляпунову (асимптотически устойчиво) тогда и только тогда, когда неподвижная точка x0 = 0 отображения монодромии H : Rn → Rn устойчива по Ляпунову (асимптотически устойчива). Поскольку устойчивость (асимптотическая устойчивость) нулевого решения системы (1) равносильна устойчивости (асимптотической устойчивости) всей системы (1) (см. § 1, гл.III ), то теорему 2 можно переформулировать так. Теорема 20 . Для устойчивости по Ляпунову (асимптотической устойчивости) системы (1) необходимо и достаточно, чтобы неподвижная точка x0 = 0 отображения H была устойчивой по Ляпунову (асимптотически устойчивой). Д о к а з а т е л ь с т в о т е о р е м ы 2. Если решение x(t) ≡ 0 асимптотически устойчиво, то, очевидно, и неподвижная точка x0 = 0 асимптотически устойчива. Обратно, пусть неподвижная точка x0 = 0 асимптотически устойчива. Из непрерывной зависимости решения ψ(t; y) системы (1) от начальных условий на отрезке [0, T ] следует, что для любого ε > 0 существует такое числo δe > 0, что для любого решения ψ(t; y) с начальным условием ψ(0, y) = y : kyk < δe выполнено неравенство kψ(t; y)k < ε для всех t ∈ [0, T ], т.е. в силу (3) kg0t yk < ε ∀ t ∈ [0, T ].
(19)
В силу устойчивости по Ляпунову неподвижной точки x0 = 0 по числу δe > 0 можно найти число δ > 0 такое, что для любой точки x ∈ Rn : |x| < δ справедливо соотношение: kH k xk < δe ∀ k ∈ N. (H k = 0 ∀ k ∈ N).
(20)
160
Пусть t ∈ [0, +∞) — произвольное число. Представим t в виде: t = kT + τ, τ ∈ [0, T ). Используя формулы (16) и (15), имеем: kψ(t; x)k = kg0t xk = kg0τ g0kT xk = kg0τ (H k x)k.
(21)
Полагая y = H k x в (20),(21), получаем из (19) и (21): |ψ(t; x)| < ε для всех t ∈ [0, +∞), если только kxk < δ. Последнее означает, что нулевое решение x(t) ≡ 0 системы (1) устойчиво по Ляпунову. Аналогично доказывается и соотношение lim ψ(t; x) = 0 ∀ x ∈ Rn .
t→+∞
(22)
Действительно, в силу того, что по условию lim H k x = 0
k→+∞
для любой начальной точки x ∈ Rn , по заданному числу δ > 0 можно найти такой номер K, что выполнено неравенство kH k xk < δ ∀ k ≥ K.
(23)
Используя (23) и (19) (где y = H k x), из (21) получим kψ(t; x)k < ε ∀ t ≥ KT (x ∈ Rn ), что доказывает соотношение (22). Следовательно, нулевое решение x(t) ≡ 0 уравнения (1) асимптотически устойчиво. Теорема 2 доказана. Замечание. Отображение H позволяет также обнаружить периодические решения системы (1) и исследовать их устойчивость. Верно следующее утверждение. Теорема 3. Система (1) имеет периодическое решение ψ(t) с начальным условием ψ(0) = x0 тогда и только тогда, когда x0 есть неподвижная точка отображения H. Это периодическое решение устойчиво по Ляпунову (асимптотически устойчиво) в том и только в том случае, когда неподвижная точка x0 отображения H устойчива по Ляпунову (асимптотически устойчива). Первая часть теоремы 3 очевидна, а вторая часть доказывается совершенно аналогично доказательству теоремы 2 (с заменой нулевого решения x(t) ≡ 0 на периодическое).
161
Следующая теорема устанавливает критерий асимптотической устойчивости неподвижной точки x = 0 произвольного (не обязательно H) линейного отображения. Теорема 4 (Критерий асимптотической устойчивости линейного отображения .) Для асимптотической устойчивости неподвижной точки x = 0 произвольного линейного отображения F : Rn → Rn необходимо и достаточно, чтобы все его собственные значения ρj лежали внутри единичного круга |p| < 1 (p ∈ C). Д о к а з а т е л ь с т в о . Пусть Φ — матрица линейного отображения F в базисе {ei }ni=1 . 1. Дадим сначала оценку нормы матрицы Φk , k ∈ N. Пусть ρ1 , · · · , ρn — собственные числа матрицы Φ с учетом их кратностей. Приведем матрицу Ψ к жордановой нормальной форме J = SΦS −1 = diag [J1 (ρ1 ), · · · , Jm (ρm )] (m ≤ n),
(24)
где ρj 0 . Jj (ρj ) = .. 0 0
1 ρj 0 0
0 ··· 1 ··· .. . .. . 0 0 ···
0 0 1 ρj
(j = 1, · · · , m)
(25)
— клетки Жордана порядков `j ; ρ1 , · · · , ρm — собственные числа матрицы Φ, соответствующие различным клеткам Жордана (не обязательно различные между собой), S — некоторая неособая матрица. Из (24) имеем Φk = (S −1 JS)k = S −1 J k S,
k ∈ N.
(26)
Используя правило умножения клеточно-диагональных матриц, найдем J k = diag [J1 (ρ1 )k , · · · , Jm (ρm )k ] (k ∈ N).
(27)
162
Для матрицы (25) нетрудно подсчитать, что k ρj
0 Jj (ρj )k = . .. 0
k·ρk−1 j 1!
ρkj .. . 0
k(k−1)ρk−2 j 2! kρjk−1 1!
..
.
··· ···
k(k−1)···(k−`j +3)ρj (`j −2)!
k−`j +2
··· .. . ···
0
k−`j +1
k(k−1)···(k−`j +2)ρj (`j −1)!
.. .
ρkj
. (28)
Из (26)-(28) получаем kΦk k ≤ kS −1 k · kJ k k · kSk ≤ C0 max kJj (ρj )k k ≤ C0 C1 max |ρj |k P (k), j
j
(29) где P (k) — некоторый многочлен от k степени r = max(`j − 1) с j
положительными коэффициентами, а C0 и C1 — некоторые положительные константы. Поскольку при любом µ > 1 lim µ−k P (k) = 0,
k→+∞
то из (29) имеем следующую оценку kΦk k ≤ Cµ (µγ)k
(µ > 1),
(30)
где γ = max |ρj |, Cµ — некоторая константа, зависящая от µ. j
Если собственным числам матрицы Φ, имеющим максимальный модуль соответствуют простые жордановые клетки (т.е. последние сводятся к одному элементу), то в (29) P (k) = const и, поэтому, вместо (30) будем иметь kΦk k ≤ Cγ k . 2. Докажем теперь утверждение теоремы 4. Пусть x ∈ Rn . Тогда образами этой точки при последовательном применении отображения F = Φ (здесь мы отождествляем отображение F с матрицей Φ ) будут точки xk = Φk x, k = 1, 2, · · · . (31)
163
Пусть собственные числа ρj матрицы Φ расположены внутри единичного круга |p| < 1. Тогда, поскольку в (30) µ > 1 — произвольное число, то всегда можно выбрать µ таким, чтобы µγ < 1. Используя (30), оценим норму вектора xk из (31): kxk k ≤ kΦk k · kxk ≤ Cµ (µγ)k kxk (k ∈ N).
(32)
Так как µγ < 1, то, как легко видеть, из неравенства (32) следует асимптотическая устойчивость неподвижной точки x = 0 отображения F , т.е. достаточность утверждения теоремы 4. Докажем необходимость. Пусть неподвижная точка x = 0 отображения F асимптотически устойчива. Допустим, что существует собственное значение ρj0 такое, что |ρj0 | ≥ 1. Тогда, положив в (31) x = ξ, где ξ — собственный вектор матрицы Φ, соответствующий её собственному числу ρj0 , будем иметь из (31) ξk = Φk ξ = ρkj0 ξ
(k ∈ N),
(33)
поскольку Φξ = ρj0 ξ. Из (33) получаем kξk k = |ρj0 |k kξk ≥ kξk (∀k ∈ N). Последнее неравенство означает отсутствие асимптотической устойчивости неподвижной точки x = 0 отображения F . Полученное противоречие доказывает необходимость утверждения теоремы 4. Теорема 4 доказана. О п р е д е л е н и е 6. Собственные значения ρj (j = 1, . . . , n) оператора монодромии H (или соответствующей ей матрицы монодромии Ψ(T )) называются м у л ь т и п л и к а т о р ам и с и с т е м ы (1). Из теоремы 20 и 4 вытекает Теорема 5. Линейная периодическая система (1) асимптотически устойчива тогда и только тогда, когда все её мультипликаторы расположены внутри единичного круга |p| < 1 (p ∈ C). Докажем теперь следующую теорему, которая устанавливает достаточные условия устойчивости по Ляпунову отображения F : R2 → R2 .
164
О п р е д е л е н и е 7. Линейное отображение F плоскости R2 на себя называется г и п е р б о л и ч е с к и м, если его собственные числа λ1 и λ2 вещественны, различны и λ1 λ2 = 1, и э л л и п т и ч е с к и м, если его собственные числа λ1 и λ2 комплексно сопряжены и λ1 λ2 = 1. Лемма. Пусть F — линейное отображение плоскости на себя. Тогда начало координат плоскости (x1 , x2 ) устойчиво для эллиптического и неустойчиво для гиперболического отображений. Короче: эллиптическое отображение — устойчивое отображение, а гиперболическое отображение — неустойчивое. Д о к а з а т е л ь с т в о . Пусть F — эллиптическое отображение и λ, λ — его собственные числа, причем λλ = 1. Собственному числу λ отвечает собственный вектор z ∈ C2 = CR2 комплексифицированного оператора C F : C2 → C2 (см. § 2, гл.I). Представим z в виде: z = x + iy, x ∈ R2 , y ∈ R2 . Тогда сопряженный вектор z = x − iy также является собственным вектором с собственным значением λ. Так как векторы z и z линейно независимы в C2 , то легко видеть, что и векторы x, y будут линейно независимыми в R2 , т.е. x и y образуют базис в R2 . Найдем матрицу оператора C F в (вещественном) базисе x, y. Поскольку λλ = 1, то собственные числа λ и λ лежат на единичной окружности |p| = 1 плоскости комплексного переменного p. Поэтому λ, λ = cos α ± i sin α, где α = arg λ. По определению C F имеем: CF x
+ iC F y = C F (x + iy) = (cos α + i sin α)(x + iy) = (x cos α − y sin α) + i(x sin α + y cos α). Отсюда C
F x = x cos α − y sin α,
C
F y = x sin α + y cos α.
Поэтому матрицей оператора F : R2 → R2 в базисе {x, y} будет µ ¶ cos α sin α . − sin α cos α Таким образом, отображение F аффинно эквивалентно повороту на угол α и, следовательно, будет устойчивым, так как траектория произвольной точки ξ ∈ R2 − {F k ξ, k ∈ N} — лежит на эллипсе.
165
Пусть теперь F — гиперболическое отображение. Тогда одно из собственных чисел (пусть это λ1 ) меньше, а другое (λ2 ) больше 1 по модулю. Поэтому отображение F состоит из сжатия в |λ1 |−1 раз в направлении собственного вектора ξ1 , соответствующего собственному числу λ1 , и растяжения в |λ2 | раз в направлении собственного вектора ξ2 , соответствующего собственному числу λ2 . Оператор F в базисе {ξ1 , ξ2 } имеет матрицу µ ¶ λ1 0 . 0 λ2 Следовательно, отображение F аффинно эквивалентно гиперболическому повороту: (x1 , x2 ) → (λ1 x1 ; λ2 x2 ) и, поэтому, неустойчиво, так как траектории — {F k ξ, k ∈ N, ξ ∈ R2 } — лежат на гиперболах (траектория, начинающаяся в сколь угодно малой окрестности начала координат, после достаточно большого числа итераций F k выйдет из любой фиксированной окрестности начала). Лемма доказана. Теорема 6. Пусть Φ — матрица линейного отображения F плоскости на себя, причем det Φ = 1 (такое отображение сохраняет площади). Тогда начало координат устойчиво для отображения F (или, короче, отображение F устойчиво), если |Tr Φ| < 2, и неустойчиво, если |Tr Φ| > 2. Д о к а з а т е л ь с т в о . Характеристический многочлен матрицы Φ имеет вид: p2 − σ · p + ∆, где σ и ∆ — вещественные числа. Корни λ1 и λ2 этого многочлена (собственные числа матрицы Φ) вещественны при |σ| > 2 и комплексно-сопряжены при |σ| < 2. Так как σ = λ1 + λ2 = Tr Φ, ∆ = λ1 λ2 = det Ψ = 1, то в первом случае (|T r Φ| > 2) одно из собственных чисел по модулю больше, а другое меньше 1, а во втором случае (|T r Φ| < 2) ¯ 1 лежат на единичной окружности собственные числа λ1 и λ2 = λ
166
|p| = 1. В первом случае, отображение F гиперболическое и, следовательно, в силу доказанной выше леммы, неустойчиво, а во втором случае, отображение F эллиптическое и, поэтому, в силу той же леммы, устойчиво. Теорема 5 доказана. Замечание. Как мы видели выше, при последовательном применении (итерациях) отображения монодромии H к произвольной точке x0 ∈ Rn получаем последовательность {xk } точек xk ∈ Rn (k = 0, 1, 2, · · · ), причем xk+1 = Hxk
(k = 0, 1, 2, · · · ).
(34)
Последнее соотношение представляет собой дискретную систему. Таким образом, здесь при рассмотрении определенных свойств решений (как, например, устойчивость) мы заменяем систему дифференциальных уравнений (1) на соответствующую ей линейную дискретную систему (34), где H — отображение за время периода T , порождаемое траекториями системы (1). Некоторые аспекты теории линейных дискретных систем будут рассмотрены в гл.VI.
§ 3. Низкочастотная стабилизация верхнего положения равновесия маятника Прежде чем перейти к проблеме Брокетта и к алгоритмам построения соответствующих стабилизирующих функций s(t) для системы (3) § 1, мы рассмотрим сначала классическую задачу о стабилизации верхнего положения равновесия маятника с вибрирующей точкой подвеса. Рассмотрим колебания маятника, который может свободно вращаться в определенной вертикальной плоскости вокруг своей точки подвеса. Предположим, что точка подвеса совершает в вертикальном направлении колебания с некоторой амплитудой и частотой. Спрашивается, может ли верхнее, обычно неустойчивое, положение равновесия маятника стать устойчивым ? Как показано в работах [31,77] неустойчивое верхнее положение равновесия маятника может сделаться устойчивым при достаточно быстрых колебаниях точки подвеса (когда точка подвеса совершает
167
в вертикальном направлении гармонические колебания y = a sin ωt или y = a cos ωt с малой амплитудой a и высокой частотой ω). Этот хорошо известный эффект высокочастотной стабилизации верхнего положения равновесия мы рассмотрим позже в следующей главе V. Здесь же мы рассмотрим возможность стабилизации верхнего положения равновесия маятника при низкочастотных колебаниях точки подвеса. Для рассмотрения этого интересного явления (стабилизации верхнего положения равновесия) составим уравнение колебаний маятника с вибрирующей точкой подвеса. Как хорошо известно, уравнение колебаний маятника с покоящейся точкой подвеса имеет вид θ¨ + αθ˙ + ν02 sin θ = 0 (ν02 = g/`)
(1)
(в предположении, что трение пропорционально скорости), где θ — угол отклонения, отсчитываемыйpот нижнего положения равновесия, α — коэффициент трения, ν0 = g/` — собственная частота малых колебаний (` — длина маятника, g — ускорение свободного падения). Пусть точка подвеса совершает колебания в вертикальном направлении по закону y = y(t), где y(t) — некоторая периодическая функция. Чтобы составить уравнение колебаний маятника с вибрирующей точкой подвеса воспользуемся принципом относительности, согласно которому движение маятника с вертикально вибрирующей точкой подвеса эквивалентно движению маятника с покоящейся точкой подвеса, находящемуся в поле "силы тяжести"с ускорением g + y 00 (t). Поэтому, заменяя в (1) g на g + y 00 (t), получим искомое уравнение g + y 00 (t) θ¨ + αθ˙ + sin θ = 0. `
(2)
Уравнение (2) допускает стационарное решение θ(t) ≡ π , соответствующее верхнему положению равновесия маятника (стационарное решение θ(t) ≡ 0 соответствует нижнему положению равновесия маятника). Для исследования устойчивости следует рассмотреть малые отклонения (вариации) δθ = θ − π от этого положения равновесия (θ = π). Уравнение первого приближения (уравнение в вариациях)
168
выглядит так (переобозначив δθ → θ): θ¨ + αθ˙ + (s(t) − ν02 )θ = 0,
(3)
где s(t) = y 00 (t)/` (s(t) – с точностью до константы ускорение точки подвеса). Наиболее часто рассматриваются (мы их рассмотрим в гл.V) функции s(t) вида s0 +βω cos ωt (или s0 +βω 2 cos ωt) ([259,260]) и периодические функции вида ([16,17]) ½ β при t ∈ [0, T/2), s(t) = s(t + T ) = s(t), t ∈ [0, +∞), −β при t ∈ [T/2, T ), где β > 0 — некоторое число, а T — период функции s(t). Исследуем уравнение (3). Задача состоит в том, чтобы найти функцию s(t) такую, чтобы положение равновесия (θ = 0, θ˙ = 0) уравнения (3) было асимптотически устойчивым (напомним, что в уравнении (3) θ — угол отклонения, отсчитываемый от верхнего положения равновесия). Перейдем от уравнения (3) к эквивалентной ему системе (x1 = θ) ½ x˙ 1 = x2 , (4) x˙ 2 = −αx2 − (s(t) − ν02 )x1 , где стабилизирующая функция s(t) подлежит определению. Будем искать стабилизирующую функцию s(t) в классе кусочнопостоянных периодических с периодом T (где T — достаточно большое число) функций вида при t ∈ [0, T/4), −β β при t ∈ [T/4, 3T/4), s(t + T ) = s(t) ∀T ∈ [0, +∞) s(t) = −β при t ∈ [3T/4, T ), (5) (где β > 0), имеющих нулевое среднее на периоде (см (4) § 1). Для функций s(t) вида (5) покажем возможность стабилизации верхнего положения равновесия маятника при низкочастотных колебаниях точки подвеса. Имеет место следующая Теорема. Пусть в системе (4), (5) α2 < 4(β − ν02 ).
169
Тогда для любого числа M > 0 существует число T > M такое, что система (4) с функцией s(t) вида (5) асимптотически устойчива. Д о к а з а т е л ь с т в о . Прежде всего, заметим, что, не умаляя общности, можно считать ν 2 ≡ β − ων02 − α2/4 = 1. Этого можно добиться всегда, сделав в уравнении (3) (или в системе (4)) замену времени τ = νt. Рассмотрим нужные нам свойства системы (4), когда s(t) = −β и s(t) = β. При s(t) = −β система (4), т.е. система ½ x˙ 1 = x2 , (6) x˙ 2 = −αx2 + (β + ν02 )x1 , имеет седловую особую точку (x1 = 0, x2 = 0) с неустойчивым многообразием M1 = {x2 = `1 x1 } и устойчивым многообразием L1 = {x2 = `2 x1 } (рис.13).
Рис.13. Неустойчивое (верхнее) положение равновесия уравнения маятника —седло.
170
Здесь r α α2 `1 = − + + (β + ν02 ) 2 r4 α2 α + (β + ν02 ) `2 = − − 2 4
(`1 = λ1 > 0), (`2 = λ2 < 0),
( `1 и `2 совпадают с корнями λ1 и λ2 характеристического уравнения p2 + αp − (β + ν02 ) = 0). Фазовый поток {f t } системы (6) состоит из сжатий в e−`2 t раз в направлении прямой x2 = `2 x1 и одновременного растяжения в e`1 t раз в направлении прямой x2 = `1 x1 . В силу условия α2 < 4(β − ω02 ) теоремы характеристический многочлен p2 + αp + (β − ν02 ) = 0 системы (4) при s(t) = β, т.е. системы ½ x˙ 1 = x2 , (7) x˙ 2 = −αx2 − (β − ν02 )x1 , имеет комплексно-сопряженные корни −α/2 ± i (ν = 1) и, следовательно, положение равновесия (0, 0) системы (7) — устойчивый фокус (рис.14).
Рис.14. Положение равновесия системы (7) — устойчивый фокус.
Фазовый поток {g t } системы (7) аффинно эквивалентен семейству сжатий в eαt/2 раз с одновременным вращением на угол t.
171
В силу предложения 1 (из § 2) матрицами преобразований f t и за время t являются нормированные фундаментальные матрицы Ψf (t) и Ψg (t) решений систем (6) и (7) соответственно. Ясно, что существует число T1 > 0 такое, что линейный оператор g T1 (описываемый матрицей Ψg (T1 ) ) преобразует прямую x2 = `1 x1 в прямую x2 = `2 x1 . Из равенства ν = 1 следует, что прямую x2 = `1 x1 в прямую x2 = `2 x1 переводят также операторы gt
g T1 +2πj ,
j ∈ Z.
Покажем теперь, что в качестве числа T можно выбрать значение 2(T1 + 2πj) с достаточно большим j. Для этого рассмотрим единичный круг E1 = {x21 + x22 ≤ 1}. 3T/4 T/4
T g Докажем, что оператор монодромии H = hT0 = f3T/4 T/4 f0 стемы (4) переводит круг E1 в эллипс, лежащий в круге
си-
1 E1/2 = {x21 + x22 ≤ } 4 радиуса 1/2, т.е. что точки круга E1 , двигаясь под действием фазового потока {f t } системы (4) вдоль его траекторий попадут при t = T в круг E1/2 (заметим, что согласно предложению 4 из § 2 H = hT0 — линейный оператор.) Так как на промежутке [0, T/4) мы имеем фазовый поток {f t } системы (6), действующий как сжатие в e−`2 t раз в направлении прямой x2 = `2 x1 и одновременно как растяжение в e`1 t раз в направT/4 лении прямой x2 = `1 x1 , то преобразование g0 за время от t = 0 до t = T/4 переведет круг E1 в эллипс, лежащий в ε-окрестности Uε прямой x2 = `1 x1 , где ε = µ1 e`2 T/4 , причем x1 (T/4)2 + x2 (T/4)2 ≤ µ22 e`1 T/2 (8) (здесь µ1 > 0 и µ2 > 0 — некоторые числа; за счет выбора µ2 можно T/4 считать µ1 < µ2 ). Поэтому образ круга E1 при преобразовании f0 (за время t = T/4 ) будет лежать в пересечении ε-окрестности Uε и круга K1 радиуса µ2 e`1 T/4 с центром в начале координат.
172
На промежутке времени [T/4, 3T/4) действует фазовый поток {g t } системы (7). Поэтому в результате действия (линейного) оператора 3T/4 T/2 gT/4 (= g0 в силу автономности системы (7)) область Uε переходит в µ3 ε-окрестность Uµ3 ε прямой x2 = `2 x1 (здесь µ3 > 0 — некоторое число). При этом из соотношения (8) следует, что (считаем µ3 µ1 < µ2 ) x1 (3T/4)2 + x2 (3T/4)2 ≤ µ22 e`1 T/2 , (9) T/2
(так как h0 есть сжатие с одновременным вращением). 3T/4 T/4 Таким образом, в результате преобразования gT/4 f0 образ круга E1 будет лежать в пересечении области Uµ3 ε с кругом K1 . На промежутке [3T/4, T ) снова действует фазовый поток {f t } сиT/4 T стемы (6). Поэтому в результате действия оператора f3T/4 (= f0 в силу автономности системы (6)) область Uµ3 ε переходит в ε1 -окрестность Uε1 прямой x2 = `2 x1 , где ε1 = µ3 ε · µ5 e`1 T/4 = µ5 µ3 µ1 e(`1 +`2 )T/4 , причем с учетом (9) x1 (T )2 + x2 (T )2 ≤ µ24 µ22 e(`1 +`2 )T/4 (здесь µ4 и µ5 — некоторые положительные числа; за счет выбора µ2 и µ4 считаем выполненным неравенство µ5 µ3 µ1 < µ4 µ2 ). Следовательно, образ Hx любой точки x = (x1 , x2 )∗ ∈ E1 при отображении H (с помощью траекторий системы (4)) за время от t = 0 до t = T : T/4 T/2 T/4 Hx = f0 g0 f0 x, лежит в пересечении окрестности Uε1 и круга K2 радиуса µ4 µ2 e(`1 +`2 )T/4 ( с центром в начале координат). Так как `1 +`2 = −α < 0, то выбирая число T достаточно большим, можно добиться выполнения неравенства µ4 µ2 e(`1 +`2 )T/4 < 1/2, т.е.K2 будет кругом радиуса r = 1/2 : K2 = E1/2 . Итак, оператор монодромии H (преобразование за время T ) переводит круг E1 в эллипс, лежащий в E1/2 (рис.15): HE1 ⊂ E1/2 .
173
Рис.15. Оператор монодромии системы (4), (5).
Из последнего соотношения и линейности оператора H следует, что H есть сжимающий оператор в E1 (и, следовательно, в R2 ), т.е. |Hz| < q|z| ∀ z ∈ E1 ,
(10)
где q = 1/2, z = (x1 , x2 )∗ . Поэтому из (10) получаем 1 |H k z| < n |z| ∀z ∈ E1 . (11) 2 Отсюда |H k z| → 0 при ∀z ∈ E1 . (12) Из соотношений (11) и (12) вытекает асимптотическая устойчивость отображения H и, следовательно, в силу леммы 2 из § 2 асимптотическая устойчивость системы (4) с функцией вида (5). Теорема полностью доказана. Замечание. Таким образом, описанный в доказательстве предыдущей теоремы алгоритм стабилизации системы (4) весьма прост. Во-первых, с помощью фазового потока {f t } системы (6) совершается сжатие фазового пространства R2 в направлении устойчивого многообразия `2 системы (6) и растяжение в направлении её неустойчивого многообразия `1 , при этом сжатие происходит быстрее, чем растяжение. Во-вторых, это неустойчивое многообразие `1 , после переключения с траекторий системы (6) на траектории системы (7), под действием фазового потока {g t } системы (7) можно повернуть
174
вдоль ее траекторий так, чтобы достичь к следующему переключению (с траекторий системы (7) обратно на траектории системы (6)) его совпадения с устойчивым многообразием `2 . В-третьих, действуя снова фазовым потоком {f t } системы (6) мы осуществляем превалирование сжатия над растяжением и в целом к моменту времени t = T полностью ликвидируем растяжение, погружая траектории в шар сколь угодно малого радиуса (рис.16).
Рис.16. Действие оператора монодромии (преобразования за время T ) системы (4), (5).
§ 4. Проблема Брокетта в классе кусочно-постоянных периодических матриц Рассмотрим теперь проблему Брокетта, сформулированную в § 1. При ее решении мы будем использовать идеи предыдущего параграфа. 1. Основная теорема. Предположим, что существуют (вещественные) постоянные матрицы s1 и s2 такие, что линейные системы x˙ = (A + b(csj )∗ )x,
x ∈ Rn (j = 1, 2)
(1)
(где A, b и c — вещественные постоянные матрицы) обладают устойчивыми инвариантными (линейными) многообразиями Lj и инвариантными (линейными) многообразиями Mj . Пусть Mj ∩ Lj = {O},
dim Lj + dim Mj = n
(2)
(знак dim в (2) означает размерность соответствующего пространства) и для положительных чисел λj , κj , αj , βj выполнены неравенства |xj (t; x0 )| ≤ αj |x0 |e−λj t ∀x0 ∈ Lj , (3) κj t |xj (t; x0 )| ≤ βj |x0 |e ∀x0 ∈ Mj . (4)
175
Здесь xj (t; x0 ) — решение системы (1) с начальным условием xj (0; x0 ) = x0 .
Рис.17. Линейные устойчивые Lj и неустойчивые Mj многообразия (j = 1, 2); θ0τ M1 ⊂ L2 .
Предположим, далее, существование непрерывной матрицы σ(t) и числа τ > 0 таких, что фазовый поток {θtt0 } системы x˙ = (A + b(cσ(t))∗ )x, x ∈ Rn ,
(5)
(где A, b и c — вещественные постоянные матрицы) за время от t = 0 до t = τ переводит многообразие M1 в многообразие, лежащее в L2 , т.е. θ0τ M1 ⊂ L2 . (6) Будем называть условие (6) ниже "условием вложения многообразий" (рис. 17). При этих предположениях имеет место следующая Теорема 1. (Основная теорема.) Пусть выполнено неравенство λ1 λ2 > κ1 κ2 . (7) Тогда существует периодическая матрица s(t) такая, что система x˙ = (A + b(cs(t))∗ )x
(x ∈ Rn )
(8)
176
является асимптотически устойчивой. Д о к а з а т е л ь с т в о . Из условия (7) следует, что для любого T > 0 существуют положительные числа t1 и t2 , удовлетворяющие неравенствам ½ −λ1 t1 + κ2 t2 < −T, −λ2 t2 + κ1 t1 < −T. Определим теперь зом: s1 σ(t − t1 ) s(t) = s2
периодическую матрицу s(t) следующим обрапри t ∈ [0, t1 ), при t ∈ [t1 , t1 + τ ), при t ∈ [t1 + τ, t1 + t2 + τ ),
s(t + T ) = s(t), (9)
где T = t1 + t2 + τ . Покажем, что при достаточно больших значениях T система (8) с матрицей s(t), определенной согласно (9), будет асимптотически устойчивой. Для этого рассмотрим (как и в § 3) единичный шар E1 = {x ∈ Rn : kxk ≤ 1} и докажем, что фазовый поток {htt0 } системы (8) с матрицей s(t) вида (9) переводит E1 за время от t = 0 до t = T в эллипсоид, лежащий в шаре E1/2 = {x ∈ Rn : kxk ≤ 1/2}, т.е. HE1 ⊂ E1/2 , где H = hT0 — оператор монодромии (преобразование за период T ). Пусть {f t } – фазовый поток системы (1) с j = 1, а {g t } — фазовый поток системы (1) с j = 2. Тогда hT0 = gtT1 +τ ϑtt11 +τ f0t1 ,
(10)
где ϑtt11 +τ — преобразование за время от t1 до t1 + τ , осуществляемое фазовым потоком {ϑtt0 } системы x˙ = [A + b(cσ(t − t1 ))∗ ]x.
(11)
Легко видеть, что в (10) ϑtt11 +τ = θ0τ .
(12)
(Последнее соотношение следует из того, что если x = ψ(t; x0 , 0) — решение системы (5) с начальным условием ψ(0; x0 , 0) = x0 , то
177
функция x = ϕ(t; x0 , t1 ), где ϕ(t; x0 , t1 ) = ψ(t − t1 ; x0 , t1 ), есть решение системы (11) с начальным условием ϕ(t1 ; x0 , t1 ) = x0 .) Поскольку ∗
x = e[A+b(csj ) ]t x0
(x0 ∈ Rn , j = 1, 2))
— решение системы (1), а решение системы (5) есть x = Ψ(t)x1
(x1 ∈ Rn ),
(13)
где Ψ(t) — фундаментальная матрица решений системы (5), нормированная при t = 0 (Ψ(0) = I), то (см. п.3, § 2) ∗ ]t
f0t1 = e[A+b(cs1 )
1
∗ ]t 2
, g0t2 = e[A+b(cs2 )
, θ0τ = Ψ(τ ).
Пусть x0 ∈ E1 — произвольная точка из шара E1 . Тогда точка x0 под действием потока {f t } (двигаясь вдоль траектории системы (1) с j = 1 ) перейдет за время от t = 0 до t = t1 в точку x1 = f0t1 x0 (x1 — значение в момент t1 решения x = ψ1 (t; x0 ) системы (1), где j = 1, с начальным условием ψ(0, x0 ) = x0 ). Затем, точка x1 под действием фазового потока {ϑtt0 } (двигаясь вдоль траектории системы (11)) перейдет за время от t = t1 до t = t1 + τ в точку x2 = ϑtt11 +τ x1 (x2 — значение в момент t = t1 + τ решения x = ϕ(t; x1 , t1 ) системы (11) с начальным условием ϕ(t1 ; x1 , t1 ) = x1 . И, наконец, точка x2 под действием потока {g t } (двигаясь вдоль траектории системы (1) с j = 2) перейдет за время от t = t1 + τ до t = t1 + t2 + τ в точку +t2 +τ x3 = gtt11+τ x2 (x3 — значение решения x = ψ2 (t; x2 ) системы (1), где j = 2, с начальным условием ψ2 (0; x2 ) = x2 ). Таким образом, с учетом (12), будем иметь +t2 +τ t1 +τ t1 x3 = hT0 x0 = gtt11+τ ϑt1 f0 x0 = g0t2 θ0τ f0t1 x0
(14)
+t2 +τ (gtt11+τ = g0t2 в силу автономности системы (1) (j = 2): если ψ2 (t) — решение, то и ψ2 (t + C) — тоже решение, где C = const ). Приведем систему (1) с помощью невырожденного линейного преобразования переменных µ ¶ 0 00 ξj (15) = Bj x, ξj ∈ Rnj , ηj ∈ Rnj (j = 1, 2), ηj
178
где n0j = dim Lj , n00j = dim Mj , Bj (j = 1, 2) — неособая матрица (порядка n × n), к следующему виду ½ ξ˙j = Pj ξj , (j = 1, 2). η˙ j = Qj ηj Не умаляя общности, можно считать, что |ξj (t)| ≤ αj |ξj (0)|e−λj t , |ηj (t)| ≤ βj |ηj (0)|eκj t
(j = 1, 2).
(16)
Так как в силу (13) x(t1 + τ ) = x2 = Ψ(τ )x1 , где x1 = x(t1 ), то с учетом (15) имеем µ ¶ µ ξ2 (t1 + τ ) −1 = B2 Ψ(τ )B1 η2 (t1 + τ )
ξ1 (t1 ) η1 (t1 )
¶ .
В силу "условия вложения многообразий"(6) для любого x0 ∈ M1 Ψ(τ )x0 = x00 , x00 ∈ L2 . Поэтому (см. (15)), B2−1 или
где
µ ¶ µ ¶ ξ2 −1 0 = Ψ(τ )B1 0 η1
µ ¶ µ ¶ ξ2 0 = B2 Ψ(τ )B1−1 , 0 η1 µ ¶ 0 B1 x = , η1 0
µ ¶ ξ2 . B2 x = 0 00
Следовательно, матрица B2 Ψ(τ )B1−1 имеет следующую структуру: ¶ µ b11 (τ ) b12 (τ ) }n02 −1 B2 Ψ(τ )B1 = }n002 , b21 (τ ) 0 | {z } | {z } n01
n00 1
где b11 (τ ), b12 (τ ), b21 (τ ) — некоторые матрицы порядков (n02 × n01 ), (n02 × n001 ) и (n002 × n01 ) соответственно.
179
Очевидно, что матрицами преобразований f0t1 и g0t2 в новых переменных (ξ1 , η1 ) и (ξ2 , η2 ) будут µ Pt ¶ µ Pt ¶ e 11 0 e 22 0 t1 −1 t2 −1 B1 f0 B1 = , B2 g0 B2 = . 0 eQ1 t1 0 eQ2 t2 Поэтому в новых переменных соотношение (14) перепишется так: ¶µ ¶µ P t ¶µ ¶ µ ¶ µ Pt ξ1 (0) b11 b12 e 11 0 ξ2 (T ) e 22 0 = . b21 0 η2 (T ) 0 eQ2 t2 0 eQ1 t1 η1 (0) Отсюда ξ2 (T ) = eP2 t2 b11 eP1 t1 ξ1 (0) + eP2 t2 b12 eQ1 t1 η1 (0), η2 (T ) = eQ2 t2 b21 eP1 t1 η1 (0). Используя оценки (16), получим kξ2 (T )k ≤ α1 α2 kb11 k · kξ1 (0)ke−λ1 t1 −λ2 t2 + +α2 β1 kb12 k · kη1 (0)ke−λ2 t2 +κ1 t1 ,
(17)
kη2 (T )k ≤ α1 β2 kb21 k · kη1 (0)ke−λ1 t1 +κ2 t2 . (18) В силу выбора чисел t1 > 0 и t2 > 0 (см. начало доказательства) из (17) и (18) имеем kξ2 (T )k ≤ C1 e−T , kη2 (T )k ≤ C2 e−T , где C1 и C2 — некоторые положительные константы. Из последних оценок следует, что при достаточно большом T > 0 µ ¶ ξ2 (T ) 1 k k < kB2−1 k−1 . η2 (T ) 2 Поэтому, µ ¶ 1 −1 ξ2 (T ) kx(T )k = kx3 k = kB2 k< . η2 (T ) 2 Итак, 1 kHx0 k < ∀x0 ∈ E1 , 2 т.е. HE1 ⊂ E1/2 . Дальше, повторяя заключительную часть доказательства теоремы из § 3, приходим, что система (8) с функцией s(t) вида (9), где T — достаточно большое число, асимптотически устойчива. Теорема доказана полностью.
180
Замечание. Идея доказательства теоремы 1 (как и теоремы из § 3) состоит в том, что сначала с помощью траекторий системы (1) (j = 1) производится сжатие и растяжение единичного шара E1 соответственно вдоль многообразий L1 и M1 (преобразование f0t1 ), причем сжатие происходит быстрее, чем растяжение; затем переключаясь на траектории системы (11), производится вращение пространства так, чтобы образ M1 лежал в устойчивом многообразии L2 (преобразование θ0τ ). Наконец, с помощью траекторий системы (1) (j = 2) производится сжатие и растяжение вдоль многообразий L2 и M2 соответственно, с превалированием сжатия над растяжением (преобразование g0t2 ). В результате таких преобразований образ шара E1 к моменту времени t = T будет лежать в шаре сколь угодно малого радиуса (при соответствующем выборе T ). 2. Случай скалярной функции s(t). Рассмотрим теперь случай, когда матрица s(t) в уравнении (8) является скалярной функцией и имеет вид (9): σ(t) ≡ σ0 ,
s1 = s2 = s0 ,
σ0 ∈ R, s0 ∈ R.
Предположим, что s0 σ0 < 0,
λ1 = λ2 = λ,
κ1 = κ2 = κ,
функция kθt k ограничена на промежутке [0, +∞) и существует последовательность {τj } → +∞, для которой θτj M1 ⊂ L2 . (Здесь {θt } — фазовый поток системы (5): σ(t) ∗ θt = e[A+b(cσ0 ) ]t .) Тогда справедлива
(19) ≡
σ0 ,
Теорема 2. Если выполнено неравенство λ>κ то существует T –периодическая функция s(t) с нулевым средним на периоде такая, что система (8) является асимптотически устойчивой.
181
Для доказательства теоремы 2 достаточно определить функцию s(t) следующим образом: t ∈ [0, |σ0 τj/2s0 |), s0 при σ0 при t ∈ [|σo τj/2s0 |, τj + |σ0 τj/2s0 |), s(t + T ) = s(t), s(t) = s0 при t ∈ [τj + |σ0 τj/2s0 |, τj + |σ0 τj/s0 |), (20) где T : = τj (1 − σ0/s0 ) — период функции s(t). Здесь τj — достаточно большое число, удовлетворяющее условию (19). Легко проверить, что функция s(t) имеет нулевое среднее на периоде. Далее, доказательство теоремы 2 полностью повторяет рассуждения доказательства теоремы 1. При этом t1 = t2 := −σ0 τj/2s0 , τ := τj . Замечание 1. Условие ограниченности функции kθt k на [0, +∞) можно заменить следующим условием: все собственные значения λj матрицы A + b(cσ0 )∗ обладают неположительными вещественными частями: Re λk (A + b(cσ0 )∗ ) ≤ 0 (k = 1, . . . , n), причем собственные числа, имеющие нулевые вещественные части, допускают лишь простые элементарные делители т.е. соответствующие клетки в жордановой нормальной форме матрицы сводятся к одному элементу. Замечание 2. Теорема из § 3 является следствием теоремы 2. Действительно, применим теорему 2 к системе (4) из § 3 с функцией s(t) вида (5) в предположении, что выполнено условие α2 < 4 (β − ν02 ) (не умаляя общности будем считать, что β − ν02 − α2/4 = 1 ). Тогда характеристический многочлен системы (4) из § 3 с s(t) = σ0 , где σ0 = β, имеет комплексно-сопряженные корни и, следовательно, выполнено условие (19) с некоторым τ1 > 0 ({θt } — фазовый поток системы (7) из § 3). Поэтому τj := τ1 + 2πj, j ∈ Z. Легко видеть, что функция kθt k ограничена на [0, +∞), так как преобразование θt аффинно эквивалентно повороту на угол t с последующим сжатием. Далее, при s(t) = s0 , где s0 := −β, характеристический многочлен системы (4)(§ 3) имеет вещественные корни −λ < 0 и κ > 0, причем λ > κ.
182
Таким образом, выполнены все условия теоремы 2 и, следовательно, система (4) (из § 3) с функцией s(t) вида (20) асимптотически устойчива (при этом T = 2τj ). § 5. Некоторые предложения, обеспечивающие эффективную проверку "условия вложения многообразий" Рассмотрим систему z˙ = Qz,
z ∈ Rn ,
(1)
где Q — постоянная неособая (n × n)–матрица. Пусть h ∈ Rn — произвольный ненулевой вектор. Лемма 1. Предположим, что решение z(t) системы (1) имеет вид z(t) = v(t) + w(t), t ∈ [0, +∞), где v(t) — периодическая вектор-функция такая, что h∗ v(t) 6≡ 0, w(t) — вектор-функция, для которой +∞ Z kw(τ )kdτ < +∞, lim w(t) = 0. t→+∞
0
Тогда существуют числа τ1 и τ2 такие, что выполнены неравенства h∗ z(τ1 ) > 0, т.е. функция
h∗ z(t)
h∗ z(τ2 ) < 0,
меняет свой знак (рис.18).
(2)
183
Рис. 18. Переход решения z(t) с одной стороны плоскости h∗ z = 0 на другую.
Д о к а з а т е л ь с т в о . Предположим противное, т.е. что ≥ 0 ∀t ≥ 0 или h∗ z(t) ≤ 0 ∀t ≥ 0. Пусть, для определенности, ∗ h z(t) ≥ 0 ∀t ≥ 0. Тогда и h∗ v(t) ≥ ∀t ≥ 0. Действительно, в противном случае существует момент t0 такой, что h∗ v(t0 ) < 0 и в силу периодичности h∗ v(t) будем иметь h∗ z(t)
h∗ z(t0 + nT ) = h∗ v(t0 ) + h∗ w(t0 + nT ) < 0 для достаточно больших n ∈ N (здесь T — период функции v(t)). Отсюда, в силу условия h∗ v(t) 6≡ 0, следует, что +∞ Z h∗ v(τ )dτ = +∞, 0
так как h∗ v(t) — периодическая функция. Поэтому будет выполнено также соотношение Zt h∗ z(τ )dτ = +∞.
lim
t→+∞ 0
(3)
184
С другой стороны Zt Zt ∗ h z(τ )dτ = h∗ Q−1 z(τ ˙ )dτ = h∗ Q−1 (z(t) − z(0)). 0
0
Отсюда и из ограниченности функции z(t) на [0, +∞) следует ограниченность функции Zt h∗ z(τ )dτ. 0
Последнее противоречит соотношению (3). Полученное противоречие доказывает лемму 1. Следствие. Пусть решение z(t) системы z˙ = P z с постоянной (не обязательно неособой) (n × n)–матрицей P имеет вид z(t) = eλt [v(t) + w(t)], где число λ не является собственным значением матрицы P , а v(t) и w(t) удовлетворяют условиям леммы 1. Тогда справедливо утверждение леммы 1, т.е. имеют место неравенства (2). Для доказательства следствия достаточно заметить, что функция ζ(t) = e−λt z(t) является решением уравнения ζ˙ = (P − λI)ζ (где I — единичная матрица) и, тогда остается применить лемму 1 к последнему уравнению, полагая Q := P − λI. Лемма 2. Пусть n = 2 и матрица Q в (1) имеет комплексносопряженные собственные значения α ± iβ. Тогда для любой пары ненулевых векторов h ∈ R2 и d ∈ R2 существуют числа τ1 и τ2 такие, что h∗ eQτ1 d > 0,
h∗ eQτ2 d < 0,
(4)
т.е. решениеz(t) = eQt d системы (1) попадает на плоскость {h∗ z} = 0 в некоторый момент τ ∈ (τ1 , τ2 ). Д о к а з а т е л ь с т в о . В рассматриваемом случае фазовый поток {g t } системы (1) аффинно эквивалентен семейству растяжений (если α < 0, то вместо растяжений имеем сжатия) в eαt раз с одновременным вращением на угол β.
185
Поэтому, очевидно, для любого вектора d ∈ R2 существуют такие числа τ1 и τ2 , что h∗ g τ1 d > 0, h∗ g τ2 d < 0. Так как z(t; d) = eQt d,
d ∈ R2 ,
— решение системы (1) с начальным условием z(0; d) = d, то (см. п.1,§ 2) g t = eQt . Следовательно, имеют место неравенства (4). Лемма 2 доказана. Следующая лемма является обобщением леммы 2. Лемма 3. Пусть матрица Q имеет пару комплексно-сопряженных собственных чисел α ± iβ кратности 1, а остальные ее собственные числа λj (Q) удовлетворяют условию Re λj (Q) < α (j = 1, · · · , n − 2). Пусть, далее, для векторов h ∈ Rn и d ∈ Rn выполнены неравенства det(d, Qd, . . . , Qn−1 d) 6= 0, (5) det(h, Q∗ h, . . . , (Q∗ )n−1 h) 6= 0.
(6)
Тогда существуют числа τ1 и τ2 такие, что h∗ eQτ1 d > 0,
h∗ eQτ2 d < 0,
(7)
т.е. решение x = eQt d системы (1) попадает на плоскость {h∗ z = 0} в некоторый момент t = τ ∈ (τ1 , τ2 ). Напомним, что условия (5) и (6) — это условия полной управляемости пары (Q, d) и полной наблюдаемости пары (Q, h). Д о к а з а т е л ь с т в о л е м м ы 3. В силу условий леммы 3 решение z(t) = eQt d системы (1) можно представить в виде X z(t) = eαt v(t) + eλj t pj (t), j
(8)
186
где каждая компонента вектор-функции v(t) имеет вид c1 cos βt + c2 sin βt (c1 , c2 — константы), и, поэтому, v(t) — периодическая функция; pj (t) — вектор-функция, каждая компонента которой есть некоторый многочлен от t (в частности, константа). Перепишем (8) в форме z(t) = eαt (v(t) + w(t)), где w(t) =
X
e(λj −α)t pj (t).
j
Очевидно, функции v(t) и w(t) удовлетворяют условиям леммы 1. Далее, из условий (5) (полной управляемости пары (Q, d)) и (6) (полной наблюдаемости пары (Q, h)) следует соотношение h∗ v(t) 6≡ 0. Теперь, применяя следствие леммы 1, получим что справедливы неравенства (7). Лемма 3 доказана. Рассмотрим систему (8) из § 4 при n = 2, т.е. систему x˙ = (A + bs(t)∗ c∗ )x,
x ∈ R2 ,
(9)
где периодическая матрица s(t) имеет вид (9) (§ 4). Из теоремы § 4 и леммы 2 вытекает следующая Теорема. Пусть для системы (9) существуют матрицы s0 и σ0 , удовлетворяющие следующим условиям: 1) det bs∗0 c∗ 6= 0, T r bs∗0 c∗ 6= 0; если det bs∗0 c∗ = 0, то пусть выполняется хотя бы одно из неравенств det A 6= 0 или det(a1 , r2 ) + det(r1 , a2 ) 6= 0, где a1 , a2 и r1 , r2 — первый и второй столбцы матриц A и bs∗0 c∗ соответственно: A = (a1 , a2 ),
bs∗0 c∗ = (r1 , r2 ).
2) матрица A + bσ0 c имеет комплексно-сопряженные собственные числа. Тогда существует периодическая матрица s(t) такая, что система (9) асимптотически устойчива. Д о к а з а т е л ь с т в о . Положим в формуле (9) из § 4 s1 = s2 = µs0 ,
σ(t) ≡ σ0 ,
187
где |µ| — достаточно большое число и T r µbs∗0 c∗ < 0. Из последнего неравенства следует, что (при достаточно большом |µ| ) T r (A + µbs∗0 c∗ ) < 0.
(10)
A + µbs∗0 c∗ .
Пусть λ и κ — собственные числа матрицы Тогда в силу (10) λ + κ < 0. Следовательно, одно из чисел λ, κ отрицательно, скажем λ. Если det bs∗0 c∗ 6= 0, то при достаточно большом |µ| det(A + µbs∗0 c∗ ) 6= 0. Последнее соотношение имеет место и тогда, когда det bs∗0 c∗ = 0. Действительно, в этом случае (по условию теоремы), как легко видеть, квадратичная функция ϕ(ε) = det(bs∗0 c∗ + εA) отлична от нуля для всех достаточно малых ε и, значит, при достаточно большом |µ| ϕ(1/µ) 6= 0. Следовательно, λκ 6= 0, т.е. κ 6= 0. В зависимости от знака κ особая точка x = 0 системы (9), где s(t) ≡ s0 или седло (если κ > 0 ), или устойчивый узел (если κ < 0 ). В любом случае система (9), где s(t) ≡ s0 , имеет одномерные инвариантные устойчивое многообразие L1 (соответствующее собственному числу λ < 0) и ( устойчивое или неустойчивое) многообразие M1 (соответствующее собственному числу κ ). Поэтому для этой системы выполнены условия (3), (4) и (7) из § 4 с λ1 = λ2 = −λ, κ1 = κ2 = κ (L1 ≡ L2 , M1 ≡ M2 ). Заметим, что если κ < 0, то система (9) будет, очевидно, асимптотически устойчива. В силу леммы 2 и условия 2) теоремы для системы (9), где s(t) ≡ s0 , выполнено "условие вложения многообразий"(6) из § 4. Итак, выполнены все условия основной теоремы из § 4 и, следовательно, система (9) с функцией s(t) вида (9) (§ 4), где s1 = s2 = s0 , σ(t) ≡ σ0 , асимптотически устойчива. Теорема доказана.
188
§ 6. Стабилизация линейной системы в скалярном случае (когда вход и выход — скалярные функции) Рассмотрим теперь важный для теории управления случай, когда в системе x˙ = Ax + bu, y = c∗ x, x ∈ Rn , (1) (A — вещественная (n × n) -матрица), b и c — одностолбцовые nмерные векторы (вход u и выход y являются скалярными функциями). Всюду в дальнейшем будем предполагать, что передаточная функция W (p) = c∗ (A − pI)−1 b системы (1) невырождена. В силу теоремы 2 из § 3, гл.II, это означает, что пара (A, b) полностью управляема, а пара (A, c) полностью наблюдаема. Вначале докажем две леммы, устанавливающие полную наблюдаемость и полную управляемость системы x˙ = (A + µbc∗ )x,
x ∈ Rn ,
(2)
где µ 6= 0 — параметр, обладающий (n − 1)-мерным и одномерным интегральными многообразиями. Лемма 1. Если гиперплоскость {x ∈ Rn : h∗ x = 0}, где h ∈ Rn , h 6= 0 — интегральное многообразие для системы (2), то пара (A, h) полностью наблюдаема. Д о к а з а т е л ь с т в о . Предположим противное — пара (A, h) неполностью наблюдаема. Тогда в силу теоремы двойственности Калмана (см.§ 3, гл.II) пара (A∗ , h) неполностью управляема и, следовательно, не выполнено свойство (V Iу ) полной управляемости (см. § 1, гл.II ), т.е. существуют ненулевой вектор ξ ∈ Cn = CRn и число λ ∈ C такие, что h∗ ξ = 0,
Aξ = λξ (ξ 6= 0).
(3) c∗ ξ
Из полной наблюдаемости пары (A, c) следует неравенство 6= 0. Действительно, в противном случае мы имели бы неполностью наблюдаемую пару (A, c). Так как {h∗ x = 0} — интегральное многообразие для системы (2), то векторное поле, определяемое системой (2), ортогонально вектору h, т.е. h∗ (A + µbc∗ )x = 0 ∀x ∈ {h∗ x = 0}
189
(подпространство {h∗ x = 0} ⊂ Rn инвариантно относительно оператора A + µbc∗ ). Отсюда следует, что h∗ (A + µbc∗ )k x = 0, {h∗ x
k = 1, 2, . . . ,
Rn .
для всех x ∈ = 0} ⊂ Из последних равенств выводим, что имеют место также соотношения h∗ (A + µbc∗ )k z = 0, k = 1, 2, . . . , для всех z из комплексной гиперплоскости {z ∈ CRn : h∗ z = 0} (z = x + iy, x, y ∈ Rn ). При k = 1 и z = ξ, в силу (3), получим 0 = h∗ Aξ + µh∗ bc∗ ξ = µh∗ bc∗ ξ. Отсюда h∗ b = 0 (так как c∗ ξ 6= 0). При k = 2 и z = ξ, используя (3) и предыдущее равенство, будем иметь 0 = h∗ (A + µbc∗ )2 ξ = λh∗ (A + µbc∗ )ξ + µh∗ (A + µbc∗ )bc∗ ξ = = µ(h∗ Ab + µh∗ bc∗ b)c∗ ξ = µ(h∗ Ab)c∗ ξ. Отсюда h∗ Ab = 0, так как µ 6= 0, c∗ ξ 6= 0. Продолжая этот процесс далее, получим равенства h∗ Ak b = 0 (k = 0, . . . , n − 1). Из полной управляемости пары (A, b) следует, что (см.§ 1, гл.II) векторы b, Ab, . . . , An−1 b линейно независимы и, следовательно, из предыдущих равенств следует, что h = 0. Полученное противоречие доказывает, что предположение о полной ненаблюдаемости пары (A, h) не верно. Лемма 1 доказана. Лемма 2. Если прямая {αd}, α ∈ R, d ∈ Rn , (d 6= 0) — интегральное многообразие для системы (2), то пара (A, d) полностью управляема. Д о к а з а т е л ь с т в о . Из условия леммы 2 следует, что прямая {αd} — одномерное инвариантное подпространство относительно оператора A + µbc∗ , т.е. (A + µbc∗ )x = α1 d,
190
если x = αd (α, α1 ∈ R). Отсюда получаем (A + µbc∗ )k d = α1k d,
(4)
где k = 0, 1, 2, . . .. Из полной наблюдаемости пары (A, c) имеем c∗ d 6= 0. Действительно, в противном случае имели бы Ad + (A + µbc∗ )d = α1 d, т.е. Ad = α1 d и c∗ d = 0, что противоречит полной наблюдаемости пары (A, c). Поэтому для вектора z ∈ Rn такого, что z ∗ d = 0, z ∗ Ad = 0, · · · , z ∗ An−1 d = 0,
(5)
будем иметь из (4) последовательно при k = 1, 2, . . . , n − 1: 0 = α1 z ∗ d = z ∗ (A + µbc∗ )d = µz ∗ bc∗ d. Отсюда z ∗ b = 0, так как c∗ d 6= 0. Далее, используя последнее равенство, получаем 0 = α12 z ∗ d = z ∗ (A + µbc∗ )2 d = z ∗ A2 d + µz ∗ bc∗ Ad+ +µz ∗ Abc∗ d + µ2 z ∗ bc∗ bc∗ d = µz ∗ Abc∗ d. Отсюда z ∗ Ab = 0 (так как µ 6= 0 и c∗ d 6= 0 ). Продолжая этот процесс далее, получим равенства z ∗ b = 0, z ∗ Ab = 0, . . . , z ∗ An−1 b = 0. Из последних равенств и полной управляемости пары (A, b) следует, что z = 0. Таким образом, из соотношений (5) имеем z = 0. Это означает, что пара (A, d) полностью управляема. Лемма 2 доказана. Следующая теорема устанавливает стабилизируемость системы (1) с помощью обратной связи u = s(t)y,
(6)
где s(t) — кусочно-постоянная периодическая функция с достаточно большим периодом T . Теорема. Пусть для системы (1) выполнены предположения основной теоремы из § 4, причем dim M1 = 1,
dim L2 = n − 1
191
Пусть, далее, s1 , s2 и σ0 — некоторые числа, причем σ0 6= sj (j = 1, 2) и матрица Q = A + σ0 bc∗ , где σ0 6= sj (j = 1, 2) имеет комплексно-сопряженные собственные значения α ± iβ кратности 1, а остальные ее собственные значения λj удовлетворяют условию Re λj < α. Тогда существует периодическая функция s(t) вида (9) (§ 4), где σ(t) ≡ σ0 (s1 , s2 , σ0 ∈ R) такая, что система (1),(6) асимптотически устойчива. Д о к а з а т е л ь с т в о . Пусть h — вектор, нормальный к подпространству L2 : h⊥L2 , т.е. L2 = {x ∈ Rn : h∗ x = 0}. (Напомним, что L2 — устойчивое интегральное многообразие для системы x˙ = (A + s2 bc∗ )x.) Тогда из неравенства σ0 6= s2 , полной управляемости пары (A, b) и полной наблюдаемости пары (A, c) по лемме 1, примененной к системе x˙ = (Q + µbc∗ )x, x ∈ Rn , (7) ∗ где µ = s2 − σ0 , Q = A + σ0 bc , следует полная наблюдаемость пары (Q, h). Пусть теперь d — произвольный ненулевой вектор из (одномерного) подпространства M1 : d ∈ M1 (d 6= 0). Тогда по лемме 2, примененной к системе (7), где µ = s1 − σ0 , пара (Q, d) полностью управляема. Таким образом, для матрицы Q и векторов d и h выполнены все условия леммы 3 из § 5. Поэтому, из этой леммы следует существование числа τ такого, что h∗ eQτ d = 0. Из линейности преобразования eQτ следует, что eQτ переводит одномерное подпространство M1 (прямую) в некоторое подпространство (прямую)M10 лежащее в L2 , т.е. (рис.19) eQτ M1 = M10 ⊂ L2 ,
192
Рис. 19. Преобразование θτ = eQτ за время τ переводит одномерное многообразие M1 в многообразие M10 , лежащее в устойчивом многообразии L2 = {h∗ x = 0}.
Тем самым выполнено "условие вложения многообразий"(здесь = eQτ , {eQt } — фазовый поток системы x˙ = Qx, x ∈ Rn ). Итак, выполнены все условия основной теоремы (§ 4). Поэтому система (1), (6) с кусочно-постоянной периодической функцией s(t) вида (9) (§ 4), где s1 , s2 — некоторые числа, а σ(t) ≡ σ0 , σ0 ∈ R, u0 6= sj (j = 1, 2), асимптотически устойчива. Теорема доказана. θ0τ
§ 7. Проверка "условия вложения многообразий", основанная на импульсном воздействии на неустойчивое интегральное многообразие В предыдущих параграфах 5 (леммы 1-3) и 6 (леммы 1, 2) были получены эффективные условия для проверки выполнения условия (6) из § 4, когда вращение подпространства было обусловлено наличием комплексных собственных значений. Ниже мы изложим другой подход, который состоит в импульсном воздействии σ(t) = µ на подпространство M1 с большим значением |µ| на малом промежутке времени. В этом случае вектор скорости x˙ часто оказывается близок к вектору γb, где γ — некоторое число. Опишем этот подход более подробно.
193
1. Импульсное воздействие на неустойчивое многообразие. Рассмотрим систему x˙ = (A + µbc∗ )x (x ∈ Rn ),
(1)
где µ 6= 0 — большой параметр: |µ| À 1. Всюду в дальнейшем будем считать, что b и c — одностолбцовые n-мерные векторы, s(t) в системе (8) из § 4 кусочно-постоянная скалярная периодическая функция, пара (A, b) полностью управляема и пара (A, c) полностью наблюдаема. Лемма 1. Пусть c∗ b = 0 и для векторов h ∈ Rn и d ∈ Rn выполнены неравенства h∗ b 6= 0,
c∗ d 6= 0.
Тогда существуют числа µ и τ (µ) > 0 такие, что h∗ x(τ (µ); d) = 0,
lim τ (µ) = 0.
µ→+∞
Д о к а з а т е л ь с т в о . Введем в рассмотрение числа t0 = −
h∗ d (1 + 2|µ| · kbk · kckt0 )kdk , K= . µh∗ bc∗ d 1 − (2kAkt0 + 4|µ| · kAk · kbk · kckt20 )
Выберем число µ таким, что t0 > 0 и 2kAkt0 + 4|µ|kAk · kbk · kckt20 < 1. (легко видеть, что левая часть этого неравенства есть O(1/µ), так как t0 = O(1/µ) ). Умножая обе части уравнения (1) на c∗ и оценивая |c∗ x|, ˙ будем иметь при t ∈ [0, 2t0 ]: |c∗ x(t; ˙ d)| = |c∗ Ax(t; d)| ≤ kAkkck · max kx(t; d)k. t∈[0,2t0 ]
(Здесь x(t; d) — решение уравнения (1) с начальным условием x(0; d) = d.) Поэтому при t ∈ [0, 2t0 ] |c∗ x(t; d)−c∗ d| = |c∗ x(η; ˙ d)t| ≤ 2kAkkckt0 max kx(t; d)k (0 < η < t). t∈[0,2t0 ]
194
Отсюда и из уравнения (1) следует, что ¯t ¯R Rt ∗ |x(t; d) − d − µbc d · t| = ¯¯ Ax(τ ; d)dτ + µ b[c∗ x(τ ; d)dτ − 0 0 ¯ 0 + 4|µ|kbk · kAk · kckXt ¯ 2= − c∗ d]dτ | ≤ 2kAkXt 0 ¯ = (2kAkt0 + 4|µ|kAk · kbk · kckt20 )X, ¯ = maxt∈[0,2t ] kx(t; b)k. Используя оценку (2), получаем где X
(2)
0
kx(t; d)k ≤ kx(t, d) − d − µbc∗ dtk + kd + µbc∗ d · tk ≤ 2 ¯ ≤ X(2kAkt 0 + 4|µ| · kbk · kckt0 ) + kdk(1 + 2|µ|kbk · kckt0 ). ¯ ≤ K. С учетом последней оценки из (2) получим: Отсюда имеем: X |h∗ x(t; d)−h∗ d−µh∗ bc∗ d·t| ≤ (2kAkt0 +4|µ|·kAk·kbk·kck·t20 )·khkK (3) для всех t ∈ [0, 2t0 ]. Так как 1 (2kAkt0 + 4|µ| · kAk · kbk · kckt20 )khkK = O( ), µ (в силу того, что t0 = O(1/µ), ), то из (3) имеем 1 |h∗ x(t; d) − h∗ d − µh∗ bc∗ d · t| ≤ O( ). µ ∗ ∗ Очевидно, что h x(0; d) = h d. При t = 2t0 из (4) получаем 1 |h∗ x(2t0 ; d) + h∗ d| ≤ O( ). µ Из последней оценки следует, что
(4)
h∗ x(2t0 (µ); d) → −h∗ d при |µ| → ∞, т.е. при достаточно больших значениях |µ| функция (от µ) h∗ x(2t0 (µ), d) имеет тот же знак, что и −h∗ d. Поскольку x(0; d) = d, то h∗ x(t; d) меняет свой знак на отрезке [0, 2t0 ] (при достаточно больших |µ| ). Следовательно, при достаточно больших |µ| существует число τ (µ) ∈ [0, 2t0 ] такое, что h∗ x(τ (µ); d) = 0, причем τ (µ) → 0 при µ → ∞. Лемма 1 доказана. Лемма 2. Пусть c∗ b 6= 0 (b, c ∈ Rn ), и для векторов h ∈ Rn и d ∈ Rn выполнены неравенства h∗ dc∗ b h∗ b 6= 0, c∗ d 6= 0, ∗ ∗ < 1. h bc d
195
Тогда существуют числа µ и τ (µ) > 0 такие, что h∗ x(τ (µ), d) = 0, lim τ (µ) = 0. µ→∞
Д о к а з а т е л ь с т в о . Введем в рассмотрение числа µ ¶ 1 h∗ dc∗ b t0 = ∗ ln 1 − ∗ ∗ , µc b h bc d ∗
K=
[1 + kbk · kck · |c∗ b|−1 (1 − e2µc bt0 ]kdk . 1 − [2kAkt0 + 2kAk · kbk · kck · |c∗ b|−1 t0 (1 − e2µc∗ bt0 )]
Выберем число µ таким, что t0 > 0 (тогда µc∗ b < 0 ) и ∗ bt 0
2kAkt0 + 2kAkkbk · kck · |c∗ b|−1 t0 (1 − e2µc
) < 1.
(это возможно, так как t0 = O(1/µ) ). Как и в доказательстве леммы 1, для решения x(t; d), x(0; d) = d уравнения (1) будем иметь при t ∈ [0, 2t0 ]: ¯ |c∗ x(t; ˙ d) − µc∗ b(c∗ x(t; d))| = |c∗ Ax(t; d)| ≤ kAk · kck · X, ¯ = maxt∈[0,2t ] x(t; d). Таким образом, функция c∗ x(t, d) удовлегде X 0 творяет следующему дифференциальному неравенству |y˙ − ky| ≤ M,
(5)
¯ Решая неравенство (5) и полагая где k = µc∗ b, M = kAk · kckX. ∗ y(t) = c x(t; d), получим при t ∈ [0, 2t0 ]: ∗
∗
∗
µc∗ bt
|c x(t; d) − c de
1 − e2µc bt0 ¯ kAk · kck · X. |≤ −µc∗ b
(6)
Из уравнения (1) имеем Rt ∗ x(t; d) − d − µb c∗ deµc bτ dτ 0
=
Rt
Ax(τ ; d) dτ +
0
Rt ∗ +µb [c∗ x(τ ; d)c∗ deµc bτ ] dτ. 0
(7)
196
Оценивая последний интеграл в (7) с использованием неравенства (6) и учитывая, что Zt ∗ bτ
(c∗ d)eµc
dτ =
0
c∗ d µc∗ bt (e − 1), µc∗ b
получим из (7): bc∗ d ∗ |x(t; d) − d − ∗ (eµc bt − 1)| ≤ c b £ ¤ ∗ ¯ ≤ 2kAkt0 + 2kAk · kbk · kck · |c∗ b|−1 t0 (1 − e2µc bt0 X.
(8)
Имеем: bc∗ d µc∗ bt bc∗ d µc∗ bt (e − 1)k + kd + (e − 1)k. c∗ b c∗ b Применяя оценку (8) к первому слагаемому в правой части последнего неравенства и беря от обеих частей полученного неравен¯ ≤ K. Отсюда и из (8) следует, ства maxt∈[0,2t0 ] , получаем оценку: X что ¯ ¯ ∗ ∗ ¯ ∗ ¯ ¯h x(t; d) − h∗ d − h bc d (eµc∗ bt − 1)¯ ≤ ¯ ¯ (9) c∗ b £ ∗ bt ¤ ∗ −1 2µc 0 ≤ 2kAkt0 + 2kAk · kbk · kck · |c b| t0 (1 − e ) · khkK kx(t; d)k ≤ kx(t; d) − d −
для всех t ∈ [0, 2t0 ]. Правая часть последнего неравенства есть O(1/µ), так как t0 = O(1/µ). Как и в конце доказательства леммы 1, с учетом того, что µ ¶ h∗ dc∗ b h∗ dc∗ b h∗ dc∗ b µc∗ bt0 2µc∗ bt0 e =1− ∗ ∗ , 1−e = ∗ ∗ 2− ∗ ∗ , h bc d h bc d h bc d имеем из (9) при t = 2t0 : ¯ ¶¯ µ ∗ ∗ ¯ ∗ ¯ ¯h x(2t0 ; d) + h∗ d 3 − h dc b ¯ ≤ O(1/µ). ¯ ∗ ∗ h bc d ¯ Отсюда получаем при |µ| → ∞:
¶ µ h∗ dc∗ b . h x(2t0 (µ); d) → −h d 3 − ∗ ∗ h bc d ∗
Учитывая, что
∗
h∗ dc∗ b < 1, h∗ bc∗ d
197
и h∗ x(0; d) = h∗ d, получаем, что (h∗ x(0; d))(h∗ x(2t0 ; d)) < 0, т.е. функция h∗ x(t; d) имеет (при достаточно больших значениях |µ| ) различные знаки на концах отрезка [0, 2t0 ]. Следовательно, существует число τ (µ) ∈ [0, 2t0 ] такое, что h∗ x(τ (µ), d) = 0, причем τ (µ) → 0 при µ → +∞. Лемма 2 доказана. 2. Случай размерности n − 1 (коразмерности 1) устойчивого многообразия. Рассмотрим теперь систему x˙ = Ax + bu,
y = c∗ x,
x ∈ Rn ,
(10)
(где A — постоянная (n × n)-матрица, b и c — одностолбцовые nмерные векторы) со скалярным входом u и скалярным выходом y. С помощью леммы 1 доказывается следующая Теорема 1. Пусть для системы (10) выполнены предположения основной теоремы из § 4, причем dim M1 = 1, Пусть, далее,
c∗ b
dim L2 = n − 1.
= 0. Тогда существует обратная связь u = s(t)y,
(11)
где s(t) — кусочно-постоянная периодическая функция вида (9) (σ(t) ≡ const ) ( § 4), что система (10), (11), т.е. система x˙ = (A + s(t)bc∗ )x,
x ∈ Rn ,
(12)
асимптотически устойчива. Д о к а з а т е л ь с т в о . Как и в начале доказательства теоремы из § 6 из полной управляемости пары (A, b) и полной наблюдаемости пары (A, c) по леммам 1 и 2 из § 6 следует полная наблюдаемость пары (A + sbc∗ , h) для любого числа s 6= s2 и полная управляемость пары (A + sbc∗ , d) для любого числа s 6= s1 . Здесь s1 и s2 — некоторые числа, h — вектор, нормальный к устойчивому инвариантному многообразию (гиперплоскости) L2 системы x˙ = (A + s2 bc∗ )x (x ∈ Rn ),
198
а d — ненулевой вектор из инвариантного многообразия (прямой) M1 системы x˙ = (A + s1 bc∗ )x (x ∈ Rn ). Отсюда следует, что h∗ b 6= 0 и c∗ d 6= 0. Действительно, предположим противное. Пусть h∗ b = 0. Тогда b ∈ L2 , так как h⊥L2 . В силу того, что подпространство L2 инвариантно относительно оператора A + s2 bc∗ , будем иметь h∗ (A + s2 bc∗ )k b = 0 при k = 1, 2, 3, . . .. При k = 1, с учетом равенства h∗ b = 0, имеем 0 = h∗ (A + s2 bc∗ )b = h∗ Ab. Отсюда при k = 2 получаем: 0 = h∗ (A + s2 bc∗ )2 b = h∗ A(A + s2 bc∗ )b = h∗ A2 b. При k = 3, с учетом предыдущих равенств, имеем: 0 = h∗ (A + s2 bc∗ )3 b = h∗ A(A + s2 bc∗ )2 b = h∗ A2 (A + s2 bc∗ ) = h∗ A3 b. Продолжая этот процесс далее, получим при k = n − 1 0 = h∗ (A + s2 bc∗ )n−1 b = h∗ An−1 b. Из полученных равенств h∗ b = 0,
h∗ Ab = 0,
h∗ A2 b = 0, . . . , h∗ An−1 b = 0
следует, что векторы b, Ab, A2 b, . . . , An−1 b линейно зависимы, что противоречит свойству (Iу ) полной управляемости пары (A, b). Следовательно, предположение, что h∗ b = 0, неверно. Итак, h∗ b 6= 0. Для установления справедливости неравенства c∗ d 6= 0 допустим противное: c∗ d = 0. Тогда в силу инвариантности подпространства M1 относительно оператора A + s1 bc∗ получим: γd = (A + s1 bc∗ )d = Ad, где γ ∈ R. Равенства Ad = γd, d∗ c = 0 противоречат свойству (V Iу ) полной управляемости пары (A∗ , c), или (в силу теоремы Калмана)
199
свойству полной наблюдаемости пары (A, c). Полученное противоречие доказывает, что c∗ d 6= 0. Таким образом, выполняются все условия леммы 1 и, поэтому, существуют числа τ и τ (µ) такие, что для системы (1) имеют место соотношения: h∗ x(τ (µ); d) = 0, lim τ (µ) = 0,
µ→∞ τ (µ) т.е. преобразование θ0 за время от 0 τ (µ) d ∈ M1 в вектор θ0 d ∈ L2 = {h∗ x = 0}. τ (µ) Так как преобразование θ0 линейно
до τ (µ) переводит вектор
(см. следствие 3 теоремы 1 τ (µ) из § 2), то оно переводит подпространство M1 в θ0 M1 ⊂ L2 (см. рис.44). Последнее означает, что выполнено "условие вложения многообразий"из § 4. Отсюда, в силу основной теоремы из § 4, вытекает утверждение теоремы 1. Теорема 1 доказана. Теперь, используя лемму 2, докажем следующую теорему. Теорема 2. Пусть в системе (10) c∗ b 6= 0, и матрица A имеет собственное значение κ > 0 и n−1 собственное значение с вещественными частями меньшими, чем −λ, где λ > κ. Пусть, далее, выполнено неравенство c∗ b < 1. (13) limp→κ (κ − p)W (p) (W (p) — передаточная функция системы (10)). Тогда существует периодическая функция s(t) вида (9) из § 4 такая, что система (12) асимптотически устойчива. Д о к а з а т е л ь с т в о . В системе (1) из § 4 положим s1 = s2 = 0. Тогда система x˙ = Ax имеет в силу условий теоремы 2 одномерное неустойчивое многообразие M (соответствующее собственному значению κ > 0 ) и устойчивое n − 1-мерное многообразие L (соответствующее собственным значениям λj с Re λj < −λ < 0, j = 1, · · · , n − 1) (рис.20).
200
Рис. 20. Устойчивое L и неустойчивое M многообразия системы (1).
Не умаляя общности, можно считать, что матрица A имеет следующий вид: µ ¶ κ 0 A= , (14) 0 A2 где A2 — гурвицева матрица порядка (n − 1) × (n − 1) (в противном случае, к такому виду можно привести матрицу A невырожденным преобразованием). Положим: L1 = L2 = L,
M1 = M2 = M
(L1 , L2 ; M1 , M2 — интегральные многообразия, фигурирующие в условиях основной теоремы из § 4). Вектор h, нормальный к подпространству L имеет вид: h = (1, 0 . . . 0)∗ . За ненулевой вектор d ∈ M можно взять вектор h (d := h), так как мы выбрали базис пространства так, что матрица A имеет вид (14) и M ⊥L. Представим векторы b и c в виде µ ¶ µ ¶ c1 b1 , c= , b= b2 c2 где b1 , c1 ∈ R, b2 , c2 ∈ Rn−1 . Тогда имеем h∗ b = b1 ,
c∗ d = c1 .
201
При этом b1 6= 0, c1 6= 0. Действительно, если бы b1 = 0, то µ ¶ µ ¶ µ ¶ µ ¶ 0 0 0 0 2 n−1 b= ; Ab = ,A b = ,··· ,A b= , b2 A2 b2 A22 b2 A2n−1 b2 и, следовательно, не выполнялось бы свойство (Iу ) полной управляемости пары (A, b). Аналогично, если бы c1 = 0, то ¢ ¡ ¡ ¢ c = c02 ; A∗ c = A∗0c2 , (A∗ )2 c = 2 ¢ ¡ ¢ ¡ 0 = (A∗0)2 c2 , · · · , (A∗ )n−1 c = (A∗ )n−1 c2 , 2
2
и, стало быть, не выполнялось бы свойство полной наблюдаемости пары (A, c). Значит, h∗ b 6= 0 и c∗ d 6= 0. Следовательно, по лемме 2 существуют числа µ и τ (µ) такие, что для системы (1) выполнено соотношение (см. рис.19) h∗ x(τ (µ); d) = 0, τ (µ)
и, следовательно, включение θ0 образий"из § 4), если
M ⊂ L ("условие вложения много-
c∗ b h∗ dc∗ b = < 1. h∗ bc∗ d b1 c1 Последнее неравенство обеспечивается условием (13) теоремы 2. Действительно, для этого достаточно заметить, что передаточная функция W (p) = c∗ (A − pIn )−1 b имеет вид: µ ¶µ ¶ b1 c1 b1 (κ − p)−1 0 ∗ = W (p) = (c1 , c2 ) + c∗2 D(p)b2 , 0 D(p) b2 κ−p ( где D(p) = (A − pIn−1 )−1 и, поэтому, lim (κ − p)W (p) = b1 c1 .
κ→p
Так как λ > κ, то выполнены все условия основной теоремы из § 4, и, следовательно, система (12) асимптотически устойчива. Теорема 2 доказана. Теорема 3. Предположим, что c∗ b 6= 0 и существуют числа s1 6= s2 такие, что: 1) матрица A + s1 bc∗ имеет положительное собственное значение κ1 ;
202
2) матрица A + s2 bc∗ имеет одно положительное собственное значение κ2 и n − 1 собственное значение с отрицательными вещественными частями; 3) выполнено условие (7) основной теоремы из § 4; 4) имеет место неравенство s1 − s2 c∗ b < 1. κ2 − κ1 Тогда существует периодическая функция s(t) вида (9) (§ 4) такая, что система (12) асимптотически устойчива. Д о к а з а т е л ь с т в о . Как и в доказательстве теоремы 2, не умаляя общности, можно считать, что матрица A + s2 bc∗ и векторы b и c имеют вид µ ¶ ¶ µ ¶ µ b1 c1 κ2 0 ∗ , b= , c= , A + s2 bc = 0 A2 c2 b2 где A2 — гурвицева (n−1)×(n−1)-матрица; b1 , c1 ∈ R; b2 , c2 ∈ Rn−1 . В этом случае вектор h, нормальный к подпространству L2 , имеет вид: h = (1, 0 · · · 0)∗ . Рассмотрим ненулевой вектор d ∈ M1 . Для этого вектора выполнено соотношение (A + s1 bc∗ )d = κ1 d, так как M1 — инвариантное подпространство (прямая), определяемое собственным значением κ1 > 0 (d — соответствующий собственный вектор) матрицы A + s1 bc∗ . Последнее соотношение можно записать в виде (A + s2 bc∗ − κ1 I)d = (s2 − s1 )b(c∗ d) или
d = (s2 − s1 )(A + s2 bc∗ − κ1 I)−1 b(c∗ d). Из этого равенства, очевидно, вытекает, что c∗ d 6= 0. Отсюда следует равенство h∗ d = (s2 − s1 )h∗ (A + s2 bc∗ − κ1 I)−1 b(c∗ d). Поэтому условие
h∗ dc∗ b 0 такое, что
(22) |µ0 |
существует
z(τ0 (µ0 ; d); d) ∈ Ω(µ0 ). Далее, двигаясь по многообразию Ω(µ0 ) вдоль траектории ϕ(t; x0 , µ0 ), x0 ∈ L2 , системы (1) с µ = µ0 (если ϕ(t; x0 , µ0 ) приближается к L2 при возрастании t) или системы (1) с µ = −µ0 (если ϕ(t; x0 , µ0 ) удаляется от L2 при возрастании t) достигнем в некоторый момент t = τ > max{τ0 (µ0 ; d), τ0 (−µ0 , d)} множества L2 . Здесь τ0 (−µ0 ; d) — время достижения траекторией системы (20) интегрального многообразия Ω(−µ0 ) системы (1) с µ = −µ0 (рис. 21)
208
Рис.21. Отображение неустойчивого многообразия M1 в устойчивое L2 .
Заметим, что в силу автономности рассматриваемых систем за счет выбора движений вдоль траекторий, образующих многообразия Ω(µ0 ) и Ω(−µ0 ), можно добиться того, чтобы время τ достижения множества L2 было одним и тем же для всех точек d ∈ M1 . Отметим также, что многообразия Ω(µ0 ) и Ω(−µ0 ) достаточно близки друг к другу, но направления движений на траекториях, составляющих эти многообразия, различные (это следует из того, что решения систем x˙ = (A/µ0 + bc∗ )x и x˙ = (−A/µ0 + bc∗ )x при достаточно большом |µ0 | сколько угодно близки к решениям системы (20) по теореме о непрерывной зависимости решения от параметра). Таким образом, отображение неустойчивого подпространства M1 (прямой) в устойчивое L2 (размерности n − 2) происходит в два этапа. Сначала под действием фазового потока {f t } системы (22) точки множества M1 , двигаясь вдоль траекторий потока {f t } в течение времени τ0 = τ0 (µ0 , d) (зависящим от µ0 и точки d ∈ M1 ), попадают
209
на интегральное многообразие Ω(µ0 ) системы (1) с µ = µ0 или интегральное многообразие Ω(−µ0 ) системы (1) с µ = −µ0 , а затем на интервале времени (τ0 , τ ), двигаясь под действием фазового потока {g t } системы (1) с µ = µ0 (или µ = −µ0 ) вдоль траекторий этого потока (вдоль многообразия Ω(µ0 ) или Ω(−µ0 )), достигают множества L2 в момент t = τ , т.е. gττ0 f0τ0 M1 ⊂ L2 . Следовательно, выполняется "условие вложения многообразий"(6) из § 4 (здесь θ0τ := gττ0 f0τ0 ). Итак, выполнены все условия основной теоремы (§ 4) и, поэтому, система (12) асимптотически устойчива. Теорема 4 доказана. § 8. Необходимые условия стабилизации В предыдущих параграфах были даны достаточные условия стабилизируемости рассматриваемых систем. Здесь мы приведем необходимые условия стабилизируемости системы x˙ = Ax + bu,
y = c∗ x (x ∈ Rn )
(1)
(где A — постоянная (n×n)-матрица, b, c ∈ Rn ) со скалярным входом u ∈ R и скалярным выходом y ∈ R. Предположим, что передаточная функция W (p) = c∗ (A − pI)−1 b системы (1) невырождена. Тогда ее можно представить в виде отношения ν(p) W (p) = , ∆(p) двух многочленов ν(p) = cn pn−1 + cn−1 pn−2 + · · · + c1 , ck ∈ R, ∆(p) = pn + an pn−1 + · · · + a1 , ak ∈ R (k = 1, . . . , n), не имеющих общих нулей (здесь ∆(p) — характеристический многочлен матрицы A). Имеет место следующая теорема, дающая достаточные условия невозможности стабилизации системы (1).
210
Теорема 1. Предположим, что для системы (1) выполнены следующие условия: 1) при n > 2 c1 ≤ 0, . . . , cn−1 ≤ 0 (при n = 2 c1 ≤ 0), 2) c1 (an − cn−1 ) > a1 c1 + c2 (an − cn−1 ) > a2 ... ... ... cn−2 + cn−1 (an − cn−1 ) > an−1 . Тогда не существует функции s(t), для которой система x˙ = (A + s(t)bc∗ )x
(x ∈ Rn )
(2)
асимптотически устойчива. Д о к а з а т е л ь с т в о . В силу следствия теоремы 2 из § 3, гл.II систему (2) можно привести к виду x˙ 1 = x2 .. . x˙ n−1 = xn x˙ = −(a x + · · · + a x ) − s(t)(x + c n n n 1 1 n n−1 xn−1 + · · · + c1 x1 ). (3) Рассмотрим множество Ω = {x ∈ Rn : x1 ≥ 0, . . . , xn−1 ≥ 0, xn + cn−1 xn−1 + · · · + c1 x1 ≥ 0}. Докажем, что Ω положительно инвариантно относительно решений системы (3), т.е. если для решения x(t; x0 , t0 ), (x(t0 ; x0 , t0 ) = x0 ) системы (3) выполнено включение x0 ∈ Ω, то x(t; x0 , t0 ) ∈ Ω для всех t ≥ t0 (рис.22).
211
Рис.22. (Случай n = 3). Положительно инвариантное множество Ω.
Пусть решение x(t) системы (3) пересекает границу (размерности n − 1) ∂Ωj = {xj = 0, xi > 0 ∀ i 6= j, xn + cn−1 xn−1 + · · · + c1 x1 > 0} (i, j = 1, · · · , n − 1) множества Ω в момент t = τ , т.е. x(τ ) ∈ ∂Ωj . Тогда x˙ j (τ ) > 0.
(4)
Действительно, при j = 1, 2, . . . , n − 2 имеем x˙ j (τ ) = xj+1 (τ ) > 0. При j = n − 1 (и n > 2) x˙ n−1 (τ ) = xn (τ ) > −cn−1 xn−1 (τ ) − · · · − c1 x1 (τ ) ≥ 0, так как ck ≤ 0 (k = 1, . . . , n − 1) в силу условия 1) теоремы 1. При n = 2 имеем x˙ 1 (τ ) = x2 (τ ) > −c1 x1 (τ ) ≥ 0 (так как c1 ≤ 0). Пусть теперь x(τ ) ∈ ∂Ω0 , где ∂Ω0 = {xj > 0 (j = 1, . . . , n − 1), xn + cn−1 xn−1 + · · · + c1 x1 = 0} — оставшаяся (n − 1)-мерная граница множества Ω. Обозначим V (x) = xn + cn−1 xn−1 + · · · + c1 x1 .
212
Тогда в силу системы (3) имеем dV (x(t)) |t=τ dt
= −an xn − · · · − a1 x1 + cn−1 xn + · · · + c1 x2 = = (cn−1 − an )xn (τ ) + · · · + (c1 − a2 )x2 (τ ) − a1 x1 = = (cn−1 − an )(−cn−1 xn−1 (τ ) − · · · − c1 x1 (τ ))+ + · · · + (c1 − a2 )x2 (τ ) − a1 x1 (τ ) = = [−an−1 + cn−2 + cn−1 (an − cn−1 ]xn−1 (τ ) + · · · · · · + [−a2 + c1 + c2 (an − cn−1 ]x2 (τ )+ +[−a1 + c1 (an − cn−1 )]x1 (τ )
(здесь мы использовали соотношение xn (τ ) + cn−1 xn−1 (τ ) + · · · + c1 x1 (τ ) = 0). Отсюда и из условия 2) теоремы 1 следует неравенство dV (x(t)) |t=τ > 0. (5) dt Из неравенств (4) и (5) следует, что граница ∂Ω множества Ω, за исключением ее частей, имеющих размерность не больше, чем n − 2, является бесконтактной по отношению к векторному полю, определяемому системой (3) и решения системы (3) "прошивают"эту границу снаружи вовнутрь множества Ω. Отсюда и из непрерывной зависимости решений системы (3) от начальных данных следует положительная инвариантность множества Ω. Так как x˙ 1 > 0 внутри множества Ω, то из положительной инвариантности Ω вытекает, что нулевое решение x(t) ≡ 0 и, следовательно, сама система (3) не является асимптотически устойчивой ни при каком выборе функции s(t). Теорема 1 доказана. Таким образом, необходимым условием стабилизации системы (1) является нарушение хотя бы одного из условий 1) или 2) теоремы 1. Приведем теперь другое хорошо известное [16,17] достаточное условие неустойчивости системы вида (2). Теорема 2. Если для линейной системы x˙ = P (t)x,
t ∈ R, x ∈ Rn ,
(6)
с кусочно–непрерывной матрицей P (t) выполнено неравенство T r P (t) ≥ α > 0
∀t ∈ R
(7)
для некоторого положительного числа α, то система (6) неустойчива.
213
Если вместо условия (7) выполнено неравенство T r P (t) ≥ 0, то система (6) не является асимптотически устойчивой. Д о к а з а т е л ь с т в о . Пусть η1 , . . . , ηn — произвольная система линейно независимых векторов фазового пространства Rn и ψ1 (t) = ψ1 (t; η1 , t0 ), . . . , ψn (t) = ψn (t; ηn , t0 ) — фундаментальная система решений уравнения (6) (см. следствие 2 теоремы 1 из § 2), выходящих в момент t = t0 из векторов {ηk }nk=1 : ψ1 (t0 ) = η1 , . . . , ψn (t0 ) = ηn . Пусть W (t) – определитель Вронского фундаментальной матрицы Ψ(t) решений {ψk (t)}nk=1 : W (t) = det Ψ(t), Ψ(t) = (ψ1 (t), · · · , ψn (t)). Тогда по теореме Лиувилля Zt T r P (τ ) dτ
W (t) = W (t0 ) exp t0
и, следовательно, в силу условия (7) |W (t)| ≥ |W (t0 )|eα(t−t0 ) .
(8)
Если система (6) была бы устойчивой, то для любого наперед заданного шара Sε (с центром в начале координат) радиуса ε (ε > 0 — произвольное число) существовал бы шар Sδ радиуса δ такой, что преобразование gtt0 фазового пространства Rn , осуществляемое траекториями уравнения (6) за время от t0 до t, переводило бы шар Sδ (с центром в начале координат) в множество gtt0 Sδ , лежащее при любом t ≥ t0 в шаре Sε , т.е. gtt0 Sδ ⊂ Sε
∀t ∈ [t0 , +∞).
(9)
214
(gtt00 Sδ ≡ Sδ , напомним, что (см. п.1, § 2) gtt0 x0 = ψ(t; x0 , t0 )), где ψ(t; x0 , t0 ) — решение уравнения (6) с начальным условием ψ(t0 ; x0 , t0 ) = x0 ). Из (9) имеем: µ(gtt0 Sδ ) ≤ µ(Sε ) ≤ Cn εn ,
(10)
где Cn — некоторая константа (зависящая от размерности фазового пространства), µ — мера соответствующего множества. Возьмем теперь длины векторов η1 , . . . ηn настолько малыми, чтобы параллелепипед Σ0 , натянутый на векторы η1 , . . . , ηn , лежал в шаре Sδ : Σ0 ⊂ Sδ . Так как gtt0 : Rn → Rn линейное преобразование (см. следствие 3 теоремы 1 из § 2), то образ gtt0 Σ0 параллелепипеда Σ0 тоже есть параллелепипед Σt , объем µ(Σt ) которого равен µ(Σt ) = | det (gtt0 η1 , . . . , gtt0 ηn )| = | det Ψ(t)| = |W (t)|,
(11)
т.е. значению в момент t модуля определителя Вронского. Поскольку Σ0 ⊂ Sδ , то в силу (9) Σt ⊂ Sε (Σt = gtt0 Σ0 ) ∀t ≥ t0 , и, поэтому, используя (10), (11), получаем |W (t)| = µ(Σt ) ≤ Cn εn
∀t ≥ t0 .
Отсюда следует, что функция |W (t)| ограничена на промежутке [t0 , +∞). С другой стороны, из соотношения (8) следует, что |W (t)| → +∞ при t → +∞. Полученное противоречие доказывает первую часть теоремы 2. Вторая часть теоремы 2 доказывается аналогично. Действительно, асимптотическая устойчивость системы (6) означала бы, что кроме условия (9), для векторов η1 , . . . , ηn ∈ Rn выполняются еще соотношения: gtt0 η1 → 0, . . . , gtt0 ηn → 0 при t → +∞ и, следовательно, в силу (11) |W (t)| → 0
при t → +∞
вопреки неравенству |W (t)| ≥ |W (t0 )|, которое следует из формулы Лиувилля в силу условия T r P (t) ≥ 0. Теорема 2 доказана полностью.
215
Следствие. Система (2) неустойчива, если T r (A + s(t)bc∗ ) ≥ α > 0
∀t ∈ R
(α – некоторое число), и не является асимптотически устойчивой, если T r (A + s(t)bc∗ ) ≥ 0 ∀t ∈ R.
§ 9. Низкочастотная стабилизация двумерных и трехмерных систем Применим полученные в предыдущих параграфах результаты к двумерным и трехмерным системам. 1. Двумерные системы. Рассмотрим систему со скалярным входом u(t) и скалярным выходом y(t), передаточная функция которой равна c2 p + c1 W (p) = 2 , (1) p + a2 p + a1 где a1 , a2 ; c1 , c2 — некоторые вещественные числа. Будем предполагать, что c2 6= 0. Тогда, не умаляя общности, можно считать, что c2 = 1. Предположим также, что функция W (p) невырождена, т.е. c21 − a2 c1 + a1 6= 0. (2) Тогда систему с передаточной функцией (1) можно реализовать (в силу следствия теоремы 2 из § 3, гл.II) в фазовом пространстве R2 как систему вида (1) из § 1: ½ x˙ 1 = x2 , (3) x˙ 2 = −a1 x1 − a2 x2 − u, y = c1 x1 + x2 . Здесь
¶ 0 1 , −a1 −a2
µ
µ A=
b=
¶ 0 , −1
µ ¶ c1 , c= 1
µ ¶ x1 x= . x1
Из условий Рауса–Гурвица (см. § 2, гл.III)вытекает, что стационарная стабилизация системы (2) с помощью обратной связи u = s0 y, s0 = const 6= 0 возможна тогда и только тогда, когда a2 + s0 > 0,
a1 + c1 s0 > 0.
216
Легко вывести, что для существования числа s0 , удовлетворяющего последним неравенствам, необходимо и достаточно выполнения либо условия c1 > 0, либо соотношений c1 ≤ 0, a2 c1 < a1 . Рассмотрим случай, когда стационарная стабилизация невозможна: c1 ≤ 0, a2 c1 ≥ a1 . (4) Применим теорему из § 5 к системе (3). Условие 1) этой теоремы выполнено для s0 6= 0: det bs∗0 c∗ = s0 det bc∗ = 0 = s0 T r bc∗ = s0 c∗ b = −s0 6= 0.
T r bs∗0 c∗
Условие 2) этой же теоремы будет выполнено, если при некотором σ0 ∈ R характеристический многочлен p2 + (a2 + σ0 )p + (a1 + c1 σ0 ) системы (2), где u = σ0 y имеет комплексно сопряженные корни. Легко видеть, что для существования такого числа σ0 необходимо и достаточно выполнения неравенства c21 − a2 c1 + a1 > 0.
(5)
Таким образом, если выполнено неравенство (5), то в силу теоремы из § 5 существует такая обратная связь u = s(t)y, где s(t) — кусочнопостоянная периодическая функция, что система (3), где u = s(t)y, асимптотически устойчива. Этот же результат можно получить и с помощью теоремы 2 из § 7. Для этого, не умаляя общности, можно предположить, что a2 > 0. Этого всегда можно достичь выбором s0 в выражении (правой части второго уравнения системы (3), где u = s(t)y) −(a2 + s0 )x2 − (a1 + c1 s0 )x1 − (s(t) − s0 )(c1 x1 + x2 ) и переобозначениями a2 + s0 → a2 , a1 + c1 s0 → a1 , s(t) − s0 → s(t). Заметим, что, тогда из условия (2) и неравенств (4) вытекает, что a1 > 0. Из неравенства a2 > 0 и соотношений (4) следует, что матрица A в системе (2) имеет вещественные собственные числа −λ и κ разных
217
знаков: −λ < 0, κ > 0, причем λ > κ (так как −λ + κ = −a2 < 0). Далее, условие (13) в теореме 2 (§ 7) принимает здесь вид κ+λ < 1. κ + c1 (В силу (2) κ 6= −c1 .) Отсюда получаем, что все условия теоремы 2 из § 7 выполнены, если (λ − c1 )(κ + c1 ) = −c21 + a2 c1 − a1 < 0. Это неравенство совпадает с неравенством (5). Если выполнено неравенство c21 − a2 c1 + a1 < 0, то, как легко видеть, выполнены условия теоремы 1 из § 8 и, тем самым, система (3) не может быть стабилизируема ни при какой обратной связи u = s(t)y. Итак, нами получен следующий результат. Теорема 1. Пусть передаточная функция W (p) системы (3) невырождена, т.е. выполнено неравенство (2). Тогда необходимым и достаточным условием стабилизируемости системы (3) является выполнение хотя бы одного из условий: 1) c1 > 0
или
2) c1 ≤ 0, c21 − a2 c1 + a1 > 0.
(6)
При этом в стабилизирующем управлении u = s(t)y, функцию s(t) можно выбрать кусочно-постоянной периодической с достаточно большим периодом (низкочастотная стабилизация). Замечание 1. В следующей главе V будет показано с помощью процедуры усреднения, что условия 1), 2) теоремы 1 также необходимы и достаточны в другом классе стабилизирующих функций s(t) вида s(t) = s0 + s1 ω cos ωt (s0 , s1 ∈ R), где ω — достаточно большое число (высокочастотная стабилизация).
218
Замечание 2. Теорема 1 очень хорошо иллюстрирует как введение функции s(t) 6≡ s0 , s0 = const, в обратной связи u = s(t)y (нестационарная стабилизация) расширяет возможности стационарной стабилизации (s(t) ≡ s0 ): в пространстве параметров {(a1 , a2 ; c1 )} системы (3) условия (6) выделяют более широкую область, чем область, определяемая условиями Рауса-Гурвица (c1 > 0 или c1 ≤ 0, a2 c1 < a1 ) при стационарной стабилизации. 2. Трехмерные системы. 1) Пусть передаточная функция системы (3) со скалярным входом u(t) и скалярным выходом y(t) имеет вид: W (p) =
1 , p3 + αp2 + βp + γ
(7)
где α, β, γ — некоторые вещественные числа. (Очевидно, функция W (p) невырождена). Тогда такую систему (в силу следствия теоремы 2 из § 3 гл.II) можно реализовать в фазовом пространстве R3 как систему вида (1) из § 1: x˙ = x2 , x˙ 2 = x3 , (8) x˙ 3 = −(αx3 + βx2 + γx1 ) − u, y = x1 . Стационарная стабилизация u = s0 y системы (8) возможна тогда и только тогда, когда α>0
и β > 0.
(это следует из условий Рауса–Гурвица). Пусть α > 0, β ≤ 0 (в этом случае стационарная стабилизация невозможна). Применим здесь теорему 4 из § 7. Выберем σ0 > 0 так, чтобы характеристический многочлен системы (8), где u = σ0 y, имел вид: p3 + αp2 + βp + (γ + σ0 ) = (p − κ0 )(p2 + α0 p + β0 ), где α0 = α + κ0 , β0 = β + κ0 (α + κ0 ), κ0 < 0, причем σ0 = −κ02 (α + κ0 ) − βκ0 − γ.
219
При достаточно большом σ0 и, значит, — κ0 многочлен p2 + α0 p + β0 имеет два комплексных корня λ0 ± iω0 , где λ0 > 0, а исходный характеристический многочлен — один отрицательный κ0 и два комплексных корня λ0 ± iω0 . Аналогично, возьмем s1 < 0 так, чтобы характеристический многочлен системы (8), где u = s1 y, принял вид: p3 + αp2 + βp + (γ + s1 ) = (p − κ1 )(p2 + α1 p + β1 ), где α1 = α + κ1 , β1 = β + κ1 (α + κ1 ), κ1 > 0, причем s1 = −κ12 (α + κ1 ) − βκ1 − γ. При достаточно большом |s1 | и, значит, κ1 многочлен p2 + α1 p + β1 имеет два комплексных корня −λ1 ± iω1 , где λ1 = (α + κ1 )/2, причем λ1 > 0, а характеристический многочлен — один положительный и два комплексных корня −λ1 ± iω1 . Наконец, аналогично как и выше, возьмем s2 настолько большим, чтобы для характеристического многочлена системы (8), где u = s2 y, выполнялось равенство p3 + αp2 + βp + (γ + s2 ) = (p + λ2 )(p2 + α2 p + β2 ), где α2 = α − λ2 , β2 = β − λ2 (α − λ2 ), и, тем самым, этот многочлен при достаточно большом λ2 будет иметь один отрицательный корень −λ2 < 0 и два комплексных корня κ2 ± iω2 , причем κ2 = (λ22−α) > 0. Таким образом, здесь (см. теорему 4 из § 7) dim M1 = dim L2 = 1, dim M2 = dim L1 = 2 α + κ1 λ2 − α λ1 = , κ2 = 2 2 λ1 λ2 − κ1 κ2 = 12 α(λ2 + κ1 ) > 0. Следовательно, выполнены все условия теоремы 4 из § 7. Поэтому при α < 0, β ≤ 0 существует такое управление u = s(t)y, где s(t) — кусочно-постоянная периодическая функция с достаточно большим периодом, что система (8), где u = s(t)y, асимптотически устойчива. Поскольку для системы (8) (u = s(t)y) T r (A + bs(t)∗ c∗ ) = −α ∀t ∈ R, то в силу теоремы 2 из § 8 система (8) (u = s(t)y) не является асимптотически устойчивой при α ≤ 0. Таким образом, получаем следующий результат.
220
Теорема 2. Система (8) с передаточной функцией (7) стабилизируема тогда и только тогда, когда α > 0. При этом функцию s(t) в стабилизирующем управлении u = s(t)y можно выбрать кусочнопостоянной периодической с достаточно большим периодом (низкочастотная стабилизация). Замечание 1. В гл.V будет показана возможность высокочастотной стабилизации системы (8) в другом классе функций вида s(t) = s0 + s1 ω 2 cos ωt (s0 , s1 ∈ R), где ω — достаточно большое число. При этом оказывается, что, как и здесь, условие α > 0 необходимо и достаточно для стабилизируемости системы (8). Замечание 2. Как и теорема 1, теорема 2 хорошо иллюстрирует преимущества нестационарной стабилизация (условие α > 0) по сравнению со стационарной (условия α > 0, β > 0). 2) Рассмотрим систему со скалярным входом u(t) и скалярным выходом y(t) и передаточной функцией вида p , W (p) = 3 2 p + αp + βp + γ где α, β и γ — некоторые вещественные числа. Будем считать, что γ 6= 0 (условие невырожденности функции W (p)). Тогда эту систему можно реализовать (в силу следствия теоремы 2 из § 3, гл.II) в фазовом пространстве R3 как систему x˙ 1 = x2 , x˙ 2 = x3 , (9) x˙ 3 = −(αx3 + βx2 + γx1 ) − u, y = x2 . Из условий Рауса–Гурвица выводим, что стационарная стабилизация u = s0 y системы (9) возможна в том и только том случае, когда α > 0, γ > 0. Рассмотрим случай α > 0, γ < 0 (тогда стационарная стабилизация невозможна). Применим здесь теорему 1 из § 7 с s1 = s2 ; λ1 = λ2 = λ, κ1 = κ2 = κ.
221
Выберем s1 так, чтобы характеристический многочлен системы (9), где u = s1 x2 , имел вид p3 + αp2 + (s1 + β)p + γ = (p − κ)(p2 + α1 p + β1 ), где α1 = α + κ, β1 = −γ/κ, κ > 0 и γ . κ Ясно, что при достаточно малых κ и, следовательно, при достаточно больших s1 , многочлен p2 +α1 p+β1 имеет комплексные корни −λ±iω, где λ = (α +κ)/2. Очевидно, что при достаточно малых κ выполнено неравенство λ > κ. Значит, все условия теоремы 1 (§ 7) выполнены. Поскольку для системы (9) s1 = −β − κ(α + κ) −
T r (A + bs(t)∗ c∗ ) = −α ∀t ∈ R, то в силу теоремы 2 из § 8 при α < 0 невозможна асимптотическая устойчивость системы (9) (u = s(t)y). Таким образом, нами получен следующий результат. Теорема 3. Пусть α 6= 0, γ 6= 0. Тогда для стабилизируемости системы (9) необходимо и достаточно, чтобы α > 0. 3) Пусть передаточная функция системы со скалярным входом u(t) и скалярным выходом y(t) имеет вид W (p) =
p2 p3 + αp2 + βp + γ
где α, β, γ ∈ R, γ 6= 0. Тогда эту систему можно реализовать (в силу следствия теоремы 2 из § 3, гл.II ) в фазовом пространстве R3 как систему вида (1) (§ 1) x˙ 1 = x2 , x˙ 2 = x3 , (10) x˙ 3 = −(αx3 + βx2 + γx1 ) − u, y = x3 . Здесь
0 1 0 0 1 , A= 0 −γ −β −α
0 b = 0 , −1
0 c = 0 1
222
Стационарная стабилизация u = s0 y этой системы возможна тогда и только тогда, когда β > 0, γ > 0. В случае β < 0, γ < 0 стабилизация (как стационарная, так и нестационарная) невозможна в силу теоремы 1 из § 8 (здесь c1 = c2 = 0, c3 = 1; a1 = γ < 0, a2 = β < 0). Рассмотрим случай β > 0, γ < 0 (когда стационарная стабилизация невозможна). Применим теорему 1 из § 4. Как и выше, примем s1 = s2 ; λ1 = λ2 = λ, κ1 = κ2 = κ. Выберем s1 так, чтобы характеристический многочлен системы (10), где u = s1 y, принял вид p3 + (α + s1 )p2 + βp + γ = (p − κ)(p2 + α1 p + β1 ), где κ > 0 и γ γ + βκ γ + βκ , β1 = − , s1 = − − κ − α. κ2 κ κ2 При достаточно малом κ > 0 (и достаточно большом s1 ) многочлен p2 + α1 p + β1 имеет два отрицательных корня, больший из которых равен r γ + βκ (γ + βκ)2 γ ν= + + . 2 4 2κ 4κ κ За число λ примем −ν : λ = −ν. Легко проверить, что неравенство λ > κ сводится к неравенству β + κ 2 > 0, которое имеет место (так как β > 0). Таким образом, здесь (рис.23) α1 = −
dim M1 = dim M2 = 1, dim L1 = dim L2 = 2. Возьмем σ0 так, чтобы характеристический многочлен системы (10), где u = σ0 y, имел вид: p3 + (α + σ0 )p2 + βp + γ = (p − κ0 )(p2 + α0 p + β0 ), где κ0 > 0 и α0 = −
γ + βκ0 γ γ + βκ0 , β0 = − , σ0 = − − κ0 − α. 2 κ0 κ0 κ02
223
Рис.23. Неустойчивое M1 = M2 и устойчивое L1 = L2 многообразия системы (10), где u = s1 y.
При достаточно большом κ0 (и |σ0 |) многочлен p2 + α0 p + β0 имеет комплексно сопряженные корни λ0 ± iω0 , причем λ0 =
γ + βκ0 > 0. 2κ02
Поэтому, не умаляя общности, можно принять (это равносильно линейной замене координат x1 , x2 , x3 ), что µ ¶ µ ¶ µ ¶ b1 c1 κ0 0 ∗ A + σ0 bc = , b= , c= , 0 Q b2 c2 где Q − (2 × 2)-матрица, имеющая собственные значения λ0 ± iω0 , b1 , c1 ∈ R, b2 , c2 ∈ R2 . Также (без умаления общности) можно считать, что p2 W (p) = 3 p + (α + σ0 )p2 + βp + γ (этого можно добиться всегда за счет изменения функции s(t) в обратной связи u = s(t)y для системы (10)). Поскольку W (p) = c∗ (A − pI)−1 b, то 1 = lim pW (p) = pc∗ (A − pI)−1 b = − lim c∗ (I − p→∞
p→∞
A −1 ) b = −c∗ b, p
224
т.е.
c∗ b = −1. Как и в доказательстве теоремы 2 из § 7 (заменяя матрицу A на A + σ0 bc∗ ), установим, что lim (κ − p)W (p) = b1 c1 .
p→∞
Используя последние два соотношения и вид функции W (p), будем иметь: c∗ b −1 α2 κ0 + β2 2γ β = = 1+ = 1− 3 − 2 < 1 (11) 2 b1 c1 limp→∞ (κ0 − p)W (p) κ0 κ0 κ0 при достаточно большом κ0 . Траектории системы x˙ = (A + σ0 bc∗ )x
(12)
имеют вид, изображенный на рис.24.
Рис.24. Траектории системы (10), где u = σ0 y.
Так как матрица Q имеет комплексные собственные значения, то для ненулевого вектора d ∈ M1 существует число τ1 > 0 такое, что векторы 1 0 , [exp(A + σ0 bc∗ )τ1 ]d b, 0
225
принадлежат одной плоскости (следует учесть, что фазовый поток {f t } системы (12) аффинно эквивалентен семейству растяжений вдоль оси x1 с одновременным вращением (на угол ω0 t) вокруг этой оси; здесь f t = exp(A + σ0 bc∗ )t). С учетом неравенства (11) из леммы 2 (§ 7) следует существование чисел µ и τ (µ) таких, что (в лемме 2 § 7 h∗ := (1, 0, 0)) (1, 0, 0) · [exp(A + (σ0 + µ)bc∗ )τ (µ)]d1 = 0, где d1 = [exp(A + σ0 bc∗ )τ1 ]d. Из того факта, что плоскости {x1 = 0} и L2 пересекаются и матрица Q имеет комплексные собственные значения, следует существование числа τ2 такого, что [exp(A + σ0 bc∗ )τ2 ]d2 ∈ L2 , µ)bc∗ )τ (µ)]d
(13)
где d2 = [exp(A + (σ0 + 1 (так как плоскость {x1 = 0} — инвариантна относительно A + σ0 bc, то фазовый поток {f t } в этой плоскости есть {eQt } — семейство вращений (на угол ω0 t) с одновременным растяжением в eλ0 t раз). Таким образом, сначала на промежутке [0, τ1 ] фазовый поток {f t } системы (12) переводит произвольный ненулевой вектор d ∈ M1 в вектор d1 , принадлежащий плоскости π, натянутой на вектор b и единичный вектор (1, 0, 0)∗ оси x1 . Затем, переключаясь на траектории системы x˙ = [A + (σ0 + µ)bc∗ ]x, на промежутке (τ1 , τ1 + τ (µ)] фазовый поток {g t } этой системы "переносит"вектор d1 с плоскости π в вектор d2 на плоскости {x1 = 0}. И, наконец, под действием опять фазового потока {f t } (f t = eQt ) на промежутке (τ1 + τ (µ), τ1 + τ (µ) + τ2 ] вектор d2 переводится в вектор, лежащий на пересечении {x1 = 0} ∪ L2 (рис.25).
226
Рис.25. Отображение неустойчивого многообразия M1 в устойчивое L2 .
Так как все преобразования f τ1 , g τ (µ) , f τ2 линейны, то из включения (13) следует включение f τ2 g τ (µ) f τ1 M1 ⊂ L2 , т.е. выполняется "условие вложения многообразий"(6) из § 4 с θ0τ = f τ2 g τ (µ) f τ1 , τ = τ1 + τ (µ) + τ2 . Здесь {θt } — фазовый поток системы x˙ = (A + σ(t)bc∗ )x (x ∈ Rn ), где
σ0 σ0 + µ σ(t) = σ0
при t ∈ [0, τ1 ), при t ∈ [τ1 , τ1 + τ (µ)), при t ∈ [τ1 + τ (µ), τ1 + τ (µ) + τ2 ).
Итак, в силу основной теоремы из § 4 мы можем сформулировать следующий результат. Теорема 4. Пусть β 6= 0, γ < 0. Тогда для стабилизируемости системы (10) необходимо и достаточно, чтобы β > 0.
227
ГЛАВА V
НЕСТАЦИОНАРНАЯ ВЫСОКОЧАСТОТНАЯ СТАБИЛИЗАЦИЯ ЛИНЕЙНЫХ СИСТЕМ
§ 1. Постановка задачи
В этой главе рассматривается линейная система управления x˙ = Ax + bu,
y = c∗ x
(1)
где A — вещественная постоянная (n × n)-матрица, b и c — одностолбцовые векторы: b, c ∈ Rn , x = x(t) — n-мерный вектор состояния (x ∈ Rn ), u = u(t) — скалярный вход (u ∈ R) и y = y(t) — скалярный выход (y ∈ R). В предыдущей главе было дано в ряде важных случаев решение задачи нестационарной линейной стабилизации для системы (1) — проблемы Брокетта — в классе кусочно–постоянных периодических стабилизирующих функций s(t), т.е. была найдена такая обратная связь u = s(t)∗ y, (2) что замкнутая система (1), (2), т.е. система x˙ = (A + bs(t)∗ c∗ )x,
x ∈ Rn ,
оказывалась асимптотически устойчивой. При этом период T функции s(t) был достаточно большим, т.е. нами была осуществлена низкочастотная стабилизация системы (1) (и при более общей ситуации, когда b и c тоже матрицы). В работе [259] предложен подход к решению проблемы Брокетта в другом классе стабилизирующих функций s(t), а именно, в классе непрерывных периодических функций, у которых период достаточно мал (высокочастотная стабилизация). Эта методика отлична от методики, рассмотренной в предыдущей главе и основывается на процедурах усреднения.
228
Следует отметить, что этот подход использует идеи и методы, применявшиеся ранее в теории управления колебаниями (см., например ([169,193,195,196,257]), в частности, при рассмотрении хорошо известного явления стабилизации верхнего положения маятника, когда точка подвеса совершает достаточно быстрые колебания в вертикальном направлении (см. [23,31,77,114,128,169,235]). Изложим указанный выше подход, применяемый для решения (в частном случае, когда b, c ∈ Rn ) проблемы Брокетта, следуя работе [259]. § 2. Некоторые предварительные факты. Приведем некоторые понятия и факты, которые будут использованы нами в дальнейшем. 1. Теорема об экспоненциальной устойчивости. Пусть дана система x˙ = f (t, x), t ∈ R,
x ∈ Rn , f (t, 0) ≡ 0,
(1)
где вектор-функция f (t, x) = (f1 (t, x), · · · , fn (t, x))∗ кусочно-непрерывна по t в интервале It+ = {a1 < t < +∞} (a ∈ R) и удовлетворяет условию Липшица по переменным x1 , · · · , xn во всем пространстве Rn , x = (x1 , · · · , xn )∗ . О п р е д е л е н и е . Тривиальное р е ш е н и е x(t) ≡ 0 дифференциального уравнения (1) называется э к с п о н е н ц и а л ь н о у ст о й ч и в ы м при t → +∞ (см. [81]), если для каждого решения x(t) ≡ x(t; t0 , x0 ), x(t0 ) = x0 , x0 ∈ Rn этого уравнения справедливо неравенство kx(t)k ≤ N kx(t0 ke−α(t−t0 ) при t ≥ t0 , где N и α — положительные постоянные, не зависящие от выбора решения x(t). Аналогично определяется экспоненциальная устойчивость нетривиального решения. А именно, решение ξ(t) экспоненциально устойчиво, если для любого решения x(t) ≡ x(t; t0 , x0 ) справедливо неравенство kx(t) − ξ(t)k ≤ N kx(t0 ) − ξ(t0 )ke−α(t−t0 ) при t ≥ t0 ,
229
где N и α — положительные постоянные, не зависящие от выбора решения x(t). Очевидно, что из экспоненциальной устойчивости решения x(t) ≡ 0 следует его асимптотическая устойчивость в целом. Обратное, вообще говоря, неверно. Примером может служить скалярное уравнение x x˙ = − , x ∈ R, t ∈ [1, +∞). t Действительно, его общее решение имеет вид x0 x(t) = , x0 = x(1), (t0 := 1); t и, поэтому, нулевое решение x(t) ≡ 0 не является экспоненциально устойчивым, хотя оно является асимптотически устойчивым. Однако, для линейной системы с постоянными коэффициентами положение иное: из асимптотической устойчивости ее тривиального решения следует его экспоненциальная устойчивость. Предложение 1. Если тривиальное решение линейной системы x˙ = Ax, x ∈ Rn ,
(2)
с постоянной матрицей A асимптотически устойчиво (при t → +∞), то эта система экспоненциально устойчива, т.е. каждое ее решение экспоненциально устойчиво (при t → +∞). Д о к а з а т е л ь с т в о. В силу теоремы 1 из § 1, гл.III тривиальное решение x(t) ≡ 0 системы (2) асимптотически устойчиво тогда и только тогда, когда матрица A гурвицева, т.е. все собственные числа λj (A) матрицы A имеют отрицательные вещественные части: Re λj (A) < 0 (j = 1, . . . , n). Положим
1 α = − max Re λj (A). 2 j
Тогда по лемме ( § 2, гл.I) об оценке нормы экспоненты имеем keAt k ≤ N e−αt при t ≥ 0, где N — некоторая положительная константа.
(3)
230
Решение x(t) уравнения (2) с начальным условием x(t0 ) = x0 дается формулой x(t) = e(t−t0 )A x0 , где начальные данные t0 ∈ R, x0 ∈ Rn произвольные. Поэтому, с учетом оценки (3), получаем kx(t)k ≤ N kx(t0 )ke−α(t−t0 ) при t ≥ t0 . Пусть ξ(t) — любое решение системы (2). Тогда, учитывая, что разность x(t) − ξ(t) тоже есть решение системы (2), будем иметь kx(t) − ξ(t)k ≤ N kx(t0 ) − ξ(t0 )ke−α(t−t0 ) при t ≥ t0 . Последнее соотношение доказывает предложение 1. Почти очевидно следующее Предложение 2. Линейная система x˙ = A(t)x,
x ∈ Rn ,
с кусочно-непрерывной матрицей A(t) экспоненциально устойчива тогда и только тогда, когда ее тривиальное решение x(t) ≡ 0 экспоненциально устойчиво. Д о к а з а т е л ь с т в о аналогично доказательству теоремы 4 из § 1, гл.III. Приведем одно достаточное условие экспоненциальной устойчивости общей системы (1). Сначала докажем следующее простое утверждение. Лемма. Пусть q(x) = x∗ Qx
(Q = Q∗ ),
— положительно определенная квадратичная форма, заданная в Rn . Тогда существуют положительные числа α < β такие, что αkxk2 ≤ q(x) ≤ βkxk2 . Д о к а з а т е л ь с т в о. Форма q(x) положительна во всех точках единичной сферы kxk = 1. Поскольку сфера компактна, а форма q(x) непрерывна на ней, то точные нижняя и верхняя грани достигаются, и, поэтому 0 < α ≤ q(x) ≤ β,
для всех x ∈ {x : kxk = 1},
(4)
231
где α = inf q(x), kxk=1
β = sup q(x). kxk=1
Rn ,
Для любого вектора x e∈ очевидно, x e/ke xk — единичный вектор и поэтому для него имеет место 4. Отсюда следует утверждение леммы. Замечание. На самом деле, в лемме α = min λj (Q), j
β = sup λj (Q), j
где λj (Q), (j = 1, · · · , n) — собственные числа матрицы Q. Но для дальнейшего это нам не понадобится. Теорема 1. Пусть существует положительно определенная квадратичная форма V (x) = x∗ Hx, x ∈ Rn (H = H ∗ ), производная которой V˙ (x) в силу системы (1) удовлетворяет неравенству V˙ (x) ≤ −W (x), (5) где W (x) = x∗ Gx, x ∈ Rn (G = G∗ ) — положительно определенная квадратичная форма. Тогда тривиальное решение x(t) ≡ 0 системы (1) экспоненциально устойчиво при t → +∞. Д о к а з а т е л ь с т в о. В силу вышедоказанной леммы для квадратичных форм V (x) и W (x) существуют соответственно числа 0 < α1 < β1 и 0 < α2 < β2 такие, что α1 · kxk2 ≤ V (x) ≤ β1 kxk2 ,
(6)
α2 · kxk2 ≤ W (x) ≤ β2 kxk2 .
(7)
Из неравенств (5)–(7) имеем α2 V˙ ≤ −α2 kxk2 ≤ − V (x), β1 т.е. V˙ ≤ −2αV,
232
где α = −α2/2β1 . Интегрируя последнее дифференциальное неравенство, будем иметь V (t) ≤ V (t0 )e−2α(t−t0 )
∀ t ≥ t0 ,
(8)
где V (t) ≡ V (x(t)), x(t) — решение уравнения (1) с начальным условием x(t0 ) = x0 (x0 ∈ Rn ). Используя оценку (8) и неравенства (6), имеем 1 β1 kx(t)k2 ≤ V (x(t)) ≤ kx(t0 k2 · e−2α(t−t0 ) (t ≥ t0 ) α1 α1 т.е. kx(t)k ≤ N · kx(t0 )k · e−α(t−t0 ) ∀ t ≥ t0 , p где N = β1/α1 . Следовательно, нулевое решение x(t) ≡ 0 экспоненциально устойчиво при t → +∞. Теорема доказана. 2. Теорема об экспоненциальной устойчивости линейной системы с малым параметром. Пусть дано векторное дифференциальное уравнение x˙ = εA(t)x,
x ∈ Rn , t ∈ [0, +∞),
(9)
где ε > 0 — малый параметр, а матрица–функция A(t) ограничена и непрерывна на промнежутке [0, +∞), и удовлетворяет условию Z t A(s) ds = tA0 + Q(t), (10) 0
причем A0 — постоянная матрица, kQ(t)k ≤ m для всех t ∈ [0, +∞) (m > 0 — константа). Следующая теорема принадлежит В.А.Якубовичу. Теорема 2. Пусть в усредненной системе x˙ = εA0 x (x ∈ Rn ) матрица A0 гурвицева. Тогда система (9) экспоненциально устойчива при 0 ≤ ε ≤ ε0 , где ε0 — достаточно малое число. Д о к а з а т е л ь с т в о . Рассмотрим матрицу Rε (t) = In + εQ(t),
(11)
где Q(t) — ограниченная матрица, удовлетворяющая условию (10) (In — единичная (n × n)-матрица). Легко показать, что det Rε (t) = 1 + ε · Tr Q(t) +
n X k=2
αk (t)εk ,
(12)
233
где αk (t) — некоторые ограниченные функции на [0, +∞). Действительно, пусть λj (t), (j = 1, · · · , n) — собственные числа матрицы Q(t) с учетом их кратностей. Тогда собственные числа матрицы Rε (t) равны 1 + ελj (t), (j = 1, · · · , n). Поскольку определитель матрицы Rε (t) равен произведению собственных чисел, то n n Q P det Rε (t) = (1 + ελj (t)) = 1 + ε λj (t)+ j=1 P j=1 (13) +ε2 λj1 (t)λj2 (t) + · · · + εn (λ1 (t) · · · λn (t)). 1=j1 <j2 =n
Так как сумма собственных чисел
n P j=1
λj (t) равна следу матрицы
Q(t), то из (13) следует (12), где X λj1 (t) · · · λjk (t) (k = 2, · · · , n). αk (t) = 1=j1 0 det Rε (t) > 1 − δ > 0
(14)
при 0 ≤ ε ≤ ε1 и всех t ∈ [0, +∞), где δ > 0 — некоторое положительное число. Сделаем в системе (9) замену переменных x = Rε (t)y, τ = εt (y ∈ Rn ),
(15)
где Rε (t) — матрица (11). Имеем · ¸ dy dRε (t) = (Rε (t))−1 εA(t)Rε (t) − y. dt dt Отсюда, учитывая равенства (11) и dQ(t) = A(t) − A0 , dt и переходя к новому времени τ , получаем dy = A0 y + z(τ ), dτ где z(τ ) = ε(Rε (t))−1 [A(t)Q(t) − Q(t)A0 ]y(τ ).
(16) (17)
234
Заметим, что поскольку матрица Rε (t) ограничена и удовлетворяет условию (14), то преобразование (15) сохраняет свойство экспоненциальной устойчивости, т.е. из устойчивости (экспоненциальной) системы (9) следует устойчивость (экспоненциальная) системы (16), (17) и, наоборот. Будем искать функцию Ляпунова для системы (16), (17) в виде квадратичной формы V (y) = y ∗ P y, (18) ∗ где симметрическая матрица P = P подлежит определению Вычислим производную функции V (y) в силу системы (16), (17): dV = y˙ ∗ P y + y ∗ P y˙ = y ∗ (A∗0 P + P A0 )y + 2y ∗ P z. (19) dτ Пусть G = G∗ < 0 — произвольная отрицательно определенная матрица. Тогда, поскольку по условию теоремы 2 матрица A0 гурвицева, то по лемме 1 из § 7, гл.III существует положительно определенная матрица P = P ∗ > 0 такая, что A∗0 P + P A0 = G (G < 0).
(20)
Так как матрицы A(t) и Q(t) ограничены, то, очевидно, ограничена также и матрица Kε (t) = (Rε (t))−1 [A(t)Q(t) − Q(t)A0 ]. Пусть kKε (t)k ≤ M при 0 ≤ ε ≤ ε1 , t ∈ [0, +∞). Отсюда и из (17) имеем kz(τ )k ≤ εM ky(τ )k. Учитывая последнее неравенство и равенство (20), из (19) получаем следующую оценку dV ≤ y ∗ Gy + 2εM kP k · kyk2 dτ или dV ≤ y ∗ (G + 2εM kP k In )y. (21) dτ Так как G > 0, то существует такое число ε0 = ε0 (G), 0 < ε0 ≤ ε1 , что G + 2εM kP kIn < 0 при 0 ≤ ε ≤ ε0 . (22)
235
Отсюда и из оценки (21) следует, что функция V (y) из (18) удовлетворяет всем условиям теоремы 1. Следовательно, по теореме 1, с учетом предложения 2, система (16), (17) и, значит, система (9) экспоненциально устойчива (при t → +∞) при 0 ≤ ε ≤ ε0 . Теорема 2 доказана. Замечание 1. Поскольку значение ε0 (G), найденное из условия (19), зависит от выбора матрицы G, то возникает естественная задача о максимизации ε0 (G) по всем G < 0. Последняя задача решена В.А.Якубовичем. Приведем без доказательства этот результат: в условиях теоремы 2 система (9) экспоненциально устойчива при 0 < ε < ε∗ (≤ ε1 ), где ε∗ = min(ε1 , ε∗∗ ), ε∗∗ = M −1 inf inf k(iωIn − A0 )e y k; ω∈R ke y k=1
при этом ε∗ ≥ sup ε0 (G). G 0 матричнозначной функцией A : R → Rn×n : τ → A(τ ), A(τ + T ) = A(T ), где ω > 0 — большой параметр. Систему (23) иногда называют системой с быстрым временем. Из доказанной выше теоремы 2 следует Теорема 3. Если усредненная система x˙ = A0 x, x ∈ Rn , где A0 =
1 T
Z
T
A(τ ) dτ, 0
(24)
236
асимптотически устойчива (т.е. матрица A0 — гурвицева), то система (23) равномерно экспоненциально устойчива для всех ω ≥ ω0 , где ω0 — достаточно большое положительное число. Д о к а з а т е л ь с т в о . Заменой времени ωt → t система (23) легко сводится к системе x˙ = εA(t)x,
A(t + T ) = A(t),
x ∈ Rn , t ∈ [0, +∞),
(25)
с малым параметром ε > 0, где ε = 1/ω. Система (25) — частный случай системы (9), рассмотренной в п.2. Действительно, матрица A(t), очевидно, непрерывна и ограничена на [0, +∞). Далее, представляя любое t > 0 в виде t = nT +s, 0 ≤ s < T и учитывая периодичность матрицы A(t) будем иметь: Zt
ZnT A(τ ) dτ =
0
Zs A(τ ) dτ +
0
ZT A(τ ) dτ = n
0
Zs A(τ ) dτ +
0
A(τ ) dτ = 0
Zs = (nT + s)A0 + где
[A(τ ) − A0 ] dτ = tA0 + Q(t), 0 t−nT Z
Q(t) =
[A(τ ) − A0 ] dτ 0
матрица–функция, ограниченная на [0, +∞), поскольку 0 ≤ t − nT < T . Согласно теореме 2 и замечания к ней система (25) равномерно экспоненциально устойчива для всех ε ∈ [0, ε0 ], где ε0 > 0, достаточно мало, если матрица A0 из (24) гурвицева. Отсюда следует утверждение теоремы 5. § 3. Высокочастотная стабилизация верхнего положения равновесия маятника Как и в гл.IV мы начнем с классической задачи стабилизации верхнего положения равновесия маятника, но в отличие от § 3 гл.IV, покажем возможность его высокочастотной стабилизации.
237
В § 3, гл.IV нами было получено уравнение малых колебаний (уравнение в вариациях) маятника около верхнего положения равновесия с вибрирующей точкой подвеса. Оно имеет вид θ¨ + αθ˙ + (s(t) − ν 2 )θ = 0, (1) 0
где θ — угол отклонения, отсчитываемыйp от верхнего положения равновесия, α — коэффициент трения, ν0 = g/` — собственная частота малых колебаний (` — длина маятника, g — ускорение свободного падения), s(t) = w(t)/`, w(t) — ускорение точки подвеса. Будем рассматривать два различных класса стабилизирующих функций s(t), а именно, кусочно-постоянные периодические функции (с нулевым средним на периоде) с достаточно малым периодом T ([16,17]) ½ −β при t ∈ [0, T2 ], s(t) = s(t + T ) = s(t), (2) β при t ∈ [ T2 , 0), и непрерывные периодические функции вида ([259,260]) s(t) = s0 + βω cos ωt (или s(t) = s0 + βω 2 cos ωt),
(3)
где s0 , β и ω — варьируемые параметры (ω — большой параметр). 1. Стабилизация с помощью кусочно-постоянных периодических функций ([16,17]). Рассмотрим сначала стабилизацию верхнего положения равновесия маятника с помощью функций вида (2). Пусть амплитуда колебаний точки подвеса равна a(a ¿ `), а ускорение w(t) точки подвеса постоянно в течение каждого полупериода τ = T2 и равно ½ −c при t ∈ [0, τ ), w(t) = w(t + T ) = w(t) ∀ t ∈ [0, +∞), c при t ∈ [τ, T ), где c > 0 — константа. Эквивалентная уравнению (1) система уравнений первого приближения в окрестности верхнего положения равновесия имеет вид (θ := x1 ): ½ x˙ 1 = x2 , (4) x˙ 2 = −αx2 − (s(t) − ν02 )x1 . Очевидно, что cT 2 c a= , β= , 32 `
238
где β — варьируемый параметр в (2). Еcли колебания точки подвеса достаточно быстры, то β > ν02 (так как β = 32a/`T 2 и T достаточно мало). Пусть H — преобразование за время от 0 до T , осуществляемое фазовым потоком системы (4). Очевидно, что преобразование H состоит из произведения двух преобразований: H = H2 H1 , где H1 — преобразование за время от 0 до T2 , осуществляемое фазовым потоком {f t } системы ½ x˙ 1 = x2 , (5) x˙ 2 = −αx2 + (β + ν02 )x1 , (положение равновесия (x1 = 0, x2 = 0) — седло) т.е. H1 = f0τ , а H2 есть преобразование за время от T2 до T , осуществляемое фазовым потоком {g t } системы ½ x˙ 1 = x2 (6) x˙ 2 = −αx2 − (β − ν02 )x1 , (положение равновесия (x1 = 0, x2 = 0) — фокус) т.е. H2 = gτT (сначала в промежутке времени [0, T2 ] точки плоскости движутся по траекториям системы (5), а затем в промежутке [ T2 , T ] — по траекториям системы (6)). Поскольку система (6) автономная и, следовательно, сдвиг решения (вдоль оси t ) есть решение, то H2 = gτT = g0τ . Найдем матрицы преобразований H1 и H2 (очевидно H1 и H2 — линейные операторы). В силу предложения 1 из § 3, гл.IV H1 = Ψ1 (τ ), H2 = Ψ2 (τ ), где Ψ1 (t) и Ψ2 (t) — нормированные фундаментальные матрицы решений систем (5) и (6) соответственно (Ψi (0) = I, i = 1, 2). Вычислим Ψ1 (t) и Ψ2 (t). Общее решение системы (5) имеет вид ½ x1 (t) = c1 eλ1 t + c2 eλ2 t , x2 (t) = c1 λ1 eλ1 t + c2 λ2 eλ2 t ,
239
где λ1 , λ2 — корни характеристического уравнения p2 +αp−(β+ν02 ) = 0 системы (5): α λ1 = − + k, 2 α α2 λ2 = − − k, k 2 = + (β + ν02 ). 2 4 ¡ ¢ Обозначим ρ(t) = 12 exp − αt 2 . Частное решение системы (5) с начальным условием x1 (0) = 1, x2 (0) = 0: h³ ³ i ´ ´ x1 (t) = ρ(t) 1 + α ekt + 1 − α e−kt , k´³ h³ ´ k ³ ´³ ´ i x2 (t) = ρ(t) 1 + α k − α ekt − 1 − α k + α e−kt . k 2 k 2 Частное решение системы (5) с начальным условием x1 (0) = 0, x2 (0) = 1: x (t) = ρ(t) ¡ekt − e−kt ¢ , 1 k h³ ´ ³ ´ i x (t) = ρ(t) 1 − α ekt + 1 + α e−kt . 2 2k 2k Теперь, составляя фундаментальную матрицу Ψ1 (t) из найденных частных решений и полагая в ней t = τ , получим Ψ1 (τ )µ= = ρτ
(1 + αk )ekτ + (1 − αk )e−kτ α (1 + k )(k − α2 )ekτ − (1 − αk )(k + α2 )e−kτ
2k −1 sh kτ α (1 − 2k )ekτ + (1 +
¶ α −kτ 2k )e
(Здесь sh — гиперболический синус, ρτ = ρ(τ )). Характеристическое уравнение p2 + αp + (β − ν02 ) = 0 системы (6) имеет комплексно-сопряженные корни α α λ01 = − + iΩ, λ02 = − − iΩ, 2 2 Ω2 = (β − ν02 ) − если
α2 , 4
α2 < 4(β − ν02 ) (последнее условие выполнено, если колебания точки подвеса маятника достаточно быстры).
.
240
Общее решение системы (6): ½ x1 (t) = 2ρ(t)(c1 cos Ωt + c2 sin Ωt), x2 (t) = 2ρ(t) [(c2 Ω − c1 α/2) cos Ωt − (c2 α/2 + c1 Ω) sin Ωt] . Находим частные решения системы (6) с начальными условиями x1 (0) = 1, x2 (0) = 0 и x1 (0) = 0, x2 (0) = 1. Ими будут соответственно: ½ ½ α x1 = 2ρ(t)(cos Ωt + 2Ω sin Ωt), x1 = 2Ω−1 ρ(t) ¢ ¡ sin Ωt, α 2 α x = 2ρ(t) cos Ωt − 2Ω sin Ωt . x2 = −2(Ω + 4Ω )ρ(t) sin Ωt; 2 Составляем фундаментальную матрицуΨ2 (t) и полагаем в ней t = τ . Получим : µ ¶ α cos Ωτ + 2Ω sin Ωτ Ω−1 sin Ωτ Ψ2 (τ ) = 2ρτ . α2 α −(Ω + 4Ω ) sin Ωτ cos Ωτ − 2Ω sin Ωτ В силу теоремы 4 из § 2, гл.IV преобразование H за время T асимптотически устойчиво тогда и только тогда, когда собственные значения (мультипликаторы) ρ1 и ρ2 матрицы T ), 2 преобразования H находятся внутри единичного круга: Ψ(T ) = Ψ1 (τ ) · Ψ2 (τ ) (τ =
|ρj | < 1, j = 1, 2. Для упрощения выкладок предположим, что трение в системе (4) отсутствует, т.е.α = 0. Тогда очевидно, что det Ψ(T ) = 1, и мы можем воспользоваться теоремой 6 из § 2, гл.IV. Условие устойчивости |T r Ψ(T )| < 2 принимает вид |2 cos Ωτ · ch kτ + (k/Ω − Ω/k) sin Ωτ · sh kτ | < 2
(7)
(Здесь sh и ch — гиперболические синус и косинус соответственно). Введем безразмерные переменные ε и δ: a g ε2 = ¿ 1, δ 2 = ¿ 1. ` c
241
Тогда имеем c g 8a ( + ) = 8ε2 (1 + δ 2 ), ` ` c c g 8a Ω2 τ 2 = ( − ) = 8ε2 (1 − δ 2 ), ` ` c r r k Ω 1 + δ2 1 − δ2 − = − = 2δ 2 + o(δ 4 ). Ω k 1 − δ2 1 + δ2 Поэтому справедливы разложения (при ε2 + δ 2 → 0 ): k2 τ 2 =
cos Ωτ = 1 − 4ε2 (1 − δ 2 ) + 8ε4/3 + o(ε4 + δ 4 ), sh kτ = 1 + 4ε2 (1 + δ 2 ) + 8ε4/3 + o(ε4 + δ 4 ), (k/Ω − Ω/k) sin Ωτ · sh kτ = 16ε2 δ 2 + o(ε4 + δ 4 ). Следовательно, условие устойчивости (7) перепишется так: 2(1 − 16ε4 + 8ε2 δ 2 + 16ε4/3 + o(ε4 + δ 4 ) + 16ε2 δ 2 + o(ε4 + δ 4 ) < 2. Пренебрегая бесконечно малыми o(ε4 + δ 4 ) высшего порядка, из последнего неравенства получаем 3δ 2 < 2ε2 или 3g` < 2ac. Это условие можно переписать так : √ √ 1 3 g` > · . (8) T 8 a Таким образом, условие устойчивости (7) свелось к неравенству (8), которое будет выполнено, если период колебаний T точки подвеса маятника достаточно мал, и, соответственно, частота колебаний N = 1/T (число колебаний точки подвеса в единицу времени) достаточно большая. Итак, при достаточно быстрых колебаниях точки подвеса маятника (при достаточно большой частоте N ) отображение H устойчиво (по Ляпунову) и, следовательно, в силу теоремы 2 из § 2, гл.IV положение равновесия (x1 = 0, x2 = 0) — верхнее положение равновесия маятника — устойчиво (по Ляпунову). 2. Стабилизация с помощью непрерывных периодических функций ([259,260]). Рассмотрим теперь возможность стабилизации
242
верхнего положения равновесия маятника с помощью функций s(t) вида (3). Система уравнений (4) движения маятника с функцией s(t) вида (3) не имеет пока стандартного вида (23) из § 2. Чтобы привести систему (4),(3) к виду (23) из § 2, сделаем в ней линейное преобразование координат (с переменными коэффициентами) ½ x 1 = y1 , (9) x2 = −(β sin ωt)y1 + y2 . Уравнения движения маятника в новых координатах y1 , y2 принимают вид ½ y˙ 1 = (β sin ωt)y1 + y2 y˙ 2 = [ν02 − s0 + αβ sin ωt − β 2 sin2 ωt]y1 + [−α + β sin ωt]y2 . (10) Заметим, что преобразование (9) сохраняет свойство устойчивости (экспоненциальной), так как матрица ¶ µ 1 0 Φ(t) = −β sin ωt 1 коэффициентов при y1 и y2 ограничена и det Φ(t) ≡ 1 на промежутке [0, +∞). Система (10) уже имеет стандартный вид (23) из § 2 и, поэтому, мы можем воспользоваться доказанной в § 2 теоремой 3, согласно которой система (10) (а значит, и система (4)) экспоненциально устойчива равномерно относительно ω для всех ω ≥ ω0 , где ω0 — достаточно большое число, если соответствующая усредненная система асимптотически устойчива, т.е. когда гурвицева следующая матрица 1 A0 = 2π где
µ
Z2π A(τ ) dτ, 0
β sin τ 1 A(τ ) = ν02 − s0 + αβ sin τ − β 2 sin2 τ −α + β sin τ Элементарные вычисления дают: µ ¶ 0 1 A0 = . ν02 − s0 − β 2/2 −α
¶ .
243
Характеристический многочлен матрицы A0 имеет вид p2 + αp + s0 + β 2/2 − ν02 . Отсюда видно, что матрица A0 гурвицева тогда и только тогда, когда ν02 < s0 + β 2/2
(11)
(поскольку α > 0). Таким образом, условие (11) есть достаточное условие экспоненциальной устойчивости системы (4),(3). Итак, верхнее положение равновесия маятника становится устойчивым, если выполнено неравенство (11). Замечание. Как легко видеть, условие стационарной стабилизации (s(t) ≡ s0 = const) верхнего положения равновесия маятника имеет вид ν02 < s0 . Отсюда и из (11) хорошо видно, насколько введение переменного слагаемого βω cos ωt в выражении функции s(t) (см. (3)) расширяет границу области устойчивости. § 4. Высокочастотная стабилизация линейных систем Пусть дана система x˙ = Ax + bu,
y = c∗ x (x ∈ Rn ),
(1)
со скалярным входом u ∈ R и скалярным выходом y ∈ R, где A — вещественная постоянная (n × n)-матрица, а b, c — одностолбцовые n-мерные векторы (b, c ∈ Rn ). Наша задача — найти обратную связь u(t) = s(t)y
(2)
такую, чтобы тривиальное решение x(t) ≡ 0 (и, следовательно, в силу предложения 2 из § 2 любое решение x(t)) замкнутой системы (1), (2), т.е. системы x˙ = (A + s(t)bc∗ )x, (x ∈ Rn ),
(3)
было экспоненциально устойчивым. Рассмотрим класс M функций s(t) таких, что s(t) = s1 (t) + s2 (t),
(4)
244
где s1 (t) и s2 (t) непрерывные и периодические функции, причем функция s2 (t) имеет нулевое среднее на периоде, т.е. ZT s2 (τ ) dτ = 0
(5)
0
(T > 0 — период функции s2 (t)). Стабилизирующую функцию s(t) в (2) будем искать в классе M. 1. Приведение замкнутой системы к специальной форме. Докажем следующую лемму. Лемма 1. Существует такое преобразование векторной переменной x x = Φ(t)z (z ∈ Rn ), (6) где
∗
Φ(t) = e`(t)bc
(7)
`(t) (t ≥ 0) — непрерывно дифференцируемая функция, удовлетворяющая условию ˙ = s2 (t), `(t) (8) что при таком преобразовании система (3) приводится к виду z˙ = [Φ(t)−1 AΦ(t) + s1 (t)bc∗ ]z.
(9)
При этом система (3) экспоненциально устойчива тогда и только тогда, когда экспоненциально устойчива система (9). Д о к а з а т е л ь с т в о . Сделаем преобразование (6) в системе (3). Имеем ˙ Φ(t)z(t) + Φ(t)z(t) ˙ = x(t) ˙ = (A + s(t)bc∗ )Φ(t)z(t). Отсюда, с учетом (4) получаем уравнение для новой векторной функции z(t): ˙ z(t) ˙ = Φ(t)−1 [(A + s1 (t)bc∗ + s2 (t)bc∗ )Φ(t) − Φ(t)]z(t). Из равенства ∗)
e`(t)(bc
=
∞ X (`(t))k (bc∗ )k k=0
k!
,
(10)
245
следует, что матрица bc∗ коммутирует с Φ(t), и , поэтому, из (7), (8) получаем ˙ Φ(t) = s2 (t)bc∗ Φ(t). Заметим, что поскольку s2 (t) — периодическая функция, удовлетворяющая условию (5), то из (8) следует, что `(t) будет тоже периодической функцией с тем же периодом T . Следовательно, уравнение (10) принимает вид (9): z˙ = Φ(t)−1 (A + s1 (t)bc∗ )Φ(t)z = = [Φ(t)−1 AΦ(t) + s1 (t)bc∗ ]z Вторая часть утверждения леммы следует из следующих свойств матричной функции Φ(t): 1) Φ(t) ограничена на промежутке [0, +∞), т.е. sup kΦ(t)k < ∞ при t
t ∈ [0, +∞); 2) 0 < m ≤ | det Φ(t)| ≤ M при t ∈ [0. + ∞), где m и M — некоторые положительные константы. (Свойства 1) и 2) вытекают из вида (7) функции Φ(t), периодичности функции `(t) и равенства (см. следствие леммы 2 из § 4, гл.I) ∗
∗
det e`(t)bc = e`(t)c b ) Легко видеть, что обратная матрица Φ(t)−1 тоже обладает свойствами 1) и 2). Поэтому как преобразование (6), так и обратное к нему преобразование z = Φ(t)−1 x не меняют свойства экспоненциальной устойчивости. Лемма 1 доказана. Далее будем различать два случая: 1) c∗ b 6= 0 и 2) c∗ b = c∗ Ab = 0. 2. Стабилизация в случае c∗ b 6= 0. Имеет место следующая Теорема 1 ([259]). Пусть в системе (1) c∗ b 6= 0. Предположим, что существуют вещественные числа α и κ ≥ 0 такие, что матрица A + κ(c∗ b)bc∗ A + (α − κc∗ Ab)bc∗ (11) гурвицева. Тогда существует такая периодическая функция s(t) = α + βω cos ωt,
(12)
246
где ω достаточно большое число, а β ∈ R такое, что µ 2π ¶2 R 1 ∗ exp(βc b sin t)dt − 1 2π 0 = κ, (c∗ b)2
(13)
что замкнутая система (3) равномерно экспоненциально устойчива при достаточно больших ω. Д о к а з а т е л ь с т в о . Так как c∗ b 6= 0, то используя очевидное соотношение (bc∗ )k = (c∗ b)k−1 bc∗ , преобразуем матрицу Φ(t) (см.(7)) к виду: P∞ `(t)k (bc∗ )k P∞ `(t)k (c∗ b)k−1 ∗ = I + bc = k=1 k=1 k! k! ∗ exp[c b`(t)] − 1 ∗ =I+ bc . c∗ b Аналогично,заменяя в (14) `(t) на −`(t), получим Φ(t) = I +
exp[−c∗ b`(t)] − 1 ∗ bc . c∗ b Учитывая (14) и (15), и, используя очевидное равенство Φ(t)−1 = exp[−`(t)bc∗ ] = I +
(14)
(15)
(bc∗ A)bc∗ = (c∗ Ab)bc∗ , приведем систему (7) к виду: · ∗ exp[c∗ b`(t)] − 1 ∗ + exp[−c b`(t)] − 1 bc∗ A+ z˙ = A + Abc c∗ b c∗ b . 2 − exp[c∗ b`(t)] − exp[−c∗ b`(t)] ∗ ∗ + s (t)bc∗ ] z + (c Ab)bc 1 (c∗ b)2
(16)
Стабилизирующую функцию s(t) возьмем в виде (4), где s1 (t) = α,
(17)
s2 (t) = βω cos ωt,
(18)
α, β и ω — вещественные параметры. Тогда согласно (8) имеем `(t) = β sin ωt + `0 ,
(19)
где `0 постоянная интегрирования, которая будет выбрана ниже.
247
Введем функцию µ : R → R, определяемую следующим образом: µ 1 2π
µ(β) =
2π R
¶2 exp[βc∗ b sin t] dt
0
(c∗ b)2
−1 .
Легко видеть, что функция µ 1) четная: µ(−β) = µ(β) и 2) имеет областью значений промежуток [0, +∞). Действительно, свойство 1) следует из очевидного равенства Z2π
Z2π ∗
exp[βc∗ b sin t]dt,
exp[−βc b sin t]dt = 0
0
а свойство 2) — из 1), равенств µ(0) = 0, µ0 (0) = 0, и того, что вторая производная µ00 (β)
µ 2π ¶2 R 1 ∗ = 2 (sin t) exp[βc b sin t]dt + 2π 0 R2π 1 R2π + 2 exp[βc∗ b sin t]dt · (sin t)2 exp[βc∗ b sin t]dt 2π 0 0
строго положительна. Таким образом, уравнение µ(β) = µ0 , µ0 ∈ [0, +∞), всегда имеет решение относительно β. Заметим, что система (16), (17), (19) с достаточно большим параметром ω является системой с быстрым временем и имеет стандартный вид (см. (23) из § 2): z˙ = B(ωt)z, где через B(τ ), τ = ωt обозначена матрица системы (16), (17), (19) (выражение, стоящее в квадратной скобке в (16) с учетом (17), (19)). Поэтому к ней можно применить теорему 3 из § 2. Найдем матрицу 1 B0 = 2π
Z2π B(τ ) dτ. 0
248
Выберем константу `0 в (19) так: Z2π 1 `0 = ∗ ln 2π − ln exp[βc∗ b sin t]dt . c b 0
Тогда 1 2π 1 2π
Z2π exp[c∗ b(β sin t + `0 )]dt − 1 = 0, 0
Z2π exp[−c∗ b(β sin t + `0 )]dt − 1 = (c∗ b)2 µ(β). 0
С учетом последних соотношений получаем, что B0 = A + (c∗ b)µ(β)bc∗ A + (−c∗ Abµ(β) + α)bc∗ . Выберем теперь число β таким, чтобы µ(β) = κ,
(20)
где κ ≥ 0 — число, фигурирующее в теореме 1. Тогда матрица B0 совпадает с (11) и по условию теоремы 1 будет гурвицевой. Следовательно, в силу теоремы 3 из § 2 система (16),(17),(19) будет равномерно (относительно ω) экспоненциально устойчивой при достаточно больших значениях ω. По доказанной выше лемме 1 последнее утверждение верно и для системы (3). Соотношения (12) и (13) следуют из (4), (17), (18) и (20) соответственно. Теорема 1 доказана. 3. Стабилизация в случае c∗ b = c∗ Ab = 0. Определим и здесь матрицу Φ(t) по формуле (7) с функцией `(t) ∈ C 1 [0, +∞), удовлетворяющей условию (8). Так как c∗ b = 0, то матрицы Φ(t) и Φ(t)−1 (см. (14) и (15)) принимают вид: Φ(t) = I + `(t)bc∗ , (21) Φ(t)−1 = I − `(t)bc∗ . С учетом (21), (22) и равенства
c∗ Ab
(22)
= 0, система (9) принимает вид:
z˙ = [A + `(t)[A, bc∗ ] + s1 (t)bc∗ ]z,
(23)
249
где
[A, bc∗ ] = A(bc∗ ) − (bc∗ )A (коммутатор матриц A и bc∗ ). Заметим, что система (23) имеет такой же вид, что и система (3). Будем искать функцию `(t), как и s(t), в классе M, т.е. положим `(t) = `1 (t) + `2 (t),
(24)
где `1 (t) и `2 (t) — непрерывные периодические функции, причем `2 (t) имеет нулевое среднее на периоде. Следующая лемма аналогична лемме 1. Лемма 2. Пусть c∗ b = c∗ Ab = 0. Тогда существует такое преобразование векторной переменной z z = Ψ(t)ξ где
(ξ ∈ Rn )
(25)
∗
Ψ(t) = em(t)[A,bc ] , (26) m(t) (t ≥ 0) — непрерывно дифференцируемая функция, удовлетворяющая условию m(t) ˙ = `2 (t), (27) что при таком преобразовании система (23) приводится к виду: £ ¤ ξ˙ = Ψ(t)−1 AΨ(t) + `1 (t)[A, bc∗ ] + s1 (t)bc∗ ξ. (28) При этом преобразование (25) сохраняет свойство экспоненциальной устойчивости. Д о к а з а т е л ь с т в о . Замена переменных (25) приводит систему (23) к аналогичному (10) виду ∗ ∗ ξ˙ = Ψ(t)−1 [(A + `1 (t)[A, i bc ] + `2 (t)[A, bc ] + (29) ˙ +s1 (t)bc∗ )Ψ(t) −Ψ(t) ξ. Поскольку ∗
em(t)[A,bc ] =
∞ X m(t)k [A, bc∗ ]k k=0
k!
,
то матрица [A, bc∗ ] коммутирует с матрицей Ψ(t), и, следовательно, из (26), (27) будем иметь ˙ Ψ(t) = `2 (t)[A, bc∗ ]Ψ(t).
250
Следовательно, система (29) принимает вид ξ˙ = Ψ(t)−1 [A + `1 (t)[A, bc∗ ] + s1 (t)bc∗ ]Ψ(t) ξ.
(30)
Так как c∗ b = c∗ Ab = 0, то [A, bc∗ ](bc∗ ) = (bc∗ )[A, bc∗ ] = 0, и, поэтому, (bc∗ )Ψ(t) = Ψ(t)−1 (bc∗ ) = bc∗ .
(31)
Так как матрица [A, bc∗ ] коммутирует с Ψ(t), то из равенств (31) следует, что систему (30) можно переписать в виде (28). Вторая часть утверждения леммы 2 доказывается аналогично соответствующей части леммы 1 с использованием того факта, что функция m(t), удовлетворяющая условию (27), периодическая (так как `2 (t) периодическая и имеет нулевое среднее на периоде). Лемма 2 доказана. Докажем теперь следующую теорему. Теорема 2 ([259]). Пусть в системе (1) c∗ b = c∗ Ab = 0. Предположим, что существуют вещественные числа α и κ ≥ 0 такие, что матрица A − 3κ(c∗ A2 b)bc∗ A + (α + κc∗ A3 b)bc∗
(32)
гурвицева. Тогда существует такая периодическая функция s(t) = α + γω 2 cos ωt,
(33)
где ω — достаточно большое число, а γ ∈ R такое, что γ2 = κ, (34) 2 что замкнутая система (3) равномерно экспоненциально устойчива при достаточно больших ω. Д о к а з а т е л ь с т в о . Поскольку по условию теоремы = c∗ Ab = 0, то легко проверить, что
c∗ b
[A, bc∗ ]2 = −(c∗ A2 b)bc∗ , [A, bc∗ ]3 = 0.
251
Из последнего равенства следует, что [A, bc∗ ]k = 0 для всех натуральных k ≥ 4. Следовательно, матрица Ψ(t) из (26) и ее обратная Ψ(t)−1 принимают вид: m(t)2 ∗ 2 (c A b)bc∗ , 2 m(t)2 ∗ 2 Ψ(t)−1 = I − m(t)[A, bc∗ ] − (c A b)bc∗ . 2 С учетом последних равенств найдем Ψ(t) = I + m(t)[A, bc∗ ] −
Ψ(t)−1 AΨ(t) = A + m(t) {A[A, bc∗ ] − [A, bc∗ ]A} − (c∗ A2 b)m(t)2 −m(t)2 [A, bc∗ ]A[A, bc∗ ] − [A(bc∗ ) + (bc∗ )A]+ (35) 2 (c∗ A2 b)m(t)3 + {[A, bc∗ ]A(bc∗ ) − (bc∗ )A[A, bc∗ ]} . 2 Легко вычислить: [A, bc∗ ]A[A, bc∗ ] = (c∗ A2 b)[A(bc∗ ) + (bc∗ )A] − (c∗ A3 b)(bc∗ ) [A, bc∗ ]A(bc∗ ) = −(c∗ A2 b)(bc∗ ) ∗ ∗ (bc )A[A, bc ] = (c∗ A2 b)(bc∗ ). Используя последние равенства, выражение (35) можно записать в виде 3(c∗ A2 b) m(t)2 [A(bc∗ )+ 2 +(bc∗ )A] + (c∗ A3 b)m(t)2 (bc∗ ) − (c∗ A2 b)2 m(t)3 (bc∗ ),
Ψ(t)−1 AΨ(t) = A + m(t)[A, [A, bc∗ ]] −
(36)
где [A, [A, bc∗ ]] — коммутатор матриц A и [A, bc∗ ]. С учетом (36), система (28) принимает вид: ½ ∗ 2 ˙ξ = A + m(t) [A, [A, bc∗ ]] − 3(c A b) m(t)2 [A(bc∗ )+ 2 (37) +(bc∗ )A] + (c∗ A3 b)m(t)2 (bc∗ ) − (c∗ A2 b)2 m(t)3 (bc∗ )+ + `1 (t)[A, bc∗ ] + s1 (t)bc∗ } ξ. Дальше, доказательство аналогично доказательству теоремы 1. Выберем функцию s(t) ∈ M (см.(4)) так: s1 (t) = α,
(38)
252
s2 (t) = γω 2 cos ωt, (39) где α, γ и ω — вещественные параметры. С учетом (39), из (8) находим `(t) = γω sin ωt + `0 , где `0 — постоянная интегрирования, которая будет выбрана ниже. В соответствии с (24) положим: `1 (t) = `0 ,
(40)
`2 (t) = γω sin ωt. С учетом (41), из (27) получаем m(t) = −γ cos ωt + m0 ,
(41) (42)
где m0 — постоянная интегрирования, которая будет выбрана ниже. Заметим, что система (37), (38), (40), (42) с достаточно большим параметром ω является системой с быстрым временем и имеет стандартный вид: ξ˙ = D(ωt) ξ, где D(τ ) (τ = ωt) — матрица системы (37), (38), (40), (42) (т.е. выражение, стоящее в фигурной скобке в (37) с учетом (38), (40), (42)). Поэтому к этой системе можно применить теорему 3 из § 2. Положив 3γ 2 ∗ 2 `0 = c A b, m0 = 0, 4 вычислим матрицу Z2π 1 D0 = D(τ ) dτ. 2π 0
Имеем 3γ 2 ∗ 2 D0 = A − (c A b)bc∗ A + 2 Возьмем теперь γ так, чтобы
µ
¶ γ2 ∗ 3 c A b + α bc∗ . 2
γ2 = κ, (43) 2 где κ ≥ 0 — число, фигурирующее в теореме 2. Тогда матрица D0 есть матрица (32) и по условию теоремы 2 она будет гурвицевой.
253
Следовательно, в силу теоремы 3 из § 2 система (37), (38), (40), (42) равномерно экспоненциально устойчива при достаточно больших значениях ω. В силу лемм 2 и 1 последнее утверждение верно и для системы (3). Соотношения (33) и (34) вытекают из (4), (38), (39) и (43) соответственно. Теорема 2 доказана.
§ 5. Высокочастотная стабилизация двумерных и трехмерных систем Здесь мы рассмотрим примеры применения теорем 1 и 2 из § 4. 1. Двумерные системы (n = 2). Рассмотрим систему (п.1, § 9, гл.IV) ½ x˙ 1 = x2 , (1) x˙ 2 = −a1 x1 − a2 x2 − u, y = c1 x1 + x2 , где a1 , a2 ; c1 — вещественные числа. Предположим, что передаточная функция W (p) системы (1) невырождена, т.е. c21 − a2 c1 + a1 6= 0. (2) Из условий Рауса–Гурвица легко выводится, что стационарная стабилизация u = αy (α = const) системы (1) возможна тогда и только тогда, когда c1 > 0 или a2 c1 < a1 ,
c1 ≤ 0.
Для системы (1) выполняется условие c∗ b = −1 6= 0 (здесь b = (0, −1)∗ , c = (c1 , 1)∗ ). Поэтому можно применить теорему 1 из § 4. Матрица (11) (см. § 4) здесь принимает вид: µ ¶ 0 1 . (3) −a1 − αc1 − κ(c21 − a2 c1 + a1 ) −a2 − α Матрица (3) гурвицева тогда и только тогда, когда существуют значения параметров α ∈ R и κ ∈ [0, +∞) такие, что выполняются неравенства: a2 + α > 0, a1 + αc1 + κ(c21 − a2 c1 + a1 ) > 0.
(4)
254
Очевидно, соотношения (4) выполнены, если выполнено по крайней мере хотя бы одно из неравенств c1 > 0 или c21 − a2 c1 + a1 > 0, c1 ≤ 0.
(5)
Таким образом, в силу теоремы 1 из § 4, условие (5) достаточно для существования стабилизирующего систему (1) управления u = s(t)y, где s(t) = α + βω cos ωt, причем β определяется из уравнения (13) § 4. В силу теоремы 1 из § 8 при выполнении неравенства c21 − a2 c1 + a1 < 0 (c1 ≤ 0) система (1) не может быть стабилизируема ни при какой обратной связи вида u = s(t)y. Итак, имеет место следующая Теорема 1. Пусть передаточная функция W (p) системы (1) невырождена, т.е. выполнено условие (2). Тогда: 1) если выполнено хотя бы одно из неравенств (5), то существуют числа β и κ ≥ 0, такие, что (см.(13) из § 4) Z2π
√ e−β sin t dt = 2π 1 + κ,
0
и обратная связь u = s(t)y, s(t) = α + βω cos ωt,
(6)
где α — некоторая константа, а ω — достаточно большое число, которая стабилизирует систему (1), т.е. замкнутая система (1), (6) является равномерно экспоненциально устойчивой при достаточно больших ω; 2) если условие (5) не выполнено, то ни при каком выборе функции s(t) система (1), где u = s(t)y, не является экспоненциально устойчивой.
255
Замечание. Таким образом, условие (5) является необходимым и достаточным для существования такой обратной связи (6), которая равномерно экспоненциально стабилизирует систему (1) (в классе M непрерывных и периодических функций, удовлетворяющих условиям (4) и (5) из § 4). Это же условие (5), как мы видели в § 9, гл.IV, является также необходимым и достаточным для стабилизируемости системы (2) в другом классе кусочно-постоянных периодических функций s(t). 2. Трехмерные системы (n = 3). Рассмотрим систему (п.2, § 9, гл.IV) x˙ 1 = x2 , x˙ 2 = x3 , y = x1 , (7) x˙ 3 = −a1 x1 − a2 x2 − a3 x3 − u, где a1 , a2 , a3 — вещественные числа. Из условий Рауса–Гурвица выводим, что стационарная стабилизация (s(t) ≡ const) возможна тогда и только тогда, когда a2 > 0,
a3 > 0.
Для системы (7) выполняются равенства меним к ней теорему 2 из § 4. Матрица (32) вид: 0 1 0 0 −a1 + α + κa3 −a2 − 3κ
c∗ b = c∗ Ab = 0. Прииз § 4 здесь принимает 0 1 . −a3
(8)
Матрица (8) гурвицева тогда и только тогда, когда при некоторых значениях параметров α ∈ R и κ ∈ [0, +∞) выполняются неравенства ¾ a3 > 0, a1 − α − κa3 > 0, . (9) a3 (a2 + 3κ) − a1 + α + κa3 > 0 Легко проверить, что такие значения параметров α ∈ R и κ ≥ 0, которые удовлетворяют неравенствам (9), существуют, если a3 > 0. Таким образом, в силу теоремы 2 из § 4 условие a3 > 0 является достаточным для существования периодической функции s(t) вида (33) из § 4 такой, что обратная связь u = s(t)y экспоненциально стабилизирует систему (7).
256
Далее, поскольку Tr(A + s(t)bc∗ ) = Tr A = −a3 при любой функции s(t) (как периодической, так и непериодической), то в силу следствия теоремы 2 из § 8, гл.IV система (7) при любой обратной связи u = s(t)y не является асимптотически (и экспоненциально) устойчивой, если a3 ≤ 0. Итак, справедлива Теорема 2. 1) Если в системе (7) a3 > 0, то существуют такие числа α и κ, что γ2 = κ, 2 и такая обратная связь u = s(t)y(t),
s(t) = α + γω 2 cos ωt,
(10)
где α — некоторая константа, а ω — достаточно большое число, что система (7), (10) равномерно экспоненциально устойчива при достаточно больших ω. 2) Если a3 ≤ 0, то ни при какой функции s(t) экспоненциальная стабилизация системы (13) с помощью обратной связи u = s(t)y невозможна. Замечание. Таким образом, условие a3 > 0, которое является, как мы видели в § 9, гл.IV, необходимым и достаточным для стабилизируемости системы (7) в классе кусочно-постоянных периодических функций s(t), и здесь тоже необходимо и достаточно для существования обратной связи u = s(t)y вида (10) (из класса M), равномерно экспоненциально стабилизирующей систему (7).
257
ГЛАВА VI ДИСКРЕТНЫЕ СИСТЕМЫ Выше на протяжении всей книги мы рассматривали системы с непрерывным временем. Основной математической моделью для описания таких систем ("вход–выход") служила система линейных дифференциальных уравнений. Управление формировалось таким образом, чтобы оно позволяло предсказать состояние объекта или какую– либо интересующую нас выходную характеристику в любой момент времени (в принятой нами математической идеализации). Однако во многих практических ситуациях (например, при управлении сложными объектами) непрерывная модель – система дифференциальных уравнений — оказывается неадекватной для описания соответствующих систем управления. В таких системах управления информация о состоянии объекта управления поступает в некоторые дискретные моменты времени t = tk , k = 0, 1, 2, · · · , и при построении управления оказывается возможным предсказать состояние объекта только в эти моменты времени tk . Любая текущая информация, поступающая в течение работы объекта, также может охарактеризовать его состояние только в те же моменты времени tk , а состояние объекта в любые промежуточные моменты времени не определено. Отметим, что к дискретным системам приводят также численные методы решения дифференциальных уравнений, основанные на идее дискретизации. Здесь будет изложен дискретный аналог линейной теории, которая была построена для непрерывных систем в главах II–IV. § 1. Линейные дискретные системы 1. Основная математическая модель. Для описания линейных дискретных систем управления примем в качестве основной математической модели дискретную систему xk+1 = Axk + buk , yk = c∗ xk (k = 0, 1, 2, · · · ),
(1)
258
где A, b и c — вещественные постоянные матрицы параметров порядков n × n, n × m и n × ` соответственно, xk — n-мерный вектор фазовых переменных (переменных состояния), uk — m-мерный вектор входных воздействий или управление, yk — `-мерный вектор выходных переменных. В модели (1) uk , xk и yk (k = 0, 1, 2, · · · ) являются последовательностями векторов в пространствах Rm , Rn и R` соответственно. Очевидно, что состояние xk и выход yk однозначно определяются из (1), если задать начальное состояние x0 и вход uk (k = 0, 1, 2, · · · ) (здесь мы видим полную аналогию с непрерывной моделью: система (1) сходна с системой линейных дифференциальных уравнений, см. § 1, гл.I). Под р е ш е н и е м с и с т е м ы (1) будем понимать любую тройку (uk , xk , yk ) векторных последовательностей {uk }, {xk } и {yk } (k ∈ N0 ), для которой выполняются равенства (1) для всех k ∈ N0 после подстановки uk , xk и yk в уравнения (1). (Здесь N0 = N ∪ {0}.) Как и в непрерывной модели, систему (1) можно представлять себе как линейный блок (1), входом и выходом которого являются векторы uk и yk соответственно, а вектор xk характеризует состояние блока в дискретные моменты времени t0 , t1 , t2 , · · · . 2. Свойства линейных дискретных систем. 2.1. Устойчивость. Рассмотрим сначала разомкнутую систему, когда отсутствует входное воздействие: uk = 0 ∀k = 0, 1, 2, · · · . Тогда система (1) принимает вид (линейная дискретная однородная система): xk+1 = Axk
(k = 0, 1, 2, · · · ).
(2)
(A — постоянная (n × n)-матрица, xk ∈ Rn ). С системой вида (2) мы фактически уже встречались в § 2, гл.IV, когда рассматривали отображение H за период (отображение монодромии) для линейной системы x˙ = A(t)x (x ∈ Rn ) с периодической матрицей A(t). Там мы видели, что устойчивость по Ляпунову и асимптотическая устойчивость исходной линейной системы дифференциальных уравнений x˙ = A(t)x равносильна соответственно устойчивости по Ляпунову и асимптотической устойчивости нулевого решения xk = 0 (k = 0, 1, 2, · · · ) дискретной системы xk+1 = Hxk .
259
Часто всевозможным свойствам решений непрерывных систем соответствуют аналогичные свойства связанных с ними дискретных систем (получаемых, например, дискретизацией исходной непрерывной системы или введением отображения за период для систем дифференциальных уравнений (не обязательно линейных) с периодической по времени t правой частью) и, наоборот. Это служит еще одной дополнительной мотивацией для изучения дискретных систем. Очевидно, что решение системы (2) с начальным условием x0 имеет вид xk = Ak x0 .
(3)
Пусть B — матрица, подобная матрице A: A = S −1 BS,
(4)
где S — некоторая невырожденная матрица. Тогда, подставляя значение (4) в (3), получим −1 −1 k xk = |S −1 BS · S −1 BS {z · S B · · · BS} x0 = S B Sx0 .
(5)
k
В случае, когда матрица B является блочно–диагональной жордановой матрицей, т.е.
J1 (λ1 ) 0 B = ... = diag[J1 (λ1 ), · · · , Jp (λp )], 0 Jp (λp ) где Jj (λj ) (j = 1, · · · , p) — клетки Жордана порядков `j , а λj — собственные числа матрицы A (не обязательно различные между собой), соответствующие различным клеткам Жордана, матрица B k имеет очень простой вид (см. (27), § 2, гл.IV):
J1 (λ1 )k 0 k k .. Bk = = diag[J1 (λ1 ) , · · · , Jp (λp ) ]. . 0 Jp (λ1 )k
(6)
260
Если все клетки Жордана Jj (λj ) простые (`j = 1), т.е. сводятся к одному элементу λj , то матрица B k будет чисто диагонального вида: k λj 0 .. Bk = . . λkj
0 Для жордановой клетки (`j > 1) λj Jj = 0
1 .. .
0
1 λj
матрица Jj (λj )k имеет вид (28) из § 2, гл.IV. Используя последнее, с учетом (6), из равенства Ak = S −1 B k S можно получить оценку нормы матрицы Ak (см. (30) из § 2, гл.IV): ||Ak || ≤ Cµ (µα)k
(µ > 1) (k = 0, 1, 2, · · · ),
(7)
где α = max |λj |, Cµ — константа, зависящая от µ; причем если собJ
ственным значениям матрицы A, имеющим максимальный модуль соответствуют простые жордановые клетки, то вместо (7) имеет место оценка ||Ak || ≤ Cαk (k = 0, 1, 2, · · · ). (8) At Оценки (7), (8) аналогичны соответствующим оценкам для ||e || (см. лемму 2 из § 4, гл.I). Используя оценки (7), (8) и вид (3) общего решения уравнения (2), получаем следующий результат. Теорема 1. 1) Для того чтобы все решения системы (2) стремились к нулю при k → +∞, необходимо и достаточно, чтобы все собственные значения λj матрицы A были расположены внутри единичного круга |p| < 1 (p ∈ C). 2) Для того чтобы все решения системы (2) были ограниченными, необходимо и достаточно, чтобы все собственные значения λj матрицы A были расположены внутри замкнутого единичного круга: |p| ≤ 1, причем собственным значениям, лежащим на окружности |λ| = 1, соответствовали простые жордановые клетки.
261
Дадим теперь определения устойчивости по Ляпунову и асимптотической устойчивости тривиального решения xk ≡ 0 дискретной системы (2), аналогичные соответствующим определениям для непрерывных систем (эти определения совпадают с данными в § 2, гл.IV соответствующими определениями для неподвижной точки отображения H монодромии). О п р е д е л е н и е 1. Т р и в и а л ь н о е р е ш е н и е xk ≡ 0 системы (2) называется у с т о й ч и в ы м п о Л я п у н о в у , если для любого δ > 0 существует число ε > 0 такое, что для любого решения системы (2) с начальным условием x0 , удовлетворяющим условию |x0 | < δ, выполняется соотношение
|xk | < ε ∀k ∈ {0, 1, 2, · · · }.
О п р е д е л е н и е 2. Т р и в и а л ь н о е р е ш е н и е xk ≡ 0 системы (2) называется а с и м п т о т и ч е с к и у с т о й ч и в ы м (в целом), если 1) оно устойчиво по Ляпунову и 2) все решения xk стремятся к нулю при k → +∞. Из вида (3) общего решения системы (2) и оценок (7) и (8) вытекает, что условия теоремы 1, очевидно, являются также необходимыми и достаточными соответственно для асимптотической устойчивости и устойчивости по Ляпунову тривиального решения системы (2) (см. также теорему 4 из § 2, гл.IV). Для удобства ссылок сформулируем этот факт. Теорема 2. 1) Т р и в и а л ь н о е р е ш е н и е xk ≡ 0 системы (2) а с и м п т о т и ч е с к и у с т о й ч и в о (в целом) тогда и только тогда, когда все собственные числа λj матрицы A удовлетворяют условию: |λj | < 1. 2) Т р и в и а л ь н о е р е ш е н и е xk ≡ 0 системы (2) у с т о й ч ив о п о Л я п у н о в у тогда и только тогда, когда все собственные числа матрицы A удовлетворяют условию: |λj | ≤ 1, причем собственным числам, лежащим на единичной окружности, соответствуют простые жордановые клетки.
262
Замечание 1. Из теорем 1 и 2 следует, что (как и для линейных однородных систем дифференциальных уравнений) для линейной однородной дискретной системы (2) устойчивость по Ляпунову тривиального решения эквивалентна ограниченности всех решений этой системы, а асимптотическая устойчивость — стремлению всех решений к нулю при k → +∞. Замечание 2. Аналогично, как и для систем линейных дифференциальных уравнений, легко установить, что устойчивость по Ляпунову (асимптотическая устойчивость) тривиального решения xk ≡ 0 системы (2) эквивалентна устойчивости по Ляпунову (асимптотической устойчивости) всех решений системы (2) (в последнем случае говорят об устойчивости или асимптотической устойчивости всей системы). Теорема 2 сводит вопрос об асимптотической устойчивости системы (2) к следующему вопросу: когда корни характеристического многочлена ∆(p) = det(pI − A) (p ∈ C), матрицы A принадлежат единичному кругу |p| < 1 ? Для ответа на этот вопрос достаточно заметить, что дробно-линейное преобразование λ=
p+1 , p ∈ C (p 6= 1) p−1
переводит единичный круг |p| < 1 в левую полуплоскость Re λ < 0. Поэтому характеристический многочлен ∆(p) заменится на дробнорациональную функцию µ ¶ λ+1 ψ(λ) = ∆ , λ−1 Вместо функции ψ(λ) можно рассматривать многочлен ¶ µ λ+1 n , χ(λ) = (λ − 1) ∆ λ−1 имеющий те же самые нули в области Re λ < 0, что и функция ψ(λ). Таким образом, для того чтобы корни характеристического многочлена ∆(p) принадлежали единичному кругу |p| < 1 необходимо и
263
достаточно, чтобы многочлен χ(λ) был устойчивым, т.е. чтобы были выполнены условия Рауса-Гурвица для многочлена χ(λ) (см.§ 2, гл.III). Пример. Приведем условия, когда корни многочлена 2-й степени ∆(p) = p2 + αp + β
(α, β ∈ R)
лежат внутри единичного круга |p| < 1. Элементарные выкладки приводят к следующему результату. Корни многочлена ∆(p) = p2 + αp + β принадлежат единичному кругу |p| < 1 тогда и только тогда, когда выполнены неравенства: |α| − 1 < β < 1.
2.2. Пример. Числа Фибоначчи. Покажем, что переход от формулы (3) к формуле (5) часто бывает полезным при решении уравнения (2). В качестве примера приведем, по-видимому, первую из рассмотренных математиками дискретную систему вида (2). Леонардо Пизанский (Фибоначчи) в начале XIII века рассмотрел дискретное уравнение ¾ fk = fk−1 + fk−2 , k = 2, 3, · · · (9) f0 = f1 = 1. Это уравнение генерирует так называемые числа Фибоначчи fk . Найдем явные выражения для fk , используя описанный выше подход. Введем обозначения: ¶ µ ¶ µ ¶ µ f0 1 fk , x0 := = . (10) xk := fk+1 f1 1 Тогда уравнение (9) можно записать в виде системы (2) с матрицей µ ¶ 0 1 A= . 1 1 Поскольку характеристический многочлен матрицы A имеет два различных вещественных корня √ √ 1+ 5 1− 5 p1 = , p2 = , 2 2
264
то жордановой формой матрицы A является матрица µ B=
p1 0 0 p2
¶ .
Матрица S, переводящая матрицу A в матрицу B, удовлетворяет соотношению SA = BS (det S 6= 0).
(11)
Обозначим через sij (i = 1, 2; j = 1, 2) элементы матрицы S, так что µ ¶ s11 s12 S= . s21 s22 Из (11) получаем уравнения для определения неизвестных элементов sij : s12 = p1 s11 s11 + s12 = p1 s12 . (12) s22 = p2 s21 s21 + s22 = p2 s22 Из первого равенства последней системы следует, что s11 6= 0 (в противном случае имели бы det S = 0). Не умаляя общности, можно считать, что s11 = 1. Тогда равенства (12) выполнены при s12 = p1 , s21 = 1, s22 = p2 . Таким образом, µ S=
1 p1 1 p2
¶ .
Используя правило нахождения обратной матрицы, получаем: S
−1
1 = p2 − p1
µ
p2 −p1 −1 1
¶ .
265
Из формулы (5) имеем µ k ¶ µ ¶ p1 0 1 −1 xk = S S· = k 0 p 2 ¶µ µ ¶µ1 k ¶ 1 p2 −p1 p1 0 1 + p1 = −√ = 1 ¶ µ 0 pk2¶ µ 1 ¶ + p2 5 −1 µ 1 −p2 p1 pk1 0 p21 √ = = k −1 p22 0 ¶ p2 5µ 1 µ ¶ 1 1 −p2 p1k+2 + p1 pk+2 pk+1 − pk+1 2 1 2 √ √ = = . k+2 k+2 pk+2 − pk+2 5 5 p1 − p2 1 2 Отсюда, учитывая обозначения (10), получаем формулу для чисел Фибоначчи fk : à √ !k+1 à √ !k+1 1 1+ 5 1− 5 . fk = √ − 2 2 5 Внимательный читатель здесь легко увидит полную аналогию с интегрированием линейных однородных систем дифференциальных уравнений путем приведения системы к канонической форме (с жордановой матрицей коэффициентов системы) с последующим возвращением к исходным переменным. 2.3. Линейные неоднородные дискретные системы. Такие системы имеют вид xk+1 = Axk + fk , k = 0, 1, 2, · · · ,
(13)
где A — постоянная (n × n)-матрица, xk ∈ Rn , fk ∈ Rn . Общее решение системы (13) можно найти последовательно (рекуррентно) подсчитывая вектор состояния xk в моменты 0, 1, 2, · · · : x1 = x2 = x3 = ··· xn = ···
Ax0 + f0 Ax1 + f1 = A2 x0 + Af0 + f1 Ax2 + f2 = A3 x0 + A2 f0 + Af1 + f2 ··· ··· ··· ··· ··· ··· P n−j−1 f An x0 + n−1 j j=0 A ··· ··· ··· ··· ······
266
Таким образом, общее решение системы (13) имеет вид xk = Ak x0 +
k−1 X
Ak−j−1 fj (k = 0, 1, 2, · · · ).
(14)
j=0
Подставляя (14) в правую и левую части уравнения (13), убеждаемся, что действительно формула (14) дает решение уравнения (13) при любом заданном начальном условии x0 ∈ Rn . Замечание 1. Формулы (3) и (14) для общих решений соответственно уравнений (2) и (13) вполне аналогичны соответствующим решениям Zt At
x(t) = e x0
At
eA(t−τ ) f (τ ) dτ
и x(t) = e x0 + 0
линейных дифференциальных уравнений dx(t) = Ax(t) и dt соответственно.
dx(t) = Ax(t) + f (t) dt
Замечание 2. В отличие от теории дифференциальных уравнений ответы на вопросы о существовании, единственности и продолжаемости решений дискретных систем xk+1 = F (xk , k), k = 0, 1, 2, · · · являются очевидными и положительными. (Здесь F — некоторое отображение прямого произведения Rn × N0 в Rn .) 2.4. Z-преобразование и передаточная функция. Для дискретных систем часто используется Z-преобразование, являющееся некоторым аналогом преобразования Лапласа для непрерывных систем. Рассмотрим множество M всех числовых последовательностей k (fk )∞ k=0 , возрастающих при k → +∞ не быстрее, чем d , где d — некоторое положительное число.
267
Определим Z-преобразование как оператор, определенный на множестве M по формуле ∞ X Z[(fk )] = fk z −k , z ∈ D, (15) k=0
где D — внешность круга {p ∈ C : |p| ≤ d}. Таким образом, Z-преобразование каждой последовательности (fk )∞ k=0 из множества M ставит в соответствие функцию комплексного переменного ∞ X F (z) = fk z −k (z ∈ D). k=0
Заметим, что часто в различных разделах математики используются производящие функции последовательностей ∞ X G(z) = fk z k . k=0
F (z −1 ).
Ясно, что G(z) = Вместо числовых последовательностей можно рассмотреть множество всех векторных последовательностей (fk )∞ k=0 , нормы которых возрастают при k → +∞ не быстрее, чем dk . Тогда Z-преобразование на множестве M всех таких векторных последовательностей определяется по той же формуле (15), что и для числовых последовательностей. Применим Z-преобразование к обеим частям уравнений (1) в предположении, что начальное условие x0 = 0: ∞ ∞ ∞ ∞ ∞ X X X X X xk z −k . yk z −k = c∗ uk z −k , xk z −k + b xk+1 z −k = A k=0
k=0
k=0
k=0
k=0
Из этих соотношений получаем: y˜k = −c∗ (A − zI)−1 b˜ uk , где u ˜k = Z[(uk )], y˜k = Z[(yk )]. Так же, как и в непрерывном случае, матричную функцию W (z) = c∗ (A − zI)−1 b
268
называют передаточной функцией системы (1) от входа uk к выходу (−yk ). Передаточная функция W (z) связывает Z-преобразования входа и выхода линейного дискретного блока так же, как и в непрерывном случае такая же функция W (p) связывала преобразования Лапласа входа и выхода. § 2. Управляемость, наблюдаемость и стабилизируемость Рассмотрим систему xk+1 = Axk + buk ,
y = c∗ xk
(k = 0, 1, 2 · · · ),
(1)
где A, b и c — вещественные постоянные (n × n)−, (n × m)− и (n × `)матрицы, uk ∈ Rm , xk ∈ Rn , y ∈ R` . 1. Управляемость. О п р е д е л е н и е 1. С и с т е м а (1) называется п о л н о с т ь ю у п р а в л я е м о й , если для любой пары векторов v ∈ Rn , z ∈ Rn существуют натуральное число K ≤ n и векторная последовательность uk (управление) такие, что для решения xk (k = 0, 1, 2, · · · , K) системы (1) с этой последовательностью uk (k = 0, 1, 2, · · · , K) и начальным условием x0 = v выполнено равенство xK = z. Таким образом, система (1) полностью управляема, если существует такое управление uk , что в некоторый момент K под его действием достигается желаемое состояние xK = z при произвольном начальном условии x0 = v (v, z ∈ Rn ). Мы видим, что определение 1 аналогично соответствующему определению в непрерывном случае. Как и в непрерывном случае в силу линейности системы (1) в определении 1 можно считать z = 0. Заметим, что в отличие от непрерывного случая здесь не гарантируется возможность достижения конечного целевого состояния z за любое время T . Требуется некоторое число тактов K, чтобы привести систему в требуемое состояние z. Теорема 1. (Критерий полной управляемости.) Система (1) полностью управляема тогда и только тогда, когда rank (b, Ab, · · · , An−1 b) = n,
(2)
269
т.е. когда пара (A, b) полностью управляема. Д о к а з а т е л ь с т в о . 1) Достаточность. Пусть выполнено условие (2). Воспользовавшись формулой (14) из § 2, представим состояние xk (k = n) в виде: n
xn = A x0 +
n−1 X
An−j−1 buj .
(3)
j=0
Пусть v и z — произвольные векторы из Rn . Тогда полагая x0 = v и используя (3), получаем условие достижимости желаемого состояния z ∈ Rn An−1 bu0 + An−2 bu1 + · · · + Abun−2 + bun−1 = z − An v, которое можно переписать в виде (b, Ab, · · · , An−1 b)
un−1 un−2 .. .
= z − An v.
(4)
u0 Соотношение (4) есть система линейных алгебраических уравнений с (n × nm)-матрицей (b, Ab, · · · , An−1 b) и свободным членом z − An y относительно неизвестных m-мерных векторов un−1 , un−2 , · · · , u0 . В силу условия (2) система (4) имеет решение (при m = 1 — единственное, а при m > 1 — бесконечное множество; в последнем случае возьмем одно из них) un−1 , un−2 , · · · , u0 . Таким образом, если выполнено условие (2), то существует такое управление (u0 , u1 , · · · , un−1 ), которое переводит вектор состояния x из состояния x0 = v в состояние xn = z, т.е. система (1) полностью управляема. Достаточность условия (2) установлена. 2) Необходимость. Пусть система (1) полностью управляема. Предположим, что условие (2) не выполнено. Тогда согласно свойству (V IIIy ) полной управляемости (см. § 1, гл.II) существует неособая
270
матрица S такая, что µ ¶ A11 A12 } n1 −1 S AS = 0 A22 } n2 , |{z} |{z} n1
µ S −1 b
=
b1 0
¶
} n1 } n2 .
(5)
n2
Сделаем в системе (1) замену переменных xk = Sξk . В результате получим ξk+1 = S −1 ASξk + S −1 buk , yk = c∗ Sξk . (6) Введя обозначение
µ (1) ¶ ξk }n1 ξk = (2) , }n2 ξ k
(1) ξk
(2) ξk
где ∈ Rn1 , ∈ Rn2 , перепишем уравнения (6), с учетом (5), следующим образом: ( (1) (1) (2) (1) ξk+1 = A11 ξk + A12 ξk + b1 uk , yk = c∗ Sξk , (2) (2) ξk+1 = A22 ξk , (1)
где uk ∈ Rn1 . (2) Мы видим, что ξk+1 не зависит от управления uk . Поэтому за счет (2)
выбора управления uk невозможно перевести вектор ξk из произ(2) (2) вольной начальной точки ξ0 = z1 в произвольную конечную точку (2) (2) ξK = z2 . Последнее означает, что система (1) неполностью управляема, вопреки условию. Полученное противоречие доказывает необходимость. Теорема 1 доказана. 2. Наблюдаемость. Перейдем теперь к понятию н а б л ю д а е м ос т и системы (1). Следующее определение аналогично соответствующему определению в непрерывном случае. О п р е д е л е н и е 2. Система (1) (или пара (A, c)) называется п о л н о с т ь ю н а б л ю д а е м о й , если существует натуральное число K ≤ n (n — размерность фазового пространства Rn ) такое, что для любых троек (1)
(1)
(1)
(2)
(2)
(2)
(uk , xk , yk ), (uk , xk , yk ), k = 0, 1, 2, · · · , K,
271
удовлетворяющих системе (1), из равенства входов и выходов: (1)
(2)
(1)
(2)
uk = uk , yk = yk , k = 0, 1, 2, · · · , K вытекает равенство состояний: (1)
(2)
xk = xk , k = 0, 1, 2, · · · , K. Как и в непрерывном случае в определении 2 можно считать (2) (2) ≡ 0, xk ≡ 0, yk ≡ 0 (k = 0, 1, 2, · · · , K). Таким образом, система (1) полностью наблюдаема, если по известным значениям входа uk и выхода yk можно однозначно определить состояние xk . Здесь тоже, как выше было отмечено для полностью управляемой системы (1), в отличие от непрерывного случая не гарантируется возможность точного определения состояния системы за любое время T . Требуется некоторое число тактов K, чтобы по наблюдениям (измерениям) входов и выходов однозначно определить состояние системы. (2) uk
Теорема 2. Для полной наблюдаемости системы (1) необходимо и достаточно, чтобы было выполнено условие rank (c, A∗ c, · · · , A∗
n−1
c) = n,
(7)
т.е. чтобы пара (A, c) была полностью наблюдаема. Д о к а з а т е л ь с т в о . 1) Достаточность. Пусть выполнено условие (7). Из рекуррентных соотношений (1) последовательно имеем: y0 = c∗ x0 = c∗ x1 = c∗ Ax0 + c∗ bu0 y1 y2 = c∗ x2 = c∗ A2 x0 + c∗ Abu0 + c∗ bu1 ··· ··· ··· ··· ··· P ∗ n−j−1 bu . yn−1 = c∗ xn = c∗ An−1 x0 + n−2 j j=0 c A
272
Перепишем эту систему в виде: ∗ y0 c c∗ A y1 − c∗ bu0 ∗ ∗ c∗ A2 · x0 = y2 − c Abu0 − c bu1 . .. . . . P ∗ n−1 ∗ n−j−1 c A yn−1 − n−2 j=0 c A
.
(8)
Соотношение (8) есть система линейных алгебраических уравнений с (n` × n)-матрицей ∗ c c∗ A .. . c∗ An−1 относительно неизвестного вектора x0 ∈ Rn . Пусть теперь известны вход uk (k = 0, 1, 2, · · · , n − 2) и выход yk (k = 0, 1, 2, · · · , n − 1). Тогда правая часть системы (8) тоже известна. Система (8) однозначно разрешима относительно неизвестного вектора x0 тогда и только, когда ∗ c c∗ A rank .. (9) = n, . c∗ An−1 что эквивалентно условию (7). Поэтому из (8) можно найти однозначно начальное состояние x0 при известных значениях входа uk и выхода yk . Определив начальное состояние x0 по рекуррентным равенствам (1), можно однозначно определить состояние xk в любой последующий момент k ≥ 1. Следовательно, система (1) полностью наблюдаема. Достаточность условия (7) установлена. 2) Необходимость условия (7) следует из того, что при его нарушении, т.е. нарушении условия (9), система (8) неоднозначно разрешима относительно x0 при известной правой части, и, следовательно, состояние xk (k ≥ 1) по соотношениям (1) определяется неоднозначно при известных значениях входа uk и выхода yk , т.е. система (1) не является полностью наблюдаемой.
273
Заметим, что в качестве числа K, фигурирующего в определении 2, можно принять число n − 1. Теорема 2 доказана. Замечание. Так как в силу теорем 1 и 2 полная управляемость и полная наблюдаемость системы (1) равносильны полной управляемости и наблюдаемости пар (A, b) и (A, c) соответственно, а последние в силу теоремы 2 из § 3, гл.II — свойству невырожденности передаточной функции W (z) = c∗ (A − zI)−1 b, то, как и в непрерывном случае, для полной управляемости и полной наблюдаемости системы (1) необходимо и достаточно, чтобы её передаточная функция W (z) была невырожденной. 3. Стабилизируемость. Дадим сначала следующее определение, аналогичное соответствующему определению в непрерывном случае. О п р е д е л е н и е 3. Система (1) называется стабилизируемой, если существует обратная связь (полная, т.е. c = I) uk = s∗ xk (k = 0, 1, 2, · · · ),
(10)
где s — постоянная (n×m)-матрица такая, что замкнутая система (1), (10), т.е. система xk+1 = (A + bs∗ )xk (k = 0, 1, 2, · · · )
(11)
асимптотически устойчива. В силу теоремы 2 из § 1 система (1) стабилизируема тогда и только тогда, когда существует постоянная (n×m)-матрица s такая, что все собственные числа матрицы A + bs∗ лежат внутри единичного круга |p| < 1 (p ∈ C). Имеет место аналог теоремы из § 4 главы III. Теорема 3. (Теорема о стабилизации.) Пусть система (1) полностью управляема. Тогда она стабилизируема. Д о к а з а т е л ь с т в о . В силу теоремы о стабилизации для непрерывных систем (см. § 4, гл.III) по описанному там алгоритму можно построить вещественную матрицу s порядка (n × m) такую, чтобы все собственные числа матрицы A + bs∗ располагались произвольно в отрицательной полуоси вещественной прямой, в частности, лежали внутри интервала (−1, 0). Тогда согласно теореме 2 из § 1 система (11) асимптотически устойчива. Теорема 3 доказана.
274
Отметим, что, как и в непрерывном случае, из стабилизируемости системы (1), вообще говоря, не следует ее управляемость. Следствие 1. Вещественную матрицу s можно выбрать так, чтобы процесс перехода решения xk в состояние x = 0 заканчивался не более, чем за n тактов, где n — размерность фазового пространства. Д о к а з а т е л ь с т в о . Выберем матрицу s так, чтобы матрица A + bs∗ имела характеристический полином pn (это можно сделать по той же теореме о стабилизации из § 4, гл.III). Тогда по теореме Гамильтона-Кэли [48] (A + bs∗ )n = 0. (12) Из (11) следует, что xn = (A + bs∗ )n x0 . Отсюда, с учетом (12), имеем: xn = 0. Следствие 1 доказано. Следствие 2. Пусть на систему (1) действует постоянное возмущение wk ≡ w, w = const — r-мерный вектор. Тогда существует обратная связь uk = s∗ xk такая, что в системе xk+1 = Axk + buk + qw, uk = s∗ xk (k = 0, 1, 2, · · · ),
(13)
где q — некоторая постоянная (n × r)-матрица, не более чем за n тактов устанавливается постоянное значение вектора состояния: x∞ = [I + (A + bs∗ ) + · · · + (A + bs∗ )n−1 ]qw.
(14)
Д о к а з а т е л ь с т в о . Из рекуррентных соотношений (13) имеем x1 = As x0 + qw, x2 = A2s x0 + (As + I)qw, x3 = A3s x0 + (A2s + As + I)qw, (15) ··· ··· ··· ··· ··· ··· xk = Aks x0 + (Ak−1 + · · · + As + I)qw, s ··· ··· ··· ··· ··· ··· , где введено обозначение As := A + bs∗ .
275
В силу следствия 1 Ans = 0. Отсюда имеем Aks = 0 ∀ k ≥ n.
(16)
Учитывая (16), из формулы общего решения (15) системы (13) получаем, что xk = (I + As + · · · + An−1 )qw s
∀ k ≥ n.
Следствие 2 доказано. Замечание 1. Поскольку (I − As )
n−1 X j=0
Ajs
=
n−1 X
Ajs (I − As ) = I − Ans ,
j=0
и матрицу s можно выбрать такой, чтобы собственные числа матрицы As были отличны от 1, то выражение для x∞ из (14) можно записать так: x∞ = (I − Ans )(I − As )−1 qw
(As = A + bs∗ ).
Замечание 2. Стабилизация системы (1) при неполной обратной связи yk = c∗ xk (c 6= I) рассмотрена в [147]. § 3. Проблема Брокетта для линейных дискретных систем управления 1. Постановка задачи. В главе IV мы рассмотрели проблему Брокетта — проблему стабилизации линейных непрерывных систем с помощью нестационарных линейных обратных связей. Дискретный аналог этой проблемы можно сформулировать следующим образом. П р о б л е м а Б р о к е т т а д л я д и с к р е т н ы х с и с т е м : дана тройка матриц A, b, c; при каких условиях существует последовательность матриц {sk }∞ k=0 такая, ято линейная система управления xk+1 = Axk + buk , yk = c∗ xk (k = 0, 1, 2, . . .), (1)
276
где xk ∈ Rn , uk ∈ Rm , yk ∈ R` , замкнутая обратной связью uk = s∗k yk , т.е. система xk+1 = (A + bs∗k c∗ )xk
(k = 0, 1, 2, . . .)
(2)
является асимптотически устойчивой ? (Здесь A, b, c — вещественные постоянные матрицы, размерности которых равны (n × n), (n × m), (n × `) соответственно). Ниже мы переносим на дискретный случай методику синтеза стабилизирующих матриц sk = s(k), разработанную в гл.IV для непрерывных систем. Далее будет показано, что для систем второго порядка со скалярной обратной связью и невырожденной передаточной функцией, удовлетворяющих одному из условий W (0) 6= 0, | det A| < 1, проблема Брокетта всегда имеет положительное решение. При изложении будем следовать работе [97]. 2. Основная теорема. Пусть существуют постоянные матрицы s(j) (j = 1, 2) такие, что системы xk+1 = (A + bs∗(j) c∗ )xk , xk ∈ Rn
(j = 1, 2),
(3)
обладают устойчивыми инвариантными линейными многообразиями Lj и инвариантными линейными многообразиями Mj . Пусть, далее, dim Mj + dim Lj = n,
Mj ∩ Lj = {0}
и для положительных чисел λj , κj , αj , βj выполнены неравенства (j)
(4)
(j)
(5)
kxk k ≤ αj kx0 ke−λj k ∀ x0 ∈ Lj , kxk k ≤ βj kx0 keκj k ∀ x0 ∈ Mj , (j)
где xk — решение системы (3) с начальным условием x0 . Пусть существует последовательность матриц {σk }∞ k=0 и целые числа k1 ≥ 1 и r ≥ 1 такие, что для системы xk+1 = (A + bσk∗ c∗ )xk
(6)
θ0r M1 ⊂ L2 ,
(7)
выполнено включение
277
(как и в § 4, гл.IV будем называть (7) "условием вложения многообразий"), где r−1 Y θ0r = (A + bσj∗ c∗ ). (8) j=0
Заметим, что решение xk системы (6) с начальным условием xk0 = x0 дается формулой: xk = θkk0 x0 , (9) где k−1 Y θkk0 = (A + bσj∗ c∗ ), k ≥ k0 + 1, θkk00 = I (10) j=k0
(здесь I — единичная матрица). При этих предположениях имеет место следующая Теорема 1. (Основная теорема.) Пусть выполнено неравенство λ1 λ2 > κ1 κ2 . (11) Тогда существует K-периодическая матрица sk (sk+K = sk ∀ k = 0, 1, 2, · · · ; K ∈ N) такая, что система (2) является асимптотически устойчивой. Д о к а з а т е л ь с т в о . Идея доказательства такая же, как и в непрерывном случае. 1) Из условия (11) следует, что для любого числа T > 0 при достаточно больших натуральных k2 выполнены неравенства T κ2 T λ2 + k2 < k 1 < − + k2 . λ1 λ1 κ1 κ1 Отсюда следует, что имеют место следующие неравенства ¾ −λ1 k1 + κ2 k2 < −T . (12) −λ2 k2 + κ1 k1 < −T 2) Определим периодическую матрицу sk следующим образом: при k ∈ [0, k1 ), s1 σ при k ∈ [k1 , k1 + r), (13) sk = k−k1 s2 при k ∈ [k1 + r, k1 + k2 + r), sk+K = sk ,
278
где K : = k1 +k2 +r (здесь обозначение k ∈ [α, β) означает, что k принимает лишь целочисленные значения, принадлежащие промежутку [α, β)). Покажем, что при достаточно больших значениях K система (2) с матрицей вида (13) будет асимптотически устойчивой. 3) Введем в рассмотрение отображение за период K: J : Rn → Rn (аналогичное отображению монодромии H в непрерывном случае), определенное следующим образом: Jx0 = xK
∀ x0 ∈ Rn ,
где xK — значение при k = K решения xk уравнения (2) с начальным условием x0 . Возьмем единичный шар E1 = {x : kxk ≤ 1} в Rn и докажем, что JE1 ⊂ E1/2 , 1 где E1/2 = {x : kxk ≤ }, т.е. все решения xk системы (1) с началь2 ными данными из шара E1 при k = K попадают в шар E1/2 . Так как xk = (A + bs∗j c∗ )k x0
(x0 ∈ Rn ) (j = 1, 2)
— решение уравнения (3) с начальным условием x0 , а k−1 Y
xk =
∗ (A + bσj−k c∗ )xk1 1
k1 ≥ k1 + 1
j=k1
— решение системы ∗ xk+1 = (A + bσk−k c∗ )xk 1
(k ≥ k1 + 1)
с начальным условием xk1 , то отображение J представляет собой композицию трех отображений (обозначим их через f0k1 , ϑkk11 +r , gkK1 +r ): Q 1 +r−1 ∗ f0k1 = (A + bs∗1 c∗ )k1 , ϑkk11 +r = kj=k (A + bσj−k c∗ ), 1 1 gkK1 +r = (A + bs∗2 c∗ )k2 , так что J = gkK1 +r · ϑkk11 +r · f0k1 ; k
f0 1
k +r
ϑk1
gkK +r
1 1 J : x0 −→ xk1 −→ xK xk1 +r −→
(x0 ∈ Rn ),
279
где xk1 = f0k1 x0 , xk1 +r = ϑkk11 +r xk1 , xK = gkK1 +r xk1 +r . Принимая во внимание (8), получаем равенство ϑkk11 +r = θ0r . Очевидно, что gkK1 +r = g0k2 . С учетом последних двух соотношений имеем xK = Jx0 = g0k2 · θ0r · f0k1 x0 ∀x0 ∈ Rn . (14) 4) С помощью невырожденного линейного преобразования переменных µ (j) ¶ ξ = Bj x (j = 1, 2), (15) η (j) 0
00
где ξ (j) ∈ Rnj , η (j) ∈ Rnj , n0j = dim Lj , n00j = dim Mj , Bj — неособая матрица, приведем систему (2) к следующему виду ( (j) (j) ξk+1 = Pj ξk , (16) (j) (j) (j = 1, 2). ηk+1 = Qj ηk Не умаляя общности, будем считать, что (j)
(j)
kξk k ≤ αj kξ0 ke−λj k , (j) (j) kηk k ≤ βj kη0 keκj k .
) (17)
Действительно, оценив норму решений уравнений (16) получим: (j)
(j)
(j)
(j)
kξk k = kPjk ξ0 k ≤ ||Pjk || · kξ0 k ≤ αjk ρkj kξ0 k, (j) (j) (j) (j) kηk k = kQkj η0 k ≤ ||Qkj || · kη0 k ≤ βj µkj kη0 k, причем ρj < 1, так как Lj — устойчивое инвариантное многообразие, а µj ≥ 1, так как Mj — инвариантное, вообще говоря, неустойчивое многообразие. Положив −λj = ln ρj , κj = ln µj , будем иметь соотношения (17). Так как xk1 +r = θ0r xk1 ,
280
то отсюда, учитывая (15), получаем µ (2) ¶ µ (1) ¶ ξk1 +r ξk1 r −1 = B θ B . 2 0 1 (2) (1) ηk1 +r ηk1
(18)
В силу условия (7) для любого x0 ∈ M1 θ0r x0 = x00 ,
x00 ∈ L2 .
(19)
С учетом (15) имеем:
µ ¶ µ ¶ 0 ξ2 00 B1 x = , B2 x = . 0 η1 0
Используя последние соотношения, из (19) получаем µ ¶ µ ¶ ξ2 r −1 0 = B2 θ0 B1 . 0 η1 Отсюда выводим, что матрица B2 θ0r B1−1 имеет следующую структуру ¶ µ b11 (r) b12 (r) }n02 −1 r B2 θ0 B1 = . b21 (r) 0 }n002 (20) | {z } | {z } n01
n00 1
Далее, из системы (16) (в новых координатах) будем иметь: ¶ µ (1) ¶ µ (1) ¶ µ k1 ξk1 ξ0 P1 0 = k1 (1) , (1) 0 Q1 η0 ηk1 µ
(2) ¶
ξK
(2)
где
ηK µ
µ =
P2k2 0
(1) ¶
ξk1
(1)
ηk1
0 Qk22 µ
= B1 xk1 ,
¶µ
(2)
ξk1 +r (2)
ηk1 +r
¶ ,
(2) ¶
ξK
(2)
ηK
= B2 xK .
Отсюда, учитывая (18) и (20), соотношение (14) перепишем (в новых координатах) так: ¶ µ k1 ¶ µ (1) ¶ ¶µ µ (2) ¶ µ k2 ξK ξ0 P2 0 b11 (r) b12 (r) P1 0 k1 k2 (1) . (2) = b (r) 0 0 Q2 0 Q1 21 η0 ηK
281
Из последнего равенства, используя оценки (17), получаем: (2)
(1)
kξK k ≤ α1 α2 kξ0 k · ||b11 (r)|| · e−λ1 k1 −λ2 k2 + (1) +α2 β1 kη0 k · ||b12 (r)|| · e−λ2 k2 +κ1 k1 (2) (1) kηK k ≤ α1 β2 kη0 k · ||b21 (r)|| · e−λ1 k1 +κ2 k2 . Из последних оценок, в силу неравенств (12), имеем (2)
(2)
kξK k ≤ C1 e−T , kηK k ≤ C2 e−T , где C1 и C2 — некоторые положительные константы. Отсюда при достаточно большом T > 0 будем иметь °µ (2) ¶° ° ° ξ °−1 ° K ° 1 ° ° (2) ° < · °B2−1 ° . ° 2 ° η K Следовательно,
° µ (2) ¶° ° ξK ° ° ° 1 kxK k = °B2−1 (2) ° < , ° ηK ° 2
т.е. kJx0 k < 1/2 ∀ x0 ∈ E1 . Таким образом, отображение J за период K переводит единичный шар E1 в некоторое подмножество из шара E1/2 радиуса 1/2 : JE1 ⊂ E1/2 . Отсюда и из линейности отображения J (в чем легко можно убедиться) следует, что J есть сжимающий оператор: 1 kJxk < kxk ∀ x ∈ Rn . (21) 2 Поэтому из (21) в силу периодичности матрицы sk и, следовательно, матрицы A + bs∗k c∗ имеем 1 kxk ∀ x ∈ Rn , 2k откуда следует асимптотическая устойчивость неподвижной точки x = 0 отображения J. Очевидно, что асимптотическая устойчивость точки x = 0 отображения J эквивалентна асимптотической устойчивости нулевого решения xk ≡ 0 системы (2) с матрицей (13). Теорема 1 доказана. kJ k xk
κ,
(23)
284
то существует K-периодическая числовая последовательность sk (sk+K = sk ∀ k = 0, 1, 2, · · · ; K ∈ N) такая, что система (2) является асимптотически устойчивой. Из теоремы 3 легко выводится Теорема 4. Пусть в системе (1) b ∈ Rn , c ∈ Rn , пара (A, b) полностью управляема, а пара (A, c) полностью наблюдаема. Предположим, что существует число s0 такое, что матрица A + s0 bc∗ имеет n − 1 собственное значение ρj , j = 1, 2, · · · , n − 1 (среди которых могут быть равные), лежащие внутри единичного круга: |p| < 1, и для ее собственного значения ρn выполнено неравенство max |ρn · ρj | < 1.
(24)
j
Тогда существует периодическая числовая последовательность sk (k = 0, 1, 2, · · · ) такая, что система (2) является асимптотически устойчивой. Д о к а з а т е л ь с т в о . Обозначим через L0 инвариантное (n − 1)-мерное подпространство, соответствующее собственным значениям ρj (j = 0, 1, 2, · · · , n−1) матрицы (A+s0 bc∗ ), лежащим внутри единичного круга, а через M0 — инвариантное одномерное подпространство, соответствующее собственному числу ρn (вообще говоря, удовлетворяющее условию |ρn | ≥ 1). Таким образом, L0 — это устойчивое инвариантное многообразие ((n − 1)-мерная гиперплоскость, на которой оператор A + s0 bc∗ действует как сжатие не менее, чем в 1/ρ∗ раз, где ρ∗ = max |ρj |), а M0 j
— инвариантное (вообще говоря, неустойчивое) многообразие (одномерная прямая, на которой A + s0 bc∗ действует, вообще говоря, как растяжение в |ρn | раз). Условие (24) означает, что сжатие в L0 "сильнее", чем растяжение в M0 . Примем s1 = s2 : = s0 ; L1 = L2 : = L0 , M1 = M2 : = M0 .
285
Из условия (24) имеем |ρn |