С. В. Емельянов, С. К. Коровин
Новые типы обратной связи Управление при неопределенности
ББК 22.18 ЕбО УДК 519.71
ЕМ...
32 downloads
226 Views
4MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
С. В. Емельянов, С. К. Коровин
Новые типы обратной связи Управление при неопределенности
ББК 22.18 ЕбО УДК 519.71
ЕМЕЛЬЯНОВ СВ., КОРОВИН С.К. Новые типы обратной связи: Управление при неопределенности. — М.: Наука. Физматлит, 1997. — 352 с. — ISBN 5-02-015149-1. Монография посвящена фундаментальным проблемам теории обратной связи. Сформулированы основные тенденции развития теории обратной связи и предложены новые идеи и принципы, ориентированные на реше ние задач управления и оптимизации в условиях неопределенности. Вве дены принципы бинарности, генерации структур и новые типы обратной связи, сочетание которых с принципами классической теории позволяет до биться высокого качества управления при существенной неопределенности и расширяет возможности автоматических систем. Представлены методы, которые могут найти применение при решении задач промышленной авто матики и при создании систем управления сложными объектами, например в авиации и космонавтике. Для научных работников, интересующихся проблемами теории обрат ной связи, кибернетики, управления и оптимизации, а также аспирантов и студентов соответствующих специальностей. Ил. 263. Библиогр. 98 назв.
Р е ц е н з е н т ы : академик В.Л. Маслов, академик Я.3. Цыпкин
_ 1602110000-014 „ Е —nn4 о т — В е з 053(02}-97 ISBN 5-02-015149-1
ов,
ь«вл.
„ „ „ л © СВ. Емельянов, с к
Коровин
1997
Оглавление Предисловие Введение
8 11
Часть I Принципы построения систем автоматического управления Глава 1. Принципы построения линейных систем автомати ческого управления 1.1. Постановка задачи управления и предварительные сведения .. 1.2. Принцип регулирования по нагрузке 1.3. Принцип регулирования по возмущению 1.4. Принцип компенсации при косвенном измерении возмущения . 1.5. Принцип двухканальности 1.6. Метод /^-изображений или метод встроенной модели 1.7. Глубокая обратная связь — большой коэффициент усиления .. 1.7.1. Постановка задачи, особенности и идея решения 1.7.2. Проблемы и ограничения метода глубокой обратной связи 1.7.3. О грубости систем с глубокой обратной связью 1.7.4. Метод пространства состояний в анализе систем с глу бокой обратной связью 1.7.5. Геометрическая интерпретация систем с глубокой обрат ной связью 1.7.6. Влияние амплитудного ограничения на системы с глу бокой обратной связью 1.8. Библиографический комментарий
17 17 28 31 35 40 49 56 56 58 62 64 65 65 66
Глава 2. Некоторые принципы построения нелинейных регу ляторов 68 2.1. Релейная обратная связь 68 2.1.1. Основные понятия 68 2.1.2. Скользящий режим в точке 71 2.1.3. Режим переключений 73 2.1.4. О прочности режима переключения 75
Оглавление
4
2.1.5. Релейная стабилизация объекта с самовыравниванием . 76 2.1.6. Стабилизация объекта с высоким относительным по рядком 78 2.1.7. Робастная стабилизация: разрывность, непрерывность и информация о состоянии 78 2.1.8. Робастная стабилизация объекта с первым относитель ным порядком 80 2.1.9. Скользящий режим на отрезке 81 2.1.10. Реальный скользящий режим на отрезке 82 2.1.11. Релейная стабилизация обобщенного объекта 83 2.2. Стабилизация объекта с неопределенным оператором 84 2.2.1. Общие положения 84 2.2.2. Принцип каскадного регулирования 88 2.2.3. Структура объектов каскадного регулирования 92 2.2.4. Стабилизация интервальных объектов 94 2.2.5. Интервальная устойчивость 96 2.2.6. Общие положения теории адаптивной стабилизации . . . 100 2.3. Стабилизация регулятором переменной структуры 108 2.3.1. Астатическая следящая система 109 2.3.2. Астатизм 2-го порядка 114 2.3.3. Астатизм порядка m 115 2.3.4. Астатическая следящая система переменной структуры 116 2.3.5. Скользящий режим на всей прямой 120 2.3.6. Анализ прочности СПС по отношению к параметриче ским возмущениям 123 2.3.7. СПС при наличии внешней силы ' 125 2.3.8. Квазирелейное представление ^-ячейки 128 2.3.9. Ограничения, недостатки и проблемы теории СПС . . . . 130 2.4. Библиографический комментарий 131
Часть II Новые типы обратной связи Глава 3. Общие положения т е о р и и новых типов о б р а т н о й связи 3.1. Вводные замечания 3.2. Система базовых понятий 3.2.1. Сигнал-оператор 3.2.2. Типы динамических объектов 3.2.3. Бинарная операция 3.2.4. Типы регулирующих органов 3.2.5. Новые типы обратной связи 3.3. Структурный синтез бинарных систем 3.3.1. Задача стабилизации 3.3.2. Нелинейная обратная связь как средство подавления неопределенности 3.3.3. Задача фильтрации
135 135 137 137 138 139 140 140 141 141 148 150
Оглавление
5
Глава 4. Теория координатно-операторнои о б р а т н о й связи .. 154 4.1. Стабилизация объекта второго порядка с неизвестными па раметрами и внешним воздействием 4.1.1. Принцип скаляриэации и уравнение объекта в простран стве ошибок 4.1.2. Некоторые замечания к постановке задачи и ее обоб щения 4.1.3. Фазовое пространство координата-оператор 4.2. КО-алгоритмы стабилизации 4.2.1. Прямая компенсация 4.2.2. Асимптотическое оценивание или косвенное измерение О-возмущения 4.2.3. Компенсация волнового О-возмущения 4.2.4. Релейная КО-стабилизация 4.2.5. Замечание о прочности систем с релейной КО-связью . . 4.2.6. Линейные КО-алгоритмы стабилизации 4.2.7. Интегрально-релейный КО-алгоритм стабилизации . . . . Глава 5. Скользящие р е ж и м ы высших порядков 5.1. Некоторые предварительные сведения из теории скользящего режима 5.1.1. Уравнения скольжения 5.1.2. Об инвариантности уравнения скольжения по отноше нию к возмущениям, удовлетворяющим условию согла сованности 5.1.3. Уравнения реального скольжения 5.1.4. Замечание о порядке скольжения 5.2. Алгоритмы скольжения 2-го порядка 5.2.1. Асимптотические алгоритмы скольжения 2-го порядка. 5.2.2. Разрывные асимптотические алгоритмы скольжения 2-го порядка 5.2.3. Финитные алгоритмы скольжения 2-го порядка: ли нейная обратная связь 5.2.4. Финитные алгоритмы скольжения 2-го порядка: релей ная обратная связь 5.2.5. Алгоритм скручивания 5.3. Финитная стабилизация по выходу Глава 6. Теория о п е р а т о р н о й о б р а т н о й связи 6.1. О назначении операторной обратной связи 6.2. Уравнения движения в пространстве координата-оператор . . . 6.3. Статическая операторная обратная связь 6.3.1. Статические операторная и координатно-операторная обратные связи 6.3.2. Статическая операторная и динамическая координатнооператорная обратные связи 6.3.3. Инерционная координатно-операторная обратная связь.
155 156 157 161 164 165 165 166 168 171 172 176 179 179 180 182 183 187 191 193 196 197 199 200 202 206 206 209 211 212 215 215
Оглавление
6
6.3.4. Инерционно-релейная координатно-операторная обрат ная связь 217 6.3.5. Инерционно-релейная координатно-операторная обрат ная связь при неизвестном параметре при управлении. . 221 6.3.6. Интегрально-релейная координатно-операторная обрат ная связь 222 Глава 7. Теория операторно-координатнои о б р а т н о й связи .. 225 7.1. Динамический статиэм и операторно-координатная обратная связь 7.2. Уравнения движения операторно-координатного объекта 7.3. Статический ОК-регулятор 7.4. Интегральный ОК-регулятор 7.5. Основные свойства и особенности бинарных систем стабили зации с различными типами обратной связи 7.6. Разрывная ОК-связь 7.6.1. Интегрально-релейный ОК-регулятор 7.6.2. Скользящие режимы второго порядка в ОК-контуре . . .
225 228 229 231 235 237 237 241
Глава 8. Ограничения, физические основы компенсации воз мущений и стабилизация в ы н у ж д е н н о г о движения в бинарных с и с т е м а х 246 8.1. 8.2. 8.3. 8.4.
Ограничения операторной переменной О глобальном поведении бинарной системы Физические основы компенсации неопределенности О компенсации координатного возмущения
Глава 9. Д и ф ф е р е н ц и р о в а н и е сигналов 9.1. Постановка задачи дифференцирования 9.1.1. Фильтрация 9.1.2. RC-цепочка 9.1.3. Дискретно-разностные аппроксимации 9.2. Следящие дифференцирующие системы 9.2.1. Линейный дифференциатор 9.2.2. Релейный дифференциатор 9.2.3. Дифференциатор переменной структуры 9.3. Следящий асимптотический бинарный дифференциатор 9.4. Финитный бинарный дифференциатор 9.5. Нестандартные дифференцирующие системы 9.5.1. Дифференциатор с "малой" амплитудой разрывов 9.5.2. Нестандартный бинарный дифференциатор 9.5.3. Результаты дискретного моделирования нестандарт ного бинарного дифференциатора
247 252 255 256 262 262 264 265 269 271 272 276 280 283 287 288 289 291 297
Оглавление
7
Глава 10. Субоптимальная стабилизация неопределенного о б ъ екта 300 10.1. Постановка задачи оптимальной стабилизации 10.2. Пример задачи оптимальной стабилизации при неопределен ности 10.3. Оптимальная стабилизация "в среднем" 10.4. Минимаксная оптимальная стабилизация 10.5. Стабилизация с использованием эталонной модели и глубокой обратной связи по ошибке 10.6. Стабилизация методами теории бинарного управления 10.6.1. Система переменной структуры 10.6.2. Бинарная стабилизация с интегральной КО-связыо . . . . 10.6.3. Стабилизация с использованием скользящего режима 2-го порядка 10.7. Сведение проблемы субоптимальной стабилизации к проблеме асимптотической инвариантности 10.7.1. Основные понятия теории асимптотической инвариант ности 10.7.2. Субоптимальная линейно-квадратичная стабилизация . . Заключение Список л и т е р а т у р ы П р е д м е т н ы й указатель
300 302 303 304 306 308 310 311 312 313 314 316 319 322 328
Авторы сердечно признательны Михаилу Юрьевичу Живило, чье искреннее жела ние содействовать развитию российской науки вызывает глубокое уважение.
Предисловие В данной монографии рассматривается одна из центральных про блем теории автоматического управления — задача стабилизации и методы ее решения в развитии, то есть, начав с простейшей поста новки задачи и постепенно усложняя ее, авторы анализируют возмож ности различных методов ее решения. Усложнение связано с ростом неопределенности в постановке за дачи, в соответствии с этим изменяются и методы ее решения. По добный подход позволяет рассмотреть общие тенденции в развитии принципов и методов теории автоматического управления. Послед нее представляется особенно важным и своевременным, ибо понима ние общих механизмов формирования управления важнее знания кон кретных методик его синтеза. Нужно отметить, что предлагаемая точка зрения на развитие тео рии автоматического управления не считается авторами единственно возможной, поскольку проблема механизма генерации обратной связи далеко не тривиальна и возможны разные подходы к описанию этого механизма. Чем больше будет предложено таких подходов, тем лучше, ибо они приближают нас к пониманию фундаментальных основ меха низма обратной связи. Последнее чрезвычайно важно в теоретическом и прикладном ас пектах, потому что современные методы стабилизации ориентиро ваны в основном на "силовое" решение проблемы, тогда как природа демонстрирует замечательные образцы решения задач стабилизации весьма ограниченными средствами и при весьма стесненных обсто ятельствах. Последнее ясно указывает на то, что настоящая теория обратной связи еще не создана, многое остается неясным и основные открытия в этой области знания еще впереди. Касаясь столь сложной и деликатной проблемы, авторы далеки от претензии на исчерпывающее ее решение, но убеждены в том, что предлагаемая ими теория выглядит естественной и убедительной.
Предисловие
9
Как уже отмечалось, изложение построено на переходе от простого к сложному и начинается, естественно, с линейных объектов и мето дов теории линейных систем управления. Поскольку упор делается на принципы решения задач и на содержательную интерпретацию ре зультатов, то математически строгие утверждения и доказательства не приводятся. Разумеется, все факты и утверждения, вошедшие в монографию, могут быть строго обоснованы, и многие из них хорошо известны по литературным источникам. В монографии сравниваются применения различных методов упра вления для решения задач стабилизации при вариации ряда условий: внешних сил, параметров, структуры и порядка объекта. Для этой цели в наибольшей степени подходят, конечно, простые модели объ ектов — только такие модели здесь и рассматриваются. При анализе, однако, используются различные формы описания объектов управле ния: структурная, операторная, дифференциальная, поскольку неко торые факты выглядят наиболее убедительно при одном описании, иные — при другом. В книге четко прослеживается тот факт, что по мере усложне ния задачи стабилизации все большая роль отводится нелинейности. Кроме того, выясняется, что без нелинейной обратной связи не может быть хорошей стабилизации и именно нелинейная обратная связь на деляет систему управления способностью демонстрировать "нужное" поведение в сложных и постоянно изменяющихся внешних и внутрен них условиях. Оказывается, что с некоторого уровня сложности за дачи "хороший" регулятор обязательно будет нелинейным. Известно, что в нелинейном мире нет регулярных путей и универсальных мето дов, характерных для локальных теорий, так как специфика нелиней ности часто играет решающую роль. Для теории, развиваемой в мо нографии, весьма полезными оказались структурные методы анализа и синтеза систем, именно поэтому описанию этих методов уделяется достаточно большое внимание. Целенаправленное использование нелинейностей в управлении по зволяет запускать в оборот принципиально новые, "несиловые", ме ханизмы подавления факторов неопределенности. Это, в частности, приемы, базирующиеся на использовании положительной обратной связи и неустойчивых движений и позволяющие системе саморазго няться до тех пор, пока не создадутся условия для подавления помех и факторов неопределенности. Именно положительная обратная связь и неустойчивость в ряде задач играют ключевую роль. Наконец, отметим, что задачу стабилизации не следует рассматри вать узко, и что многие важные проблемы теории управления могут быть сведены к задаче стабилизации, например проблемы дифферен-
10
Предисловие
цирования и оптимизации. Однако ввиду важности и содержательно сти этого класса задач относящиеся к ним исследования вынесены в самостоятельные разделы. Авторы искренне признательны многим людям, сыгравшим важ ную роль в появлении и развитии теории бинарного управления: од ним — за доброжелательное внимание и заинтересованное отношение еще на этапе первых публичных выступлений, другим — за самоотвер женную и творческую работу над актуальными проблемами теории, оппонентам — за суровую, но в итоге полезную критику. Мы выражаем особую благодарность академикам А.А. Красовскому, Е.П. Попову и Я.З. Цыпкину, замечания которых всегда были точными, затрагивали существо вопросов и способствовали правиль ному развитию теории. Мы также признательны своим ученикам и последователям, кото рые много лет с энтузиазмом продуктивно трудились в этой области и внесли важный вклад в новую теорию. Прежде всего мы хотели бы отметить вклад И.Г. Мамедова, А.Л. Нерсисяна, В.И. Сизикова, А.П. Носова и Л.В. Левантовского. Нам приятно отметить атмосферу доброжелательности, научного творчества и взаимоподдержки, которая сложилась в коллективе Ин ститута системного анализа Российской академии наук, что самым благотворным образом отразилось на нашей работе. В этом заслуга первого директора ИСА РАН академика Д.М. Гвишиани. Наконец, мы обязаны отметить кропотливую и исключительно по лезную работу по подготовке рукописи к печати, которую взяли на себя А.П. Носов, М.М. Белова, А.С. Фурсов, Л.А. Селиванова, Э.Н. Шо лохова, Т.С. Борщова, Т.В. Ковалина. В период написания книги авторы пользовались финансовой под держкой в виде грантов Российского фонда фундаментальных иссле дований и Европейского экономического сообщества.
Введение В последние годы широко распространилась точка зрения, что разра ботка принципиальных вопросов теории автоматического управления в основном завершена, центр исследований сместился в область прило жений, создания эффективных методов анализа и проектирования си стем управления, а возникновение новых идей и принципов возможно лишь при переходе к объектам новой природы. Нужно заметить, что для такой точки зрения действительно име ются основания, и весьма веские. Теория автоматического управле ния достигла впечатляющих успехов, сегодня она в состоянии пред ложить широкий спектр методов решения разнообразных задач при кладной автоматики. Поле практического применения теории упра вления огромно, и невозможно представить современную технологию без средств автоматизации, а значит и без использования рекомен даций теории управления. Это один аспект. Другой аспект состоит в том, что в теории управления все активнее используется самый со временный математический аппарат, а выходящие по теории управле ния книги и журнальные публикации в основном имеют обобщающий, подытоживающий характер. Может показаться, что существуют яв ные признаки того, что теория управления близка к совершенству и заканчивает свое развитие. Действительно ли положение таково и в теории управления есть готовые решения для каждого конкретного случая? В некоторых слу чаях это в самом деле так, но гораздо чаще теория управления дает не рецепты, а лишь рекомендации, которые еще должны пройти экс периментальную проверку на адекватность рассматриваемой ситуа ции. Поэтому неслучайно существует общепринятая последователь ность этапов разработки систем автоматического управления: разра ботка математической модели объекта, исследование и идентифика ция модели, формулировка требований к свойствам системы, подбор закона управления и проведение имитационного эксперимента, техни ческая реализация системы и проведение натурного или полунатур ного эксперимента, отладка системы. При этом вся цепочка разра ботки или некоторые ее звенья могут использоваться многократно. Если к тому же учесть, что реализация каждого этапа требует опреде-
12
Введение
ленных творческих усилий, то становится ясно, что процесс создания и эксплуатации систем весьма сложен и требует привлечения специа листов высокой квалификации. Это требование очевидным образом вступает в противоречие с массовым характером автоматизации. Следовательно, такие этапы, как разработка, проектирование и поддержание системы управления являются "узким местом", сдержи вающим прогресс в технологии автоматизации. Это своего рода вы зов для теории управления, которая должна дать надлежащие методы и инструменты, позволяющие эффективно разрабатывать и эксплуа тировать системы управления малыми силами и без привлечения вы сококвалифицированных специалистов. В определенной степени разрешению этой ситуации могут способ ствовать системы автоматизированного проектирования (САПР),' но не только они. САПР — это инструмент, который только тогда эф фективен, когда он хорошо "оснащен" теоретически. В противном случае САПР может справиться с рутинной фазой разработки, но не продвинет решение творческих задач автоматизации, для кото рых, собственно, и требуется высокая квалификация. Только развитая теория, дающая не только жесткие рекомендации для определенного класса ситуаций, но и предлагающая правила разумного действия в нестандартных положениях и способы получения адекватного реше ния для каждого конкретного случая, может стать тем фундаментом, на котором возможен дальнейший качественный прогресс в автомати зации. САПР с элементами "интеллекта" в теоретическом базисе — вот то, что сегодня необходимо. Удовлетворяет ли этому требованию (требованию высокого "ин теллекта") современная теория управления? Приходится с сожале нием констатировать, что нет, не удовлетворяет. Причин здесь много. Разработчику системы управления все чаще приходится разрешать объективное противоречие между детальностью описания объекта и возможностями дальнейшего аналитического исследования системы, идентификации ее параметров и проблемами синтеза регулятора. По жалуй, это самый трудный этап, формализация которого едва ли воз можна. И хотя в основе разработки, как правило, лежит некоторый реальный процесс, в автоматике стремятся к построению не точной, а лишь имитационной модели процесса, отражающей его "важнейшие свойства" по отношению к заранее заданным входным и выходным пе ременным. Это основное, что отличает модели теории управления от моделей, эксплуатируемых в таких фундаментальных дисциплинах, как физика, химия и т.п. При этом понятие "важнейшие свойства" очень часто имеет интуитивный смысл, плохо поддающийся форма лизации. Возможно, поэтому при построении системы управления
Введение
13
приходится итеративно возвращаться к данному этапу и вносить не обходимые исправления. В силу отмеченного обстоятельства самым естественным пока зался путь к "настолько простым моделям, насколько это возможно". Это привело к образованию набора стандартных моделей, которые в основном и эксплуатируются в теории управления. В настоящее время этот арсенал достаточно беден, и его основу составляют линейные или близкие к ним модели. Таким образом, часто в ущерб реальности, но в угоду теории, сформировался банк упрощенных моделей, с которым и по сей день, в основном, имеют дело в управлении, и что по сути дела является одним из препятствий, о которое "спотыкается" теория управления на практике. Итак, приоритет в направлении развития теории был отдан ана литике, и это, в свою очередь, привело к гипертрофированному раз витию аналитических методов, часто похожих по своим конечным ре зультатам, но различающихся способами их достижения и условиями применения: передаточных функций, дифференциальных уравнений, отображений вход-выход, частотных и временных характеристик и т.д. Но даже при мощном аналитическом аппарате сфера примени мости простых моделей не может быть распространена за границы, определенные уровнем их адекватности реальному процессу. Особенно это касается систем автоматического управления, так как разработке вопросов синтеза регуляторов уделялось явно недоста точное внимание. Фактически эта область теории управления оста ется почти нетронутой. Существует довольно ограниченный набор способов синтеза для небольшого числа стандартных ситуаций. Без преувеличения можно сказать, что сегодня процессы возник новения регуляторных механизмов совершенно не ясны. Во всех слу чаях появление нового метода синтеза скорее обязано изобретению, чем теории. Поэтому весьма привлекательной представляется задача поиска общих принципов синтеза, позволяющих в конкретных обстоя тельствах как бы автоматически получать требуемый закон управле ния. Разработка таких общих принципов и предопределит, по нашему мнению, развитие теории управления в ближайшем будущем. Можно попытаться предугадать некоторые черты такого разви тия. Прежде всего ясно, что нелинейность должна стать неотъемле мым элементом теории. Во-первых, это требование практики: огра ничения, нелинейность элементов и т.п. Но дело не только в этом. Примеры других наук (да и теории управления тоже) наглядно де монстрируют тот факт, что учет нелинейных явлений многократно обогащает теорию содержательно: нелинейный "мир" несоизмеримо
14
Введение
богаче линейного, и именно на этом пути возникают новые явления, принципы и законы. В качестве иллюстрации можно привести пример, когда теория автоматического управления существенно обогатилась благодаря ре шению задач об абсолютной устойчивости, исследованию автоколе бательных процессов, адаптивного управления. Примеры из других наук, например физики или химии, еще более выразительны. Но эта констатация почти очевидна, гораздо труднее указать какой-либо кон структивный путь, ведущий в нелинейный "мир". Существует ли он? По нашему мнению, да, существует. И этот путь лежит в направле нии систематического использования важнейшего принципа киберне тики — принципа обратной связи. Надо только научиться правильно его применять в нестандартных ситуациях. Сегодня ясно, что этот принцип является основой саморегуляции и развития всего живого. В теории автоматического управления в полную силу пока "рабо тают" только отрицательная обратная связь и, соответственно, устой чивые процессы. Широкому использованию положительной обрат ной связи и неустойчивых процессов препятствует "гнет" линейности. И только при переходе к принципиально нелинейным системам воз можно активное вовлечение в оборот новых эффектов, связанных с использованием положительной или знакопеременной обратной связи. Данная монография служит иллюстрацией этой научной парадигмы.
Часть I Принципы построения систем автоматического управления В первой масти монографии дается краткое описание основных прин ципов построения систем автоматического управления. Основное вни мание уделяется методам компенсации влияния внешнего возмуще ния на регулируемую координату. Для простоты рассматриваются только скалярные стационарные объекты управления, что позволяет при необходимости представлять операторы их вход-выходного соот ветствия передаточными функциями. Принята форма изложения с параллельным использованием наибо лее употребительных в теории автоматического управления способов описания динамических систем: структурного и пространства состо яний. Это обеспечивает возможность всестороннего анализа рассма триваемых проблем, а также разнообразных интерпретаций получае мых решений. Кроме того, на различных примерах можно сравнить достоинства и ограничения обоих способов. Изложение ведется в такой последовательности, которая дает воз можность проследить направление эволюции основных идей, принци пов и проблем теории управления, а также методов их решения. Это позволяет сформулировать некоторые актуальные проблемы теории управления, для разрешения которых требуются новые идеи. Первая часть монографии состоит из двух глав. В первой главе рассматриваются принципы построения линейных систем автомати ческого управления, а во второй — некоторые принципы построе ния нелинейных регуляторов. Общие теоретические конструкции со провождаются примерами, которые позволяют на простых ситуациях прояснить слабые и сильные стороны каждого подхода. Некоторые важные результаты и выводы, известные из теории автоматического управления и необходимые для лучшего восприя тия излагаемого материала оформлены в виде Примеров, являющихся
16
Принципы построения систем автоматического управления
самостоятельной структурной единицей текста с названием и номе ром, что облегчает их поиск при ссылках. Ниже приведен список таких тем (в скобках указаны номера страниц): •
Программное управление неустойчивым объектом (30).
•
Прямая компенсация возмущения (33).
•
Косвенная компенсация возмущения (37).
•
Стабилизация с использованием принципа двухканальности (45).
•
Стабилизация методом /^-изображения (53).
•
Устойчивость систем с обратной связью (60).
•
Неустойчивость систем с обратной связью по отношению к сингу лярным возмущениям (63).
•
Простейшая релейная система (69).
•
Релейная стабилизация системы второго порядка (73).
•
Релейная стабилизация неустойчивого объекта с относительным порядком, равным двум (74).
•
Иерархия обратных связей (88).
•
Метод включения (98).
•
Синтез адаптивной системы управления (105).
•
Точное слежение за задающим воздействием (113).
•
Режим переключений в системах переменной структуры (117).
•
Системы переменной структуры с движением по вырожденным траекториям (119).
•
Скользящий режим на прямой (120).
•
СПС при сингулярном возмущении (129).
•
СПС при функциональном возмущении (130).
Главы сопровождаются кратким обзором соответствующей науч ной литературы в виде библиографического комментария.
Глава 1 Принципы построения линейных систем автоматического управления Ниже вводятся базовые понятия теории автоматического управления и описываются основные механизмы компенсации внешнего возмуще ния для линейного объекта управления.
1.1. П о с т а н о в к а задачи управления и предварительные сведения В теории автоматического управления имеют дело с математическими моделями реальных процессов, которые, конечно, всегда неполны и лишь приближенно отражают те черты поведения реального процесса, которые важны в контексте конкретного исследования. Выбранную математическую модель называют объектом управления или просто объектом и для удобства прибегают к графическому его изображению в виде блока с входом и и выходом у (рис. 1.1). При таком структурУ
р
и
Рис. 1.1
ном представлении объект характеризуется оператором вход-выход ного соответствия Р, т.е. оператором, устанавливающим связь между множествами входных и выходных сигналов у = Ри. Обычно вход объекта и называют управлением, а его выход у — ре гулируемой координатой. В линейной теории управления оператор Р предполагается линей ным. Это означает, что для любых чисел a i , a = —РГ' находим передаточную функцию W-o{a) оператора V в виде VVp(5) = -(e-(-A,), что (в сочетании с регулированием по нагрузке для получения программной
34
Глава I. Пршщипы построения линейных систем
части и' фушщии упргшления) приводит к структуре системы управления, изображенной на рис. 1.17. Из этой структурной схемы и дифференциаль-
s''+a,s+a,
Wp(s)
-9-
"/ s + Xi
s + Xj
- * - J
Рис. 1.17 ного ургшнения (1.8) можно получить соответствующее решение в терминах пространства состояний. После подстановки в правую часть уравнения (1.8) компенсирующего управления и = ~ ( / + Ai/) движение системы описывается однородным дифференциальным ургшнением У + а^у + aiy = 0. Из этого ургшнения, кгж и ргшее, следует, что асимптотическая устой чивость объекта — необходимое условие разрешимости задачи в рамках принципа регулировгшия по нагрузке. Но и это ограничение метода далеко не единственное, так как в регуляторе синтезированной системы управле ния используются физически неосуществимые операторы с передаточными функциями 3^ +a23+ai и s-f-Ai. Более того, даже если на это закрыть глаза, то все равно построенная система может оказаться неработоспособной, так как она очень чувствительна к малейшему нарушению условия компенсации: u = -(/-f-Ax/). Допустим, что в реализации передаточной функции оператора V допущена погрешность и вместо W^is) использована передаточная функция W:,{s) = -{s + Xi + AX), где ДА — некоторая константа. Тогда ошибка в реализации условия компенсации описывается выражением Е=-
ДА «2 + a2S + ai
и может быть сколь угодно малой при малой погрешности ДА. По скольку ошибка регулирования в данном случг1е определяется выра жением е = у' -у=
-у-т
т—/>
1.4- Компенсация при косвенном измерении возмущения
35
ТО вновь, как и в Примере 1, убеждаемся, что при ai = О, ог > О даже сколь угодно малое постоянное возмущение / может привести к сколь угодно большому отклонению выхода у от задания у'. Таким образом, •
возможна лишь приближенная реализация принципа прямой ком пенсации. При этом, пожалуй, наиболее существенным его ограни чением является необходимость прямого измерения возмущения.
Попытка смягчения этого ограничения предпринята в принципе компенсации с косвенным измерением возмущения. Перейдем к рас смотрению этого принципа регулирования.
1.4. Принцип компенсации при косвенном измерении возмуидения Одна из классических идей косвенного измерения возмущения может быть проиллюстрирована с помощью рис. 1.18.
Pi
^
Р,
•^
т
Рис. 1.18
Пусть измеряются выход объекта у и его внутренняя координата Z. Тогда в результате преобразования выхода объекта оператором Pj"^ получаем сигнал TJ = Р^^у, который является оценкой сигнала v. Поскольку V = f + Z, а. сигнал z известен, то можно получить оценку возмущения / по формуле и = т) — z. Речь идет об оценках сигналов г и / в связи с тем, что рассматри ваемое звено с оператором Р^^ может иметь собственную динамику, с точностью до которой и следует понимать равенства г} fa v, w fa f. Далее следует применить принцип прямой компенсации и сформиро вать управление в виде суммы двух компонент: программной и* и компенсирующей Pw, т.е. и = и' + Т>и, где оператор V должен удовлетворять приведенному в предыдущем разделе условию компенсации: V = Pf^.
36
Глава i. Принципы построения линейных
систем
В результате управление, решающее рассматриваемую задачу ста билизации, должно формироваться в виде
u=
p-'y'-V(Pi'y-z).
Этому соответствует структурная схема системы управления, пред ставленная на рис. 1.19. Описанному способу компенсации сопут-
Р'
Т^
/ Р2
Р "^
i^L —(^ 7 \
Р; "/
CD
Рг"
*2
Рис. 1.19
ствует принципиальная трудность — в структуре системы управле ния появляется контур внутренней положительной обратной связи (на рис. 1.19 он згшггрихован), который по сути является критическим, так как его устойчивость или неустойчивость определяется скрытыми параметрами. В самом деле, оператор Рц.г этого контура от входа w' к выходу z дается выражением Pi
l-VPi
Pi
l-p-^Pi
и, следовательно, возникают проблемы, связанные с делением на ноль. Эти проблемы разрешаются, если принять во внимание скрытые па раметры. Действительно, если Pi — модель реального процесса, то факти чески в этом контуре действует оператор Pi = PiQ, где Q — опера тор, которым пренебрегли при составлении модели. Но при возник ших обстоятельствах этот оператор начинает играть существенную роль, и динамические свойства рассматриваемого контура, по суще ству, определяются этим оператором, так как оператор контура от и' к Z имеет вид Pu.z = Pi/(^ — Q)- Иными словами, • свойства контура предопределяются неконтролируемыми факто рами, что неприемлемо. Как правило, это приводит к неустойчи вости собственных движений внутреннего контура. Это означает, что сигнал Z неограниченно нарастает, нарушая правильное функ ционирование всей системы управления.
1.4. Компенсация при косвенном измерении
возмущения
37
В следующем примере подробно разбираются некоторые особенно сти описанного явления. Здесь же подчеркнем, ч т о указанная т р у д ность не единственнг1Я. Все проблемы, связанные с использованием принципа прямой компенсации и отмечавшиеся в предыдущих разде лах, разумеется, наследуются и рассмотренными в э т о м разделе си с т е м а м и компенсации с косвенным измерением возмущения. П р и м е р 3. Косвенная компенсация возмущения. Для рассмотрен ного в Примере 1 объекта проиллюстрируем описанный выше способ компенсгщии возмущения. В соответствии с изложенной теорией для указгшного объекта имеем систему управления, структурнсш схема которой пред ставлена на рис. 1.20. Выделим из этой структурной схемы фрагмент с местной положительной обратной связью (рис. 1.21) и более подробно ис следуем его свойства. Из рис. 1.21 непосредственно устангшливаем, что
Рис. 1.20
-9-
s+Xi
s + Xi
Рис. 1.21 передаточная функция Wu,z{3) от входа и' к выходу z задается равенством 1
1
W^,4s) = 1 - 1 а - | - А
Лоо 3 + Xi'
и, следовательно, укаэаннгъя положительнгш обратная связь приводит к эф фекту использования в прямом канале бесконечного коэффициента усиления fcoo. Допустим, что в этом контуре вместо оператор» Pi с передаточной
38
Глава 1. Принципы построения линейных систем
фующией Wi(s) = 1/(а + Ai) стоит оператор Pi = PiQ с передаточной функцией где т = const > О — малый паргинетр. При этом второй множитель моде лирует "быструю" динамику оператора Q, не учтенную в исходной модели
* + Xi
TS+1
«-
s + Xi
Рис. 1.22
объекта. Тогда имеем структурную схему (рис. 1.22) и описывающие ее соотношения в виде (s + \I){TS
+ l)z = и,
и = и' + (3 +
Xi)z.
В результате искомая передаточная фушщия Wu,i{s) от и' к г опреде ляется однозначно и дается выражением И^и,х(в) =
1
т«(з + A i ) ' Отсюда следует, что объект находится на границе устойчивости и произ вольно малое возмущение его параметров может привести к неустойчиво сти. Координата z начнет неогргшиченно нарастать по г1бсолютной вели чине, приводя к неограниченному же росту ощибки регулирования. Теперь проведем исследование Примера 3 при помощи дифферен циальных уравнений, а не с использованием структурного или опера торного описания, как это было сделано выше. Из структурной схемы системы управления (рис, 1.20) имеем дифференциальные уравнения, описывающие объект управления Z + Ajz = и,
(1.9) (1.10)
и уравнения компенсирующей внешнее возмущение связи и = и'-{ш + \1и), u = ri-z, Л = У + Х2у.
(1.11) (1.12) (1.13)
Из (1.9) и (1.13) имеем, что rj = f + г,и и = - / , поэтому управление в итоге имеет вид u = u'-(/-HAi/). (1.14)
1.4. Компенсация при косвенном измерении возмущения
39
Если К (1.9) применить дифференциальный оператор d/dt + Ai, то с учетом уравнения (1.10) получг1ем уравнение объекта в виде y+a2y + aiy = u + f + Ai/, где, как и ранее, параметры 02 = Ai + Аг,
ai = Ai Аз.
После подстановки в это уравнение управления из (114) получаем, что движение системы управления описывается уравнением у + а2У + aiy = и' -{f
+ Ai/) + (/ + Ai/) = и'
и не зависит от возмущения. Поскольку (рис. 1.20) « ' = у' + 022/' + o i / и е = J/' - г/, то уравнение движения в ошибках имеет вид 6 + 026 + 016 = 0,
(115)
и если оно устойчиво, то задача стабилизации решена без прямого измерения возмущения / . Отметим, что если уравнение (112) подставить в уравнение (111), а результат U = ы' + (i + Ai^:) - (»? + AiTj) подставить в уравнение (1.10), то получим i + Ajz = и' + (i + Xiz) - (^ + AIT;) или, после упрощений, ^ + Ai»; = u ' . (1.16) Значит, собственные движения координаты z при таком управлении не определяются однозначно, т.е. имеет место сокргицение полюса и нуля. Положим теперь, что вместо оператора Pi в системе действует опе ратор Pi = Pi Q и оператору Q отвечает, как и ранее, передаточная функция W'^(s) = l / ( r s + l ) . Тогда, как это можно понять из рис. 1.20,1.21, вместо дифференциаль ных уравнений (1.9), (110) надлежит рассматривать уравнения вида У + А2!/ = / + г,
rz + ( r + l ) i + Aiz = u.
(1.17)
Вновь повторяя преобразования, убеждаемся в справедливости урав нения (1.15), но вместо соотношения (116) теперь получаем уравнение TZ + (г + l ) i + Aiz = (i + Aiz) + ы' - (^ + Ai??),
40
Глава 1. Принципы построения линейных систем
которое после приведения подобных принимает вид гг + гг = и' — (г) + Ai»;). Отсюда следует, что устойчивость свободных движений переменной Z определяется корнями характеристического полинома (p[s) = T^s^ + Ts, который имеет нулевой корень и, следовательно, отражает погранич ную ситуацию: •
малого изменения параметров объекта достаточно для возникно вения неустойчивого корня, а вместе с ним и неограниченного на растания координаты Z.
Этот вывод полностью совпадает с результатом, полученным на основе операторного анализа системы управления. Более тонкий под ход к косвенному измерению возмущения с последующей компенса цией его влияния на регулируемую координату используется в прин ципе двухканальности Петрова.
1.5. Принцип двухканальности Принцип двухканальности является эвристическим приемом струк турного синтеза инвариантных систем автоматического управления или таких систем, в которых регулируемая координата не зависит от неконтролируемого, т.е. не измеряемого непосредственно, внешнего возмущения. Как всякий эвристический прием, принцип двухканаль ности не приводит к однозначному решению и не сводится к какойлибо единственной последовательности действий. Однако централь ная идея этого приема весьма прозрачна и может быть сформулиро вана следующим образом: для достижения независимости регулируе мой координаты системы управления от внешнего возмущения необ ходимо организовать, как минимум, еще один дополнительный канал влияния этого возмущения на регулируемую координату и "настро ить" его таким образом, чтобы в заданной точке системы управления произошла взаимная компенсация компонент сигналов, обусловленных действием возмущения. К рассматриваемой задаче стабилизации этот принцип построения системы управления с полной компенсацией возмущения можно приме нить, например, при следующих обстоятельствах. Пусть компонента Рг оператора объекта Р представлена в виде композиции двух опера торов Р^ и Pj'i т.е. Р2 = Р^'Р^, причем выходной сигнал z подсистемы с оператором Pj может быть измерен и, кроме того, при необходимости к этому сигналу может быть прибавлен какой-либо внешний сигнал д.
1.5. Принцип двухканальыости
41
Такому разбиению соответствует структура объекта, показанная на рис. 1.23. Из рисунка видно, что выход объекта у не зависит от возмущения / , когда сигнал v = z + q не зависит от / . Дгшее, так как сигналы 2 и г определяются равенствами z = P^{f + r),
г^Р.и',
то, очевидно, z = P^f + P2P1U*, и сигнал v не будет зависеть от возмущения / , если сигнал q надлежащим образом зависит от этого возмущения. Это соображение и является неформальным выражением принципа двухканальности.
Р,"
П^
Е,'
Рг
Рис. 1.23
Перейдем теперь к формальному его обоснованию. В том случае, когда выход г подсистемы Pi известен, т.е. г = Piu', искомую за висимость q{f), компенсирующую влияние / на v, можно построить следующим образом. Сначала измеряется сигнал z, затем он преобра зуется оператором Ri, а полученный сигнал вычитается из программ ного управления к*. В результате получаем структурную схему си стемы управления, в которой z = РУ -\- Р^г, г = —Pi Riz + Piu' (рис. 1.24). Подставив первое выражение во второе, получаем равен-
Г Р"
Ri р'
Pi
-9h
Рис. 1.24
ство Г = —Pi P i (Р2/ -I- P^r) + Piu*. Решаем это равенство относи тельно г и находим, что сигнал PiRiP!, 1 -I- Pi P i Р Г
Л , 1 + Л P i Р^
(1.18)
зависит от внешнего возмущения / , чего не было ранее. Поэтому, следуя рекомендациям из предшествующих разделов и выбирая под ходящим образом оператор Рг в системе на рис. 1.25, можно рг1ссчи-
Глава 1. Принципы построения линейных систем
42
тывать на получение искомой, т.е. компенсирующей влияние / на v, зависимости q(f). В этом случае образуется второй дополнительный канал распространения возмущения / (на рисунке обозначен штри ховой линией), с чем связано название рассматриваемого принципа инвариантности.
Рис. 1.25
Проанализируем полученную систему управления. Поскольку в структурной схеме на рис. 1.25 сигнал z дается выражением
то можно, подставив в это соотношение г из (1.18), полупить связь между сигналами z,f и и' в виде
^ ~ l + PiRiP^^'^
l + PiRiPi''
'
Теперь, зная зависимость сигнала v = z-\-q от f, нетрудно подобрать требуемую для обеспечения инвариантности по отношению к / за висимость ? ( / ) . Для этого оператор Лг в схеме на рис. 1.25 нужно выбрать в виде Й2 = ^
.
(1.19)
В самом деле, при таком выборе оператора R2, с учетом соотно шения (1.18), нетрудно определить, что Р' 9 = Я2Г=
1
--
l + PiRiPi'J7f +' Riil + PiRiPi) и .
Следовательно, сигнал t; выражается равенством V = z + q=
-—и
и не зависит от неконтролируемого возмущения / , что и требовалось.
1.5. Принцип двухкянальности
43
Структурная схема синтезированной инвариантной системы ста билизации приведена на рис. 1.26.
Рис. 1.26 Таким образом, независимость выхода объекта у от возмущения / обеспечена, но, вообще говоря, ценой потери требуемого в задаче стабилизации равенства у = у', поскольку теперь
Pi' , У
Ri
Pi'P-^ Ri
^2
s
5
у = -рТУ
a выполнение равенства Яг = P'l (1.20) нигде выше не предполагалось. Следовательно, для точного решения задачи стабилизации указанным выше способом требуется либо со блюдение условия (1.20), либо введение связи по заданию у', v' = Qy', корректирующей программное управление и' (Q — оператор коррек тирующей связи, которая на рис. 1.26 заштрихована). В последнем случае имеем вполне очевидные соотношения
y=^^i^'
+ v')=(^^
+ R2PiP^'Q)y=^(i
+
PQ)y\
при получении которых учтены условия компенсации (119) и введен ные ранее обозначения Р = РГ-
Р2,
Р2 = Р2-
Р2-
При наличии корректирующей связи в выборе операторов Ri и Дг появляется необходимая для смягчения (но отнюдь не для устранения)
44
Глава 1. Принципы построения линейных систем
требований к физической реализуемости степень свободы, стесненная лишь условием компенсации Pi Ri R2 = 1 и условием несмещенности решения задачи стабилизации
R2{\^PQ)
= P2-
Поэтому среди принципов прямой компенсации внешнего возмущения принцип двухканальности имеет, пожалуй, наибольшую сферу приме нимости. Однако и он не свободен от серьезных недостатков. •
•
•
•
Во-первых, при его использовании, как, впрочем, и в случаях при менения других принципов компенсации, мы вынуждены ограни чиваться устойчивыми объектами. Во-вторых, в структурной схеме соответствующей системы ста билизации (рис. 1.25) возникает контур местной обратной связи с оператором Р\ Р2 в прямом канале и оператором Ri в канале обратной связи. Устойчивость этого контура отнюдь не наступает неотвратимо, и так как выбор оператора Ri стеснен условием ком пенсации, то скорее всего придется принимать специальные меры для стабилизации движений в этом внутреннем контуре. В-третьих и в-четвертых, из условия компенсации Ri R2P1 = 1 видно, что в нетривиальном случае (когда Pi — физически реали зуемое динамическое звено и, следовательно, степень полинома чи слителя соответствующей передаточной функции меньше степени полинома ее знаменателя) точное выполнение условия компенсации в классе физически регшизуемых операторов Ri, R^ невозможно. Поэтому речь может идти только о приближенной компенсации возмущения. К этому же выводу мы приходим и с учетом того обстоятельства, что условие полной компенсации выражается точ ным равенством, а для этого необходима информация об истин ных значениях параметров объекта, чего на практике, конечно же, нет. Иными словами, применение этого принципа регулирования не приводит, вообще говоря, к грубым системам управления. И, наконец, в-пятых, условия применимости принципа двухканаль ности довольно специфичны и предполагают не только наличие ин формации о внутренних координатах объекта, но и возможность активного, а по сути дела регулирующего, воздействия на внутрен ние координаты. Само собой разумеется, что подобные возмож ности, а точнее, их сочетание, встречаются на практике далеко не всегда.
Именно поэтому теория управления обратилась к более активному использованию обратной связи. Подробнее об этом поговорим в сле дующем разделе, а теперь рассмотрим простой пример, иллюстриру ющий особенности применения принципа двухканальности.
1.5. Принцип двухканальности
45
П р и м е р 4. Стабилизация с использованием принципа двухканальности. Рассмотрим объект упргшления третьего порядка, декомпо зированный в соответствии с общей теорией метода двухкан т.е. когда Р^ — аннулирующий оператор для / , Поскольку надежд на выполнение этого тождества нет, то попы таемся изменить оператор между / и г е помощью местной обратной
р"
Z
^-L^
р' *2
Рг
IV
Рис. 1.31
связи с оператором R (рис. 1.31). В модифицированной таким образом системе для нахождения зависимости z от f воспользуемся соотноше ниями г = Р^(/-Нг), r = Pi{u-Rz). После подстановки второго равенства в первое и приведения по добных, находим искомую зависимость в виде Р'
г =
\-\-PtiPiR
+
р'гЛ
H-P^Pifl
(1.28)
Координата z не будет зависеть от помехи / , если найдется опера тор R такой, что при некотором операторе L имеет место равенство Р'
1 -I- Р;^ Pi Л
=
LK.
(1.29)
1.6. Метод К-изображеиий или метод встроенной модели
51
где К — полином из (1.27). Решая уравнение (1.29) относительно R, находим требуемый оператор R: (1.30) где N = iPiLK)/{LPiPi). Формула (1.30) показывает, что местная обратная связь, обеспечи вающая условие инвариантности, должна содержать оператор, обрат ный оператору, аннулирующему возмущение. Именно с этим обстоя тельством и связано второе название описываемого метода — метод встроенной модели. При выполнении условия инвариантности (1.29) справедливы ра венства P!i Z = : Pi U = LKPi ы. 1 -(- Pl^PiR и для окончательного решения задачи стабилизации {у = у") необ ходимо подобрать корректирующую обратную связь по нагрузке для нового объекта с оператором Р = Р!^ LKP\ (рис. 1.32). Если объР"
LKPi
Рис. 1.32
ект Р минимально фазовый, т.е. полиномы его числителя и знамена теля устойчивы, то можно использовать стандартную прямую связь по нагрузке (рис. 1.33), которая и решает поставленную задачу, иначе говоря, поддерживает в статике равенство у = у'.
V-' S
у*
,л
•V
У
и = и*
Р
Рис. 1.33
Таким образом, минимальная фазовость объекта Р является обя зательным, но не единственным условием применения метода / 1 можно рассчитывать на удо влетворительное решение задачи стабилизации. Но это уже другая тема — тема глубокой обратной связи, к кото рой мы перейдем в следующем разделе, а теперь рассмотрим пример к методу 7(s) = ( в - a ) ( s - ( - A i ) + iV(s). Ясно, что можно положить N{s) = k\s -{-ki. Тогда при выполнении нера венств fci > Ai а, /гг > а — Ai рассматриваемый полином («) — гурвицев. В результате передаточная функция "подновленного" объекта опреде ляется выражением
^^'^ = ( Т Т А ^ Ы ^ ' а обратная к ней передаточная функция W
-1, . _ (з-ЬА2)у(з)
имеет неустойчивый полюс, и, значит, в данном случае принцип регули рования по нагрузке применять нельзя. Ничего в этой схеме не меняет и обратная связь по ошибке е = у' — у, тала как такгш связь не устраняетправых нулей передаточных функций. С л у ч а й В . Вновь рассмотрим объект, представленный структурной схемой на рис. 1.35 с возмущением / = const, но теперь для описания метода /^-изображения используем дифференциальные уравнения. Дгинный объект описывскется дифференциальными уравнениями У + \2У = г, z + Xiz = f + u-v.
(1.33)
После дифференцирования по t уравнения (1.33) с учетом того, что / = О, имеем Z Xi Z = i) + й,
и, следовательно, z не зависит от / . Полагаем «> = kz.
(1.34)
Тогда Z \i Z + kz = й,п если А; > О, то это уравнение устойчиво и надле жащим выбором й(у') можно получить у —> у', что решг1ет задачу. Урав нение (1.34) описывает интегргшьную обратную связь, так как
'"1
zdt.
56
Глава 1. Принципы построения линейных систем
1.7. Глубокая обратная связь — большой коэффициент усиления Рассмотрим один из наиболее мощных методов решения задач ста билизации в условиях неопределенности — метод глубокой обратной связи, который для линейного случая сводится к использованию в ре гуляторе большого коэффициента усиления. 1.7.1. Постановка задачи, особенности и идея решения Пусть на объект с оператором Р = Pi Рг действует возмущение / (рис. 1.38). Требуется выбором управления и обеспечить независи-
/
Рг Рис. 1.38
мость регулируемой координаты у от возмущения / и, кроме того, достижение и поддержание равенства У = «/'• Укажем на некоторые особенности постановки задачи стабилиза ции. Во-первых, не предполагается, как ранее, что объект Р обяза тельно устойчивый. Во-вторых, возмущение / необязательно является малым или исчезающим со временем. И, наконец, в-третьих, не пред полагается наличие возможностей прямого или косвенного измерения возмущения / . В рассматриваемых условиях применение описанных выше мето дов невозможно, а потому неизбежно обращение или к обратной связи и принципу регулирования по ошибке в рамках схемы на рис. 1.39, в которой надлежит выбрать оператор обратной связи R', или к со-
Jil.A—£.
R'
'.-4U" Рис. 1.39
Рг
1.7. Глубокая обратная связь
57
четанию принципа регулирования по нагрузке с обратной связью в рамках схемы на рис. 1.40, в которой, кроме того, нужно построить
R'
^
Рис. 1.40 оператор прямой связи по нагрузке Q. Идея решения задаии осно вана на переходе от схемы на рис. 1.39 к схеме, представленной на рис. 1.41, который осуществляется заменой R' = kR, где к — скаляр ный коэффициент усиления, а Я — искомый оператор обратной связи.
У" .^
•«
е
kR
-4-4^ Рис. 1.41 Уравнения, описывающие полученную замкнутую систему управления имеют вид
y = P2{f + r),
r = Piu,
u=
kR(y'-y).
После исключения переменных и и г находим связь между основ ными переменными у, у' л f сначала в виде
il+kPR)y
= P2f +
kPRy',
(1.35)
а после деления на 1 -|- kPR в окончательном варианте: У=
Рг , , kPR , \ + kPR' l + kPR
(1.36)
58
Глава 1. Принципы построения линейных систем
Можно заметить, что при к —^ оо первое слагаемое в выражении (1.36) уменьшается до нуля, а второе стремится к заданию у', что и решает рассматриваемую задачу стабилизации, если, конечно, при каждом значении к -¥ оо замкнутая система асимптотически устой чива. Кроме того, использование больших коэффициентов усиления ве дет к увеличению значений переменных системы, а поскольку в реаль ных системах всегда имеются амплитудные ограничения, то необхо димо изучить их влияние на свойства системы. Наконец, следует выяс нить, насколько чувствительно решение, даваемое глубокой обратной связью, к вариациям условий задачи, т.е. по отношению к регуляр ным и сингулярным возмущениям. Свойства системы, непрерывно зависящие от указанных возмущений, принято называть грубыми. 1.7.2. Проблемы и ограничения м е т о д а глубокой обратной связи В этом и последующих разделах рассмотрим некоторые из упомяну тых выше проблем. Здесь мы исследуем условия устойчивости пре дельной и допредельной систем и изучим влияние амплитудных огра ничений на управление. Из уравнения (1.36) замкнутой системы получаем
{l+kPR)y
= P2f +
kPRy',
и, следовательно, при к —^ оо нужно изучать устойчивость свобод ного движения или, что то же самое, устойчивость нулевого решения уравнения {l + kPR)y = 0. (1.37) Обозначим передаточную функцию объекта Р через W ( ) - ^"'+1^"' + ^mg"'"^ + ...+bi •^^^"^ s" + a„s"-'+ ...+ai
_ b{s) a{s)'
a передаточную функцию регулятора R, — как Pn + lS" + PnS"~^ + • • • + ? !
Wnis) = 9 n + i s " + 9 „ s " - i - ( - . . . -f-gi
P(s) q(s)'
Подстановка этих выражений в исследуемое уравнение (1.37) дает выражение a(s) q{s)
_ a[s)q{s) + kb{s)p{s) ya{s)q{s) У'
и проблема устойчивости сводится к исследованию при fc —^ оо гурвицевости параметрического семейства полиномов оо зависит от устойчивости двух полиномов: 0. Ясно, что последнее нергшенство может и не выполняться. Если же р{з) = л + с, где с = const > О, то при q(s) = 1 устойчивость полинома 4>k{s) = 3^ + [{Xi + Х2) + к] S + Х1Х2 + кс наступает при любых параметрах Ai, А2 и достаточно большом значении коэффициента обратной связи к. При этом следует обратить внимание на то, что передаточнги! функция регулятора
физически нереализуема, так как deg q(s) < deg р{з), следовательно, в при веденных выше расчетах нужно, как минимум, положить q(s) = 3 + q,
q = const > 0.
Тогда можно установить, что отвечающий за устойчивость замкнутой си стемы полином имеет вид 4>k{s) = 3^ + {Xi + Х2 + q) 3'^ + [А1А2 + (Ai -I-A2)g-|-fc] 3-f-AiA2g-f-fcc, a устойчивость наступает при достаточно больших значениях параметров к тл q. Тем самым мы получим структуру замкнутой системы управле-
у'
s+c s+q
^
f 1 S + X2 "
^ 6у' Ч
1 s + Xi
Рис. 1.44 ния (рис. 1.44), устойчивую при неограниченном увеличении коэффициента обратной связи {к —>• оо) и решающую поставленную задачу стабилизации.
62
Глава 1. Принципы построения линейных систем
1.7.3. О г р у б о с т и систем с глубокой обратной связью Рассмотрим влияние двух типов вариаций оператора объекта: • регулярных вариаций, или вариаций параметров; • нерегулярных вариаций или сингулярных возмущений, меняющих порядок объекта. Для анализа последствий, которые имеют место при регулярных воз мущениях, достаточно обратиться к полиному ipk{s) = a{s) q{s) + kb{s) p{8), отвечающему за устойчивость замкнутой системы. Очевидно, что если полиномы ^б,р(«) = b(s)p(s) и ipk{s) гурвицевы (последний при достаточно большом значении к), то, в силу непрерывной зависимости спектра от параметров, малые изменения параметров полиномов a(s) и b{s) (т.е. параметров объекта) не меняют ситуацию качественно% Иными словами, • системы с глубокой обратной связью грубы по отношению к регу лярным возмущениям. При сингулярном возмущении меняется порядок объекта, напри мер, вместо передаточной функции W{s) = b{s)/a{s) мы имеем дело с передаточной функцией вида WAS) = - 7 ^ , a{s) T(S) где T(S) — некоторый устойчивый, но неизвестный полином степени не ниже первой, т.е. deg T(S) > 1. Тогда за устойчивость замкнутой системы отвечает полином вида 2, то для физи чески реализуемой обратной связи полином fl{s) всегда неустойчив при fc -> оо. Надежда на устойчивость сохраняется только тогда, когда deg T{S) = 1. Но и эта надежда призрачна, так как порядок реального объекта всегда выше порядка его математической модели и,следовательно, • практическое использование глубокой обратной связи всегда ведет к неустойчивости. Следовательно, значение коэффициента усиления, предельно допу стимого по соображениям устойчивости, ограничено некоторым кри тическим значением kct, т.е. О < к < к„. Последнее, разумеется, не позволяет полностью устранить влияние возмущения / на регулиру емую координату у и, как следствие, добиться требуемого равенства у = у', т.е. не позволяет точно решать задачу стабилизации. Иными словами, • системы с глубокой обратной связью негрубы по отношению к син гулярным возмущениям.
1.7. Глубокая обратная связь
63
Пример 7. Неустойчивость систем с обратной связью по от ношению к сингулярным возмущениям. Пусть в системе с обратной связью (Пример 6) имеется действующее указанным выше способом сингу лярное возмущение с оператором т(а) = гз + 1,
г = const > 0.
Тогда полином замкнутой системы упргъвления описывается выражением ifil{s) = {тз + 1){з + \2){з + Ai)(s + д) + к{з + с) и ясно, что ни при кгисом положительном значении г он не может быть гурвицевым при /с -> оо. Таким образом, построенная в Примере 6 система стабилизгщии неработоспособна при к -^ оо. Заметим, что при к < кет полином (р^(з) устойчив, однако требуемое равенство у = у' не выполняется и, более того, ощибка стабилизащш зависит от возмущения f{t). Выясним, что принципиально нового вносит в полученные резуль таты дополнительная прямая связь по нагрузке в соответствии со схе-
kR
•^
Рх
—^
Рис. 1.45 мой, представленной на рис. 1.45. Отвечающие этой структуре урав нения имеют вид y = P2{f + r),
r=Pi{u
+ u'),
u'=Qy',
u=
kR{y'-y).
После исключения переменных и, и' и г находим искомую связь между переменными у, у' и / в виде
{l + kPR)y = P2f + {kPR + PQ)y'. Из этого выражения следует, что рассматриваемая прямг1я связь по нагрузке не влияет на устойчивость системы, так как отвечающий за устойчивость полином 1 -f- kPR не зависит от оператора Q. Точ ность компенсации возмущения / также не зависит от оператора Q. Польза от прямой связи состоит в том, что при конечном коэффи циенте усиления (к 4С ^сг) с помощью оператора Q можно повысить точность поддержания требуемого равенства у = у'.
64
Глава I. Принципы построения линейных систем
1.7.4. М е т о д пространства состояний в €кналнзе систем с глубокой обратной связью Решим задачу стабилизации объекта из Примера 6 (рис. 1.42) мето дами пространства состояний. Дифференциальные уравнения, опи сывающие объект в пространстве состояний, имеют вид У + \2У=/+г, г-\- Air = и.
(1.42)
Применим оператор d/dt+Xi к уравнению (1.42), полагая, конечно, дифференцируемость функции / . Тогда, используя стандартные обо значения a2 = Ai-bA2, ai = А1А2, уравнение объекта можно записать следующим образом: y + a2y + aiy=F
+ u,
(1.43)
где F = f + Xyf — возмущение, приведенное ко входу объекта, т.е. к управляющему входу. Пусть у' + а2у' + aiy'
=Y'.
Вычтем из этого выражения уравнение объекта (1-43) и, так как е = у" — у, получим в результате уравнение объекта в отклонениях: ё + огё + aie = Y' - F
-и.
Определим декартовы координаты xi = е, жг = ^ и запишем урав нения объекта управления в фазовом пространстве (xi,a;2)- Имеем XI = Х2)
^2 = —iiaJi — ога^г — и + У — F.
При обратной связи и = ка,
а = Х2 + cxj,
с = const > О,
получаем замкнутую систему управления вида ii = Х2,
Х2 = -aixi
- агхг - к{х2 + cxi) + Y' - F.
(1-44)
При к -> оо последнее дифференциальное уравнение вырождается в алгебраическое уравнение X2-f-cxi = 0. После подстановки Х2 = —cxi в дифференциальное уравнение (144), получаем уравнение предельного движения в виде Xi =
—CXi.
Поскольку это уравнение экспоненциально устойчиво, а у' -y
= e = xi,
то у* — у —> О, и задача стабилизации тем самым решена.
1.7. Глубокая обратная связь
65
1.7.5. Геометрическая интерпретация систем с глубокой обратной связью Если в (1.44) положить oi = const,
02 = const,
Y' — F = А = const,
TO уравнения замкнутой системы принимают вид i i = ar2,
Х2 =-aiXi-a2X2-k(x2
+ cxi)+А,
(1-45)
и полученным аналитическим результатам можно придать геометри ческую интерпретацию (рис 1.46). При конечном значении параме^2
^
\ °
Чг»
pi У^Л2(к)
а=0
Нк) Рис. 1.46
тра к качественное поведение фазовых траекторий системы (145) ил люстрирует рис. 1.46а, на котором Ai(fc), A2(fc) — нули характери стического полинома ос прямая Ai(fc) стремится к прямой оо имеем дело с релейной системой ё =-ae-sgne-t-F.
(2.3)
Система (2.3) разительно отличается о т системы (2.2). Ясно, ч т о для неустойчивого о б ъ е к т а (т.е. когда а < 0) з а д а ч а слежения реша ется системой (2.3) только при выполнении неравенства \ae + F\< 1, иначе говоря, только п р и определенных начальных условиях и только для ограниченного возмущения F. Следовательно, •
релейной обратной связью стабилизируются более узкие, по срав нению с линейной обратной связью, классы о б ъ е к т о в и только при действии ограниченных по амплитуде возмущений.
2.1. Релейная обратная связь
71
2.1.2. Скользящий р е ж и м в точке В релейных системах часто возникает скользящий режим. Для пояс нения приведем следующий пример: ё + ае = —sgn е,
(2.4)
а = const.
Фс13овое пространство системы (2.4) одномерно (рис. 2.6). \а\
\а\
Рис. 2.6
Из (2.4) нетрудно понять, что неустойчивый объект (т.е. когда а < 0) стабилизируется в нуле для любых начальных условий е(0) из интервала (—1/|а|, 1/|а|), тогда как устойчивый объект (т.е. а > 0) стабилизируется в нуле на всей прямой для любых начальных условий (—оо,оо). В окрестности точки О фазовые траектории системы (2.4) направлены навстречу друг другу и, следовательно, фазовая точка не может покинуть точку 0. Решение е = О не является "классиче ским" и должно пониматься в каком-то ином смысле, например по А.Ф.Филиппову [72]. Такому решению отвечают бесконечно частые переключения релейного элемента. Эти переключения ассоциируются со скользящим режимом. Исследуем скользящий режим в системе (2.4) более подробно. Для этого представим ее геометрически в виде многообразия на плоско сти (е,ё) (рис. 2.7). Слева от нуля движение происходит по прямой ё-\- ае = 1, а справа — по прямой ё -f- ае = —1. Отрезок [ 1 , - 1 ] на оси е = О есть отрезок скользящего режима, когда скачком ме няется уравнение движения. Выясним, что произойдет с системой при появлении задержки в переключениях РЭ. Задержка в переключе нии может быть пространственной или временной. В первом случае (рис. 2.8а) релейный элемент имеет петлю гистерезиса шириной 2Д и для него используем обозначение sgnд е, а во втором случае (рис. 2.86) переключение происходит через время г после смены знака входным сигналом. Соответствующий элемент обозначен через sgn^ е = sgner, где т — постоянная времени запаздывания. 1
1
"'
д
-Д
0
-1 Ри с. 2.7
е
бг
е
0
е-"
-1
а
б Рис. 2.8
72
Паава 2. Некоторые принципы построения нелинейных регуляторов
Уравнения движения релейной системы при наличии задержки да ются выражениями ё + ае = — 8§пд е и ё + ае = — sgn^ е, которым соответствуют рис. 2.9а и 2.9^. При всем отличии в существе явле-
1
-т б
0
г
"-С
Рис. 2.9
ния задержки качественно картина поведения систем в случаях а и 5 на рис. 2.9 схожая: скользящий режим в точке разрушен, возникает режим переключений с предельным циклом в окрестности нуля, "раз мер" которого по входной переменной пропорционален постоянным Д или г, характеризующим задержку. Это позволяет нам сделать следующий вывод: • скользящий режим в точке не является прочным, и, следовательно, задача релейной стабилизации не имеет робастного решения. В заключение приведем структурные схемы релейной системы с пространственной (рис. 2.10а) и временной (рис. 2.106) задержками в переключениях.
Ф-
s+a
Л
.
е
s+a Рис. 2.10
2.1. Релейная обратная связь
73
Пример 9. Релейная стабилизация системы в т о р о г о порядка. Рассмотрим более сложную задачу, а именно: исследуем особенности релей ной обратной связи, стг1билизирующей объект второго порядка (рис. 2.11).
S
У^
1
е
0
-1
у
|/
.
1
JL
«2
Рис. 2.11
Ургшнение движения такой системы при у' = О, очевидно, имеет вид ё = —sgn е — / ,
(2.5)
Ясно, что необходимым условием стабилизируемости является нергшенство 1/1 < 1, ограничивающее класс допустимых возмущений. Если это условие выполнено, то вместо (2.5) без потери общности можно рассматри вать однородное уравнение ё = —sgn е. (2.6)
2.1.3. Р е ж и м переключений Ф а з о в ы й п о р т р е т системы (2.6) образуется "сшиванием" по оси е = О фазовых трг1екторий из двух полуплоскостей: ё = -1
(/),
ё= 1
{II).
Фазовые т р а е к т о р и и — суть отрезки парабол с вершинами на оси 6 = 0 (рис. 2.12), и поэтому система (2.6) является консервативной.
Рис. 2.12
74
Глава 2. Некоторые пршщипы построения нелинейных регуляторов
При наличии пространственного или временного запаздывания из менения фазовых портретов показаны на рис. 2.13а и 2.13^ соответ ственно, из которых видно, что в рассматриваемых системах необра тимо наступает неустойчивость. Иными словами, релейные системы
t /
"^
• л
V'
I'fb.0 \ •
•
Ч}
'Уп) Рис. 2.13
С ВЫСОКИМ относительным порядком негрубы. Напомним, что отно сительный порядок линейного стационарного объекта равен разности степеней полиномов знаменателя и числителя передаточной функции. Из Примера 9 можно сделать следующий вывод: • для придания грубости релейной системе следует уменьшить до единицы относительный порядок передаточной функции от входа релейного элемента до его выхода. Пример 10. Релейная стабилизация объекта с относительным порядком, равным двум. Рассмотрим теперь релейную систему стабили зации объекта с относительным порядком, равным двум (рис. 2.14). Вновь 1
S
1
е
- ^J —
ш
0
-1
|/
1
s(s + ] )
—
i.
Рис. 2.14 без потери общности полгъгаем j / ' = 0. Тогда уравнение движения системы на рис. 2.14 относительно координаты ошибки имеет вид ё -I- ё -I- sgn е = - / . (2.7) Необходимое условие стабилизируемости в нуле дается очевидным неравен ством 1/1 < 1. Это неравенство вместе с устойчивостью в нуле уравнения ё -I- ё -I- sgn е = О (2.8) гаргштируют стг1билизируемость системы (2.7) в нуле.
2.1. Релейная обратная связь
75
Для анёишза устойчивости уравнения (2.8) используем геометрические представления, т.е. метод фгкзовой плоскости. Ход фазовых траекторий уравнения (2.8) при е > О, когда действует уравнение ё + ё + 1 = О, и при е < о, когда действует уравнение ё + ё - 1 = О, показаны на рис. 2.15а и 2.156 соответственно. В результате "сшивания" фазовых траекторий имеем итоговый фазовый портрет системы, изобра женный на рис. 2.15в. Из ангишза этого фазового портрета становится ясно.
Рис. 2.15 что 1/L < 1, а значит каждая траектория "скручивается" к началу коорди нат. Этс(,т же факт можно установить аналитически с помощью функции Ляпунова
-|e| + f Ее производная в силу уравнения (2.8) имеет вид i) = esgn е -f- е ё = esgn е -Ь ё(—ё — sgn е)
•2
-е . Поскольку многообразие {ё = 0} \ {0} не содержит целых траекторий, то нуль уравнения (2.8) асимптотически устойчив. 2.1.4. О п р о ч н о с т и рехсима переключения Убедимся, ч т о устойчивость нуля уравнения (2.8) ё-\- ё + sgn е = О не сохраняется при наличии пространственной или временной з а д е р ж к и в переключении. В самом деле, пусть имеет место пространствен ная з а д е р ж к а величиной Д . Тогда вместо уравнения (2.8) поведение системы можно описать уравнением ё + ё+ sgnд е = О
(2.9)
76
Глава 2. Некоторые принципы построения нелинейных регуляторов
и проиллюстрировать рис. 2.16. После "сшивания" фазовых траекто рий по границам разрыва получаем итоговый фмовый портрет урав нения (2.9), в котором нетрудно усмотреть существование предель ного цикла (рис. 2.16в). Следовательно, релейная система стабилиза-
Рис. 2.16
ции (2.8) является негрубой, так как качественно меняет поведение при вариации условий задачи. 2.1.5. Р е л е й н а я с т а б и л и з а ц и я о б ъ е к т а с с а м о в ы р а в н и в а н и е м Интересно выяснить, остается ли справедливым вывод, сделанный в предыдущем разделе, для более простых объектов. Рассмотрим воз можности релейной обратной связи при стабилизации объекта с само выравниванием, т.е. объекта, асимптотически устойчивого при ну-
S
у« ^ е "i V
1
-1
/
У
1
s^+s+1
'
J Q9'
Рис. 2.17
левом управлении. Для простоты ограничимся объектом, изображен ным на рис. 2.17. При у' = О исследованию подлежит уравнение ё + ё + е + sgn е = —/. Ясно, что при выполнении условия | / | < 1 исследование стабилизируемости сводится к анализу устойчивости свободных колебаний системы управления, описываемых уравнением ё + ё + е + sgn е = 0.
(2.10)
2.1. Релейная обратная связь
77
Вновь используем для этой цели геометрические представления, т.е. фазовую плоскость. Фазовые траектории уравнения (2.10) со стоят из отрезков фазовых траекторий уравнения
ё + ё + е + 1 = О, действующего при е > О (рис. 2.18а), и фазовых траекторий уравнения ё - | - ё - | - е - 1 = 0, действующего при е < О (рис. 2.186). После "сшивания" траекто рий по границе разрыва е = О получим итоговый фазовый портрет (рис. 2.18б), на котором видна тенденция к скручиваемости траекто рий системы к началу координат. Последнее обусловленно тем, что
Рис. 2.18
1/L < 1. Ангшитическое исследование устойчивости уравнения (2.10) проводится с использованием функции Ляпунова v = Р -\-е^ + \е\, про изводная которой i) = —ё^. При нашичии пространственного запаздывания Д в переключениях уравнения (2.10) фазовые портреты претерпевают естественные изме нения и принимают вид, показанный на рис. 2.19. На рис. 2.19в можно
наблюдать предельный цикл в окрестности нуля, что эквивалентно не грубости исследуемой релейной системы.
78
Глава 2. Некоторые принципы построения нелинейных
регуляторов
2.1.6. Стабилизация объекта с высоким относительным порядком Рассмотрим произвольный линейный объект с относительным поряд ком г = п — тп, где г > 3, п и m — порядок полинома знаменателя и чи слителя соответственно (например, объект, приведенный карие. 2.20).
' \•V •ж 9
S
е
1
-1
/
у 1
s"+anS°"4. . + ai •—(ar—— Рис. 2.20
При у* = О исследованию подлежит устойчивость нуля уравнения е("' -I- а„е("~^' -|- . . . + aje -Ь sgn е = - / . Вновь при условии все сводится к устойчивости свободных колебаний е(") + а„е0, а + Аг>0 наступает устойчивость, т.е. предельный цикл исчезает. Подводя итог исследованию, можно сделать вывод о том, что ре лейная стабилизация годится только для объектов с относительным порядком г < 2. Поскольку стабилизация при г = п — m = 2 была рас смотрена выше, то теперь можно исследовать особенности релейной стабилизации при г = п — т = 1. 2.1.8. Робастная стабилизация объекта с первым относительным порядком Рассмотрим релейную систему управления, структурная схема кото рой изображена на рис. 2.22. В данном случае относительный порядок
А.
S+C
и
и
Рис. 2.22
объекта г = т — п = 2—1 = 1. Для введения переменных состояния удобно объект управления представить в виде схемы, приведенной на рис. 2.23. Тогда поведение исследуемого объекта управления можно U+/
S+C
Рис. 2.23
описать уравнениями i = w 4- / ,
у = х + сх,
const. После введения переменных состояния по формулам ц = х, Х2 = х и при необременительном условии у' = О получаем уравнения движе ния рассматриваемой системы в стандартном виде: XI = Х2, Х2 = - S g n (Г2 -I- CXi) -I- / .
(2.13)
2.1. Релейная обратная связь
81
При выполнении условия | / | < 1 исследование стабилизируемости системы (2.13) сводится к анализу устойчивости нуля уравнений (2.14)
Х2 = - S g n ( x 2 + CXi).
Для исследования этой системы построим ее фазовый портрет, кото рый получается в результате "сшивания" по линии о- = жг + cxj = О фазовых траекторий двух систем _
Г 3Ci = Х2,
г
-•
/ XI - Х2, XI - - 1 ,
действующих, соответственно, в полуплоскостях (т < О и (т > 0. 2.1.9. Скользящий реж:им на отрезке Траектории систем Ei,S2 — суть параболы, которые при с > О рас положены так, как это показано на рис. 2.24. На рисунках обозна-
(т=0
£7 = 0
Рис. 2.24
чены две точки Aw. В, являющиеся точками касания фазовых траек торий систем Ej и Ег прямой линии О у политопа [ - -
\
АР
АР Рис. 2.49
Рис. 2.50
на основе тождества AR-\-AP = О, но оператор Д Р неизвестен, и по этому следует позаботиться о получении его асимптотической оценки Д Р , так чтобы Д Р ->• Д Р t-^oo. Тогда, полагая, точнее говоря, осуществляя настройку оператора обратной связи Д Д по правилу ДД=-ДР,
(2.35)
102
Глава 2. Некоторые принципы построения нелинейных регуляторов
можно рассчитывать на асимптотическое решение задачи стабилиза ции, так как в этом случае справедлива асимптотика
AR + AP = -AP + AP-^0,
t-^oo.
В теории адаптивного управления получение оценки АР возлага ется на специальный измеритель с оператором D, а реализация "на стройки" (2.35) — на "адаптатор" с оператором А. В результате получается схема, представленная на рис. 2.51. Такой адаптивной си стеме стабилизации можно дать содержательную интерпретацию в терминах основных принципов регулирования. Описанный выше способ компенсации операторного возмущения АР похож на способ косвенной компенсации координатного возмуще ния /(f) с помощью принципа регулирования по возмущению. Дей ствительно, по доступной информации о параметрах объекта Р, его входах и выходах вырабатывается оценка возмущения Р, которая за тем используется для компенсации АР = —АР. Все так, как и при D
Ж R
AR
D
-9 АР
Рис. 2.51
Р+АР
-f Рис. 2.52
компенсации неизмеряемого прямо возмущения /( О, одну из наиболее распро страненных методик синтеза адаптивного управления. Замкнем объект (2.38) обратной связью U = —fclXl — ^2^2
и сформируем алгоритмы адглтации Л переменных ^i, ^2: *:i=6,
^2=6,
(2.39)
т.е. г1лгоритмы настройки параметров ki, /сг, таким образом, чтобы пове дение замкнутой системы Е*: XI =
Х2,
Х2 = —{bki — a)xi — bfcjxa, было бы подобно (может быть, даже близко) поведению некоторой эталон ной системы Е-,: «1 = 22, 22 = - 7 1 2 1 -
7222.
106
Глава 2. Некоторые принципы построения нелинейных
регуляторов
Здесь 71 и 72 — назначенные положительные числа; Е.у-систему будем также называть моделью. После введения обозначений bAfci = bki — а — 711
ЬАк2 = bfcj — 72
замкнутую адаптируемой обратной связью Е;ь-систему можно представить в стандартном виде XI = 1 2 ,
Х2 = —71^1 — 721^2 — b/\kixi
— ЬАк2Х2.
в условиях гипотезы квазистационарности Aki = ki, А^г = ^2, и по этому формально удобно считать, что адаптируются не сами коэффици енты ki и ^2, а их отклонения от требуемых значений, т.е. згккон адаптации А можно згшисать в обобщенном виде Aki = ^1, ДЛг = ^2Для получения конкретного алгоритма адгштации Л используем квадра тичную форму t)(x) = (х, Нх) с положительно определенной (2 х 2)-матрицей Н = [hi,h2]'*', тгисую, что при некотором (желаемом) положительном числе Л > О, определяющем степень устойчивости Е-^-системы (модели поведения замкнутой системы), ее производная в силу Е-^-системы имеет вид I) 1 = Is.,
-2Xv.
Поскольку выбор параметров модели 7i, 72 ничем не огргшичен, такие мат рица Н и число А существуют. Введем теперь в рассмотрение квадратичную форму V{x,k) в расши ренном простргшстве переменных {х, к} выражением
,^, ,, =, , Vix,k)
bfAkj Akl\ vix)+-i^-^+^j,
где Pi, 132 — некоторые положительные числа. Ее производная в силу Е*системы с алгоритмом адглтации Л дается выражением ^ U = ^ U - ( ^ - . (
г )>(А^1-1 + А . 2 Х 2 ) - Ь Ь (
= -2\{х,Нх)
Aki(xia-^\-\-Ak2(x2(T-^\
-Ь
где "• = ( Нх, ( 1 ) ) = {^2,х).
^
+ ^
)
=
40)
, (2.
Теперь ясно, что если правые части алго
ритма адаптации выбрать в виде $1 = /?lXl• оо, то такую следящую систему называют астатической, в противном случае система стати ческая. Для пояснения основных проблем, связанных с построением аста тической следящей системы в рамках линейной теории, запишем урав нение движения системы, изображенной на рис. 2.58, относительно ошибки слежения в операторном виде, после чего имеем уравнения a(s)e = a(s)y' — и
= a(s)y' - Re u=Re
или, после приведения подобных, получаем уравнение [a{s) + R{s)]e = a{8)y'.
(2.41)
Стоит подчеркнуть, что в (2.41) R{s), вообще говоря, — тоже дробно-рациональная функция,
R{s) = к
lis)
4s)'
(2.42)
с коэффициентом усиления к и полиномами 7(*)> '^(*)i удовлетворяю щими условию физической осуществимости deg S{s) > deg 7(*)Положим для определенности, что deg S(s) > 1. С учетом этого заме чания уравнение (2.42) можно преобразовать к следующему виду: [ a{s) 6{s) + к 7(s) ] е = a{s) S{s) / .
(2.43)
Из (2.43) видно, что теоретически данная следящг1я система будет астатической тогда и только тогда, когда полином a(s) S{s)+'f(s) гурвицев и полином a(s)<J(s) содержит множитель /C(s), аннулирующий
110
Глава 2. Некоторые принципы построения нелинейных регуляторов
функцию задания, т.е. такой, что K{s)y' = О,
(2.44)
либо, если такого множителя K{s) нет, то: 1) полином 7(e) должен быть гурвицев; 2) в пределе при к —¥ оо поведение системы описывается асимптоти чески устойчивым уравнением l{s)e = 0.
(2.45)
Впрочем, так как большие коэффициенты усиления приводят к не грубым системам, то реально при синтезе астатических систем при ходится ориентироваться на конечные коэффициенты передачи, а зна чит, и на гурвицевость полинома a{s) 5{s) + 7(5) и условие (2.44). Если аннулирующий полином IC{s) является гурвицевым, то выпол нение указанных выше условий не вызывает принципигшьных ослож нений. Другое дело, когда полином /C(s) — неустойчивый, например /С(в) = s^ — а^, о = const > 0. Тогда мы сталкиваемся с серьезными проблемами. В самом деле, полином S{s) не может быть неустойчи вым, ибо в противном случае неустойчива собственная динамика ре гулятора (2.42) и его выход u{t) экспоненциально нарастает со всеми вытекаюпщми отсюда негативными последствиями: выходом за пре делы зоны линейности и т.п. Следовательно, неустойчивые компо ненты (множители) аннулирующего оператора K{s) должны быть од новременно множителями полинома a(s), что, конечно, неве{)оятно. Это рассуждение показывает, что •
в рамках линейной теории управления, предполагающей исполь зование только ограниченных коэффициентов передачи в регуля торе, построить гютатическую систему слежения за экспоненци ально растущим сигналом у' невозможно. Мы рассмотрели две грубые ситуации: экспоненциально устойчи вые и экспоненциально неустойчивые K{s). Проанализируем теперь пограничную ситуацию, когда задание j / ' — полиномиально рги;тущая функция времени, т.е. у' = Cm+l^ + С ^ * ' " - Ч . . . +С1, где с,- — некоторые константы, (t = 1, . . . , m -(- 1), а число m — по рядок полинома, т.е. Cm+i ф 0. Простейшим оператором, аннулиру ющим полином (2.45), очевидно, является оператор ( т -I- 1)-кратного дифференцирования K{s) = s"*'^^. Естественно предполагать, что в систему слежения он привносится регулятором, т.е. S{8) = 5-+1 S'{S), где S'(s) — некоторый устойчивый полином. Но в таком случае, в силу необходимого условия устойчивости, для обеспечения гурвицевости
2.3. Стабилизация регулятором переменной структуры
111
характеристического полинома замкнутой системы a(s)S'(s)s'"+^-\-k'y{s)
(2.46)
требуется выполнение неравенства deg f{8) > m + 1. Если полином (2.46) гурвицев, то система слежения без ошибки воспроизводит по линомиальный сигнал (2.45), и тогда говорят, что регулятор fis) '+1 S'{s)
R{8)
(2.47)
обеспечивает астатизм (m + 1)-го порядка. Заметим, что, в силу из вестного разложения экспоненты »а«
=т=0Е{atrг!
задачу слежения за экспоненциально растущим сигналом
y'{t) =
y4oy
можно интерпретировать как задачу построения системы с бесконеч ным порядком астатизма. Ясно, что указанным выше способом построить такую систему слежения нельзя из-за неограниченно возрастающей сложности регу лятора. Это наблюдение только подтверждает сделанный ранее вывод о том, что • в рамках линейной теории невозможно построение робастной аста тической следящей системы. Может показаться, что и в рамках принципа комбинированного управления, когда управляющий сигнал формируется в виде суммы сигнала обратной связи по ошибке слежения и^ = Ле и сигнала прямой связи по нагрузке Uy = Ну' (рис. 2.59), этот принципиальный вывод неверен.
н Uy
S
^
У^
«
R
у
W(s) Рис. '2.59
ue J "Ч > — 1
112
Глава 2. Некоторые принципы построения нелинейных регуляторов
Разберем и эту ситуацию, полагая, как и ранее, что W{s) ~ l / a ( s ) , R[s) = j{s)/5{s). Из рис. 2.59 имеем следующее уравнение движения относительно ошибки: =
a{s) е — a{s) у' — и
[a{8)-H{s)]y'-R{s)e.
u=Hy'+Re
После приведения подобных имеем дело с уравнением [ais)S{s)+y{s)]e
= S{s)[a(s)
- H{s)]y'.
(2.48)
В (2.48) оператор прямой связи H{s) надлежит выбрать так, чтобы правая часть обратилась в тождественный нуль. Имеется несколько очевидных возможностей решения этой задачи. С п о с о б I . Можно, например, положить H{s) = a{s), тогда прямая связь определяется выражением «у = a(s) у' и предполагает п-кратное точное дифференцирование задающего сиг нала (напомним, что deg a(s) = п). По неоднократно приводившимся выше соображениям от этого решения, как неробастного, приходится отказываться. С п о с о б П . Можно понизить кратность дифференцироваЦия вос производимого сигнала y'(t), если deg /C(s) < deg a{s), где K.{s) — оператор, аннулирующий y'[t). В самом деле, поделим по лином a{s) на IC(s), так как, вообще говоря, все нули tC{s) не являются нулями oi{s). В результате деления получится некий остаток y{s), т.е. a{s) = a'{s)ICis) + T,is),
(2.49)
причем справедливы неравенства deg y{s) < deg K-{s) < deg a{s). Теперь для достижения г1статизма достаточно (при том условии, что характеристический полином (p(s) = a(s) J(s) + j(s) — гурвицев) по ложить H(s) = ф). (2.50) Подставляя (2.50) в (2.49), а результат — в (2.48), получаем уравнение [а{8) Sis) + f(s) ] е = 5(8) [e'(s) IC{s) + ф) - n{s) из которого и следует сказанное выше.
]у'=0,
2.3. Стабилизация регулятором переменной
структуры
113
С п о с о б I I I . Если же deg K.{s) > deg a{s) и у о п е р а т о р а K{s) есть устойчивые нули, т.е. он представим в виде IC{s) =
lC-{s)K+{s),
где /C_(s) — гурвицев полином, т о э т и нули можно в к л ю ч и т ь в число нулей полинома S(s), т.е. в з я т ь последний в виде S(s)^S'(s)IC-{s). Если при э т о м еще окажется, ч т о deg lC+{s) < d e g
a(s),
т о возможен синтез оператора прямой связи H{s) по т о й же схеме, ч т о и в Способе II. При невыполнении последнего неравенства использо вание прямой связи по нагрузке к а р д и н а л ь н ы м образом не влияет н а возможность построения астатической следящей системы. Из приведенного выше анализа следует, ч т о в любом случае п о т р е буется операция т о ч н о г о м н о г о к р а т н о г о дифференцирования, ч т о не позволяет г о в о р и т ь о решении рассматриваемой з а д а ч и . П р и м е р 14. Т о ч н о е с л е ж е н и е з а з а д а ю щ и м в о з д е й с т в и е м . Про иллюстрируем теоретические выкладки предыдущего раздела на простей шем примере и рассмотрим следующую постановку задачи: требуется син тезировать обратную связь, обеспечивающую точное слежение регулируе мой координатой у за задающим воздействием у' (рис. 2.60). Уравнение е
S
.6 •V
J
'
R
У
1 S
Рис. 2.60 системы слежения относительно ошибки е таково: ё = у' то задачу решает любг1я обратная связь вида и = ке,
и. Если у' = О,
к = const > О,
так как в этом случае уравнение замкнутой системы ё — —ке экспоненщ1ально устойчиво. Если же у' ^ О, нашример у' = const (т.е. задание растет линейно), то статическая обратная связь и = ке уже не решает за дачу, так как уравнение движения в отклонениях имеет ненулевую правую
114
Глава 2. Некоторые прииципы построения нелинейных регуляторов
часть в положении равновесия ё = —ке + у', и, следовательно, появляется статииеская ошибка, т.е. установившееся при t —> оо значение ошибки регу лирования е(оо) = у'/к. Разумеется, увеличением коэффициента усиления обратной связи к эту погрешность слежения можно устранить, но при этом возникают характерные для систем с глубокой обратной связью проблемы, о которых говорилось в главе 1. Если в системе на рис. 2.60 дополнительно использовать прямую связь по нагрузке, т.е. сформировать управление в виде суммы U = ке + у', то получится астатическая следящая система со структурной схемой, приведенной на рис. 2.61, и уравнением движения вида ё = —ite. Последнее асимптотически устойчиво при А; > О, что и решает рассматриваемую задачу.
S
Uy yS
S
к
f^
"« оо поki
S
yS
е
,6 У-
S
кг
у 1 S
Рис. 2.63
^
,
116
Глава 2. Некоторые принципы построения нелинейных
регуляторов
рядок линейного регулятора растет до бесконечности, что, конечно, практически неприемлемо. В частности, таким путем нельзя постро ить астатическую систему для экспоненциально растущего задания у' = е"', а = const > О, так как
=" = Еиг т! и для этого по указанной методике потребуется использование беско нечномерного регулятора. Как же быть? 2.3.4. Астатическая следящгкя система п е р е м е н н о й структуры Исследуем систему, структурная схема которой дана на рис. 2.64. Особенность рассматриваемой системы состоит в том, что знак ко-
S
,e^'^ "V
>
е
1
±к
У
1 S
Рис. 2.64
эффициента обратной связи по выходу у определяется знаком ошибки слежения е. Именно, уравнение движения имеет вид у = ку sgn е, и если ^ > О, то при е > О выход объекта экспоненцигшьно нарастает (рис. 2.65а), так как у =^ ку, у = у(0)е*', а при е < О выход объекта экспоненциально убывает (рис. 2.656), так как у = —ку, у = у(0) е~**. .у
н
У(0)' 0
't Рис. 2.65
2.3. Стабилизация регулятором переменной
структуры
117
Если теперь положить к > а и sgn j/(0) = sgn /?, т о при |j/(0)| < (/?| экспонента j/(0) е**, а при |j/(0)| > |/?| экспонента у(0) е~*' з а конечное время "догонит" з а д а ю щ у ю экспоненту /Зе"*^ (рис. 2.66). Возникает I/ у(0)е'='
1
^/^
_^J_ -^Jr^C^ — Скользящий fi
Tlv^
режим
1 Ч
У(0)
1
0
h
^ ^ y^e-^^W-*!)
Рис. 2.66 режим переключений, и выход о б ъ е к т а y[t) точно воспроизводит за дание y'{t) By скользящем режиме. Следовательно, • астатиэм оо-го п о р я д к а д о с т и г н у т с помощью статической раз рывной обратной связи с конечными коэффициентами усиления и без использования производной о т задания. Рассмотренный случай демонстрирует э ф ф е к т и в н о с т ь использо вания разрывной знакопеременной обратной связи. Оказалось, ч т о э т о не исключение, а правило, т.е. регулярное использование неустой чивых с т р у к т у р является фундаментальной идеей т е о р и и обратной связи, альтернативной д р у г и м фундаментгшьным идеям т е о р и и упра вления (идеям точной компенсации и глубокой обратной связи) и от к р ы в а е т п у т ь к построению р о б а с т н ы х систем управления, в т о м чи сле и р о б а с т н ы х следящих систем. Э т а идея явилась ключевой для теории систем управления переменной с т р у к т у р ы , ф р а г м е н т ы кото рой излагаются далее на к о н к р е т н ы х примерах. П р и м е р 15. Р е ж и м ы переключений в системах переменной с т р у к т у р ы . Рассмотрим задачу стабилизации в нуле объекта второго порядка у = и при условии, что имеется информация только о координате у и знаке ее производной у. Поскольку ни при кгжом фиксированном к обратная связь U = -ку (2.53) не является стабилизирующей, то ясно, что линейными средствами эту за дачу не решить. Будем менять коэффициент обратной связи (2.53) в зависимости от у и sgn у, например, следующим образом:
к(у,у) = { ки *2,
УУ>0, УУ 0.
(2.55)
Вновь ясно, что никакгш линейнгья обратная связь вида U=
-ку
не решсъет задачи стабилизации. Сделгъем коэффициент к разрывным, на пример, по следующему пргшилу: I/
\
/
с^.
ус^ > О,
тогда получим систему с разрывной обратной связью, описываемую ургшнением У = -c^|y|sgn а. Для анализа этой системы используем метод фазовой плоскости. В области ytr > О (на рисунке она обозначена знаком ф) поведение системы описывается уравнением у = —с'у, его фазовые траектории — эллипсы (рис. 2.69а). При у О, что и требовалось.
120
Глава 2. Некоторые принципы построения нелинейных регуляторов
Недостаток данной системы управления состоит в ее непрочности. Малые задержки в переключениях качественно меняют ее поведение: апериодические переходные процессы могут стать колебательными (рис. 2.70а) или даже может наступить неустойчивость (рис. 2.706). 1
\ s^^
1
\
1 1
\
\ 0, / ;
; ч
Рис. 2.70
2.3.5. Скользящий р е ж и м на всей прямой При рассмотрении режимов переключения и движения по вырожден ным траекториям выявляются определенные достоинства принципа переменности структуры, в том числе: простота закона обратной связи, уменьшение объема информации, необходимой для стабилиза ции объекта по сравнению с линейной обратной связью. Но видны и недостатки этих режимов: колебательность переходного процесса в режиме переключений и трудность организации движения по выро жденным траекториям при изменении параметров объекта и действии внешних сил. Не имеют в этих случаях простого ответа и вопросы, связанные с прочностью систем управления, а также с возможностью переноса методов синтеза на многомерные системы. Поэтому актуа лен следующий вопрос: • возможно ли при сохранении достоинств принципа переменности структуры устранение или ослабление указанных выше недостат ков? Ответ на этот вопрос положителен, но для этого следует использовать скользящий режим на прямой. Пример 17. Скользящий режим на прямой. Вновь рассмотрим задачу стабилизации в нуле объекта у= и при условии, что в обратной связи возможно использование информации о координате у и знаке линейной комбинации 0. Ясно, что линейнс1я обратная связь и = —ку ни при каком фиксированном коэффшдаенте к задачу не решает.
2.3. Стабилизация регулятором переменной
структуры
121
Применим принцип переменности структуры, положим и = ф{у, у)у и уа > 0 , У 0. Тогда в секторе уи > О на фгьзовой плоскости (у, у) движение системы управления описывается ургшнением (/): у = fciy, ki < О, фазовые траектории которого — эллипсы (рис. 2.71а). В секторе у/т < О действует уравнение ( / / ) : у = к2у,
к2 > О,
и движение происходит по гиперболическим кривым (рис. 2.716). Видно, что асимптотическсш устойчивость не наступает ни при положительных, ни при отрицательных значениях к. Если, однако, фазовые траектории "сшить" по линиям разрыва (т = О, у = О, то получим асимптотически устойчивую систему (рис. 2.71 в). Обозначения / и / / на рисунках соответ-
/
Скользяший режим
Рис. 2.71 ствуют областям действия структур (/) и ( / / ) . На прямой (Т = О фазовые траектории уравнений (7) и ( / / ) направлены "встречно" (рис. 2.72), где f', f'^ — фазовые скорости. Формгъльно это означает, что (г& < О, когда (Т / 0.
о-=0
Рис. 2.72 Следовательно, фазовгш точка не может покинуть прямую разрыва (Т = О, при дальнейшем движении выполнено равенство и = О и этому движению отвечает фазовый вектор f" = af' + (1 — а)/'\ о >0, направленный вдоль прямой разрыва а = 0.
122
Глава 2. Некоторые принципы построения нелинейных регуляторов
Строгий ангииз движения системы в скользящем режиме дает те ория А.Ф. Филиппова (определение решения, условия его существо вания, единственности, продолжимости вправо и т.д.). Здесь огра ничимся эвристическими рассуждениями. Поскольку в скользящем режиме выполнено равенство О, то y{t) -^ О при t —> оо, что и требуется. Значит, задача стаби лизации решена. Заметим, что даже если бы имелась информация о линейной комбинации 0
7->-o dt ~
(2.56)
И, так как равенство & ={c-
а2)(т - [c(c - аг) 4- ai]y + Ьфу,
выполняется при ki < min
с{с - аг) - 01
^2 > шах
0, ff 1. В структуре синтезированной системы управления д,пя случая из меряемого возмущения, изображенной на рис. 2.78, видны две V'-ячейки, что прямо характеризует эту систему как систему переменной \L1
Ч-р Up
а
S
у'
-^^ У
%
tb t| ' + • , » + • !
Рис. 2.78
""
ffi
f * к.
р*
128
Глава 2. Некоторые принципы построения нелинейных регуляторов
структуры. В СПС скачкообразно меняется не только коэффициент обратной связи ^е, но и коэффициент прямой связи по возмущению. Заметим, что ^-ячейка является функциональным элементом на два входа, и ее можно представить в виде релейного элемента с изме няющейся "полкой" или, иначе, величиной коммутируемого сигнала. Это хорошо видно при так назывг1емом квазирелейном представлении ^-ячейки. 2.3.8. Квазирелейное представление ^'-ячейки Стандартное отображение ^-ячейки дано на рис. 2.79. Вход и выход
V
Рис. 2.79
V'-ячейки связаны между собой выражениями , ^ '
, ^
( ki, \ *2,
еа > О, ео- < 0.
Без потери общности положим hi = —Аз = —к, и тогда имеем для V'-ячейки выражение V = —Arsgn {е О, t ^ 00. Указанный выше переход от формирования сигнала к формированию оператора, вырабатывающего нужный сигнал, можно возвести в прин цип и дать ему, например, следующую формулировку: •
при дефиците информации следует переходить от программного формирования функции (элемента) к синтезу алгоритма (опера тора), генерирующего функцию. Как функция времени u{t) — элемент некоторого множества допусти мых управлений, так и оператор R — только элемент множества И стабилизирующих обратных связей. Поэтому для получения требуе мого оператора R при дефиците информации используем сформулиро ванный выше принцип. Именно, будем синтезировать не сам опера тор обратной связи R, но алгоритм его формирования, а поскольку все это происходит в условиях неопределенности, то без механизма обратной связи здесь не обойтись. Заметим, что эта идея является явной альтернативой идее адаптивного управления (рис. 3.16), когда с
137
3.2. Система базовых понятий
помощью процедуры идентификации реализуется "программная" ге нерация требуемого оператора R. Сформулированный выше принцип впредь будем называв принци пом генерации. Разумеется, принцип генерации может быть распро странен и на формирование алгоритма, генерирующего оператор R, и т.д. и т.п. При применении принципа генерации естественным обра зом возникают следующие первоочередные вопросы: •
каким образом осуществлять синтез контура генерации;
•
что будет ошибкой или регулируемой координатой такого контура;
•
что следует применять в качестве регулирующего органа в этом контуре;
•
можно ли из этой идеи извлечь практическую выгоду, ведь контур генерации можно рассматривать как часть регулятора, и откуда следует, что такой синтез регулятора "по частям" проще синтеза регулятора "в целом".
На некоторые из этих вопросов ответы даются легко, на другие однозначных ответов нет вообще. Это означает, что в реализации намеченного плана по автоматическому синтезу стабилизирующих ре гуляторов в условиях неустранимой неопределенности по априорной и текущей информации много эвристики и произвола. 0тчг1сти это можно устранить с помощью следующей системы базовых понятий.
3.2. Система базовых понятий Для придания развиваемой теории конструктивного характера нам потребуется ряд нестандартных для классической теории управления понятий, и ключевое из них вводится в следующем пункте. 3.2.1. С и г н а л - о п е р а т о р Для обозначения того, что изменению подвергается оператор, будем применять двойную стрелку (рис. 3.2). Соответствующую перемен ную обозначаем буквами греческого алфавита, например //, и пазы-
Ж Рис. 3.2
Глава 3. Теории новых типов обратной связи
138
BBjeu сигналом-оператором или для краткости 0-сигналом (рис. 3.3а) в отличие от обычных переменных, обозначаемых латинскими бук вами и одинарными стрелками (рис. З.Зб) и называемых сигнгиамикоординатами или К-сигнг1лами. Поскольку всякий 0-сигнал, как и К-
Рис. 3.3
сигнал, имеет физический носитель, то ясно, что различие между Ои К-сигналами условное и предопределяется интерпретацией участия сигнала в локальном преобразовании у = Pi(n, х) = Р2{х, /i) (рис. 3.4). В первом случае (рис. 3.4а) преобразуется сигнал х, а сигнал /i опре-
Г
1
Pi
Рис. 3.4
деляет оператор преобразования. Во втором случае (рис. 3.46) все с точностью до наоборот. Таким образом. О- и К-сигналы образуют общую совокупность переменных состояния нелинейной системы, и поэтому удобно ввести преобразователи подобия, действия которых можно полностью уяснить из анализа рис. 3.5. Введенная типизация
б Рис. 3.5
сигналов естественным образом влечет типизацию основных струк турных элементов системы автоматического управления. 3.2.2. Типы динамических объектов В зависимости от типа входного и выходного сигнгиюв динамиче ского звена возможно выделение четырех основных типов динамиче ских объектов, изображенных на рис. 3.6. Нужно заметить, что в раз-
3.2. Система базовых понятий
139
личных дисциплинах объекты подобных типов используются давно, однако клги:сификация их по указанным выше признакам не проводи-
К
О
ко
ок d Рис. 3.6
лась. Приведем лишь некоторые примеры объектов разных типов: К-объект: стандартный колебательный радиоконтур, преобразую щий входные напряжения в выходные; О-объект: колебательный контур с вариконом, преобразующий ем кость контура в частоту колебаний; КО-объект: стандартный колебательный контур, вход — напряже ние, выход — характеристика; ОК-объект: устанавливает связь между параметрами колебатель ного контура и выходным напряжением. 3.2.3. Бинарная операция Из предыдущего изложения видна важная роль, отводимая элементу на два независимых входа, изображенному на рис. 3.7. Такой элемент
К. р Рис. 3.7
описывается уравнением у = /?(^, х) и называется бинарным элемен том. Бинарный элемент может быть: линейным по х: у = ;3i(/i)x; линейным по /х: у = ц02х; линейным по Z и /i, тогда он называется билинейным.
140
Глава 3. Теории новых типов обратной связи
Простейший билинейный элемент — множитель с масштабирова нием, описываемый уравнением у ~ к fix. Бинарный элемент называется сепарабельным, если Бинарный элемент обобщгьет понятия релейного элемента и V'-ячейки. Так, релейный элемент можно получить из бинарного при fi = const, а ^/'-ячейку — при /?i = sgn fi, /32{x) > 0. 3.2.4. Типы регулирующих органов Элемент системы управления, выходная переменная которого оказы вает непосредственное влияние на вход объекта, называется регул'ирующим органом. Регулирующие органы бывают статическими и ди намическими. В классической теории управления регулирующим органом чаще всего выступают статический усилитель (рис. 3.8а) или интегрирую щий усилитель (рис. 3.86), т.е. линейные звенья. При использовании
Рис. 3.8
«h.
Рис. 3.9
бинарного элемента регулирующие органы становятся нелинейными и появляются дополнительные возможности по управлению их свой ствами. Примеры статического и динамического бинарного регули рующего органа даны на рис. 3.9. 3.2.5. Новые типы обратной связи При расширенном наборе типов динамических звеньев представляется оправданным помимо обычной или, иначе, координатной обратной связи (КОС) ввести в обиход еще три новых типа обратной связи:
3.3. Структурный синтез бинарных систем
141
координатно-операторную, или КООС, операторно-координатную — ОКОС и операторную — ООС (рис. 3.10). Теперь мы располагаем У^
Sy
iff*
е
е
у'
Ru
Sy
"i 9
•
R,
и
У
iV
а
Р=^
Ru
I'y
б
0=0
Sp [=c>5f=J>| RM | = | ]
-^ u
p в
i=|
Р
kJ
P. Ф=^ г Рис. 3.10
необходимым минимумом базовых понятий и можем приступить к из ложению основных фактов теории.
3.3. Структурный синтез бинарных систем 3.3.1. Задача стабилизации Рассмотрим стандартную задачу стабилизации неопределенного объ екта Р (рис. 3.11) в условиях, когда по априорной информации о координатном / G F и операторном а € А возмущениях требуется выбрать оператор Лц стабилизирующей обратной связи (рис. 3.12). Предположим, что по условию задачи требуется не только добиться
S
е
у'
i
'
Ru
fsF У
Р
К р
т.
еЛ
leA Рис. 3.11
Рис. 3.12
Глава 3. Теории новых типов обратной связи
142
стабилизации, т.е. "устойчивости" ошибки регулирования, но и обес печить заданное качество переходного процесса. Пусть, например, в переходных процессах требуется выполнение соотношения Se{c)e = е,
где Se{c) — известный оператор, с — его параметр, с Е С. При этих естественных допущениях возможно провести структур ный синтез бинарной системы стабилизации. Действительно, сле дуя изложенной выше общей концепции бинарного управления, отка жемся от априорного выбора оператора обратной связи Лц по схеме на рис. 3.12 и перейдем к его автоматическому выбору с помощью сигнала-оператора /х по схеме, представленной на рис. 3.13. В ре-
S
у'
1
е ' V 7^ Р
•
'
Ru /
у
и е
Р
Ре
1foe
А
Рис. 3.13
^
\\asA Рис. 3.14
зультате этого перехода проблема выбора конкретного оператора Дц заменена более простыми проблемами выбора семейства стабилизиру ющих операторов R, маркируемых сигналом-оператором f^, и форми рования требуемого значения самого сигнала-оператора /х. Обсуждение проблемы выбора семейства операторов R пока от ложим и займемся принципами формирования надлежащего /л. По скольку качество системы управления в поставленной задаче выра жено через ошибку регулирования, то систему на рис. 3.13 можно представить в виде нового (обобщенного) объекта Ре (рис. 3.14), име ющего выходом ошибку регулирования е, а входом — сигнал-оператор fi, т.е. Ре является нелинейным объектом ОК-типа, на который дей ствует неизвестное возмущение а Е А. Для теории регулирования это стандартная постановка задачи стабилизации, решаемая с помощью рассмотренных в предыдущем разделе принципов регулирования. В частности, если ввести в рассмотрение сигнал е'
=See,
где Se — оператор, отражающий требования к эталонному поведению ошибки, то можно ввести в рЕ1Ссмотрение новую ошибку регулирова ния О вместо пе ременной а можно использовать выход объекта у, и тогда, по сути дела, принцип скаляриэации приводит к задаче стабилизации выхода
^''(') = Ь «2 Й +7 а- ' И'.(5) =
у = су -I- Ьи -f- / , т.е. объект 2-го порядка можно заменить объектом 1-го порядка. Как видно из (4.7), такой объект имеет относительный порядок г = 1 и является минимально фгкзовым.
160
Глава 4. Теория координатно-операторной обратной связи З а м е ч а н и е 5.
Выбор обратной связи, стабилизирующей Е^-объект: а = da + Ъи + f,
особенно прост, когда имеется полная информация о параметрах и возму щениях. В самом деле, при этих предположениях управление и = t; — f/b сводит задачу стабилизации к тривиальной & = dff + V, когда выбор управления t; очевиден. Если же параметры или возмущение не известны, то проблема становится сложнее, так как методы стабилизации классической теории регулировгшия: глубокая обратнг^я связь (и = —fcu, к —> оо), адгштивная обратная связь (и = —ка, к = la^, f = const > 0), си стема переменной структуры (и = —fm sgntr), при известных достоинствах имеют недостатки и ограничения по применению. З а м е ч а н и е 6.
Покажем, что линейная обратная связь u = —k2 О,fci> 2d. Поэтому оценка а асимптотически (экспоненциально) сходится к чи слу а. Если теперь управление ц сформировать в виде ti=Mi-j,
(4.20)
то произойдет асимптотическая компенсация возмущения а, так как ^ = 2d^ + bni + a- о, и, следовательно, а — а —> 0. Таким образом, при выборе управления ^i достаточно иметь дело со свободным движением объекта: i = 2d^ + bfix. В исходных переменных алгоритму управления (4.20) соответствует алгоритм вида а « = /iXi = filXi
-
-Xi,
где вторую компоненту естественно называть адаптивной. словами, •
Иными
описанный способ асимптотического оценивания постоянного воз мущения а реализует стандартную процедуру адаптивного упра вления.
Если, однако, а = а( О, , ^о [ к, xiff < О, и, следовательно, фазовый портрет рг1СсматриБаемой системы в ко ординатах (xi,X2) имеет уже знакомый вид (рис. 4.11). Изменение и = фХ1,
Ф=
Q,
(т(х)|^(,)=o 0) "амплитуда", как правило, уменьшается до нуля, а "чгютота" растет до бесконечности, т.е. lim W(A) = оо,
lim А{А) = 0.
Д-vO
Д-fO
^
'
При этом реальное скольжение переходит в идеальное (рис. 5.5) и весьма важен вопрос о порядке этого перехода по параметру Д.
о-=0
Рис. 5.5
Прежде чем точно определить то, что здесь имеется в виду, полу чим уравнения реального скольжения. Напомним, что при идеальном скольжении (а- = 0) искомый фазовый вектор правой части уравнения движения /eq (рис. 5.5) находится в результате решения уравнения О при Д —> 0. Тогда по теореме Лагранжа для некоторой точки в из этого интервсша |t^(0)| < 2 m a x | < r |
Эти уравнения отличаются от применявшихся ранее уравнений xi =
-dxi+^xi,
i = 2d( + bfi +
a-d^
зависимостью параметра d задатчика Se от операторной переменной р и наличием производной dp^O ъ правой части (6.5), так как теперь dp = dp{t). Поскольку 0-закон (т.е. функцию р) можно формировать независимо от КО-закона (т.е. функции (х), постольку член dp, по существу, можно интерпретировать как дополнительное управление, привлекаемое для стабилизации 0-переменной ^ в нуле. Практически, однако, удобно синтезировать не производную dp, а при выбранной функциональной зависимости d{p) (например, без потери общности, в виде dp = d + р) оператор 0-связи Rp (рис.6.2) и, в отдельных случаях, оператор КО-связи R,,. Для дальнейшего упрощения уравнения Ре-объекта (рис. 6.3) и по лучения его окончательного вида будем считать, что при всех из менениях параметр р мал по отношению к d. Это предположение вполне оправдано, более того, нужно стремиться к его обеспечению, поскольку в желаемом режиме стабилизации, когда 'р = О, основная переменная xi изменяется, согласно (6.5), в соответствии с уравне нием Xl = -dpXi = -{d + p)xi. Тогда качество переходного процесса близко к эталонному, опре деляемому уравнением i j = —dxi, если выполнено упомянутое выше соотношение порядка между параметрами dn р. Но если принять это допущение, то можно приближенно заменить dp = (d + p)^d^
+ 2dp.
6.3. Статическая операторная обратная связь
211
Наконец, если, как и ранее, для удобства сначала ввести обозначение а* = а-
d\
а затем, для простоты, "звездочку" не указывать (т.е. осуществить замену а* -^ а), то окончательно уравнения движения исследуемого объекта в 0-теории принимают вид XI =-{d + р)х1 + (хи i = 2{d + p)^ + bfi + a-2dp + p, а€А,ЬеВ.
(6.7) (6.8)
Далее этот объект (6.7), (6.8) для удобства обозначаем символом Pp. Если же рассматривается только второе уравнение Рр-объекта (6.8), то его, как условлено выше, обозначаем символом Pg. Из уравнений (6.7), (6.8) виден нелинейный, точнее билинейный, характер уравнений движения (это обстоятельство принципиально и неоднократно отмечалось выше), но, что важно и что обеспечивает успех всего мероприятия, так это аффинность уравнений движения по управлению (т.е. по паре {fA,p)). Последнее позволяет применять для решения задачи стабилизации методы классической теории ста билизации.
6.3. Статическая операторная обратная связь Рассматривая уравнение Ре-объекта i = 2{d + p)^ + bn + a-2dp + p, аеА,
be В,
нетрудно понять, что обратная связь р = Rp/л может быть статиче ской или динамической, в зависимости от вида оператора Rp, однако только во втором случае ввиду наличия производной р в правой части (6.8) КО-связь fi = R^CTp может быть разрывной. Исследование естественно начать с анализа возможностей отрица тельной статической 0-связи, когда р = -qfi,
(6.9)
где q > О — коэффициент усиления 0-связи. Имеем в результате следующие уравнения движения: XI =
-{d-qn)xi+ixi,
i = 2{d-qn)i-{-bn-\-a-qix, 6 = 64- 2Qd.
(6.10)
212
Глава 6. Теория операторной обратной связи
После выбора оператора 0-свяэи Rp = —д свободным остается вы бор оператора КО-связи R^. Применяя разные операторы R^, по лучаем варианты бинарной системы управления с 0-связью. Есте ственно начать рассмотрение с простейших вариантов выбора опера тора R^. 6.3,1. Статические операторная и координатно-операторная обратные связи При использовании статической КО-связи fi = —Ц,
к = const > О
второе уравнение движения в (6.10) принимает вид
^ = 2(d -Ь дН)^ - Щ + gki + а. После приведения подобных и выделения главной части имеем сле дующее линейное уравнение:
если, конечно, 1 > дк. При выполнении неравенства (6- -I- 2gd)k > 2d уравнение асимптотически устойчиво и предельное (т.е. установив шееся) значение переменной ^(t) определяется выражением а а ^~ ^ (6 -I- 2gd)k - 2d ^ bk-2d(l-gk)'
^^'^^^
Ошибка ^оо определяет статическую 0-ошибку, которая порождает динамический статизм в основном контуре. Поскольку в пределе основная переменная удовлетворяет уравне нию XI = -{d + gk^oo)xi + ^00^1 = -[d+{qkl)^^]xi, то величина упоминавшегося динамического статизма дается следую щим выражением: _ а{1-дк) ^°° Ьк - 2d(l - дк) • Стоит заметить, что статическая ошибка в системе (6.10) без Освязи (т.е. при 9 = 0) определяется выражением а ^оо
=
bk-2d'
из сравнения которого с (6.11) следует, что в бинарной системе с Освязью заданная величина динамического статизма достигается при
6.3. Статическая операторная обратная связь меньшем значении параметра к, нежели в бинарной системе без Освязи. Это немедленно следует из того, что 1 bk-2d
l-qk > bk- 2d{l - qk)'
Действительно, после освобождения от знаменателей имеем сна чала, что {Ьк - 2d) + 2dqk > {bk - 2d) - qk{bk - 2d), а после приведения подобных получаем тривиальное неравенство О > -qbk^. Более того, поскольку динамический статизм l-qk
С(9) = bk-2d(l-qk) монотонно убывает с ростом параметра q, то величина динамического статизма ^^(з) может быть сколь угодно приближена к нулю при gfc -> 1, хотя нуль недостижим, ибо при g = О все эти уравнения не действуют. Следовательно, • использование статической 0-связи оправдано даже в том триви альном случае, когда применяются только статические нелинейные обратные связи. Для содержательной интерпретации последнего вывода полезно по лучить выражение для закона управления по основной переменной, т.е. закона, выраженного через исходные переменные Xi, х^. Делая обратную замену ц = —к^ и используя равенство р = —qfi, имеем по следовательно : ы = /ill = -k^xi = -ксгр = -к[х2 + (d+ p)xi] = = -k[x2
+ {d- qfi)xi ] = -k{x2 + dxi) + qkpxi — -kcr + qku.
Разрешая последнее равенство относительно управления и, находим, что ifc u=-а, а = xi + dxi. l-qk Иными словами, построенная нелинейная бинарная система упра вления на множестве Gs эквивалентна линейной с коэффициентом уси ления и при qk —¥ —I нг1ступает эффект большого коэффициента усиления, хотя во всех контурах системы управления применяются конечные ко эффициенты усиления. Этот эффект является прямым результатом использования нелинейности и положительной обратной связи.
213
Глава 6. Теория операторной обратной связи
214
Структурная схема рассмотренной системы приведена на рис. 6.4. Напомним, что эта схема работоспособна только при ограничении
р
»+d
—1
р==Ф -к =: \м •»
а
f
("—
^~] и
a^i
b
WasA Рис. 6.4
\ а, в точке ^ = О возникает скользящий режим. Для определения уравнения движения в скользящем режиме сначала из уравнений ( = О, ^ = О находим эквивалентное значение разрывного элемента
затем найденное значение подставляем в уравнение (6.15) изменения переменной (л и получаем следующее уравнение движения: qfi — bfi = а.
(6.17)
Это уравнение устойчиво при g < О и при фиксированном параметре а имеет положение равновесия /* 0.
(6.19)
В координатах (g/i — bfi,^) уравнениям (6.15) и (6.19) соответствуют графики на рис. 6.10, откуда немедленно следует оценка |^| < Д(г), что и означает прочность системы, так как Д('') —> О при г -> 0. Структурная схема синтезированной бинарной системы приведена на рис. 6.11, и для сравнения на рис. 6.12 дана схема, эквивалентная ей при возникновении скользящего режима. Из сравнения рис. 6.7 и 6.11 / t+d Xi
or
b
'
1
u
НаеЛ Рис. 6.11
Рис. 6.12 видно, что последняя система стабилизации при тех же возможностях проще в реализации. Следует, однако, позаботиться о дальнейшем ее упрощении и, если это возможно, исключить использование информа ции о параметре 6 6 В.
6.3. Статическая операторная обратная связь
221
6.3.5. Инерционно-релейная координатно-операторная обратная связь при неизвестном параметре при упрхшлении В этом пункте для стабилизации Ре-объекта (6.8) ^ = 2 ( d - g / i ) ^ + b / i - | - a - g / i , b = b + 2qd
аеА,
be В,
применяется инерционно-релейная КО-связь вида qfi — b~fi = ksgn^,
к = const > О,
b- =b- + 2qd,
(6.20)
которая может быть использована и тогда, когда значение параме тра 6 неизвестно. Отметим, что допускаются изменения неизвестных параметров а, 6 во времени произвольным образом. Структура ре гулятора (6.20) совпадает со структурой регулятора на рис.6.8 при замене 6 на 6~. Подстановка (6.20) в (6.8) дает уравнение замкнутой системы в следующем виде: i = 2{d- qn)i + (6 - b-)ii -ksgni
+ a.
(6.21)
Поскольку и в этом случае переменная ц равномерно ограничена (при g < 0), то, очевидно, существует такое число а", что при fc > а° в точке ^ = О возникает скользящий режим. В скользящем режиме можно считать выполненными равенства ^ = 0,
^ = 0,
тогда из уравнения (6.21) эквивалентное значение разрывного сигнала определяется в виде ^sgneq^ = a - | - ( 6 - 6 " ) / j . После подстановки этого значения в уравнение регулятора (6.20) находим уравнение движения операторной переменной /i в скользящем режиме g / i - 6 / i = a, (6.22) которое в точности совпадает с уравнением скольжения для перемен ной /* из предыдущего пункта. Поэтому верны все сделанные ранее выводы и, в частности, о том, что уравнение скольжения по основной переменной после окончания переходного процесса уравнения (6.22) дается выражением XI = -{d + qa/b)xi. Следовательно, • и в этом случае имеет место неустранимый (хотя и сколь угодно малый при q —> —0) динамический статизм.
222
Глава 6. Теория операторной обратной связи
Сохраняются также все замечания и о прочности системы управления, и о физическом смысле эффекта компенсации возмущений а, Ь. Ход проекций фазовых траекторий на множество Gt в плоскости {xi,X2) показан на рис. 6.5, а для получения структуры системы до статочно в схеме на рис. 6.11 заменить параметр 6 на 6~ и добавить двойную стрелку J^ 6 € В, действующую на объект Р и отражающую влияние фактора неопределенности. Достоинство регулятора (6.20) состоит в том, что он эффективно действует при любых неизвестных параметрах а^ А,Ь ^ В. 6.3.6. Интегрально-релейная координатно-операторная обратная связь Максимально возможное упрощение системы управления достигается при использовании интегрально-релейного закона g/i = Jk8gn^.
(6.23)
В этом случае замкнутая система управления описывается (6.23) и уравнением ^ = 2((f-?/i)^-|-6/i-»-a-Jtsgn^,
b = h-{-2qd.
(6.24)
При возникновении скользящего режима можно считать выполнен ными в надлежащем смысле равенства
а поэтому эквивалентное значение разрывного сигнала имеет следую щее значение: После его подстановки в уравнение регулятора (6.23) находим точные и асимптотические уравнения скольжения для переменных /i и zi в виде известных уже из предыдущего выражений
qii-bn = a,
xi = -{d-qn)xi-
tioo=-a/b,
xi =
(d + qa/b) xf,
-{d+qa/b)xi.
Поэтому справедливы все выводы, сделанные в пунктах 6.3.4 и 6.3.5. Единственная трудность в проведенном рассуждении состоит в том, что факт возникновения скользящего режима в точке ( = О не просто усмотреть из уравнений замкнутой системы (6.23), (6.24). По скольку нас интересует анализ в малом, то этот вопрос^можно иссле довать с помощью функции Ляпунова вида « = (1/2)^
(6.25)
6.3. Статическая операторная обратная связь
223
Действительно, полагая для простоты, что параметры а,Ь = const, после дифференцирования функции (6.25) в силу уравнений движения (6.23), (6.24) находим v = i = ^[2(d- qn)i + bfi + a- asgn^] = (6.26)
= 2{d-qfi)e-\^\[d-(b(i
+
^)4t^a
Далее заметим, что в положении равновесия ^ = О, 1/1 + 0 = 0, поэтому в его окрестности в (6.26) доминирует член —d|^|. Следова тельно, существует число 7 > О такое, что 11 < -7lf I = -7\/2и = -7*>А. Решая последнее дифференциальное неравенство, находим оценку
из которой следует, что в некоторой окрестности положения равнове сия скользящий режим всегда возникает через конечное время, что и требовалось доказать. Структурная схема синтезированной бинарной системы управле ния представлена на рис. 6.13. Пожалуй, она наиболее простая из всех рассмотренных ранее, причем основные стабилизирующие свойства сохраняются.
•+d
P-,—, X. оо, но это понижает прочность системы управления. Можно, напротив, устремить пара метр ? -> О, что не исключается, но в пределе (т.е. при g = 0) 0-связь размыкается, а без этого для достижения аналогичного качества пе реходного процесса нужно увеличивать коэффициенты усиления либо согласиться на колебания фазового вектора относительно многообра зия О, как это сле дует, например, из уравнения интегрально-релейного КО-регулятора fi=-8gn
^,
я означает, по существу, введение глубокой обратной связи в КО-контуре регулирования, так как при этом k/q -¥ оо. Это, как известно, ведет к потере прочности и, хотя значения скрытых параметров в регуляторе можно считать меньшими, нежели значения скрытых па раметров в объекте, и, следовательно, критическое значение коэффи циента усиления этого контура, при превышении которого требуется устойчивость, выше, тем не менее в принципиальном плане следует поискать новые средства для точного решения рассматривг^мой за дачи стабилизации. Важно также отметить, что в системах со статической 0-связью и разрывной КО-связью при возникновении скользящего режима упра вление в главном контуре описывается выражением и = (k/q) (т, и хотя, быть может, k/q > ксг, неустойчивость не наступает. Обосно вание этого факта почти очевидно и здесь не приводится. Для устранения динамического статизма воспользуемся операторно-координатной обратной связью или, коротко, ОК-связью, охваты вающей объект управления по схеме рис. 7.3. В этой структуре подле-
\
Sd
"
>
Rv
dp
_
е
(
5е И - ^ - Ч
1
RM 1==Т1 Ч|— =Ц
jH 1 ,
"Р |^=
1
Pjr ——®
У* '""V
Sy
У
Р^
и'
[аеЛ.беВ Рис. 7.3
1
228
Глава 7. Теория операторно-координатной
обратной связи
жат заданию или синтезу операторы 0-задатчика Sd и ОК-регулятора Rf,. Напомним, что dp = d{p). Выделенная часть схемы на рис. 7.3 является типичным ОК-объектом, и поэтому рассматриваемую за дачу укрупненно иллюстрирует рис. 7.4. Поскольку эта схема стан-
Sd
с>5е=Ф
Rv
Рис. 7.4
дартна для теории обратной связи, то и методы решения задачи могут быть стандартными.
7.2. Уравнения движения операторно-координатного объекта Исходные уравнения объекта в координатном пространстве имеют те перь следующий вид: XI = Х2, ае А Х2 = axi + b{u + v),
(т = сх\ + Х2, b £ В.
Здесь наличие ОК-связи отражено компонентой v в управлении. После введения, с учетом действия 0-связи, ошибки (Гр = Х2 + dpXi
и операторной переменной ^ = = ^ = - * i s g n ^ , (7.7) то нужно позаботиться о надлежащем выборе оператора Д,,, гаран тирующего стабилизацию ошибки i/ в нуле. Ргьссмотрим некоторые варианты.
7.3. Статический ОК-регулятор Пусть оператор R,j в (7.5) является простейшим линейным операто ром, т.е. т] = k^v- Тогда надлежит исследовать на устойчивость следу ющую систему уравнений, для удобства обозначаемую символом Е*^: i = 2(d- qn)i + bn-ki
sgn^ -|- kibu + a,
i> = - * i s g n ^ .
(7.8) (7.9)
230
Глава 7. Теория операторно-координатной обратной связи
Поскольку и = р, р= —9А«, то после введения обозначения 6* = (1 - 9*2)6 - 2qd, эту систему можно переписать в более удобном виде ^ = 2(d - qfi)^ + ЬУ - ki sgn^ + а, i>= -kisgn^. Уравнения, подобные уравнению (7.8) Е'-системы, подробно иссле довались в главах 4, б, поэтому можно утверждать, что при выполне нии неравенства fci > а° в точке ^ = О возникает скользящий режим. Поскольку при этом, кроме того, в определенном смысле ^ = О, то эквивалентное значение разрывного сигнала определяется следующим выражением: *isgneq^ = 6*/i + a. После подстановки этого выражения в уравнение (7.9) Е'^-системы находим уравнение изменения 0-ошибки i/ в виде i> = —b*fi — a. В силу того, что и = р= —qf^, окончательно имеем уравнение для ошибки i/: й = —и-а. а° существуют такие константы а, /? > О, что в окрестности
выполнено неравенство которое эквивалентно дифференциальному неравенству ^ < -asgn£. Из приведенных неравенств следуют утверждение о возникновении скользящего режима в точке £ = О за конечное время и сходимость в Gi к нулю основной переменной xi, так как из (7.16) имеем уравнение XI = -(d + р)х1. Однако этого мало, поэтому продолжим исследование. В скользящем режиме, как обычно, из равенств £ = £ = О опреде ляем эквивгшентное значение разрывного сигнала в виде ^isgneq£ = b/i + b»?+a. После подстановки найденного эквивалентного управления в уравне ния (7.20) Е^-системы получаем следующую совокупность дифферен циальных уравнений Е^-системы:
Положение равновесия Е^-системы находится в точке (О, —а/Ь), которая, естественно, совпадает с точкой (//со > 'Поо)- Устойчивость по ложения равновесия определяется асимптотическими свойствами ди намической системы fi.= 'Ц+ Ч
-t), Ч
T) = qk2H-
(7.22)
234
Глава 7. Теория операторно-коордииатной обратной связи
Система (7.22) асимптотически устойчива тогда и только тогда, когда гурвицев ее характеристический полином 0. Заметим, что степень устойчивости системы (7.22) увеличивгьется при q —¥ О, т.е. назнач£1ется по произволу без изменения коэффициентов передачи главного К-контура регулирования. Кроме того, из (7.14) и (7.18) следует равенство v = —qn, и поэтому j / —> О, когда /i —^ 0. Таким образом, интегральный ОК-регулятор решает поставленную задачу об асимптотическом устранении с произвольным темпом ди намического статизма. Выбирая надлежащим образом свободные параметры дифферен циального уравнения i/ — и b/q + k2b = О, определяющего изменение 0-ошибки 1/, можно добиться колебательных (рис. 7.7а) или аперио дических (рис. 7.76) переходных процессов. В соответствии с этим определяется и характер переходных процессов в исходном коорди натном (а;1,а;2)-пространстве (рис. 7.8).
Рис. 7.7
7.5. Основные свойства и особенности бинарных систем
235
7.5. Основные свойства и особенности бинарных систем стабилизации с различными типами обратной связи Перечислим основные свойства и особенности бинарных систем ста билизации с различными типами обратной связи. О т л и ч и е о т и д е н т и ф и к а ц и о н н о г о п о д х о д а . В рассмо тренной бинарной системе нет даже косвенного эффекта идентифи кации. Отсутствие идентификации следует из формулы
и принципиально отличг1ет предложенную схему управления от адап тивного подхода. Э ф ф е к т , лежащий в основе компенсации неопреде л е н н о с т и . По формуле (7.15) сигнал управления и' =:u + v = (fi-hrj)xi=
-Н)'
11 + -\цх1.
(7.23)
с другой стороны, в скользящем режиме ^ = О, что эквивалентно по формуле (7.19) равенству 1, выполняется усло вие sgn(^ -f fi\^\) = sgn/i. Таким образом, в нижней зоне |^i| < 1 и fi = —ksgn^, а вне ее /i = —к sgn fi. Последнее обеспечивает соблю дение ограничения /i < 1 в скользящем режиме на границах |/х| = 1, а также немедленный сход с границ \fi\ = 1 при изменении знака ^. А это как раз то, что и нужно для управляемости. Описанный выше оператор с управляемым ограничением выхода является, таким образом, сложным нелинейным динамическим зве ном. Унифицированное обозначение таких звеньев дано на рис. 8.8.
И -1
7^ Рис. 8.8
8.1.
Ограничения операторной переменной
251
Отметим, что при использовании инерционно-релейного КО-регулятора qji = Ьц — к sgn ^ ограничение |/i| < const выполнено автома тически. Если же, однако, используется обычное инерционное звено qii = bn — к^, то ограничитель выхода необходим. В завершение этого раздела приведем итоговую структуру бинар ной системы (рис. 8.9, 8.10) со всеми типами обратной связи и с огра ничениями. Заметим, что итоговый регулятор Л„ довольно сложен и отгадать его непросто.
^
4т^=^ i +d
^
Р IL
|]^^^ч|н|->[^
ТТ •ч
С
с
«
(8.29)
Из полученной оценки следует, что функция к° отличается от кон станты ki, действующей при управлении свободным движением, на слагаемое 2(6+/ + 1) JM 6\хг\ обусловленное наличием внешней силы / . При отсутствии этой силы (/м = 0) данная оценка совпадает с ранее установленной. Второй вывод из (8.29) тот, что в окрестности нуля переменной Рх функция к\ неограниченно возрастает, что неприемлемо. Для огра ничения этой функции вместо (8.29) следует использовать оценку
*?>*! + ^^fM
= кг + k'jM,
(8.30)
где Д — положительная константа, определяющая размер шара диссипативности Br{0)={x\xl + xl О
Рис. 8.13
8.4. О компенсации координатного возмущения
261
шар вырождается в точку О, как это и должно быть. Шар диссипативности jBr(O) можно уменьшить, а значит, поднять точность стабилиза ции, введением надлежащих О- и ОК-связей. Подробное обоснование этого утверждения здесь не приводится. Структурная схема синтезированной бинарной системы стгкбилизации вынужденного движения для случая, когда возмущение измеря ется, приведена на рис. 8.14. Завершг1я обсуждение данной темы, от-
Г -1
1—1 "' h
,—,
L^5^
ki
1 s
1
1—|яЛ-| 1 1
1?'"* (9.5) ищем в виде y = ^gj(nt+v)_ (9.6) где А — амплитуда, а у> — фаза выходного сигнала ДС-цепочки. Под ставляя (9.6) в (9.5), получаем соотношение (jfi + l / r ) A e ^ * ' = j n . Из этого равенства находим выражение для амплитуды и фазы: А=
, „
у>= ^ - a r c t g ( T n ) .
Поскольку "чистая" производная дается выражением
то величины П—Л, itl2—ip уместно назвать искажениями по амплитуде и фазе соответственно.
9.1. Постановка задачи дифференцирования
267
Зависимости ошибок дифференцирования от постоянной времени Т для случая, когда Q > 1, приведены на рис. 9.8. Из графиков видно, что с увеличением постоянной времени уменьшаются амплитудные, но нарастают фазовые искажения при дифференцировании гармониче ского сигнала. Следовательно, проблема выбора постоянной времени не так проста, как это может показаться. Q
Q-A
П-1 ^Т Рис. 9.8 *У О А 0
t
•А
а Рис. 9.9
На рис. 9.9 штриховой линией изображена "чистая" производная П cos (Qf), а сплошной линией — "реальная" производная на выходе ЛС-цепочки. Полезно также иметь представление о том, как меняются погреш ности дифференцирования при изменении частоты обрабатываемого сигнала. Соответствуюпще графики при Т < 1 даны на рис. 9.10. Видно, что разные частоты обрабатываются с разными погрешно стями, и что самые лучшие характеристики ЛС-цепочка имеет при Q-A
Рис. 9.10
Глава 9. Дифференцирование сигналов
268
П -> О, т.е. при дифференцировании постоянного сигнала. При нали чии помехи, т.е. когда дифференцируется сигнал g{t) = е^^* + ее-''^*, где частота помехи w 3> П, а амплитуда е „ = a r c t g ( - T a ) ) .
Из выражений для амплитуды и фазы следует, что для устранения вредного влияния помехи следует увеличивать постоянную времени ДС-цепочки, но тогда возрастают фазовые искажения в полезной со ставляющей. Поэтому здесь возможен компромисс. Лучший выход, однако, может состоять в поиске таких схем дифференцирования, в которых имеется несколько свободных параметров, позволяющих не зависимо решать задачу "фильтрации" помехи и уменьшения ампли тудных и фазовых искажений. Перейдем к рассмотрению подобных схем дифференцирования, но прежде заметим, что передаточная функция ЛС-цепочки имеет вид
s+l/T' который нетрудно установить по ее дифференциальному уравнению 1 Такой передаточной функции соответствует упрощенная струк турная схема на рис. 9.11, которую можно развернуть в виде системы, представленной на рис. 9.12, где z — выход следящей системы, е — ее е
1
S + 1/T
1 ST
Рис. 9.11
Рис. 9.12
У
ошибка, в схемах всего один настраиваемый параметр Т, что и пре допределяет их возможности. Если вместо тождественного преобра зования в прямом канале использовать иные законы обратной связи, то можно рассчитывать на получение лучших дифференциаторов.
9.1. UocTSLHOBKa задачи дифференцирования
269
9.1.3. Дискретно-разностные аппроксимации К улучшенным методам дифференцирования относятся методы, осно ванные на использовании дискретных разностей различных порядков дифференцируемой функции. Например, оценкой производной функ ции g{t) может служить разность
Ь"'"-',"-"'^^,
(9.7)
где h = const > 0. Заметим, что для линейных функций эта оценка (9.7) производной совпадает с ее точным значением. В общем случае имеет место равенство g{t) = g{t -h)+
g{t) h + g{t + dh) —,
где d — некоторое число из интервала [0,1], и, следовательно, оценка (9.7) имеет погрешность порядка О(Л^). Использование дискретных значений в (г + 1)-й точке для форми рования оценки г
к=0
при надлежащем выборе параметров а* позволяет повысить точность аппроксимации до 0{h^). Кажется, что устремлением Л —> О задача дифференцирования исчерпывается. Однако это не так и при наличии помехи возникают проблемы, родственные описанным в предыдущем пункте. Именно, пусть вместо g{t) дифференцируется по схеме (9.7) сигнал де = g(t) + е sin uit, тогда оценка его производной д^ дг1ется выражением
^ 9e{t)-9^t-h) д^ = 7 ^^
=
g(t)-g{t + h) , 7 + '•
+— [sin ut — sin u{t — h)]. h
(9.8)
Ho sin w(t — h) = sin ut cos wh — cos uit sin uh, и при u)h 0.
Глава 9. Дифференцирование сигналов
270
В некоторых ситуациях качество такого дифференцирования мо жет быть повышено использованием идеи фильтрации, которая в раз ностных схемах эквивалентна операции усреднения. Именно, пусть дифференцируемый сигнал д( есть аддитивная смесь полезного сиг нала д и случайной помехи ^ с нулевым средним, т.е. М ( = 0. Для измерения производной используем N параллельно работающих диф ференциаторов D* (рис. 9.13) вида
^g(t)-g{t-h)
^
^ оо и от ^ не зависит.
9.2. Следящие дифференцирующие системы
273
Пусть д — const, тогда (9.12) легко интегрируется и e,(0 = f ( l - e - * ' ) . Поскольку у = ке, то для оценки производной имеем формулу Ьл(1-е-*0. Временные графики оценок при различных к {ki > /fj) приведены на рис. 9.17. Из графиков видно, что увеличение коэффициента усиления
Рис. 9.17
в обратной связи улучшает дифференцирующие свойства этой схемы. При этом, однако, нужно всегда помнить о том, что мы имеем дело с глубокой обратной связью. А именно, нужно при к —¥ оо учиты вать влияние ограничений и сингулярных возмущений на прочность системы. Если д ф const, то для уменьшения ошибки слежения также нужно устремлять fe -> оо. Для анализа последствий, наступающих при сингулярном возму щении, положим, что в схеме на рис. 9.16 вместо чистого интегриро вания осуществляется интегрирование с малой временной задержкой г = const > О, т.е. исследуемая ситуация иллюстрируется рис. 9.18. 9
,
е
'\
к
'!/
Z
S
Рис. 9.18
На этом рисунке уравнение в ошибках иное и дается следующей фор мулой: 'e{t) = -kt{t-T)^g. (9.13)
Глава 9. Диффереицирование сигналов
274
Теперь вопрос о том, принимать или не принимать во внимание свободную компоненту решения уравнения (9.13), зависит от устой чивости квазиполинома