Introduction à l'analyse et à la commande des systèmes non linéaires

Philippe Müllhaupt Introduction à l’Analyse et à la Commande des Systèmes Non Linéaires 12 juin 2007 Avant-propo...

Author: Philippe Müllhaupt

202 downloads 915 Views 5MB Size Report

This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form

DOWNLOAD PDF

Philippe Müllhaupt

Introduction à l’Analyse et à la Commande des Systèmes Non Linéaires 12 juin 2007

Avant-propos

L’objectif de ce livre est de présenter les fondements de l’analyse et de la synthèse de loi de commande pour les systèmes non linéaires. Le terme de système apparaˆıt de plus en plus pour désigner une multitudes de choses, par exemple pour un ensemble organisé de concepts, d’arrangements, d’assemblage, de composition d’idées et d’objets concrets. Nous entendrons par système, une représentation mathématique par des équations différentielles ordinaires non linéaires d’une réalité physique pouvant provenir de plusieurs disciplines différentes : biologie, génie mécanique, électrique, chimique, physique, etc. Ainsi, nous nous démarquons à la fois du sens biologique classique qui entend par système, un ensemple structuré d’éléments naturels de même espèce ou de même fonction, et du sens mécaniste qui entend par système, un appareil ou dispositif formé par une réunion d’organes, d’éléments analogues. Toutefois, la nature de structure est clairement présente dans notre définition de système, et nous mettons clairement la notion d’universalité d’application des théories développées, pour autant qu’elles puissent donner une adéquation a la fois avec l’observation des phénomènes et avec la prédicabilité de ceux-ci. ` Finalement, la provenance des équations décrivants un modèle de la réalité disparaˆıt lorsque l’on étudie, par voie mathématique, son comportement. La compréhension de ce comportement fera l’objet de la première partie intitulée ”Analyse”, et sa modification, l’objet de la seconde partie intitulée ”Synthèse”. Le comportement est ici à comprendre dans son sens large, à savoir non seulement l’évolution temporelle des solutions de l’ensemble des équations différentielles ordinaires décrivant le modèle, mais également certaines propriétés topologiques caractéristiques de cet ensemble : par exemple, type et qualité des points singuliers (c.-à-d, la classification des points d’équilibre stables ou instables), l’existence de cycle limite, la délimitation du bassin d’attraction des points d’équilibre stables, etc.

VI

Avant-propos

Une grande partie du livre est consacré à définir convenablement le concept de stabilité et de donner des outils permettant de déterminer avec un nombre d’opération réduit cette propriété. Nous verrons également que le comportement peut être modifié par le concept de rétroaction (ou loi de commande). En modifiant certaines variables apparaissants dans le système d’équations différentielles (que l’on désigne par le nom d’entrée) en utilisant l’information de certaines autres variables de cet ensemble (appelée sortie) de telle sorte que les variables d’entrées soient mises en correspondance avec les variables de sortie, le concept de boucle de rétroaction fait son entrée, et permet de modifier radicalement le comportement de l’ensemble des équations différentielles. Ainsi, un système initialement instable peut devenir stable. Il est alors nécessaire d’exploiter la définition de la stabilité et de ces caractérisations pour élaborer les correspondances entre entrées et sorties (les lois de commande) de telle sorte de parvenir à ces fins. Ce livre est issu d’un enseignement à des étudiants en fin d’études d’ingénieur en génies électrique, microtechnique, et mécanique. La matière est couverte ` a raison de deux heures par semaines sur une durée d’un semestre. Je conseille vivement d’intercaller des séances à l’ordinateur permettant aux étudiants d’être confrontés eux-mêmes aux problèmes, ce qui rend le contenu de la matière plus concrète et plus facilement assimilable. Je remercie les nombreuses volées d’étudiants qui m’ont permis d’affiner l’ouvrage proposé et surtout ma compréhension du sujet. J’espère également avoir pu leur transmettre les connaissances de cette discipline et transmis un peu de mon enthousiasme pour cette matière parfois d’aspect superficiellement aride. Ce texte est une introduction au sujet et l’objectif est de permettre, dans un volume compact, l’accès à une littérature difficile à un large spectre de lecteurs de formation scientifique et technique diverse. Les prérequis ne sont pas excessifs ; de bonnes notions sur les équations différentielles et les représentations associées comme la transformée de Laplace et la notion de fonction de transfert sont requises ; il est nécessaire également de connaˆıtre les concepts de représentation d’état linéaire, de commandabilité et d’observabilité. Malheureusement, le traitement proposé dans cet ouvrage ne couvre que les systèmes ayant une seule entrée et ne dépendant pas du temps. Le concept d’observateur non linéaire n’est pas abordé et le concept de gouvernabilité non linéaire n’est pas traité dans toute sa complexité. L’accent est mis sur l’accessibilité, présentée comme condition nécessaire à la linéarisation d’état. Les concepts qui ne sont pas traités peuvent être abordés sereinement une fois que la matière de ce cours est assimilée. Leur exposition correspond mieux à un cours au niveau doctoral.

Avant-propos

VII

Une bibliographie se trouve à la fin de l’ouvrage qui contient exclusivement des références ` a des livres complets. C’est un choix personnel dicté par la difficulté de faire une bibliographie pertinente au niveau introductif sans léser les auteurs d’éminentes publications qui seraient laissés de cˆ oté, non pas par manque d’intérêt, mais par soucis de compacité. Une solution aurait été de faire une bibliographie exhaustive mais elle demanderait une liste énorme. Par exemple, les références ` a la littérature (essentiellement russe) se trouvant dans l’ouvrage [BS70] couvre déj` a plus de 35 pages. J’invite donc le lecteur de se référer aux bibliographies détaillées des ouvrages cités ` a la fin de cet ouvrage. Le premier de ceux-ci qui m’a transmis l’enthousiasme de la discipline est [SL91]. Il n’est pas étonant que le présent ouvrage en est fortement inspiré pour la rédaction de plusieurs chapitres, en particulier pour la séparation en deux parties, analyse et synthèse. Egalement dans cette même optique, l’ouvrage incontournable de [Kha02], longtemps utilisé comme support au cours (avec l’ouvrage de [SL91] précédemment mentionné), m’a également fortement inspiré à plusieurs reprises. Je félicite l’auteur pour son ouvrage, un modèle de rigueur et un excellent point d’entrée pour quiconque voulant approfondir au del` a du présent contenu. Le chapitre géométrie est inspiré de [Isi89], [NvdS90], [KN63],[Car71] et [For59], en particulier j’attire l’attention sur ces deux dernières références pour la notion des 1-formes, du calcul extérieur et de la dérivée extérieure. J’invite également le lecteur intéressé à consulter l’excellent [Mor01]. La commande par les méthodes de Lyapunov est inspirée par plusieurs passages dans [SJK97] et j’en remercie les auteurs. Cet ouvrage est également le fruit de mes nombreuses interactions avec mes doctorants que je remercie vivement, sans qui l’exposition de la matière serait plus opaque. C’est ainsi que je témoigne ma sincère gratitude à Davide Buccieri, Jean-Yves Favez, Basile Graf, Yvan Michellod, Thierry Prud’homme et Christophe Salzmann. Le premier professeur m’ayant transmis les notions essentielles de commande d’état est le professeur Roland Longchamp dont la pédagogie et le goˆ ut pour la science m’ont poussé à m’orienter vers l’automatique durant mes études. Je le remercie vivement pour cela, mais surtout j’aimerais le remercier particulièrement pour avoir encouragé la réalisation de cet ouvrage, ainsi que pour son soutient sans faille tout au long de la rédaction de celui-ci. Ensuite, j’aimerais chaleureusement remercier le professeur Jean Lévine qui m’a permis de me spécialiser en commande non linéaire, me transmettant les connaissances indispensables durant mon séjour au Centre Automatique et Systèmes de l’Ecole des Mines de Paris à Fontainebleau. Je remercie également le professeur Laurent Praly avec qui j’ai pu discuté de manière quotidienne lors du repas de midi. J’aimerais également remercier le professeur Zhong-Ping Jiang pour l’excellent travail en commun effectué à Lausanne et à New York. Son aisance

VIII

Avant-propos

avec les inégalités mathématiques est impressionnante. J’ai résumé quelques unes de ces techniques dans le présent ouvrage, et je le remercie vivement pour m’avoir transmis cette connaissance. J’aimerais également remercier les professeurs Dominique Bonvin, Sebastian Dormido, Balint Kiss, Balasubrahmanyan Srinivasan, ainsi que le Dr. Denis Gillet pour le très bon travail scientifique effectué en commun aboutissant ` a des publications internationales.

Lausanne, Juin 2007

Philippe M¨ ullhaupt

Table des mati` eres

Partie I Analyse 1

D´ efinition et propri´ et´ es des syst` emes non lin´ eaires . . . . . . . . . 1.1 Principe de superposition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Classe de systèmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Réponse indicielle disymétrique . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Termes d’ordre supérieur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Points d’équilibre isolés multiples . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Explosion en temps fini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7 Réponse harmonique multiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.8 Orbites chaotiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3 3 4 4 6 7 8 8 8

2

Diagramme de phase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Plan de phase pour les système du second ordre . . . . . . . . . . . . . 2.1.1 Système masse-ressort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Techniques de graphe du plan de phase . . . . . . . . . . . . . . . . . . . . . 2.3 Systèmes linéaires du second ordre . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Solutions numériques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Graphe des pentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Elimination du temps explicitement . . . . . . . . . . . . . . . . . . 2.3.4 Elimination du temps implicitement . . . . . . . . . . . . . . . . . 2.3.5 Méthode des isoclines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.6 Exemple : oscillateur de van der Pol . . . . . . . . . . . . . . . . . 2.4 Cycles limites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Classification des cycles limites . . . . . . . . . . . . . . . . . . . . . .

11 11 12 12 13 14 14 15 15 16 17 19 20

X

3

Table des matières

2.5 Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Type de points d’équilibre . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.2 Classification des points d’équilibre . . . . . . . . . . . . . . . . . . 2.5.3 Théorème de l’index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.4 Théorème de Bendixson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Impossibilité du chaos planaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.1 Théorème de Poincaré-Bendixson . . . . . . . . . . . . . . . . . . . . 2.7 Exemple : dynamique de populations . . . . . . . . . . . . . . . . . . . . . . . 2.7.1 Compétition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7.2 Prédateur-proie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20 22 22 23 24 24 25 25 26 28 30

M´ ethode du premier harmonique . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Système linéaire et non-linéarité statique . . . . . . . . . . . . . . . . . . . 3.1.1 Excitation sinuso¨ıdale en boucle ouverte . . . . . . . . . . . . . . 3.1.2 Caractéristique passe-bas du système linéaire G(s) . . . . . 3.1.3 Gain complexe équivalent . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Premier harmonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Décomposition en harmoniques . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Equivalent du premier harmonique . . . . . . . . . . . . . . . . . . 3.2.3 Calcul de l’équivalent du premier harmonique . . . . . . . . . 3.3 Non-linéarités communes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Saturation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.2 Zone morte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.3 Relais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.4 Hystérèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.5 Non-linéarités symétriques, continues par morceaux . . . . 3.4 Système en rétroaction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.2 Double intégrateur et oscillateurs linéaires . . . . . . . . . . . . 3.4.3 Théorème de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Critère de stabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.1 Cycle limite stable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.2 Cycle limite instable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Fiabilité de l’analyse par le premier harmonique . . . . . . . . . . . . . 3.7 Oscillateur de Van der Pol revisité . . . . . . . . . . . . . . . . . . . . . . . . .

31 32 33 33 35 37 37 37 38 42 43 44 45 45 46 47 49 50 52 58 58 59 61 61

Table des matières

4

Stabilit´ e au sens de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Point d’équilibre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Rappel de la notion de stabilité pour les systèmes linéaires . . . . 4.3 Notion intuitive de la stabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Définition mathématique précise de la stabilité . . . . . . . . . . . . . . 4.4.1 Notion de distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.2 Stabilité : définition formelle . . . . . . . . . . . . . . . . . . . . . . . . 4.4.3 Illustration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.4 Stabilité asymptotique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.5 Désavantages de la définition . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Méthode directe de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.1 Candidat de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.2 Fonction de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 Exemple : robot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.1 Loi de commande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.2 Lois de la mécanique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.3 Candidat Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.4 Fonction de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7 Théorème de stabilité locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7.1 Preuve (stabilité locale) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7.2 Preuve de stabilité locale asymptotique . . . . . . . . . . . . . . 4.8 Stabilité exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.8.1 Exemple : Dynamique des populations . . . . . . . . . . . . . . . 4.9 Stabilité globale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.10 Fonction de Lyapunov pour les systèmes linéaires . . . . . . . . . . . . 4.11 Stabilité locale et linéarisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.11.1 Inconvénients de la méthode indirecte . . . . . . . . . . . . . . . . 4.12 Stabilité exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.13 Théorème d’invariance de LaSalle . . . . . . . . . . . . . . . . . . . . . . . . . . 4.13.1 Ensemble invariant M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.13.2 Ensemble d’annulation de la dérivée de la fonction de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.13.3 Exemple : le pendule simple . . . . . . . . . . . . . . . . . . . . . . . . 4.14 Méthodes de construction des fonctions de Lyapunov . . . . . . . . . 4.14.1 Méthode de Krasovskii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.15 Méthode du gradient variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

XI

65 65 65 66 66 66 67 70 70 70 71 71 72 73 73 73 74 74 75 75 77 79 79 79 81 82 84 84 85 85 86 87 91 92 92

XII

Table des matières

4.16 4.17 4.18 4.19

Résultat d’instabilité 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Résultat d’instabilité 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Résultat d’instabilité 3 : th. de Chetaev . . . . . . . . . . . . . . . . . . . . 96 Techniques de comparaison et majoration . . . . . . . . . . . . . . . . . . . 97 4.19.1 Les formes quadratiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 4.19.2 Inflation et déflation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.19.3 Le développement limité . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 4.19.4 La réintroduction de V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 4.19.5 L’équation intégrale associée . . . . . . . . . . . . . . . . . . . . . . . . 101 4.19.6 Quelques inégalités standards . . . . . . . . . . . . . . . . . . . . . . . 103 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

5

Passivit´ e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 5.1 Notion intuitive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 5.2 Exemple de système statique passif . . . . . . . . . . . . . . . . . . . . . . . . 108 5.3 Système statique passif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 5.4 Exemple de système dynamique passif . . . . . . . . . . . . . . . . . . . . . . 109 5.5 Définition différentielle de la passivité . . . . . . . . . . . . . . . . . . . . . . 111 5.6 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 5.6.1 Connexion parallèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 5.6.2 Connexion par rétroaction . . . . . . . . . . . . . . . . . . . . . . . . . . 113 5.6.3 Définition intégrale de la passivité . . . . . . . . . . . . . . . . . . . 114 5.7 Passivité des systèmes linéaires SISO . . . . . . . . . . . . . . . . . . . . . . . 114 5.7.1 Preuve du lien entre passivité et réponse harmonique positive réelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 5.8 Système réel positif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 5.8.1 Degré relatif et minimum de phase . . . . . . . . . . . . . . . . . . 119 5.8.2 Lien entre Lyapunov et système RP . . . . . . . . . . . . . . . . . 122 5.9 Stabilité absolue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 5.9.1 Non-linéarité statique de secteur . . . . . . . . . . . . . . . . . . . . 128 5.9.2 Définition de la stabilité absolue . . . . . . . . . . . . . . . . . . . . . 128 5.9.3 Conjecture de M. A. Aizerman . . . . . . . . . . . . . . . . . . . . . . 130 5.9.4 Critère du cercle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 5.9.5 Critère de Popov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

Table des matières

XIII

Partie II Synth` ese 6

Elements de G´ eom´ etrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 6.2 Variété, Cartes et Atlas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 6.2.1 Difféomorphisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 6.3 Solution de l’équation différentielle . . . . . . . . . . . . . . . . . . . . . . . . 150 6.4 Champ de vecteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 6.5 Espace dual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 6.6 Produit tensoriel et forme multilinéaire . . . . . . . . . . . . . . . . . . . . . 152 6.7 Produit scalaire et produit extérieur en dimension deux . . . . . . 153 6.7.1 forme bilinéaire symétrique . . . . . . . . . . . . . . . . . . . . . . . . . 154 6.7.2 forme bilinéaire antisymétrique (alternée) . . . . . . . . . . . . . 154 6.7.3 Produit extérieur de deux formes linéaires . . . . . . . . . . . . 155 6.8 Forme multilinéaire alternée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 6.9 Cotangent et les 1-forme différentielles . . . . . . . . . . . . . . . . . . . . . 157 6.10 Le gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 6.11 Dérivée de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 6.12 Crochet de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 6.12.1 Propriétés du crochet de Lie . . . . . . . . . . . . . . . . . . . . . . . . 162 6.13 Différentiation extérieure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 6.13.1 Différentielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 6.13.2 Dérivation extérieure d’une 1-forme . . . . . . . . . . . . . . . . . . 165 6.13.3 Dérivation extérieure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 6.13.4 Théorème de Stokes généralisé . . . . . . . . . . . . . . . . . . . . . . 167 6.14 Intégrabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 6.15 Différence entre une 1-forme exacte et intégrable. . . . . . . . . . . . . 170 6.16 Différentielles et dérivation extérieure . . . . . . . . . . . . . . . . . . . . . . 171 6.17 Propriétés de la différentielle extérieure . . . . . . . . . . . . . . . . . . . . . 173 6.18 Condition d’exactitude et d’intégrabilité . . . . . . . . . . . . . . . . . . . . 174 6.19 Interprétation géométrique de l’intégrabilité et de la non-intégrabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 6.20 Les deux formes du théorème de Frobenius . . . . . . . . . . . . . . . . . 184

7

Commande par lin´ earisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 7.1 Linéarisation locale et stabilisation . . . . . . . . . . . . . . . . . . . . . . . . 192 7.1.1 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193

XIV

Table des matières

7.2 Linéarisation exacte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 7.3 Equation d’erreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 7.3.1 Fonction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 7.3.2 Equation différentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 7.3.3 Placement de pˆ oles et équation d’erreur . . . . . . . . . . . . . . 201 7.4 Systèmes linéaires SISO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 7.4.1 Sortie spécifiée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 7.4.2 Sortie non spécifiée, formule d’Ackermann . . . . . . . . . . . . 212 7.5 Linéarisation entrée-sortie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 7.6 Linéarisation exacte entrée-état . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 7.6.1 Conditions pour la sortie plate . . . . . . . . . . . . . . . . . . . . . . 217 7.6.2 Exemple : Robot avec joint flexible . . . . . . . . . . . . . . . . . . 220 7.6.3 Exemple : Bille roulant sur une barre . . . . . . . . . . . . . . . . 224 7.7 Commande d’une chaˆıne d’intégrateurs . . . . . . . . . . . . . . . . . . . . . 226 7.7.1 Stabilisation et poursuite . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 7.7.2 Transit en temps fini avec commande a priori . . . . . . . . . 227 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 8

Commande par les m´ ethodes de Lyapunov . . . . . . . . . . . . . . . . . 233 8.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 8.2 Fonction de Lyapunov de Commande . . . . . . . . . . . . . . . . . . . . . . 234 8.3 Structure cascade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 8.3.1 Restriction de la croissance du terme de couplage . . . . . . 237 8.4 Passivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 8.5 Phénomène du peaking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 8.6 Backstepping . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 8.6.1 Fonction de Lyapunov réduite . . . . . . . . . . . . . . . . . . . . . . . 248 8.6.2 Fonction de Lyapunov complète . . . . . . . . . . . . . . . . . . . . . 249 8.6.3 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250

Litt´ erature . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255

Partie I

Analyse

1 D´ efinition et propri´ et´ es des syst` emes non lin´ eaires

La notion de système non linéaire est fondée sur le non respect du principe de superposition. Les systèmes n’obéissant pas au principe de superposition sont très nombreux. Nous présenterons une sous-classe de tels systèmes pour lesquels les équations différentielles ordinaires sont suffisantes à leur description. Cette classe sera étudiée tout au long de cet ouvrage. Finalement, plusieurs propriétés propres ` a cette classe sont illustrées à travers divers exemple.

1.1 Principe de superposition Un système linéaire pourvu d’une entrée u et d’une sortie y obéit au principe de superposition. D´ efinition 1.1. (Prinicipe de superposition). Soit deux signaux d’entrées u1 et u2 engendrants deux signaux de sorties y1 y2 . La réponse a ` la somme des entrées u = u1 + u2 est la somme des réponses individuelles, i.e. y = y1 + y2 . Une conséquence directe de ceci est : Caractéristique 1.2. Pour tout système obéissant au principe de superposition, la réponse ` a une amplification du signal par un facteur α engendre une amplification de la sortie par un même facteur α. En d’autres termes si y corrspond a u alors la réponse ` ` a αu est αy. Ce principe est ` a l’origine même de la définition d’un système linéaire. D´ efinition 1.3. Tout système obéissant au principe de superposition est un système linéaire. Par conséquent tout système qui n’obéit plus au principe de superposition est un système non-linéaire, l’objet de ce livre.

4

1 Définition et propriétés des systèmes non linéaires

1.2 Classe de syst` emes La classe de système qui sera étudiée dans ce texte est celle décrivant les modèles de systèmes physiques qui peuvent se représenter par un ensemble d’équations différentielles ordinaires. Le modèle mathématique du système physique s’écrit x˙ = f (x, u),

(1.1)

T de dimension n et o` u x représente le vecteur d’état x = x1 x2 . . . xn T u un vecteur de grandeur d’entrée u = u1 , u2 , . . . um avec m grandeurs de commandes ui ∈ R, i = 1, . . . , m. Tout au long de cet ouvrage, nous supposerons que f (x, u) apparaissant dans (1.1) est une fonction continue de ces deux arguments. De plus cette continuité sera telle que la solution de (1.1) est unique pour des conditions initiales x0 et une commande uo déterminées. La condition sur cette continuité est que f (x, u) soit Lipschitz continue (en chaque point l’évolution infinitésimale locale de f (x, u) doit être bornée). D´ efinition 1.4. La fonction f (x, u) est appelée Lipschitz continue selon ces deux arguments x et u lorsque, d’une part, elle est continue selon ses deux arguments x et u et, d’autre part, lorsqu’il existe deux constantes c1 ∈ R et c2 ∈ R telles que pour toute valeur de x1 et x2 , (resp. u1 et u2 ), kf (x1 , u) − f (x2 , u)k ≤ c1 kx1 − x2 k, resp. kf (x, u1 ) − f (x, u2 )k ≤ c2 ku1 − u2 k. Le lecteur intéressé par la nécessité et la suffisance de cette condition est invité ` a consulter [Kha02]. Cependant, nous n’expliquerons pas complètement comment obtenir un tel modèle, étant donné qu’il serait alors nécessaire de couvrir un très grand nombres de disciplines connexes : chimie, physique, mécanique du solide, electrotechnique, etc., chacune ayant une théorie de la modélisation propre conduisant ` a des équations différentielles ordinaires susmentionnées. Avant d’entrer dans le vif du sujet, mentionnons que les systèmes non linéaires possèdent des particularités singulières qui sont complètement absente des systèmes linéaires. Certaines de ces propriétés sont présentées ciaprès.

1.3 R´ eponse indicielle disym´ etrique Considérons le système linéaire simple

1.3 Réponse indicielle disymétrique

5

x˙ = −x + u. Un signal d’entrée symétrique et carré entre 0 et +1 lui est appliqué. Le signal de sortie x(t) associé suit le signal d’entrée, mais avec une inertie. Les phases de montées alternent avec les phases de descentes de manière symétrique. Le diagramme de gauche de la figure 1.1 illustre le résultat. Par contre, le système non-linéaire simple x˙ = −|x|x + u exhibe un comportement disymétrique. En effet, la phase de montée est plus rapide que la phase de descente (` a droite de la figure 1.1). 3

2

2 1

1

0 0

0

20

40

0

20

40

Fig. 1.1. A gauche, les phases de montée et de descente sont symétriques dans le cas de l’équation x˙ = −x+u, o` u u est un signal carré entre +1 et 0. A droite, lorsque x˙ = −[x[x + u, ce n’est plus le cas.

Remarque 1.5. Dans le cas du système non linéaire x˙ = |x|x + u, le terme |x|x peut être localement interprété comme le membre de droite ax d’un système linéaire x˙ = ax, o` u l’inverse de la constante de temps, dénotée a, correspond a |x|. Ainsi, autour de la valeur maximale de x, correspondant au régime ` permanent lorsque l’entrée vaut 1, le système est rapide. Par contre, autour de la valeur de x nulle, la constante de temps est grande, et le système lent. A la montée, seul l’entrée u = +1 force rapidement le système à se déplacer, bien que la constante de temps soit grande (système lent). L’effet de x est négligeable par rapport ` a l’entrée dans la phase de montée. A la descente, par contre, même si la constante de temps est initialement grande, l’entrée est nulle, et la valeur x se modifie en fonction d’elle même, sans être aidée par la contribution de l’entrée. Initialement rapide, le système ralentit vite, à cause de la diminution de x.

6


1.4 Termes d’ordre sup´ erieur Lorsque la solution d’un système non linéaire s’éloigne suffisamment d’un point d’équilibre, les termes d’ordre supérieur du dévelopement en série (autour de ce point d’équilibre) contribuent de manière croissante à l’influence sur la dérivée. Il se peut très bien que ces termes présentent un effet déstabilisant sur le comportement global. Par exemple, le système x˙ = −x + x2 ,

(1.2)

ne comporte pas d’entrée et possède un point d’équilibre à l’origine. Plusieurs conditions initiales sont considérées, certaines inférieures en valeur absolue ` a l’unité, et d’autres supérieures. Elles sont choisies symétriques par rapport ` a l’origine, au sens o` u, si une simulation est effectuée pour x(0) = x0 , alors une autre l’est également pour x(0) = −x0 . Les solutions de l’équation différentielle associées aux conditions initiales sont représentées a la figure 1.2. ` x

3

2

1

0

-1

t 0

2

4

Fig. 1.2. Les solutions de x˙ = −x+x2 sont représentées pour les conditions initiales x(0 suivantes : ±0.2, ±0.4, ±0.6, ±0.8, ±1.01, ±1.1. L’instabilité apparaˆıt dès que x(0) > 1.

La première constatation est que le comportement n’est pas symétrique par rapport au signe des conditions initiales. La seconde, et la plus importante, est qu’il y a, ` a la fois des conditions initiales pour lesquelles la solution s’éloigne de plus en plus du point d’équilibre au fur et à mesure que le temps progresse, et d’autres pour lequel la solution converge vers la valeur d’équilibre x = 0. La séparation se produit lorsque la condition initiale x(0) est supérieure à 1. Remarque 1.6. Contrairement au systèmes linéaires, la stabilité peut dépendre des conditions intiales.

1.5 Points d’équilibre isolés multiples

7

Pour mieux comprendre le phénomène, les fonctions x et x2 sont représentées a la figure 1.3 ` x2 1.5

x 1

0.5

x

0 0

0.5

1

Fig. 1.3. La stabilité de x˙ = −x + x2 est déterminé par le signe du membre de droite. La figure représente les deux fonctions x et x2 . On constate que x2 devient plus grand que x lorsque x > 1. Le signe du membre de droite change et conduit ` a l’instabilité.

Remarque 1.7. Le signe devant le terme x ou x2 est fondamental. En effet, x˙ = x est un système instable, car la solution x(t) = et diverge lorsque t → ∞. Par contre x˙ = −x est stable ; la solution x(t) = e−t converge vers 0 lorsque t → ∞. Ainsi, dans l’équation différentielle, le terme x2 a une tendance à déstabiliser le système, et −x à le stabiliser. La stabilité est garantie pour autant que le terme −x domine x2 pour x positif, ce qui est le cas lorsque x < 1.

1.5 Points d’´ equilibre isol´ es multiples En examinant l’équation (1.2) de l’exemple précédent, une particularité supplémentaire peut être remarquée. Bien que x = 0 soit un point d’équilibre, car x˙ = 0, il n’est pas unique. En effet, Il existe d’autres points d’équilibre qui sont obtenus en résolvant −x + x2 = 0 par factorisation, conduisant à x(x − 1) = 0, et un nouveau point d’équilibre x = 1 apparait.. Ceci est ` a mettre en perspective avec le cadres des systèmes linéaires, pour lesquels, lorsque le point d’équilibre est isolé, alors il est unique. En effet, la condition d’équilibre pour un système x˙ = Ax est 0 = A¯ x. Lorsque A est invertible (i.e. |A| = 6 0) le point d’équilibre est unique et correspond à x ¯ = 0. Lorsque A est singulière alors le noyau est un sous-espace vectoriel et donc les points d’équilibre multiples sont connectés. Ainsi dans ce cas, si x ¯ 6= 0 et x ¯ ∈ {x | Ax = 0} alors λ¯ x 6= 0 est aussi un point d’équilbre ∀λ ∈ R∗ .

8


1.6 Explosion en temps fini Dans le cas linéaire, l’instabilité est toujours bornée par une exponentielle. Par exemple x˙ = 3x tend vers l’infini sans jamais dépasser une exponentielle x(t) < x0 e3.01t . La raison de ceci tient au fait que l’expression de la dérivée peut être bornée par une quantité proportionnelle à la valeur de l’état. La constante de proportionalité donne la vitesse de l’exponentielle. Dans le cas non linéaire des surprises peuvent se produire. Par exemple, pour le système (1.2), la divergence vers l’infini est beaucoup plus rapide que dans le cas linéaire. La solutions analytique de cette équation est

x(t) =

x0 e−t 1 − x0 + x0 e−t .

La solution devient de plus en plus grande lorsque t → 1. Ainsi, elle diverge vers l’infini en un temps fini.

1.7 R´ eponse harmonique multiple Un autre phénomène très intéressant est la réponse polyharmonique d’un système non linéaire ` a une excitation ne contenant qu’une seule harmonique. Cet aspect sera présenté dans le contexte de la méthode du premier harmonique au chapitre 3

1.8 Orbites chaotiques On considère le système x¨ + 0.1x˙ + x5 = u = 6 sin(t)

(1.3)

Deux trajectoires sont représentées, l’une correspondant à la condition T T intiale x0 = 0.1 0.2 et l’autre à x0 = 0.105 0.2 . On constate que même si les deux conditions initiales sont très proches l’une de l’autre, les trajectoires résultantes sont rapidement très différentes, sans pour autant devenir non bornées (les valeurs de la position x demeurent dans un interval fermé et borné). Cette hypersensibilité aux conditions intiales et l’aspect presque imprévisible du résultat donne l’impression que le système est soumis à des perturbations aléatoires. Mais il n’en n’est rien. Le système est parfaitement déterministe. Un tel comportement est appelé ”chaos”. Comme exemple supplémentaire, considérons l’oscillateur de Lorenz,

1.8 Orbites chaotiques

x

9

2

1

0

-1

-2

t 0

10

20

30

40

50

60

Fig. 1.4. Les solutions de l’équations différentielle (1.3) sont représentées pour deux conditions initiales proches (x(0) = 0.1, et x(0) = 0.105 ; x(0) ˙ = 0.2 pour les deux cas). Bien que les trajectoires résultantes sont proches dans la première portion horizontale, elles deviennent très différentes dans la deuxième portion horizontale du graphique.

x˙ = −σx + σy y˙ = rx − y − zx z˙ = −bz + xy,

o` u seuls les deux termes en bleu, zx d’une part, et xy d’autre part, chacun produits de deux états, sont responsables de la nature non linéaire de la dynamique. Les paramètres σ, b, r sont fixes. Un exemple de trajectoire est représenté ` a la figure 1.5. 20 10 0 -10 -20 40

30

20

10 -10 0 10

Fig. 1.5. Orbite chaotique de l’oscillateur de Lorenz pour σ = 10, b = 38 , r = 28.

10


On constate plusieurs phénomènes intéressants : – Une trajectoire solution ne repasse jamais par le même point. – Il n’y a pas de solution périodique. – Il existe des voisinages tels que pour toute condition initiale comprise dans ce voisinage, la solution repasse une infinité de fois dans le voisinage. De plus ce voisinage peut être pris arbitrairement. Autrement dit, en définissant V0 (x0 ∈ V0 ), il existe une infinité d’instant temporels t0 < t1 < t2 < . . . t∞ pour lesquels x(ti ) ∈ V0 pour i ∈ N. – Les solutions demeurent dans un cube (un ensemble fermé et borné, ou autrement dit un ensemble compact). – Pour deux conditions intiales arbitrairement proches, les solutions respectives finissent par diverger l’une de l’autre pour finalement plus se ressembler du tout.

2 Diagramme de phase

Pour les systèmes mécaniques, la modélisation en utilisant les coordonnées généralisées (mécanique analytique) conduit à un modèle comportant des dérivées secondes des coordonnées généralisées exprimées en fonction des coordonnées généralisées ainsi que de leur première dérivée. Pour simuler de tels systèmes, il est nécessaire de connaˆıtre les conditions initiales, c’est-à-dire l’ensemble des coordonnées généralisées ainsi que leurs premières dérivées. Ainsi, une solution du système d’équations est un ensemble de fonctions du temps, une pour chacune des coordonnées généralisées et une pour la première dérivée (vitesse) correspondante. Les variables de phase forment un tel ensemble de grandeurs. De manière plus générale, le formalisme d’Hamilton permet d’associer aux coordonnées généralisées q1 , . . . , qn , des variables vitesses particulières, appelées moments généralisés p1 , . . . , pn . L’espace de phase est l’ensemble des 2n grandeurs q1 , . . . , qn et p1 , . . . pn . Cet ensemble constitue donc T les grandeurs d’état du système, à savoir x = q1 . . . qn p1 . . . pn . Cependant nous séparons ces grandeurs d’état en deux groupes. Dans ce chapitre, les systèmes de seond ordre, o` u l’espace de phase est l’ensemble q, et q, ˙ seront étudiés. De plus, ces système ne proviendrons pas forcément du domaine mécanique.

2.1 Plan de phase pour les syst` eme du second ordre Pour les systèmes du second ordre donnés par q¨ = f (q, q), ˙

(2.1)

on désignera par q ∈ R et q˙ ∈ R les variables de phases. Maintenant le plan de phase n’est rien d’autre que le plan o` u l’on représente dans l’axe horizontal, la variable q et selon l’axe vertical, la variable q. ˙ Une

12


solution ` a l’équation (2.1) sera donné par deux fonctions du temps q = φq (t) q˙ = φq˙ (t) telles que

dφq˙ = f (φq˙ , φq ) dt

Maintenant, en faisant varier le temps, q et q˙ sont obtenus par substitution. Une courbe paramétrée est alors décrite dans le plan de phase par les deux coordonnées x = φq (t) et y = φq˙ (t). Il est important de remarquer que le temps n’apparaˆıt pas explicitement. 2.1.1 Syst` eme masse-ressort Afin d’illustrer les techniques de tracés des orbites dans le plan de phase, le système simple suivant est utilisé : q¨ + q = 0. C’est l’équation dynamique d’un système mécanique comportant un ressort parfait ` a l’extrêmité duquel se situe une masse. L’ensemble forme un oscillateur mécanique. Les paramètres sont normalisés à l’unité. La représentation schématique est donnée ` a la figure 2.1.

k=1

m=1

Fig. 2.1. Système masse ressort.

2.2 Techniques de graphe du plan de phase Plusieurs techniques sont disponibles pour représenter les orbites des trajectoires d’un système dynamique à deux états. Certaines consistent a

2.3 Systèmes linéaires du second ordre

13

représenter exactement le tracé d’autres à n’obtenir qu’une information partielle concernant celles-ci, par exemple en ne représentant que l’information concernant la direction de la tangente en plusieurs points du plan de phase. Les méthodes suivantes seront détaillées : 1. Méthodes informatiques – Solutions numériques pour diverses conditions initiales – Graphe des pentes 2. Méthodes papier crayon – Solution explicite des équations a) en éliminant le temps explicitement b) en éliminant le temps implicitement 3. Méthodes mixtes – Méthode des isoclines

2.3 Syst` emes lin´ eaires du second ordre Un système linéaire autonome du second ordre ne comporte pas d’entrée et est représentable par un modèle d’état comportant deux états.

x˙ 1 = a11 x1 + a12 x2 x˙ 2 = a12 x2 + a22 x2 que l’on peut représenter matriciellement sous la forme x˙ = Ax avec

A=

a11 a12 a21 a22

Les trajectoires d’un tel systèmes peuvent être représentées dans la plan par des courbes paramétrées par le temps

Fig. 2.2. Figure représentant une trajectoire d’un système linéaire du second ordre

Les trajectoires possibles qui varient en fonction de la valeur numériques des paramètres aij peuvent être regroupées en catégories en fonction de la nature des valeurs propres de la matrice A. Soit λ1 et λ2 les deux valeurs propres obtenues en résolvant | A − λI |= 0. Quatre cas sont ` a distinguer, ainsi les valeurs propres sont :

14


1. toutes deux réelles de même signe. C’est un foyer stable. 2. réelles mais de signe opposé. C’est un point scelle. 3. purement imaginaire. C’est un centre. 4. complexes conjuguées. C’est un foyer. 2.3.1 Solutions num´ eriques Les logiciels d’aide au calcul différentiels qu’ils soient orientés vers le calcul formel (Maple, Mathematica, Reduce) ou vers le calcul numérique (Matlab, SysQuake, LME, Scilab) possèdent un solveur d’équations différentielles ordinaire. Il est alors très aisé d’obtenir les solutions d’un système dynamique planaire en y changeant les conditions initiales d’une simulation à l’autre rendant ainsi la possibilité d’y révéler la nature des orbites sous-jacentes. Dans le cas du système masse ressort précédemment décrit nous pourrions obtenir la représentation donnée ` a la figure suivante :

3

2

1

-3

-2

-1

1

2

3

-1

-2

-3

Fig. 2.3. Trajectoires simulées du système masse-ressort.

2.3.2 Graphe des pentes Autrefois, l’ordinateur faisait défaut et la détermination de solutions ne pouvaient pas procéder par une méthode inductive comme celle de RungeKutta étant donné le nombre d’opérations prohibitif que cela impliquerait. Ainsi il était plus commode de ne calculer qu’un certain nombre de pentes en des points prédéterminés du plan de phase. Les pentes sont obtenues en évaluant f1 (x1 , x2 ) et f2 (x1 , x2 ), puis en représentant un petit segment de droite ayant une dénivelée f2 (x1 , x2 ) sur une distance horizontale f1 (x1 , x2 ) au point (x1 , x2 ). La longueur du segment peut soit être proportionel à la norme de f o` u fixé ` a une longueur unitaire arbitraire. Ironiquement, l’ordinateur


15

est ici aussi d’une grande aide. En prenant une grille equidistribuée selon les deux axes x1 et x2 , on obtient une représentation donnée à la figure 2.4 pour le système masse-ressort. ´T ` x = x1 x2

f (x) =

« „ f1 (x1 , x2 ) f2 (x1 , x2 )

Fig. 2.4. Graphique des éléments de pente pour le système masse-ressort.

2.3.3 Elimination du temps explicitement Lorsque le système dynamique est relativement simple comme c’est le cas du système masse ressort, il est envisageable d’obtenir la solution de manière explicite ` a l’équation différentielle décrivant la dynamique. x(t) = x0 cos t + x˙ 0 sin t x(t) ˙ = −x0 sin t + x˙ 0 cos t Cependant il est nécessaire de se débarasser de la paramétrisation du temps afin de représenter l’orbite. En utilisant l’identitié cos2 t + sin2 t = 1, il est possible d’exprimer la relation x2 + x˙ 2 = x20 + x˙ 20 , qui représente un cercle centré en (0, 0) de rayon

p x20 + x˙ 20 .

2.3.4 Elimination du temps implicitement Remarquons que dans l’exemple précédent le temps est éliminé après l’intégration de l’équation différentielle. Il est tout a fait possible d’en faire l’élimination lorsque celui-ci apparaˆıt encore à l’état de différentielle :

16


dx1 dt dx2 x˙ 2 = −x1 = dt

x˙ 1 = x2 =

dx2 dx1 =− = dt x2 x1 L’intégration se fait alors sans faire intervenir le temps et revêt dans le cas du système masse un caractère plus simple que l’obtention de la solution explicite. Z

x2 dx2 = −

Z

x1 dx1

x21 + x22 = c = x210 + x220 Remarque 2.1. La relation avec le paramétrage temporel est perdue. graphique de x2 + x˙ 2 = x20 + x˙ 20

Fig. 2.5. Graphique associée ` a l’équation x2 + x˙ 2 = 1 = x20 + x˙ 20 .

2.3.5 M´ ethode des isoclines Le méthode du graphique des pentes a procédé par l’évaluation sur une grille donnée a priori et de géométrie arbitraire. Il est intéressant de se demander s’il y a une possibilité de trouver un lieu de points, le long duquel il

x˙


17

serait plus intéressant de calculer les pentes. Par exemple, afin de minimiser le nombre d’évaluation, il serait intéressant de calculer l’ensemble de points auquel le champ de vecteur de la dynamique ait une pente commune. En variant la pente, il est alors possible d’obtenir un ensemble de lieux. f2 (x1 , x2 ) dx2 =α= dx1 f1 (x1 , x2 ) x¨ + x = 0 −x1 α= x2 1 x2 = − x1 α α = 1, x2 = −x1

Fig. 2.6. La méthode des isoclines consiste ` a choisir un élément de pente et de représenter le lieu des points comportant la même pente.

application systématique pour différentes valeurs de α 2.3.6 Exemple : oscillateur de van der Pol x ¨ + ǫ(x2 − 1)x˙ + x = 0 ǫ = 0.5

x0 = x˙ 0 = 1

Graphe des pentes et trajectoires

Droite d’isocline α

x˙

18


Fig. 2.7. Lorsque la méthode des isoclines est utilisée pour représenter les éléments de pentes identiques, ces derniers sont tracés en respectant la symétrie du cercle et donne un aspect plus naturel que lorsqu’une grille uniformément espacée est utilisée.

2

1

-2

-1

1

2

-1

-2

Fig. 2.8. Une trajectoire de l’oscillateur de van der pol est représentée pour la condition intiale x1 (0) = 1 et x2 (0) = 1 et pour la valeur du paramètre ǫ = 0.5.

x ¨ + ǫ(x2 − 1)x˙ + x = 0 α=

x ¨ x = −ǫ(x2 − 1) − x˙ x˙

avec droites d’isoclines

2.4 Cycles limites

19

3

2

1

-3

-2

-1

1

2

3

x0 = x˙ 0 = 1 -1

-2

-3

Fig. 2.9. Superposition du graphe des pentes et d’une trajectoire dans le cas de l’oscillateur de van der Pol (ǫ = 0.5, x10 = 1, x20 = 1).

Fig. 2.10. Méthode des isoclines appliquée ` a l’oscillateur de van der Pol.

2.4 Cycles limites Un cycle limite est une trajectoire fermée solution du système. D´ efinition 2.2. Un système x˙ = f (x) possèdent un cycle limite C s’il existe un interval de temps [t0 ; t0 + T [ et un point de départ x0 ∈ C, tel que en désignant par Φ(t) la solution de système avec pour condition initiale x(t0 ) = x0 = Φ(t0 ) on ait : – Φ(t) ∈ C ∀t ∈ [t0 ; t0 + T [,

20


– Φ(T ) = x0 . 2.4.1 Classification des cycles limites D´ efinition 2.3. Soit C un cycle limite 1. stable : toutes les trajectoires dans un voisinage du cycle → C. 2. instable : toutes les trajectoires divergent de C.

3. semi-stable : certaines trajectoires convergent vers C.

2.5 Index L’index est une propriété topologique des systèmes en rapport avec une région déterminée du plan de phase. Elle est invariante pour des petites perturbations continues du système considéré. Cette propriété permet, entre autres, d’établir des conditions nécessaires pour l’existence de cycles limites. D´ efinition 2.4. (Index en un point du plan de phase). Trois choix sont effectués : 1. Une courbe autour du point auquel l’index est évalué. Cette courbe est choisie de manière arbitraire, mais comprise dans un disque de taille suffisamment petite. Théoriquement, le disque est de taille infinitésimale. 2. Une paramétrisation de la courbe dans le sens trigonométrique positif. 3. Une suite arbitraire de points de la courbe dans le sens de la paramétrisation. Les points sont alors numérotés selon cette progression (xi , i = 1, . . . , n). Le dernier point xn correspond au point initial x1 (x1 = xn ). En chacun des points choisis xi , i = 1, . . . n, le vecteur f (xi ), correspondant au système x˙ = f (x), est évalué. On obtient ainsi une suite de vecteurs fi = f (xi ). numérotés de i = 1 a ` i = n. Les vecteurs sont ensuite reportés sur un autre espace de telle sorte que leurs origines se confondent. L’index mesure alors l’angle modulo 2π que l’extrémité des vecteurs fi parcourent dans le sens trigonométrique positif. L’index est indépendant a ` la fois de la courbe choisie (pour autant quelle soit comprise dans un disque de taille suffisamment petite), des points choisis xi et de leur nombre n.

2.5 Index

Exemple 2.5. Soit un contour et un système tel que :

3

3

4

4

2

2

5

5 6

1

1

6

8

7

8 7

alors l’index vaut : +1. Exemple 2.6. Soit un contour et un système tel que :

3

7 2

8

6

1 4 5

8

5 6

alors l’index vaut : −1.

7

1

4

2 3

21

22


Exemple 2.7. Soit un contour et un système tel que :

5

4

6

3

357 6

2 1

7

248 1

8

alors l’index vaut : 0. 2.5.1 Type de points d’´ equilibre Les points d’équilibre peuvent être classifiés selon leur index. Par exemple, les points d’équilibre rencontrés lors de l’analyse des systèmes linéaires du deuxième ordre peuvent être regroupés en fonction de leur caractéristique exprimée par la position des valeurs propres. Ils peuvent également être classifiés en fonction de leur index. Ceci donne : 1. 2. 3. 4.

point selle (S) index : −1 noeud (N) index : +1 foyer (N) index : +1 centre (N) index : +1

Caractéristique 2.8. Les index sont indépendants de la stabilité. Pour illustrer la validité de cette propriété, il suffit de renverser le sens des vecteurs dans les trois exemples précédents. Il est alors ainsé de vérifier que l’index ne change pas. Le fait de renverser le sens des vecteurs a comme conséquence de changer la stabilité du point d’équilibre lorsque ce dernier est compris dans la courbe de taille infinitésimale. Les considérations de stabilité seront abordés dans le prochain chapitre. Il y sera question d’un traitement rigoureux de la question. 2.5.2 Classification des points d’´ equilibre Il est possible de classifier les points d’équilibre x¯ d’un système non linéaire x˙ = f (x) en fonction du type de point d’équilibre du système linéarisé x˙ = ∂f x x = Ax. Ainsi on parlera d’un ∂x |x=¯

2.5 Index

23

1. point selle (S) 2. noeud (N) 3. foyer (N) 4. centre (N) en fonction des valeurs propres de A conformément à l’étude des systèmes linéaires planaires. 2.5.3 Th´ eor` eme de l’index La définition 2.4 détermine l’index d’un point particulier de l’espace de phase. De manière analogue, il est possible de définir un index pour une courbe quelconque. D´ efinition 2.9. L’index d’une courbe est obtenu de manière analogue a ` celle de l’index d’un point du plan de phase. Seul la restriction a ` une courbe comprise dans un disque de taille suffisamment petite est relaxée. Ainsi, l’index d’une courbe dépend de la courbe choisie contrairement au cas de la défintion 2.4. A l’aide de cette définition, il est possible d’évaluer l’index d’un cycle limite, étant donné que ce dernier est une courbe particulière. Le résultat suivant est important. Th´ eor` eme 2.10. (Th. de l’index de Poincaré) Soit N le nombre de noeuds, centres et de foyers et S le nombre de points selles. Si un cycle limite existe, les points singuliers que le cycle encercle sont tels que N = S + 1. Par contraposition au principe susmentionné, il est possible d’établir la non existence d’un cycle limite en fonction du non respect de la condition de ce théorème. La démonstration découle d’une propriété simple d’addition des index des points d’équilibre compris dans une courbe particulière. Caractéristique 2.11. Soit une courbe particulière donnée. L’index de cette courbe est la somme des index de tous les points d’équilibre compris à l’intérieur de cette courbe. Comme un cycle limite est une solution du système dynamique, les vecteurs y sont en tout point tangent. Il est donc aisé, en reportant ces vecteurs en un point donné d’un nouvel espace, de constater que leur extrêmité parcourt un tour complet dans le sens identique au sens de parcours du cycle. Ainsi, l’index du cycle est +1. Par conséquent, il doit y avoir nécessairement un excès de 1, des points d’équilibre (compris à l’intérieur du cycle) dont l’index est +1 par rapport ` a ceux dont l’index vaut −1, ce qui donne les conditions du théorème 2.10.

24


2.5.4 Th´ eor` eme de Bendixson Soit x˙ 1 = f1 (x1 , x2 ) x˙ 2 = f2 (x1 , x2 ) Th´ eor` eme 2.12. Pour un tel système, aucun cycle limite ne peut exister dans ∂f2 ∂f1 + ∂x ne s’annule pas ni ne une région Ω du plan de phase dans laquelle ∂x 1 2 change de signe. 1 Preuve. C’est une conséquence du théorème de Stokes. En posant dx dt = f1 dx2 et dt = f2 , la différentielle du temps est éliminée pour obtenir l’expression f1 f2 dt = dx = dx , d’o` u l’on déduit que la 1-forme ω = −f1 dx1 + f2 dx2 s’an1 2 nule le long du cycle. D’autre part, le long du cycle, cette même 1-forme ω = −f1 dx1 + f2 dx2 peut être intégrée. Cette intégrale de chemin doit être égale ` a l’intégrale de surface, sur l’aire comprise H Rà Rl’intérieur du cycle, de la différentielle extérieure de cette 1-forme : ω = dω.

0=

I

−f1 dx1 + f2 dx2 = ∂f1 ∂f1 dx1 ∧ dx1 − dx2 ∧ dx1 ∂x1 ∂x2 ∂f2 ∂f2 + dx1 ∧ dx2 + dx2 ∧ dx2 ∂x1 ∂x2 Z Z ∂f2 ∂f1 dx1 ∧ dx2 + = ∂x2 ∂x1 Z Z

−

Par conséquent, le seul moyen d’annuler cette intégrale de surface est (i) que l’intégrant, s’il est non nul, puisse changer de signe a` l’intérieur de la surface ou (ii) que l’intégrant soit nul en tout point. Vérifier que l’intégrant ne s’annule pas et ne change pas de signe garantit donc la non existence d’un cycle limite autour de la surface considérée.

2.6 Impossibilit´ e du chaos planaire Dans le chapitre introductif, un exemple tridimensionel (trois états) a été construit exhibant une trajectoire particulière. Cette trajectoire restait comprise dans un ensemble fermé et borné (un compact représenté par un cube). Elle exhibait de surcroit la particularité de ne jamais passer par le même point. La trajectoire n’était donc pas périodique bien qu’un mouvement d’apparence cyclique y était le théaˆtre. Le prochain théorème démontre, entre autre, l’impossibilité qu’un tel phénomène puisse avoir lieu pour des systèmes dont l’état est de dimension 2.

2.7 Exemple : dynamique de populations

25

2.6.1 Th´ eor` eme de Poincar´ e-Bendixson Système du second ordre uniquement. Th´ eor` eme 2.13. Si une trajectoire demeure dans une région finie Ω alors une des trois propositions suivantes est vraie : 1. La trajectoire va vers un équilibre. 2. La trajectoire tend asymptotiquement vers un cycle limite. 3. La trajectoire est elle même un cycle limite. La démonstration de ce théorème est fort intéressante. On peut la trouver dans [GH83]. Pour l’illustrer de manière ludique, il suffit de prendre une plume et une feuille de papier et de tracer une courbe continue qui ne passe jamais par le même point. On aboutira sans trop de difficultés aux conséquences données par le théorème.

2.7 Exemple : dynamique de populations Pour illustrer les concepts introduits dans ce chapitre, nous présentons deux exemples très simplifiés de dynamique de populations. Nous envisageons a la fois les modèles mathématiques de deux espèces en compétition pour une ` ressource unique, ainsi que la dynamique prédateur-proie, o` u deux espèces distinctes s’affrontent, l’une jouant le rôle de proie, et l’autre celui de prédateur. Les hypothèses simplificatrices suivantes sont adoptées : – La densité de l’espèce, c.-à-d. le nombre d’individus par unité d’aire, est représentée par une variable unique, la différence d’age de sexe et de génotype sont ignorés. – L’effet de surpeuplement affecte le groupe dans son entier. Tous les membres de la population sont touchés de manière similaire. Bien que ceci soit peu probable lorsque les membres se repartissent en sousgroupes, de telle sorte qu’ils ne soient pas uniformément distribués dans tout l’ensemble du territoire considéré, nous faisons néanmoins cette hypothèse. – Les effets des interactions au sein de la même espèce et avec des espèces différentes sont instantanés. Il n’y a pas de délai lors d’action prise par un individu. – Les facteurs abiotiques environnementaux (c.-à-d. l’influence du nonvivant sur le vivant) sont suffisamment constants. – La croissance du taux de la population est dépendante de la densité, même lors de très faibles densités. – Les femelles trouvent toujours à s’accoupler, même lorsque la densité est basse. Ces hypothèses, très simplificatrices, se justifient essentiellement par le fait qu’il y aura nécessairement un effet limitant par le manque de ressources.

26


2.7.1 Comp´ etition Deux populations distinctes sont en compétition pour une même ressource qui se trouve en quantité limitée. s1 désigne la population de la première espèce et x2 celle de la seconde. Un modèle d’évolution différentielle est obtenu en considérant une croissance exponentielle en absence d’effet inhibitif. Deux coefficients positifs a1 et a2 sont introduits pour représenter les taux de croissances instantanés. Les populations agissent alors de manière indépendante. Cependant, les ressources ne sont pas infinies et la présence d’une densité croissante aura tendance ` a inhiber la croissance des populations respectives. Ainsi, nous distinguons les coefficients d’auto-inhibition b11 et b22 (deux quantités positives, crées par la présence d’un compétiteur de même espèce), de ceux des coefficients d’inhibition croisée b12 et b21 (également deux nombres réels positifs mais dus cette fois-ci à la présence d’un compétiteur de l’autre espèce). En conséquence, nous posons comme modèle d’évolution

x˙ 1 = x1 (a1 − b11 x1 − b12 x2 ) x˙ 2 = x2 (a2 − b21 x1 − b22 x2 ). Notons, en résolvant x˙ 1 = x˙ 2 = 0, la présence de plusieurs points d’équilibre. Lorsque b11 b22 − b12 b21 6= 0, il y a quatre points d’équilibre isolés distincts : (i) x¯1 (ii) x¯1 (iii) x¯1 (iv) x¯1

=0 = ba111 12 −a1 b22 = ba112 bb22 −b12 b21 =0

x ¯2 x ¯2 x ¯2 x ¯2

=0 =0 −a2 b11 = ba111 bb21 22 −b12 b21 a2 = b22

Ils correspondent respectivement à (i) l’extinction des deux espèces ; (ii) l’extinction de la seconde espèce au profit de la première ; (iii) la survie des deux espèces en équilibre ; (iv) l’extinction de la première au profit de la seconde. Lorsque b11 b22 −b12 b21 = 0, outre le point d’équilibre à l’origine, la présence d’une droite continue de points d’équilibre est constatée. En effet, en prenant pour valeur numérique a1 = a2 = 2 et b11 = b12 = b21 = b22 = 2, on obtient les deux équations définissant les points d’équilibres 2x1 − x1 x2 − x21 = 0 et 2x2 − x1 x2 − x22 = 0. En soustrayant ces deux équations, l’expression (x2 − x1 )(x2 + x1 − 2) = 0 est obtenue faisant apparaˆıtre la droite x2 = 2 − x1 comme un lieu continu de points d’équilibre. Le système non linéaire x˙ = f (x) peut s’estimer par le premier terme du développement en série de Fourier. Ceci donne x˙ = A(¯ x)(x − x ¯) o` u x¯ désigne le point d’équilibre o` u l’on développe f (x). La matrice A s’écrit


a1 − 2b11 x¯1 − b12 x¯2 −b12 x¯1 A= −b21 x¯2 a2 − b21 x¯1 − 2b22 x¯2

27

(2.2)

et dépend des valeurs x¯1 et x¯2 du point d’équilibre.

Fig. 2.11. Plan de phase et points d’équilibre pour deux population en compétition pour une ressource unique. a1 = a2 = 2 et b11 = b22 = 1. Dans les trois cas, l’origine un foyer instable. A gauche, (i) b12 = b21 = 2. L’inhibition croisée est plus grande que l’auto-inhibition et cel` a conduit une population ` a survivre au détriment de l’autre ; la population survivante dépend des conditions initiales et les densités convergent soit vers (2 0)T ou (0 2)T . Le point d’équilibre central (2/3 2/3)T est un point selle. Au centre, (ii) b12 = b21 = 1. L’inhibition croisée est identique ` a l’auto-inhibition, ce qui conduit les deux populations ` a vivre avec des rapport qui dépendent des conditions initiales. A droite, (iii) b12 = b21 = 21 . L’auto-inhibition est plus grande que l’inhibition croisée, et les deux populations finissent au point d’équilibre ( 43 43 ) pour presque toutes les conditions initiales.

Le plan de phase est représenté à la figure 2.11 pour trois choix de valeurs numériques. Les facteurs de croissance sont fixés à a1 = a2 = 2. Dans le premier cas, les facteurs inhibitifs croisés sont plus importants que les facteurs auto-inhibitifs (b11 = b22 = 1 et b12 = b22 = 2). Le point d’équilibre (0 0)T est localement instable puisque les valeurs propres de la matrice A sont toutes deux égales à +2. Les points d’équilibres (2 0)T et (0 2)T sont des points stables (les valeurs propres sont toutes deux égales a −2). Le point d’équilibre ( 32 23 )T est un point selle dont une des valeurs ` propres vaut −2 et l’autre + 32 . Ainsi, trois points d’équilibre d’index +1 et un d’index −1 sont obtenus, pour donner un index global de +2. L’index global s’obtient en considérant une courbe fermée quelconque englobant tous les points d’équilibre. Dans le second cas, lorsque l’auto-inhibition est identique à l’inhibition croisée, on constate une vie mutuelle des deux espèces et une convergence vers des points d’équilibre qui dépend des conditions initiales. Dans le troisième cas, c.-à-d. lorsque l’inhibition croisée est moins forte que l’auto-inhibition, il y a également une survie mutuelle des deux espèces,

28


mais toujours avec la même densité. Le point d’équilibre ( 43 43 )T est stable avec pour valeur propre de la matrice A, −2 et − 32 . Le point d’équilibre (0 0)T est instable (les valeurs propres de A sont toutes deux égales à +2). Les deux points d’équilibres restants (0 2)T et (2 0)T sont des points selles avec comme valeurs propres −2 et +1. Il est intéressant de constater que le passage de l’index global +2 à celui de 0 c’est fait par l’intermédiaire de l’apparition d’un lieu continu de points d’équilibre. On constate également qu’il n’y a pas de cycle limite. 2.7.2 Pr´ edateur-proie Dans ce modèle, x1 représente la densité de population des proies, et x2 celle des prédateurs. L’équation de l’évolution de x1 est identique au cas des populations en compétition de la section précédente. En effet, les proies croissent de manière exponentielle en l’absence de prédateur (coefficient a1 positif). Leur croissance est limitée par les ressources (effet auto-inhibitif, b11 ) et par la présence de prédateurs (effet d’inhibition croisé, b12 ). Par contre, l’évolution des prédateurs x2 est foncièrement différente. En l’absence de proie, les prédateurs disparaissent progressivement de manière exponentielle, et le signe devant le coeffcient a2 est cette fois-ci négatif. De plus, la présence des proies n’a pas un effet inhibitif, mais bien au contraire, un effet de croissance : le signe devant le facteur b21 est positif. Il n’y a pas d’effet auto-inhibitif ce qui implique l’annulation du coefficient b22 = 0. Sous ses hypothèses, les deux équations différentielles qui gouvernent l’évolution des populations sont : x˙ 1 = x1 (a1 − b11 x1 − b12 x2 ) x˙ 2 = x2 (−a2 + b21 x1 ) Ce système comporte trois points d’équilibre : (i) x ¯1 = 0 (ii) x ¯1 = ba111 (iii) x ¯1 = ba212

x ¯2 = 0 x ¯2 = 0 2 b11 x ¯2 = a1 bb2112−a b21

Le premier point d’équilibre est l’extinction mutuelle des deux espèces. Le second correspond uniquement à la survie des proies ; il y a absence de prédateurs. Le troisième correspond à une survie mutuelle. Lorsque a1 b21 < a2 b11 , les prédateurs meurent par manque de facteur de reproduction des proies (coefficient a1 ) par rapport au besoin de nourriture des prédateur (coefficient a2 ). La condition de survie mutuelle pondère les


29

deux facteurs a1 et a2 par la qualité de satisfaction énergétique de la proie pour un prédateur b21 et du taux d’auto-inhibition des proies b11 . En effet, l’auto-inhibition des proies rend la reproduction et la survie des prédateurs difficiles. La figure 2.12 représente le plan de phase pour les valeurs numériques a1 = a2 = b21 = 2,

b11 = b12 = 1.

Deux courbes solution de l’équation différentielle sont également représentées, une pour la condition initiale x1 (0) = x2 (0) = 0.2 et une autre pour la condition initiale x1 (0) = 1.7 et x2 (0) = 1.4. On constate que dans les deux cas, la solution correspondante converge vers le point d’équilibre de survie mutuelle x ¯1 = x¯2 = 1. Pour la première courbe, la densité des prédateurs commence légèrement a diminuer puis demeure relativement modeste à cause du faible nombre de ` proies disponibles. Toutefois, ces dernières se reproduisent en présence de la faible densité des prédateurs. Lorsqu’une taille critique est atteinte, à partir de laquelle les prédateurs peuvent mieux se développer, la tendance s’inverse, et les prédateurs augmentent au détriment des proies. De manière générale, le taux de prédateurs par rapport a` celui des proies oscille jusqu’` a atteindre l’équilibre de survie mutuelle.

Fig. 2.12. Plan de phase et points d’équilibre pour le modèle prédateur-proie. La variable x1 représente la densité des proies (axe horizontal) et la variable x2 représente la densité des prédateurs (axe vertical). Les valeurs numériques choisies sont a1 = a2 = 2 = b21 = 2 et b11 = b12 = 1. Deux trajectoires sont également représentées pour x1 (0) = x2 (0) = 0.2 et pour x1 (0) = 1.7, x2 (0) = 1.4. Trois points d’équilibre sont constatés : (i) l’origine x ¯1 = x ¯2 = 0 (en bas, ` a gauche), (ii) la survie des proies et l’extinction des prédateurs x ¯1 = 2, x ¯2 = 0 (en bas, ` a droite), et finalement (iii) la survie mutuelle x ¯1 = x ¯2 = 1 (au centre).

30


Exercice 2.1. Saturation et syst` eme lin´ eaire. Soit le système linéaire x˙ 1 = x1 + u x˙ 2 = −x2 + u avec u = sat(v), o` u  1 sat v v  −1

v>1 −1 ≤ v ≤ 1. v < −1

(2.3)

On applique également un bouclage stabilisant v = −k1 x1 − k2 x2 . (i) Choisir les gains afin d’avoir deux pˆ ole en −1 et −1 dans la partie linéaire. (ii) Trouver tous les points d’équilibre. (iii) Dessiner le plan de phase avec le champ de vecteur associé. Tracer plusieurs trajectoires pour différentes conditions initiales (il faut simuler les équations différentielles). (iv) Déterminer la nature du bassin d’attraction en simulant le système en temps rétrograde, i.e. x˙ 1 = −x1 − u et x˙ 2 = +x2 − u, la commande u demeurant identique. Il faut prendre plusieurs conditions initiales réparties sur un petit cercle centré sur l’origine. (v) Répéter l’opération en (iv) en changeant la position des pˆ oles, en les ralentissant (p. ex − 21 et − 21 ) et en les rendant plus rapides (p. ex. −2 et −2). (vi) Est-ce que la position des points d’équilibre joue-t-il un rôle ?

3 M´ ethode du premier harmonique

Dans les deux précédents chapitres, un système était donné par un ensemble d’équations différentielles ordinaires de la forme x˙ = f (x). Certaines de ses caractéristiques comme la présence de plusieurs points d’équilibre, l’existence de cycles limites ou d’orbites chaotiques ont été présentées, ainsi que des critères permettant de déterminer de telles propriétés (théorème de l’index, critère de Poincaré-Bendixson, etc.). Toutefois, la notion de système en boucle fermée n’a pas été mentionnée de manière explicite. En effet, x˙ = f (x) pouvait à la fois représenter un système en tant que tel, ou provenir de l’association en boucle fermée de deux systèmes interconnectés entre eux. Par exemple, w˙ = g1 (w, u) et z˙ = g2 (z) avec dim u = dim z donnent lieu lorsque u = z à un système x˙ = f (x) avec T x = wT z T . Nous allons rendre ainsi la présence d’une telle configuration en boucle fermée plus explicite dans le cours du présent chapitre. L’objectif étant d’exposer une méthode d’analyse approximative d’une classe relativement restreinte de systèmes, mais apparaissant très fréquemment en pratique. Il s’agit de la combinaison en rétroaction d’un système linéaire ayant une seule entrée et une seule sortie, bouclé par un élément non linéaire. Ce dernier élément ne possède pas de dynamique et correspond à une fonction statique arbitraire. L’importance de cette classe de système provient du fait, qu’en pratique, beaucoup de systèmes possèdent des imprfections qui ne disparaissent pas après linéarisation locale. De telles imperfections proviennent par exemple d’une zone morte pour certains systèmes mécaniques, d’hystérèse pour les piézoélectriques et les matériaux magnétiques, ainsi que la saturation pour presque tous les types d’actioneurs. En effet, on ne peut pas à proprement parler éliminer un jeu dans un engrenage, si ce n’est recourir à le changer ou à le réparer. Tout au plus, nous

32

3 Méthode du premier harmonique

pouvons espérer compenser son effet néfaste par la manière dont le système comportant cet élément est commandé. De plus, de tels phénomènes ont la particularité de pouvoir se séparer entre un effet non-linéaire purement statique (le jeu et la saturation, par exemple, font intervernir leur effet de manière instantanée sans phénomène de mémoire) et un effet dynamique propre au système dans son ensemble (par exemple, les inerties et les frottements d’un réducteur comportant le jeu susmentionné constituent alors la partie linéaire du modèle du système). Ainsi, bien que la majeure partie du système se comporte de manière linéaire, il peut y avoir une non-linéarité statique qui subsiste. Celle-ci peut être isolée du reste du comportement linéaire pour aboutir au schéma que l’on va analyser. L’objectif de cette analyse est de détecter et caractériser la présence d’éventuels cycles limites. Il s’agit de déterminer à la fois la propriété de se maintenir après une légère perturbation (stabilité) et de trouver les paramètres représentatifs tels que l’amplitude et la fréquence du cycle limite.

3.1 Syst` eme lin´ eaire et non-lin´ earit´ e statique Considérons la mise en série, en boucle ouverte, d’un premier bloc, dont le comportement est non-linéaire, et d’une simple fonction de transfert qui constitue le second bloc (Figure 3.1). Chacun des blocs comporte une entrée unique et une sortie unique. L’entrée de la non-linéarité est notée u et sa sortie y. L’entrée de la fonction de tranfert est alors y (attention ` a ne pas confondre avec u) et sa sortie est z. Il est important d’insister sur cette convention.

u

N.L.

y

G(s)

z

Fig. 3.1. Association d’un bloc non-linéaire statique N.L. et d’une fonction de transfert G(s).

La non-linéarité du premier bloc est clairement séparée du comportement linéaire de la fonction de transfert. La contre-réaction du second bloc sur le premier est momentanément absente. Nous étudierons les conséquences de la boucle fermée (u = −z) ultérieurement.

3.1 Système linéaire et non-linéarité statique

33

De plus, nous ne considérerons qu’une relation non-linéaire statique du premier bloc. Ainsi, ` a chaque instant t, la sortie y(t) est une simple fonction de son entrée u(t), c.-à-d. y(t) = φ(u(t)). Il y a donc absence d’état pour le comportement du premier bloc. Les états ne sont nécessaires que pour réaliser la fonction de transfert. 3.1.1 Excitation sinuso¨ıdale en boucle ouverte Pour illustrer le principe, une saturation constituera le premier bloc. La combinaison en série des deux blocs est soumise à une excitation sinuso¨ıdale d’amplitude A et de pulsation ω : u(t) = A sin(ωt) La saturation est décrite par la fonction  u(t) > a  ka ˆ −a ≤ u(t) ≤ a φ(u(t)) = ku(t)  −ka u(t) < −a

(3.1)

(3.2)

o` u k définit le gain de la partie non-saturée et le paramètre a correspond à la valeur d’entrée ` a partir de laquelle la saturation est active. La figure 3.2 illustre le phénomène pour un choix particulier des paramètres. u(t)

y(t)

4

4

2

2

0

0

-2

-2

-4

-4

Fig. 3.2. Représentation graphique de l’entrée u(t) et de la sortie y(t) de la saturation pour les valeurs A = 2, ω = 5, k = 2 et a = 1.

3.1.2 Caract´ eristique passe-bas du syst` eme lin´ eaire G(s) En examinant la figure 3.2, nous constatons que le signal sinuso¨ıdal est fortement transformé par la saturation. Il ne correspond plus à une courbe

34


lisse et de même nature que la sinuso¨ıde de départ. Il n’est pas possible de superposer une seule sinuso¨ıde, même lorsque celle-ci est déphasée et amoidrie de facteurs appropriés. Par contre, le constat peut être différent à la sortie du système G(s), puisque ce dernier agit comme un filtre supplémentaire. Par exemple, considérons un système G(s) du second ordre avec un paramètre b unique permettant de déterminer sa bande passante. Son gain statique est fixé égal ` a l’unité. Le paramètre b correspond à la valeur réelle o` u se trouve la paire de pˆ oles sur l’axe réel négatif.

G(s) =

b2 s2 + 2bs + b2

(3.3)

Le système est stable pour autant que b soit strictement positif. Un gand b détermine un système rapide qui filtre peu, et un petit b correspond à un système de nature passe-bas qui filtre les hautes fréquences. La figure 3.3 illustre le résultat du filtrage lorsque b = 3 et b = 30. z(t)

z(t)

4

4

2

2

0

0

-2

-2

-4

-4

Fig. 3.3. Représentation graphique de la sortie du système linéaire lorsque A = 2, ω = 5, k = 2 et a = 1 pour deux valeurs du paramètre b de la fonction de transfert (3.3). A gauche b = 3 et ` a droitre b = 30.

Dans les deux cas, un régime transitoire est constaté. Celui-ci découle du fait que les conditions initiales de G(s) ne sont pas compatibles avec le régime forcé que tend ` a imposer l’entrée u(t). Ce régime transitoire disparaˆıt rapidement pour laisser place à un régime forcé de nature différente en fonction de la valeur de b. Lorsque le système filtre peu (b = 30), le signal z(t) est très proche de la sortie de la non-linéarité y(t). Par contre, en examinant le premier résultat (b = 3), l’effet conjoint de la saturation φˆ et du système linéaire G(s) revient simplement ` a déphaser et ` a atténuer la sinuso¨ıde d’origine, un peu comme le ferait un système linéaire. La non-linéarité a en quelque sorte disparu, ou

3.1 Système linéaire et non-linéarité statique

35

de manière plus rigoureuse, elle a été englobée pour constituer avec G(s) une sorte de nouvelle fonction de transfert. 3.1.3 Gain complexe ´ equivalent Pardoxalement, nous avions initialement clairement séparé le comportement non linéaire du comportement linéaire, et voilà que le dernier résultat de la section précédente revient à simplement déphaser et amoindrir le signal d’origine. Le comportement global de la mise en série des deux éléments montre qu’il est peu commode de le séparer en une partie purement non-linéaire caractérisable et une partie linéaire. En effet, il n’est pas aisé en examinant le signal z(t) (b = 3) de détecter la présence d’une saturation. Cependant, il est possible de substituer à la non-linéarité, un nombre complexe N , permettant de caractériser celle-ci sans perdre trop de qualité dans la réponse z(t). Ceci est rendu possible par la nature passe-bas du système linéaire. Clairement, z(t) pour b = 30 ne permet pas une telle simplification. En conséquence, lorsque le système linéaire possède des propriétés passe-bas marquées, le schéma de la figure 3.1 peut être remplacé par l’approximation représentée ` a la figure 3.4.

u

N

y

G(s)

z

Fig. 3.4. La non-linéarité statique N.L. est remplacée par un gain équivalent complexe N .

Pour déterminer le gain N , nous procédons par essais/erreurs et il est relativement aisé de trouver la sinuso¨ıde 0.329A sin(ωt − 2.00) qui se superpose très bien avec le signal z(t). Ceci est représenté à la figure 3.5. Cette détermination repose sur le caractère du régime permanent sinuso¨ıdal. Le signal d’excitation est multiplié par N puis par G(jω) avec ω = 5. Pour déterminer N , il suffit donc de diviser la représentation fréquentielle de la sortie par G(j5) et ensuite de comparer le résultat avec le signal d’entrée. Une manière similaire de procéder est de déphaser et d’amplifier les signaux

36

3 Méthode du premier harmonique z(t) 4 2 0 -2 -4

Fig. 3.5. Représentation graphique de la sortie du système linéaire lorsque A = 2, ω = 5, k = 2, a = 1 et b = 3. Une sinuso¨ıde 0.329A sin(ωt − 2.00) y est superposée.

temporels par respectivement la phase et l’amplitude des nombre complexes correspondants. On déduit sans peine que N ≈ 1.2. C’est un nombre purement réel. Le déphasage est donc causé exclusivement par G(j5) = 9(30j − 14)−1 . Il est important ` a ce stade d’insister sur le fait que le gain N dépend en général de l’amplitude et de la pulsation ω du signal d’entrée. C’est là que réside la différence essentielle entre un comportement purement linéaire (représentable par une fonction de transfert à part entière) et l’approximation de la non-linéarité par un gain équivalent N . En prenant une autre amplitude pour le signal d’entrée, nous aurions trouvé une autre valeur pour le gain N . C’est la raison pour laquelle il est noté soit N (A) ou N (A, ω), selon son type de dépendance. Ceci n’est pas surprenant pour la saturation par exemple, car lorsque l’amplitude du signal est faible, de telle sorte que la saturation n’est pas active, le signal de sortie est amplifié par le gain k de la saturation. Par contre, lorsque le signal est très grand, il est fortement limité par la saturation, et le gain équivalent peut devenir bien inférieur à l’unité. Il faut également faire attention à ne pas confondre le paramètre d’amplitude A et la valeur instantanée u(t) du signal à l’entrée de l’élément approximé par N (A). Ce sont deux choses différentes. L’amplitude A correspond à la valeur maximale d’une sinuso¨ıde unique pouvant être appliquée à l’entrée de la non-linéarité, auquel cas cette même entrée sera amplifiée d’un facteur N (A) o` u A est l’amplitude fixe de la sinuso¨ıde A sin(ωt). Ce n’est pas la valeur de A sin(ωt) ` a un instant t donné. C’est la raison pour laquelle lorsque le signal n’est pas proche d’une sinuso¨ıde unique (de pulsation ω), il est difficile de donner une interprétation ` a A, et de surcroit à N (A).

3.2 Premier harmonique

37

3.2 Premier harmonique Il est fastidieux de déterminer le nombre complexe N en fonction des deux paramètres A et ω par une succession de simulations du type que nous avons exposé ` a la section précédente. Il est plus efficace de trouver une expression analytique du gain équivalent N (A, ω). 3.2.1 D´ ecomposition en harmoniques Comme la non-linéarité est dépourvue de dynamique, lorsque le signal u(t) = A sin(ωt) est appliqué ` a l’entrée de la non-linéarité statique φ, le signal à la sortie de la non-linarité y(t) est périodique et de même période T = 2π ω que le signal d’entrée. Ceci implique que le signal de sortie y(t) puisse être décomposé en série de Fourier : y(t) =

∞

a0 X + [al cos(lωt) + bl sin(lωt)] 2

(3.4)

l=1

Z 1 π y(t)d(ωt) π −π Z 1 π y(t) cos(lωt)d(ωt) al = π −π Z 1 π y(t) sin(lωt)d(ωt) bl = π −π

a0 =

(3.5) (3.6) (3.7)

La série (3.4) donne une décomposition exacte de y(t). Les coeffcients a0 , al , bl , (l = 1, . . . , ∞) caractérisent alors le type de non-linéarité φ. Le seul incovénient de cette décomposition (et non le moindre) est qu’il nécessite une infinité d’évaluations d’intégrales le long d’une période. En effet, les coefficients al et bl doivent être déterminés d’une manière ou d’une autre en utilisant les définitions (3.6) et (3.7). Il est important d’insister à nouveau sur le fait que chaque coefficient a0 , al et bl dépend de l’amplitude A et de la pulsation ω. Formellement, on devrait écrire a0 (A, ω), al (A, ω) et bl (A, ω), les intégrales (3.5), (3.6) et (3.7) conduisant alors ` a une formule respective. Nous n’insisterons pas sur cette précision de notation, sauf lorsque cela est vraiement indispensable. 3.2.2 Equivalent du premier harmonique Bien que tous les termes de la série soient nécessaires pour représenter exactement la sortie y(t), ceux associés aux hautes harmoniques n’ont pas

38


beucoup d’impact sur la sortie z(t) de la fonction de transfert G(s), étant donné le caractère passe-bas de cette dernière. Il est par conséquent possible de tronquer la série et de ne retenir que quelques termes. Puisque a0 , a1 et b1 sont suffisants pour définir un nombre complexe, nous retenons de la série (3.4) que le terme constant et ceux associés à la fondamentale. Ceci constitue l’approximation du premier harmonique cherchée et permet de déterminer le gain équivalent N . En effet, en approximant y(t) ≈ a0 + a1 cos(ωt) + b1 sin(ωt) = a0 + M sin(ωt + α), l’amplitude M et la phase α s’obtiennent à partir des coefficient a1 et b1 par q M = a21 + b21 α(A, ω) = arctan(a1 /b1 ).

Ainsi, lorsque la non-linéarité est parfaitement symétrique, a0 = 0, et le gain équivalent s’exprime comme N (A, ω) = M

M jα 1 ejωt+α = e = (b1 + ja1 ). jωt Ae A A

(3.8)

3.2.3 Calcul de l’´ equivalent du premier harmonique Certes, la troncation de la série de Fourier fournit une manière élégante d’exprimer le gain équivalent à partir des paramètres a0 , a1 et b1 (formule (3.8) dans le cas symétrique). Il reste toutefois à determiner une procédure de calcul permettant d’évaluer les intégrales Z 1 π y(t)d(ωt) (3.9) a0 = π −π Z 1 π a1 = y(t) cos(ωt)d(ωt) (3.10) π −π Z 1 π y(t) sin(ωt)d(ωt), (3.11) b1 = π −π ` partir desquelles seront issues les formules explicites des deux paramètres A a et ω. Deux méthodes sont présentées ci-après pour une telle évaluation. La première est un calcul analytique et la seconde repose sur des techniques numériques. Intégration analytique La méthode la plus directe consiste à calculer analytiquement les intégrales exprimant les coefficients a0 , a1 et b1 .


39

Le cas de la saturation est traité dans son intégralité. Nous donnerons à la section suivante d’autres types de non-linéarités avec les gains équivalents respectifs. En reprenant l’expression φˆ de la saturation (3.2), la sortie y(t) est exprimée en fonction de l’entrée u(t) = A sin(ωt). Cependant, une différence fondamentale entre le cas o` u l’amplitude A est inférieure à a (absence de saturation), et lorsque celle-ci est supérieure à a, existe. Lorsque A > a, la sortie se décompose en une partie non saturée et en une partie saturée. En ne considérant qu’un quart de période (0 ≤ ωt ≤ π2 , les autres quarts se déduisant par symétrie), nous pouvons exprimer A≤a

y(t) = kA sin(ωt)

A>a

y(t) =

kA sin ωt 0 ≤ ωt ≤ γ ka γ < ωt ≤ π2

γ = arcsin(a/A)

o` u γ est une variable temporaire définissant l’angle à partir duquel la saturation commence ` a faire son effet. ˆ ˆ Etant donné que Rla saturation est symétrique, c.-à-d. φ(−u) = φ(u), on 1 π déduit que a0 = π −π y(t)d(ωt) = 0 (absence de composante continue). D’autre part, et également par raison de symétrie, la première demi-période compense la seconde dans (3.10) de telle sorte que a1 = 0. Par contre, b1 est différent de zéro, et seul le deuxième cas A > a, nécessite une attention particulière. Sur un quart de période, l’identité " # r Z Z π2 a2 a 1 kA 1 γ 2 γ+ A sin (ωt)dωt + ka sin(ωt)dωt = 1− 2 π 0 π γ 2π A A est valable et, après multiplication par quatre (pour tenir compte de la symétrie des quarts de périodes mentionnée précédemment), on déduit le gain équivalent  k A≤a q N (A) = 2k . a a a2 A>a +A 1− A  π arcsin A 2

En reportant les valeurs numériques A = 2, k = 2 et a = 1, nous obtenons N (A) = 1.218, justifiant ainsi, par des moyens analytiques, les résultats empiriques de la section 3.1. De plus, en représentant le gain équivalent sous forme graphique à la figure 3.6, la constation de la fin de cette section, à savoir la diminution du gain équivalent lorsque l’amplitude du signal d’entrée augmente, est également confirmée.

40

3 Méthode du premier harmonique 2

1.5

1

0.5

k = 2, a = 1

5

10

15

20

25

30

A a

Fig. 3.6. Gain équivalent purement réel de la saturation. Il diminue en fonction de l’amplitude.

Intégration numérique Les trois intégrales (3.5), (3.10) et (3.11) peuvent être évaluées après discrétisation du signal temporel y(t) de t = − ωπ à t = ωπ en une suite finie de n points y( ω1 (−π + 2π nk )), k = 0 . . . n − 1. Afin de simplifier la notation, nous introduisons 1 k yk = y( (−π + 2π )). ω n Ceci permet d’approximer les coefficients a0 , a1 et b1 par a0 ≈ a ˆ0,n =

n−1 2X yk n

a1 ≈ a ˆ1,n =

2 n

b1 ≈ ˆb1,n =

2 n

k=0 n−1 X

k=0 n−1 X k=0

(3.12)

k yk cos(−π + 2π ) n

(3.13)

k yk sin(−π + 2π ) n

(3.14)

et nous avons une convergence de a ˆ0,n , a ˆ1,n et ˆb1,n vers respectivement a0 , a1 et b1 lorsque n → ∞. Comme a ˆ0,n est une moyenne, elle ne nécessite qu’une seule multiplication et n − 1 additions. Par contre, le coˆ ut en multiplications est important pour a ˆ1,n et ˆb1,n . En écrivant n−1 k 2j X ˆ = 1 j(ˆ N a1,n − jˆb1,n ) = − yk e−j2π n A An

(3.15)

k=0

nous constatons qu’une seule série complexe finie est nécessaire. Cette propriété peut donc être exploitée pour réduire le nombre d’opération. De plus, ˆ est une approximation du gain équivalent N qui s’obl’expresssion de N tient par tranformée Fourier discrète du signal échantillonné y( ω1 (−π + 2π nk )), k = 0 . . . n − 1.


41

En effet, (3.15) exprime l’approximation du gain équivalent par le premier 2j . Notons que terme de la transformée de Fourier discrète multiplié par − An cette transformée peut être obtenue par un algorithme de transformation de Fourier rapide en choisissant un nombre de points d’échantillonnage égal à une puissance entière de 2, c.-à-d. n = 2m avec m ∈ N. Cependant, un tel algorithme fournit trop d’information étant donné que les harmoniques supérieures sont simplement ignorées. Il est néanmoins possible de réduire substantiellement le nombre de multiplications apparaissant dans (3.13) et (3.14) en utilisant les symétries des points complexes k e−j2π n . Le concept est d’abord présenté en considérant le cas particulier d’un échantillonnage de 8 = 23 points. La formule (3.15) devient 1

2

3

ˆ = y0 + y1 e−j2π 8 + y2 e−j2π 8 + y3 e−j3π 8 j4N 5 6 7 4 +y4 e−j2π 8 + y5 e−j2π 8 + y6 e−j2π 8 + y7 e−j2π 8

(3.16)

En utilisant le fait que pour chaque point complexe e−jα , il existe un point complexe e−jα−jπ de signe contraire, nous pouvons regrouper des termes de telle sorte que le membre de droite de (3.16) s’écrit π

π

(y0 − y4 ) + (y1 − y5 )e−j 4 + (y2 − y6 )e−j 2 + (y3 − y7 )e−j

3π 4

.

(3.17)

Le nombre de multiplications est ainsi réduit d’un facteur de deux. En utilisant π le symétrie d’un quart de tour (−j = e−j 2 ), (3.17) devient π

(y0 − y4 ) − j(y2 − y6 ) + [(y1 − y5 ) − j(y3 − y7 )]e−j 4 .

(3.18)

En recourant, d’une part ` a l’isomorphisme (noté ∼ =) des nombres complexes T ∼ avec les points d’un plan a + jb = a b , ainsi qu’à la propriété que √ cos − π4 = sin − π4 = − 22 , l’expression (3.18) prend la forme √ 2 1 −1 y1 − y5 y0 − y4 , − y3 − y7 y2 − y6 2 1 1

(3.19)

et nous avons grandement simplifié le résultat par rapport aux formules brutes ˆ = 1 (ˆb1,8 + a ˆ1,8 et ˆb1,8 données par (3.13) et (3.14) (n = 8) à partir desquel N A jˆ a2,8 ) était directement exprimable. Etant donné que la méthode présentée est une méthode approximative, il est également possible d’estimer √ 2 5 ≈ 2 7 avec une erreur de 7.17 10−3 . 2π En général, la matrice de rotation correspondant à e−j n ne peut pas se mettre sous une forme aussi élégante qu’en (3.19), mais la première partie des simplifications est applicable. Par conséquent, à partir de (3.15), nous avons

42

3 Méthode du premier harmonique n/2−1 2j X k ˆ N =− (yk − yk+ n2 )e−j2π n An k=0

=

2 An

n/4−1

X

k=0

k (yk − yk+ n2 + y n2 −k − yn−k ) sin(2π ) n

n/4−1 k 2j X (yk − yk+ n2 − y n2 −k + yn−k ) cos(2π ), − An n k=0

et le nombre de multiplications est réduit d’un facteur quatre. De plus, le nombre d’évaluations des sinus et consinus peut encore être diminué de moitié afin d’utiliser uniquement sin(2π nk ) et cos(2π nk ) pour k = 1, . . . , n4 − 1. Il suffit de recourir aux deux propriétés cos(α) = sin( π2 − α) et sin(α) = cos( π2 − α) valables pour 0 > α > π2 . Cependant le nombre de multiplications, en tant que tel, ne peut pas être réduit d’avantage en utilisant les symétries du cercle unité qui conservent l’axe des ordonnées et l’axe des abscisses. Mis ` a part le gain en nombre d’opérations, le résultat précédent montre que les échantillons sont redondants en ce qui concerne leur impact sur le prermier harmonique. Certains situés loin les uns des autres se regroupent en classe d’équivalence selon leur apparition devant la fonction de base sin(2π nk ) ou cos(2π nk ), k = 0, . . . , n4 − 1.

3.3 Non-lin´ earit´ es communes Dans cette section, nous présentons les résultats du calcul analytique de quatres non-linéarités communes. Ces résultats sont présentés sous forme condensée, car ils s’obtiennent aisément à partir de la saturation. En effet, par sommation entre une saturation et un gain dont les signes et les valeurs sont convenablement choisis, toutes les non-linéarités de cette section sont exprimables. Nous reportons, pour commencer, les résultats associés à la saturation, par soucis de complétude.

3.3 Non-linéarités communes

43

3.3.1 Saturation La saturation correspond à une modélisation de la limitation de beaucoup d’actionneur. Tant que l’actionneur opère dans sa plage de fonctionnement, sa sortie y(t) est proportionnelle à la valeur désirée de sa sortie u(t), c.-àd. y(t) = ku(t). Par contre, si la valeur désirée est irréalisable (u(t) > a par exemple), l’actionneur ne peut que fournir le maximum possible (u(t) = ka) et il n’y a plus de proportionnalité entre la grandeur désirée et la sortie effective. Symbole et fonction φ

ˆ φ(u(t)) =

Gain équivalent N (A)

Graphique

 k N (A) = 2k  π arcsin

 

ka ku(t)  −ka

a

A

u(t) > a −a ≤ u(t) ≤ a u(t) < −a

q a +A 1−

a2 A2

(3.20)

A≤a A>a

2

1.5

1

0.5

k = 2, a = 1

5

10

15

20

25

30

A a

Fig. 3.7. Gain équivalent purement réel de la saturation. Il diminue en fonction de l’amplitude.

44


3.3.2 Zone morte La zone morte correspond à la perte de transmission entre la grandeur d’entrée u(t) et celle de la sortie y(t) pour des valeurs proches de zéro. Ainsi, tant que la grandeur désirée n’a pas atteint un seuil δ, la grandeur de sortie y(t) est nulle. Dès que la grandeur d’entrée dépasse ce seuil, la sortie correspond a la différence entre l’entrée et le seuil multiplié par un gain k. ` Symbole et fonction φ La fonction φ correspondant à la zone morte est notée φˇ :

Gain équivalent

  k(u(t) − δ) ˇ 0 φ(u(t)) =  −k(u(t) + δ)

u(t) > δ −δ ≤ u(t) ≤ δ u(t) < −δ

(3.21)

Pour obtenir le gain équivalent de la zone morte, il suffit de remarquer que celle-ci peut se fabriquer très facilement à partir d’une saturation. En effet, en posant a = δ et en désignant la fonction de la saturation par φˆ et celle de la ˇ un montage sommateur entre un gain k et l’opposé d’une zone morte par φ, ˆ et ainsi saturation donne la zone morte, autrement dit φˇ = k − φ,  0 A≤δ q N (A) = 2k π δ2 δ δ  π 2 − arcsin( A ) − A 1 − A2 A > δ Réciproquement, il est facile de construire une saturation à partir d’une ˇ zone morte, car une fois posé δ = a, la saturation s’exprime comme φˆ = k − φ. Graphique

1.5

1

0.5

k = 2, δ = 1

2

4

6

8

10

12

14

A

Fig. 3.8. Gain équivalent purement réel de la zone morte. Il augmente en fonction de l’amplitude.

3.3 Non-linéarités communes

45

3.3.3 Relais Le relais correspond ` a la commutation tout ou rien en fonction du signe de la valeur d’entrée. Lorsque celle-ci est positive, la sortie du relais prend la valeur fixe +M . Elle prend la valeur contraire pour des valeurs négatives de l’entrée. Symbole et fonction φ ¯ Nous noterons la fonction φ associée au relais par φ.   +M ¯ 0 φ(u(t)) =  −M

u(t) > 0 u(t) = 0 u(t) < 0

(3.22)

Gain équivalent N (A) Pour calculer le gain équivalent, il suffit de remarquer que la fonction φ¯ ˆ en posant k = a , et en peut être exprimer ` a partir de celle la saturation φ, M passant ` a la limite lima→0 . Ainsi ˆ k = a , u(t)), ¯ φ(u(t)) = lim φ(a, a→0 M et donc en utilisant le fait que sin(x) = x+o(x) (c.-à-d. arcsin(x) = 1/x+o(x)) N (A) =

4M πA

3.3.4 Hyst´ er` ese L’hystérèse peut modéliser une transmission comportant deux engrenages. Lorsqu’un premier engrenage commence à tourner, durant un angle de δ, il n’y a pas d’effet sur la rotation du second engrenage. Un fois cet angle parcouru, le seond engrenage commence à tourner et il tourne alors d’un angle correspondant ` a celui du premier. Lorsque le mouvement est inversé, il est nécessaire au premier engrenage de parcourir un différence d’angle de 2δ dans le sens inverse sans qu’il y ait d’effet sur le second engrenage. Ce dernier commence alors ` a tourner dans le sens contraire.

46


a1 =

4kb b ( − 1) π A

 s 2 2b 2b 2b Ak  π − arcsin −1 − −1 −1  1− b1 = π 2 A A A q 1 kN (A)k = a21 + b21 A a1 arg(N (A)) = arctan b1 3.3.5 Non-lin´ earit´ es sym´ etriques, continues par morceaux Nous avons vu que la saturation permet de synthétiser une zone morte et un relais. En outre, comme nous allons le voir dans cette section, elle peut également fabriquer un ensemble très grand de non-linéarités statiques. Nous allons montrer comment, à partir de zones mortes (et donc à l’aide de saturations), il est possible de constituer n’importe quelle non-linéarité statique symétrique constante par morceaux, par simple principe de superposition (c.-` a-d. en utilisant des sommes et des multiplications par des gains constants). La figure 3.9 illustre le principe. φ(u)

φˇ4

40

20

φˇ2 0

φˇ1

-20

φˇ3 -40 -10

10

u

Fig. 3.9. Le trait en solide représente une non-linéarité statique symétrique, et continue par morceaux. Elle est égale ` a la somme des quatres zones mortes φˇ1 , φˇ2 , φˇ3 , et φˇ4 , avec δ1 < δ2 < δ3 < δ4 . Les zones mortes sont représentées en traits hachurés. La non-linéarité peut donc s’exprimer comme une combinaison de saturations φî avec des paramètres ai et ki judicieusements choisis.

Comme la non-linéarité est symétrique, il suffit de considérer le cas u ≥ 0. φ est alors déterminé par des valeurs en un nombre fini m de points. Soit u1 < u2 < u3 < . . . < um , les valeurs de u pour lesquelles φ vaut φ1 = φ(u1 ), φ2 = φ(u2 ), . . ., φm = φ(um ), avec φi ∈ R, i = 1, . . . , m.

3.4 Système en rétroaction

47

Ceci étant donné, nous pouvons exprimer φ à l’aide de φˇi (ki , δi ). Pour trouver ces expressions, il suffit de fixer δi = u i ,

i = 1. . . . , m

et de constater que les zones mortes i, i + 1, . . ., m n’influencent pas le comportement pour u ∈ [0; ui [. Les gains ki s’expriment donc inductivement par ki =

φ(ui+1 ) − φ(ui ) −

Pi−1 Pl l=1

n=1

ui+1 − ui

kn ul

Comme ` a travers cette construction φ=

m X

ˇ i , δi ), φ(k

i=1

le gain équivalent de la fonction φ s’écrit alors par superposition des gains équivalents des zones mortes respectives ! r m π δi δi 2X δi2 ki ǫ(A − δi ) − arcsin( ) − N (A) = 1− 2 , π i=1 2 A A A o` u ǫ(.) désigne la fonction (de R dans R) x → ǫ(x) qui vaut +1 lorsque x > 0 et 0 sinon.

3.4 Syst` eme en r´ etroaction Jusqu’` a présent, nous n’avons pas considéré le système en boucle fermée. Le but essentiel de la méthode du premier harmonique est de déterminer une estimation des paramètres d’un système oscillant (période et amplitude) lorsque ce dernier oscille ` a cause d’une rétroaction du signal de sortie sur son entrée. Ceci est représenté ` a la figure 3.10. La boucle est fermée en for¸cant u(t) = −z(t) . Pour qu’un cycle limite puisse se maintenir dans un tel arrangement, il faut que les signaux respectent les équations y(t) = φ(u(t)) Z t z(t) = y(τ )g(t − τ )dτ

(3.23) (3.24)

0

u(t) = −z(t),

(3.25)

48

3 Méthode du premier harmonique u

y N.L.

−

z G(s)

Fig. 3.10. La boucle de rétroaction est fermée par le signal de sortie de telle sorte que u(t) = −z(t).

o` u g(.) représente la réponse impulsionnelle de G(s). Ceci correspond ` a déterminer la nature du point fixe z(.) solution de l’équation intégrale non-linéaire Z T z(t) = φ(−z(τ ))g(t − τ )dτ (3.26) 0

Evidemment, trouver une solution à cette équation sur toute la durée [0; T ] donne une solution exacte du problème. Cependant, la caractéristique passe-bas de G(s) permet d’approximer la solution en rempla¸cant la fonction non-linéaire φ par le gain équivalent N (A, ω). Ceci est représenté ` a la figure 3.11.

u −

y N (A, ω)

z G(s)

Fig. 3.11. Le système en boucle fermée est approximé par le schéma ci-dessus, o` u la non-linéarité statique φ est considérée comme un gain équivalent N (A, ω).

La non-linéarité se borne à modifier le gain en fonction de l’amplitude A et éventuellement de la pulsation ω. Par conséquent, un cycle limite existe lorsque les signaux respectent les conditions fréquentielles Y (jω) = N (A, ω)U (jω)

(3.27)

Z(jω) = G(jω)Y (jω) U (jω) = −Z(jω).

(3.28) (3.29)

Ces trois conditions conduisent à une équation unique pour Z(jω) : Z(jω) = −G(jω)N (A, ω)Z(jω)

(3.30)


49

Cette équation (3.30) correspond à une approximation de l’équation intégrale (3.26). Le fait de considérer uniquement le premier harmonique permet de factoriser Z(jω) de telle sorte que ce facteur se simplifie dans (3.30). Une simplification analogue est impossible dans l’équation exacte (3.26). Ainsi, selon le critère du premier harmonique, une estimation possible de l’amplitude A et de la pulsation ω du cycle limite éventuel correspond aux solutions de l’équation 1 = −G(jω)N (A, ω). (3.31) Il peut exister une solution, plusieurs solutions, ou aucune solution à cette équation. Une solution est représentée par un couple A, ω. 3.4.1 Repr´ esentation graphique Pour représenter les solutions de l’équation (3.31), nous utilisons le diagramme de Nyquist. Il s’agit de représenter un nombre complexe correspondant ` a une réponse harmonique (ou au gain équivalent) dans un plan o` u l’axe horizontal représente la partie réelle de ce nombre et l’axe vertical, la partie complexe.

Im

G(jω)

1 − N(A)

Re

Fig. 3.12. Représentation de la réponse harmonique et du gain équivalent dans le plan complexe (diagramme de Nyquist). Le point de croisement y est égalament représenté. Le cycle limite aura les paramètres A et ω donné par ce point de croisement.

Pour obtenir une représentation correspondant à la réponse harmonique G(jω). la pulsation ω est augmentée de manière continue afin qu’une courbe associée aux nombres complexes G(jω) soit représentée dans ce plan. Cette courbe est orientée dans le sens des pulsations croissantes.

50


Nous pouvons également représenter une courbe associée au gain équivalent N (A). Dans ce cas, l’amplitude A (et non la pulsation) est graduellement et continument augmentée de telle sorte que les points complexes −1/N (A) décrivent une courbe dans le plan. Elle est également orientée dans le sens croissant des amplitudes. Un exemple de diagramme de Nyquist comprenant G(jω) et −1/N (A) est donné ` a la figure 3.12. Lorsque le gain équivalent dépend à la fois de l’amplitude et de la pulsation (c.-` a-d. N (A, ω)), il est nécessaire de discrétiser la pulsation en un ensemble fini de valeurs ω1 , ω2 , . . ., ωp . Ensuite, chaque gain équivalent N (A, ωi ), i = 1, . . . , p est considéré comme un gain dépendant de l’amplitude et il est traité comme précédemment. En conséquence, un ensemble de p courbes distinctes est obtenue o` u chaque courbe est un lieu de points complexes −1/N (A, ωi ), i = 1, . . . , p paramétré par l’amplitude A. Un cycle limite potentiel, solution de (3.31), correspond a` un point d’intersection entre la réponse harmonique G(jω) et une des courbes représentées par −1/N (A) ou −1/N (A, ωi ). 3.4.2 Double int´ egrateur et oscillateurs lin´ eaires Les considérations de la section précédente prennent une caractérisation précise lorsque le gain N est un simple nombre réel. En partant d’un double intégrateur G(s) =

1 , s2

et en effectuant une contre-réaction négative avec un gain unité N = 1, on se place dans une configuration particulière du diagramme 3.11. Comme le système est linéaire, la boucle fermée correspond à une fonction de transfert ¯ G(s) = N G(s)/(1 + N G(s)), c.-à-d.

1 +1 et on constate que le système oscille car ses deux pˆ oles valent s1 = +j et s2 = −j. ¯ G(s) =

s2

Remarque 3.1. Les considérations précédentes admettent une interprétation physique en considérant la sortie z(t) du double intégrateur G(s) comme une position. Son entrée est alors une accélération. Le schéma de la figure 3.11


51

signifie qu’une accélération proportionnelle, mais de signe contraire à la position de sortie, est appliquée. Le système se comporte donc comme une masse unitaire soumise ` a une force élastique de constante égale à l’unité, et nous retrouvons l’oscillateur du chapitre précédent sous un angle nouveau. Comme nous l’avons vu, l’amplitude de l’oscillation est fonction des conditions initiales. C’est là une propriété universelle des oscillateurs linéaires. L’information nouvelle est la possibilité de représenter l’apparition de l’oscillation par une particularité du diagramme de Nyquist. En reportant la courbe G(jω) = − ω12 dans ce diagramme, nous constatons que cette courbe coupe le point −1 exactement à la pulsation d’oscillation ω = 1. En modifiant le gain N nous obtenons une autre fonction √ de transfert N/(s2 + N ) dont les deux pˆ oles sont purement imaginaires ±j N . L’oscillateur change de fréquence. A nouveau, le diagramme de Nyquist donne une intérprétation similaire, puisque N G(jω) coupe à nouveau le point −1 exac√ tement ` a la pulsation ω = N , ou autrement dit lorsque G(jω) intersecte le point −1/N (Figure 3.13). Im

ω

G(jω)

− N1

−1

Re

Fig. 3.13. Digramme de Nyquist d’un double intégrateur G(s) = s12 . Le lieu G(jω) = − ω12 intersecte tous les points sur l’axe réel négatif. Par conséquent, chaque a un gain N d’une contre-réaction permettant de point d’intersection − N1 correspond ` √ forcer une oscillation ` a la pulsation ω = N . Lorsque N = 1, l’oscillateur correspond au système masse ressort unitaire du chapitre précédent.

Ainsi, puisque tout système linéaire oscillant possède des pˆ ole imaginaires complexes conjugués, ces pˆ oles annulent le dénominateur de la fonction de transfert en boucle fermée, conduisant naturellement à ce que la réponse harmonique en boucle ouverte N G(jω) passe par le point −1. Notons que dans le cas linéaire (N constant par exemple), une caractéristique passe-bas de la fonction de transfert n’est absolument pas nécessaire pour l’existence d’une paire de pˆ oles complexes conjugués déterminant la possibilité d’avoir une oscillation à la pulsation correspondante.

52


Néanmoins, une difficulté provient de la garantie d’existence de l’oscillation qui ne peut être déterminée qu’en considérant les pˆ oles et zéros supplémentaire aux paires de pˆ oles complexes conjugués solutions de l’équation 1 + N G(jω) = 0. 3.4.3 Th´ eor` eme de Nyquist Le diagramme de Nyquist correspond à effectuer une transformation conforme entre le plan de représentation des pˆ ole et zéros du système en boucle fermée vers un nouveau plan o` u tous les pˆ oles en questions sont envoyés au point unique −1. Pour définir cette transformation conforme, on prend l’axe imaginaire ±jω en évitant soigneusement tous les pˆ oles et zeros sur cet axe en effectuant un arc de demi-cercle situé dans le demi-plan droit et de rayon infiniment faible, chaque fois qu’un pˆ ole ou zéro est rencontré. On utilise alors l’application des nombres complexes a + jb → G(a + jb) (avec a, b ∈ R) qui transforme l’axe imaginaire jω du premier plan en une courbe G(jω) dans le second plan. En rejoignant par une courbe située dans le demi-plan droit du plan de départ, une valeur imaginaire pure choisie arbitrairement et se trouvant sur la partie positive de l’axe imaginaire vers celle de signe contraire située sur l’axe imaginaire négatif, une courbe de Jordan est obtenue englobant une partie du demi-plan droit du plan complexe initial. De plus, lorsque la courbe est parcourue dans le sens des pulsations croissantes pour le demi-axe imaginaire positif (et dans le sens des pulsations décroissantes pour le demi-axe imaginaire pur négatif), la partie en question est toujours laissée a` droite de la courbe. En augmentant d’avantage la valeur imaginaire pure choisie, tout en maintenant le module aussi grand que possible des points complexes constituants la courbe qui rejoint les deux points de l’axe imaginaire choisis, une grande partie du demi-plan droit du plan complexe est englobée. En continuant le processus, il est possible de considérérer l’ensemble de l’axe imaginaire en tant que tel et d’imaginer que l’extrémité infinie positive de celui-ci est refermée à l’infini vers la partie imaginaire infinie négative par une courbe de Jordan de module infini. La totalité du demi-plan droit est ainsi systèmatiquement laissée sur la droite de la courbe de Jordan de départ. Ce demi-plan droit est alors transformé par l’application susmentionnée a + jb → G(a + jb) en la partie du plan complexe laissée ` a droite par la courbe G(jω) dans le plan d’arrivée. Ces considérations sont illustrées aux figures 3.14 et 3.15, pour la fonction e N = 1. La en boucle ouverte G(s) = s3 +2ss−1 2 +3s+9 , et avec un gain unit´ fonction de transfert en boucle fermée possède une paire de pˆ oles complexes conjugués (±2j) ainsi qu’un pˆ ole réel négatif (−2), tous trois sont envoyés au point −1 par la transformation a + jb → G(a + jb). La transformation de l’axe imaginaire (en vert) est également illustrée.


53

a + jb → G(a + jb)

−1

Fig. 3.14. La fonction de transfert en boucle fermée 1/(1+G) = (s−1)/(s3 +2s2 + 4s + 8) correspond ` a la fonction de tranfert en boucle ouverte G(s) = (s − 1)/(s3 + 2 2s + 3s + 9). A gauche, les pˆ oles et zéro de la boucle fermée sont représentés. A droite, le plan de Nyquist et l’image de l’axe imaginaire du plan de gauche est tracé. Les trois pˆ oles (une paire complexe conjuguée et un pˆ ole réel négatif) du plan de gauche sont tous envoyé au point −1 du plan de droite.

Deux courbes de Jordan délimitées par des demi-arcs de cercle ainsi que leurs images respectives sont représentées à la figure 3.15. Le demi-disque du plan droit limité par un rayon très légèrement (i.e. infinitésiment) inférieur ` a deux est entièrement transformé dans une très grande région du plan droit. L’application est clairement surjective, car certains points situés dans le demi-anneau de rayon 1.8 < r < 2 et ceux situés dans le demi-anneau de rayon 2 < r < 3 sont envoyés vers des points identiques. Cette surjectivité provient du fait que le degré du dénominateur est supérieur ` a un, de telle sorte qu’il possède plus qu’un seul pˆ ole, impliquant que le point −1 de l’image possède également plusieurs points sources (les pˆ oles en question). Par continuité, il existe donc des points différents de −1 du plan image auxquels correspondent plusieurs points distincts du plan source, c.-à-d. G(s1 ) = G(s2 ) 6= −1, s1 6= s2 avec s1 , s2 ∈ C. On remarque également que le recouvrement se produit essentiellement lorsque les pˆ oles complexes conjugués, imaginaires purs, et responsables de l’oscillation, sont rencontrés. De plus, il y a une extrême sensibilité entre les points de départ situés autour de ces pˆ oles et les points d’arrivée. (Un petit déplacement des points dans le plan source implique un grand déplacement de leurs images.) Une simulation du système précédent confirme qu’il oscille bien à la pulsation ω = 2. Cette oscillation est stable au sens o` u, bien qu’il y ait présence d’un régime transitoire conditionné par la présence du pˆ ole réel −2, il disparaˆıt rapidement pour laisser place à l’oscillation. Tout comme dans le cas

54

3 Méthode du premier harmonique 1.8

1

3

2

3 1.8

0

0

-2 -1

-2

0

2

-1

-0.5

0

0.5

Fig. 3.15. Illustration des courbes de Jordan lorsque les courbes rejoignants les deux points de l’axe imaginaire sont des demi-cercles de rayon 1.8 et 3. Le système est identique ` a celui de la figure 3.14. Lorsque le rayon dépasse la valeur 2, plus ce rayon est grand, plus petite est la courbe image dans le diagramme de Nyquist.

du double intégrateur en rétroaction, l’amplitude de l’oscillation est fonction des conditions initiales. Cependant, une différence essentielle existe entre le double intégrateur et le système G(s) que l’on vient de présenter. Dans ce dernier cas, lorsque le gain de contre-réaction N change, la réponse harmonique ne peut plus couper le point −1/N , contrairement au cas du double intégrateur. Par conséquent, la paire de pˆ oles complexes conjugués, imaginaires purs, disparaˆıt. Nous pouvons néanmoins prédire o` u doivent se trouver les deux pˆ oles manquants lorsque le gain augmente ou diminue, en utilisant à la fois la propriété de séparation de l’axe imaginaire (séparant le plan complexe initial en deux), et la nature de la transformation utilisée (` a savoir conforme). Sans perte de généralité, considérons une diminution du gain, disons N = 0.9. Le point −1/N = −10/9 se déplace alors sur la gauche du point −1 du diagramme de droite de la figure 3.14. Ceci signifie que, lorsqu’on se déplace sur la courbe verte solide du diagramme de droite, dans le sens croissant des pulsations, nous laissons le point −10/9 sur la droite. En conséquence, les pˆ oles associés ` a ce point doivent se situer également sur la droite de la courbe verte solide du diagramme de gauche de la figure 3.14. C’est la raison pour laquelle les pˆ oles correspondants appartiennent au demi-plan droit du diagramme de gauche et possèdent des parties réelles positives. Le signal de sortie est instable et l’oscillation d’amplitude constante ne se maintient pas. L’amplitude explose. A l’inverse, lorsque le gain est augmenté, les pˆ oles du diagramme de gauche se déplace sur la gauche, le signal de sortie est asymptotiquement stable, (il tend vers zéros quels que soient les conditions intiales, lorsque le temps tend vers l’infini), et l’oscillation d’amplitude constante ne se maintient pas. Elle s’évanouit progressivement.


55

Ceci est confirmé en simulation en prenant N = 0.9 et N = 1.1 dont les résultats sont donnés ` a la figure 3.16.

Resultats

Resultats

4

4

2

2

0

0

-2

-2

-4

-4 0

20

40

0

20

40

Fig. 3.16. Illustration de l’effet de la modification du gain dans le cas du système G(s) des figures 3.14 et 3.15. A gauche, le gain est diminué ` a N = 0.9, l’oscillation s’amplifie. A droite, le gain est augmenté ` a N = 1.1, et l’oscillation s’évanouit.

Par conséquent, la condition de stabilité (absence de pˆ oles à partie réelle positive) est profondément liée à la manière dont le point −1 est laissé à droite ou ` a gauche de l’image de l’axe imaginaire par la fonction de transfert N G(s). Pour être plus précis, la stabilité dépend de la fa¸con dont la réponse harmonique G(jω) entoure le point −1/N . La conclusion suit une application directe du critère de l’argument de Cauchy appliqué ` a la courbe de Jordan particulière. Th´ eor` eme des r´ esidus et principe de l’argument de Cauchy Le principe de l’argument de Cauchy stipule que la somme des résidus associés ` a des singularités de la transformation équivaut aux nombre de tours que la courbe doit parcourir autour de l’image de la singularité. C’est un corolaire du théorème des résidus que nous donnons ci-après. Le corolaire en question suit pour finalement présenter le résultat qui nous intéresse. Pour commencer nous donnons la définition exacte d’un résidu. Elle se fonde sur un développement en série de la fonction analytique f (z). D´ Pe∞finition 3.2.kSoit f (z) une fonction complexe que nous exprimons f (z) = −∞ Ck (z − z0 ) dans un voisinage de z0 en excluant z0 . Le nombre C−1 est appelé le résidu de f au point z0 . Nous notons Res (f ; z0 ) = C−1

56


Nous donnons également la définition du nombre d’entourement : D´ efinition 3.3. Soit γ une courbe fermée et a un point qui n’appartient pas a ` cette courbe (a 6∈ γ). Alors Z dz 1 n(γ; a) = 2πj γ z − a est le nombre d’entourement. Pour illustrer cette dernière définition, lorsque γ est un cercle, n(γ; z) = 1, si a est ` a l’intérieur du cercle et lorsque a est à l’extérieur, n(γ; z) = 0. Le théorème des résidus de Cauchy s’énonce alors Th´ eor` eme 3.4. Supposons f analytique dans un domaine simplement connexe, si ce n’est pour un ensemble fini isolés de singularités z1 , z2 , . . . , zm . Soit γ une courbe fermée qui ne passe par aucune des singularités. Alors Z

f = 2πj

γ

m X

n(γ; zk )Res (f ; zk ).

k=1

ℑ

ℑ E(s)

X

O X

O

X

ℜ

X X O

ℜ

X P=6

Z=3

N = -3

Fig. 3.17. Illustration du théorème des résidus dans le cas particulier o` u f est une fraction rationnelle E(s). A gauche, le plan s est représenté avec les zéros représentés par O et au nombre de Z = 3, ainsi que les pˆ oles représentés par X, et au nombre de P = 6. Une courbe de Jordan quelconque dans le sens des aiguilles d’une montre est choisie. Le théorème des résidues indique que le nombre d’encerclements N de l’orgine, effectué par l’image de la courbe de Jordan par l’application E(s), est égal ` a N = Z − P = −3. La courbe encercle bien trois fois l’origine dans le sens contraire du sens de la courbe initiale.

En somme, lorsque une courbe fermée est parcourue, seules les singularités contribuent au nombre d’entourement de la courbe, Chaque contribution des


57

singularités est proportionnelle à leur résidu et à leur nombre d’entourement propre. Les singularités se somment en quelque sorte. On comprend donc que lorsque une courbe est transformée en une autre, conservant les singularités avant et après transformation, c.-à-d. sans modifier ni le résidu ni le nombre d’entourement correspondant, le nombre d’entourement global doit demeurer identique. Crit` ere de Nyquist En appliquant le théorème des résidus à la courbe de Jordan particulière correspondant ` a prendre l”axe imaginaire (tout en évitant les pˆ oles et zéros se situant sur l’axe imaginaire en effectuant un écart infinitésimal) et d’inclure tout le demi plan droite du plan complexe en refermant la courbe à l’infini, on aboutit au critère de Nyquist généralisé. En effet, en prenant pour E(s) l’expression 1 + G(s)H(s) on obtient le théorème suivant : Th´ eor` eme 3.5. 1. On prend l’axe imaginaire du plan s, c.-` a-d. jω, ω ∈ [−∞; ∞]. 2. On prend son image par G(s)H(s)

3. N = nbr de fois que G(jω)H(jω) encercle −1 (sens trig. −).

4. P = nbr de pˆ oles de G(s)H(s) instables (≡ pˆ oles instables de 1+G(s)H(s)) Z = N + P = nbr de pˆ oles inst. de la boucle fermée (zéros inst. de 1 + G(s)H(s)) Remarquons que les pˆ ole de 1 + G(s)H(s) sont également les pˆ oles de la boucle ouverte G(s)H(s) (la sommation de 1 ne change pas la stabilité de 1 + G(s)H(s)). De plus, considérer que l’image de la courbe de Jordan par 1 + G(s)H(s) encercle l’origine est identique à tester le nombre de fois que l’image de cette courbe par G(s)H(s) encercle le point −1. Le précédent théorème peut être légèrement modifié pour tenir compte du gain N supplémentaire : Th´ eor` eme 3.6. 1. On prend l’axe imaginaire du plan s, c.-` a-d. jω, ω ∈ [−∞; ∞]. 2. On prend son image par G(s)H(s)

3. N = nbr de fois que G(jω)H(jω) encercle −1/K (sens trig. −) 4. P = nbr de pˆ oles instables de la boucle ouverte

Z = N + P = nbr de pˆ oles instables de la boucle fermée

58


3.5 Crit` ere de stabilit´ e Dans le cas d’une contre-réaction linéaire, il n’est pas possible de maintenir une oscillation avec la même fréquence d’oscillation lorsque le gain est augmenté ou diminué. Pour une majeure partie des cas (sauf pour le double intégrateur, par exemple), l’oscillation à tendance a immédiatement s’évanouir ou ` a s’amplifier. De plus, même lorsque l’oscillation se maitient parfaitement, il est très difficile de garantir une amplitude bien définie, étant donné que cette dernière dépend des conditions initiales qui ne sont pas maˆıtrisables. Cependant, lors de l’ajout d’une non-linéarité, l’oscillation peut se maintenir ` a une amplitude bien définie. Ceci est illustré en rempla¸cant le gain constant dans l’exemple des figures 3.14 et 3.15 par un élément non-linéaire. L’idée est de garantir l’intersection avec le lieu du gain équivalent même lorsque le gain statique de G(s) est modifié. Ainsi, le critère d’existence d’un cycle limite est satisfait. Nous prendrons deux types de non-linéarités, i) la saturation et ii) la zone morte. Toutes deux permettent de constituer un lieu pour lequel l’intersection avec la réponse harmonique G(jω) existe. Remarque 3.7. Les deux figures 3.18 et 3.19 correspondent à des systèmes n’ayant pas de zéros instables. Ainsi le critère de Nyquist simplifié s’applique. La stabilité est donnée lorsque la réponse harmonique laisse le point de stabilité ` a gauche. L’instabilité a lieu lorsque ce dernier est laissé à droite. 3.5.1 Cycle limite stable La prévision d’un cycle limite stable a lieue lorsque le gain équivalent, paramétré par l’amplitue A, croise la réponse harmonique, paramétrée par ω, selon la figure 3.18. Pour s’en convaincre, il suffit de considérer le point de croisement, après une légère perturbation, comme un point de stabilité. La perturbation est effectuée en augmentant ou diminuant l’amplitude A. La figure 3.18 représente le cas o` u l’amplitude est augmentée. Le point de croisement est alors déplacé sur la gauche. Lorsque la réponse harmonique est parcourue dans le sens des pulsations croissantes, elle laisse ce point également sur la gauche. Ainsi, lorsque ce point est considéré comme un point de stabilité, la réponse harmonique décrit une situation stable. Le système aura donc tendance ` a diminuer l’amplitude par la présence de cette stabilité. Par conséquent, le point hypothétique aura tendance à revenir vers le point de croisement. De manière similaire, l’attraction du point de croisement est déduit en considérant une diminution de l’amplitude. Le point de croisement est alors déplacé sur la droite, de telle sorte qu’il correspond à un point instable par rapport ` a la réponse harmonique. L’amplitude aura donc tendance à s’accroˆıtre

3.5 Critère de stabilité

59

lorsqu’elle est amoindrie par la perturbation. Ainsi le point hypothétique aura tendance ` a revenir également au point de croisement. Le point de croisement est donc bien stable dans ce cas de figure.

ω

A

1 −K

Fig. 3.18. Illustration d’une prévision de la présence d’un cycle limite stable.

3.5.2 Cycle limite instable La prévision d’un cycle limite instable a lieu lorsque le croisement entre le gain équivalent, paramétré par l’amplitude A, croise la réponse harmonique, paramétrée par ω, selon la figure 3.19. De manière similaire au cas de la stabilité de la section 3.5.1, le comportement résulte de l’interprétation après une légère perturbation. La figure représente le cas o` u, après augmentation de l’amplitude par perturbation, le point de stabilité devient instable. Ceci reflète une tendance ` a ce que l’amplitude augmente d’avantage. Le cycle ne peut donc pas se maintenir. Afin d’illustrer les considérations ci-dessus, nous revenons à l’exemple des figure 3.14 et 3.15. La fonction de transfert G(s) admet la réalisation en représentation d’état suivante x˙ 1 = x2 x˙ 2 = x3 x˙ 3 = −2x3 − 3x2 − 9x1 + u y = x2 − x1

60


ω

1 −K

A

Fig. 3.19. Illustration d’une prévision de la présence d’un cycle limite instable.

Deux conditions initiales différentes, sont choisies, à savoir x10,a = x1 (0) = 2 et x10,b = x1 (0) = 3, x2 (0) = −2 et x3 (0) = 0 pour les deux choix de conditions initiales. La première simulation consiste à simplement bouclé l’entrée sur la sortie avec un gain unité, c.-à-d. u = −y. Le résultat est reporté à gauche dans la figure 3.20. L’amplitude dépend des conditions initiales.

Resultats

Resultats

5

5

0

0

-5

-5

0

10

20

0

10

20

Fig. 3.20. Illustration de l’effet des conditions initiales lorsque l’oscillateur est crée avec une rétroaction linéaire (figure de gauche, gain unité) et lorsque le gain est produit par une zone morte (figure de droite, k = 4.2 et δ = 0.9). Le système en boucle ouverte est le même que celui des figure 3.14 et 3.15.

A droite de la figure est représenté le résulta lorsque une zone morte remplace le gain unité, avec k = 4.2 et δ = 0.9. On constate que l’amplitude de l’oscillation ne dépend pas des conditions initiales.

3.7 Oscillateur de Van der Pol revisité

61

Par conséquent, lorsque la non-linéarité est une zone morte, l’oscillation correspond ` a un point de stabilité. Pour le vérifier, appliquons le critère de stabilité en utilisant la réponse harmonique G(jω) et le gain équivalent −1/N (A) de la zone morte. G(jω) coupe l’axe réel négatif lorsque ω = 2. exactement au point −1. On calcule également facilement que A = 1.39 pour les paramètres δ = 0.9 et k = 4.2. Cette valeur d’amplitude est légèrement plus grande que la valeur d’amplitude constatée, mais le résultat donne une bonne estimée étant donné la nature approximative de la méthode.

3.6 Fiabilit´ e de l’analyse par le premier harmonique – amplitude et fréquence prédites ne sont pas exactes – un cycle limite prévu ne se produit pas – un cycle limite existant n’est pas prédit

3.7 Oscillateur de Van der Pol revisit´ e Bien que sous l’hypothèse passe bas de la partie linéaire, la méthode du premier harmonique s’applique à la contre-réaction par un élément non-linaire statique, cette méthode permet également de traiter d’autres types de nonlinéarité. Dans cette section, nous reprenons l’oscillateur de Van der Pol et nous allons voir, dans quelle mesure, la méthode de ce chapitre s’applique. La première chose essentielle est de constater que l’oscillateur oscille à une fréquence fondamentale. C’est une constation, certes, triviale, mais c’est la clé de l’application correcte de la méthode du premier harmonique dans ce contexte. A partir de l’oscillation fondamentale (pulsation et amplitude), il est possible d’approximer celle-ci par une onde sinuso¨ıdale unique. En passant en variable complexe, le déphasage correspond au rapport entre partie réelle et imaginaire. En partant de l’équation de l’oscillateur, x ¨ + ǫ(x2 − 1)x˙ + x = 0 il est possible d’isoler les termes linéaires de ceux non linéaires. C’est une procédure similaire ` a ce qui est entrepris lors de la présence d’une non-linéarité statique. x¨ − ǫx˙ + x = −ǫx2 x. ˙

(3.32)

62


Ainsi le terme non linéaire est isolé au membre de droite et il constitue alors le bloc non linéaire : u(t) = −x2 x. ˙ Toutefois, ce terme ne peut pas être transformé par un bloc à une seule sortie et une seule sortie statique. En effet, bien que statique, la présence de plusieurs entrées (x et x) ˙ pour une seule sortie (u) n’est pas exactement similaire ` a ce qui ` a été vu précédemment. Néanmoins, l’oscillation ` a la sortie du montage (x(t)) est assumée contenir que la fondamentale (une sinuso¨ıde de première harmonique). Par conséquent, les deux signaux d’entrée de la non-linéarité sont en fin de comptes paramétrés par la phase et le rapport d’amplitude des signaux d’entrée. Il est donc possible de représenté la non-linéarité par son effet d’amplification et de déphasage de la sortie par rapport ` a l’effet combiné des deux entrées. Il est alors naturel d’introduire un nombre complexe constituant le gain multivariable équivalent de manière similaire au cas mono-entrée mono-sortie traité précédemment. En utilisant la tranformée de Laplace sur la partie linéaire des équations (3.32), nous obtenons (s2 − ǫs + 1)X(s) = ǫU (s). Comme seule la fondamentale est considérée x(t¯) = Asin(ω t¯ + φ). A cause du déphasage, nous changeons la variable temporelle pour s’en débarasser t¯ → t ω t¯ + φ = ωt.

x(t) = A sin ωt x(t) ˙ = Aω cos ωt En examinant l’effet de la non-linéarité sur le premier harmonique

3.7 Oscillateur de Van der Pol revisité

63

−xx ˙ 2 = −(Aω cos(ωt))(A2 sin2 ωt) = −A3 ω cos(ωt) (1 − cos2 (ωt)) 1 = −A3 ω cos(ωt) (1 − cos(2 ωt)) 2 31 = −A ω(cos(ωt) − cos(ωt) cos(2ωt)) 2 1 31 = −A ω(cos(ωt) − (cos(ωt) + cos(3ωt))) 2 2 1 = −A2 (Aω cos(ωt) − Aω cos(3ωt)) 4 u≡

A3 A2 d ω cos ωt = (−A sin ωt) 4 4 dt

De la précédente expression découle le gain équivalent N (A, ω) =

A2 jω 4

L’oscillateur de van der Pol peut donc être approximé par la mise en contre-réaction négative de l’élément approximant ci-dessus avec le système linéaire α s2 − αs + 1, qui peut être interprété comme un un filtre passe-bas. Une approximation des paramètres de l’oscillation est obtenue en cherchant les solutions de 1 + G(jω)N (A, ω) = 0 On trouve aisément A=2 ω=1

4 Stabilit´ e au sens de Lyapunov

Le chapitre précédent a fait appel à la notion de la stabilité, sans pour autant en donner une définition formelle et des résultats rigoureux relatifs à cette question. En effet, la stabilité de cycle limite, bien que présentée à l’aide du concept de stabilité BIBO issue de l’interprétation fréquentielle donnée par le critère de Nyquist, et étendue aux cycles limites par une méthode approximative, demeure une notion intuitive dépourvue d’une axiomatique précise. La stabilité y était considérée comme la capacité du cycle limite de se maintenir même après perturbation de celui-ci. Ce type de stabilité sera appelé asymptotique. Le présent chapitre donne les nuances entre les types de stabilité ainsi qu’un traitement approfondi du concept, et des résultats relatifs. Il ne s’occupera que de l’analyse d’un point d’équilibre. Les concepts pourront alors être étendus à la notion de cycle limite sans trop de difficulté.

4.1 Point d’´ equilibre Soit donc un système, x˙ = f (x) et un point d’équilibre x de telle sorte que,

x˙ = 0 = f (x).

4.2 Rappel de la notion de stabilit´ e pour les syst` emes lin´ eaires Considérons un système linéaire avec entrée x˙ = Ax + Bu suivi d’un bouclage u = −Kx : de telle sorte que le système en boucle fermée s’écrive

66

4 Stabilité au sens de Lyapunov

˜ x˙ = (A − BK)x = Ax

(4.1)

Ce système possède un point d’équilibre unique, à condition que la matrice A˜ ne sois pas singulière, auquel cas l’équilibre est x = 0. Lorsque toutes les valeurs propres de la matrice A˜ sont à parties réelles ˜ < 0) alors le système (4.1) est asympstrictement négative (c.-` a-d. Re λ(A) totiquement stable. Remarque 4.1. La caractérisation de la stabilité par les valeurs propres, bien que tout ` a fait satisfaisante en linéaire, étant donné sa connexion à d’autres types de stabilité dans ce contexte, notamment la stabilité entrée-sortie BIBO (c.-` a-d. ` a une entrée bornée, la sortie doit demeurer bornée), elle n’est pas du tout adaptée au contexte non linéaire, principalement à cause de l’impossibilité de trouver un équivalent universel du concept de valeur propre associé au système dynamique x˙ = f (x). En conséquence, il faut remonter aux sources du concept de stabilité afin de trouver une définition adéquate.

4.3 Notion intuitive de la stabilit´ e D´ efinition 4.2. Si le système est initialement ”légèrement” perturbé de son point d’équilibre le système reste ”proche” de ce point d’équilibre.

stable

instable

Fig. 4.1. Illustration de la définition intuitive de la stabilité.

4.4 D´ efinition math´ ematique pr´ ecise de la stabilit´ e 4.4.1 Notion de distance Il faut rendre précis ”proche” et ”légèrement” Un espace vectoriel V est dit normé lorsqu’il existe une fonction x → kxk de V dans R avec les propriétés suivantes :

4.4 Définition mathématique précise de la stabilité

67

1. kxk ≥ 0, ∀x ∈ V ; et kxk = 0 seulement lorsque x = 0. 2. kcxk =| c | kxk, ∀c ∈ R et ∀x ∈ V.

3. kx + yk ≤ kxk + kyk, ∀x, y ∈ V.

4.4.2 Stabilit´ e : d´ efinition formelle D´ efinition 4.3. Un système est stable au sens de Lyapunov, si ∀R > 0, ∃r > 0 tel que kx0 k < r implique kx(t)k < R. Cette définition signifie que, quelle que soit la boule d’exigence de taille R, il est toujours possible de choisir une certaine sous-boule de taille r telle que, pour toutes les conditions initiales comprises dans cette sous-boule, les trajectoires résultantes seront, en tout temps, comprises dans la boule d’exigence de taille R. Lorsque le système est stable, il est toujours possible de trouver une telle sous-boule, même lorsque le rayon R de la boule d’exigence est diminué de manière ` a le rendre arbitrairement petit, augmentant ainsi les contraintes sur les conditions initiales.

(i)

(ii)

(iii)

Fig. 4.2. Illustration de la définition formelle de la stabilité. (i) Pour tout choix de la boule d’exigence kxk < R, il doit être possible de construire (ii) une sous boule de conditions initiales kx0 k < r, telle que (iii) pour toute condition initiale appartenant ` a cette sous boule, la trajectoire résultante reste emprisonnée dans la grande boule de taille R.

Ceci corrobore la définition intuitive de la stabilité. En effet, en considérant la bille captive dans un bol, une hauteur de référence arbitraire de la bille peut être considérée comme étant une mesure de la boule d’exigence R. Maintenant, s’il existe toujours une certaine hauteur suffisamment petite (correspondant à r), de telle sorte que, si la bille est lachée à n’importe quelle hauteur comprise dans l’interval défini par cette hauteur (associée à r), elle ne pourra jamais dépasser la hauteur d’exigence de référence (associée à R), alors la bille sera stable au sens de Lyapunov. Ceci ne signifie pas pour autant que la bille revienne asymptotiquement à son point d’équilibre.

68


Ainsi, la bille est stable dans le cas d’un bol concave et instable lorsque le bol est convexe.

Fig. 4.3. Lorsque le système est instable (` a gauche), quel que soit le choix de la boule de conditions intiales de rayon r, certaines trajectoires résultantes ressortent toujours de la boule d’exigence de rayon R. Ceci n’est pas le cas pour le système stable (` a droite).

Fig. 4.4. Lorsque l’axe du temps est utilisé pour représenter les solutions de l’équation différentielle x˙ = f (x), la boule d’exigence devient un cylindre. On constate alors clairement que lors de l’instabilité, il n’est pas possible de confiner toutes les trajectoires ` a l’intérieur du cylindre pour toute boule de conditions initiales ` a l’intérieur de celui-ci.

Les figures 4.3 et 4.4 représentent les trajectoires du système x˙ 1 = 4x2 + 0.2x1 x˙ 2 = −6 sin(x1 ) + b(0.9 − cos(6t)) Lorsque b = −0.4, le système est stable. La condition initiale est choisie en x1 (0) = x2 (0) = 0.5 et le temps d’arrêt de la simulation est fixé à T = 10 (` a droite dans les figures 4.3 et 4.4). Lorsque b = 0.1, le système est instable. Les conditions initiales sont choisies arbitrairement, par exemple x1 (0) = x2 (0) = 0.2, et le temps d’arrêt de la simulation est fixé T = 9 (` a gauche dans les figures 4.3 et 4.4).

4.4 Définition mathématique précise de la stabilité

69

L’instabilité est définie dès lors que la stabilité n’a pas lieu. D´ efinition 4.4. Un système est instable au sens de Lyapunov lorsque il n’est pas stable au sens de la définition 4.3. Ceci semble être une tautologie. Cependant l’importance de cette définition provient du fait que l’instabilité ne signifie pas nécessairement une forme d’explosion ou de divergence à l’infini. En effet, il existe des systèmes qui convergent asymptotiquement vers un point d’équilibre quelles que soient les conditions initiales, sans pour autant que ces systèmes puissent être considérés comme stables. Ceci provient du fait qu’il est impossible de dominer le comportement transitoire des trajectoires résultantes, même en rapprochant les conditions initiales de l’origine. Les excursions des trajectoires sont toujours bornées inférieurement par une boule de taille fixe, témoignant ainsi de l’instabilité au sens du non respect de la définition 4.3. L’exemple suivant illustre le phénomène.

0.8

0.6

0.4

0.2

0.1

0.2

0.3

0.4

0.5

0.6

0.7

Fig. 4.5. Exemple d’un système convergent mais instable.

Exemple 4.5. Soit le système planaire, x21 (x2 − x1 ) + x52 (x21 + x22 )[1 + (x21 + x22 )2 ] x22 (x2 − 2x1 ) x˙ 2 = 2 . (x1 + x22 )[1 + (x21 + x22 )2 ]

x˙ 1 =

Plusieurs solutions pour différentes conditions initiales sont représentées ` la figure 4.5. Les trajectoires, bien que commen¸cant près de l’origine, s’en a écartent pour finir par y revenir le long de l’axe horizontal. Il s’agit donc bien d’une convergence asymptotique. Cependant, le système est instable étant

70


donné que les trajectoires ne peuvent pas être contraintes à demeurer dans une boule de taille suffisamment petite, quel que soit la proximité des conditions initiales de l’origine. 4.4.3 Illustration

sans frottement

avec frottement

Fig. 4.6. Deux cas pour lesquels la bille est stable.

4.4.4 Stabilit´ e asymptotique La stabilité asymptotique exige l’existence d’une voisinage de l’équilibre tel que toute trajectoire ayant pour condition initiale un point de ce voisinage converge vers le point d’équilibre. En somme, on aimerait que le système revienne et s’arrête au point d’équilibre lorsqu’il en est légèrement perturbé. D´ efinition 4.6. Le point d’équilibre x ¯ = 0 de x˙ = f (x) est asymptotiquement stable a ` condition 1. qu’il soit stable au sens de Lyapunov 2. qu’il existe une boule de de condition initiales kx0 k < r0 telles que les solutions résultantes soient telles que x(t) → 0 lorsque t → ∞. 4.4.5 D´ esavantages de la d´ efinition La définition de stabilité présente certains désavantages importants : – Il est nécessaire de pouvoir calculer de manière explicite chaque solution correspondant ` a chacune des conditions initiales. – Le maniement de la définition est fastidieux. Par conséquent, des résultats permettant de déterminer la stabilité sans devoir intégrer les équations dynamiques seraient les bienvenus.

4.5 Méthode directe de Lyapunov

71

∃r0

Fig. 4.7. Condition pour la stabilité asymptotique.

4.5 M´ ethode directe de Lyapunov Lorsque la bille est examinée selon un point de vue différent, on constate que le comportement stable ou instable de celle-ci est relié à la fois à la caractéristique et ` a l’évolution de sa fonction d’énergie. La présence d’un maximum ou minimum d’énergie potentielle possède une influence critique. De plus, la présence de frottement est responsable de la décroissance de l’énergie complète (cinétique et potentielle) et influence donc la stabilité. La bille possède donc une fonction d’énergie E qui comporte une part d’énergie potentielle Ep et une part d’énergie cinétique Ec . On a E = Ec + Ep . – Le comportement est stable lorsque : – L’énergie E diminue et est minimum au point d’équilibre. – L’énergie E est conservée et E est minimum à l’équilibre – Par contre, le comportement est instable lorsque : – L’énergie E augmente. – L’énergie E est conservée mais elle ne correspond pas à un minimum a l’équilibre. ` La théorie de Lyapunov et en particulier la deuxième méthode de Lyapunov (dite aussi méthode directe) généralise cette constatation à une classe plus large de fonctions. Ces fonctions sont notées V . 4.5.1 Candidat de Lyapunov La fonction d’énergie possède deux propriétés essentielles. La première est la qualité d’extremum au point d’équilibre, à savoir s’il s’agit d’un maximum ou d’un minimum. Le point d’équilibre à tendance à être stable lorsque cet extremum est un minimum. Le candidat Lyapunov est une fonction qui présente ce type de particularité. Afin de forcer la présence d’un minimum au point d’équilibre, la fonction sera contrainte à être positive pour toute valeur différente de l’origine. Elle ne pourra s’annuler qu’à l’origine.

72


D´ efinition 4.7. (Fonction définie positive) Une fonction définie positive est une fonction f (x) : RN → R telle que f (x) > 0, ∀x 6= 0 et f (x) = 0 lorsque x = 0. De plus, cette fonction sera continue. On aboutit donc à la définition du candidat de Lyapunov. D´ efinition 4.8. (Candidat de Lyapunov) Une fonction définie positive continue, notée V (x), est un candidat de Lyapunov. 4.5.2 Fonction de Lyapunov La deuxième particularité de la fonction d’énergie lors de la présence d’un système stable, est d’avoir tendance à diminuer ou d’être conservé lors de l’évolution du système. En conséquence, on exigera en plus du candidat de Lyapunov que la dérivée de celui-ci soit négative. La dérivée s’écrit, T ∂V f (x) V˙ (x) = ∂x Remarque 4.9. La notation V˙ (x) est utilisée. Toutefois, ceci n’est pas très rigoureux. Nous verrons dans le chapitre 7, qu’il est possible de définir le concept de dérivée temporelle projetée le long du système qui sera appelée dérivée de Lie et notée Lf V (x). Par conséquent, la notation Lf V (x) est plus précise que V˙ (x). Lorsque ceci ne prête pas à confusion, la notation V˙ (x) sera préférée dans ce chapitre, de part le caractère simple et suggestif de cette notation. D´ efinition 4.10. (Fonction de Lyapunov) Une fonction de Lyapunov est un candidat de Lyapunov, a ` savoir une fonction continue V (x) telle que V (x) > 0

∀x 6= 0,

V (x) = 0

x = 0,

∀x 6= 0,

V˙ (x) = 0

x = 0.

ayant en plus la propriété V˙ (x) ≤ 0

Le théorème de stabilité fondamental de la théorie de Lyapunov peut maintenant être énoncé. Th´ eor` eme 4.11. (Seconde méthode de Lyapunov, dite aussi méthode directe) Si une fonction de Lyapunov existe pour un système donné alors ce système est stable. Si la fonction de Lyapunov est strictement décroissante, c’est-` a-dire que V˙ (x) < 0, ∀x 6= 0, alors la stabilité est en plus asymptotique.

4.6 Exemple : robot

73

4.6 Exemple : robot Un exemple simple illustrera l’avantage de la fonction de Lyapunov sur le simple concept d’énergie. Il s’agit d’un robot ayant un nombre arbitraire n mais fini de degrés de liberté. Chacun des degrés de liberté est associé un actuateur responsable d’un mouvement le long de la coordonnée correspondante. Une représentation possible est donnée à la figure 4.8.

q2 τ 2

τ1

q1

Fig. 4.8. Robot planaire comportant un actuateur indépendant pour chacune des coordonnées.

4.6.1 Loi de commande Pour beaucoup de systèmes de la théorie de la commande linéaire, les lois de type proportionelle (P), proportionelle et dérivée (PD), et prportionnelle et dérivée avec terme intégral (PID) suffissent pour un très grand nombre d’application. C’est pourquoi nous prendrons, comme choix initial de loi de commande, une loi de type proportionnelle-dérivée (PD) de la forme : τ = −Kd q˙ − Kp (q − q).

(4.2)

Il s’agit maintenant de justifier ce choix à l’aide des techniques de Lyapunov. 4.6.2 Lois de la m´ ecanique Afin d’obtenir un modèle suffisant pour établir la preuve de stabilité de la loi de commande envisagée, nous appliquerons le simple bilan des puissances. L’ énergie cinétique peut s’exprimer comme

74


Ec =

1 T q˙ M (q)q. ˙ 2

Le bilan de puissance s’écrit d Ec = P dt d 1/2 q˙T M (q)q˙ = q˙T τ. dt 4.6.3 Candidat Lyapunov La souplesse du candidat de Lyapunov permet d’envisager des expressions qui a priori n’ont pas une expression physique spéciale. Par exemple, nous envisagerons une modification de la fonction d’énergie cinétique faisant intervenir un terme aditionel qui n’a pas d’interprétation physique immédiate, puisqu’il ne correspond pas au robot en tant que tel : 1 1 V = (q − q)T Kp (q − q) + q˙T M (q)q. ˙ (4.3) 2 2 On constate bien que cette fonction est définie positive au sens o` u V (q) > 0, ∀q 6= q et V (q) = 0. 4.6.4 Fonction de Lyapunov Afin de vérifier que le candidat de Lyapunov est bien une fonction de Lyapunov, il est nécessaire de tester la décroissance de cette fonction. V˙ = q˙T Kp (q − q) + q˙T τ En introduisant la loi de commande (4.2), V˙ = q˙T Kp (q − q) + q˙T (−Kd q˙ − Kp (q − q)) = −q˙T Kp q˙ ≤ 0,

et le robot est donc bien rendu stable par l’adjonction de la loi de commande de type PD. En effet les deux conditions sur la fonction de Lyapunov sont satisfaitent. V > 0 ∀x 6= 0 provient de la structure de la fonction de Lyapunov (4.3) Remarque 4.12. L’aspect abstrait de la fonction de Lyapunov (abstrait au sens que cette fonction est une notion purement mathématique et non physique), peut maintenant être exploitée en revenant en arrière dans l’interprétation de cette fonction. En examinant la structure de l’équation (4.3), on constate que le terme que l’on a ajouté possède la structure d’énergie potentielle élastique, bien qu’il n’y a pas de présence de ressort physiquement dans le système. C’est la loi de rétroaction qui agit comme si, au lieu d’appliquer une loi de commande, le système était muni de ressorts responsables de la génération d’une force proportionnelle lorsque le robot quitte son point d’équilibre.

4.7 Théorème de stabilité locale

75

4.7 Th´ eor` eme de stabilit´ e locale Le premier résultat en relation avec la fonction de Lyapunov est le résultat de stabilité locale autour du point d’équilibre. Nous énon¸cons le théorème avec précision : Th´ eor` eme 4.13. ∃ BR0 telle que – V (x) > 0 (∀x 6= 0 dans BR0 ) et V (0) = 0 – ddt V (x) ≤ 0 (dans BR0 ) alors le point d’équilibre x = 0 est stable. Si en plus, alors il y présence d’une stabilit´ e asymptotique

d dt V

(x) < 0 ∀x 6= 0,

Nous allons également procéder à sa démonstration. L’objectif est de connecter les concepts contenus dans ce théorème avec la défintion relativement difficile ` a manier examinée au début de ce chapitre (définition 4.3). 4.7.1 Preuve (stabilit´ e locale) Tout au long de la démonstration, la distinction entre sphère et boule sera effectuée. Une sphère est la partie la plus à l’extérieur d’une boule pleine (en quelque sorte ceci correspond à l’écorce d’épaisseur infinitésimale d’une orange) et la boule est la boule pleine prise dans son ensemble (l’orange entière). La définition suivante précise ces deux notions au niveau mathématique : D´ efinition 4.14. Une sphère de rayon r est notée Sr et une boule de même rayon est notée Br , et sont définies par Sr = {x | kxk = r} Br = {x | kxk ≤ r}.

S

B

Fig. 4.9. Différence entre sphère S et boule B

La proposition ` a démontrer consiste à vérifier que quel que soit la grande boule d’exigence ∀BR , il est toujours possible de trouver une sous-boule de conditions initales ∃Br tel que si le système commence à l’intérieur de cette

76


x(t)

BR

Br

Fig. 4.10. Trajectoire dans le cas d’un système stable.

sous-boule, x0 ∈ Br , alors x(t) ∈ BR . La trajectoire doit rester comprise dans la boule de grand rayon comme l’illustre la figure 4.10 Pour débuter la démonstration, un rayon R est choisi de manière quelconque. On examine alors la fonction de Lyapunov V (x) sur la sphère de rayon R et on définit son minimum m sur cette sphère SR . m = min V (x). x∈SR

SR

V =m

Br

Fig. 4.11. m représente le minimum de V (x) lorsque x parcourt la sphère SR .

Etant donné que V (x) est une fonction de Lyapunov, elle possède la propriété d’être continue et de s’annuler à l’origine. Par conséquent, il existe un rayon r, suffisamment petit, pour lequel, quel que soit x compris dans la boule Br , la fonction de Lyapunov V (x) (vue comme simple fonction du point x considéré) demeure inférieure à m. En d’autres termes, en se rapprochant de l’origine, il est toujours possible de trouver une petite région telle que, la valeur de la fonction soit très petite, et donc plus petite que la valeur m. En effet, la fonction de Lyapunov ne peut pas changer de manière brutale, en se dépla¸cant de la sorte, parce que la fonction de Lyapunov est continue. La petitesse de V provient alors de son annulation à l’équilibre. Afin de satisfaire ces deux contraintes, la valeur maximum de V , dans une région donnée comprenant le point d’équilibre, décroit nécessairement de plus en plus, au fur et à

4.7 Théorème de stabilité locale

77

mesure que cette région se rétrécit. Une coupe verticale illustre le phénomène a la figure 4.12. ` V (x) SR

m

0 Br Fig. 4.12. Coupe verticale de la conséquence de la continuité de la fonction de Lyapunov et de son annulation au point d’équilibre.

La stabilité découle alors de manière très naturelle, étant donné que la d V (x) ≤ 0, implique condition de décroissance de la fonction de Lyapunov, dt que V (x(t)) < m, puisque son maximum dans la boule BR est celui sur la sphère SR et donc correspond à m. La trajectoire ne peut donc pas traverser SR . Elle demeure dans la boule BR , pour les conditions initiales ∀x0 ∈ Br . La stabilité est donc bien démontrée. 4.7.2 Preuve de stabilit´ e locale asymptotique La stabilité asymptotique est plus difficile à établir. La fonction de Lyapunov est supposée strictement décroissante, c’est-à-dire que V˙ (x) < 0, ∀x 6= 0 et V˙ (0) = 0. Comme V ≥ 0 et V décroit, la fonction de Lyapunov tend vers une limite L qui est supérieure ou égale ` a zéro (V → L, L ≥ 0). Deux cas seront envisagés, (a) L = 0 et (b) L > 0. (a) Si L = 0 alors x(t) doit nécessairement converger vers zéro. Ceci provient du fait que la fonction de Lyapunov s’annule seulement à l’origine. La stabilité asymptotique est dans ce cas démontrée. (b) L > 0 Comme V (0) = 0 et V est continue, il est possible de trouver une petite boule Br0 telle que, pour tout point compris à l’intérieure de celle-ci, V est inférieur ` a L (se référer ` a l’explication donnée dans le cas de la stabilité, avec m au lieu de L). Ceci est représenté à la figure 4.13. Considérons W = BR \ Br0 . Ceci revient à enlever un noyau de taille r0 de la boule de taille R. Cette région est représentée en vert à la figure 4.14. L’hypothèse que V → L implique que la trajectoire reste à l’intérieur de cette région.

78

4 Stabilité au sens de Lyapunov V

L x Br0 a L. Fig. 4.13. Pour tout point dans Br0 , V est garantit inférieur `

ˇ V =L

W

d V dt

= −L1

Fig. 4.14. Une boule de taille r0 est extraite de la boule de taille R. On y défninit ˇ et la décroissance la plus lente de V . le minimum de V = L

¯ il est évident que 0 6∈ W ¯ et que W ¯ est En se restreignant ` a la fermuture W, un compact (ensemble fermé et borné). De part la compacité, il doit exister ˇ un minimum de V noté L, ˇ = min V (x), L ¯ x∈W

ˇ < L), (0 < L

¯ De plus, V < 0 pour tout point de W et de atteind en un point de W. ¯ W. Par conséquent une décroissance minimum de V est atteinte en un point ¯ i.e. particulier de W, d L1 = min − V (x) . ¯ dt x∈W En procédant ` a quelques calculs, on obtient Z t V˙ (x(t))dt = V (x(t)) − V (x(0)) 0

V (x(t)) =

Z

t

V˙ (x(t))dt + V (x(0))

0

Il est maintenant possible de borner l’évolution de V en se pla¸cant dans le scénario le plus défavorable, c’est-à-dire en supposant qu’en chaque instant la Rt d V > L1 . Par , 0 V˙ (x(t))dt < −L1 t et décroissance soit minimum : − dt

4.9 Stabilité globale

79

V (x(t)) < V (x(0)) − L1 t. ˇ Mais ceci contredit le fait Il existe donc un instant fini t1 tel que V (x(t1 )) < L. que la trajectoire reste dans W par hypothèse, impliquant ainsi nécessairement que L = 0. La stabilité asymptotique découle dès lors du cas (a).

4.8 Stabilit´ e exponentielle Nous connaissons la stabilité asymptotique : x(t) → 0 lorsque t → ∞ Cependant on veut garantir plus : D´ efinition 4.15. x = 0 est un point d’équilibre localement exponentiellement stable si ∃α > 0 et ∃λ > 0, ∃r > 0 tel que, ∀t > 0,

kx(t)k ≤ αkx(0)ke−λt ,

∀x ∈ Br .

4.8.1 Exemple : Dynamique des populations

4.9 Stabilit´ e globale Pour l’instant, nous avons exclusivement traité de propriétés locales, dans le sens que la conclusion du théorème de Lyapunov ne conclut que la stabilité en relation avec des conditions initiales comprises dans un voisinage du point. Par conséquent, le simple fait que V soit défini positif et que V˙ soit négatif dans tout l’ensemble d’état, ne garantit pas nécessairement que le système soit globalement stable. En d’autres termes, la stabilité locale signifie la stabilité pour ∀x0 ∈ BR0 et la stabilité globale celle pour ∀x0 ∈ Rn . La question est de savoir s’il suffit de remplacer BR0 par Rn et de vérifier les hypothèses du théorème de Lyapunov afin de conclure sur la stabilité globale du système. La réponse est non comme va l’illustrer l’exemple suivant :

x˙ 1 = 2x1 x˙ 2 = −x2 dont un candidat de Lyapunov est, V =

x21 + x22 . 1 + x21

Les courbes de niveau de cette fonction de Lyapunov sont représentées à la figure 4.15. Pour autant que V est inférieure à l’unité les courbe de niveau sont fermées et encerclent une région compacte. Dès que la valeur dépasse 1,

80

4 Stabilité au sens de Lyapunov 1.5

1

V = 1.4

0.5

V = 1.1

V = 0.9 -5

-10

5

10

-0.5

-1

-1.5 Fig. 4.15. Courbe de niveau de la fonction de Lyapunov V =

.

x2 1 1+x2 1

+ x22

les courbes de niveau ne croisent plus l’axe horizontal et ne sont donc plus fermées. Les solutions explicites du système sont, x1 (t) = x10 e2t x2 (t) = x20 e−t . Après elimination du temps, √ −1 x2 = x20 x10 x1 2 . En prenant une condition intiale particulière, √ −1 x2 = x20 x10 x1 2 x10 = 1.5 √ x20 = 2/ 1.5 ≈ 1.633, on obtient une trajectoire rouge qui est représentée en surimpression sur les courbes de niveau précédemment obtenues (figure 4.16). En outre, la courbe représentée continue indéfiniment sur la droite sans jamais sortir du premier quadrant ! Le système glisse donc vers l’infini bien que la valeur de la fonction de Lyapunov diminue à chaque instant. Elle diminue et tend asymptotiquemen vers un, mais sans jamais y parvenir. Le problème provient du fait que V = cte n’est pas une courbe fermée, c’est-` a-dire que la fonction V n’est pas radialement non bornée. Par conséquent il faut une condition supplémentaire, Th´ eor` eme 4.16. Pour que l’on puisse garantir que le théorème de Lyapunov concluse sur la stabilité globale d’un système, il faut d’une part que toutes

4.10 Fonction de Lyapunov pour les systèmes linéaires

81

1.5

1

0.5

-5

-10

5

10

-0.5

-1

-1.5

Fig. 4.16. Une solution particulière montre que V décroit ` a chaque instant le long de cette solution.

les hypothèses de ce théorème soient satisfaites, mais il faut également que la condition de bornitude radiale existe, c’est-` a-dire que V (x) → ∞

lorsque

kxk → ∞.

Le théorème suivant récapitule les conditions : Th´ eor` eme 4.17. S’il existe une fonction V telle que – V (x) > 0, ∀x 6= 0 et V (0) = 0 – kxk → ∞ ⇒ V (x) → ∞ d – dt V (x) < 0, ∀x 6= 0 alors x = 0 est globalement asymptototiquement stable.

4.10 Fonction de Lyapunov pour les syst` emes lin´ eaires La théorie de Lyapunov est une théorie très générale s’appliquant aussi bien aux systèmes non linéaires que linéaires. Il est intéressant d’interpréter sa signification en termes de représentation d’état des systèmes linéaires. Th´ eor` eme 4.18. Soit x˙ = Ax tel que ∀λ, ℜe(λ) < 0 (système stable au sens strict) alors ∀Q > 0, ∃P > 0 tel que AT P + P A = −Q

(4.4)

Preuve. Comme toutes les valeurs propres de la matrice A sont stables, eAt est une fonction décroissante telle que keAt k → 0, lorsque t → ∞. En choisissant Q > 0 (une matrice définie positive) nous allons construire une matrice P satisfaisant l’équation (4.4). Comme A et AT ont toutes les deux des valeurs propres ` a partie réelle strictement négative (matrices de Hurwitz),

82

4 Stabilité au sens de Lyapunov T

ketA QetA k ≤ ckQke2λt , pour tout t ≥ 0, o` u λ ≤ 0 est n’importe quel nombre réel tel que les valeurs propres de AT et A ont une partie réelle plus petite que λ. Ainsi, Z ∞ T etA QetA dt (4.5) P =− 0

est bien définie. De plus, AT P + P A = − =−

Z

∞

0

Z

0

∞

T T AT etA QetA + etA QetA A dt T

d(etA QetA ) dt dt T

= Q − lim etA QetA t→∞

=Q Remarque 4.19. Le théorème précédant permet de tester si une matrice est Hurwitz sans devoir calculer ses valeurs propres. Soit une matrice A réelle donnée. Fabriquons l’équation AT X + XA = −I, et résolvons là pour une matrice symétrique X. Ceci est une équations linéaire et donc l’élimination de Gauss doit aboutir à un résultat. En testant alors les mineurs principaux de X on peut conclure sur la stabilité de A. Ils doivent tous être strictement positif pour que la matrice A soit Hurwitz.

4.11 Stabilit´ e locale et lin´ earisation Une approximation locale de la dynamique du système autour du point d’équilibre permet, dans certains cas, de déduire la stabilité locale du système complet. Il s’agit de la méthode indirecte de Lyapunov. L’approximation au premier ordre du développement en série de Taylor de la dynamique est calculé, et seul le premier ordre du développement est retenu. Lorsque la dynamique est donnée par un champ de vecteurs (cf. chapitre 7) f (x), une matrice est obtenue pour caractériser le premier ordre. Son expression est donnée par, ∂f . A= ∂x x=0

Cette matrice possède des valeurs propres qui permettent de déduire la stabilité du système x˙ = Ax. La question est de savoir si elles peuvent également induire une conclusion sur la stabilité du système non linéaire x˙ = f (x).

4.11 Stabilité locale et linéarisation

83

Le théorème suivant donne les résultats que l’on peut garantir. Seul le cas o` u toutes les valeurs propres ont une partie réelle négative ou nulle avec certaines d’entre elles ayant une partie strictement nulle, n’est pas conclusif. Seul les termes d’ordre supérieur peuvent nous renseigner sur la stabilité du système non linéaire. Par contre, pour tous les autres cas, le premier ordre est suffisant. Th´ eor` eme 4.20. Soit x˙ = f (x), et on pose A = ∂f ∂x avec 0

Λ = λ(A)

– ∀λ ∈ Λ, Re(λ) < 0 ⇒ x = 0 est asymptotiquement stable. – ∃λ ∈ Λ, Re(λ) > 0 ⇒ x = 0 est instable. – ∀λ ∈ Λ, Re(λ) ≤ 0 et ∃λ1 Re(λ1 ) = 0 on ne peut pas conclure. Montrons ∀λ ∈ Λ, Re(λ) < 0 ⇒ x = 0 est localement asymptotiquement stable. Preuve.

∂f x + g(x) = Ax + g(x) x˙ = f (x) = ∂x x=0

Ceci n’est qu’une réécriture de x˙ = f (x) en isolant le terme de dépendance linéaire dans Ax et les termes d’ordre supérieur dans g(x). Comme les termes qui dépendent de manière linéaire de x sont isolés dans Ax, kg(x)k décroit plus vite que kxk : limx→0 kg(x)k kxk = 0. k g(x)k

γ3 kxk γ2 kxk γ1 kxk

r1

r2

r3

Fig. 4.17. Illustration de la dominance du terme linéaire Ax sur le terme non linéaire g(x).

Ceci signifie que pour tout γi > 0, il existe ri tel que pour tout x tel que kxk < ri ⇒ kg(x)k < γi kxk. Comme A est stable ∀Q > 0, ∃P > 0 AT P + P A = −Q

84


et donc en posant V = xT P x, avec x˙ = f (x) = Ax + g(x) V˙ = x˙ T P x + xT P x˙ = (Ax + g(x))T P x + xT P (Ax + g(x)) = xT (AT P + P A)x + g(x)T P x + xT P g(x) = −xT Qx + 2xT P g(x) De l’inégalité du produit scalaire : kaT bk ≤ kakkbk on déduit V˙ ≤ −xT Qx + kxkkP kkg(x)k Comme limx→0 kg(x)k/kxk = 0, ∀γ > 0, ∃r, ∀x ≤ r ⇒ kg(x)k < γkxk. V˙ < −xT Qx + γkP kkxk2 Sachant que −xT Qx ≤ −λmin kxk2 on a donc V˙ < −(λmin − γkP k)kxk2 Il suffit de choisir γ suffisamment petit afin que (λmin − γkP k) > 0. Ainsi pour le r associé au γ choisi, V˙ < 0, ∀x, kxk < r. Par conséquent, le système x˙ = f (x) est localement asymptotiquement stable. Les autres cas peuvent être également démontrés. Nous renvoyons le lecteur aux références [Vid93], [Kha02] et les références s’y trouvant. 4.11.1 Inconv´ enients de la m´ ethode indirecte La méthode indirecte de Lyapunov possède deux inconvénients principaux. Le premier est le caractère local du résultat. La stabilité que l’on peut conclure n’est valable que dans un voisinage du point d’équilibre. On ne peut pas garantir r très grand. Le second inconvénient est que la méthode est non conclusive lors de la présence de valeur(s) propre(s) à partie réelle nulle. Ces inconvénient n’apparaissent pas dans la méthode directe de Lyapunov. Le prix a payer est ka détermination de la fonction complémentaire V (x) possédant ` les bonnes propriétés.

4.12 Stabilit´ e exponentielle La stabilité asymptotique garantit que le système converge vers le point d’équilibre, lorsque le temps tend vers l’infini. Pourtant, nous avons aucun

4.13 Théorème d’invariance de LaSalle

85

moyen de quantifier la qualité de cette convergence, en particulier sa vitesse de convergence. Afin d’obtenir plus que la simple convergence asymptotique, il est possible d’introduire un concept plus exigeant que la simple stabilité asymptotique. Si l’état du système, lors de sa convergence, est compris dans une enveloppe qui décrois de manière exponentielle, la stabilité est qualifiée d’exponentielle. D´ efinition 4.21. x = 0 est un point d’équilibre localement exponentiellement stable si ∃α > 0 ∃λ > 0, ∃r > 0, α, λ, r ∈ R tels que, ∀t > 0,

kx(t)k ≤ αkx(0)ke−λt ,

∀x ∈ Br .

4.13 Th´ eor` eme d’invariance de LaSalle Bien que certains systèmes ont la caractéristique d’avoir une fonction de Lyapunov décroissante, mais pas pour autant strictement décroissante, (c’esta-dire V˙ ≤ 0 au lieu de V˙ < 0, x 6= 0), ils sont néanmoins asymptotiquement ` stable. L’objet de cette section est de présenter les conditions supplémentaires sur la fonction V et sa dérivée dans le temps pour garantir la stabilité asymptotique. De plus, l’outil qui sera présenté permet de traiter également la convergence vers un cycle limite. Nous verrons également que le caractère positif défini de V peut très bien être relaxé. Le théorème ne donnera pas une preuve de stabilité au sens de Lyapunov, mais un critère de convergence asymptotique ; ceci valant autant pour les points d’équilibre que pour les cycles limites. 4.13.1 Ensemble invariant M Avant de présenter le résultat à proprement parler, le concept d’ensemble invariant est exposé. Comme son nom l’indique, il s’agit avant tout d’un ensemble donné par la réunion de points de l’espace d’état. Le deuxième élément est le terme ”invariant”, et ici l’équation x˙ = f (x) prend toute son importance. Un ensemble invariant est un ensemble de points de l’espace d’état tel que toute trajectoire du système x˙ = f (x), ayant pour condition initiale un point de cet ensemble, reste indéfiniement à l’intérieur de cet ensemble. Ainsi, l’ensemble est constitué par un sous ensemble de conditions initiales telles que toutes les trajectoires issues de ces conditions intiales restent dans l’ensemble en question. D´ efinition 4.22. (flot) La solution du système x˙ = f (x) ayant comme condition initiale x(0) = x0 sera notée Φ(x0 , t) :

86


d Φ(x0 , t) = f (Φ(x0 , t)). dt Φ(x0 , t) signifie, qu’une fois la condition initiale x0 donnée, l’état x devient une fonction uniquement du temps Φ(x0 , t). On peut donc dériver cette fonction par rapport au temps, et cette dérivée doit correspondre à la dynamique a ce point f (Φ(x0 , t)). ` D´ efinition 4.23. (ensemble invariant) Un ensemble invariant M, pour un système dynamique x˙ = f (x), est défini comme un ensemble de conditions initiales, tels que la solution Φ(x0 , t) reste dans l’ensemble M ∀t, c.-` a-d. M = {x | x0 ∈ M ⇒ Φ(x, t) ∈ M

∀t ≥ 0}

M x0 Φ(x0 , t)

Fig. 4.18. Ensemble invariant M

4.13.2 Ensemble d’annulation de la d´ eriv´ ee de la fonction de Lyapunov Parallèlement ` a la notion d’ensemble invariant, celui des points pour lesquels V˙ s’annule est de première importance. Ceci n’a rien de surprenant, car un des objets de cette analyse est d’étendre la conclusion de la stabilité asymptotique au cas o` u V˙ ≤ 0 au lie de V˙ < 0 ; la différence entre les deux cas se situent dans la possibilité que V˙ = 0. L’ensemble en question est noté R et correspond mathématiquement à R = {x | V˙ (x) = 0} et il est représenté ` a la figure 4.19. Le théorème de Lasalle peut maintenant être énoncé. C’est un résultat de nature locale au sens o` u il nécessite la connaissance d’un ensemble compact pour toutes les conditions initiales. Th´ eor` eme 4.24. (Théorème d’invariance de LaSalle) Soit l > 0, et Ωl = {x | V (x) ≤ l} :


87

R = {x | V˙ (x) = 0}

Fig. 4.19. Ensemble R. C’est l’ensemble de points pour lesquels V˙ = 0.

– Ωl fermé et borné – ∀x ∈ Ωl on a V˙ ≤ 0 – R ⊂ Ωl et R = {x | V˙ (x) = 0} – M le plus grand ensemble invariant, M ⊂ R ⇒ ∀x0 ∈ Ωl , X (x0 , t) → M lorsque t → ∞. Remarque 4.25. Il est important de mentionner deux aspects important : 1. Il n’y est pas question de stabilité, mais uniquement de convergence. 2. La fonction V (x) n’est pas nécessairement définie positive. Le théorème de LaSalle donne la stabilité asymptotique d’un point d’équilibre lorsque la condtion V > 0, x 6= 0 et V (0) = 0 est explicitement ajoutée. Ce théorème possède l’avantage de s’appliquer à l’analyse de la convergence asymptotique vers un cycle comme l’illustre la figure 4.20 Ωl

cycle limite

Ωl

R

R

M

M point d’´ equilibre

Fig. 4.20. Le théorème d’invariance s’applique aussi bien aux points d’équilibre qu’aux cycles limites.

4.13.3 Exemple : le pendule simple On considère un simple pendule qui consiste en une masse m reliée par une tige de longueur unitaire ` a son axe de rotation. Il est soumis à un frottement visqueux proportionnel ` a la vitesse du pendule autour de son axe.

88


La position du centre de masse est donnée par x = sin θ et y = cos θ de telle sorte que son énergie cinétique s’écrit Ecin = 1/2m(x˙ 2 + y˙ 2 ) = 1/2mθ˙ 2 . On suppose également que la gravité agit dans le sens perpendiculaire à l’axe de rotation. Par conséquent, l’énergie potentielle s’exprime Epot = mg(1 − cos θ). A l’aide de ces deux quantités, nous pouvons établir la représentation d’état du modèle dynamique en appliquant le formalisme de Lagrange. Une seule coordonnée généralisée est dans ce cas nécessaire (` a savoir θ). Le lagrangien est donné par L = Ecin − Epot . De plus, une force généralisée Fθ = −bθ˙ s’applique également, o` u b ∈ R est un paramètre positif (b > 0) correspondant au coefficient de frottement. La formule de mécanique analytique d dt

∂L ∂ θ˙

−

∂L = Fθ ∂θ

conduit ` a ˙ mθ¨ + mg sin θ = −bθ. C’est une équation différentielle du second ordre qui se met sous la forme ˙ : d’état (avec x1 = θ et x2 = θ)

x˙ 1 = x2 x˙ 2 = −g sin x1 −

b x2 m

On aimerait maintenant obtenir une conclusion quand à la stabilité asymptotique de ce pendule en considérant une fonction de Lyapunov qui ne soit pas strictement décroissante. Considérons, par exemple, la fonction d’énergie complète du pendule V = Ecin + Epot =

1 ˙2 mθ + mg(1 − cos θ). 2

Cette fonction est positive pour autant que θ˙ et le second terme ne s’annulent pas simultanément. Par conséquent, V est nul pour θ 0 + 2kπ avec k ∈ Z. x= ˙ = 0 θ


89

Le système dynamique s’écrit x˙ = f (x) avec f1 (x) = θ˙ ˙ f2 (x) = −g sin θ − b/mθ, de telle sorte que ∂V ˙ ˙ − mg sin θθ˙ = −bθ˙ 2 ≤ 0. f = mθ(−g sin θ − b/mθ) V˙ (x) = ∂x Il faut insister sur le fait que l’inégalité ci-dessus n’est pas stricte étant donné que θ˙2 ne pénalise qu’une partie de l’état, à savoir θ˙ ; θ n’apparaˆıt pas a gauche de l’inégalité. ` Par conséquent, dans un voisinage de l’origine, les conditions de stabilités 1. V (x) = 0, x = 0 2. V (x) > 0, x 6= 0 3. V˙ ≤ 0 sont satisfaites. Le système est donc localement stable. Toutefois, le théorème de Lyapunov n’est pas conclusif quant à la stabilité locale asymptotique, étant donné que V n’est pas strictement décroissante et que V ne s’annule pas uniquement au point 0, 0. Toutefois, nous pouvons examiner l’ensemble R pour lequel V˙ = 0. Comme ˙ V = −bθ˙2 = −bx22 , l’ensemble R = { x1 , x2 | x2 = 0 } est une droite horizontale passant par l’origine. Afin d’obtenir le plus grand ensemble invariant M contenu dans R, il est nécessaire et suffisant que le vecteur f (x) définissant la dynamique soit tangent ou nul ` a cet axe horizontal. En d’autres termes, la seconde composante de f (x), c.-à-d f2 (x), doit être nulle. On obtient la condition g sin x1 = 0, conduisant a une multitudes de points isolé θ˙ = 0, θ = kπ avec k ∈ Z. ` La figure 4.21 représente les courbes de niveau de la fonction de Lyapunov, ainsi que les solutions pour deux valeurs du coefficient de frottement (b = 0 et b = 1). La masse est m = 1 et la gravité est égale à g = 10. L’axe horizontal R est représenté, lequel contient les points constituant l’ensemble invariant M inclut dans R. Ces points sont séparés en deux classes. Les points associés au minimum de V sont représentés en blanc et correspondent aux équilibres stables ; ceux représentés en noir sont associés aux points selles de la fonction V , et correspondent à des points d’équilibre instable. En effet, le gradient ∇V = mg sin(θ) mθ˙ , s’annule aux points θ = kπ, k ∈ Z, θ˙ = 0. Localement, autour de ces points, V est approximé par

90


10

10

5

5

0

0

-5

-5

-10

-10 -10

-5

0

5

10

-10

-5

0

5

10

Fig. 4.21. Plan de phase (θ selon l’axe horizontal et θ˙ selon la verticale), et lignes de contour de la fonction de Lyapunov pour le pendule. A gauche, le frottement est non nul. L’ensemble R pour lequle V˙ = 0 est représenté en jaune et le plus grand invariant M correspond aux points blancs (minimum de V ), et aux points noirs (extremum de V , points selle). A droite, le frottement est nul. Des solutions pour des choix de conditions initiales différentes sont également représentées.

¯ V ≈ (θ˙ − θ)

θ˙

T

¯ = (θ˙ − θ)

θ˙

T

 



∂∇V ¯ θ=0 ˙ ∂θ θ=θ, θ  ∂∇V ¯˙ ∂ θ˙ θ=θ, θ=0

− θ¯ θ˙

θ − θ¯ mg cos θ¯ 0 . 0 m θ˙

(4.6)

Aux valeurs θ¯ = 2kπ, la matrice dans l’expression (4.6) est l’identité et les deux valeurs propres sont égales à 1 ; c’est un minimum (points blancs). Aux valeurs θ¯ = 2kπ + π, la matrice à une valeur propre négative −1 et une valeur propre positive +1 ; c’est un point selle (points noirs). Dans la partie droite de la figure 4.21, le frottement est nul de telle sorte que V˙ = 0. Dans ce cas, chaque courbe de niveau de V est invariante. Etant donné que certaines de ces courbes de niveau ne sont pas fermées, le système n’est pas globalement stable. Néanmoins, l’origine est localement stable (mais pas asymptotiquement). En effet, dans un voisinage de l’origine, les courbes de niveau sont fermées et constituent des cycles. Pour V˙ ≤ 0 (frottement non nul, partie de gauche de la figure 4.21), le théorème d’invariance est appliqué en considérant divers ensembles compacts Ωl (fermés et bornés) pour lesquels V est inférieur ou égal à la quantité l. Lorsque V est supérieur ` a la valeur atteinte à un des points selles, les ensembles Ωl ne sont plus compacts. Le bord de Ωl est alors constitué par les courbes de niveau non fermées de V . Par contre, en prenant l < mg, par exemple

4.14 Méthodes de construction des fonctions de Lyapunov

91

l = mg − ǫ, l’ensemble ˙ (θ, θ) ˙ ≤ mg − ǫ, θ ∈] − π, π[} Ωmg−ǫ = {θ, θ|V est compact, invariant (parce que V˙ ≤ 0), et l’ensemble R ∩ Ωmg−ǫ ne comporte qu’un seul point qui est l’origine 0. L’origine est stable par rapport à cet ensemble de conditions initiales, mais elle n’est pas globalement stable, étant donné que lorsque la condition initiale n’appartient pas à cet ensemble, il n’est pas possible de connaˆıtre a priori vers quel point d’équilibre le système convergera, en se fondant uniquement sur la fonction de Lyapunov et ses propriétés. Toutefois, il est garantit que, globalement, le système converge vers un des points d’équilibre. En effet, lorsque θ0 et θ˙0 sont des valeurs initiales quelconques, un ensemble invariant compact contenant cette condition initiale peut être construit. Cet ensemble contient alors plusieurs points d’équilibre, et la conclusion suit du théorème d’invariance. En effet, le fait que V s’annule en plusieurs points d’équilibre n’a pas de conséquence, étant donné que V n’est pas exigé être positif défini. Seule la condition de bornitude est nécessaire, ce qui est le cas dans un compact donné (c.-à-d. ∃c > 0, c ∈ R tel que V < c). Cet argument inductif concernant la stabilité globale permet également de s’affranchir du fait fˆ acheux que la fonction V n’est pas bornée radialement comme le constat de l’existence de courbes de niveau non fermées nous l’a démontré.

4.14 M´ ethodes de construction des fonctions de Lyapunov La présente section présente trois méthodes de construction de fonctions de Lyapunov. Le trait commun de ces méthodes (et du reste de toutes les méthodes de construction de fontion de Lyapunov) est de procéder par construction/correction et essais/erreurs. En d’autres termes, il n’y pas de méthode constructive directe à proprement dit. Il s’agit de procéder de manière itérative en alternant entre, d’une part, imposer la première condition de positivité de la fonction de Lyapunov, et, d’autre part, imposer la seconde condition concernant la décroissance le long des solutions de la fonction de Lyapunov.

92


4.14.1 M´ ethode de Krasovskii La première méthode est celle de Krasovskii. Th´ eor` eme 4.26. Soit x˙ = f (x) tel que f (0) = 0. Définissons : A(x) =

∂f . ∂x

S’il existe un ouvert Ω ⊆ RN contenant l’origine 0 ∈ Ω, et que la matrice F (x) = A(x) + A(x)T < 0 est définie négative dans l’ouvert Ω (c.-` a-d. xT F (x)x < 0, ∀x 6= 0, x ∈ Ω) alors la fonction V (x) = f (x)T f (x). est une fonction de Lyapunov et l’origine 0 est localement asymptotiquement stable. Si de plus Ω = Rn et V (x) → ∞ lorsque kxk → ∞, alors x = 0 est globalement asymptotiquement stable. Ce théorème admet une certaine généralisation en considérant une équation de Lypaunov pour la matrice F (x). Th´ eor` eme 4.27. S’il existe un ouvert Ω ⊆ Rn , ainsi que deux matrices définies positive P > 0 et ∃Q > 0 telles que ∀x 6= 0, x ∈ Ω il est vrai que F (x) = A(x)T P + P A(x) + Q < 0 est une matrice définie négative, alors V (x) = f (x)T P f (x) est une fonction de Lyapunov, et 0 est localement asymptotiquement stable.. Si de plus Ω = Rn et V (x) → ∞ lorsque kxk → ∞, l’origine 0 est globalement asymptotiquement stable.

4.15 M´ ethode du gradient variable Si l’on connaˆıt ` a la foir le gradient de la fonction de Lyapunov et la fonction de Lyapunov ` a proprement dit, la relation V (x) =

Z

0

x

∇V (ξ)dξ

est valable entre ces deux quantités. Nous verrons dans le chapitre 6, que le gradient est une 1-forme que l’on écrit également sous la forme dV o` u la paramétrisation ξ n’est pas explicitment mentionée. Ainsi,

4.15 Méthode du gradient variable

V =

Z

93

dV,

ce qui devient une notation tout à fait explicite. Toutefois, tout vecteur ligne ne peut provenir d’un gradient. Nous distinguerons (i) un vecteur ligne qui est issu directement d’une fonction par dérivation (1-forme exacte) ; (ii) un vecteur ligne qui, une fois multiplié par une fonction arbitraire, devient une 1-forme exacte (1-forme intégrable) ; et finalement (iii) un vecteur ligne quelconque (une 1-forme quelconque). Par conséquent, il faut que les composantes respectent certaines conditions entre elles pour pouvoir provenir d’un gradient. Ce sont les conditions d’exactitude. Ainsi, on commence par paramétriser ∇V plutˆ ot que V , ∇V = [∇V1 , ∇V2 ]T . (dV plutˆ ot que V ). ∇V1 = a11 (x1 , x2 )x1 + a12 (x1 , x2 )x2 ∇V2 = a21 (x1 , x2 )x1 + a22 (x1 , x2 )x2 Ensuite, il faut respecter les conditions d’intégrabilité (ddV ∧ dV = 0, voir le chapitre 6) qui s’écrit dans notre cas ∂∇Vj ∂∇Vi = ∂xj ∂xi

(∗)

Tout en respectant ces conditions, on choisit la paramétrisation pour rendre négatif la dérivée de la fonction de Lyapunov V˙ < 0. Ensuite, on remonte ` a la fonction de Lyapunov en intégrant le grandient ∇V le long d’un contour quelconque. Comme la 1-forme est une différentielle exacte (voir chapitre 6), le processus d’inégration ne dépend pas du chemin d’intégration choisit (en effet, la fonction ne change pas de valeur selon le chemin emprunté, seul compte le point d’arrivée qui détermine la valeur de celle-ci). En conséquence, il est possible de figer certaines quantités à zéro en choisissant un chemin d’intégration particulier

V (x) =

Z

x1

Z0 x2 0

∇V1 (ξ1 , 0, . . . , 0)dξ1 + ∇V2 (x1 , ξ2 , 0, . . . , 0)dξ2 +

... + ...+ Z xn ∇Vn (x1 , x2 , . . . , ξn )dξn 0

94


Finalement, la nature définie positive de la fonction V est vérifiée (c.-à-d. V > 0). Exemple 4.28. Soit le système dynamique

x˙ 1 = x2 x˙ 2 = −x21 − x2 Pour obtenir une fonction de Lyapunov, nous commen¸cons par paramétrer son gradient. Pour simplifier quelque peu la tˆ ache, nous choisissons des combinaisons linéaires de l’état pour chacune des deux composantes du gradient. Par conséquent, ∇V = a11 x1 + a12 x2

a21 x1 + a22 x2 .

La condition d’exactitude (intégrabilité ”renforcée”, voir le chapitre sur la géométrie) s’écrit ∂∇V2 ∂∇V1 = x2 x1 a12 = a21 . Maintenant, la négativité de la dérivée de la fonction de Lyapunov (la deuxième condition) est imposée : V˙ = ∇V f = a11 x1 x2 + a12 x22 + (a12 x1 + a22 x2 )(−x21 − x2 ) = −(a22 − a12 )x22 − (a12 + a22 x22 )x21 + a11 x1 x2 − a12 x1 x2 En choisissant a12 < a22 et a22 > 0, le terme résultant en x22 est négatif. Toutefois, il demeure deux termes dont le signe est indéfini, à savoir a11 x1 x2 − a12 x1 x2 . En for¸cant l’égalité a11 = a12 , ils ne contribuent plus à la dérivée. Il ne reste plus qu’à discuter du signe du coefficient devant x21 . Ce facteur (a12 + a22 x22 ) doit être positif. Ceci est garantit pour autant que a12 > 0. En résumé nous avons les conditions a11 = a12 = a21 , a22 > 0, a12 > 0 et a12 < a22 ; la fonction de Lyapunov devenant après intégration et à un facteur 1/2 près : V = a12 x21 + 2a12 x1 x2 + a22 x22 . Il ne reste plus qu’à forcer la première condition, c.-à-d. la positivité de V . La fonction V est factorisée pour faire apparaˆıtre une matrice symétrique a12 a12 x1 x x . V = 1 2 x2 a12 a22

Pour garantir que la matrice centrale soit définie positive, il suffit que ses deux mineurs soient plus grand que zéro. Le premier est a12 qui est plus grand que

4.17 Résultat d’instabilité 2

95

zéro. Le second a12 a22 − a212 = a12 (a22 − a12 ) > 0 conduit à ce que a22 > a12 , condition déj` a rencontrée pour forcer la première condition. V est donc bien une fonction de Lyapunov car elle satisfait simultanément aux deux conditions V > 0, x 6= 0 et V˙ < 0.

4.16 R´ esultat d’instabilit´ e1 Déterminer l’instabilité peut être aussi important que d’établir la stabilité. Cependant, la tˆ ache est parfois plus simple étant donné qu’il suffit d’exhiber une condition initiale qui conduit à une trajectoire qui sort de la boule d’exigence de rayon R, plutˆ ot que de garantir que toutes les trajectoires demeurent dans la boule R pour une sous-boule (de rayon r) de conditions initiales, comme cela était le cas pour la stabilité. Nous présenterons trois résultats permettant d’identifier si un système est instable. Le premier consiste à vérifier que V croit, quelles que soient les conditions initiales. Th´ eor` eme 4.29. – ∃Ω ⊆ Rn , 0 ∈ Ω, V (0) ≥ 0 et V (x) > 0 ∀x ∈ Ω, x 6= 0 d V (x) > 0, ∀x ∈ Ω, x 6= 0 – dt ⇒ 0 est instable

La première condition (V (x) > 0) est de garantir la positivité de la fonction de test, et la seconde consiste à vérifier que cette fonction croit le long des solutions (V˙ > 0).

4.17 R´ esultat d’instabilit´ e2 Le second résultat particularise quelque peu les conditions et permet de détecter une plus large classe de systèmes instables que le premier résultat. Th´ eor` eme 4.30. – ∃Ω ⊆ Rn , 0 ∈ Ω, V (0) ≥ 0 et V (x) > 0 ∀x ∈ Ω\{0} d – ∃λ > 0, dt V (x) − λV (x) ≥ 0, ∀x ∈ Ω ⇒

0 est instable La seconde condition introduit un test indirect qui consiste à exprimer la dérivée en utilisant la fonction V elle-même. Comme cette fonction est scalaire, on aboutit ` a une équation différentielle avec un seul état V . Si le facteur de proportionnalité λ est plus grand que zéro, cela conduit à une croissance de V et donc ` a une instabilité.

96


4.18 R´ esultat d’instabilit´ e 3 : th. de Chetaev Comme mentionné plus haut, la condition de stabilité exige que quel que soit la condition initiale x0 appartenant à la boule Br la trajectoire résultante reste comprise dans la boule d’exigence BR et ce, quel que soit la boule d’exigence choisie. Par conséquent, il suffit d’exhiber une seule condition initiale par boule Br de taille suffisamment petite, pour laquelle la trajectoire du système sorte d’une certaine boule d’exigence BR . Le théorème de Chetaev permet d’aborder l’instabilité selon cet angle. L’idée consiste ` a envisager une région ressemblant à une sorte de tranche de gateau Ωl pour laquelle le candidat de Lyapunov V (on devrait dire le candidat de la fonction Chetaev) s’annule sur la partie de la tranche de gateau qui est coupée (V (x) = 0 pour x ∈ ∂Ωl ) ; et qui est croissante dans cette région (V˙ > 0). Pour les systèmes dont la dimention de l’état est plus grande que deux, une image de ”cone” généralise la notion de ”tranche de gateau”. La figure 4.22 illustre le concept. Th´ eor` eme 4.31. (Chetaev) ∃Ω ⊆ Rn et ∃Ωl ⊂ Ω – V (x) > 0, ∀x ∈ Ωl d V (x) > 0, ∀x ∈ Ωl – dt – 0 ∈ ∂Ωl – V (x) = 0, ∀x ∈ ∂Ωl ⇒ 0 est instable x2 Ω ∂Ωl Ωl 0

x1

Fig. 4.22. Figure illustrant le théorème de Chetaev

Preuve. L’explication consiste à remarquer que, d’une part, par le fait que V est forcé de s’annuler sur les cˆ otés de la tranche de gateau (V (x) = 0

4.19 Techniques de comparaison et majoration

97

∀x ∈ ∂Ωl ) et, d’autre part, comme la fonction V est croissante par hypothèse sur l’ensemble de la tranche (V˙ > 0, ∀x ∈ Ωl ), il est impossible que les trajectoires du système (celles commen¸cant à l’intérieure de la tranche Ωl ) sortent de la région bleue par les cˆ otés ∂Ωl (en rouge). Pourtant, il se pourrait qu’elles restent piégées à l’intérieure de la région bleue Ωl . Nous allons néanmoins montrer qu’il existe une certaine boule d’exigence suffisamment petite BR pour laquelle les trajectoires issues de l’intersection Ωl ∩ BR sortent de la boule BR . En chosissant le rayon R suffisamment petit (ce qui n’est nullement interdit et n’impose aucune condition supplémentaire), V est garantie bornée supérieurement à l’intérieure de la région Ωl ∩ BR , i.e ∃v ∈ R, 0 < v < ∞, V (x) < v, ∀x ∈ Ωl ∩ BR . Ceci est rendu possible par le fait que la fonction V est continue et s’annule à l’origine par hypothèse. D’autre part, et également par hypothèse, V est strictement croissante dans cette région le long des solutions du système. Ainsi, en supposant que les trajectoires ne sortent pas de BR , la fonction V évaluée le long de ces trajectoires (étant strictement croissante) finirait par dépasser la borne v en question, conduisant ` a une contradiction. En conséquence, toute trajectoire commen¸cant dans la région Ωl ∩ BR , (et en particulier pour une condition initiale arbitrairement proche du point d’équilibre), finit par quitter la boule d’exigence BR , exhibant de la sorte l’instabilité.

4.19 Techniques de comparaison et majoration Nous présentons dans cette section diverses techniques directes et indirectes de majoration permettant de déduire la deuxième condition V˙ ≤ 0 du théorème de stabilité de Lyapunov. Certaines de ces techniques, comme l’utilisation d’inégalités classiques ou le développement limité, rendent également possible la vérification de la nature définie positive du candidat de Lyapunov V (x), c.-à-d. la première condition de la défnition 4.10, au moins dans un voisinage. De plus, en renversant les inégalités, les résultats sont également applicables pour tester l’instabilité. Déterminer la stabilité par l’entremise d’un candidat de Lyapunov nécessite de tester la décroissance de la fonction V : V˙ ≤ 0

(4.7)

En effet, la deuxième condition de la définition 4.10 impose de vérifier cette inégalité. Malgré l’apparente simplicité de cette condition, un calcul direct à partir de la fonction V (x) et de la dynamique f˙(x) conduit à une égalité V˙ = m(x), o` u m(x) est une certaine fonction non-linéaire de x, ne permettant pas toujours d’établir facilement ce résultat.

98


Afin de vérifier m(x) ≤ 0,

(4.8)

la fonction m(x) est alors majorée par une nouvelle quantité m(x) ¯ > m(x), dont l’expression, plus simple, permet de déduire m(x) ¯ ≤ 0, et donc également (4.8) et (4.7). 4.19.1 Les formes quadratiques Pour les systèmes linéaires x˙ = Ax, nous avons vu à la section ?? que, , la fonction de Lyapunov, ainsi que sa dérivée, admettent une forme quadratique V = xT P x et V˙ = −xT Qx, o` u P et Q sont des matrices réelles symétriques définies positives. Cependant, l’utilisation des matrices définies positives est également applicable au cas non linéaire x˙ = f (x) à la fois pour estimer la fonction de Lyapunov V et sa dérivée. En effet, nous verrons qu’un développement limité caractérise localement ces fonctions par la présence de formes quadratiques définies positives et semi-définies positives. Nous rappelons quelque propriétés des matrices réelles symétriques définies positives et semi-définies positives. D´ efinition 4.32. Une matrice P dont les coefficients sont réels est dite strictement réelle symétrique positive définie lorsque les deux conditions 1. P = P T 2. xT P x > 0, ∀x 6= 0. sont satisfaites. Dans le cas d’une inégalité faible xT P x ≥ 0, la matrice P est dite positive semi-définie. Lemme 4.33. Les valeurs propres λ1 , . . ., λn d’une matrice symétrique définie (respectivement semi-définie) positive P sont toutes réelles λi ∈ R, i = 1, . . . , n, et positives 0 < λ1 ≤ λ2 ≤ . . . ≤ λn (resp. non négatives, 0 ≤ λ1 ≤ λ2 ≤ . . . ≤ λn ). Preuve. Soit v un vecteur propre de norme unité associé à une des valeurs propres que l’on notera λ. Comme par définition la matrice P est symétrique définie (resp. semi-définie) positive, la valeur xT P x est un nombre réel positif (resp. non négatif). Ceci est en particulier vrai pour x = v. Par conséquent, comme v T P v = v T (λP )v = λv T v = λ, toutes les valeurs propres λ sont réelles et positives (resp. réelles et non négatives).


99

Lemme 4.34. Si les valeurs propres λi et λj sont distinctes (λi 6= λj ), alors les vecteurs propres vi et vj associés a ` ces valeurs propres (P vi = λi vi et P vj = λj vj ) sont orthogonaux : viT vj = 0

i 6= j,

λi 6= λj .

Preuve. Supposons que viT vj 6= 0 et λi 6= λj . Comme vj est associé à λj viT vj =

1 T 1 T v (λj vj ) = v (P vj ). λj i λj i

(4.9)

1 T T (v P )vj . λi i

(4.10)

Comme vi est associé ` a λi , viT vj =

Etant donné que P est symétrique, les deux égalités (4.9) et (4.10) entraˆınent λi = λj , conduit ` a une contradiction ce qui implique viT vj = 0 dès lors que λi 6= λj . 4.19.2 Inflation et d´ eflation Les deux lemmes 4.33 et 4.34 conduisent alors à une représentation mentale d’une matrice définie positive par une sorte de ”ballon de rugby” à ndimensions. En conséquence, il est possible d’englober le ballon de rugby par un ballon homogène (en considérant l’axe le plus grand du ballon de rugby), et également d’y inscrire un ballon homogène à l’intérieur du ballon de rugby (en considérant l’axe le plus petit du ballon de rugby). Lemme 4.35. Soit P > 0 une matrice réelle symétrique définie positive. Il existe deux constantes réelles c, C ∈ R telle que cxT x ≤ xT P x ≤ CxT x. De plus, c = λ1 (la plus petite valeur propre de P ) et C = λn (la plus grande valeur propre de P ). Preuve. Le lemme 4.34 garantit l’existence d’une base orthonorm´ ee de vecP teurs propres vi ` a partir de laquelle la décomposition de x = ni=1 αi vi conduit a ` n n X X αi vi ) αi vi )T P ( xT P x = ( i=1

i=1

n n X X λi αi vi ). αi vi )T ( =( i=1

i=1

100


En tenant compte de l’orthonormalité des vecteurs propres choisis (viT vj = 0, i 6= j et kvi k = 1), n X xT P x = λi α2i , (4.11) i=1

Pn

2 i=1 αi

T

et en remarquant = x x, la propriété 0 < λ1 ≤ λi ≤ λn , garantie par le lemme 4.33, démontre les inégalités à partir de (4.11). Remarque 4.36. Le fait que les vecteurs propres sont orthogonaux permet d’éliminer les produits croisés viT vj , i 6= j. De plus, le plus grand axe du ballon de rugby correspond ` a la plus petite valeur propre λ1 . En effet, 1/c = 1/λ1 correspond au rayon du grand ballon homogène xT x = λ11 englobant le ballon de rugby xT P x = 1. De même, 1/C = 1/λn correspond au rayon du petit ballon homogène xT x = λ1n inscrit à l’intérieur du ballon de rugby xT P x = 1. 4.19.3 Le d´ eveloppement limit´ e Lorsque la fonction V˙ admet un développement en série, il est possible d’exprimer V˙ = −

n X n X

aij xi xj + R3 (x) + R4 (x) + . . . + Rn (x) + . . .

(4.12)

i=1 j=1

o` u les monˆ omes du second ordre ont été mis en évidence par rapport à ceux d’ordres supérieurs regroupés dans Ri , i = 1, . . . , ∞. Par convention, les degrés des de tous les monˆ omes de Ri sont de degré exactement égal ` a i (do Ri = i). Les techniques de développement se fondent alors sur le fait que si la matrice A = (aij ) est définie positive, alors il existe une certaine constante c > 0, c ∈ R, telle que V˙ < 0

∀kxk ≤ c.

En effet, les termes pouvant changer le signe de V˙ sont tous dans un des facteurs Ri . A cause du degré, tous les monˆ omes associés disons c¯xi xj xk . . . xl peuvent être factorisés sous la forme c¯(xi xj )xk . . . xl avec xi xj un des monˆ ome apparaissant dans la forme quadratique xT Ax. En choisissant kxk suffisament petit le facteur c¯xk . . . xl devient alors négligeable par rapport au coefficient aij T de P telle sorte que le terme x Ax domine par rapport au terme de perturbation i Ri . 4.19.4 La r´ eintroduction de V

Le résultat d’instabilité 2 (théorème 4.30) est fondé sur la comparaison entre la fonction V˙ et V elle-même. Si la dérivée de la quantité V est pro-


101

portionnelle (avec un facteur positif) à cette quantité V , alors cette quantité augmente exponentiellement. Il est ainsi intéressant, une fois le calcul de V˙ = m(x) effectué, d’essayer de réintroduire l’expression de V dans m(x). Si cela est possible, alors, en fonction du coefficient devant la fonction de V , cette quantité peut décroˆıtre au cours du temps. Lemme 4.37. Soit V une fonction définie positive quelconque (V (x) > 0, ∀x 6= 0, V (0) = 0) telle que ∂V f (x) = αV, V˙ = ∂x avec α ∈ R, alors

V (t) = V0 eαt .

Si α < 0, le système x˙ = f (x) est asymptotiquement stable. Preuve. En dérivant par rapport au temps V (t) = V0 eαt , l’expression V˙ = αV est vérifiée. L’expression V0 eαt conduit à ce que, lorsque α < 0, V (x(t)) → 0, et donc que x(t) → 0 lorsque t → ∞. 4.19.5 L’´ equation int´ egrale associ´ ee Sous certaines conditions de continuité (que nous avons admises dans l’introduction), l’équation différentielle ordinaire x˙ = f (x),

x(0) = x0 ,

donne lieu ` a une représentation équivalente sous forme d’équation intégrale Z t x(t) = f (τ )dτ τ =0

x(0) = x0 .

Par conséquent, des inégalités et des majorations sont applicables à l’intégrale, afin d’estimer les solutions de l’équation différentielle. Ce procédé s’applique également aux inégalités différentielles, lorsque la fonction V apparaˆıt de part et d’autre de l’inégalité. Elle est alors convertie en inégalité, o` u la différentielle disparaˆıt au profit de l’intégrale. Par exemple, en considérant une fonction V , V˙ ≤ αV devient

102


V (t) ≤ V (0) + α quel que soit le signe de α ∈ R. De même

Z

t

V (τ )dτ,

(4.13)

g(V (τ ))dτ.

(4.14)

0

V˙ ≤ g(V )

devient V (t) ≤ V (0) +

Z

t

0

Ce type de conversion permet alors d’utiliser les propriétés des inégalités intégrales du genre (4.13) et (4.14) afin de trouver des estimations pour la fonction V . En particulier, l’apparition de V à la fois à gauche de (4.13) et à droite, sous le signe d’intégration, rend l’estimation difficile. C’est pourquoi l’isolation de V d’un seul cˆ oté de l’inégalité est très commode. Lemme 4.38. Soit m(.) et v(.) des fonctions continues non négatives de R+ dans R+ , et c ∈ R un nombre réel non négatif c ≥ 0. Si Z t

m(t) ≤ c +

v(τ )m(τ )dτ,

t ≥ 0,

(4.15)

.

(4.16)

0

alors

m(t) ≤ c exp

Z

t

v(τ )dτ 0

Remarque 4.39. Ce lemme permet d’isoler m(.), apparaissant des deux cˆ oté de l’inégalité, dans le membre de gauche de l’inégalité, et sans le symbole d’intégration. Ce lemme et ceux de cette section sont appelés lemmes de (type) Bellman-Gronwall. Preuve. En multipliant (4.15) par la valeur non négative v(t) de part et d’autre de l’inégalité, l’inégalité ne change pas de sens Z t m(t)v(t) ≤ v(t) c + v(τ )m(τ )dτ , 0

Lorsque c > 0, le facteur entre crochets est strictement positif, de telle sorte qu’en divisant des deux cˆ otés par cette expression non nulle, l’inégalité ne change également pas de sens m(t)v(t) ≤ v(t), Rt c + 0 v(τ )m(τ )dτ

Maintenant, une intégration directe conduit à

(4.17)


Z Z t v(τ )m(τ )dτ − log c ≤ log c +

103

T

v(τ )dτ

0

0

entraˆınant (4.16). Pour le cas c = 0, nous pouvons appliquer le résultat valable pour c > 0 en choisissant une suite décroissante de nombre positif ǫi > 0 en posant successivement c = ǫi de telle sorte que (4.15) est valable pour tous ces choix. En passant ` a la limite ǫ → 0, nous obtenons m(.) = 0 identiquement, ce qui démontre le lemme. Lorsque le nombre c dépend explicitement du temps, le lemme devient Lemme 4.40. Soit m(.), v(.) et h(.) des fonctions continues non négative de R+ dans R+ , Si Z t m(t) ≤ h(t) + v(τ )m(τ )dτ, t≥0 (4.18) 0

alors

m(t) ≤ h(t) +

Z

t

v(τ )h(τ ) exp

0

Z

τ

t

v(ξ)dξ dτ.

(4.19)

De plus si h(.) est dérivable, Z t Z t Z t m(t) ≤ h(0) exp v(τ )dτ + h′ (τ ) exp v(ξ)dξ dτ. 0

0

s

Pour une démonstration, le lecteur est invité à consulter [LLM89]. Tout comme dans [LL69], on y trouvera également d’autres inégalités de ce type. 4.19.6 Quelques in´ egalit´ es standards Etant donné que des inégalités souvent complexes doivent être manipulées, faisant intervenir des opérateurs différentiels et intégraux, il est utile d’utiliser des résultats classiques afin de majorer (ou minorer selon le cas) les inégalités plus compliquées ` a l’aide de celles utilisant des expressions arithmétiques simples. C’est pourquoi nous présentons essentiellement trois types d’inégalités apparaissant très souvent en pratique pour établir des résultats de stabilité en commande non linéaire. In´ egalit´ e de Cauchy-Schwarz Cette inégalité découle du produit scalaire existant dans un espace vectoriel et provient du fait que | sin(α) |≤ 1 pour tout α ∈ R.

104


Lemme 4.41. Soit x = x1 x2 . . . xn √ En définissant, kxk = xT x, alors

n

un vecteur d’un espace vectoriel V .

| xT y |≤ kxkkyk. In´ egalit´ e du triangle C’est la généralisation en dimension n de la propriété que la somme des longueurs des cˆ otés adjacents d’un triangle est toujours plus grande que la longeur du cˆ oté restant. A nouveau, nous nous pla¸cons dans un espace vectoriel quelconque. Lemme 4.42. Soit x et y deux vecteurs non nuls d’un espace vectoriel V . Nous avons kxk + kyk ≥ k ± x ± y k. Les signes devant les vecteurs x et y n’ont pas d’importance dans le membre de droite. In´ egalit´ e arithm´ etique-g´ eom´ etrique La moyenne arithmétique n1 (x1 + x1 + . . . + xn ), est toujours au moins √ égale ` a la moyenne géométrique n x1 · x2 · . . . · xn : Lemme 4.43. Soit xi ∈ R∗+ , i = 1, . . . , n, une suite finie de nombre réels non négatifs. v un n uY 1X n xi . (4.20) xi ≥ t n i=1 i=1 Les deux moyennes, géométrique et arithmétique, sont des cas particuliers de moyenne Mf associée ` a une fonction f (x) dont on connaˆıt la fonction réciproque f −1 (x) : Mf = f −1

! n 1X f (xi ) . n i=1

Ainsi avec f (x) = x, Mx est la moyenne arithmétique, et avec f (x) = log(x), Mlog est la moyenne géométrique. L’inégalité (4.20) s’écrit donc aussi Mx ≥ Mlog .


105

Exercices 4.1. Th´ eor` eme de Krasovskii, Démontrer les théorèmes 4.26 et 4.27 4.2. Grue ` a portique 2D1 On considère une grue planaire à portique. Le chariot comporte une poulie guidant le cˆ able principal qui relie le moteur de treuillage (moteur principal fixé sur la structure fixe) ` a la charge. Le chariot supérieur peut également se déplacer sous l’action d’un autre cˆ able reliant le chariot au moteur secondaire (ce dernier est également monté sur la structure fixe). La charge peut ainsi se déplacer dans le plan. La longueur du cˆ able de treuillage est R et celui du cˆ able secondaire L. (i) Dessiner le système. Considérer tous les paramètres comme des valeurs normalisées ` a un. (ii) Etablir le modèle dynamique en se fondant sur l’hypothèse que les cˆ ables sont infiniment rigides et qu’ils peuvent transmettre à la fois les forces négatives et positives (en réalité un cˆ able ne peut que transmettre la force dans un seul sens, l’autre conduirait le cˆ able à être détendu). Les deux moteurs sont supposés idéaux et transmettent chacun un couple pur instantanément. L’entrée du premier moteur est le couple τ1 et celle du moteur secondaire τ2 . (iii) Poser comme loi de commande ¯ − R) τ1 = 1 − 2R˙ + (R ˙ ¯ τ2 = 1 − 2L + (L − L) ¯ L ¯ ∈ R sont des nombre réels fixes. Le terme 1 est nécessaire pour o` u R, compenser la force due ` a la gravité (toutes les constantes sont normalisée en particulier g = 1 et m = 1, ainsi que les rayons des poulies). (iv) Trouver le point d’équilibre naturel. En existe-t-il d’autres ? (v) Démontrer en linéarisant par la méthode du développement de Taylor (cf. chapitre sur la linéarisation si nécessaire) que le système est localement exponentiellement stable. (vi) Pour augementer le domaine de stabilité, considérer la fonction ¯ 2 + (L − L) ¯ 2 + R + L, V = Ec + Ep + (R − R) o` u Ec est l’énergie cinétique du système et Ep est l’énergie potentielle. Est-ce que cette fonction est positive à l’extérieur du point d’équilibre ? (vii) Montrer que V˙ ≤ 0. 1

Ce problème est une adaptation de l’article de B. Kiss, J. Lévine, J. et Ph. Mullhaupt A Simple Output Feedback PD Controller for Nonlinear Cranes, Proc. 39th IEEE Conference on Decision and Control, Sydney, Australia, December 2000, pp. 5097-5101.

106


(viii) Déterminer l’ensemble V˙ = 0. (ix) Déterminer le plus grand ensemble invariant compris dans cet ensemble. (x) En déduire les propriétés de stabilité globale, en particulier est-ce que la fonction V est radialement non bornée ? Envisager divers compacts invariants Ω et vérifier que V est bien borné inférieurement sur ces compacts. En particulier est-ce que V (x) ≤ l est-il un ensemble compact ? (xi) Illustrer l’ensemble des résultats obtenus à l’aide de simulations.

5 Passivit´ e

Le chapitre précédent a défini la stabilité de manière formelle. Pourtant, l’application directe de la définition présentait des difficultés. La nature même de celle-ci rendait son traitement difficile ; mais surtout le besoin de connaˆıtre de manière explicite la solution des équations différentielles représentant le système, a contraint de procéder par l’entremise d’une fonction supplémentaire (seconde méthode de Lyapunov). L’orgine de la réflexion était liée à la fonction d’énergie. Un système était stable lorsque, d’une part, la fonction d’énergie représente un minimum ` a l’équilibre et, d’autre part que cette fonction soit, soit conservée ou décroissante dans le temps. La stabilité asymptotique ne pouvant pas découler lorsque la fonction est conservée uniquement. Le présent chapitre consiste, en quelque sorte, à étendre le concept d’énergie ` a une plus large classe de système. Au chapitre précédent, seules les dynamiques dépourvues d’entrée ont fait l’objet d’une étude détaillée. Il s’agit ici d’envisager la présence d’une entrée u supplémentaire, x˙ = f (x, u). La présence, ` a la fois d’une entrée et d’une sortie de dimension compatible, complique cependant les interprétations. En effet, bien que l’énergie puisse avoir une tendance à décroˆıtre au cours du temps, il serait tout à fait possible, en utilisant la nouvelle entrée à disposition, de l’augmenter de manière arbitraire. Par exemple, lors d’une connexion entre systèmes, l’énergie peu passer d’un système ` a un autre suivant une sorte de résonance, bien que chaque système pris isolément fasse décroitre son énergie propre lorsque la connexion est rompue. Toutefois, il existe une classe de système pour lesquels bons nombres de choses se passent bien, en particulier un certain type de comportement se trouve maintenu quelles que soient les connexions. Cette particularité est remarquable, mais impose des restrictions importantes. Ce sont d’une part, la définition de cette classe de systèmes, ainsi que leurs propriétés et restrictions, qui seront maintenant étudiées.

108

5 Passivité Lyapunov d V dt

Système sans entrée : x˙ = f (x)

≤0

Passivité Système entrée-sortie :

x˙ = f (x, u)

d V dt

y = h(x)

≤ Puissance Fournie

Tableau 5.1. Tableau distinctif pour la stabilité et la passivité.

5.1 Notion intuitive Le système x˙ = f (x, u) y = h(x, u) possède ` a la fois une entrée u et une sortie y = h(x, u). L’entrée est utilisée pour injecter ou soutirer de la puissance. Un système est passif si lorsque de la puissance est soutirée, le soutirage se fait au détriment du stock interne d’énergie. Ainsi il ne peut pas y avoir de génération interne de puissance. Ce stock est en quel que sorte l’analogue de la fonction de Lyapunov du chapitre précédent. On le notera également V .

5.2 Exemple de syst` eme statique passif Les systèmes passifs les plus simples sont ceux qui ne comportent pas de dynamique. La sortie est directement fonction de la valeur de la grandeur d’entrée. Pour simplifier encore d’avantage la présentation, l’exemple considéré comporte une entrée d’une seule dimension et une sortie d’une seule dimension. Ainsi, pour que la puissance soit dissipée, il faut que le produit entrée sortie, c’est-` a-dire ui soit positif, afin que la puissance soit consommée et dissipée à chaque instant dans le système statique. L’exemple simple de la résistance électrique u = Ri

5.4 Exemple de système dynamique passif

109

est donné ` a la figure 5.1 et illustre parfaitement ce cas de système. Etant donné que le système est statique, la puissance est dissipée instantanément. Il n’y a pas la notion de stock interne de puissance. La fonction V est absente dans ce cas.

i i

u

u

Fig. 5.1. La résistance électrique est un système statique passif

Un simple calcul donne aisément ui = Ri2 et confirme que la puissance instantanée est effectivement instantanément dissipée dans la résistance électrique.

5.3 Syst` eme statique passif L’exemple de la simple résistance électrique peut s’étendre par analogie ` une plus large classe de systèmes. L’extension doit cependant prendre en a compte la nécessité de dissiper instantanément la puissance que donne le couple entrée-sortie. En conséquence, il est impératif que uy = g,

g>0

lors de la présence d’un système statique passif. Ceci signifie que la caractéristique statique doit nécessairement se trouver dans le premier et le troisième quadrant, conformément à ce qui est représenté a la figure 5.2. `

5.4 Exemple de syst` eme dynamique passif Lorsque le système comporte une partie dynamique, certaines variables d’état sont associées au système. Le produit de l’entrée par la sortie uT y, ne suffit plus pour caractériser la passivité.

110

5 Passivité y

u

Fig. 5.2. Représentation graphique d’un système passif statique : La caractéristique doit appartenir au secteur rerpésenté en vert solide.

En effet, la puissance peut être emaganisée dans les éléments dynamiques. Elle peut également être restituée à l’entrée du système. Pour mieux comprendre le phénomène, étudions un circuit électrique comportant que des résistances, inductances et capacités. Le circuit est représenté a la figure 5.3. `

il

R1

u

L

uc

C

R2

Fig. 5.3. Un circuit électrique RLC est un système dynamique passif.

Ce circuit peut recevoir de la puissance par l’entremise du couple entréesortie u et i. Cette puissance est alors dissipée partiellement dans les résistances et stockée dans les deux éléments C (capacité) et L (inductance). Le circuit peut également fournir de la puissance en entrée en diminuant sont stock interne d’énergie, en diminuant soit la charge dans la capacité soit le champ magnétique dans la bobine. Soit donc la fonction de stockage V =

1 2 1 2 Cu + Li 2 c 2 l

La dynamique du système est : dil + uc dt 1 duc + uc i=C dt R2

u = R1 il + L

5.6 Propriétés

111

En posant x1 = il et x2 = uc on arrive à la représentation d’état R1 1 1 u− x1 − x2 L L L 1 1 x2 x˙ 2 = x1 − C R2 C x˙ 1 =

On peut donc calculer l’évolution du stockage dans le temps : V˙ = Lx1 x˙ 1 + Cx2 x˙ 2 = ux1 − R2 x21 − x1 x2 + x2 x1 − = ux1 − R2 x21 −

1 2 x R2 2

1 2 x R2 2

En considérant la sortie y = il = x1 : V˙ = uy − g(x), avec g(x) = R2 x21 + R12 x22 Ainsi la puissance en entrée est – soit stockée – soit dissipée

5.5 D´ efinition diff´ erentielle de la passivit´ e L’exemple précédent rend possible une extension mathématique de la notion de passivité, tout comme cela a été le cas lors de la généralisation de la résistance électrique ` a une plus large classe de systèmes. D´ efinition 5.1. Soit le système, x˙ = f (x, u) y = h(x) S’il existe γ > −∞, V > γ, et, V˙ = uT y − g avec g ≥ 0, alors le système est passif.

5.6 Propri´ et´ es L’immense avantage des systèmes passifs est leur plasticité lors de connexion en tout genre. En effet, ces systèmes se comportent très bien lors de connexion

112

5 Passivité

en série, car les systèmes agissent en quelque sorte indépendammant de leur connexion. Mais ils se comportent également très bien lors de connexion à la fois en parallèle et en rétroaction. Ce dernier cas est important lors d’association de sous-systèmes passif en retour de sortie. 5.6.1 Connexion parall` ele Lors d’une connexion parallèle, u1

y1 V1 ,

g1 +

u

y

+

u2

V2 ,

g2

y2

chacun des deux systèmes comporte une fonction de stockage interne V1 et V2 respectivement et obéit à la définition 5.1. Ceci donne, V˙ 1 = uT1 y1 − g1 V˙ 2 = uT2 y2 − g2 V˙ = V˙ 1 + V˙ 2 = uT1 y1 + uT2 y2 − g1 − g2 = u T y1 + u T y2 − g1 − g2 = uT (y1 + y2 ) − g1 − g2 V˙ = uT y − g,

o` u l’on a fait l’usage de la particularité de la connexion parallèle. Le calcul montre donc que, si l’on considère V = V1 +V2 comme fonction de stockage associé ` a l’assemblage constitué par la connexion en parallèle des deux systèmes individuels, alors cet assemblage répond encore à la même définition 5.1, en utilisant cette fois-ci V = V1 + V2 et g = g1 + g2 . La passivité est donc maintenue !

5.6 Propriétés

113

5.6.2 Connexion par r´ etroaction La connexion par rétroaction est plus pernicieuse étant donné que les deux systèmes interagissent d’amont en aval et ceci à l’infini. Soit donc la connexion par rétroaction négative, u1

u -

y2

V1 ,

g1

V2 ,

g2

y1

y

u2

pour laquelle chacun des sous-systèmes constitutifs obéit à la définition 5.1. En tenant compte de la particularité de la connexion, V˙ 1 = uT1 y1 − g1 V˙ 2 = uT2 y2 − g2 V˙ = V˙ 1 + V˙ 2 = uT1 y1 + uT2 y2 − g1 − g2 = (uT − y2T )y1 + uT2 y2 − g1 − g2

= (uT − y2T )y1 + y1T y2 − g1 − g2 = uT y1 − y2T y1 + y1T y2 − g1 − g2

= u T y1 − g1 − g2 V˙ = uT y − g.

Et la même constatation que dans le cas de la connexion parallèle est déduite : Le système est passif avec comme fonction de stockage V = V1 + V2 et terme de dissipation g = g1 + g2 . Remarque 5.2. La propriété de maintenir la passivité après connexion par rétro-action negative de deux système passifs est extrêmement utile pour synthétiser des lois de commande. En effet, il est possible d’identifier des sous-systèmes passifs dans un système à commander. Lorsque ceci n’est pas directement le cas, un bouclage partiel peut transformer une sous-partie en une sous-partie passive. Lorsque le système complet admet (après bouclage) une décomposition en systèmes passifs (chaque sous-système est connecté aux autres par connexion parallèle, série ou par rétroaction négative) la stabilité sera garantie par les propriétés de connexion élaborées ci-dessus. Ceci permet de constituer une fonction de Lyapunov compliquée à partir de fonctions plus simples associées aux sous-parties passives. Nous examinerons de telles techniques dans la section consacrée à la synthèse.

114

5 Passivité

5.6.3 D´ efinition int´ egrale de la passivit´ e Il est également possible de donner une définition équivalente de la passivité sous forme intégrale ne faisant pas intervenir de notion différentielle. D´ efinition 5.3. S’il existe γ ∈ R, γ > −∞, V > γ et g ≥ 0 tel que si V˙ = uT y − g ceci implique ∃α ∈ R, α > −∞ Z ∞

u(τ )T y(τ )dτ > α

0

alors le système est passif. Remarque 5.4. Pour voir la correspondance entre les deux définitions, (il suffit de prendre g ≡ 0). En fait, la définition intégrale signifie qu’il est impossible en jouant sur l’entrée de rendre arbitrairement petit le stock interne d’énergie. Ce stock est borné inférieurement. Cette définition sera utilisée pour démontrer un lien important entre la propriété de passivité et la caractéristique fréquentielle associée aux systèmes linéaires par l’entremise de l’identité de Perseval.

5.7 Passivit´ e des syst` emes lin´ eaires SISO Les deux définitions de la passivité (définition 5.1 et 5.3), s’appliquent aussi bien aux systèmes linéaires que non-linéaires. Pour les systèmes linéaires, cette propriété peut se caractériser en fonction de la caractéristique fréquentielle. Soit une fonction de transfert donnée comme une fraction rationnelle en variable de Laplace s. G(s) =

bm sm + bm−1 sm−1 + . . . + b1 s + b0 sn + an−1 sn−1 + . . . + a1 s + a0

Il est possible de caractériser la propriété de passivité en fonction de la réponse harmonique du système. Th´ eor` eme 5.5. Le système G(s) =

Y (s) U(s)

est passif

⇔ ℜe[G(jω)] ≥ 0

5.7 Passivité des systèmes linéaires SISO

115

Remarque 5.6. Le résultat du théorème précédent n’a rien de surprenant si l’on considère un circuit électrique RLC, car le déphasage induit par un quelconque assemblage de tels éléments ne pourra jamais sortir de l’interval [− π2 ; π2 ]. Le plus étonant est que ceci soit le cas, quel que soit le système passif. Mentionnons, par ailleurs, que le problème inverse est encore plus intéressant : Remarque 5.7. La synthèse d’un système passif linéaire quelconque à l’aide d’un réseau électrique comportant uniquement des éléments R, L ou C est d’une complexité considérable. Ce problème a occupé le centre de la scène de la recherche dans le domaine au cours des trois premiers quarts de siècles du siècle dernier.

ℑ

ℜ G(jω)

Fig. 5.4. Diagramme de Nyquist d’un système linéaire SISO passif.

Exemple 5.8. Afin de confirmer la précédente remarque, le circuit éléctrique RLC est reconsidéré. La fonction de transfert est G(s) =

I(s) R2 Cs + 1 = U (s) R2 CLs2 + (R1 R2 C + L)s + R1 + R2

Les valeurs numériques suivantes sont choisies : R1 = 1, R2 = 10, C = 2.4, L = 1.2. Il est alors aisé de constater que la partie réelle de la réponse harmonique est ` a partie réelle positive, exhibant ainsi rien d’autre que la propriété des signaux périodiques de nature sinuso¨ıdale d’être déphasé d’un angle de valeur absolue toujours inférieure ou égale à π2 .

116

5 Passivité

Nyquist Diagrams

0.5 0.4 0.3

Imaginary Axis

0.2 0.1 0 -0.1 -0.2 -0.3 -0.4

G(jω)

-0.5 -1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

Real Axis

Fig. 5.5. Diagramme de Nyquist pour un exemple particulier de circuit électrique passif.

5.7.1 Preuve du lien entre passivit´ e et r´ eponse harmonique positive r´ eelle Pour démontrer le lien, considérons les signaux représentés à la figure 5.6.

Preuve.

u

y τ

t

G(s)

τ

Fig. 5.6. Illustration pour la démonstration de la passivité

Le système est soumis ` a un signal d’entrée non nul sur un horizon temporel de o ` a τ . L’entrée est nulle avant le temps initial t = 0 et ensuite abruptement arrêté pour tout instant t supérieur à τ . La sortie par contre n’a aucune raison de revenir ` a zero pour tout instant supérieur à τ . La clé de la démonstration réside dans le fait que le bilan de puissance sur tout l’horizon temporel est égal au bilan sur tout le spectre. Le célèbre théorème de Perseval est donc utilisé.

5.7 Passivité des systèmes linéaires SISO

Z

∞

u(τ )y(τ )dτ =

0

Z

∞

117

y(τ )u(τ )dτ

−∞

Z ∞ 1 Y (jω)U ∗ (jω)dω (Perseval) 2π −∞ Z ∞ 1 G(jω) | U (jω) |2 dω = 2π −∞ Z 0 Z ∞ 1 1 2 = G(jω) | U (jω) | dω + G(jω) | U (jω) |2 dω 2π −∞ 2π 0 Z 0 Z ∞ 1 1 =− G(−j ω ¯ ) | U (−j ω ¯ ) |2 d¯ ω+ G(jω) | U (jω) |2 dω 2π ∞ 2π 0 =

u(t) réel → U (jω) = U ∗ (−jω) | U (−jω) | = U (−jω)U ∗ (−jω) = U ∗ (jω)U (jω) =| U (jω) |2 2

donc

Z ∞ Z ∞ 1 1 G(−jω) | U (jω) |2 dω + G(jω) | U (jω) |2 dω 2π 2π 0 0 Z 0 1 ∞ G(−jω) + G(jω) 2 = | U (jω) | dω π 0 2 Z 1 ∞ = ℜe[G(jω)] | U (jω) |2 dω π 0 R∞ ℜe[G(jω)] ≥ 0, ∀ω > 0 ⇒ 0 u(τ )T y(τ )dτ > α, α > −∞ La démonstration procède maintenant par l’absurde, c’est-à-dire que l’on suppose que dans le système viole le principe que la partie réelle de la réponse harmonique puisse avoir une partie réelle négative. Ainsi supposons que dans la plage de fréquence ∃ω1 , ∃ω2 → ℜe[G(jω)] < 0} ∀ω ∈ (ω1 ; ω2 ). Ce cas de figure est représenté ` a la figure 5.7.

Z

∞

u(τ )y(τ )dτ =

ℜe[G(jω)]

ω1

ω2

ω

Fig. 5.7. La partie réelle est négative pour dans la plage fréquentielle ]ω1 ; ω2 [.

Il se pourrait, dès lors, que de l’énergie soit injectée dans cette bande de fréquence. Pire encore, nous pourrions arbitrairement augmenter cette énergie en jouant explicitement sur la fréquence du signal d’excitation. Ceci est représenté ` a la figure 5.8.

118

5 Passivité

| U (jω) |2

ω1

ω2

ω

Fig. 5.8. L’énergie dans la plage de fréquence ]ω1 ; ω2 [ est augmentée de manière arbitraire

En écrivant ceci de manière calculatoire, Z ∞ Z 1 ω1 u(τ )y(τ )dτ = ℜe[G(jω)] | U (jω) |2 dω (≥ 0) π 0 0 Z 1 ω2 + ℜe[G(jω)] | U (jω) |2 dω (< 0) ⇓ π ω1 Z 1 ∞ + ℜe[G(jω)] | U (jω) |2 dω (≥ 0). π ω2 De part le fait que la partie réelle est négative seulement dans la plage ]ω1 ; ω2 [, seul le terme du centre peut être rendu négatif. Toutefois, ce terme peut être rendu arbitrairement négatif et donc l’intégrale peut être rendue aussi négative que désirée. En conséquence, si ∃ω1 , ∃ω2 → ℜe{G(jω) < 0} ∀ω ∈ (ω1 ; ω2 ) on a, ∀α > −∞, ∃u(t) tel que, Z

∞

u(τ )y(τ )dτ < α.

0

En utilisantR la contraposée, (A ⇒ B ≡ A ⇐ B), ℜe{G(jω)} ≥ 0, ∀ω > 0 ∞ T a la conclusion 0 u(τ ) y(τ )dτ > α, (∀u(t)), et nous arrivons ` de la proposition, en utilisant la définition intégrale de la passivité ??

⇐∃α > −∞,

5.8 Syst` eme r´ eel positif Le théorème précédent conduit naturellement à définir une classe de systèmes linéaires en fonction de la partie rélle de leur réponse harmonique.

5.8 Système réel positif

119

D´ efinition 5.9. G(s) est réelle positive (RP) si, ℜe [G(s)] ≥ 0, ∀ℜe[s] ≥ 0; et strictement réelle positive (SRP) si, ∃ǫ > 0 tel que G(s − ǫ) est (RP). Th´ eor` eme 5.10. Une fonction de transfert G(s) est (SRP) ⇔ 1. G(s) est strictement stable (sans pˆ ole sur l’axe imaginaire) 2. ∀ω ≥ 0 ⇒ ℜe [G(jω)] > 0 Une démonstration de ce théorème peut être trouvée dans [Kha02]. 5.8.1 Degr´ e relatif et minimum de phase Quelques critères simples sont à disposition pour détecter les systèmes positifs réels, ou plus exactement pour rejeter ceux qui ne le sont pas. La fonction de transfert peut être mise sous forme de fraction rationnelle de polynˆ omes factorisés de telle sorte que les zéros et les pˆ oles apparaissent de manière explicite. Qm (s − zi ) Q G(s) = ni=0 (s − pi ) i=0

C’est en fonction de la caractéristique de ces pˆ oles et zéros qu’il est possible d’établir des critères de nécessité pour que la réponse harmonique ait la propriété de la définition 5.9. Deux notions jouent un rôle fondamental dans cette analyse. Il s’agit du concept de degré relatif et de minimum de phase. Le premier est défini comme la différence entre le nombre de pˆ oles et le nombre de zéros. D´ efinition 5.11. (degré relatif ) Le degré relatif noté do r est défini comme la différence do r = n − m o` u n est le nombre de pˆ oles de la fonction de transfert et m, le nombre de zéros. Etant donné qu’un système physique est causal, cette différence sera toujours considérée positive ou nulle. Caractéristique 5.12. Pour un système physique, le degré relatif est toujours positif ou nul, i.e. do r. ≥ 0.

120

5 Passivité

La deuxième notion est celle de minimum de phase. Elle joue également un rôle majeur lors de la commande de système par linéarisation entrée-sortie et sera abordée au chapitre 7. Cette propriété est liée à la position des zéros dans le plan complexe. D´ efinition 5.13. (minimum de phase) Un système linéaire est dit a ` minimum de phase si tous ces zéros ont une partie réelle strictement négative. i.e. Re(zi ) < 0, i = 1, . . . , m. Remarque 5.14. La définition précédente de la notion de système à minimum de phase est valable pour les systèmes linéaires uniquement. Une définition plus générale, ne faisant pas appel à la notion de fonction de transfert, existe et elle sera donnée au chapitre 7. Les quatre exemples qui suivent permettent, d’une part de se familiariser avec ces notions et, d’autre part, d’illustrer les conditions nécessaires pour la présence d’un système réel positif. Ces quatres exemples présentent chacun une fonction de transfert type. Les réponses harmoniques sont représentées a la fois dans le diagramme de Nyquist et dans le diagramme de Bode. Le ` diagramme de Bode comporte un graphique pour l’amplitude et un pour la phase. Exemple 5.15. Le premier exemple correspond à la fonction de transfert, G(s) =

1 , (s + 1)(s + 1)

dont la réponse harmonique est représentée à la figure 5.9. En examinant les notions introduites à la section précédente, on constate que le degré relatif vaut deux et ne comporte pas de zéro. Il est donc à phase minimale. Le système est également stable. Cependant la partie réelle de la réponse harmonique comporte toujours une partie rélle négative, comme le montre le diagramme de Nyquist et la phase du diagramme de Bode. Exemple 5.16. Le deuxième exemple, G(s) =

s+2 , (s + 1)(s − 1)

est de degré relatif 1, mais il comporte cette fois un zéro dont la partie réelle est négative. Un coup d’oeil sur les pˆ oles montre que le système est cependant instable, puisqu’un de ceux-ci se trouve en +1. La partie réelle de la réponse harmonique devient négative à partir d’une certaine pulsation comme l’illustre la figure 5.10. Ceci est logique étant donné que l’instabilité nécessite d’encercler le point −1. La réponse harmonique doit donc nécessairement entrer dans le deuxième ou troisième quadrant.

5.8 Système réel positif Bode de (s+2)/[(s+1)(s-1)] :-(

121

Nyquist Diagrams :-( 0.5

5 0.4

-5

0.3

-10

0.2

-15

Imaginary Axis

Phase (deg); Magnitude (dB)

0

-20 -100

-120

0.1 0 -0.1 -0.2

-140

-0.3

-160

-0.4 -0.5 -1

10

0

1

10

10

-2

-1.5

Frequency (rad/sec)

-1

-0.5

Real Axis

Fig. 5.9. Toute la réponse harmonique possède une partie réelle négative. Le degré relatif est do r = 2. Bode de 1/[(s+1)(s+1)] :-(

Nyquist Diagrams :-(

0

0.6

-10 0.4

0.2

-30 Imaginary Axis


-20

-40

0

-0.2

-50

-0.4

-100

-150

-0.6 -1

10

0

1

10

10

-1

Frequency (rad/sec)

-0.5

0

0.5

1

Real Axis

Fig. 5.10. Une partie de la réponse harmonique possède une partie réelle négative. Le degré relatif est do r = 1, mais le système est instable.

Exemple 5.17. Le troisième exemple, G(s) =

s−2 , (s + 1)(s + 1)

est stable et de degré relatif 1. Mais il comporte un zéro situé à 2, c’est-à-dire dans le demi plan complexe correspondant à une partie réelle positive. Le système n’est donc pas ` a phase minimale.

122

5 Passivité Bode de (s-2)/[(s+1)(s+1)]:-(

Nyquist Diagrams :-( 1.5

5 0 1

-10 0.5 -15

Imaginary Axis


-5

-20

150

0

-0.5

100 50

-1 0 -50

-1.5 -1

10

0

10

1

10

-2

Frequency (rad/sec)

-1

0

Real Axis

Fig. 5.11. Une partie de la réponse harmonique possède une partie réelle négative. Le degré relatif est do r = 1. Le système est stable, mais il n’est pas ` a phase minimale.

La réponse harmonique est représentée à la figure 5.11 et démontre, comme dans le cas de l’exemple précédent, que le système n’est pas réel positif. Exemple 5.18. Le dernier exemple G(s) =

s+2 , (s + 1)(s + 1)

est stable, de degré relatif 1. La fonction de transfert comporte un zéro dans le demi plan complexe gauche et donc représente un système à phase minimale. De plus, les deux pˆ oles ont une partie réelle strictement négative correspondant ` a système est stable. La réponse harmonique est représentée à la figure 5.12 et est à partie réelle positive sur tout l’ensemble des fréquence. Le système est donc positif réel. 5.8.2 Lien entre Lyapunov et syst` eme RP Les quatre exemples précédents suggère que les critères suivants sont nécessaires pour que le système soit réel positif. Caractéristique 5.19. Si la fonction de transfert est positive réelle, c.-à-d. ℜe [G(jω)] ≥ 0, ∀ω, alors 1. le degrés relatif est nulle ou égal à 1 ;

5.8 Système réel positif Bode de (s+2)/[(s+1)(s+1)] :-)

5

1

0

0.8

-5

0.6

-10

0.4

-15

Imaginary Axis


123

Nyquist Diagrams :-)

-20

0.2 0 -0.2

-20 -0.4 -40 -0.6 -60

-0.8

-80

-1 -1

0

10

10

Frequency (rad/sec)

1

10

-1

0

1

2

Real Axis

Fig. 5.12. La réponse harmonique est ` a partie réelle positive. Le degré relatif est do r = 1. Le système est stable. Il est également ` a phase minimale.

2. il n’y a pas de zéro ` a partie réelle positive (G(s) est à phase minimale) ; 3. le système est stable ; Il est alors intéressant de s’interroger sur la structure de la représentation d’état d’un système linéaire passif. Comme le système est nécessairement stable, l’équation de Lyapunov pour le système linéaire AT P + P A = −Q admet toujours une solution P > 0 pour tout choix de matrice Q > 0. La passivité est alors imposée par la relation entre l’entrée u et la sortie y en relation avec la solution P obtenue lors de la résolution de l’équation de Lyapunov. Une différence essentielle réside dans le fait quee choix de Q ne peut plus se faire complètement arbitrairement. Remarque 5.20. Le théorème et la preuve qui vont être présentés ci-après vont être simplifié quelque peu pour ne considérer que les systèmes linéaires qui, dans la représentation d’état, ne contiennent pas d’influence instantanée de l’entrée sur la sortie (c.-` a-d. D = 0 pour l’équation de sortie y = Cx + Du). Lemme 5.21. (Kalman-Yakubovich-Popov) Soit G(s) = C(sI − A)−1 B une matrice de transfert m × m avec m ∈ R correspondant a ` un système qui est a ` la fois commandable, rang B AB . . . An−1 B = n.

et observable,

rang C T AT C T . . . (AT )n−1 C T = n.

124

5 Passivité

Sous ces hypothèses, la fonction de transfert G(s) est strictement réelle positive si, et seulement si, il existe deux matrices symétriques définies positives P et Q telles que AT P + P A = −Q et P B = CT . La démonstration de ce lemme est assez compliquée (cf. par exemple [Kha02] et [Vid93] ainsi que les références ci trouvant). Toutefois, nous donnons quelques indications sur la démonstration. Preuve. (suffisance : ⇐) Par hypothèse il existe une matrice P symétrique définie positive (P = P T > 0) satisfaisant AT P + P A = −Q pour un certain Q > 0 (également symétrique). Etant donné que cette équation de Lyapunov est respectée, l’origine de x˙ = Ax est asymptotiquement stable. Par conséquent, A n’a pas de valeur propre ` a partie réelle strictement positive. Posons Φ(s) = (sI − A)−1 de telle sorte que G(s) + GT (−s) = CΦ(s)B + B T Φ(−s)C T . En utilisant le fait que P B = C T (par hypothèse), G(s) + GT (−s) = B T P Φ(s)B + B T ΦT (−s)P B = B T Φ(−s)T (ΦT (−s))−1 P + P (Φ(s))−1 Φ(s)B = B T Φ(−s)T ((−sI − A)T P + P (sI − A) Φ(s)B = B T ΦT (−s) −AT P − P A) Φ(s)B = B T ΦT (−s)QΦ(s)B,

o` u pour la dernière égalité, la propriété AT P + P A = −Q a été utilisée. On conclut ainsi que G(s + GT (−s) ≥ 0 pour autant que ℜ(s) ≥ 0. Le système est donc bien positif réel. (nécessité : ⇒) Comme la matrice de fonctions de transfert G(s) est connue, il est possible de la factoriser sous la forme G(s) + GT (−s) = T (s)T T (−s) par l’intermédiaire du lemme suivant : Lemme 5.22. Si une matrice V (.) est rationnelle propre de dimension m×m de telle sorte que V (s) = V T (−s) et V (jω) > 0, ∀ω, alors il existe une matrice stable rationnelle T (.) de dimension m × m telle que V (s) = T T (s)T (s), avec en plus rang T (jω) = m, ∀ω.


125

(Une preuve de ce lemme se trouve dans Anderson, B. D. O. and Moore, J. B. Optimal Filtering, Prentice-Hall, 1979 ; une illustration dans le cas monovariable est donnée ` a la remarque 5.23, après la démonstration.) Comme une réalisation de G(s) est supposée, par hypothèse, commandable et observable, ces deux propriétés sont également vraies pour T (s), de telle ¯ + Bu, ¯ sorte que la matrice T (s) admet une réalisation minimale x˙ = Ax −1 ¯ ¯ ¯ ¯ y = Cu avec T (s) = C(sI − A) B. ¯ ¯ −1 , Maintenant, en posant Φ(s) = (sI − A) ¯ T Φ¯T (−s)C¯ T C¯ Φ(s) ¯ B. ¯ T T (−s)T (s) = −B

(5.1)

Comme la réalisation est observable, il existe une matrice symétrique définie ¯ > 0 telle que positive R ¯+R ¯ A¯ = −C¯ T C. ¯ A¯T R De plus,

¯+R ¯ A¯ = (sI + A¯T )R ¯ − R(sI ¯ ¯ −C¯ T C¯ = A¯T R − A).

(5.2)

¯ En substituant cette expression dans (5.1), on obtient en utilisant Φ(s) = −1 ¯ (sI − A) : = = = =

T T (−s)T (s) ¯T Φ ¯T (−s) (sI + A¯T )R ¯ − R(sI ¯ ¯ Φ(s) ¯ B ¯ −B − A) ¯ T ((−sI − A) ¯ −1 )T −(−sI − A) ¯ TR ¯ − R(sI ¯ ¯ (sI − A) ¯ −1 B ¯ −B − A) T T −1 T −1 ¯ R ¯+B ¯ ((−sI − A) ¯ ) R(sI ¯ ¯ (sI − A) ¯ B ¯ B − A) T −1 T −1 T ¯ R(sI ¯ ¯ B ¯ +B ¯ ((−sI − A) ¯ ) R ¯B ¯ B − A)

¯T R ¯ Φ(s) ¯ B ¯ +B ¯T Φ ¯T (−s)R ¯ B. ¯ =B

(5.3)

D’un autre cˆ oté, en considérant une réalisation de G(s) (au lieu de celle de T (s)) donnée par x˙ = Ax+Bu, y = Cx avec G(s) = C(sI −A)−1 B, le produit T T (−s)T (s) s’écrit également sous la forme T T (−s)T (s) = G(s) + GT (s) = C(sI − A)−1 B + B T (−sI − AT )−1 C T (5.4) Comme toutes les valeurs propres des réalisations de G(s) et T (s) ont une partie réelle négative (les pˆ oles sont tous à partie réelle strictement plus petite que zéro de telle sorte que les valeurs propres de A et A¯ le sont également), il est possible d’identifier terme à terme les expressions (5.3) et (5.4). Le terme de gauche correspond ` a un système complètement stable, et celui de droite à un système ”symétrique” complètement instable. Les stables et les instables doivent donc être égaux ; on ne peut pas croiser les valeurs propres. On obtient par conséquent ¯ T R(sI ¯ ¯ −1 B ¯ = C(sI − A)−1 B. B − A)

(5.5)

126

5 Passivité

Finalement, en se souvenant que si deux réalisations minimales équivalentes ˜ B, ˜ C)) ˜ donnent la même matrice de transfert, alors il (disons (A, B, C) et (A, ˜ , existe une matrice de changement de coordonnée M telle que A = M −1 AM −1 ˜ ˜ B = M B et C = CM . L’expression (5.5) signifie qu’il existe une cer¯ , C = B ¯ T RM ¯ ¯ En taine matrice M telle que A = M −1 AM et B = M −1 B. −1 ¯ T ¯T ¯ conséquence, P B = P M B = M R B de telle sorte qu’avec ¯T M P = MT R l’équation P B = CT est respectée. En ce qui concerne la dernière propriété, à savoir établir AT P + P A = −Q avec Q une matrice définie positive, on considère une petite perturbation de la fonction de transfert G(s). En fait on utilise non pas G(s) directement mais G(s − µ) avec µ variant entre 0 et un petit paramètre δ > 0. Comme δ est choisi petit, G(s − µ) demeure strictement réel positif. Ceci revient ` a considérer ǫ Aǫ = A + I 2 pour un petit paramètre ǫ > 0 qui continue à satisfaire toutes les hypothèses. En utilisant Aǫ au lieu de A dans le raisonnement ci-dessus, et en adaptant les quantités M , R, A¯ en tenant compte du changement de A vers Aǫ , nous avons ¯ ǫT Mǫ + MǫT R ¯ ǫT Mǫ Aǫ ATǫ P + P Aǫ = ATǫ MǫT R −1 ¯ T T ¯T ¯ T Mǫ (M −1 A¯ǫ Mǫ ) = (Mǫ Aǫ Mǫ ) Mǫ Rǫ Mǫ + MǫT R ǫ ǫ ¯ǫ + R ¯ ǫ A¯ǫ )Mǫ = MǫT (A¯Tǫ R = −M T C¯ T C¯ǫ Mǫ ǫ

ǫ

Finalement, en revenant vers A, ǫ ǫ (A + I)T P + P (A + I) = −MǫT C¯ǫT C¯ǫ Mǫ 2 2 AT P + P A = −MǫT C¯ǫT C¯ǫ Mǫ − ǫP = −Q, et comme Q est visiblement définie positive, le résultat est démontré. Remarque 5.23. Pour illustrer la factorisation polynomiale utilisée dans la par1 tie de la suffisance, prenons le cas monovariable G(s) = s+a avec a > 0. La factorisation T (s) est obtenue en considérant √ √ 1 2a 2a 1 T + = = T (s)T T (−s). G(s) + G (−s) = s+a a−s s+aa−s Le lemme 5.22 indique que cette factorisation a également lieue en multivariable.


127

Remarque 5.24. La preuve du lemme montre la nécessité de la commandabilité et l’observabilité du système linéaire (A, B, C). Ces hypothèses sont utilisées a deux reprises. Premièrement pour garantir l’existence des réalisations mi` nimales de G(s) et T (s) permettant l’existence de la matrice de passage M , ¯+R ¯ A¯ = −C¯ T C¯ o` mais également lors de l’identité A¯T R u l’observabilité de la réalisation de T (s) est utilisée (découlant de celle de la réalisation de G(s)). Le théorème 5.25 (présenté ci-après) montre que la positivité réelle implique la passivité. Dans une certaine mesure, les hypothèses de commandabilité et d’observabilité sont alors clairement nécessaires. En effet, si ce n’était pas le cas, une combinaison d’état non observable ne pourrait pas avoir d’impact sur la sortie, ce qui permettrait en utilisant l’entrée u(t) de rendre arbitrairement R∞ petit l’intégrale −∞ uT (τ )y(τ )dτ en injectant de l’énergie dans la direction non observable, impliquant ainsi la non passivité selon la définition intégrale. Ces éléments seront abordés dans les exercices ? ?. Th´ eor` eme 5.25. Si un système linéaire x˙ = Ax + Bu, y = Cx admet deux matrices symétriques définies positives P et Q qui satisfont les deux équations AT P + P A = −Q P B = CT

alors le système est passif avec comme fonction de stockage interne V =

1 T x Px 2

g=

1 T x Qx. 2

et comme terme de dissipation

Preuve. Comme mentionné plus haut, la matrice A est stable, et l’équation de Lyapunov AT P + P A = −Q admet une solution P > 0 quel que soit le choix de la matrice Q > 0. Posons V (x) = 12 xT P x et calculons sa dérivée 1 T x˙ P x + xT P x˙ V˙ (x) = 2 1 (Ax + bu)T P x + xT P (Ax + bu) = 2 1 = xT (AT P + P A)x + ubT P x 2 1 = − xT Qx + ubT P x. 2 En conséquence, lorsque y = bT P x = cT x,

128

5 Passivité

on obtient 1 V˙ = − xT Qx + uy 2 = uy − g, de telle sorte que le système respecte bien la définition de passivité avec V =

1 T x Px 2

et g =

1 T x Qx. 2

Remarque 5.26. Plusieurs P sont nécessairement obtenus par résolution de la fonction de Lyapunov AT P +P A = −Q. Seule une sera telle que P b = c. D’un autre cˆ oté, en considérant uniquement l’équation P b = c, plusieurs possibilités existent, mais elles conduisent à de mauvais choix, étant donné qu’elles ne satisfont pas nécessairement AT P + P A = −Q. Par exemple, la symétrie de P n’a aucune raison d’être satisfaite.

5.9 Stabilit´ e absolue La stabilité traitée dans cette section apparaˆıt lorsqu’un système linéaire est bouclé par une non-linéarité statique. Cette classe de système a déj` a fait l’objet de l’étude par la méthode du premier harmonique dans le chapitre 3. Trois différences essentielles vont apparaˆıtre entre les deux traitements. 1. La non-linéarité appartient à un secteur. 2. La stabilité d’un point d’équilibre sera exclusivement traitée. 3. Les résultats ne seront pas approximatifs mais exacts. Nous commencerons pas définir le type de non-linéarité, puis nous donnerons une définition de ce type de stabilité. 5.9.1 Non-lin´ earit´ e statique de secteur D´ efinition 5.27. Une non-linéarité φ est une non-linéarité de type secteur [k1 ; k2 ] ∀y 6= 0 ⇒ k1 y ≤ φ(y) ≤ k2 y 5.9.2 D´ efinition de la stabilit´ e absolue Un système linéaire en représentation d’état est bouclé par une nonlinéarité statique u = −φ(y), o` u y est la sortie du système linéaire et u son entrée :

5.9 Stabilité absolue

129

φ(y) k2 y

k1 y y

Fig. 5.13. Un secteur délimite la région dans laquelle la non-linéarité statique peut se trouver.

x˙ = Ax − bφ(y)

(5.6)

y = cT x

La question de la stabilié que l’on va traiter s’énonce de la manière suivante. D´ efinition 5.28. Un système linéaire x˙ = Ax + bu avec y = cT x est dit stable de manière absolue vis-` a-vis de la non-linéarité φ de secteur [k1 ; k2 ], si le système (5.6) est stable quel que soit la valeur de la fonction statique comprise dans le secteur [k1 ; k2 ].

u

x˙ = Ax + bu

y = cT x

-

φ

Fig. 5.14. Diagramme de blocs représentant le système linéaire bouclé par une non-linéarité statique.

130

5 Passivité

5.9.3 Conjecture de M. A. Aizerman Le secteur définit un lieu de points à l’intérieur duquel la caractérstique statique non linéaire doit se situer. Si le secteur se rétrécit de telle sorte qu’il se confonde avec une droite lorsque k1 → k2 , la caractéristique statique devient un simple gain. Lorsque k1 6= k2 , le secteur est suffisamment large de telle sorte que plusieurs pentes k différentes peuvent y être inclues. Ainsi, la question est de savoir si ces divers gains, compris entre k1 et k2 , assurent la stabilité du système en boucle fermée. Etant donné que dans ce cas, l’ensemble est linéaire, l’analyse s’en trouve alors facilitée. Par conséquent, il se peut très bien que, pour tout gain fixe compris entre k1 et k2 , le système linéaire bouclé soit stable. Peut-on alors en déduire, après remplacement des gains fixes par une caractéristique statique quelconque comprise dans ce secteur, la stabilité du système bouclé ? Force est de constater que ceci n’est pas le cas, bien que cette conjecture soit très séduisante. Hypothèse 5.29. Si pour tout choix de gain k compris dans l’interval k ∈ [k1 ; k2 ], la matrice A − bcT k est Hurwitz, c.-à-d. que la partie réelle de chacune de ses valeurs propres est strictement négative, alors le système linéaire x˙ = Ax + bu, y = cT x bouclé par une non-linéarité secteur u = −φ(y) avec φ(y) appartenant au secteur [k1 ; k2 ] est stable. Cette conjecture est fausse comme il le sera illustré dans les exercices. Les restrictions sur le système linéaire doivent être plus sévères afin d’aboutir ` a une conclusion satisfaisante. Ceci fait l’objet du critère du cercle et du critère de Popov. 5.9.4 Crit` ere du cercle Bien que la conjecture d’Aizerman soit fausse, elle évoque une certaine vérité, ` a condition d’en modifier quelque peu l’énoncé. Il est nécessaire de définir un critère de stabilité de Nyquist plus exigeant. Le critère du cercle est une approche. L’idée est de représenter, non plus un point unique en −1, mais un cercle dont les paramètres sont fonctions des deux gains délimitant le secteur. En fonction du signe de ces gains, la réponse harmonique doit laisser le cercle à un certain endroit par rapport à lui. Th´ eor` eme 5.30. Un système entrée-sortie dont la réponse harmonique est définie par G(jω), bouclé par une non-linéarité statique de secteur [k1 , k2 ], est stable au sens absolu lorsque la réponse harmonique et le cercle D(k1 , k2 ) respectent certaines propriétés géométriques l’un par rapport a ` l’autre. En désignant par Card[{λ|ℜe[λ] > 0}] = ρ le nombre de valeurs propres a ` partie strictement positive associée a ` la fonction de transfert G(s), nous pouvons distinguer trois cas de figure :


131

1. Si 0 < k1 < k2 et G(jω) ne rentre pas dans le disque D(k1 , k2 ) et G(jω) encercle ρ fois dans le sens dans le sens trigonométrique positif, alors le système est stable au sens absolu.

G(jω)

D(k1 , k2 )

− k11

− k12

Fig. 5.15. Critère du cercle lorsque k1 > 0 et k2 > 0.

2. Si 0 = k1 < k2 G(s) et que tous les pˆ oles de G(s) ont une partie réelle strictement négative et que le réponse harmonique G(jω) se trouve a ` droite de la droite verticale défine passant par − k12 alors le système est stable au sens absolu.

G(jω)

− k11

Fig. 5.16. Critère du cercle lorsque k1 > 0 et k2 = 0.

3. Finalement, si k1 < 0 < k2 et que tous les pˆ oles de G(s) sont a ` partie réelle strictement négative et que G(jω) est entièrement inscrit a ` l’intérieur du cercle D(k1 , k2 ), alors le système est stable au sens absolu. Pour comprendre le critère du cercle, et ainsi en établir sa démonstration, il est important d’abord de comprendre le cas particulier du secteur φ ∈ [0, +∞]. On se situe dans le cas 2. o` u le cercle dégénère en une droite verticale. Le critère exige simplement que G(s) soit positif réel. Il s’agit alors de démontrer

132

5 Passivité

G(jω)

− k11

− k12

Fig. 5.17. Critère du cercle lorsque k1 < 0 et k2 > 0.

que sous ces conditions, le système est localement asymptotiquement stable au sens de Lyapunov. On commence par établir une représentation d’état à partir de la fonction de transfert G(s) = C(sI − A)−1 B. Dans le cas k1 = 0 et k2 = +∞, le cercle dégénère en l’axe imaginaire. Le critère du cercle exige de laisser le cercle à gauche. Par conséquent, ceci revient a admettre que G(s) est ` ` a partie réelle positive. On peut donc appliquer le théorème de Kalman-Yakubovich-Popov garantissant l’existence d’une fonction pouvant jouer le rôle d’une fonction de Lyapunov. Pour être plus précis, sous la condition que la partie rélle de la réponse harmonique est supérieure a zéro, il existe une certaine matrice définie positive P satisfaisant simul` tanément AT P + P A = −Q P B = CT . Il est important de noter que le choix de cette matrice est liée aux propriétés entrée-sortie donné par les matrices B et C. Pour aboutir ` a la stabilité dans le schéma bouclé ci-dessus, on considère la relation u = −φ(u) et la fonction de Lyapunov associée à P , c.-à-d. V = dont la dérivée temporelle

1 T x P x, 2


u

G(s)

133

y = cT x

-

φ ∈ [0; +∞]

Fig. 5.18. Diagramme de blocs de la cascade entre un système linéaire et une non-linéarité de secteur compris entre 0 et ∞.

1 1 V˙ = xT P x˙ + x˙ T P x 2 2 1 T T = x (A P + P A)x + xT P Bu 2 1 = − xT Qx + xT C T u 2 1 = − xT Qx − y T φ(u) 2 montre que sous la condition φ ∈ [0; +∞] (de telle sorte que y T φ(y) ≥ 0) la dérivée de la fontion de Lyapunov est strictement plus petite que zéro V˙ < 0

x 6= 0.

En conséquence, le théorème de Lyapunov assure la stabilité en boucle fermée quel que soit la non-linéarité statique compris dans le secteur délimité par k1 = 0 et k2 = ∞. Pour traiter le cas général, il suffit de construire des bouclages artificiels autour du schéma, afin de transformer la non-linéarité secteur [k1 ; k2 ] en une non-linéarité secteur [0; +∞]. Commen¸cons par modifier la non-linéarité φ de secteur [k1 , k2 ] en une nouvelle non-linéarité de secteur [0; k2 − k1 ]. Il suffit d’additionner en parallèle a φ un gain négatif de −k1 , c.-à-d. φ(u) − k1 u. Maintenant, l’inverse de la non` 1 linéarité ainsi obtenue conduit à une nouvelle, mais de secteur [ k2 −k ; +∞]. 1 1 Finalement, le redressement est opéré par addition en parallèle du gain − k2 −k 1 conduisant ` a une non-linéarité de secteur [0; +∞]. Les étapes précédentes sont résumée en un calcul, o` u l’on note [φ] pour l’opérateur entrée-sortie associé à la fonction φ(.) : 1 1 − [φ] − k1 k2 − k1

134

5 Passivité

En inversant cette expression, on obtient toujours une non-linéarité secteur [0; +∞], 1 [φ]−k1

1 −

1 k2 −k1

=

[φ] − k1 , 1 ([φ] − k1 ) 1 − k2 −k 1

mais qui se met sous la forme d’un bouclage représenté à la figure 5.19

1 k2 −k1

+ +

φ

+

-

k1

Fig. 5.19. Bouclages permettant de modifier une non-linéarité de secteur [k1 ; k2 ] en une non-linéarité de secteur [0; +∞].

En renversant le sens des bouclages et en les appliquants à la fonction de transfert G(s), tous les bouclages introduits se compensent parfaitement. En fin de compte, nous n’avons rien modifié (figure 5.20). Remarque 5.31. La clé consiste à introduire des bouclages sur la non-linéarité φ et des bouclages sur la partie linéaire G(s) dans le sens opposé, de telle sorte que la relation u = −y annule l’effet des bouclages. (Dans le bouclage initial, u est l’entrée de la non-linéarité φ et y la sortie du système linéaire G(s).) Les bouclages ne sont donc qu’artificiels et ne modifient en rien le comportement global du schéma initial. Toutefois, en redéfinissant les éléments φ et G(s) autour des bouclages nouvellement constitués, de nouveaux éléments φ¯ et ¯ G(s) font leur apparition. Ceci transforme G(s) en une nouvelle fonction de ¯ transfert G(s), entraˆınant de la sorte une nouvelle condition sur G(s). Ainsi, en examinant la figure 5.20 et en isolant la non-linéarité transformée par les bouclages, conformément à la figure 5.19, un nouveau système linéaire ¯ G(s) est identifié ¯ G(s) =

G(s) 1 = + 1 + k1 G(s) k2 − k1

1 k2 1 k1

+ G(s) + G(s)

k2 1 k1 k2 − k1

.

(5.7)

Démontrons le premier cas du critère du cercle o` u k1 > 0 et k2 > 0. Comme, d’une part, k2 > k1 (propriété de la définition du secteur), le second

5.9 Stabilité absolue 1 k2 −k1

1 k2 −k1

φ

G(s)

+

135

+

-

+

-

+ -

k1

+

k1

Fig. 5.20. Les bouclages introduits se compensent parfaitement conduisant le schéma ci-dessus ` a être identique au bouclage de G(s) par la non-linéarité φ.

¯ facteur du dernier membre de (5.7) est toujours positif, et, d’autre part, G(s) doit être strictement positif réel, nous aboutissons à la condition # " 1 k2 + G(jω) >0 ∀ω ∈ R. (5.8) Re 1 k1 + G(jω) 5.9.5 Crit` ere de Popov Le critère de Popov est, tout comme le critère du cercle, une exploitation de la propriété de passivité lors de l’interconnexion d’un système linéaire et d’une non-linéarité de type secteur. Nous donnons le résultat sans démonstration. L’utilisation du critère revient à tracer une droite dans un plan convenable et de garantir que la réponse harmonique G(jω) demeure du bon cˆ oté de la droite. Le plan consiste à représenter en abscissee la partie réelle de la réponse harmonique Re G(jω) et l’ordonnée la partie imaginaire multipliée par la pulsation ωIm G(jω). La droite passe par le point − k1 et possède une pente de α1 . ǫ représente la marge avant de toucher la droite. Th´ eor` eme 5.32. – ∀λ ℜe[λ(A)] > 0 et (A, B) commandable – Non-linéarité φ de type secteur – ∃α > 0 tel que ∀ω ≥ 0, ℜ[(1 + jαω)G(jω)] + k1 ≥ ǫ pour une certaine valeur ǫ > 0 ⇒ 0 est globalement asymptotiquement stable

136

5 Passivité

Exercices 5.1. Crit` ere du cercle. Démontrer à partir de la formule (5.8), le critère du cercle dans le cas 0 < k1 < k2 . Déterminer une formule analogue pour les autres cas, et montrer que ces formules admettent l’interprétation correspondant ` a l’énoncé du critère du cercle. 5.2. N´ ecessit´ e de l’observabilit´ e. Supposons qu’il ne soit pas possible de discriminer la sortie nulle de l’état nul pour un système linéaire ayant une réponse harmonique dans la partie droite du plan complexe. En somme, en for¸cant la sortie du système à zéro, il existe une trajectoire non nulle associée a une combinaison des états qui n’est pas identiquement nulle. Montrer que ` le système n’est pas passif dans ce cas. 5.3. N´ ecessit´ e de la commandabilit´ e. Discuter du cas o` u le système à commander (en représentation d’état) n’est pas commandable mais possède une sortie pour laquelle la fonction de transfert associée donne lieu à une réponse harmonique qui se situe dans le plan droit du plan complexe. Est-ce que le système obéit ` a la définition de la passivité ? 5.4. Crit` ere de Popov. Démontrer le critère de Popov. 5.5. La conjecture d’Aizerman est fausse1 . Considérer la fonction de transfert s(s + a) G(s) = ][(s + b)2 + 1.12 ] [(s + b)2 + 0.92 bouclée par une contre réaction négative sur une zone morte d’équation (u = φ(y) avec u l’entrée de G et y sa sortie).  y>1 y − 1 0 −1 ≤ y ≤ 1 φ(y) =  y + 1 y < −1

(i) Obtenir une réalisation d’état de la fonction de transfert G(s), et simuler l’ensemble en boucle fermée. Les valeurs nominales des paramètres sont k = 10, a = 0, et b = 0.01. (ii) Vérifier théoriquement que pour un gain constant compris entre 0 et 1 le système est stable. (iii) Remplacer la non-linéarité par un gain 0 et 1 et vérifier par simulation le résultat. (iv) En utilisant la non-linéarité en contre-réaction comme décrit plus haut et en faisant varier les paramètres suivant le tableau 1

Selon l’article de R. E. Fitts Two Counterexamples to Aizerman’s Conjecture, IEEE Trans. on Automatic Control, 1966, pp. 553-556.


137

a b k 0.1 ≤ k ≤ 1000 0 0.01 10 0 ≤ a ≤ 0.02 0.01 10 0 0.01 ≤ b ≤ 0.75 montrer par simulation que le système dynamique n’est pas stable et qu’il y a présence de cycles limites.

Partie II

Synth` ese

141

La partie précédente a été consacrée à l’analyse d’un système dynamique non linéaire. L’existence d’un bouclage y était admis sans savoir précisément comment il est obtenu. Dans ce chapitre et les suivants, la construction de la loi de commande sera examinée. L’objectif est d’améliorer le système à commander en performance (p. ex. suivi précis et rapide d’une trajectoire) ou en robustesse (p. ex. rejet de perturbations). Pour commencer, nous disinguerons principalement les problèmes de régulation et de poursuite. La régulation consiste ` a ramener le système vers un point d’équilibre. La poursuite consiste a suivre une trajectoire prédéfinie avec une erreure asymptotique nulle. En` suite, l’approche de linéarisation sera envisagée. Il s’agira de transformer le système initial en un ensemble de chaˆınes d’intégrateurs indépendants. Ainsi, la solution complète sera obtenue lorsque ces chaˆınes d’intégrateurs seront stabilisées. Nous avons donc un système donné comme un ensemble d’équations différentielles ordinaires du premier ordre x˙ = f (x). Lorsqu’on a ` a disposition, dans cet ensemble d’équations différentielles ordinaires, une variable xl que l’on peut instantanément modifier, on peut la désigner comme étant une entrée u. Bien entendu, nous devons faire attention à ce que la modification de cette variable puisse être physiquement réalisée dans la réalité. En effet, les équations différentielles ne sont qu’un modèle, et cette modification de l’entrée potentielle est sujette parfois à des hypothèses supplémentaires qui n’ont pas été prises en comptes pour élaborer le modèle. Si tel s’avère être le cas, il faut alors compléter les équations différentielles par les conditions négligées correspondantes et considérer l’entrée comme un état. (Il y aura donc des équations différentielles supplémentaires.) Une fois les entrées désigneées, nous pouvons également choisir des sorties particulières du système. Ce sont des fonctions de l’état correspondant le plus souvent ` a une grandeur particulière d’intérêt et mesurable dans la réalité. Mais il peut également s’agir d’une sortie ”artificielle”, au sens o` u l’objet de la réalité ne possède pas nécessairement les capteurs nécessaires pour mesurer cette grandeur. Nous verrons qu’il est possible de constituer de telles sorties et qu’elles sont très pratiques pour élaborer un mouvement d’ensemble de l’état par simple assignation de valeurs successives particulières à cette sortie. Bien qu’elle puisse ne pas être mesurée, il est possible au moyen d’une simple commande a priori d’assigner un tel historique à cette sortie et donc à l’ensemble de l’état. En conséquence, une fois les grandeurs d’entrée et de sortie désignées, les équations difflérentielles x˙ = f (x) s’écrivent avec les entrées ui , i = 1, . . . , m et et les sorties y1 , . . . yp comme :

142

x˙ = f (x, u1 , . . . , um ) y1 = h1 (x) .. .. . . yp = hp (x) Nous allons montrer dans le cours des chapitres de cette seconde partie comment nous pouvons fabriquer un nouvel ensemble d’équations différentielles ordinaires du premier ordre, non-linéaires qui constituera la loi de commande : z˙ = f¯(z, v1 , . . . , vp ) ¯ 1 (x) w1 = h .. . wm

.. . ¯ m (x). =h

Il est important de remarque que cet ensemble est purement artificiel et ne correspond pas nécessairement à une représentation d’un phénomène observable existant (contrairement au modèle de départ). Il pourra être réaliser dans un calculateur, ou par des module de synthèse analogiques ou biologiques, par construction de mécanismes particulier, etc. Afin que le controleur interagisse avec le système de départ, les entrées du système de départ seront assignées aux sorties du controleurs et réciproquement : u1 = w1 .. .. . . um = wm v1 = y1 .. .. . . vp = yp , ou de manière plus condensée : v = h(x) ¯ u = h(z). Nous avons comme cas particulier, i) l’assignation d’une trajectoire temporelle p(t) ` a l’entrée u (puisque pouvant instantanément être modifiée). Cette entrée est alors définie de manière univoque à chaque instant du temps u = p(t). Nous avons égalment le cas particulier ii) o` u le controleur est dépourvu de dynamique de telle sorte que v = x :

143

¯ u = h(x). Dans le premier cas i) on parlera de commande en boucle ouverte, ou de commande a priori, en fonction du contexte. Dans le second cas ii), il s’agit d’une loi de commande statique en boucle fermée (ou en contre-réaction). Dans le cas général la commande sera qualifiée de dynamique. Dans les deux cas, les solutions du système d’équations différentielles ordinaires non linéaires est modifié entre le cas o` u les entrées stont forcées à zéro et le cas o` u elles suivent une de ces lois de commande. Toute la question réside alors dans la manière d’élaborer cette commande afin d’atteindre un objectif, un but déterminé. Pour l’instant, nous n’avons pas mentionné ce que nous entendons par but ou objectif. Contrairement à l’analyse, o` u le système est en quelque sorte figé, la possibilité de définir plusieurs objectifs potentiels, chacun nécessitant une commande différente, conduit à l’existence d’une multitude de systèmes. Cette non fixité du système résultant rend la tˆ ache paradoxalement difficile et facile ` a la fois : difficile, car l’objectif est souvent très contraignant à cause de la complexité du système de départ ; facile, car la présence de plusieurs choix de commande augmente nécessairement les possibilités de synthèse. Il est important de souligner que la solution en fonction de l’objectif choisit n’est pas nécessairement unique. L’objectif est lié ` a ce que désire l’utilisateur de la représentation de la réalité qu’il a obtenu en définissant son système de départ. Ceci signifie que même lorsque le problème mathématique est résolut, et que la grandeur de commande est assignée sur le système réel selon la loi obtenue, il n’est pas garantit que l’évolution du vrai système mesuré et observé sur la réalité soit conforme avec les désirs du concepteur. Les raisons sont nombreuses et sont toutes essentiellement liées à la validité et l’applicabilité des équations différentielles utilisées pour représenter le phénomène. Ce que l’on peut dire néanmoins, c’est que la commande élaborée doit en quelque sorte améliorer le comportement du système mathématique, que cel` a soit la qualité de l’évolution temporelle des solutions, la structure des solutions, ou les caractéristiques du système transformé, comme par exemple, la nature et le nombre de points d’équilibres nouvellement formés ou détruits, la création de cycle limite avec des paramètres bien définis. Dans le cas oˆ u le modèle initial correspond fidèlement à l’observation de la réalité il y alors de grandes chances de succès, au sens o` u la modification, en suivant la loi de commande établie, de la grandeur réelle correspondant a l’entrée, conduise ` ` a l’observation du comportement désiré sur la réalité. Toutefois, il est important d’insister sur une réserve, une prudence qu’il faut observer.

144

En effet le modèle n’est qu’une représentation de la réalité sous les conditions d’expérimentation effectuées pour l’élaborer. Lorsque le controleur est activé, il se peut qu’il pousse le système réel au del` a des conditions dans lesquelles le modèle initial a été établit, conduisant à une catastrophe potentielle. Il est donc très important d’être prudent lors de la phase d’implantation. Il faut bien se rendre compte qu’il n’y a absolument aucun moyen d’éviter cette difficulté. Dans le cours des chapitres L’objectif sera un de ceux donnés ci-aprés : 1. forcer les trajectoires des états à converger de manière stable vers un point d’équilibre bien défini (c.-à-d. en présence de perturbations potentielles) ; 2. forcer une sortie préétablie (fonction particulière des états) à suivre une trajectoire choisie ` a l’avance pour un certain choix de conditions initiales et en absence de perturbation ; 3. même objectif que le précédent, mais en exigeant que ceci se produise quelque soit les conditions intiales et en présence de perturbation ; 4. amener le système d’un point de départ (état initial) vers un point d’arrivée final (état terminal), en l’absence de perturbation, et sans condition sur l’évolution de l’état durant la transition ; 5. amener le système d’un point de départ (état initial) vers un point d’arrivée final (état terminal), en présence de perturbations, et avec des conditions sur l’évolution de l’état durant la transition.

6 Elements de G´ eom´ etrie

6.1 Introduction Contrairement aux précédents chapitres, il ne sera pas question de système dynamique ` a proprement parlé. Le point de vue sera d’abandonner momentanément la conception du temps en tant que variable particulière (sauf mention explicite du contraire dans certains cas rares). L’idée est d’introduire des outils de formulation des conditions d’intégrabilité apparaissant à la fois dans le chapitre sur le problème de la linéarisation par bouclage et de celui concernant la construction de fonction de Lyapunov. Dans ces deux cas, la difficulté essentielle est de remonter à partir d’un vecteur ligne correspondant a un certain gradient vers la fonction dont le gradient est issu. La construction ` de la fonction n’est pas toujours possible et il est important d’avoir des outils permettant de déterminer la possibilité ou non de la construire. Le cadre mathématique adéquat est la géométrie différentielle. Cette discipline étudie les surfaces (variétés) selon un point de vue infinitésimal. Localement, une variété ressemble à un espace euclidien, au sens o` u une correspondance entre un point de la variété et un point d’un espace euclidien existe. La correspondance doit être continue et différentiable. L’inverse de la correspondance doit également être continue et différentiable. Toutefois, l’ensemble complet (consistant en la réunion des ensembles localement euclidien) ne possède plus la propriété euclidienne. Un exemple trivial est la surface d’une sphère. Il est en effet possible de représenter (moyennant distortion) la surface de la sphère par une carte plane. Chaque point de la sphère peut être mis en correspondance avec un point de la carte. Les méridiens et les parallèles sont alors perpendiculaires sur la carte (espace euclidien) bien que ceux-ci se coupent sur la sphère (espace non euclidien). De plus, il est impossible de représenter de manière continue l’ensemble de départ par une seule carte.

146

6 Elements de Géométrie

En effet, il faut décider quelles en seront les limites et on se heurte au problème suivant. Supposons une carte unique, de telle sorte qu’un point se trouvant ` a l’extrémité droite d’une carte possède un voisinage dans la variété qui n’est plus un ensemble connexe sur cette carte. Par exemple, si l’on prend une carte traditionnelle du monde, un voisinage de la taille de deux méridiens de large de l’atole de Funafuti un peu au dessus du dixième parallèle tout à droite de la carte se retrouve également partiellement représenté 40’ooo km à gauche sur la carte (ceci en faisant confiance à l’échelle de la carte) ! Pour garantir la continuité dans la lecture de la carte, il est nécessaire d’avoir recours a plusieurs cartes chacune pour une région particulière d’intérêt. En géométrie ` différentielle, tout comme en cartographie, un tel ensemble est appelé un atlas. Maintenant, si l’on considère la trajectoire d’un avion évoluant au dessus de la surface de la terre, on peut le représenter par une trajectoire sur la sphère (l’altitude de l’avion n’est pas considérée). Il y correspond également une trajectoire plane sur la carte. Une notion clé de la géométrie différentielle est que les vitesses d’un objet le long d’une trajectoire d’une variéte appartiennent toujours ` a un espace euclidien ! La courbure est en quelque sorte absente lorsqu’on considère les espaces des vitesses en un point de la variété. Si l’on considère un instant spécifique, l’orientation du vecteur de vitesse peut a priori prendre n’importe quelle orientation dans un certain plan dit plan tan` gent de la variété au point en question (on considère que l’on ne connait pas a priori la trajectoire avant l’instant et après l’instant spécifique lorsqu’on examine le point en question). De plus, le vecteur vitesse peut également prendre n’importe quel module (pour autant que l’ aérodynamique le permette). En somme, c’est réellement un vecteur appartenant à un espace euclidien propre aux vitesses. La difficulté est que cet espace euclidien change de point en point le long de la trajectoire. Nous verrons comment un système dynamique x˙ = f (x, u) est représenté a l’aide des outils géométriques de la géométrie différentielle. Il sera alors ` question de la variété dans laquelle l’état évolue, un peu comme les positions de l’avion sur la surface de la sphère, et des vecteurs de vitesses associés à cette représentation.

6.2 Vari´ et´ e, Cartes et Atlas Une variété M est un objet mathématique qui localement est représentable par un espace euclidien Rn . Une variété consiste en l’espace M avec une ensemble d’applications inversibles φi : Rn → M

(6.1)

6.2 Variété, Cartes et Atlas

147

o` u n représente la dimension de la variété. Ces cartes permettent de représenter un point de la variété m ∈ M par un ensemble de coordonnées de Rn . Un atlas Φ consiste en la réunion de toutes les cartes Φ = ∪i φi Par exemple, dans le cas d’une sphère S 2 , il est possible de représenter une courbe plane sur la surface de la sphère par une représentation bidimensionnelle ` a l’aide d’une carte. En effet, une courbe plane définie par x = sin t + 2 cos t y = cos t(1 − sin t) + 2 sin(2t) pour t ∈ [0; 2π[, est représentée à la figure 6.1. y 3 2 1

x -2

-1

1

2

-1 -2 -3

Fig. 6.1. Courbe paramétrée dans le plan.

Selon la manière de représenter la variété S 2 , il existe plusieurs représentations possibles de la carte φ1 . Si l’on considère la sphère comme plongée dans R3 , de telle sorte qu’un point est défini par trois coordonnées x ¯, y¯ et z¯ soumisent a la contrainte ` x ¯2 + y¯2 + z¯2 = 1, nous avons la représentation (6.2) o` u x et y sont les coordonnées sur la carte.   cos( y6 ) cos( x3 ) x φ1 : →  cos( y6 ) sin( x3 )  y sin( y6 )

(6.2)

Cependant, il est également possible d’utiliser les angles de latitude φ et de longitude ψ pour représenter un point de S 2 . Dans ce cas, la carte devient

148


φ1 :

x φ = x/3 → y θ = y/6

(6.3)

Dans les deux cas, la figure correspondant à celle 6.1 est donnée à la figure 6.2.

Fig. 6.2. Représentation dans la variété S 2 de la courbe planaire de la figure 6.1, donnée localement dans une carte de l’atlas.

La variété ne peut en général pas être décrite par carte unique, sauf lorsqu’elle peut se mettre en correspondance bijective avec un espace Rn . En effet, il est exigé de pouvoir garantir l’existence d’un voisinage inclut dans la carte. Par exemple, la sphère nécessite trois cartes, afin que chaque point possède au moins une carte dans laquelle le point en question admette un voisinage inclut dans la carte. (Ceci évite ainsi le problème de l’ˆıle de Funafuti décrit dans l’introduction du présent chapitre, ou plus précisément le problème des points qui sont représentés par les bords verticaux de cette carte unique.) Ceci entraˆıne également que plusieurs points de la variété admettent plusieurs représentants, au plus un par carte. (Ce problème est absent sur une carte traditionnelle unique du monde, si ce n’est pour les pˆ oles qui sont représentés par les lignes supérieure et inférieure délimitant respectivement le haut et le bas de la carte.) Il faut, par conséquent, que les cartes satisfassent des hypothèse de compatibilité. Lorsqu’une carte particulière est utilisée pour décrire un mouvement sur la variété, il doit être également possible, sur les zones de recouvrement entre les deux cartes, de le représenter à l’aide de la carte qui n’est pas utilisée. Ainsi, si φi et φj admettent chacune un représentant du même point m ∈ M, disons respectivement xi et xj , alors il doit exister deux voisinages Vi et

6.2 Variété, Cartes et Atlas

149

Vj de xi et xj qui peuvent se mettre en correspondance à l’aide des carte φi et φj . Plus précisément, φ−1 j (φi (Vi )) = Vj

φ−1 i (φj (Vj )) = Vi . Un ensemble de carte φi constituant un atlas ayant ces propriétés de compatibilité définit complètement la variété M. 6.2.1 Diff´ eomorphisme Les cartes correspondent à des applications entre un espace euclidien et la variété M. En composant une carte par l’inverse d’une autre, nous obtenons, sur les zones de recouvrement, un changement de coordonnée. Les cartes se composent de manière univoque à condition que les changements de coordonnées soient bien définis. Nous aurons également besoin de changements de coordonnées dans le chapitre consacré à la linéarisation. Il seront motivés également par la volonté de compenser les courbures inhérentes à la représentation du système initial, un peu comme les cartes d’un atlas classique remédie quelque peu ` a la courbure intrinsèque de la surface de la terre. Une trajectoire rectiligne et plate sur la carte correspond à une trajectoire courbe dans l’espace d’origine, dans l’espace de la variété M. De manière générale, la notion de changement de coordonnées est rendue mathématiquement précise par la définition suivante : D´ efinition 6.1. (Difféomorphisme) Une fonction Φ : Rn → Rn définie dans ∂Φ ∂Φ , . . . ∂x existent et si Φ−1 une région Ω est appelée difféomorphisme si ∂x 1 n −1 existe. De plus Φ et Φ doivent être dérivables. Si Ω = Rn alors c’est un difféomorphisme global. Lemme 6.2. Soit Φ(x) une fonction régulière de Ω ⊆ Rn → Rn . Si ∂Φ ∂x est non singulière en x0 alors Φ(x) est un difféomorphisme dans une sous région de Ω contenant x0 . Exemple 6.3. Soit l’application de R2 dans R2 donnée par 2x1 + 5x1 x22 Φ(x) = 3 sin x2 de telle sorte que sa matrice Jacobienne ∂Φ 2 + 5x22 10x1 x2 = 03 cos x2 ∂x

150


devienne au point (0, 0)T ∂Φ = ⇒ ∂x

20 . 03

Comme cette matrice est plein rang au point considéré, Φ respecte les conditions de la définition de difféomorphisme dans un voisinage du point (0, 0)T considéré. On peut également démontrer que ce voisinage est contenu dans l’ensemble Ω = { (x1 , x2 ), | x2 |< φ2 }.

6.3 Solution de l’´ equation diff´ erentielle L’équation initiale x˙ = f (x, u) admet l’interprétation géométrique suivante. L’état x est assimilé à un point d’une variété. Le plus souvent, cette variété est considérée comme l’espace euclidien Rn . Comme cas particulier de l’équation définissant la dynamique du système, considérons x˙ = f (x). Une solution à cette équation différentielle ordinaire est une courbe paramétrée par le temps x(t) = Φ(xo , t) telle que Φ(x0 , t0 ) = x0 etre t. Ainsi, et dφ dt (x, t) = f (Φ(x0 , t)) pour chaque point valeur du param` on peut attacher en chacun des points de la courbe paramétrée Φ(x0 , t) un vecteur tangent ` a cette courbe f (x0 , t). Trouver la solution de l’équation différentielle ordinaire x˙ = f (x) revient donc ` a trouver une trajectoire dans la variété dès lors que f (x) est donné. Cette trajectoire est une courbe paramétrée Φ(x0 , t) associée à une certaine condition initiale x0 . La donnée du système d’origine f (x) est interprétée géométriquement comme un ensemble de vecteurs de vitesse définit sur la variété. Il existe un vecteur f (x) et un seul pour chacun des points x de la variété. Trouver la solution à l’équation différentielle ordinaire consiste à trouver une courbe paramétrée Φ(x0 , t) (c.-à-d. une trajectoire) passant par x0 ` a l’instant t0 et telle que la vitesse le long de la trajectoire dΦ dt (Φ(x0 , t)) soit égale au vecteur de vitesse en ce point f (Φ(xo , t)). Le paramètre t permettant d’identifier le point sur la trajectoire.

6.4 Champ de vecteurs Lors de l’étude des systèmes dans le plan de phase, l’interprétation de la dynamique f (x) fait apparaˆıtre l’importance de représenter l’élément de droite de pente correspondant au rapport entre f2 (x1 , x2 ) sur f1 (x1 , x2 ) en un maximum de nombre de points x. Plus l’ensemble est grand et plus le nombre d’éléments de droite est également important, meilleure est l’interprétation des trajectoires résultantes. Dans le plan de phase il y a deux états x1 et x2 et la dynamique s’écrit

6.5 Espace dual

x˙ 1 = f1 (x1 , x2 ) x˙ 2 = f2 (x1 , x2 )

151

(6.4)

Mathématiquement on peut considérer x1 et x2 comme les coordonnées d’un point, et f1 (x1 , x2 ) et f2 (x1 , x2 ) comme la composante d’un vecteur définit en ce point. De manière plus générale, et quel que soit la dimension de la variété (espace), f (x) représente un vecteur en un point donné de cette variété. Si maintenant on considère la variété dans son entier, il est possible de se constituer une image visuelle d’une infinité de vecteurs, chaque vecteur f (x) étant attaché au point x. Ce concept est un champ de vecteurs. D´ efinition 6.4. On appelle champ de vecteur une fonction f : Rn → Rn    x1 f1 (x1 , x2 , . . . .xn )  x2   f2 (x1 , x2 , . . . , xn )       ..  →   ..  .    . 

xn

fn (x1 , x2 , . . . , xn )

D´ efinition 6.5. Un champ de vecteur est dit régulier si existent en tout point défini par x1 , x2 ,

∂f1 ∂x1 (x1 , x2 )

et

∂f2 ∂x2 (x1 , x2 )

6.5 Espace dual En chaque point de la variété, un espace vectoriel existe contenant les vecteurs tangents ` a la variété. Il est donc naturel de constituer l’espace dual de cet espace vectoriel. Nous rappelons brièvement, dans cette section, la notion d’espace dual ` a un espace vectoriel quelconque. En algèbre linéaire, il est possible d’associer un ensemble d’applications associées ` a un espace vectoriel arbitraire V . Chaque application prend comme argument un vecteur et retourne un nombre scalaire. D´ efinition 6.6. (Espace vectoriel dual V ∗ ) L’ensemble des applications Φ:V →R et linéaire en l’argument x, a ` savoir quel que soit α, β ∈ R Φ(αx1 + βx2 ) = αΦ(x1 ) + βΦ(x2 ), constitue l’ensemble des vecteurs d’un espace vectoriel. Cet espace vectoriel appelé le dual de l’espace V , et il est noté V ∗ .

152


La propriété de linéarité implique que ces applications constituent également un espace vectoriel que l’on désigne par V ∗ . En effet, en considérant une base orthonormée e1 , e2 , . . ., en de l’espace vectoriel V , une application linéaire f de V ∗ agit sur les vecteurs de bases pour fournir n nombres réels f (e1 ), f (e2 ), . . ., f (en ). Il est alors possible de représenter f , non plus comme une application linéaire en tant que telle, mais sous la forme d’un vecteur ligne f (e1 ) f (e2 ) . . . f (en ) . (6.5)

La valeur de l’application f pour un vecteur x de V est alors donnée par le produit scalaire entre le vecteur ligne (6.5) et le vecteur x. Par conséquent, f est équivalent ` a un vecteur ligne, ce qui prouve que V ∗ est bien un espace vectoriel.

6.6 Produit tensoriel et forme multilin´ eaire L’espace des formes linéaires d’un seul argument (appartenant à un espace vectoriel V ) forme donc un espace vectoriel à part entière, noté V ∗ . En effet, à chaque forme linéaire, un vecteur ligne est associé, et réciproquement, comme cel` a a été vu ` a la section précédente. En résumé, D´ efinition 6.7. Une forme linéaire est donnée par un application de V dans R: ΦV → R, qui est linéaire : ∀α, β ∈ R,

∀v1 , v2 ∈ V,

Φ(αv1 + βv2 ) = αΦ(v1 ) + βΦ(v2 ). A partir de deux espaces vectoriels identiques V , un nouvel espace vectoriel, noté V ⊗ V , est formé, appelé le produit vectoriel entre V et V . Un vecteur de V ⊗ V est alors donné par la réunion de deux vecteurs de V , disons v1 et v2 que l’on note v1 ⊗ v2 . Il est facile de généraliser ceci au produit d’un nombre dénombrable d’éléments de V . D´ efinition 6.8. A partir d’un espace vectoriel V , un nouvel espace vectoriel est constitué n O V = V ⊗ V ⊗ . . . ⊗ V, i=1

appelé le produit tensoriel entre espaces vectoriels V , pour i = 1 a ` n.

Remarque 6.9. Lorsqu’un produit tensoriel contient une infinité de copies de l’espace vectoriel V , il est d’usage de distinguer la somme directe

6.7 Produit scalaire et produit extérieur en dimension deux ∞ X

V = V ⊗ V ⊗ ... ⊗ V

∞ Y

V = V ⊗ V ⊗ . . . ⊗ V.

i=1

du produit direct

i=1

153

P∞ Dans le premier, i=1 V , seul un nombre fini de vecteurs est non nul. Dans Q∞ le second, i=1 V , un nombre dénombrable (infini) d’éléments non nuls est admis. Etant donné que seul un nombre fini de V est nécessaire dans ce qui suit, nous ne ferons pas cette distinction. D´ efinition 6.10. Une forme multilinéaire est donnée comme une application d’un nombre fini de copies de V dans R : Φ:

n O i=1

V → R,

satisfaisant la linéarité, c.-` a-d. ∀α, β ∈ R, ∀vi ∈ V , i = 1, . . . , n, ∀w1 , w2 ∈ V , ∀r ∈ {1, 2, . . . , n}, Φ(v1 , . . . , vr−1 , αw1 + βw2 , vr+1 , . . . , vn ) = αΦ(v1 , . . . , vr−1 , w1 , vr+1 , . . . , vn ) + βΦ(v1 , . . . , vr−1 , w2 , vr+1 , . . . , vn ).

6.7 Produit scalaire et produit ext´ erieur en dimension deux Le produit extérieur est utilisé en association avec l’espace dual. Il est fondé sur l’usage de déterminants. Considérons pour commencer un espace vectoriel de dimension deux. A T T du plan, il est chaque couple de vecteurs v1 = v11 v12 , v2 = v21 v22 possible d’associer un nombre réel correspondant à leur produit scalaire : v1T v2 = v11 v21 + v12 v22 = v T Iv. L’écriture ci-dessus met en évidence la matrice identité. Il est également possible de définir un produit à partir d’une matrice définie positive Q > 0 quelconque : (v1 , v2 ) = v1T Qv2 .

(6.6)

On remarque alors, qu’à toute forme linéaire symétrique et définie positive, il existe une certain matrice Q qui lui est associé. Ceci se généralise en dimension plus grande que deux (section ??).

154


Au lieu de considérer des formes définies positives et symétriques (donnant naissance ` a des produits scalaires) il est possible de considérer des formes antisymétriques, c.-à-d. des formes dont le signe alterne lorsque les arguments sont permutés. Elles donnent naissance à des produits extérieurs. En dimension deux, le produit extérieur entre deux vecteurs v1 et v2 est défini comme le déterminant constitué des composantes des vecteurs : v v v1 ∧ v2 = 11 21 = v11 v22 − v12 v21 v12 v22

(6.7)

o` u l’on reporte les composantes en vertical dans le déterminant. Ce produit est bien anti-symétrique v2 ∧ v1 = v12 v21 − v11 v22 = −v1 ∧ v2 .

(6.8)

6.7.1 forme bilin´ eaire sym´ etrique Une forme bilinéaire symétrique à deux séries de variables u1 , u2 , . . ., un et v1 , v2 , . . ., vn s’écrit f (u, v) = f (u1 , u2 , . . . , un , v1 , v2 , . . . , vn ) =

XX i

pij ui uj ,

j

avec pij ∈ R des coefficients fixes. Pour que la forme bilinéaire f (u, v) soit symétrique, il faut que les coefficients aij soient tels que f (u, v) = f (v, u) et donc pij = pji . Elle peut donc s’exprimer à l’aide d’une matrice symétrique P = (pij ) : f (u, v) = uT P v. 6.7.2 forme bilin´ eaire antisym´ etrique (altern´ ee) La forme f (u, v) est antisymétrique lorsque f (u, v) = −f (v, u). Cette propriété entraˆıne que f (u, v) s’écrit sous la forme XX aij (ui vj − uj vi ). f (u, v) = i

j

On constate alors que les termes sous le signe sommation sont des déterminants :

6.7 Produit scalaire et produit extérieur en dimension deux

XX u u X X aij ui ∧ uj . aij i j = f (u, v) = vi vj i

i

j

155

(6.9)

j

La dernière égalité est obtenue en ne reportant que les variables de la première ligne du déterminant (` a savoir ui et uj ) intercalés du signe ∧ correspondant au produit extérieur. Nous verrons la justification de cette notation au prochain paragraphe. 6.7.3 Produit ext´ erieur de deux formes lin´ eaires D´ efinition 6.11. Lorsque deux formes linéaires sont données, disons f (u) et f¯(u), leur produit extérieur est définit comme la forme bilinéaire antisymétrique associée au déterminant f (u) f¯(u) ¯ . f (u) ∧ f (u) = (6.10) f (v) f¯(v) En utilisant les formes explicites

f (u) = a1 u1 + a2 u2 + . . . + an un f¯(u) = a ¯1 u1 + a ¯ 2 u2 + . . . + a ¯n un

(6.11) (6.12)

le produit (6.10) s’écrit ` a partir des déterminants des variables comme f (u) ∧ f¯(u) =

XX i

j

ui uj X X = ai a ¯j ai a ¯ j ui ∧ uj vi vj i

(6.13)

j

Remarque 6.12. En introduisant explicitement l’expression de f et f¯ données par (6.11) et (6.12) , on obtient XX ai a ¯j ui ∧ uj (6.14) (a1 u1 + . . . + an un ) ∧ (¯ a1 u 1 + . . . + a ¯ n un ) = i

j

et l’on constate que ce résultat aurait pu être obtenu directement en considérant le produit ∧ avec la propriété distributivité par rapport à l’addition et la propriété d’antisymétrie : – a∧a=0 – a ∧ b = −b ∧ a (6.15) – a ∧ (b + c) = a ∧ b + a ∧ c

(6.16)

Il comporte également d’autre propriétés en relation avec la multiplication par une fonction Υ (.) de Rn → R.

156


Υ (x)(ω1 ∧ ω2 ) = ω1 ∧ (Υ (x)ω2 ) = (Υ (x)ω1 ) ∧ ω2

(6.17)

Ceci justifie également la notation f (u) ∧ f¯(u), o` u seul u apparaˆıt, ainsi que celle du paragraphe précédent (6.9).

6.8 Forme multilin´ eaire altern´ ee En ajoutant des séries de variables, nous aboutissons à une forme multilinéaire alternée f (u, v, . . . , w) qui est telle qu’après échange de deux séries de variables, le signe change. En utilisant le produit ∧ nous pouvons constituer une forme multilinéaire à partir d’un nombre fini de formes linéaires en suivant (6.14) et en utilisant les propriétés de non-commutativité et distributivité du produit ∧. Par induction, il est alors également possible de construire le produit extérieur de plusieurs formes extérieures de degré quelconque. Nous donnons maintenant une construction algébrique des formes multilinéaires alternées en utilisant la définition des formes multilinéaires données a la section (6.6). ` L’idée consiste ` a remarquer qu’une forme multilinéaire Φ est alternée lorsque elle annule un élément v1 ⊗ v2 ⊗ . . . ⊗ vn pour lequel deux vecteurs, disons vi et vj , i 6= j, sont identiques. Ceci est notamment le cas pour une forme bilinéaire alternée, car f (u, u) = −f (u, u) implique f (u, u) = 0. D´ efinition 6.13. L’ensemble des éléments annulateurs a est a = {v1 ⊗ v2 ⊗ . . . ⊗ vn | ∃i, j i 6= j vi = vj }. Nn a constitue un module de l’espace vectoriel i=1 V . C’est un sous ensemble de l’espace vectoriel qui est fermé pour l’addition vectorielle et qui est également fermé pour le produit de l’espace vectoriel. Le produit extérieur de n copies de l’espace vectoriel V est alors donné par le quotient n ^

i=1

V =

n O i=1

V

!

/a

Nn Vn ce qui a pour effet d’envoyer tous les éléments de a de i=1 V vers 0 dans ole d’élément absorbant. i=1 V . a joue en quelque sorte le rˆ Nn D´ efinition 6.14. Une forme Vnmultilinéaire alternée Φ de i=1 V dans R est une forme multilinéaire de i=1 V dans R.

6.9 Cotangent et les 1-forme différentielles

157

6.9 Cotangent et les 1-forme diff´ erentielles Les vecteurs tangents en un point donné x de la variété appartiennent à un espace vectoriel Tx . Cet espace est un cas particulier d’espace vectoriel V . Il est alors naturel de construire son espace dual Tx∗ . Les vecteurs de cet espace dual sont des applications linéaires ayant comme argument un des vecteurs tangent ` a la variété au point x et retournant un nombre réel. Une telle application linéaire est appelée un covecteur tangent ou une 1forme différentielle. Tout comme dans le cas de V , elle peut également se représenter sous la forme d’un vecteur ligne en choisissant une base orthonormée quelconque de Tx . L’espace vectoriel associé Tx∗ est appelé espace vectoriel cotangent, ou plus simplement cotangent. Exemple 6.15. Dans le chapitre sur le plan de phase, l’élimination de la variable temporelle s’est fait de deux manières différentes. D’une part, le système d’équations différentielles du premier ordre x˙ 1 = f1 (x1 , x2 ) x˙ 2 = f2 (x1 , x2 )

(6.18) (6.19)

a conduit ` a deux solutions x1 (t) = Φ1 (t) et x2 (t) = Φ2 (t) décrivant une courbe Φ(x1 , x2 ) après élimination de la variable temporelle t. D’autre part, la différentielle dt a été éliminée et l’expression résultante directement intégrée. Ces deux techniques sont maintenant réexaminées selon l’angle du champ de vecteur f (x) de du covecteur associé. Dans la première technique, lorsque le temps est éliminé après intégration du système d’équation (6.18) et (6.19), une courbe trajectoire dans le plan de phase est obtenue. Pour le système masse-ressort nous avons obtenu un cercle Φ(x1 , x2 ) = x21 + x22 − x1 (0)2 − x2 (0)2 . Par conséquent, l’intégration des équations différentielles (6.18) et (6.19) T définies par un champ de vecteur f (x) = f1 f2 et élimination de la variable indépendante t engendre une courbe solution. Cette courbe solution est également obtenue en envisageant le dual du champ de vecteur f (x). Le vecteur ligne f2 (x1 , x2 ) −f1 (x1 , x2 ) annule le champ de vecteur f (x) : f1 (x1 , x2 ) f2 (x1 , x2 ) −f1 (x1 , x2 ) = 0. (6.20) f2 (x1 , x2 ) Le vecteur ligne représente une contrainte sur les accroissements dx1 et dx2 pour que le déplacement infinitésimal correspondant soit dans le sens de la solution de l’équation différentielle.

158


Le produit scalaire (6.20) permet donc d’associer à un vecteur ligne, une forme linéaire dont l’argument est un vecteur du champ de vecteur appartenant ` a Tx . La ligne en question est un vecteur cotangent appartenant a` Tx∗ que l’on note f2 (x1 , x2 )dx1 − f1 (x1 , x2 )dx2 . (6.21) On obtient une expression différentielle qui peut être directement intégrée 1 conduisant ` a la courbe solution. En effet, après substitution de f1 = dx dt et dx2 f2 = dt la somme des quantitiés (6.20) reste nulle et la différentielle dt est éliminée : Z f2 (x1 , x2 )dx1 − f1 (x1 , x2 )dx2 = 0 conduisant ` a la courbe solution après intégration. Pour l’oscillateur masse ressort o` u f1 (x1 , x2 ) = x2 et f2 (x1 , x2 ) = −x1 , l’expression différentielle en question est −x1 dx1 − x2 dx2 qui conduit après intégration ` a l’équation du cercle − 21 x21 − 21 x22 = C, o` u C est une constante d’intégration spécifiée par les conditions initiales C = − 21 (x1 (0)2 + x2 (0)2 ). L’expression (6.21) est appelée une 1-forme différentielle.

D´ efinition 6.16. Le dual de l’espace tangent en un point x, noté Tx∗ , est appelé le cotangent au point x. C’est un espace vectoriel dont les éléments sont les applications linéaires de Tx dans R. Un vecteur correspondant est appelé une 1-forme différentielle et noté a1 (x)dx1 + a2 (x)dx2 + . . . + an (x)dxn , o` u ai (x), i = 1, . . . n, sont des fonctions des n variables x1 , x2 , . . ., xn .

6.10 Le gradient L’exemple précédent montre que la correspondance entre un vecteur ligne et une application linéaire peut procéder dans le sens contraire. A partir d’un vecteur ligne quelconque, une application linéaire est définie par le produit scalaire entre cette ligne et le vecteur auquel l’application linéaire est appliquée. Dans le cas d’une fonction scalaire de h(x1 , x2 , . . . , xn ) : Rn → R les dérivées partielles par rapport à chacune des variables sont rassemblées dans un vecteur ligne définissant une forme linéaire par association de cette ligne avec l’application correspondante. Un tel vecteur ligne est appelé le gradient et noté ∂h ∂h ∂h . . . ∂x . ∇h = ∂x 1 ∂x2 n Par conséquent, nous pouvons également interpréter le gradient comme un vecteur (covecteur) du cotangent Tx∗ en un point x.

6.11 Dérivée de Lie

159

Remarque 6.17. Jusqu’` a présent, les notations rendent indispensable l’utilisation des coordonnées x1 , x2 , . . ., xn . En somme, nous devons toujours utiliser une carte locale pour exprimer le gradient ou une autre forme différentielle. Toutefois, en écrivant dh =

∂h ∂h ∂h dx1 + dx2 + . . . + dxn , ∂x1 ∂x2 ∂x n

tout en conservant la relation avec les coordonnées x1 , . . ., xn dans le membre de droite, nous nous en débarrassons dans le membre de gauche en ne faisant apparaˆıtre que dh. Ce dh peut être définit, à travers la compatibilité des cartes, sur l’ensemble de la variété M. C’est là un avantage de la notation dh. Exemple 6.18. Le gradient d’un candidat de Lyapunov s’obtient à partir de l’expression de V (x) en prenant les dérivées partielles en fonction des coordonnées x1 , x2 , . . ., xn : ∂V ∂V ∂V . . . ∂x ∇V (x) = ∂x . (6.22) 1 ∂x2 n La 1-forme dV représente également ce gradient sous la forme dV =

∂V ∂V ∂V dx1 + dx2 + . . . + dxn ∂x1 ∂x2 ∂xn

(6.23)

rendant possible la définition de dV indépendamment des cartes locales utilisées. Le gradient en tant que champ de co-vecteurs se marie naturellement avec un champ de vecteurs, comme nous le verrons à la section suivante.

6.11 D´ eriv´ ee de Lie Au chapitre 4, nous avons vu que la deuxième condition du théorème de stabilité de Lyapunov exige que V˙ ≤ 0 afin que le système dynamique x˙ = f (x) soit stable. Géométriquement, la notation V˙ (x) n’est pas convaincante car la propriété de décroissance de la fonction V est de nature géométrique et la référence a variable temporelle n’est pas vraiment nécessaire. En effet, une fois f (x) ` assimilé ` a un champ de vecteur, la condition V˙ ≤ 0 signifie simplement que le vecteur f (x), en chaque point x de la variété, assure que le système évolue vers des courbes de niveau V = cte inférieures ou égales à celle sur laquelle il se trouve ` a l’instant considéré. En d’autres termes, lorsque V˙ ≤ 0, f (x) forme un angle inférieur ou égal π a 2 par rapport au gradient ∇V en chaque point de l’état. En effet, `

160


∂V ∂V d V = x˙ = f dt ∂x ∂x =

∂V ∂V ∂x1 ∂x2



 f1    f2  ∂V . . . ∂x   . n  ..  fn

= ∇V f

(6.24)

Par conséquent, et de manière générale, si à la fois un champ de vecteur f (x) est donné ainsi qu’une fonction scalaire h(x), alors il est possible de définir une nouvelle fonction scalaire, notée Lf h, appelée dérivée de Lie de h le long de f , égale au produit scalaire entre le gradient de cette fonction et le champ de vecteur. Cette dérivée représente le taux d’évolution de la fonction le long du champ de vecteur f (x). Remarque 6.19. Notons que la dérivée de Lie Lf h est l’association naturelle par dualité, en chacun des points x, entre le co-vecteur dh(x) du cotangent Tx∗ et le vecteur f (x) du tangent Tx . Cette fonction scalaire pourrait tout aussi bien s’écrire Lf h = dhf, mettant en exergue l’interprétation à l’aide des espaces Tx∗ et Tx . Fondamentalement, le gradient n’appartient pas au même espace vectoriel que le vecteur f (x). Par abus, nous représentons souvent les deux dans le même plan (en particulier lors de l’utilisation du plan de phase). Cependant, il est important de souligner cette différence pour éviter une confusion des concepts. D´ efinition 6.20. Soit h une fonction et f un champ de vecteurs. La dérivée de Lie de la fonction h(x) le long du champ d’un champ de vecteur f (x) est définie par Lf h(x) = ∇h f = =

∂h ∂h ∂x1 ∂x2

∂h f ∂x 

 f1  f2  ∂h   . . . ∂x  ..  n . fn

Comme le résultat est ` a nouveau une fonction scalaire, il est possible de dériver successivement : L0f h = 0 i−1 Lif h = Lf (Li−1 f h) = d(Lf h)f

i = 1, 2, . . .

6.12 Crochet de Lie

161

6.12 Crochet de Lie Dans le courant de ce chapitre et le suivant, il sera question de manipuler des champs de vecteurs et de vérifier des propriétés particulières de ceux-ci. Bien que ses propriétés soient essentiellement intrinsèques aux champs de vecteurs que l’on va considérer, il est néanmoins utile d’avoir à disposition des moyens de manipulation et de formulation qui permettent une écriture compacte des conditions relatives à leurs propriétés. En particulier, il sera question de la question d’intégrabilité de ceux-ci, a savoir la possibilité qu’un ensemble de champ de vecteurs donnés soient ` en relation étroite avec une surface courbe. Plus précisément, le champ sera dit intégrable lorsqu’il est possible de construire une surface (courbe) pour laquelle en tout point de la surface il est garantit que l’espace tangent à cette surface soit engendré par les vecteurs du champ en ce point. Bien que cette propriété est de nature essentiellement globale, elle admet une caractérisation locale, par des propriétés des crochets de champs de vecteurs. En effet, deux champs de vecteurs f1 et f2 peuvent être composés pour constituer un nouveau champ de vecteur [f1 , f2 ], appelé le crochet de Lie, comme suit : D´ efinition 6.21. (Crochet de Lie) Soit deux champs de vecteurs f1 et f2 . La dérivée de Lie des champs de vecteur f et g est donnée par [f, g] =

∂f ∂g f− g ∂x ∂x

L’inconvénient de cette notation est qu’elle devient lourde lorsqu’il est nécessaire d’itérer le crochet par rapport à un même champ de vecteur. Par exemple, pour noter le résultat des opérations [f, [f, g]] et [f, [f, [f, g]]], et ainsi de suite. Pour y remédier, nous introduisons la notation adjointe suivante [f, g] = adf g qui s’applique inductivement ad0f g = g adf g = [f, g] .. .. . . adif g = [f, adi−1 f g] = [f, . . . , [f, g]]. A l’aide de cette nouvelle notation, les deux champs de vecteurs [f, [f, g]] et [f, [f, [f, g]]] s’expriment respectivement comme ad2f g et ad3f g. L’exposant indique le nombre de fois que le champ f apparaˆıt à l’intérieur des crochets imbriqués.

162


Remarque 6.22. L’expression f f f g est parfois également utilisée pour désigner le champ de vecteur [f, [f, [f, g]]]. Cependant, cette notation est déconseillée, étant donné la possible fausse interprétation. En effet, cette expression pourrait signifier [[f, f ], [f, g]] ou [f, [f, [f, g]]]. La première expression est nulle car [f, f ] = 0 par application directe de la définition. La seconde n’a pas de raison a priori d’être nulle. Lorsque f f f g est employé, il est d’usage de lui associer un ordre de crochetage particulier, devenant néanmoins ainsi un moyen commode de noter le champ de vecteur correspondant. Exemple 6.23. Soit les deux champs de vecteurs f (x) et g(x) définis par −2x1 + ax2 + sin x1 0 f (x) = g(x) = . cos(2x1 ) −x2 cos x1 Un calcul des Jacobiens multipliés par le champ complémentaire donne ∂g 0 0 −2x1 + ax2 + sin x1 f = −x2 cos x1 −2 sin(2x1 ) 0 ∂x ∂f 0 −2 + cos x1 a g= cos(2x1 ) x2 sin x1 − cos x1 ∂x de telle sorte que le crochet s’exprime finalement par a cos(2x1 ) [f, g] = 2 sin(2x1 )(2x1 − ax2 − sin x1 ) + cos x1 cos(2x1 ) 6.12.1 Propri´ et´ es du crochet de Lie Le crochet de Lie comporte plusieurs propriétés utiles pour les calculs et qui peuvent être établies directement à partir de la définition du crochet. 1. Distributivité par rapport à l’addition : Soit deux nombres réels α1 , α2 ∈ R, alors [α1 f1 + α2 f2 , g] = α1 [f1 , g] + α2 [f2 , g] [f, α1 g1 + α2 g1 ] = α1 [f, g1 ] + α2 [f, g2 ] 2. Anti-commutativité : [f, g] = −[g, f ]

6.13 Différentiation extérieure

163

3. Identité de Jacobi : Soit trois champs de vecteurs f , g, et h [f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = 0. 4. Dérivée de Lie le long d’un crochet : L[f,g] h = Lf Lg h − Lg Lf h La propriété 4. engendre inductivement de nouvelles relations. En particulier, L[f,[f,g]] h = L2f Lg h − 2Lf Lg Lf h − Lg L2f h

6.13 Diff´ erentiation ext´ erieure Pour l’instant, seul les formes différentielles de degré un ont été envisagées. Le gradient est un exemple. D’un autre cˆ oté, les vecteurs de l’espace tangents peuvent être composés par différentiation spéciale provoquée par le crochet en de nouveaux vecteurs. Ainsi, les champs de vecteurs se composent pour engendrer de nouveaux champs de vecteurs. Chaque nouveau vecteur en un point x demeure dans l’espace tangent Tx . Au paragraphe suivant, nous nous interesserons à la construction d’une surface ` a partir d’un ensemble de champ de vecteurs (distribution) de telle sorte qu’en chacun point de la surface l’espace tangent est engendrée par les vecteurs de la distribution. Cette surface, si elle existe, est alors décrite par une équation. Cette équation définit ainsi un scalaire qui, lorsqu’il est nul, correspond ` a la surface. Nous verrons que l’existence de cette surface est intimement liée ` a la propriété des crochets des champs de vecteurs. Toutefois, établir cette condition directement est difficile. Par contre, en prenant le gradient de cette fonction, une forme différentielle de degré un est obtenue. Ceci conduit alors à une interprétation à l’aide du dual Tx∗ de la surface intégrale. Pour que la surface soit tangente au champ de vecteurs, le gradient doit être normal à l’ensemble des vecteurs. En effet, si la surface est tangente aux champs de vecteurs, la dérivée de Lie de la fonction selon chaque champ de vecteur est nul, la quantité en question ne pouvant pas changer lors d’un déplacement le long d’un des champs de vecteurs. Cependant le calcul par crochets (valable sur l’espace tangent en considérant les champs de vecteur) n’est plus disponible en tant que tel dans l’espace cotangent. Il est nécessaire d’introduire un nouveau calcul permettant de trouver une condition d’intégrabilité exprimable à partir de celui-ci. L’avantage est que l’obtention de cette condition est plus simple et plus directe que lors de l’utilisation des crochets. Au lieu de crocheter les champs de vecteurs en restant dans l’espace vectoriel Tx , nous construisons des formes différentielles de degré supérieur par

164


une opération que l’on appelle différentiation extérieure. En partant de Tx∗ on grimpe dans le produit tensoriel Tx∗ ⊗ Tx∗ et ainsi de suite Tx∗ ⊗ Tx∗ ⊗ . . . ⊗ Tx∗ . Cette opération est également à l’origine de la généralisation du théorème de Stokes. (Rappelons que nous avons utilisé ce théorème pour établir une condition d’existence de cycle limite dans le chapitre consacré au plan de phase : la condition de Bendixson.) Il admet une généralisation en dimension quelconque et s’énonce en utilisant la différentiation extérieure. Pour introduire cette nouvelle opération, nous commen¸cons par revoir la notion de différentielle. Celle-ci n’est pas unique et repose sur des choix. Puis nous montrons que deux systèmes de différentielles se combinent pour former des expressions alternées exactement comme deux ensembles de variables engendrent des formes alternées. La principale raison de l’alternance est liée à l’intégration. Il est important d’associer ` a un élément de surface (ou volume) infinitésimal un sens positif ou négatif en fonction de son orientation. Ensuite nous introduisons l’opération de différentiation extérieure permettant de passer d’une intégrale sur l’enveloppe d’un espace donné (intégrale de contour le long d’un hyper-espace) vers une intégrale de l’espace considéré (intégrale de volume). C’est la généralisation du théorème de Stokes. La raison de l’introduction de cette nouvelle opération ne provient pas du lien entre ces deux types d’intégration, mais plutˆ ot par le lien entre cette opération et la propriété d’intégrabilité qui alors abordée en détail. 6.13.1 Diff´ erentielles Lorsqu’on exprime la différentielle d’une fonction, on entend par là son accroissement infinitésimal. Il est exprimé par la relation dΥ =

∂Υ ∂Υ ∂Υ dx1 + dx2 + dx3 ∂x1 ∂x2 ∂x3

(6.25)

o` u les différentielles dx1 , dx2 et dx3 forment un système de différentielles, et correspondent généralement à l’accroissement infinitésimal des quantités géométriques x1 , x2 et x3 . Cependant, et en toute généralité, ces expressions dx1 , dx2 et dx3 peuvent être vues que comme des fonctions des coordonnées x1 , x2 , x3 et d’un nombre arbitraire de nouvelles fonctions. C’est ainsi que nous pouvons considérer un autre système de différentielles, disons δx1 , δx2 et δx3 , qui sont également des fonctions (mais différentes) de x1 , x2 et x3 et d’un autre ensemble de variables. Supposons que nous adoptions comme variables indépendantes (` a la place de x1 , x2 et x3 ), trois fonctions indépendantes y1 , y2 et y3 de x1 , x2 et x3 . Nous conviendrons de continuer à leur associer les mêmes différentielles


dyi =

165

∂yi ∂yi ∂yi dx1 + dx2 + dx3 . ∂x1 ∂x2 ∂x3

On déduit de la règle de différentiation des fonctions de fonctions que, grâce à cette convention, dΥ est une quantité qui ne dépend pas du choix des variables indépendantes. Cette invariance de dΥ au cours d’un changement de variables résume les règles qui indiquent comment un changement de varibles transforme les dérivées d’une fonction. Après le choix d’un autre système de différentielles, il est possible de prendre δΥ au lieu de dΥ . Il est aussi important de pouvoir considérer à la fois δdΥ et dδΥ . Ainsi, il est possible de définir les différentielles δi , i = 1, 2, 3 des variables autres que x1 , x2 et x3 dont dépendent les dx1 , dx2 et dx3 dont dépendent δx1 , δx2 et δx3 . Nous supposerons toujours qu’il soit possible de choisir les différentielles de telles sortent que δdxi = dδxi ,

i = 1, 2, 3.

(6.26)

Par exemple si dxi = ξi (x1 , x2 , x3 ), δxi = ηi (x1 , x2 , x3 ), i = 1, 2, 3, alors (6.41) s’écrit 3 X ∂ηi ∂ξi i = 1, 2, 3. ηk − ξk ∂xk ∂xk k=1

Quand cette relation est vérifiée, les symboles d et δ sont dits échangeables. De plus, si les symboles sont échangeables, ils le sont également après changement de variables. Normalement, le choix du système de différentielles est effectué en fonction de l’interprétation naturelle (géométrique et analytique), à savoir que si dxi , i = 1, 2, 3, sont des accroissements infiniments petits, dΥ est la partie principale de l’accroissement correspondant de Υ . 6.13.2 D´ erivation ext´ erieure d’une 1-forme Soit la 1-forme ω = ω1 dx1 + ω2 dx2 + ω3 Et calculons la différence dω − δω : dω − δω =

3 X

dωk δxk − δωk dxk

k=1 3 X 3 X

∂ωk (dx1 δxk − δxi dxk ) ∂xi i=1 k=1 X ∂ωk ∂ωi = (dx1 δxk − δxi dxk ) − ∂xi ∂xk

=

1≤i≤k≤3

(6.27)

166


On définit la dérivée extérieure ω ′ = dω − δω

(6.28)

On peut noter de fa¸con abrégée la différence dxi δxj − δxi dxj sous la forme dxi ∧ dxj . P Le ωk dxk avec une autre 1-forme Pproduit extérieur d’une 1-forme ω = ω ¯= ω ¯ k dxk est donné par ω∧ω ¯=

X i,j

ωi ω ¯ j dxi ∧ dxj

X

=

1≤i≤j≤3

(ωi ω ¯ j − ωj ω ¯ i )dxi ∧ dxj

Ainsi en dénotant dω au lieu de ω ′ :

X

dω =

1≤i≤j≤3

∂ωi ∂ωj − ∂xi ∂xj

dxi ∧ dxj

(6.29)

Nous avons la propriété suivante, o` u ω est une 1-forme et Υ une fonction : d(Υ ω) = dΥ ∧ ω + Υ dω

(6.30)

6.13.3 D´ erivation ext´ erieure Pour une fonction Υ , nous avons l’expression (6.40). Pour une 1-forme ω = P dx + Qdy + Rdz, en appliquant (6.45) sur chacun des termes, et en tenant compte de (6.40), nous obtenons ∂P ∂P ∂P dx + dy + dz) ∧ dx ∂x ∂y ∂z ∂Q ∂Q ∂Q dx + dy + dz) ∧ dy +( ∂x ∂y ∂z ∂R ∂R ∂R +( dx + dy + dz) ∧ dz ∂x ∂y ∂z

dω = (

(6.31)

Comme dxi ∧ dxi = dxi δxi − δxi dxi = 0 et dxi ∧ dxj = dxi δxj − δxi dxj = −(dxj δxi −δxj dxi ) = −dxj ∧dxi , nous retombons bien sur l’expression (6.44). Par conséquent, avec Υ une fonction arbitraire des variables x1 , x2 , . . ., xn , on peut définir de manière inductive la différentielle extérieure d’une forme de degré quelconque en partant d’une forme monˆ ome


167

α = Υ dx1 ∧ dx2 ∧ dx3 ∧ . . . ∧ dxn , par dα = (dΥ ) ∧ dx1 ∧ dx2 ∧ dx3 ∧ . . . ∧ dxn .

(6.32)

Cette opération définie pareillement est la seule qui possède les propriétés suivantes : 1. distributivité par rapport à l’addition : d(ω + ν) = dω + dν;

(6.33)

2. règle de Leibniz en tenant compte de l’anti-symétrie : d(ω ∧ ν) = dω ∧ ν + (−1)p ω ∧ dnu

o` u ω est une p-forme;

(6.34)

3. d est l’opérateur de différentiation usuel sur les 0-formes (le gradient sur les fonctions) ; 4. d(df ) = 0 sur les fonctions f ; La définition ci-dessus montre que cette opération est indépendante du choix des coordonnées et se définit de manière globale sur la variété. Toutefois, en utilisant des coordonnées locales, nous avons la définition de la différentielle extérieure d’une 1-forme arbitraire suivante : D´ efinition 6.24. La différentielle extérieure d’une forme arbitraire ω = P n ee par j=1 αj dxj est donn´ dω =

n n X X ∂αj j=1

i=1

∂xi

dxi

!

∧ dxj .

6.13.4 Th´ eor` eme de Stokes g´ en´ eralis´ e A l’aide de cette nouvelle propriété de différentiation, et en partant d’une 1-forme ω quelconque en dimension n, il est possible d’intégrer cette 1-forme sur une hyper-surface, sous-variété δΓ englobant un certain volume, la variété Γ . Quel que soit la dimension n, il est toujours vrai que I

∂Γ

ω=

Z Z

dω.

Γ

La démonstration se trouve dans bon nombre de livres sur la géométrie différentielle et nous invitons le lecteur à consulter par exemple [Boo75].

168


6.14 Int´ egrabilit´ e Nous allons maintenant montrer sous quelles conditions il est possible de construire une hypersurface perpendiculaire à une 1-forme unique. Cette dernière représente un champ de normales à partir de laquelle la surface est construite. Remarquons que ceci revient au même que d’établir sous quelles conditions un ensemble de champ de vecteur (constituant de la sorte une distribution) engendre, en tout point l’espace, l’espace tangeant à l’hypersurface mentionnée précédemment. Une hypersurface dans l’espace est représentée comme une seule équation de tous les états : C = Υ (x1 , x2 , x3 , . . . , xn ),

(6.35)

avec une certaine constante C ∈ R. Cette hypersurface est une surface de dimension n−1 plongée dans l’espace de dimension n. Nous n’envisagerons dans ce qui suit que le caractère local de cette hypersurface, au sens o` u on ne s’intéressera pas de savoir si cette surface est définie partout dans l’espace. Nous reviendrons sur le caractère local des résultats par la suite. La figure 6.3 représente la surface ellipso¨ıdale 4x21 + x22 + 2x23 = 1.

(6.36)

0.5

0

-0.5

-1 -0.5

-0.5 -0.25

0 0 0.25

0.5 1 0.5

Fig. 6.3. Illustration de l’ellipse définie par l’équation 4x21 + x22 + 2x23 = 1

6.14 Intégrabilité

169

Si l’on se place en un point p de cette surface, il est possible de se déplacer de manière infinitésimale dans l’espace d’état. Par exemple, si l’on se déplace le long de l’axe x1 , et uniquement le long de cet axe, on peut considérer dx1 = ǫ > 0, dx2 = dx3 = 0 comme représentant un très petit déplacement parallèle ` a l’axe x1 et n’ayant aucune contribution le long des axes x2 et x3 . Toutefois, en considérant un tel déplacement, on quitte instantanément la surface définie par (6.36). Par contre, rien n’empêche de prendre un autre déplacement infinitésimal associé ` a une valeur particulière des quantités dx1 = α1 , dx2 = α2 et dx3 = α3 . Quelle est alors la condition sur les déplacements infinitésimaux (choix de α1 , α2 et α3 ) afin que l’on demeure sur la surface correspondant à l’équation de l’ellipso¨ıde (6.36) ? Si l’on reste sur la surface, la valeur correspondant au membre de gauche de (6.36) ne doit pas changer après le déplacement et continuer de valoir un. Ainsi, en définissant Υ = 4x21 + x22 + 2x23 , la condition sur les accroissements est ∂Υ ∂Υ ∂Υ dx1 + dx2 + dx3 ∂x1 ∂x2 ∂x3 = 8x1 dx1 + 2x2 dx2 + 4x3 dx3 = 0.

dΥ =

(6.37)

Les valeurs αi , i = 1, 2, 3 sont choisies afin de satisfaire cette équation, condition qui peut s’écrire comme l’annulation du prpduit scalaire :   dx1 8x1 2x2 4x3  dx2  = 0. dx3 Par conséquent, le vecteur 8x1 2x2 4x3 représente une normale à la surface. En effet, un déplacement infinitésimal, choisi afin de rester sur la surface Υ = C, respecte la condition (6.37). Les considérations ci-dessus montrent également que l’on peut mettre en correspondance (isomorphisme) entre les deux entités : (6.38) 8x1 dx1 + 2x2 dx2 + 4x3 dx3 ↔ 8x1 2x2 4x3 .

La quantité de gauche est appelée une 1-forme et le vecteur de droite un co-vecteur gradient ou co-vecteur normal selon les circonstances (et par abus de langage vecteur gradient ou vecteur normal, bien que cette quantité décrit a proprement parlé un champ d’éléments qui est dans le dual d’un champ de ` vecteurs, au sens ou chacun des éléments en question est un dual d’un vecteur, lui-même élément d’un champ de vecteurs).

170


Fig. 6.4. Représentation du champ de normales correspondant ` a la 1-forme 8x1 dx1 + 2x2 dx2 + 4x3 dx3 . Seule une partie de l’ellipse d’équation 4x21 + x22 + 2x23 = 1 est représentée.

6.15 Diff´ erence entre une 1-forme exacte et int´ egrable. La section précédente montre l’existence d’un champ de co-vecteurs normaux ` a une surface. Etant donné une surface, il existe toujours un champ normal. La question est de savoir si la réciproque est vraie, c’est-à-dire étant donné un champ de co-vecteurs quelconques, exite-t-il une surface pour laquelle la normale ` a cette surface correspond au champ en question ? Soit donc une fonction Υ de trois coordonnées x1 , x2 , x3 . Il est possible de constituer une 1-forme en prenant la différentielle totale de la fontion Υ :

dΥ =

∂Υ ∂Υ ∂Υ dx1 + dx2 + dx3 . ∂x1 ∂x2 ∂x3

On constate que les coefficients devant dx1 , dx2 , dx3 sont des fonctions de x1 , x2 , x3 . De plus, ces coefficients ne sont pas arbitraires, puisqu’il sont issus de la fonction Υ , par dérivées partielles. On peut alors s’interroger sur la réciproque, à savoir, étant donné trois fonctions arbitraires de x1 , x2 et x3 (disons ω1 (x1 , x2 , x3 ), ω2 (x1 , x2 , x3 ) et ω3 (x1 , x2 , x3 )), existe-t-il une fonction Ψ qui est en relation étroite avec la 1-forme ω = ω1 dx1 + ω2 dx2 + ω3 dx3 .

Trois cas de figure se présentent :

(6.39)

6.16 Différentielles et dérivation extérieure

171

1. Il existe une fonction Ψ (x1 , x2 , x3 ) pour laquelle ωi =

∂Ψ ∂xi

i = 1, 2, 3,

de telle sorte que dΨ = ω. La 1-forme (6.39) est dite exacte dans ce cas et nous avons la réciproque exacte de l’assertion ci-dessus. 2. Il existe une fonction Ψ (x1 , x2 , x3 ) et une autre fonction η(x1 , x2 , x3 ) telles que ∂Ψ i = 1, 2, 3. η(x1 , x2 , x3 )ωi = ∂xi Dans ce cas, la 1-forme est dite intégrable. Il s’agit donc de trouver un facteur qui multiplie toutes les composantes de la 1-forme afin que la 1forme résultante devienne exacte, le facteur variant d’un point à l’autre de l’espace d’état. La difficulté de l’intégration provient de la nécessité de déterminer deux quantités η(x1 , x2 , x3 ) et Ψ (x1 , x2 , x3 ). Nous avons une sorte de réciproque partielle de l’assertion ci-dessus. 3. La 1-forme (6.39) n’est reliée à aucune fonction Ψ des trois coordonnées x1 , x2 , et x3 ; elle est alors dite non-intégrable. La réciproque de l’assertion ci-dessus n’existe pas dans ce cas. On constate donc qu’une 1-forme exacte est nécessairement intégrable. Par contre, il existe des 1-formes intégrables qui ne sont pas pour autant exactes. Il nous reste donc ` a trouver les conditions pour discriminer entre les trois cas possibles. Pour se faire, il est nécessaire de déveloper un calcul infinitésimal particuler, appelé calcul différentiel extérieur.

6.16 Diff´ erentielles et d´ erivation ext´ erieure Diff´ erentielles Les différentielles dx1 , dx2 et dx3 forment un système de différentielles. Ce sont des fonctions des coordonnées x1 , x2 , x3 et d’un nombre arbitraire de nouvelles fonctions. Considérons un autre système de différentielles, disons δx1 , δx2 et δx3 , qui sont également des fonctions (mais différentes) de x1 , x2 et x3 et d’un autre ensemble de variables. La différentielle d’une fonction Υ (x1 , x2 , x3 ) est par définition

dΥ =

∂Υ ∂Υ ∂Υ dx1 + dx2 + dx3 ∂x1 ∂x2 ∂x3

(6.40)

Supposons que nous adoptions comme variables indépendantes (` a la place de x1 , x2 et x3 ), trois fonctions indépendantes y1 , y2 et y3 de x1 , x2 et x3 . Nous conviendrons de continuer à leur associer les mêmes différentielles

172


dyi =

∂yi ∂yi ∂yi dx1 + dx2 + dx3 . ∂x1 ∂x2 ∂x3

On déduit de la règle de différentiation des fonctions de fonctions que, grâce à cette convention, dΥ est une quantité qui ne dépend pas du choix des variables indépendantes. Cette invariance de dΥ au cours d’un changement de variables résume les règles qui indiquent comment un changement de varibles transforme les dérivées d’une fonction. Après le choix d’un autre système de différentielles, il est possible de prendre δΥ au lieu de dΥ . Il est aussi important de pouvoir considérer à la fois δdΥ et dδΥ . Ainsi, il est possible de définir les différentielles δi , i = 1, 2, 3 des variables autres que x1 , x2 et x3 dont dépendent les dx1 , dx2 et dx3 dont dépendent δx1 , δx2 et δx3 . Nous supposerons toujours qu’il soit possible de choisir les différentielles de telles sortent que δdxi = dδxi ,

i = 1, 2, 3.

(6.41)

Par exemple si dxi = ξi (x1 , x2 , x3 ), δxi = ηi (x1 , x2 , x3 ), i = 1, 2, 3, alors (6.41) s’écrit 3 X ∂ηi ∂ξi ηk − ξk i = 1, 2, 3. ∂xk ∂xk k=1

Quand cette relation est vérifiée, les symboles d et δ sont dits échangeables. De plus, si les symboles sont échangeables, ils le sont également après changement de variables. Normalement, le choix du système de différentielles est effectué en fonction de l’interprétation naturelle (géométrique et analytique), à savoir que si dxi , i = 1, 2, 3, sont des accroissements infiniments petits, dΥ est la partie principale de l’accroissement correspondant de Υ . Toutefois, les considérations ci-dessus montrent qu’il est possible de définir des différentielles ”abstraites” (disons δxi ) pour autant qu’elles soient compatibles avec un calcul différentiel approprié. D´ erivation ext´ erieure Soit la 1-forme ω = ω1 dx1 + ω2 dx2 + ω3 Et calculons la différence dω − δω :

6.17 Propriétés de la différentielle extérieure

dω − δω =

3 X

dωk δxk − δωk dxk

k=1 3 X 3 X

∂ωk (dx1 δxk − δxi dxk ) ∂xi i=1 k=1 X ∂ωk ∂ωi = (dx1 δxk − δxi dxk ) − ∂xi ∂xk

=

173

(6.42)

1≤i≤k≤3

On définit la dérivée extérieure

ω ′ = dω − δω

(6.43)

On peut noter de fa¸con abrégée la différence dxi δxj − δxi dxj sous la forme dxi ∧ dxj . P Le ωk dxk avec une autre 1-forme Pproduit extérieur d’une 1-forme ω = ω ¯= ω ¯ k dxk est donné par ω∧ω ¯=

X i,j

ωi ω ¯ j dxi ∧ dxj

X

=

1≤i≤j≤3

(ωi ω ¯ j − ωj ω ¯ i )dxi ∧ dxj

Ainsi en dénotant dω au lieu de ω ′ :

dω =

X

1≤i≤j≤3

∂ωj ∂ωi − ∂xi ∂xj

dxi ∧ dxj

(6.44)

Nous avons la propriété suivante, o` u ω est une 1-forme et Υ une fonction : d(Υ ω) = dΥ ∧ ω + Υ dω

(6.45)

6.17 Propri´ et´ es de la diff´ erentielle ext´ erieure Pour une fonction Υ , nous avons l’expression (6.40). Pour une 1-forme ω = P dx + Qdy + Rdz, en appliquant (6.45) sur chacun des termes, et en tenant compte de (6.40), nous obtenons

174


∂P ∂P ∂P dx + dy + dz) ∧ dx ∂x ∂y ∂z ∂Q ∂Q ∂Q dx + dy + dz) ∧ dy +( ∂x ∂y ∂z ∂R ∂R ∂R +( dx + dy + dz) ∧ dz ∂x ∂y ∂z

dω = (

(6.46)

Comme dxi ∧ dxi = dxi δxi − δxi dxi = 0 et dxi ∧ dxj = dxi δxj − δxi dxj = −(dxj δxi −δxj dxi ) = −dxj ∧dxi , nous retombons bien sur l’expression (6.44). Par conséquent, avec Υ une fonction arbitraire des variables x1 , x2 , . . ., xn , on peut définir de manière inductive la différentielle extérieure d’une forme de degré quelconque en partant d’une forme monˆ ome α = Υ dx1 ∧ dx2 ∧ dx3 ∧ . . . ∧ dxn , par dα = (dΥ ) ∧ dx1 ∧ dx2 ∧ dx3 ∧ . . . ∧ dxn .

(6.47)

En résumé, nous avons la définition de la différentielle extérieure d’une 1-forme arbitraire suivante : D´ efinition 6.25. La différentielle extérieure d’une forme arbitraire ω = P n ee par j=1 αj dxj est donn´ n n X X ∂αj dxi dω = ∂xi i=1 j=1

!

∧ dxj .

Le produit extérieur est anti-symétrique et il préserve la linéarité après multiplication. Ces principales propriétés sont :

dxi ∧ dxj = −dxj ∧ dxi

Υ (x)(ω1 ∧ ω2 ) = ω1 ∧ (Υ (x)ω2 ) = (Υ (x)ω1 ) ∧ ω2 ω1 ∧ (ω2 + ω3 ) = ω1 ∧ ω2 + ω1 ∧ ω3

(6.48) (6.49)

6.18 Condition d’exactitude et d’int´ egrabilit´ e Maintenant que nous sommes en possession d’un nouveau type de calcul (la différentiation extérieure), nous allons réexaminer les questions soulevées à la section 6.15 en déterminant les conditions permettant de décider du type de 1-forme que nous avons ` a faire. Ces conditions sont des expressions calculables facilement ` a partir des coefficients de la 1-forme.

6.18 Condition d’exactitude et d’intégrabilité

175

Condition d’exactitude Soit une 1-forme exacte ω = P dx + Qdy + Rdz.

(6.50)

Par définition, il existe une fonction Υ telle que P =

∂Υ , ∂x

Q=

∂Υ , ∂y

et

R=

∂Υ . ∂z

Calculons la différentielle extérieure de ω en utilisant (6.44) ou (6.40) : dω =

∂2Υ dy ∧ dx + ∂y∂x ∂2Υ dx ∧ dy + ∂x∂y ∂2Υ dx ∧ dz + ∂x∂z

∂2Υ dz ∧ dx ∂z∂x ∂2Υ dz ∧ dy ∂z∂y ∂2Υ dy ∧ dz. ∂z∂z

En utilisant (6.48), on déduit que dω) = 0, concluant sur la nécessité de cette condition. Pour en démontrer la suffisance, supposons que ω soit exacte (c.-à-d. que ω soit le gradient d’une fonction) mais que dω 6= 0. Nous allons montrer qu’il y a une contradiction. Pour la voir, il suffit d’appliquer le théorème de Stokes Z I dω = ω, V

∂V

o` u V est un petit parallélépipède. Comme ω provient d’une fonction, les contributions sur les cˆ otés ∂V du parallélépipède V se compensent de telle sorte que l’intégrale de droite est nulle. Comme dω 6= 0, par supposition, l’intégrale de gauche est non nulle, ce qui contredit l’égalité des deux intégrales. Ceci se généralise ` a un nombre arbitraire de variables et nous avons donc le théorème suivant valable localement Th´ eor` eme 6.26. Une 1-forme ω est localement exacte si, et seulement si, dω = 0. Condition d’intégrabilité La condition d’intégrabilité est plus subtile étant donné qu’une fonction η est manquante (inconnue) pour transformer la 1-forme intégrable ω en une 1-forme exacte ηω.

176


Dans un premier temps, supposons que la 1-forme (6.50) soit intégrable. Ceci signifie que P , Q, et R, sont proportionnels aux dérivées partielles d’une certaine fonction Υ par rapport à respectivement x, y et z : ηP =

∂Υ , ∂x

ηQ =

∂Υ , ∂y

et ηR =

∂Υ . ∂z

(6.51)

A partir des deux premières équations, nous obtenons ∂2Υ ∂ ∂ (ηP ) = = (ηQ); ∂y ∂x∂y ∂x en d’autres termes, η

∂P ∂η ∂Q ∂η +P =η +Q , ∂y ∂y ∂x ∂x

ou, ce qui revient au même, ∂η ∂Q ∂η ∂P =Q − −P . η ∂y ∂x ∂x ∂y

(6.52)

De manière similaire, avec les deux dernières équations de (6.51), ∂Q ∂R ∂η ∂η η − −Q =R ∂z ∂y ∂y ∂z ∂η ∂η ∂R ∂P =P − −R . η ∂x ∂z ∂z ∂x

(6.53) (6.54)

En multipliant (6.52) par R, (6.53) par P, et (6.54) par Q, et en aditionnant le tout, il vient finalement la condition

P

∂Q ∂R − ∂z ∂y

+Q

∂R ∂P − ∂x ∂z

+R

∂P ∂Q − ∂y ∂x

= 0.

(6.55)

Par conséquent, lorsque il est possible de déterminer une fonction qui rend la 1-forme ω, après multiplication par cette fonction, exacte, alors la condition (6.55) est satisfaite. En outre, Il est aisé de montrer que si l’on prend au lieu de P , Q et R, des nouvelles fonctions P1 = λP , Q1 = λQ et R1 = λR, o` u λ est une fonction quelconque, la condition (6.55) continue à être vérifiée lorsqu’on remplace P par P1 , Q par Q1 , et R par R1 . La réciproque est également vraie, à savoir que si la condition (6.55) est satisfaite, alors la 1-forme ω est intégrable, ou en d’autres termes, il existe une intégrale Υ (x, y, z) = 0.


177

Pour le voir, nous allons d’abord revenir en dimension deux. Lorsque P et Q sont des fonctions de x et y uniquement, l’équation différentielle P dx + Qdy = 0,

(6.56)

est garantie de possèder une solution u(x, y) = c, o` u c est une constante, quel que soit P et Q. Ceci est toujours possible, car il suffit d’écrire (6.56) sous une des deux formes Q dx =− dy P ou P dy =− , dx Q selon que P 6= 0 ou Q 6= 0 ; aucune des deux fonctions ne peut, par hypothèse, s’annuler simultanément, sinon cela conduirait à un système trivial 0 = 0. En intégrant une de ces deux équations différentielles ordinaires de manière classique (celle dont le membre de droite ne devient pas singulier), nous obtenons, après mise sous forme implicite, l’expression u(x, y) = c. En dérivant u(x, y), on a ∂u ∂u dx + dy = 0, ∂x ∂y ∂u ce qui revient ` a dire que P = λ ∂u u λ est une fonction quelconque. ∂x , Q = λ ∂x , o` Lorsqu’il y a trois variables, bien qu’il puisse être possible, par la méthode décrite ci-dessus, de garantir que P et Q soient proportionnels aux dérivées partielles de Υ par rapport à x et y (il suffit de poser P dx + Qdy = 0 et de résoudre l’équation différentielle ordinaire sous jacente, en considérant z comme un paramètre constant), R ne sera pas nécessairement proportionnel a ∂Υ ` ∂z . Néanmoins, soit u(x, y, z) une telle fonction, de sorte qu’il existe une fonction λ(x, y, z) pour laquelle

P1 = λP =

∂u ∂x

Q1 = λQ

∂u . ∂y

Nous définissons S comme la quantité manquante pour que R1 soit directement proportionnel ∂u a-d. ∂z , c.-` R1 −

∂u ∂u = λR − =S ∂z ∂z

(6.57)

Maintenant, en substituant P1 =

∂u ∂z

Q1 =

∂u ∂y

R1 =

∂u +S ∂z

178


dans P1

∂R1 ∂Q1 − ∂z ∂y

+ Q1

∂P1 ∂R1 − ∂x ∂z

+ R1

∂Q1 ∂P1 − ∂y ∂x

=0

(équation qui est automatiquement satisfaite étant donné que (6.55) est satisfaite), nous obtenons ∂S ∂u ∂S ∂u − = 0. (6.58) ∂x ∂y ∂y ∂x C’est ainsi que deux cas de figure se présentent. Ou bien R1 est proporegrale cherchée, ou alors S est une tionnel ` a ∂u ∂z , auquel cas Υ = u est l’int´ fonction non nulle qui satisfait identiquement l’équation (6.58). Cependant, (6.58) est satisfaite si, et seulement si, il existe une relation entre S et u valable quelles que soient les valeurs particulières de x et y, c-à-d. que u peut s’exprimer directement à partir de S et vice versa : u = g(S)

S = f (u).

Toutefois, la présence de z en tant que paramètre dans u(x, y, z) implique sa présence également en tant que paramètre dans l’équation (6.58), ce qui signifie qu’il faille l’introduire dans l’expression S = f (u, z), bien que x et y n’apparaissent plus indépendamment l’une de l’autre, mais seulement sous forme combinée par l’intermédiaire de la fonction u(x, y, z). C’est ainsi que nous pouvons écrire ∂u ∂u ∂u dx + dy + dz + Sdz ∂x ∂y ∂z = du + Sdz,

λ(P dx + Qdy + Rdz) =

(6.59)

o` u S s’exprime en fonction uniquement de u et z. Nous avons donc obtenu une 1-forme en dimension deux pour laquelle l’intégrale est garantie d’exister par transformation en une équation différentielle ordinaire et intégration classique. Sous forme implicite ceci donne Ψ (u, z) = cte, avec

∂Ψ =µ ∂u

∂Ψ = µS. ∂z

Par conséquent, λµ(P dx + Qdy + Rdz) = µ(du + Sdz) = dΨ, conduisant après subsititution de u(x, y, z) dans Ψ (u, z) à l’intégrale


179

Ψ (u, z) = Υ (x, y, z). Ces considérations se généralisent en dimension plus grande que trois, conduisant au thérorème d’intégrabilité d’une 1-forme suivant : Th´ eor` eme 6.27. Une 1-forme ω est intégrable si, et seulement si, dω ∧ ω = 0.

(6.60)

180


La démonstration, en dimension trois, a déj` a été effectuée ci-dessus. Il suffit de constater que (6.60) conduit en partant de ω = P dx + Qdy + Rdz à l’expression (6.55). Pour le voir, commen¸cons par calculer dω : ∂P ∂P ∂P dx + dy + dz ∧ dx dω = ∂x ∂y ∂z ∂Q ∂Q ∂Q + dx + dy + dz ∧ dy ∂x ∂y ∂z ∂R ∂R ∂R dx + dy + dz ∧ dz + ∂x ∂y ∂z ∂P ∂P = dy + dz ∧ dx ∂y ∂z ∂Q ∂Q dx + dz ∧ dy + ∂x ∂z ∂R ∂R + dx + dy ∧ dz ∂x ∂y o` u nous avons utiliser (6.48). Ensuite, en prenant le produit extérieur, et en distribuant selon (6.49), on obtient ∂P ∂P dy + dz ∧ dx ∧ (P dx + Qdy + Rdz) dω ∧ ω = ∂y ∂z ∂Q ∂Q + dx + dz ∧ dy ∧ (P dx + Qdy + Rdz) ∂x ∂z ∂R ∂R dx + dy ∧ dz ∧ (P dx + Qdy + Rdz) + ∂x ∂y ∂P ∂P = R dy ∧ dx ∧ dz + Q dz ∧ dx ∧ dy ∂y ∂z ∂Q ∂Q +R dx ∧ dy ∧ dz + P dz ∧ dy ∧ dx ∂x ∂z ∂R ∂R dx ∧ dz ∧ dy + P dy ∧ dz ∧ dx +Q ∂x ∂y ∂Q ∂R ∂R ∂P ∂P ∂Q = − P − − − +Q +R ∂z ∂y ∂x ∂z ∂y ∂x dx ∧ dy ∧ dz, de sorte que la condition (6.55) est équivalente à dω ∧ ω = 0. Exemples Nous donnons trois exemples simples de 1-formes :

6.19 Interprétation géométrique de l’intégrabilité et de la non-intégrabilité

181

– La 1-forme ω1 = (z+1)dx+xdz est exacte, car une fois posé Υ = x(1+z), l’utilisation de la formule (6.40) donne d(x(1 + z)) = ω1 . – La 1-forme ω2 = z+1 x dx + dz n’est pas exacte. Par contre, elle est intégrable, étant donné que xω2 = ω1 . – La 1-forme ω3 = (−x + y + yz)dx + x(1 + z)dz n’est pas intégrable puisque ω3 ∧ dω3 = −x(1 + z)2 dx ∧ dy ∧ dz 6= 0.

6.19 Interpr´ etation g´ eom´ etrique de l’int´ egrabilit´ e et de la non-int´ egrabilit´ e La figure 6.5 illustre le cas d’une 1-forme exacte ω = yzdx + xzdy + xydz, pour laquelle la fonction intégral est Υ = xyz − C = 0, avec C une constante arbitraire. On constate que les flèches - vecteur ligne yz xz yz - sont perpendiculaires en chacun de point de la surface intégrale. Elles définissent non seulement un champ normal, mais correspondent exactement au gradient de la fonction intégrale Υ .

Fig. 6.5. la 1-forme ω = yzdx + xzdy + xydz exacte est représentée avec trois surfaces intégrales xyz = cte.

Lorsque la 1-forme n’est plus exacte, mais toutefois intégrable, la longueur de la flèche n’a en quelque sorte pas d’importance, et seul son orientation compte. Ainsi, si au lieu de ω, nous aurions pris une fonction arbitraire η, modifiant en chacun des points la norme de la flèche à ce point, mais pas son orientation, les flèches demeureraient normales aux surfaces intégrales Υ = 0. La 1-forme ηω possèdent donc les mêmes surfaces intégrales que ω. Dans le cas d’une 1-forme non intégrable, les orientations des normales bloquent en quelque sorte le processus d’intégration. Nous allons examiner de plus près une explication géométrique de ce phénomène.

182

6 Elements de Géométrie -2 -1.5 -1 1

-0.5

0

-1

-2

0.5 1 1.5 2 -2

-2 -1.5

-1.5 -1

1

-1 1

-0.5

0

-0.5

0

-1

-1

-2

-2

0.5

0.5

1

1

1.5 2

1.5 2

Fig. 6.6. (i) La 1-forme intégrable ω = yzdx + xzdy + xydz est représentée. (ii) La courbe Ξ est toujours orientée dans le sens des 1-forme. (iii) Les deux surfaces intégrales x2 − y 2 = c1 et y 2 − z 2 = c2 des 1-formes complémentaires (6.63) et (6.64) (c.-` a-d. xzdx − yzdy et xydy − xzdz) se coupent exactement pour donner Ξ. (iv) Les surfaces intégrales ` a ω, ` a savoir xyz = c, c ∈ R pour quatre valeurs de c différentes, sont ajoutées.

6.19 Interprétation géométrique de l’intégrabilité et de la non-intégrabilité

183

Soit P dx + Qdy + Rdz,

(6.61)

une 1-forme arbitraire, ` a partir de laquelle deux équations supplémentaires de deux 1-formes chacune sont constituées : dy dz dx = = . P Q R

(6.62)

Ce système est toujours intégrable (même lorsque (6.61) ne l’est pas), car il comporte deux 1-formes indépendantes comprenant trois variables chacunes. Ce sont, par exemple, les 1-formes Qdx − P dy = 0

(6.63)

Rdy − Qdz = 0.

(6.64)

et

Ces deux équations doivent être satisfaites simultanément sur leur variété intégrale, ce qui est toujours le cas, étant donné qu’il est possible d’assigner une variable indépendante y, et de former le système d’équations différentielles ordinaires P dx = dy Q R dz = dy Q

(6.65) (6.66)

dont la solution - et par conséquent également la solution de (6.62) - est constitué par un ensemble infini de courbes x(y) et z(y), paramétrée par la coordonnée y libre ; chacune de ces courbes part, à la coordonnée y0 , d’une condition initiale x(y0 ), z(y0 ) différente. Remarquons que si Q s’annule le long de l’intégration, il suffit de prendre l’annulation de deux autres 1-formes issues de (6.62) au lieu de Qdx−P dy = 0 et Rdy − Qdz = 0. Nous désignerons par Ξ une courbe parmis cet ensemble ainsi obtenu. En partant d’un certain point de cette courbe Ξ, disons A, il est possible de se déplacer, soit dans la direction de cette courbe le long de son vecteur tangent, soit perpendiculairement ` a celui-ci, dans un nombre infini de directions possibles. Ces directions perpendiculaires sont contenues dans la plan de support des vecteurs lignes (6.63) et (6.64), à savoir Q −P 0 et 0 R −Q . Ce plan sera dénommé le plan perpendiculaire à Ξ au point considéré. Indépendamment des considérations précédentes, choisissons une surface quelconque ψ(x, y, z) = 0 de telle sorte que la point A soit compris dans cette

184


surface. Notons que Ξ n’appartient pas nécessairement à cette surface choisie de manière arbitraire. Maintenant, une solution à (6.61), (qui est une 1-forme quelconque, mais pas nécessairement intégrable), s’obtient de la manière suivante : On se déplace dans le plan perpendiculaire à Ξ au point A. Il existe une infinité de tels déplacements. Cependant, il y a un seul déplacement dans la surface ψ(x, y, z) = 0 dans cette direction. C’est le prochain point désiré A1 . On répète alors la procédure : 1. on construit la courbe Ξ passant à traver A1 et qui satisfait le système (6.62) ; 2. on construit le vecteur ξ au point A1 , tangent à la courbe Ξ le long de celle-ci. 3. parmis tous les co-vecteurs perpendiculaires au vecteur tangent ξ, il en existe un qui correspond à un déplacement au sein de la surface ψ(x, y, z). ; 4. on se déplace ` a ce nouveau point A2 . Ainsi, la solution est dépendante de la surface ψ(x, y, z) choisie. Une fois cette surface choisie, la solution est une famille de courbes dépendant du point initial A. Pour un point A déterminé, il y a une seule courbe particulière. Dans le cas d’une 1-forme intégrable, il est possible de choisir la surface ψ(x, y, z) de telle sorte que tout déplacement infinitésimal à l’intérieur de cette surface soit perpendiculaire au vecteur ξ tangent à la courbe Ξ solution de (6.62). Par conséquent, la solution est assimilée à la surface ψ(x, y, z) = 0 complète et non plus ` a une courbe spécifique. Le résultat (de l’intégration) est indépendant de Ξ, solution de (6.62) : Ξ n’a pas d’influence sur le choix de courbe comprise dans dans ψ(x, y, z) = 0. Mais bien entendu, on ne peut plus choisir ψ(x, y, z) librement, contrairement au cas non-intégrable (c.-à-d. lorsque la condition ω ∧ dω = 0 n’est pas satisfaite). On peut ainsi interpréter le résultat comme le fait que la normale à la surface ψ(x, y, z) = 0 (qui est P Q R est toujours colinéaire au champ de vecteurs correspondant au système (6.62) (celui définissant ξ et Ξ ; afin que les surfaces coupent Ξ ` a angle droit). Le champ de vecteurs est dans l’annulateur des formes constitutives Q R P = = dx dy dz Le cas d’une 1-forme intégrable est illustré à la figure 6.6.

6.20 Les deux formes du th´ eor` eme de Frobenius Soit les équations aux dérivées partielles suivantes :

(6.67)

6.20 Les deux formes du théorème de Frobenius

185

Ξ

A

z 7.5

A’ 7.25

7

6.75

3

6.5 2

0 0.5 1

1

y

1.5

x 0

2

Fig. 6.7. Représentation de la construction d’une solution de ω = 0 lorsque la 1-forme ω n’est pas intégrable. Le cas de ω = (−x − y + yz)dx + x(1 + z)dz = x(1+z) dy dz P dx + Rdz conduit ` a l’équation différentielle dx = −x−y+yz et dx = 0 définissant la courbe Ξ. Cette courbe est représentée pour la condition initiale x = 0, y(0) = 1 et z(0) = 2. Le point A est pris en x = 2, y = 1 et z = 7.07. Comme Q = 0, le plan de support est définit par (R 0 − P )T et (0 R − Q)T . La surface arbitraire ψ(x, y, z) = 12 cos(4(y − 1))(x − 2)2 + 21 sin(4(y − 1))(y − 1)2 + 7.07 intersecte le plan de support selon une courbe sur laquelle le prochain point A1 = A′ se situe. La solution dépend de la surface ψ(x, y, z) choisie.

∂h f1 + ∂x1 ∂h g1 + ∂x1

∂h f2 + ∂x2 ∂h g2 + ∂x2

∂h f3 = 0 ∂x3 ∂h g3 = 0 ∂x3

(6.68) (6.69)

Avec fi (x1 , x2 , x3 ) et gi (x1 , x2 , x3 ), i = 1, . . . , 3 des fonctions données. Il existe deux formulation des conditions nécessaires et suffisantes pour l’existence d’une fonction h(x1 , x2 , x3 ) qui satisfasse les équations (6.68) et (6.69). La première formulation utilise directement les deux champs de vecteurs T T f1 f2 f3 et g1 g2 g3 :

186


1 1.25 1.5 1.75 2

Ξ 1.5

z

1

0.5

y

0

0 0.5

x

1 1.5 2

Fig. 6.8. Dans le cas intégrable il est possible de trouver une surface pour laquelle tout les déplacements infinitésimaux sont possibles. Le cas de ω = yzdx

Th´ eor` eme 6.28. h(x1 , x2 , x3 ) est une solution si, et seulement si, le crochet de f et g retombe dans l’espace engendré par f et g, c.-` a-d. qu’il existe deux fonctions scalaires de x, disons α1 (x) et α2 (x) de M → R telles que [f, g](x) = α1 (x)f (x) + α2 (x)g(x). Pour avoir un résultat local, il n’est pas nécessaire de tester la condition ci-dessus sur toute la variété M mais autour d’un voisinage o` u l’on aimerait construire la fonction h(x1 , x2 , x3 ). Ce théorème permet de rattacher la condition d’intégrabilité de la fonction h` a celle de la distribution engendrée par les champs de vecteurs : D´ efinition 6.29. Une distribution (génére par f1 et f2 ) pour laquelle la fonction h satisfasse aux équations (6.68) et (6.69) est dite complètement intégrable. La seconde formulation du théorème de Frobenius utilise la 1-forme unique qui est perpendiculaire aux champs de vecteurs f1 et f2 . Soit ω la 1-forme en question de telle sorte que ωf1 = ωf2 = 0.

(6.70)


187

Th´ eor` eme 6.30. h(x1 , x2 , x3 ) est une solution ⇔ ω ∧ dω = 0. La seconde condition exprime simplement que la 1-forme doit être intégrable. En fait, le gradient de h ne diffère de ω que par une fonction inconnue qu’il s’agit de déterminer comme cel` a a été démontré à la section 6.14. Nous formulerons les deux conditions dans le cas d’une dimension de l’état plus grande que trois et nous verrons que ces deux théorèmes sont identiques. La seconde formulation a déj` a été démontrée dans le cas de trois variables ; la démonstration dans le cas d’un plus grand nombre de variables suit les mêmes lignes. Nous nous contenterons donc de montrer que la première formulation est équivalente ` a la seconde. Dans le cas de plus de trois variables, la première formulation s’énonce ` a partir du concept de distribution involutive (aussi appelée famille involutive par abus de langage pour désigner une famille de champ de vecteurs qui est involutive). Distribution involutive D´ efinition 6.31. On dit que la distribution engendrée par une famille de champ de vecteurs {f1 , f2 , . . ., fn } est involutive, lorsque ∀fi , fj , i, j = 1, . . . n [fi , fj ] ∈ span {f1 , f2 , . . . , fn } o` u span signifie ”sous-espace vectoriel engendré par”. Ainsi, une famille involutive est une collection de champ de vecteur tels que si on prend n’importe quel couple de vecteurs y appertenant et que l’on en prenne le crochet de Lie, le champ de vecteur résultant retombe dans la distribution. Ceci signifie qu’en chaque point de la variété, le crochet de deux vecteurs appartenant au sous-espace vectoriel engendré par les vecteurs définissant la distribution demeure dans le sous-espace vectoriel en question. Nous avons également besoin de la propriété dω(f, g) =

1 (Lf (ωg) − Lg (ωf ) − ω[f, g]) . 2

(6.71)

Elle découle de la dérivation extérieure d’une 1-forme arbitraire ω mais exprimée sans recours aux coordonnées locales. La 2-forme dω est évaluée selon deux vecteurs arbitraires f et g afin de donner un nombre qui s’exprime directement ` a partir des dérivées de Lie des quantitée ωf et ωg (ces dernières sont

188


des valeurs scalaires). Il reste toutefois un terme supplémentaire qui dépend du crochet de Lie des deux vecteurs f et g et c’est là que réside esstentiellement le lien entre les deux formulations du théorème de Frobenius. La propriété (6.71) se démontre par calcul direct. La procédure est un peu fastidieuse mais ne présente pas de difficulté particulière et nous en laissant le soin au lecteur. Nous donnons maintenant la formulation des deux formes du théorème de Frobenius dans le cas d’une distribution définie par n − 1 champ de vecteurs de n coordonnées (la variété est de dimension n). Th´ eor` eme 6.32. Un ensemble de n − 1 champ de vecteurs {f1 , f2 , . . . , fn−1 } définit une distribution intégrable si, et seulement si, la distribution est involutive. Th´ eor` eme 6.33. Soit ω, la 1-forme qui annule tous les champs de vecteurs f1 , f2 , . . ., fn−1 . La 1-forme ω et la distribution définie par les champs f1 , f2 , . . ., fn−1 sont intégrables si, et seulement si, ω ∧ dω = 0. Nous savons que, par définition, une distribution consitituée de n−1 champ de vecteurs est intégrable s’il existe une fonction h tel que son gradient annule la distribution en question. Par conséquent, il suffit de vérifier que la condition d’intégrabilité ω ∧ dω = 0 est équivalente à l’involutivité de la distribution {f1 , f2 , . . . , fn−1 }. Commen¸cons par admettre que la distribution est involutive. Ceci signifie Pn−1 que quelque soit i, j, les crochets [fi , fj ] s’expriment [fi , fj ] = k=1 αk (x)fk . Comme ω est choisi de telle sorte que ωfk = 0, k = 1, . . . , n − 1, on a donc ω[fi , fj ] = 0 pour tout choix de i et j (ceci découle directement de l’involutivité). C’est ainsi qu’en utilisant (6.71), on a dω(fi , fj ) = 12 (Lfj (ωfi ) − Lfi (ωfj ) − ω[fi , fj ]) = 12 (Lfj (ωfi ) − Lfi (ωfj ) = 0, et donc dω(fi , fj ) = 0 pour autant que fi , et fj appartienne à la distribution. Attention, ceci ne signifie par pour autant que dω(f1 , f2 ) = 0 quel que soit f1 et f2 . Toutefois, comme la distribution est de rang n − 1, et puisque dω s’annule sur cette distribution, dω se décompose selon deux 1-formes dont une au moins est multiple de ω. En d’autres termes, dω = ω1 ∧ α(x)ω. En effet, supposons que cela ne soit pas le cas et que dω = ω1 ∧ ω2 de telle sorte que ni ω1 ni ω2 ne soit multiple de ω. Ceci signifie, par indépendance linéP aire des f1 , f2 , . . ., fn−1 , qu’il existe alors une combinain−1 son linéaire f¯ = i=1 βi fi pour laquelle à la fois ω1 f¯ 6= 0 et ω2 f¯ 6= 0 et


189

nous aboutissons ` a la contradiction que dω ne s’annule pas sur la distribution F = span {f1 , . . . , fn−1 }. Ainsi, comme dω = ω1 ∧ α(x)ω, nous avons nécessairement dω ∧ ω = 0, et la correspondance de la première formulation à la seconde est démontrée. Dans l’autre sens, nous supposerons que dω ∧ ω = 0 et nous devons alors montrer que la distribution annulant ω est involutive. Premièrement, et quelque soit ω, intégrable ou non, il est toujours possible de trouver des champs de vecteurs f1 , . . ., fn−1 qui annulent ω. Remarquons également que dω peut toujours s’exprimer comme un produit extérieur de deux 1-formes, quel que soit les propriétés particulières de ω. Maintenant, comme dω ∧ ω = 0, ceci signifie, comme précédemment, que une de ces deux formes doive être proportionnelle à ω, car sinon la condition d’intégrabilité ne serait pas satisfaite. Ainsi, et sans perte de généralité, nous pouvons assumer dω = ω1 ∧ α(x)ω,

(6.72)

o` u α(x) est une fonction scalaire arbitraire. Maintenant, nous savons par construction que la 1-forme ω annule tout champ vecteur dans la distribution F = span {f1 , . . . , fn−1 }. Par conséquent, quel que soit les champs de vecteurs f ∈ F et f¯ ∈ F, nous aurons à cause de (6.72) dω(f, f¯) = 0. (6.73) En utilisant la propriété (6.71), nous avons 1 1 Lf (ω f¯) − Lf¯(ωf ) − ω[f, f¯] = − ω[f, f¯] = 0. dω(f, f¯) = 2 2

Par conséquent [f, f¯] ∈ F. Comme le choix de f et f¯ est arbitraire, la distribution F est bien involutive, ce qui conclut sur l’équivalence des deux formes du théorème de Frobenius.

7 Commande par lin´ earisation

Le présent chapitre aborde les techniques qui ont comme objectif d’exploiter la possibilité d’utiliser des techniques linéaires pour la synthèse d’une loi de commande en essayant de garantir un ensemble de stabilité le plus grand possible. Nous ne traiterons que des systèmes comportant une seule entrée. Une manière de procéder est de tranformer, par l’entremise d’un bouclage, le système initial en un système équivalent linéaire, a` partir duquel des techniques de synthèse linéaires peuvent être appliquées. Le modèle linéaire le mieux approprié est le système linéaire le plus simple possible, c.-à-d. une chaˆıne d’intégrateurs. Nous distinguons essentiellement deux méthodes, celle qui transforme l’ensemble de l’état initial en une chaˆıne d’intégrateurs. Cette chaˆıne contient alors autant d’intégrateurs que le nombre d’états utilisés pour décrire le système originellement. La seconde consiste à ne transformer qu’une sous partie associée a une sortie du système assignée dès le départ. Il faut alors faire attention à ce ` que la partie rendue inobservable par le bouclage sur la sortie ne déstabilise pas les états qui ne sont pas pris en compte par l’équivalence avec la chaˆıne d’intégrateurs. Nous traiterons essentiellement du problème de régulation et de la poursuite de trajectoire. Ces objectifs peuvent être définis en fonction du concept d’équation différentielle d’erreur. Nous présentons également une technique de commande en boucle ouverte ou commande a priori.

192

7 Commande par linéarisation

7.1 Lin´ earisation locale et stabilisation Soit x˙ = f (x, u) une représentation du système non linéaire pour lequel on aimerait trouver un régulateur garantissant la stabilité et la convergence rapide vers un point d’équilibre désiré. Une première idée consiste à ne retenir que les effets directs de f (x, u) sur l’évolution temporel de l’état x. Ceci revient à ne retenir que le premier ordre du développement de Taylor de la fonction f (x, u). En effet, lorsque les signaux (grandeurs d’état) sont comparables à la valeur nominale autour de laquelle le développement de Taylor est affectué (l’erreur est alors petite), les premiers termes dominent les autres, et ils constituent alors une bonne approximation du système non linéaire. Cette méthode de linéarisation est très répandue, car c’est sans doute la méthode la plus simple permettant d’utiliser un paradigme linéaire pour la synthèse. En partant du système initial x˙ = f (x, u), o` u l’on suppose sans perte de généralité que 0 = f (0, 0), une représentation d’état d’un système linéaire équivalent est calculée : x˙ = Ax + Bu. Les matrices A et B sont alors donnée respectivement par A= et B=

∂f ∂x x=0,u=0

∂f . ∂u x=0,u=0

Ensuite, un régulateur d’état u = −Kx est élaboré qui transforme le système dynamique initial x˙ = f (x, u) en x˙ = f (x, −Kx) = f¯(x) . L’analyse du système au premier ordre de la dynamique résultante s’écrit ! ∂ f¯ du ∂f ∂f x˙ = x = (A − BK)x x= + ∂x x=0 ∂x x=0,u=0 ∂u x=0,u=0 dx

Lorsque la paire A et B est commandable, il est possible d’assigner les pˆ oles du système en boucle fermée de manière arbitraire en utilisant le vecteur de gains K (en utilisant la formule d’Ackermann par exemple).

7.1 Linéarisation locale et stabilisation

193

En conséquence, ∀Q > 0, ∃P > 0 tel que l’équation de Lyapunov du système linéaire transformé soit vérifiée : P (A − BK) + (A − BK)T P = −Q. La candidat de Lyapunov V (x) = xT P x devient une fontion de Lyapunov valable localement. 7.1.1 Exemple Un exemple permettra d’illustrer la méthode précédente. Il s’agit d’un simple robot ` a un degré de liberté avec un actioneur pour la coordonnée libre. Ce système est représenté ` a la figure 7.1.

θ τ

Fig. 7.1. Pendule avec actuateur

Ce système est ”presque” linéaire. Par exemple, il le serait s’il était placé à l’horizontale de telle sorte que l’axe de rotation se confonde avec l’axe vertical, supprimant de la sorte l’action de la gravité sur le pendule. Par contre, lorsqu’il est placé verticalement, l’axe de rotation devenant un axe horizontal, la gravité agit sur la barre. Comme le centre de gravité n’est pas situé sur l’axe de rotation, un couple en résulte, lorsque la barre quitte la position d’alignement vertical. L’influence de la gravité n’est pas homogène avec l’écart provoqué par rapport ` a ce point d’équilbre. La dépendance fait apparaˆıtre une fonction trigonométrique. Ce système a fait l’objet d’une brève présentation dans le chapitre introductif o` u il a été question de la présence de deux points d’équilibre isolés. Ce simple fait, aurait pu nous indiquer la présence de non-linéarité. En conclusion, la dépendance gravifique en raison trigonométrique donne naissance à des équilibres mulitples comme le calcul le confirme. Nous commen¸cerons par établir les équations du système dynamique puis nous obtiendront les matrices A et B associées à la linéarisation locale, à partir desquels une synthèse de retour d’état sera effectuée.

194


Formulation des équations dynamiques Pour formuler les équations dynamiques, il est impératif de déterminer les coordonnées des centres de masses de tous les corps pouvant se déplacer par rapport aux autres. Dans cet exemple trivial, seul le centre de masse de la barre mobile doit être étudié. Ses coordonnées xc et yc répondent aux équations,

xc = lc cos θ yc = lc sin θ La méthode de la mécanique analytique lagrangienne est utiilisée pour établir les équations. L’énergie cinétique et potentielle s’écrivent : 1 1 1 mx˙ 2c + my˙ c2 = mlc2 θ˙2 2 2 2 Ep = mgyc = mglc sin θ Ec =

En appliquant la méthode de Lagrange, le Lagrangien s’écrit L = Ec − Ep et la dynamique ∂L d ∂L = τ, − ˙ dt ∂ θ ∂θ l’équation suivante est obtenue : mlc2 θ¨ + mglc cos θ = τ. Ici, τ = u joue le rôle d’entrée du système. Le problème qui est posé est alors de stabiliser l’ensemble, de telle sorte que le pendule fasse un angle δ fixe. Une représentation d’état peut être obtenue en chosissant x1 = θ − δ et x2 = θ˙ :

x˙ 1 = x2 x˙ 2 = −

1 g cos(x1 + δ) + τ lc mlc2

A l’équilibre x1 = 0, τ = τ0 = mglc cos(δ). En linéarisant, la matrice A est également obtenue :

A=

g lc

0 1 ; sin(δ) 0

B=

0 1 ml2c

7.2 Linéarisation exacte

195

La loi de commande comportera alors un terme constant (a priori) afin de maintenir le bras dans sa position d’équilibre en l’absence de perturbation, et deux gains constant, un pour chacun des deux états x1 et x2 . On obtient alors, τ = τ0 − k1 x1 − k2 x2 .

7.2 Lin´ earisation exacte La méthode de linéarisation exposée à la section précédente n’est valable que localement. C’est uniquement autour de la valeur nominale, o` u est effectué le développement de Taylor de la fonction f (x, u), que l’approximation donne de bons résultats. Lors de grands écarts, les termes d’ordre élevés l’emportent sur les premiers termes du développement, et l’approximation est alors souvent inutile. Néanmoins, il est possible de changer de point nominal du développement, afin de constituer un nouveau système linéaire local. Avec un peu de chance, ce nouveau système permet de caractèriser le comportement, mais aucune garantie n’est alors possible. Il existe toutefois d’autres approches pour améliorer la taille de la validité de la linéarisation. Elles reposent toutes plus ou moins sur l’idée de changer la représentation du système initial pour corriger l’effet néfaste des termes d’ordre supérieur. Ceci est effectué, soit en les corrigeant directement par la commande, soit en changeant de coordonnées de telle sorte qu’ils n’apparaisent plus dans le dévelopement selon ces nouvelles coordonnées. La possibilité d’implanter une loi de rétroaction arbitraire permet de transformer le système initial en un nouveau système avec de meilleures propriétés. De plus, le choix des coordonnées pour représenter l’état du système permet également de simplifier les équations. Par exemple, dans le cas purement géométrique d’une sphère, l’utilisation de coordonnées sphériques (angles de latitude de de longitude) est mieux adapté que les coordonnées cartésiennes tridimensionnelles. Nous présenteront, sans recours pour l’instant aux formules associées, les concepts qui seront approfondis dans les sections suivantes. Changement de coordonnées Dans les ouvrages de mécanique théorique (mécanique analytique par exemple), l’utilisation d’un système de coordonnées plutˆ ot qu’un autre, permet de simplifier grandement l’expression des équations dynamiques. Par exemple, dans le formalisme Hamiltonien, les transformations de Legendre (transformation qui implique non seulement les coordonnées, mais également les moments généralisés) sont très utiles pour obtenir des constantes du mouvement, et donc intégrer le système mécanique.

196


Dans notre cas, nous sommes en présence d’une représentation d’état. La structure des équations ne découle pas nécessairement de l’existence de fonctions particulières comme le lagrangien ou l’hamiltonien. Toutefois, un changement d’état peut néanmoins être bénéfique. Seule la structure mathématique des équations peut être exploitée afin de trouver de bons choix de coordonnées. Changement de l’entrée (retour d’état) Par l’entremise d’un bouclage supplémentaire, définissant une nouvelle entrée, les caractéristiques du systèmes sont modifiées. Pour mieux comprendre le phénomène, il suffit de prendre l’exemple du réglage en cascade. Un premier bouclage permet d’assurer le suivi d’une consigne pour une grandeur de sortie déterminée. Ce bouclage définit complètement l’entrée initiale du système à commander. Cependant, si l’on interprète la consigne en question comme une nouvelle entrée, le système comporte maintenant, ` a la fois le système initial, mais également le bouclage, et le comportement du système est donc bien modifié. Toute la difficulté revient à trouver un bouclage adéquat qui garantisse les bonnes propriétés du système transformé. Linéarisation entrée-état C’est la linéarisation de l’état dans son ensemble. Cette technique utilise a la fois un changement de coordonnées et un bouclage. ` Linéarisation entrée-sortie Contrairement au cas précédent, cette technique ne linéarise que le comportement entrée-sortie. Nous verrons que ceci a comme conséquence de garantir un comportement linéaire d’une partie seulement de l’espace d’état. Le système devra possèder de bonnes propriétés afin que la partie restante de l’état ne devienne pas instable lorsque la linéarité est imposée sur la sous-parti de l’état correspondante. Cette technique utilise principalement qu’un bouclage. Cependant le changement de coordonnée est souvent utilisé également pour mettre le système sous la forme normale, représentant une forme canonique du système. La linéarisation est globale C’est principalement le gain des méthodes qui seront présentées par rapport ` a la technique de la première approximation présentée plus haut. Nous examinerons essentiellement les systèmes comportant une seule entrée. Les techniques présentées peuvent toutefois être étendues relativement facilement au cas d’entrées multiples qui offre également quelques possibilités

7.3 Equation d’erreur

197

supplémentaires, notamment dans la possibilité d’utiliser une extension dynamique pour surmonter d’éventuels bloquages. Le lecteur intéressé pourra consulter les ouvrages cités en référence à la fin du Livre pour un traitement de ces sujets. Avant de procéder avec l’exposition de ces sujets, nous reprenons l’exemple du pendule simple avec un seul actuateur. La représentation d’état

x˙ 1 = x2 x˙ 2 = −

1 g cos x1 − τ lc mlc2

indique que la première équation est parfaitement linéaire. La second par contre montre la présence de l’influence de la gravité de manières trigonométrique. Par ailleurs, l’entrée apparaˆıt sur cette même équation. Ainsi, nous constatons que la représentation semble ne pas nécessiter de modification, étant donner qu’une partie est déj` a sous forme linéaire et que la partie non linéaire semble pouvoir être compensée par l’entrée seulement. En effet, en choisissant un bouclage adéquat, le changement d’entrée v → τ : τ = α(x) + β(x)v, transforme le système intial en un système linéaire (vu de la nouvelle entrée) équivalent. τ=

mlc2

g v + cos x1 , lc

α(x) = mglc cos x1 , β(x) = mlc2 01 0 on linéarise le système : A = ,b= , 00 1 x˙ = Ax + bv. Quoique cet exemple soit simplisite, il illustre parfaitement le gain entre une approche de type purement locale et une approche de nature globale.

7.3 Equation d’erreur La présente section sert a` introduire le concept fondamental pour la commande par linéarisation, que cel` a soit à des fins de stabilisation de point d’équilibre, ou de stabilisation en poursuite ; c’est l’équation d’erreur. La section suivante examine la signification de cette équation dans le contexte de fonction. Ensuite, le cas des équations différentielles est considéré.

198


7.3.1 Fonction Dans le cas de fonctions, il y a évidemment absence de comportement dynamique. Obtenir les zéros d’une fonction scalaire de R dans R notée f (x) consiste a rendre nulle l’erreur e = f (x) en déterminant les valeurs particulières de x. ` Lorsque la fonction considérée fait correspondre plusieurs grandeurs scalaires distinctes de l’ensemble de départ, pour fournir plusieurs valeurs scalaires distinctes, disons f (x) : Rn → Rm , trouver des zéros de la fonction revient ` a trouver des ensembles de nombres réels x1 , x2 , . . ., xn qui annulent simultanément toutes les composantes de la fonction f , disons f1 (x1 , x2 , . . . , xn ) = 0, f2 (x1 , x2 , . . . xn ) = 0, . . ., fm (x1 , x2 , . . . , xn ) = 0. Maintenant, lorsqu’au lieu de considérer les zéros de la fonction, on aimerait forcer la fonction ` a prendre une valeur particulière, il est possible de considérer la fonction modifiée e = f¯ − f , o` u f¯ désigne la valeur désirée. On retrouve une équation d’erreur, et la réponse au problème posé revient a chercher les valeurs de x qui annulent cette nouvelle équation d’erreur. En conséquence, chercher les zéros d’une fonction ou bien les valeurs de l’ensemble de départ qui force la fonction à prendre une valeur particulière revient en quelque sorte ` a une tˆ ache analogue. Il s’agit de trouver les zéros d’une équation d’erreur. 7.3.2 Equation diff´ erentielle Si le comportement dynamique doit être pris en compte, la fonction f cède la place ` a une équation différentielle x˙ = f (x, u), il n’est plus possible de forcer instantanément x à zéro, lorsque cette variable est initialement différente de zéro. Le cas le plus élémentaire est une équation linéaire ` a une seule variable, sans entrée. Par exemple, avec x ∈ R, x˙ = −3x.

(7.1)

Comme cette équation est dépourvue d’entrée, elle ne peut donc pas être influencée de quelque manière que ce soit. Par contre, on peut facilement trouver sa solution analytique x(t) = x0 e−3t . Etant donné que x(t) → 0 lorsque t → 0, la solution converge asymptotiquement vers la valeur nulle désirée. La vitesse de convergence est déterminée par la valeur absolue du nombre devant la variable du temps dans l’exponentiel, c.-à-d. 3.


199

Dans le cas o` u le signe est changé devant ce facteur, de telle sorte que l’équation différentielle s’écrive x˙ = 3x, la solution x(t) = x0 e3t diverge. Il n’y a alors pas moyen de changer ce comportement. Par contre, dès qu’une entrée est à disposition, il est possible de modifier les solutions de l’équation différentielle, en corrigeant la valeur de l’entrée en fonction de l’état. Par exemple, bien que x˙ = 3x + u

(7.2)

diverge lorsque l’entrée est forcée à zéro, u = −4x transforme l’équation originale (7.2) en une équation différentielle convergente, x˙ = −x, puisque la solution à cette dernière est x0 e−t . Stabilisation ` a une valeur constante L’exemple précédent (7.2) peut être également interprété à l’aide de la variable d’erreur e=0−x (7.3) La variable d’erreur est ainsi définie afin d’indiquer que nous voulons forcer le système ` a converger vers la valeur nulle. En différentiant (7.3), et en introduisant (7.2), une nouvelle équation différentielle est obtenue : e˙ = 3e − u.

(7.4)

En posant u = +4e, cette équation est transformée en e˙ = −e,

(7.5)

qui est également une équation différentielle dont la solution converge exponentiellement vers la valeur nulle désirée. Il est intéressant de noter que, dans ce cas, la manipulation d’introduire la variable d’erreur est purement formelle, et ne change pas du tout le résultat final, car u = +4e = −4x comme précédemment. Poursuite L’avantage d’introduire la variable d’erreur est la possibilité de traiter, à la fois la stabilisation vers une valeur constante, et la poursuite d’une trajectoire prédéfinie. Nous avons vu que, dans le cas de fonctions, il suffisait de changer la variable d’erreur de e = 0 − f en e = f¯ − f pour traiter de la même manière,

200


la recherche de zéros de la fonction, et celle des valeurs qui forcent la fonction a prendre une valeur désirée f¯. ` En quelque sorte, cette technique s’étend sans difficulté au contexte des équations différentielles. Il suffit de déterminer la quantité à ajouter à l’opposé de la variable que l’on désire commander pour constituer la variable d’erreur. Par conséquent, nous considérons d’abord le problème de spécifier le comportement désiré en poursuite. Spécification du comportement désiré Nous avons vu que l’évolution (solution) de l’équation différentielle peut être modifiée en changeant convenablement la valeur de l’entrée. Il est possible également de spécifier l’évolution temporelle de la variable a commander. ` Par exemple, si l’origine doit être atteinte en un temps fini, il est possible de considérer une évolution sous forme d’un polynôme de la variable temporelle. Dans le cas de l’équation (7.2) , le transfert de l’état initial x0 à t = 0 vers l’origine xT = 0, en un temps arbitraire T choisi préalablement, en suivant un segment de droite, est obtenu en posant xc (t) = at + b et en déterminant a, b ∈ R de telle sorte que la condition intiale xc (0) = x0 et la condition terminale xc (T ) = 0 soient satisfaites. On obtient sans peine xc (0) = x0 = a0 + b = b. De même, aT + b = 0 = aT + x0 , a = − xT0 ; et l’on détermine le signal de référence, aussi appelé signal de consigne, résultant : x0 xc (t) = − t + x0 (7.6) T Commande en boucle ouverte Lorsque les conditions initiales sont parfaitement connues, et en absence de perturbation (c.-` a-d. lorsque, à la fois l’équation différentielle, et la valeur de l’état, demeurent non modifiées par des facteurs extérieurs de telle sorte que la variable ` a commander suit exactement la solution de l’équation différentielle de départ), il est possible de déterminer l’entrée u à appliquer pour effectuer le transfert de x0 ` a 0 en un temps arbitraire T (pour autant que le système soit commandable ; nous examinerons ceci plus en détail ultérieurement). Dans notre exemple précédent, il suffit de remplacer x par xc dans l’équation différentielle de départ (7.2), c.-à-d. x˙ c = 4xc + u, de telle sorte que − xT0 = 4(− xT0 t + x0 ) + u, autrement dit u=

x0 (4t − 1) + 4x0 T

(7.7)

Ceci signifie qu’il est possible de calculer, a priori, la commande pour déplacer, en suivant un segment de droite, le système d’une valeur initiale


201

donnée vers une valeur prédéterminée désirée, en un temps lui-aussi déterminé et arbitrairement court. Ceci conduit naturellement à obtenir une suite continue de valeurs de l’entrée qui garantit la transition. Il est important d’insister sur la nature de la commande obtenue. Une fois la décision prise d’appliquer la séquence continue mentionnée plus haut, et donnée par la fonction temporelle (7.7), il n’y a plus d’effet de la sortie effective du système (la variable x) sur le choix de l’entrée u. Tout s’opère en quelque sorte en aveugle, et c’est seulement après le temps T qu’une nouvelle transition, ou correction est possible. Ainsi, lors d’une modification du comportement, comme par exemple une modification instantanée de la variable x durant l’interval ]0; T [, suite à une perturbation par exemple, il n’y a pas moyen, pour le moment, d’instantanément prendre en compte ce phénomène en corrigeant la commande appliquée au système. Commande en boucle fermée Toutefois, il est possible d’envisager une méthode pour corriger l’apparition de la dérive causée par une brusque réinitialisation de la varible x à un instant inopiné et inconnu. A nouveau, le concept de variable d’erreur est introduit, toutefois avec comme différence essentielle que l’erreur est constituée entre la consigne précédemment obtenue et la variable à commander ; ainsi e = xc − x. En dérivant cette erreur, et en tenant compte à la fois de la dynamique et de la consigne, nous obtenons e˙ = x˙ c − x˙ = x˙ c − 3x − u = x˙ c − 3(xc − e) − u

(7.8)

Pour stabiliser l’erreur, il faut forcer une équation différentielle stable. Par exemple, en choisissant e˙ = −e, la commande ux˙ c − 4(xc − x) est obtenue. Une méthode systématique pour ce type de synthèse est présentée dans la prochanine section. 7.3.3 Placement de pˆ oles et ´ equation d’erreur L’équation différentielle d’erreur (7.5) est très simple, étant donné qu’elle ne comporte qu’une seule dérivée (1er ordre). N’importe quel autre nombre negatif que −1 devant e au membre de droite conduirait à une convergence asymptotique vers la valeur nulle de la solution. Lorsque l’ordre de l’équation est supérieur ` a un, les choses ne sont pas aussi simples.

202


Dans le cas d’une équation différentielle linéaire d’erreur d’ordre supérieur ` un, l’erreur, ainsi qu’un certains nombre fini des dérivées temporelles de cette a erreur, appraissent avec des coefficients qui sont déterminés de telle sorte que la solution converge exponentiellement vers zéro. Comme l’équation est supposée être linéaire, la solution est une somme de signaux exponentiels dont les coefficients sont choisis en fonction des taux de décroissance désirés. La méthode est la suivante. On choisit un nombre de nombres complexes (les pˆ oles ` a placer) correspondant à l’ordre de l’équation différentielle d’erreur que nous voulons constituer, disons m. On a ainsi s1 , s2 , . . ., sm les m pˆ oles complexes qui sont alors choisis avec une partie réelle négative. Plus cette dernière est grande, plus rapide sera la convergence. On constitue le polynˆ ome en s ayant ces pˆ oles comme zéros, c.-à-d. E(s) = (s − s1 )(s − s2 ) . . . (s − sm )

= sm + a1 sm−1 + . . . am−1 s + am

d et en appliEn rempla¸cant la variable s par l’opérateur de dérivation dt d quant l’opérateur E( dt ) associé au polynôme E(s) à la variable temporelle d d’erreur e(t), on aboutit ` a l’équation différentielle d’erreur E( dt )e(t) = 0, autrement dit

E(

d )e(t) = e(m) + a1 e(m−1) + . . . + am−2 e¨ + am−1 e˙ + am e = 0 (7.9) dt

7.4 Syst` emes lin´ eaires SISO Nous considérons dans cette section le cas de systèmes linéaires ayant une seule entrée. Nous pouvons le représenter à l’aide de la représentation d’état, x˙ = Ax + Bu.

(7.10)

7.4.1 Sortie sp´ ecifi´ ee Dans la plupart des cas, l’état n’est qu’une représentation interne du système, et la tˆ ache du régulateur est de garantir principalement un comportement de sortie. Bien entendu, il est alors impératif que les états internes restent dans des bornes acceptables afin que le dispositif décrit par (7.10) ne court pas de risque de destruction ou d’endomagement.

7.4 Systèmes linéaires SISO

203

Ainsi, en plus des équations (7.10), une sortie y = Cx

(7.11)

est également donnée. Nous supposerons, sans perte de généralité, que l’entrée u n’influence pas directement la sortie. Ceci étant le cas avec (7.11), le système (7.10) indique que l’entrée pourrait influencer la dérivée temporelle de cette sortie y. En effet, y˙ = C x˙ = CAx + CBu (7.12) de telle sorte que si CB 6= 0, l’entrée u influence directement y. ˙ Dans le cas contraire, cette procédure peut être continuée : y¨ = CAx˙ = CA2 x + CABu = CA2 x .. . y (r−1) = CAr−2 x˙ = CAr−1 x + CAr−2 Bu = CAr−1 x y (r) = CAr−1 x˙ = CAr x + CAr−1 Bu

(7.13)

avec CAr−1 B 6= 0 et CB = 0, CAB = 0, . . ., CAr−2 B = 0. Nous pouvons donc assumer, qu’il existe un nombre entier r 6= 0, 1 ≤ r < n = dim x, pour lequel y, y, ˙ y¨, . . ., y (r−1) ne sont pas influencées par u. Seul y (r) subit l’influence directe de l’entrée u, et nous pouvons donc définir (r) y comme la nouvelle entrée v = y (r) = CAr x + CAr−1 Bu,

(7.14)

a partir de laquelle le bouclage ` u=

1 (v − CAr x) , CAr−1 B

(7.15)

obtenu par simple inversion de l’expression précédente, transforme le système initial (7.12) en une chaˆıne d’intégrateurs y (r) = v.

(7.16)

En posant e = yc − y, et en constituant une équation d’erreur differentielle d’ordre r conformément ` la section 7.3.3, nous pouvons garantir une stabilité et une convergence du a système (7.16), par le choix des pˆ oles. Il suffit d’exprimer v en fonction de l’équation différentielle d’erreur résultante :

204


v = yc(r) + a1 e(r−1) + a2 e(r−2) + . . . ar e (7.17) (r) (r−1) (r−1) (r−2) (r−2) = yc + a1 (yc −y ) + a2 (yc −y ) + . . . + ar (yc − y) = yc(r) + a1 (yc(r−1) − CAr−1 x) + a2 (yc(r−2) − CAr−2 x) + . . . + ar (yc − Cx)

Qu’en est-il du système complet ? C’est-à-dire, en considérant (7.12), (7.15), et (7.17) est-ce que l’ensemble de tous les états se comporte-t-il correctement, ` a savoir de manière bornée ? Il s’agit donc d’étudier les états internes qui n’apparaissent pas nécessairement dans le comportement de la sortie. Pour l’analyse qui va suivre, nous allons considérer le cas particulier de yc = 0. Ceci garantit de couvrir tous les cas, étant donné que le principe de superposition est valable en linéaire. Ainsi, sous cette hypothèse, lorsque la stabilité interne est démontrée pour yc = 0, elle l’est également pour un yc quelconque. La loi de bouclage (7.15) avec (7.17) permet de garantir que y, y, ˙ . . ., y (r) (r) convergent vers leurs valeurs respectives yc , y˙ c , . . ., yc , sans erreur. Dans le cas particulier d’une consigne nulle (yc = 0), ceci revient à garantir que y et ses r dérivées convergent vers zéro, c’est-à-dire que la partie de l’état associée converge également vers zéro. Nous avons 

C CA CA2 .. .





y y˙ y¨ .. .



            0=  = 0. x =          (r−1) CAr−1 y

(7.18)

En conséquence, après convergence de y, y, ˙ . . ., y (r−1) à zéro, x est nul a un multiple près du noyau de la matrice d’observabilté tronquée (pour ne ` retenir que les r premières lignes). Ceci signifie que tout vecteur d’état dans l’ensemble   C  CA    2   X = {x |  CA  x = 0}  ..   .  CAr−1

ne pourra pas influencer la commande v élaborée plus haut, cf. (7.17). En particulier, si un tel vecteur d’état diverge à l’infini, il n’y a aucun moyen pour que le régulateur précédent ne détecte et ne corrige le comportement (puisque y et ces dérivées ne sont pas affectés). Nous sommes alors en présence d’une instabilité interne. Les états constituants la trajectoire divergente sont rendus inobservables par le régulateur proposé.


205

Par conséquent, les états rendus inobservables par le bouclage précédent ne doivent pas diverger pour que la commande proposée puisse être applicable. Pour comprendre ce que cela signifie plus concrètement, complétons la matrice d’observabilité tronquée pour constituer une matrice plein rang, c.-àd. la matrice 

de rang n.

C CA .. .



          r−1  CA Z=     γr+1     .   ..  γn

(7.19)

Remarque 7.1. Il est important de noter que les r vecteurs lignes C, CA, . . ., CAr−1 sont nécessairement indépendants, car autrement l’entrée ne pourrait pas apparaˆıtre par dérivation de la sortie au cours du processus (7.13). En effet, le fait de retomber dans l’espace vectoriel courant (celui engendré par la sortie et ces dérivées jusqu’` a l’ordre en cours) implique que l’on ne pourra plus en sortir. C’est pourquoi il est toujours possible de compléter les lignes a l’aide des n − r nouveaux vecteurs indépendants γr+1 , γr+2 , . . ., γn . ` En inversant la matrice Z et en calculant ZZ −1 = I, on constate que les premières r lignes de la matrice Z annulent les n−r dernières colonnes de l’inverse Z −1 . Nous avons donc ainsi une base de X , c.-à-d. une base des vecteurs x qui n’influencent pas l’entrée u après bouclage par (7.15). En changeant de coordonnées par z = Zx, on constate que les premières composantes z1 = y, z2 = y, ˙ . . ., zr = y (r−1) s’annulent (ainsi que leur dérivée) et que les variables internes sont zr+1 , zr+2 , . . ., zn . En prenant la dérivée de ces dernières variables, et en utilisant le fait que v = 0 lorsque y et ces r dérivées ont convergés, de sorte que u=−

1 CAr x, CAr−1 B

206


il s’ensuit que       z˙r+1 γr+1 γr+1 z˙r+2  γr+2  γr+2  1       r BCA x  ..  =  ..  x˙ =  ..  A − CAr−1 B  .   .   .  z˙n γn γn     zr+1 γr+1 z  γr+2  r+2  1   −1 0r×(n−r)  r Z BCA =  .  A−   r−1 I(n−r)  ...  CA B  ..  zn γn   zr+1 zr+2    (7.20) = Az  .  .  ..  zn

Pour que la loi de commande présentée à ce paragraphe puisse fonctionner sans endommager le système à commander, il est nécessaire et suffisant que la dynamique interne (7.20) soit bornée. Ceci signifie deux choses : i) Soit toutes les valeurs propres de la matrice Az ont des parties réelles strictement négatives (auquel cas la dynamique interne sera asymptotiquement stable) ; ou alors ii) les valeurs propres de Az n’ont pas de partie réelle strictement positive et les blocs de Jordan associés aux valeurs propres nulles sont séparés et de dimension deux au maximum, auquel cas la dynamique interne est oscillatoire mais bornée. Exemples Nous allons considérer un modèle élémentaire d’une table de positionnement industrielle ` a une dimension. L’objet à positionner n’est malheureusement pas rigide ; il possède un mode propre associé à sa flexibilité. Ceci rend la tˆ ache de positionnement plus difficile. Un moteur fournit un couple pur τ à un chariot de masse M , qui n’est pas parfait non plus car, ` a vide, il présente un mode de résonance correspondant à une flexibilité propre modélisée par une masse m2 et une constante de rigidité k2 . Le chariot supporte un outil qui doit se positionner précisément à sa position d’arrivée quel que soit l’état initial de la table. L’outil et sa structure possède une masse m1 , et il est relié au chariot par une attache qui n’est pas infiniment rigide. Elle est modélisée par un ressort pur de constante d’élasticité k1 .


207

L’énergie cinétique est donnée par Ecin =

1 1 1 m1 x˙ 21 + m2 x˙ 22 + M x˙ 2 2 2 2

et l’énergie potentielle par Epot =

1 1 k1 (x1 − x)2 + k2 (x2 − x)2 2 2

Le lagrangien pour ce système est donné par L = Ecin − Epot d ∂L En calculant les équations dynamiques par dt − ∂ q˙ x, x1 , x2 et Fx = τ , Fx1 = Fx2 = 0, nous obtenons

∂L ∂q

= Fq avec q =

Mx ¨ − k1 (x1 − x) − k2 (x2 − x) = τ m1 x¨1 + k1 (x1 − x) = 0 m2 x¨2 + k2 (x2 − x) = 0

(7.21) (7.22) (7.23)

Nous allons utiliser la variable x pour désigner à la fois le vecteur d’état et la position du chariot x. Le contexte devrait être suffisant pour distinguer ces deux notions. En cas de confusion possible, une précision explicite sera apportée. Pour simplifier quelque peu les développement nous prendrons un cas numérique particulier M = 1, k1 = 2, k2 = 3, m1 = 0.5 et m2 = 0.25. T En choisissant l’état x = x x1 x2 x˙ x˙ 1 x˙ 2 , il vient x˙ = Ax+Bu, y = Cx avec u = τ et 

0 0 0 10 0 0 0 01  0 0 0 00 A= −5 2 3 0 0   4 −4 0 0 0 12 0 −12 0 0 C= 010000

 0 0  1  0  0 0

  0 0   0  B= 1   0 0

Pour appliquer la méthode présentée, il suffit de dériver cette sortie jusqu’` a ce que l’entrée fasse son apparition. On calcule facilement CB = 0,

CAB = 0,

CA2 B = 0, CA3 B = −4

de sorte que le système peut être transformé en une chaˆıne de quatre intégrateurs

208


y (4) = v a l’aide du bouclage (7.15) qui s’exprime comme ` u=

1 (v − CA4 x) = −4(v − −36 24 12 0 0 0 x) CA3 B

(7.24)

La chaˆıne d’intégrateur se stabilise facilement en constituant l’équation d’erreur différentielle d’ordre quatre. En posant, d’une part e = yc − y, o` u (3) yc est la position x1 de l’outil désirée, et, d’autre part, y˙ c = y¨c = yc = 0 (consigne constante), le polynôme d’erreur s’écrit, en choissant les tous les quatre pˆ oles réels et au même endroit −2, comme E(s) = (s + 2)4 = s4 + 8s3 + 24s2 + 32s + 16, de telle sorte que l’entrée de la chaˆıne d’intégrateurs s’expriment v = 8(−CA2 x) + 24(−CAx) + 32(yc − Cx). Pour trouver la dynamique interne, on complète dans un premier temps C, CA, CA2 CA3 par deux vecteurs lignes γ5 et γ6 afin de garantir une matrice de rang 6. Comme     0 10 0 0 0 C  CA   0 0 0 0 1 0      (7.25) CA2  = −4 4 0 0 0 0  0 0 0 −4 4 0, CA3 on peut fixer

γ5 = 0 0 1 0 0 0 γ6 = 0 0 0 0 0 1 .

En ne retenant que les deux dernières colonnes de l’inverse de la matrice (7.19), on trouve sans difficulté la matrice Az à l’aide de (7.20) : 1 0 1 γ5 −1 O4×2 4 = . (7.26) CA Z A− Az = −12 0 I2 γ6 CA3 B

√ Etant donné que les valeurs propres de Az sont λ = ±2 3j, c.-à-d. qu’elles sont distinctes et ` a partie réelle nulle, la dynamique associée aux deux états internes z5 = γ5 x = x2 et z6 = γ6 x = x˙ 2 est oscillante et stable, mais pas asymptotiquement stable. Ainsi, selon les conditions initiales, le système sera le théaˆtre d’un mouvement oscillant qui demeurera indéfiniment, bien que la sortie finisse par être parfaitement régulée. Pour comprendre de manière imagée ce qui se produit, notons que la commande choisie garantit le contrôle de x1 par construction. Elle garantit également le comportement d’une combinaison d’états supplémentaires


209

déterminée par le vecteur CA2 , à savoir x1 −x. Comme la position x1 converge, la position x converge aussi. Ceci signifie que les deux masses m1 et m finissent par ne plus bouger. Toutefois, le régulateur laisse un degré de liberté dans le système, au sens o` u la position x2 n’est pas contrainte puisque cet état est γ5 x. Le régulateur ne fait que compenser l’influence de la masse m2 sur les deux autres, sans pour autant éliminer l’énergie associée à cette masse. C’est la commande u qui fournit le couple nécessaire pour compenser exactement l’influence de la masse m2 sur le système complet, de telle sorte que la convergence des deux autres positions x1 et x n’en est pas affectée. (A travers le terme − CA13 B CA4 x = 4 −36 24 12 0 0 0 x dans l’expression (7.24).) Ainsi, si la masse m2 ne part pas au repos, la loi de commande implantée ne changera pas le comportement de la position x2 . Celle-ci oscillera indéfiniment, bien que les deux autres masses finissent par s’arrêter. Du point de vue de la sortie spécifiée, tout se passe très bien étant donné qu’elle converge vers le poins désiré selon la dynamique imposée. La seule question est de savoir si l’oscillation en x2 est tolérable d’un point de vue pratique. Ceci dépendra alors du contexte dans lequel la machine devra opérer. Système linéaire 1 L’exemple précédent a montré que la dynamique interne résultante doit être prise au sérieux et analysée avec soin. En effet, il se pourrait que les états associés finissent par diverger. Dans le présent paragraphe et dans le suivant, deux exemples sont présentés afin de caractériser quelque peu la propriété responsable de l’instabilité de la dynamique interne. Ils diffèrent l’un de l’autre uniquement par un changement de signe. De plus, en ne comportant que deux états, ils sont choisis avec une structure la plus simple possible. Soit le premier système donné par les équations x˙ 1 +x2 + u = u x˙ 2 y = x1 . On procède comme précédemment en dérivant simplement la sortie jusqu’` a ce que l’entrée influence une des dérivées. En l’occurance, la première dérivée fait apparaˆıtre l’entrée y˙ = x2 + u = v. Le système équivalent est un intégrateur unique. Nous choisissons, sans perte de généralité, le pˆ ole en −1, et ainsi v = yc + (yc − y), ce qui conduit à u = −x2 + y˙ c − (y − yd ).

210


Il reste ` a déterminer la dynamique interne et son comportement. Comme le système est linéaire, yc = 0 est considéré. Asymptotiquement, y = 0, y˙ = 0, ce qui conduit ` a ce que x1 = 0 et x˙ 1 = x2 + u = 0. Par conséquent, u = −x2 et la dynamique interne devient x˙ 2 = −x2 , qui est asymptotiqement stable puisque sa solution est x2 = x20 e−t . Système linéaire 2 Le deuxième système diffère du premier (7.27) uniquement par le signe devant x2 dans la première équation, c.-à-d. −x2 + u x˙ 1 = u x˙ 2 y = x1 En procédant de manière similaire au cas précédent, y˙ = −x2 + u, u = x2 + y˙ d − (y − yd ), ce qui engendre e˙ + e = 0 x˙ 2 − x2 = y˙ c − e et la dynamique interne x˙ 2 = x2 est instable puisque sa solution x2 = x20 et diverge ` a l’infini. Comparaison Les deux précédents exemples permettent d’élaborer une conjecture sur la structure de la fonction de transfert G(s) de la représentation d’état. En calculant les fonctions de transfert associée G1 (s) =

s+1 s2

G2 (s) =

s−1 , s2

on constate que le changement de signe sur x2 de cette représentation a influencé seulement le numérateur des fonctions de transfert G1 (s) et G2 (s). C’est la position du zéro unique qui se situe dans un cas dans le demi plan droit du plan complexe (dynamique interne instable) et dans le demi-plan gauche (dynamique interne stable). De plus la différence de degré du polynôme du dénominateur par rapport au polynôme du numérateur correspond à la longueur de la chˆ aine d’intégrateurs entre l’entrée v et la sortie y.


211

Dynamique interne et position des z´ eros z˙ = Az + bu y = cT z y = cT (sI − A)−1 bu =

b0 + b1 s u a 0 + a 1 s + a 2 s2 + s3

1 u a 0 + a 1 s + a 2 s2 + s3 x2 = x˙ 1 x1 =

x3 = x˙ 2 

      x1 x1 0 1 0 0 d    x2 = 0 0 1  x2  + 0 u dt x3 −a0 −a1 −a2 x3 1

  x1 y = b0 b1 0 x2  x3

y˙ = b0 x2 + b1 x3 y¨ = b0 x˙ 2 + b1 x˙ 3 = b0 x3 + b1 (−a0 x1 − a1 x2 − a2 x3 +u) u = (a0 x1 + a1 x2 + a2 x3 −

1 b0 ) + (−k1 e − k2 e˙ + y¨d ) b1 x3 b1

0 = e¨ + k2 e˙ + k1 e

x˙ 1 = x2 1 x˙ 1 = (y − b0 x1 ) b1 → x˙ 1 + bb10 x1 = b11 y y = e + yd est borné, stabilité → ℜe − bb10 < 0

Pour que la dynamique interne soit asymtotiquement stable il faut que tous les zéros soient ` a partie réelle strictement négative.

212


7.4.2 Sortie non sp´ ecifi´ ee, formule d’Ackermann La présence d’une dynamique interne pouvant être instable est la principale limite de la technique de dérivation successive. De plus, même lorsque celle-ci est stable, sa vitesse de convergence ne peut pas être modifiée. Cette dynamique interne apparaˆıt à cause de l’influence trop rapide de l’entrée sur la sortie, au sens o` u cette entrée influence la dérivée d’ordre r. La dynamique interne est alors de dimension n − r. On peut alors s’interroger sur la possibilité de choisir une sortie construite de telle sorte que l’entrée influence une dérivée supérieure à r. Etant donné que le système est de taille n, la plus haute dérivée possible est alors r = n. Avec un tel choix de sortie, la dynamique interne disparaˆıt et le système devient équivalent ` a une chaˆıne d’intégrateurs v = y (n) . En conséquence, la sortie y est paramétrée par n coefficients à déterminer, c1 , c2 , . . ., cn , ci ∈ R, i = 1, . . . , n, de telle sorte qu’en définissant (7.27) y = Cx = c1 c2 . . . cn x

l’équation

C B AB A2 B . . . An−2 B = 0

(7.28)

doit être respectée. Ceci découle d’une application directe du processus (7.13) de la section précédente particularisée pour r = n. Néanmoins, nous devons en plus garantir que l’entrée u affecte bien la n-ième dérivée, car sinon il n’y aurait pas moyen de diriger le système. C’est ainsi que CAn−1 B 6= 0.

(7.29)

Afin de déterminer le vecteur C, formons la matrice de commandabilité C = B AB A2 B . . . An−1 B . (7.30)

Les conditions (7.28) et (7.29) signifient qu’un choix de vecteur C correspond ` a la dernière ligne de la matrice inverse de C : C = eTn C −1 ,

(7.31) o` u eTn = 0 0 . . . 0 1 . Tout autre multiple de C conviendrait également parfaitement. Une telle sortie y = Cx est appelée sortie de Brunovsky dans le cas linéaire ou sortie plate dans le cas général. Comme C −1 C = I, CAn−1 B = 1.

(7.32)


213

Pour déterminer le bouclage stabilisant, on prend à nouveau une équation différentielle ordinaire stable mais cette fois-ci d’ordre n, E(s) = sn + a1 sn−1 + . . . + an dont tous les zéros sont ` a partie réelle négative. Conformément au développement précédent, ceci conduit au bouclage 1 (v − CAn x) CAn−1 B n X ai (yc(n−i) − CAn−i x) v = yct +

u=

(7.33) (7.34)

i=1

constitué parP (7.15), (7.17) et particularisé pour r = n. En remarquant que n E(s) = sn + i=1 ai sn−1 est le polynôme caractéristique désiré de la boucle fermée, les deux équations (7.33) et (7.34) n’en forme qu’une qui n’est rien d’autre que la formule d’Ackermann lorsqu’on prend en compte (7.32) :

u = −en C −1 E(A)x.

(7.35)

(Nous avons pris pour simplifier yc = 0, . . . yc = . . . , = ycn = 0, à nouveau sans perte de généralité.) Finalement, la seule condition pour que cette construction soit valable est que le système soit commandable, c’est-à-dire que la matrice matrice C soit inversible. La dynamique interne est absente et tout l’etat est sous contrôle. La sortie y = Cx ainsi que ses dérivées convergent vers les valeurs de référence correspondantes. Exemple Nous reprenons l’exemple de la table rudimentaire. En élaborant la matrice de commandabilité   0 1 0 −5 0 73 0 0 0 4 0 −36    0 0 0 12 0 −204   C= (7.36) 0  1 0 −5 0 73  0 0 4 0 −36 0  0 0 12 0 −204 0

et en ne retenant que la dernière ligne de l’inverse de celle-ci, la sortie de Brunovsky est obtenue 1 1 − 96 000 . y = eTn C −1 = 0 32 (7.37)

214


Bien que la sortie dont le comportement désiré est la position x1 , commander directement celle-ci par la méthode des dérivées successives conduit a une dynamique oscillante interne. ` Par contre, en choisissant une combinaison entre x1 et x2 conformément à (7.37), il est alors possible de complètement s’affranchir de la présence d’une dynamique interne. Le prix est la nécessité de mesurer cette position. Toutefois, même lorsque la position donnée par (7.37) n’est pas mesurable, le fait que cette combinaison retarde l’apparition de l’entrée suffisament pour que tous les états soient sous l’influence de la trajectoire de cette sortie, il est possible d’utiliser cette combinaison d’état pour planifier le mouvement et trouver une commande a priori permettant de transférer le système d’un état initial vers un état terminal. Cette technique sera présentée dans le contexte non linéaire d’ici peu, car les deux techniques que l’on vient de présenter admettent une généralisation.

7.5 Lin´ earisation entr´ ee-sortie La généralisation de la dérivation de la sortie spécifiée au cas non linéaire est ce que nous appelerons la linéarisation entrée-sortie. Nous commencerons par un exemple introductif.

x˙ 1 = sin x2 + (x2 + 1)x3 x˙ 2 = x51 + x3 x˙ 3 = x21 + u y = x1 La sortie étant spécifiée, nous allons simplement la dériver successivement jusqu’` a l’apparition de l’entrée u. Ceci engendre y˙ = x˙ 1 = sin x2 + (x2 + 1)x3 y¨ = cos x2 x˙ 2 + x˙ 2 x3 + (x2 + 1)x˙ 3 = (cos x2 + x3 )(x51 + x3 ) + (x2 + 1)(x21 + u) Ainsi, l’apparition de l’entrée après la deuxième dérivation arrête le processus. Cette entrée permet néanmoins d’imposer y¨, variable que l’on peut considérer comme une nouvelle entrée v. v = (cos x2 + x3 )(x51 + x3 ) + (x2 + 1)(x21 + u)

(7.38)

Il faut toutefois être prudent et garantir que l’on peut effectivement modifier v = y¨ en manipulant u. En résolvant (7.38) pour u, un dénominateur x2 + 1 fait son apparition :

7.5 Linéarisation entrée-sortie

u=

1 v − (cos x2 + x3 )(x51 + x3 ) − x21 (x2 + 1)

215

(7.39)

Par conséquent, l’imposition de y¨ n’est possible que lorsque x2 6= −1. Il est également possible de suivre une trajectoire de sortie yd (t) à condition de constituer l’erreur e(t) = yd (t)−y(t) et de former une équation différentielle d’erreur stable du second ordre. Une fois cette équation déterminée, il suffit de la résoudre pour y¨ = v et forcer cette accélération par l’intermédiaire de u donné par (7.39). Par exemple, l’équation d’erreur e¨ + k1 e˙ + k2 = 0 e = yd − y avec k1 et k2 choisit de telle sorte que les deux racines du polynôme caractéristique s2 + k1 s + k2 = 0 aient chacune une valeur réelle strictement négative conduit entraˆıne une poursuite asymptotique de la sortie par l’entremise de v = y¨d + k1 (y˙ d − y) ˙ + k2 (yd − y). Cependant, il faut également prêter attention aux états cachés par la dynamique entrée-sortie. Seul deux combinaisons des états sont réellement sous contrˆ ole, ` a savoir celle de la sortie y et celle de la dérivée de la sortie y. ˙ Le système comporte trois états, et seul deux combinaison sont linéarisées. Il demeure un état caché, masqué, rendu inobservable par la relation entrée sortie imposée pour linéariser le comportement de sortie. Pour obtenir l’état caché, il suffit de considérer les deux combinaisons commandées y = x1 et y˙ = sin x2 + (x2 + 1)x3 = x˙ 1 . Asymptotiquement, y convergera vers yd et par conséquent x1 → yd . L’état x1 est sous contrˆ ole. La deuxième condition y˙ → y˙ d indique que la combinaison de deux états x2 et x3 est sous contrˆ ole. Ainsi, en envisageant soit l’étude du comportement de x2 , ou celui de x3 , l’évolution cachée du système sera alors déterminée. Par exemple, en considérant x2 , la deuxième équation de la dynamique donne x˙ 2 = x51 + x3 . (7.40) En ne considérant que le comportement asymptotique, il est possible de remplacer dans l’équation (7.40), x1 par yd (t), et déterminer x3 à partir de y˙ d (t) = sin(x2 ) + (x2 + 1)x3 : x˙ 2 = yd5 +

1 (y˙ d − sin x2 ) . x2 + 1

(7.41)

Cette équation différentielle est du premier ordre en x2 . Si elle est instable, la loi de commande de linéarisation entrée-sortie ne pourra pas être appliquée sur le système initial.

216


Si elle est stable, il n’est pas cependant complètement garantit que la loi de commande fonctionne. En effet, non seulement la variable x2 ne doit pas passer par −1, mais il faut également que le transitoire des états x1 et x3 n’entraˆıne pas une instabilité sur x2 . L’équation différentielle (7.41) n’est valable que lorsque x1 = yd et sin(x2 ) + (x2 + 1)x3 = y˙ d et ces égalités n’ont lieu que de fa¸con asymptotique. Entre les deux, il est possible que des phénomène d’instabilité en temps fini fasse leur apparition. Ceux-ci sont causés pas des écarts importants par rapport au comportement asymptotique. Nous présenterons ce phénomène au début du chapitre suivant. Néanmoins, la stabilité de l’équation différentielle (7.41) garantit que localement autour du comportement asymptotique, la loi de linéarisation entréesortie est applicable.

7.6 Lin´ earisation exacte entr´ ee-´ etat A la différence de la linéarisation entrée-sortie, il y a dans le présent cas absence d’une sortie spécifiée initialement. En fait, toute la méthode revient simplement à trouver une sortie particulière (appelée sortie plate ou sortie linéarisante) qui retarde suffisament l’apparition de l’entrée par dérivation successive. Ainsi, la dynamique interne disparaˆıt après transformation en une chaˆıne d’intégrateurs associée. Supposons donc la sortie y = h(x) comme inconnue, et dérivons celle-ci par rapport au temps y˙ =

∂h ∂h ∂h ∂h x˙ = (f (x) + g(x)u) = f (x) + g(x)u ∂x ∂x ∂x ∂x

(7.42)

L’équation (7.42) nous apprend qu’il y aura présence de l’influence de l’entrée u lorsque ∂h ∂x g(x) 6= 0. En utilisant le notion de dérivée de Lie présentée dans le chapitre géométrie, on peut écrire plus succintement la dérivée temporelle de la sortie comme y˙ = Lf h(x) + Lg h(x)u

(7.43)

et la condition que l’entrée n’influence pas celle-ci est que Lg h(x) = 0.

(7.44)

Si cette condition est satifaite, on peut continuer le processus de dérivation, exactement comme dans le cas de la linéarisation entrée-sortie. On obtient la seconde dérivée

7.6 Linéarisation exacte entrée-état

∂Lf h(x) ∂Lf h(x) x˙ = (f (x) + g(x)u) ∂x ∂x = Lf Lf h(x) + Lg Lf h(x)u,

217

y¨ =

(7.45)

et ainsi l’entrée u influencera la seconde dérivée que lorsque Lg Lf h(x) 6= 0. 7.6.1 Conditions pour la sortie plate Si l’on veut réduire la dynamique interne de telle sorte que celle-ci disparaisse, il est nécessaire et suffisant que l’entrée n’apparaisse qu’au dernier moment, c.-à-d. après un grand nombre de dérivées de celle-ci. Pour un système mono-entrée de dimension d’état égal à n, nous avons donc les conditions suivantes :

Lg h(x) = 0 Lg Lf h(x) = 0 .. .. . .

(7.46) (7.47)

Lg Lfn−2 h(x) = 0

(7.48)

Lg Lfn−1 h(x)

(7.49)

6= 0

Remarquons que la dernière condition Lg Lfn−1 h(x) 6= 0 est indispensable pour que l’on puisse trouver une expression de l’entrée afin de contrôler la chaˆıne d’intégrateurs que constitue y et ces n− 1 dérivées. En effet, la dernière dérivée s’exprime comme (n)

(n−1)

y (n) = Lf h(x) + Lg Lf

h(x)u = v

(7.50)

que nous avons égaler ` a une nouvelle entrée v correspondant à l’entrée de la chaˆıne de n intégrateurs y (n) = v. Comme dans le cas de la linéarisation entrée sortie, le contrôleur est complet lorsqu’une équation d’erreur d’ordre n est spécifiée à partir de laquelle l’expression de v est exprimée. Finalement, l’entrée du système d’orgine s’exprime comme 1 (n) u= v − L h(x)) , f (n−1) Lg Lf h(x) o` u v stabilise la chaˆıne d’intégrateurs en utilisant l’équation d’erreur. Bien que les conditions (7.46-7.48) soient les seules que doivent satisfaire la fonction h(x), il n’est pas aisé de trouver des conditions nécessaires et suffisantes pour l’existence de celle-ci. Nous allons reformuler ces conditions afin qu’une interprétation géométrique puisse en découler.

218


Dans la partie géométrique, il a été question de champs de vecteur. Ceux-ci correspondaient ` a la donnée d’un vecteur en chacun des points de la variété. Il existe une opération très utile entre deux champs de vecteurs produisant un nouveau champ de vecteurs. Cette opération rend possible la reformulation plus géométrique de la condition de linéarisation exacte entrée-état. Il s’agit du crochet de Lie entre deux champs de vecteurs. D´ efinition 7.2. Le crochet de Lie de deux champs de vecteurs f et g correspond a ` un nouveau champ de vecteurs noté [f, g] et donné par [f, g] = o` u

∂g ∂x

et

∂f ∂x

∂f ∂g f− g, ∂x ∂x

sont des matrices Jacobiennes.

Une propriété intéressante de la dérivée de Lie le long du crochet de Lie est qu’elle puisse s’exprimer à partir des dérivées de Lie des vecteurs avant le crochet. Plus précisément. Proposition 7.3. L[f,g] h(x) = Lf Lg h(x) − Lg Lf h(x)

(7.51)

Preuve. Le membre de gauche s’obtient par application de la définition de la ∂g dérivée de Lie en considérant le champ de vecteur [f, g] = ∂x f − ∂f ∂x g : L[f,g] h(x) =

∂h ∂f ∂h ∂g f− g ∂x ∂x ∂x ∂x

(7.52)

Le membre de droite est un peu plus compliqué, car chaque terme fait apparaˆıtre une forme quadratique. Nous avons d’une part Lf Lg h(x) = Lf (

∂h ∂h ∂g ∂2h g) = g T 2 f + f, ∂x ∂x ∂x ∂x

(7.53)

Lg Lf h(x) = Lg (

∂h ∂f ∂ 2h ∂h f) = fT 2 g + g, ∂x ∂x ∂x ∂x

(7.54)

et d’autre part,

de telle sorte qu’en faisant la soustraction de (7.53) et (7.54) et en tenant compte de (7.52), nous obtenons bien (7.51) puisque les termes quadratiques (étant identiques) s’annulent. En revenant aux conditions (7.46-7.48), nous remarquons que nous pouvons ajouter ` a la deuxième, Lg Lf h(x), n’importe quel multiple de la première, Lg h(x), puisque cette dernière est nulle. En outre, ceci signifie qu’il est possible d’ajouter Lf Lg h(x) puisque cette expression est nulle également, suite à Lg h(x) = 0. Ainsi,


Lg Lf h(x) = Lg Lf h(x) − Lf Lg h(x) = −L[f,g] h(x) = −

219

∂h [f, g] = 0. (7.55) ∂x

En suivant un raisonnement similaire, l’identité ∂h [f, [f, g]] = 0 ∂x

(7.56)

est obtenue. Cette idée se généralise, conduisant à la transformation du système (7.46-7.48) en un système équivalent ∂h g [f, g] [f, [f, g]] . . . adfn−2 g = 0 ∂x

(7.57)

L’équation (7.57) entre la 1-forme ∂h ∂x et les champs de vecteurs signifie deux choses : Premièrement, la construction d’un vecteur ligne ∂h e ∂x est relativement ais´ car la matrice g [f, g] [f, [f, g]] . . . adfn−2 g se calcule de manière systèmatique en utilisant le crochet de Lie. Deuxièmement, la possibilité de remonter à partir du vecteur ligne ∂h ∂x vers la fonction h(x) est conditionné par la nature des champs de vecteurs g, [f, g], ad2f g, . . ., adfn−2 g. La condition est alors celle du théorème de Frobenius qui conclut que h(x) existe si, et seulement si, la distribution engendrée par ces champs de vecteurs est involutive. On aboutit ainsi au théorème important de ce chapitre Th´ eor` eme 7.4. Un système avec une seule entrée x˙ = f (x) + g(x)u est linéarisable entrée-état si, et seulement si, la distribution engendrée par g, adf g, . . ., adfn−1 g est de plein rang et que celle engendrée par g, adf g, . . ., adfn−2 g est involutive. Preuve. La seconde condition permet la construction de la sortie y = h(x), comme expliqué précédemment. La première condition garantit qu’après la n ème dérivée de la sortie, l’entrée u influence cette dérivée. Le bouclage linéarisant s’obtient, comme dans le cas de la linéarisation entrée-sortie, en considérant la sortie nouvellement construite y = h(x), et en la dérivant n fois jusqu’` a ce que l’entrée apparaisse. En posant y (n) = v et en traitant v comme la nouvelle entrée, l’expression de u en fonction de v est obtenue et le système est transformé en une chaˆıne de n intégrateur qui représente le système linéaire équivalent. Pour aboutir ` a un schéma de commande complet, Il faut encore stabiliser la chaˆıne d’intégrateurs y (n) = v à l’aide de l’entrée v. Pour se faire, il est

220


possible de constituer une équation d’erreur appropriée, comme dans le cas de la linéarisation entrée-sortie. Il y a essentiellement deux fa¸cons de vérifier l’involutivité des champs de vecteurs susmentionnés, et chacune repose sur l’une ou l’autre des versions du théorème de Frobenius. La première consiste ` a vérifier l’annulation des déterminants det g [f, g] . . . adfn−2 g [g, [f, g]] = 0 det g [f, g] . . . adfn−2 g [g, ad2f g] = 0 .. . det g [f, g] . . . adfn−2 g [[f, g], ad2f g] = 0 det g [f, g] . . . adfn−2 g [[f, g], ad3f g] = 0

.. . det g [f, g] . . . adfn−2 g [adfn−1 g, adfn−2 g]] = 0,

(7.58)

La seconde revient ` a calculer, à l’aide d’un algorithme du type élimination de Gauss, l’annulateur de la distribution, c.-à-d. ω tel que ω g [f, g] [f, [f, g]] . . . adfn−2 g = 0. (7.59)

Notons que l’utilisation de l’algorithme d’élimination ne garantit pas de tomber sur une 1-forme exacte ∂h ∂x mais sur une certaine 1-forme ω qui annule l’ensemble des champs de vecteurs mentionnés. Si la distribution est involutive alors la 1-forme ω doit être intégrable et doit donc satisfaire la condition dω ∧ ω = 0. 7.6.2 Exemple : Robot avec joint flexible Il s’agit d’un robot dont l’axe prinicipal est muni d’un moteur permettant de fournir un couple τ ` a un axe de transmission qui le transmet au pendule constituant la partie mobile principale du robot. Cette transmission n’est pas rigide, mais elle est modélisée par un ressort de torsion de constante de rigidité k. La variable θ2 désigne la position angulaire du moteur et la variable θ1 représente la position angulaire du pendule. La figure 7.2 illustre le dispositif. L’énergie cinétique contient deux termes, celui du moteur et celui du pendule. L’énergie potentielle contient un terme d’énergie potentielle gravifique du au centre de masse du pendule et un terme d’énergie potentielle élastique contenu dans la transmission flexible.


221

θ1 τ θ2

k

Fig. 7.2. Robot avec joint flexible.

1 ˙2 1 ˙2 I1 θ + I2 θ 2 1 2 2 1 Ep = k(θ2 − θ1 )2 + mgl sin θ1 2 Ec =

Ainsi le lagrangien s’écrit L = Ec − Ep En choisissant les coordonnées généralisée comme θ1 et θ2 , on obtient deux équations du second ordre d ∂L ∂L =τ − dt ∂ θ˙1 ∂θ1 ∂L d ∂L =0 − dt ∂ θ˙2 ∂θ2 a partir desquelles, en introduisant les variables d’état x1 = θ1 , x2 = θ˙1 , ` x3 = θ2 , x4 = θ˙2 , il est possible d’obtenir la représentation non linéaire x˙ 1 = x2 x˙ 2 = a cos x1 − b(x1 − x3 )

x˙ 3 = x4

x˙ 4 = c(x1 − x3 ) + du, avec a = − I11 mgl, b = k/I1 , c = k/I2 et d = 1/I2 . La première chose ` a trouver est l’expression des champs de vecteurs f et g. En considérant les équations précédentes, on obtient facilement 

 x2 a cos x1 − b(x1 − x3 )  f (x) =    x4 c(x1 − x3 )

  0  0  g(x) =   0 d

222


Ensuite, on construit g, [f, g] et [f, [f, g]] = ad2f g et [f, [f, [f, g]]] = ad3f g. 

0 1 0 −a sin x1 − b 0 b ∂f = 0 0 0 ∂x  c 0 −c 

0 −a sin x1 − b ∂g ∂f [f, g] = f− g = −  0 ∂x ∂x c 

0 1 −a sin x1 − b 0 [f, [f, g]] = −   0 0 c 0 

 0 0  1 0

1 0 0 b 0 0 0 −c

    0 0 0 0   0  0   =   1 0 −d 0 d 0

    0 0 0 0     b 0   0  =  bd      0 1 −d 0  −c 0 0 −bd

0 1 −a sin x1 − b 0 [f, [f, [f, g]]] = −   0 0 c 0

    −bd 0 0 0     b 0   bd  =  0  0 1  0   bd  0 −bd −c 0

De telle sorte que l’on obtient finalement,  0 0 0 −bd  0 0 bd 0   g [f, g] ad2f g ad3f g =  −d 0 0 cd  d 0 0 0 

(7.60)

Cet ensemble de champ de vecteurs doit être plein rang au point autour duquel on aimerait linéariser. En fait, il est important d’insister sur la différence entre la linéarisation locale en un point et la linéarisation que nous faisons ici, également en tenant compte du point autour duquel cette linéarisation est effectuée. On entend par global le fait de tenir compte de toutes les nonlinéarités, le fait de trouver une domaine le plus grand possible dans lequel toutes les non-linéarités puissent être compensées. Ce domaine possède un centre o` u l’on évalue les champs de vecteurs. Dans le présent cas, le fait que les champs de vecteurs apparaissant dans (7.60) ne dépendent pas de l’état x implique que le rang est constant dans tout l’espace d’état. Celui-ci est de 4 et signifie que la première condition de la linéarisation est satisfaite.


223

La seconde condition consiste en la vérification de l’involutivité des champs de vecteurs {g, adf g, ad2f g}. Etant donné que tous les vecteurs susmentionnés sont constants, tout crochet de Lie entre ces vecteurs constants sont nuls, et la famille est bien involutive. L’autre approche du théorème de Frobenius consiste à calculer la 1-forme ω telle que ω{g, adf g, ad2f g} = 0 On constate facilement que ω= 1000

est une solution qui est trivialement intégrable puisqu’elle conduit à h(x) = x1 . Ainsi y = x1 est la sortie linéarisante. En conséquence, le changement de coordonnées, Φ1 (x) = x1 Φ2 (x) = x2 Φ3 (x) = a cos x1 − b(x1 − x3 )

Φ4 (x) = −ax2 sin x1 − b(x2 − x4 ) transforme les équations d’état dans la forme, z˙1 = z2 z˙2 = z3 z˙3 = z4 z˙4 = −(a sin z1 + b + c)z3 − a(z22 − c) cos z1 + bdu En posant z˙4 = v, on aboutit au bouclage linéarisant transformant le robot en une chaˆıne de quatre intégrateurs. Nous laissons le soin au lecteur de constituer l’équation d’erreur pour une telle chaˆıne d’intégrateurs et d’obtenir une expression pour la nouvelle entrée v. Ceci conduit alors à un schéma complet de commande fondé sur la linéarisation complète du système valable globalement dans tout l’espace d’état.

224


7.6.3 Exemple : Bille roulant sur une barre Une bille de rayon ρ et de masse m roule sans glisser sur un barreau. Le barreau comporte un axe en son milieu, perpendiculaire au déplacement de la bille. Il peut donc s’incliner d’un angle θ permettant ainsi à la bille de rouler sous l’effet de la gravité. Un moteur fournit un couple τ afin d’incliner le barreau. Il n’y a pas de frottement sur la bille (figure 7.3).

r

θ τ

g

Fig. 7.3. Une bille roule sans glisser sur une barre sous l’effet de la gravité. La barre est inclinée d’un angle θ par l’entremise d’un couple τ . La position de la bille est déterminée par la distance r qu’elle parcourt le long de la barre.

Le centre de masse de la bille est désigné par x et y. Il y a deux effets inertiels dans ce système, ` a savoir la bille elle-même et la barre. Remarquons que le bille roule de telle sorte que son moment cinétique est toujours colinéaire a l’axe de rotation. Il n’y a donc pas de couple gyroscopique provoqué par la ` rotation de la bille. La contrainte de roulement sans glissement entraˆıne la bille ` a se comporter comme une simple masse en translation avec cependant une masse légèrement plus lourde due à l’inertie de rotation de la bille. θ et r sont choisis comme coordonnées généralisées. L’angle de rotation de la bille autour de son axe est donné par ρr . La position du centre de masse de la bille par x = r cos θ et y = r sin θ. L’énergie cinétique comporte trois termes, celle de translation de la bille, celle de rotation de la bille, et enfin celle de rotation de la barre. En désignant ¯ l’inertie de la bille autour de son centre de masse, et par I, l’inertie de par I, la barre autour de son axe de rotation, l’énergie cinétique s’écrit

Ecin

2 1 r˙ 1 1 2 2 ¯ + I θ˙2 = m x˙ + y˙ + I 2 2 ρ 2 1 1 ¯ 2 1 = (m + 2 I) r˙ + (I + mr2 )θ˙2 2 2ρ 2

(7.61)


225

et l’énergie potentielle Epot = mgy = mgr sin θ.

(7.62)

En conséquence, le lagrangien L = Ecin − Epot

(7.63)

entraˆıne, après application de la méthode de Lagrange, deux équations différentielles du second ordre couplées ∂L d ∂L − =0 dt ∂ r˙ ∂r ∂L d ∂L − = τ. dt ∂ θ˙ ∂θ (7.64) En effet, une seule force généralisée Fθ est non nulle et correspond au couple τ imposé ` a la barre. Les deux équations précédentes s’écrivent explicitement sous la forme I¯ m + 2 r¨ − mrθ˙2 + mg sin θ = 0 ρ (I + mr2 )θ¨ + mr(2θ˙ r˙ + g cos θ) = τ. ˙ conduit L’introduction des variables d’états x1 = r, x2 = r, ˙ x3 = θ et x4 = θ, alors au modèle x˙ 1 = x2 ax1 x24

x˙ 2 = x˙ 3 = x4

(7.65) − b sin x3

(7.66) (7.67)

x˙ 4 = u

(7.68)

¯ > 0, b = mρ2 g/(mρ2 + I) ¯ > 0 et o` u a = mρ2 /(mρ2 + I) u=−

mgx1 cos x3 τ 2mx1 x2 x4 − + . I + mx21 I + mx21 I + mx21

(7.69)

Cette dernière équation (7.69) donne un bouclage préliminaire après résolution de τ en fonction de u, rendant ainsi possible l’utilisation de u comme entrée dans (7.68) au lieu de τ . Ce bouclage est toujours régulier étant donné que le dénominateur I + mx21 ne s’annule jamais. Pour construire une sortie linéarisante h(x), les champs de vecteurs f (x) = x2 g(x) = 0

ax1 x24 − b sin x3 T 0 0 1 ,

x4

0

T

(7.70)

226


obtenus par inspection en se référant à (7.65-7.68), conduisent à [f, g](x) = 0

−2ax1 x4

[f, [f, g]](x) = 2ax1 x4

−1

0

T

−2ax2 x4 − b cos x3

0

Malheureusement, [g, [f, g]] = 0

−2ax1

0

0

T

.

(7.71)

T 0 ,

ce qui signifie que la deuxième condition pour la linéarisation exacte n’est pas satisfaite car [g, [f, g]] 6∈ span {g.[f, g], [f, [f, g]]} ; la famille n’est donc pas involutive. En effet, det g [f, g] [f, [f, g]] [g, [f, g]] = −4a2 x21 x4

est non nul dès que la bille quitte le point central r = 0. On peut alors s’interroger sur la structure de la 1-forme ω qui annule g [f, g] [f, [f, g]] . Comme −2ax2 x4 − b cos x3 −2ax1 x4 4a2 x21 x24 0 g [f, g] [f, [f, g]] = 0,

la 1-forme ω s’écrit

ω = (−2ax2 x4 − b cos x3 )dx1 − (2ax1 x4 )dx2 + (4a2 x21 x24 )dx3 , et elle ne provient pas d’une fonction de l’état h(x), principalement parcequ’il n’est pas possible de se débarasser du coefficient x4 en multipliant ω par une fonction (ω n’a pas de coefficient non nul devant dx4 ). En effet, dω comporte un monˆ ome extérieur avec un facteur dx4 (non nul) alors que ω en est dépourvu, de telle sorte que dω ∧ ω 6= 0.

7.7 Commande d’une chaˆıne d’int´ egrateurs Les techniques présentées dans ce chapitre ont toutes pour but de transformer (ou d’établir une correspondance) entre le système écrit dans les coordonnées d’origine, en une chaˆıne d’intégrateurs. Cette chaˆıne doit alors être commandée. En conséquence nous avons comme système y (r) = v, avec y, v ∈ R des grandeurs scalaires. L’objectif est de choisir une succession de valeurs temporelles de v pour atteindre un objectif désiré.

7.7 Commande d’une chaˆıne d’intégrateurs

227

Nous considérons essentiellement deux techniques. La première est une technique de régulation permettant de garantir la stabilité globale de l’origine, et la poursuite d’une référence donnée. Toutefois, elle nécessite la mesure de la sortie y et de ces r − 1 dérivées temporelle. La seconde, est une technique de commande en boucle ouverte (a priori) permettant de faire transiter l’état du système d’une valeur donnée correspondant à une valeur initiale de y et de ces dérivées, vers une valeur finale, en un temps fini. Elle ne nécessite que la connaissance des conditions initiales. Une fois l’expression de l’entrée de la chaˆıne d’intégrateur ramenée à celle de l’entrée du système d’origine par les calculs exposés aux sections précédentes, nous avons une technique complète de régulation des r états associés ` a la sortie y et ses dérivées. 7.7.1 Stabilisation et poursuite Dans le cas o` u toutes les dérivées de y sont mesurées, nous pouvons forcer y` a converger vers zéro en utilisant une équation d’erreur. En posant e = yc − y et en choisissant r pˆ oles (valeurs propres) λ1 , λ2 , . . . λr à valeur propre réelle plus petite que zéro, l’équation d’erreur différentielle est constituée, d’abord avec l’opérateur de différentiation symbolique s : : (s + λ1 )(s + λ2 ) . . . (s + λr ) = sr + a1 sr−1 + . . . + an−1 s + an

(7.72)

Ensuite, en effectuant les dérivations correpondant à l’opérateur s, on obtient l’équation différentielle associée e(r) + a1 e(r−1) + . . . + an−1 e˙ + an e = 0. (r)

Finalement, on remplace la plus haute dérivée er par v − yc et on trouve l’expression de l’entrée v stabilisante par simple résolution de l’équation obtenue. 7.7.2 Transit en temps fini avec commande a priori L’objectif est de déterminer une loi de commande a priori permettant de transférer l’état de la chaˆıne d’intégrateur, initialement en y(0), y(0), ˙ ... y (r) (0) vers un nouvel état y(T ), y(T ˙ ), . . . y (r) (T ), en un temps fini T . En pratique, l’état initial est donné sous la forme x(0) et l’état terminal sous la forme x(T ) (ou une sous-partie de ces états). Dans chacun des cas, ces valeurs correspondent ` a des états de la chaˆıne d’intégrateur associés à la sortie y et ces dérivées. Ainsi, les valeurs d’interpolation sont spécifiées par des valeurs dans les coordonnées de départ.

228


Afin d’obtenir la commande mentionnée, il suffit de choisir un polynôme d’interpolation d’ordre suffisamment élevé pour représenter la trajectoire de la sortie y. L’ordre élevé permet alors de représenter l’évolution de l’ensemble des r dérivées de la sorties depuis l’instant initial 0 et l’instant final T . Il est nécessaire de choisir un ordre 2r afin de pouvoir spécifier à la fois les conditions initiales et terminales. Le polynˆ ome s’écrit sous la forme yc (t) =

2r−1 X

p i ti

i=0

o` u les coefficients pi ∈ R sont choisis afin de satisfaire le système d’équations yc (0) = y(0)

yc (T ) = y(T )

y˙ c (0) = y(0) ˙

y˙ c (T ) = y(T ˙ ) .. .

yc(r) (T ) = y (T )

yc(r) (T ) = y (r) (T ).

Une fois ce polynˆ ome choisit, il suffit de dériver celui-ci r fois et d’appliquer l’entrée v = yc(r) (t) 0 ≤ t ≤ T a la chaˆıne d’intégrateurs. ` La technique présentée ne nécessite pas de mesure durant la transition. Seules les conditions initiales (ou une sous partie) est nécessaire. L’inconvénient est lié ` a toute commande en boucle ouverte, au sens o` u si le modèle n’adhère pas exactement à la réalité, une dérive par rapport au comportement désiré durant et après la transition peut alors être observé. Il n’y a pas de mécanisme de compensation prenant en compte une éventuelle erreur entre le comportement désiré et celui réellement observé. Paradoxalement, cet inconvénient peut également devenir un avantage lorsque le système est soumis à une classe de perturbation de ces paramètres entre le modèle de représentation utilisé pour la commande et celui du système a commander. Par exemple, un frottement visqueux surmodélisé peut être ` compensé par retour entraˆınant la présence d’une boucle à rétro-action positive. Ceci est illustré dans l’exercice 7.3.


229

Exercices 7.1. Bille sur la barre : lin´ earisation entr´ ee-sortie. En considérant le modèle dynamique (7.65-7.68) de la bille qui roule sur la barre : dynamique ! interne dynamique ! zéros (i) Dériver la sortie y = r = x1 jusqu’` a ce que l’entrée u apparaisse. On suppose que les conditions initiales sont telles que x1 (0) 6= 0 et x4 (0) 6= 0. (ii) Calculer la dynamique interne lorsque la position de la bille y = r = x1 est régulée ` a zéro par l’intermédiaire de la régulation de la chaˆıne d’intégrateurs obtenus sous (i). La dynamique interne comporte comme entrée la sortie y ainsi qu’un nombre fini de ses dérivées y, ˙ . . ., y (p) . Elle est constituée par les états rendus inobservables par le bouclage régularisant la chaˆıne d’intégrateurs obtenus en (i). Est-ce que cette dynamique est globalement stable ? (Traiter y et ses dérivées comme des paramètres.) (iii) Calculer la dynamique des zéros. (Il suffit de remplacer y = y˙ = . . . y (p) = 0 dans l’équation de la dynamique interne.) Vérifier le type de stabilité de cette dynamique. (iv) Négliger le premier terme ax1 x24 de la seconde équation (7.66) pour le modèle de commande, et répéter la même démarche qu’en (ii). Il s’agit de temporairement négliger le terme dans le modèle du système utilisé pour synthétiser le contrˆ oleur tout en gardant le terme pour simuler le système à commander. (v) Stabiliser la chaˆıne d’intégrateurs résultante. (vi) Appliquer le schéma de commande obtenu sur le système complet (c.-` a-d. sans négliger le terme ax1 x24 ). (vii) Simuler le système complet. (viii) D’après vous, est-ce que le système est localement asymptotiquement stable ? Est-il localement exponentiellement stable ? Est-il globalement asymptotiquement stable ? 7.2. Toycopter1 . Soit le modèle réduit dont le schéma de principe est représenté ` a la figure 7.4. (i) Montrer que le lagrangien de ce système s’écrit 1 1 1 ˙ m L = + Iφ φ˙ 2 + Ic sin2 ψ φ˙ 2 + Iψ ψ˙ 2 + Im1 sin ψ φω 2 2 2 1 2 ˙ r + 1 Ir1 ω 2 − Gs cos ψ + Ir1 ψω + Im1 ωm r 2 2 + Gc sin ψ. 1

(7.73)

Cet exercice est une adapation des papiers de Ph. Mullhaupt, B. Srinivasan, J. Lévine, et D. Bonvin A Toy More Difficult to Control Than the Real Thing, Proc. European Control Conference, Brussels, 1997, et Cascade Control of the Toycopter, Proc. European Control Conference, Karslruhe, 1999.

230


ψ

ωr

ωm

φ

Fig. 7.4. Schéma du Toycopter avec ces coordonnées. Deux moteurs entraˆınes des vitesses de rotation des pales variables ωm et ωr permettant au Toycopter de se déplacer sur une sphère de latitude ψ et de longitude φ.

o` u Gc et Gs sont des paramètres liées à la position du centre de masse (i.e. vérifier également la relation de ces paramètres à la position réelle du centre de masse). Ic est un paramètre inertiel dˆ u à la difference d’inertie autour de l’axe φ en fonction de la position angulaire ψ. Im1 et Ir1 sont les inerties des systèmes rotors et pales (principal et secondaire respectivement). (ii) On suppose que les forces aérodynamiques sont proportionnels à la vitesses des hélices (en réalité elles évoluent en fonction du carré de celles-ci). Les hélices sont entraˆınées par des moteurs à courant continu. Les coefficients respectifs sont Cm pour l’hélice principale et Cr pour l’hélice arrière. L’effet de sol est négligé. Il y a également du frottement visqueux le long des deux axes φ et ψ (coefficients Cφ et Cψ ). Vérifier que les forces généralisées s’écrivent : Fψ = Cm ωm − Cψ ψ˙ Fφ = Cr ωr − Cφ φ˙

Fρm = Km um − Fm ωm Fρr = Kr ur − Fr ωr (iii) Montrer que la dynamique est donnée par les équations Iψ ψ¨ + Ir ω˙ r = Cm ωm − Cψ ψ˙

+Gs sin ψ + Gc cos ψ 1 + Ic φ˙ 2 sin(2ψ) + Im ωm φ˙ cos ψ 2

(Iφ + Ic sin2 (ψ))φ¨ + Im ω˙ m sin ψ = Cr ωr | ωr | sin ψ − Cm1 ωm | ωm | sin ψ −Ic ψ˙ φ˙ sin(2ψ) − Im ωm ψ˙ cos ψ − Cφ φ˙

(7.74)

ω˙ m = vm

(7.75) (7.76)

ω˙ r = vr

(7.77)


231

(iv) En utilisant les sorties y1 = ψ et y2 = φ, dériver celles-ci jusqu’` a l’apparition des entrées vm et vr . Stabiliser les chaˆınes d’intégrateurs résultantes ¯ Calculer la dynamique interne et vérifier pour atteindre une consigne ψ¯ et φ. la stabilité de celle-ci. (v) De manière similaire à l’exercice 7.1, on néglige les termes Ir ω˙ r et Im ω˙ m sin ψ pour synthétiser la loi de commande tout en les conservant dans le modèle pour la simulation. Procéder alors comme en (iv) et simuler le système résultant. 7.3. Consid´ erations de robustesse. Soit un moteur électrique d’équation θ¨ = −k θ˙ + u o` u la force électromotrice et le frottement visqueux sont représenté par la constante k. Les inerties et autres constantes de couple ont été normalisée. (i) Transformer le modèle en une chaˆıne d’intégrateurs. (ii) Synthétiser une loi stabilisant la chaˆıne d’intégrateurs à la position θ¯ = π2 . Chosir les gains de telle sorte à stabiliser à 99 % de la consigne après 1 s. (iii) Choisir une loi de commande en boucle ouverte dépla¸cant la position angulaire de l’état initial au repos en θ = 0 vers l’angle final θ¯ = π2 . (iv) Répeter les deux techniques précédentes dans le cas k¯ = 1.1k et k¯ = 0.9k. k¯ est la valeur du vrai système et k celle utilisée pour synthétiser la loi de commande. Simuler et discuter les résultats obtenus. (v) Imaginer une méthode qui puisse tenir compte des avantages des deux méthodes en limitant leurs inconvénients. 7.4. Table de positionnement. On reconsidère la table de positionnement de l’exemple de la section 7.4.1, mais uniquement avec la technique de commande en boucle ouverte. (i) Trouver une paramétrisation polynomiale de la sortie plate afin de faire déplacer la table d’une position d’équilibre vers une autre en 1 s. (ii) Déterminer la commande en boucle ouverte résultante et simuler le système. (iii) Discuter du transitoire en fonction de la position à atteindre et du temps de transition.

8 Commande par les m´ ethodes de Lyapunov

8.1 Introduction Dans le chapitre 4, la notion de la stabilité a été présentée avec des conditions permettant de la garantir. Par exemple, une fonction définie positive est associée au système, appelée candidat de Lyapunov. Lorsque la valeur de cette fonction décroit le long des solutions de l’équation différentielle représentant le système, la stabilité est garantie, et le candidat devient une fonction de Lyapunov. Cette méthode de Lyapunov peut être également utilisée pour synthétiser une commande. Lorsque l’entrée u du système x˙ = f (x, u) n’est pas spécifiée, nous avons des degrés de liberté supplémentaires pour constituer a` la fois la fonction V (x) et la loi de commande non linéaire u = k(x). Dans le cas de l’analyse, le choix est plus restreint étant donné que seul V (x) doit être déterminé, l’accès à l’entrée étant absent puisque le système s’écrit x˙ = f (x). Ce chapitre introduit la conception utilisant la méthode de Lyapunov dans le cas particulier d’une synthèse en cascade. Une cascade est la réunion de deux sous-systèmes qui s’influencent l’un l’autre. Ainsi en quelque sorte, tout système comportant plus que deux états est une cascade. Toutefois, nous mettrons l’accent sur les systèmes o` u une partie de l’état évolue de manière indépendante par rapport ` a une autre partie. Cette dernière, par contre, subit l’influence de la première, un peu comme une cascade d’eau lorsqu’elle se fragmente en sous-parties, la partie du haut évoluant de manière indépendante de celle du bas. Pour commencer, nous étudions les propriétés de stabilité à la fois locale et globale de la mise en cascade de deux systèmes individuellement stables. Puis nous exploitons la propriété de passivité, qui, comme nous l’avons déj` a vu au chapitre ??, se préserve après connexion en parallèle et en rétroaction.

234

8 Commande par les méthodes de Lyapunov

Finalement, la méthode dite du backstepping est présentée. Une fonction de Lyapunov est d’abord construite pour un système réduit obtenu lorsque un des état est considéré comme une entrée directe. Le système est réduit car la dérivée de cet état est momentanément pas prise en compte. A partir de la fonction de Lyapunov associée au système réduit, l’influence de la dynamique associée ` a l’état manquant est alors pris en compte en augmentant la fonction de Lyapunov par une erreur quadratique entre la valeur idéale de cet état et sa valeur réelle. En dérivant cette nouvelle fonction de Lyapunov et en la for¸cant a être négative, on aboutit ` ` a une loi de commande pour le système complet. Cette méthode dite du backstepping permet de construire une fonction de Lyapunov de deux variables (une pour chaque partie de la cascade) à partir d’une fonction de Lyapunov d’une sous-partie de la cascade.

8.2 Fonction de Lyapunov de Commande Commen¸cons par considérer un système ayant une entrée u et dont l’état x est considéré sans distinction de groupe de variables. En toute généralité, le système s’écrit x˙ = f (x, u).

(8.1)

Pour trouver la commande selon la méthode de Lyapunov, il s’agit de trouver une fonction définie positive V (x) et une loi de commande u = k(x) de telle sorte qu’en rempla¸cant la loi de commande dans l’expression (8.1), x˙ = f (x) + g(x)k(x) = f˜(x), il soit possible de trouver une fonction de Lyapunov V (x), c.-à-d., V (x) > 0 Lf˜V (x) < 0

x 6= 0

Pour trouver V (x), il est possible d’utiliser une des méthode décrite dans la partie Analyse de cet ouvrage, comme par exemple la méthode de Krasovskii ou la méthode des gradients variables. Toutefois, une difficulté (ou une facilité selon le cas) supplémentaire apparaˆıt, étant donné qu’il est possible de modifier la loi de commande et donc de changer f˜(x) afin que Lf˜V ait de meilleures propriétés.

8.3 Structure cascade Construire une fonction de Lyapunov pour tout l’état x est une tˆ ache parfois très difficile. C’est pourquoi, il est souvent plus judicieux de séparer la construction en tirant avantage de la structure du système à commander.

8.3 Structure cascade

235

L’objectif est de faire apparaˆıtre une structure emboˆıtée, ou cascade. Par exemple, z˙ = f (z) + ψ(z, ξ) ξ˙ = a(ξ, u)

(8.2) (8.3)

sépare l’état en deux contributions, z et ξ. Lorsque les deux sous-systèmes, considérés séparément, z˙ = f (z) et ξ˙ = a(ξ, u) sont stables, alors leur réunion par le terme d’interconnexion non linéaire ψ(z, ξ) est également localement stable. Ainsi, on peut ` a l’aide de l’entrée u stabiliser uniquement la partie du bas (état ξ) afin de stabiliser l’ensemble de la cascade (8.2) et (8.3). Le résultat est le suivant : Th´ eor` eme 8.1. On suppose que le terme de couplage non-linéaire ψ(z, ξ) est tel que ψ(z, 0) = 0. Si z = 0 est un point d’équilibre asymptotiquemet stable de z˙ = f (z), alors n’importe quel retour partiel de l’état u = k(ξ) rendant l’équilibre du sous-système (8.3) ξ = 0 asymptotiquement stable, rend également l’ensemble de la cascade (8.2-8.3) localement asymptotiquement stable. Preuve. Soit U (ξ) une fonction de Lyapunov pour le sous-système ξ˙ = a(ξ, k(ξ)). Ceci signifie également que V (z, ξ) = U (ξ) est une fonction semidéfinie positive pour l’ensemble de la cascade. Maintenant, la stabilité du point d’équilibre complet z = 0 et ξ = 0 suit du théorème de stabilité conditionnel, parce que ce point d’équilibre est conditionnellement stable à l’ensemble {z, ξ|V (z, ξ) = 0} = {z, ξ|ξ = 0}. La stabilité conditionnelle revient à restreindre les choix de la boule d’exigence et de celle des conditions initiales à l’intersection entre celles-ci et l’ensemble en question. Les résultats de stabilité de LaSalle s’adapte mutatis mutandis. Soit Ωz la région d’attraction de la dynamique z˙ = f (z) et Ωξ , celle de la dynamique ξ˙ = a(ξ, k(ξ)). Etant donné que l’équilibre complet est stable, il existe un voisinage Ω tel que toute solution z(t), ξ(t) commen¸cant dans Ω est bornée et demeure dans Ωz × Ωξ pour tout instant du temps t ≥ 0. Lorsque t → ∞, ξ(t) → 0 de telle sorte que z(t), ξ(t) convergent vers le plus grand ensemble invariant de z˙ = f (z) compris dans Ωz × {0}, qui n’est rien d’autre que le point d’équilibre complet z = 0, ξ = 0, démontrant ainsi la stabilité asymptotique. Dans une structure cascade, il n’est pas toujours possible d’atteindre une stabilité globale, bien que les sous-systèmes soient globalement stables. Toutefois, il est souvent possible d’atteindre une région de stabilité aussi grande que l’on veut, par un choix judicieux de la loi de commande. C’est le concept de stabilité semi-globale.

236


D´ efinition 8.2. Un système x˙ = f (x, u) est dit semi-globalement stabilisable, s’il est possible, pour tout ensemble compact aussi large que possible Ω de trouver une loi de commande u = k(x) telle que le système x˙ = f (x, k(x)) possède un bassin d’attraction qui contient Ω. Exemple 8.3. Le système avec z ∈ R et ξ ∈ R, z˙ = −z + ξz 2 ξ˙ = u munit de la loi de commande u = −kξ, k > 0, garantit la stabilité asymptotique de (z, ξ) = (0, 0). La région d’attraction peut alors être estimée à l’aide de la fonction de Lyapunov V = z 2 + ξ 2 . La dérivée, 2 −z 2 z (8.4) V˙ = −2(z 2 + kξ 2 − ξz 3 ) = − z ξ −z 2 2k ξ √ est négative pour z 2 < 2 k. Par conséquent, une estimée de la région d’attraction est alors donnée par la condition que V˙ < 0, ce qui signifie que le 2 gain k devrait être choisit telle que k > c4 . Ainsi, il est toujours possible de rendre aussi grand que l’on désire la région d’attraction, ` a condition d’augmenter suffisamment le gain k. Cependant, il n’est pas possible de stabiliser globalement un tel système. Prenons par exemple z = σ1 , ce qui transforme l’équation non linéaire z˙ = −z +ξz 2 en σ˙ = σ −ξ. C’est une équation du premier ordre avec comme entrée la variable ξ. La formule R t générale pour la solution explicite de x˙ = Ax + Bu donne x(t) = x0 eAt + 0 eA(t−τ ) Bu(τ )dτ . Dans notre cas A est un scalaire égal a −1, u(t) correspond ` ` a ξ(t) (également un scalaire) et B = 1. En conséquence, Z t −t et−τ ξ(τ )dτ. σ(t) = σ(0)e + 0

Il est important de comprendre que l’on considère l’entrée ξ(t) comme l’entrée u du sous système dont l’état est z. En revenant dans la variable z, z(t) =

1 z(0)

e−t . Rt − 0 e−τ ξ(τ )dτ

Nous rencontrons le phénomène déj` a esquissé dans le premier chapitre concernant les propriétés des systèmes non linéaires, à savoir que lorsque z(0) > R ∞ −τ −1 e ξ(τ )dτ le dénominateur finit par s’annuler à un instant fini condui0 sant z ` a devenir infini en un temps fini : C’est une explosion en temps fini empêchant le système de converger ultérieurement. Le transitoire de z est devenu trop grand par rapport à sa tendance naturelle de décroˆıtre en absence


237

d’excitation crée par ξ. Ce phénomène exclu ainsi des conditions initiales du bassin d’attraction. La limitation du bassin d’attraction, malgré la stabilité des deux soussystèmes z et ξ pris isolément, est liée au mauvais transitoire qui est en quelque sorte amplifié par le terme de couplage entre les deux sous-systèmes. Par conséquent, il est possible de limiter cet effet en choisissant comme sous-systèmes ceux qui sont couplés de manière à ne pas engendrer une telle sur-sensibilité au transitoire. Dans l’exemple précédent, le terme de couplage comporte ξ multiplié par z 2 . C’est l’apparition du facteur au carré qui crée des difficultés. De plus, il faut également veiller à ne pas prendre comme variable ξ une variable ayant de mauvaises caractéristiques transitoires. Ces deux éléments, ` a savoir la nature du couplage et la nature de la variable ξ sont maintenant étudiés plus en détail. Il s’agit de déterminer des conditions favorables ` a la stabilisation globale des deux sous-systèmes réunis. 8.3.1 Restriction de la croissance du terme de couplage En général, comme la fontion de Lyapunov à tendance à croˆıtre de manière monotone lorsque l’état s’éloigne de la valeur d’équilibre, il est utile de distinguer cette classe de systèmes par rapport à cette propriété. Cependant, cette croissance peut obéir ` a une loi compliquée. C’est pourquoi nous introduisons une fa¸con de caractériser celle-ci sans pour autant entrer dans le fin détail de savoir exactement comment cette fonction augmente. Nous estimons la croissance en désignant les fonctions de classe K. D´ efinition 8.4. Une fonction γ(.) : R+ → R+ est dite de classe K si elle est continue, strictement croissante et s’annule pour la valeur nulle, c.-` a-d. γ(0) = 0. A l’aide de cette définition nous pouvons donner une hypothèse concernant la croissance du terme de couplage ψ(z, ξ) apparaissant dans (8.2). D´ efinition 8.5. (croissance du terme d’interconnexion) La fonction ψ(z, ξ) est de croissance linéaire en z s’il existe deux fonctions de classe K, disons γ1 (.) et γ2 (.), différentiable en ξ = 0 et telles que kψ(z, ξ)k ≤ γ1 (kξk)kzk + γ2 (kξk). A l’aide de cette définition nous pouvons établir la condition pour que la stabilité globale aie lieue : Th´ eor` eme 8.6. Supposons que le terme de croissance soit conforme a ` la definition 8.5. Supposons également que la linéarisation locale (A, B) de ξ˙ = a(ξ, u) au point ξ = 0 soit stabilisable. Soit k(ξ) une loi de commande

238


continue qui rende le point ξ = 0 de ξ˙ = a(ξ, k(ξ)) globalement asymptotiquement stable et localement exponentiellement stable. Maintenant, s’il existe une fonction W (z) semi-définie positive et radialement non bornée, ainsi que des constantes c et M telles que pour tout kzk > M on ait : 1. Lf W (z) ≤ 0; 2. k ∂W ∂z kkzk ≤ cW (z) alors la loi de commande u = k(ξ) garantit que toutes les solutions de (8.2-8.3) restent bornées. Si par ailleurs, z˙ = f (z) est globalement asymptotiquement stable, alors la loi de commande u = k(ξ) rend le point d’équilibre complet (z, ξ) = (0, 0) globalement asymptotiquement stable. Preuve. Soit z(0) et ξ(0) des conditions initiales arbitraires. Les deux propriétés 1. et 2. Ainsi que l’hypothèse sur la nature de l’interconnexion entraˆıne : ˙ = Lf W + Lψ W ≤ k ∂W kψk W ∂z W ≤ k k(γ1 (kξk) + γ2 (kξk)kzk z D’autre part, étant donné que le point d’équilibre ξ = 0 de ξ˙ = a(ξ, k(ξ)) est localement exponentiellement stable, il est garantit qu’il existe une constante α et une fonction γ de classe K telles que ˙ (z(t)) ≤ k ∂W k(γkξ(0)k)e−αt (1 + kz(t)k) W ∂z ∂W kkz(t)k(γkξ(0)k)e−αt, ∀kz(t)k ≥ 1 ≤k ∂z En faisant usage de la propriété 2., Il existe une fonction K1 (.) de classe K telle que pour z suffisament petit (c.-à-d. kz(t)k > max{1, M }), l’estimée ˙ ≤ K1 (kξ(0)k)e−αt W W est vraie. Ceci démontre la bornitude de W étant donné qu‘il est également vrai que W (z(t)) ≤ W (z(0))e

Rτ 0

K1 (kξ(0)k)e−ατ dτ ≤ K(kξ(0)k)

pour une certaine fonction K de classe K. Puisque W (z) est radialement non bornée, la bornitude de kzk est garantie. Finalement, si z˙ = f (z) est globalement asymptotiquement stable, cette même propriété s’applique au point d’équilibre complet z = 0, ξ = 0, à cause du théorème ??. Etonnament, et surtout malheureusement, la croissance linéaire du terme de couplage (selon la Définition 8.5), couplé avec la décroissance exponentielle, ne sont pas suffisants pour empêcher la déstabilisation du sous-système z, comme va l’illustrer l’exemple suivant.


239

Exemple 8.7. Le système z˙1 = −z1 + z2 ξ

z˙2 = −z2 + z12 z2 ξ˙ = u

Bien que satisfaisant les hypothèses croissance linéaire du terme d’interconnexion (celui-ci est donné par z2 ξ pour la première équation et 0 sur la seconde) ainsi que de stabilisabilité exponentielle du sous-système ξ, ne peut pas être globalement stabilisé. Pour expliquer ce phénomène quelque peu paradoxal, remarquons, pour commencer, que le sous système z˙1 = −z1

z˙2 = (−1 + z12 )z2

est bien globalement stable, étant donné que 2

W (z) = z12 + z22 ez1

est une fonction de Lyapunov radialement non bornée. En effet, un calcul immédiat donne ˙ (z) = −2W (z). W Cependant, et c’est là que le paradoxe est levé, la condition 2. du théorème 2 n’est pas satisfaite ` a cause du facteur de croissance très rapide ez1 . Pour montrer que ceci engendre la perte de la stabilité globale, considérons une condition initiale ξ(0) > 0 de telle sorte que pour tout t ≥ 0, ξ(t) ≥ 0. ˙ Comme la loi de commande k(ξ) est supposé différentiable, ξ(t) ≥ Cξ(t) pour une certaine constante positive C > 0. Maintenant, considérons une condition initiale z2 (0) > 0 de telle sorte que pour autant que z12 (t) > C + 2 la relation z˙2 ≥ (C + 1)z2 (t) est valable. En combinant ces deux estimations, nous obtenons que sous la condition z1 (t)2 ≥ C + 2 il est également vrai que d (z2 ξ) ≥ (C + 1)z2 ξ − Cz2 ξ = z2 ξ. dt √ Finalement, en choisissant z2 (0)ξ(0) > z1 (0) > C + 2, il est garantit que la condition initiale z˙1 (0) > 0. Mais z˙1 (t) croˆıt au cours du temps à cause de z¨1 (t) =

d (z2 ξ − z1 ) − Cz2 ξ = z2 ξ. dt

Comme ξ(t) converge vers zéro tout en demeurant positif, cela induit z2 (t) à devenir non-borné.

240


Cet exemple insiste sur l’importance de la structure de la fonction de Lyapunov. Non seulement le type de croissance est important pour le terme d’interconnexion entre les deux sous systèmes isolément stable, mais il est également tout aussi important dans la manière dont la fonction de Lyapunov croˆıt en s’écartant de l’équilibre. Si cette croissance est trop rapide, alors il est possible de la faire décroˆıtre beaucoup dans une petite région de l’espace d’état, encourageant l’apparition d’explosion en temps fini. Les résultats précédents reposent sur la décroissance exponentielle de ξ. Au lieu de cette condition, le concept de stabilité entrée-état est introduit. Considérons le sous-système z˙ = f (z) + ψ(z, ξ). L’idée derrière ce nouveau concept de stabilité est d’exiger que toute solution z de cette équation différentielle reste bornée lorsque la variable ξ (considérée comme une entrée) converge vers zéro. Cette propriété est suffisante pour garantir la stabilité asymptotique globale de l’équilibre complet z = 0 ξ = 0 lorsque z˙ = f (z) est globalement asymptotiquement stable. D´ efinition 8.8. Le système x˙ = f (x, u) est stable entrée-état s’il existe une fonction décroisante β et une fonction de classe K telle que pour toute entrée bornée u(.) et chaque condition initiale x(0) la solution x(t) existe pour tout t ≥ 0 et est bornée par kz(t)k ≤ β(kz(0)k, t) + γ( sup kξ(τ )k) 0≤τ ≤t

En quelque sorte, on élimine d’entrée la possibilité d’avoir des explosions en temps fini. Cette définition serait assez inutile s’il n’y avait pas de moyens de la déterminer de manière indirecte. Le premier résultat dans cette direction assure que cette définition est respectée dans la cas o` u la fonction de Lyapunov ne croˆıt pas trop vite. Le second permet de charactériser la propriété de stabilité entrée-état par l’intermédiaire d’une nouvelle fonction de type Lyapunov que l’on désigne par le nom de fonction de Lyapunov entrée-état. Lemme 8.9. On suppose que le terme de couplage est linéaire en z et que le système z˙ = f (z) est globalement asymptotiquement stable avec comme fonction de Lyapunov W (z) satisfaisant la condition de croissance ∂W k ≤ α3 kzk z Lf W ≤ −α4 W (z), αi > 0, i = 2, . . . , 4.

α1 kzk2 ≤ W (z) ≤ α2 kzk2,

k

Sous ces conditions, la solution z(t) de (8.2) est bornée et converge vers zéro pour tout ξ(t) convergeant vers zéro.


241

Preuve. Le long des solutions de (8.2),nous avons ˙ (z) ≤ −α4 W (z)2α3 kzkkψ(z, ξ) W pour une certaine fonction de classe K, de telle sorte ˙ (z) ≤ (−α4 + α3 γ(kξk))W (z). W α1 Ceci démontre que W (z(t)) existe pour tout t ≥ 0. De plus, puisque ξ(t) converge vers zéro, il existe un temps fini après lequel ˙ (z) ≤ 1 α4 W (z), W 2 Conduisant ` a ce que z demeure borné et converge exponentiellement vers 0. On se tourne maintenant vers le deuxième résultat concernant la caractérisation de la propriété de stabilité entrée-état. Th´ eor` eme 8.10. Le système x˙ = f (x, u) est stable entrée-état a ` condition qu’il existe une fonction radialement non bornée W (z) telle que kxk ≥ χ1 (kuk) ⇒

∂w f (x, u) ≤ −χ2 (kxk), ∂x

o` u χ1 et χ2 sont des fonctions de classe K. D´ efinition 8.11. La fonction W (z) satisfaisant aux hypothèses du théorème précédent 8.10 est appelée une fonction de Lyapunov entrée-état. Un corollaire immédiat de ceci est : Corollaire 8.12. Si le système z˙ = f (z) + ψ(z, ξ) est stable entrée-état avec ξ pour entrée, et que, d’une part, le système z˙ = f (z) est globgalement asymptotiquement stable et, d’autre part, qu’il existe un bouclage u = k(ξ) rendant ξ = 0 de ξ˙ = a(ξ, k(ξ)) globalement asymptotiquement stable, alors le bouclage en question rend également le point d’équilibre complet de la cascade (8.2-8.3) globalement asymptotiquement stable. La démonstration de ces résultats sont exposés dans le papier de E.D. Sontag et Y. Wang “On characterizations of the input-to-state stability property”, Systems & Control Letters, vol. 24, pp. 351-359, 1995. Nous terminons cette section par un exemple illustratif. Exemple 8.13. En prenant comme fonction de Lyapunov entrée-état W (z) = z2 eme 2 , le syst`

242


z˙ = −z 3 + z 2 ξ ξ˙ = ξ 2 u est globalement asymptotiquement stable. En effet, ˙ = −z 4 + ξz 3 ≤ − 1 z 4 + 1 ξ 4 W 4 4 o` u la dernière inégalité provient de l’homogénéisation du ”ballon de rugby”. W est donc bien une fonction de Lyapunov entrée-état. Pour de grand z, le terme stabilisant −z 3 dans la cascade domine le terme de perturbation z 2 ξ et le bouclage u = −ξ conduit toute la cascade à être globalement asymptotiquement stable, même si la convergence de ξ vers zéro n’est pas exponentielle.

8.4 Passivation Dans la section précédente, nous avons explicitement admis une décomposition en sous-systèmes individuellement globalement asymptotiquement stables ou stabilisables. Or, imposer de telles propriétés aux sous-systèmes composant le système d’origine limite quelque peu les possibilités de synthèse des lois de commande. En effet, il est nullement indiqué comment forcer un système donné a priori ` a admettre une telle décomposition. Toutefois, l’analyse effectuée a souligné l’importance de considérer attentivement la manière dont la cascade résultante est connectée, même lorsque les propriétés de stabilité individuelle sont garanties. Conformément ` a cette optique, considérer de bonnes propriétés des systèmes isolés pour garantir la stabilité du système complet est une excellente fa¸con de procéder pour construire des lois de commandes globales à partir d’une décomposition en sous-systèmes. Par exemple, le chapitre 5 a montré que deux systèmes passifs interconnectés demeurent passifs. De plus, les systèmes passifs ont une excellente propriété pour la stabilisation. En effet, un bouclage par un gain négatif de leur sortie sur leur entrée conduit ` a une stabilité garantie, à condition que l’état nul soit détectable. D´ efinition 8.14. L’état nul détectable signifie que lorsque la sortie d’un système x˙ = f (x), y = h(x) est nulle sur un interval de temps fini, alors l’état x est nul nécessairement. Th´ eor` eme 8.15. Soit x˙ = f (x, u) y = h(x) un système passif avec comme fonction de stockage interne V (x) et comme point d’équilibre x ¯ = 0, u ¯ = 0 (c.-` a-d. 0 = f (0, 0)). Si le système est zéro

8.4 Passivation

243

détectable, alors le bouclage u = −y assure la stabilité asymptotique du système. Si la fonction V (x) est radialement non bornée, alors la stabilité asymptotique est globale. Preuve. La passivité garantit V˙ = uy − g(x) avec g(x) > 0. Comme y = −u par le choix du bouclage, V˙ = −uT u − g(x) ≤ 0, de telle sorte qu’il est possible d’appliquer le théorème d’invariance de LaSalle. L’ensemble R = {x | V˙ (x) = 0} est alors celui pour lequel −y T y−g(x) = 0. Il faut donc simultanément g(x) = 0 et y T y = 0. Le plus grand invariant contenu dans cet ensemble doit donc satisfaire y T y = 0 pour tout temps. Or, l’hypothèse de détectabilité implique que si la sortie est nulle sur un interval de temps fini, alors l’état x est nécessairement nul. Par conséquent, l’ensemble invariant M inclu dans R est l’origine x = 0, et la stabilité est démontrée. La stabilité globale suit de l’hypothèse de non bornitude radiale de V (x). A l’aide de ce théorème, il est possible de stabiliser un système comportant une décomposition en deux systèmes passifs interconnectés. L’interconnexion consiste en une succession de boucles et de connexion parallèle préservant la passivité (voir section ??). Le grand avantage de l’utilisation de la passivité est que la restriction du taux de croissance du terme d’interconnexion n’est plus nécessaire (contrairement ` a la cascade simple comme nous l’avons vu à la section 8.3.1). De plus l’hypothèse de stabilité asymptotique globale du sous-système z˙ = f (z) est remplacé par la stabilité globale simple (non nécessairement asymptotique). Pour le voir, commen¸cons par examiner le système z˙ = f (z) + ψ(z, ξ) ξ˙ = Aξ + Bu. Afin de faire apparaˆıtre deux systèmes passifs interconnectés, le terme de couplage ψ(z, ξ) est ` a nouveau factorisé, mais en faisant apparaˆıtre le facteur Cξ ˜ ξ)Cξ ψ(z, ξ) = ψ(z, (8.5) Cette factorisation permet d’identifier un block linéaire dont la fonction de transfert est G1 (s) = C(sI − A)−1 B. Pour que ce système soit passif, il suffit que la fonction de transfert G1 (s) soit positive réelle (la réponse harmonique G( jω) doit être à partie réelle positive), comme nous l’avons vu au chapitre sur la passivité.

244


Quand au second block, il est décrit par l’équation différentielle ˜ ξ)u2 , z˙ = f (z)ψ(z, avec commen entrée u2 = y1 = Cξ; la sortie y2 restant encore ` a être définie pour garantir la passivité. Cette sortie y2 = h2 (z, ξ) doit être choisie afin qu’une fonction de stockage interne existe. En prenant la fonction de Lyapunov W (z) (associée au sous-système z) comme fonction de stockage, il suffit de garantir ˜ ξ)y1 ) ≤ y T u2 . ˙ = ∂W (f (z) + ψ(z, (8.6) W 2 ∂z Comme Lf W ≤ 0, la relation (8.6) ci-dessus est satisfaite à condition que T ∂W T T ˜ . y2 = h2 (z, ξ) := (Lψ˜ W ) (z, ξ) = ψ ∂z Ce choix de sortie garantit ainsi la passivité du deuxième block de la cascade. Finalement, le bouclage sur le système initial u = −h2 (z, ξ) + v garantit que le système complet vu depuis la nouvelle entrée v et la sortie y1 est passif. En posant v = −y1 l’ensemble de la cascade est stabilisée. La construction ci-dessus n’est pas limitée au cas o` u la dynamique en ξ est linéaire, et nous avons le résultat suivant : Th´ eor` eme 8.16. Soit la cascade z˙ = f (z) + ψ(z, ξ) ξ˙ = a(ξ) + b(ξ)u

(8.7) (8.8)

avec z = 0 un point d’équilibre globalement stable pour z˙ = f (z) de telle sorte qu’il existe un fonction de Lyapunov radialement non bornée W (z) avec Lf W (z) ≤ 0. Supposons également qu’il existe une sortie ne dépendant que de ξ, disons y = h(ξ) de telle sorte que 1. Le sous système ξ˙ = a(ξ) + b(ξ)u y = h(ξ)

(8.9) (8.10)

est passif avec comme fonction de stockage U (ξ), également radialement non bornée.

8.4 Passivation

245

˜ ξ)ξ. 2. Le terme de connexion se factorise sous la forme ψ(z, ξ) = ψ(z, alors la cascade (8.7-8.8) peut être rendue passive par retour d’état donné par u = Lψ˜ W T (z, ξ) + v avec comme nouvelle entrée v et comme fonction de stockage V (z, ξ) = W (z) + U (ξ). De plus, si ce système est zéro détectable par la sortie y = h(ξ), alors le bouclage v = −ky avec k > 0 garantit la stabilité globale asymptotique du point d’équilibre (z, ξ) = (0, 0). Remarque 8.17. Il y a essentiellement deux conditions pour atteindre la stabilité globale 1. La connexion linéaire par le terme ψ(x, ξ), c.-à-d. la possibilité de facto˜ ξ)ξ. riser ce terme sous la forme ψ(x, ξ) = ψ(x, 2. L’existence de deux fonctions de Lyapunov radialement non bornée pour les deux sous-systèmes. Remarque 8.18. La passivité possède comme grand avantage sur les retours partiels d’état simple, de ne pas imposer de condition sur la croissance du terme de couplage. Remarquons également qu’il n’est pas exigé que la partie du haut z˙ = f (z) soit asymptotiquement stable ; c’est uniquement la stabilité qui est nécessaire. Pour illustrer la dernière remarque, un exemple avec un terme de couplage ayant une croissance rapide est présenté. Exemple 8.19. Nous avons vu que l’exemple z˙ = −z + z 2 ξ ξ˙ = u n’est pas globalement stabilizable par retour partiel d’état à cause de la croissance du terme de couplage z 2 ξ. Maintenant, en considérant la sortie y1 = ξ, un sous block G1 (s) passif est délimité. Ensuite, en posant W (z) = z 2 comme fonction de stockage, nous constatons que la première équation du modèle correspond ` a un système passif d’entrée u2 = ξ et de sortie y2 = z 3 . Ainsi, le bouclage u = −y2 + v = −z 3 + v transforme la cascade initiale en une connexion de deux systèmes passifs. La propriété de nulle détectabilité de la sortie est également satisfaite parce qu’à l’intérieur de l’ensemble y1 = ξ = 0, le système complet se réduit à z˙ = −z. C’est pourquoi la loi de commande z = −ky1 (avec k > 0) rend l’ensemble de la cascade globalement asmptotiquement stable.

246


Remarque 8.20. Bien que l’hypothèse de croissance du terme de couplage n’apparaˆıt plus dans le cas de l’utilisation de la passivité, des restrictions de structure sont néanmoins présentes. En effet, la sortie des deux sous-systèmes doit être de degré relatif au maximum de un et le sous-système entrée-sortie sélectionné doit également être à phase minimale.

8.5 Ph´ enom` ene du peaking Que cel` a soit lors de l’utilisation de retours partiels, ou lors de l’exploitation de la propriété de passivité, des limitations de structure sont présentes. Elles sont associées ` a certaines propriétés des sous-systèmes envisagés (stabilité, degré relatif, minimum de phase) et également à la nature de l’interconnexion (type de croissance). Toutes ces limitations tirent leur origine essentiellement du phénomène de peaking que nous présentons dans cette section. Ce phénomène a déj` a été esquissé pour illustrer l’importance du taux de croissance du terme d’interconnexion dans le cas des retours partiels. x˙ = −x + yx2

z˙1 = z2 z˙2 = u

y = c1 z 1 + c2 z 2 Ces équations représentent un double intégrateur (états z1 et z2 ) interconnecté ` a un système exponentiellement stable (x˙ = −x) par le terme de connexion yx2 . Cet exemple est fortement inspiré du modèle de la bille qui roule sur une barre o` u la force centrifuge est interprétée comme le terme d’interconnexion. Toutefois, contrairement à ce modèle, o` u θ et θ˙ jouent le rôle de z1 et z2 , la non-linéarité yx2 contient la variable du haut x, alors que dans le cas de la bille sur le barreau, le terme rθ˙2 comporte une non-linéarité sur ˙ la variable du bas θ. La variable intermédiaire y est introduite afin de montrer l’influence des coefficients c1 et c2 sur l’effet du terme de connexion yz 2 sur la stabilité du système complet. Cette variable y peut également être interprétée comme une sortie permettant l’application de la théorie de la passivité. Lorsque y est maintenu constant à une valeur non nulle, la première équation différentielle x˙ = −x + yx2 devient très similaire à celle (1.2) analysée dans le chapitre introductif. Nous avons vu que pour certaines conditions initiales, le système explose en temps fini. Il est donc nécessaire d’éviter si possible un tel phénomène. En effet, en faisant décroˆıtre y convenablement par rapport à l’évolution de x, le coefficient devant le facteur x2 peut devenir suffisamment petit pour

8.5 Phénomène du peaking

247

que l’état x soit toujours du bon cˆ oté par rapport à la séparation constatée sur la figure 1.2. Clairement, si y est forcé à une constante, il y aura toujours des conditions initiales pour lesquelles la trajectoire solution s’échappera à l’infini en un temps fini. La difficulté d’augmenter le bassin d’attraction du point d’équilibre provient essentiellement du problème de peaking, à savoir la possibilité que le transitoire de y ait une tendance à s’amplifier en fonction des conditions initiales z1 (0) et z2 (0). Pour un système linéaire z˙ = Az + Bu, un gain K est choisit de telle sorte que u = −Kz place les valeurs propres de A − BK avec une partie réelle inférieure ` a −a < 0. Pour que z1 et z2 convergent rapidement vers 0, il faut que a soit suffisament grand. Chaque composante de z est alors bornée par une exponentielle décroissante de taux a :

z1 (t) < C1 (z1 (0), z2 (0), k)e−kt

z2 (t) < C2 (z1 (0), z2 (0), k)e−kt .

Les coefficients C1 et C2 devant ces exponentiels sont très importants et dépendent en général du gain k choisi et de la valeur des conditions initales. De manière générale, chaque état a un coefficient γi = γ¯i k πi avec γ¯i ne dépend que de la condition initiale. y 0

-5

0

1

2

t

Fig. 8.1. Phénomène du peaking. Le système x ¨ + 2kx˙ + k2 x est simulé en posant x1 = x et x2 = x. ˙ Le gain est fixé ` a quatre valeurs croissantes, k = 3, 4, 10, et 20. La sortie y = x1 ne comporte pas de phénomène de peaking (traitillé) ; elle reste bornée entre deux valeurs indépendamment du gain k choisi. La sortie y = x2 comporte un phénomène de peaking (trait plein). Pour tout choix de borne de y, il est toujours possible en augmentant le gain k de dépasser cette borne. Le transitoire est amplifié au fur et ` a mesure que le gain k augmente.

248


D´ efinition 8.21. Le système ξ˙ = f (ξ, u), y = g(ξ), u ∈ R, y ∈ Rp n’a pas de phénomène de peaking si pour tout nombre réel a > 0 et pour chaque condition initiale ξ(0) ∈ Rp , il existe une entrée u(.) : R → R telle que l’état ξ(t) converge a ` zéro et que la sortie y(t) satisfasse 1 ky(t)k ≤ γkξ(0)k(e−σat + ), a o` u les constantes γ, σ ne dépendent pas du paramètre a. En exigeant que l’on puisse borner le transitoire, on limite les difficultés rencontrées pour passer de la stabilité locale à la stabilité semi-globale et globale.

8.6 Backstepping La technique de décomposition en cascade fondée sur la propriété de passivité exige que les sous-systèmes de la décomposition soient de degré relatif un. Il est parfois difficile de garantir une telle propriété. La technique de backstepping permet de court-circuiter en quelque sorte un ordre de l’équation différentielle composant un des sous-blocks, et permet ainsi d’étendre quelque peu la technique de passivation à une plus large classe de systèmes. Le backstepping consiste à négliger momentanément l’influence d’une partie de l’état sur une autre. Soit le système particulier x˙ = f (x) + g(x)z z˙ = u, o` u l’état z est clairement séparé de la partie x. Au lieu de calculer directement la fonction de Lyapunov pour le système complet V (x, z), ainsi que la loi de bouclage final k(x, z), une fonction intermédiaire V0 (x) impliquant uniquement la partie de l’état désignée par x est considérée. La variable d’état z est traitée comme l’entrée du système x˙ = f (x) + g(x)z. Son évolution donnée par z˙ = u est pour l’instant ignorée. Par conséquent, la détermination de Vo (x) et z = k0 (x) s’effectue comme a la section précédente. ` 8.6.1 Fonction de Lyapunov r´ eduite Il s’agit de déterminer V0 (x) et la loi de commande idéale z = k0 (x) de telle sorte que la dérivée de Lie de cette fonction le long du champ de vecteur f˜ = f (x) + g(x)k0 (x) soit négative. Ce vecteur est obtenu lorsqu’on considère qu’il est possible d’agir instantanément sur la valeur de la variable z et de

8.6 Backstepping

249

pouvoir ainsi la forcer ` a être égal à k0 (x). En outre, on suppose qu’il est également possible de déterminer une fonction définie positive W (x) telle que cette dérivée soit égale ` a −W (x) : ∂V0 (f (x) + g(x)k0 (x)) = −W (x), V˙ 0 = ∂x

(8.11)

8.6.2 Fonction de Lyapunov compl` ete A partir de la fonction de Lyapunov réduite, il est possible de trouver un candidat de Lyapunov pour le système complet en ajoutant à la fonction réduite V0 (x) un terme d’erreur quadratique entre l’état z réel et sa valeur idéale correspondant ` a k0 (x). Ainsi, on tient compte explicitement du fait qu’il n’est pas possible de forcer instantanément ces deux quantités à être égales, contrairement au paragraphe précédent. La variable d’erreur e = z − k0 (x) est introduite ` a partir de laquelle la fonction de Lyapunov complète s’exprime 1 1 V (x, z) = V0 (x) + e2 = V0 (x) + (z − k0 (x))2 . 2 2 Avec un tel choix, la dérivée de V le long des trajectoires solutions devient ∂V0 V˙ (x, z) = x˙ + ee˙ ∂x ∂V0 (f (x) + g(x)z) + ee˙ = ∂x ∂V0 = (f (x) + g(x)(e + k0 (x))) + ee. ˙ ∂x

(8.12)

A ce stade, on utilise une astuce permettant d’utiliser (8.11). En effet, en isolant le facteur e, l’expression centrale de (8.11) apparaˆıt dans (8.12) : ∂V0 ∂V0 (f (x) + g(x)k0 (x)) + g(x)e + ee˙ V˙ (x, z) = ∂x ∂x ∂V0 g(x)e + ee. ˙ = −W (x) + ∂x

(8.13)

En conséquence, la dérivée de la fonction de Lyapunov contient un terme clairement négatif, −W (x), et deux termes de signe indéfini. Toutefois, nous n’avons pour l’instant pas utiliser la commande u du système complet. Cette commande u apparaˆıt indirectement dans l’expression (8.13) par l’entremise de la dérivée de l’erreur e. ˙ C’est pourquoi nous pouvons assigner une expression convenable ` a e˙ de telle sorte que les trois termes de (8.13) deviennent négatifs. Comme la variable d’erreur e apparaˆıt comme un facteur dans les

250


deux termes de signe indéfini, il suffit de prendre pour e˙ une expression contenant deux termes, le premier permettant de compenser la partie de signe indéfini, et le second, proportionnel à e, for¸cant la négativité : e˙ = −

∂V0 g(x) − ke; ∂x

(8.14)

ainsi, V˙ (x, z) = −W (x) − kee. Finalement, en dérivant l’expression définissant l’erreur e = z − k0 (x), ∂k0 x˙ ∂x ∂k0 (f (x) + g(x)z). = u− ∂x

e˙ = z˙ −

et en tenant compte de (8.14), on obtient u : u = −k(z − k0 ) −

∂V0 ∂k0 g(x) + (f (x) + g(x)z). ∂x ∂x

8.6.3 Exemple Il s’agit d’un système comprenant deux états x1 et x2 . La commande intervient comme la dérivée du second état. x˙ 1 = x21 − x31 + x2 = f (x1 ) + g(x1 )x2 x˙ 2 = u

(8.15) (8.16)

Dans un premier temps, l’état x2 est supposé varier instantanément et selon la volonté du concepteur. Ainsi, x2 joue le rôle d’une entrée pour la dynamique du premier état. Idéalement, x2 = −x21 − x1 de telle sorte que x˙ 1 = −x1 − x31 . Par conséquent, k0 (x1 ) = −x21 − x1 1 V0 (x1 ) = x21 2 donne le bouclage et la fonction de Lyapunov réduite correspondante. En effet, V˙ 0 = x1 x˙ 1 = −x21 − x41 < 0, ce qui signifie que la commande réduite conduit à la stabilité asymptotique du système réduit.

8.6 Backstepping

251

A partir de la fonction réduite V0 (x1 ), l’expression de la fonction de Lyapunov pour le système complet est déduite en introduisant l’erreur entre le valeur idéale −x21 − x1 et la vraie valeur de x2 : e = x2 − k0 (x1 ) e = x2 − (−x21 − x1 ) = x2 + x21 + x1 Ainsi, 1 V (x1 , x2 ) = V0 + e2 2 1 2 1 = x1 + (x2 + x21 + x1 )2 2 2 Pour trouver la loi de bouclage, il suffit d’imposer une valeur convenable ` la dérivée de l’erreur e. a ˙ Dans un premier temps, le terme de signe indéfini est compensé et un terme proportionnel à l’erreur est également ajouté : e˙ = −

∂V0 g(x1 ) − ke = −x1 − k(x1 + x21 + x1 ) ∂x

Ensuite, l’entrée u fait son apparition en dérivant l’équation définissant l’erreur e = x2 + x21 + x1 : e˙ = u + (2x1 + 1)(x21 − x31 + x2 ) La loi de commande s’obtient par égalité entre ces deux expressions : u = −x1 − k(x2 + x21 + x1 ) − (2x1 + 1)(x21 − x31 + x2 )

(8.17)

Ceci conduit au système en boucle fermée x˙ 1 = x21 − x31 + x2 x˙ 2 = −x1 − k(x2 + x21 + x1 ) − (2x1 + 1)(x21 − x31 + x2 ) Pour vérifier si V = 12 x21 + 12 (x2 +x21 +x1 )2 est une fonction de Lyapunov, il suffit de dériver cette fonction et d’introduire la dynamique en boucle fermée. 1 2 1 x + (x2 + x21 + x1 )2 2 1 2 V˙ = x1 x˙ 1 + (x2 + x21 + x1 )(x˙ 2 + (2x1 + 1)x˙ 1 ) = x1 x˙ 1 + (x2 + x21 + x1 )(2x1 + 1)x˙ 1 + (x2 + x21 + x1 ) x˙ 2 V =

= x1 (x21 − x31 + x2 ) + (x2 + x21 + x1 )(2x1 + 1)(x21 − x31 + x2 ) + (x2 + x21 + x1 )(−x1 − k(x2 + x21 + x1 ) − (2x1 + 1)(x21 − x31 + x2 ))

= x1 (x21 − x31 + x2 ) + (x2 + x21 + x1 )(2x1 + 1)(x1 − x31 + x2 ) − x1 (x2 + x21 + x1 ) − k(x2 + x21 + x1 )2 −

(x2 + x21 + x1 )(2x1 + 1)(x1 − x31 + x2 ) = x31 − x41 + x2 x1 − x1 x2 − x31 − x21 − k(x2 + x21 + x1 )2

= −x21 − x41 − k(x2 + x21 + x1 )2 < 0

252


On constate donc bien que la dérivée est partout négative sauf à l’origine. En conséquence, le système (8.15)-(8.16) munit la loi de bouclage (8.17) est globalement asymptotiquement stable étant donné que (i) V (x1 , x2 ) est partout positive sauf ` a l’origine ; (ii) V˙ (x1 , x2 ) est partout négative sauf à l’origine ; et finalement (iii) V (x1 , x2 ) est radialement non bornée.

Litt´ erature

[Boo75]

W.A. Boothby. An Introduction to Differentiable Manifolds and Riemannian Geometry. Academic Press, New York, 1975.

[BS70]

N. P. Bhatia and G. P. Szeg¨ o. Stability Theory of Dynamical Systems. Springer-Verlag, Berlin, 1970.

[Car71]

E. Cartan. Le¸cons sur les invariants intégraux. Hermann, Paris, 1971.

[Che46]

C. Chevalley. Theory of Lie Groups. Princeton University Press, Princeton, 1946.

[Che61]

N. G. Chetaev. The Stability of Motion. Pergamon Press, Oxford, 1961.

[For59]

A. R. Forsyth. Theory of Differential Equations, Part I. Exact Equations and Pfaff ’s Problem. Dover Publications, Inc., Varick Street, New York, 1959.

[GH83]

J. Guckenheimer and P. Holmes. Nonlinear Oscillations, Dynamical Systems, and Bifurcations of Vector Fields. Springer-Verlag, New York, 1983.

[GP74]

V. Guillemin and A. Pollack. Differential Topology. Prentice-Hall, Englewood Cliffs, New Jersey, 1974.

[GVW68] A. Gelb and W. E. Vander Welde. Multiple-input Describing Functions and Nonlinear System Design. McGraw-Hill, New York, 1968. [Hah67]

W. Hahn. Stability of Motion. Springer-Verlag, Berlin, 1967.

[Hir76]

M. W. Hirsch. Differential Topology. Springer-Verlag, New York, 1976.

[HLP52] G. Hardy, J. E. Littlewood, and G. P´ olya. Inequalities. Cambridge University Press, Cambridge, second edition, 1952. [Isi89]

A. Isidori. Nonlinear Control Systems. Springer-Verlag, Berlin, Heidelberg, New York, second edition, 1989.

[Kha02]

H. K. Khalil. Nonlinear Systems. Prentice-Hall, Upper Saddle River, NJ, 2002.

[KN63]

S. Kobayashi and K. Nomizu. Foundations of Differential Geometry, volume 1 & 2. John Wiley & Sons, Inc., New York, 1963.

[LaS86]

J. P. LaSalle. The Stability and Control of Discrete Processes. SpringerVerlag, Berlin, 1986.

254

Littérature

[LL61]

J. P. LaSalle and S. Lefschetz. Stability by Liapunov’s Direct Method. Academic Press, New York, 1961.

[LL69]

V. Lakshmikantham and S. Leela. Differential and Integral Inequalities, volume I & II. Academic Press, New York, 1969.

[LLM89] V. Lakshmikantham, S. Leela, and A. A. Martynuk. Stability Analysis of Nonlinear Systems. Marcel Dekker, New York, 1989. [Mee81]

A. I. Mees. Dynamics of Feedback Systems. John Wiley & Sons, Chichester, New York, Brisbane, Toronto, 1981.

[MM82]

R.K. Miller and A. N. Michel. Ordinary Differential Equations. Academic Press, New York, 1982.

[Mor01]

S. Morita. Geometry of Differential Forms. American Mathematical Society, Providence, Rhode Island, 2001.

[MT95]

R. Marino and P. Tomei. Nonlinear Control Design. Prentice-Hall Europe, Hertfordshire, 1995.

[NvdS90] H. Nijmeijer and A. van der Schaft. Nonlinear Dynamical Control Systems. Springer-Verlag, New York, 1990. [Sas99]

S. Sastry. Nonlinear Systems. Springer-Verlag, New York, 1999.

[SJK97]

R. Sepulchre, M. Janković, and P.V. Kokotović. Constructive Nonlinear Control. Springer-Verlag, London, 1997.

[SL91]

J.-J. Slotine and W. Li. Applied Nonlinear Control. Prentice-Hall, Upper Saddle River, NJ, 1991.

[Son98]

E.D. Sontag. Mathematical Control Theory : Deterministic Finite Dimensional Systems. Springer-Verlag, New York, second edition, 1998.

[Vid93]

M. Vidyasagar. Nonlinear Systems Analysis. Prentice-Hall, Englewood Cliffs, NJ, 1993.

[Wal68]

A.H. Wallace. Differential Topology, First Steps. W.A. Benjamin, Inc., New York, Amsterdam, 1968.

[Wal70]

W. Walter. Differential and Integral Inequalities. Springer-Verlag, Berlin, 1970.

[Yos66]

T. Yoshizawa. Stability Theory by Liapunov’s Second Method. Gakujutsutosho Printing Co., Tokyo, 1966.

[Zub62]

V.I. Zubov. Mathematical Methods for the Study of Automatic Control Systems. Pergamon Press, Oxford, 1962.

[Zub64]

V.I. Zubov. Methods of A. M. Lyapunov and their Applications. Noordhoff, Groningen, 1964.

Index

élimination du temps, 15 équation intégrale, 101 équation d’erreur, 197 équation différentielle d’erreur, 198, 201 solution, 150 1-forme, 92, 157, 158, 170 1-forme exacte, 170 exemple, 180 intégrable, 170 , 229 Bellman-Gronwall, 101 candidat de Lyapunov, 71, 74 chaˆıne d’intégrateurs, 226 champ de vecteurs, 150, 223 changement de coordonnées, 195 chaos, 8 commande en boucle fermée, 201 en boucle ouverte, 200 compétition, 26 comparaison, 97 condition d’exactitude, 174 d’intégrabilité, 174 conjecture de Aizerman, 130 Cotangent, 157

cotangent, 158 covecteur, 157, 170 critère d’exactitude, 174 d’intégrabilité, 174 de Nyquist, 57 de Popov, 135 du cercle, 130 crochet de Lie, 162, 222 de Lie propriétés, 162 cycle limite, 19 cycle limite instable, 59 stable, 58 décomposition en harmoniques, 37 déflation, 99 dérivée de Lie, 218 dérivation extérieure, 164, 165, 171, 172 extérieure propriétés, 166, 173 développement limité, 100 degré relatif, 119 difféomorphisme, 149, 195 différentielle, 164, 171 distribution, 223 dynamique de populations, 25 dynamique

256

Index

interne, 211 ensemble invariant, 85 espace dual, 151 explosion en temps fini, 8 fiabilité du premier harmonique, 61 flot, 85 Fonction de Lyapunov, 159 fonction d’erreur, 198 de Lyapunov, 122 fonction définie positive, 71 fonction de Lyapunov, 72, 74, 86 fonction de Lyapunov méthodes de construction, 91 pour les systèmes linéaires, 81 fonction radialement non bornée, 80 forme alternée, 156 linéaire, 152 multilinéaire, 152, 156 quadratique, 98 formule d’Ackermann, 212 gain équivalent, 35, 37, 43–45 gradient, 157 graphe des pentes, 14 inégalité de Cauchy-Schwarz, 103 du triangle, 104 inegalité arithmétique-géométrique, 104 inflation, 99 instabilité, 95, 96 intégrabilité, 168 involutivité, 223 lemme de Bellman-Gronwall, 101 linéarisation, 82, 191 linéarisation entrée-état, 196 entrée-sortie, 214 exacte, 195, 216 Lyapunov, 122

méthode de Krasovskii, 92 des isoclines, 16 directe de Lyapunov, 71, 84 du gradient variable, 92 du premier harmonique, 31 majoration, 97 matrice défnie positive, 98 minimum de phase, 119 non minimum de phase, 119 non-linéarité continue par morceaux, 46 de secteur, 128 statique, 32 oscillateur de Van der Pol, 61 linéaire, 50 passivité, 107 passivité connexion par rétroaction, 113 connexion parallèle, 112 définition, 111, 114 notion intuitive, 108 propriétés, 111 système linéaire, 114 pendule inversé, 194 placement de pˆ oles, 201 plan de phase, 11 planification de trajectoire, 200 platitude, 216, 217 point d’équilibre, 7, 22, 65 population, 25 poursuite, 199 prédateur, 28 premier harmonique, 37 principe de superposition, 3 produit extérieur, 153, 156, 174 scalaire, 153 tensoriel, 152 proie, 28 rétroaction, 47 relais, 45

Index robot flexible, 220 saturation, 43 sortie de Brunovsky, 212 plate, 212, 216, 217 stabilié locale asymptotique, 131 stabilisation, 199 stabilité, 65 stabilité absolue, 128, 130 au sens de Lyapunov, 67 critère de, 58 définition précise, 66 exponentielle, 79, 84 globale, 79 locale, 75, 82 notion intuitive, 66 preuve locale, 75 système dynamique passif, 109 linéaire, 209 linéaire SISO, 202

réel positif, 116, 118 statique passif, 109 système non-linéaire, 3 technique , de comparaison97, IeC de majoration97 termes d’ordre supérieur, 6 théorème d’invariance de LaSalle, 85 de Bendixson, 24 de Chetaev, 96 de Frobenius, 184 de Frobenius version 1-forme, 188 version champ de vecteur, 188 de l’index, 23 de Nyquist, 52 de Poincaré-Bendixson, 25 des résidus, 55 variété, 145 zone morte, 44

257

Introduction à l'analyse et à la commande des systèmes non linéaires

Modélisation et commande de la machine asynchrone

Commande des systèmes multidimensionnels

Introduction à la commande des robots humanoïdes : De la modélisation à la génération du mouvement

Commande H infini et mu-analyse

La morale et la science des moeurs

La microstructure des aciers et des fontes : genèse et interprétation

Dynamique de la commande lineaire, 8e edition

La comptabilité des artisans et commerçants

Les textes des sarcophages et la democratie

La transmission des PME : Perspectives et enjeux

De la musique et des lettres

Introduction à la théorie des points critiques et applications aux problèmes elliptiques (Mathématiques et Applications)

La nostalgie des origines: Méthodologie et histoire des religions

Theorie des nombres irrationnels, des limites et de la continuite

Introduction au non marxisme

Dynamiques complexes et morphogenèse : Introduction aux sciences non linéaires

Apocalypse sur commande

INTRODUCTION a la PEINTURE de la CHINE et du JAPON

La justice internationale et la repartition des ressources naturelles

Non Aprire La Porta!

La Morte Non Dimentica

La Morte Non Dimentica

Non Aprire La Porta!

La Morte Non Dimentica

Non Aprire La Porta!

La Morte Non Dimentica

Introduction à l'analyse et à la commande des systèmes non linéaires

Modélisation et commande de la machine asynchrone

Commande des systèmes multidimensionnels

Introduction à la commande des robots humanoïdes : De la modélisation à la génération du mouvement

Commande H infini et mu-analyse

La morale et la science des moeurs

La microstructure des aciers et des fontes : genèse et interprétation

Dynamique de la commande lineaire, 8e edition

La comptabilité des artisans et commerçants

Les textes des sarcophages et la democratie

La transmission des PME : Perspectives et enjeux

De la musique et des lettres

Introduction à la théorie des points critiques et applications aux problèmes elliptiques (Mathématiques et Applications)

La nostalgie des origines: Méthodologie et histoire des religions

Theorie des nombres irrationnels, des limites et de la continuite

Introduction au non marxisme

Dynamiques complexes et morphogenèse : Introduction aux sciences non linéaires

Apocalypse sur commande

INTRODUCTION a la PEINTURE de la CHINE et du JAPON

La justice internationale et la repartition des ressources naturelles

Non Aprire La Porta!

La Morte Non Dimentica

La Morte Non Dimentica

Non Aprire La Porta!

La Morte Non Dimentica

Non Aprire La Porta!

La Morte Non Dimentica

Recommend Documents