Mathematische Physik: Klassische Mechanik
Andreas Knauf
Mathematische Physik: Klassische Mechanik
123
Prof. Dr. Andreas Knauf Department Mathematik FAU Erlangen-Nürnberg Cauerstr. 11 91058 Erlangen Deutschland
[email protected] ISBN 978-3-642-20977-2 e-ISBN 978-3-642-20978-9 DOI 10.1007/978-3-642-20978-9 Springer Heidelberg Dordrecht London New York Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Mathematics Subject Classification (2010): 37N05 c Springer-Verlag Berlin Heidelberg 2012 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Einbandentwurf: WMXDesign GmbH, Heidelberg Gedruckt auf säurefreiem Papier Springer ist Teil der Fachverlagsgruppe Springer Science+Business Media (www.springer.com)
Inhaltsverzeichnis Bemerkungen zur Mathematischen Physik Motive und Ziele . . . . . . . . . . . . . Inhalte des Buches ,Klassische Mechanik’ Inhalte der Lehrbuchreihe . . . . . . . . . Zur Notation . . . . . . . . . . . . . . . . Kleines Englisch-W¨ orterbuch . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
1 Einleitung
xi xi xiii xiv xv xvi 1
2 Dynamische Systeme 2.1 Iterierte Abbildungen, dynamische Systeme . . . . . . . . . . . . 2.2 Stetige dynamische Systeme . . . . . . . . . . . . . . . . . . . 2.3 Differenzierbare dynamische Systeme . . . . . . . . . . . . . . .
11 12 16 25
3 Gew¨ ohnliche Differentialgleichungen 3.1 Definitionen und Beispiele . . . . . . . . . . . . . . . . 3.2 Lokale Existenz und Eindeutigkeit der L¨osung . . . . . 3.3 Globale Existenz und Eindeutigkeit der L¨osung . . . . . 3.4 Transformation in ein dynamisches System . . . . . . . 3.5 Das maximale Existenzintervall . . . . . . . . . . . . . 3.6 Der Hauptsatz der Differentialgleichungstheorie . . . . 3.6.1 Linearisierung der DGL entlang einer Trajektorie 3.6.2 Aussage und Beweis des Hauptsatzes . . . . . . 3.6.3 Folgerungen aus dem Hauptsatz . . . . . . . .
. . . . . . . . .
29 30 35 42 45 48 50 51 53 55
4 Lineare Dynamik 4.1 Homogene lineare autonome DGLn . . . . . . . . . . . . . . . . 4.2 Explizit zeitabh¨angige lineare DGLn . . . . . . . . . . . . . . . 4.3 Quasipolynome . . . . . . . . . . . . . . . . . . . . . . . . . .
57 58 65 70
5 Klassifikation linearer Fl¨ usse 5.1 Konjugationen linearer Fl¨ usse . . . 5.2 Hyperbolische lineare Vektorfelder 5.3 Lineare Fl¨ usse in der Ebene . . . . 5.4 Beispiel: Feder mit Reibung . . . .
73 74 76 80 84
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . . . . . . .
. . . .
. . . . . . . . .
. . . .
. . . . . . . . .
. . . .
. . . . . . . . .
. . . .
. . . .
v
vi
Inhaltsverzeichnis
6 Hamiltonsche Gleichungen und Symplektische Gruppe 6.1 Gradientenfl¨ usse und hamiltonsche Systeme . . . . . . . 6.1.1 Gradienten–Differentialgleichungen . . . . . . . . 6.1.2 Hamiltonsche Systeme . . . . . . . . . . . . . . 6.2 Die symplektische Gruppe . . . . . . . . . . . . . . . . . 6.2.1 Lineare hamiltonsche Systeme . . . . . . . . . . 6.2.2 Symplektische Geometrie . . . . . . . . . . . . . 6.2.3 Die symplektische Algebra . . . . . . . . . . . . 6.3 Lineare hamiltonsche Systeme . . . . . . . . . . . . . . . 6.3.1 Harmonische Oszillatoren . . . . . . . . . . . . . 6.3.2 Harmonische Gitterschwingungen . . . . . . . . . 6.3.3 Teilchen im konstanten elektromagnetischen Feld 6.4 Unterr¨aume symplektischer Vektorr¨aume . . . . . . . . . 6.5 * Der Maslov–Index . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
89 90 90 93 95 95 96 101 103 104 110 113 116 119
7 Stabilit¨ atstheorie 7.1 Stabilit¨at linearer Differentialgleichungen . 7.2 Liapunov-Funktionen . . . . . . . . . . . 7.3 Verzweigungen . . . . . . . . . . . . . . . 7.3.1 Verzweigungen von Ruhelagen . . 7.3.2 Verzweigungen periodischer Orbits 7.3.3 Verzweigungen des Phasenraums .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
127 128 131 134 134 138 141
8 Variationsprinzipien 8.1 Lagrange- und Hamilton–Gleichungen 8.2 Holonome Zwangsbedingungen . . . . 8.3 Das hamiltonsche Variationsprinzip . . 8.4 Die Geod¨atische Bewegung . . . . . . 8.5 Die Jacobi–Metrik . . . . . . . . . . . 8.6 Das fermatsche Prinzip . . . . . . . . 8.7 Die geometrische Optik . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
143 144 149 152 159 164 169 171
9 Ergodentheorie 9.1 Maßerhaltende dynamische Systeme 9.2 Ergodische dynamische Systeme . . 9.3 Mischende dynamische Systeme . . . 9.4 Der birkhoffsche Ergodensatz . . . . 9.5 Der poincar´esche Wiederkehrsatz . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
177 178 181 184 191 197
10 Symplektische Geometrie 10.1 Symplektische Mannigfaltigkeiten . . . . . 10.2 Lie–Ableitung und Poisson–Klammer . . . 10.3 Kanonische Transformationen . . . . . . . 10.4 Lagrange–Mannigfaltigkeiten . . . . . . . 10.5 Erzeugende kanonischer Transformationen
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
201 202 208 213 219 221
. . . . .
Inhaltsverzeichnis
vii
11 Bewegung im Potential 11.1 Allgemein g¨ ultige Eigenschaften . . . . . . . . . . . . . . 11.1.1 Existenz des Flusses . . . . . . . . . . . . . . . . 11.1.2 Reversibilit¨at des Flusses . . . . . . . . . . . . . 11.1.3 Erreichbarkeit . . . . . . . . . . . . . . . . . . . 11.2 Bewegung im periodischen Potential . . . . . . . . . . . 11.2.1 Existenz der asymptotischen Geschwindigkeiten . 11.2.2 Verteilung der asymptotischen Geschwindigkeiten 11.2.3 Ballistische und diffusive Bewegung . . . . . . . 11.3 Himmelsmechanik . . . . . . . . . . . . . . . . . . . . . 11.3.1 Geometrie des Kepler–Problems . . . . . . . . . 11.3.2 Zwei Gravitationszentren . . . . . . . . . . . . . 11.3.3 Das n–K¨ orper-Problem . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
225 226 226 227 228 228 229 231 235 238 239 247 252
12 Streutheorie 12.1 Potentialstreuung . . . . . . . . . . . . . . . . . . . . . 12.2 Die Møller-Transformationen . . . . . . . . . . . . . . . 12.3 Der differentielle Wirkungsquerschnitt . . . . . . . . . . 12.4 Zeitverz¨ ogerung, Radon–Transform., Inverse Streutheorie 12.5 Kinematik der Streuung von n Teilchen . . . . . . . . . 12.6 * Asymptotische Vollst¨andigkeit . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
259 260 268 275 279 286 291
13 Integrable Systeme und Symmetrien 13.1 Was bedeutet Integrabilit¨at? Ein Beispiel 13.2 Der Satz von Liouville-Arnol’d . . . . . 13.3 Winkel-Wirkungskoordinaten . . . . . . 13.4 Die Impulsabbildung . . . . . . . . . . . 13.5 * Reduktion des Phasenraums . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
305 306 309 315 322 330
14 Starre und bewegliche K¨ orper 14.1 Bewegungen des Raumes . . . . . . . . . 14.2 Kinematik starrer K¨ orper . . . . . . . . . 14.3 L¨osung der Bewegungsgleichungen . . . . 14.3.1 Kr¨aftefreie Kreisel . . . . . . . . . 14.3.2 Schwere (symmetrische) Kreisel . 14.4 Bewegliche K¨ orper, anholonome Systeme . 14.4.1 Geometrie beweglicher K¨ orper . . 14.4.2 Anholonome Zwangsbedingungen .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
343 344 345 351 352 358 361 361 364
15 St¨ orungstheorie 15.1 Bedingt-periodische Bewegung des Torus . . . 15.2 St¨orungstheorie f¨ ur eine Winkelvariable . . . . 15.3 Hamiltonsche St¨ orungstheorie erster Ordnung 15.4 KAM-Theorie . . . . . . . . . . . . . . . . . 15.4.1 * Ein Beweis des KAM–Satzes . . . . 15.4.2 Maß der KAM–Tori . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
367 368 376 379 387 388 399
viii
Inhaltsverzeichnis 15.5 Diophantische Bedingung und Kettenbr¨ uche . . . . . . . . . . . 403 15.6 Cantori: Am Beispiel der Standardabbildung . . . . . . . . . . . 408
16 Relativistische Mechanik 16.1 Die Lichtgeschwindigkeit . . . . . . . 16.2 Die Lorentz– und die Poincar´e–Gruppe 16.3 Geometrie des Minkowski–Raumes . . 16.4 Die Welt in relativistischer Sichtweise . 16.5 Von Einstein zu Galilei — und zur¨ uck 16.6 Relativistische Dynamik . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
411 412 414 419 425 430 435
17 Symplektische Topologie 437 17.1 Das symplektische Kamel und das Nadel¨ohr . . . . . . . . . . . 438 17.2 Der Satz von Poincar´e–Birkhoff . . . . . . . . . . . . . . . . . . 442 17.3 Die Arnol’d–Vermutung . . . . . . . . . . . . . . . . . . . . . . 446 A Topologische R¨ aume und A.1 Topologie und Metrik A.2 Mannigfaltigkeiten . . A.3 Das Tangentialb¨ undel
Mannigfaltigkeiten 449 . . . . . . . . . . . . . . . . . . . . . . . 449 . . . . . . . . . . . . . . . . . . . . . . . 457 . . . . . . . . . . . . . . . . . . . . . . . 463
B Differentialformen ¨ B.1 Außere Formen . . . . . . . . . . . . . . B.2 Differentialformen auf dem Rn . . . . . . B.3 Integration von Differentialformen . . . . B.4 Differentialformen auf Mannigfaltigkeiten . B.5 Innere Ableitung und Lie–Ableitung . . . . B.6 Der Satz von Stokes . . . . . . . . . . . . B.7 Das Poincar´e–Lemma . . . . . . . . . . . B.8 de-Rham–Kohomologie . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
471 472 477 482 485 486 489 493 497
C Konvexit¨ at und Legendre–Transformation 500 C.1 Konvexe Mengen und Funktionen . . . . . . . . . . . . . . . . . 500 C.2 Die Legendre-Fenchel–Transformation . . . . . . . . . . . . . . 501 D Fixpunkt- und Urbilds¨ atze
505
E Gruppentheorie E.1 Gruppen . . . . . . . . E.2 Lie–Gruppen . . . . . . E.3 Lie–Algebren . . . . . . E.4 Lie–Gruppenwirkungen
508 508 511 514 519
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Inhaltsverzeichnis F B¨ undel, Zusammenhang, Kr¨ ummung F.1 Faserb¨ undel . . . . . . . . . . . . . . . . F.2 Zusammenh¨ange auf Faserb¨ undeln . . . . F.3 Distributionen und der Satz von Frobenius F.4 Holonomie und Kr¨ ummung . . . . . . . .
ix
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
522 522 526 532 534
G Morse–Theorie 537 G.1 Morse–Ungleichungen . . . . . . . . . . . . . . . . . . . . . . . 537 G.2 Singul¨are Homologie . . . . . . . . . . . . . . . . . . . . . . . . 541 G.3 Geod¨atische Bewegung und Morse–Theorie . . . . . . . . . . . . 545 H L¨ osungen der Aufgaben
552
Literaturverzeichnis
609
Namensregister
620
Symboltabelle
622
Abbildungsnachweis
623
Sachregister
624
Bemerkungen zur Mathematischen Physik Motive und Ziele The laws of nature are constructed in such a way as to make the universe as ” interesting as possible.” Freeman Dyson, in Imagined Worlds (1997) In der Mathematischen Physik wird versucht, ausgehend von physikalischen Grundgleichungen und -Annahmen (wie der newtonschen Gleichung, der Boltzmann–Verteilung oder der Schr¨ odinger–Gleichung) physikalische Sachverhalte mathematisch abzuleiten. Im Mittelpunkt steht also das physikalische Problem (zum Beispiel die Frage nach der Stabilit¨at des Sonnensystems, dem Grund f¨ ur die Existenz von Kristallen oder der Lokalisierung von Elektronen im amorphen Festk¨orper). Die zur L¨osung des jeweiligen Problems ben¨otigten Methoden lassen sich mehrheitlich Analysis oder Geometrie zuordnen, aber auch algebraische Techniken spielen eine Rolle. In grober Zuordnung entspricht mathematisch der • Klassischen Mechanik die Theorie der gew¨ ohnlichen Differentialgleichungen, • der Quantenmechanik die Funktionalanalysis und • der (klassischen) Statistischen Mechanik die Wahrscheinlichkeitstheorie. Zu einem Zyklus u ¨ber Theoretische Physik geh¨ort aber auch die Elektrodynamik und damit mathematisch gesehen die Theorie der Maxwell–Gleichung, einer linearen partiellen Differentialgleichung. Die Allgemeine Relativit¨atstheorie, eins der Fundamente der modernen Physik, f¨ uhrt wie viele andere Fragestellungen auf eine nichtlineare partielle Differentialgleichung. Die Quantenfeldtheorie beruht auf einer Vielfalt analytischer, geometrischer wie algebraischer Methoden. Bei dieser Uferlosigkeit des Gebietes stellt sich die Frage, wie es m¨oglich ist, hier in vern¨ unftiger Zeit Boden unter den F¨ ußen zu bekommen, und ob sich die Besch¨aftigung mit Mathematischer Physik lohnt. Der vorliegende erste Band des geplanten dreib¨andigen Kurses zur Mathematischen Physik gibt ein Angebot zur ersten Frage. xi
xii
Bemerkungen zur Mathematischen Physik
Die zweite Frage muß jeder f¨ ur sich entscheiden. Studierende der Mathematik und der Physik haben hier oft unterschiedliche Motive: • In den Kursusvorlesungen der Theoretischen Physik kann ein mathematisch rigoroser Unterbau aus Zeitgr¨ unden nicht geschaffen werden. Notgedrungen werden etwa Schr¨ odinger-Operatoren wie endliche Matrizen behandelt. Hier bietet die Mathematischen Physik eine sinnvolle Erg¨anzung. Der f¨ ur eine h¨ ohere mathematische Genauigkeit zu zahlende Preis besteht darin, dass ein Kurs zur Mathematischen Physik bei Bachelor-regulierter Zeit nicht die gleiche Vielfalt physikalischer Ph¨anomene behandeln kann, wie das in einem Kurs zur Theoretischen Physik m¨ oglich ist. Stattdessen werden begriffliche Grundlagen gekl¨art und exemplarische Modelle untersucht. • Im Mathematik-Studium wird aus gutem Grund eine deduktive Entwicklung mathematischer Begriffe gew¨ahlt. Hier kann die problem- und nicht methodenorientierte Mathematische Physik die praktische Relevanz dieser Begriffe motivieren, etwa die dynamische Bedeutung der Spektralanteile eines selbstadjungierten Operators. Ein weiterer Grund f¨ ur das Interesse an der Mathematischen Physik ist ein Ph¨anomen, das Eugene Wigner zum Titel eines 1960 erschienenen Essays machte, n¨amlich The Unreasonable Effectiveness of Mathematics in the Natural Sciences” ” Oder mit Albert Einstein: Wie ist es m¨oglich, daß die Mathematik, die doch ein von aller Erfahrung un” abh¨angiges Produkt des menschlichen Denkens ist, auf die Gegenst¨ande der Wirklichkeit so vortrefflich paßt?” 1 Unmittelbar bezieht sich das Zitat Einsteins auf alle ,Gegenst¨ande der Wirklichkeit’. Aber seine beste Best¨atigung findet es in der Physik. Hier weisen mathematische Strukturen (wie die Differentialgeometrie f¨ ur die Relativit¨atstheorie oder die Gruppentheorie f¨ ur die Quantenfeldtheorie) oft vor experimentellen Beobachtungen den Weg zur angemessenen Theorie.2 Dagegen sind etwa in der Biologie als neuer Leitwissenschaft naturhistorisch entstandene Strukturen entscheidend. Auch wenn sich viele Ph¨anomene mathematisch modellieren lassen, ist die Voraussagekraft der Modelle begrenzt. Gleiches gilt in verst¨arktem Maß etwa f¨ ur die Wirtschaftswissenschaften. Zwar l¨aßt sich auch die Vielfalt technischer Erfindungen in mathematischer Sprache beschreiben, auch hier wird mehr problem- als methodenorientiert gearbeitet. Ein Unterschied liegt aber in der Zielsetzung. Ziel Mathematischer Physik ist zun¨achst Erkenntnis von Naturvorg¨angen, w¨ahrend es in der Technomathematik letztlich um die Simulation und Optimierung von Strukturen und Prozessen geht. 1 A. Einstein: Geometrie und Erfahrung. Festvortrag, gehalten an der Preussischen Akademie der Wissenschaften zu Berlin, am 27. Januar 1921. Berlin: Julius Springer 1921. 2 Dass umgekehrt ,physikalische Beweise’ mathematischer Sachverhalte m¨ oglich sind, zeigt auf sehr unterhaltsame Weise das Buch [Lev] von Mark Levi.
Bemerkungen zur Mathematischen Physik
xiii
Inhalte des Buches ,Klassische Mechanik’ Als μηχαν η´ (mˆechanˆe) bezeichnet man vorwissenschaftlich im Griechischen ” eine Konstruktion, einen Kunstgriff oder auch einen — illegitimen — Trick. Wenn griechische Staatsvertr¨age hinterlistiges Verhalten ausschließen wollten, verboten sie den Einsatz von τ ´χνη (technˆe) oder mˆechanˆe, von Hinterlist und T¨ucke.” [Me], Seite 129 Dies ist der erste Band der geplanten dreib¨andigen Lehrbuchreihe zur Mathematischen Physik. Die logischen Beziehungen zwischen den Kapiteln dieses Buches werden in erster N¨aherung durch den folgenden Baum dargestellt. 2: Dynamische Systeme
3: Gew¨ ohnliche Differentialgleichungen
4: Lineare Dynamik
6: Hamiltonsche Gleichungen und Symplektische Gruppe
5: Klassifikation linearer Fl¨ usse
7: Stabilit¨ atstheorie
8: Variationspr.
13: Integrable Systeme
10: Symplektische Geometrie
14: Der starre K¨ orper
9: Ergodentheorie
17: Symplektische Topologie
11: Potentialbew.
16: Relativistik
12: Streutheorie
15: St¨ orungstheorie
Einer vierst¨ undigen Vorlesung kann beispielsweise (falls Grundkenntnisse u ¨ber gew¨ohnliche Differentialgleichungen vorausgesetzt werden k¨onnen) die folgende Stoffauswahl zugrunde gelegt werden: • Kapitel 2: Dynamische Systeme • Kapitel 6: Hamiltonsche Gleichungen und Symplektische Gruppe • Kapitel 8: Variationsprinzipien • Kapitel 9: Ergodentheorie • Kapitel 10: Symplektische Geometrie • Kapitel 13: Integrable Systeme Erg¨anzend zu den Anh¨angen dieses Buches sei das Taschenbuch der Mathematik [Zei] von Eberhard Zeidler [Hg] empfohlen.
xiv
Bemerkungen zur Mathematischen Physik
Inhalte der Lehrbuchreihe Die geplante Lehrbuchreihe eignet sich als Basis einer dreisemestrigen vierst¨ undigen Vorlesung zur Mathematischen Physik, wie sie an mehreren deutschsprachigen Universit¨aten angeboten wird. Mit dieser Beschr¨ankung des Stoffes ist eine Integration in das Lehrangebot der Mathematik oder der Physik realisierbar. Zus¨atzlich sind die drei B¨ande weitgehend unabh¨angig voneinander, wodurch sie leichter in eine andere Unterrichtsplanung integriert werden k¨onnen. Explizit vorausgesetzt werden nur die Vorlesungen zur Analysis und zur Linearen Algebra. Anh¨ange fassen die wichtigsten Voraussetzungen etwa aus Differentialgeometrie, Gruppentheorie, Topologie und Wahrscheinlichkeitstheorie zusammen. Essentials etwa aus der Theorie gew¨ ohnlicher Differentialgleichungen oder der Funktionalanalysis werden an Ort und Stelle eingef¨ uhrt. Bei entsprechenden Vorkenntnissen k¨ onnen die entsprechenden Kapitel ausgelassen werden. Die B¨ande eignen sich auch zum Selbststudium. Die geplante Lehrbuchreihe kann vorhandene Literatur wie etwa die bekannten vierb¨andigen Werke ,Methods of Modern Mathematical Physics’ von M. Reed und B. Simon oder ,Lehrbuch der Mathematischen Physik’ von W. Thirring nicht ersetzen. W¨ahrend Ersteres wegbereitend f¨ ur die Mathematisierung der Quantenmechanik war, spannte das zweite Werk einen Bogen von den Grundgleichungen bis zum Beweis von Eigenschaften physikalisch realistischer Modelle. Es wird hier ein etwas geringeres mathematisches Ausgangsniveau vorausgesetzt, gleichzeitig aber versucht, die Breite aktueller Fragestellungen abzubilden und Voraussetzungen f¨ ur das Verst¨andnis spezialisierterer Literatur zu schaffen. Die durch einen Stern (*) gekennzeichneten Kapitel sind mathematisch anspruchsvoller, werden aber im Weiteren nicht vorausgesetzt. ¨ Die (in diesem Band u werden teilweise durch ¨ber 100) Ubungsaufgaben L¨ osungstipps erg¨anzt, denn sie variieren stark in ihrem Schwierigkeitsgrad. In einem Anhang findet man die L¨ osungen. Die (f¨ ur den vorliegenden Band etwa 340) Illustrationen sind – soweit m¨ oglich – quantitativ exakt. Danksagung Die geplante Lehrbuchreihe hat ihren Ursprung im Vorlesungszyklus ,Mathematische Physik’, der von Ruedi Seiler am Fachbereich Mathematik der TU Berlin etabliert wurde. Ihm verdanke ich und verdankt die Lehrbuchreihe sehr viel. Robert Schrader, der am Fachbereich Physik der FU Berlin meine Diplomarbeit und Dissertation betreute, hat meine Sicht der Mathematischen Physik entscheidend geformt. Ich danke Frau Irmgard Moch, die in detektivischer Arbeit meine Handschrift entzifferte und dieses Buch schrieb. Christoph Schumacher hat unter Anderem mehrere Aufgaben beigetragen. Viviane Baladi, Tanja Dierkes, Jacques F´ejoz, Herbert Lange, Zhiyi Tang, Stefan Teufel, Stephan Weis sowie zahlreiche weitere Kolleginnen und Kollegen fanden Fehler im Manuskript oder trugen anderweitig zu seiner Verbesserung bei. Frau Herrmann und Herrn Heine vom Springer–Verlag danke ich f¨ ur ihre freundliche Hilfe bei der Ver¨ offentlichung des Buches. Alle Fehler gehen nat¨ urlich auf mein Konto. F¨ ur entsprechende Hinweise bin ich dankbar. Erlangen, im Mai 2011, A.K.
Bemerkungen zur Mathematischen Physik
xv
Zur Notation Teilmengen: Sind A und B Mengen, dann heißt A Teilmenge von B (in Zeichen A ⊆ B), wenn gilt: x ∈ A ⇒ x ∈ B. Insbesondere gilt B ⊆ B. Die echte Inklusion A B bedeutet, dass A ⊆ B, aber A = B gilt. In der mathematischen Literatur findet man auch das Teilmengenzeichen A ⊂ B. Dies benutzen wir statt ⊆ als Hinweis auf eine echte Teilmenge. Potenzmengen: Ist A eine Menge, dann ist die Potenzmenge von A 2A := {B | B ⊆ A}. Synonym findet man auch die Notationen P(A) und P(A). Funktionen: F¨ ur f : M → N und A ⊆ M ist f (A) := {f (a) | a ∈ A}. F¨ ur B ⊆ N ist f −1 (B) := {m ∈ M | f (m) ∈ B}. F¨ ur b ∈ N ist f −1 (b) := −1 f ({b}). Zahlen: Menge N = {1, 2, . . .} der nat¨ urlichen Zahlen, N0 = {0, 1, 2, . . .}, Ring Z = {0, 1, −1, 2, −2, . . .} der ganzen Zahlen. K¨orper Q, R, C der rationalen, reellen beziehungsweise komplexen Zahlen. F¨ ur einen K¨orper K bedeutet K∗ die multiplikative Gruppe K∗ := K \ {0}, und R+ := {x ∈ R | x > 0} = (0, ∞). Intervalle: F¨ ur a, b ∈ R, a < b ist (a, b) := {x ∈ R | x > a, x < b}
, (a, b] := {x ∈ R | x > a, x ≤ b}
etc.
(Synonym findet man auch die Notation ]a, b[= (a, b), ]a, b] = (a, b] etc.) Matrizen: Mat(m × n, K) bezeichnet den K–Vektorraum der m × n–Matrizen mit Eintr¨agen aus dem K¨ orper K, und Mat(n, K) den Ring Mat(n × n, K). Sph¨ aren und Kugeln: F¨ ur d ∈ N0 ist S d := {x ∈ Rd+1 | x = 1} = ∂B d+1 , also Rand der abgeschlossenen Vollkugel Brd := {x ∈ Rd | x ≤ r} vom Radius r > 0, und B d := B1d . Wir schreiben S 1 ⊂ C f¨ ur {c ∈ C | |c| = 1}, aber auch S 1 := R/Z (mit der Identifikation [x] → exp(2πix)) f¨ ur die multiplikative bzw. additive Gruppe. Das griechische Alphabet: a) Kleinbuchstaben α β γ δ , ε
Alpha Beta Gamma Delta Epsilon
ζ η θ,ϑ ι κ
Zeta Eta Theta Jota Kappa
λ μ ν ξ o
Lambda My Ny Xi Omikron
π ρ, σ,ς τ υ
Pi Rho Sigma Tau Ypsilon
φ, ϕ χ ψ ω
Phi Chi Psi Omega
Ω
Omega
b) Großbuchstaben (soweit verschieden von den lateinischen) Γ Δ
Gamma Delta
Θ Λ
Theta Lambda
Ξ Π
Xi Pi
Σ Υ
Sigma Ypsilon
Φ Ψ
Phi Psi
xvi
Bemerkungen zur Mathematischen Physik
Kleines Englisch-W¨ orterbuch abelian absolute value acceleration accumulation point angular momentum area assertion associativity as. completeness asymptotic value average ball barycenter bifurcation billiard bound bounded box bundle cardinality cartesian product centroid chain rule circle closed complete conditionally periodic connected connection constraint continuity convergent convolution countable covering critical point critically damped cross section curvature degree derivative disjoint disk distance divergent domain empty set equilibrium equivalence class escape time expectation value fibre field fixed point flow force forced oscillation friction function golden ratio/mean graph group group action ill-posed
abelsch Betrag Beschleunigung H¨ aufungspunkt Drehimpuls Fl¨ ache Aussage Assoziativit¨ at as. Vollst¨ andigkeit Grenzwert Mittelwert Vollkugel Schwerpunkt Verzweigung Billard Schranke beschr¨ ankt W¨ urfel B¨ undel M¨ achtigkeit kartesisches Produkt Schwerpunkt Kettenregel Kreislinie abgeschlossen vollst¨ andig bedingt-periodisch zusammenh¨ angend Zusammenhang Zwangsbedingung Stetigkeit konvergent Faltung abz¨ ahlbar ¨ Uberlagerung Ruhelage; kr. Punkt Aperiodischer Grenzfall Wirkungsquerschnitt Kr¨ ummung Abbildungsgrad Ableitung disjunkt Kreisscheibe Abstand divergent Definitionsbereich leere Menge Ruhelage ¨ Aquivalenzklasse Fluchtzeit Erwartungswert Faser K¨ orper Fixpunkt Fluss Kraft erzwungene Schwingung Reibung Funktion Goldener Schnitt Graph Gruppe Gruppenwirkung schlecht gestellt
image imaginary part imgaginary unit inequality initial condition intersection interval inverse mapping limit linking number manifold map measure metric metric space mixing moment of inertia momentum monotonous neighborhood numbers - complex - integer - irrational - natural - rational - real one-to-one onto open order overdamped partition proposition power series power set primes principal bundle proper map real part relation residue class ring root scattering section semicontinuous sequence set sign solution speed stable subsequence subset theorem time delay time reversal triangle inequality underdamped union unit velocity well defined
Bild Imagin¨ arteil imagin¨ are Einheit Ungleichung Anfangsbedingung Durchschnitt Intervall Umkehrabbildung Limes Verschlingungszahl Mannigfaltigkeit Abbildung, Karte Maß Metrik metrischer Raum mischend Tr¨ agheitsmoment Impuls monoton Umgebung Zahlen - komplexe - ganze - irrationale - nat¨ urliche - rationale - reelle injektiv surjektiv offen Ordnung Kriechfall Zerlegung Satz Potenzreihe Potenzmenge Primzahlen Hauptfaserb¨ undel eigentliche Abb. Realteil Relation Restklasse Ring Wurzel Streuung Schnitt halbstetig Folge Menge Signum L¨ osung Betrag der Geschw. stabil Teilfolge Teilmenge Satz Zeitverz¨ ogerung Zeitumkehr Dreiecksungleichung Schwingfall Vereinigung Einheit Geschwindigkeit wohldefiniert
Kapitel 1
Einleitung
Newtons eigenes Exemplar der ersten Auflage seines Buches Philosophiae Naturalis Principia Mathematica, mit handschriftlichen Korrekturen f¨ ur die zweite Auflage.
Wie alles anfing Und nachdem ihm gesagt worden war, er m¨oge die Wahrheit sagen, sonst ” werde man zur Folter schreiten, Antwortete er: Ich bin hier, um Gehorsam zu leisten, und ich habe besagte Meinung nach der getroffenen Entscheidung nicht aufrechterhalten”. Gerichtsprotokoll des Heiligen Offiziums der Inquisition zum Fall Galilei (1633) 1 Gut f¨ unfzig Jahre vergingen zwischen Galileis Verurteilung und dem Erscheinen der Principia Newtons. In dieser Zeit etablierte sich die moderne Naturforschung, mit der Klassischen Mechanik als Leitwissenschaft. Wir beginnen diese 1 Zitiert
nach Sobel [Sob2], Seite 289.
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 1,
1
2
1. Einleitung
Einf¨ uhrung mit der L¨ osung der Bewegungsgleichung f¨ ur die Planeten, also der Best¨atigung und Pr¨azisierung des heliozentischen Weltbilds von Galileo Galilei. Sowohl die Untersuchung von Differentialgleichungen als auch die physikalisch begr¨ undete Himmelsmechanik gehen auf Isaac Newton (1643–1727) zur¨uck. • Der Mathematiker Newton ist (zusammen mit Leibniz) als Begr¨under der Differentialrechnung bekannt. • Der Physiker Newton gab dem Gesetz Kraft
=
Masse
×
Beschleunigung
(1.1)
seinen Namen. Diese beiden T¨atigkeitsfelder Newtons h¨angen miteinander zusammen. Ist n¨amlich • x(t) ∈ R3 der Ort eines Massenpunktes zur Zeit t ∈ R, dann sind (in 3 Newtons Schreibweise f¨ ur Zeitableitungen) x(t) ˙ = dx dt (t) ∈ R seine Ged2 x 3 schwindigkeit und x ¨(t) = dt2 (t) ∈ R seine Beschleunigung zu diesem Zeitpunkt. • Andererseits kann die Kraft F von Ort und Geschwindigkeit des Teilchens und auch direkt von der Zeit abh¨angen, sodass Gleichung (1.1) die Form F (x, x, ˙ t) = m¨ x besitzt. Dabei ist die Kraftfunktion F als bekannt vorausgesetzt. Dies ist ein Beispiel einer Differentialgleichung, denn es handelt sich um eine Gleichung, die von der gesuchten, hier vektorwertigen Funktion t → x(t) und ihren Ableitungen erf¨ ullt wird. Beispielsweise wirkt auf die Erde (mit demMittelpunkt 2 bei x, der Masse m > 0, und mit der euklidischen Norm x = x21 + x22 + x23 ) die Kraft F (x) = −mγ
x
x 3
wobei vereinfachend vorausgesetzt wird, dass die Sonne im Ursprung des Koordinatensystems ruht. Eine genauere Behandlung zeigt, dass sich das echte 2–K¨ orperproblem, bei dem Erde und Sonne sich um ihren gemeinsamen Schwerpunkt bewegen, auf das diskutierte
x ∈ R3 \{0} ,
(1.2)
Kraft Sonne Geschwindigkeit Erde Schwerpunkt
2 In Aufgabe 12.37 auf Seite 289 wird gezeigt, dass f¨ ur eine zentralsymmetrische Masseverteilung die Gravitation so wirkt, als ob die Masse im Mittelpunkt konzentriert w¨ are.
1. Einleitung
3
Zentralkraftproblem reduzieren l¨asst, wenn man statt der Erdmasse m die reduzierte Masse mM/(m + M ) einsetzt 3 . Die positive Konstante γ ist das Produkt von Gravitationskonstante und Sonnenmasse. Gleichung (1.1) besitzt hier also nach K¨ urzung durch m die Form x x ¨ = −γ x 3 .
(1.3)
Newton l¨oste diese Differentialgleichung und leitete damit die bisher nur empirisch aus den Beobachtungsdaten abgelesenen keplerschen Gesetze der Planetenbewegung aus dem mechanischen Grundgesetz (1.1) und (1.2) ab. Dies war der erste Triumph der neuen Naturwissenschaft — 1687 in seinem Hauptwerk Philosophiae naturalis principia mathematica”(kurz: Principia) [Ne] ” ver¨offentlicht. Newton war sich der Bedeutung seiner Erkenntnis bewusst, und da er außer zu Mathematik und Physik auch zum Geheimnisvollen und Mystischen neigte, verschl¨ usselte er einen lateinischen Satz in einem Anagramm4 . Der Satz lautete, frei u ¨bersetzt: Es ist n¨ utzlich, Differentialgleichungen zu l¨osen.” ”
Ableitung der keplerschen Gesetze Wir wollen Newtons Rat folgen und (1.3) l¨ osen. 1. Als erstes stellen wir fest, dass der Planet f¨ ur alle Zeiten in der durch seinen Anfangsort und seine Anfangsgeschwindigkeit aufgespannten Bahnebene 5 bleibt, denn x×x d [x × x] ˙ = x˙ × x˙ + x × x ¨ = x˙ × x˙ − γ = 0, dt
x 3
(1.4)
der auf dieser Ebene senkrechte Vektor x(t) × x(t) ˙ ∈ R3 ist also zeitlich konstant. 2. Nun ist es n¨ utzlich, den Ort x(t) in dieser Bahnebene durch eine komplexe Zahl z(t) zu beschreiben, wobei z(t) := x1 (t) + ix2 (t), falls ohne Einschr¨ankung x × x˙ in 3–Richtung weist. Damit ist in Polarkoordinaten z(t) = r(t)eiϕ(t) , also ¨ eiϕ . z˙ = (r˙ + i rϕ)e ˙ iϕ und z¨ = r¨ − rϕ˙ 2 + i(2r˙ ϕ˙ + rϕ) Nach Division durch eiϕ und Trennung von Real- und Imagin¨arteil f¨ uhrt die newtonsche Kraftgleichung z¨ = −γ |z|z 3 damit zu den beiden verkoppelten 3 Siehe
Beispiel 12.39 auf Seite 291. nach der Einleitung des Buches [Ar3] von Arnol’d. Interessante biographische Notizen zu Newton findet man in [Ar6]. 5 Falls x ˙ parallel zu x ist, erhalten wir statt einer Ebene eine Gerade. 4 Zitiert
4
1. Einleitung reellen Differentialgleichungen (I): r¨ − rϕ˙ 2 +
γ =0 , r2
(II): 2r˙ ϕ˙ + rϕ¨ = 0.
(1.5)
d (r 2 ϕ) ˙ = r(2r˙ ϕ˙ + rϕ) ¨ = 0 ist := r 2 ϕ˙ = const eine Konstante 3. Wegen dt der Bewegung. Die Multiplikation dieser Gr¨ oße mit der Masse m des Planeten ergibt definitionsgem¨aß den Drehimpuls. Dieser ist also zeitlich konstant.
4. Substitution von ϕ˙ = /r2 in (I) ergibt die Gleichung r¨ −
γ 2 + 2 = 0. r3 r
Auch hier l¨asst sich eine Konstante der Bewegung finden, denn mit 2 γ und H (r, r) − ˙ := 12 r˙ 2 + U (r) 2r 2 r 2 d ˙ = r˙ r¨ − r 3 + rγ2 = 0, H r(t), r(t) ist dt sodass H zeitlich konstant ist: H r(t), r(t) ˙ = H r(0), r(0) ˙ =: E. Physikalisch wird E m als die Gesamtenergie des Planeten interpretiert, und alle reellen Zahlen treten als Energiewerte auf. U (r) :=
5. Nun sind wir zun¨achst weniger an der L¨ osung der Differentialgleichung (1.6) r˙ = ± 2(E − U (r)), also der Zeitabh¨angigkeit des Radius interessiert, als an der Bahnform R(ϕ) := r(t(ϕ)). Wir k¨onnen zu ϕ als unabh¨angiger Variable u ¨bergehen, wenn wir voraussetzen, dass = r 2 ϕ˙ = 0 ist. Dann ergibt sich aus (1.6) ±R2 r˙ dR = = dϕ ϕ˙
2(E − U (R))
oder durch Separation der Variablen und Einsetzen von U dR = dϕ = ϕ − ϕ0 . ±R 2ER2 + 2γR − 2 Mit den Konstanten e := 1 + der linken Seite umformen:
2E2 γ2
und p := 2 /γ l¨asst sich der Integrand
p/R = . 2 2 2 2 e R − (p − R)2 R 2ER + 2γR −
1. Einleitung
5
Laut Integraltabelle ist arccos
p/R(ϕ)−1 e
R(ϕ) =
= ϕ − ϕ0 oder
p . 1 + e cos(ϕ − ϕ0 )
(1.7)
Dies ist aber die Gleichung eines Kegelschnittes, wobei die Konstante e als Exzentrizit¨at und p als Parameter des Kegelschnittes bezeichnet wird. Der Winkel ϕ − ϕ0 heißt in der astronomischen Literatur wahre Anomalie.
Ergebnisse 1. Es ergibt sich f¨ ur Energien • E < 0 : 0 ≤ e < 1 (Ellipse)
, mit dem Kreis f¨ ur e = 0
• E = 0 : e = 1 (Parabel) • E>0: e>1
(Hyperbel)
Damit haben wir das erste Keplersche Gesetz abgeleitet.
Parabel Kraft Geschwindigkeit Massenpunkt Schwerpunkt
Hyperbel Kraft
Geschwindigkeit
Massenpunkt Schwerpunkt
2. Das zweite Keplersche Gesetz besagt, dass die Verbindungsstrecke zwischen Sonne und Planet in gleichen Zeiten gleiche Fl¨achen u ¨berstreicht. ˙ denn die im Zeitintervall [t1 , t2 ] Es ergibt sich aus der Konstanz von = r 2 ϕ, u ¨berstrichene Fl¨ache ist ϕ2 t2 dϕ 2 1 1 R(ϕ) dϕ = r(t)2 (t) dt = 12 (t2 − t1 ). 2 2 dt ϕ1 t1 3. Ebenso best¨atigen wir das dritte Keplersche Gesetz, nach dem sich die Quadrate der Umlaufzeiten6 wie die dritten Potenzen der großen Halbachsen verhalten. Wir substituieren f¨ ur eine L¨ osung t → x(t) der Kraftgleichung (1.3) X(t) := cx x(t/ct ), mit positiven Parametern cx und ct . Genau f¨ ur c2t = c3x erf¨ ullt die 2 d2 X Kurve t → X(t) wieder die Kraftgleichung, denn dt2 (t) = ccx2 ddt2x (t) und X X3
x = c−2 x x3 .
t
Dies beweist das Gesetz f¨ ur gr¨ oßenskalierte Orbits gleicher Form. 6 Merkregel
f¨ ur die zu quadrierende Gr¨ oße: Times Square.
6
1. Einleitung
1.1 Aufgabe (Drittes Keplersches Gesetz) Zeigen Sie, dass die Umlaufzeit auf einer Kepler–Ellipse nur von deren großer Halbachse abh¨angt7 . Tipp: Zeigen Sie zun¨achst, dass (a) mit den Minimal- und Maximalabst¨anden rmin := R(ϕ0 ), rmax := R(ϕ0 + π) die L¨ange der großen Halbachse gleich dem arithmetischen Mittel a := 12 (rmin + rmax ), die der kleinen Halbachse gleich dem geometrischen Mittel b := (rmin rmax )1/2 ist;
b
p
a
rmax
rmin
(b) Wegen des zweiten Keplerschen Gesetzes die Umlaufzeit gleich 2πab/ ist. −1 (c) Benutzen sie dann die Beziehung 2 = γ 2 e2E zwischen Drehimpuls und Exzentrizit¨at. 3 2
Wir haben also die Differentialgleichung des Kepler–Problems gel¨ost. Ohne dass dies vielleicht klar wurde, profitierten wir von der Symmetrie des untersuchten Systems, n¨amlich der Invarianz von (1.3) unter den orthogonalen Transformationen des R3 , indem wir feststellten, dass bestimmte Gr¨ossen zeitlich konstant sind, und damit die Zahl der Variablen reduzieren konnten. Die newtonsche Gleichung mit einer Zentralkraft ist immer integrabel. In (1.2) kommen maximal zweite zeitliche Ableitungen von x vor, und entsprechend m¨ ussen als Anfangswerte zur Zeit 0 Anfangsort x(0) ∈ R3 und Anfangsgeur alle Zeiten eine schwindigkeit x(0) ˙ ∈ R3 vorgegeben werden. Dann existiert f¨ eindeutige L¨osung von (1.3) (außer f¨ ur den bei linearer Abh¨angigkeit von x(0) und x(0) ˙ auftretenden Fall der Kollision mit der Zentralmasse bei x = 0).
Das n-K¨ orper-Problem Diesem Erfolg Newtons steht aber ein Misserfolg gegen¨ uber. Verallgemeinert kann man die Bewegung von n Massenpunkten untersuchen, die sich gegenseitig anziehen. Man stelle sich zum Beispiel das Sonnensystem mit Sonne und Planeten vor. Da die Kraft auf den i–ten Himmelsk¨ orper mit Position qi ∈ R3 gleich dem Produkt aus seiner Masse mi und seiner Beschleunigung q¨i ist, ergibt sich 8 mit 7 Aus den Formeln f¨ ur die Halbachsen folgt, dass ihr Quotient b/a gleich 1 + O(e2 ) ist, w¨ ahrend der Quotient von rmin und rmax von der Exzentrizit¨ at e in der Form 1−e = 1 − 2e + 1+e
angt. Planetenbahnen mit ihren Exzentrizit¨ aten e < 14 sind also in erster N¨ aherung O(e2 ) abh¨ Kreise, wobei die Sonne um die Ordnung e aus dem Mittelpunkt verschoben ist. Die abgebildete Ellipse hat die Exzentrizit¨ at e = 12 , die Erde e = 0.017. 8 in Einheiten, in denen die Gravitationskonstante Eins ist.
1. Einleitung
7
(1.1) und (1.2) das Differentialgleichungssystem q¨i =
j=i
mj
qj − qi
qj − qi 3
(i = 1, . . . , n).
(1.8)
Daß die Planeten so viel leichter als die Sonne sind, f¨ uhrt zwar dazu, dass die N¨aherungsl¨osung des Zwei-K¨ orperproblems so pr¨azise ist. Jupiter — der schwerste Planet — ist aber immerhin knapp 1/1000 so schwer wie die Sonne. Man kann also erwarten, dass schon nach ca. 1000 Jahren seine Anwesenheit die Erdbahn merklich beeinflusst. Die L¨osung des n¨achst einfachen Problems von drei K¨ orpern w¨are f¨ ur uns also von besonderer Bedeutung. Das 3–K¨orperproblem widerstand aber in den 200 auf das Erscheinen der ,Principia’ folgenden Jahren allen L¨ osungsversuchen 9 . 1885 wurde dem franz¨ osischen Mathematiker Henri Poincar´e ein von K¨onig Oskar II. von Schweden auf die L¨ osung dieses Problems ausgesetzter Preis verliehen. Poincar´e hatte das Problem aber nicht allgemein gel¨ost, sondern Indizien daf¨ ur gefunden, dass L¨ osungsans¨atze divergieren mussten (Diacu und Holmes erz¨ahlen in [DH] die interessante Geschichte). 1.2 Bemerkung (Dreik¨ orperproblem) Tats¨achlich sind die Bahnformen schon des sogenannten restringierten Dreik¨ orperproblems (bei dem sich ein Satellit mit verschwindend kleiner Masse im Gravitationsfeld zweier um ihren Schwerpunkt kreisenden Himmelsk¨ orpern bewegt), sehr kompliziert. In der nebenstehenden numerischen L¨osung der Differentialgleichung sieht man eine Bahnform des Satelliten im mitgedrehten Koordinatensystem, in dem die Orte der beiden Himmelsk¨ orper fix sind. 3 Die Feststellung Poincar´es leitete eine neue Epoche ein, in der mehr Gewicht auf qualitative Eigenschaften von Differentialgleichungen gelegt wurde. Beispielsweise wird gefragt, ob das Sonnensystem stabil ist oder nicht, ob ohne Reibungskr¨afte Himmelsk¨orper eingefangen werden k¨ onnen etc. Beide Typen von Fragen, die nach den expliziten L¨ osungen von Differentialgleichungen und die nach ihren qualitativen Eigenschaften, werden im Buch ihren Platz haben.
Zwangsbedingungen und Reibung Ziel der Klassischen Mechanik ist es also, aus der Form der zwischen den Massenk¨orpern wirkenden Kr¨afte auf die Gestalt ihrer Bewegungen zu schließen. Eine erste Teilaufgabe besteht darin, die Bewegungsgleichung aufzustellen. 9 Siehe
Kapitel 11.3, beginnend auf Seite 238.
8
1. Einleitung
Stellen wir uns etwa die Bewegungen eines Balls vor. Zwar besteht dieser aus einer riesigen Zahl von Atomen. Insoweit deren Abst¨ande aber zeitlich konstant sind, der Ball also als ein sogenannter starrer K¨orper aufgefasst werden kann, reichen sechs Gleichungen zweiter Ordnung aus, um seine Bewegung im Raum zu beschreiben. Davon beschreiben drei die Lage seines Schwerpunktes und drei die Drehung gegen¨ uber seiner Ausgangslage 10 . Rollt der Ball auf einer Unterlage, wird durch diese Zwangsbedingung die Zahl dieser Freiheitsgrade um Eins erniedrigt. Rollt er ohne Schlupf, dann ist eine Schwerpunktbewegung nur bei gleichzeitiger Drehung m¨oglich. Eine Frage ist, ob der Ball durch geeignete Bewegungen jede vorgegebenen Punkt in seinem Konfigurationsraum erreichen kann. W¨ahrend im Fall der Bewegung der Erde um die Sonne in guter N¨aherung von Reibung abgesehen werden konnte, ist dies f¨ ur den auf der Erde rollenden Ball nicht der Fall. Hier ist die Abbremsung proportional zur Geschwindigkeit. Der Ball gibt im Lauf der Zeit durch Reibung Energie an seine Umgebung ab und kommt daher allm¨ahlich zur Ruhe. Wir werden uns zwar vorzugsweise mit hamiltonschen Systemen herumschlagen, bei denen die Energie eine zeitlich erhaltene Gr¨oße ist. Wir werden dabei sehen, dass diese eine geometrische Beschreibung zulassen, wobei diese sogenannte symplektische Geometrie des Phasenraums sich wesentlich von der gewohnteren riemannschen Geometrie unterscheidet. Trotzdem wollen wir auch, und gerade am Anfang, allgemeinere dynamische Systeme, zum Beispiel solche mit Energieverlust, betrachten. Nur so k¨onnen wir die Besonderheit der hamiltonschen Dynamik richtig erkennen.
Diskrete dynamische Systeme Ein letztes Beispiel: In der Hochenergiephysik werden Teilchen auf hohe Energien beschleunigt, um sie dann kollidieren zu lassen. Aus verschiedenen Gr¨ unden m¨ ochte man die Teilchen oft nicht sofort zur Kollision bringen. Daher werden Speicherringe verwandt, in denen die bis fast auf Lichtgeschwindigkeit beschleunigten Teilchen durch ein Magnetfeld auf eine Kreisbahn gezwungen werden (der abgebildete Speicherring steht in Melbourne). Ein konstantes Magnetfeld erzeugt eine spiralf¨ormige Bahn, wobei die Geschwindigkeitskomponente in Magnetfeldrichtung konstant ist 11 . Nach wenigen Uml¨aufen w¨ urden die geladenen Teilchen daher den Speicherring verlassen. Daher werden kompliziertere Anordnungen von Magneten benutzt. Um diese zu studieren, kann man an einer Stelle des Ringes Ort und Geschwindigkeit des Teilchens senkrecht zur Strahlrichtung messen. Wir erhalten 10 Siehe 11 Das
Kapitel 14, beginnend auf Seite 343. wird in Kapitel 6.3.3 auf Seite 113 gezeigt.
1. Einleitung
9
so eine Abbildung, die es gestattet, aus Ort qn und Geschwindigkeit vn des Teilchens beim n–ten Umlauf auf die Werte dieser Gr¨oßen beim (n + 1)–ten Umlauf zu schließen: qn+1 = f1 (qn , vn )
, vn+1 = f2 (qn , vn )
oder kurz xn+1 = F (xn )
mit
xk :=
qk vk
und F :=
f1 f2
.
Um die Abbildung F zu bestimmen, muss die Wirkung der Magnete auf die relativistischen Teilchen berechnet werden. Wo befinden sich die Teilchen am Ende der Speicherung, zum Beispiel nach ussen wir im Prinzip die obige 108 Uml¨aufen? Zur Beantwortung dieser Frage m¨ Abbildung iterieren. Wir setzen F n+1 := F ◦ F n
mit
F 0 := Id.
Ist F invertierbar, dann definieren wir analog F −n−1 := F −1 ◦ F −n . Wir erhalten also ein sozusagen stroboskopisches Modell der Bewegung. Bei diesem nimmt der Zeitparameter n Werte in den ganzen Zahlen Z an, w¨ahrend im ersten Fall t ∈ R war. Wieder kann in guter N¨aherung Energieerhaltung vorliegen oder, zum Beispiel durch Abstrahlung, Energie verloren gehen. Eine Ingenieursaufgabe besteht darin, die Magnete so auszulegen, dass Stabilit¨at vorliegt, die Teilchen also nicht den Speicherring verlassen. Es ist dabei rechnerisch ineffektiv, F tats¨achlich 108 mal zu iterieren. Denn es muss ja Stabilit¨at f¨ ur ein Kontinuum von Anfangsbedingungen gezeigt werden. Eine tiefergehende Analyse der Dynamik ist notwendig. Nehmen wir an, dass F (0) = 0 ist, also die ohne Auslenkung von Ort und Geschwindigkeit startenden Teilchen auch wieder so ankommen. Eine erste N¨aherung besteht dann in der Linearisierung von F , das heißt der Untersuchung der Matrix M := DF (0). W¨ urde diese nur komplexe Eigenwerte besitzen, deren Betrag kleiner als Eins ist, dann w¨are die Bewegung stabil. Dies ist aber bei Energieerhaltung nicht der Fall. Das Beste, was hier konstruktiv erreicht werden kann, ist marginale Stabilit¨at, bei der sich alle komplexen Eigenwerte auf dem Einheitskreis befinden. Kann dann immer noch von M auf F geschlossen werden? Dies ist mit der hamiltonschen St¨orungstheorie m¨ oglich, nach dem ber¨ uhmten Satz von Kolmour alle Zeiten. In der Tat stellt man bei gorov, Arnol’d und Moser 12 sogar f¨ Variation der Parameter von F (also der Anordnung der Magnete) fest, dass dies f¨ ur bestimmte Parameterwerte eine Verzweigung von instabilen zu stabilen Verhalten stattfindet. Die Ingenieursaufgabe ist also im Prinzip l¨osbar. 12 Die
KAM-Theorie wird in Kapitel 15.4 behandelt, beginnend auf Seite 387.
10
1. Einleitung
Verh¨ altnis zur Statistischen Mechanik und Quantenmechanik W¨ahrend der aus vielen Atomen bestehende starre K¨orper durch nur sechs verkoppelte Differentialgleichungen beschrieben werden konnte, ist dies etwa f¨ ur Gase nicht der Fall. Trotzdem werden diese in der Statistischen Mechanik sehr effektiv beschrieben. Die Basis ist aber nicht mehr deterministisch sondern wahrscheinlichkeitstheoretisch. Man geht davon aus, dass der Gleichgewichtszustand des Gases durch wenige Parameter wie Dichte und Energie beschrieben werden kann und auf der durch diese Parameter definierten Mannigfaltigkeit gleichverteilt ist. Diese erfolgreiche Annahme muss aber gerechtfertigt werden, indem die ergodischen Eigenschaften des mechanischen Systems analysiert werden. In Wirklichkeit ist die Natur nicht klassisch sondern quantenhaft. Die Newton– Gleichung der Klassischen Mechanik erscheint nur in einer Asymptotik der quantenmechanischen Schr¨ odinger–Gleichung. Trotzdem w¨ urde niemand auf die Idee kommen, etwa die mechanischen Eigenschaften eines Fahrrads quantenmechanisch zu untersuchen. Und auch bei mikroskopischen Objekten wie Atomen und Molek¨ ulen ist es oft effektiv, die Quantendynamik als St¨orung der klassischen Bewegung anzusetzen.
Kapitel 2
Dynamische Systeme
Seeschnecken (Links: Oliva porphyria, Rechts: Conus marmoreus) Jeweils Links: Fotografie, Rechts: Simulation durch ein dynamisches System. Quelle: Fowler und Prusinkiewicz in Meinhardt [FP].
2.1 Iterierte Abbildungen, dynamische Systeme . . . . . . . . 12 2.2 Stetige dynamische Systeme . . . . . . . . . . . . . . . . 16 2.3 Differenzierbare dynamische Systeme . . . . . . . . . . . 25
Dynamiken kann man unter verschiedenen Blickwinkeln und mit unterschiedlichen Zusatzstrukturen betrachten, und entsprechend gibt es auch verschiedene Definitionen dynamischer Systeme. Wir werden in diesem Kapitel zwar haupts¨achlich sogenannte topologische und differenzierbare dynamische Systeme untersuchen, beginnen aber noch etwas allgemeiner. Erst ab Kapitel 6 r¨ ucken die in der Klassischen Mechanik dominierenden hamiltonschen dynamischen Systeme ins Zentrum. Das sind L¨osungen von speziellen Differentialgleichungen erster Ordnung. Sie besitzen ein zeitinvariantes Maß, was f¨ ur einen Vektorraum als Phasenraum das Lebesgue-Maß ist. Das Kapitel 9 widmet sich solchen (nicht notwendig hamiltonschen) maßerhaltenden dynamischen Systemen. 2.1 Weiterf¨ uhrende Literatur Die Lehrb¨ ucher von Katok und Hasselblatt [KH] und von Robinson [Ro] behandeln allgemeine (nicht notwendig hamiltonA. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 2,
11
12
2.1. Iterierte Abbildungen, dynamische Systeme 26
1
0
52
17
34
11
22
7
9
2 5
5
4
6
10
11
16
8
4
7
40 9
28
3
2
13
8
14
20
10
1 3
6
12
Abbildung 2.1.1: Iterierte Abbildungen. Links: Beispiel 2.2. Rechts: Collatz–Graph aus Beispiel 2.3 sche) dynamische Systeme, und auch iterierte nicht invertierbare Abbildungen (die oft ebenfalls als dynamische Systeme bezeichnet werden). 3
2.1
Iterierte Abbildungen, dynamische Systeme
Wir m¨ ussen also den gegenw¨artigen Zustand des Weltalls als die Wirkung ” seines fr¨ uheren und als die Ursache des folgenden Zustandes betrachten. Eine Intelligenz, welche f¨ ur einen gegebenen Augenblick alle in der Natur wirkenden Kr¨afte sowie die gegenseitige Lage der sie zusammensetzenden Elemente kennte, und u ¨berdies umfassend genug w¨are, um diese gegebenen Gr¨oßen der Analysis zu unterwerfen, w¨ urde in derselben Formel die Bewegungen der gr¨oßten Himmelsk¨orper wie des leichtesten Atoms umschließen; nichts w¨ urde ihr ungewiß sein und Zukunft und Vergangenheit w¨ urden ihr offen vor Augen liegen.” Pierre-Simon Laplace (1814), [Lap], Seite 1 Gegeben sei eine Abbildung f : M → M einer Menge M in sich. Diese k¨onnen wir iterieren, indem wir die iterierte Abbildung f (0) := IdM
, f (t) := f ◦ f (t−1)
(t ∈ N)
definieren. F¨ ur jedes m ∈ M erhalten wir eine Folge a : N → M, at = f (t) (m). Wir nennen dann M Phasenraum, t Zeitparameter und m Anfangspunkt. Wir haben nicht vorausgesetzt, dass f injektiv ist. Dass verschiedene Anfangspunkte also die gleiche Zukunft haben k¨ onnen, kann man am Graphen von f ablesen. 2.2 Beispiel F¨ ur f : N0 → N0 , m → m/2 ergibt sich der in Abbildung 2.1.1 (links) durch Pfeile von m nach f (m) dargestellte gerichtete Graph. 3 Schon einfache iterierte Abbildungen k¨ onnen zu sehr schwierigen Fragen f¨ uhren. 2.3 Beispiel (Collatz–Vermutung) Auf dem Phasenraum M := N ist f definiert durch f (m) := m/2, falls m gerade und f (m) := 3m+1, falls m ungerade.
2. Dynamische Systeme
13
Zum Beispiel beginnt die Folge mit Anfangspunkt 7 mit 7, 22, 11, 34, 17, 52, 26, 13, 40, 20, 10, 5, 16, 8, 4, 2, 1, 4 . . . und wird nach Erreichen der Eins zyklisch, siehe Abbildung 2.1.1 (rechts). Die Vermutung von Lothar Collatz, dass jede Folge die 1 enth¨alt, ist seit 1937 weder bewiesen noch widerlegt worden. 3 2.4 Beispiel (Calkin-Wilf-Folge) F¨ ur die Zerlegung x = x + {x} von x ∈ R, mit x ∈ Z und {x} ∈ [0, 1) iterieren wir die Abbildung f : R+ → R+
, x →
f
1 ,
x + 1 − {x}
beginnend mit 1. Die ersten Folgenglieder sind also 1, 12 , 2, 13 , 32 , 23 , 3, 14 , 43 , 35 , 52 , 25 , 53 , 34 , .. . Diese Folge z¨ahlt die positiven rationalen Zahlen ab. Einen Beweis findet man in Calkin und Wilf [CW]. 3
3 =
2 1 1
2.5 Aufgabe (Cantor–Menge) Im Intervall I := [0, 1] befindet sich das Loch L := (1/3, 2/3). Wir iterieren die Abbildung f : R → R, x → 32 1 − 2 |x − 1/2|
3 2
2
3
x
f
1 =
so oft, bis wir das Loch erreichen. Wir betrachte also f¨ ur den Startwert x0 ∈ I die Folge (xn )n∈N , xn+1 := f (xn ). Zeigen Sie, dass die Menge C := {x0 ∈ I \ L | ∀n ∈ N : xn ∈ I \ L}
0
1 3
2 3
1
der nie in das Loch fallenden Anfangswerte die Cantorsche 1/3–Menge ist.
x 3
2.6 Bemerkung (Invertierbarkeit) Die Grundgleichungen der Natur geben keine Zeitrichtung vor. Daher spielen nicht bijektive, eine Dynamik definierende Abbildungen nur als grobe Modelle physikalischer Geschehnisse eine Rolle. Statt allgemeiner iterierter Abbildungen stehen in der Klassischen Mechanik eher dynamische Systeme im Sinn der folgenden Definition im Mittelpunkt des Interesses. Trotzdem kommen wir gelegentlich auf nicht injektive iterierte Abbildungen zur¨ uck (so die logistische Familie aus Beispiel 2.26). Denn diese k¨onnen schon in Dimension Eins komplizierte Dynamiken aufweisen und eignen sich daher besonders zur Veranschaulichung. 3 2.7 Definition F¨ ur die Gruppen G := (Z, +) beziehungsweise G := (R, +) heißt eine Familie von Abbildungen Φt : M → M (t ∈ G) auf einer Menge M dynamisches System, wenn gilt: Φ0 = IdM
und Φt2 ◦ Φt1 = Φt1 +t2
(t1 , t2 ∈ G).
(2.1.1)
14
2.1. Iterierte Abbildungen, dynamische Systeme
M heißt dann Phasenraum. F¨ ur G = Z heißt das dynamische System diskret, f¨ ur G = R kontinuierlich oder Fluss auf M . 2.8 Beispiel (Diskretes dynamisches System) (Φt )t∈Z ist genau dann ein dynamisches System, wenn f := Φ1 : M → M 3 bijektiv ist mit Φt = f (t) und Φ−t = (f −1 )(t) (t ∈ N0 ). 2.9 Bemerkungen 1. Der Phasenraumpunkt Φ(t, m) gibt den Zustand des dynamischen Systems (also z.B. die Orte und Geschwindigkeiten der betrachteten Himmelsk¨ orper) zur Zeit t an, wenn zur Zeit 0 der Zustand m war. 2. Die Forderung Φ0 (m) = m ist nur billig und stellt sicher, dass die Abbildungen Φt bijektiv sind. ur Die Forderung Φt2 ◦ Φt1 = Φt1 +t2 der Invarianz unter Zeittranslationen ist f¨ G = R erf¨ ullt, wenn Φ die L¨ osung eines autonomen Differentialgleichungssystems ist. Um beispielsweise die Position und Geschwindigkeit der Erde in zehn Monaten zu berechnen, k¨ onnen wir zun¨achst ihren Zustand in sieben Monaten bestimmen, um danach diesen Zeitpunkt als neuen Zeitnullpunkt zu w¨ahlen und den Zustand in drei Monaten zu berechnen. F¨ ur L¨osungen Φ explizit zeitabh¨angiger Differentialgleichungen ist diese Forderung aber nicht erf¨ ullt. Nehmen wir etwa an, dass in acht Monaten ein schneller Komet die Erde ablenkt und sei Φ(t, m) der Zustand der Erde zum Zeitpunkt t. Dann erf¨ ullt diese Abbildung Φ die obige Bedingung nicht. Erst nach Einbeziehung der Kometendynamik durch Vergr¨oßerung des Phasenraums um dessen Ort und Geschwindigkeit erhalten wir wieder ein autonomes Differentialgleichungssystem und als L¨ osung ein dynamisches System. 3 2.10 Definition F¨ ur ein dynamisches System (Φt )t∈G auf dem Phasenraum M und m ∈ M heißt • die Abbildung G → M, t → Φt (m) die Bahnkurve durch m. • ihr Bild O(m) := {Φt (m) | t ∈ G} der Orbit oder die Trajektorie durch m, • m heißt Ruhelage oder Fixpunkt, wenn O(m) = {m}. • m ∈ M heißt periodisch (oder geschlossen) mit Periode T ∈ G, wenn T > 0 und ΦT (m) = m. T heißt dabei Minimalperiode, wenn f¨ ur alle t ∈ (0, T ) gilt: Φt (m) = m. Analoge Definitionen ergeben sich f¨ ur nicht invertierbare iterierte Abbildungen, wenn man von der Gruppe Z zu N0 u ¨bergeht. 2.11 Beispiel (Matrixpotenzen als dynamische Systeme) F¨ ur eine invertierbare positive Matrix A ∈ Mat(n, R) und M := Rn ist
t Φ : Z × M → M , Φ(t, x) := At x mit At = λ∈spek(A) λ Pλ
f¨ ur die Spektraldarstellung A = λ∈spek(A) λPλ von A ein dynamisches System. Falls 1 ∈ spek(A), also kein Eigenwert ist, ist x = 0 die einzige Ruhelage. 3
2. Dynamische Systeme
15
2.12 Aufgaben (Periode) 1. Auf dem Phasenraum S 1 = {c ∈ C | |c| = 1} sei f¨ ur einen Parameter α ∈ R die Drehung um Vielfache von 2πα gegeben durch Φt : S 1 → S 1 , Φt (m) := exp(2πitα) m
(t ∈ Z),
(2.1.2)
siehe Abbildung. Zeigen Sie: (a) Die Abbildungen (2.1.2) bilden ein dynamisches System. (b) F¨ ur rationale Parameterwerte α ∈ Q, also α = pq , q ∈ Z, p ∈ N, q und p teilerfremd, ist jeder Phasenraumpunkt periodisch, mit Minimalperiode p. (c) F¨ ur irrationale α ∈ R \ Q ist kein Phasenraumpunkt periodisch.
Φ1 (m)
S1 m
Φ2 (m) Φ3 (m)
2. Die Abbildung C → C, z → z m mit m ∈ N \ {1} induziert durch Einschr¨ankung auf |z| = 1 eine (nicht invertierbare) Abbildung fm : S 1 → S 1 der Kreislinie auf sich. Berechnen Sie f¨ ur n ∈ N die Anzahl Pn (fm ) der periodischen Punkte von fm mit Periode n (wobei n nicht die Minimalperiode zu sein braucht) und zeigen 3 Sie, dass die Menge der periodischen Punkte von fm dicht in S 1 liegt. 2.13 Satz (Orbiten dynamischer Systeme) 1. Die Relation m1 ∼ m2 , falls m2 ∈ O(m1 ) der Zugeh¨origkeit zum gleichen ¨ Orbit ist eine Aquivalenzrelation auf M . 2. Ist m periodisch mit Periode T , dann gilt dies auch f¨ ur alle Punkte des Orbits O(m) (wir sprechen dann von einem periodischen Orbit). 3. Besitzt der Orbit O die Minimalperiode T > 0, dann ist diese eindeutig, und die Perioden von O bilden die Menge T N = {T n | n ∈ N}. Beweis: ur alle m ∈ M ). 1. • Wegen Φ0 = IdM ist die Relation ∼ reflexiv (d.h. m ∼ m f¨ • Ist m2 = Φt (m1 ), dann gilt Φ−t (m2 ) = Φ−t ◦ Φt (m1 ) = Φt−t (m1 ) = m1 , die Relation also symmetrisch. • Mit m2 = Φt1 (m1 ) und m3 = Φt2 (m2 ) ist m3 = Φt1 +t2 (m1 ), ∼ also transitiv. 2. Ist m = Φt (m), dann ist ΦT (m ) = ΦT +t (m) = Φt ◦ΦT (m) = Φt (m) = m , also T auch Periode von m .
16
2.2. Stetige dynamische Systeme
3. Ist S > 0 ebenfalls Minimalperiode von O, dann gilt T ∈ (0, S), also T ≥ S und umgekehrt S ≥ T . Letzteres gilt f¨ ur alle Perioden S. W¨are S ∈ T N, dann g¨abe es eine eindeutige Darstellung S = nT +r mit n ∈ N und r ∈ (0, T ). Damit w¨are auch r Periode von m ∈ O: Φr (m) = ΦS−nT (m) = ΦS ◦ Φ−nT (m) = ΦS (m) = m, was einen Widerspruch zur Minimalit¨at von T ergeben w¨ urde.
2
F¨ ur die Gruppe G = Z von Zeiten haben die Ruhelagen eine Minimalperiode, n¨amlich 1, f¨ ur G = R haben sie keine. 2.14 Definition Eine Teilmenge N ⊆ M des Phasenraums M heißt • vorw¨ artsinvariant, wenn f¨ ur alle t ∈ G, t ≥ 0 gilt: Φt (N ) ⊆ N . • invariant, wenn f¨ ur alle t ∈ G gilt: Φt (N ) ⊆ N . Invariante Teilmengen N haben die Eigenschaft Φt (N ) = N f¨ ur alle t ∈ G, denn aus Φ−t (N ) ⊆ N folgt N = Φt Φ−t (N ) ⊆ Φt (N ). Wir nennen eine nicht leere invariante Teilmenge N von M (mengentheoretisch) minimal, wenn sie nicht ihrerseits eine echte solche Teilmenge besitzt. Die minimalen Teilmengen sind also gerade die Orbits. Wir haben also ein dynamisches System (Φt )t∈G verstanden, wenn wir dessen Orbits und die Restriktionen von Φt : M → M auf diese Orbits kennen. 2.15 Aufgabe (Minimalperiode eines dynamischen Systems) Wir nennen T > 0 Periode des dynamischen Systems, wenn ΦT = IdM gilt. Zeigen Sie, dass ein diskretes dynamisches System Φ : Z × M → M auf einer endlichen Menge M = ∅ als Minimalperiode das kleinste gemeinsame Vielfache der Minimalperioden seiner Orbits besitzt. 3
2.2
Stetige dynamische Systeme
Die Zahl der Fragen an ein dynamisches System erh¨oht sich enorm, wenn wir eine Topologie zur Verf¨ ugung haben (siehe Anhang A.1), also zum Beispiel von Grenzwerten sprechen k¨ onnen. 2.16 Definition Ein dynamisches System (Φt )t∈G auf dem Phasenraum M heißt stetiges oder topologisches dynamisches System, wenn M ein topologischer Hausdorff–Raum ist und Φ:G×M →M
,
Φ(t, m) := Φt (m)
stetig 1 ist. 1 Dabei wird (R, +) beziehungsweise (Z, +) als topologische Gruppe (Definition E.16) aufgefasst und die Produkttopologie (Anhang A.1) auf G × M benutzt.
2. Dynamische Systeme
17
2.17 Bemerkungen (Topologische dynamische Systeme) 1. Da Z als topologischer Raum diskret ist, also jede Teilmenge offen ist, ist die Stetigkeit von Φ f¨ ur G = Z gleichbedeutend mit der Stetigkeit der Φt (t ∈ Z). Dies wiederum ist ¨aquivalent dazu, dass Φ1 : M → M ein Hom¨oomorphismus (siehe Definition A.17) ist. Umgekehrt erzeugt jeder Hom¨oomorphismus f : M → M durch Iteration ein stetiges dynamisches System. 2. In fast allen Anwendungen ist der Phasenraum eines dynamischen Systems in nat¨ urlicher Weise ein Hausdorff–Raum. Ob aber die Dynamik stetig ist, muss von Fall zu Fall entschieden werden. Dies ist zum Beispiel bei Billards oder bei St¨oßen von Punktmassen nicht immer der Fall. 3. Verzichtet man auf die Topologie, also auch auf die Forderung der Stetigkeit von Φ, dann verliert man aber die Kontrolle dar¨ uber, dass f¨ ur endliche Zeit t die Φ(t, m ) nahe bei Φ(t, m) bleibt, wenn die Anfangspunkte m, m ∈ M nahe beieinander liegen. Dies ist aber von praktischem Interesse, denn m kann im Experiment nur mit endlicher Genauigkeit gemessen werden. 4. In allen einleitenden Beispielen ist M der Raum der Orte q und Geschwindigkeiten v der betrachteten Massenk¨ orper. Etwa im Fall der Erde im dreidimensionalen Raum ist also M der topologische Raum R3 × R3 und m = (q, v). Der Wert Φ(t, m) gibt den Zustand (also hier Ort und Geschwindigkeit) des K¨orpers nach der Zeit t an, wenn er sich zur Zeit 0 im Zustand m befand. Wir m¨ochten aber auch zum Beispiel die Bewegung einer Perle auf einem kreisf¨ormigen Draht betrachten. Dort ist ihr Ort durch einen Punkt auf dem Kreis S 1 := {x ∈ R2 | x = 1} gegeben und der Phasenraum ist die ur die Geschwindigkeit der Kreisbewegung). Mannigfaltigkeit M := S 1 ×R (R f¨ Im Anhang A.2 wird der Begriff der Mannigfaltigkeit eingef¨ uhrt. 5. Es kommen auch Phasenr¨aume vor, die keine Mannigfaltigkeiten sind. Beispielsweise definiert die quantenmechanische Schr¨odinger–Gleichung dΦt = −i H Φt dt
, Φ0 = 1lH
eines selbstadjungierten Operators H = H ∗ : H → H eine unit¨are Zeitentwicklung Φt = exp(−iHt) (t ∈ R) auf dem C-Hilbert–Raum (H, ·, ·). Letzterer ist als normierter Vektorraum ein topologischer Raum, und die Abbildung Φ : R × H → H , Φ(t, ψ) = Φt (ψ) ur dim(H) < ∞ der Phasenraum eine (endlichist stetig 2 . Allerdings ist nur f¨ dimensionale) Mannigfaltigkeit im Sinn der Definition A.25. 2 Im Fall der in der Quantenmechanik ublichen unbeschr¨ ankten selbstadjungierten Opera¨ toren H ist der Fluss Φ zwar nicht mehr bez¨ uglich der Normtopologie, aber der sogenannten starken Topologie auf H stetig.
18
2.2. Stetige dynamische Systeme
6. Teil unserer Aufgabe wird es sein, Φ zu bestimmen, f¨ ur die Gruppe G = R durch Integration gew¨ ohnlicher Differentialgleichungen und f¨ ur G = Z durch Iteration einer Abbildung. Die Abbildungen Φ werden dabei nicht nur stetig, sondern beliebig oft differenzierbar (,glatt’) sein, falls entsprechendes f¨ ur die Differentialgleichung beziehungsweise f¨ ur die zu iterierende Abbildung gilt. 7. L¨asst man in Definition 2.16 beliebige topologische Gruppen3 (G, ◦) zu (und fordert verallgemeinert Φt2 ◦ Φt1 = Φt2 ◦t1 ), dann kommt man zum Begriff der (topologischen) Gruppenwirkung, genauer Linkswirkung oder -operation, im Gegensatz zur Rechtswirkung mit Φt2 ◦ Φt1 = Φt1 ◦t2 . Solche Gruppenwirkungen k¨onnen z.B. als Symmetrien eines dynamischen Systems auftreten. Der Spezialfall dynamischer Systeme ist zwar insofern einfacher, weil die topologischen Gruppen R und Z abelsch sind. Allerdings sind sie nicht kompakt, was die Analyse erschwert. 3 2.18 Beispiele (Topologische dynamische Systeme) 1. Ein einfaches Beispiel ist die freie Bewegung eines Himmelsk¨ orpers im Vakuum. Der Phasenraum ist wieder M := R3q × R3v . Da nach Voraussetzung am K¨orper keine d2 Kr¨afte angreifen, ist seine Beschleunigung dt 2 q = 0. Damit ist die Geschwind q des Ortes nach der Zeit, zeitlich konstant: digkeit, also die Ableitung v = dt d osung dt v = 0, und wir haben die in Anfangswert m und Zeit t stetige L¨ Φ(t, m) = (q + v t, v) t ∈ R, m = (q, v) ∈ M . 2. Das einleitende Beispiel des himmelsmechanischen Zweik¨orperproblems liefert dagegen im strengen Sinn noch nicht einmal ein dynamisches System im Sinn von Definition 2.7, denn die beiden Himmelsk¨orper k¨onnen in endlicher Zeit kollidieren. Restringiert man aber den Phasenraum durch die (flussinvariante) Bedingung q × v = 0 nicht verschwindenden Drehimpulses, dann erh¨alt man ein stetiges dynamisches System. 3. F¨ ur eine endliche Menge A = ∅ ist auf dem Folgenraum M := AZ = {a : Z → A} = {(ak )k∈Z | ak ∈ A} durch Φt : M → M
,
Φt (a) k := ak+t
(t ∈ Z)
(2.2.1)
eine diskrete Dynamik definiert. Versieht man das sogenannte Alphabet A mit der diskreten Topologie und den Folgenraum oder Shiftraum M mit der Produkttopologie, dann ist M ein topologischer Raum und der Shift Φ ein stetiges dynamisches System. Nach dem Satz von Tychonoff (Satz A.19) ist dabei der Phasenraum X kompakt. Obwohl sein Phasenraum (f¨ ur |A| > 1) keine Mannigfaltigkeit bildet, kann es, wie wir sehen werden, auch f¨ ur die Analyse physikalisch relevanter chaotischer dynamischer Systeme benutzt werden. 3 3 siehe
Anhang E.1 und E.2.
2. Dynamische Systeme
19
2.19 Aufgabe (Shift) Es sei wie in Beispiel 2.18.3 A ein Alphabet, M := AZ . ¨ (a) Uberpr¨ ufen Sie, dass d : M × M → [0, ∞), gegeben durch 2−|j| dA (xj , yj ) x = (xj )j∈Z , y = (yj )j∈Z ∈ M , d(x, y) := j∈Z
mit dA (a, b) := 0 falls a = b, sonst dA (a, b) := 1, eine Metrik auf M definiert. Zeigen Sie, dass der Shift Φ stetig ist. (b) Wie viele periodische Punkte m ∈ M und wie viele periodische Orbits der Periode n ∈ {2, 3, 4} hat Φ aus (2.2.1) f¨ ur das Alphabet A := {0, 1}? Geben Sie alle Punkte der Minimalperiode n f¨ ur n ∈ {2, 3, 4} an. (c) Zeigen Sie, dass ein x ∈ M mit in M dichtem Orbit existiert, das heißt, es gilt {Φt (x) | t ∈ Z} = M . Bemerkung: Damit ist das stetige dynamische System Φ : Z × M → M topologisch transitiv, das heißt f¨ ur offene, nicht leere A, B ⊆ M gibt es ein t ∈ Z mit Φt (A) ∩ B = ∅. 3 Das Langzeitverhalten eines Punktes im Phasenraum M wird (zumindest f¨ ur kompakte M ) durch seine Limesmengen beschrieben: 2.20 Definition F¨ ur ein stetiges dynamisches System Φ : G × M → M und x ∈ M heißen
α(x) := y ∈ M ∃(tn )n∈N mit lim tn = −∞ und lim Φ(tn , x) = y , n→∞
n→∞
ω(x) := y ∈ M ∃(tn )n∈N mit lim tn = +∞ und lim Φ(tn , x) = y n→∞
n→∞
α–Limesmenge von x beziehungsweise ω–Limesmenge von x. Diese Mengen sind einerseits Invarianten des Orbits O(x) (das heißt α(y) = α(x) und ω(y) = ω(x) f¨ ur y ∈ O(x)), andererseits selbst invariant. Man ist aber nicht nur an den einzelnen Orbits interessiert, sondern auch am Verhalten benachbarter Orbits. Zum Beispiel ist es beruhigend, dass auch bei einer kleinen Ver¨anderung der Geschwindigkeit der Erde, etwa durch Meteoriteneinschlag, ihre neue Bahn auf Dauer in der N¨ahe der alten bleibt. Zun¨achst untersuchen wir die Stabilit¨at von Fixpunkten, sp¨ater von periodischen Orbits. 2.21 Definition (Stabilit¨ at) Sei m0 ∈ M ein Fixpunkt des stetigen dynamischen Systems Φ : G × M → M . ur jede Umgebung U ⊆ M von m0 eine 1. m0 heißt liapunov–stabil, wenn f¨ (kleinere) Umgebung V von m0 existiert, so dass f¨ ur alle t ≥ 0 Φt (V ) ≡ {Φt (m) | m ∈ V } ⊆ U.
20
2.2. Stetige dynamische Systeme 2. Andernfalls heißt m0 instabil. 3. m0 heißt asymptotisch stabil, falls m0 liapunov–stabil ist und eine vorw¨artsinvariante Umgebung V ⊆ M von m0 existiert mit lim Φt (m) = m0
t→∞
(m ∈ V ).
2.22 Aufgabe (Stabilit¨ at) Auf dem Phasenraum M := C seien f¨ ur den Parameter λ ∈ C \ {0} die Abbildungen Φt : M → M , Φt (m) := λt m (t ∈ Z) gegeben. Zeigen Sie: (a) Diese bilden ein stetiges dynamisches System, und 0 ∈ M ist ein Fixpunkt. (b) Dieser Fixpunkt ist genau dann liapunov–stabil, wenn |λ| ≤ 1. (c) Der Fixpunkt ist genau dann asymptotisch stabil, wenn |λ| < 1.
3
2.23 Definition • Eine kompakte invariante Teilmenge A ⊆ M heißt Attraktor des stetigen dynamischen Systems Φ : G×M → M , wenn eine offene Umgebung U0 ⊆ M von A existiert mit 1. U0 ist vorw¨arts invariant. 2. F¨ ur jede offene Umgebung V von A, A ⊆ V ⊆ U0 gibt es ein τ > 0 mit Φt (U0 ) ⊆ V f¨ ur alle t ≥ τ . • Das Bassin eines Attraktors A ist die Vereinigung aller offenen Umgebungen von A, die 1. und 2. erf¨ ullen. Damit ist das Bassin B selbst eine offene Umgebung von A, die die Eigenschaft 1. besitzt. Wie das n¨achste Beispiel zeigt, ist aber die Eigenschaft 2. f¨ ur B im Allgemeinen nicht erf¨ ullt. 2.24 Beispiel (Attraktor) Auf dem Phasenraum C ist ein stetiges dynamisches System Φ : Z × C → C mit Parameter λ ∈ R gegeben C durch Iteration des Hom¨ oomorphismus Φ1 (m) iλ m e √ , m = 0 |m| Φ1 (m) := m 0 , m = 0, siehe Abbildung. Hier ist A := S 1 ⊂ C Φ2 (m) ein Attraktor, und sein Bassin ist C \ {0}. Denn Φt : C → C bildet Kreise vom Radius Φ3 (m) −t r > 0 auf solche vom Radius r(2 ) ab, die (abgeschlossene) Kreislinie S 1 ist also invariant, und die Bilder der offenen Kreisringe U (r1 , r2 ) := {c ∈ C | |c| ∈ (r1 , r2 )} ⊂ C \ {0}
2. Dynamische Systeme
21
Sinn gegen A: konvergieren f¨ ur 0 < r1 < 1 < r2 im folgenden F¨ ur alle c > 1 existiert ein τ ∈ N mit Φt U (r1 , r2 ) ⊆ U (1/c, c) falls t ≥ τ . Wegen Kompaktheit von A enth¨alt aber jede offene Umgebung V von A ein U (1/c, c). Das Bassin von A kann den Fixpunkt 0 ∈ C nicht enthalten, enth¨alt aber die Mengen U (r1 , r2 ), ist also gleich C \ {0}. Der Parameter λ beschreibt die Drehung um den Ursprung. Sein Wert ist wesentlich f¨ ur die Frage, welche Teilmengen von A ebenfalls Attraktoren sind. 3 2.25 Aufgaben (Attraktor) 1. Finden Sie zum dynamischen System aus Beispiel 2.24 alle Fixpunkte und zwei weitere Attraktoren mit Bassin. 2. Es sei Φ : G × M → M ein stetiges dynamisches System. (a) Ist die Vereinigung zweier Attraktoren wieder ein Attraktor? (b) Zeigen Sie A = t≥0 Φt (U0 ) f¨ ur einen Attraktor A ⊆ M und eine zugeh¨orige offene Menge U0 aus der Definition 2.23 eines Attraktors. 3 2.26 Beispiel (Logistische Familie) F¨ ur Parameterwerte p ∈ [0, 4] betrachten wir die (nicht invertierbare) logistische Abbildung auf M := [0, 1] fp : M → M
, fp (x) := p x (1 − x).
(2.2.2)
ur jeden Parameterwert p auf sich abgebildet, • Der Punkt 0 ∈ M wird von fp f¨ ist also Fixpunkt. • Ist nun der Parameter p ≤ 1, dann ist f¨ ur x > 0 immer fp (x) < x, sodass f¨ ur (t) alle Startwerte m ∈ M folgt: limt→∞ fp (m) = 0. • Dar¨ uber hinaus gibt es f¨ ur Parameterwerte p ∈ (1, 4] einen zweiten Fixpunkt von fp in f , Id p M , n¨amlich yp := p−1 p , siehe nebenstehen- 1 de Abbildung. • F¨ ur p ∈ (1, 3] gilt f¨ ur alle Folgen mit Anfangspunkt m ∈ (0, 1), dass (t) ur limt→∞ fp (m) = yp . Dies sieht man f¨ p ∈ (1, 2] so: Da fp das rechte Intervall [1/2, 1) in das linke Intervall (0, 1/2] ab- 13 bildet, brauchen wir nur Anfangswerte x ∈ (0, 1/2] zu betrachten. F¨ ur x ∈ (0, yp ) gilt: fp (x) ∈ (x, yp ), f¨ ur x ∈ (yp , 1/2] gilt: fp (x) ∈ (yp , x). Der allgemeine Fall soll in Aufgabe 2.27 bearbeitet werden.
p1.5
p1 p 1 3
1 2
1
x
22
2.2. Stetige dynamische Systeme
• F¨ ur Werte p ∈ (3, 4] besitzt die zweifach iterierte Abbildung fp ◦ fp vier Fixpunkte. Diese sind in nebenstehender Abbildung als die Schnittpunkte zwischen der Diagonale und dem Graphen von fp ◦ fp sichtbar. Zwei dieser Fixpunkte sind die schon diskutierten Fixpunkte von fp . Die beiden ande(1) (2) ren, nennen wir sie yp und yp , werden durch die logistische Abbildung aufeinander (1) (2) abgebildet, das heißt fp yp = yp und (2) (1) = yp . fp yp
p3.5 f p f p , Id
1
1 2
0
fp
y1 p
y p y2 p 1 2
1
x
Wegen des Satzes von Bolzano–Weierstraß wissen wir, dass die Folgen t → (t) fp (m) immer einen H¨aufungspunkt besitzen. Wir interessieren uns f¨ ur Menge ihrer H¨aufungs- Häufungspunkte 1 punkte, in Abh¨angigkeit vom Parameter p und vom Startwert m. Wegen fp (0) = 0 exi1 2 stiert f¨ ur m = 0 nur der H¨aufungspunkt 0. F¨ ur typische Startwerte m ergibt sich in Abh¨angigkeit von p p 0 eine komplizierte Struktur 1 2 3 4 der H¨aufungspunkte, siehe nebenstehende Abbildung (mit Startwert m = 0.01). Nebenbei: Die iterierte ¨ logistische Abbildung dient in der Physik als einfaches Modell f¨ ur den Ubergang von laminarer zu turbulenter Str¨ omung von Fl¨ ussigkeiten, wobei große Werte von p dem turbulenten Regime zugeordnet werden, siehe Feigenbaum [Fei]. 3 (n)
2.27 Aufgaben (Logistische Familie) 1. Wir betrachten die n-te Iterierte f4 der logistischen Abbildung (2.2.2). (n) Zeigen Sie, dass f4 genau 2n Fixpunkte in [0, 1] hat, indem Sie die Mono(n) tonieintervalle von f4 untersuchen. 2. Zeigen Sie, dass die logistische Abbildung (2.2.2) f¨ ur Parameterwerte p ∈ (n) (1, 3) den Fixpunkt yp = (p − 1)/p besitzt und dass limn→∞ fp (x) = yp f¨ ur alle x ∈ (0, 1). 3 Tipp: Welche Werte nimmt fp (yp ) im Intervall 1 ≤ p ≤ 3 an? Wir wollen nun stetige dynamische Systeme miteinander vergleichen. 2.28 Definition F¨ ur zwei stetige dynamische Systeme Φ(i) : G × M (i) → M (i) (i = 1, 2)
2. Dynamische Systeme
23
• heißt Φ(2) (topologischer) Faktor von Φ(1) , und Φ(2) zu Φ(1) semikonjugiert, (2) (1) wenn es eine stetige Surjektion h : M (1) → M (2) gibt mit Φt ◦ h = h ◦ Φt f¨ ur alle t ∈ G, das heißt wenn das folgende Diagramm kommutiert: (1)
Φ
M (1) −−−t−→ M (1) ⏐ ⏐ ⏐ ⏐ h h
(2.2.3)
(2)
Φ
M (2) −−−t−→ M (2) • heißt Φ(2) konjugiert zu Φ(1) , wenn Φ(2) sogar f¨ ur einen Hom¨oomorphismus h : M (1) → M (2) Faktor von Φ(1) ist. h heißt dann Konjugation. 2.29 Bemerkungen (Konjugation) 1. Da die Inversen (und die Komposition) von Hom¨oomorphismen wieder Hom¨ oomorphismen sind, ist die Definition der Konjugation unabh¨angig von der Nummerierung der beiden dynamischen Systeme, und wir erhalten eine Einteilung in Klassen zueinander konjugierter stetiger dynamischer Systeme. 2. Wenn zwei stetige dynamische Systeme u ¨berhaupt konjugiert sind, gibt es im Allgemeinen viele Konjugationen. Denn mit h aus (2.2.3) sind zum Beispiel (1) (1) auch hs := h ◦ Φs , s ∈ G Konjugationen, die aber f¨ ur Φs = IdM (1) von h verschieden sind. 3. Im Beweis des Satzes 2.31 u ¨ber Kreisrotationen wird eine Semikonjugation als Beweistechnik benutzt werden. 3 Da die in diesem Kapitel definierten Begriffe rein topologischer Natur sind, gelten sie gleichermaßen f¨ ur konjugierte Systeme. Insbesondere gilt: 2.30 Aufgabe (Konjugation) Es sei h : M (1) → M (2) eine Konjugation der stetigen dynamischen Systeme Φ(i) : G × M (i) → M (i) . Beweisen Sie: (a) x1 ∈ M (1) ist genau dann Ruhelage von Φ(1) , wenn x2 := h(x1 ) ∈ M (2) Ruhelage von Φ(2) ist. Konjugierte Ruhelagen unterscheiden sich nicht hinsichtlich ihrer Liapunov–Stabilit¨at oder asymptotischen Stabilit¨at. (b) Der Φ(1) –Orbit O(x1 ) durch x1 ∈ M (1) ist genau dann geschlossen, wenn der Φ(2) –Orbit O(x2 ) durch x2 := h(x1 ) ∈ M (2) geschlossen ist. Dann sind auch die Perioden gleich. (c) Das Bild der ω–Limes–Menge ω(x1 ) von x1 ∈ M (1) ist gleich h ω(x1 ) = ω h(x1 ) .
3
Um zu zeigen, dass zwei stetige dynamische Systeme nicht konjugiert sind, gen¨ ugt es, eine Konjugationsinvariante zu benutzen. Zum Beispiel sind nach
24
2.2. Stetige dynamische Systeme
Aufgabe 2.30.b) die Systeme nicht konjugiert, wenn im ersten System ein periodischer Orbit einer bestimmten Periode existiert, aber nicht im zweiten. Im Beweis des folgenden Satzes ist die sogenannte Rotationszahl (fast) eine solche Invariante. Als Beispiel untersuchen wir n¨amlich, wann die Kreisrotationen aus Aufgabe 2.12.1 konjugiert sind. F¨ ur diese stetigen dynamischen Systeme Φ(γ) : Z × S 1 → S 1
,
Φ(γ) (t, m) = exp(2πiγt) m
(γ ∈ R)
ist genau dann sogar Φ(α) = Φ(β) , falls α − β ∈ Z ist. Wir nehmen also ohne Einschr¨ankung γ ∈ [0, 1) an. 2.31 Satz (Kreisrotationen) Zwei solche Kreisrotationen Φ(α) und Φ(β) sind genau dann konjugiert, wenn α = β oder α = 1 − β gilt. Beweis: • F¨ ur α = β ist IdS 1 eine Konjugation, f¨ ur α = 1 − β die Abbildung S 1 → S 1 , z → z. (β) (α) • Gilt dagegen Φt = h ◦ Φt ◦ h−1 (t ∈ Z) f¨ ur einen Hom¨oomorphismus h : S 1 → S 1 , dann liften wir diese dynamischen Systeme auf den Phasenraum R. Darunter ist Folgendes zu verstehen: Die Abbildung π : R → S1
,
x → exp(2πix)
ist stetig und wickelt anschaulich die Zahlengerade auf der Kreislinie auf. π ist ein Gruppenhomomorphismus von (R, +) auf (S 1 , ·), denn wegen der Funktionalgleichung von exp ist π(x + y) = π(x)π(y). • Wir nennen ein stetiges dynamisches System ˜ (γ) : Z × R → R Φ ˜ t(γ) = Φt(γ) ◦ π π–Lift der Kreisrotation Φ(γ) : Z × S 1 → S 1 , wenn π ◦ Φ gilt, also ˜ (γ) (x) = exp 2πi(x + α) exp 2πiΦ (x ∈ R),
(t ∈ Z)
1
˜ (γ) (x) = x + α − nγ f¨ ˜ (γ) das heißt Φ ur ein nγ ∈ Z (wegen der Stetigkeit von Φ 1 h¨angt nγ nicht von x ab). ˜ : R → R einen π–Lift der Konjuga¨ • Ahnlich nennen wir eine stetige Abbildung h 1 1 ˜ ˜ tion h : S → S , wenn gilt: π ◦ h = h ◦ π, also exp 2πih(x) = h exp(2πix) . ˜ + 1) = h(x) ˜ ˜ streng monoton ist, Damit muss h(x + n f¨ ur ein n ∈ Z gelten. Da h ˜ ˜ folgt n = 0. Da andererseits kein y ∈ (x, x + 1) existiert mit h(y) − h(x) ∈ Z, kommen f¨ ur n nur n = −1 und n = 1 in Frage. ˜ (γ) ist definiert als • Die Rotationszahl des π–Lifts Φ ˜ (γ) (t, x) Φ t→∞ t
R(γ) := lim
(2.2.4)
2. Dynamische Systeme
25
und in der Tat unabh¨angig vom Startpunkt x ∈ R, n¨amlich R(γ) = γ − nγ . ur zu Φ(α) konjugierte dynamische Systeme Sinnvollerweise w¨ahlen wir nγ := 0. F¨ (β) ˜ Φ kommt also, je nachdem ob h streng monoton steigend oder fallend ist, nur ˜ −1 (x) α + Z , h ˜ ◦ Φ(α) ◦ h ˜ steigend h t R(β) = lim ∈ ˜ fallend. t→∞ −α + Z , h t in Frage. Das zeigt, dass nur β = α und β = 1 − α L¨osungen sein k¨onnen.
2
Die meisten Kreisrotationen unterscheiden sich also topologisch voneinander. Andererseits kann man auch f¨ ur andere Diffeomorphismen (siehe Def. 2.36) f : S 1 → S 1 der Kreislinie als die Rotationen die Rotationszahl R(f ) der iterierten Abbildung analog zu (2.2.4) definieren, und es gilt folgender erstaunliche Satz (siehe Herman [Her]): 2.32 Satz (Denjoy) Ist f¨ ur den Diffeomorphismus f ∈ C 2 (S 1 , S 1 ) die Rotationszahl R(f ) irrational, dann ist das von f definierte dynamische System zur Kreisrotation Φ(R(f )) konjugiert.
2.3
Differenzierbare dynamische Systeme
Um Techniken der Analysis auf stetige dynamische Systeme anzuwenden, ist es nat¨ urlich anzunehmen, dass deren Phasenraum eine differenzierbare Mannigfaltigkeit ist. Mannigfaltigkeiten werden in Anhang A systematisch eingef¨ uhrt. Hier betrachten wir nur den Fall von Untermannigfaltigkeiten des Rn . Dies ist aber keine wirkliche Einschr¨ankung (siehe Satz A.49). 2.33 Definition F¨ ur eine offene Teilmenge W ⊆ Rn und f ∈ C 1 (W, Rm ) heißt m y ∈ R regul¨ arer Wert von f , wenn f¨ ur alle q ∈ W mit f (q) = y die Ableitung Dq f : Rn → Rm surjektiv ist. Dieser Begriff dient zun¨achst zur Definition von Untermannigfaltigkeiten des Rn . Er wird in (A.45) auf Abbildungen zwischen Mannigfaltigkeiten verallgemeinert. 2.34 Definition F¨ ur p ∈ {0, . . . , n} heißt eine Teilmenge M ⊆ Rn p–dimensionale Untermannigfaltigkeit des Rn , wenn jeder Punkt x ∈ M eine Umgebung Vx ⊆ Rn besitzt, so dass f¨ ur eine geeignete Abbildung f ∈ C 1 Vx , Rn−p mit regul¨arem Wert 0 gilt: M ∩ Vx = f −1 (0). Im einfachsten Fall ist M = f −1 (0), aber man m¨ochte auch Mengen wie im folgenden Beispiel als Mannigfaltigkeiten bezeichnen.
26
2.3. Differenzierbare dynamische Systeme
2.35 Beispiel (M¨ obius–Band) F¨ ur U := R × (−1, 1) und f ∈ C ∞ (U, R3 ), x (2−y sin 2 ) sin x f (x, y) := (2−y sin x2 ) cos x y cos
x 2
ist M := f (U ) ⊂ R3 das sogenannte 1 f3 2 M¨obius–Band. F¨ ur die Parametrisierung w¨ urde der Win- -1 kelbereich x ∈ [0, 2π) ausreichen, denn -2 f2 zwar kommen Winkel x/2 in f vor, aber 0 -2 f1 f (x + 2π, y) = f (x, −y). f (R × {0}) ist 2 eine Kreislinie vom Radius 2. Da die Fl¨ache M nur eine Seite besitzt, kann sie nicht Niveaumenge f −1 (0) eines regul¨aren Wertes 0 sein, denn sonst w¨ urde ∇f (x) = 0 an jedem Punkt x ∈ M senkrecht auf der Fl¨ache stehen und damit eine von zwei Seiten auszeichnen. 3 2.36 Definition Es sei U ⊆ Rn offen und f ∈ C 1 (U, Rn ). • f heißt Diffeomorphismus auf das Bild V := f (U ) ⊆ Rn , wenn V offen, f : U → V bijektiv und auch f −1 : V → U stetig differenzierbar ist. • f heißt lokaler Diffeomorphismus, wenn jeder Punkt x ∈ U eine offene Umgebung Ux ⊆ U besitzt, f¨ ur die f Ux ein Diffeomorphismus auf das Bild ist. • F¨ ur r ∈ N und U, V ⊂ Rn offen heißt eine Abbildung f ∈ C r (U, V ) ein C r – Diffeomorphismus, wenn f Diffeomorphismus auf das Bild V ist (also die inverse Abbildung f −1 ∈ C r (V, U ) ist). Man kann Diffeomorphismen als Koordinatenwechsel ansehen, und da man gerne dem jeweiligen Problem angepasste Koordinaten verwendet, sind Diffeomorphismen eine h¨aufig verwendete Klasse von Abbildungen. 2.37 Beispiel (Affine Abbildungen) Eine affine Abbildung f : Rn → Rn besitzt die Form f (x) = Ax + b mit A ∈ Mat(n, R) und b ∈ Rn . Sie ist genau dann ein Diffeomorphismus, wenn sie bijektiv ist, d.h. wenn A ∈ GL(n, R) ist. 3 Aus diesem Beispiel liest man ab, dass die Regularit¨at der Jacobi–Matrix Df Einfluss auf die Invertierbarkeit der Abbildung f hat, denn hier ist Df = A. 2.38 Satz (Lokale Diffeomorphismen) F¨ ur U ⊆ Rn offen ist f ∈ C 1 (U, Rn ) genau dann ein lokaler Diffeomorphismus, wenn f¨ ur alle x ∈ U gilt: Df (x) ∈ GL(n, R) Beweis: • Es sei f ein lokaler Diffeomorphismus, x ∈ U , und g : Vx → Ux die Umkehrfunktion des Diffeomorphismus f Ux : Ux → Vx . Dann gilt nach der Kettenregel Dg f (x) Df (x) = D(g ◦ f )(x) = D IdUx (x) = 1l, also Df (x) ∈ GL(n, R).
2. Dynamische Systeme
27
• Es gelte umgekehrt Df (z) ∈ GL(n, R). Um die lokale Inverse von f bei z ∈ U zu finden, wenden wir den Satz u ¨ber die implizite Funktion auf F : Rn × U → R n
, (y, z) → −y + f (z) an. Nach Voraussetzung ist f¨ ur X := f (z), z D2 F (X) = Df (z) ∈ GL(n, R)
, und F (X) = 0.
Anwendung des Satzes u ¨ber die implizite Funktion ergibt die Existenz einer auf der Umgebung Vz := Ury (f (z)) des Bildpunktes definierten Abbildung ur die F (y, g(y)) = f (g(y)) − y = 0 ist. g ∈ C 1 (Vz , W ) mit W = Urz (z), f¨ Wir setzen Uz := g(Vz ) ⊆ W . Sowohl g als auch f Uz sind injektiv, denn sonst k¨onnte nicht f ◦ g = IdVz gelten. Damit ist auch g ◦ f Uz = IdUz und nach der Kettenregel Dg(y) ∈ GL(n, R) f¨ ur alle y ∈ Vz . Damit ist Uz nach dem folgenden Satz eine offene Umgebung von z. 2 ar, d.h. gilt 2.39 Satz Es sei U ⊆ Rn offen und f ∈ C 1 (U, Rn ). Ist f regul¨ Df (x) ∈ GL(n, R) f¨ ur alle x ∈ U , dann ist f (V ) offen, falls V ⊆ U offen ist. 2
Beweis: Siehe zum Beispiel Hildebrandt [Hil], Band 2, Kapitel 1.9.
2.40 Bemerkung (Lokale Koordinaten) Wir nehmen an, dass f¨ ur eine offene Teilmenge W ⊆ Rn 0 ∈ F (W ) regul¨arer Wert von F : W → Rm ist. Dann muss offensichtlich m ≤ n sein, und wegen des Satzes u ¨ber die implizite Funktion k¨onnen wir f¨ ur q ∈ M := F −1 (0) eine Umgebung U ⊆ W von q und einen ur n − m < i ≤ n und Diffeomorphismus ϕ : U → Rn finden, sodass ϕ(z)i = 0 f¨ alle z ∈ U ∩M . Die ersten n−m Komponenten von ϕ dienen dann, eingeschr¨ankt auf U ∩ M , als lokale Koordinaten der Mannigfaltigkeit M . Beispielsweise kann man bei q immer geeignete n − m der n kartesischen Koordinaten verwenden.3 2.41 Beispiel (Sph¨ are) Null ist regul¨arer Wert von F : R3 → R, F (x) := 2 u r die Urbilder x ∈ F −1 (0) = S 2 ist DF (x) = 2x = 2. Der
x − 1, dennf¨ 0 Nordpol q := 0 ∈ S 2 besitzt die Umgebung U := {x ∈ R3 | x3 > 0}. Der 1 Diffeomorphismus auf das Bild ϕ : U → V, ϕ(x) := x1 , x2 , F (x) wird durch die Abbildung ϕ−1 (y) = y1 , y2 , y3 + 1 − y12 − y22 invertiert. Da wir durch Drehung in jedem Punkt q ∈ S 2 eine analoge Konstruktion durchf¨ uhren k¨onnen, haben wir gezeigt, dass S 2 eine zweidimensionale Unter3 mannigfaltigkeit des R3 ist. 2.42 Beispiel Ein Gegenbeispiel hierzu ist F : R2 → R , F (x1 , x2 ) := x21 − x32 , also mit F −1 (0) = {(x1 , x2 ) ∈ R2 | x21 = x32 }. Auch hier ist F unendlich oft differenzierbar, aber 0 kein regul¨arer Wert von F . Nebenstehend sieht man die Niveaumenge F −1 (0), die keine Untermannigfaltigkeit ist. 3
x2 1 1 2
=
1
x23 1
x1
28
2.3. Differenzierbare dynamische Systeme
2.43 Definition Ein stetiges dynamisches System Φ : G × M → M heißt differenzierbar, wenn M eine differenzierbare Mannigfaltigkeit ist und Φ stetig differenzierbar ist. 2.44 Bemerkungen (Differenzierbare dynamische Systeme) 1. Auf differenzierbare dynamische Systeme kann man also die Methoden der Analysis anwenden. Ein Beispiel sind Stabilit¨atsuntersuchungen. So wird im Satz von Liapunov (Satz 7.6) von den Eigenwerten der totalen Ableitung eines Vektorfeldes bei einer Gleichgewichtslage auf die asymptotische Stabilit¨at bez¨ uglich des durch dieses Vektorfeld definierten Flusses geschlossen. 2. Die Diffeomorphismen f : M → M einer Mannigfaltigkeit (siehe Def. A.36) bilden unter Komposition eine Gruppe, die Diffeomorphismengruppe Diff(M ). Ist M kompakt, dann kann man Diff(M ) als unendlich-dimensionale Lie– Gruppe auffassen, deren Lie–Algebra der Raum X (M ) der Vektorfelder ist. Ein differenzierbares dynamisches System Φ : G × M → M ist damit ein Gruppenhomomorphismus G → Diff(M )
, g → Φg .
Diese Sichtweise hilft manchmal beim Verst¨andnis dynamischer Systeme. • Man kann untersuchen, welche Eigenschaften dynamischer Systeme typisch sind. Beispielsweise gilt f¨ ur kompakte M , dass die Diffeomorphismen F ∈ Diff(M ), die nur endlich viele Fixpunkte besitzen, eine offene dichte Teilmenge von Diff(M ) bilden. Allgemein heißt eine Eigenschaft, die diskreten dynamischen Systemen zukommen kann, generisch, wenn die durch sie definierte Teilmenge von Diff(M ) Schnitt abz¨ahlbar vieler offener dichter Mengen ist. • Man kann statt der mengentheoretischen die algebraische Topologie von Diff(M ) untersuchen und beispielsweise feststellen, dass die Diffeomorphismen F ∈ Diff(S 1 ) der Kreislinie S 1 ⊂ C entweder in der Zusammenhangskomponente der Identit¨at oder der der Konjugationsabbildung 3 S 1 → S 1 , z → z liegen. 2.45 Aufgabe (Diffeomorphismengruppe) Zeigen Sie, dass die Diffeomorphismengruppe Diff(M ) einer zusammenh¨angenden Mannigfaltigkeit M transitiv wirkt, das heißt, es f¨ ur alle x, y ∈ M ein f ∈ Diff(M ) gibt mit f (x) = y. Tipp: Beweisen Sie zun¨achst f¨ ur alle y in einer kleinen Umgebung von x ∈ M die Existenz eines Vektorfeldes auf M , dessen Zeit-1-Fluss f ein Diffeomorphismus mit f (x) = y ist. 3 ¨ 2.46 Weiterf¨ uhrende Literatur Eine sehr lesenswerte fr¨ uhe Ubersichtsarbeit zu differenzierbaren dynamischen Systemen ist [Sm1] von Steven Smale. 3
Kapitel 3
Gew¨ ohnliche Differentialgleichungen
Bewegung in einem zuf¨alligen Potential (siehe Seite 231) 3.1 3.2 3.3 3.4 3.5 3.6
Definitionen und Beispiele . . . . . . . . . . . . ¨ Lokale Existenz und Eindeutigkeit der Losung . ¨ Globale Existenz und Eindeutigkeit der Losung . Transformation in ein dynamisches System . . . Das maximale Existenzintervall . . . . . . . . . Der Hauptsatz der Differentialgleichungstheorie
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
30 35 42 45 48 50
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 3,
29
30
3.1. Definitionen und Beispiele
Differentialgleichungen sind so vielf¨altig wie die Naturvorg¨ange, die sie beschreiben. Dieses Kapitel beginnt damit, diese begrifflich zu sortieren, und gew¨ohnliche Differentialgleichungen in eine Normalform (explizite DGL 1. Ordnung) zu u uhren. Danach werden Existenz, Eindeutigkeit und Glattheit der L¨osung ¨berf¨ des Anfangswertproblems untersucht. Es geht dabei noch weniger um konkrete L¨osungstechniken. Sind entsprechende Kenntnisse vorhanden, kann Kapitel 3 problemlos u ¨berschlagen werden.
3.1
Definitionen und Beispiele
Wir beginnen mit (etwas informellen) Definitionen und einer Grobeinteilung: 3.1 Definition • Eine Differentialgleichung (DGL) ist eine Gleichung, in der Ableitungen einer oder mehrerer Funktionen von einer oder mehreren Variablen auftreten. Die gesuchten Unbekannten sind hierbei die Funktionen. • H¨angen die Funktionen von nur einer Variablen ab, so heißt die Differentialgleichung gew¨ ohnlich, sonst partiell. • Werden mehrere Funktionen gesucht, so spricht man von einem Differentialgleichungssystem, sonst von einer Einzel-DGL. 3.2 Beispiele (Differentialgleichungen) 1. F¨ ur c > 0 beschreibt die gew¨ohnliche Einzel–Differentialgleichung dx dt (t)
= −c x(t)
zum Beispiel radioaktiven Zerfall, mit der Stoffmenge x als Funktion der Zeit t und Zerfallskonstante c. Ist die Stoffmenge x zur Zeit t = 0 gleich x0 ∈ R, dann ist 1 x(t) = x0 e−ct
(t ∈ R)
die eindeutige L¨ osung. Wir erhalten also eine einparametrige Schar von L¨ osungen, die linear vom Anfangswert x0 abh¨angt (siehe Abbildung).
1 2
0 0
1
2
t
2. Die Bahn eines geworfenen K¨ orpers im konstanten Schwerefeld der Erde mit Erdbeschleunigung 1 g > 0 wird unter Vernachl¨assigung der Luftreibung durch das gew¨ohnliche DGL–System, d2 x1 dt2 (t)
=0 ,
d2 x2 dt2 (t)
= −g
beschrieben. Dabei bezeichnet x1 die Horizontalkomponente und x2 die Vertikalkomponente des Ortes als Funktionen der Zeit t. 1 In
Bodenh¨ ohe ist g = 9.81m/s2 .
3. Gew¨ohnliche Differentialgleichungen F¨ ur Anfangsort x0 = R2 ist die L¨osung:
x1,0 x2,0
x1 (t) = x1,0 + v1,0 t
31
∈ R2 und Anfangsgeschwindigkeit v0 = , x2 (t) = x2,0 + v2,0 t − 12 gt2
v1,0 v2,0
∈
(t ∈ R).
Dies entspricht den Geschwindigkeiten v1 (t) :=
d x (t) dt 1
= v1,0
,
v2 (t) :=
d x (t) dt 2
Die Zeichnung zeigt verschiedene Wurfx2 bahnen bei gleichem Anfangsort und Betrag der Anfangsgeschwindigkeit, 0.2 aber unterschiedlicher Richtung der An0.1 fangsgeschwindigkeit. Der Wurf mit Winkel α = π/4 f¨ uhrt dabei am weitesten, denn f¨ ur die Zeit t := 2v2,0 /g α ist x2 (t) = x2,0 , und wegen v0 = v0 ( cos sin α ) ist
= v2,0 − gt
(t ∈ R).
=
x1 (t) − x1,0 =
0.2
0.4
0.6
x1
2v1,0 v2,0
v0 2 sin(2α) = . g g 2
2
3. Die eindimensionale Wellengleichung ∂∂t2u (x, t) = c2 ∂∂xu2 (x, t) mit Parameter c > 0 (Ausbreitungsgeschwindigkeit) ist ein Beispiel einer partiellen Differentialgleichung. F¨ ur beliebige Funktionen f± ∈ C 2 (R) ist u(x, t) := f+ (x − ct) + f− (x + ct)
(x, t ∈ R)
eine L¨osung. Eine physikalische Anwendung ist die Ausbreitung elektrischer Signale f± in einem Telegraphendraht, wobei die Position mit x, die Zeit mit t bezeichnet wird. 3 Wir werden in diesem Buch nur gew¨ ohnliche Differentialgleichungen (englisch: ordinary differential equations oder o.d.e.) behandeln. 3.3 Definition Die h¨ochste Ordnung eines in der DGL auftretenden Differentialquotienten wird Ordnung der Differentialgleichung genannt. 3.4 Beispiele 1. Die DGL aus Beispiel 3.2.1. ist von erster Ordnung, 2. die aus 3.2.2. ist von zweiter Ordnung. 3. Die Differentialgleichung (1.3) und ihr durch Spezialisierung auf verschwin2 denden Drehimpuls entstehender Radialteil ddt2r (t) = − r2γ(t) sind von zweiter Ordnung. Letztere DGL beschreibt z.B. die Bewegung eines sich radial mit Geschwindigkeit dr dt vom Erdmittelpunkt wegbewegenden Raumschiffes. γ ist das Erde Raumschiff Produkt von Gravitationskonstante und r Erdmasse M > 0, r der Abstand des Raumschiffes vom Erdmittelpunkt und r˙ d r die Radialgeschwindigkeit. 3 r˙ = dt
32
3.1. Definitionen und Beispiele
3.5 Definition • Ein gew¨ohnliches Differentialgleichungssystem f¨ ur die Funktionen x1 , . . . , xm heißt linear, wenn es die Form n
A(i) (t) x(i) (t) = b(t)
i=0 i
i
d d hat. Dabei bezeichnet x(i) := ( dt den Vektor der i–ten Abi x1 , . . . , dti xm ) (i) leitungen; t → A (t) ∈ Mat(m, R) und t → b(t) ∈ Rm sind vorgegebene Matrix– beziehungsweise vektorwertige Funktionen.
• Andernfalls heißt das Differentialgleichungssystem nicht linear. • Eine lineare DGL heißt homogen, wenn b(t) = 0 f¨ ur alle t, sonst inhomogen. • Die Komponenten bl von b heißen St¨ orfunktionen. So ist Beispiel 3.2.1. linear homogen, Beispiel 3.2.2. ist linear inhomogen und Beispiel 3.4.3. ist nicht linear. Ab jetzt werden viele Begriffe nur f¨ ur Einzel–Differentialgleichungen eingef¨ uhrt. Das meiste u ¨bertr¨agt sich aber auf DGL–Systeme. 3.6 Definition 1. Eine Differentialgleichung heißt implizit, wenn sie die Form (3.1.1) F t, x, x , . . . , x(n) = 0 hat, explizit, wenn sie die Form x(n) = f t, x, x , . . . , x(n−1)
(3.1.2)
hat. 2. Eine n–mal differenzierbare auf dem offenen Intervall I definierte Funktion x : I → R heißt explizite L¨ osung der DGL (3.1.1) bzw. (3.1.2), wenn gilt: F t, x(t), x (t), . . . , x(n) (t) = 0 (t ∈ I) (t ∈ I). bzw. x(n) (t) = f t, x(t), x (t), . . . , x(n−1) (t) Beispiele 3.2.1.–2. und Beispiel 3.4.3 sind explizite Differentialgleichungen. F¨ ur 3.2.1.–2. wurden auch (die) expliziten L¨ osungen angegeben. 3.7 Bemerkung (L¨ osungsbegriff) Algebraische Gleichungen, wie etwa ax2 + bx + c = 0 mit Koeffizienten a, b, c ∈ R, sind uns vertraut. Diese sind Aussageformen u ¨ber dem Variablenbereich R, es entsteht also eine (entweder wahre oder falsche) Aussage, wenn wir eine Zahl x ∈ R einsetzen. ¨ Ahnlich betrachten wir z.B. eine Differentialgleichung vom Typ (3.1.2) mit stetigem f als Aussageform u ¨ber dem Variablenbereich C n (I, R), wobei die L¨osungen wieder die wahren Aussagen liefern, siehe W¨ ust [Wu], Kap. 5.2. 3
3. Gew¨ohnliche Differentialgleichungen
33
dy + x = 0 ist eine impli3.8 Beispiel (Implizite und explizite L¨ osungen) y dx 2 2 zite nichtlineare DGL. Die Kreisgleichung x + y = c ≥ 0 ist die √ allgemeine L¨o√ sung, aber in impliziter Form. Explizite L¨osung: y(x) = ± c − x2 f¨ ur |x| < c, also
x x dy =− . = ∓√ dx y c − x2
3
3.9 Definition • Eine einzelne L¨osung (ohne frei w¨ahlbare Konstanten) heißt spezielle oder partikul¨ are L¨osung. • Eine parameterabh¨angige L¨osung einer Differentialgleichung n–ter Ordnung heißt allgemeine L¨osung, wenn sie n frei w¨ahlbare Konstanten enth¨alt, • eine parameterabh¨angige L¨osung heißt vollst¨ andig, wenn alle speziellen L¨osungen durch Wahl geeigneter Parameterwerte aus ihr hervorgehen. • Eine nicht zu einer parameterabh¨angigen L¨osung geh¨orende spezielle L¨osung heißt singul¨ ar. Beispiele 3.2.1. und 2.: Die allgemeinen und auch vollst¨andigen L¨osungen wurden angegeben. Eine partikul¨are L¨ osung von 2. ist z.B. x1 (t) = 0, x2 (t) = − 12 gt2 . Beachte: In 2. gab es vier Parameter x1,0 , x2,0 , v1,0 , v2,0 , denn es waren zwei Differentialgleichungen zweiter Ordnung, 2 × 2 = 4. Beispiel 3.8.4.: Hier war c ≥ 0 Parameter der allgemeinen = vollst¨andigen L¨osung. 3.10 Beispiel (implizite Differentialgleichung) (y )2 − 4xy + 4y = 0 ist eine implizite nichtlineare DGL erster Ordnung. y Die allgemeine L¨ osung: y(x) = 2cx − 1 c2 , c ∈ R ist eine durch c parametrisierte Geradenschar. 1 2 Dies ist aber nicht die vollst¨andige L¨ osung, denn es existiert noch die sinx gul¨are L¨osung y(x) = x2 . Diese Parabel 1 1 ist die Einh¨ ullende der Geradenschar, siehe Abbildung. 3 Frage:
• Wie findet man L¨ osungen? • Woher weiß man, dass man alle gefunden hat?
Diese Frage besch¨aftigt seit der Zeit Newtons viele Mathematiker (und uns in diesem Kapitel). 2
34
3.1. Definitionen und Beispiele
Wir betrachten zun¨achst die expliziten Einzel-Differentialgleichungen erster Ordnung y = f (x, y)
y 1
(x, y) ∈ U ⊆ R2 , U offen.
Geometrische Interpretation: Zeichnet man an jedem Punkt (x, y) ∈ U eine Gerade der Steigung f (x, y), dann ist der graph(˜ y ) = (x, y˜(x)) | x ∈ I ⊂ U
1
x
1
jeder speziellen osung L¨ y˜ : I → R der Differentialgleichung das Bild einer Kurve I → U, x → x, y˜(x) , die u ¨berall tangential an den lokalen Geraden ist. Beispiel y = −cy, also f : R2 → R, f (x, y) = −cy, siehe Abbildung. Um also die durch den Punkt (x, y) gehende spezielle L¨osung zu finden, bewegt man sich, von (x, y) ausgehend, tangential zum Richtungsfeld. Vorsicht: Woher wissen wir u ¨berhaupt, dass durch jeden Punkt (x, y) ∈ U ⊂ R2 nur eine L¨osungskurve geht? 3.11 Beispiele (Gegenbeispiele zur eindeutigen L¨ osbarkeit) 1. Implizite Differentialgleichung aus Beispiel 3.10. (3.1.3) (y )2 − 4xy + 4y = 0 Hier gehen durch jeden Punkt (x0 , y0 ) unterhalb des Graphen der Parabel y = x2 zwei L¨ osungskurven, das heißt an die Parabel tangentiale Geraden. Deren Steigungen entsprechen den zwei L¨osungen der quadratischen Gleichung (3.1.3) f¨ ur y am Punkt (x0 , y0 ). Oberhalb des Graphen der Parabel gibt es keine L¨osung.
y
1 1 2
1
1
x
2. Explizite Differentialgleichung mit nicht lipschitz–stetigem f √ 3 Eine allgemeine L¨ osung der DGL v˙ = f (v) mit f (v) := 3 v 2 ist v(t) = (t − c)3 , c ∈ R. 2 Numerische Methoden zur L¨ osung von Differentialgleichungen werden zum Beispiel in Deuflhard und Bornemann [DB] behandelt.
3. Gew¨ohnliche Differentialgleichungen Daneben gibt es aber eine singul¨are L¨osung: v(t) = 0. Durch jeden Punkt auf der t– Achse gehen damit mindestens zwei L¨osungskurven! In diesem Beispiel f¨allt auf, dass die Funktion f zwar stetig, aber bei 0 nicht differenzierbar ist.
35
v 1 2
0
1
t
12
Der Vergleich mit dem (eindeutigen) Fall f (t) := |t| legt aber nahe, dass nicht die mangelnde Differenzierbarkeit sondern die fehlende Lipschitz–Stetigkeit die Nichteindeutigkeit verursacht. Physikalisch modelliert dieses Beispiel das Wachstum des Volumens v von Regentropfen durch Kondensation von Wasserdampf an der Oberfl¨ache. Dabei wird angenommen, dass die Rate kondensierten Wassers proportional zur Oberfl¨ache des Tropfens, also zu v2/3 ist. Zur eigentlichen Entstehung von Tropfen kann das Modell also nichts aussagen. 3 3.12 Aufgaben (Einzeldifferentialgleichungen erster Ordnung) 1. Skizzieren Sie die Graphen der Geschwindigkeitsfunktionen fi : R → R mit f1 (x) := (x2 − 1)2
,
f2 (x) := (x2 + 1)2 .
Bestimmen Sie die Fixpunkte und die minimalen invarianten Mengen der Differentialgleichungen x˙ = fi (x). Beschreiben Sie, ohne die Differentialgleichungen explizit zu l¨osen, das qualitative Verhalten ihrer L¨ osungen xi (t, x0 ) f¨ ur Zeiten t und Anfangswert x0 . 2. Geben Sie in Abh¨angigkeit von α ≥ 0 und dem Anfangswert x0 > 0 das maximale Zeitintervall an, f¨ ur das das Anfangswertproblem x˙ = f (x) f¨ ur osung besitzt. 3 f : R+ → R, f (x) := xα eine L¨ ¨ Nach dieser informellen Ubersicht u ¨ber die bei gew¨ohnlichen Differentialgleichungen auftretenden Ph¨anomene zeigen wir nun mathematisch rigoros die (lokale) Existenz und Eindeutigkeit der L¨ osung gen¨ ugend regul¨arer expliziter gew¨ohnlicher DGLn 1. Ordnung. Sp¨ater werden wir sehen, dass damit auch die gleiche Frage f¨ ur explizite Differentialgleichungen h¨ oherer Ordnung beantwortet wird.
3.2
Lokale Existenz und Eindeutigkeit der L¨ osung
Wir werden nun sehen, dass bei etwas mehr Regularit¨at von f die Differentialgleichung lokal eindeutig l¨ osbar ist. Dazu schauen wir uns aber gleich die n–dimensionale Situation an:
36
3.2. Lokale Existenz und Eindeutigkeit der L¨osung
3.13 Definition • Ist U ⊆ Rt × Rnx offen und f : U → Rn stetig, dann heißt U erweiterter Phasenraum, f zeitabh¨ angiges Vektorfeld und die Gleichung x˙ = f (t, x) nichtautonome oder explizit zeitabh¨ angige Differentialgleichung. ˜ mit Phasenraum U ˜ ⊆ Rn offen und f von der Form • Ist speziell U = Rt × U x f (t, x) = f˜(x), dann heißt die DGL autonom oder dynamisches System. • Eine differenzierbare Funktion ϕ : I → Rnx auf dem Intervall I ⊆ Rt wird eine L¨ osung der Differentialgleichung genannt, wenn graph(ϕ) ⊂ U und dϕ = f τ, ϕ(τ ) (τ ∈ I). dt t=τ ugt der Anfangsbedingung (t0 , x0 ), wenn t0 ∈ I, (t0 , x0 ) ∈ • ϕ : I → Rnx gen¨ U und ϕ(t0 ) = x0 gilt. ϕ l¨ ost das Anfangswertproblem (AWP), wenn gilt: dϕ = f τ, ϕ(τ ) (τ ∈ I) und ϕ(t0 ) = x0 (3.2.1) dt t=τ • Das zeitabh¨angige Vektorfeld f : U → Rn erf¨ ullt - global eine Lipschitz–Bedingung mit Konstante L, wenn (t, xi ) ∈ U
f (t, x0 ) − f (t, x1 ) ≤ L x0 − x1
- und (lokal) eine Lipschitz–Bedingung, wenn jeder Punkt (τ, x) aus U eine Umgebung V ⊆ U besitzt, sodass f¨ ur eine Konstante L = L(τ, x)
f (t, x0 ) − f (t, x1 ) ≤ L x0 − x1
(t, xi ) ∈ V . (3.2.2) 3.14 Lemma Ist das zeitabh¨angige Vektorfeld f : U → Rnx stetig differenzierbar, dann ist die lokale Lipschitz–Bedingung (3.2.2) auf einer kompakten konvexen Teilmenge V ⊆ U des erweiterten Phasenraums mit Lipschitz–Konstante L := sup(t,x)∈V Dx f (t, x) erf¨ ullt. Beweis: • Da Dx f : V → Mat(n, R) stetig und V kompakt ist, gilt L < ∞. • F¨ ur die Punkte xs := (1 − s)x0 + sx1 (s ∈ [0, 1]) der Verbindungsstrecke ist wegen der Konvexit¨atsannahme (t, xs ) ∈ V . 1 d • Der Hauptsatz der Integralrechnung sagt: f (t, x1 )−f (t, x0 ) = 0 ds f (t, xs ) ds 1 1 dxs = 0 Dx f (t, xs ) ds ds = 0 Dx f (t, xs )(x1 − x0 ) ds, woraus (3.2.2) folgt: 1 2
f (t, x1 ) − f (t, x0 ) ≤ 0 Dx f (t, xs ) ds x1 − x0 ≤ L x1 − x0 . 3.15 Bemerkungen (Existenz und Eindeutigkeit) 1. Man beachte, dass die Lipschitz–Stetigkeit nur bez¨ uglich der x–Variablen gefragt ist.
3. Gew¨ohnliche Differentialgleichungen
37
2. Die lokale Lipschitz–Bedingung garantiert nach dem Satz von Picard–Lindel¨of (Satz 3.17) schon die Existenz und Eindeutigkeit (siehe Definition 3.16) einer zeitlokalen L¨osung des Anfangswertproblems. Die bloße Existenz einer solchen L¨ osung folgt sogar schon aus unserer Generalannahme, dass f stetig ist (Satz von Peano). 3. Es war schon festgestellt worden, dass aus einer L¨osung ϕ : I → Rnx des AWP durch Restriktion ϕI˜ auf ein kleines, t0 enthaltendes Intervall I˜ ⊆ I eine von ϕ im strengen Sinn verschiedene L¨ osung entsteht, denn die Definitionsbereiche der beiden Funktionen ϕ und ϕI˜ sind ja unterschiedlich. In diesem Sinn ist die L¨osung des Anfangswertproblems also nicht eindeutig. Da wir aber nach dem gr¨ oßtm¨ oglichen Zeitintervall I suchen, f¨ ur das die L¨osung von (3.2.1) definiert ist (siehe Kapitel 3.5), interessiert uns diese triviale Verschiedenheit der L¨ osungen nicht. Daher wird sie wegdefiniert: 3 3.16 Definition Die L¨osung des Anfangswertproblems (3.2.1) ist eindeutig, wenn f¨ ur je zwei L¨osungen ϕ1 : I1 → Rnx und ϕ2 : I2 → Rnx des Anfangswertproblem auf dem Intervall I3 := I1 ∩ I2 gilt: ϕ1 I3 = ϕ2 I3 . Wir werden im Beweis des Satzes 3.17 die eindeutigen lokalen L¨osungen des Anfangswertproblems als Fixpunkte einer kontrahierenden Abbildung auf einem Raum stetiger Funktionen finden. Damit wir sicher sein k¨onnen, dass der Fixpunkt u ¨berhaupt existiert, benutzen wir gem¨aß dem banachschen Fixpunktsatz (Satz D.3 des Anhangs) die in Satz D.1 auf Seite 505 konstatierte Vollst¨andigkeit dieses Raumes. 3.17 Satz (Picard–Lindel¨ of) Das zeitabh¨angige Vektorfeld f : U → Rn auf dem erweiterten Phasenraum uge einer Lipschitz–Bedingung auf U . U ⊆ Rt × Rnx gen¨ Dann existiert f¨ ur (t0 , x0 ) ∈ U ein ε > 0, sodass das Anfangswertproblem x˙ = f (t, x)
, x(t0 ) = x0
(3.2.3)
eine eindeutige L¨osung ϕ : [t0 − ε, t0 + ε] → Rnx besitzt. Beweis: Wir bezeichnen das gesuchte Zeitintervall mit I ≡ Iε := [t0 − ε, t0 + ε]. • Existiert eine solche L¨ osung, dann muss sie die Integralgleichung t f s, ϕ(s) ds (t ∈ I) ϕ(t) = x0 +
(3.2.4)
t0
erf¨ ullen, wie man durch Differentiation bzw. Einsetzen von t0 feststellt. Andererseits ist nach dem Hauptsatz der Differential– und Integralrechnung jede stetige L¨osung von (3.2.4) auch schon differenzierbar und damit eine L¨osung des Anfangswertproblems (3.2.3).
38
3.2. Lokale Existenz und Eindeutigkeit der L¨osung
• Es soll nun die L¨ osung ϕ als Fixpunkt einer Abbildung A aufgefunden werden. x A wird stetige Kurven im Phasenraum in solche abbilden. Um den U Definitionsbereich von A g¨ unstig zu x0 w¨ahlen, soll der Phasenraumbereich Vr Vε,r ψ die abgeschlossene Vollkugel V ≡ Vr := Ur (x0 ) sein. Wir setzen Vε,r := Iε × Vr ,
t
und w¨ahlen r so klein, dass Vr,r ⊆ U. Weiter sei L > 0 Lipschitz–Konstante von f Vr,r , N := max(t,x)∈Vr,r f (t, x)
und 3
t0 Iε
r 1 . ε := min r, , N 2L
(3.2.5)
Damit ist insbesondere Vε,r ⊆ Vr,r ⊆ U . M := C(I, V ) ⊆ C(I, Rn ) bezeichne wieder den metrischen Raum der stetigen Funktionen ψ : I → V , mit Supremumsmetrik d(ψ, ϕ) := sup ψ(t) − ϕ(t) . t∈I
Nach Satz D.1 ist (M, d) ein vollst¨andiger metrischer Raum (denn V ⊆ Rn ist abgeschlossen). • Wir f¨ uhren durch (Aψ)(t) := x0 +
t t0
f s, ψ(s) ds
(t ∈ I)
eine Abbildung A : M → C(I, Rn ) ein. Von dieser zeigen wir zun¨achst, dass ihr Bild in M bleibt. Der Abstand zwischen (Aψ)(t) und x0 ist t t f s, ψ(s) ds f s, ψ(s) ds ≤ t0 t0 t max(t˜,x)∈Vr,r f (t˜, x) ds ≤ |t − t0 |N ≤ εN ≤ r, ≤ t0
unter Verwendung der Definition (3.2.5) von ε. Damit gilt f¨ ur alle Zeiten t ∈ I: (Aψ)(t) ∈ Uε (x0 ) = V , also Aψ ∈ M . 3 mit
r/N := +∞ f¨ ur N = 0
3. Gew¨ohnliche Differentialgleichungen
39
• Jetzt fehlt uns als Voraussetzung des banachschen Fixpunktsatzes nur noch, dass diese sogenannte Picard–Abbildung A:M →M kontrahierend ist, dass also f¨ ur ein geeignetes 0 < θ < 1 gilt d Aϕ, Aψ ≤ θ d(ϕ, ψ) (ϕ, ψ ∈ M ). Tats¨achlich ergibt sich d Aϕ, Aψ = sup Aϕ(t) − Aψ(t)
t∈I t ≤ ε sup f s, ϕ(s) − f s, ψ(s)
= sup f s, ϕ(s) − f s, ψ(s) ds t∈I s∈I t0
≤ ε L sup ϕ(s) − ψ(s) = ε L d(ϕ, ψ) ≤ s∈I
1 2
d(ϕ, ψ).
Die Definition (3.2.5) von ε wurde wieder in der letzten Ungleichung verwendet. A ist damit eine kontrahierende Abbildung auf dem vollst¨andigen metrischen Raum M . • A besitzt also nach dem banachschen Fixpunktsatz (siehe Seite 506) einen eindeutigen Fixpunkt ϕ ∈ M . Diese Funktion ϕ erf¨ ullt die Integralgleichung (3.2.4) und l¨ost damit das Anfangswertproblem. 2 Die Picard–Iteration xi+1 := Axi , die hier benutzt wurde, um den Fixpunkt ϕ = limi→∞ xi von A zu finden, wurde, kann auch zur L¨osung von Differentialgleichungen verwendet werden: 3.18 Beispiele (Picard–Iteration) 1. Wir approximieren die L¨osung des Anfangswertproblems x˙ = x , x(0) = x0 ∈ R durch x0 (t) := x0
t
und xi+1 (t) := x0 +
xi (s) ds
(t ∈ R),
0
tk n k0 , n0,...,3 k
also (siehe Abbildung) x1 (t) = x0 (1 + t) t2 x2 (t) = x0 1 + t + 2 .. . n ti xn (t) = x0 . i! i=0
2
1
1
0
1
t
40
3.2. Lokale Existenz und Eindeutigkeit der L¨osung
∞ i Da x(t) = x0 i=0 ti! = x0 · et , konvergiert f¨ ur alle t ∈ R die n–te Iterierte osung x(t), und zwar gleichm¨aßig auf jedem kompakten xn (t) gegen die L¨ Zeitintervall (aber nicht gleichm¨aßig auf R).
2. Das Anfangswertproblem x˙ = 1 + x2 , x0 = 0 besitzt nur eine L¨osung auf π π − 2 , 2 , und zwar den Tangens. Wir optimieren die Konstanten im Beweis des Satzes von Picard–Lindel¨of. F¨ ur r > 0 ist N = max|x|≤r f (x) = 1 + r2 , und die Lipschitz–Konstante L = max|x|≤r f (x) = 2r. Also ist gem¨aß Definition (3.2.5) ε = min
ε wird maximal f¨ ur r =
√1 , 3
das heißt ε =
√ 3 4 .
.
√
F¨ ur Zeiten |t|
0 und eine Funktion ϕ : [−ε, ε] → R, welche dieses Anfangswertproblem l¨ost. (a) Finden Sie eine untere Schranke an ε, die von diesem Satz garantiert wird. (b) Wie sieht die Picard–Iteration f¨ ur dieses Anfangswertproblem aus? (c) Wie lautet die maximale L¨ osung des Anfangswertproblems?
3
In den naturwissenschaftlichen oder technischen Anwendungen von Differentialgleichungen kennen wir deren Anfangswerte normalerweise nicht genau. Der folgende Satz besagt, dass dies auch gar nicht n¨otig ist. 3.20 Satz Unter den Voraussetzungen des Satzes 3.17 (Picard–Lindel¨of) existiert f¨ ur jeden Punkt (T0 , X0 ) ∈ U des erweiterten Phasenraums eine kompakte Umgebung V ⊂ U und ein Intervall Iε := [−ε, ε], sodass die Familie Φ : Iε × V → U
,
(s; t0 , x0 ) → ϕ(t0 + s)
3. Gew¨ohnliche Differentialgleichungen
41
der L¨osungen des Anfangswertproblems (3.2.3) eine stetige Abbildung ist. Die L¨osungen h¨angen also stetig von ihren Anfangswerten und der Zeit ab. Beweis: • F¨ ur kleine R > 0 und ε > 0 ist [T0 − 2ε, T0 + 2ε] × UR (X0 ) Teilmenge des erweiterten Phasenraums U . Die Menge Vε,r := [T0 − ε, T0 + ε] × Ur (X0 ) von Anfangswerten (t0 , x0 ) ist f¨ ur r ∈ (0, R) darin enthalten. Außerdem ist sie beschr¨ankt und abgeschlossen, also kompakt. F¨ ur die Picard–Iteration benutzen wir statt des Raumes der Kurven den metrischen Raum M := C Iε × Vε,r , UR (X0 ) mit der Supremumsmetrik d(Φ, Ψ) := sup{ Φ(t; y) − Ψ(t; y) | (t; y) ∈ Iε × Vε,r }
(Φ, Ψ ∈ M ).
• (M, d) ist ein vollst¨andiger metrischer Raum, denn (a) die Bildmenge ist eine abgeschlossene Teilmenge des Rn , also vollst¨andig. (b) der Definitionsbereich ist kompakt. Jede Cauchy–Folge (Φm )m∈N in M besitzt also einen punktweisen Limes Φ mit Φ(t; y) := limm→∞ Φm (t; y). (c) auch das ε/3–Argument aus Satz D.1 u ¨bertr¨agt sich auf diese Situation, Φ ist also stetig und Φ ∈ M . • Wir betrachten f¨ ur Ψ ∈ M die Picard–Abbildung s f t0 +τ, Ψ(τ ; t0 , x0 ) dτ (AΨ)(s; t0 , x0 ) := x0 +
(s; t0 , x0 ) ∈ Iε ×Vε,r .
0
Ist Φ ein Fixpunkt von A, dann bedeutet dies Φ(0; t0 , x0 ) = AΦ(0; t0 , x0 ) = x0 und d d Φ(s; t0 , x0 ) = (AΦ)(s; t0 , x0 ) = f t0 + s, Φ(s; t0 , x0 ) . ds ds Die Abbildung t → Φ(t−t0 ; t0 , x0 ) l¨ ost also das AWP mit Anfangswert (t0 , x0 ). • Mit der gleichen Argumentation wie im Beweis von Picard–Lindel¨of wird f¨ ur kleine Parameter ε, r > 0 die Picard–Abbildung zu einer Kontraktion A : M → M. Sie hat also nach dem banachschen Fixpunktsatz einen eindeutigen Fixpunkt Φ ∈ M. 2
42
3.3
3.3. Globale Existenz und Eindeutigkeit der L¨osung
Globale Existenz und Eindeutigkeit der L¨ osung
Es ist naheliegend, auch Differentialgleichungen auf Mannigfaltigkeiten zu untersuchen. 3.21 Definition • Ist f : M → T M ein (zeitunabh¨angiges) Vektorfeld auf der Mannigfaltigkeit M (siehe Definition A.39), dann wird eine Kurve ϕ ∈ C 1 (I, M ) L¨ osung der Differentialgleichung x˙ = f (x) genannt, wenn f¨ ur d ϕ(t) = f ϕ(t) . alle Zeiten t ∈ I gilt: dt • Ein Vektorfeld f : M → T M auf der Mannigfaltigkeit M heißt vollst¨ andig, wenn f¨ ur alle x0 ∈ M das Anfangswertproblem x˙ = f (x), x(0) = x0 eine eindeutige L¨osung ϕ : R → M besitzt. In diesem Abschnitt stellen wir Kriterien f¨ ur die Vollst¨andigkeit von Vektorfeldern vor. Wir beginnen mit dem Fall des Phasenraums M = Rn . 3.22 Beispiele 1. Am Beispiel 3.18.2 der DGL x˙ = f (x) = 1 + x2 des Tangens sehen wir, dass die L¨ osung nicht f¨ ur alle Zeiten existiert (sondern in der Zeit π von Null nach ∞ divergiert), da x → f (x) superlinear w¨achst. Dies steht 2 nicht im Widerspruch zur lokalen Lipschitz–Stetigkeit von f . 2. Dagegen ist in Beispiel 3.18.1 f (x) = x sogar global lipschitz–stetig, und dieses lineare Vektorfeld ist vollst¨andig. Dies ist ganz allgemein so: 3 3.23 Satz • Lipschitz–stetige Vektorfelder f : Rn → Rn sind vollst¨andig. • Allgemeiner sei I ⊆ R ein Intervall, und das zeitabh¨angige Vektorfeld ulle die zeitabh¨angige globale Lipschitz–Bedingung f : I × Rn → Rn erf¨
f (t, x1 ) − f (t, x2 ) ≤ L(t) x1 − x2
t ∈ I, x1 , x2 ∈ Rn mit stetiger Lipschitz–Konstante L : I → R+ . Dann hat das Anfangswertproblem f¨ ur alle Anfangswerte (t0 , x0 ) ∈ I × Rn eine eindeutige L¨osung ϕ : I → Rn . Beweis: • Der zeitunabh¨angige Fall ergibt sich aus dem zeitabh¨angigen Fall mit I = R und konstantem L. • Es gen¨ ugt, kompakte Intervalle I zu betrachten, denn jedes Intervall I t0 l¨asst sich als Vereinigung kompakter Intervalle Ik t0 darstellen. • Dann ist wegen der Stetigkeitsannahme supt∈I L(t) endlich. Es gibt also eine ˜ ≥ 1 mit Lipschitz-Konstante L ˜ x1 − x2
f (t, x1 ) − f (t, x2 ) ≤ L
(t ∈ I, x1 , x2 ∈ Rn ).
Wir w¨ahlen r := f (x0 ) + 21L˜ , sodass N := maxx∈Ur (x0 ) f (x) die Ungleichung N
≤
f (x0 ) + maxx∈Ur (x0 ) f (x) − f (x0 )
≤
˜ max ˜
x − x0 ≤ r + Lr
f (x0 ) + L x∈Ur (x0 )
3. Gew¨ohnliche Differentialgleichungen
43
erf¨ ullt, und die das Zeitintervall definierende Konstante ε aus (3.2.5) unabh¨angig von x0 wird: r 1 1 1 1 1 ε = min r , , + f (x0 ) , , . = min = ˜ ˜ ˜ ˜ ˜ N 2L 2L 1 + L 2L 2L • F¨ ur beliebige Zeiten tk ∈ I und Anfangswerte xk ∈ Rn k¨onnen wir nach Satz 3.17 die eindeutige lokale L¨ osung ϕk : Ik → Rn des Anfangswertproblems x˙ = f (t, x) mit ϕk (tk ) := xk auf dem Intervall Ik := [tk − ε, tk + ε] ∩ I finden. ur k ∈ N bei Kenntnis der Mit den Zeiten tk := t0 + 2ε k ∈ I setzen wir nun f¨ L¨osung ϕk−1 den Anfangswert xk := ϕk−1 (tk ). Analog w¨ahlen wir f¨ ur ganzzahlige k < 0 den Anfangswert xk := ϕk+1 (tk ). • Es ist also ϕk−1 (tk ) = ϕk (tk ). Wegen der Eindeutigkeit der L¨osung des Anfangswertproblems im Sinn von Definition 3.16 erhalten wir mit ϕ : I → Rn
,
ϕ(t) := ϕk (t) falls t ∈ Ik
eine eindeutige L¨ osung des Anfangswertproblems x˙ = f (t, x), x(t0 ) = x0 .
2
3.24 Bemerkungen 1. Analog zu Lemma 3.14 hat man das folgende hinreichende Kriterium f¨ ur globale Lipschitz–Stetigkeit. Ist f ∈ C 1 (Rn , Rn ), dann ist f lipschitz–stetig, wenn gilt: sup Df (x) < ∞ .
x∈Rn
2. Insbesondere folgt, dass f¨ ur alle linearen Differentialgleichungen das Anfangswertproblem x˙ = Ax , x(0) = x0 f¨ ur alle Zeiten eindeutig l¨ osbar ist, denn das Vektorfeld f (x) = Ax ist lipschitz– stetig mit Konstante L = A := supv∈S n−1 Av , der Matrixnorm von A ∈ Mat(n, R). In Kapitel 4.1 wird gezeigt, dass diese L¨osung von der Form x(t) = exp(At)x0 ist. 3. Satz 3.23 garantiert die eindeutige globale L¨ osbarkeit unter Voraussetzung der Existenz einer stetig von der Zeit abh¨angigen Lipschitz–Konstante L : I → ur inhomogen-lineare Differentialgleichungen x(t) ˙ = A(t)x(t) + b(t) R+ . F¨ gen¨ ugt es sogar anzunehmen, dass A und b lokal integrabel sind, siehe Weidmann [Weid], Theorem 2.1. 3 3.25 Aufgabe Finden Sie die L¨ osung des Anfangswertproblems x˙ = sin x mit 3 x(0) = π/2. Berechnen Sie limt→−∞ x(t) und limt→∞ x(t). Wie das folgende Beispiel zeigt, ist die Lipschitz–Stetigkeit des Vektorfeldes auf dem gesamten Phasenraum Rn eine hinreichende, aber keineswegs notwendige Voraussetzung f¨ ur seine Vollst¨andigkeit.
44
3.3. Globale Existenz und Eindeutigkeit der L¨osung
3.26 Beispiel (Vollst¨ andiges Vektorfeld) x2 Das Vektorfeld f : P → R2 , x → x 2 ( −x ) auf dem Phasenraum P = R2 ist 1 glatt. Es ist aber nicht global lipschitz–stetig, denn seine Ableitung 2x x2 x21 +3x22 Df : P → Mat(2, R) , Df (x) = −3x12 −x 2 −2x x 1
2
1
2
ist nicht beschr¨ankt. Daher k¨ onnen wir seine Vollst¨andigkeit nicht mit Satz 3.23 beweisen. Wir stellen aber fest, dass f tangential zu den Kreislinien Sr1 := {x ∈ P | x = r} vom Radius r ist, denn es steht senkrecht auf deren Normalenvektoren: f (x), x = 0. In Polarkoordinaten x1 = r cos ϕ, x2 = r sin ϕ lautet die DGL x˙ = f (x) r˙ = 0 ,
ϕ˙ = −r 2 .
Die eindeutige L¨ osung r(t) = r0 , ϕ(t) = ϕ0 − r02 t des Anfangswertproblems existiert f¨ ur alle Zeiten t ∈ R. 3 Entscheidend f¨ ur die globale L¨ osbarkeit war hier die M¨oglichkeit, das Vektorfeld f auf die kompakten Untermannigfaltigkeiten Sr1 des Phasenraums einzuschr¨anken.
3.27 Satz Lipschitz–stetige Vektorfelder auf kompakten Mannigfaltigkeiten sind vollst¨andig. Beweis: • Zun¨achst macht man sich klar, dass lokale Lipschitz–Stetigkeit (und um diese geht es hier) kartenunabh¨angig definiert ist. Denn Kartenwechsel sind Diffeomorphismen offener Teilmengen des Rn , deren Ableitungen auf Kompakta beschr¨ankt sind. • F¨ ur jeden Punkt x ∈ M gibt es nach Satz 3.20 eine kompakte Umgebung Kx und ein εx > 0, sodass das Anfangswertproblem f¨ ur alle x0 ∈ Kx eine eindeutige L¨osung mit Zeitintervall (−εx , εx ) besitzt. Ebenso gibt es im (maximalen) Atlas von M zu jedem x ∈ M Karten (Ux , ϕx ) mit offenen, x enthaltenden Kartengebieten Ux ⊂ Kx und Kartenabbildungen ϕx : Ux → Rn . Da die Mannigfaltigkeit M kompakt ist, werden von diesen Karten nur end¨ lich viele f¨ ur einen Atlas ben¨ otigt (denn jede offene Uberdeckung von M besitzt wegen der Kompaktheit eine endliche Teil¨ uberdeckung). Wir k¨onnen also annehmen, dass die Indexmenge I des Atlas {(Ui , ϕi ) | i ∈ I} von M endlich ist. • Da das Minimum der εi immer noch positiv ist, kann man mit der St¨ uckelungsmethode des Beweises von Satz 3.23 eine eindeutige L¨osung des Anfangswertproblems mit Zeitintervall R konstruieren. 2 2n 3.28 Aufgabe (Existenz des Flusses) Es sei H : R → R eine glatte Funk−1 (−∞, E] f¨ ur alle E ∈ R kompakt ist. tion, so dass H
(a) Geben Sie ein Beispiel f¨ ur eine solche Funktion H.
3. Gew¨ohnliche Differentialgleichungen
45
(b) Zeigen Sie, dass der Fluss, der von den (hamiltonschen) Differentialgleichungen x˙ j = −
∂H (x) ∂xj+n
,
x˙ j+n =
∂H (x) ∂xj
(j ∈ {1, . . . , n}) 3
generiert wird, f¨ ur alle Zeiten existiert.
3.4
Transformation in ein dynamisches System
Reduktion der Ordnung Auch Differentialgleichungen h¨ oherer als erster Ordnung lassen sich mit den beschriebenen Methoden behandeln, indem man aus einer expliziten Differentialgleichung n–ter Ordnung ein System von n DGLn erster Ordnung macht. 3.29 Satz Die Differentialgleichung der Ordnung n > 1 n−1 dn x = F t, x, dx , . . . , ddtn−1x dtn dt
(3.4.1)
mit F ∈ C 1 (Rn+1 ) ist zum Differentialgleichungssystem ⎛ y2 .. dy . = f (t, y) mit f (t, y) := ⎝ yn dt
⎞ ⎠
(3.4.2)
F (t,y1 ,...,yn )
im folgenden Sinn ¨aquivalent: ⎛ • Ist ϕ : I → R L¨osung von (3.4.1), dann ist ψ := ⎝
ϕ ϕ
.. .
⎞ ⎠ : I → Rn L¨osung
ϕ(n−1)
von (3.4.2). ψ 1 .. • Ist umgekehrt ψ = L¨osung von (3.4.2), dann ist ψ1 L¨osung von (3.4.1). . ψn
Beweis: Nach Definition ist ϕ n–mal differenzierbar, also ψ : I → Rn differend ψk−1 (k = 2, . . . , n), zierbar, und ψk = dt d dt ψn
=
dn ϕ dtn
= F (t, ϕ, ϕ , . . . , ϕ(n−1) ) = F (t, ψ1 , . . . , ψn ).
Die Argumentation l¨asst sich umkehren.
2
3.30 Aufgabe Betrachten Sie die eindimensionale Bewegung x ¨ = x. Finden Sie die L¨osung mit Anfangsbedingung (x0 , x˙ 0 ) = (1, −1). Wieviel Zeit braucht sie, um x = 0 zu erreichen? 3
46
3.4. Transformation in ein dynamisches System
3.31 Beispiel (Kepler–Problem) Das himmelsmechanische 2–K¨orper–Problem beschreibt die z.B. die Bewegung von Erde und Sonne um ihren gemeinsamen Schwerpunkt. Es l¨aßt sich auf das in der Einleitung behandelte sogenannte 1– Zentren-Problem der Bewegung einer Punktmasse am Ort x ∈ R3 \{0} im Schwerefeld eines im Koordinatenursprung befindlichen Himmelsk¨orpers reduzieren. Es gilt dann nach (1.3) x . x ¨ = −γ
x 3 Dieses DGL–System zweiter Ordnung l¨asst sich auf die Differentialgleichung erster Ordnung mit Phasenraum U := (R3 \{0}) × R3 v x z = (x, v) ∈ U (3.4.3) z˙ = f (z) := −γ x 3 umformen. Der Phasenraum U ist eine offene Teilmenge des R6 , mit einem Vektorfeld f ∈ C ∞ (U, R6 ). Damit k¨onnen wir (3.4.3) mit Picard–Iteration oder einem anderen Verfahren f¨ ur kleine Zeiten l¨ osen. Analoges gilt auch f¨ ur das n–K¨orper-Problem (1.8). 3
¨ Ubergang zu einem zeitunabh¨ angigen System Wir k¨onnen auch explizite zeitabh¨angige Differentialgleichungen auf autonome zur¨ uckf¨ uhren. Statt der DGL x˙ = f (t, x) mit f : U → Rn , U ⊆ Rt × Rnx offen betrachten wir dazu das autonome Differentialgleichungssystem 1 . (3.4.4) g(y) := f (y) y˙ = g(y) mit g : U → Rn+1 , y := ( xs ) Wir erh¨ohen also die Dimension des Phasenraums um Eins, indem wir den Zeitparameter s zum Phasenraumpunkt x hinzuf¨ ugen. Ausgeschrieben hat (3.4.4) die Form d d (3.4.5) dt s = 1 , dt x = f (s, x). s(t) Ist nun ψ : I → U eine L¨ osung von (3.4.4), dann gilt mit ψ(t) = x(t) s(t) = s(0) + t, bis auf eine zu w¨ahlende additive Konstante ist also die Phasenraumkoordinate s gleich der t. Die L¨ osung ψ = ( xs˜ ) des Anfangswertpro t Zeit 0 blems y˙ = g(y), ψ(0) = x0 ergibt daher eine L¨osung x des Anfangswertpro˜(t − t0 ). blems x˙ = f (t, x), x(t0 ) = x0 . Man setzt einfach x(t) := x Umgekehrt kann man aus einer L¨ osung des AWP x˙ = f (t, x), x(t0 ) = x0 durch Erg¨anzung eine L¨ osung des Anfangswertproblems von (3.4.4) konstruieren. Ist f : U → Rn (in allen Argumenten) lipschitz–stetig, dann auch g. Damit u ¨bertr¨agt sich der Existenz– und Eindeutigkeitssatz (man beachte aber, dass wir f¨ ur nicht autonome DGLn keine Lipschitz–Stetigkeit bez¨ uglich t forderten).
Grundbegriffe f¨ ur autonome Differentialgleichungen Existiert f¨ ur alle x0 ∈ M eine eindeutige L¨ osung ϕx0 : R → M des Anfangswertproblems x˙ = f (x), x(0) = x0 auf der Mannigfaltigkeit M , dann heißt die
3. Gew¨ohnliche Differentialgleichungen
47
Abbildung Φ:R×M →M
, (t, x) → ϕx (t)
(3.4.6)
Phasenfluss oder kurz Fluss der Differentialgleichung. Sie bildet dann ein kontinuierliches dynamisches System im Sinn der Definition 2.7. Es ist aber oft praktisch, die folgenden bis jetzt nur f¨ ur dynamische Systeme definierten Begriffe auch dann zu verwenden, wenn die L¨osung des Anfangswertproblems nicht f¨ ur alle Zeiten existiert: 3.32 Definition Das Vektorfeld f : M → T M auf einer Mannigfaltigkeit M sei lokal lipschitz–stetig. Wir betrachten die Differentialgleichung x˙ = f (x). 1. ϕ : I → M sei eine L¨osungskurve der Differentialgleichung mit maximalem Zeitintervall I. Das Bild ϕ(I) ⊆ U heißt dann Orbit. F¨ ur x ∈ ϕ(I) heißt O(x) := ϕ(I) der Orbit durch x. arer Punkt des Vektorfeldes f , wenn f (xs ) = 0 ist. 2. xs ∈ M heißt singul¨ Ist xs ∈ M singul¨arer Punkt von f , dann heißt xs auch Ruhelage oder Gleichgewichtslage der Differentialgleichung. 3. x ∈ M heißt periodischer Punkt mit (Minimal)-Periode T > 0, wenn ϕx (T ) = x (und ϕx (t) = x falls t ∈ (0, T )). Ein Orbit O(x) heißt geschlossen, wenn x ∈ M ein periodischer Punkt ist 3.33 Bemerkungen 1. F¨ ur einen singul¨aren Punkt xs des Vektorfelds f ist die konstante Funktion x(t) = xs die (einzige) L¨osung des Anfangswertproblems. 2. Singul¨ar heißt der Punkt nicht etwa deswegen, weil das Vektorfeld f dort eine Singularit¨at bes¨aße, sondern weil dessen Richtungsfeld 4 x → f (x)/ f (x)
dort undefiniert ist und sich auch im Allgemeinen nicht stetig auf xs fortsetzen l¨asst. 3. Wie schon in Satz 3.27 verwendet, ist der Definition 3.32 zugrundeliegende Begriff der lokalen Lipschitz–Stetigkeit auch f¨ ur Vektorfelder auf Mannigfaltigkeiten wohldefiniert. 3 3.34 Satz Wenn das durch ein lokal lipschitz–stetiges Vektorfeld f : M → T M definierte Anfangswertproblem x˙ = f (x) eine L¨osung Φ : R × M → M besitzt, ist Φ ein stetiges dynamisches System (im Sinn von Definition 2.16). Beweis: Nach Satz 3.20 ist die Abbildung Φ aus (3.4.6) stetig. Die Bedingung Φ0 = IdM ist wegen der Eigenschaft ϕx0 (0) = x0 der L¨osung des Anfangswertproblems erf¨ ullt, die Kompositionseigenschaft Φt1 ◦ Φt2 = Φt1 +t2 (t1 , t2 ∈ R) wegen der Eindeutigkeit und Translationsinvarianz der L¨osung. 2 4 mit
einer zum Beispiel von einer riemannschen Metrik kommenden Norm
48
3.5. Das maximale Existenzintervall
!n 3.35 Beispiele 1. F¨ ur ein reelles Polynom f (x) = i=1 (x − ai ) mit den Nullstellen a1 < . . . < an ist die Differentialgleichung x˙ = f (x) lokal eindeutig l¨osbar und besitzt f¨ ur x ∈ [a1 , an ] sogar L¨ osungen t → Φt (x) f¨ ur alle t ∈ R. ur x ∈ (ai , ai+1 ) ist f (ai ,ai+1 ) > Die Ruhelagen sind die Punkte a1 , . . . , an . F¨ 0, falls n − i gerade ist. In diesem Fall ist damit ω(x) = {ai+1 } und α(x) = {ai }. Ist dagegen n − i ungerade, also f (ai ,ai+1 ) < 0, dann gilt umgekehrt ω(x) = {ai }, α(x) = {ai+1 }. Periodische Punkte existieren nicht. 2. F¨ ur das (in Polarkoordinaten (r, ϕ) notierte) Differentialgleichungssystem mit Phasenraum R2 r˙ = r(1 − r 2 ) , ϕ˙ = 1 ist der Ursprung (r = 0) die einzige Ruhelage, und {1} × [0, 2π) der einzige periodische Orbit. F¨ ur alle x ∈ R2 \{0} ist ω(x) gleich diesem periodischen Orbit, f¨ ur x < 1 ist α(x) = {0}. 3
3.5
Das maximale Existenzintervall
Zur Vorbereitung des Hauptsatzes bestimmen wir zun¨achst die Struktur des maximalen Definitionsbereichs von Φ. Wir betrachten das Vektorfeld f ∈ C 1 (U, Rn ) auf dem Phasenraum U ⊆ Rn (oder allgemeiner ein Vektorfeld auf einer Mannigfaltigkeit), und wollen f¨ ur die Anfangszeit t0 = 0 allen Anfangswerten x0 aus U das maximale Zeitintervall zuordnen, f¨ ur das die L¨ osung des Anfangswertproblems definiert ist. Nach dem Satz von Picard–Lindel¨ of ist dies eine Umgebung der Null, und (da dies auch f¨ ur alle Punkte des Orbits gilt) offen. Wir k¨ onnen es also in der Form T − (x0 ), T + (x0 ) mit −∞ ≤ T − (x0 ) < 0 < T + (x0 ) ≤ +∞ schreiben. Die entsprechende L¨ osung des Anfangswertproblems wird auch die maximale L¨osung genannt. Wir untersuchen die Fluchtzeiten T ± : U −→ R := {−∞} ∪ R ∪ {+∞}
(3.5.1)
mit Werten in der erweiterten Zahlengerahx de. Dazu wird R mit einer Topologie verse1 hen, bez¨ uglich derer R zum Intervall [−1, 1] hom¨oomorph ist, mit Hom¨ oomorphismus x ⎧ 2 1 1 2 −1 , x = −∞ ⎨ tanh(x) , x ∈ R h : R → [−1, 1], x → ⎩ 1 , x = +∞. 1 Wir sehen an folgendem Beispiel, dass T + und T − im Allgemeinen nicht stetig sind: =
3. Gew¨ohnliche Differentialgleichungen
49
3.36 Beispiel (Fluchtzeiten) Auf dem Phasenraum U := R2 \{0} betrachten wir das Anfangswertproblem f¨ ur das konstante Vektorfeld f (x) := e1 , also Φt (x) = x + e1 t. Dies ist f¨ ur alle t definiert, falls x = xx12 mit x2 = 0 ist. F¨ ur x2 = 0 und x1 < 0 ist T − (x), T + (x) = − ∞, |x1 | . 3 In diesem Beispiel springt T + nur nach oben, nicht nach unten. Dies ist typisch f¨ ur alle Differentialgleichungen: 3.37 Definition Eine Funktion f : U → R auf einem topologischen Raum 5 U heißt oberhalbstetig beziehungsweise unterhalbstetig bei x0 ∈ U , wenn f (x0 ) ≥ lim sup f (x) x→x0
bzw.
f (x0 ) ≤ lim inf f (x), x→x0
und oberhalbstetig (beziehungsweise unterhalbstetig), wenn sie f¨ ur alle x0 ∈ U oberhalbstetig (bzw. unterhalbstetig) bei x0 ist. 3.38 Beispiel (floor und ceil) In der Zerlegung von x ∈ R in x = x + {x} mit x ∈ Z und {x} ∈ [0, 1) x x ist die floor –Funktion · : R → 1 1 R (auch Gauss–Klammer genannt) 1 2x oberhalbstetig, w¨ahrend x → {x} 2 1 2 1 1 2x (ebenso wie die ceil–Funktion · : 2 R → R) unterhalbstetig ist. 3 3.39 Satz Die Fluchtzeit T + : U → R aus (3.5.1) ist unterhalbstetig, die Fluchtzeit T − : U → R ist oberhalbstetig. Damit ist der Definitionsbereich D := (t, x) ∈ R × U | t ∈ T − (x), T + (x) des sogenannten maximalen Flusses Φ : D → U eine offene Teilmenge des erweiterten Phasenraums. Beweis: • Es sei x0 ∈ U . Dann existiert wegen der Offenheit von U eine Umgebung Ur (x0 ) mit Ur (x0 ) ⊂ U . Da Ur (x0 ) kompakt ist, ist die Einschr¨ankung des Vektorfeldes auf diese Menge lipschitz–stetig. Nach dem Satz von Picard– Lindel¨of gibt es ein ε > 0, sodass f¨ ur alle y ∈ Ur/2 (x0 ) das Anfangswertproblem x˙ = f (x), x(0) = y f¨ ur t ∈ (−ε, ε) eindeutig l¨osbar ist. • Wir betrachten nun eine aufsteigende Folge von Zeiten (tn )n∈N mit t1 = 0, limn→∞ tn = T + (x0 ), sodass f¨ ur geeignete rn > 0 und εn > 0 das AWP x˙ = f (x)
,
x(0) = y
f¨ ur alle t ∈ (−εn , εn )
und y ∈ Urn /2 (xn )
l¨osbar ist, wobei wir xn := Φtn (x0 ) setzen. Nach Konstruktion der maximalen L¨osung k¨onnen wir annehmen, dass tn+1 − tn < εn ist. 5 Wir haben es durchweg mit R¨ aumen zu tun, deren Topologie metrisierbar ist, verstehen also lim supx→x0 f (x) und im Sinn von limε0 sup f (x) | x ∈ Uε (x0 ) \ {x0 } . Allgemein ist eine solche Funktion genau dann unterhalbstetig, wenn ihr Epigraph abgeschlossen ist.
50
3.6. Der Hauptsatz der Differentialgleichungstheorie
• Es sei nun T + nicht unterhalbstetig bei x0 , also Tˆ := lim inf x→x0 T + (x) < T + (x0 ) und k ∈ N so gew¨ahlt, dass tk ≤ Tˆ < tk+1 . Nach Annahme ist tk + εk > Tˆ . Wegen der Stetigkeit des Flusses in den Anfangsbedingungen (Iteration von Satz 3.20) existiert eine Umgebung V ⊂ U von x0 mit Φtk (V ) ⊂ ur alle y ∈ V gilt Urk /2 (xn ), und f¨ T + (y) = tk + T + (Φtk (y)) ≥ tk + εk > Tˆ . Widerspruch! • Die Oberhalbstetigkeit von T − zeigt man analog. • W¨are D nicht offen, dann w¨ urde eine Folge (tn , xn )n∈N in R × Rn \ D mit Grenzwert (t, x) := limn→∞ (tn , xn ) ∈ D existieren. Wegen der Offenheit von U ⊆ Rn k¨onnen wir (durch Weglassen der ersten Folgenglieder) annahmen, dass xn ∈ U . Also muss f¨ ur jedes n gelten: Entweder ist tn ≥ T + (xn ) oder tn ≤ T − (xn ). Einer der beiden F¨alle tritt unendlich oft auf, zum Beispiel tn ≥ T + (xn ). Wir gehen wieder zur entsprechenden Teilfolge u ¨ber. Wegen (t, x) ∈ D ist t ∈ (0, T + (x)), was wegen lim inf T + (xn ) ≤ lim inf tn = t < T + (x) n→∞
n→∞
der Unterhalbstetigkeit von T + bei x widerspricht.
2
3.40 Bemerkung In diesem Abschnitt haben wir angenommen, dass die Differentialgleichung autonom ist. Ganz analoge Aussagen stimmen aber auch f¨ ur Anfangswertprobleme nicht autonomer Differentialgleichungen, wenn wir eine Anfangszeit t0 fixieren. Denn durch Hinzunahme einer abh¨angigen Variable k¨onnen wir die DGL in autonomer Form schreiben. Diese Tatsache werden wir uns beim Beweis des Hauptsatzes zunutze machen. 3 mit Para3.41 Aufgabe (Fluchtzeit) H : R×(0, ∞) → R, H(p, q) := 12 p2 − m q meter m ∈ (0, ∞) und zugeh¨ origer hamiltonscher Differentialgleichung p˙ = −m/q 2 , q˙ = p beschreibt die radiale Bewegung im Gravitationsfeld. (a) Geben Sie eine obere Schranke f¨ ur die Fluchtzeit (also Kollisionszeit) an. (b) Finden Sie eine untere Schranke an die Fluchtzeit. (c) Finden Sie eine DGL auf R mit – je nach Anfangswert – nur f¨ ur die Vergangenheit, die Zukunft oder immer unendlichen Fluchtzeiten. 3
3.6
Der Hauptsatz der Differentialgleichungstheorie
Wir wissen aus Satz 3.20, dass f¨ ur stetig differenzierbare zeitabh¨angige Vektorfelder f auch die L¨ osungen Φ(t, x0 ) des Anfangswertproblems (3.6.1) x(t) ˙ = f t, x(t) , x(t0 ) = x0
3. Gew¨ohnliche Differentialgleichungen
51
stetig in der Zeit t und im Anfangswert x0 sind. Der Hauptsatz besagt nun, dass die L¨ osung Φ genauso glatt wie f ist. Die beim Beweis benutzte Gronwall–Ungleichung ist eine in der Differentialgleichungstheorie wichtige Absch¨atzung. Sie ¨ahnelt M¨ unchhausens Methode, sich an den eigenen Haaren aus dem Sumpf zu ziehen. 3.42 Satz (Gronwall–Ungleichung) F¨ ur F, G ∈ C [t0 , t1 ), [0, ∞) gelte mit einem geeigneten a ≥ 0 die Ungleichung
t
F (t) ≤ a +
F (s)G(s) ds
t ∈ [t0 , t1 ) .
(3.6.2)
t ∈ [t0 , t1 ) .
(3.6.3)
t0
Dann ist
t
F (t) ≤ a exp
G(s) ds
t0
t Beweis: • Ist a > 0, dann gilt f¨ ur die rechte Seite h(t) := a + t0 F (s)G(s) ds der Voraussetzung (3.6.2): h(t) > 0 und h (t) = F (t)G(t) ≤ h(t)G(t), also h (t) h(t) ≤ G(t). t t G(s) ds, oder h(t) ≤ a exp G(s) ds . Integration ergibt ln h(t) ≤ a t0 t0 Zusammen mit der Ungleichung F (t) ≤ h(t) zeigt dies die Behauptung (3.6.3). • F¨ ur a = 0 gelten Voraussetzung und Resultat f¨ ur alle a ˆ > 0. Also ist F = 0. 2 3.43 Bemerkung (Gronwall–Gleichung) Man kann sich die Absch¨atzung leicht merken, wenn man Gleichheit annimmt. Die Integralgleichung t F (t) = a + t0 F (s)G(s) ds F˙ = F G, F (t0 ) = a mit der L¨osung entspricht ja dem Anfangswertproblem t F (t) = a exp t0 G(s) ds . 3
3.6.1
Linearisierung der DGL entlang einer Trajektorie
Zur Vorbereitung des Beweises des Hauptsatzes lernen wir zun¨achst, welcher Differentialgleichung die Ableitung der L¨ osung nach dem Anfangswert gen¨ ugen sollte. Nehmen wir dazu schon einmal an, dass sowohl das Vektorfeld f in (3.6.1) als auch die L¨osung Φ stetig differenzierbar sind und setzen M (t, x) := D2 Φ(t, x) ∈ Mat(n, R). ˜ x) := D2 f (t, x) ∈ Mat(n, R) aus Dann folgt mit A(t,
t
Φ(t, x) = x + t0
f s, Φ(s, x) ds
(3.6.4)
52
3.6. Der Hauptsatz der Differentialgleichungstheorie
die Integralgleichung
t
A(s, x)M (s, x) ds
M (t, x) = 1l +
(3.6.5)
t0
mit A(s, x) := A˜ s, Φ(s, x) . A ist als Komposition stetiger Abbildungen stetig. Wir untersuchen Integralgleichungen vom Typ (3.6.5) zun¨achst f¨ ur beliebige stetige A. Sie sind ¨aquivalent zum linearen Anfangswertproblem D1 M (t, x) = A(t, x)M (t, x)
,
M (t0 , x) = 1l.
(3.6.6)
Die im folgenden Lemma konstatierte Stetigkeit der L¨osung von (3.6.6) in Zeit t und Parameter x folgt nicht aus schon bewiesenen Aussagen wie Satz 3.34. 3.44 Lemma Es sei D ⊆ Rt ×Rnx eine offene Umgebung von (t0 , x0 ), die (wie D aus Satz 3.39) die Zeitachsen Rt × {x} in t0 enthaltenden Intervallen schneidet. F¨ ur A ∈ C D, Mat(n, R) besitzt dann das Anfangswertproblem (3.6.6) eine eindeutige L¨osung M ∈ C D, Mat(n, R) . Beweis: • Nach Satz 3.23 besitzt f¨ ur den Anfangswert (t0 , 1l) das Anfangswertproblem (3.6.6) eine eindeutige L¨ osung. Denn x ist nur ein Parameter, und A ist stetig in t, das zeitabh¨angige Vektorfeld (t, M ) → A(t, x)M also lipschitz–stetig. • Um auch Stetigkeit von M in (t, x) zu zeigen, gen¨ ugt es, sich auf kompakte Umgebungen K ⊂ D von (t0 , x0 ) der Form K := Uδt (t0 ) × Uδx (x0 ) zu beschr¨anken. Es ist k := sup(t,x)∈K A(t, x) < ∞, also nach (3.6.5) t
M (t, x) ≤ 1 + k
M (s, x) ds t0
und mit dem Gronwall–Lemma (Satz 3.42) sup M (t, x) ≤ ekδt .
(3.6.7)
(t,x)∈K
• Aus (3.6.5) folgt die Identit¨at M (t, x) − M (t, x0 )
t
= t0 t
+
t0
A(s, x0 ) M (s, x) − M (s, x0 ) ds A(s, x) − A(s, x0 ) M (s, x) ds. (3.6.8)
3. Gew¨ohnliche Differentialgleichungen
53
Der zweite Term besitzt eine radiusabh¨angige obere Schranke a(δx ) > 0 mit limδx 0 a(δx ) = 0. Denn die stetige Funktion A ist auf dem Kompaktum K gleichm¨aßig stetig, und die Norm von M ist durch (3.6.7) beschr¨ankt. Damit ergibt sich f¨ ur Fx (t) := M (t, x) − M (t, x0 ) aus (3.6.8): t Fx (t) ≤ a(δx ) + k Fx (s) ds . t0
Die Gronwallsche Ungleichung macht daraus Fx (t) ≤ a(δx ) exp(k|t − t0 |) ≤ a(δx ) exp(kδt )
x ∈ Uδx (x0 ) ,
also limx→x0 M (t, x) = M (t, x0 ) gleichm¨aßig in t ∈ [t0 − δt , t0 + δt ].
2
Damit sind wir in der Lage, den Hauptsatz der Theorie der gew¨ohnlichen Differentialgleichungen zu beweisen.
3.6.2
Aussage und Beweis des Hauptsatzes
Das zeitabh¨angige Vektorfeld f auf dem erweiterten Phasenraum U ⊆ R × Rn sei in C r (U, Rn ). Wir fixieren eine Anfangszeit t0 ∈ R und ur An betrachten f¨ fangswert (t0 , x0 ) ∈ U das maximale L¨ osungsintervall T − (x0 ), T + (x0 ) des AWP (3.6.9) x˙ = f (t, x) , x(t0 ) = x0 . Wie im zeitunabh¨angigen Fall bekommen wir einen in U offenen maximalen Definitionsbereich D = (t, x) ∈ U | t ∈ T − (x), T + (x) des nichtautonomen Flusses Φ : D → Rn , mit Φ(t0 , x0 ) = x0
und
d Φ(t, x0 ) = f t, Φ(t, x0 ) . dt
(3.6.10)
Der nichtautonome Fluss ist so glatt wie das Vektorfeld: 3.45 Satz (Hauptsatz der Theorie gew¨ ohnlicher Differentialgleichungen) ur r ∈ N, dann ist Ist in (3.6.9) das zeitabh¨angige Vektorfeld f ∈ C r (U, Rn ) f¨ Φ ∈ C r (D, Rn ). Beweis: • Wir wissen von Satz 3.20, dass f¨ ur r = 1 gilt: Φ ∈ C 0 (D, Rn ). Auch die Zeitableitung der L¨ osung existiert, mit D1 Φ ∈ C 0 (D, Rn ), denn dies folgt aus der zweiten Formel in (3.6.10). Unser erstes Ziel ist zu zeigen, dass aus f ∈ C 1 (U, Rn ) auch Φ ∈ C 1 (D, Rn ) folgt. Da die Zeitableitung D1 Φ stetig ist, muss nur noch die Existenz und
54
3.6. Der Hauptsatz der Differentialgleichungstheorie
Stetigkeit der Ableitung D2 Φ : D → Mat(n, R) nachgewiesen werden. Falls D2 Φ existiert, muss diese Abbildung auch stetig sein, denn dann ist D2 Φ = M mit der L¨osung M der Integralgleichung t M (t, x) = 1l + A(s, x)M (s, x) ds, t0
siehe Lemma 3.44. Nach Definition der totalen Ableitung muss gezeigtwerden, dass f¨ ur Anfangs wert (t0 , x0 ) ∈ U und Zeiten t ∈ T − (x0 ), T + (x0 ) gilt: Φ(t, x0 + h) − Φ(t, x0 ) = M (t, x0 )h + o ( h ).
(3.6.11)
• Wir k¨onnen das zeitabh¨angige Vektorfeld bei (t, x) nach Taylor entwickeln und erhalten f (t, y) = f (t, x) + D2 f (t, x)(y − x) + R(t, x, y)
(3.6.12)
mit Restterm R(t, x, y) = o ( y − x ).
Es ergibt sich wegen A(s, x0 ) = D2 f s, Φ(s, x0 ) und (3.6.12) aus (3.6.4) und (3.6.5) die folgende Abweichung von der Linearit¨at: Φ(t, x0 + h) − Φ(t, x0 ) − M (t, x0 )h t f s, Φ(s, x0 + h) − f s, Φ(s, x0 ) − A(s, x0 )M (s, x0 )h ds = t0 t
=
& % D2 f s, Φ(s, x0 ) · Φ(s, x0 + h) − Φ(s, x0 ) − M (s, x0 )h ds
t0
t
+
R s, Φ(s, x0 ), Φ(s, x0 + h) ds.
(3.6.13)
t0
Die Stetigkeit von Φ verbessert sich durch eine Gronwall–Absch¨atzung zun¨achst zur Lipschitz–Stetigkeit s ∈ [t0 − δt , t0 + δt ] ,
Φ(s, x0 + h) − Φ(s, x0 ) = O( h ) gleichm¨aßig im Zeitintervall. Wegen der Resttermabsch¨atzung ist daher der zweite Term in (3.6.13) von der Ordnung o ( h ). Mit der Abk¨ urzung F (x) := Φ(t, x0 + h) − Φ(t, x0 ) − M (t, x0 )h
schreiben wir damit f¨ ur k := sups D2 f (s, Φ(s, x0 )) den Betrag von (3.6.13) in der Form t F (s) ds , F (t) ≤ o ( h ) + k t0
3. Gew¨ohnliche Differentialgleichungen
55
also nach Gronwall F (t) = o ( h )ek|t−t0 | = o ( h )
t ∈ [t0 − δt , t0 + δx ] .
Damit ist (3.6.11) bewiesen. • Um f¨ ur r ≥ 2 und f ∈ C r (U, Rn ) zu zeigen, dass auch der Fluss r–mal stetig differenzierbar ist, benutzen wir ein Induktionsargument. Dazu setzen wir f˜ : U × Rn → Rn × Rn , f˜(t, x, h) := f (t, x), D2 f (t, x)h . ˜ , Rn × Rn ) ein zeitabh¨angiges Vektorfeld auf dem erDamit ist f˜ ∈ C r−1 (U ˜ := U × Rn . Nach dem eben Bewiesenen ist f¨ weiterten Phasenraum U ur n ˜ := D × R D ˜ x0 , h0 ) := Φ(t, x0 ), D2 Φ(t, x0 )h0 ˜ :D ˜ → Rn × Rn , Φ(t, Φ eine stetige Abbildung, die das Anfangswertproblem d (x, h) = f˜(t, x, h) dt
, (x, h)(t0 ) = (x0 , h0 )
˜ stetig ist. Um Φ ˜ ∈ l¨ost. Wir wissen auch schon, dass die Zeitableitung D1 Φ 1 ˜ n n ˜ C (D, R ×R ) zu zeigen, m¨ ussen wir nur die Existenz und Stetigkeit von D2 Φ zeigen. Dies geht wie der obige Beweis der Existenz und Stetigkeit von D2 Φ. Der Induktionsschritt l¨asst sich r–mal anwenden, und wir erhalten Dr Φ ∈ C 0 , also Φ ∈ C r (D, Rn ). 2
3.6.3
Folgerungen aus dem Hauptsatz
In der N¨ahe einer Gleichgewichtslage k¨ onnen wir ein autonomes Differentialgleichungssystem zwar linearisieren, aber der Zusammenhang zwischen den L¨osungen der beiden Differentialgleichungen ist nicht immer sehr eng (siehe Kapitel 7). Anders ist die Situation in der N¨ahe einer Nichtgleichgewichtslage: 3.46 Satz (Satz u ¨ber die Begradigung) Es sei U ⊆ Rn offen und f¨ ur ein r ∈ N das Vektorfeld f ∈ C r (U, Rn ). Ist dann x0 ∈ U keine Gleichgewichtslage, dann existiert ein C r –Diffeomorphismus G:V →W von einer Umgebung V von x0 auf W ⊆ R mit DGx f (x) = e1 = n
f¨ ur alle x ∈ V .
1 0
.. .
∈ Rn
0
3.47 Bemerkung In geeigneten Koordinaten auf V ist also das Vektorfeld f konstant und damit die L¨ osung eine affine Funktion der Zeit. 3
56
3.6. Der Hauptsatz der Differentialgleichungstheorie
ur kleine ε > 0 Beweis: Da f (x0 ) = 0 ist, ist f¨ Fε := {x ∈ Uε (x0 ) | x − x0 , f (x0 ) = 0} eine Kreisscheibe der Dimension n − 1, und f (x), f (x0 ) > 0
x ∈ Uε (x0 ) .
(3.6.14)
Durch eine euklidische Transformation T des R , also eine Komposition einer Translation onnen wir erreichen, dass T (x0 ) = 0 und und einer Drehung, k¨ T f (x0 ) = λe1 mit λ > 0 gilt, also T (Fε ) = y ∈ Rn | y1 = 0, y < ε . n
Zur Vereinfachung der Notation nehmen wir an, dass f und x0 selbst schon die Eigenschaften x0 = 0 und f (x0 ) = λe1 mit λ > 0 haben. Wir betrachten den ur kleine δ > 0 ist ΦZδ : Zδ → Uε (x0 ) injektiv, Zylinder Zδ := (−δ, δ) × Fδ . F¨ denn solange Φt (x) ∈ Uε ist, gilt wegen (3.6.14) d Φ(t, x) = f1 Φ(t, x) > 0, dt 1 wir k¨onnen also mit der Trajektorie nicht zum zweiten Mal Fδ schneiden. Nach dem Hauptsatz ist ΦZδ ein C r –Diffeomorphismus auf sein Bild V := Φ(Zδ ), und auch die Umkehrabbildung G ist ein C r –Diffeomorphismus. 2 Oft h¨angen Differentialgleichungen von Parametern p ∈ P ab, wie etwa Masse und L¨ange eines Pendels. Wir betrachten also das parametrisierte Anfangswertproblem (3.6.15) x˙ = f (t, x, p) , x(t0 ) = x0 mit U ⊆ R × Rn und P ⊆ Rd offen und f ∈ C r (U × P, Rn ). 3.48 Satz Es sei D ⊆ U × P der maximale Definitionsbereich des parametrisierten Anfangswertproblems (3.6.15). Dann ist die L¨osung Φ ∈ C r (D, Rn ). ¨ Beweis: Dies folgt direkt durch Ubergang zum Anfangswertproblem (x, ˙ p) ˙ = f˜(t, x, p) , (x, p)(t0 ) = (x0 , p0 ) mit dem zeitabh¨angigen Vektorfeld ˜ , Rn × Rd , f˜(t, x, p) := f (t, x, p), 0 f˜ ∈ C r U ˜ := U × P , denn dieses l¨asst den Parameterwert invariant und besitzt eine auf U ˜ ∈ C r (D, Rn+d ). 2 L¨osung Φ Die wichtigste Folgerung aus dem Hauptsatz ist aber: In der N¨ahe eine Nichtgleichgewichtslage besitzen glatte Differentialgleichungen keine lokale Struktur. Alle interessanten Fragen sind globaler Natur, also Fragen an das Verhalten der L¨osung f¨ ur große Zeiten. 3.49 Weiterf¨ uhrende Literatur Standardtexte sind die B¨ ucher von Amann [Am], Arnol’d [Ar1], Heuser [Heu], Perko [Per] und Walter [Wa1].
Kapitel 4
Lineare Dynamik
4.1 Homogene lineare autonome DGLn . . . . . . . . . . . . . 58 ¨ 4.2 Explizit zeitabhangige lineare DGLn . . . . . . . . . . . . . 65 4.3 Quasipolynome . . . . . . . . . . . . . . . . . . . . . . . . 70
Eine besonders wichtige Klasse von Differentialgleichungen sind die linearen, und wir k¨onnen mit Satz 3.29 annehmen, dass das System von erster Ordnung ist. Das inhomogene Anfangswertproblem lautet dann x(t) ˙ = A(t) x(t) + b(t) ,
x(t0 ) = x0 ,
(4.0.1)
mit Systemmatrix A : I → Mat(n, R) und St¨orfunktion b : I → Rn , t0 im Intervall I und x0 ∈ Rn . Die L¨ osungsstrategie besteht darin, zun¨achst das homogene AWP (4.0.2) y˙ = A(t)y , y(t0 ) = x0 A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 4,
57
58
4.1. Homogene lineare autonome DGLn
zu l¨osen, und danach (4.0.1) mittels des so genannten Duhamel–Prinzips, d.h. durch eine Integration. Formal ist f¨ ur den Fall einer konstanten Systemmatrix A y(t) := exp (t − t0 )A x0 (t ∈ R) (4.0.3) die L¨osung von (4.0.2), denn Anwendung der Differentiationsregel exp = exp auf y ergibt Ay, und y(t0 ) = x0 .
4.1
Homogene lineare autonome DGLn
Exponentiation von Matrizen Zur Definition und Rechtfertigung von (4.0.3) untersuchen wir jetzt matrixwertige Funktionen, und zwar f¨ ur Vektorr¨aume u ¨ber den K¨orpern K = R und K = C. Die Exponentialfunktion ist wie in Dimension n = 1 durch ihre Potenzreihe erkl¨art: 4.1 Definition • F¨ ur einen Endomorphismus M ∈ Lin(V ) eines endlich-dimensionalen K–Vektorraums V ist exp(M ) ∈ Lin(V ) definiert durch exp(M ) :=
∞ M (k) k=0
(4.1.1)
k!
(mit M (0) = IdV und M (k+1) = M ◦ M (k) ). • Analog wird das Matrixexponential von Matrizen in Mat(n, K) gebildet. Warum aber l¨ost das Matrixexponential f¨ ur konstante Systemmatrix das homogene Anfangswertproblem (4.0.2)? Diese Frage ist nicht rein akademisch, denn t ist die Matrix A zeitabh¨angig, dann l¨ ost die Abbildung t → exp t0 A(s) ds x0 (4.0.2) nicht, außer f¨ ur Spezialf¨alle wie Dimension n = 1. Wir haben mit (4.1.1) eine Reihe vor uns, deren Summanden Elemente von Lin(V ), dem Raum der (beschr¨ankten) linearen Abbildungen von V in V sind. Sei etwa V = Kn , mit euklidischer Norm · . Die Operatornorm auf Lin(Kn )
M :=
sup v∈Kn \{0}
M (v) v
=
sup
M (v)
v∈Kn , v=1
ist dann zus¨atzlich zu den Eigenschaften M ≥ 0, M = 0 ⇐⇒ M = 0,
λM = |λ| M
(λ ∈ K)
und M + N ≤ M + N
jeder Norm noch submultiplikativ : 4.2 Lemma F¨ ur M, N ∈ Lin(Kn ) gilt: M N ≤ M N .
4. Lineare Dynamik
59
Beweis: Durch Erweitern ergibt sich f¨ ur M N = supv=0
M N = sup v: N v=0
M N v N v
·
N v v
≤ supw=0
M w w
· supv=0
M N v v : N v v
= M N , 2
außer f¨ ur N = 0, wo sowieso beide Seiten Null sind. Die obige Definition von exp(M ) ist sinnvoll, weil konvergent:
4.3 Lemma (Matrixexponential) F¨ ur M ∈ Lin(Kn ) bilden die Partialsummen
k M () sk := =0 ! (k ∈ N) von exp(M ) eine Cauchy–Folge. Beweis: F¨ ur k1 ≥ k0 ≥ M gilt nach der Dreiecksungleichung und Lemma 4.2
sk1 − sk0
=
k k1 1 M () ≤ ! =k0 +1
≤
M k0 +1 (k0 +1)!
M () !
≤
k1 =k0 +1
=k0 +1
k1 −k0 −1 m=0
M m (k0 +1)m
≤
M k0 +1 (k0 +1)!
1−
M ! M k0 +1
−1
.
Dieser Ausdruck geht f¨ ur k0 → ∞ gegen Null, denn die Fakult¨at w¨achst schneller als die (reelle) Exponentialfunktion. 2 Nebenbei stellen wir fest, dass wir an keiner Stelle vorausgesetzt haben, dass der lineare Endomorphismus beziehungsweise die Matrix reell ist. Dies ist g¨ unstig, denn die Jordan–Normalform von A in (4.0.2), und damit von exp(At), kann auch komplex sein. Um nun zu sehen, dass (4.0.3) das Anfangswertproblem (4.0.2) tats¨achlich l¨ost, m¨ ussen wir in der Lage sein, die Abbildung R −→ Lin(Kn )
, t −→ exp(At)
nach dem Zeitparameter zu differenzieren. Sp¨ater werden wir uns auch fragen, wie die L¨osungen von eventuellen Parametern der linearen DGL abh¨angen. F¨ ur diese Art von Fragestellungen wertet man die Exponentialfunktion f¨ ur mehr als ein Argument aus, man betrachtet also die Abbildung exp : Lin(Kn ) → Lin(Kn )
, M → exp(M )
in ihrer Abh¨angigkeit vom Argument M . Hier hilft das Weierstraß–Kriterium: 4.4 Satz (Weierstraß) Es sei (V, · ) ein Banach–Raum, X ⊆ V und fl : X → V
(l ∈ N0 )
seien Funktionen
∞ mit supx∈X fl (x) ≤ al mit die Reihe l=0 fl auf X gleichm¨aßig.
∞ l=0
al < ∞. Dann konvergiert
60
4.1. Homogene lineare autonome DGLn
Beweis: Das Beweisargument f¨ ur reelle Funktionenreihen l¨asst sich verallgemeinern: Wegen der Vollst¨andigkeit des metrischen Raumes V haben wir punktweise
l Konvergenz der Partialsummen sl := m=0 fm , das heißt: s(x) := lim sl (x) l→∞
(x ∈ X).
n F¨ ur alle ε > 0 gibt es nach Annahme
n ein m ∈ N mit l=m+1 al < ε (n > m). Daher folgt sn (x) − sm (x) ≤ l=m+1 al < ε (x ∈ X), also gleichm¨aßige Konvergenz auf X. 2 4.5 Satz (Exponentialabbildung) F¨ ur A ∈ Lin(Kn ) ist die Abbildung , t → exp(At)
R → Lin(Kn ) stetig differenzierbar, und es gilt d dt
exp(At) = A exp(At).
(4.1.2) (l)
Beweis: • Setzen wir V := Lin(Kn ) und fl : X → V, M → Ml! in Satz 4.4 ein, so gilt f¨ ur alle l ∈ N: supM ∈V fl (M ) = ∞. Wir k¨onnen also im Satz von Weierstraß als Definitionsbereich X nicht den gesamten Vektorraum V w¨ahlen. • F¨ ur die Vollkugel X := {M ∈ V | M ≤ r} mit Radius r > 0 ist aber al := sup fl (M ) =
∞
M ∈X
1 rl sup M (l) ≤ , l! M ∈X l!
ur jede Wahl von r. und die Reihe l=0 al ≤ exp(r) konvergiert f¨ • Deshalb ist die Exponentialabbildung als Limes gleichm¨aßig konvergenter stetiger Funktionen sl X : X → V auch stetig, und, da die Ableitungen Dsl auf X ebenfalls gleichm¨aßig konvergent sind, auch differenzierbar. Damit ist die Formel (4.1.2) richtig, und aus ihr ergibt sich auch die Stetigkeit der Ableitung. 2 Verwendung der Jordan–Normalform Die konkrete Berechnung von exp(At) kann mittels der Jordan–Normalform von A erfolgen. ⎞ ⎛λ 1 0 .. .. ⎠ . .1 ∈ 4.6 Definition • F¨ ur λ ∈ K und r ∈ N heißt Jr (λ) := ⎝ .. . 0 λ Mat(r, K) r × r–Jordan–Block mit Eigenwert λ. • Eine Jordan–Matrix ist eine quadratische Matrix der Form ⎛ J (λ ) ⎞ 0 r1
1
⎜ J =⎝
⎟ ⎠ ≡ Jr1 (λ1 ) ⊕ . . . ⊕ Jrk (λk ).
Jr2 (λ2 )
.. 0
. Jrk (λk )
(4.1.3)
4. Lineare Dynamik
61
• Eine Jordan–Basis eines Operators A ∈ Lin(V ) auf dem K–Vektorraum V ist eine Basis von V , in der die darstellende Matrix von A eine Jordan–Matrix ist. Aus der Linearen Algebra ist der (konstruktive) Beweis des folgenden Satzes bekannt: 4.7 Satz Sei V ein endlich–dimensionaler C–Vektorraum und A ∈ Lin(V ). Dann existiert eine Jordan–Basis f¨ ur A. Da der Vektorraum V isomorph zu Cn mit n := dim(V ) ist, k¨onnen wir A in der Form A = W JW −1
, mit Jordan–Matrix J ∈ Mat(n, C) und W ∈ GL(n, C)
schreiben, wenn wir die darstellende Matrix ebenfalls mit A bezeichnen. Wegen Mat(n, R) ⊂ Mat(n, C) k¨ onnen wir insbesondere reelle quadratische Matrizen A Jordan-diagonalisieren, aber J ist im Allgemeinen nicht mehr reell (wir komplexifizieren A also im Sinne der Linearen Algebra). 0 −1 4.8 Beispiel (Jordan–Basis) A = besitzt die komplexen 1 0 1 1 1 i Eigenwerte 1 1 −1 √ √ ±i. Die Matrix W := 2 −i i ∈ GL(2, C), mit W = 2 1 −i , diagonalisiert A: 0 W −1 AW = 0i −i 3 = J1 (i) ⊕ J1 (−i). Wie in diesem Beispiel existiert allgemein zu jedem nicht reellen Eigenwert λ von A ∈ Mat (n, R) und Jordan–Block Jr (λ) ein Eigenwert λ gleicher Multiplizit¨at 1 und ein Jordan–Block Jr (λ), denn das charakteristische Polynom von A l¨asst sich in R in Faktoren h¨ ochstens zweiten Grades zerlegen (siehe Abbildung 4.1.1).
Imλ
(2)
(3)
(4)
Reλ (1) (3)
(2)
Abbildung 4.1.1: Komplexe Eigenwerte (mit Multiplizit¨aten) einer reellen Matrix 1 Die algebraische Vielfachheit oder Multiplizit¨ at von λ ∈ C ist die Ordnung der Nullstelle λ des charakteristischen Polynoms x → det(A − x1l), die geometrische der Defekt von A − λ1l.
62
4.1. Homogene lineare autonome DGLn exp(At) = W exp(Jt)W −1
Es gilt
(t ∈ R).
Das folgt aus der Potenzreihe des Matrixexponentials unter Benutzung von Am = (W JW −1 )m = W J m W −1 . Da f¨ ur die Jordan–Matrix J aus (4.1.3) exp(Jt) gleich ⎛ ⎞ exp Jr1 (λ1 )t 0 ⎜ ⎟ .. ⎝ ⎠ ≡ exp Jr1 (λ1 )t ⊕ . . . ⊕ exp Jrk (λk )t . 0
exp Jrk (λk )t
(4.1.4) = J (0) + λ1 l. Jr (0) ist, gen¨ ugt es, exp Jr (λ)t zu berechnen. Nun gilt Jr (λ) r und λ1l kommutieren aber, was die Berechnung von exp Jr (λ)t erleichtert: 4.9 Lemma F¨ ur kommutierende (BC = CB) Matrizen B, C ∈ Mat (n, C) gilt exp(B + C) = exp(B) exp(C). Beweis: Formal ergibt sich die Identit¨at durch Einsetzen in die Definition von exp: ∞ ∞ n 1 1 n BC=CB B i C n−i (B + C)n = exp(B + C) = i n! n! n=0 n=0 i=0 ⎞ ⎛ ∞ ∞ ∞ n 1 1 1 = B i C n−i = Bi ⎝ Cj⎠ , i!(n − i)! i! j! n=0 i=0 i=0 j=0 also exp(B) exp(C). Diese formale Rechnung ist nach einem Satz u ¨ber das Cauchy–Produkt von Reihen erlaubt, denn diese sind absolut konvergent. 2 4.10 Bemerkungen 1. Als Gegenbeispiel gilt f¨ ur die Dreiecksmatrizen B := ( 00 10 ) und C := B = ( 01 00 ): exp(Bt) = ( 10 1t ) und exp(Ct) = ( 1t 01 ), also 2 t t und exp(Ct) exp(Bt) = 1t 1+t . exp(Bt) exp(Ct) = 1+t 2 t 1 10 ( 0 1 ) , n gerade n Dagegen folgt aus (B + C)n = ( 01 10 ) = ( 01 10 ) , n ungerade
∞
∞ t2m t2m+1 t sinh t exp (B+C)t = ( 10 01 ) m=0 (2m)! + ( 01 10 ) m=0 (2m+1)! = cosh sinh t cosh t . (4.1.5) 2. F¨ ur alle A ∈ Mat (n, K) gilt die Funktionalgleichung exp(At1 ) exp(At2 ) = exp A (t1 + t2 )
(t1 , t2 ∈ R),
da Vielfache einer Matrix miteinander kommutieren. Der f¨ ur A ∈ Mat (n, R) die Differentialgleichung x˙ = Ax l¨osende lineare Fluss Φt : Rn → Rn
, Φt (x) = exp(At)x
bildet also eine einparametrige Gruppe.
(t ∈ R) 3
4. Lineare Dynamik
63
F¨ ur die Jordan–Bl¨ ocke in (4.1.4) gilt exp Jr (λ)t = exp Jr (0)t exp λt1l . ∞ 1 n n exp(λt1l) ist gleich exp(λt)1l und exp Jr (0)t = n=0 n! Jr (0) t mit n i, k ∈ {1, . . . , r} , Jr (0) i,k = δi,k−n also
⎛
1 t
··· ···
⎜ ⎜0 1 t ⎜ exp Jr (λ)t = exp(λt) ⎜ .. . . . . . . ⎜. . . . ⎝. .. .. .. . . 0 ··· ···
tr−1 (r−1)!
.. . .. .
⎞ ⎟ ⎟ ⎟ ⎟. ⎟ ⎠
(4.1.6)
t 1
0
4.11 Aufgabe (Matrixexponential) 1 0 0 L¨osen Sie das Differentialgleichungssystem x˙ = Ax mit A = 1 1 0 . 111
3
Verwendung der reellen Jordan–Normalform F¨ ur A ∈ Mat (n, R) ist es oft sinnvoll, die reelle Jordan–Normalform von exp(At) zu benutzen. Dabei setzt man f¨ ur reelle Eigenwerte einfach JrR (λ) := Jr (λ)
(λ ∈ R).
F¨ ur λ ∈ C\R transformiert man Paare von Jordan–Bl¨ocken der Gestalt Jr (λ) 0 , 0 J (λ) r
unter Benutzung von X := JrR (λ) := X
√1 2
Jr (λ) 0 0 Jr (λ)
1lr 1lr −i1lr i1lr
X −1 =
in die reelle Normalform
Jr (μ) −ϕ1lr ϕ1lr Jr (μ)
(λ ∈ C\R)
mit μ := Re(λ) und ϕ := Im(λ). Es ist exp JrR (λ)t gleich J (0)t Jr (λ) 0 − sin(ϕt)eJr (0)t −1 μt cos(ϕt)e r Xexp t X , = e Jr (0)t Jr (0)t 0 J (λ)
(4.1.7)
also im Spezialfall r = 1 einfacher Multiplizit¨at − sin(ϕt) . exp J1R (λ)t = eμt cos(ϕt) sin(ϕt) cos(ϕt)
(4.1.8)
sin(ϕt)e
r
cos(ϕt)e
Bedeutung der Spur Unter einem Diffeomorphismus g : Rn → Rn besitzt das Bild g(Λ) einer kompakten Teilmenge Λ ⊂ Rn das Volumen det Dg(x) dx, Vn g(Λ) = Λ
64
4.1. Homogene lineare autonome DGLn
der Betrag der Funktionaldeterminante bei x ∈ Λ ist also der Faktor, um den bei x das Volumen durch g vergr¨ oßert wird (Transformationssatz). Betrachten wir nun f¨ ur die Zeit t ∈ R den L¨ osungsoperator der Differentialgleichung x˙ = Ax, also die lineare Abbildung Φt ∈ Lin(Rn )
, Φt (x) = exp(At)x.
Wie bei jeder linearen Abbildung ist die Ableitung konstant: DΦt (x) = exp(At)
(x ∈ Rn ),
(4.1.9)
und es gilt 4.12 Satz F¨ ur A ∈ Lin(Cn ) gilt
det exp(A) = exp tr(A) .
Beweis: Dies folgt aus der Existenz einer Jordan–Basis, also von W ∈ GL(n, C) mit W −1 AW = J und Jordan–Matrix J. Es ist in der Notation (4.1.3) f¨ ur J −1 det exp(A) = det W exp(A)W = det exp(W −1 AW ) = det exp(J) !k !k = =1 det exp(Jr (λ )) = =1 exp(r λ )
und andererseits tr(A) = tr(W −1 AW ) = tr(J) = tr Jr (λ ) = r λ , sodass sich die Aussage aus der Funktionalgleichung der komplexen Exponentialfunktion ergibt. 2 Folgerung: Der von A ∈ Mat(n, R) erzeugte lineare Fluss Φt (x) = exp(At)x auf dem Phasenraum Rn ist genau dann volumenerhaltend, wenn tr(A) = 0. 4.13 Bemerkung (reelle Allgemeine Lineare Gruppe) GL(n, R), die Gruppe der invertierbaren Matrizen in Mat(n, R), ist das wichtigste Beispiel einer Lie–Gruppe. GL(n, R) ist die offene Teilmenge derjenigen Matrizen ur die det(A) = 0 gilt. Damit A im n2 –dimensionalen Vektorraum Mat(n, R), f¨ wird GL(n, R) zu einer Untermannigfaltigkeit von Mat(n, R), siehe Definition 2.34. Matrizenmultiplikation und Inversion sind in den Matrizeneintr¨agen glatt (letzteres folgt aus der Cramerschen Regel der Linearen Algebra). Betrachten wir die Abbildung Mat(n, R) → GL(n, R) , u → exp(u), dann liegt das Bild der Exponentialfunktion tats¨achlich in GL(n, R), denn det exp(u) = exp tr(u) > 0. Da g ∈ GL(n, R) mit det(g) < 0 existieren, ist klar, dass exp nicht surjektiv ist (sondern das Bild die Untergruppe GL+ (n, R) ist, siehe Beispiel E.18). Andererseits ist die Exponentialabbildung mindestens f¨ ur A ∈ GL(n, R) mit
1l − A < 1 invertierbar, denn die Potenzreihe der Umkehrfunktion konvergiert dann: ∞ (1l − A)k ln(A) = ln 1l − (1l − A) = − . k k=1
4. Lineare Dynamik
65
Mat(n, R) mit dem Kommutator bildet eine sogenannte Lie–Algebra 2 . Der Kommutator [u1 , u2 ] = u1 u2 − u2 u1 von u1 , u2 ∈ Mat(n, R) misst den Mangel an Kommutativit¨at in der Gruppenmultiplikation, denn exp(εu1 ) exp(εu2 ) exp(−εu1 ) exp(−εu2 ) = 1l + ε2 [u1 , u2 ] + O(ε3 ). Man nennt daher Mat(n, R) die Lie–Algebra von GL(n, R).
4.2
3
Explizit zeitabh¨ angige lineare DGLn
Das homogene Problem Wir betrachten zun¨achst auf dem t0 enthaltenden Zeitintervall I das homogene, lineare, aber nichtautonome (das heißt explizit zeitabh¨angige) Anfangswertproblem y(t) ˙ = A(t)y(t) , y(t0 ) = y0 , (4.2.1) wobei A : I → Mat(n, R) eine stetige matrixwertige Funktion ist. 4.14 Satz Das Anfangswertproblem (4.2.1) hat eine eindeutige L¨osung t (4.2.2) y : I → R mit y(t) ≤ exp t0 A(s) ds y0 . Beweis: • Es gen¨ ugt, t ≥ t0 zu betrachten, denn (4.2.2) ist invariant unter Zeitumkehr. • Die eindeutige L¨ osbarkeit des Anfangswertproblems f¨ ur das zeitabh¨angige Vektorfeld (t, x) → A(t)x auf dem Intervall I folgt mit der zeitabh¨angigen Lipschitz–Konstante L(t) := A(t) aus Satz 3.23. t • z(t) := exp − t0 A(s) ds y(t) erf¨ ullt f¨ ur t ∈ I das Anfangswertproblem z(t) ˙ = N (t)z(t)
,
z(0) = y0
mit
N (t) := A(t) − A(t) 1l,
wie man durch Differentiation nachpr¨ uft. Die Absch¨atzung (4.2.2) folgt, wenn wir (t ≥ t0 , t ∈ I) (4.2.3)
z(t) ≤ y0
bewiesen haben. Nun ist mit S(t) := N (t) + N (t) f¨ ur t ≥ t 0 d 2 dt z(t)
= z(t), ˙ z(t) + z(t), z(t) ˙ = N (t)z(t), z(t) + z(t), N (t)z(t) = z(t), S(t)z(t) ≤ 0,
(4.2.4)
denn S(t) ist selbstadjungiert und besitzt nur Eigenwerte E ≤ 0. 2 Definition: Eine Lie–Algebra ist ein Vektorraum E mit einer bilinearen alternierenden Abbildung [·, ·] : E × E → E, die die Jacobi–Identit¨ at [A, [B, C]] + [B, [C, A]] + [C, [A, B]] = 0 erf¨ ullt (siehe auch Anhang E.3).
66
4.2. Explizit zeitabh¨angige lineare DGLn
Letzteres sieht man so: W¨are S(t)v = Ev mit v ∈ Rn \ {0} und E > 0, dann w¨ urde auch (A(t) + A(t) )v = (E + 2 A(t) )v gelten, also
A(t) + A(t) > 2 A(t) = A(t) + A(t) , im Widerspruch zur Dreiecksungleichung der Operatornorm. Aus (4.2.4) folgt aber (4.2.3). 2 Sind ϕ1 , ϕ2 : I → Rn L¨ osungen der DGL y(t) ˙ = A(t)y(t) und c1 , c2 ∈ R, dann ist auch c1 ϕ1 + c2 ϕ2 : I → Rn L¨ osung der Differentialgleichung. Die Menge ˙ = A(t)ϕ(t), t ∈ I (4.2.5) L0 := ϕ ∈ C 1 (I, Rn ) | ϕ(t) der L¨osungen bildet also einen R–Untervektorraum von C 1 (I, Rn ), den (homogenen) L¨osungsraum. Ist t0 ∈ I, so ist wegen der lokalen Existenz und Eindeutigkeit der L¨osung des Anfangswertproblems die lineare Abbildung Bt0 : L0 → Rn
,
ϕ → ϕ(t0 )
ein Isomorphismus, es ist also dim(L0 ) = n. 4.15 Definition Eine Basis des homogenen L¨osungsraumes L0 heißt Fundamentalsystem von L¨osungen der Differentialgleichung. Da die L¨osung des homogenen Differentialgleichungssystems (4.2.1) linear von osung in der Form y0 abh¨angt, erhalten wir die allgemeine L¨ yh (t) = Φ(t, s)yh (s) mit dem L¨osungsoperator Φ : I ×I → Mat(n, R). Im Fall einer zeitunabh¨angigen Matrix A ist Φ(t, s) = exp (t − s) A (t, s ∈ R). Allgemein gilt d dt Φ(t, s)
= A(t)Φ(t, s) und Φ(s, s) = 1l .
(4.2.6)
4.16 Bemerkungen 1. Auch wenn diese Familie von Matrizen von zwei Parametern, der Anfangszeit s und der Endzeit t abh¨angt, gen¨ ugt es, f¨ ur ein einziges t0 ∈ I die einparametrige Familie t → Φ(t, t0 )
(t ∈ I)
zu kennen, denn es gilt Φ(t, s) = Φ(t, t0 ) Φ(t0 , s) = Φ(t, t0 ) Φ(s, t0 )−1 . 2. Trotzdem ist die L¨ osung dieses homogenen nicht autonomen Problems oft eine Matrix, deren Eintr¨age keine elementaren Funktionen sind, auch wenn die Eintr¨age von A elementare Funktionen sind. Tats¨achlich werden viele sogenannte h¨ohere Funktionen als L¨osungen solcher DGLn definiert, etwa die Bessel–Gleichung und die Mathieu–Gleichung. 3
4. Lineare Dynamik
67
Die Wronski–Determinante 4.17 Definition F¨ ur ein Intervall I und Kurven v1 , . . . , vn ∈ C(I, Rn ) ist die Wronski–Determinante die stetige Funktion w : I → R , t → det v1 (t), . . . , vn (t) . Wir sind hier an der Wronski–Determinante w von L¨osungen v1 , . . . , vn der DGL (4.2.1) interessiert. Da diese L¨ osungen sogar stetig differenzierbar von der Zeit ullt selbst eine Differentialgleichung. abh¨angen, ist w ∈ C 1 (I, R), und erf¨ 4.18 Satz F¨ ur die Wronski–Determinante w gilt d w(t) = tr A(t) w(t) dt
also
t
w(t) = exp
(t ∈ I),
tr A(s) ds w(t0 ).
(4.2.7)
(4.2.8)
t0
Beweis: Da die L¨ osungen vi ∈ C 1 (I, Rn ) der Differentialgleichung die Ableitung v˙ i (t) = A(t)vi (t)
(i = 1, . . . , n)
besitzen, gilt nach der Produktregel d w(t) dt
=
n i=1
=
n
det v1 (t), . . . , vi−1 (t), v˙ i (t), vi+1 (t), . . . , vn (t) det v1 (t), . . . , vi−1 (t), Avi (t), vi+1 (t), . . . , vn (t) .
i=1
F¨ ur die kanonische Basis e1 , . . . , en des Rn gilt tr(A) =
n
(A)i,i =
i=1
n
det e1 , . . . , ei−1 , Aei , ei+1 , . . . , en ,
i=1
was sich nach der Determinantenproduktregel auf beliebige Vektoren v˜1 , . . . , v˜n ∈ Rn u ¨bertr¨agt: tr(A) det(˜ v1 , . . . , v˜n ) =
n
det (˜ v1 , . . . , v˜n )(e1 , . . . , ei−1 , Aei , ei+1 , . . . , en )
i=1
=
n n
det v˜1 , . . . , v˜i−1 , (A)k,i v˜k , v˜i+1 , . . . , v˜n
i=1 k=1
=
n
det v˜1 , . . . , v˜i−1 , A˜ vi , v˜i+1 , . . . , v˜n .
i=1
Die L¨osung (4.2.8) der DGL (4.2.7) erfolgt durch Separation der Variablen.
2
68
4.2. Explizit zeitabh¨angige lineare DGLn
4.19 Bemerkungen 1. Die Wronski–Determinante eines Fundamentalsystems l¨asst sich also durch Integration berechnen, auch wenn man nur die Anfangswerte v1 (t0 ),. . . , vn (t0 ) kennt. Weil w(t0 ) = det v1 (t0 ), . . . , vn (t0 ) = 0 ist, folgt aus der Gestalt (4.2.8) der L¨ osung auch w(t) = 0 f¨ ur alle t ∈ I. 2. Der Quotient w(t)/w(t0 ) der Wronski–Determinante eines Fundamentalsystems gibt den Faktor an, um den sich das Volumen von Φ(t, t0 )(K) zum Zeitpunkt t gegen¨ uber dem des Kompaktums K ⊂ Rn ver¨andert hat. 3. F¨ ur eine lineare Differentialgleichung n–ter Ordnung der Form y (n) (t) +
n−1
ai (t)y (i) (t) = 0
i=0
mit stetigen Koeffizienten a0 , . . . , an−1 ist die zugeordnete Differentialgleichung erster Ordnung nach Satz 3.29 von der Form ⎛ 0 1 ⎞ x1 x˙ 1 .. .. ⎠. . = A ... mit xi = y (i−1) und A = ⎝ . 1 x˙ n
xn
−a0 −a1 ... −an−1
Hier ist also die Wronski–Determinante von L¨osungen y1 , . . . , yn : I → R gleich ⎛ ⎞ y1 (t)
w(t) = det ⎝
...
yn (t)
.. .
(n−1) y1 (t)
⎠
.. . ...
, und
d dt w(t)
= −an−1 (t)w(t).
3
(n−1) yn (t)
Das inhomogene Problem Das inhomogene Anfangswertproblem mit stetiger St¨orfunktion b : I → Rn z(t) ˙ = A(t)z(t) + b(t)
, z(t0 ) = z0
(4.2.9)
l¨asst sich bei Kenntnis des homogenen L¨ osungsoperators aus (4.2.6) leicht l¨osen:
4.20 Satz (,Duhamel–Prinzip’) Die L¨osung des Anfangswertproblems (4.2.9) ist t (t ∈ I). (4.2.10) z(t) = Φ(t, t0 )z0 + t0 Φ(t, s)b(s) ds Beweis: • Wegen Φ(s, s) = 1l ist in (4.2.10) z(t0 ) = z0 . d Φ(t, s) = A(t)Φ(t, s) • Zus¨atzlich gilt wegen dt
t
z(t) ˙ = A(t)Φ(t, t0 )z0 + A(t)
Φ(t, s)b(s) ds + Φ(t, t)b(t) = A(t)z(t) + b(t). t0
Damit ist (4.2.10) die L¨ osung von (4.2.9).
2
4. Lineare Dynamik
69
Die Menge der L¨osungen der inhomogenen linearen Differentialgleichung Lb := {ϕ ∈ C 1 (I, Rn ) | ϕ(t) ˙ = A(t)ϕ(t) + b(t), t ∈ I} ist also von der Form Lb = L0 + ϕb , mit dem in (4.2.5) definierten homogenen L¨ osungsraum L0 und der partikul¨aren L¨osung t ϕb ∈ C 1 (I, Rn ) , ϕb (t) = Φ(t, s)b(s) ds t0
Der inhomogene L¨osungsraum Lb ist damit ein affiner Unterraum von C 1 (I, Rn ).
1 x(t)+x(t) ˙ = cos(t) 4.21 Beispiel (Inhomogenes Problem) Die DGL x ¨(t)+ 10 eines ged¨ampften harmonischen Oszillators mit ¨außerer Anregung ist zum System
z(t) ˙ = A(t)z(t) + b(t)
x(t) mit z(t) := x(t) und A(t) = ˙ die komplexen Eigenwerte
λ1/2 =
1 − 20
±
0 1 −1 −1/10
1 2 20
und Eigenvektoren
W1/2 =
, b(t) =
−1=
0 cos(t)
1 20 (−1
±
√
¨aquivalent. A besitzt
399 i),
√ 399i) ,
1 20 (+1∓
1
sodass mit der diagonalisierenden Matrix W := (W1 ; W2 ) = und W −1 AW = exp(At) = W
λ1
0 0 λ2
1−
√ 399i 20
√ 1+ 399 i 20
1
e λ1 t 0 0 e λ2 t
1
, also W −1 =
gilt. Damit ist mit ω :=
W
−1
=e
−t/20
−10i √ 399 √10i 399
1 √i 2 − 2 399 1 √i 2 + 2 399
√ 399 20
cos(ωt)+
sin(ωt) √ 399
1 sin(ωt) −ω
1 ω
sin(ωt)
√ 399 t sin 20 √ cos(ωt)− 399
.
Aus (4.2.10) ergibt sich
t z(t) = exp(At)z0 + exp A(t − s) b(s) ds = 0 sin(ωt) 1 −t/20 1 √ sin(t)− ω e sin(ωt) ω sin(ωt) −t/20 cos(ωt)+ 399 e z . + 10 sin(ωt) 0 sin(ωt) 1 cos(t)+e−t/20 − cos(ωt)+ √ √ − ω sin(ωt)
cos(ωt)−
399
399
70
4.3. Quasipolynome
Damit ist die allgemeine L¨ osung der DGL zweiter Ordnung von der Form x(t) = e−t/20 c1 cos(ωt)−c2 sin (ωt) +10 sin t.
x 5
Die L¨osung des Anfangswertproblems f¨ ur x0 = x0 = 0 ist nebenstehend abgebildet. Die Integration bereitet zwar keine grunds¨atzli- 5 chen Probleme, ist aber schon in diesem einfachen Beispiel rechenintensiv. 3
4.3
75
t
Quasipolynome
Um den Rechenaufwand bei der L¨ osung einer inhomogenen linearen Differentialgleichung zu verringern, benutzt man die Methode der Quasipolynome. Erinnerung: Der L¨ osungsoperator exp(At) der linearen DGL x˙ = Ax hat die Form exp(At) = W exp(Jt)W −1 mit der Jordan–Matrix J = exp Jr1 (λ1 ) ⊕. . .⊕exp Jrk (λk ) , und nach (4.1.6) ⎛
gilt exp Jr (λ)t = eλt
⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
⎞ tr−1 (r−1)! ⎟ ⎟ 0 1 t ⎟ ⎟ ⎟ . . . . . ⎟ . . . . . ⎟ . . . . . ⎟ ⎟ ⎟ . . . ⎠ . . . . . t . 0 ··· ··· 0 1
1 t ··· ···
.
Folgerung: Ist A ∈ Mat(n, C) und sind λ1 , . . . , λk ∈ C die Eigenwerte von A mit den Vielfachheiten ν1 , . . . , νk , dann haben die Eintr¨age der Matrix exp(At)
k die Form l=1 eλl t pl (t), wobei pl (t) ein Polynom vom Grad ≤ νl − 1 ist. Diese Folgerung k¨ onnen wir uns zunutze machen, nur unter Benutzung eines entsprechenden L¨ osungsansatzes direkter eine L¨osung linearer DGLn zu finden. 4.22 Definition F¨ ur λ ∈ K und ein Polynom p ∈ K[t] heißt die Funktion t → eλt p(t) λ–Quasipolynom vom Grad grad(p) u ¨ber K. Kennt man nun durch Auswertung des charakteristischen Polynoms von A die Eigenwerte λ1 , . . . , λk und die Multiplizit¨aten ν1 , . . . , νk , dann kann man die L¨osung in der oben angegebenen Form ansetzen. Der K-Vektorraum der λ–Quasipolynome wird durch Differentiation linear in sich abgebildet, und es gilt d dt
eλt p(t) = eλt p (t) + λp(t) .
Einsetzen des L¨osungsansatzes ergibt f¨ ur jeden Eigenwert λl eine Gleichung f¨ ur die Polynome pl (im Allgemeinen mehrere, denn x(t) = x1 (t), . . . , xn (t) ). Daraus lassen sich im Prinzip deren Koeffizienten bestimmen.
4. Lineare Dynamik
71
Besonders leicht ist der L¨ osungsansatz f¨ ur lineare Einzel-Differentialgleichungen h¨oherer Ordnung. Ist n¨amlich x(n) + an−1 x(n−1) + . . . + a0 x = 0, y1 .. , y := dk−1 x dann ergibt sich das ¨aquivalente System y˙ = Ay mit y = k dtk−1 . yn ⎛ 0 1 0 ... ⎞ 0 .. .. ⎜ 0 0 1 . . ⎟ ⎜ ⎟. Es ist damit das charakteristische Polyund A = ⎝ . . . . ⎠ .. .. . . . . 0 nom
0 0 ... 0 1 −a0 −a1 ... −an−2 −an−1
⎛
λ −1 0
...
0
⎜ 0 λ −1 . . . ⎜ det(λ1l − A) = det ⎜ . . . . ⎝ .. . . . . . .
.. .
0 0 0 λ −1 a0 a1 ... an−2 λ+an−1
⎞ ⎟ ⎟ ⎟ = λn + an−1 λn−1 + . . . + a0 , ⎠
also das Polynom mit den Koeffizienten der Differentialgleichung. Wir brauchen also nicht den Umweg u ¨ber ein Differentialgleichungssystem erster Ordnung zu machen, wenn wir die allgemeine L¨osung in Form eines Quasipolynoms schreiben wollen. 4.23 Beispiele 1. x(4) − ax = 0, a > 0. Die Nullstellen des charakteristischen Polynoms λ4 − a = 0 sind √ (k = 1, . . . , 4). λk = ik 4 a
4 λk t mit Koeffizienten Jede L¨osung besitzt also die Form x(t) = k=1 ck e ck ∈ C. Ist eine reelle L¨ osung gefragt, dann muss offensichtlich c2 , c4 ∈ R und c1 = c3 gelten. 2. Die Differentialgleichung x ¨ + k x˙ + x = 0 mit k > 0 (siehe Beispiel 4.21) beschreibt einen ged¨ampften harmonischen Oszillator (ohne ¨außere Anregung). 0 1 2 sind nur Die Eigenwerte λ1/2 = − k2 ± k4 − 1 der Matrix A = −1 −k im aperiodischen Grenzfall k = 2 einander gleich: Dann ist λ1 = λ2 = −1, sodass die allgemeine L¨ osung von der Form x(t) = (c1 + c2 t)e−t ist (siehe auch Kapitel 5.4). 3 F¨ ur λ ∈ R (sogar f¨ ur λ ∈ C!) ist cosh(λt) = 12 eλt + e−λt und sinh(λt) = 1 1 λt −λt iλt −iλt e , und nach der Euler–Formel cos(λt) = e und − e + e 2 2 iλt 1 −iλt sin(λt) = 2i e − e . L¨ osungen linearer DGLn k¨onnen also insbesondere Produkte dieser vier elementaren Funktionen mit t–Potenzen enthalten, denn diese erh¨alt man durch Linearkombination geeigneter Quasipolynome. Das hat eine weitere Konsequenz. Ist n¨amlich x˙ = Ax + b(t), wobei b(t) sich als Summe von Quasipolynomen schreiben l¨asst, dann l¨asst sich die L¨osung dieser
72
4.3. Quasipolynome
inhomogenen Differentialgleichung mit konstanten Koeffizienten als Summe von λ–Quasipolynomen schreiben (wobei λ Eigenwert von A ist oder als Exponent in b(t) auftaucht). Dies ergibt sich unmittelbar aus der in diesem Fall g¨ ultigen L¨osungsformel (siehe (4.2.10)) t ϕ(t) = exp(At) x0 + 0 exp(−As)b(s) ds f¨ ur das Anfangswertproblem mit ϕ(0) = x0 , denn Produkte und Integrale von Quasipolynomen sind Quasipolynome. 4.24 Beispiele (inhomogene lineare Differentialgleichungen) 1. x ¨+x = t2 . Eine partikul¨are L¨ osung dieser inhomogenen Differentialgleichung ist xp (t) := t2 − 2, die allgemeine a1 cos t + a2 sin t + xp (t), mit a1 , a2 ∈ R. 2. x(4) + x = t2 et cos t. Die rechte Seite ist von der Form 12 t2 eλt + eλt mit λ := 1 + i. Allgemein hat ein Quasipolynom eλt p(t) die k–te Ableitung dk dtk
k k l (k−l) (t), eλt p(t) = eλt l=0 l λ p
denn nach der Leibniz–Regel gibt es alfaktor l–mal abzuleiten.
k l
(4.3.1)
Wahlm¨oglichkeiten, den Exponenti(4)
Wir setzen die partikul¨are L¨ osung xp in der Form xp = yp + y p mit yp (t) + t2 λt yp (t) = 2 e an, wobei yp (t) := eλt (a2 t2 + a1 t + a0 ) sein soll. Nach Formel (4) (4.3.1) ist die linke Seite yp (t) + yp (t) = eλt (λ4 + 1)a2 t2 + [(λ4 + 1)a1 + 8λ3 a2 ]t + [(λ4 + 1)a0 + 4λ3 a1 + 12λ2 a2 ] . Vergleich mit der rechten Seite ergibt wegen λ2 = 2i, λ4 = −4 a2 =
1/2 λ4 +1
= − 16 , a1 =
−8λ3 a2 λ4 +1
= 89 (1 − i) und a0 = − 4λ
2 Damit ist xp (t) = 2Re e(1+i)t (− t6 + 89 (1 − i)t + 2 et (− t3 +
16 9 t) cos t
+ ( 16 9 t−
3
a1 +12λ2 a2 λ4 +1
=
92 27 i.
92 27 i)
184 27 ) sin t
= .
3
Kapitel 5
Klassifikation linearer Flu ¨sse
5.1 5.2 5.3 5.4
Konjugationen linearer Flusse ¨ . . . Hyperbolische lineare Vektorfelder . Lineare Flusse ¨ in der Ebene . . . . Beispiel: Feder mit Reibung . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
74 76 80 84
Wir kennen den von einer linearen Differentialgleichung x˙ = Ax mit Systemmatrix A ∈ Mat(n, R) auf dem Phasenraum Rn erzeugten Fluss Φt : Rn → Rn
, x → exp(At)x
(t ∈ R),
wollen aber ein vertieftes geometrisches Verst¨andnis erlangen. Insbesondere werden wir f¨ ur kleine Dimensionen n die Phasenportraits von Φ untersuchen. Allgemein versteht man unter dem Phasenportrait eines dynamischen Systems Φ : G × M → M die Zerlegung des Phasenraums M in Orbits. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 5,
73
74
5.1. Konjugationen linearer Fl¨usse
Abbildung 5.1.1: Phasenportraits von stabilen Spiralen der Differentialgleichung −1 x˙ = Ax. Links: A = −1/5 ; rechts: eine zu A ¨ahnliche Matrix 1 −1/5
5.1
Konjugationen linearer Fl¨ usse
Zun¨achst fragen wir etwas unpr¨azise, wann eine zweite lineare Differentialgleichung x˙ = Bx auf dem Phasenraum Rn ein ¨ahnliches Phasenportrait hat wie das von x˙ = Ax. Naheliegend erscheint dabei zun¨achst vielleicht die folgende Klasseneinteilung. Die Matrizen A, B ∈ Mat(n, R) heißen ¨ahnlich, wenn ein S ∈ GL(n, R) existiert mit B = SAS −1 . Dann gilt f¨ ur den von B erzeugten Fluss Ψt (y) := exp(Bt)y Ψt (y) = S exp(At)S −1 y = SΦt (S −1 y). (5.1.1) Also geht das Phasenportrait von B aus dem von A durch eine Basistransformation des Rn hervor. In Abbildung 5.1.1 sehen wir Phasenportraits zweier ¨ahnlicher Matrizen. ¨ Da bei der Ahnlichkeitstransformation die Eigenwerte mit ihrer Multiplizit¨at ¨ invariant gelassen werden, ist diese Aquivalenzklasseneinteilung linearer Fl¨ usse f¨ ur viele Zwecke zu fein. Angemessener f¨ ur den Vergleich zweier stetiger dynamischer Systeme Φ(i) : R × M (i) → M (i) ist dagegen oft der Begriff der Konjugation mit einem Hom¨oomorphismus h ∈ C M (1) , M (2) (siehe Definition 2.28). Sind die dynamischen Systeme differenzierbar und ist hsogar ein Diffeomor phismus (das heißt h ∈ C 1 M (1) , M (2) und h−1 ∈ C 1 M (2) , M (1) ), dann (2) (1) folgt aus Φt ◦ h = h ◦ Φt f¨ ur die Vektorfelder fk : d (2) d (1) f2 ◦ h = Φt ◦ h = h ◦ Φt = Dh ◦ f1 dt dt t=0 t=0 oder
f2 = Dh ◦ f1 ◦ h−1 .
(5.1.2)
5. Klassifikation linearer Fl¨ usse
75
Die den Fluss erzeugenden Vektorfelder werden also durch die Linearisierung von h aufeinander abgebildet. Ist insbesondere x1 ∈ M (1) eine Ruhelage von Φ(1) , dann ist nach Aufgabe 2.30 auch x2 = h(x1 ) eine Ruhelage von Φ(2) , und die Linearisierungen Df1 (x1 ) und Df2 (x2 ) sind ¨ahnliche Matrizen aus Mat(n, R). Angewandt auf die Ruhelage 0 ∈ Rn impliziert dies f¨ ur lineare Fl¨ usse auf dem Rn , dass diese genau dann durch Diffeomorphismen konjugiert sind, wenn die ihre Vektorfelder definierenden Matrizen ¨ahnlich sind. In diesem Fall k¨onnen wir statt allgemeiner Diffeomorphismen des Rn aber gleich die in (5.1.1) durch S ∈ GL(n, R) definierte lineare Abbildung als konjugierenden Diffeomorphismus verwenden. Anders sieht die Situation bei Verwendung nicht differenzierbarer Hom¨oomorphismen h aus. 5.1 Beispiel (Lineare DGLn auf R) F¨ ur Parameter a ∈ R betrachten wir die (a) lineare Differentialgleichung x˙ = ax auf R, mit Fluss Φt (x) = eat x. Dann ist der Ursprung x = 0 f¨ ur alle a ∈ R Ruhelage. Ist nun x ∈ R\{0}, dann ist die α– bzw. ω–Limesmenge von x (siehe Definition 2.20) parameterabh¨angig: • f¨ ur a < 0 :
α(x) = ∅, ω(x) = {0}
• f¨ ur a = 0 :
α(x) = ω(x) = {x}
• f¨ ur a > 0 :
α(x) = {0}, ω(x) = ∅.
Nach Aufgabe 2.30 k¨ onnen also Φ(a) (b) und Φ h¨ochstens dann konjugiert sein, wenn sign(a) = sign(b) gilt. Dann sind die Abbildungen aber auch wirklich konjugiert. Sind n¨amlich a und b beide gr¨oßer als Null oder beide kleiner als Null, k¨onnen wir den f¨ ur α > 0 definierten Hom¨oomorphismus
hΑ 1
=
1
1
x
1
Der konjugierende Hom¨oomorphismus ur α = 1/2, 1 und 2 hα , f¨ hα : R → R , x → sign(x)|x|α −1 von R benutzen. Es ist hα = h1/α und daher f¨ ur α := ab > 0 (a)
hα ◦ Φt
◦ h−1 α (x)
=
hα (eat sign(x)|x|1/α )
=
sign(x)(eat |x|1/α )α = ebt sign(x)|x| = ebt x = Φt (x).
(b)
Wir beachten, dass dieser konjugierende Hom¨ oomorphismus außer an der Stelle Null glatt ist. Der (eindimensionale, da durch a ∈ R parametrisierte) Parameterraum der ¨ eindimensionalen linearen dynamischen Systeme x˙ = ax wird also in drei Aquivalenzklassen zueinander konjugierter Systeme zerlegt. 3
76
5.2
5.2. Hyperbolische lineare Vektorfelder
Hyperbolische lineare Vektorfelder
Wir verallgemeinern jetzt das Beispiel 5.1 auf beliebige Dimensionen. 5.2 Definition • Eine Matrix A ∈ Mat(n, R), das Vektorfeld x → Ax und der Fluss (t, x) → Φt (x) = exp(At)x heißen hyperbolisch, wenn f¨ ur alle Eigenwerte λ ∈ C von A gilt: Re(λ) = 0. • Die Summe der algebraischen Vielfachheiten der Eigenwerte λ mit Re(λ) < 0 heißt der Index von A und wird Ind(A) geschrieben. • E s := {x ∈ Rn | limt→∞ Φt (x) = 0} heißt stabiler Unterraum, E u := {x ∈ Rn | limt→−∞ Φt (x) = 0} instabiler Unterraum von A. 5.3 Satz F¨ ur alle n ∈ N ist die Menge der hyperbolischen Matrizen in Mat(n, R) offen und dicht. Beweis: • Sei A ∈ Mat(n, R) hyperbolisch und λ ∈ iR. Dann ist λ kein Eigenwert von A, und es gilt sogar I(A) := inf{| det(A − λ 1ln )| | λ ∈ iR} > 0. Da die Abbildung det : Mat(n, C) → C stetig ist, gibt es Λ > 0 und eine Umgebung U ⊂ Mat(n, R) von A mit I(B) = inf{| det(B − λ 1ln )| | λ ∈ iR, |λ| ≤ Λ} > 0 f¨ ur B ∈ U . Die Matrizen B ∈ U sind also auch hyperbolisch. • Sei A ∈ Mat(n, R) nicht hyperbolisch. Dann ist f¨ ur c ∈ R die Matrix A+c1ln ∈ Mat(n, R) hyperbolisch, falls |c| ∈ (0, C) mit C := inf |Re(λ)| | λ ∈ C Eigenwert von A, Re(λ) = 0 ∈ (0, ∞]. Die Menge dieser Matrizen besitzt A als H¨aufungspunkt.
2
5.4 Bemerkungen 1. Wenn auch typische Matrizen in Mat(n, R) hyperbolisch sind, gilt dies nicht mehr, wenn wir uns auf den Untervektorraum der in der Klassischen Mechanik als Systemmatrizen auftretenden infinitesimal symplektischen Matrizen (siehe Seite 95) beziehen. 2. Eine Matrix A ∈ Mat(n, R) ist genau dann hyperbolisch, wenn gilt: Ind(A) + Ind(−A) = n. 3. Im Beispiel 5.1 waren die hyperbolischen dynamischen Systeme mit gleichem Index zueinander konjugiert. Dies werden wir jetzt auch f¨ ur beliebige Dimensionen n zeigen. 4. Die (gebr¨auchlichen) Indices s bzw. u stehen f¨ ur stable bzw. unstable. 5. Der Index einer Ruhelage x0 eines dynamischen Systems x˙ = f (x) ist definiert als Index von Df (x0 ). F¨ ur ein lineares Vektorfeld (f (x) = Ax) ist damit der Index jeder Ruhelage, insbesondere der Null, gleich dem Index der Systemmatrix A. 3
5. Klassifikation linearer Fl¨ usse
77
5.5 Aufgabe (Index) Bestimmen Sie ein Fundamentalsystem der L¨osungen zu 1 1 −1 x˙ = 0 −1 2 x . −2 −1 1
Welche L¨osungen bleiben f¨ ur t → ∞ beschr¨ankt? Ist die Matrix hyperbolisch? Wenn ja, welchen Index hat sie? 3 5.6 Lemma (Index) F¨ ur eine hyperbolische Matrix A gilt dim(E s ) = Ind(A). Beweis: Zun¨achst sind wegen der Linearit¨at des Flusses Φt tats¨achlich E u und E s Unterr¨aume des Phasenraums Rn . • Ist x ∈ Rn Element der direkten Summe der verallgemeinerten Eigenr¨aume zu den Eigenwerten λi mit Re(λi ) < 0, dann sind die Komponenten der vektorwertigen Funktion t → Φt (x) Summen von λi –Quasipolynomen, also x ∈ E s . Damit ist dim(E s ) ≥ Ind(A). • Andererseits ist mit der analogen Argumentation f¨ ur die Eigenwerte mit positivem Realteil dim(E u ) ≥ Ind(−A) = n − Ind(A).
• Außerdem gilt f¨ ur jede Summe f (t) := i pi (t)eλi t von λi –Quasipolynomen: Falls limt→∞ f (t) = limt→−∞ f (t) = 0, dann ist auch f = 0. Also ist E u ∩ E s = {0} und damit dim(E u ) + dim(E s ) = n, was dim(E s ) = Ind(A) und dim(E u ) = n − Ind(A) impliziert. 2 5.7 Beispiel Die Abbildung am Kapitelanfang (Seite 73) zeigt Orbits eines linearen Flusses auf dem R3 , mit Index 3. 3 Betrachten wir das rechte Phasenportrait in Abbildung 5.1.1, dann ist die Trajektorie zwar stabil, n¨ahert sich aber nicht die ganze Zeit dem Ursprung. Der ¨ Ubergang zur ¨ahnlichen Systemmatrix der linken Abbildung behebt diesen Defekt. Dies ist allgemein m¨ oglich: 5.8 Lemma Es sei A ∈ Mat(n, R), und Λ := max{Re(λ) | λ Eigenwert von A}. ur dessen Norm Dann gibt es f¨ ur alle Λ > Λ ein Skalarprodukt auf dem Rn , f¨ gilt: d
Φt (x) ≤ Λ Φt (x)
(x ∈ Rn , t ∈ R). (5.2.1) dt d d Beweis: Wegen dt Φt (x) = ds Φt+s (x)|s=0 = gen¨ ugt es, (5.2.1) f¨ ur t = 0 zu zeigen.
d ds Φs (y)|s=0
mit y := Φt (x)
• (5.2.1) gilt f¨ ur x = 0. Es gen¨ ugt also, die Ungleichung f¨ ur x ∈ Rn \ {0} zu beweisen. Stattdessen zeigen wir sogar, dass f¨ ur ein geeignetes Skalarprodukt auf dem Cn gilt 1 2
d exp(At)x, exp(At)x |t=0 ≤ Λ x, x dt
(x ∈ Cn ).
(5.2.2)
78
5.2. Hyperbolische lineare Vektorfelder
Ohne Beschr¨ankung der Allgemeinheit k¨ onnen wir voraussetzen, dass der Basiswechsel zur Jordan–Normalform schon vorgenommen wurde. Es ist d exp(At)x, exp(At)x |t=0 = 2Re x, Ax . dt • Ist das Skalarprodukt so gew¨ahlt, dass die Unterr¨aume zu den verschiedenen Jordan–Bl¨ocken orthogonal sind, ist dieser Term eine Summe u ¨ber die Beitr¨age der Jordan–Bl¨ocke. Mit dem Jordan–Block Jr (λ) f¨ ur den Eigenwert λ ist f¨ ur μ := Re(λ) ≤ Λ Re x, Jr (λ)x = Re x, Jr (μ)x . • F¨ ur ε > 0 konjugieren wir Jr (μ) = μ1lr + Jr (0) mit der Diagonalmatrix Dε := diag(1, ε, ε2 , . . . , εr−1 ) ∈ GL(r, C) (also Dε−1 = D1/ε ): Dε−1 Jr (μ)Dε = μ1lr + Dε−1 Jr (0)Dε = μ1lr + εJr (0). Die Nebendiagonale wurde also mit ε multipliziert. Wir bezeichnen das kanonische Skalarprodukt auf Cr mit ·, ·can . Die Cauchy-Schwarz–Ungleichung impliziert Re x, Jr (0)xcan ≤ x can Jr (0)x can ≤ x 2can . Also ist f¨ ur ε ∈ 0, Λ − Λ = μ x, xcan + ε Re x, Jr (0)xcan Re x, (μ1lr + εJr (0))xcan ≤ (Λ + ε) x, xcan ≤ Λ x, xcan . ) * Wir definieren also das Skalarprodukt durch x, y := Dε−1 x, Dε−1 y can und erhalten f¨ ur x ˜ := Dε−1 x x, Jr (μ)x = ˜ x, (μ1lr + εJr (0))˜ xcan ≤ Λ ˜ x, x ˜can = Λ x, x , insgesamt also
1 d 2 2 dt exp(At)x |t=0
≤ Λ x 2 , das heißt (5.2.2).
2
5.9 Satz (Konjugationsklassen) Die linearen Fl¨ usse zweier hyperbolischer Matrizen A(1) , A(2) ∈ Mat(n, R) sind genau dann konjugiert, wenn gilt: Ind A(1) = Ind A(2) . (i)
Beweis: Wir bezeichnen die linearen Fl¨ usse mit Φt (x) := exp(A(i) t)x und (i) deren stabile Unterr¨aume mit E (i = 1, 2). · (i) : E (i) → [0, ∞) bezeichnen Normen, die die Ungleichung aus Lemma 5.8 f¨ ur ein Λ < 0 erf¨ ullen. • Existiert ein konjugierender Hom¨ oomorphismus h : Rn → Rn , dann gilt h(0) = (1) (2) 0 und auch h E = E , denn die Punkte x ∈ E (i) haben die definierende Eigenschaft {0} = ω(x), und es gilt nach Aufgabe 2.30 h ω(x) = ω h(x) . Es ist eine wichtige Eigenschaft von Hom¨ oomorphismen, die Dimension von Vektorr¨aumen invariant zu lassen. Damit ist bei Existenz einer Konjugation h Ind A(1) = dim E (1) = dim h(E (1) ) = dim E (2) = Ind A(2) .
5. Klassifikation linearer Fl¨ usse
79
• Wir nehmen jetzt umgekehrt Ind A(1) = Ind A(2) an und konstruieren einen konjugierenden Hom¨ oomorphismus h. Da beide Phasenr¨aume Rn direkte Summen ihrer stabilen beziehungsweise instabilen Unterr¨aume sind, schreiben wir uglich dieser Zerlegungen den Hom¨oomorphismus in der Form bez¨ h = h(s) , h(u) mit h(s) : E (1) → E (2) , w¨ahrend h(u) die instabilen Unterr¨aume aufeinander abbildet. • Wir definieren h(s) und zeigen, dass die Abbildung ein Hom¨oomorphismus ist. Zun¨achst ist h(s) (0) := 0, denn Ruhelagen werden auf Ruhelagen abgebildet. (1) Ist x ∈ E (1) \{0}, dann ist limt→∞ Φt (x) = 0 und (1) (1) limt→−∞ Φt (x) = ∞. Nach Lemma 5.8 gibt es genau ein
(1) T (x) ∈ R mit ΦT (x) (x) ∈ S (1) := y ∈ E (1) y (1) = 1 , und T : E (1) \ {0} → R ist glatt. ¨ Geometrisch ist S (1) die Sph¨are vom Radius 1 in E (1) . Ahnlich bezeichnet (2) (2) (2) (2) S := {z ∈ E | z = 1} die Einheitssph¨are in E . Da die beiden R–Vektorr¨aume E (1) und E (2) die gleiche Dimension besitzen, gibt es einen Isomorphismus I : E (1) → E (2) , und entsprechend den Diffeomorphismus I(y) . I˜ : S (1) → S (2) , y →
I(y) (2) Wir setzen (2) (1) h(s) (x) := Φ−T (x) ◦ I˜ ◦ ΦT (x) (x)
x ∈ E (1) \{0} .
Als Verkettung glatter Abbildungen ist h(s) auf E (1) \{0} glatt, und h(s) (x) → 0 f¨ ur x → 0. Analoge Aussagen gelten f¨ ur die Umkehrabbildung von h(s) . (s) Damit ist h ein Hom¨ oomorphismus. (u) ¨ h definiert man analog, durch Ubergang von den Systemmatrizen A(i) zu (i) oomorphismus. −A . Daher ist schließlich auch h ein Hom¨ (1)
• h konjugiert die Fl¨ usse. Denn f¨ ur y := Φs (x) und x ∈ E (1) \ {0} ist (1)
(1)
(1)
(1)
ΦT (x)−s (y) = ΦT (x) ◦ Φ−s (y) = ΦT (x) (x)
, also T (y) = T (x) − s. (2)
F¨ ur alle t ∈ R und (zun¨achst nur) f¨ ur x ∈ E (1) ist daher Φt ◦ h(x) gleich (2)
(1)
(2)
(1)
(1)
(1)
Φt−T (x) ◦ I˜ ◦ ΦT (x) (x) = Φt−T (x) ◦ I˜ ◦ ΦT (x)−t ◦ Φt (x) = h ◦ Φt (x). Daraus folgt mit analoger Argumentation f¨ ur den instabilen Unterraum die Konjugationseigenschaft f¨ ur alle x ∈ Rn . 2 ¨ Es gilt also bez¨ uglich Konjugation genau n + 1 Aquivalenzklassen hyperbolischer Matrizen A ∈ Mat(n, R).
80
5.3. Lineare Fl¨ usse in der Ebene
5.10 Weiterf¨ uhrende Literatur Eine weitergehende Analyse, insbesondere eine Verallgemeinerung auf die lokale Theorie nichtlinearer Differentialgleichungen in der N¨ahe eines hyperbolischen singul¨aren Punktes, findet sich in Palis und de Melo [PdM], sowie in Amann [Am]. 3
5.3
Lineare Fl¨ usse in der Ebene
Nach dem in Beispiel 5.1 behandelten Fall der Phasenraumdimension n = 1 untersuchen wir jetzt den n¨achst einfachen Fall n = 2. a12 ) ∈ Mat(2, R) den Fluss Φ(A) : R × Wir betrachten also f¨ ur A = ( aa11 21 a22 2 2 R → R der linearen DGL x˙ = Ax. Zueinander ¨ahnliche Matrizen f¨ uhren zu Fl¨ ussen, die sich nur durch eine Basistransformation unterscheiden. Die Gr¨oßen tr(A) = a11 + a22 , det(A) = a11 a22 − a12 a21 und D(A) := tr(A)2 − 4 det(A) sind invariant unter Konjugationen A → SAS −1 , und die Eigenwerte λ1/2 ∈ C sind gleich √ λ1/2 = 12 tr(A) ± D . Nur wenn die Diskriminante D = 0 ist, kann also die komplexe Jordan–Normalform von A aus einem Jordan–Block der Gr¨ oße 2 bestehen, und nur dann ist die Konjugations-Klasse von A nicht schon durch tr(A) und det(A) festgelegt. Nicht hyperbolisch ist die Matrix A genau dann, wenn mindestens einer der Eigenwerte verschwindenden Realteil hat. Dies ist genau dann der Fall, wenn 1. det(A) = 0, also sogar ein Eigenwert 0 ist oder 2. det(A) > 0, aber tr(A) = 0 gilt, also die Eigenwerte rein imagin¨ar sind. In der (tr, det) ∈ R2 –Ebene bilden diese Bedingungen die Abszisse bzw. die positive Ordinate und trennen damit drei Gebiete1 ab, siehe Abbildung 5.3.1. • Ind(A) = 0 gilt f¨ ur den Quadranten mit det(A) > 0 < tr(A). • Ind(A) = 1 gilt f¨ ur det(A) < 0. Hier sind beide Eigenwerte reell. • Ind(A) = 2 entspricht dem Quadranten mit det(A) > 0 > tr(A). Wie im letzten Abschnitt bewiesen, sind die Fl¨ usse innerhalb jedes dieser drei Gebiete untereinander konjugiert, aber Fl¨ usse f¨ ur Matrizen mit verschiedenen Indices sind nicht konjugiert. Der Fall Ind(A) = 1 ist, entsprechend dem Vorzeichen von tr(A), noch weiter unterteilbar. In der Situation tr(A) = 0 zweier Eigenwerte λ1 = −λ2 ∈ R wird das Phasenraumvolumen durch den Fluss erhalten, w¨ahrend es f¨ ur tr(A) < 0 1 Unter einem Gebiet wird eine offene, nichtleere und zusammenh¨ angende Teilmenge eines topologischen Raumes verstanden.
5. Klassifikation linearer Fl¨ usse
81
DetA
Sattel
Spirale ten o Kn D0 . g i e Knoten un
Zentrum
Spirale un eig .K no Knoten ten
trA
Abbildung 5.3.1: Verzweigungsdiagramm f¨ ur Matrizen A ∈ Mat(2, R), mit Diskriminante D ≡ D(A) = tr(A)2 − 4 det(A). tr(A) < 0: Senke; tr(A) = 0: Volumenerhaltender Fluss; tr(A) > 0: Quelle gem¨aß Lemma 4.12 im Limes großer Zeiten mit exponentieller Rate gegen Null geht. Der Fall tr(A) > 0 ist in Abbildung 5.3.2 dargestellt. Die durch die Gleichung D = 0 definierte Parabel trennt die KonjugationsKlassen Ind(A) = 0 und Ind(A) = 2 noch weiter auf. F¨ ur D > 0, also reelle Eigenwerte, erhalten wir sogenannte Knoten als Phasenraumportraits, siehe Abbildung 5.3.3. Diese werden stabil genannt, wenn dim(E s ) = 2, also Ind(A) = 2 ist und instabil f¨ ur Ind(A) = 0. F¨ ur D = 0 kann die Jordan–Normalform von A ein nichttrivialer Jordan– Block sein. Ein entsprechendes Phasenportrait, uneigentlicher Knoten genannt, findet sich ebenfalls in Abbildung 5.3.3. Ist zus¨atzlich tr(A) = 0, sind also beide Eigenwerte gleich Null, erh¨alt man einen eindimensionalen Eigenraum von Gleichgewichtslagen, wie in Abbildung 5.3.4 (links). Der Fall tr(A) = 0, det(A) > 0 f¨ uhrt zu imagin¨aren Eigenwerten und periodischen Orbits (Abbildung 5.3.4 rechts), auch Zentren genannt. Endlich ist f¨ ur D < 0 und tr(A) < 0 die Bewegung spiralf¨ormig und stabil (Abb. 5.3.5), w¨ahrend D < 0 und tr(A) > 0 zu sog. instabilen Spiralen f¨ uhrt. Der reibungsfreie (hamiltonsche) Fall der Klassischen Mechanik entspricht einer Matrix A ∈ Mat(2, R) mit tr(A) = 0. Wir befinden uns also auf der Ordinate des Verzweigungsdiagramms 5.3.1. 5.11 Beispiel (hamiltonsche lineare Differentialgleichungen) Wir betrachten einen Massenpunkt der Masse 1 am Ort q ∈ R, der durch eine Kraft F (q) := a q beschleunigt wird, mit Parameter a ∈ R. Physikalisch kann man etwa an einen Gegenstand denken, der unter dem Einfluss der Schwerkraft reibungsfrei auf einer parabolisch geformten Unterlage gleitet. Nach Newton gilt
82
5.3. Lineare Fl¨ usse in der Ebene
Abbildung 5.3.2: Phasenportrait von Satteln der Differentialgleichung x˙ = Ax. Links: Systemmatrix A = 03 −20 ; Rechts: zu A ¨ahnliche Matrix.
Abbildung 5.3.3: Phasenportraits von Knoten der DGL x˙ = Ax. Links: instabiler 0 Knoten, f¨ ur A = 01 1/2 ; Rechts: instabiler uneigentlicher Knoten, f¨ ur A = 10 11
Abbildung 5.3.4: Phasenportraits von x˙ = Ax. Fall rein imagin¨arer Eigenwerur antisymmetrische te. Links: Nilpotente Matrix A = 00 10 ; Rechts: Zentrum, f¨ 0 1 Matrix A = −1 0
5. Klassifikation linearer Fl¨ usse
83
Abbildung 5.3.5: Phasenportraits von stabilen Spiralen der Differentialgleichung −1 x˙ = Ax. Links: A = −1/5 ; rechts: eine nicht zu A ¨ahnliche Matrix 1 −1/5 1
p
0
1
1
1
h q 1
1
q
=
p
0
q
1
1
Abbildung 5.3.6: Abstoßende Kraft (a = 1): Vektorfeld q˙ = p, p˙ = q und Phasenportrait also die DGL zweiter Ordnung q¨ = a q. Durch Einf¨uhrung der Geschwindigkeit p = q˙ ergibt sich das lineare Differentialgleichungssystem erster Ordnung q˙ = p ,
p˙ = a q
oder x˙ = A x mit x = ( pq ) und A := ( a0 10 ).
3
5.12 Aufgabe (Hookesches mit A = ( a0 10 ) f¨ur Kraftgesetz) Zeigen Sie, dass q0 den linearen Fluss q(t), p(t) = Φt (q0 , p0 ) = exp(A t) ( p0 ) gilt: √ (a) F¨ ur a > 0 (siehe Abbildung 5.3.6) ist mit ω := a p0 q(t), p(t) = q0 cosh(ωt) + sinh(ωt) , ωq0 sinh(ωt) + p0 cosh(ωt) . ω (b) F¨ ur a = 0 (siehe Abbildung 5.3.7) ist q(t), p(t) = (q0 + p0 t, p0 ).
84
5.4. Beispiel: Feder mit Reibung
√ (c) F¨ ur a < 0, (siehe Abbildung 5.3.8) ist mit ω := −a p0 sin(ωt) , −ωq0 sin(ωt) + p0 cos(ωt) . 3 q(t), p(t) = q0 cos(ωt) + ω 1
p
1
1
q
=
0
1
p
q˙ q
1
0
1
q
Abbildung 5.3.7: Freie Bewegung (a = 0): Vektorfeld q˙ = p, p˙ = 0 und Phasenportrait
1
p
0
1
1
1
h 1
q
1
q
=
1
p
0
q
1
Abbildung 5.3.8: Anziehende Kraft (a = −1): Vektorfeld q˙ = p, p˙ = −q und Phasenportrait Wir bemerken, dass in allen drei F¨allen det(exp(At)) = 1 (t ∈ R) ist. Das folgt aus Satz 4.12. Eine anschauliche Interpretation dieser Tatsache ist die Feststellung, dass der Fluss in R2 fl¨achenerhaltend ist.
5.4
Beispiel: Feder mit Reibung
Als Anwendungsbeispiel der Theorie linearer Differentialgleichungen diskutieren wir den Fall eines an einer Feder aufgeh¨angten Gewichts der Masse m > 0, das sich im Ruhezustand in der H¨ ohe x = 0 befinde. Die Kraft F (x, x), ˙ die auf die Masse wirkt, ist in der einfachsten N¨aherung eine lineare Funktion der Auslenkung x ∈ R und der Geschwindigkeit x˙ ∈ R. Die
5. Klassifikation linearer Fl¨ usse
85
erste Proportionalit¨atskonstante −D mit D > 0 nennt man Federkonstante. Sie ist ein Maß f¨ ur die Steifheit der Feder. Die zweite Konstante −R mit R ≥ 0 beschreibt die Reibung des Massenk¨orpers an der umgebenden Luft und die innere Reibung des Federmaterials2 . Autonomer Fall 2
2
d d d D Es gilt also nach Newton m dt 2 x(t) = −Dx(t) − R dt x(t), oder dt2 x = − m x − m R d d urzt ds x(t(s)) m dt x. Setzt man als neuen Zeitparameter s = D t an, und k¨ mit x˙ ab, so ergibt sich
x ¨ = −x − k x˙
k := √
, mit
R ≥ 0. mD
Eine solche Umskalierung wird h¨aufig benutzt, um eine Differentialgleichung auf eine m¨oglichst einfache Form zu bringen. Mit der Geschwindigkeit v := x˙ ergibt sich das lineare System erster Ordnung 0 1 ( xv˙˙ ) = A ( xv ) mit A := −1 −k . 2 Die Eigenwerte von A ergeben sich als die Nullstellen λ1/2 = − k2 ± i 1 − k4 des charakteristischen Polynoms det(λ1l − A) = λ2 + kλ + 1. Es gilt det(A) = 1 und tr(A) = −k, wir bewegen uns also im Diagramm 5.3.1 auf einer horizontalen Geraden. Je nach Gr¨ oße des Reibungsterms m¨ ussen also drei F¨alle unterschieden werden: 1. Schwingfall:, Kleine Reibung, 0 ≤ k < 2, (siehe auch Aufgabe 5.12). 2 Die allgemeine L¨ osung hat hier mit ω := Im(λ1 ) = 1 − k4 die Form x(t) = e−kt/2 a cos(ωt) + b sin(ωt) wobei die Koeffizienten a und b aus den Anfangswerten x(0), x(0) ˙ zu bestimmen sind. F¨ ur den reibungsfreien Fall k = 0 liegt ein Zentrum vor, sonst eine Spirale. Die Schwingungsfrequenz ω(k) ist gegen¨ uber ω(0) = 1 verkleinert, aber es gilt noch ω(k) > 0. Die an der Feder aufgeh¨angte Masse pendelt sich allm¨ahlich in ihre Ruhelage (x, x) ˙ = (0, 0) ein.
x 1
=
Π
2Π
4Π
t
Zwei L¨ osungen f¨ ur den Schwingfall (k = 1/2)
2 Im Gegensatz zu dieser geschwindigkeitsproportionalen, nach Stokes benannten Reibung wird die Reibung in einer turbulenten Str¨ omung empirisch durch die zum Quadrat der Geschwindigkeit proportionale Reibung beschrieben.
86
5.4. Beispiel: Feder mit Reibung
2. Aperiodischer k = 2. 0 Grenzfall: 1 Es ist A = −1 −2 , und dieMatrix 1 1 V := −1 mit V −1 = 12 11 −1 1 1 , f¨ uhrt A in obere Dreiecksform u ¨ber: 2 J := V −1 AV = −1 0 −1 . Damit ist eJt = e−t ( 10 2t 1 ) und t exp(At) = V eJt V −1 = e−t 1+t −1 1−t .
x 1
1 2
Π 2Π 3Π Zwei L¨osungen f¨ ur den Aperiodischen Grenzfall
Beispielsweise ist bei verschwindender Anfangsgeschwindigkeit v0 = 0 x(t) = x0 (1 + t)e−t .
t
Es findet also keine Schwingung mehr statt. Wegen der Nichttrivialit¨at des Jordan–Blockes ist die Bewegung zur Ruhelage hin gegen¨ uber der L¨osung x(t) = x0 e−t verlangsamt. 3. Kriechfall: Große Reibung, k > 2. Hier hat A die beiden reellen negativen Eigenwerte λ1/2 = −
k±
+ √ 4 k2 − 4 k 1± 1− 2 . =− 2 2 k
F¨ ur k → ∞ ist also λ1 ∼ −k −1
,
λ2 ∼ −k.
Das Phasenportrait ist das eines Knotens. Physikalisch bedeutet dies, dass, außer f¨ ur sehr spezielle Anfangswerte (x0 , v0 ) die einem Eigenvektor zum kleineren Eigenwert λ2 entsprechen, die Ann¨aherung an die Ruhelage sich bei Vergr¨ oßerung von k verlangsamt: x(t) = aeλ1 t + beλ2 t .
x 1
1 2
Π Zwei L¨osungen f¨ ur den Kriechfall (k = 2.5)
2Π
t
Nicht autonomer Fall Eine in der Praxis wichtige Erweiterung des eben besprochenen Beispiels besteht darin, dass auf den Massenpunkt zus¨atzlich eine ¨außere Kraft wirkt. Soll beispielsweise dauerhaft eine Schwingung aufrechterhalten werden, kann man den
5. Klassifikation linearer Fl¨ usse
87
Aufh¨angungspunkt zeitperiodisch nach oben und unten bewegen. Die zu behandelnde Differentialgleichung hat dann die Normalform x ¨ + k x˙ + x = f (t) mit einer vorgegebenen ¨außeren Kraft f , etwa f (t) = a cos ωt. Es ist ja cos ωt = urzung der Rechnung nahe, eine partikul¨are Re(eiωt ). Es liegt also zur Verk¨ L¨osung y : R → C der komplexen Differentialgleichung y¨ + k y˙ + y = aeiωt zu suchen, und danach x(t) := Re(y(t)) zu setzen. Physikalisch ist wegen der Reibung zu erwarten, dass der Massenpunkt r, nach einiger Zeit haupts¨achlich eine harmonische Schwingung mit der Kreisfrequenz ω durchf¨ uhrt, die ihm 2 von außen aufgepr¨agt wird. Setzen Π = iωt 2 wir an: y(t) := Be , so ergibt sich y (k) (t) = (iω)k y(t), also 1 (1 − ω 2 + ikω)y(t) = Aeiωt
1
oder, nach Aufl¨osen nach B: A B= = Ar(ω)e−iϕ(ω) 1 − ω 2 + ikω 1 mit Amplitude r(ω) := √ 2 2
(1−ω ) +(kω)
2
Ω
Amplitude und Phasendifferenz der Erzwungenen Schwingung (k = 12 ) kω der und Phase ϕ(ω) := arctan 2 1−ω 2
erzwungenen Schwingung (siehe Abbildung, ein sogenanntes Bode–Diagramm). Offensichtlich spielt ω = 1 eine besondere Rolle; das ist nicht verwunderlich, denn die homogene Gleichung ohne Reibung hatte ja diese Frequenz ihrer L¨osungen. Wir interpretieren jetzt Amplitude und Phase der L¨osung physikalisch: • Amplitude: F¨ ur kleine anregende Frequenz ω schwingt die Masse etwa mit der Amplitude der Anregung. Ist ω nahe bei der auf 1 normierten Eigenfrequenz, dann kommt es zur Resonanz. Die Schwingungsamplitude wird gr¨ oßer als die anregende Amplitude und zwar um so gr¨ oßer, je geringer die D¨ampfung ist.3 Das Maximum von r(ω) liegt an der Stelle ω0 = 1 − k 2 /2, also zwischen der Eigenfrequenz mit und ohne Reibung. Die Maximalamplitude ist f¨ ur verschwindende D¨ampfung k ! 0 asymptotisch zu 1 1 ∼ . r(ω0 ) = 2 k k 1 − k /4 3 Voraussetzung:
k
0 gilt. 2. Die Menge C ⊂ R4 der lichtartigen Vektoren heißt Lichtkegel, mit dem Vorw¨ arts- beziehungsweise R¨ uckw¨ artslichtkegel C ± := {u ∈ C | ±u4 > 0}. 16.8 Aufgabe (Minkowski–Produkt) Zeigen Sie, dass ein Paar v, w zeitartiger ur Paare Vektoren immer ein Minkowski–Produkt v, w3,1 = 0 besitzt, dies aber f¨ raumartiger Vektoren nicht gilt. 3 16.9 Bemerkungen (Lichtgeschwindigkeit) 1. Einem Vektor u = (u1 , u2 , u3 , u4 ) ∈ R4 mit nichtverschwindender Zeitkomponente u4 = 0 weisen wir wie in der nichtrelativistischen Theorie den Geschwindigkeitsvektor u1 ? G(u) := uu2 u4 ∈ R 3 3
zu. Die lichtartigen u besitzen die Geschwindigkeit G(u) = 1, die Lichtgeschwindigkeit. F¨ ur zeitartige u ist G(u) < 1. 2. Lorentz–Transformationen ¨andern den Charakter eines Vektors im Sinn von Definition 16.7.1 nicht und bilden den Lichtkegel C auf sich ab. Die (in Bemerkung 16.4.2 definierten) orthochronen Lorentz–Transformationen bilden dabei C + und C − jeweils auf sich ab. 3 Jede Basis des Minkowski–Raums R4 definiert ein Koordinatensystem in der Raumzeit. Aber nicht jede Basis ist physikalisch angemessen. Jedenfalls ist die unftig, denn es gilt ei , ek 3,1 = δi,k sk mit kanonische Basis e1 , e2 , e3 , e4 vern¨ s 1 = s 2 = s3 = 1
und s4 = −1.
3 nach dem britischen Mathematiker und Physiker Llewellyn Hilleth Thomas (1903–1992), der 1926 die nach ihm benannte relativistische Pr¨ azession der Elektronen im Atom voraussagte. 4 Die Zuordnung der Nullpunktes ist in der Literatur nicht einheitlich.
420
16.3. Geometrie des Minkowski–Raumes
Die Maßst¨abe in den Raum- und der Zeitrichtung sind also normiert. Gleiches gilt f¨ ur eine Basis f1 , f2 , f3 , f4 genau dann, wenn es eine Lorentz– Transformation M gibt mit fk = M ek . Nach Bemerkung 16.9.2 sind dann f1 , f2 , f3 raumartig und f4 zeitartig, siehe nebenstehende Abbildung. Dort sind die Hyperboloide der Punkte u mit u, u3,1 = ±1 eingezeichnet, sowie auch ein von der f -Basis erzeugtes Koordinatennetz.
t f4 e4
f1 e1
x1
Zwar erhalten wir umgekehrt allein durch Angabe eines Geschwindigkeitsvektors v ∈ R3 , v < 1 noch kein Koordinatensystem, aber immerhin zwei ¨ Aquivalenzrelationen auf der Raumzeit. F¨ ur alle Inertialsysteme, die sich mit dieser Geschwindigkeit gegen das durch die kanonische Basis e1 , e2 , e3 , e4 gegebene Inertialsystem bewegen, beschreiben diese die gleichzeitigen beziehungsweise am gleichen Ort stattfindenden Ereignisse. Bezeichnen wir n¨amlich f¨ ur einen beliebigen zeitartigen Vektor f ∈ G−1 (v) den Lorentz–orthogonalen Unterraum f ⊥ := {e ∈ R4 | e, f 3,1 = 0}, dann h¨angen dieser und span(f ) nur von v ab. In jedem um a ∈ R4 verschobenen affinen Unterraum span(f ) + a sind die Ereignisse zueinander gleichortig. f ⊥ ist dreidimensional, und eine kleine Erweiterung der ersten Aussage aus ur einen Aufgabe 16.8 zeigt, dass alle Vektoren aus f ⊥ \ {0} raumartig sind. F¨ Beobachter mit dieser Geschwindigkeit v sind in jedem um a ∈ R4 verschobenen affinen Unterraum f ⊥ + a die Ereignisse zueinander gleichzeitig. 16.10 Bemerkung (konstante Lichtgeschwindigkeit und Lorentz–Gruppe) Bemerkung 16.9.2 rechtfertigt teilweise die Lorentz–Transformationen als Transformationen der Raumzeit, denn unter ihnen bleibt die Lichtgeschwindigkeit konstant. Zwar bilden auch die Dilatationen λ ∈ (0, ∞) (16.3.1) R4 −→ R4 , x −→ λx den Lichtkegel auf sich ab, ver¨andern aber die Minkowski–Bilinearform ·, ·3,1 durch Multiplikation mit λ2 . F¨ ur drei Raumdimensionen (nicht aber f¨ ur eine Raumdimension!) ist die um die Dilatationen (16.3.1) erweiterte Lorentz–Gruppe die gr¨oßte die Kausalit¨at erhaltende Symmetriegruppe, siehe Zeeman [Zee]. In diesem Sinn ist das Zitat von Einstein auf Seite 412 zu verstehen. 3 Die Bedeutung der Minkowski–Bilinearform geht also dar¨ uber hinaus, dass man mit ihr den Lichtkegel (sowie Zukunft und Vergangenheit) definieren kann. Wir
16. Relativistische Mechanik
421
definieren die sogenannte Minkowski–Norm 5 D(u) := | u, u3,1 |
u ∈ R4 .
(16.3.2)
F¨ ur einen Vektor u ∈ R3 ⊂ R4 (also mit u4 = 0) stimmt damit D(u) mit der euklidischen L¨ange u ur u ∈ R1 ⊂ R4 (also u = (0, 0, 0, u4 ) ∈ ¨berein. Ebenso mißt f¨ 4 R ) D(u) den zeitlichen Abstand. Mit der Minkowski–Norm k¨onnen wir also Strecken und Zeitspannen messen. Wie gewohnt ¨andert sich die L¨ange von u ∈ R3 ⊂ R4 unter Drehungen nicht (D(Ou) = D(u) f¨ ur O ∈ SO(3)). Das Besondere ist aber, dass sich diese Gr¨oßen auch unter Lorentz–boosts nicht ¨andern, das heißt D L(v)u = D(u). Dagegen ver¨andert sich die Norm u21 + u22 + u23 der Raumkomponente von u unter Lorentz–boosts: 16.11 Beispiel (Lorentz–Kontraktion) Wie man der Form (16.2.5) des Lorentz-boosts mit Geschwindigkeit v ∈ R3 , 0 < v < 1 ersehen kann, findet in Bewegungsrichtung eine (Lorentz–Kontraktion genannte) L¨angenverk¨ urzung um den Faktor (1l3 − Pv ) + γ(v)Pv Pv = γ(v) = (1 − v 2 )−1/2 < 1 statt (mit der Projektion Pv in Geschwindigkeitsrichtung). Senkrecht dazu Bezugssystemen die gleichen L¨angen werden dagegen in beiden gemessen, denn (1l3 − Pv ) + γ(v)Pv (1l3 − Pv ) = 1l3 − Pv . Der Grund f¨ ur die Lorentz–Kontraktion ist die Abh¨angigkeit der Definition gleichzeitiger Ereignisse vom Bezugssystem. Um etwa die L¨ange eines von links nach rechts am r¨aumlichen Nullpunkt unseres Bezugssystems vorbeifliegenden Stabes festzustellen, messen wir in unserem Bezugssystem die Orte der Stabenden gleichzeitig und bilden die Differenz. Im Bezugssystem des Stabes findet aber die Messung des linken Stabendes sp¨ater als die des (in beiden Bezugssystemen) zuerst vorbeikommenden rechten Stabendes statt, was eine entsprechende scheinbare Verk¨ urzung mit sich bringt (siehe Abbildung 16.3.1). 3 ¨ Ahnlich f¨ uhrt ein Lorentz–boost auch zu einer Zeitkontraktion. Wir nennen eine Kurve c : I → R4 im Minkowski–Raum Weltlinie, und zeitartig 6 , wenn sie regul¨ar ist mit zeitartigen Tangentialvektoren c (t) (t ∈ I). Unter der Eigenzeit einer Weltlinie c verstehen wir die Zeit, die in dem System gemessen wird, das durch c parametrisiert ist. 16.12 Satz Die entlang der zeitartigen Weltlinie c ∈ C 1 [t0 , t1 ], R4 vergangene Eigenzeit ist t1 τ (c) := D c (s) ds, t0
ist keine Norm auf dem R4 ! wird schon in der Definition von Weltlinien ihre Zeitartigkeit vorausgesetzt.
5 Dies 6 Oft
422
16.3. Geometrie des Minkowski–Raumes
t
t
2
2
2
2
x
2
2
x
2
2
Abbildung 16.3.1: Lorentz–Kontraktion eines Stabes der L¨ange 2. Links: Geschwindigkeit 0, rechts: Geschwindigkeit 0.75 c (mit D aus (16.3.2)) Diese Eigenzeit ist unabh¨angig von der Parametrisierung der Weltlinie. t Beweis: Die Funktion ϕ : [t0 , t1 ] → R, ϕ(t) := t0 D c (s) ds ist stetig diffe renzierbar mit ϕ (t) = D c (t) > 0. Damit ist ϕ auf dem Intervall Ableitung [0, τ ] := ϕ [t0 , t1 ] invertierbar. Die reparametrisierte Weltlinie c˜ := c ◦ ϕ−1 ∈ C 1 [0, τ ], R4 ist nicht nur zeitartig, sondern erf¨ ullt D c˜ = 1. Damit ist die Eigenzeit τ = τ (˜ c) = τ (c). 2 Ist die Weltlinie c durch den Zeitparameter t eines Inertialsystems parametrisiert, das heißt t cˆ(t) v(s) ds mit cˆ(t) = cˆ(t0 ) + c(t) = t t0
und der Geschwindigkeit v(s) zum Zeitpunkt s des Inertialsystems, entspricht ihr also die Eigenzeit t τ (c) = t01 1 − v(s) 2 ds. (16.3.3)
16.13 Beispiel (Hafele–Keating–Experiment) Im Experiment von Hafele und Keating [HK] wurden 1971 vier C¨asium-Atomuhren auf Fl¨ ugen um die Erde mitgenommen, in westlicher und in ¨ ostlicher Richtung. Beim Flug nach Westen gingen die Uhren im Vergleich zu Atomuhren in Washington um durchschnittlich 273 ± 7 Nanosekunden vor, beim Flug nach Osten um 59 ± 10 Nanosekunden nach. Die aus den Flugdaten abgeleitete Voraussage der Relativit¨atstheorie war ein Gangunterschied von +275 ± 21 beziehungsweise −40 ± 23 Nanosekunden. Diese setzte sich additiv aus einem Anteil der Speziellen und der Allgemeinen Relativit¨atstheorie zusammen.
16. Relativistische Mechanik
423
2005 wurde das Experiment modifiziert wiederholt, wobei Voraussage und Messung mit einer relativen Genauigkeit von ca. 2 % u ¨bereinstimmten. Der allgemein-relativistische Effekt wurde inzwischen sogar mit einer relativen Genauigkeit von 10−8 best¨atigt (siehe M¨ uller, Peters und Chu [MPC]), allerdings mit Atomen und einer Flugh¨ ohe von 0.1 mm. Wir berechnen den speziell-relativistischen Effekt in einer idealisierten Version ¨ des Experiments, bei der das Flugzeug entlang des Aquators mit einer konstanten Relativgeschwindigkeit vF ∈ (0, c) bodennah fliegt. Die Flugzeit ist damit T := ¨ uE /vF , mit dem Aquatorumfang uE . ¨ Am Aquator bewegt sich die Erdoberfl¨ache mit der Geschwindigkeit vE ∈ (0, c) gegen¨ uber einem im Erdmittelpunkt ruhenden Inertialsystem nach Osten. Damit sind nach (16.2.4) die Geschwindigkeiten des west- beziehungsweise ostw¨arts fliegenden Jets im Inertialsystem gleich (mit vmax := max(vE , vF )) vW =
vF − vE 1 − vF vE /c2
also vW = vF − vE + O
3 vmax c2
vF + vE , 1 + vF vE /c2
,
vO =
,
vO = vF + vE + O
3 vmax c2
.
Die Zeitdilatationen gegen¨ uber dem Inertialsystem sind durch (16.3.3) gegeben. Die Differenz zwischen der Zeitdilatation von Flugzeug und Erde ist also beim Ostflug tO := T
3 2 /c2 − 2 /c2 = −u vE + vF /2 + O vmax . 1 − vO 1 − vE E c4 c2
und beim Westflug tW := T
2 /c2 − 1 − vW
3 2 /c2 = u vE − vF /2 + O vmax . 1 − vE E c4 c2
Numerisch ist vE = uE /tE ≈ 465.1 m/s wobei uE ≈ 40 075 017 m der ¨ Aquatorumfang ist und tE ≈ 86 164 s die mittlere siderische Tagesl¨ange. Setzt man f¨ ur die Relativgeschwindigkeit des Flugzeugs vF := 900 km/h = 250 m/s an, ergeben sich im Inertialsystem die Geschwindigkeiten von vW ≈ 215.1 m/s und vO ≈ 715.1 m/s. Die Differenzen der Zeitdilatationen betragen dann tW ≈ 152 × 10−9 s und tO ≈ −263 × 10−9 s. 3 16.14 Aufgabe (Modifiziertes Zwillingsparadox) Zwei (z¨ahe) Schnecken be¨ geben sich entlang des Aquators auf Wanderschaft, eine nach Osten und eine nach Westen. Um wieviel weniger ist die nach Osten kriechende Schnecke gealtert, wenn sie sich beim Ausgangsort wieder treffen? Man betrachte also in Beispiel 16.13 die Zeitdifferenz tO − tW im Limes tS → 0 verschwindender
424
16.3. Geometrie des Minkowski–Raumes
Kriechgeschwindigkeit tS ! 3 Es sind solche nicht intuitive Ph¨anomene, die bis heute Widerspruch gegen die einsteinsche Relativit¨atstheorie hervorrufen, und auch immer neue Widerlegungsversuche provozieren (siehe das nebenstehende Facsimile eines entsprechenden Briefes). 16.15 Bemerkung Der Minkowski–Raum R4 , ·, ·3,1 wird in zwei Bedeutungen verwendet: • Als Raumzeit. Die Punkte x ∈ R4 heißen dann Ereignisse (denn Ereignisse finden an einem Ort und zu einem Zeitpunkt statt). Die (chronologische) Zukunft beziehungsweise Vergangenheit eines Ereignisses x sind dann definitionsgem¨aß die offenen Kegel I ± (x) := y ∈ R4 | y − x, y − x3,1 < 0, ±(y4 − x4 ) > 0 . Wir haben schon gesehen, dass Zukunft und Vergangenheit von 0 ∈ R4 invariant unter orthochronen Lorentz–Transformationen aus L↑ ist. Allgemeiner gilt f¨ ur Poincar´e–Transformationen Φ(a,A) : Φ(a,A) I ± (x) = I ± Φ(a,A) (x) x ∈ R4 , (a, A) ∈ R4 × L↑ . • Als Tangentialraum Tx R4 ∼ = R4 der Raumzeit an einem Punkt x ∈ R4 . Eine stetig differenzierbare Kurve c : I → R4 heißt zeitartig, wenn ihre Tangentialvektoren c (s) ∈ Tc(s) R4 f¨ ur alle Parameter s ∈ I zeitartig sind, und zwar zukunftsorientiert, wenn c4 (s) > 0 gilt. Offensichtlich besteht die Zukunft I + (x) von x aus den von x aus mit zukunftsorientierten Kurven erreichbaren Kurven. Einer mit ,der Zeit’ t parametrisierten Kurve C : I → R3 im Raum wird durch 4 C(t) c : I → R , t → eine zukunftsorientierte Kurve zugeordnet, falls f¨ ur t ihre Geschwindigkeit C (t) < 1 (t ∈ I) gilt. In der Allgemeinen Relativit¨atstheorie wird dann der Minkowski–Raum in seiner ersten Bedeutung als Raumzeit zu einer vierdimensionalen Mannigfaltigkeit mit einer Lorentz–Metrik verallgemeinert. Die als Untergruppe in der Poincar´e–Gruppe enthaltenen Translationen Ta : R4 → R4 , Ta (x) = x + a a ∈ R4 der Raumzeit R4 lassen die Lorentz–Metrik unver¨andert. Man spricht in diesem Zusammenhang von der Homogenit¨at der Raumzeit. 3
16. Relativistische Mechanik
16.4
425
Die Welt in relativistischer Sichtweise Or high Mathesis, with her charm severe, ” Of line and number, was our theme; and we Sought to behold her unborn progeny, And thrones reserved in Truth’s celestial sphere: While views, before attained, became more clear; And how the One of Time, of Space the Three, Might, in the Chain of Symbols, girdled be” Aus dem Gedicht The Tetractys W.R. Hamiltons u ¨ber die von ihm gefundenen Quaternionen, 1846
Hamilton hat in diesem Gedicht eine fruchtbare Anwendung seiner Theorie vorweggenommen. Ausgangspunkt ist die folgende Feststellung. Betten wir wie in E.27 den R4 als Vektorraum der Quaternionen ein: x1 x4 +ix3 x2 +ix1 x2 4 → −x I : R → Mat(2, C) , , x3 2 +ix1 x4 −ix3 x4
dann ist die Lorentz–Metrik des Minkowski–Raums von der Form x, y3,1 = − 12 tr I(x)I(y) . Auch die Lorentz–Transformationen der Himmelssph¨are k¨onnen so beschrieben werden. Damit wird z.B. die relativistische Verzerrung des Bildes am Kapitelanfang erkl¨art. Man k¨onnte aus der Diskussion der Lorentz–Kontraktion (in Bsp. 16.11) schließen, dass diese einfach zu einer optischen Stauchung der Objekte in ihrer Bewegungsrichtung f¨ uhrt. Entsprechende Abbildungen findet man in ¨alteren Popularisierungen der Relativit¨atstheorie. Wie wir sehen werden, ist dies nicht der Fall. Insbesondere sehen Kugeln auch f¨ ur bewegte Beobachter kugelf¨ormig aus. Ein Beobachter im Nullpunkt des Minkowski–Raumes sieht das Licht 7 x2 seines R¨ uckw¨artslichtkegels C − , und zwar unabh¨angig davon, ob seine Geschwindigkeit Null ist oder nicht. Dieser C+ ist die disjunkte Vereinigung der durch 0 die Raumrichtung x definierten Strahlen t x )|λ>0 (x ∈ S 2 ). R(x) := λ ( −1 R(x) CS1 Die Sph¨are S 2 nennen wir Himmelskugel. x In nebenstehender Abbildung ist die Geometrie f¨ ur zwei Raumdimensionen (das heißt in (R3 , ·, ·2,1 )) dargestellt, x1 mit der Himmelskugel S 1 . 7 und allgemeiner die elektromagnetische Strahlung, soweit sie sich nicht in einem Medium mit geringerer Geschwindigkeit als Lichtgeschwindigkeit 1 ausbreitet.
426
16.4. Die Welt in relativistischer Sichtweise
Wir untersuchen nun, wie sich die Richtungen und deren Winkelabst¨ande bei Lorentz–Transformationen ver¨andern. Dazu sind die Projektivit¨aten genannten Abbildungen die geeignete Sprache. 16.16 Definition Die projektive lineare Gruppe PGL(V ) eines K–Vektorraums V ist die Faktorgruppe PGL(V ) := GL(V ) / Z(V ) der allgemeinen linearen Gruppe GL(V ), mit der normalen Untergruppe 8 der Streckungen Z(V ) := {λ IdV | λ ∈ K∗ } GL(V ). Diese Gruppe wirkt auf dem projektiven Raum P(V ), denn GL(V ) wirkt auf diesem (siehe Beispiel E.18), und Z(V ) l¨asst die eindimensionalen Unterr¨aume von V invariant. 16.17 Beispiel (projektiver Raum KP(1) und M¨ obius–Transformationen) Wie in Beispiel 6.52 gezeigt, ist der reell-projektive Raum RP(1) ≡ P(R2 ) diffeomorph zur Kreislinie S 1 . Analog ist der komplex-projektive Raum CP(1) ≡ P(C2 ) diffeomorph zur Sph¨are S 2 (Bemerkung 6.36). Eine andere M¨ oglichkeit, dies zu sehen, besteht in der Identifikation von Sph¨are und projektivem Raum mit K ∪ {∞}, f¨ ur K = R beziehungsweise C. • Im Fall von S 1 beziehungsweise S 2 geschieht dies u ¨ber die stereographische Projektion (Beispiel A.29.3). • Im Fall von KP(1) identifiziert man die ¨ Aquivalenzklasse [v] = span(u) \ {0} ∈ KP(1) von u ∈ K2 \ {0} mit ∞, falls u2 = 0 und sonst mit u1 /u2 ∈ K, f¨ ur K = R bzw. K = C. Geometrisch entspricht letzteres {(u1 /u2 , 1)} = dem Schnittpunkt [u] ∩ K × {1} , siehe Abbildung.
1 u1u2
Die Projektivit¨aten oder M¨obius–Transformationen zu dieser Notation von der Form z →
u1 az + b f¨ ur z = cz + d u2
beziehungsweise
u
u2
a b c d
z →
u1
∈ GL(2, K) sind in
a f¨ ur z = ∞, c
siehe auch Aufgabe 6.42. Sie h¨angen nur von drei Parametern aus K ab, da Z¨ahler und Nenner mit der gleichen Zahl aus K∗ multipliziert werden kann, ohne das Ergebnis zu ¨andern. PGL(R2 ) ist damit eine dreidimensionale, PGL(C2 ) eine sechsdimensionale Lie–Gruppe. 8 Z(V ) wird auch das Zentrum von GL(V ) genannt, weil es aus den mit allen Gruppenelementen kommutierenden Abbildungen besteht.
16. Relativistische Mechanik
427
Im Artikel [AR] von Arnold und Rogness wird bewiesen und visualisiert, upfung von (inverdass die M¨obius–Transformationen aus PGL(R2 ) durch Verkn¨ ser) stereographischer Abbildung und starrer Bewegung der Sph¨are S 2 im R3 entstehen. 3 Der folgende Satz wurde 1959 unabh¨angig voneinander von Penrose in [Pen] und Terrell in [Te] bewiesen. 16.18 Satz Die restringierte Lorentz–Gruppe SO+ (3, 1) wirkt auf der Himmelskugel S 2 als die Gruppe PSL(2, C) := SL(2, C)/{±1l} orientierungserhaltender M¨obius–Transformationen. Beweis: • Betrachten wir zun¨achst f¨ ur den linearen Isomorphismus +v3 v1 +iv2 mit det A(v) = − v, v3,1 A : R4 → Sym(2, C) , A(v) := vv14−iv 2 v4 −v3 die Gruppenwirkung Φ : SL(2, C) × R4 → R4
,
Φg (v) := A−1 gA(v)g ∗ .
(16.4.1)
F¨ ur die Lorentz–Metrik und w := Φg (v) gilt w, w3,1 = − det gA(v)g ∗ = −| det(g)|2 det A(v) = − det A(v) = v, v3,1 . Die Gruppe SL(2, C) wirkt also durch Lorentz–Transformationen, und wir erhalten einen Gruppenhomomorphismus ˜ : SL(2, C) → O(3, 1). Π • Dieser erweitert den Gruppenhomomorphismus Π : SU(2) → SO(3) aus Satz E.29. Denn SU(2) ≤ SL(2, C) und SO(3) ≤ O(3, 1) sind Untergruppen, und f¨ ur −ix3 −ix 1 +x2 g ∈ SU(2) ist g ∗ = g −1 . Weiter ist mit σ : R3 → su(2), x → 12 −ix ix3 1 −x2 A ( x0 ) = 2i σ(x)
, also ΦU ( x0 ) = ΠU0(x)
x ∈ R3 , U ∈ SU(2) .
˜ SL(2, C) ist in der restringierten Lorentz–Gruppe SO+ (3, 1) ent• Das Bild Π halten: - nach Bemerkung 16.4.2 ist die Untergruppe SO+ (3, 1) ≤ O(3, 1) die Zusammenhangskomponente der Eins; - die Matrizen g ∈ SL(2, C) besitzen die Polarzerlegung g = u exp(w) mit u ∈ SU(2) und w ∈ Mat(2, C) hermitesch und spurlos. Umgekehrt ist jedes solche Produkt u exp(w) in SL(2, C). Da SU(2) ∼ = S 3 × R3 = S 3 , ist SL(2, C) ∼ zusammenh¨angend. ˜ SU(2) • Andererseits ist das Bild von SL(2, C) gleich SO+ (3, 1), wie man aus Π = SO(3) und der Transformation des positiven Faktors in der Polarzerlegung von
428
16.4. Die Welt in relativistischer Sichtweise
g ∈ SL(2, C) sieht. • Wir bemerken nun, dass wir die Abbildung C2 → Sym(2, C)
z = ( zz12 ) → z ⊗ z =
,
|z1 |2 z1 z2 z2 z1 |z2 |2
mit A−1 : Sym(2, C) → R4 zur sogenannten Hopf–Abbildung ⎛ Hopf : C2 → R4
, z=
( zz12
) →
2Re(z1 z2 ) 1 z2 ) ⎝ 2Im(z |z1 |2 −|z2 |2 |z1 |2 +|z2 |2
⎞ ⎠
verkn¨ upfen k¨onnen. Die ersten drei (also die ,r¨aumlichen’) Komponenten wurden schon im Zusammenhang des zweidimensionalen harmonischen Oszillators zur Parametrisierung von S 2 genutzt, siehe Bemerkung 6.36. 2dessenOrbitraum Das Bild Hopf C \ {0} ⊂ R4 ist der Vorw¨artslichtkegel C + aus Definition 16.7, und f¨ ur v := Hopf(z) ∈ C + ist die Faser die Kreislinie Hopf −1 (v) = {λz | λ ∈ S 1 ⊂ C}. Die lineare Wirkung ( zz12 ) →
g1,1 z1 +g1,2 z2 g2,1 z1 +g2,2 z2
der Matrix g =
g1,1
g1,2 g2,1 g2,2
∈
SL(2, C) auf C f¨ uhrt also bei Komposition mit der Hopf–Abbildung zu einer Lorentz–Transformation des Vorw¨artslichtkegels, die die Himmelskugel konform transformiert. 2 2
Einige M¨obius–Transformationen der Himmelskugel sind in den Abbildungen 16.4.1 und 16.4.2 dargestellt, genauer gesagt, ihre erzeugenden Vektorfelder: • Die t¨agliche scheinbare Drehung der Sterne um die Polachse der Erde ist uns vertraut. • Der boost konzentriert die Sterne in Geschwindigkeitsrichtung, w¨ahrend entgegen der Flugrichtung ihre Dichte abnimmt. • Kombinationen von Drehung und boost sind der typischere Fall. Nur bei Drehung um die Geschwindigkeitsrichtung sind dabei die beiden Nullstellen des M¨obius–Vektorfelds Antipoden. • Die beiden Nullstellen k¨ onnen sich auch zu einer degenerierten Nullstelle vereinigen. Da von den winkeltreuen M¨ obius–Transformationen Kreise auf Kreise abgebildet werden, ist keine relativistische L¨angenkontraktion sichtbar. Das steht nicht im Widerspruch zu den vorigen Bemerkungen. Denn in der in Beispiel 16.11 behandelten Lorentz–Kontraktion wurden die beiden Enden des vorbeifliegenden Stabes an verschiedenen Orten des Bezugssystems gemessen. In Penrose und Rindler [PR1] findet sich eine weiterf¨ uhrende Diskussion.
16. Relativistische Mechanik
429
Abbildung 16.4.1: Oben Links: Rotation, Oben Rechts: boost, Unten: Kombination von Rotation und boost
Abbildung 16.4.2: Links: Kombination von Rotation und boost, mit verschiedenen Achsen, Rechts: Orbits eines degenerierten M¨ obius–Vektorfelds
430
16.5
16.5. Von Einstein zu Galilei — und zur¨ uck
Von Einstein zu Galilei — und zur¨ uck
Die Relativit¨atstheorie Galileis entsteht durch Limesbildung aus der Speziellen Relativit¨atstheorie Einsteins, wenn die Lichtgeschwindigkeit c gegen Unendlich geht. Um dies zu sehen, setzen wir c > 0 in das Minkowski–Produkt ein 9 : ·, ·c : R4 × R4 → R,
,
v, wc = v1 w1 + v2 w2 + v3 w3 − c2 v4 w4 , (16.5.1)
und definieren die Lorentz–Gruppen als deren Invarianz–Gruppen, das heißt Lc := A ∈ GL(4, R) | ∀v, w ∈ R4 : Av, Awc = v, wc . ˜ c (v) einer Matrix A ∈ Lc mit einer orthogonalen In der Polarzerlegung A = OL ˜ Matrix O besitzt der Lorentz–boost durch Modifikation von (16.2.5) die explizite Form (1l3 − Pv )/γc (v) + Pv v v ∈ R3 , 0 < v < c , Lc (v) = γc (v) 1 v /c2 (16.5.2) mit γc (v) := (1− v 2 /c2 )−1/2 = 1+O(c−2 ). Damit ist f¨ ur jede Geschwindigkeit v ∈ R3 1l3 v L∞ (v) := lim Lc (v) = . 0 1 c→∞ Geh¨ort A zur restringierten Lorentz–Gruppe, dann ist die orthogonale Matrix in ˜ = ( O 0 ) mit Drehmatrix O ∈ SO(3). Noch der Polarzerlegung von der Form O 0 1 ˜ ∞ (v) = ( O Ov ) wird die Gestalt der Matrix bei Vertauschen der einfacher als OL 0 1 ˜ = ( O v ). Faktoren in der Polarzerlegung, denn L∞ (v)O 0 1 Die Poincar´e–Gruppe in ihrer explizit von der Lichtgeschwindigkeit abh¨angigen Form ist das semidirekte Produkt Pc := R4 Lc . Sie l¨aßt sich als Matrixa gruppe schreiben, indem man a ∈ R4 und A ∈ Lc in die 5 × 5-Matrix ( A 0 1) zusammenf¨ ugt. Nach Bildung des Limes c → ∞ erhalten O vwir mit dem Translaq tionsvektor a := ( qt ) ∈ R4 = R3 × R die Elemente 0 1 t der (eigentlichen 0 0 1
orthochronen) Galilei–Gruppe, mit Multiplikation O1 v1 q1 O2 v2 q2 O1 O2 v1 +O1 v2 q1 +v1 t2 +O1 q2 = . 0 1 t1 0 1 t2 0 1 t1 +t2 0
0 1
0
0 1
0
0
(16.5.3)
1
Wie die Poincar´e–Gruppe ist diese also eine zehndimensionale Lie–Gruppe. 16.19 Bemerkungen (Galilei–Gruppe) 1. Damit ist diese Gruppe isomorph zum semidirekten Produkt R4 E(3) der euklidischen Gruppe E(3) mit dem R4 : Auf den Raumzeitpunkt (q, t) ∈ R4 wirkt g := (Δq, Δt ; v, O) ∈ R4 E(3) durch (16.5.4) Φg (q, t) := Oq + vt + Δq, t + Δt . 9 Wo die Faktoren c als Umrechnungsfaktor zwischen Ort und Zeit eingef¨ ugt werden m¨ ussen, kann man leicht durch eine Dimensionsbetrachtung feststellen.
16. Relativistische Mechanik
431
2. Die Minkowski–Bilinearform (16.5.1) selbst besitzt keinen Limes unendlicher Lichtgeschwindigkeit. Statt dessen existiert in Galileis Relativit¨atstheorie eine absolute, vom Bezugssystem unabh¨angige Zeit. Zwei Raumzeitpunkte (q, t) = (q , t ) werden dabei gleichzeitig genannt, wenn man nicht physikalisch von (q, t) aus (q , t ) erreichen kann, es also kein (v, s) ∈ R4 mit (q , t ) = (q + vs, t + s) gibt. Das ist offensichtlich genau dann der Fall, wenn t = t ist. Galilei–Gleichzeitigkeit ¨ auf der Raumzeit. definiert damit 10 eine Aquivalenzrelation Die Raumzeit kann so als B¨ undel u ¨ber der Zeitachse R aufgefasst werden, deren Fasern isomorph, aber nicht kanonisch isomorph zum dreidimensionalen affinen Raum ist. Dieser Aspekt wird zum Beispiel im Kapitel II.2 des Buches [Scho] von Schottenloher diskutiert. Nur durch explizite Zeittranslation kann diese globale Uhrzeit ge¨andert wer¨ den, nicht durch Anderung der Geschwindigkeit. Dies kann man dem Eintrag t1 + t2 des Multiplikationsgesetzes (16.5.3) entnehmen. Der Raumpunkt dagegen h¨angt auch in Galileis Theorie von der Geschwindigkeit ab, entsprechend dem Eintrag q1 + v1 t2 + O1 q2 in (16.5.3). Es gibt in ihr keine absolute ,Gleichortigkeit’. Auch das Konzept der absoluten Gleichzeitigkeit aufzugeben, stellte den entscheidenden Schritt auf dem Weg zur Speziellen Relativit¨atstheorie dar. 3. Erstaunlicher als die Tatsache, dass die Galilei–Gruppe so durch Limesbildung aus der Poincar´e–Gruppe gewonnen werden kann, ist, dass auch der umgekehrte Weg m¨ oglich ist. Durch eine Deformation genannte Technik l¨aßt sich die einsteinsche Spezielle Relativit¨atstheorie gruppentheoretisch und fast ohne physikalische Zus¨atze aus der Theorie Galileis ableiten. Die Lie–Algebra g einer Lie–Gruppe bestimmt deren lokale Struktur (siehe Bemerkung E.23.2). In einer Basis b1 , . . . , bn des R–Vektorraums g ist die Lie–Algebra–Struktur durch die Koeffizienten cki,j ∈ R in deren Lie–
n k Klammer [bi , bj ] = k=1 ci,j bk festgelegt. Aus deren Antisymmetrie folgt k k cj,i = −ci,j , w¨ahrend die Jacobi–Identit¨at die quadratischen Beziehungen
n m m m =1 ci,j c,k + cj,k c,i + ck,i c,j = 0 der Koeffizienten ergibt. Die Menge der Struktur–Tensoren (cki,j ) von Lie-Algebren bildet damit eine Teilmenge L(n) eines n3 –dimensionalen R–Vektorraums. Auf diesem operiert die Gruppe GL(n, R), und deren Orbits in L(n) bestehen aus zueinander isomorphen Lie–Algebren. Die Kontraktionen einer Lie–Algebra entsprechen den Randpunkten von deren Orbits. Wie wir gesehen haben, entsteht die Lie–Algebra der Galilei–Gruppe durch eine solche Kontraktion aus der Lie–Algebra der Poincar´e–Gruppe. Die Grundidee der Deformation von g besteht umgekehrt darin, die Koeffizienten von g in L(n) zu st¨ oren, und zu schauen, ob die so entstehende 10 im
Gegensatz zum Fall der Speziellen Relativit¨ atstheorie!
432
16.5. Von Einstein zu Galilei — und zur¨ uck
Lie–Algebra g zu g isomorph ist (siehe Kapitel 7.2 des Buches [OV] von Onishchik und Vinberg). F¨ ur die Lie–Algebra der euklidischen Gruppe E(3) wird man so einerseits auf die Lie–Algebra so(4) der Drehgruppe, andererseits auf die der Lorentz– Gruppe gef¨ uhrt. Die Drehgruppe scheidet als Kandidatin einer relativistischen Symmetrie der Raumzeit aus. Details kann man in [FOF] und den darin zitierten Arbeiten finden. 3 Die grundlegenden Wechselwirkungen einer physikalischen Theorie sollten unter den relativistischen Symmetrietransformationen invariant sein. Dies schr¨ankt die Form der physikalisch fundamentalen Hamilton–Funktion ein. Um diese Invarianz u ussen wir statt Pha¨berhaupt formal zu definieren, m¨ senr¨aumen, die Kotangentialb¨ undel u ¨ber dem Ortsraum sind, solche u ¨ber der Raumzeit betrachten. Sehr allgemein gehen wir aus von einer eventuell zeitabh¨angigen Hamilton– Funktion H : T ∗ M × Rt → R auf dem um die Zeitachse Rt erweiterten Phasenraum T ∗ M mit Konfigurationsmannigfaltigkeit M . Das Produkt T ∗ M × T ∗ Rt von Kotangentialr¨aumen (T ∗ M, ω1 ) und (T ∗ Rt , ω2 ) mit ihren kanonischen symplektischen Formen besitzt mit den Projektionen πi auf die Faktoren die nach Satz 6.48 symplektische Struktur ω := ω1 & ω2 = π1∗ (ω1 ) − π2∗ (ω2 ).
(16.5.5)
Dabei ist das Vorzeichen so gew¨ahlt, dass ω an den Minkowski–Raum ·, ·3,1 angepasst ist. Die von H erzeugte Dynamik vergleichen wir mit der von ˜ : T ∗ (M × Rt ) → R H
˜ E; q, t) := H(p, q, t) − E. , H(p,
(16.5.6)
Die hamiltonschen Bewegungsgleichungen sind (in lokalen kanonischen Koordinaten p = (p1 , . . . , pd ), q = (q1 , . . . , qd ) von T ∗ M ) p˙j = −
∂H ∂qj
,
q˙j =
∂H ∂pj
∂H , E˙ = ∂t
und t˙ = 1,
wobei der Punkt die Ableitung nach dem Zeitparameter s bezeichnet. Also ˜ korrespondieren mit denen k¨onnen wir t = s setzen, und die L¨ osungen f¨ ur H f¨ ur H. ˜ −1 (0) gilt außerdem E = H(p, q, t), die PhasenraumAuf der Niveaumenge H variable E ist also dort als Gesamtenergie interpretierbar. Wir spezialisieren nun auf den Fall M := R3q , und untersuchen unter der auf T ∗ R4 gelifteten Wirkung der Poincar´e–Gruppe P = R4 L die Form der invarianten Hamilton–Funktionen. (a, A) ∈ P wirkt durch die affine Abbildung Φ(a,A) : R4 → R4 , x → Ax + a auf der Raumzeit R4 , also durch deren ω–symplektischen Kotangentiallift (siehe Definition 10.32) ∗ ΦT(a,A) : T ∗ R4 → T ∗ R4 , (p, x) → I A−1 I p, Ax + a (16.5.7)
16. Relativistische Mechanik
433
auf deren Kotangentialraum. Wegen der (nach Bemerkung 16.2.4 aus der Definition der Lorentz-Gruppe folgenden) Relation A IA = I, mit der Diagonalma trix I = diag(1, 1, 1, −1), kann man statt der Matrix I A−1 I auch einfach A schreiben. 16.20 Lemma (Kotangentiallift der Galilei-Transformation) Der nichtrelativistische Limes von (16.5.7) f¨ ur die Poincar´e–Transformation mit Polarzerlegung ˜ orthogonaler Matrix O ˜ = ( O 0 ) und a = Δq ist Ac := Lc (v)O, 0 1 Δt (p, E ; q, t) −→ Op , E + v, Op ; Oq + vt + Δq , t + Δt . (16.5.8) Dies ist der Kotangentiallift der Galilei-Transformation (16.5.4) auf T ∗ R4 ∼ = T ∗ R3 × T ∗ R. I = Dc Ac Dc−1 , mit Dc := Beweis: Analog zur obigen Bemerkung ist I A−1 c 2 diag(1, 1, 1, c ). Weiter ist ˜ c−1 = Dc Lc (v)Dc−1 O. ˜ Dc Ac Dc−1 = Dc Lc (v)Dc−1 Dc OD Der Limes c → ∞ ergibt sich nach Konjugation der Formel (16.5.2) f¨ ur den 2 Lorentz–boost Lc (v). Bemerkenswert an (16.5.8) ist, dass in diesem Limes der Impuls p ∈ R3 durch den ¨ Ubergang zum Bezugssystem mit Relativgeschwindigkeit v nicht ver¨andert wird. Wir erinnern uns aber daran, dass der Impuls erst durch Angabe der Hamilton– Funktion eines Teilchens eine Beziehung zu dessen Geschwindigkeit bekommt. Da a ∈ R4 frei w¨ahlbar ist, kann eine Lorentz–invariante Hamilton–Funktion nur vom Vierer-Impuls p abh¨angen. F¨ ur beliebige f ∈ C 1 (R, R) ist eine Hamilton– Funktion der Form ˜ c (p, q) := f p, p ˜ c : T ∗ R4 → R , H H 1/c invariant. Im einfachsten Fall ist f : R → R linear, und zum Vergleich mit der nichtrelativistischen Theorie bezeichnen wir die Steigung von f mit 1/(2m). Schreiben wir den Viererimpuls in der Form (p, E) ∈ R3 × R, dann ergibt sich 2 f¨ ur den Wert − mc 2 der Hamilton–Funktion ˜ c (p, E; q, t) := p − E 2 2 H 2m 2mc 4 2 2 also die Formel E = mc2 1 + p = mc2 + p +O p f¨ ur die Energie mc 2m mc des relativistischen freien Teilchens. Die Bewegungsgleichungen 2
dp =0 ds
,
dE =0 , ds
˜ f¨ von H uhren auf der Niveaumenge von dq = dt
dq p = ds m mc2 2
,
dt E = ds mc2
zur relativistischen Beziehung
p 2 m 1 + p mc
434
16.5. Von Einstein zu Galilei — und zur¨ uck
zwischen Geschwindigkeit und Impuls. 2 ˜ c (p, E; q, t) = p ist, wird f¨ ur W¨ahrend der punktweise Limes limc→∞ H 2m vorgegebene Werte von p (sowie q und t) auf der c–abh¨angigen Niveaufl¨ache 2 p2 2 ˜ ˜ ˜ von mc 2 der nichtrelativistische Limes von Hc (p, E + mc ; q, t) gleich 2m − E. ¨ Die auf diese Weise oder durch den Ubergang (16.5.6) auf den erweiterten Phasenraum gewonnene nichtrelativistische Hamilton–Funktion ˜ : T ∗ (R3q × Rt ) → R H
,
2 ˜ E; q, t) := p − E H(p, 2m
(16.5.9)
ist allerdings unter der gelifteten Wirkung (16.5.8) der Galilei–Gruppe nicht invariant. Daher benutzt man nichtrelativistisch statt (16.5.8) die folgenden Transformationen: 16.21 Lemma (Phasenraumwirkung der Galilei–Gruppe) Die Abbildungen (p, E ; q, t) → Op + mv , E + v, Op + 12 m v 2 ; Oq + vt + Δq , t + Δt (16.5.10) definieren eine (bez¨ uglich ω aus 16.5.5) ω–symplektische Gruppenwirkung der Galilei–Gruppe auf dem Phasenraum T ∗ R4 der Raumzeit, die die Wirkung Φ aus Bemerkung 16.19.1 u ¨berlagert. Beweis: • Abbildung (16.5.10) ist die Komposition des (ω–symplektischen) Kotangentiallifts (16.5.8) mit der Translation der Fasern von T ∗ R4 um die Kon 1 stante mv, 2 m v 2 ; 0, 0 . Damit ist sie ω–symplektisch. • Außerdem gilt f¨ ur die Komposition der Wirkungen der Bewegungen (v1 , O1 ), (v2 , O2 ) ∈ E(3): O1 (O2 p + mv2 ) + mv1 = O1 O2 p + m(O1 v2 + v1 ) und
E + v2 , O2 p + 12 m v2 2 + v1 , O1 (O2 p + mv2 ) + 12 m v1 2 = E + O1 v2 + v1 , O1 O2 p + 12 m O1 v2 + v1 2 .
Es liegt also wirklich eine Gruppenwirkung der Galilei–Gruppe vor. • Die letzten beiden Eintr¨age in (16.5.10) stimmen mit (16.5.4) u ¨berein. Die Wirkung Φ wird also u 2 ¨berlagert. Diese Abbildungen unterscheiden sich zwar von (16.5.8) nur durch eine konstante Fasertranslation von T ∗ R4 , lassen aber die Hamilton–Funktion (16.5.9) invariant. Nichtrelativistische Teilchen k¨ onnen auf vielerlei Weise Galilei–invariant miteinander interagieren. Der erweiterte Phasenraum von n Teilchen ist Pn := T ∗ R3n q × Rt .
16. Relativistische Mechanik
435
Die Wirkung der Galilei–Gruppe ist diagonal bez¨ uglich der Koordinaten der > 0 und die Gesamtmasse m := Teilchen, das heißt f¨ u r die Teilchenmassen m k
n ¨ber in k=1 mk geht der Phasenraumpunkt (p1 , . . . , pn , E; q1 , . . . , qn , t) ∈ Pn u O(p1 + m1 v), . . . , O(pn + mn v) , E + v, p1 + . . . + pn + 12 m v 2 ; O(q1 + vt) + Δq, . . . , O(qn + vt) + Δq , t + Δt .
16.22 Aufgabe (Galilei–Gruppe) (a) Zeigen Sie analog zu Lemma 16.21, dass diese Abbildungen eine symplektische Gruppenwirkung der Galilei–Gruppe auf dem erweiterten Phasenraum Pn von n Teilchen definieren. (b) Wir betrachten die Hamilton–Funktion H : Pn → R, H(p1 , . . . , pn , E; q1 , . . . , qn , t) =
n
pk 2 k=1
2mk
+
Vk, (qk − q ) − E.
1≤k 0) wird die Bahn durch die Hamilton–Funktion H : R2 → R , H(p, q) = 1 + p2 − g q beschrieben, vergleiche mit Beispiel 8.7. Damit ist p˙ = g und q˙ = p/ 1 + p2 .
436
16.6. Relativistische Dynamik
t
t
2
2
]=
2
2
2
x
2
2
x
2
Abbildung 16.6.1: Weltlinien, das heißt Flugbahnen in Raumzeit-Darstellung. Die Geraden sind im beschleunigten Bezugssystem simultan. Links: R¨ uckkehr zum Ausgangspunkt. Rechts: Konstante Beschleunigung. Alle L¨osungskurven ergeben sich durch Raumzeittranslation aus der mit Energie H = 0 und p(0) = 0, also q(0) = 1/g. Wir erhalten q˙ = 1 − g/q 2 , also q(t) =
g −2 + t2
t und q(t) ˙ = ∈ (−1, 1). g −2 + t2
t → q(t), t ∈ R2 ist die parametrische Gleichung einer Hyperbel (siehe Abbildung 16.6.1, rechts). Die Raumzeitgeraden der im mitbewegten Bezugssystem zum Punkt q(s), s simultanen Ereignisse sind daher von der Form
q(s), s + c 1, q(s) ˙ | c ∈ R = span g −2 + s2 , s (s ∈ R), schneiden sich also alle im Nullpunkt der Raumzeit. uglich des NullDamit ist der Doppelkegel {(x, t) ∈ R2 | t2 > x2 } der bez¨ punktes des Minkowski–Raumes R2 zeitartigen Ereignisse zu keinem Punkt der Weltlinie simultan. 3 Das beschriebene Ph¨anomen deckt sich nicht mit der Alltagserfahrung, tritt aber auch im Alltag kaum auf (denn Beschleunigungen, die viel gr¨oßer als die Erdbeschleunigung sind und Entfernungen, die gr¨ oßer als ein Lichtjahr sind, geh¨oren nicht zu unserem Erfahrungsschatz): 16.25 Aufgabe (konstante Beschleunigung) Berechnen Sie die Entfernung des Kreuzungspunktes aus Beispiel 16.24 vom beschleunigten Beobachter, falls 3 dieser eine konstante Beschleunigung von 10 m/s2 erf¨ahrt.
Kapitel 17
Symplektische Topologie
Volumenerhaltendes, nicht symplektisches Kamel
¨ 17.1 Das symplektische Kamel und das Nadelohr . . . . . . . . 438 ´ 17.2 Der Satz von Poincare–Birkhoff . . . . . . . . . . . . . . . 442 17.3 Die Arnol’d–Vermutung . . . . . . . . . . . . . . . . . . . . 446
In der Theorie dynamischer Systeme werden topologische Methoden oft dann eingesetzt, wenn die Dynamik zu kompliziert ist, um direkt Fragen wie die nach der Existenz periodischer Orbits zu beantworten. Da hamiltonsche Differentialgleichungen (wie auch Gradienten–Differentialgleichungen) durch die Ableitung einer Funktion H : M → R definiert werden, A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 17,
437
438
17.1. Das symplektische Kamel und das Nadel¨ohr
werden topologische Aussagen u ¨ber Werte einer reellen Funktion auf einer Mannigfaltigkeit zu dynamischen Aussagen. Beispielsweise besitzt eine solche Funktion auf einer kompakten Mannigfaltigkeit Minimum und Maximum. Die Morse–Theorie sagt (abh¨angig von der Topologie der Mannigfaltigkeit) die Existenz weiterer kritischer Punkte der Hamilton–Funktion voraus. All diese sind Ruhelagen des dynamischen Systems. Die meisten Phasenr¨aume der Klassischen Mechanik sind nicht kompakt, weswegen die obigen Argumente verfeinert werden m¨ ussen. Die symplektische Topologie, ein in den letzten Jahrzehnten sehr aktives Forschungsgebiet, versucht, solche dynamische Eigenschaften hamiltonscher Systeme zu ergr¨ unden. Darin ersch¨opft sie sich aber nicht. Beispielsweise sind (nach dem Satz von Darboux, siehe Seite 214) symplektische Mannigfaltigkeiten gleicher Dimension lokal nicht von einander zu unterscheiden, ganz im Gegensatz etwa zu riemannschen Mannigfaltigkeiten. Was sind aber die globalen Invarianten? Einige Antworten kommen direkt in den Sinn: • Auf einer Mannigfaltigkeit kann es nicht isomorphe symplektische Strukturen geben, denn etwa das Volumen einer kompakten symplektischen Mannigfaltigkeit ist eine Invariante. • Ebenso tr¨agt nicht jede Mannigfaltigkeit eine symplektische Struktur. Abgesehen von der Bedingung gerader Dimension muss sie orientierbar sein. In diesem Kapitel werden einige weiter gehende Antworten angesprochen.
17.1
Das symplektische Kamel und das Nadel¨ ohr
Eher geht ein Kamel durch ein Nadel¨ohr, als dass ein Reicher in das Reich ” Gottes gelangt.” Evangelium nach Markus, 10,25 Unter diesem merkw¨ urdigen Titel firmiert eine von M. Gromov in den 1980er Jahren begonnene Analyse der Invarianten symplektischer Abbildungen. K¨onnte sich das symplektische Kamel mit beliebigen volumenerhaltenden statt nur mit ¨ symplektischen Diffeomorphismen verformen, so die Idee, w¨are die Uberwindung des Nadel¨ohrs keine Schwierigkeit. So aber verwehren ihm seine symplektischen Rippen den Zutritt. Das Kamel wird dabei durch eine Vollkugel Br vom Radius r im symplektischen Vektorraum (R2n , ω0 ) modelliert und das Nadel¨ohr durch ein Loch vom ur n = 1 Freiheitsgrad kann sich das Radius R in einer Hyperfl¨ache H ⊂ R2n . F¨ Kamel immer fl¨achenerhaltend d¨ unn machen und durch das Loch schl¨ upfen. F¨ ur n ≥ 2 geht das symplektisch aber nur 1 , falls r < R. 1 technisch: Es existiert eine symplektische Isotopie Φ : R2n → R2n , t ∈ [0, 1] mit Φ = Id, t 0 die die gelochte Hyperfl¨ ache invariant l¨ aßt und f¨ ur die Φ1 (Br ) in der anderen Komponente von R2n \ H liegt als Br .
17. Symplektische Topologie
439
Im von Gromov 1985 bewiesenen nonsqueezing -Satz wird gefragt, wann die Vollkugel Br symplektisch in einen speziellen Zylinder ZR vom Radius R abgebildet werden kann. Dies ist in beliebiger Dimension genau dann m¨oglich, wenn r ≤ R. Aus dem nonsqueezing-Satz folgt die obige Aussage u ¨ber das symplektische Kamel, aber, wie wir sehen werden, noch viel mehr (siehe aber [AbMa]). Wir schauen uns das Problem zun¨achst in einer stark vereinfachten Situation an, bei der nur affin symplektische Abbildungen des 2n–dimensionalen Vektorraums E f :E→E
,
x → g(x) + a mit
g ∈ Sp(E, ω) und a ∈ E
(17.1.1)
betrachtet werden. Diese bilden als semidirektes Produkt E Sp(E, ω) eine Lie– Gruppe, genannt ASp(E).2 Um Objekte wie Kugeln und Zylinder zu definieren, ben¨otigt man eigentlich eine euklidische Norm, also eine Zusatzstruktur. Außerdem werden Kugeln unter affinen symplektischen Abbildungen nicht auf Kugeln abgebildet (die Eigenschaft, eine Kugel zu sein, ist also keine affin symplektische Invariante). Dagegen ist in einem endlich-dimensionalen reellen Vektorraum E auch ohne Norm definierbar, wann eine Teilmenge E ⊆ E ein Ellipsoid ist, n¨amlich, wenn f¨ ur eine geeignete positiv definite quadratische Form Q:E→R
gilt:
E = {x ∈ E | Q(x) ≤ 1}.
Da sich die quadratische Form aus dem Ellipsoid durch Q(0) := 0 und Q(x) := inf{q > 0 | x/q ∈ E} f¨ ur x ∈ E \ {0} rekonstruieren l¨aßt, sind Ellipsoide und positiv definite quadratische Formen zwei Seiten einer Medaille. Unsere erste Frage ist die nach den symplektischen Normalformen von Ellipsoiden (beziehungsweise positiv definiten quadratischen Formen). Wir vergleichen zun¨achst mit Normalformen f¨ ur andere Gruppen: • Auf dem Raum P = P(E) dieser Formen wirkt die allgemeine lineare Gruppe GL(E) transitiv durch GL(E) × P → P
, (f, Q) → Q ◦ f.
Dies kann man f¨ ur den Fall E = Rd und die Darstellung Q(x) = x Q x mit −1/2 1/2 Q ∈ Sym(d, R) sehen, indem man Q1 mit der Kongruenzmatrix Q1 Q2 ∈ GL(d, R) in Q2 transformiert. Jedes Ellipsoid l¨asst sich also linear in die Einheitskugel u uhren. ¨berf¨ • F¨ ur die spezielle lineare Gruppe SL(d, R) ⊂ GL(d, R) ist das Volumen des Ellipsoids die einzige Invariante, und dieses ist proportional zu det(Q)−1/2 . • F¨ ur die orthogonale Gruppe O(d) ⊂ GL(d, R) sind dagegen die d L¨angen der Hauptachsen des Ellipsoids die Invarianten. 2 Ihre
Dimension ist n(2n + 3), denn nach Aufgabe 6.26 ist dim Sp(E, ω) = n(2n + 1).
440
17.1. Das symplektische Kamel und das Nadel¨ohr
Im Vergleich zum letzten Fall gibt es f¨ ur d = 2n und die symplektische Gruppe nur halb so viele Invarianten: 17.1 Lemma (Symplektische Normalform von Ellipsoiden) F¨ ur jedes Ellipsoid E ⊂ R2n im kanonischen symplektischen Vektorraum (R2n , ω0 ) gibt es eindeutige reelle Zahlen 0 < r1 ≤ . . . ≤ rn und eine symplektische Abbildung f ∈ Sp(2n, R) mit E = f (Er1 ,...,rn ) f¨ ur das Ellipsoid
n p2 +q2 Er1 ,...,rn := (p, q) ∈ R2n k=1 kr2 k ≤ 1 . k
Beweis: Dies folgt aus Lemma 6.29 und der Normalform-Darstellung (6.3.2). 2 Damit sind die linear symplektischen Bilder von Br2n = Er,...,r die bestm¨oglichen Analoga der euklidischen Kugel Br2n vom Radius r > 0, und f¨ ur n ≥ 2 ist nicht jedes Ellipsoid f¨ ur einen geeigneten Radius r so darstellbar. Wir betrachten symplektische Zylinder der Form ZR := (p, q) ∈ Rnp × Rnq = R2n | p21 + q12 ≤ R2 . Die Frage ist nun, wann es ein f ∈ ASp(R2n , ω0 ) gibt mit f (Br ) ⊂ ZR . 17.2 Satz (Gromovs nonsqueezing-Resultat, linearer Fall) Genau dann kann man eine Kugel vom Radius r affin symplektisch in den Zylinder ZR abbilden, wenn r ≤ R ist. Beweis: • F¨ ur r ≤ R bildet f = Id die Kugel in den Zylinder ab. • Die Nichtexistenz-Aussage folgt durch Skalierung aus dem Spezialfall r = 1. Es sei f (x) = g(x) + a mit g ∈ Sp(R2n , ω0 ) und a = (a1 , . . . , a2n ) ∈ R2n . Die linke Seite der Bedingung maxx∈S 2n−1 f1 (x)2 + fn+1 (x)2 ≤ R2 ist minimal f¨ ur a1 = an+1 = 0. Auch die Transponierte H = (h1 , . . . , h2n ) der darstellenden Matrix von g ist symplektisch, und daher gilt hk hn+k ≥ ω0 (hk , hn+k ) = 1. Wir folgern = maxx∈S 2n−1 h1 , x2 + hn+1 , x2 maxx∈S 2n−1 f1 (x)2 + fn+1 (x)2 ≥
max{ h1 2 , hn+1 2 } ≥ 1,
durch Anwendung der Ungleichung ab ≤ max{a2 , b2 } auf a := h1 und b := 2
hn+1 . 17.3 Bemerkung (Squeezing f¨ ur volumenerhaltende Abbildungen) Stellt man die analoge Frage f¨ ur affine volumenerhaltende Abbildungen (bei denen in (17.1.1) gefordert wird, dass g ∈ SL(2n, R) ist), dann ist f¨ ur n ≥ 2 Freiheitsgrade eine entsprechende Einbettung immer m¨oglich. Denn dann besitzt der Zylinder ZR (der selbst als degenerierte Ellipse aufgefasst werden kann) unendliches Volumen. Die Aussage betrifft also eine spezifische, u ¨ber die Volumenerhaltung hinausgehende, Eigenschaft symplektischer Abbildungen. 3
17. Symplektische Topologie
441
17.4 Korollar Genau dann kann man das Ellipsoid Er1 ,...,rn affin symplektisch in den Zylinder ZR abbilden, wenn r1 ≤ R ist. Wesentlich ist also, dass die symplektische Fl¨ache πr12 des Ellipsoids kleiner als die symplektische Fl¨ache πR2 des Zylinders ist. Im nonsqueezing-Satz wird damit eine zweidimensionale Eigenschaft von Teilmengen des symplektischen Phasenraums gemessen. Grundlegende Invarianten der symplektischen Theorie sind zweidimensional, w¨ahrend etwa Kurvenl¨angen eindimensionale Invarianten der riemannschen Theorie sind. Wir sehen dies auch am Beispiel der von Helmut Hofer eingef¨ uhrten displacement-Energie 1 sup(Ht ) − inf(Ht ) dt e(K) := inf {Ht }
0
einer (kompakten) Teilmenge K ⊂ M einer symplektischen Mannigfaltigkeit (M, ω). Diese misst die Energie, die ben¨ otigt wird, um durch einen von {Ht }t∈[0,1] erzeugten hamiltonschen Fluss {φt }t∈[0,1] die Menge K von sich selbst zu trennen, das heißt φ1 (K) ∩ K = ∅. 17.5 Beispiel (Displacement-Energie) Wir schauen uns den einfachsten Fall eines Flusses an, der von einer linearen zeitunabh¨angigen Hamilton–Funktion erzeugt wird K wirkt. Das
und auf ein Ellipsoid
Ellipsoid sei achsenparallel, das 2 p2k n qk 2n heißt K = (p, q) ∈ R k=1 r2 + s2 ≤ 1 . Der von der Hamilton–Funktion k
Hξ,η : R
2n
→R
k
, Hξ,η (p, q) = ξ, p − η, q
(ξ, η ∈ Rn )
erzeugte Fluss ist die Verschiebung φt (p, q) = (p + tη, q + tξ).
2 −1/2 2 n ηk ξk die Tren• Damit ist f¨ ur alle Zeiten |t| > T (ξ, η) := 2 2 + s2 k=1 rk k nung erfolgt (φt (K) ∩ K = ∅). Genau dann, wenn (η, ξ)/2 ein Punkt der Oberfl¨ache von K ist, gilt damit T (ξ, η) = 1. • Andererseits ist die eingesetzte Energie gleich
Hξ,η
:= max{Hξ,η (x) | x ∈ K} − min{Hξ,η (x) | x ∈ K} = 2 max{Hξ,η (x) | x ∈ K},
wegen der Punktsymmetrie von K. Durch Maximierung mit der Nebenbedingung x ∈ K ergibt sich 2 2 1/2 .
Hξ,η = 2 ξ, r + η, s Schreiben wir die Komponenten des Verschiebungsvektors in der Polarform + η2 ξ2 ξk = k sk cos ϕk , , ηk = k rk sin ϕk mit k := r2k + sk2 , (17.1.2) k
k
n 2 1/2 dann ist Hξ,η = 2 . k=1 (k rk sk ) • Wir nehmen jetzt T (ξ, η) = 1 an, also 2 = 2. Falls fj = min{f1 , . . . , fn }
442
17.2. Der Satz von Poincar´e–Birkhoff
f¨ ur fk := rk sk , nimmt Hξ,η das Minimum 4fj an, wann immer in (17.1.2) ur alle anderen k gilt. Damit ist die Verschiebungsenergie j = 2 und k = 0 f¨ proportional zur oben definierten symplektischen Fl¨ache des Ellipsoids. 3 Die Displacement-Energie ordnet zwar Mengen wie den Ellipsoiden eine nichtnegative Zahl zu, aber diese h¨angt von der Einbettung der Menge in die symplektische Mannigfaltigkeit (im Fall der Ellipsoide der (R2n , ω0 )) ab, ist also keine intrinsische Gr¨oße. Als Konsequenz haben Ekeland und Hofer in [EH] axiomatisch definiert, was unter einer (intrinsischen) symplektischen Kapazit¨at zu verstehen sei. 17.6 Definition Eine Abbildung c : (P, ω) → [0, ∞], die den symplektischen Mannigfaltigkeiten nichtnegative Zahlen zuordnet, heißt eine symplektische Kapazit¨ at, wenn sie die folgenden Eigenschaften besitzt: Monotonie: Falls es eine kanonische Transformation gibt, die (P1 , ω1 ) in (P2 , ω2 ) einbettet, ist c(P1 , ω1 ) ≤ c(P2 , ω2 ). Skalierung: F¨ ur k > 0 gilt c(P, k ω) = k c(P, ω). Nichttrivialit¨ at: F¨ ur die Einheitskugeln B12n in (R2n , ω0 ) gilt c(B12n , ω0 ) > 0; f¨ ur die symplektischen Zylinder Z1 in (R2n , ω0 ) gilt c(Z1 , ω0 ) < ∞. 17.7 Satz (Gromovs nonsqueezing-Resultat) Wenn es eine symplektische Kapazit¨at mit c(B12n , ω0 ) = c(Z1 , ω0 ) gibt, dann gilt: Genau dann kann man eine Kugel vom Radius r symplektisch in den Zylinder ZR abbilden, wenn r ≤ R ist. Beweis: • Ist r ≤ R, dann ist Br2n schon eine Teilmenge von ZR . • Bei Existenz einer symplektischen Einbettung I : Br2n → ZR gilt: c(Br2n , ω0 ) ≤ c(ZR , ω0 ) = c(Z1 , R−2 ω0 ) = R−2 c(Z1 , ω0 ) = R−2 c(B12n , ω0 ), ur r > R einen Widerspruch zur Posiwas wegen c(Br2n , ω0 ) = r−2 c(B12n , ω0 ) f¨ 2 tivit¨at von c(B12n , ω0 ) darstellt. Tats¨achlich haben Gromov und Hofer–Zehnder solche Kapazit¨aten definiert.
17.2
Der Satz von Poincar´ e–Birkhoff
Poincar´e, der ja als Erster systematisch qualitative Methoden in die Mechanik einf¨ uhrte, formulierte in seinem ,letzten geometrischen Theorem’ eine Aussage u ¨ber fl¨achenerhaltende Abbildungen. Diese wurde 1925 von George David Birkhoff bewiesen. Wir betrachten f¨ ur die Radien 0 < r− < r+ < ∞ und die Kreislinie S 1 = R/2πZ einen Hom¨ oomorphismus H = (R, Φ) : A −→ A
des Kreisrings
A := [r− , r+ ] × S 1 ,
(17.2.1)
17. Symplektische Topologie
443
der die beiden Randkomponenten {r± }×S 1 orientierungserhaltend auf sich abbil¨ det. Die bez¨ uglich der Uberlagerung A˜ := [r− , r+ ]×R → A zu H semikonjugierte Abbildung ˜ = (R, ˜ Φ) ˜ : A˜ → A˜ H ˜ ϕ + 2π) = R(r, ˜ ϕ) und besitzt die Periodizit¨aten R(r, ˜ ϕ + 2π) = Φ(r, ˜ ϕ) + 2π. Φ(r,
(17.2.2)
Die Randkomponenten sollen gegenl¨aufig verdreht werden, das heißt es gebe ϕ− < 0 < ϕ+ mit ˜ ± , ϕ) = ϕ + ϕ± Φ(r (ϕ ∈ R). (17.2.3) ˜ Letzteres ist haupts¨achlich eine Forderung an H, aber auch an die Wahl von H.
17.8 Satz (Poincar´ e–Birkhoff) Ist der Hom¨oomorphismus H fl¨achenerhaltend 3, dann besitzt er mindestens zwei Fixpunkte im Inneren des Kreisrings A. 17.9 Bemerkung Die Voraussetzung, dass H fl¨achenerhaltend ist, kann nicht weggelassen werden. Gegenbeispiele sind die Diffeomorphismen des Kreisrings 1 ˜ ε (r, ϕ) := r − ε(r − r+ )(r − r− ) , ϕ + r − 1 (r+ + r− ) H . |ε| < r+ −r 2 − Diese sind f¨ ur ε = 0 fixpunktfrei und nur f¨ ur ε = 0 fl¨achenerhaltend.
3
Beweis: Wir nehmen vereinfachend an, dass H zweimal stetig differenzierbar ist. In der Arbeit [Bi2] von George David Birkhoff findet man einen Beweis, der ohne diese Annahme auskommt. Die Abbildung Ψ:A→R
˜ ϕ) − ϕ , Ψ(r, [ϕ]) := Φ(r,
ist wegen (17.2.2) wohldefiniert und misst die Winkeldifferenz zwischen Bild und Urbild von H. Insbesondere ist wegen (17.2.3) Ψ(r± , [ϕ]) = ϕ± , also 0 ∈ Ψ(A). • Ist 0 regul¨arer Wert von Ψ, dann ist die Urbildmenge M := Ψ−1 (0) ⊂ A eine eindimensionale kompakte Untermannigfaltigkeit. Damit besteht sie aus endlich vielen Zusammenhangskomponenten Mi , die ihrerseits diffeomorph zur Kreislinie sind. Die Restriktionen Πi : Mi → S 1 der Projektion Π : A → S 1 , (r, ϕ) → ϕ besitzen also Abbildungsgrade deg(Πi ) (siehe Seite 122), von denen wir durch onnen, dass sie nichtnegativ sind. Wahl der Orientierung von Mi annehmen k¨ Ein Abbildungsgrad gr¨ oßer als Eins kann nicht vorkommen, weil sonst Mi Selbst¨ uberschneidungen aufweisen m¨ usste. Die Mi sind Jordan–Kurven. A\Mi 3 Wir nehmen das Lebesgue-Maß auf A beziehungsweise die Fl¨ achenform dr ∧ dϕ, aber etwa uhrende Maß r dr ∧ dϕ kann verwendet werden. auch das vom Polarkoordinaten auf R2 herr¨
444
17.2. Der Satz von Poincar´e–Birkhoff
besteht also nach dem jordanschen Kurvensatz 4 aus genau zwei Zusammenhangskomponenten. Es muß aber einen Index j mit deg(Πj ) = 1 geben, weil sonst {r− } × S 1 und {r+ } × S 1 jeweils in der gleichen Komponente liegen w¨ urden. Schnittpunkte von Mj mit H(Mj ) sind Fixpunkte von A, denn nur die erste Komponente eines Punktes (r, ϕ) ∈ M kann sich bei Anwendung von A ¨andern. Solche Schnittpunkte existieren, denn sonst w¨ urde eine Zusammenhangskomponente U M2 M1 von A − Mj durch H in eine echte Teilmenge H(U ) von sich abgebildet. Dies w¨ urde der Fl¨achenerhaltung widersprechen, denn auch die Fl¨ache dieser Teilmenge w¨are echt kleiner. Wenn es aber einen Schnittpunkt von Mj mit H(Mj ) gibt, existiert noch ein zweiter solcher Schnittpunkt. • Ist aber 0 kein regul¨arer Wert von Ψ, dann betrachten wir die St¨orungen Hε : A → A
,
Hε := Rε ◦ H
mit
Rε (r, ϕ) := (r, ϕ − ε)
ullt Hε die Voraussetzungen des Satzes. Wevon H. F¨ ur alle ε ∈ (ϕ− , ϕ+ ) erf¨ gen des Satzes von Sard (siehe Seite 299) gibt es eine gegen Null konvergente ur die Hεn auch die Regularit¨atsvoraussetzung des ersten Teils Folge (εn )n∈N , f¨ des Beweises erf¨ ullt. Also existiert eine Folge von Fixpunkten xn von Hεn . Wegen der Kompaktheit des Kreisringes besitzt diese eine konvergente Teilfolge. Deren Limespunkt x ∈ A ist Fixpunkt von H. Eine Verfeinerung des Argumentes zeigt, dass es sogar zwei Fixpunkte gibt. 2 Eine besonders einfache Klasse von Abbildungen (17.2.1) sind monotone Twistabbildungen. Diese sind stetig differenzierbar, mit partieller Ableitung D1 Φ > 0. Daher ist nach dem Satz u ¨ber implizite Funktionen die Nullstellenmenge M = Ψ−1 (0) ⊂ A Graph einer Funktion des Winkels. 17.10 Beispiele (Monotone Twistabbildungen) 1. (Standardabbildung) Die in Abschnitt 15.6 behandelten fl¨achenerhaltenden Standardabbildungen Fε (x, y) = x + y + ε sin(2πx), y + ε sin(2πx) haben die monotone Twist-Eigenschaft D1 Φ > 0. Dabei wird x als die Winkelvariable ϕ und y ∈ R als Radius r aufgefasst, so dass Φ(r, ϕ) = ϕ + r + ε sin(2πϕ) ist. 4 Jordanscher Kurvensatz: Das Komplement des Bildes c(S 1 ) ⊂ R2 einer einfachen geschlossenen Kurve c : S 1 → R2 in der Ebene besteht aus genau zwei Zusammenhangskomponenten, von denen die eine beschr¨ ankt, die andere unbeschr¨ ankt ist. c(S 1 ) ist der Rand beider Zusammenhangskomponenten.
17. Symplektische Topologie
445
Zwar ist die Bedingung der Invarianz und gegenl¨aufigen Verdrehung (17.2.3) der Randkreise f¨ ur ε = 0 in diesen Koordinaten nicht erf¨ ullt. Man kann aber — und in dieser Idee liegt das eigentliche Anwendungspotential des Satzes von Poincar´e–Birkhoff — das von zwei invarianten KAM-Tori eingeschlossene Gebiet betrachten, und auf die Existenz zweier Fixpunkte in diesem Gebiet schließen. Dass die Punkte (x, y) = (0, 0) und (x, y) = (1/2, 0) Fixpunkte der Standardabbildungen Fε sind, sieht man allerdings auch direkt. Ebenso rechnet man von Fε an diesen Fixpunk nach, 1dass die Linearisierung 1−2πε 1 ten von der Form 1+2πε beziehungsweise ist, f¨ ur ε = 0 der −2πε 1 2πε 1 eine also im Sinn der Klassifikation von SL(2, R)–Matrizen (Aufgabe 6.26) hyperbolisch, der andere elliptisch ist. Die Abbildungen 15.6.1 lassen vermuten und man kann beweisen, dass sich um den hyperbolischen Fixpunkt eine chaotische Zone bildet, w¨ahrend der elliptische Fixpunkt von invarianten Tori umschlossen wird. All dies sind typische Eigenschaften von Twistabbildungen. 2. (Konvexer Billard) Eine einfache geschlossene Kurve c : S 1 → R2 definiert nach dem gerade benutzten jordanschen Kurvensatz ein beschr¨anktes Gebiet im R2 . Dieses kann man als Billardtisch auffassen. Am einfachsten liegen die Verh¨altnisse, wenn die Kurve glatt, regul¨ar und positiv gekr¨ ummt ist 5 . Wir normieren die L¨ange der Kurve zu 2π. Die Billardtrajektorie besteht dann aus einem Streckenzug, dessen Ecken auf dem Rand C := c(S 1 ) des liegen, und bei denen die Richtun Billardtischs gen zur Kurvennormale 10 −1 c (t) sich nach der Regel ,Ausfallwinkel = − 0 Einfallwinkel’ ver¨andern. Neben der Bogenl¨ange t des Kollisionspunktes parametrisiert der Ausfallwinkel, oder praktischerweise dessen Sinus u, die Strecke. Der Phasenraum der diskretisierten Dynamik ist damit ein Kreisring der Form A := [−1, 1] × S 1 . Wegen der positiven Kr¨ ummung des Randes sind die jeweils folgenden Kollisionen mit dem Rand transversal, die Abbildung Φ : A → A also nach dem Satz u ¨ber die implizite Funktion glatt. Die Transversalit¨at wird nur verletzt f¨ ur den Fall einer zu C tangentialen Richtung, also u = ±1. In diesem Fall ist (u, t) Fixpunkt von Φ, weshalb eine der Bedingungen des Satzes 17.8 erf¨ ullt ist. Aus dem gleichen Grund ist aber die Bedingung (17.2.3) an die Verdrehung der Randkomponenten verletzt. Auch die Aussage des Satzes ist falsch, denn f¨ ur einen von ±π verschiedenen Winkel ist der n¨achste Kollisionspunkt vom ˚ = (−1, 1) × S 1 vor. gegebenen verschieden, es liegt also kein Fixpunkt in A Dennoch ist der Satz von Poincar´e–Birkhoff auf das Billardproblem anwendbar. Da n¨amlich die Winkeldifferenz ϕ+ − ϕ− (siehe (17.2.3)) gleich 2π ist, 5 Ist c nach der Bogenl¨ ange parametrisiert (was f¨ ur regul¨ oglich * ist und wir im m¨ ) are Kurven c (t) > 0. weiteren annehmen), dann bedeutet positive Kr¨ ummung c (t), 10 −1 0
446
17.3. Die Arnol’d–Vermutung
entspricht der n–ten Iterierten Φn eine Winkeldifferenz von 2πn. Damit be˚ Diese geh¨oren zu sitzt f¨ ur alle n ≥ 2 die Abbildung Φn Fixpunkte in A. n–periodischen Orbits von Φ. Da Φm und Φn f¨ ur teilerfremde Potenzen m, n keinen gemeinsamen Fixpunkt ˚ haben k¨onnen, besitzt Φ unendlich viele periodische Orbits. in A 3
17.3
Die Arnol’d–Vermutung
Schon George David Birkhoff suchte nach einer Verallgemeinerung seines Satzes auf h¨ohere Phasenraumdimensionen. Eine solche Verallgemeinerung ist in den letzten Jahren mit dem Beweis der Arnol’d–Vermutung gelungen. 17.11 Bemerkung (Arnol’d-Diffusion) Zun¨achst ist nicht einmal klar, wie eine solche Aussage u onnte. Betrachten wir als Anwendungs¨berhaupt aussehen k¨ bereich des Satzes von Poincar´e–Birkhoff das Phasenraumportrait eines hamiltonschen Systems mit zwei Freiheitsgraden, wie in Abbildung 15.4.3. Da die Energiefl¨ache dreidimensional ist, besitzen die zweidimensionalen KAM-Tori Kodimension Eins. Zwei solche KAM-Tori k¨ onnen also ein dreidimensionales Gebiet einschließen. Nach Diskretisierung der Dynamik durch eine Poincar´e–Fl¨ache gelangen wir zu einem Kreisring zwischen zwei invarianten Kreislinien. Da nun f¨ ur n Freiheitsgrade die n–dimensionalen KAM–Tori in der Energieschale die Kodimension n − 1 besitzen, begrenzen endlich viele von ihnen f¨ ur n > 2 kein Gebiet. Statt dessen k¨onnen in diesem Fall nicht auf einem invarianten Torus befindliche Anfangswerte zu Trajektorien geh¨oren, deren Wirkungsvariablen sich zeitlich ¨ahnlich wie eine Irrfahrt verhalten. Dem entspricht ein auch auf den Sph¨aren ω = const. zusammenh¨angendes Komplement der diophantischen Menge, das f¨ ur n = 3 und ω3 = 1 nebenstehend (in Schwarz) abgebildet ist. Dies ist zu vergleichen mit der Abbildung f¨ ur n = 2 auf Seite 383. Dieses Arnol’d-Diffusion genannte Ph¨anomen konnte f¨ ur einige hamiltonsche Systeme nachgewiesen werden, so im von Kaloshin und Levi [KL] ausgearbeiteten Fall der Bewegung in einem periodischen Potential. Siehe auch Kapitel 6 von Lichtenberg und Lieberman [LL]. 3 In dieser Richtung ist also keine Verallgemeinerung zu erwarten. Der folgende alternative Beweis des Satzes von Poincar´e–Birkhoff f¨ ur das Billard-Problem ergibt aber eine erfolgversprechendere Perspektive.
17. Symplektische Topologie
447
17.12 Beispiel (Periodische Orbits konvexer Billardtische) In Beispiel 17.10.2 wurden die Kollisionsdaten mit den Phasenraumkoordinaten (u, t) ∈ A = [−1, 1] × S 1 parametrisiert; die diskrete Dynamik H = (R, Φ) : A → A f¨ uhrte entsprechend einen Punkt (u0 , t0 ) in (u1 , t1 ) u ¨ber. Die monotone Twistbedingung D1 Φ > 0 erm¨oglicht es, die Startrichtung u0 aus dem Paar (t0 , t1 ) von Randpunkten zu berechnen. Setzen wir n¨amlich als erzeugende Funktion der kanonischen Transformation S : S1 × S1 → R
, S(t0 , t1 ) = − c(t1 ) − c(t0 ) ,
dann ist, abgesehen von der Diagonale Δ ⊂ S 1 × S 1 des Torus, S eine glatte Funktion (und die Diagonalpunkte (t, t) ∈ Δ entsprechen uneigentlichen, zum Rand tangentialen Billard-Trajektorien). Die partiellen Ableitungen sind D1 S(t0 , t1 ) = c (t0 ), c(t1 ) − c(t0 ) / c(t1 ) − c(t0 ) = sin ϕ0 = u0 und analog D2 S(t0 , t1 ) = u1 . Die kritischen Punkte (t0 , t1 ) von S entsprechen daher u0 = u1 = 0, also einem beidseitig senkrecht auf dem Rand C auftretenden Segment der Billardtrajektorie. Iteration f¨ uhrt hier zu einem zwei-periodischen Orbit. Wir schließen auf die Existenz eines solchen Orbits, weil S einen negativen Minimalwert besitzt, w¨ahrend S auf Δ verschwindet. Wegen der Symmetrie S(t1 , t0 ) = S(t0 , t1 ) wird dieser Minimalwert zweimal angenommen. Ein weiterer periodischer Orbit entspricht einem (eventuell degenerierten) Sattelpunkt von S. Auf dessen Existenz kann man daraus schließen, dass S auf der Diagonale gleich Null ist. Damit entspricht S (durch Aufschneiden des Torus an der Diagonalen) einer Funktion auf einem Kreisring A, die auf dessen beiden Randkreisen ∂± A den Wert Null annimmt und in dessen Inneren negativ ist. Den Sattelpunkt findet man zum Beispiel durch Betrachtung des Minimaxproblems maxd∈D min S d(x) < 0, x∈[0,1]
mit
D := d : [0, 1] → A | d stetig, d(0) ∈ ∂− A, d(1) ∈ ∂+ A .
3
17.13 Aufgabe (elliptischer Billard) Zeigen Sie f¨ ur einen elliptischen Billardtisch mit Rand C := {x ∈ R2 | (x1 /a1 )2 + (x2 /a2 )2 = 1} und Halbachsen 0 < a1 < a2 , dass die diskrete Dynamik genau zwei geometrisch verschiedene periodische Trajektorien der Minimalperiode Zwei besitzt. 3 Die Minimalzahl kritischer Punkte betr¨agt hier also Zwei. Im Zusammenhang solcher Beispiele stellte Arnol’d in den 1960er Jahren die folgende Vermutung auf, siehe Anhang 9 in [Ar2]. Arnol’d–Vermutung: Ein hamiltonscher Symplektomorphismus Φ : P → P (siehe Definition 10.27) einer kompakten symplektischen Mannigfaltigkeit P • besitzt mindestens so viele Fixpunkte, wie eine glatte Funktion S : P → R
448
17.3. Die Arnol’d–Vermutung
kritische Punkte. • Falls seine Fixpunkte nicht degeneriert sind, ist deren Anzahl mindestens so groß wie die der kritischen Punkte einer Morse–Funktion S : P → R. Hier wurden die folgenden Begriffe benutzt (siehe auch Anhang G): 17.14 Definition F¨ ur eine differenzierbare Mannigfaltigkeit P heißt • ein Fixpunkt x ∈ P einer Abbildung Φ ∈ C 1 (P, P ) nicht degeneriert, wenn die lineare Abbildung DΦ(x) − IdTx P : Tx P → Tx P bijektiv ist; • eine Funktion f ∈ C 2 (P, R) Morse–Funktion, wenn alle kritischen Punkte x von f nicht degeneriert sind, das heißt die Hessesche D2 f (x) als Bilinearform nicht degeneriert im Sinn von Definition 6.12 ist. 17.15 Bemerkungen (Arnol’d–Vermutung) 1. Da die Minimalzahlen der in der Vermutung angesprochenen kritischen Punkte berechenbar sind (siehe Anhang G), ergeben die behaupteten Ungleichungen einen Zugang zu den periodischen Orbits von Φ. 2. Falls der hamiltonsche Symplektomorphismus Φ : P → P Zeit-Eins-Fluss der hamiltonschen Differentialgleichung einer Hamilton–Funktion H : P → R ist, ist die Arnol’d–Vermutung f¨ ur Φ offensichtlich richtig, denn die Ruhelagen des Flusses entsprechen den kritischen Punkten von H. Dies zeigt auch, dass die behaupteten Ungleichungen schon optimal sind, wenn es auf P eine perfekte Morse–Funktion gibt (siehe Seite 538). 3. Dass der Symplektomorphismus Φ hamiltonsch ist, ist eine im Allgemeinen notwendige Voraussetzung f¨ ur die Existenz von Fixpunkten. Denn der Zwei-Torus P := T2 mit Fl¨achenform ω ist eine kompakte symplektische Mannigfaltigkeit, und jede Verschiebung Φa : P → P, x → x + a ist symplektisch. Aber diese ist fixpunktfrei außer f¨ ur den hamiltonschen Fall Φ0 = IdP (siehe Beispiel 10.29.3). 4. Eine Morse–Funktion f ∈ C 2 (P, R) heisst Morse-Smale, wenn sich (anders als in der Abbildung auf Seite 540) die stabilen Mannigfaltigkeiten der kritischen Punkte p mit den instabilen Mannigfaltigkeiten der q transversal schneiden. In diesem Fall kann die Morse-Theorie auf mittels der transversalen Schnitte definierten relativen Indices von (p, q) aufgebaut werden, siehe M. Schwarz [Schw]. Dies erm¨ oglicht f¨ ur unendlich-dimensionale P die nach Andreas Floer benannte Floer–Theorie, siehe [Bo2] von R. Bott, [McD] von D. McDuff und Kapitel 6 in [Jo] von J. Jost. 3 17.16 Weiterf¨ uhrende Literatur F¨ ur ein gr¨ undliches Studium eignen sich der das Gebiet definierende Artikel [Ar5] von Arnol’d, die Lehrb¨ ucher von McDuff und Salamon [MS], von Hofer und Zehnder [HZ, Zeh] und die darin zitierte Literatur. 3
Anhang A
Topologische R¨ aume und Mannigfaltigkeiten A.1 Topologie und Metrik . . . . . . . . . . . . . . . . . . . . . 449 A.2 Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . 457 A.3 Das Tangentialbundel ¨ . . . . . . . . . . . . . . . . . . . . . 463
A.1
Topologie und Metrik
Eine Teilmenge von R nennen wir offen, wenn sie Vereinigung offener Intervalle (a, b) ⊆ R ist. Damit wird R zu einem topologischen Raum: A.1 Definition 1. Ein topologischer Raum ist ein Paar (M, O), bestehend aus einer Menge M und einer Menge O von Teilmengen (genannt offene Mengen) von M derart, dass gilt 1. ∅ und M sind offen, 2. beliebige Vereinigungen offener Mengen sind offen, 3. der Durchschnitt von je zwei offenen Mengen ist offen. 2. O heißt Topologie von M . 3. Sind O1 und O2 Topologien auf M und O1 ⊆ O2 , dann heißt O1 gr¨ ober als O2 und O2 feiner als O1 . A.2 Beispiele 1. Die diskrete Topologie 2M (Potenzmenge) beziehungsweise die triviale Topologie {M, ∅} sind die feinste bzw. gr¨obste Topologie einer Menge M . Die topologischen R¨aume (M, 2M ) heißen diskret. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 18,
449
450
A.1. Topologie und Metrik
2. Ist N ⊆ M Teilmenge eines topologischen Raumes (M, O), dann ist {U ∩ N | U ∈ O} ⊆ 2N
(A.1.1)
eine Topologie auf N , die sogenannte Teilraumtopologie, Spurtopologie oder induzierte Topologie. Etwa f¨ ur die Teilmenge N := [0, ∞) von R sind alle Teilintervalle der Form [0, b) ⊂ N mit b ∈ N in N (nicht aber in R) offen. 3. Sind (M, OM ) und (N, ON ) disjunkte (d.h. M ∩N = ∅) topologische R¨aume, dann ist die Vereinigung M ∪ N mit {U ∪ V | U ∈ OM , V ∈ ON } ⊆ 2M ∪N ein topologischer Raum, genannt Summenraum. 4. Es sei (M, OM ) ein topologischer Raum und f : M → N surjektiv. Die durch f auf N induzierte Quotiententopologie ist die Topologie V ⊆ N | f −1 (V ) ∈ OM ⊆ 2N . 3 A.3 Satz Es sei F eine beliebige Familie von Teilmengen einer Menge M . • Dann existiert eine eindeutige gr¨obste Topologie O(F) von M mit F ⊆ O(F). • O(F) heißt die von F erzeugte Topologie. In vielen F¨allen wird die Topologie von einer Metrik erzeugt. A.4 Definition • Ein metrischer Raum ist ein Paar (M, d), bestehend aus einer Menge M und einer Funktion d : M × M → [0, ∞), derart, dass f¨ ur alle x, y, z ∈ M gilt (a) d(x, y) = 0 ⇐⇒ x = y (b) d(x, y) = d(y, x)
(Positivit¨at)
(Symmetrie)
(c) d(x, z) ≤ d(x, y) + d(y, z)
(Dreiecksungleichung).
• d heißt Metrik, d(x, y) Abstand von x und y. • F¨ ur x ∈ M und ε > 0 heißt Uε (x) := {y ∈ M | d(y, x) < ε} (offene) ε–Umgebung von x in M . A.5 Beispiele 1. Die Menge B := {0, 1} bezeichnet ein Bit. Wir betrachten Folgen von n ∈ N Bits, das heißt Elemente von B n . Ihr sogenannter Hamming–Abstand ist durch die Metrik d : B n × B n → {0, 1, . . . , n}, d (b1 , . . . , bn ), (c1 , . . . , cn ) := i ∈ {1, . . . n} | bi = ci gegeben 1 , also durch die Zahl der Stellen, an denen sich die beiden Bitfolgen unterscheiden. Diese Metrik wird in der Informationstheorie benutzt. 1 mit
Schreibweise als Zeilenvektoren.
A. Topologische R¨aume und Mannigfaltigkeiten
451
2. Ist (M, d) ein metrischer Raum und N eine Teilmenge von M , dann ist (N, dN ) mit der ,auf N restringierten’ Metrik 2 dN : N × N → R
, dN (x, y) := d(x, y)
ebenfalls ein metrischer Raum. Etwa f¨ ur M := C mit der Metrik d(x, y) := |x−y| ist S 1 ⊂ C geometrisch die Kreislinie vom Radius 1 um den Nullpunkt. Der Abstand dS 1 (x, y) zwischen zwei Kreispunkten ist dann gleich der L¨ange der Sekante mit den Endpunkten x und y. Eine andere sinnvolle Metrik auf S 1 ist durch die (minimale) Winkeldifferenz von x und y gegeben. 3. Auf dem Vektorraum Rn wird die L¨ange eines Vektors durch die euklidische Norm n 2 v = (v1 , . . . , vn ) ∈ Rn
v := i=1 vi von v definiert. Mit d(x, y) := y − x ergibt sich daraus eine Metrik auf dem Rn , genannt die euklidische Metrik. 4. Auf dem Vektorraum Rn wird auch durch die Maximumsnorm
v ∞ := max(|v1 |, . . . , |vn |)
v = (v1 , . . . , vn ) ∈ Rn
eine Metrik definiert: d∞ (x, y) := x − y ∞ , und es gilt d∞ (x, y) ≤ d(x, y) ≤
√ nd∞ (x, y)
(x, y ∈ Rn ),
siehe nebenstehende Abbildung f¨ ur n = 2 und x = 0. Die ,Einheitskugel’ {v ∈ Rn | v ∞ ≤ 1} bez¨ uglich der Maximumsnorm ist ein achsenparalleler um den Nullpunkt zentrierter n-dimensionaler W¨ urfel der Kantenl¨ange 2. 3 A.6 Definition F¨ ur einen metrischen Raum (M, d) heißt O(d) := V ⊆ M | ∀x ∈ V ∃ε > 0 : Uε (x) ⊆ V .
(A.1.2)
die (metrische) Topologie von (M, d). A.7 Satz M, O(d) ist ein topologischer Raum, und die ε–Umgebungen Uε (x) sind offen. 2 Genau
gesagt wird die Abbildung d : M × M → R auf N × N restringiert.
452
A.1. Topologie und Metrik
A.8 Bemerkung (Topologische Vektorr¨ aume) Oft erzeugen verschiedene Metriken die gleiche Topologie. Insbesondere gilt dies f¨ ur Metriken auf Vektorr¨aumen, die (wie in Beispiel A.5.3 und A.5.4) von ¨aquivalenten Normen 3 abstammen. Denn in diesem Fall findet man zu jeder ε–Kugel um x bez¨ uglich der einen Norm eine in dieser enthaltene ε/c–Kugel um x bez¨ uglich der anderen Norm. Da alle Normen auf einem endlich-dimensionalen Vektorraum ¨aquivalent sind, sprechen wir von der Topologie des Rn oder Cn (es gibt aber auch Topologien auf diesen R¨aumen, die nicht von Normen herkommen, siehe Beispiel A.2.1). Auf einem unendlich-dimensionalen K–Vektorraum V gibt es dagegen viele von Normen erzeugte Topologien O. In jedem Fall sind Addition und Skalarmultiplikation stetig, weswegen (V, O) ein sogenannter topologischer Vektorraum ist. 3 Wir erweitern unseren topologischen Sprachschatz, indem wir die uns vom Raum R bekannten Begriffsbildungen verallgemeinern: A.9 Definition Es sei (M, O) ein topologischer Raum. • A ⊆ M heißt abgeschlossen, wenn A Komplement einer offenen Menge ist: M \ A ∈ O. • U ⊆ M heißt Umgebung von x ∈ M , wenn es eine offene Menge V mit x ∈ V ⊆ U gibt. • F¨ ur A ⊆ M und x ∈ M heißt x innerer beziehungsweise ¨ außerer bzw. Randpunkt von A, je nachdem, ob A oder M \ A oder keine von beiden Mengen Umgebung von x ist. ˚ := {x ∈ M | x ist innerer Punkt von A} heißt das Innere von A. - A - A := {x ∈ M | x nicht ¨außerer Punkt von A} heißt der Abschluss oder die abgeschlossene H¨ ulle von A. - ∂A := {x ∈ M | x Randpunkt von A} heißt Rand von A. • x ∈ M heißt H¨ aufungspunkt der Teilmenge A ⊆ M , wenn f¨ ur keine Umgebung U von x die Menge U ∩ (A \ {x}) leer ist. • N ⊆ M heißt dicht, wenn N = M ist. • N ⊆ M heißt nirgends dicht, wenn das Innere von N leer ist. ˚ = (0, 1), A = [0, 1] und ∂A = A.10 Beispiele 1. F¨ ur A := (0, 1] ⊆ R ist A {0, 1}. 3 Definition: Zwei Normen · , · aquivalent, wenn eine Zahl c ≥ 1 I II : V → R heißen ¨ existiert mit (v ∈ V ). c−1 vI ≤ vII ≤ cvI
A. Topologische R¨aume und Mannigfaltigkeiten 2. In R ist Q eine dichte, Z eine nirgends dichte Teilmenge.
453 3
A.11 Definition Es sei (M, O) ein topologischer Raum. ¨ von M , wenn • Eine Familie (Ui )i∈I von Ui ∈ O heißt offene Uberdeckung gilt: ∪i∈I Ui = M. ¨ • (M, O) heißt kompakt, wenn jede offene Uberdeckung (Ui )i∈I eine endliche ¨ Teil¨ uberdeckung, das heißt eine offene Uberdeckung (Uj )j∈J mit endlicher Indexmenge J ⊆ I, besitzt. • (M, O) heißt lokalkompakt, wenn alle m ∈ M eine kompakte Umgebung besitzen. • (M, O) heißt Hausdorff–Raum, wenn f¨ ur alle x = y ∈ M disjunkte Umgebungen Ux von x und Uy von y existieren. ¨ • Ein Hausdorff–Raum (M, O) heißt parakompakt, wenn f¨ ur jede offene Uber¨ deckung {Ui }i∈I eine offene Uberdeckung {Vj }j∈J existiert, die (a) eine Verfeinerung von {Ui }i∈I ist, d.h. ∀j ∈ J ∃i ∈ I : Vj ⊆ Ui , (b) und die lokal endlich ist, das heißt f¨ ur alle x ∈ M existiert eine Umgebung U von x mit endlicher Indexmenge {j ∈ J | Vj ∩ U = ∅}. A.12 Beispiele (topologische Begriffe) 1. Endlich-dimensionale reelle und komplexe Vektorr¨aume V sind lokalkompakt und parakompakt. Teilmengen von V sind genau dann kompakt, wenn sie beschr¨ankt und abge¨ schlossen sind (Uberdeckungssatz, auch Satz von Heine-Borel genannt). Q mit der Spurtopologie von R ist aber nicht lokalkompakt. 2. Da in einem metrischen Raum (M, d) alle Punkte x = y ∈ M positiven Abstand besitzen, ist der topologische Raum M, O(d) hausdorffsch. Ein topologischer Raum (M, O) heißt metrisierbar wenn es eine Metrik d auf M gibt mit O = O(d). Wie man am Beispiel von nicht-Hausdorff–R¨aumen sieht, ist das nicht immer der Fall. 3. Unendlich-dimensionale Banach–R¨aume sind zwar nicht lokalkompakt, wohl aber (wie jeder metrische Raum) parakompakt. 4. Ein Beispiel eines nicht parakompakten Hausdorff–Raumes ist die sogenannte ,Lange Gerade’, siehe Hirsch [Hirs], Kap. 1.1, Aufgabe 9. Nicht parakompakte R¨aume treten normalerweise in mechanischen Problemen nicht auf. 3 A.13 Definition • Eine Zerlegung der Eins (englisch: partition of unity) auf einem topologischen Hausdorff–Raum (M, O) ist eine Familie (fi )i∈I stetiger ur jedes x ∈ M gilt: (siehe Def. A.17) Funktionen fi : M → [0, 1], so dass f¨ x hat eine Umgebung U , sodass die Indexmenge {j ∈ I | fj U = 0} endlich
ist, und i∈I fi (x) = 1.
454
A.1. Topologie und Metrik
¨ • Eine Zerlegung der Eins (fi )i∈I heißt angepasst an eine offene Uberdeckung ur alle i ∈ I gilt: supp(fi ) ⊆ Ui . (Ui )i∈I von M , wenn f¨ Zerlegungen der Eins sind n¨ utzlich, weil man mit ihnen lokal, das heißt auf geeigneten Umgebungen Ui definierte Objekte zu einem global, d.h. auf ganz M definierten Objekt konvex-kombinieren kann. Daher kl¨art der folgende Satz die Bedeutung des Begriffes ,parakompakt’: A.14 Satz Ein topologischer Hausdorff–Raum ist genau dann parakompakt, wenn ¨ er f¨ ur jede offene Uberdeckung eine angepasste Zerlegung der Eins besitzt. A.15 Definition • Eine Folge (xn )n∈N in einem metrischen Raum (M, d) heißt Cauchy–Folge, wenn f¨ ur alle ε > 0 eine Schranke N0 ≡ N0 (ε) ∈ N existiert mit m, n ≥ N0 (ε) . d(xm , xn ) < ε • (M, d) heißt vollst¨ andig, wenn jede Cauchy–Folge gegen ein x ∈ M konvergiert, das heißt f¨ ur alle ε > 0 eine Schranke N (ε) ∈ N existiert mit xn ∈ Uε (x) n ≥ N (ε) . A.16 Satz Jeder kompakte metrische Raum ist vollst¨andig. A.17 Definition Eine Abbildung f : M → N der topologischen R¨aume (M, OM ) und (N, ON ) • heißt stetig, wenn die Urbilder offener Mengen offen sind (f −1 (V ) ∈ OM falls V ∈ ON ); • heißt Hom¨ oomorphismus, wenn f bijektiv, stetig und f −1 : N → M stetig ist. oomorph, wenn • Die topologischen R¨aume (M, OM ) und (N, ON ) heißen hom¨ es einen Hom¨oomorphismus f : M → N gibt. Hom¨oomorphe topologische R¨aume sind vom Standpunkt der Topologie nicht zu unterscheiden, so zum Beispiel R und das Intervall (−1, 1) mit dem Hom¨oomorphismus tanh : R → (−1, 1). ! F¨ ur das kartesische Produkt M := i∈I Mi von Mengen Mi wird, ausgehend von Topologien Oi der Faktoren Mi mithilfe der kanonischen Projektionen pj : M → Mj
, (mi )i∈I → mj
(j ∈ I)
eine Topologie definiert: A.18 Definition • Die Produkttopologie O auf M ist die gr¨obste Topologie, bez¨ uglich der noch alle kanonischen Projektionen pi (i ∈ I) stetig sind.
A. Topologische R¨aume und Mannigfaltigkeiten
455
• Der topologische Raum (M, O) heißt der Produktraum der (Mi , Oi ). A.19 Satz (Tychonoff) Beliebige Produkte kompakter topologischer R¨aume sind in der Produkttopologie kompakt. Beweis: Siehe zum Beispiel J¨ anich [Jae], Kapitel X.
2
U ⊆ M ist offen genau dann, wenn U die Vereinigung von (m¨oglicherweise unendlich vielen) Durchschnitten je endlich vieler Mengen der Form p−1 i (Oi ) mit Oi ∈ Oi ist. Im Allgemeinen sind nicht alle kartesischen Produkte offener Teilmengen offen. Das aber der Fall, wenn die Indexmenge I endlich ist. A.20 Definition Es sei (M, O) ein topologischer Raum. • (M, O) heißt zusammenh¨ angend, wenn die einzigen gleichzeitig offenen und abgeschlossenen Teilmengen von M die leere Menge und M selbst sind. Sonst heißt (M, O) unzusammenh¨ angend. • N ⊆ M heißt zusammenh¨ angend, wenn N in der Spurtopologie (A.1.1) von O zusammenh¨angend ist. • Die maximalen zusammenh¨angenden Teilmengen N ⊆ M heißen die Zusammenhangskomponenten von M • (M, O) heißt total unzusammenh¨ angend, falls alle Zusammenhangskomponenten einpunktig sind. • N ⊆ M heißt diskret, wenn die Spurtopologie diskret (siehe Beispiel A.2.1) ist. A.21 Bemerkungen 1. Zusammenhangskomponenten N ⊆ M sind in (M, O) abgeschlossen, m¨ ussen aber nicht offen sein. Beispielsweise sind die rationalen Zahlen (als einelementige Mengen) die Zusammenhangskomponenten von Q. 2. Die Zusammenhangskomponenten Ni (i ∈ I) von (M, O) bilden eine Partition von M , das heißt ∪i∈I Ni = M und Ni ∩ Nj = ∅ f¨ ur i = j ∈ I. 3. Ein metrisierbarer (siehe Beispiel A.12.2) Raum (M, O) heißt (topologische) Cantor–Menge, wenn der Raum nicht leer, kompakt und total unzusammenh¨angend ist und jeder Punkt von M H¨aufungspunkt von M ist. Alle Cantor–Mengen sind zueinander und auch zur Cantorschen 1/3–Menge (siehe Aufgabe 2.5) hom¨oomorph. Das gilt zum Beispiel auch f¨ ur das nebenstehend abgebildete kartesische Produkt der Cantorschen 1/3–Menge mit sich. 3
456
A.1. Topologie und Metrik
A.22 Definition • Zwei stetige Abbildungen f0 , f1 : M → N heißen homotop, wenn es eine stetige Abbildung h : M × [0, 1] → Y
mit
h(m, i) = fi (m) (m ∈ M, i ∈ {0, 1})
gibt. h heißt dann eine Homotopie von f0 nach f1 . • Zwei topologische R¨aume M, N heißen homotopie¨ aquivalent, wenn es stetige Abbildungen f : M → N und g : N → M gibt, f¨ ur die g ◦ f homotop zu IdM und f ◦ g homotop zu IdN ist. • Ein topologischer Raum M heißt kontrahierbar, wenn M homotopie¨aquivalent zu einer einpunktigen Menge ist. • Eine stetige Abbildung c : I → M eines Intervalls in einen topologischen Raum heißt Kurve oder Weg. t ∈ I heißt der Parameter von c, ihr Bild c(I) ⊆ M auch die Spur von c. • Zwei Kurven c0 , c1 : I → M im topologischen Raum (M, O) mit I := [a, b] und gleichen Anfangs– und Endpunkten (c0 (a) = c1 (a) und c0 (b) = c1 (b)) heißen homotop relativ zu diesen Punkten, wenn es eine Homotopie h : I × [0, 1] → M von c0 nach c1 gibt mit h{a}×[0,1] = c0 (a)
und h{b}×[0,1] = c0 (b).
• M heißt einfach zusammenh¨ angend, wenn je zwei Kurven in M mit gleichen Anfangs- und Endpunkten relativ zu diesen Punkten homotop sind. • F¨ ur ein m ∈ M ist die Fundamentalgruppe π1 (M, m) von M (bei m) die Menge der Homotopieklassen der bei m beginnenden und endenden Kurven. A.23 Bemerkungen 1. Anschaulich wird durch h die Kurve c0 stetig in c1 deformiert, wobei Anfangs- und Endpunkte festgehalten werden. Setzt man n¨amlich f¨ ur s ∈ [0, 1] cs : I → M
, cs (t) := h(t, s),
dann stimmen die Kurven cs f¨ ur s = 0 oder s = 1 mit den vorher definierten Kurven u ¨berein, und cs (a) = c0 (a), cs (b) = c0 (b). 2. Wie schon bei der Definition der Fundamentalgruppe benutzt, ist Homoto¨ pie¨aquivalenz eine Aquivalenzrelation. 3. Die Fundamentalgruppe besitzt bez¨ uglich der Zusammensetzung von Kurven die Struktur einer Gruppe. Falls die Fußpunkte m1 und m2 in der gleichen Zusammenhangskomponente von M liegen, sind die Gruppen π1 (M, mi ) isomorph. Ein solcher Isomorphismus wird durch eine Kurve mit m1 als Anfangs- und und m2 als Endpunkt induziert. Ist M zusammenh¨angend, spricht man daher kurz von der Funda3 mentalgruppe π1 (M ) von M .
A. Topologische R¨aume und Mannigfaltigkeiten
457
A.24 Beispiele (Zusammenhang) 1. Der gelochte Raum M := Rn+1 \ {0} ist homotopie¨aquivalent zur Sph¨are N := S n . Dies sieht man, wenn man f¨ ur f : M → N die radiale Projektion x → x/ x , f¨ ur g : N → M die Einbettung nimmt. Es ist damit π1 (M ) = π1 (S n ). Alle Sph¨aren S n außer S 0 = {−1, 1} sind zusammenh¨angend. S n ist genau dann einfach zusammenh¨angend, wenn n ≥ 2. Dann ist die Fundamentalgruppe von S n trivial. Weiter ist π1 (S 1 ) ∼ = Z. 2. Konvexe Teilmengen U ⊆ Rn sind einfach zusammenh¨angend, denn f¨ ur zwei Kurven c0 , c1 : [a, b] → U mit gleichen Anfangs- und Endpunkten ist h : [a, b] × [0, 1] → U
, h(t, s) := (1 − s) c0 (t) + s c1 (t) 3
eine Homotopie.
A.2
Mannigfaltigkeiten
In Definition 2.34 wurden Untermannigfaltigkeiten des Rn eingef¨ uhrt. Hier werden Mannigfaltigkeiten ohne Bezugnahme auf eine solche Einbettung definiert. Grob gesagt ist eine n–dimensionale Mannigfaltigkeit ein topologischer Raum, der lokal wie der Rn aussieht. Genauer ist die folgende Definition. A.25 Definition Es sei (M, O) ein topologischer Raum. • M heißt lokal euklidisch, wenn es ein n ∈ N0 gibt, sodass jedes m ∈ M eine Umgebung U ∈ O besitzt, die hom¨oomorph zu Rn ist. Die (eindeutige) Zahl n heißt dann die Dimension von M . • Ist (M, O) außerdem parakompakt, dann heißt M topologische Mannigfaltigkeit. • Eine Karte (U, ϕ) von (M, O) (auch lokales Koordinatensystem genannt) besteht aus einer offenen Teilmenge U ⊆ M und einem Hom¨oomorphismus ϕ : U → V auf das offene Bild V := ϕ(U ) ⊆ Rn . • F¨ ur r ∈ N bzw. r = ∞ haben zwei Kar¨ ten (Ui , ϕi ), (Uj , ϕj ) C r –Uberlapp (oder r aglich), wenn f¨ ur Vi,j := heißen C –vertr¨ ϕi (Ui ∩ Uj ) ⊆ Rn die Kartenwechsel
M Uj Ui ϕj
ϕi Vi,j
Vj,i
ϕi,j := ϕj ◦ ϕ−1 i Vi,j : Vi,j → Vj,i r–fach stetig differenzierbare Diffeomor phismen sind (d.h. ϕi,j ∈ C r Vi,j , Vj,i und ϕj,i ∈ C r Vj,i , Vi,j ), siehe Abb.
Kartenwechsel zwischen (Ui , ϕi ) und (Uj , ϕj )
458
A.2. Mannigfaltigkeiten
• Ein C r –Atlas von M ist eine Menge {(Ui , ϕi ) | i ∈ I} C r –vertr¨aglicher Karten, die M u ¨berdecken, das heißt M = ∪i∈I Ui . • Zwei C r –Atlanten heißen ¨ aquivalent, wenn je zwei ihrer Karten C r –vertr¨aglich sind. A.26 Bemerkungen 1. Topologische Mannigfaltigkeiten M (oder allgemeiner lokal euklidische R¨aume) besitzen eine eindeutige Dimension (Schreibweise: dim(M )). Dies ist aber nicht ganz einfach zu beweisen (man denke an die raumf¨ ullenden Peano–Kurven). ¨ ¨ F¨ ur 2. Aquivalenz von C r –Atlanten ist offensichtlich eine Aquivalenzrelation. r einen C –Atlas Φ existiert ein eindeutiger maximaler C r –Atlas Ψ von M , der Φ enth¨alt. Ein solcher maximaler Atlas von M heißt C r –differenzierbare Struktur. 3 A.27 Definition Eine topologische Mannigfaltigkeit (M, O) zusammen mit einer C r –differenzierbaren Struktur heißt C r –Mannigfaltigkeit. A.28 Bemerkungen 1. Man denke bei einem Atlas durchaus an einen Weltatlas. Er muss die ganze Erdoberfl¨ache zeigen. Dazu reicht eine Karte bekanntlich nicht aus. Die Karten des Atlas k¨ onnen durch verschiedene Projektionsarten entstehen. Ein Objekt, das in der einen Karte rechteckig aussieht, kann in der anderen durch Kurven begrenzt sein. Knicke sind aber nicht erlaubt (siehe Abbildung). Von einer metrischen Struktur wird also abgesehen, nicht aber von der differenzierbaren Struktur.
M
ϕ1
kompatibel
ϕ2
ϕ3
inkompatibel
Vertr¨agliche und nichtvertr¨agliche Karten
A. Topologische R¨aume und Mannigfaltigkeiten
459
2. Die Forderung der Parakompaktheit (siehe Definition A.11) bedeutet praktisch keine Einschr¨ankung. Sie ist erf¨ ullt, wenn die Topologie des lokal euklidischen Raumes von einer Metrik erzeugt wird, also etwa wenn M als Teilmenge eines Rm definiert wird. Die sogenannte Gerade mit zwei Urspr¨ ungen ist ein Beispiel eines eindimensionalen lokal euklidischen topologischen Raums, der nicht hausdorffsch (und ˜ / ∼ mit M ˜ := damit nicht parakompakt) ist. Man setzt dabei M := M R × {0} ∪ R × {1} und durch (x, 0) ∼ (x, 1) f¨ ur x ∈ R \ {0} erzeug¨ ter Aquivalenzrelation, und versieht M mit der Quotiententopologie. 3. Wir werden normalerweise glatte (C ∞ –) Mannigfaltigkeiten M untersuchen. ¨ Auf M gibt es dann zu jeder offenen Uberdeckung (Ui )i∈I eine angepasste Zerlegung der Eins durch glatte Funktionen (fi )i∈I . 4. Oft wird die Schreibweise M n f¨ ur eine n–dimensionale Mannigfaltigkeit M benutzt. 3 A.29 Beispiele (Mannigfaltigkeiten) 1. Jede offene Teilmenge M ⊂ Rn wird mit der Karte (M, IdM ) zu einer Mannigfaltigkeit. 2. Als Teilmenge des Rn+1 ist die n–Sph¨are M = S n = {x ∈ Rn+1 | x = 1} ein topologischer Raum. Die 2n + 2 Kartengebiete U±j := {x ∈ S n | ±xj > 0}
(j = 1, . . . , n + 1)
und die Abbildungen ϕ±j : U±j −→ Rn
, x=
x1
.. .
xn+1
⎛
⎞ .. ⎜ . ⎟ ⎜ ⎟ → ϕ±j (x) = ⎜ x2j ⎟ − ⎝ . ⎠ .. x1
xn+1
bilden einen Atlas von M . Dabei zeigt der Hut u ¨ber xj an, dass diese Koordinate weggelassen wird. 3. Ein damit vertr¨aglicher Atlas auf S n wird durch die beiden Karten ϕk : Uk → Rn der stereographischen Projektion gegeben (siehe Abbildung), mit
S2 U1/2 := S n \{(0, . . . , 0, ±1) }, x1 2 .. . ϕ1/2 (x) := 1 ∓ xn+1 x.n
n n+1 2 2 Da 1−x k=1 xk = 1+xn+1 = (1 − xn+1 ) / 2
4/ ϕ1 (x) , ist der Kartenwechsel auf U1 ∩ U2 geometrisch die Spiegelung an
x ϕ1 (x) Stereographische Projektion
460
A.2. Mannigfaltigkeiten
der Sph¨are mit Radius 2: ϕ2 ◦ ϕ−1 1 (y)
1 − xn+1 = 1 + xn+1
y1 4y .. = 2 .
y
yn
y ∈ ϕ1 (U1 ∩ U2 ) = Rn \ {0} .
In der Mathematischen Physik taucht S 2 etwa als Konfigurationsraum des sph¨arischen Pendels auf, und S 2n−1 als Energieschale H −1 ( 12 ) des harmonischen Oszillators H : Rnp × Rnq → R , H(p, q) := 12 p 2 + q 2 . 4. In Definition A.27 haben wir von einer Einbettung der Mannigfaltigkeit v¨ollig abgesehen. Wir k¨onnen Mannigfaltigkeiten M sogar allein dadurch definieren, indem wir ¨ Kartenbilder und vertr¨agliche Ubergangsfunktionen angeben. Die Menge M ¨ wird dabei als Menge von Aquivalenzklassen unter Kartenwechsel ¨aquivalenter Punkte aufgefasst, die Topologie ist die Quotiententopologie. Ein Beispiel: W¨ahrend das M¨obius–Band in Beispiel 2.35 als Untermanniguhrt wurde, k¨ onnen wir es statt dessen als abstrakte faltigkeit des R3 eingef¨ C ∞ –Mannigfaltigkeit M wie folgt definieren. Die Kartenbilder der drei Karten ϕi : M → R2 , i = 1, 2, 3 seien die offenen Rechtecke Vi := (0, 3) × (−1, 1), die Definitions- und Wertebereiche der Kartenwechsel die Teilmengen Vi,i+1 := {(x, y) ∈ Vi | x > 2} , Vi,i−1 := {(x, y) ∈ Vi | x < 1}
(i = 1, 2, 3)
(mit Index–Addition modulo 3). Die Kartenwechsel selbst seien von der Form ϕi,i+1 : Vi,i+1 → Vi+1,i
, (x, y) → (x − 2, −y)
(also ϕi+1,i = ϕ−1 i,i+1 : Vi+1,i → Vi,i+1 , (x, y) → (x + 2, −y)). 5. Der Konfigurationsraum zweier ebener Pendel ist der Torus T2 := S 1 ×S 1 . 3 A.30 Bemerkungen (Konstruktion von Mannigfaltigkeiten) 1. Eine offene Teilmenge N ⊂ M einer C r –Mannigfaltigkeit (M, OM ) mit Atlas {(Ui , ϕi ) | i ∈ I} bildet in kanonischer Weise wieder eine C r –Mannigfaltigkeit. Als Topologie nimmt man f¨ ur (N, ON ) die Teilraumtopologie ON := {U ∩ N | U ∈ OM }, als Atlas die Menge
Ui ∩ N, ϕi N | i ∈ I
der auf N eingeschr¨ankten Karten (Ui , ϕi ) von M . In Beispiel A.29.1 wurde schon der Fall M = Rn besprochen.
A. Topologische R¨aume und Mannigfaltigkeiten
461
2. Mit den differenzierbaren Mannigfaltigkeiten M und N und ihren Atlanten {(Ui , ϕi ) | i ∈ I} beziehungsweise {(Vj , ψj ) | j ∈ J} ist auch der topologische Produktraum M × N eine differenzierbare Mannigfaltigkeit, mit Atlas { (Ui × Vj , ϕi × ψj ) | (i, j) ∈ I × J} .
3
ur eine Die abgeschlossene Vollkugel B n = {x ∈ Rn | x ≤ 1} ist ein Beispiel f¨ sogenannte berandete Mannigfaltigkeit. B n ist keine Mannigfaltigkeit, denn es gibt f¨ ur die Randpunkte x ∈ ∂B n = S n−1 keine zu Rn hom¨oomorphe Umgebung. Wohl aber gibt es eine Umgebung, die zu einem durch eine lineare Abbildung : Rn → R definierten Halbraum hom¨ oomorph ist, mit Hn := {y ∈ Rn | (y) ≥ 0}
(also mit H0n = Rn ).
A.31 Definition • Ein parakompakter topologischer Raum (M, O), f¨ ur den es ein n ∈ N0 gibt, sodass jedes m ∈ M eine zu einem Halbraum Hn hom¨oomorphe Umgebung U ∈ O besitzt, heißt topologische berandete Mannigfaltigkeit. n heißt dann Dimension von M . • Eine Karte (U, ϕ) von (M, O) besitzt als Definitionsbereich eine offene Teilmenge U ⊆ M , und ϕ : U → ϕ(U ) ist ein Hom¨oomorphismus auf das relativ offene Bild ϕ(U ) ⊆ Hn . C r –Vertr¨ aglichkeit von Karten, C r –Atlanten {(Ui , ϕi ) | i ∈ I} von M und berandete C r –Mannigfaltigkeiten werden analog zu den Definitionen A.25 und A.27 eingef¨ uhrt. A.32 Definition • Der Rand der berandeten Mannigfaltigkeit M ist die Menge ∂M := m ∈ M | ∃ i ∈ I : m ∈ Ui , ϕi (m) ∈ ∂ ϕi (Ui ) ⊆ Rn . Der Witz bei dieser Definition ist, dass der Rand der Teilmenge ϕi (Ui ) des Rn im topologischen Sinn (Definition A.9) definiert ist. Er besteht genau aus den Punkten von ϕi (Ui ), die auch in der Hyperebene ∂Hni des Rn liegen. A.33 Satz F¨ ur die Indexmenge J := {j ∈ I | Uj ∩ ∂M = ∅} und Abbildungen ˜j → ∂H n mit Definitionsbereich U ˜j := Uj ∩ ∂M ϕ˜j := ϕU˜j : U j ˜j , ϕ˜j )j∈J ein C r –Atlas des Randes der berandeten C r –Mannigfaltigkeit M . ist (U Insbesondere ist der Rand ∂M selbst eine unberandete Mannigfaltigkeit: ∂∂M=∅. Dies ist in der Integrationstheorie dual zu der Eigenschaft dd = 0 der ¨außeren Ableitung aus Satz B.20.
462
A.2. Mannigfaltigkeiten
A.34 Beispiel (berandete Mannigfaltigkeit) Halb-unendlicher Zylinder M := {x ∈ R3 | x21 + x22 = R2 , x3 ≥ 0}
1
x2
mit Radius R > 0. Wir k¨ onnen z.B. die folgenden vier Karten (Ui± , ϕ± i ), i = 1, 2 benutzen (siehe Abbildung):
M
0
1 2
± 2 Ui± := {x ∈ M | ±xi > 0}, ϕ± i : Ui → R+ =
ϕ± 1 (x1 , x2 , x3 )
:= (±x2 , x3 ),
ϕ± 2 (x1 , x2 , x3 ) := (±x1 , x3 ).
x3 1 0
Der Rand des Zylinders ist ∂M = {x ∈ M | x3 = 0},
x1
0 1
also ein Kreis mit Radius R in der (x1 , x2 )– 3 Ebene des R3 . A.35 Bemerkung Das kartesische Produkt M × N zweier berandeter Mannigfaltigkeiten ist im Allgemeinen keine berandete Mannigfaltigkeit. 3 Wie k¨onnen wir eine stetige Abbildung f : M → N zwischen differenzierbaren Mannigfaltigkeiten angeben und beschreiben? Offenbar wieder unter Verwendung von Karten (U, ϕ) von M bei x ∈ M und (V, ψ) von N bei f (x) ∈ N , die der Abbildung angepasst sind: Es muss f (U ) ⊆ V gelten. Dann ist die Abbildung ψ ◦ f ◦ ϕ−1 : ϕ(U ) → ψ(V )
(A.2.1)
definiert. Sie heißt lokale Darstellung von f bei x. Wegen der Stetigkeit von f k¨onnen wir eine solche immer finden, indem wir notfalls zu einer kleineren offenen Umgebung U ⊆ U von x u ¨bergehen (die Karte (U , ϕU ) ist mit den anderen Karten vertr¨aglich). A.36 Definition • f : M → N heißt r–mal stetig differenzierbar (Schreibur alle x ∈ M die lokalen Darstellungen von f bei weise: f ∈ C r (M, N )), wenn f¨ x r–mal stetig differenzierbar sind (siehe Abbildung A.2.1). • Die Abbildungen f ∈ C ∞ (M, N ) heißen auch glatt. • Ein Hom¨oomorphismus f ∈ C r (M, N ) heißt C r –Diffeomorphismus, wenn f −1 ∈ C r (M, N ).
A.37 Weiterf¨ uhrende Literatur Eine empfehlenswerte Referenz zum Thema ,Mannigfaltigkeiten’ ist Kapitel 1 von Abraham und Marsden [AM]; Globale topologische Fragen werden in Hirsch [Hirs] behandelt. 3
A. Topologische R¨aume und Mannigfaltigkeiten
M
463
N f (x) f (U )
f U x
ψ
ϕ ψ ◦ f ◦ ϕ−1
Abbildung A.2.1: Differenzierbarkeit von f : M → N
A.3
Das Tangentialb¨ undel
Welche geometrische Struktur bilden die Zust¨ande, also Orte und Geschwindigkeiten, eines mechanischen Systems, wenn sein Konfigurationsraum eine Mannigfaltigkeit M ist? Sie bilden das sogenannte Tangentialb¨undel T M von M . Ist M eine in den Rn eingebettete UntermannigR3 faltigkeit, so ist klar, was wir unter dem Tangentialraum von M an einem Punkt x ∈ M verste- S 2 Tx S 2 hen. Das ist dann der Unterraum Tx M der Vektoren des Tangentialraums Tx Rn ∼ = Rn des Rn x bei x, die an M tangential sind. Ist insbesondere M ⊂ Rn offen, dann ist TM ∼ = M × Rn .
(A.3.1)
A.38 Beispiel Der Tangentialraum der Sph¨are S d ⊂ Rd+1 bei x ∈ S d ist Tx S d = {y ∈ Rd+1 | y, x = 0}, siehe nebenstehende Abbildung 4 . 3
Tangentialraum Tx S 2
Da nicht alle Mannigfaltigkeiten als Teilmengen eines Rn definiert sind, m¨ ussen wir bei der allgemeinen Definition des Tangentialb¨ undels anders vorgehen: A.39 Definition • Ein Tangentialvektor einer Mannigfaltigkeit M am Punkt ¨ x ∈ M ist eine Aquivalenzklasse von Kurven c ∈ C 1 ]−ε, ε[, M mit c(0) = x, wobei zwei solche Kurven c1 , c2 ¨ aquivalent heißen, wenn in einer Karte (U, ϕ), 4 Beispiel A.38 zeigt, dass schon aus Dimensionsgr¨ unden das Tangentialb¨ undel T M einer Untermannigfaltigkeit M ⊂ Rd im Allgemeinen nicht in den Rd eingebettet werden kann, wohl aber die Tangentialr¨ aume Tx M .
464
A.3. Das Tangentialb¨ undel
x ∈ U , gilt
d d ϕ ◦ c1 (t) = ϕ ◦ c2 (t) . dt dt t=0 t=0
• Die Menge Tx M von Tangentialvektoren von M an x heißt Tangentialraum von M an x. 7 • Das Tangentialb¨ undel T M von M ist die Vereinigung x∈M Tx M . • Wir bezeichnen die Projektion der Tangentialvektoren in Tx M auf ihren Fuß−1 punkt x mit πM : T M → M ; πM (x) = Tx M heißt Faser u ¨ber x ∈ M . • Eine stetige Abbildung v : M → T M mit πM ◦ v = IdM heißt Vektorfeld auf M , siehe Abbildung A.3.2.
M
−1 −ε
0
1
x U
ε ϕ c˙1 (0) = c˙2 (0) ϕ(x) ϕ(U )
¨ Abbildung A.3.1: Tangentialvektor als Aquivalenzklasse von Kurven Der Tangentialvektor wird also durch die Menge aller Kurven definiert, die aneinander tangential im Sinn von (A.3.2) ϕ c1 (t) − ϕ c2 (t) = o(t) sind, siehe Abbildung A.3.1. Die Tangentialit¨atseigenschaft (A.3.2) zweier Kurven ist zwar in einer Karte definiert, bleibt aber bei Kartenwechsel erhalten. A.40 Bemerkung (Definitionen des Tangentialb¨ undels) Sei M ⊆ Rn offen, und als Karte werde (U, ϕ) := (M, Id) benutzt. Dann ergibt Definition A.39 in ¨ undel von Ubereinstimmung mit (A.3.1) T M ∼ = M × Rn , sodass das Tangentialb¨ M eine differenzierbare Mannigfaltigkeit der doppelten Dimension ist. Allgemein wird die am Anfang des Abschnitts ausgesprochene Definition des Tangentialb¨ undels T M einer Untermannigfaltigkeit M ⊆ Rn in Definition A.39 von T M u uhrt, wenn man einem Tangentialvektor v ∈ Tm Rn an m ∈ M ¨bergef¨ ¨ die Aquivalenzklasse der auf M projizierten Kurve t → m + t v zugeordnet. 3
A. Topologische R¨aume und Mannigfaltigkeiten
465
v(x) TM v x M Tx M Abbildung A.3.2: Ein Tangentialvektorfeld v : M → T M ; der Nullschnitt von T M wird mit M identifiziert Allgemein sind f¨ ur einen Punkt x einer Mannigfaltigkeit M , eine Karte (U, ϕ) bei x und eine C 1 –Kurve c : (−ε, ε) → U mit c(0) = x die Zeitableitungen d ϕ ◦ c(t) dt t=0 Vektoren in Tϕ(x) Rn ∼ = Rn , und im Kartenbild k¨onnen wir diese Tangentialvektoren mit einer reellen Zahl multiplizieren und miteinander addieren. Diese Vektorraumstruktur u ¨bertr¨agt sich kartenunabh¨angig auf die Menge Tx M der Tangentialvektoren von M an x. A.41 Definition F¨ ur f ∈ C 1 (M, N ) heißt T f : T M → T N mit T f [c]x := [f ◦ c]f (x) x ∈ M, c Kurve bei x ¨ die Tangentialabbildung von f (dabei bezeichnet [·] die Aquivalenzklasse). A.42 Satz • F¨ ur eine C r+1 –Mannigfaltigkeit M gilt: Der Tangentialraum Tx M von M an x ist ein reeller Vektorraum der Dimension dim(Tx M ) = dim(M ). • Das Tangentialb¨ undel T M ist eine C r –Mannigfaltigkeit, und dim(T M ) = 2 dim(M ). Beweis: Sei A := {(Ui , ϕi ) | i ∈ I} ein Atlas von M . Dann ist T A := {(T Ui , T ϕi ) | i ∈ I} ein Atlas von T M , genannt der nat¨ urliche Atlas. Seine Karten heißen nat¨ urliche Karten. 2 Zwar k¨onnen wir im Prinzip in der Mannigfaltigkeit T M beliebige Koordinaten benutzen. Es ist aber sinnvoll, in den Tangentialvektoren lineare Koordinaten zu
466
A.3. Das Tangentialb¨ undel
verwenden, um in den Karten Tangentialvektoren an einem Punkt wie u ¨blich zu addieren. Eine Karte (U, ϕ) von M induziert auf U die n = dim(M ) Vektorfelder ∂ ∂ ,..., : U → T U, ∂ϕ1 ∂ϕn die unter der Tangentialabbildung die Bilder ∂ (u) = ϕ(u), el (u ∈ U, l = 1, . . . , n) Tϕ ∂ϕl
(A.3.3)
haben (el bezeichnet den l-ten kanonischen Basisvektor des Rn ). F¨ ur x ∈ U ∂ ∂ (x), . . . , (x) eine Basis von T M . bilden die Tangentialvektoren ∂ϕ x ∂ϕ 1 n Die Menge X (M ) der Vektorfelder einer Mannigfaltigkeit M bildet einen R– Vektorraum. U besitzt X ∈ X (M ) die eindeutige Darstellung
n Im Kartengebiet ∂ X(x) = k=1 Xk (x) ∂ϕ (x) mit stetigen Funktionen Xk : U → R. k A.43 Definition • Das Tangentialb¨ undel T M einer n–dimensionalen Mannigfaltigkeit M heißt parallelisierbar, wenn es einen Diffeomorphismus I : T M → M × Rn gibt, der faserweise (das heißt restringiert auf die Fasern Tm M , f¨ ur alle m ∈ M ) −1 (m) = {m} × Rn ). linear und bez¨ uglich M die Identit¨at ist (I ◦ πM • Dann heißt I eine Parallelisierung von T M . Alle parallelisierbaren Mannigfaltigkeiten sind insbesondere orientierbar, siehe Definition F.12. A.44 Beispiele (Parallelisierbarkeit) 1. Lie–Gruppen G sind parallelisierbar, denn mit der Linkswirkung Lg aus (E.1.3) und der Lie–Algebra g ∼ = Te G ∼ = dim(G) von G ist R G × g → TG
,
(g, ξ) → (Te Lg )(ξ)
ein faserweise linearer Diffeomorphismus mit (Te Lg )(ξ) ∈ Tg G. 2. Das Tangentialb¨ undel der Sph¨are S n = {x ∈ Rn+1 | x = 1} ist T S n = (x, y) ∈ Rn+1 × Rn+1 | x = 1 , x, y = 0 . • T S 1 : Wegen S 1 = {x ∈ C | |x| = 1} k¨onnen wir das Tangentialb¨ undel mit
y ∈iR T S 1 = (x, y) ∈ C × C | |x| = 1 , x identifizieren. Wir finden eine Parallelisierung I : T S 1 → S 1 × R , (x, y) → x, y/(ix)
T S1 y x Tangentialraum der Kreislinie S 1
A. Topologische R¨aume und Mannigfaltigkeiten
467
von T S 1 , mit Inverser I −1 (x, z) = (x, ixz), siehe nebenstehende Abbildung. Wir machen von dieser Tatsache bei der Betrachtung des ebenen Pendels Gebrauch. • T S 2. Behauptung: T S 2 ist nicht parallelisierbar.5 Beweis: Durch Widerspruch. Betrachte dazu I −1 x × 10 . Das ist ein Tangentialvektor an x ∈ S 2 . Dieser Tangentialvektor verschwindet nach Voraussetzung nicht (Linearit¨at). Betrachten wir f¨ ur alle x ∈ S 2 diese Tangentialvektoren, so erhalten wir ein nicht verschwindendes Vektorfeld auf S 2 . Ein solches Vektorfeld Y : S 2 → T S 2 existiert aber nicht (siehe Abbildung). Denn sei Y (x) (notfalls durch Normierung) f¨ ur alle x ∈ S 2 von der L¨ange 1, also Yε := ε Y von der L¨ange |ε|. Dann bildet
S2
Tangentialvektorfeld auf S 2
fε : S 2 → R3
, x → x + Yε (x) √ ur betragsm¨aßig auf die Sph¨are S 2 (r) vom Radius r := 1 + ε2 ab, und fε ist f¨ kleine ε ein Diffeomorphismus der Sph¨aren. Wir betrachten auf R3 die Zwei–Form (siehe Anhang B.2) ω := x1 dx2 ∧ dx3 + x2 dx3 ∧ dx1 + x3 dx1 ∧ dx2 = r3 cos(θ) dϕ ∧ dθ in Kugelkoordinaten x1 = r cos(θ) cos(ϕ)
, x2 = r cos(θ) sin(ϕ) ,
x3 = r sin(θ).
Nun k¨onnen wir die Fl¨ache F (r) der Sph¨are S 2 (r) einerseits durch 1 F (r) = ω = 4πr2 = 4π (1 + ε2 ) r S 2 (r) berechnen, andererseits aber nach unserer Widerspruchsannahme durch 1 1 ω= f ∗ (ω). F (r) = r fε (S2 (1)) r S 2 (1) ε √ Letzterer Ausdruck ist aber ein Polynom in ε, dividiert durch r = 1 + ε2 , 2 wie man durch explizite Betrachtung von fε∗ (ω) sieht. Widerspruch! 5 Satz vom Igel: Jeder stetig gek¨ ammte Igel hat mindestens eine kahle Stelle, englisch: hairy ball theorem.
Der folgende Beweis von Milnor l¨ asst sich auf alle Sph¨ aren S 2n verallgemeinern, siehe Gallot, Hulin und Lafontaine [GHL], Kapitel I.C. Von den ungerad-dimensionalen Sph¨ aren ist außer S 1 nur noch S 3 und S 7 parallelisierbar, siehe Hirzebruch [Hirz]. Dass S 3 parallelisierbar ist, sieht man daran, dass S 3 diffeomorph zur Lie–Gruppe SU(2) ist (siehe (E.2.1)).
468
A.3. Das Tangentialb¨ undel
Das Tangentialb¨ undel T M einer Konfigurationsmannigfaltigkeit M ist der Raum der Orte und Geschwindigkeiten. Die Lagrange–Funktion eines mechanischen Systems mit Konfigurationsraum M ist eine Funktion L : T M → R. A.45 Definition F¨ ur die C 1 –Mannigfaltigkeiten M und N sei f ∈ C 1 (M, N ). • f heißt immersiv bei m ∈ M , wenn Tm f : Tm M → Tf (m) N injektiv, submersiv bei m ∈ M und m regul¨ arer Punkt von f , wenn Tm f surjektiv ist. Sonst heißt m singul¨ arer Punkt von f . • f heißt Immersion, wenn f¨ ur alle m ∈ M f immersiv bei m ist. f heißt Submersion, wenn f¨ ur alle m ∈ M f submersiv bei m ist. • f heißt Einbettung, wenn f eine Immersion ist, die M hom¨oomorph auf f (M ) abbildet. (In Zeichen: f : M !→ N ) • n ∈ N heißt regul¨ arer Wert von f , wenn alle m ∈ f −1 (n) regul¨are Punkte sind, sonst singul¨ arer Wert. Immersionen m¨ ussen nicht injektiv sein, regul¨are Werte n ∈ N nicht im Bild f (M ) liegen. Aus dem Satz u ¨ber die inverse Abbildung folgt: A.46 Satz (Satz vom regul¨ aren Wert) F¨ ur r ≥ 1 und die C r –Mannigfaltigkeiten M und N sei n ∈ N regul¨arer Wert von f ∈ C r (M, N ). Dann ist U := f −1 (n) ⊆ M eine C r –Untermannigfaltigkeit, und dim U = dim M − dim N . Viele Ph¨anomene kann man schon bei Kurven c : I → N in einer Mannigfaltigkeit N sehen. Eine solche C 1 –Kurve heißt regul¨ar, wenn sie eine Immersion ist, also der Geschwindigkeitsvektor c (t) ∈ Tc(t) M nie verschwindet. A.47 Aufgaben (Differentialtopologie) Man zeige: 1. f : R → R , t → t3 ist injektiv, aber bei t = 0 nicht immersiv. Das Bild ist f (R) = R, also eine Mannigfaltigkeit. 3 (siehe Abbildung A.3.3, links) ist zwar eine glatte 2. f : R → R2 , t → tt2 Abbildung, aber bei t = 0 nicht immersiv, und das Bild ist keine Untermannigfaltigkeit (vergleiche mit dem implizit definierten Fall aus Beispiel 2.42). sin t ) heißen Rosenkurven (siehe 3. Die Kurven fk : R → R2 , t → cos(kt) ( cos t ur alle k ∈ R Immersionen, aber im Abbildung A.3.3, Mitte). Die fk sind f¨ Allgemeinen sind die Bilder fk (R) ⊂ R2 keine Untermannigfaltigkeiten. sin t 4. f : R → R2 , t → cos t ist eine nicht injektive Immersion, also keine Einbettung. Dennoch ist das Bild S 1 ⊂ R2 eine Untermannigfaltigkeit. sin t Dagegen ist f˜ : R/(2πZ) → R2 , t + 2πZ → cos t wohldefiniert und bettet die eindimensionale Mannigfaltigkeit R/(2πZ) ein. 5. f : R → R2 , t → exp(−t2 ) tt3 (siehe Abbildung A.3.3, rechts) ist eine injektive Immersion, aber keine Einbettung.
A. Topologische R¨aume und Mannigfaltigkeiten
469
x2
x2
x1
x2
x1
x1
Abbildung A.3.3: Links: Bild einer glatten, nicht immersiven Abbildung. Mitte: Rosenkurve mit k = 2/3, Bild einer nicht injektiven Immersion. Rechts: Bild einer injektiven Immersion, die keine Einbettung ist. ur dim(M ) > dim(N ) keine Immersion, f¨ ur dim(M ) < 6. f ∈ C 1 (M, N ) kann f¨ dim(N ) keine Submersion sein. 7. Die in Anhang F.1 besprochenen Projektionen π : E → B differenzierbarer Faserb¨ undel sind Submersionen. 3 In der Differentialtopologie gibt es eine untrennbare Verbindung zwischen Aussagen u ¨ber Mannigfaltigkeiten und Aussagen u ¨ber Abbildungen. Ein Beispiel daf¨ ur ist der folgende Satz: A.48 Satz Sei N eine C r –Mannigfaltigkeit, r ≥ 1. Eine Teilmenge A ⊂ N ist genau dann eine C r –Untermannigfaltigkeit, wenn A das Bild einer C r –Einbettung einer Mannigfaltigkeit ist. Andererseits lassen sich nach dem folgenden Satz alle abstrakt definierten Mannigfaltigkeiten als Untermannigfaltigkeit eines Rd auffassen: A.49 Satz (Einbettungssatz von Whitney) Jede kompakte n-dimensionale differenzierbare Mannigfaltigkeit besitzt eine Einbettung in R2n . A.50 Bemerkung Diese in der Dimension lineare Schranke ist optimal, wie man etwa am Beispiel A.47.4 von S 1 oder dem reell-projektiven Raum RP(2) sieht, der sich als kompakte nicht orientierbare Fl¨ache nicht in den R3 einbetten l¨aßt. Wohl aber existieren Immersionen RP(2) → R3 , z.B. die Boysche Fl¨ache, das Wahrzeichen des Mathematischen Forschungsinstituts Oberwolfach. 3 Riemannsche Mannigfaltigkeiten A.51 Definition Es sei M eine differenzierbare Mannigfaltigkeit.
470
A.3. Das Tangentialb¨ undel
• Eine riemannsche Metrik auf M ist eine differenzierbar von m abh¨angende Familie g = (gm )m∈M positiv definiter symmetrischer Bilinearformen gm : Tm M × Tm M → R
(m ∈ M ).
• F¨ ur eine riemannsche Metrik g auf M heißt (M, g) riemannsche Mannigfaltigkeit. Die Funktion g heißt auch metrischer Tensor 6 . Aus dem Beispiel (Rn , g) mit translationsinvarianter riemannscher Metrik gm (v, w) := v, w ergeben sich durch Restriktion von g auf Untermannigfaltigkeiten M ⊆ Rd wieder riemannsche Mannigfaltigkeiten, siehe Seite 483. Als nicht degenerierte Bilinearform definiert die riemannsche Metrik einen Isomorphismus zwischen Tangential– und Kotangentialr¨aumen, n¨amlich ∗ M Tm M → Tm
,
v → gm (v, ·)
(m ∈ M ).
Das ergibt einen Vektorb¨ undel-Isomorphismus : T M → T ∗ M . Diese Legendre– Transformation heißt musikalischer Isomorphismus, und sein Inverses wird mit " : T ∗ M → T M bezeichnet. Der Gradient ∇f : M → T M einer Funktion f ∈ C 1 (M, R) ist das Vektorfeld, das durch aus der ¨außeren Ableitung df : M → T ∗ M entsteht. Im Gegensatz zu df h¨angt also ∇f vom metrischen Tensor g ab. A.52 Weiterf¨ uhrende Literatur Bekannte B¨ ucher zur Differentialtopologie sind [Hirs] von Hirsch und [BJ] von Br¨ ocker und J¨ anich. Choquet-Bruhat, DeWitt-Morette und Dillard-Bleick geben in ih¨ rem zweib¨andigen Werk [CDD] eine umfassende Ubersicht u ¨ber die Theorie differenzierbarer Mannigfaltigkeiten, einschließlich Differentialformen, B¨ undeltheorie und Differentialgeometrie. 3
6 Sie ist keine Metrik im Sinne metrischer R¨ aume, erlaubt aber die Definition einer solchen, siehe (G.3.3).
Anhang B
Differentialformen B.1 B.2 B.3 B.4 B.5 B.6 B.7 B.8
¨ Außere Formen . . . . . . . . . . . . . . Differentialformen auf dem Rn . . . . . . Integration von Differentialformen . . . . Differentialformen auf Mannigfaltigkeiten Innere Ableitung und Lie–Ableitung . . . Der Satz von Stokes . . . . . . . . . . . ´ Das Poincare–Lemma . . . . . . . . . . de-Rham–Kohomologie . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. 472 . 477 . 482 . 485 . 486 . 489 . 493 . 497
In zahlreichen physikalischen Anwendungen der Analysis wird ¨uber Untermannigfaltigkeiten des Rn integriert, zum Beispiel zur Bestimmung - des durch eine von einer Leiterschleife berandete Fl¨ache dringenden magnetischen Flusses - der entlang eines Weges geleisteten Arbeit, etc. ´ Cartan und anderen der Um solche Integrationen durchzuf¨ uhren, ist von Elie Kalk¨ ul der Differentialformen auf Mannigfaltigkeiten entwickelt worden. Dieser Kalk¨ ul l¨asst aber auch den geometrischen Gehalt physikalischer Theorien wie Klassische Mechanik, Elektrodynamik oder Allgemeine Relativit¨atstheorie klar hervortreten (die Maxwellschen Gleichungen beispielsweise lassen sich mit Differentialformen als dF = 0, δF = j schreiben, siehe Beispiel B.21). B.1 Weiterf¨ uhrende Literatur Eine gute Einf¨ uhrung gibt das Buch [AF] von Agricola und Friedrich. 3 Der erste Schritt ist die algebraische Theorie der ¨außeren Formen, denn diese beschreiben das lokale Verhalten der Differentialformen an einem Punkt der Mannigfaltigkeit. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 19,
471
¨ B.1. Außere Formen
472
B.1
¨ Außere Formen
B.2 Definition Es sei E ein n–dimensionaler reeller Vektorraum. Eine Abbildung ϕ : E × . . . × E → R heißt multilinear, wenn sie in jedem Argument linear ist, d.h. f¨ ur λ ∈ R, j = 1, . . . , k und xj , xIj , xII j ∈E ϕ(x1 , . . . , xj−1 , λxj , xj+1 , . . . , xk ) = λϕ(x1 , . . . , xk ) und ϕ x1 , . . . , xj−1 , xIj + xII j , xj+1 , . . . , xk = ϕ x1 , . . . , xIj , . . . , xk + ϕ x1 , . . . , xII j , . . . , xk . Genauer spricht man von einer k–linearen Abbildung. Auf E := Rn mit Standardbasis e1 , . . . , en ∈ E bezeichne α1 , . . . , αn ∈ E ∗ die Dualbasis (das heißt αi (ej ) = δij ). ¨ B.3 Beispiele (Außere Formen) 1. k = 1. Dann ist ϕ eine Linearform auf E, und f¨ ur ϕ = 0 ist ϕ−1 (0) ⊂ E ein Unterraum der Dimension n − 1. 2. k = 2, E = Rn mit innerem Produkt ·, ·. F¨ ur A ∈ Mat(n, R) ist ϕ : E × E → R, ϕ(x, y) := x, Ay eine Bilinearform. Sie heißt (anti)symmetrisch, wenn ϕ(x, y) = ±ϕ(y, x) (x, y ∈ E). 3. k = n, E = Rn . ϕ(x1 , . . . , xn ) := det(x1 , . . . , xn ) (x1 , . . . , xn ∈ E) definiert die Determinantenform. Diese gibt das orientierte Volumen des von den 3 Vektoren x1 , . . . , xn aufgespannten Parallelotops an. Offensichtlich k¨onnen wir zwei k–lineare Abbildungen ϕ1 , ϕ2 addieren, indem wir (x1 , . . . , xk ∈ E) (B.1.1) setzen und eine k–lineare Abbildung ϕ mit einer reellen Zahl multiplizieren (λ ∈ R, x1 , . . . , xk ∈ E). (B.1.2) (λϕ)(x1 , . . . , xk ) := λ ϕ(x1 , . . . , xk )
(ϕ1 + ϕ2 )(x1 , . . . , xk ) := ϕ1 (x1 , . . . , xk ) + ϕ2 (x1 , . . . , xk )
Damit wird die Menge Lk (E, R) der k–linearen Abbildungen in R zu einem R– Vektorraum. B.4 Definition Es sei E ein n–dimensionaler R–Vektorraum. Dann heißt ϕ ∈ Lk (E, R) ¨ außere k–Form, wenn sie antisymmetrisch ist, d.h. ϕ(x1 , . . . , xi , . . . , xj , . . . , xk ) = −ϕ(x1 , . . . , xj , . . . , xi , . . . , xk )
(x ∈ E).
Der Unterraum der ¨außeren k–Formen wird mit Ωk (E) ⊂ Lk (E, R) bezeichnet. B.5 Beispiele (R¨ aume ¨ außerer Formen) 1. Ω1 (E) = L1 (E) ∼ = E∗.
B. Differentialformen
473
2. Die bilineare Abbildung Rn × Rn → R, (x, y) → x, Ay definiert eine ¨außere Zwei–Form auf Rn genau dann, wenn die Matrix A ∈ Mat(n, R) antisymmetrisch ist, also A = −A gilt. Also ist dim(Ω2 (Rn )) = ( n2 ). 3. Die n–Formen auf dem Rn sind Vielfache der Determinantenform.
3
B.6 Definition Das ¨ außere Produkt von ω1 , . . . , ωk ∈ Ω1 (E) wird durch ⎛ ⎞ ω1 (x1 ) . . . ωk (x1 ) ⎜ ⎟ .. .. ω1 ∧. . .∧ωk (x1 , . . . , xk ) := det ⎝ ⎠ (x1 , . . . , xk ∈ E) . . ω1 (xk )
...
ωk (xk )
definiert. Offensichtlich ist ω1 ∧ . . . ∧ ωk eine k–Form, also in Ωk (E). Insbesondere ist damit αi1 ∧ . . . ∧ αik ∈ Ωk (E). Diese ¨außere Form stimmt bis auf Vorzeichen mit derjenigen u ¨berein, bei der i1 , . . . , ik aufsteigend geordnet sind und ist genau dann = 0, wenn alle Indices voneinander verschieden sind. Wir k¨onnen nun jede k–Form ω ∈ Ωk (Rn ) eindeutig als Linearkombination ωi1 ...ik αi1 ∧ . . . ∧ αik ω= 1≤ii m ⎛ ⎞ n−1 n−1 θm d(x1 , x0 ). d(xn , xm ) ≤ d(xj+1 , xj ) ≤ ⎝ θj ⎠ d(x1 , x0 ) ≤ 1−θ j=m j=m Also ist (xn )n∈N eine Cauchy–Folge, und wegen Vollst¨andigkeit von (X, d) existiert x∗ := lim xn . n→∞ ∗ θm ∗ • Damit ist d(x , xm ) = limn→∞ d(x , xn ) + d(xn , xm ) ≤ 1−θ d(x1 , x0 ). ∗ • Wegen der Stetigkeit von f gilt f (x∗ ) = limn→∞ f (xn ) = limn→∞ xn+1 = ∗x . ∗ • Gilt f¨ ur x ∈ X ebenfalls f (x) = x, dann ist d(x, x ) = d f (x), f (x ) 2 ≤ θ d(x, x∗ ), also x = x∗ . Damit ist x∗ der einzige Fixpunkt. In vielen F¨allen ist die kontrahierende Abbildung parameterabh¨angig und man interessiert sich f¨ ur die Abh¨angigkeit des Fixpunktes vom Parameter. Eine entsprechende Aussage ist: D.4 Satz (Parametrisierter Fixpunktsatz) Es sei (X, d) ein vollst¨andiger metrischer Raum, P ein topologischer Raum (der Parameterraum) und es gelte f¨ ur f : X × P → X, fp (x) := f (x, p): 1. Es gibt eine gemeinsame Kontraktionskonstante θ ∈ (0, 1) f¨ ur die Abbildungen fp (p ∈ P ). 2. F¨ ur alle x ∈ X sind die Abbildungen P → X, p → fp (x) stetig.
D. Fixpunkt- und Urbilds¨atze
507
Dann sind die Fixpunkte xp von fp stetig in p ∈ P . Beweis: Wegen 1. besitzt fp nach Satz D.3 einen eindeutigen Fixpunkt xp . • F¨ ur alle p, q ∈ P ist, ebenfalls wegen der ersten Bedingung d(xp , xq ) = d fp (xp ), fq (xq ) ≤ d fp (xp ), fp (xq ) + d fp (xq ), fq (xq ) ≤ θ d xp , xq + d fp (xq ), fq (xq ) , also d(xp , xq ) ≤ d fp (xq ), fq (xq ) /(1 − θ). • Wegen der zweiten Bedingung ur alle ε > 0 eine Umgebung U ⊆ P gibt es f¨ von q mit d fp (xq ), fq (xq ) < ε(1 − θ), falls p ∈ U . F¨ ur diese p ist also 2 d(xp , xq ) < ε. D.5 Bemerkung (Newton–Verfahren) Es sei f ∈ C 2 (I, R), also eine zweimal stetig differenzierbare Funktion auf dem Intervall I := [a, b], mit f (x) = 0 f¨ ur alle x ∈ I. f Gesucht ist das (wegen dieser Annah1 me eindeutige) Urbild X eines Punktes Y ∈ f (I). X ist der einzige Fixpunkt von x0 , f x0 g ≡ gY : I → R
,
g(x) = x −
f (x)−Y f (x)
.
Geometrisch ist g(x) der Schnittpunkt der Tangente an den Graphen von f bei (x, f (x)) mit der Geraden y = Y . Im Newton–Verfahren w¨ahlt man einen Anfangswert x0 ∈ I und iteriert g, mit xn+1 := g(xn ). 3
Y
X,Y
x1 ,Y
X,X
f
I
gY x
D.6 Satz (Newton-Verfahren) F¨ ur alle x ∈ I ist |g(x) − X| ≤ M |x − X|2 , maxx∈I |f (x)| mit M := minx∈I |f (x)| . Also konvergiert das Verfahren f¨ ur Anfangswerte x0 ∈ I mit M |x0 − X| < 1, das heißt: limn→∞ xn = X. Beweis: Falls x = X ist, sind wir fertig. Sonst gibt es nach dem Mittelwertsatz der Differentialrechnung ein ξ im offenen Intervall zwischen x und X mit f (x)−f (X) = f (ξ), also x−X f (ξ) |g(x) − X| = x − f (x)−Y − X) 1 − = − X (x f (x) f (x) (ξ) 2 f (x)−f (ξ) 1 ≤ |x − X| = |x − X| · f (x)−f · f (x) x−ξ f (x) =
|x − X|2 ·
|f (η)| . |f (x)|
Wieder wird nach dem Mittelwertsatz η geeignet zwischen x und ξ gew¨ahlt. 2 1 Oft
wird in Darstellungen des Newton–Verfahrens Y = 0 angenommen.
Anhang E
Gruppentheorie E.1 E.2 E.3 E.4
E.1
Gruppen . . . . . . . . Lie–Gruppen . . . . . Lie–Algebren . . . . . Lie–Gruppenwirkungen
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. 508 . 511 . 514 . 519
Gruppen
E.1 Definition • Eine Gruppe ist eine Menge G mit einer Abbildung (,Verkn¨ upfung’ genannt) ◦ : G × G → G, die assoziativ ist (g ◦ (h ◦ k) = (g ◦ h) ◦ k), und einem ausgezeichneten Element e ∈ G (Identit¨ at) mit g ◦ e = e ◦ g = g, (g ∈ G), f¨ur die zu jedem Element g ∈ G ein inverses Element h ∈ G mit g ◦ h = e existiert. • G heißt kommutativ oder abelsch, wenn g ◦ k = k ◦ g
(g, k ∈ G) gilt.
• Die Ordnung |G| einer Gruppe ist die Kardinalit¨at der Menge. • Eine nicht leere Teilmenge H ⊆ G heißt Untergruppe, wenn sie unter Multiplikation und Inversenbildung abgeschlossen ist. Schreibweise: H ≤ G. • F¨ ur eine Untergruppe H ≤ G und g ∈ G heißt g ◦ H := {g ◦ h | h ∈ H} ⊆ G eine Linksnebenklasse, H ◦ g eine Rechtsnebenklasse von H. E.2 Bemerkung Sowohl die Identit¨at e als auch das zu g inverse Element g −1 ist eindeutig, und es gilt auch g −1 ◦ g = e. 3 E.3 Satz (Lagrange) Die Ordnung |H| einer Untergruppe H ≤ G einer endlichen Gruppe G teilt die Ordnung |G| von G. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 22,
508
E. Gruppentheorie
509
E.4 Definition g1 ∈ G heißt konjugiert zu g2 ∈ G, wenn ein h ∈ G existiert mit g2 = h ◦ g1 ◦ h−1 . Eine Untergruppe H1 ≤ G heißt konjugiert zu H2 ≤ G, wenn ein h ∈ G existiert mit H2 = h ◦ H1 ◦ h−1 . ¨ E.5 Satz Konjugation ist eine Aquivalenzrelation. Eine Gruppe G zerf¨allt also in Konjugationsklassen, wobei die Identit¨at e ∈ G eine eigene Klasse bildet. E.6 Definition Eine Untergruppe H ≤ G heißt normal, wenn gilt: kHk −1 = H
(k ∈ G),
also Links- und Rechtsnebenklassen u ¨bereinstimmen. Schreibweise: H G. E.7 Satz Ist die Untergruppe H ≤ G normal, dann induziert die Verkn¨ upfung auf G eine Verkn¨ upfung auf der Menge G/H der Nebenklassen von H. Diese Gruppe heißt Faktorgruppe G/H. E.8 Beispiel (Restklassengruppe) F¨ ur n ∈ N ist die Teilmenge nZ ⊆ Z der ganzzahligen Vielfachen von n eine Untergruppe von (Z, +). Da (Z, +) abelsch ist, ist nZ normal, mit der Restklassengruppe Zn := Z/nZ ∼ = {0, 1, . . . , n − 1} als Faktorgruppe (Addition mod n). 3 E.9 Definition Eine Abbildung φ : G1 → G2 von der Gruppe G1 in die Gruppe G2 heißt Homomorphismus, wenn φ(g1 ◦ g2 ) = φ(g1 ) ◦ φ(g2 )
(g1 , g2 ∈ G1 )
(E.1.1)
gilt. Ein bijektiver Homomorphismus heißt Isomorphismus. E.10 Bemerkung Aus (E.1.1) folgt f¨ ur die Bilder des neutralen und der inversen Elemente φ(e) = e und φ(g −1 ) = φ(g)−1 (g ∈ G1 ). 3 E.11 Satz Der Kern ker(φ) := {g ∈ G1 | φ(g) = e} eines Gruppenhomomorphismus φ : G1 → G2 ist eine normale Untergruppe. E.12 Definition • Eine (Links–)Wirkung oder Aktion einer Gruppe G auf einer Menge M ist eine Abbildung Φ : G×M → M , f¨ ur die in der Schreibweise Φg : M → M
, Φg (m) := Φ(g, m)
(g ∈ G)
gilt Φe = IdM
und Φg ◦ Φh = Φg◦h
(g, h ∈ G).
(E.1.2)
• Der Orbit eines Punktes m ∈ M ist die Menge O(m) := Φ(G, m) ⊆ M . • Die Isotropiegruppe (auch Stabilisator, Fixgruppe oder Standgruppe genannt) von m ∈ M ist die Untergruppe Gm := {g ∈ G | Φ(g, m) = m}.
510
E.1. Gruppen
• Die Wirkung heißt frei, wenn f¨ ur alle m ∈ M die Abbildung G → M, g → Φ(g, m) injektiv ist, transitiv, wenn sie f¨ ur ein (und damit f¨ ur alle) m ∈ M surjektiv ist. • Eine Gruppenwirkung Φ : G × V → V auf einem Vektorraum V heißt Darstellung von G, wenn die Abbildungen Φg : V → V linear sind. Φ : G × C → C, (g, c) → ϕ(g)c (und auch ϕ : G → C) heißt Charakter. Wie im Spezialfall dynamischer Systeme (Satz 2.13) definiert die Zugeh¨origkeit ¨ zu einem Orbit eine Aquivalenzrelation auf M . F¨ ur h ∈ G und den Punkt m := h m ∈ O(m) des Orbits von m ist in der Kurzschreibweise g m := Φg (m) Gm = {g ∈ G | g ◦ h m = h m} = {g ∈ G | h−1 ◦ g ◦ h m = m} = h Gm h−1 . Die Isotropiegruppen der Punkte eines Orbits sind also zueinander konjugiert. Gruppen G wirken in verschiedener Weise auf sich selbst, zum Beispiel durch Links– beziehungsweise Rechtswirkung 1 L:G×G→G
, Lg (h) := g ◦ h
, R:G×G→G
, Rg (h) := h ◦ g. (E.1.3) Die Abbildungen Lg und Rg vertauschen miteinander, und sowohl die Links– als ur auch die Rechtswirkung sind transitiv, denn f¨ ur h1 , h2 ∈ G ist Lg (h1 ) = h2 f¨ −1 g := h2 ◦ h−1 und R (h ) = h f¨ u r g := h ◦ h . Auch die Abbildung g 1 2 2 1 1 I :G×G→G
, Ig (h) := g ◦ h ◦ g −1
(E.1.4)
ist eine Gruppenwirkung von G auf sich, aber im Gegensatz zu Lg und Rg ist Ig : G → G ein Gruppen–Automorphismus, denn es gilt Ig (h1 ) ◦ Ig (h2 ) = g ◦ h1 ◦ g −1 ◦ g ◦ h2 ◦ g −1 = Ig (h1 ◦ h2 ), ur alle g ∈ G. Diese Gruppenwirkung heißt (entalso insbesondere Ig (e) = e f¨ sprechend Definition E.4) auch Konjugation. E.13 Satz Ist |G| < ∞ und Φ : G × M → M eine Gruppenwirkung, so gilt |O(m)| · |Gm | = |G|
(m ∈ M ).
E.14 Definition • Sind G1 , G2 Gruppen, so heißt G1 × G2 mit Gruppenmultiplikation g1 , g2 ◦ g1 , g2 := g1 ◦ g1 , g2 ◦ g2 direktes Produkt von G1 und G2 . • Die Automorphismengruppe einer Gruppe G ist die Gruppe Aut(G) := {φ : G → G | φ ist Isomorphismus } mit der Komposition als Gruppenverkn¨ upfung. 1 F¨ ur
die Rechtswirkung gilt allerdings Rg1 ◦ Rg2 = Rg2 ◦g1 , im Gegensatz zu (E.1.2).
E. Gruppentheorie
511
• Ist φ : G2 → Aut(G1 ) ein Homomorphismus von G2 in die Automorphismengruppe von G1 , so heißt G1 × G2 (als Menge) mit Gruppenmultiplikation (g1 , g2 ) ◦ (g1 , g2 ) = g1 ◦ φ(g2 )(g1 ) , g2 ◦ g2 gi , gi ∈ Gi semidirektes Produkt von G1 und G2 , und wird mit G1 φ G2 (oder G1 G2 ) bezeichnet. E.15 Beispiel (Euklidische Gruppe) Wie in Satz 14.1 gezeigt wird, ist die Euklidische Gruppe E(d) des Rd semidirektes Produkt von G1 := (Rd , +) und der orthogonalen Gruppe G2 := O(d). Der Homomorphismus φ : O(d) → Aut(Rd ) ist dabei einfach durch φ(O)(v) := Ov f¨ ur v ∈ Rd gegeben, sodass (v, O) ◦ (v , O ) = v + Ov , O O gilt. Insbesondere ergibt sich f¨ ur d = 1 Dimensionen E(1) ∼ = R φ {±1}, wobei dieses semidirekte Produkt abelscher Gruppen nicht abelsch ist, denn z.B. (v, −1) ◦ (v , 1) = (v − v , −1)
, aber (v , 1) ◦ (v, −1) = (v + v , −1).
3
Zwar sind die beiden Faktoren eines semidirekten Produktes Untergruppen von G1 G2 , aber im Allgemeinen ist nur G1 normal. Etwa im Beispiel der Euklidischen Gruppe ist die Untergruppe {0} × O(d) der Drehspiegelungen um den Ursprung konjugiert zu den Untergruppen der Drehspiegelungen um einen anderen Punkt des Rd .
E.2
Lie–Gruppen
Viele Gruppen sind in nat¨ urlicher Weise topologische R¨aume oder sogar Mannigfaltigkeiten. E.16 Definition • Eine Gruppe (G, ◦) heißt topologische Gruppe, wenn G mit einer Topologie versehen ist, sodass gilt: Die Gruppenverkn¨ upfung ◦ : G × G → G und die Inversenbildung G → G sind stetig (dabei wird G × G mit der Produkttopologie versehen, siehe Seite 454). • Eine Gruppe (G, ◦) heißt Lie–Gruppe, wenn G mit einer differenzierbaren Struktur (siehe Seite 458) versehen ist, sodass die Gruppenverkn¨ upfung G × G → G und die Inversenbildung G → G glatte Abbildungen sind. Ein einfaches Beispiel einer Lie–Gruppe ist die abelsche Gruppe (Rd , +), ebenso deren Untergruppe Zd mit der durch die Inklusion Zd ⊂ Rd entstehenden (diskreten) Teilraumtopologie. E.17 Bemerkungen 1. Schon in Definition 2.16 eines stetigen dynamischen Systems und Definition 2.43 eines differenzierbaren dynamischen Systems haben wir von Definition E.16 Gebrauch gemacht.
512
E.2. Lie–Gruppen
2. Da Mannigfaltigkeiten topologische R¨aume und glatte Abbildungen stetig sind, ist jede Lie–Gruppe eine topologische Gruppe. Umgekehrt gilt das nicht. Beispielsweise kann man die Gruppe Diff(M ) aller Diffeomorphismen einer Mannigfaltigkeit M als topologische Gruppe auffassen. F¨ ur dim(M ) ≥ 1 m¨ usste sie als ,Mannigfaltigkeit’ unendliche Dimension besitzen, was mit unserem Mannigfaltigkeitsbegriff nicht kompatibel ist. 3. Um zu zeigen, dass G eine Lie–Gruppe ist, reicht es aus zu zeigen, dass die Multiplikation glatt ist. Bezeichnen wir diese n¨amlich mit M : G × G → G, −1 dann ist die Inversenbildung I : G → G, I(g) = g L¨osung der Gleichung M g, I(g) = e, und die partielle Ableitung D2 M (g, h) nach dem zweiten Argument ist ein Isomorphismus. Die Glattheit von I folgt damit aus dem Satz u 3 ¨ber die implizite Funktion. E.18 Beispiel (Allgemeine lineare Gruppe) Die allgemeine lineare Gruppe GL(V ) eines Vektorraums V ist die Gruppe der Automorphismen von V (also der invertierbaren linearen Abbildungen aus Lin(V )). Damit wirkt sie auf V und auch auf dem projektiven Raum P(V ) von V , also ¨ der Menge der Aquivalenzklassen P(V ) := [v] | v ∈ V \ {0}
mit
[v] = [w] falls span(v) = span(w).
Im Fall eines K–Vektorraums V endlicher Dimension n ist die Gruppe isomorph zu der Gruppe der invertierbaren Matrizen aus Mat(n, K). F¨ ur K = R und alle n ∈ N ist diese reelle allgemeine lineare Gruppe GL(n, R) := {M ∈ Mat(n, R) | det(M ) = 0} eine offene Teilmenge des n2 –dimensionalen Vektorraums Mat(n, R), und die Gruppenmultiplikation ist als Einschr¨ankung der bilinearen Matrixmultiplikation glatt (siehe auch Beispiel 4.13). Es gilt also dim GL(n, R) = n2 , und die Lie– Gruppe GL(n, R) besitzt neben der Untergruppe GL+ (n, R) := {M ∈ GL(n, R) | det(M ) > 0} noch eine zweite Zusammenhangskomponente. Dabei ist die letztere von der Form GL+ (n, R)N mit einer beliebigen Matrix N ∈ GL(n, R) negativer Determinante. Sie sieht also als Mannigfaltigkeit genauso aus wie GL+ (n, R), ist aber keine Gruppe. Eine Untergruppe von GL(n, R) ist die orthogonale Gruppe O(n) := M ∈ GL(n, R) | M = M −1 der Drehspiegelungen des Rn . Die Topologie der Mannigfaltigkeit GL(n, R) kann man verstehen, indem man die Matrizen M ∈ GL(n, R) mittels Polarzerlegung eindeutig in der Form M = OP schreibt mit O ∈ O(n) und P positiv. Dass dabei P = (M M )1/2 sein muss, ergibt sich aus dem Ansatz M = OP : M M =
E. Gruppentheorie
513
P O OP = P P = P 2 . Da die positiven Matrizen von der Form P = exp(S) mit S ∈ Sym(n, R) sind,2 ist GL(n, R) −→ O(n) , OP −→ O ein B¨ undel mit typischer Faser Sym(n, R). Als R–Vektorraum ist diese zusammenh¨angend. Also besitzt der Totalraum GL(n, R) des B¨ undels genauso viele Zusammenhangskomponenten wie die Basis O(n). GL+ (n, R) projiziert auf die Drehgruppe SO(n) := M ∈ GL+ (n, R) | M = M −1 . Letztere ist zusammenh¨angend, wie in Beispiel E.19 gezeigt wird. Die Gruppe GL(n, R) ist andererseits nicht kompakt, denn sie enth¨alt ja die Untergruppe {λ1l | λ > 0}. Analog ist f¨ ur alle n ∈ N die komplexe allgemeine lineare Gruppe GL(n, C) := {M ∈ Mat(n, C) | det M = 0} als offene dichte Teilmenge von Mat(n, C) eine 2n2 –dimensionale (reelle) Mannigfaltigkeit. Diese Lie–Gruppe ist aber zusammenh¨angend. 3 Oft werden Lie–Gruppen als Untergruppen von GL(n, R) oder GL(n, C) definiert. E.19 Beispiele (Lie–Gruppen) 1. Die spezielle lineare Gruppe SL(n, R) := {M ∈ GL(n, R) | det(M ) = 1} ist eine (n2 − 1)–dimensionale Untermannigfaltigkeit von GL+ (n, R), da 1 regul¨arer Wert von det : Mat(n, R) → R ist. SL(n, R) ist zusammenh¨angend und f¨ ur n > 1 nicht kompakt. 2. Die Drehgruppe SO(n) = M ∈ SL(n, R) | M = M −1 ist diejenige Zusammenhangskomponente der orthogonalen Gruppe O(n) die die Identit¨at enth¨alt. Denn als normale reelle Matrix ist O ∈ SO(n) in einer geeigneten Orthonormalbasis von Rn eine direkte Summe von Matrizen der Form ( sc −s c )∈ Mat(2, R) und Zahlen u ∈ Mat(1, R) = R. Da O orthogonal ist, sind die ( sc −s c ) ∈ SO(2), und |u| = 1. Da sogar O ∈ SO(n), gibt es eine gerade Zahl von Summanden c = −1. Diese kann man wieder zu Paaren von Drehmatri cos ϕ − sin ϕ zen aus SO(2) zusammenfassen. Da SO(2) = | ϕ ∈ [0, 2π) sin ϕ cos ϕ zusammenh¨angend ist, ist damit auch SO(n) zusammenh¨angend. Da die Matrixnorm der Elemente von O(n) gleich Eins ist, ist O(n) und damit auch SO(n) kompakt. 1l ∈ Sym(n, R) ⊂ Mat(n, R) ist regul¨arer Wert der Abbildung P : GL(n, R) −→ Sym(n, R) 2 Mit
, M −→ M M,
Sym(n, K) := {P ∈ GL(n, K) | P ∗ = P } f¨ ur K = R oder K = C.
514
E.3. Lie–Algebren
denn ihre Linearisierung ist durch DP (M )N = M N + N M gegeben, und f¨ ur M ∈ P −1 (1l) = O(n) und L ∈ Sym(n, R) ist L Bild von N := 12 M L unter der Abbildung N → M N + N M , diese also surjektiv. Damit ist O(n) eine Lie–Gruppe, und dim O(n) = dim GL(n, R) − dim Sym(n, R) = n2 − n+1 = ( n2 ) . 2 3. Die unit¨are Gruppe U(n) := M ∈ GL(n, C) | M ∗ = M −1 ist als Lie–Gruppe ebenfalls kompakt, besitzt die (reelle) Dimension n2 , und U (1) ∼ = S 1 . Die Untergruppe SU(n) := {M ∈ U(n) | det(M ) = 1} der speziell unit¨aren Matrizen ist eine (n2 − 1)–dimensionale Lie–Gruppe. Die Darstellung v w 2 2 SU(2) = ( −w (E.2.1) v ) | v, w ∈ C, |v| + |w| = 1 zeigt, dass SU(2) diffeomorph zur Sph¨are S 3 ⊂ R4 ∼ = C2 ist. 4. Kartesische Produkte von Lie–Gruppen sind, als Produktmannigfaltigkeiten aufgefasst, wieder Lie–Gruppen. Ein Beispiel ist die abelsche Gruppe Tn := S 1 × . . . × S 1 , der n–dimensionale Torus. 3
E.3
Lie–Algebren
In der Mathematik ist das Konzept der Linearisierung oft erfolgreich, denn lineare Strukturen sind meist einfacher zu verstehen als nicht lineare. Da eine Lie–Gruppe auch eine Mannigfaltigkeit ist, kann man sie lokal (in der N¨ahe des neutralen Elements) betrachten, und kommt so zum Begriff ihrer Lie–Algebra. Die in (E.1.3) definierten Links- und Rechtswirkungen Lg , Rg : G → G sind im Fall einer Lie–Gruppe G Diffeomorphismen. E.20 Definition Ein Vektorfeld X : G → T G auf einer Lie–Gruppe G heißt • links–invariant, wenn gilt (Lg )∗ X = X • rechts–invariant, wenn gilt (Rg )∗ X = X
(g ∈ G), (g ∈ G).
Wir werden weiter meistens die links–invarianten Vektorfelder X betrachten; f¨ ur die rechts–invarianten gelten dann analoge Aussagen. Da die Linkswirkung transitiv ist, brauchen wir nur X(e) zu kennen, um ur alle g ∈ G zu kennen. Die links–invarianten Vektorfelder X(g) = T Lg X(e) f¨ urlich isomorphen Unterraum XL (G) im R– auf G bilden also einen zu Te G nat¨ Vektorraum X (G) aller Vektorfelder.
E. Gruppentheorie
515
E.21 Definition Eine Lie–Algebra E, [·, ·] ist ein K–Vektorraum E mit einer Abbildung [·, ·] : E × E → E, genannt Lie–Klammer, die (mit a, b ∈ K und X, Y, Z ∈ E) • bilinear ist, das heißt [a X + b Y, Z] = a [X, Z] + b [Y, Z]
und [Z, a X + b Y ] = a [Z, X] + b [Z, Y ]
• alternierend ist: [X, X] = 0, und damit antisymmetrisch: [X, Y ] = −[Y, X], ullt. • und die die Jacobi–Identit¨ at [X, [Y, Z]] + [Y, [Z, X]] + [Z, [X, Y ]] = 0 erf¨ E.22 Lemma Die Lie–Klammer [X, Y ] : G → T G (siehe Definition 10.20) zweier links–invarianter Vektorfelder X, Y : G → T G ist selbst links–invariant. Beweis: F¨ ur g ∈ G gilt (Lg )∗ [X, Y ] = [(Lg )∗ X, (Lg )∗ Y ] = [X, Y ], also auch [X, Y ] ∈ XL (G). 2 Damit bildet XL (G), [·, ·] eine Lie–Algebra, die sogenannte Lie–Algebra Lie(G) von G. E.23 Bemerkungen 1. Oft wird statt Lie(G) das Frakturzeichen g benutzt, zum Beispiel Lie SO(n) = so(n). 2. Wie bemerkt, l¨aßt sich die Lie–Algebra g einer Lie–Gruppe G als Tangentialraum von G des neutralen Elements e ∈ G auffassen 3 . Da sie damit deren lokale Struktur in der N¨ahe der Identit¨at wiedergibt, kann es wie in Aufgabe E.27.2.b) oder im Beispiel so(n) = o(n) vorkommen, dass nicht isomorphe Lie–Gruppen isomorphe Lie–Algebren besitzen. 3 Nicht alle Lie–Gruppen sind Matrixgruppen: E.24 Beispiele (Lie–Gruppen vs Matrixgruppen) 1. So besteht zwar (R, +) aus reellen Zahlen, also eindimensionalen Matrizen, aber die Gruppenverkn¨ upfung entspricht nicht der Matrixmultiplikation. In diesem Fall ist die Lie–Gruppe aber isomorph zu einer Matrixgruppe, n¨amlich der multiplikativen Gruppe (R+ , ·), mit dem Isomorphismus exp : R → R+ . Solche Lie–Gruppen heißen auch linear. Beispielsweise sind alle endlichen Gruppen linear. 2. Manche Gruppen sind ,zu groß’ um linear zu sein, zum Beispiel die Permutationsgruppe von N. sogenannte Baker–Campbell–Hausdorff–Formel stellt log exp(X) exp(Y ) durch Kommutatoren von X und Y dar, mit exp aus (E.3.1), stellt also eine Beziehung zwischen Lie–Klammer und Gruppenverkn¨ upfung her. 3 Die
516
E.3. Lie–Algebren
3. Auch manche zusammenh¨angenden Lie–Gruppen wie die sogenannten metaplektischen Gruppen, die die symplektischen Gruppen zweifach u ¨berlagern und in der Quantenmechanik wichtig sind, sind nicht linear (siehe etwa Carter, Segal und Macdonald [CSM], Seite 130). 3 Im allgemeinen Fall der Lie–Algebra g einer Lie–Gruppe G wird die Exponentialabbildung wie folgt definiert. Die Elemente ξ ∈ g werden als linksinvariante Vektorfelder auf G aufgefasst. Diese erzeugen Fl¨ usse Φ(ξ) : R × G → G
(ξ ∈ g),
(denn wegen der Gruppenstruktur gibt es ein von der Anfangsbedingung g ∈ G unabh¨angiges Zeitintervall, auf dem die Picard–Iteration konvergiert), und die Exponentialabbildung ist exp : g → G
, ξ → Φ(ξ) (1, e).
(E.3.1)
Die Exponentialabbildung bildet kleine Umgebungen von 0 ∈ g diffeomorph auf Umgebungen von e ∈ G ab (etwa f¨ ur lineare Gruppen ist ja D exp(0) = 1l). Sie bildet aber nicht immer g auf die Zusammenhangskomponente von e ∈ G ab. Dies sieht man etwa f¨ ur die in Aufgabe 6.26.d) diskutierte und auf Seite 89 illustrierte Gruppe SL(2, R) = Sp(2, R). Unter den hyperbolischen Matrizen ist die Zusammenhangskomponente der Matrizen mit negativen Eigenwerten nicht im Bild exp sl(2, R) der Exponentialabbildung. Siehe auch Abraham und Marsden [AM], Example 4.1.9 f¨ ur die Gruppe GL(2, R). E.25 Aufgabe (Exponentialabbildung f¨ ur GL(n, R)) Zeigen Sie, dass die links– beziehungsweise rechts–invarianten Vektorfelder auf der Matrixgruppe GL(n, R) von der Form g ∈ GL(n, R), ξ ∈ Mat(n, R) g → X (ξ) (g) = g ξ bzw. g → ξ g sind, dass der Kommutator von zwei links-invarianten Vektorfeldern durch % & X (ξ) , X (η) = X ([ξ,η]) mit [ξ, η] = ξη − ηξ ξ, η ∈ Mat(n, R) gegeben ist, und dass Definition (E.3.1) von exp(ξ) mit dem Matrixexponential (4.1) u 3 ¨bereinstimmt.
E.26 Beispiele 1. Die links– und die rechts–invarianten Vektorfelder einer abelschen Lie–Gruppe sind einander gleich, und ihre Lie–Klammer verschwindet. Auf Rn etwa geh¨oren genau die konstanten Vektorfelder zur Lie–Algebra XL (Rn ) = XR (Rn ). F¨ ur die Lie–Gruppe U (1) = {c ∈ C | |c| = 1} mit Lie–Algebra iR ergibt sich das nebenstehende Bild.
U1
i
E. Gruppentheorie
517
2. Die Matrixgruppe GL(n, K) ist offen in Mat(n, K), ihre Lie–Algebra ist also der Tangentialraum gl(n) = Mat(n, K). Der oben beschriebene Zusammenhang zwischen Lie–Algebra und Tangentialraum der Identit¨at erlaubt damit eine einfache Berechnung der Matrix– Lie–Algebra einer Matrix–Lie–Gruppe, wie man am Beispiel der SO(n, R) ⊂ GL(n, R) sieht: F¨ ur eine C 1 –Kurve A : (−, ) → SO(n, R) mit A(0) = 1l gilt A(s)A(s) = 1l und det A(s) = 1 f¨ ur alle s ∈ (−, ), also ˙ ˙ = A(0) ˙ ˙ . A(s)A(s) = A(0)A(0) + A(0)A(0) + A(0) 0= d ds
s=0
Folglich ist mit dem Vektorraum Alt(n, R) := {X ∈ Mat(n, R) | X = −X} der antisymmetrischen Matrizen so(n) = Alt(n, R),
(E.3.2)
denn aus X + X = 0 folgt bereits exp(X) exp(X ) = 1l und tr (X) = 0, so dass det(exp X) = 1. 3 E.27 Aufgaben (Lie–Gruppen und Lie–Algebren) 1. Berechnen Sie analog zu den obigen Beispielen die Lie–Algebren u(n), su(n) und sp(R2n ) von U(n), SU(n) beziehungsweise Sp(R2n ) (siehe Beispiel E.19.3 und (6.2.5)), und bestimmen Sie deren Dimensionen. 2. (Isomorphien von Lie–Algebren) (a) Zeigen Sie, dass die Lie–Algebra so(3) mit (13.4.8) isomorph ist zur Lie– Algebra des R3 , versehen mit dem Vektorprodukt als Klammeroperation. (b) Zeigen Sie die Isomorphie so(3) ∼ = su(2) mit su(n) := {X ∈ Mat(n, C) | X + X ∗ = 0, tr(X) = 0} . (c) Es bezeichne H den Schiefk¨ orper der Quaternionen q = a + bi + cj + dk mit a, b, c, d ∈ R, wobei i, j, k folgenden Relationen gen¨ ugen: ij = k = −ji , jk = i = −kj , ki = j = −ik und i2 = j 2 = k2 = −1, und die Konjugation durch q ∗ := a − bi − cj − dk erkl¨art ist (siehe auch Koecher und Remmert [KR]). Zeigen Sie, dass su(2) als Lie–Algebra isomorph ist zur Menge ImH := {q ∈ H | a = 0} der imagin¨aren Quaternionen mit dem Kommutator als Klammeroperation. Verwenden Sie dazu die Einbettung a+bi c+di H → Mat(2, C) , q → −c+di 3 a−bi . E.28 Beispiel (Parametrisierung von SO(3)) Eine Parametrisierung von SO(3) ist die folgende glatte Abbildung (mit der Vollkugel Brd = {x ∈ Rd | x ≤ r}): a1 0 −a3 a2 A : Bπ3 → SO(3), x → exp i(x) , mit i : R3 → so(3), aa2 → a3 0 −a1 3
−a2 a1
0
518
E.3. Lie–Algebren
(siehe auch (13.4.8)). Da x im Kern der Matrix i(x) liegt, ist A(x) eine Drehung um die Achse span(x). Wegen der Eigenwerte spek(x) = 0, i x , −i x ist der Drehwinkel gleich x . Da jede Drehung im R3 als Rechtsdrehung um einen Winkel im Intervall [0, π] dargestellt werden kann, ist A surjektiv. Abgesehen von der Identifikation der Antipoden auf der Kugeloberfl¨ache, das heißt i(x) = i(−x) f¨ ur x = π, ist die Abbildung injektiv. Diese Eigenschaften von A folgen auch mit der Formel von Rodrigues exp i(x) = 1l3 +
sin(x) x
i(x) +
1 2
sin(x/2) x/2
2 i(x)
x ∈ R3 \ {0} .
(E.3.3) Letztere beweist man durch Einsetzen der Formel i(x)2 = xx − x 2 1l3 , also i(x)3 = − x 2 i(x) in die Potenzreihe von exp und Sortieren in gerade und ungerade Potenzen. 3 Aus dieser Parametrisierung folgt (siehe Aufgabe 6.53), dass SO(3) diffeomorph zum reell-projektiven Raum RP(3) ∼ = S 3 /{±1l} ist. Andererseits ist nach Beispiel E.19.3 die Lie–Gruppe SU(2) diffeomorph zur Sph¨are S 3 . Wir erhalten damit eine ¨ zweifache Uberlagerung von SO(3) durch die Gruppe SU(2). E.29 Satz (SU(2) und SO(3)) Mit dem linearen Isomorphismus −ix3 −ix1 −x2 σ : R3 → su(2) , σ(x) := 12 −ix ix3 1 +x2 ist die adjungierte Darstellung Π : SU(2) → SO(3) ,
ΠU (x) = σ −1 U σ(x)U −1
U ∈ SU(2), x ∈ R3
ein surjektiver Gruppenhomomorphismus mit Kern {±1l}. Beweis: • Mit tr σ(x)σ(y) = − 12 x, y folgt f¨ ur ΠU ∈ GL(3, R) schon ΠU ∈ SO(3), denn f¨ ur x, y ∈ R3 ist ΠU (x), ΠU (y) = −2tr U σ(x)U −1 U σ(y)U −1 = −2tr σ(x)σ(y) = x, y . • Π ist ein Gruppenhomomorphismus mit {±1l} ⊆ ker(Π), denn Π−1l (x) = Π1l (x) = x und f¨ ur U, V ∈ SU(2) ist ΠU ◦ ΠV (x) = ΠU σ −1 V σ(x)V −1 = σ −1 U V σ(x)V −1 U −1 = ΠU V (x). Andererseits ist U ∈ ker(Π) genau dann, wenn U v U −1 = v f¨ ur alle v ∈ su(2). Das ist gleichbedeutend mit U v = vU f¨ ur alle v ∈ su(2), also damit, dass U Vielfaches der Eins ist. 0 −a3 a2 a1 • i : R3 → so(3) , aa2 → a3 0 −a1 ist nach (13.4.8) ein Isomorphismus 3
−a2 a1
0
der Lie–Algebren, ebenso wie σ : R3 → su(2), und daher (Aufgabe E.27.2) auch ψ := i ◦ σ −1 : su(2) → so(3).
E. Gruppentheorie
519
Damit ist die Linearisierung Te Π : su(2) → so(3) des Gruppenhomomorphismus Π bei der Identit¨at von der Form Te Π = ψ, denn unter Verwendung von v × x = i(v)x folgt Te Π(u)(x) = σ −1 uσ(x)−σ(x)u = σ −1 (u)×x = ψ(u)x u ∈ su(2), x ∈ R3 . • Π ist damit ein lokaler Diffeomorphismus 4 . Das Bild Π SU(2) ⊆ SO(3) ist damit offen und abgeschlossen zugleich. Da nach Beispiel E.19.2 die Gruppen SO(n) zusammenh¨angend sind, ist Π SU(2) = SO(3). 2
E.4
Lie–Gruppenwirkungen
Wie jede Gruppe auf einer Menge wirken kann (siehe Definition E.12), so kann auch eine topologische Gruppe auf einem topologischen Raum beziehungsweise eine Lie–Gruppe auf einer Mannigfaltigkeit wirken. Man wird aber dann Vertr¨aglichkeit der Strukturen erwarten. Im ersten Fall wird man also Stetigkeit der Gruppenwirkung, im zweiten Fall stetige Differenzierbarkeit voraussetzen. E.30 Beispiele (Lie–Gruppenwirkungen) 1. Jede Lie–Gruppe G wirkt auf sich selbst von links und von rechts (E.1.3), sowie durch die Konjugation I : G × G → G (E.1.4), das heißt durch Gruppenautomorphismen. 2. Damit wirkt sie auch auf ihrer Lie–Algebra g. Identifizieren wir diese n¨amlich mit dem Tangentialraum Te G an der Identit¨at e ∈ G, dann ist wegen Ig (e) = e (g ∈ G) die adjungierte Darstellung Adg : g → g
(g ∈ G, ξ ∈ Te G ∼ = g)
, Adg (ξ) = DIg (e) ξ
(E.4.1)
eine lineare Gruppenwirkung von G auf g. Ist die Lie–Gruppe G eine Matrixgruppe, dann ist Adg (ξ) = g ξ g −1
(g ∈ G, ξ ∈ Te G).
3. Damit wird auch auf der dualen Lie–Algebra g∗ eine Darstellung von G definiert. Die zur linearen Abbildung Adg duale Abbildung Ad∗g ist ja durch die Eigenschaft ) ∗ ∗ * Adg (ξ ), η = ξ ∗ , Adg (η) (η ∈ g, ξ ∗ ∈ g∗ ) festgelegt. Die Abbildung g → Ad∗g ist aber eine Rechtswirkung, w¨ahrend wir Linkswirkungen benutzen. Entsprechend ist die koadjungierte Darstellung von G auf g∗ , definiert durch Ad∗ : G → Lin(g∗ )
,
g → Ad∗g −1 ,
(E.4.2)
eine Linkswirkung. 4 Also analog zu Definition 2.36 jeder Punkt x ∈ SU(2) eine Umgebung U besitzt, so dass x ΠUx ein Diffeomorphismus auf Π(Ux ) ist.
520
E.4. Lie–Gruppenwirkungen
Abbildung E.4.1: Links und Mitte: Orbits der Linkswirkung einer einparametrigen Untergruppe in SO(3), Rechts: Rechtswirkung der gleichen Untergruppe (beachte die umgekehrte Torsion der Orbits). Darstellung in der Kugel-Parametrisierung von SO(3) aus Beispiel E.28, Seite 517. 4. Auch die in diesem Buch behandelten differenzierbaren dynamischen Systeme sind Lie–Gruppenwirkungen (n¨amlich der Lie–Gruppen Z oder R, siehe Definition 2.43). 3 E.31 Aufgabe (adjungierte Darstellung) Zeigen Sie, dass f¨ ur G = SO(3) und mit der Identifikation (13.4.8) von so(3) mit R3 die adjungierte Darstellung der 3 Drehmatrix O ∈ SO(3) die Form AdO (ξ) = O ξ besitzt. Das Besondere, mit der Differenzierbarkeit der Wirkung einhergehende Element der Lie–Gruppenwirkungen Φ : G × M → M im Vergleich zu anderen Gruppenwirkungen ist die folgende Beziehung zwischen der Lie–Algebra g und Vektorfeldern auf der Mannigfaltigkeit M . E.32 Definition F¨ ur eine Lie–Gruppenwirkung Φ : G × M → M und ξ ∈ g heißt das Vektorfeld auf M d Xξ : M → T M , Xξ (m) := Φ exp(tξ), m dt t=0 der infinitesimale Erzeuger der von ξ erzeugten Gruppenwirkung. F¨ ur die Linkswirkung Φ : G × G → G, Φg (h) = g ◦ h erhalten wir damit die rechts–invarianten Vektorfelder 0 0 0 auf G. In Abbildung E.4.1 sieht man als Beispiel Orbits der von ξ = 0 0 −1 ∈ so(3) erzeugten Linkswirkung; das Vektorfeld 01 0
Xξ : SO(3) → T SO(3) ist zu diesen Orbits tangential. Es ist nicht erstaunlich, dass die adjungierte Darstellung sich mit Lie–Klammer und Exponentialabbildung vertr¨agt: E.33 Satz F¨ ur jede Lie–Gruppe G mit Lie–Algebra g und alle ξ, η ∈ g gilt (g ∈ G) Adg [ξ, η] = Adg ξ , Adg ξ , exp Adg (ξ) = g ◦ exp(ξ) ◦ g −1
E. Gruppentheorie
521 d Adexp(tξ) (η) t=0 = [ξ, η] . dt
und
(E.4.3)
¨ E.34 Aufgabe (adjungierte Wirkung) Uberpr¨ ufen Sie diese Formeln f¨ ur die Lie–Gruppe GL(n, R) und deren Lie–Algebra Mat(n, R) (und damit f¨ ur alle Matrix–Lie–Gruppen G ≤ GL(n, R)). 3 Die Identit¨at (E.4.3) f¨ uhrt zur Definition der linearen ad–Operatoren d Adexp(tξ) t=0 : g → g , η → [ξ, η]. (E.4.4) dt Diese sind also die infinitesimalen Erzeugenden der adjungierten Darstellung. adξ :=
E.35 Definition • Eine stetige Abbildung f : M → N zwischen topologischen R¨aumen heißt eigentlich (englisch: proper), wenn die Urbilder kompakter Mengen kompakt sind. • Eine stetige Gruppenwirkung Φ : G × M → M einer topologischen Gruppe G heißt eigentlich, wenn die Abbildung G×M → M ×M, (g, m) → m, Φ(g, m) eigentlich ist. Oft betrachtet man den Raum der Orbits einer Lie–Gruppenwirkung, und manchmal kann man diesen als Mannigfaltigkeit auffassen. E.36 Satz (Mannigfaltigkeit von Orbits) Ist ψ : G × M → M eine freie eigentliche Gruppenwirkung der Lie–Gruppe G auf einer Mannigfaltigkeit M , dann besitzt der Quotientenraum B := M/G = {O(m) | m ∈ M } die differenzierbare Struktur einer Mannigfaltigkeit, und die Abbildung π:M →B
,
x → O(x),
die den Punkten von M die sie enthaltenden Orbits zuordnet, ist eine surjektive Submersion (siehe Seite 468). Beweis: Dies ist Proposition 4.1.23 in Abraham und Marsden [AM].
2
Zun¨achst kann B immer mit der Quotiententopologie aus Beispiel A.2.4 versehen werden. Man kann, wie die folgenden Beispiele zeigen, aber die Forderungen nach Freiheit und Eigentlichkeit der Gruppenwirkung nicht einfach weglassen: E.37 Aufgaben (Lie–Gruppenwirkungen) 1. Zeigen Sie, dass f¨ ur n ∈ N \ {1} die Abbildung Φ : SO(n) × Rn → Rn , (O, m) → Om eine eigentliche, aber nicht freie Lie–Gruppenwirkung der Drehgruppe SO(n) ist, und dass B = Rn /SO(n) keine (unberandete) Mannigfaltigkeit ist. t 0 x 2. Zeigen Sie, dass die Abbildung Φ : R × M → M, (t, m) → e0 e−t auf M := R2 \{0} eine freie, aber nicht eigentliche Lie–Gruppenwirkung von (R, +) ist, und dass B kein Hausdorff–Raum ist. 3
Anhang F
Bu ¨ndel, Zusammenhang, Kru ¨mmung F.1 F.2 F.3 F.4
F.1
Faserbundel ¨ . . . . . . . . . . . . . . . . . ¨ Zusammenhange auf Faserbundeln ¨ . . . . Distributionen und der Satz von Frobenius Holonomie und Krummung ¨ . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. 522 . 526 . 532 . 534
Faserb¨ undel
Das kartesische Produkt E := B × F zweier Mannigfaltigkeiten ist selbst eine Mannigfaltigkeit. Bezeichnen wir mit π : E → B (b, f ) → b die Projektion auf den ersten Faktor, dann ist (E, B, F, π) ein Beispiel f¨ ur ein sogenanntes Faserb¨ undel. F.1 Definition • Es seien E, B und F topologische Hausdorff–R¨aume und π : E → B eine stetige surjektive Abbildung. Dann heißt (E, B, F, π) (topologisches) Faserb¨ undel mit Totalraum E, Basis B und ( Standard-) Faser F (siehe nebenstehende Abbildung), wenn die Projektion π lokal trivial ist, d.h. f¨ ur alle b ∈ B eine offene Umgebung U ⊆ B und ein Hom¨oomorphismus Φ : π −1 (U ) → U × F existiert mit Φ π −1 (b ) = {b } × F (b ∈ U ).
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 23,
522
F. B¨ undel, Zusammenhang, Kr¨ ummung
523
• F¨ ur ein Faserb¨ undel (E, B, F, π) heißt eine Familie (Ui , Φ7 i )i∈I von solchen offenen Mengen Ui ⊆ B und Hom¨oomorphismen Φi mit i∈I Ui = B eine lokale Trivialisierung des Faserb¨ undels. • Analog spricht man (f¨ ur r ∈ N oder r = ∞) von einem C r –Faserb¨ undel, wenn Totalraum E, Basis B und Faser F jeweils C r –Mannigfaltigkeiten und C r –Abbildungen sind. π sowie die Φ±1 i • Eine stetige (bzw. C r –) Abbildung S : B → E heißt Schnitt, wenn gilt: π ◦ S = IdB . F.2 Bemerkungen 1. Statt der etwas umst¨andlichen Benennung (E, B, F, π) findet man oft die Schreibweise π : E → B oder – pars pro toto – E. Die Fasern π−1 (b) ∼ = F schreibt man auch Eb . 2. Im einleitenden Beispiel eines Produktb¨ undels ist (U, Φ) := (B, IdE ) eine lokale Trivialisierung. Solche B¨ undel nennt man trivial. Beispielsweise sind die parallelisierbaren Tangentialb¨ undel (siehe Definition A.43) trivial. 3 F.3 Beispiele (Eindimensionale B¨ undel) 1. Ein einfaches Beispiel f¨ ur ein undel ist E := S 1 ⊂ R2 , B := RP(1) (der einnicht triviales C ∞ –Faserb¨ dimensionale reell–projektive Raum aller Ursprungsgeraden im R2 , siehe Definition 6.50) und die Abbildung π : E → B, die jedem Punkt x ∈ S 1 der Kreislinie die durch ihn gehende Ursprungsgerade zuordnet. Hier ist die Standardfaser F := {−1, +1} zweielementig, aber der Totalraum E ist zusammenh¨angend, also nicht hom¨ oomorph zu B × F . Eine lokale Trivialisierung ist z.B. (Ui , Φi )i∈I mit Indexmenge I := {1, 2} und Ui := span(x) | x ∈ S 1 ⊂ R2 , xi > 0 , Φi : π−1 (Ui ) → B × F
,
x → span(x), sign(xi ) .
Verallgemeinert erhalten wir f¨ ur n ∈ N ein nicht triviales Faserb¨ undel mit Faser F = {−1, +1} π : S n → RP(n). 2. Ein weiteres Beispiel f¨ ur ein C ∞ –Faserb¨ undel ist die Abwicklung der Gerade auf der Kreislinie, mit Totalraum E := R, Basis B := S 1 ⊂ C, Projektion π : E → B, x → exp(2πix) und Standardfaser F := Z. 3 Ist, wie in den vorigen Beispielen, die Standardfaser F ein diskreter topologischer ¨ Raum, dann nennt man das Faserb¨ undel eine Uberlagerung.
524
F.1. Faserb¨ undel
Hauptfaserb¨ undel und Vektorb¨ undel Oft besitzen die Faserb¨ undel Fasern mit Zusatzstrukturen. F.4 Definition Ist die Standardfaser F des Faserb¨ undels (E, B, F, π) eine topologische Gruppe und gibt es eine stetige (Rechts–) Wirkung Ψ:E×F →E
, Ψf (e) := Ψ(e, f ),
die die Fasern invariant l¨asst (das heißt f¨ ur alle f ∈ F : π ◦ Ψf = π) und auf ihnen frei und transitiv wirkt, heißt (E, B, F, π) Hauptfaserb¨ undel oder Prinzipalb¨ undel mit Strukturgruppe F . F.5 Bemerkung Da nach Annahme f¨ ur je zwei Punkte e1 , e2 ∈ E, die in einer Faser liegen (π(e1 ) = π(e2 )) genau ein Gruppenelement f ∈ F existiert mit Ψ(e1 , f ) = e2 , ist der Raum E/F der Orbits der Gruppenwirkung tats¨achlich hom¨oomorph zur Basis B. Sind die topologischen R¨aume differenzierbare Mannigfaltigkeiten, nimmt man an, dass F eine Lie–Gruppe ist. Oft entstehen Hauptfaserb¨ undel umgekehrt durch eine freie eigentliche Gruppenwirkung Ψ einer Gruppe G auf einem Raum E. Spezialisiert auf Mannigfaltigkeiten kann dann der Satz E.36 benutzt werden, um die Basismannigfaltigkeit B := E/G zu definieren. 3 Ein Beispiel f¨ ur eine solche Gruppenwirkung ist die von G = S 1 auf die Energiefl¨ache E := S 2d−1 ⊂ R2d des harmonischen Oszillators mit d Freiheitsgraden, siehe Satz 6.35. undels f¨ ur alle Punkte b ∈ B der Obwohl die Fasern Eb eines Hauptfaserb¨ Basis hom¨oomorph zur topologischen Gruppe F sind, gibt es im Allgemeinen keine stetige Vorschrift, je zwei Punkte einer Faser miteinander zu verkn¨ upfen. F.6 Beispiel (Einheitstangentialb¨ undel) F¨ ur die n–Sph¨are B := S n bezeichnet E := {(x, y) ∈ S n × Rn+1 | x, y = 0, y = 1} das Einheitstangentialb¨ undel, mit Projektion π : E → B, (x, y) → x und Faser ur n = 2 ist F eine (Lie–) Gruppe, und diese wirkt durch F = S n−1 . Etwa f¨ Drehung des Einheitstangentialvektors y um die x–Achse. Die Existenz einer stetig definierten Gruppenmultiplikation in den Fasern w¨ urde in jeder Faser ein Element auszeichnen (das neutrale Element), sodass wir einen Schnitt B → E erhalten w¨ urden. Dieser existiert aber nicht (siehe Beispiel A.44.2). 3 F.7 Aufgabe (Trivialit¨ at von Hauptfaserb¨ undeln) Beweisen Sie, dass ein Hauptfaserb¨ undel (E, B, F, π) genau dann trivial ist, wenn es einen Schnitt B → E besitzt. 3 Die Vektorb¨ undel sind ein anderer Typ von B¨ undeln. Bei ihnen ist die typische Faser F ein Vektorraum. Zum Beispiel sind f¨ ur das in Anhang A.3 behandelte Tangentialb¨ undel E := T B einer Mannigfaltigkeit B die Fasern Eb = Tb B reelle Vektorr¨aume der Dimension dim(B).
F. B¨ undel, Zusammenhang, Kr¨ ummung
525
F.8 Bemerkung (Nullschnitt) Zwar sind bei einem Vektorb¨ undel die Fasern als Vektorr¨aume insbesondere (additive) Gruppen, aber es gibt im Allgemeinen keine Gruppenwirkung von F auf E. Denn dann w¨aren nach Aufgabe F.7 Vektorb¨ undel immer trivial, wegen der Existenz des Nullschnittes B → E, b → 0 ∈ Eb . undel im Wie im Beispiel A.44.2 des Tangentialb¨ undels T S 2 sind aber Vektorb¨ Allgemeinen nicht trivial. 3 Daher ist die Definition von Vektorb¨ undeln auch kein Spezialfall der Definition von Prinzipalb¨ undeln. F.9 Definition Ein Faserb¨ undel (E, B, F, π), bei dem die Standardfaser F ein topologischer Vektorraum ist, wird Vektorb¨ undel (oder Vektorraumb¨ undel) genannt, wenn die lokale Trivialisierung (Ui , Φi )i∈I f¨ ur je zwei u ¨berlappende ¨ Gebiete Ui , Uj ⊆ B mit Ui,j := Ui ∩ Uj = ∅ sich mittels stetiger Ubergangsfunktionen ti,j : Ui,j → GL(F ) in der Form Φi ◦ Φ−1 , (b, f ) −→ b, ti,j (b)f j : Ui,j × F −→ Ui,j × F schreiben l¨asst. Der Rang des Vektorb¨ undels ist die Dimension der Standardfaser F . Wir betrachten in diesem Buch nur Vektorb¨ undel, deren Standardfaser ein K– Vektorraum mit K = R oder C ist. ¨ Dass der Ubergang zwischen B¨ undelkarten durch invertierbare lineare Abbildungen erfolgt, stellt sicher, dass die Vektorraumstruktur der Fasern Eb kartenunabh¨angig definiert ist. Faserweise k¨onnen mit Vektorb¨ undeln die u ¨blichen Operationen der linearen Algebra durchgef¨ uhrt werden, etwa die Bildung des Faktorraums nach einem Unterraum. F.10 Beispiel (Normalenb¨ undel) Eine andere Klasse von Vektorraumb¨ undeln wird durch die Normalenb¨ undel TM N/T M 7 von Untermannigfaltigkeiten M ⊆ N gebildet (mit TM N := m∈M Tm N ). Besitzt N eine riemannsche Metrik, ist dieses (algebraische) Normalenb¨ undel kanonisch isomorph zum geometrischen Normalenb¨ undel T M ⊥ , das aus allen lokal auf M senkrecht stehenden Tangentialvektoren von N besteht. Etwa f¨ ur M := S n ⊆ Rn+1 ist T M = (x, y) ∈ Rn+1 × Rn+1 | x = 1, y, x = 0 , also T M ⊥ = (x, y) ∈ Rn+1 × Rn+1 | x = 1, y = kx f¨ ur ein k ∈ R .
3
526
F.2. Zusammenh¨ange auf Faserb¨ undeln
F.11 Bemerkung (Whitney–Summe) Wendet man auf zwei Vektorb¨ undel π (i) : E (i) → B u ¨ber der gleichen Basis B faserweise die direkte Summe (1) (2) (E (1) ⊕ E (2) )b := Eb ⊕ Eb an, erh¨alt man die direkte Summe π : E (1) ⊕ E (2) → B der Vektorb¨ undel. Dieses Vektorb¨ undel wird auch Whitney–Summe genannt. undel T M ⊥ einer UnterSo ist etwa T M ⊕ T M ⊥ ∼ = TM N , mit dem Normalenb¨ mannigfaltigkeit M ⊆ N aus Beispiel F.10. 3
Orientierung von Vektorb¨ undeln Auch der Begriff der Orientierung eines n ∈ N–dimensionalen R–Vektorraums V u undel: ¨bertr¨agt sich auf Vektorb¨ Die Menge der Basen (e1 , . . . , en ) von V wird durch die allgemeine lineare Gruppe GL(V ) (siehe Beispiel E.18) parametrisiert, denn f¨ ur eine zweite Basis (f1 , . . . , fn ) gibt es genau ein A ∈ GL(V ) mit fk = A(ek ) (k = 1, . . . , n), und umgekehrt ist das Bild einer Basis unter A ∈ GL(V ) wieder eine Basis. ¨ Sie zerf¨allt damit in genau zwei Aquivalenzklassen durch die Untergruppe GL+ (V ) ineinander transformierter Basen. Diese heißen die Orientierungen von V . Etwa f¨ ur R2 sind die Basen (e1 , e2 ) beziehungsweise (e2 , e1 ) Repr¨asentanten, n ¨ von (e1 , . . . , en ) die Standardorientierung. und f¨ ur R heißt die Aquivalenzklasse Um auch den Vektorraum R0 = {0} mit ins Boot zu nehmen, f¨ ugt man ihm die Zahl 1 (Standardorientierung ) oder -1 als Orientierungen zu. F.12 Definition Ein Vektorb¨ undel (E, B, F, π) mit endlich-dimensionalem R– Vektorraum F als Standardfaser heißt • orientiert, wenn den Fasern Fb (b ∈ B) Orientierungen zugeordnet werden, die in den lokalen Trivialisierungen (siehe Definition F.1) konstant sind. • Es heißt orientierbar, wenn es in diesem Sinn orientiert werden kann. Eine Mannigfaltigkeit M heißt orientierbar beziehungsweise orientiert, wenn ihr Tangentialb¨ undel T M orientierbar bzw. orientiert ist. In diesem Sinn sind das M¨ obius–Band oder die reell-projektiven R¨aume RP(2k) gerader Dimension nicht orientierbar, die RP(2k + 1) aber schon.
F.2
Zusammenh¨ ange auf Faserb¨ undeln
Wir betrachten in diesem Abschnitt C r –Faserb¨ undel π : E → B.
F. B¨ undel, Zusammenhang, Kr¨ ummung
527
Die Linearisierung der Projektion π ist die Abbildung Tπ : TE → TB vom Tangentialb¨ undel des Totalraums E auf das Tangentialb¨ undel der Basis B. F¨ ur einen beliebigen Punkt e ∈ E in der Faser Eb u ¨ber b := π(e) ist die induzierte Abbildung Te E → Tb B der Tangentialr¨aume linear und surjektiv. Ihr Kern Ve ⊂ Te E besitzt die Dimension dim(Ve ) = dim(F ) der Standardfaser. In der Tat ist Ve = Te Eb . ur den vertikaDie Bezeichnung Ve steht f¨ len Unterraum Te Eb ⊂ Te E, und V → E heißt vertikales B¨ undel, siehe nebenstehende Abbildung. F.13 Definition • Ein (Ehresmann)–Zusammenhang auf dem Faserb¨ undel (E, B, F, π) ist ein glattes Unterb¨ undel H des Tangentialb¨ undels T E → E mit Whitney–Summe H ⊕ V = T E. • H wird horizontales B¨ undel genannt. F¨ ur jeden Punkt e ∈ E erg¨anzt also der horizontale Unterraum He ⊂ Te E den vertikalen Unterraum Ve ⊂ Te E so, dass He ⊕ Ve = Te E gilt, und die Restriktion der linearen Abbildung Te π : Te E → Tb B auf He ein Isomorphismus ist. F.14 Bemerkung Unterr¨aume eines Vektorraums k¨onnen wir als Kerne (oder als Bilder) linearer Abbildungen erhalten. Angewandt auf ein Faserb¨ undel (E, B, F, π) wurden schon die vertikalen Unterr¨aume so dargestellt. F¨ ur einen Ehresmann–Zusammenhang H auf dem Faserb¨ undel wird jeder Tangentialvektor Xe ∈ Te E am Punkt e ∈ E des Totalraums eindeutig in seine vertikale beziehungsweise horizontale Komponente vere (X) ∈ Ve , hore (Xe ) ∈ He zerlegt: Xe = vere (Xe ) + hore (Xe ).
(F.2.1)
Entsprechend besitzt ein Vektorfeld X : E → T E die Komponenten ver(X) : E → V
und hor(X) : E → H.
Umgekehrt definiert eine faserweise lineare Abbildung ω : TE → V
, Te E → Ve
genau dann einen Ehresmann–Zusammenhang, wenn die linearen Abbildungen ωe : Te E → Ve Projektionen auf den Vertikalraum Ve sind, das heißt ωe ◦ωe = ωe und ωe (Te E) = Ve gilt. 3
528
F.2. Zusammenh¨ange auf Faserb¨ undeln
Abbildung F.2.1: Zwei verschiedene Zusammenh¨ange auf dem gleichen B¨ undel
F.15 Beispiel (Produkt–Zusammenhang) F¨ ur ein triviales B¨ undel π : E → B mit E = B × F ist der Produkt–Zusammenhang durch den Kern von T π2 gegeben, mit der Projektion π2 : E → F
, (b, f ) → f
auf die Standardfaser, siehe nebenstehende Abbildung. 3 Im Gegensatz zu V ist aber H nicht durch das B¨ undel selbst definiert, und es gibt dementsprechend viele Zusammenh¨ange auf einem Faserb¨ undel π : E → B (siehe Abbildung F.2.1).
F.16 Definition Es sei I ⊆ R ein Intervall und c ∈ C 1 (I, B) eine Kurve in der undels π : E → B. Basis B eines C 1 –Faserb¨ • Eine Kurve c˜ ∈ C 1 (I, E) wird Lift von c genannt, wenn gilt: c = c˜ ◦ π. • F¨ ur einen Zusammenhang H auf dem Faserb¨ undel wird ein Lift c˜ von c horizontal genannt, wenn die Geschwindigkeit c˜ horizontal ist, das heißt c˜ (t) ∈ Hc˜(t) ⊂ Tc˜(t) E
(t ∈ I).
F¨ ur jeden Zeitpunkt t ∈ I und jeden Punkt e ∈ Ec(t) gibt es einen eindeutigen Vektor ft (e) ∈ He , der unter der linearisierten Projektion T π auf c (t) projiziert.
F. B¨ undel, Zusammenhang, Kr¨ ummung
529
Der Satz von Picard–Lindel¨ of (Satz 3.17) garantiert nun, dass das Anfangswertproblem (F.2.2) c˜ (t) = ft c˜(t) , c˜(t0 ) = e0 f¨ ur alle t0 ∈ I und e0 ∈ Eb(t0 ) in einer in I offenen Umgebung von t0 eindeutig l¨osbar ist. Oft (zum Beispiel wenn die Standardfaser kompakt ist), gibt es sogar eine eindeutige L¨ osung von (F.2.2) auf I. Zusammenh¨ ange auf Hauptfaserb¨ undeln und Vektorb¨ undeln F¨ ur Prinzipal– beziehungsweise Vektorb¨ undel gibt es besondere – der Gruppen– bzw. Vektorraumstruktur angepasste – Typen von Zusammenh¨angen. Wir schauen uns zun¨achst den Fall der Hauptfaserb¨ undel (E, B, F, π) an, bei der die Lie–Gruppe F auf dem Totalraum E als Gruppe von fasererhaltenden Diffeomorphismen Ψf wirkt. F.17 Definition Ein Ehresmann–Zusammenhang H auf dem Hauptfaserb¨ undel heißt F –Zusammenhang, wenn f¨ ur die linearisierte Gruppenwirkung T Ψf : T E → T E
(f ∈ F )
gilt: Te Ψf (He ) = HΨf (e)
(e ∈ E, f ∈ F ),
die Gruppenwirkung also den Zusammenhang H invariant l¨asst. Beispielsweise l¨asst sich das Faserb¨ undel π : E → B in Abbildung F.2.1 als Hauptfaserb¨ undel mit Gruppe F = S 1 interpretieren. Dann ist nur der links dargestellte Zusammenhang ein F -Zusammenhang. Da auf Hauptfaserb¨ undeln fast nur solche F –Zusammenh¨ange benutzt werden, l¨asst man oft das ,F ’ weg. Bezeichnen wir die Lie–Algebra der Lie–Gruppe F mit f, dann ist f¨ ur alle Vektoren f ∈ f d Xf : E → T E , Xf (e) = Ψ e, exp(tf ) dt t=0 ein vertikales Vektorfeld, das heißt Xf (e) ∈ Ve . Da bei einem Hauptfaserb¨ undel die Lie–Gruppe F frei und transitiv wirkt, sind die linearen Abbildungen f → Ve
,
f → Xf (e)
(e ∈ E)
sogar bijektiv. Die in Bemerkung F.14 eingef¨ uhrte, den Ehresmann–Zusammenhang H darstellende Abbildung ω : T E → V k¨onnen wir also als f–wertige ur die gilt: Eins–Form ω ∈ Ω1 (E, f) auffassen, f¨ ω(Xf ) = f
(f ∈ f).
(F.2.3)
530
F.2. Zusammenh¨ange auf Faserb¨ undeln
F.18 Satz Der durch ein ω ∈ Ω1 (E, f) mit (F.2.3) definierte Ehresmann–Zusammenhang ist genau dann ein F –Zusammenhang, wenn mit der adjungierten Darstellung ad von F in f gilt: adf Ψ∗f ω = ω
(f ∈ F )
(F.2.4)
Beweis: Siehe Kobayashi und Nomizu [KN], Kapitel II, Proposition 1.1. 2 F.19 Bemerkung Im f¨ ur unsere Anwendungen wichtigen Fall einer abelschen Lie–Gruppe F (zum Beispiel eines Torus) ist adf = Idf , also ω nach (F.2.4) einfach invariant unter der Gruppenwirkung. 3 Um lineare Zusammenh¨ange auf Vektorb¨ undeln (E, B, F, π) einzuf¨ uhren, benutzen wir die beiden folgenden glatten Abbildungen. - Die faserweise Skalarmultiplikation mit k ∈ K Mk : E → E
e → k e
,
(k ∈ K),
- die faserweise Vektoraddition auf der Whitney–Summe E ⊕ E: A:E⊕E →E
,
(e1 , e2 ) → e1 + e2 .
F.20 Definition Ein (Ehresmann–) Zusammenhang H auf einem differenzierbaren Vektorb¨ undel (E, B, F, π) heißt linear, wenn sich die horizontalen Unterr¨aume wie folgt transformieren: (e ∈ E, k ∈ K) 2. T(e1 ,e2 ) A (He1 , He2 ) = He1 +e2 (e1 , e2 ) ∈ E ⊕ E .
1. Te Mk (He ) = Hke
Ein linearer Zusammenhang ist in Abbildung F.2.2 (links) dargestellt, ein (translationsinvarianter) F –Zusammenhang rechts. Die meisten in Anwendungen vorkommenden Zusammenh¨ange auf Vektorb¨ undeln sind linear. F.21 Bemerkung (Existenz von Zusammenh¨ angen) F¨ ur ein differenzierbares Faserb¨ undel (E, B, F, π) existieren Zusammenh¨ange (und auch F –Zusammenh¨ange beziehungsweise lineare Zusammenh¨ange). Denn f¨ ur den Fall eines trivialen B¨ undels mit E = B × F und Projektion π2 : E → F
,
(b, f ) → f
auf die Standardfaser erf¨ ullt der triviale Zusammenhang H alle geforderten Eigenschaften. ¨ Sonst besitzt B eine der Uberdeckung (Ui )i∈I angepasste Zerlegung
der Eins (siehe Def. A.13), d.h. χi ∈ C(B, [0, 1]) mit supp(χi ) ⊂ Ui und i∈I χi = 1. F¨ ur einen beliebigen Punkt e ∈ E des Totalraums mit Projektion b := π(e) benutzen wir die linearisierte Projektion Te π : Te E → Tb B.
F. B¨ undel, Zusammenhang, Kr¨ ummung
531
E
E e
B
e
B
Abbildung F.2.2: Linearer (links) und nicht linearer (rechts) Zusammenhang auf einem Vektorb¨ undel π : E → B
ur alle Indices i ∈ I mit b ∈ Ui der triviale Zusammenhang Ist y ∈ Tb B, dann hat f¨ Hi die Eigenschaft, dass der Horizontalraum Hi,e ⊂ Te E genau einen bez¨ uglich ber y liegenden Punkt x ∈ H besitzt. Te π u ¨ i i,e Ebenso gilt f¨ ur die (endliche!)
Konvexkombination E x := i∈I χi (b)xi , dass Te π(x) = y. Eb Damit k¨onnen wir die gesamten Horizontalr¨aume Hi,e konvex kombinieren und erB halten den horizontalen Unx1,e terraum He ⊂ Te E, siehe xe e x nebenstehende Abbildung. 3 2,e Te E V e Im Abschnitt 8.4 wurden die (mit i, j, h = 1, . . . , d indizierten) Christoffel–Symbole Konvexkombination von Zusammenh¨angen Γhi,j (x) = 12 g h,k (x)
∂gi,k ∂gi,j ∂gk,j (x) + (x) − (x) ∂xi ∂xj ∂xk
x∈U
eingef¨ uhrt. In einer Karte mit Definitionsbereich U ⊆ M sind sie Koeffizienten der geod¨atischen Gleichung (8.4.3) auf der riemannschen Mannigfaltigkeit (M, g). Dies bedeutet, dass sie einen Zusammenhang auf dem Tangentialb¨ undel π : T M → M definieren, den Levi-Civita–Zusammenhang. Die geod¨atische Bewegung ergibt sich dann durch Parallelverschiebung des Geschwindigkeitsvektors. uhrten) KoordinaBezeichnet man mit ∂ϕ1 , . . . , ∂ϕd die (auf Seite 488 eingef¨ tenvektorfelder in einer Karte (U, ϕ) von M , dann haben Vektorfelder X ∈ X (M )
d die lokale Gestalt X = k=1 Xk ∂ϕk mit Koeffizientenfunktionen Xk : U → R. ¨ Die kovariante Ableitung, das heißt die Anderung des Vektorfelds Y in Richtung von X, nimmt dann (mit einsteinscher Summenkonvention) die folgende
532
F.3. Distributionen und der Satz von Frobenius
Form an:
∇X Y = Xi ∂ϕi Yk + Γki,j Xi Yj ∂ϕk .
F.22 Satz (Hauptsatz der riemannschen Geometrie) Der lokal so definierte Levi-Civita–Zusammenhang zeichnet sich durch die folgenden Eigenschaften aus: • Er ist vertr¨aglich mit der Metrik g, d.h. LX g(Y, Z) = g(∇X Y, Z) + g(Y, ∇X Z)
X, Y, Z ∈ X (M ) ; • Er ist torsionsfrei, das heißt ∇X Y − ∇Y X = [X, Y ] X, Y ∈ X (M ) .
F.3
Distributionen und der Satz von Frobenius
Um die Kr¨ ummung eines Zusammenhangs einzuf¨ uhren, schauen wir uns zun¨achst Eigenschaften von Unterb¨ undeln des Tangentialb¨ undels an. F.23 Definition • Eine (geometrische) Distribution in einer Mannigfaltigkeit M ist ein glattes Unterb¨ undel D ⊆ T M des Tangentialb¨ undels. rang(D) ist der Rang von D als Vektorb¨ undel, also die (konstante) Dimension der Fasern Dx ⊆ Tx M (x ∈ M ). • Eine rang(D)–dimensionale Untermannigfaltigkeit N ⊆ M heißt Integralmannigfaltigkeit von D, wenn gilt: Tx N = Dx (x ∈ N ). • Eine Distribution D ⊆ T M vom Rang k heißt integrabel, wenn jeder Punkt x ∈ M in einer Integralmannigfaltigkeit von D liegt. • Sie heißt involutiv, wenn der Kommutator [X, Y ] zweier zu D tangentialer Vektorfelder X, Y ∈ X (M ) ebenfalls zu D tangential ist. Einen k–dimensionalen Unterraum eines m–dimensionalen Vektorraums kann man als gemeinsame Nullstellenmenge von m − k linear unabh¨angigen Line¨ arformen beschreiben. Ahnlich kann jede Distribution vom Rang k lokal (also in geeigneten Umgebungen U ⊂ M der x ∈ M ) durch den Schnitt der Kerne unabh¨angiger Eins–Formen ω1 , . . . , ωm−k ∈ Ω1 (U ) beschrieben werden. F.24 Bemerkung (Existenz von Distributionen) • Auf einer Mannigfaltigkeit M braucht es gar keine Distribution vom Rang k zu geben. Ein Beispiel ist die Sph¨are M = S 2 und k = 1. Dies beweist man ¨ahnlich wie den Satz vom Igel (Beispiel A.44.2). • Auch wenn es auf M eine Distribution vom Rang k gibt, braucht sie nicht global als Schnitt der Kerne unabh¨angiger Eins–Formen darstellbar sein. Ein Beispiel ist M = S 2 und k = 0, also eine ziemlich triviale Distribution. Wie gerade bemerkt, gibt es keine Eins–Form auf S 2 , die nirgendwo verschwindet. 3
F. B¨ undel, Zusammenhang, Kr¨ ummung
533
f
f
b2
b1 b2
b1
Abbildung F.3.1: Integrable (links) und nicht integrable (rechts) Distribution auf dem B¨ undel π : R3 → R2
F.25 Satz (Frobenius) Es sei E ⊆ T M eine geometrische Distribution vom Rang k auf der m–dimensionalen Mannigfaltigkeit M . Dann sind die folgenden Bedingungen ¨aquivalent: 1. E ist integrabel; 2. E ist involutiv; ¨ 3. Es gibt eine Uberdeckung von M mit Umgebungen U ⊆ M , so dass f¨ ur eine lokale Darstellung E ∩ T U = {v ∈ T U | ω1 (v) = . . . = ωm−k (v) = 0} der Distribution durch ω1 , . . . , ωm−k ∈ Ω1 (U ) weitere Eins–Formen θi,j ∈ Ω1 (U ) existieren mit
m−k dωi = j=1 θi,j ∧ ωj (i = 1, . . . , m − k). 4. Mit den Bezeichnungen von 3. ist dωi ∧ω1 ∧. . .∧ωm−k = 0 (i = 1, . . . , m−k). Den Beweis findet man in Kapitel 4.1 des Buches [AF] von Agricola und Friedrich. 2 F.26 Beispiele (Integrabilit¨ at geometrischer Distributionen) 1. Distributionen D ⊆ T M vom Rang Eins sind integrabel. Dies folgt aus dem Hauptsatz der Differentialgleichungstheorie (Satz 3.45), denn wir k¨onnen in einer geeigneten Umgebung U ⊆ M jedes Punktes ein nicht verschwindendes glattes Tangentialvektorfeld X ∈ X (U ) finden, das tangential zur Distribution ist. Dessen Orbits sind Integralmannigfaltigkeiten von D. 2. Die Kontaktdistributionen aus Bemerkung 10.11 sind dagegen nicht integrabel. Denn eine Kontaktform ω ∈ Ω1 (M ) auf einer (2n + 1)–dimensionalen Mannigfaltigkeit M erzeugt nach Definition eine Volumenform ω ∧ (dω)∧n .
534
F.4. Holonomie und Kr¨ ummung
Dies widerspricht aber der Bedingung 3 im Satz von Frobenius (dω = θ ∧ ω), aus der wegen Antisymmetrie ω ∧ dω = 0 folgt. 3. Ein (Ehresmann–) Zusammenhang auf einem Faserb¨ undel (Definition F.13) ist eine spezielle Distribution. Deren Mangel an Integrabilit¨at f¨ uhrt zum Begriff der Kr¨ ummung, und damit zum Zentrum der Differentialgeometrie. 3
F.4
Holonomie und Kr¨ ummung
Wir nehmen einfachheitshalber an, dass im betrachteten B¨ undel (E, B, F, π) mit Zusammenhang H Kurven c ∈ C 1 (I, B) in der Basis B beliebig horizontal geliftet ur st¨ uckweise stetig differenzierbare werden k¨onnen1 (das Gleiche gilt dann auch f¨ Kurven). Es sei I das Intervall [0, 1] und c geschlossen (c(1) = c(0) = b). Bezeichnet die Kurve c˜e : I → E den horizontalen Lift von c mit Anfangspunkt c˜e (0) = e ∈ Eb , dann braucht c˜e (1) ∈ Eb nicht gleich e zu sein (siehe nebenstehende Abbildung). Immerhin wird die Faser Eb u ¨ber dem Anfangspunkt b von c durch die Abbildung
E
B
e
cˆ : Eb → Eb
, e → c˜e (1)
hom¨oomorph auf sich abgebildet.
b Holonomie eines Zusammenhangs
F.27 Definition F¨ ur b ∈ B heißt Hol(b) := cˆ : Eb → Eb | c ∈ C 1 (I, B), c(0) = c(1) = b die Holonomiegruppe von b. F.28 Bemerkungen 1. Tats¨achlich ist Hol(b) eine Gruppe, denn f¨ ur zwei solche Wege c1 , c2 : I → B k¨ onnen wir den zusammengesetzten Weg c1 ∗c2 : I → B mit , t ∈ 0, 12 c2 (2t) c1 ∗ c2 (t) := (F.4.1) c1 (2t − 1) , t ∈ 12 , 1 horizontal liften, was der Komposition von cˆ1 und cˆ2 entspricht.2 Ebenso ist die Existenz der Inversen von cˆ durch (ˆ c)−1 = (c−1 )∧ mit c−1 (t) := c(1 − t) sichergestellt. 1 Manchmal wird diese – f¨ ur kompakte F immer erf¨ ullte – Eigenschaft gleich zur Definition ´r ˘, Michor, und des Zusammenhangs hinzugef¨ ugt. Siehe zum Beispiel Kapitel 9.9 von Kola ´k [KMS]. Slova 2 c ∗ c ist zwar im Allgemeinen nur st¨ uckweise stetig differenzierbar. Wir k¨ onnen aber 1 2 durch Umparametrisierung erreichen, dass c2 (1) = c1 (0) = 0 ist. Diese Umparametrisierung andert weder cˆ1 noch cˆ2 . ¨
F. B¨ undel, Zusammenhang, Kr¨ ummung
535
2. Ist die Basismannigfaltigkeit B zusammenh¨angend, dann sind alle Gruppen Hol(b) (b ∈ B) zueinander isomorph, denn f¨ ur b0 , b1 ∈ B gibt es eine Kurve d ∈ C 1 (I, B) mit d(0) = b0 , d(1) = b1 . Besitzt c1 ∈ C 1 (I, B) Anfangs– und Endpunkt b1 , dann ist die (analog zu (F.4.1) definierte) Kurve c0 := d−1 ∗c1 ∗d eine bei b0 basierte Schleife. Die Abbildung Hol(b1 ) → Hol(b0 ), cˆ1 → cˆ0 ist dann ein Gruppenisomorphismus. 3 F.29 Beispiel (Dreiachsenstabilisierung) Ohne Verwendung von Steuerd¨ usen k¨onnen Raumflugk¨ orper ihren Drehimpuls nicht ver¨andern. Dieser ist im Normalfall sehr klein, so dass die Lage im Raum n¨aherungsweise konstant bleibt. Um diese Lage zu ver¨andern, werden Reaktionsr¨ader eingesetzt, bei der sogenannten Dreiachsenstabilisation mit drei aufeinander orthogonalen Achsen (siehe auch den Kasten auf Seite 356). Beschreibt der Winkel θ ∈ B := S 1 die aktuelle Lage eines solchen Rades relativ zum Satelliten, dann bilden die Lagen von Satellit und Rad im Raum einen undels Punkt (ϕS , ϕR ) ∈ E := T2 des Torus. Wir fassen E als Totalraum des B¨ π : E → B auf, mit Projektion θ = π(ϕS , ϕR ) := ϕR − ϕS . Sind die Tr¨agheitsmomente von Satellit beziehungsweise Rad um die Radachse IS , IR > 0 (siehe Seite 295), dann ist der Gesamtdrehimpuls um diese Achse gleich IS ϕ˙ S + IR ϕ˙ R . Drehimpulserhaltung bedeutet also geometrisch den durch die Eins–Form IS dϕS + IR dϕR = (IS + IR ) dϕS + IR dθ definierten, auf Seite 534 abgebildeten Zusammenhang auf E. Die Holonomie f¨ ur die Drehung des Rades um Δθ = 2π betr¨agt also, gemes3 sen in der Lage¨anderung des Satelliten, ΔϕS = −2πIR /(IS + IR ). Wie dieses Beispiel zeigt, kann ein integrabler Zusammenhang eine nichttriviale Holonomiegruppe besitzen, wenn die Basis-Mannigfaltigkeit nicht einfach zusammenh¨angend ist. Es gibt aber auch die M¨ oglichkeit, dass die Holonomiegruppe nichttrivib2 al ist, weil der Zusammenhang nicht integrabel ist (siehe Abbildung). Die Kr¨ ummung des Zusammenhangs ist dann ein quantitatives Maß f¨ ur dessen Mangel an Integrabilit¨at. f Das Bild suggeriert, dass die Holonomie im Limes kleiner Kurvenl¨ange proportional zu der Fl¨ache ist, die von der auf die Basis projizierten Kurve eingeschlossen wird. Die folgende Definition pr¨azisiert diese Beobachtung und beb1 zeichnet den Proportionalit¨atsfaktor als Kr¨ ummung. =
F.30 Definition (Kr¨ ummung eines Zusammenhangs) Die Kr¨ ummung des Ehresmann–Zusammenhangs H ist (bez¨ uglich der Zerlegung (F.2.1) eines Vek-
536
F.4. Holonomie und Kr¨ ummung
torfeldes) die Zwei–Form K ∈ Ω2 (E, T E)
, K(X, Y ) = ver hor(X), hor(Y )
X, Y ∈ X (E) .
F.31 Bemerkungen (Kr¨ ummung als vektorwertige Zwei–Form) 1. Der so definierte Tangentialvektor K(X, Y )(e) ∈ Te E h¨angt f¨ ur einen Punkt e ∈ E nur von X(e) und Y (e) ab, K ist also tats¨achlich eine vektorwertige Zwei–Form. Das liegt daran, dass ganz allgemein auf einer Mannigfaltigkeit E Lie–Klammern von Vektorfeldern U, V ∈ X (E) bei Multiplikation mit einer Funktion f ∈ C ∞ (E, R) die Relation [U, f V ] = f [U, V ] + df (U ) V
(F.4.2)
erf¨ ullen. Das ergibt sich direkt aus Definition 10.20. Der erste Summand in (F.4.2) enth¨alt gar keine Ableitung von f . Der zweite h¨angt zwar von df ab. Ist aber V horizontal, dann auch sein Produkt mit der Funktion df (U ). Der zweite Term verschwindet also in der Projektion auf den vertikalen Teilraum. Analoges gilt f¨ ur die Multiplikation von U mit einer Funktion. 2. Die Kr¨ ummung eines F –Zusammenhangs auf einem Prinzipalb¨ undel mit abelscher Lie–Gruppe ist invariant unter Fasertranslationen (siehe Bemerkung F.19). Sie kann damit auch als eine vektorwertige Zwei–Form auf der Basismannigfaltigkeit aufgefasst werden. Das ist beispielsweise in der Elektrodynamik der Fall. Bei dieser bildet die Raumzeit R4 die Basis, und die Faser ist die abelsche Gruppe U(1). Die Kr¨ ummung setzt sich aus elektrischer und magnetischer Feldst¨arke zusammen (siehe Beispiel B.21 und Thirring [Th2]). 3
Anhang G
Morse–Theorie Morse–Theorie stellt eine Beziehung her zwischen der Topologie einer n–dimensionalen Mannigfaltigkeit M und den kritischen Punkten einer Funktion f ∈ C 2 (M, R). G.1 Definition • Ein kritischer Punkt x ∈ M von f ∈ C 2 (M, R) heißt nicht degeneriert, wenn in einer beliebigen Karte bei x die Hesse–Matrix D2 f (x) ∈ Mat(n, R) regul¨ar ist. • Der Index Ind(x) des kritischen Punktes x ∈ M von f ist als der Index 1 von D2 f (x) definiert. • f ∈ C 2 (M, R) heißt Morse–Funktion, wenn alle kritischen Punkte von f nicht degeneriert sind. Die Menge Crit(f ) ⊆ M der kritischen Punkte von f ist abgeschlossen. Ist f eine Morse–Funktion, dann ist diese kritische Menge diskret. Wir betrachten zun¨achst nur kompakte Mannigfaltigkeiten M . Auf diesen hat dann eine Morse– Funktion nur endlich viele kritische Punkte. Da die Teilmenge der nicht degenerierten symmetrischen Matrizen offen und dicht im Vektorraum Sym(n, R) ist, ist die Eigenschaft, Morse–Funktion zu sein, generisch (siehe Bemerkung 2.44.2, und Satz 1.2 in Kapitel 6 von [Hirs]). Ist beispielsweise M ⊂ Rn eine Untermannigfaltigkeit, dann ist f¨ ur Lebesgue– fast alle a ∈ Rn die Restriktion der Linearform fa : Rn → R, x → x, a auf M eine Morse–Funktion (siehe Proposition 17.18 in Bott und Tu [BT]).
G.1
Morse–Ungleichungen
Die Morse–Ungleichungen f¨ ur eine Morse–Funktion f : M → R stellen eine Beziehung her zwischen der in den Betti–Zahlen betti (M ) (siehe Definition 1 Der Index einer n × n–Matrix wurde in Definition 5.2 als Summe der algebraischen Vielfachheiten der Eigenwerte λ mit Re(λ) < 0 eingef¨ uhrt.
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 24,
537
538
G.1. Morse–Ungleichungen
B.8.2) codierten Topologie von M und den Kardinalit¨aten crit (f ) := |Crit (f )| der Mengen Crit (f ) kritischer Punkte mit Index . In ihrer einfachsten Form besagen sie f¨ ur eine kompakte Mannigfaltigkeit M n crit (f ) ≥ betti (M )
( = 0, . . . , n).
(G.1.1)
Eine Morse–Funktion f : M → R, f¨ ur die Gleichheit gilt, heißt perfekt.2 Es ist allerdings wichtig, dass wir zwar (f¨ ur Dimensionen n ≥ 1) die linke Seite der Ungleichungen durch Ver¨anderung von f beliebig groß machen k¨onnen, aber trotzdem nicht in beliebiger Weise. Insbesondere gilt immer die Gleichung
n =0
(−1) crit (f ) =
n =0
(−1) betti (M ) =: χ(M ),
(G.1.2)
wobei wir die alternierende Summe der Betti–Zahlen als Definition der Euler– Charakteristik χ(M ) der Mannigfaltigkeit gew¨ahlt haben. G.2 Beispiel (Sph¨ aren) M = S n . Die H¨ ohenfunktion f (x) := xn+1 von S n bez¨ uglich der u ¨blichen Einbettung in den Rn+1 hat ein Minimum und ein Maximum und keine weiteren kritischen Punkte. Es ist also crit0 (f ) = critn (f ) = 1, crit1 (f ) = . . . = critn−1 (f ) = 0 und damit χ(S n ) = 1 + (−1)n
(n ∈ N0 ).
Wenn wir die runde Sph¨are eindellen, erscheint f¨ ur die H¨ohenfunktion eine weitere Maximalstelle, aber eben unweigerlich noch mindestens ein weiterer kritischer Punkt.
Die rechte Abbildung zeigt f¨ ur n = 2 den Fall crit0 (f ) = critn−1 (f ) = 1, critn (f ) = 2 (und crit1 (f ) = . . . = critn−2 (f ) = 0). Die alternierende Summe 3 ¨andert sich dann nicht. 2 Eine solche Funktion braucht f¨ ur M nicht zu existieren. Ein Beispiel ist die (im Zusammenhang der Poincar´ e–Vermutung wichtige) sogenannte Poincar´e–Sph¨ are, siehe Remark 5.15 im Buch [Ni] von Nicolaescu.
G. Morse–Theorie
539
G.3 Bemerkungen 1. Die Morse–Ungleichungen werden verwendet, um von kritischen Punkten geeigneter Morse–Funktionen auf die Topologie der Mannigfaltigkeit zu schließen. Beispielsweise kann man durch die Euler–Charakteristik sowohl die orientierbaren als auch die nicht orientierbaren kompakten Fl¨achen topologisch klassifizieren. Mindestens ebenso wichtig ist es, umgekehrt zu zeigen, dass Morse–Funktionen viele kritische Punkte besitzen m¨ ussen. Ein Beispiel ist die Frage nach der Minimalzahl periodischer Orbits f¨ ur hamiltonsche Systeme, siehe die Arnol’d– Vermutung (Seite 448). 2. Es ist aber nicht zwingend notwendig, dass die Mannigfaltigkeit M endliche Dimension besitzt. Beispielsweise ist f¨ ur das Intervall I der Raum H 1 (I, N ) 1 3 der H –Kurven c : I → N auf einer riemannschen Mannigfaltigkeit (N, g) nicht kompakt. Sie besitzt aber immerhin die Struktur einer unendlich-dimensionalen Mannigfaltigkeit (siehe [Kli2], Kapitel 2.3), mit riemannscher Metrik. F¨ ur glatte Vektorfelder v, w entlang c (also v(t), w(t) ∈ Tc(t) N ) setzt man % & gc(t) v(t), w(t) + gc(t) ∇v(t), ∇w(t) dt. v, w := (G.1.3) I 1
Damit wird H (I, N ) zu einer sogenannten Hilbert–Mannigfaltigkeit. Das Energiefunktional 1 1 ˙ c(t) ˙ dt (G.1.4) E : H (I, N ) → [0, ∞) , c → 2 gc(t) c(t), I
ist glatt. Seine kritischen Punkte sind die konstanten Kurven, denn die Ableitung DE(c)(v) = gc(t) c(t), ˙ ∇v(t) dt v ∈ Tc H 1 (I, M ) (G.1.5) I
in Richtung v := c˙ ist sonst positiv. Die kritische Menge ist also hom¨oomorph zu N . 3 Es gibt verschiedenartige Beweise der Morse–Ungleichungen (siehe auch Bemerkung 17.15.4). G.4 Bemerkung (Wittens Beweis der Morse–Ungleichungen) Der Physiker Edward Witten ver¨ offentlichte 1982 in [Wit] einen Beweis der Morse–Ungleichungen f¨ ur geschlossene orientierbare Mannigfaltigkeiten, der auf einer Deformation des sogenannten Laplace–Beltrami–Operators auf dem in (B.4.1) eingef¨ uhrten Vektorraum Ω∗ (M ) mithilfe der Morse–Funktion beruht, siehe auch [CFKS], Kapitel 11. Dieser Beweis ist Ausgangspunkt interessanter Entwicklungen in der Mathematik und der Quantenfeldtheorie. 3 3 Also
solche mit quadratintegrabler erster Ableitung.
540
G.1. Morse–Ungleichungen
Wir stellen kurz die Hauptschritte des klassischen Beweises zusammen. Die Mannigfaltigkeit M wird dabei durch Vergr¨ oßerung des Parameters b aus den Subniveaumengen (b ∈ R) Mb := f −1 (−∞, b] der Morse–Funktion aufgebaut.
Subniveaumengen T2b einer perfekten Morse–Funktion f : T2 → R des Torus. Man unterscheidet dabei Parameterintervalle danach, ob sie einen kritischen Wert enthalten oder nicht. ur f ∈ C r+1 (M, R), r ≥ 1 keinen G.5 Lemma Enth¨alt Ma,b := f −1 [a, b] f¨ kritischen Punkt, dann ist die berandete Mannigfaltigkeit Ma,b diffeomorph zu f −1 (a) × [a, b] (mit einem C r –Diffeomorphismus, der die Niveaumengen f −1 (c) auf f −1 (a) × {c} abbildet). Beweis: Man benutzt auf Ma,b den Fluss des normierten Gradientenvektorfeldes ∇f uglich einer beliebigen riemannschen Metrik. Dieser f¨ uhrt wegen X := ∇f 2 bez¨ df (X) = 1 Niveaumengen in Niveaumengen u ¨ber. Die Details findet man in Kapitel 6.1, Satz 2.2. von Hirsch [Hirs]. 2 G.6 Lemma (Morse–Lemma) Es sei m ∈ M n ein nicht degenerierter kritischer Punkt von f ∈ C r+1 (M, R), r ≥ 1 mit Index k. Dann gibt es eine C r –Karte (U, ϕ) bei m mit f ◦ ϕ−1 (x) = f (m) −
k i=1
x2i +
n i=k+1
x2i
x ∈ ϕ(U ) .
Beweis: In Hirsch [Hirs], Satz 1.1 von Kapitel 6.1 (Differenzierbarkeitsstufe in Exercise 1). 2 Enth¨alt Ma,b genau einen kritischen Punkt m, dann entsteht topologisch 4 Mb = Ma ∪ Ma,b aus Ma durch Ankleben der stabilen Mannigfaltigkeit von m (siehe Abbildung G.1.1, und §3 von Milnor [Mi]). Diese ist nach dem Morse–Lemma Ind(m)–dimensional. Mit den im n¨achsten Abschnitt aufbereiteten Techniken der singul¨aren Homologie wird die dabei stattfindende Topologie¨anderung der Subniveaumenge kontrolliert. 4 als sog. Deformationsretrakt von M . F¨ ur einen topologischen Teilraum A ⊆ B heißt eine b Homotopie g : B × [0, 1] → B Deformationsretraktion und A Deformationsretrakt von B, wenn aquivalent. g(B, 1) = A und g(·, 1)A = IdA ist. Damit sind A und B insbesondere homotopie¨
x1
x2
x2
541
x2
G. Morse–Theorie
x1
x1
Abbildung G.1.1: Subniveaumengen Mc−ε (links) und Mc+ε (rechts) einer Morse–Funktion f : M → R in der N¨ahe eines kritischen Punktes m mit c := f (m) und Ind(m) = 1. Die mittlere Abbildung zeigt die Vereinigung von Mc−ε und der stabilen Mannigfaltigkeit von m. Die Karte entspricht der im Morse–Lemma.
G.2
Singul¨ are Homologie
Die Morse–Ungleichungen enthalten die in (B.8.2) mithilfe der de-Rham–Kohomologie definierten Betti–Zahlen. Es erscheint daher nat¨ urlich, diese Ungleichungen auch mit dem Kalk¨ ul der Differentialformen zu beweisen. Statt der de-Rham–Kohomologie wird f¨ ur diesen Beweis aber u ¨blicherweise die sogenannte singul¨are Homologie verwandt. Ein Grund daf¨ ur ist die Tatsache, dass diese f¨ ur beliebige topologische R¨aume, nicht nur f¨ ur endlich-dimensionale Mannigfaltigkeiten definierbar ist. Damit kann die Morse–Theorie auch auf so wichtige Fragen wie die nach geschlossenen Geod¨aten angewandt werden (siehe Bemerkung G.3.2). Singul¨are Homologie ist eine Homologietheorie, die einem topologischen Raum X abelsche Gruppen Hk (X), k ∈ N0 zuordnet, die diesen teilweise charakterisieren. Das Buch [Cr] von Croom ist eine elementare Einf¨ uhrung. Bausteine sind die Simplices: Sind a0 , . . . , ak ∈ Rn geometrisch unabh¨angig in dem Sinn, dass sie in keinem (k − 1)–dimensionalen affinen Unterraum liegen, so heißt die konvexe H¨ ulle
k k n σk := [a0 , . . . , ak ] := i=0 ti ai ti ≥ 0, i=0 ti = 1 ⊂ R dieser Punkte Standard–k–Simplex; die i–te Seite (i)
σk−1 := [a0 , . . . , a ˆi , . . . , ak ]
(i = 0, . . . , k)
von σk ist Konvexkombination der Eckpunkte von σk außer ai . G.7 Definition • Ein singul¨ arer k–Simplex des topologischen Raumes X ist ein Paar (σk , f ) mit einer stetigen Abbildung f : σk → X.
542
G.2. Singul¨are Homologie
• Es sei G eine abelsche Gruppe. Eine singul¨ are k–Kette ist eine endliche
formale Linearkombination i gi (σk,i , fi ) singul¨arer k–Simplices, mit gi ∈ G. Die Menge Ck (X; G) (oder kurz: Ck (X)) dieser singul¨aren Ketten ist damit wieder eine abelsche Gruppe. • Der Rand eines singul¨aren k–Simplex (σk , f ) ist die formale Linearkombination
k (q) q (−1) , f ∂(σk , f ) := σ ∈ Ck−1 (X; G), (q) q=0 k−1 σ
k−1
der Rand einer singul¨aren k–Kette ck := i gi (σk,i , fi ) ist gi ∂(σk,i , fi ). ∂ck := i
G.8 Satz ∂ : Ck (X) → Ck−1 (X) (k ∈ N) ist ein Gruppenhomomorphismus, und ∂∂ = 0. Diese einfach nachzurechnende Formel ist mit der Eigenschaft dd = 0 der ¨außeren Ableitung vergleichbar. Wie diese in (B.8.1) zur Definition der de-Rham– Kohomologie benutzt wurde, f¨ uhrt Satz G.8 zur Definition der singul¨aren Homologie: G.9 Definition (und Satz) • Eine Kette ck ∈ Ck (X; G) heißt Zykel (ck ∈ Zk (X; G)), wenn ∂ck = 0, ur ein ck+1 ∈ Bk+1 (X; G). Rand (ck ∈ Bk (X; G)), wenn ck = ∂ck+1 f¨ Damit ist Zk (X) eine Untergruppe von Ck (X) und Bk (X) eine Untergruppe von Zk (X). • Zwei Zykeln ck , ck ∈ Zk (X) heißen ¨ aquivalent, wenn ck − ck Rand ist. ¨ Das ist eine Aquivalenzrelation. ¨ • Die Menge Hk (X; G) der Aquivalenzklassen heißt k–te singul¨ are Homologiegruppe. Sie ist damit die Faktorgruppe Hk (X) = Zk (X)/Bk (X). F¨ ur die Morse–Theorie wird als additive Gruppe G oft der K¨orper R der reellen Zahlen verwandt. Ck (X) und analog Zk (X), Bk (X) und Hk (X) werden damit zu R–Vektorr¨aumen. W¨ahrend erstere aber typischerweise unendlich-dimensional sind, ist etwa f¨ ur kompakte Mannigfaltigkeiten X die Homologiegruppe Hk (X) endlich–dimensional. Nach dem universellen Koeffiziententheorem (Satz 15.14 in [BT]) und dem Satz von de Rham (etwa: Satz 8.9 in [BT]) gilt dann sogar: dim(Hk (X)) = bettik (X) mit den Betti–Zahlen bettik (X). Eine stetige Abbildung topologischer R¨aume ϕ : X → Y induziert den Homomorphismus
(k ∈ N0 ) ϕ∗ : Ck (X; G) → Ck (Y ; G) , ϕ∗ (ck ) = i gi (σk,i , ϕ ◦ fi )
der Ketten, f¨ ur ck := i gi (σk,i , fi ). ϕ∗ induziert wiederum einen Homomorphismus (k ∈ N0 ). (G.2.1) ϕ∗ : Hk (X; G) → Hk (Y ; G)
G. Morse–Theorie
543
Dieser h¨angt nur von der Homotopieklasse von f ab. Insbesondere besitzen homotopie¨aquivalente R¨aume isomorphe (singul¨are) Homologiegruppen. G.10 Beispiel Die gelochte Ebene und sind die Kreislinie nach Beispiel A.24.1 homotopie¨aquivalent. Daher gilt Hk C\{0}; G = Hk S 1 ; G . 3 F¨ ur den Beweis der Morse–Ungleichungen ben¨ otigen wir auch die relativen Homologien. Ist Y ein Teilraum des topologischen Raumes X, dann ist die Gruppe Ck (Y ; G) Untergruppe von Ck (X; G). Die Faktorgruppe wird mit Ck (X, Y ) := Ck (X)/Ck (Y ) bezeichnet. ∂ bildet Ck (Y ) in Ck−1 (Y ) ab, und definiert damit einen Randoperator ∂ : Ck (X, Y ) → Ck−1 (X, Y ). Es sei die Gruppe der relativen Zykeln Zk (X, Y ) := {ck ∈ Ck (X, Y ) | ∂ck = 0} und die Gruppe der relativen R¨ander Bk (X, Y ) := ck ∈ Ck (X, Y ) | ∃ ck+1 ∈ Ck+1 (X, Y ) : ck = ∂ck+1 . Die k–te relative Homologiegruppe ist die Faktorgruppe Hk (X, Y ) := Zk (X, Y )/Bk (X, Y ). • Da jeder Zykel aus Hk (X) als einer in Hk (X, Y ) betrachtet werden kann, erhalten wir einen Homomorphismus j : Hk (X) → Hk (X, Y )
, [zk ] → [zk + Ck (Y )].
• Andererseits induziert die Inklusion i : Y → X mit (G.2.1) einen Homomorphismus i∗ : Hk (Y ) → Hk (X). • Zu guter Letzt stellen wir fest, dass f¨ ur [zk + Ck (Y )] ∈ Hk (X, Y ), n ≥ 1, zk + Ck (Y ) ein relativer k–Zykel ist, ∂zk also in Ck−1 (Y ) liegt. Da ∂∂zk = 0 (Satz G.8), ist ∂zk ein (k − 1)–Zykel; ∂zk ∈ Zk−1 (Y ) definiert also ein Element [∂zk ] ∈ Hk−1 (Y ). Die entsprechende Abbildung ist ∂∗ : Hk (X, Y ) → Hk−1 (Y )
, [zk + Ck (Y )] → [∂zk ].
G.11 Satz Die Sequenz ∂
i
j
∂
i
∗ ∗ . . . →∗ Hk (Y ) → Hk (X) → Hk (X, Y ) →∗ Hk−1 (Y ) → . . . H0 (X, Y ) → 0
ist exakt, also ker(i∗ ) = Im(∂∗ ) , ker(j) = Im(i∗ ) und ker(∂∗ ) = Im(j).
544
G.2. Singul¨are Homologie
Beweis: Siehe Band 3, §5 von Dubrovin, Fomenko und Novikov [DFN]. 2 Wir kehren zum Beweis der Morse–Ungleichungen zur¨ uck. F¨ ur diesen ist es n¨ utzlich, das Poincar´e–Polynom der Mannigfaltigkeit M n
n PM (t) := =0 betti (M ) t mit dem Poincar´e–Polynom der Morse–Funktion f : M → R
n QM (f, t) := =0 crit (f ) t zu vergleichen. Durch gen¨ ugend kleine Ver¨anderung von f auf disjunkten Umgebungen der kritischen Punkte erreichen wir, dass die Werte ck := f (xk ) der kritischen Punkte x1 , . . . , xN von f voneinander verschieden sind, ohne dabei ihren Index zu ¨andern. Wir nummerieren die ck aufsteigend, und definieren f¨ ur Y ⊆ X die relativen Betti–Zahlen betti (X, Y ) := dim H (X, Y )
( ∈ N0 ).
Wir w¨ahlen regul¨are Werte ai ∈ (ci , ci+1 ), mit a0 < c1 und aN > cN . G.12 Lemma Das Poincar´e–Polynom ist QM (f, t) =
n N
betti Mak , Mak−1 t .
k=1 =0
Beweis: • Aus der sogenannten Exzisionseigenschaft der relativen Homologie folgt H (X, Y ) = H (X/Y, ∗), wobei ∗ eine einpunktige Menge symbolisiert und X/Y der Raum mit Quotiententopologie ist, bei dem Y zu einem Punkt zusammengeschlagen wird. • In unserem Fall ist f¨ ur den kritischen Punkt xk mit Index m die Mannigfaltigkeit Mak /Mak−1 homotopie¨aquivalent zu Dm /∂Dm ∼ = S m , siehe das auf das Morse–Lemma G.6 folgende Argument. Daher sind die Betti–Zahlen betti Mak , Mak−1 = betti (S m , ∗) = δ(, m). 2 fi
fi+1
fi+k−1
fi+k
Aus der Exaktheit einer Sequenz . . . Hi → Hi+1 −→ . . . −→ Hi+k −→ ... endlich-dimensionaler Vektorr¨aume, also dim ker(f+1 ) = dim im(f ) , folgt mit dem Dimensionssatz dim(H ) = dim(ker(f )) + dim(im(f )) der Linearen Algebra f¨ ur die alternierende Summe:
i+k −i dim(H ) = dim ker(fi ) + (−1)k dim im(fi+k ) . =i (−1) Satz G.11 impliziert daher ∞ =0
(−1) betti (Y ) − betti (X) + betti (X, Y ) = 0.
(G.2.2)
G. Morse–Theorie
545
Beweis der Morse–Ungleichungen: • Die Formel (G.1.2) f¨ ur die Euler–Charakteristik folgt wegen M = MaN durch Summation u ¨ber k aus (G.2.2), mit Y := Mak und X := Mak−1 . • In ¨ahnlicher Weise wie (G.1.2) beweist man die starken Morse–Ungleichungen
m
m −m crit (f ) ≥ =0 (−1)−m betti (M ) (m = 1, . . . , n − 1). =0 (−1) (G.2.3) Daraus folgen die schwachen Morse–Ungleichungen (G.1.1) durch Addition von (G.2.3) f¨ ur Paare benachbarter Werte von m. 2
G.3
Geod¨ atische Bewegung und Morse–Theorie
¨ In diesem Abschnitt wird ein Uberblick u ¨ber Anwendungen und Erweiterungen der Morse–Theorie gegeben, insbesondere f¨ ur die Analyse der Geod¨aten einer vollst¨andigen riemannschen Mannigfaltigkeit (M, g). Eine Geod¨ate auf (M, g) ist eine Kurve c ∈ C 2 (I, M ), f¨ ur die der Paralleltransport entlang c den Geschwindigkeitsvektor c invariant l¨asst, die also in lokalen Koordinaten die Geod¨atengleichung (8.4) erf¨ ullt. F¨ ur das Intervall I = [0, 1] ist sie damit Extremal des Energiefunktionals (G.1.4) und des L¨angenfunktionals 1 gc(t) c(t), L : H (I, M ) → [0, ∞) , L(c) := ˙ c(t) ˙ dt, (G.3.1) I
im Vergleich mit Kurven, deren Anfangs- und Endpunkt gleich c(0) bzw. c(1) sind. Eine analoge Aussage gilt f¨ ur beliebige Punktepaare. Ist M eine Untermannigfaltigkeit des Rk und die riemannsche Metrik g auf M die Restriktion der euklidischen Metrik des Rk , dann zeichnen sich die Geod¨aten auf M dadurch aus, dass ihre Beschleunigung c (t) ∈ Tc(t) Rk senkrecht auf dem Tangentialraum Tc(t) M ist. Die geod¨atische Bewegung, aufgefasst als Fluss auf dem Tangentialb¨ undel T M , ist hamiltonsch, mit der Hamilton–Funktion H : TM → R
,
ur v ∈ Tm M. v → 12 gm (v, v) f¨
(G.3.2)
Dabei ist die das hamiltonsche Vektorfeld XH definierende symplektische Form die mittels der B¨ undelabbildung T M → T ∗ M, v → g(v, ·) vom Kotangen∗ tialb¨ undel T M auf T M zur¨ uckgezogene kanonische symplektische Form ω0 (siehe Seite 205). Das L¨angenfunktional L erm¨ oglicht es, eine (zusammenh¨angende) riemannsche Mannigfaltigkeit (M, g) als metrischen Raum mit Metrik d : M × M → [0, ∞), (G.3.3) d(q0 , q1 ) := inf L(c) | c ∈ H 1 (I, M ), c(0) = q0 , c(1) = q1 aufzufassen. Nach der Cauchy-Schwarz–Ungleichung gilt f¨ ur die Zeitintervalle [t0 , t1 ] ⊆ I: d c(t0 ), c(t1 ) ≤ 2 E(c) (t1 − t0 ).
546
G.3. Geod¨atische Bewegung und Morse–Theorie
G.13 Definition • Die riemannsche Mannigfaltigkeit (M, g) heißt geod¨ atisch vollst¨ andig, wenn es f¨ ur jeden Tangentialvektor v ∈ Tm M eine Geod¨ate c : R → M mit c(0) = m und c (0) = v gibt. • Auf einer geod¨atisch vollst¨andigen Mannigfaltigkeit heißt mit diesen Bezeichnungen die Abbildung exp : T M → M
,
v → c(1)
Exponentialabbildung. Ihre Restriktion auf Tm M wird mit expm : Tm M → M bezeichnet. Diese Exponentialabbildung der Differentialgeometrie sollte nicht mit der gleichnamigen Abbildung (E.3.1) aus der Theorie der Lie–Gruppen verwechselt werden 5 . G.14 Beispiele 1. Kompakte Mannigfaltigkeiten sind bez¨ uglich jeder riemannschen Metrik geod¨atisch vollst¨andig. Denn die flussinvarianten Niveaufl¨achen der Hamilton–Funktion (G.3.2) sind dann ebenfalls kompakt. Damit folgt die Behauptung aus Satz 3.27. 2. Ein einfaches Beispiel f¨ ur eine Exponentialabbildung ist die der runden Sph¨are S 2 ⊂ R3 . Vom Tangentialraum Tn S 2 ∼ = R2 des Nordpols n aus gesehen wird durch die Inverse der Tangentialabbildung expn : Tn S 2 → S 2 die (Erd-) Kugel azimutal auf die Ebene abgebildet. Die Geod¨aten sind in diesem Fall Großkreise. Der Nordpol erscheint als Nullpunkt und in Form konzentrischer Kreise der Radien 2πn, n ∈ N. In nebenstehender Abbildung sieht man die Antarktis mit dem S¨ udpol als Kreis mit Radius π. 3
Inverse Exponentialabbildung der Erde am Nordpol, also ¨aquidistante Azimutalprojektion, nach wikipedia.
G.15 Satz (Hopf und Rinow) F¨ ur eine zusammenh¨angende riemannsche Mannigfaltigkeit (M, g) sind die folgenden Aussagen ¨aquivalent: 1. (M, g) ist geod¨atisch vollst¨andig. 5 Bei einer unter der Links- und der Rechtswirkung (E.1.3) invarianten Metrik auf einer Lie– Gruppe G fallen die beiden Begriffe aber zusammen, wenn man die Lie–Algebra g in exp : g → G als Tangentialraum Te G von G beim neutralen Element e ∈ G auffasst. Beispiele sind abelsche Lie–Gruppen wie Rn und der Torus Tn .
G. Morse–Theorie
547
2. (M, d) (mit der Metrik d aus (G.3.3)) ist ein vollst¨andiger metrischer Raum; 3. die abgeschlossenen und bez¨ uglich d beschr¨ankten Teilmengen von M sind kompakt; Unter dieser Voraussetzung existiert f¨ ur je zwei Punkte q0 und q1 von M eine Geod¨ate c : [0, 1] → M mit c(i) = qi und minimaler L¨ange L(c) = d(q0 , q1 ). Um die Geod¨aten mithilfe von Morse–Theorie zu untersuchen, muss man ihren Index bez¨ uglich des Energiefunktionals verstehen. Dieser h¨angt mit ihren konjugierten Punkten zusammen. G.16 Definition • Es sei c : [0, T ] → M ein Geod¨atensegment auf der riemannschen Mannigfaltigkeit (M, g). Dann heißt q := c(t) konjugierter Punkt von p := c(0) (entlang c), wenn die lineare Abbildung Tc (0)t expp : Tc (0)t Tp M −→ Tq M einen nichttrivialen Kern besitzt. • Die Dimension dieses Kerns heißt Multiplizit¨ at Multc (t) des konjugierten Punktes. G.17 Bemerkung (konjugierte Punkte) Man betrachtet also die Linearisierung der Exponentialabbildung und schaut damit, ob eine Variation der Anfangsgeschwindigkeit der bei p startenden Geod¨ate uns trotzdem in der Zeit t zu uhrt. Die zu p konjugierten Punkte c(t) entlang der Geod¨ate q = expp (c (0)t) f¨ c besitzen damit Zeitparameter t, die sich nicht h¨aufen. Ist q konjugierter Punkt von p entlang c, dann ist auch p konjugierter Punkt von q (entlang der umgekehrt durchlaufenen Geod¨ate). In Beispiel G.14.2 sind genau die Antipodenpaare (p, q) = (p, −p) und die Paare (p, p) der Sph¨are zueinander konjugiert, entlang jedes sie treffenden Großkreissegmentes. 3 Die in Bemerkung G.3.2 eingef¨ uhrte Hilbert–Mannigfaltigkeit H 1 (I, M ) besitzt nur die konstanten Kurven als kritische Punkte des Energiefunktionals E. Man kann aber u ¨ber die Endpunktabbildung π : H 1 (I, M ) → M × M , c → c(0), c(1) Untermannigfaltigkeiten von H 1 (I, M ) definieren und E darauf restringieren. Besonders wichtig sind die R¨aume Ωp,q M := π −1 (p, q) (p, q ∈ M ) der bei p beginnenden und bei q endenden Kurven, und ΛM := π −1 Δ , mit der Diagonale Δ := {(q, q) | q ∈ M }.
548
G.3. Geod¨atische Bewegung und Morse–Theorie
G.18 Satz (Index–Satz von Morse) Der Index des Energiefunktionals E : Ωp,q M −→ [0, ∞)
bei einer Geod¨ate c von p nach q ist 6 t∈(0,1) Multc (t). Beweis: In Klingenberg [Kli2], Theorem 2.5.9.
2
Der Raum ΛM kann sinnvollerweise als Raum von H 1 –Schleifen c : S 1 → M aufgefasst werden. Das (wieder mit E bezeichnete) auf ΛM restringierte Energiefunktional ist dann invariant unter den Drehungen t → t + s auf S 1 = R/Z. Es ist also immer degeneriert und damit keine Morse–Funktion 7 . Die kritischen Punkte von E : ΛM → [0, ∞) besitzen aber endlichen Index, und sie sind geschlossene Geod¨aten. Letzteres schließt man durch partielle Integration aus der Formel (G.1.5) f¨ ur ihre Ableitung DE, ¨ahnlich wie beim hamiltonschen Variationsprinzip in Satz 8.16. uglich der G.19 Satz Falls (M, g) vollst¨andig ist, sind auch Ωp,q M und ΛM bez¨ von (G.1.3) abgeleiteten Metrik auf H 1 (I, M ) vollst¨andige metrische R¨aume. Beweis: Siehe Theorem 2.4.7 in Klingenberg [Kli2]. Dort wird angenommen, dass M kompakt ist. Die leichte Verallgemeinerung auf vollst¨andige (M, g) findet 2 man zum Beispiel in Proposition 4.1 von 8 . Um in Ωp,q M beziehungsweise ΛM Geod¨aten als kritische Punkte von E zu finden, u uft man eine sogenannte Palais-Smale–Bedingung. Wir bezeichnen ¨berpr¨ diese R¨aume dabei pauschal mit Ω: G.20 Definition (Palais-Smale–Bedingung) Alle Folgen (ck )k∈N von Kurven in Ω, f¨ ur die die Folge E(ck ) k∈N beschr¨ankt ist und limk→∞ grad E(ck ) = 0 gilt, besitzen eine konvergente Teilfolge. G.21 Beispiel (Gegenbeispiel) Ist (M, g) die (vollst¨andige) riemannsche Mannigfaltigkeit M := R mit euklidischer Metrik g, dann ist die Palais-Smale– Bedingung f¨ ur ΛM nicht erf¨ ullt. ullt die Denn etwa die Folge der konstanten Schleifen ck mit ck (t) := k erf¨ Voraussetzung der Definition, besitzt aber keine konvergente Teilfolge. 3 G.22 Lemma Die Palais-Smale–Bedingung ist f¨ ur Ωp,q M erf¨ ullt, falls (M, g) vollst¨andig ist, und f¨ ur ΛM , falls M kompakt ist. 6 Die
Summe ist endlich! es k¨ onnte eine sogenannte Morse-Bott–Funktion sein. Bei einer Morse-Bott–Funktion ist die kritische Menge eine abgeschlossene Untermannigfaltigkeit und die Hesse–Matrix in Normalenrichtung ist nicht degeneriert. 8 M. Klein, A. Knauf: Classical Planar Scattering by Coulombic Potentials. LNP 13. Berlin: Springer, 1993 7 Aber
G. Morse–Theorie
549
Unter den genannten Voraussetzungen erzeugt das Gradientenvektorfeld grad E einen vollst¨andigen Fluss auf Ω. Man findet also beispielsweise in jeder Zusammenhangskomponente von Ωp,q M ein p mit q verbindendes Geod¨atensegment. Diese Zusammenhangskomponenten werden durch die Fundamentalgruppe π1 (M ) nummeriert. Auch im Fall trivialer Fundamentalgruppe kann man oft die Existenz vieler solcher Geod¨atensegmente nachweisen: G.23 Beispiel • Sei zun¨achst M = S n mit Standardmetrik g und p, q ∈ S n nicht konjugiert, also nicht gleich oder Antipoden. Wir k¨onnen diese beiden Punkte mit unendlich vielen Geod¨aten–Segmenten mit Multiplizit¨aten k(n − 1), k ∈ N0 verbinden. Allerdings sind diese alle Segmente einer (in span(p, q) liegenden) Geod¨ate. • Ist die Metrik nicht die Standardmetrik, so l¨asst sich unter Zuhilfenahme des Satzes von Sard (siehe Seite 299), angewandt auf die Exponentialabbildung, immer noch feststellen, dass fast alle (p, q) ∈ M × M nicht konjugiert sind, und man erh¨alt wieder viele verbindende Geod¨atensegmente. Allerdings werden diese im Allgemeinen geometrisch verschieden sein. 3 Eine andere Fragestellung ist die nach Existenz und Zahl geschlossener Geod¨aten. Man benutzt dabei das in Bemerkung G.3.2 eingef¨ uhrte und auf den Raum der H 1 –Schleifen c : S 1 → M restringierte Energiefunktional E : ΛM → [0, ∞). G.24 Satz (Ljusternik-Fet) Auf einer geschlossenen (das heißt kompakten und randlosen) riemannschen Mannigfaltigkeit existiert eine periodische Geod¨ate. Beweis: Neben dem Originalbeweis in [LF], siehe auch Theorem 3.7.7 von Klingenberg [Kli2], gibt es in [Kli2], Thm. 2.4.20 einen weiteren Beweis. Beweisidee: • Wenn die Fundamentalgruppe π1 (M ) nicht trivial ist, dann gibt es auch nicht triviale Konjugationsklassen (siehe Satz E.5) in π1 (M ), also nicht kontrahierbare Schleifen. Da allgemein die Zusammenhangskomponenten von ΛM den Konjugationsklassen entsprechen, finden wir durch Straffziehen einer solchen Schleife mit dem Gradientenfluß eine geschlossene Geod¨ate. • Ist aber M einfach zusammenh¨angend, dann existiert eine nicht triviale Homotopiegruppe9 π (M ), 2 ≤ ≤ dim(M ). ∑B1 Sei f : S → M nicht homotop zu einer konstanten Abbildung. Wir zerlegen S (auf die in der Abbildung f¨ ur = 2 B1 −1 angedeuteten Weise) in durch B parametrisierte Orbits ur Parameter aus ∂B −1 . von S 1 , mit konstanten Kreisen f¨ Diese ziehen wir gemeinsam straff. Es ergibt sich eine ge- 2 schlossene Geod¨ate. Beispiel: Im Fall von M = S 2 mit Stan- S ¨ dardmetrik und f = IdS 2 ist diese der Aquator. 2 9 eine analog zur Fundamentalgruppe definierte Gruppe von Homotopieklassen von Abbildungen S → M .
550
G.3. Geod¨atische Bewegung und Morse–Theorie
G.25 Bemerkung (Existenz vieler geschlossener Geod¨ aten) Typischerweise besitzt eine geschlossene riemannschen Mannigfaltigkeit (M, g) (mit dim(M ) ≥ 2 mehr als eine geschlossene Geod¨ate. Dabei nennen wir zwei Geod¨aten geometrisch verschieden, wenn ihre Orbits im Einheitstangentenb¨ undel T1 M verschieden sind. Dies kann man zeigen, wenn die Fundamentalgruppe π1 (M ) hinreichend groß ist (etwa f¨ ur Tori, siehe Satz 8.33). Aber auch zum Beispiel f¨ ur die Sph¨are S 2 mit beliebigen Metriken ist das bewiesen worden, siehe Bangert [Ban]. 3 Ein großes Problem bei der Anwendung der Morse–Theorie ist die Voraussetzung der Nichtdegeneriertheit der kritischen Punkte. Zwar ist diese Voraussetzung in einem generischen Sinn erf¨ ullt, doch f¨ ur den konkreten Einzelfall l¨asst sie sich nur schwer nachpr¨ ufen. Hier ist die Ljusternik–Schnirelmann–Kategorie n¨ utzlich: G.26 Definition Die Ljusternik–Schnirelmann–Kategorie cat(X) eines Hausdorff–Raumes X ist die kleinste Kardinalit¨at kontrahierbarer abgeschlossener 10 Mengen 11 Ai ⊆ X (i ∈ I) mit 7 X = i∈I Ai . G.27 Beispiel (Kreislinie) Die Ljusternik–Schnirelmann–Kategorie cat(S 1 ) der Kreislinie S 1 ist gleich 2. Denn zum Beispiel die beiden abgeschlossenen Teilmengen A± := {z ∈ S 1 ⊂ C | ±Re(z) ≤ 1/2} sind kontrahierbar, mit A− ∪ A+ = S 1 . Aber S 1 selbst ist nicht kontrahierbar. 3 Ist X kompakt, dann ist cat(X) < ∞. Es gilt der G.28 Satz Eine Funktion f ∈ C 2 (M, R) auf einer geschlossenen Mannigfaltigkeit M besitzt mindestens cat(M ) kritische Punkte. Beweis: Einen Beweis findet man in Band 3, §19 von Dubrovin, Fomenko und Novikov [DFN]. Die grobe Idee ist folgende: Bez¨ uglich jeder riemannschen Metrik g erzeugt ∇f einen vollst¨ a ndigen Gradientenfluss auf M . Es gilt M = 7 s W (m), wobei die stabilen Mannigfaltigkeiten W s (m) voneinander m∈Crit(M ) s verschiedener kritischer Punkte disjunkt sind. Aus den W (m) l¨asst sich eine ¨ Uberdeckung im Sinn von Definition G.26 basteln. 2 Die Ljusternik–Schnirelmann–Kategorie k¨ onnen wir oft mithilfe der sogenannten cup–L¨ange berechnen. G.29 Definition Die cup–L¨ ange cup(M ) eine Mannigfaltigkeit M ist die Maximalzahl von Elementen α1 , . . . , αp ∈ H ∗ (M, Z) mit Grad ≥ 1 und α1 ∧ . . . ∧ αp = 0. 10 Man kann f¨ ¨ ur unsere Zwecke auch offene Uberdeckungen verwenden, siehe R. Fox: On the Lusternik-Schnirelmann Category. The Annals of Mathematics, Second Series, 42, 333–370 (1941) 11 Es wird nicht gefordert, dass die A zusammenh¨ angend sind. i
G. Morse–Theorie
551
Damit ist die cup–L¨ange einer n–dimensionalen Mannigfaltigkeit h¨ochstens n. G.30 Satz cat(M ) ≥ cup(M ) + 1. Beweis: In Band 3, §19 von Dubrovin, Fomenko und Novikov [DFN]. 2 G.31 Beispiel (Torus) cup(Tn ) = n, wie man durch Benutzung einer Basis α1 , . . . , αn ∈ H 1 (Tn ) von H ∗ (Tn , Z) sieht (vergleiche mit Beispiel B.54). Jede glatte Funktion f : Tn → R besitzt also mindestens n + 1 kritische Punkte. Diese untere Schranke wird auch realisiert. Etwa f¨ ur den 2-Torus T2 := 2 2 R /πZ ist die Funktion f : T2 → R, x → sin(x1 ) sin(x2 ) sin(x1 + x2 ) wohldefiniert und hat genau drei kritische Punkte: (0, 0) (π/3, π/3) (2π/3, 2π/3) siehe Abbildung.
(degeneriert), (Maximalstelle), und (Minimalstelle), 3
Finishing a book is just like you took a child out in the yard and shot it.” ” Truman Capote
Anhang H
L¨ osungen der Aufgaben Kapitel 1, Einleitung Aufgabe 1.1 auf Seite 6 (Drittes Keplersches Gesetz): (a) Mit der Parametergleichung (1.7) sind die Minimal- und Maximalabst¨ande rmin = R(ϕ0 ) =
p 1+e
und rmax = R(ϕ0 + π) =
Praktisch nach Definition ist die große Halbachse a = tisches Mittel.
p 1−e2
p . 1−e deren arithme-
Der Abstand der beiden Brennpunkte ist rmax − rmin . Daher gilt mit der G¨artner-Definition der Ellipse1 : Die kleine Halbachse ˜b erf¨ullt nach Pythagoras die Beziehung ˜b2 + (rmax − rmin )2 /4 = (rmax + rmin )2 /4 oder ˜b = (rmin rmax )1/2 = b. (b) Der Fl¨acheninhalt der Ellipse ist πab, also nach dem zweiten Keplerschen Gesetz gleich T /2, mit der Umlaufzeit T . Damit ist T = 2πab/. √ √ (c) Mit b = p/ 1 − e2 = pa = a/γ folgt aus Teil b) f¨ ur die Umlaufzeit: T =
2πab
3/2
= 2π a√γ .
2
Kapitel 2, Dynamische Systeme Aufgabe 2.5 auf Seite 13 (Cantor–Menge): • Die Cantor–Menge ist definiert als C˜ := ∩n∈N Cn mit C0 := I, wobei Cn+1 ⊂ Cn aus Cn durch Wegnahme des 1 also aufgefaßt als die Menge der Punkte, deren Summe der Abst¨ ande zu den Brennpunkten konstant ist, die also gezeichnet werden kann, indem man einen Faden an zwei N¨ ageln festbindet und ihn mit einem Stift staffzieht. Im Barock und im Rokoko waren ellipsenf¨ ormige Beete beliebt.
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 25,
552
H. L¨osungen der Aufgaben
553
mittleren Drittels aller Teilintervalle entsteht. • Da f¨ ur x ∈ [0, 1/3] beziehungsweise x ∈ [2/3, 1] gilt: f (x) = 3x bzw. ˜ = C˜ und damit C˜ ⊆ C. f (x) = 3(1 − x), ist f (Cn+1 ) = Cn , also f (C) ˜ • Ist umgekehrt x0 ∈ I \ C, dann existiert genau ein n ∈ N0 mit xn ∈ Cn aber 2 xn+1 ∈ Cn+1 . Dann ist xn+1 ∈ L. Aufgabe 2.12 auf Seite 15 (Periode): 1. • F¨ ur Φt (m) = exp(2πitα)m gilt Φ0 (m) = exp(0)m = m und Φt1 ◦ Φt2 (m) = exp(2πit1 α) exp(2πit2 α)m = exp(2πi(t1 + t2 )α)m = Φt1 +t2 (m). (Φt )t∈Z ist also ein dynamisches System auf S 1 . • F¨ ur α = q/p mit q ∈ Z, p ∈ N ist Φp (m) = exp 2πip pq m = m, p also Periode von m ∈ S 1 . Die Minimalperiode r ∈ N von m teilt p (in Zeichen: r|p), und aus Φr (m) = m folgt exp 2πi rq = 1, also p|rq. Da q und p nach Annahme teilerfremd sind, p folgt p|r. Da auch r|p gilt, ist r = p. • Falls f¨ ur ein t ∈ Z und m ∈ S 1 gilt: Φt (m) = m, dann folgt exp(2πiαt) = 1, und damit αt ∈ Z. Ist α ∈ R\Q, dann ist t = 0. (n)
2. Durch Induktion folgt f¨ ur m, n ∈ N und fm (z) := z m : fm = fmn . F¨ ur ∈ N folgt aus f (z) = z die Gleichung z = z oder z −1 − 1 = 0. F¨ ur > 1 ist das Polynom vom Grad − 1, besitzt also genau − 1 Nullstellen auf dem komplexen Einheitskreis. (n) 2 Damit ist Pn (fm ) = P1 fm = P1 fmn = mn − 1. Aufgabe 2.15 auf Seite 16 (Minimalperiode des dynamischen Systems): F¨ ur dynamische Systeme gilt, dass die Φt : M → M Bijektionen sind. Ist M eine endliche Menge und m ∈ M , dann gibt es Zeiten t1 < t2 mit Φt1 (m) = Φt2 (m). Dann ist t := t2 − t1 eine Periode: Φt (m) = m. Jeder Punkt m ∈ M ist also periodisch, und wegen t ∈ Z gibt es auch eine Minimalperiode T (m) ∈ N. Da das kleinste gemeinsame Vielfache Tˆ ∈ N der T (m) (m ∈ M ) wegen der Endlichkeit von M existiert, gilt f¨ ur alle m ∈ M : ΦTˆ (m) = m. Andererseits ist ˆ T auch Minimalperiode des dynamischen Systems. 2 Aufgabe 2.19 auf Seite 19 (Shift): 1. dA ist eine Metrik A, also auch 2−|j| dA f¨ ur beliebige j ∈ Z.
auf−|j| = 3 < ∞ ist, ist d eine Produktmetrik auf AZ : Da außerdem j∈Z 2 • F¨ ur x = y gibt es ein j ∈ Z mit xj = yj , also d(x, y) ≥ 2−|j| > 0. • d(x, y) = d(y, (b, a).
x), da dA (a, b) = dA
• d(x, z) = j∈Z 2−|j| dA (xj , zj ) ≤ j∈Z 2−|j| dA (xj , yj ) + dA (yj , zj ) = d(x, y) + d(y, z). Φ ist stetig, denn d Φ±1 (x), Φ±1 (y) ≤ 2d(x, y).
554
H. L¨osungen der Aufgaben
ur j = 2. • m = (mj )j∈Z ist genau dann n–periodisch, wenn mj+kn = mj f¨ 0, . . . , n − 1 und k ∈ Z gilt. Es gibt also genau 2n n–periodische Punkte. • Die Minimalperiode T eines n–periodischen Punktes m ∈ M teilt n (siehe Satz 2.13). Daher gibt es f¨ ur n = 2, 3 beziehungsweise 4 genau 2 = 22 − 3 4 2, 6 = 2 − 2 bzw. 12 = 2 − 2 − 2 Punkte mit Minimalperiode n. • Die periodischen Orbits der Minimalperiode k umfassen k Punkte. Es gibt also 2 = 2/1, 1 = 2/2, 2 = 6/3 bzw. 3 = 12/4 Orbiten der Minimalperioden 1, 2, 3 bzw. 4. Damit gibt es genau 2, 3, 4 bzw. 6 Orbiten dieser Perioden. Steht B(n) f¨ ur die Anzahl der periodischen Orbits mit Minimalperiode n ∈ N, so ist d B(d), 2n = d: d|n
und die M¨obius–Inversion dieser Beziehung sagt einem nun B(n) =
1 d n 2 μ( d ). n d: d|n
Dabei ist μ : N → {−1, 0, 1} die M¨obius–Funktion ⎧ ⎪ , n = 1 oder n hat eine gerade Anzahl von Primteilern, ⎨1 μ(n) := −1 , n hat eine ungerade Anzahl von Primteilern ⎪ ⎩ 0 , sonst. Ist n prim, so vereinfacht sich die Formel f¨ ur B zu B(n) =
1 n
2n − 2 .
3. Es sei etwa x = (xj )j∈Z mit xj := 0 f¨ ur j ≤ 0 und (xj )j∈N die Folge 0 1 00 01 10 11 000 001 010 011 . . ., bei der also nacheinander die Bitfolgen der L¨angen 1, 2, . . . lexikalisch geordnet aneinandergeh¨angt werden. 2 Aufgabe 2.22 auf Seite 20 (Stabilit¨ at): ur λ ∈ C\{0} 1. Die Abbildungen Φt : C → C, Φt (m) := λt m (t ∈ Z) bilden f¨ ein stetiges dynamisches System, weil die Φt lineare, also stetige Abbildungen sind, Φ0 (m) = λ0 m = m und Φt1 ◦ Φt2 (m) = λt1 λt2 m = λ(t1 +t2 ) m gilt. Wegen Linearit¨at ist 0 ein Fixpunkt. 2. Die Umgebungsbasis {U ur |λ| ≤ 1 die ε (0) | ε > 0} der Null besitzt genau f¨ Eigenschaft Φt Uε (0) ⊆ Uε (0) f¨ ur alle t ≥ 0. Damit ist f¨ ur diese λ–Werte 0 Liapunov–stabil. Ist dagegen |λ| > 1, dann ist limt→∞ |λ|t ε = ∞, und wegen Φt Uε (0) = U|λ|t ε (0) ist die 0 nicht Liapunov–stabil. 3. Ist |λ| < 1, dann ist 0 nicht nur Liapunov–stabil, sondern der Radius |λ|t ε der ur t → ∞ gegen Null. Also ist die 0 asymptoKreisscheibe Φt Uε (0) geht f¨ tisch stabil. 2
H. L¨osungen der Aufgaben
555
Aufgabe 2.25 auf Seite 21 (Attraktor): 1. Die Vereinigung A zweier Attraktoren A1 , A2 ist wieder ein Attraktor, denn sind Ui ⊆ M vorw¨arts invariante Umgebungen von Ai , dann ist U := U1 ∪ U2 eine solche f¨ ur A, und mit einer offenen Umgebung V ⊆ U von A sind ur Ai . Es existieren dann τi > 0 mit Φt (Ui ) ⊆ Vi Vi := V ∩ Ui ⊆ Ui solche f¨ f¨ ur alle t ≥ τi . F¨ ur τ := max(τ1 , τ2 ) ist dann auch Φt (U ) ⊆ V f¨ ur alle t ≥ τ . 2. A ⊆ t≥0 Φt (U0 ) folgt aus A ⊆ U0 und Φ(t, A) = A f¨ ur alle t ∈ G. Sei x ∈ t≥0 Φt (U0 ) \ A. Dann ist V := U0 \ {x} offen und erf¨ ullt A ⊆ V ⊆ existiert ein τ ≥ 0 mit Φ(t, U ) ⊆ V f¨ u r alle t ≥ τ . Das widerspricht U0 . Also 0 x ∈ t≥0 Φ(t, U0 ). 2 Aufgabe 2.27 auf Seite 22 (Logistische Familie): 1. • F¨ ur f4 (x) = 4x(1 − x) gilt: f4 12 = 1 ist der Maximalwert, und f (0) = (n) f (1) = 0. Da f4 − Id ein Polynom 2n –ten Grades ist (bei der Komposition von Polynomen werden ja die Grade multipliziert), kann es h¨ochstens 2n (n) Nullstellen haben. Damit existieren h¨ ochstens 2n Fixpunkte von fn . (n)
• Andererseits gibt es f¨ ur f 4 (n)
(n)
Punkte xk (n)
(k = 0, . . . , 2n ) mit
(n)
(n)
x0 = 0 , xk < xk+1 und x2n = 1, (n) (n) (n) sodass f4 x2 = 0 und f4n x2+1 = 1 ist.
(1) Das folgt durch Induktion aus x1 := 12 , denn f4 w¨achst auf 0, 12 streng monoton von 0 auf 1 und f¨allt auf 12 , 1 streng monoton auf 0. (n) Daher existieren mindestens 2n Fixpunkte von f4 . 2. Es ist fp (yp ) = yp , und f¨ ur p ≥ 1 ist yp ∈ [0, 1]. Damit ist yp im Parameterur alle x ∈ (0, 1) bereich p ∈ (1, 3) der zweite Fixpunkt von fp neben 0. Dass f¨ (n) gilt: limn→∞ fp (x) = yp , wurde f¨ ur Parameterwerte p ∈ (1, 2] in Beispiel 2.26 gezeigt. F¨ ur p ∈ (2, 3) betrachten wir fp(2) (x) = p2 x(1 − x) 1 − px(1 − x) . Wir beginnen mit einer Kurvendiskussion. • F¨ ur die Parameterwerte ist 12 Minimal(2) stelle von fp , und die Maximalstellen √
p(p−2) . 2p p Der Maximalwert ist 4. (2) • Die beiden Wendepunkte von √ fp liep(p−2)/3 , gen an den Stellen wp± := 12 ± 2p 3/2 d (2) und dx fp (wp± ) = ± p(p−2) . 3 (2)
von fp
liegen bei m± p :=
1 2 ± (2) fp (m± p)=
p2.8 f p f p , Id
1
1 2
0
wp
y p mp 1 2
x
1
556
H. L¨osungen der Aufgaben
√ ur das Da das Intervall (2, 3) innerhalb des Intervalls 2, 1 + 5 liegt, f¨ (2) (2) + + + fp (m+ ) < m gilt, wird das Intervall [m , 1) durch f in (0, m p p p p p ) ab (2) + + gebildet, und auch fp (0, mp ) ⊆ (0, mp ). Wir zeigen, dass sich der Abstand von x zum Fixpunkt yp unter Iteration ultigen Absch¨atzung verkleinert. Das folgt aus der f¨ ur x ∈ (0, m+ p ), x = yp , g¨ |fp(2) (x) − yp | < |x − yp |. (2)
Der Graph von fp ist ja in (0, yp ) oberhalb der Diagonale, aber wegen d (2) d (2) − dx fp (x) ≥ dx fp (wp ) > −1 auch unterhalb der Gerade x → 2yp − x durch den Fixpunkt. F¨ ur das Intervall (yp , m+ p ) argumentiert man analog. Einen f¨ ur alle p ∈ (1, 3] g¨ ultigen L¨ osungsansatz findet man in Denker [De], Kapitel 1.5. 2 (1)
(2)
Aufgabe 2.30 auf Seite 23 (Konjugation): Es gelte h◦Φt = Φt ◦h (t ∈ G), ¨ f¨ ur einen Hom¨oomorphismus h : M (1) → M (2) . Da Konjugation eine Aquiva¨ lenzrelation ist, reicht es aus, eine Implikation der folgenden Aquivalenzen zu zeigen. (i)
(a) x ∈ M (i) ist genau dann eine Ruhelage, wenn Φt (x) = x (t ∈ G). Ist x1 ∈ M (1) eine Ruhelage, dann ist also (2)
(2)
(1)
Φt (x2 ) = Φt ◦ h(x1 ) = h ◦ Φt (x1 ) = h(x1 ) = x2 . Ist U (2) ⊆ M (2) eine Umgebung von x2 , so auch U (1) := h−1 (U (2) ) ⊆ M (1) f¨ ur x1 . Ist x1 Liapunov–stabil, dann existiert eine Umgebung V (1) ⊆ U (1) von (1) x1 mit Φt (V (1) ) ⊆ U (1) (t ≥ 0). Entsprechend ist V (2) := h(V (1) ) ⊆ U (2) eine Umgebung von x2 mit (2) (2) (1) Φt V (2) = Φt ◦ h V (1) = h ◦ Φt V (1) ⊆ h U (1) = U (2) . Die asymptotische Stabilit¨at u ¨bertr¨agt sich analog. Auch die Teile (b) und (c) sind Routineaufgaben.
2
Aufgabe 2.45 auf Seite 28 (Diffeomorphismengruppe): • Es sei (U, ϕ) eine Karte von M mit x ∈ U , und mit V := U (ϕ) ⊆ Rn sei das Kartenbild bezeichnet. F¨ ur gen¨ ugend kleine ε > 0 ist die ε–Kugel x) um x ˜ := ϕ(x) ganz in V enthalten. Es sei χ ˜ ∈ C ∞ Uε (˜ x), [0, 1] eine Uε (˜ Abschneidefunktion, also etwa χ ˜ Uε/4 (˜ x) = 1 und χ(z) ˜ = 0 f¨ ur z ∈ Uε/2 (˜ x). Ist nun y˜ ∈ Uε/4 (˜ x), dann ist v˜ : Uε (˜ x) → Rn , v˜(z) := χ(z) ˜ · (˜ y−x ˜) ein x) verschwindet und innerhalb Uε/4(˜ x) Vektorfeld, das außerhalb von Uε/2 (˜ −1 gleich y˜ − x ˜ ist. Durch Fortsetzung mit Null wird das auf ϕ Uε (x) ⊆ U geliftete Vektorfeld zu einem Vektorfeld v auf M . Sein Zeit–1–Fluss f ∈ Diff(M ) existiert (das folgt aus einem zum Beweis von Satz 3.27 analogen Argument). Zudem gilt mit y := ϕ−1 (˜ y ) : f (x) = y (denn in der Karte gilt x + t˜ y , dass v˜(zt ) = y˜ − x ˜). f¨ ur alle zt := (1 − t)˜
H. L¨osungen der Aufgaben
557
• Damit ist die Menge Mx := {y ∈ M | es gibt ein f ∈ Diff(M ) mit f (x) = y} offen und nicht leer. Aber auch M \Mx ist offen, denn mit z ∈ M \Mx kann auch ganz Mz nicht erreicht werden (hier nutzt man, dass Diff(M ) eine Gruppe ist). Nun ist M 2 nach Annahme zusammenh¨angend, also Mx = M .
Kapitel 3, Gew¨ ohnliche Differentialgleichungen Aufgabe 3.12 auf Seite 35 (Einzeldifferentialgleichungen erster Ordnung): 1. • Es ist genau dann f1 (x) = 0, wenn |x| = 1 ist, sonst ist f1 (x) > 0. Damit sind die minimalen invarianten Mengen (−∞, −1), {1}, (−1, 1), {1} und (1, +∞). Die L¨ osungen sind in den offenen Intervallen streng monoton wachsend. Da f1 (x) ≥ x4 /2 gilt, falls |x| ≥ 2, sind die Existenzintervalle f¨ ur Anfangsur x0 < −1 von werte x0 > 1 von oben, f¨ unten beschr¨ankt. • Es ist f2 (x) ≥ f2 (0) = 1. Damit ist der Phasenraum R die einzige (nicht leere) invariante Menge, und es gibt insbesondere keine Fixpunkte. Die L¨osungen sind streng monoton wach2 send und existieren nur f¨ ur ein endliches Zeitintervall, denn f2 (x) ≥ x4 .
f 25 20 15
=
10 5 1
1
2
x
2. Die Differentialgleichung x˙ = f (x) f¨ ur f : (0, ∞) → R, x → xα besitzt die 1/β mit β := 1 − α L¨osungen x(t) = et x0 , falls α = 1, und x(t) = βt + xβ0 sonst. Letzteres berechnet man durch Trennung der Variablen und Anpassung der Integrationskonstanten an den Anfangswert x0 > 0. W¨ahrend also f¨ ur den linearen Fall α = 1 die L¨ osung f¨ ur alle Zeiten existiert, ist das f¨ ur α > 1 nur f¨ ur das Zeitintervall −∞ , xβ0 /|β| der Fall, f¨ ur α ∈ [0, 1) 2 nur f¨ ur t ∈ −xβ0 /β , +∞ . Aufgabe 3.19 auf Seite 40 (Picard–Lindel¨ of): 1 (a) Die von Satz 3.17 garantierte Maximalzeit ist ε(r) := min{r, N r(r) , 2L(r) } r := max{|f (x)| | x ∈ B (0)} = e und mit r > 0, Br (0) ⊆ Df = R, N (r) r Lipschitz–Konstante L(r) := Lip f Br (0) = er . 1 F¨ ur r = 12 erh¨alt man ε(r) = 2√ , und das ist der Maximalwert. e
(b) Die Picard–Iteration stellt man mit dieser Rekursionsformel auf: t t f xj (τ ) dτ = e−xj (τ ) dτ . x0 (t) := x0 = 0 und xj+1 := x0 + t0
0
558
H. L¨osungen der Aufgaben
(c) Die maximale L¨ osung des AWP ist ϕ : (−1, ∞) → R, ϕ(t) = log(1 + t). 2 Aufgabe 3.25 auf Seite 43: Die Funktion sin ist auf R (nicht aber auf C!) Lipschitz–stetig. Also besitzt das Anfangswertproblem x˙ = sin x, x0 = π/2 eine eindeutige L¨osung. Diese gewinnt man durch Trennung der Variablen: t = y x x 1 tan(x/2) dy = log tan 2 = log tan(π/4) , also x(t) = 2 arctan(et ). Dax0 sin y x0 mit ist lim x(t) = lim 2 arctan(y) = π und lim x(t) = 2 arctan(0) = 0. 2 t→∞
y→∞
t→−∞
Aufgabe 3.28 auf Seite 44 (Existenz des Flusses): 2n (a) F¨ ur eine beliebige Zahl n ∈ N von Freiheitsgraden ist H : R → R, H(x) := 2 −1
x eine Funktion, deren Subniveaumengen H (−∞, E] kompakte Vollkugeln sind. H ist die Hamilton–Funktion eines harmonischen Oszillators.
(b) • H ist Konstante der Bewegung, denn f¨ ur eine L¨osung ϕ : [−ε, ε] → R2n der hamiltonschen Differentialgleichung gilt 2n d ∂H ϕ(t) ϕ˙ j (t) = 0. H ϕ(t) = dt ∂xj j=1
ur E > 0. • Wir betrachten die Subniveaumenge PE := H −1 (−∞, E] f¨ Diese ist invariant unter dem hamiltonschen Fluss, denn H ist ja eine Konstante der Bewegung. Da Annahme kompakt ist, ist das PE nach Vektorfeld J ∇HPE mit J = 1l0n −10ln Lipschitz–stetig. Der hamiltonsche ur alle Zeiten definiert. Da E beliebig war und Fluss auf 7 PE ist damit f¨ R2n = E>0 PE , folgt die Vollst¨andigkeit des Vektorfelds auf R2n . 2 Aufgabe 3.30 auf Seite 45: Die lineare Differentialgleichung x ¨ = x besitzt als Basis des L¨osungsraums x± : R → R, x± (t) = exp(±t), also x± (0) = 1, x˙ ± (0) = ±1. F¨ ur die Anfangsbedingungen (x0 , x˙ 0 ) = (1, −1) ergibt sich also 2 die L¨osung x(t) = x− (t) = exp(−t), mit 0 = limt→∞ x(t). Aufgabe 3.41 auf Seite 50 (Fluchtzeit): Die hamiltonschen Differentialgleichungen lauten wie behauptet p˙ = −
m ∂H =− 2 ∂q q
,
q˙ =
∂H = p. ∂p
Wir haben die Erhaltungsgr¨ oße H(p, q) = 12 p2 − m = E, also q m q= 1 2 bzw. p = ± 2 E + m q . p −E 2 Gemeinsame L¨osung der Teile (a) und (b): • p0 > 0, E := H(p0 , q0 ) ≥ 0: Es ist √ √ m ur t ≥ 0 : q(t) ≥ q0 + t 2E. q(t) ˙ = 2 E + q(t) ≥ 2E , also f¨
H. L¨osungen der Aufgaben
559
Der linke Rand des Definitionsbereichs wird von q ∈ (0, ∞) also f¨ ur positive Zeiten nie erreicht. Weiter gilt f¨ ur t ≥ 0 und wieder p0 > 0, E ≥ 0 m q(t) ˙ = 2 E + q(t) ≤ 2(E + qm0 ) =⇒ q(t) ≤ q0 + t 2(E + qm0 ). Das bedeutet, dass f¨ ur p > 0, E ≥ 0 die Fluchtzeit TF = ∞ ist. − |E| wird mit Tren• p0 ≤ 0, E < 0. Die Differentialgleichung q˙ = − 2 m q nung der Variablen zu q q + d˜ t=− = g(q) − g(q0 ) 2
q0
m q˜ −|E|
3 q − |E|) + m arcsin(1 − 2|E| m ) , was f¨ ur mit g(q) = (2|E|)− 2 q 2|E| 2( m q m q ∈ (0, |E| ] definiert ist. F¨ ur q ! 0 erhalten wir die Fluchtzeit limq0 (g(q) − g(q0 )) = mπ 3 − g(q0 ). 2(2|E|) 2
• p0 > 0, E < 0. Die Differentialgleichung f¨ ur q lautet q˙ = l¨asst sich umschreiben zu q d˜ q t= = g(q0 ) − g(q). m q0 2 q˜ − |E|
2 m q − |E| und
Die Differentialgleichung verliert ihre G¨ ultigkeit bei 0 = q˙ =
2 m q − |E| ,
m m . Bis dahin vergeht die Zeit g(q0 ) − g( |E| ) = g(q0 ) + also wenn q = |E| mπ ¨bernimmt das Regime p0 ≤ 0, E < 0. Wir erhalten 3 , anschließend u 2(2|E|) 2
die Fluchtzeit g(q0 ) +
3mπ 3
2(2|E|) 2
.
• p0 ≤ 0, E = 0. Die Differentialgleichung q˙ = − 2 m q wird mit Trennung der Variablen zu t = −(2m)− 2 1
q
q0
3 3 23 2 3 q 2 − q02 ⇐⇒ q = q02 − 3t m q˜ d˜ q=− √ . 2 3 2m
Wir k¨onnen die Fluchtzeit
√ 3 √2 q 2 3 m 0
direkt ablesen.
+ E , und • p0 < 0, E > 0. Die Differentialgleichung lautet nun q˙ = − 2 m q das f¨ uhrt auf q d˜ q t=− = g(q) − g(q0 ) mit m q0 2 q˜ + E √ √ m g(q) = 4E2 √mE log m + 2Eq + 2q E m (q > 0). q + E − 2q q +E 3
3
Mit limq0 g(q) = m log(m)/(2E) 2 ist die Fluchtzeit g(q0 )+m log(m)/(2E) 2 .
560
H. L¨osungen der Aufgaben
osung des AWP x(0) = x0 ist eindeutig, (c) Ein Beispiel ist x˙ = x2 . Denn die L¨ x(t) = 0 ist eine L¨ osung, und f¨ ur x0 ∈ R \ {0} lautet sie (siehe Aufgabe 3.12) −1 x(t) = x−1 auf x−1 ur x0 < 0, bzw. − ∞, x−1 f¨ ur x0 > 0. 2 0 −t 0 , ∞ f¨ 0
Kapitel 4, Lineare Dynamik Aufgabe 0 0 0 4.11 auf Seite 63 (Matrixexponential): A = 1l + B mit B := 1 0 0 . Also ist der L¨ osungsoperator f¨ ur alle Zeiten t ∈ R 110
t
t
exp(At) = e exp(Bt) = e 1l + Bt +
1 2 2 B t 2
=e
t
1 00 t 10 t+t2 /2 t 1
2
.
Kapitel 5, Klassifikation linearer Fl¨ usse Aufgabe 5.5 auf Seite 77 (Index): Es ist 1 ein doppelter und −1 ein einfacher 1 1 −1 Eigenwert der Matrix A := 0 −1 2 . Die Matrix ist damit hyperbolisch und −2 −1 1
ihr Index ist 1. Es gilt B −1 AB = J mit −1 −1 1 2 1 2 1 1 B = 2 0 −2 , B −1 = 14 −4 −2 0 und Jordan–Matrix J = 0 1 2
1
0
0 0 0 0 −1
2 −1 2
Ein Fundamentalsystem der L¨ osungen ist also −1 −1 R t → et 2 , R t → et t 2 + 2
2
1 0 −1
,
R t → e−t
und die letzte davon bleibt f¨ ur t → +∞ beschr¨ankt.
1 −2 0
.
, 2
Aufgabe 5.12 auf Seite 83: (Hookesches Kraftgesetz) Es ist (At)2 = at2 ( 10 01 ), also exp(At) =
∞ ∞ ∞ (At)n (at2 )k (At2 )k = 1l + At . n! (2k)! (2k + 1)! n=0 k=0
k=0
√ (a) F¨ ur a > 0 und ω = a ist also √ √ sinh( at) cosh(ωt) sinh(ωt)/ω √ exp(At) = 1l cosh( at) + A = , ω sinh(ωt) cosh(ωt) a (b) F¨ ur a = 0 ist A2 = 0, also exp(At) = ( 10 1t ). √ (c) F¨ ur a < 0 ist mit ω = 2 −a sin(ωt) cos(ωt) exp(At) = 1l cos(ωt) + A = ω sin(ωt) ω
sin(ωt)/ω cos(ωt)
.
2
H. L¨osungen der Aufgaben
561
Kapitel 6, Hamiltonsche Gleichungen und Symplektische Gruppe Aufgabe 6.23 auf Seite 102 (Symplektische Algebra): u ist infinitesimal symplektisch. F¨ ur die darstellende Matrix U von uglich einer Basis, in der ul bez¨ dargestellt wird, gilt daher die symplektischen Bilinearform ω durch J = 10l −1 0 JU + U J = 0. Die Eigenwerte sind Nullstellen des charakteristischen Polynoms det(λ1l − U ) = det J(λ1l − U ) = det(λJ − JU ) = det λJ + U J = det (λ1l + U )J = det λ1l + U = det(λ1l + U ) = det(−λ1l − U ). Das charakteristische Polynom ist also gerade, und damit ist mit λ auch −λ Eigenwert. Da U nur reelle Eintr¨age hat, ist mit λ auch λ Eigenwert. Die Multiplizit¨aten der so zueinander geh¨ orenden Eigenwerte stimmen u ¨berein. Die gerade Multiplizit¨at der Null ergibt sich auch daraus, dass das charakteristische Polynom gerade ist. 2 Aufgabe 6.26 auf Seite 102 (Symplektische Matrizen): 0 −1l A B C −C 0 −1l A C + ( ) = (a) u J + Ju = B C D 1l 0 1l 0 D +A D
−A −D −B +B
.
(b) Dies folgt daraus, dass der folgende Ausdruck gleich Null ist: AB 0 −1l l A C ( C D ) − 10l −1 a J a − J = B 1l 0 0 D C A−A C C B−A D+1l C −A A B ) − 0 −1l = ( . = D C D 1l 0 D A−B C−1l D B−B D −B (c) SL(2, R) = {u ∈ Mat(2, R) | det u = 1} und die Bedingung aus (b) zeigen die erste Behauptung. Der dreidimensionale offene Volltorus ist S 1 × B. Wegen
cos(ϕ) − sin(ϕ) 1 | ϕ ∈ S SO(2) = sin(ϕ) cos(ϕ) ist die S 1 –Koordinate bereits identifiziert. Die positiven symmetrischen MaA B ) mit A > 0, B ∈ R trizen mit Determinante 1 lassen sich schreiben als ( B C 2 und C = 1+B A . Die Cayley–Transformation der riemannschen Zahlenkugel C ∪ {∞} → C ∪ {∞}
, z →
z−i z+i
bildet die Obere Halbebene {z = B + iA ∈ C | B ∈ R, A > 0} mit einem 1+w Diffeomorphismus (mit Inverser w → i 1−w ) auf die offene Einheitskreisscheibe B = {w ∈ C | |w| < 1} ab. b 2n = (a2 + b2 )n 1l ist (d) Wegen ab −a exp
a
b b −a
√ sinh a2 + b2 a b 2 2 √ a + b 1l + = cosh b −a . a2 + b 2
562
H. L¨osungen der Aufgaben √ Also ist tr(M ) = 2 cos(ϕ) cosh a2 + b2 . Die Formel 1 tr(M )2 − 4 det(M ) 2 tr(M ) ± f¨ ur die Eigenwerte einer Matrix M ∈ Mat(2, R) zeigt, dass die Eigenwerte der symplektischen Matrix M genau f¨ ur |tr(M )| = 2 einander gleich sind. 2
Aufgabe 6.34 auf Seite 107 (Lissajous–Figuren): 1. Das Frequenzverh¨altnis ist
ω2 ω1
=
Zahl der Maximalstellen von q2 . Zahl der Maximalstellen von q1
2. E := {Q ∈ R2 | H(0, Q) ≤ E} = {Q ∈ R2 | ω1 Q21 + ω2 Q22 ≤ 2E} ist das elliptische Hillsche Gebiet, aus dem wir den Anfangspunkt q w¨ahlen. Dann ist der Abschluss der Lissajous-Figur mit Anfangsbedingung (p, q), H(p, q) = E das Rechteck Rp := {Q ∈ R2 | |Qk | ≤ p2k + qk2 }. Die Vereinigung dieser Rechtecke ergibt die q2 Teilmenge des Ellipsengebiets E ∩ [−R1 , R1 ] × [−R2 , R2 ], q1 mit R1 := (2E − ω2 q22 )/ω1 und R2 := (2E − ω1 q12 )/ω2 . Kein Punkt q ∈ E außerhalb dieses Gebiets ist von q aus erreichbar, und f¨ ur q = 0 gibt es solche Punkte q . Das Analogon des Satzes von Hopf und Rinow gilt also nicht f¨ ur Hillsche Gebiete. 2 Aufgabe 6.38 auf Seite 110 (Verschlingungszahl): • Mit den Frequenzen ωk = nk ω0 ist die Bewegung des harmonischen Oszilla. Die Normalschwingungen auf der tors periodisch mit Minimalperiode T = 2π ω0 −1 onnen daher mit S 1 := R/T Z in der Energieschale ΣE = H (E), E > 0 k¨ Form + + 0 1 t) 2E cos(ω 2E cos(ω 1 2 t) 0 , c˜2 (t) = c˜k : S → ΣE , c˜1 (t) = 0 1 t) ω1 sin(ω ω2 sin(ω 2 t) 0 dargestellt werden. ΣE ⊂ R4 ist unter der linearen Abbildung √ √ √ √ (p1 , p2 , q1 , q2 ) −→ (2E)−1/2 ω1 p1 , ω2 p2 , ω1 q1 , ω2 q2 diffeomorph zu S 3 ⊂ R4 . Die Projektionen der Normalschwingungen seien mit cˆk : S 1 → S 3 bezeichnet. Diese projizieren 2 wir nun mit der stereographischen Abbildung aus Beispiel A.29.3 auf R3 . Es ergeben sich als Bildkurven der cˆk cos(ω1 t) − sin(ω1 t) 0 0 c1 : S 1 → R3 , c1 (t) = 2 , also c1 (t) = 2ω1 sin(ω1 t)
π
cos(ω1 t)
2 Dass c ˆ2 (t) f¨ ur t = 2 + 2πk /ω2 , k ∈ Z gleich dem Nordpol (0, 0, 0, 1) ∈ S 3 ist, st¨ ort bei der Integration nicht.
H. L¨osungen der Aufgaben c2 : S 1 → R3 ∪ {∞}, c2 (t) =
563 2 1−sin(ω2 t)
0 cos(ω2 t) 0
, also c2 (t) =
2 Damit ist Δc(t) = c1 (t1 ) − c2 (t2 ) = 2 1−sin(ω und 2 t2 ) ⎞ ⎛ √ cos(ω1 t1 ) 1−sin(ω2 t2 ) √ 1 ⎝ − cos(ω2 t2 )/ 1−sin(ω2 t2 ) ⎠ . G(t1 , t2 ) = √ √ 2 sin(ω1 t1 ) 1−sin(ω2 t2 )
2ω2 1−sin(ω1 t)
0 1 0
.
F¨ ur die Verschlingungszahl (6.3.8) der beiden Kurven erhalten wir also wegen det DG(t) = −ω1 ω2 1 − sin(ω2 t2 ) ω 1 ω2 T T LK(c1 , c2 ) = − √ 1 − sin(ω2 t2 ) dt1 dt2 4π 8 0 0 n 1 ω2 T = − √ 1 − sin(ω2 t2 ) dt2 = −n1 n2 . 4 2 0 • F¨ ur beliebige Paare voneinander verschiedener periodischer Trajektorien in ΣE existiert eine stetige Homotopie der Anfangsbedingungen, die diese mit c˜1 (0) beziehungsweise c˜2 (0) verbindet und dabei Gleichheit der deformierten Orbits vermeidet. In der Abbildung sind dieWerte der Abbildung F1 (x) mit den Konstanten ΣE → R2 , x → F 2 (x) der Bewegung Fk aus (6.3.4) aufgetragen. Es ergibt sich eine Strecke, denn 3
f2
f1
Fk ≥ 0 und F1 + F2 = H. Die Wirkung der Homotopie auf die Werte von F sind durch Pfeile angedeutet. • In der Abbildung auf Seite 108 entspricht dem horizontalen Kreis die projizierte Normalschwingung c1 , der vertikalen Gerade c2 . Diese Zuordnung ¨andert sich 2 auch f¨ ur voneinander verschiedene Frequenzen (n1 = n2 ) nicht. Aufgabe 6.40 auf Seite 112 (Dispersionsrelation): (a)
(a) Ist f¨ ur den Ansatz q (t) := c(a) exp(2πik/n + iωk t) das Verh¨altnis λ := (2) (1) c /c , dann ergibt sich aus den Gleichungen f¨ ur die Impuls¨anderungen (a) (a) p˙ = −ωk2 m(a) q das gekoppelte System ωk2 m(1) = c[2 − λ(e2πik/n + 1)]
, ωk2 m(2) = c[2 − λ−1 (e−2πik/n + 1)].
Die quadratische Gleichung f¨ ur die quadrierten Frequenzen ωk2 lautet daher 2πk 2c 2c 2 2 2 1 + cos n ωk − (1) = 0. ωk − (2) − 2c m m m(1) m(2) 3 Die
Endpunkte der Strecke sind die F –Werte der Normalschwingungen.
564
H. L¨osungen der Aufgaben Ihre L¨osungen sind die beiden Zweige der Dispersionsrelation.
(b) Aus den Gleichungen (6.3.11) f¨ ur die Frequenzen ωk , also ωk2 =
2 cr 1 − cos(2πk r/n) m
(k ∈ L)
r∈L
ergibt sich durch Fourier–Transformation bez¨ uglich der Gruppe L = Z/nZ die Bestimmungsgleichung f¨ ur die Kopplungskonstanten cr : Nur die Summen ein, und diese sind proportional zu cr + c−r gehen in die Wechselwirkung
den Fourier–Koeffizienten ω ˆ r2 := k∈L ωk2 exp(2πik r/n). 2 Aufgabe 6.42 auf Seite 115 (Obere Halbebene und M¨ obius–Transformationen): 2z > 0 zu u (a) Wir haben Im M ufen. ¨berpr¨ 2z = 1 az+b − az+b = 1 (az+b)(cz+d)−(cz+d)(az+b) Im M 2 2i cz+d cz+d 2i |cz+d| =
ad Imz − bc Imz |cz + d|
Imz
det M =1
=
2
(b) Seien M, M ∈ SL(2, R) und z ∈ H. Es ist M −1 = a d−bc b d−bd . ac −a c ad −b c
2
|cz + d|
>0
d −b −c a
und M −1 M =
z+b d ac z+d d(a z + b ) − b(c z + d ) a z + b − b −1 M −1 2 z = M = M = a z+b c z + d −c(a z + b ) + a(c z + d ) −c c z+d + a
=
(a d − bc )z + b d − bd −1 M z, = M
(ac − a c)z + ad − cb
also handelt es sich um eine Gruppenwirkung. (c) Wir setzen die Fixpunktgleichung an: 2z = az + b ⇐⇒ (cz + d)z = az + b ⇐⇒ cz 2 + (d − a)z − b = 0 z=M cz + d Diese quadratische Gleichung hat die Diskriminante (d − a)2 + 4bc = (tr M )2 − 4. • F¨ ur eine elliptische Matrix ist die Diskriminante negativ, also existiert genau ein Fixpunkt in H. • F¨ ur eine parabolische Matrix verschwindet die Diskriminante, also existiert ein (doppelter) Fixpunkt in R ∪ {∞}, letzteres passiert bei c = 0. • F¨ ur eine hyperbolische Matrix erhalten wir zwei Fixpunkte in R ∪ {∞}, denn die Diskriminante ist positiv. Im Fall c = 0 ist einer von ihnen ∞.
H. L¨osungen der Aufgaben
565
(d) Die M¨obius–Transformationen zu M1 := 21 : z → a2 z + ab M
a
b 0 a−1
und M2 :=
0 c −c−1 0
sind
2 22 : z → c2 z −1 = c z = c2 x − iy . und M 2 x2 + y 2 |z|
Ihre Ableitungen bei z = x + iy ∈ H sind 21 (x, y) = DM
a2 0 0 a2
22 (x, y) = und DM
(x2
2 2 c2 y −x 2 2 2xy +y )
−2xy y 2 −x2
.
2∗ g = (a2 y)−2 (a4 dx ⊗ dx + a4 dy ⊗ dy) = g Wir transportieren die Metrik. M 1 und mit v = (vx , vy ) ∈ Tz H:
2∗ g (z)(v, v) = g M 22 z DM 22 v, DM 22 v M 2 2 2 2 c2 (x2 + y 2 )2 (y −x )vx −2xyvy = 2 2 (c2 y)2 (x2 + y 2 )2 2xyvx +(y −x )vy ((y 2 − x2 )vx − 2xyvy )2 + (2xyvx + (y 2 − x2 )vy )2 = y 2 (x2 + y 2 )2
(y 2 − x2 )2 (vx2 + vy2 ) + 4x2 y 2 (vx2 + vy2 )
v 2 = = g(z)(v, v). y 2 (x2 + y 2 )2 y2 Die u uften Matrizen erzeugen SL(2, R). Denn falls M = ac db ∈ ¨berpr¨ SL(2, R) nicht von der Form M1 ist, dann ist c = 0. Ist dann M nicht von der a = 0 oder d = 0. Durch Konjugation erreicht 0Form M2 ,0 dann ist −d c 1 1 man −1 0 M −1 0 = b −a , Durch nachfolgende Multiplikation mit einer Matrix vom Typ M1 kann manden rechten oberen Eintrag Null setzen. 0 1 Nochmalige Konjugation mit −1 0 erzeugt eine Matrix vom Typ M1 . =
Damit ist g unter allen M¨ obius–Transformationen invariant. (e) folgt aus Aufgabe 6.26 (a). 2 4 · zz33 −z ist genau dann (f) Das Doppelverh¨altnis DV (z1 , z2 , z3 , z4 ) := zz11 −z −z4 −z2 reell, wenn die vier Punkte z1 , z2 , z3 , z4 ∈ C auf einem Kreis liegen. 0 1 0 1 cos t sin t • m = −1 = − sin t cos t ist elliptisch (außer bei t ∈ 0 : exp t −1 0 πZ) mit Fixpunkt i ∈ H. Die Orbits sind Kreise in H, siehe Abbildung H.1, links. • m = ( 01 00 ): exp t ( 01 00 ) = ( 1t 01 ) ist parabolisch (nur bei t = 0 gleich ( 10 01 )) mit Fixpunkt 0 ∈ ∂H. Der Abschluss eines Orbits ist ein Kreis, der am Ursprung tangential an ∂H ist, siehe Abbildung H.1, Mitte. t sinh t • m = ( 01 10 ): exp t ( 01 10 ) = cosh ist hyperbolisch (außer bei sinh t cosh t t = 0) mit Fixpunkten −1, 1 ∈ ∂H. Die Orbits sind durch die Fixpunkte begrenzte Kreissegmente, siehe Abbildung H.1, rechts. 2
566
H. L¨osungen der Aufgaben 3
2
y
1
2
1
0
1 x
2.5
2.5
.0
2.0
1.5
1.5
1.0
1.0
0.5
0.5
2 1.5
1.0
0.5
0
0.5
1.0
1.5
1.5
1.0
0.5
0
0.5
1.0
1.5
Abbildung H.1: Orbits der Gruppen aus 6.42 (f) durch die Punkte 1 + i, 3i und i/2. Links: elliptisch, Mitte: parabolisch, Rechts: hyperbolisch Aufgabe 6.45 auf Seite 117 (Symplektische Abbildungen und Unterr¨ aume): (a) Da die antisymmetrische Bilinearform ω : E × E → R des 2n–dimensionalen Vektorraums E nicht degeneriert ist, gibt es f¨ ur v, w ∈ E\{0} nach dem linearen Satz von Darboux (Satz 6.13.2) sogar zwei Basen d1 , . . . , d2n und e1 , . . . , e2n von E mit d1 = v, e1 = w und ω(dk , d ) = ω(ek , e ) = δk+n,
(1 ≤ k ≤ ≤ 2n).
(H.1)
Die lineare Abbildung f : E → E, die durch den Basiswechsel f (dk ) := ek (k = 1, . . . , 2n) definiert wird, ist in Sp(E, ω). (b) Sei E := R4 mit kanonischer Basis e1 , . . . , e4 und symplektischer Form ω, die durch ω(ek , e ) = δk+2, (1 ≤ k ≤ ≤ 4) festgelegt ist. Dann ist F := span(e1 , e2 ) lagrangesch, F := span(e1 , e3 ) symplektisch. Daher gibt es kein f ∈ Sp(E, ω) mit f (F ) = F . (c) Seien F, F ⊆ E symplektisch und von gleicher Dimension 2m. Der Beweis von Satz 6.13.2 liefert die Existenz von Basen d1 , . . . , d2n und e1 , . . . , e2n von E mit (H.1) und d1 , . . . , d2m ∈ F , e1 , . . . , e2m ∈ F . Die durch f (dk ) := ek definierte Abbildung f ∈ Sp(E, ω) bildet also F auf F ab. 2 Aufgabe 6.47 auf Seite 118 (Dimensionsformel): Ist f1 , . . . , fm eine Basis von F ⊆ E, dann sind wegen der Nichtdegeneriertheit von ω die Linearformen ∗ f1∗ , . . . , fm ∈ E ∗ , fk∗ (e) := ω(fk , e) f¨ ur e ∈ E, linear unabh¨angig. Also ist ∗ F ⊥ = {e ∈ E | f1∗ (e) = . . . = fm (e) = 0}
von Dimension dim(F ⊥ ) = dim(E) − dim(F ).
2
∼ Aufgabe 6.53auf Seite 121 (SO(3) = RP(3)): • Die Rodrigues–Parametrisier∞ 3 ung A ∈ C Bπ , SO(3) aus (E.3.3) ist surjektiv und, eingeschr¨ankt auf die offene Vollkugel vom Radius π, ein Diffeomorphismus auf das Bild. Dies sieht man zum Beispiel, indem man nachpr¨ uft, dass f¨ ur x ∈(0, π) die Invertierung von A(x) durch
r 2 sin(r) (A(x)
− A(x) ) mit r := arccos
tr(A(x))−1 2
erfolgt.
H. L¨osungen der Aufgaben
567
Auch bei x ∈ ∂Bπ3 , also x = π ist A ein lokaler Diffeomorphismus. Bei Identifikation ∼ der Antipoden der Zwei–Sph¨are ∂Bπ3 ist A sogar injektiv. • Andererseits ist Bπ3 / ∼ diffeomorph zu RP (3). Denn unter einer (mit π/2 skalierten) stereographischen Projektion S 3 \{(0, 0, −1) } → R3 ist Bπ3 als berandete Mannigfaltigkeit diffeomorph zur Nordhalbkugel {x ∈ S 3 | x3 ≥ 0}, siehe Beispiel A.29.3. Außerdem hat jede Ursprungsgerade des R3 (also jedes Element von RP (3)) genau einen Schnittpunkt mit der Nordhalbkugel, bis auf ¨ 2 diejenigen, die den Aquator {x ∈ S 3 | x3 = 0} an Antipoden treffen. Aufgabe 6.59 auf Seite 124 (Maslov–Index): 1. F¨ ur u ∈ Λk (m) = {u ∈ Λ(m) | dim(u ∩ v) = k} mit v = Rm p × {0} setzen wir uv := u ∩ v. F¨ ur w ∈ Gr(v, k) besteht die Faser πk−1 (w) also aus den u ∈ Λk (m) mit uv = w. Diese l¨asst sich durch den Unterraum Sym(w ⊥ ) der selbstadjungierten Abbildungen von w⊥ := {x ∈ Rm | ∀ y ∈ w : x, y = 0} in sich parametrisieren, denn deren Graph ist lagrangesch, und der symplektische Vektorraum (Rm × Rm , ω0 ) ist die direkte Summe seiner symplektischen Unterr¨aume w × w und w ⊥ × w ⊥ . , denn dim w⊥ = m − k. Andererseits ist dim Sym w⊥ = m−k+1 2 Trivialisierung des B¨ undels πk : Λk (m) → Gr(v, k) ist u ¨ber einer Umgebung von w ∈ Gr(v, k) durch Orthogonalprojektion m¨oglich. Da die Dimension des Totalraums eines B¨ undels die Summe der Dimensionen von Basis und typischer Faser ist, folgt mit dim Gr(v, k) = k(m − k) (Satz 6.51) k+1 − 2 . dim Λk (m) = k(m − k) + 12 (m − k + 1)(m − k) = m+1 2 2. Die unter 1. gezeigte Parametrisierung von Λ0 (m) durch Sym(Rm ) zeigt, ur k ≥ 2, dann kann man in dass Λ0 (m) ⊂ Λ(m) offen ist. Ist u ∈ Λk (m) f¨ uv ∈ Gr(v, k) eine orthogonale Zerlegung uv = a⊕b in einen eindimensionalen Unterraum a und einen (k − 1)–dimensionalen Unterraum b w¨ahlen. Damit wird uv durch die Folge der Lagrange–Unterr¨aume ({0} × a) ⊕ Graph(n1lb )
(n ∈ N)
approximiert, mit der identischen Abbildung 1lb : b → b.
2
Aufgabe 6.61 auf Seite 125 (Wertebereich des Maslov-Index): • F¨ ur m = 1 und I ∈ Z hat die Abbildung c : S 1 → Λ(1) , z → spanR z I/2 ⊂ C ∼ = R2 den gew¨ unschten Maslov–Index I. Dabei wurde von der Schreibweise S 1 = {z ∈ C | |z| = 1} und Λ(1) = {spanR (z) | z ∈ S 1 } Gebrauch gemacht. Man beachte,
568
H. L¨osungen der Aufgaben
ur ungerade I wohldefiniert ist. dass spanR z I/2 auch f¨ • F¨ ur m > 1 bettet man Λ(1) in Λ(m) ein, etwa mit Λ(1) → Λ(m)
, u → u ⊕ Rm−1 × {0}.
2
Aufgabe 6.62 auf Seite 125 (Harmonischer Oszillator): Eine solche geschlossene L¨osungskurve c˜ : S 1 → F −1 (f ) ⊂ R4 ist f¨ ur f = (f1 , f2 ) mit fi > 0 und ki = 2fi /ωi gegeben durch c˜(t) = k1 sin(ω1 (t−t1 )), k2 sin(ω2 (t−t2 )), k1 cos(ω1 (t−t1 )), k2 cos(ω2 (t−t2 )) . Der invariante Phasenraum-Torus F −1 (f ) projiziert auf ein Rechteck des Konfigurationsraums. Entlang der Kurven {(0, k2 sin ϕ, ±k1 , k2 cos ϕ) | ϕ ∈ [0, 2π]} und {(k1 sin ϕ, 0, k1 cos ϕ, ±k2 ) | ϕ ∈ [0, 2π]} ist diese Projektion vertikal. Diese Kurven werden von c˜ innerhalb einer Periode [0, T ] mit T = ω6π1 = 10π ω2 sechsmal beziehungsweise zehnmal, also insgesamt 16–mal getroffen. Man sieht der Projektion t → k1 cos(ω1 (t−t1 )), k2 cos(ω2 (t−t2 )) von c˜ auf dem Konfigurationsraum an, dass die 1–Komponente sechs, die 2–Komponente zehn Extrema besitzt. 2
Kapitel 7, Stabilit¨ atstheorie Aufgabe 7.4 auf Seite 130 (Starke Stabilit¨ at): Zun¨achst einmal ist XH : Rt × R2x → R2 , XH (t, x) = 10 −f0(t) x das zeitabh¨angige hamiltonsche Vektorfeld zu H. Die Differentialgleichung ist ugt damit nach Satz 4.14 f¨ ur alle Zeiten l¨ osbar, denn XH ist linear in x und gen¨ einer Lipschitz–Bedingung. (a) Gegenbeispiel zur Gruppeneigenschaft: F¨ ur die 2–periodische charakteristische Funktion f := 1l[0,1]+2Z ist die eindeutige Existenz der L¨osung weiterhin gesichert, denn die Lipschitz–Bedingung bezieht sich nur auf x (siehe die Bemerkung 3.24.3). Wir k¨ onnen die Differentialgleichung st¨ uckweise l¨osen: cos(t) − sin(t) x(t) = Mk ({t})x( t) mit M0 (t) := sin(t) cos(t) , M1 (t) := ( 1t 01 ) und k := 0 f¨ ur gerade t, k := 1 f¨ ur ungerade t. Es ist M02 (1) = M0 (1)M1 (1). (b) F¨ ur s = 0 gilt ΦT +s = Φ0 ◦ ΦT , denn Φ0 = Id. Weiter gilt d ΦT +s (x) = XH T + s, ΦT +s (x) = 01 −f0(s) ΦT +s (x), ds denn f (T + s) = f (s), sowie d Φs ◦ ΦT (x) = XH s, Φs ◦ ΦT (x) = 01 −f0(s) Φs ◦ ΦT (x). ds ullen also dasselbe Die Funktionen s → Φs ◦ ΦT (x) und s → ΦT +s (x) erf¨ eindeutig l¨osbare Anfangswertproblem, und daher stimmen sie u ¨berein.
H. L¨osungen der Aufgaben
569
ur alle t ∈ R linear, denn f¨ ur t = 0 ist (c) Die Abbildung Φt : R2 → R2 ist f¨ Φ0 = Id, was sicher linear ist, weiter gilt d Φt (λx + y) = XH t, Φt (λx + y) = 01 −f0(t) Φt (λx + y) dt d und dt λΦt (x) + Φt (y) = λXH t, Φt (x) + XH t, Φt (y) = 10 −f0(t) λΦt (x) + Φt (y) . Die Funktionen erf¨ ullen dasselbe Anfangswertproblem, stimmen also u ¨berein. d Die Wronski–Determinante t → det Φt besitzt die Ableitung dt det Φt = −1 ˙ tr det(Φt )Φ−1 t Φt = det(Φt )tr Φt XH (t)Φt = det(Φt )tr XH (t) = 0. Wegen det Φ0 = 1 folgt insbesondere det A = 1. Mit J = 10 −1 ist 0 tr XH (t) = tr JB(t) = tr B (t)J = −tr B(t)J = −tr JB(t) = 0.
(d) Wenn die Nulll¨ osung des hamiltonschen Flusses Liapunov–stabil ist, dann ist 0 auch Liapunov–stabiler Fixpunkt der Abbildung A, denn es ist ja Ψ = ΦZ×R2 . Zur Umkehrung sei κ := (sup{ Φs | s ∈ [0, T ]})−1 und eine Umgebung U von 0 ∈ R2 gegeben. Wir w¨ahlen ε > 0, so dass Bε (0) ⊆ U und mit Hilfe der Liapunov–Stabilit¨at von Ψ ein δ > 0, so dass Ψ(n, x0 ) ∈ Bεκ (0) f¨ ur alle n ∈ N0 und f¨ ur alle Anfangsbedingungen x0 ∈ Bδ (0). F¨ ur t = nT + s mit n ∈ N0 und s ∈ [0, T [ erhalten wir
Φt (x) = Φs (Ψ(n, x)) ≤ Φs
Ψ(n, x) ≤ κ−1 εκ = ε. Damit ist Φ Liapunov–stabil. (e) Zun¨achst einmal ist Ψ Liapunov–stabil, wenn |tr(A)| < 2 erf¨ ullt ist, denn das charakteristische Polynom von A lautet χA (λ) = λ2 − λ trA + det A det A=1 1 1 1 1 2 2 = λ − 2 trA + i 1 − ( 2 trA) λ − 2 trA − i 1 − ( 2 trA) . Die Eigenwerte von A haben Betrag 1, wie man leicht nachrechnet. Damit ist A eine Drehung und Liapunov–stabil. 0 ˜ | H ˜ − H < δ} (t ∈ R) und U := {H Wir setzen B(t) := 10 f (t) ˜ mit noch zu bestimmendem δ > 0. Sei nun K := sup{ Φ−1 s , Φs | s ∈ ˜ von H ˜ ∈ U generiert.}. Es ist K < ∞, denn [0, T ], Φ t t ˜0 + ˜ 0 + ˜ Φ(s) ˜ ˜ ˜ ≤ Φ ˜ t = Φ J B(s) ds
B(s)
Φ(s)
ds
Φ 0
t
˜ ( B(s) + δ) Φ(s)
ds,
≤1+ 0
0
570
H. L¨osungen der Aufgaben und das Lemma von Gronwall verr¨at uns nun t ˜ t ≤ exp
Φ ( B(s) + δ) ds ≤ exp 0
T
( B(s) + δ) ds. 0
Wir vergleichen die beiden Zeitentwicklungen: d −1 ˜ ˙ = Φ−1 J B(t) − B(t) −1 ˜ −1 ˜ ˜ ˜t ˙ (Φt Φt ) = Φ−1 Φ Φ + Φ Φ Φ Φ t t t t t t t dt und erhalten t d −1 ˜ ˜ ˜
Φt − Φt ≤ Φt
Φt Φt − 1l = Φt (Φ−1 s Φs ) ds ds 0 t 3 ˜ ˜
Φ−1 ≤ Φt
t B(t) − B(t) Φt ds ≤ K T δ. 0
˜ Liapunov–stabil, und der FixWegen der Stetigkeit der Spur sind alle Φ punkt 0 ist stark stabil. Matrizen mit absoluter Spur kleiner 2 heißen auch elliptisch. (f) F¨ ur ε = 0 reduziert sich die Differentialgleichung zu x ¨(t) = −ω 2 x(t), und der Fluss hat die Form cos(ωt) −ω sin(ωt) . Φt = ω −1 sin(ωt) cos(ωt) Es ist T = 2π, und entsprechend ist cos(2πω) −ω sin(2πω) A = Φ2π = ω−1 sin(2πω) cos(2πω) mit |tr(A)| = 2|cos(2πω)| < 2, weil 2ω ∈ Z.
2
Aufgabe 7.8 auf Seite 132 (Liapunov–Funktion): d V (x(t)) = − x(t) 4 < 0 (a) Es ist ∇V (x) = x und f1 (x) = − x 2 x, also dt 2 f¨ ur x ∈ R \ {0}. Der Ursprung ist damit asymptotisch stabil.
(b) Wegen f2 = −f1 ist der Ursprung instabil. 2 d (c) Die Form f3 (x) = (1+x1 ) −x V (x(t)) = x1 des Vektorfeldes impliziert, dass dt 0 ist, die Orbits also in Kreisen um den Ursprung enthalten sind. Jeder Punkt auf der Gerade x1 = −1 entspricht einem Orbit, ebenso die Kreissegmente, die durch Schnitt dieser Kreise mit den Halbebenen (−1, ∞) × R und (−∞, −1) × R entstehen. (d) V : R3 → R, x → 12 x 2 ist eine Liapunov–Funktion, mit f4 (x), ∇V (x) = −x21 x 2 − x42 − x63 < 0 Also ist 0 ∈ R3 asymptotisch stabil.
f¨ ur x ∈ R3 \ {0}.
H. L¨osungen der Aufgaben
571
cos t − sin t 0 0 −1 0 (e) Es ist A := Df (0) = 1 0 0 , also exp(At) = sin t cos t 0 . Der Ur0 0 0 0 0 1 sprung dieses linearisierten Systems ist damit liapunov–stabil, aber nicht asymptotisch stabil. Insbesondere besteht die x3 –Achse aus Fixpunkten. 2 Aufgabe 7.21 auf Seite 141 (Parametrisierte periodische Orbits): Nach Annahme ist die Abbildung (t, m, p) → Φpt (m) n-mal stetig differenzierbar, und f¨ ur Parameterwert p0 ∈ P gibt es nach Satz 7.17 eine Poincar´e–Abbildung von Φp0 beim Punkt m ∈ M des Φp0 –periodischen Orbits. Es folgt aus einem Transversalit¨atsargument die Existenz einer Umgebung P˜ ⊆ P von p0 und einer zu allen Fl¨ ussen Φp , p ∈ P˜ transversalen Hyperfl¨ache S ⊂ M durch m. Damit existieren auch eine in S offene Umgebung U ⊂ S von m, und Poincar´e–Zeiten T˜ : U × P˜ → R+ mit F p (u) := Φp T˜(u, p), u ∈ S. Nach Voraussetzung ist F p0 (m) = t0 , und T˜, also auch (u, p) → F p (u) sind in C n . Ebenfalls ist nach Voraussetzung 1 kein Eigenwert von DF p0 (m). Damit n ˜ ur erhalten 0 ) = m, f¨ wir mit Satz 7.12 eine Abbildung X ∈ C (P , S), mit X(p p 4 die F X(p) = X(p) ist, die also den Fixpunkt parametrisiert. Ebenso k¨onnen wir annehmen, dass DF p X(p) keinen Eigenwert 1 besitzt. Die Minimalperiode t : p˜ → (0, ∞) ist die durch t(p) = T˜ X(p), p definierte Abbildung. Es kann zwar in beliebigen kleinen Umgebungen vom X(p) weitere periodische Orbits geben, aber nicht mit einer nahe bei t(p) liegenden Minimalperiode. 2
Kapitel 8, Variationsprinzipien Aufgabe 8.5 auf Seite 146 (Legendre–Transformation): ur q ∈ R d (a) Wegen r > 1 ist H ∈ C 1 (Rd , R) und strikt konvex. Wir suchen f¨ d den Vektor pˆ = pˆ(q) ∈ R mit = 0. ∇p p, q − H(p) p=pˆ
r−2
p
Wegen ∇H(0) = 0 ist pˆ(0) = 0. Sonst gilt q = ˆ p pˆ, also q = ˆ s−1 oder mit (r − 1)(s − 1) = 1: ˆ p = q . Daher ist pˆ =
q
ˆ p
r−2
=
q
rs=r+s
(r−2)(s−1)
q
=
q
s−2
r−1
q.
Damit k¨onnen wir H ∗ ausrechnen: s−2 s−2 s (s−1)r s = 1s q . H ∗ (q) = q, q q − H q q = q − 1r q
(b) Wir gehen wie in (a) vor. 0 = ∇p p, q − H(p) 4 Hier
p=pˆ
= q − Aˆ p − b,
und im Weiteren m¨ ussen gegebenenfalls Definitionsbereiche wie P˜ verkleinert werden.
572
H. L¨osungen der Aufgaben also q = Aˆ p + b oder pˆ = A−1 (q − b). Und wieder berechnen wir H ∗ : H ∗ (q) = q, A−1 (q − b) − H A−1 (q − b) = q, A−1 (q − b) − 12 A−1 (q − b), AA−1 (q − b) − b, A−1 (q − b) − c = q − b, A−1 (q − b) − 12 q − b, A−1 (q − b) − c = 12 q − b, A−1 (q − b) − c.
2
Aufgabe 8.8 auf Seite 148 (Legendre-Transformation): v cos ϕ−v r sin ϕ (a) Polarkoordinaten: x = r cos ϕ, y = r sin ϕ, v = vrr sin ϕ+vϕϕr cos ϕ . v ˜ x(r,ϕ) , vr cos ϕ−vϕ r sin ϕ L(( ϕr ) , ( vϕr )) = L = 12 (vr2 + r2 vϕ2 ) − U (r). vr sin ϕ+vϕ r cos ϕ y(r,ϕ) Die Legendre–Transformierte davon lautet H(( ϕr ) , ( ppϕr )) = 12 p2r + r−2 p2ϕ + U (r). (b) Es ist ∇v L(q, v) = mv + ec A(q), also folgt sup p, v − L(q, v) | v ∈ R2 1 = p, m (p − ec A(q)) −
=
1 2m p
1 2m p
2
− ec A(q) + eφ(q) −
e cm p
− ec A(q), A(q)
2
− ec A(q) + eφ(q).
2
Aufgabe 8.12 auf Seite 152 (Perle am Draht): (a) Zum Zeitpunkt t ∈ R wird der parabolische Draht parametrisiert durch w −→ q˜(t, w) =
w cos(ωt) w sin(ωt) α2 2
.
w2
Ist der Parameterwert gleich w(t), dann ist f¨ ur q(t) := q˜ t, w(t) ⎞ ⎛ w(t) ˙ cos(ωt) − ωw(t) sin(ωt) ˙ sin(ωt) + ωw(t) cos(ωt) ⎠ , q(t) ˙ = ⎝ w(t) ˙ α2 w(t)w(t) also q
˙ 2 = w˙ 2 +w 2 ω 2 +α4 w2 w˙ 2 . Die nicht explizit zeitabh¨angige Lagrange– Funktion besitzt damit die Gestalt 2 4 2 w w˙ 2 + m − gα2 w2 . L(w, w) ˙ = m 2 1+α 2 ω Der zu w konjugierte Impuls ist pw = D2 L(w, w) ˙ = m(1 + α4 w2 )w. ˙ Damit 2 2 ist die Hamilton–Funktion f¨ ur c := gα − ω gleich H(pw , w) =
p2w + V (w) 2m(1 + α4 w2 )
mit
V (w) =
2 m 2 cw .
H. L¨osungen der Aufgaben
573
(b) Die Linearisierung A := DXH (0) des hamiltonschen Vektorfelds XH = −D2 H 0 −mc 1 . Damit ist det(A) = am Ursprung ist von der Form A = 0 D1 H m c. F¨ ur c > 0 (d.h. langsame Rotation) ist daher die Ruhelage (pw , w) = (0, 0) ein elliptischer Fixpunkt und die Bewegung Liapunov–stabil. (c) F¨ ur langsame Rotation (c > 0) wird die Periode der Librationsbewegung in Abh¨angigkeit von der Energie E durch wmax + √ dw 2(E−β 2 w2 ) E mit w(E, ˙ w) = m(1+α T (E) = 4 4 w 2 ) und wmax = β w(E, ˙ w) 0 bestimmt. Es ergibt sich √ √ H 4 2 y 8m 1 1+ Eα 8m π/2 β2 T (E) = dy = 1+ 1−y 2 β β 0 0
Eα4 β2
sin2 θ dθ.
2
Aufgabe 8.20 auf Seite 156 (Beispiel zur Nichtminimalit¨ at des Wirkungsfunktionals): (a) Die Extremalen erf¨ ullen die Euler–Lagrange–Gleichung (8.3.4), also q¨ = −(0, q2 ) . Die L¨ osungsschar mit Anfangsbedingung q(0) = 0 hat die Form (t ∈ R). q(t) = c2v1sint t F¨ ur T ∈ R\πZ kann nur dann q(T ) = 0c sein, wenn v1 = Tc und c2 = 0 gilt. Ist dagegen T ∈ πZ\{0}, dann erhalten wir die einparametrige L¨osungsschar q(t) = Tc t, c2 sin t . (b) Die Variation des Wirkungsfunktionals in Richtung δq ist X(δq)
=
1 2
=
1 2
T 0
% c & 2 c 2 T + δ q(t) − T − δq 2 (t) dt ˙ 2 0 0
T 2 [ δ q(t)
˙ − δq22 (t)] dt + 0
0
T
)
c T
0
* , δ q(t) ˙ dt.
- c
. Das zweite Integral ist gleich T0 , δq(T ) − δq(0) = 0. F¨ ur die angegebene πnt
∞ π Variation ist δ q˙2 (t) = T n=1 ncn cos T , also ist X(δq) gleich ∞ n=1
T
c2n 0
/
π2 2 n cos2 T2
πnt T
− sin
2
πnt T
0
∞ c2n 2 2 dt = (π n − T 2 ). 2T n=1
F¨ ur T ∈ lπ, (l + 1)π und l ∈ N0 ist π 2 n2 < T 2 genau dann, wenn n ≤ l gilt. Auf dem durch ck = 0 (k > l) bestimmten Unterraum ist also X negativ definiert, aber es gibt keinen h¨ oherdimensionalen solchen Unterraum von Variationen. 2
574
H. L¨osungen der Aufgaben
Aufgabe 8.21 auf Seite 159 (Tautochronen-Problem): Die Zeit, die zwischen dem Start am Punkt (x0 , y0 ) und der Ankunft am tiefsten Punkt (r, −2r) vergeht, ist analog zu (8.3.6) H r+ r 1 + Y (x)2 r T˜(y0 ) := dx = dx, 2g(y0 − Y (x)) gY (x)(Y (x) − y0 ) x0 (y0 ) x0 denn die Startgeschwindigkeit ist 0. Bei der Umformung wurde die Differentialgleichung (8.3.7) der Brachistochrone verwandt. Substitution der y–Variable ergibt T˜(y0 ) =
−2r
+
y0
dy r gy(y − y0 ) −1 −
2r y
−2r
+
= y0
r dy. g(−y − 2r)(y − y0 )
y0 −y Substitution von z := 2r+y , also y = y0 − z(2r + y0 ), ergibt 0 1 r T˜(y0 ) = dz = π r , unabh¨angig von y0 . 0
gz(1−z)
g
2
Aufgabe 8.23 auf Seite 161 (L¨ angenfunktional und Euler–Lagrange-Gleichung in Polarkoordinaten): (a) Die Polarkoordinaten (r, ϕ) ∈ (0, ∞) × (−π, π) der geschlitzten Ebene stehen zu den kartesischen Koordinaten in der Beziehung x1 = r cos ϕ, x2 = r sin ϕ. Es ist also ˙ sin ϕ , x˙ 2 = r˙ sin ϕ + ϕr ˙ cos ϕ x˙ 1 = r˙ cos ϕ − ϕr
und x
˙ 2 = r˙ 2 + r2 ϕ˙ 2 .
˙ 2 besitzt damit die Gestalt Die Lagrange–Funktion L(x, x) ˙ = 12 x
1 2
gr,r (r, ϕ)r˙ 2 + 2gr,ϕ (r, ϕ)r˙ ϕ˙ + gϕ,ϕ (r, ϕ)ϕ˙ 2 ,
ur die mit gr,r = 1, gr,ϕ = 0 und gϕ,ϕ (r, ϕ) = r2 . Die Formel (8.4.2) f¨ Christoffel–Symbole ergibt mit g r,r = 1, g r,ϕ = 0 und g ϕ,ϕ (r, ϕ) = r−2 : Γrϕ,ϕ (r, ϕ) = −r
,
Γϕ r,ϕ (r, ϕ) =
1 = Γϕ ϕ,r (r, ϕ), r
ϕ w¨ahrend Γrr,ϕ = Γrϕ,r = Γrr,r = Γϕ ϕ,ϕ = Γr,r = 0 ist.
(b) Mit der obigen Form des metrischen Tensors in Polarkoordinaten ist das t1 t1 2 2 2 L¨angenfunktional von der Form t0 x(t)
˙ dt = t0 r˙ + r ϕ˙ dt. Nach (8.4.3) sind die Euler–Lagrange–Gleichungen des Energiefunktionals in Po˙ = 0, also larkoordinaten r¨ + Γrϕ,ϕ (r, ϕ)ϕ˙ 2 = 0, ϕ¨ + 2Γϕ r,ϕ (r, ϕ)r˙ ϕ r¨ = rϕ˙ 2
2 ˙ und ϕ¨ = − r˙ ϕ. r
2
H. L¨osungen der Aufgaben
575
Aufgabe 8.26 auf Seite 163 (Rotationsfl¨ achen-Geod¨ aten): Die Bedingung positiven Profils R(x3 ) > 0 ist wichtig, ansonsten ist M keine Mannigfaltigkeit. (a) In der Formel f¨ ur die Christoffel–Symbole: ∂g ∂gi,l ∂gi,j l,j 1 k,l Γki,j (x) = g (x) (x) + (x) − (x) 2 ∂xi ∂xj ∂xl
(i, j, k ∈ {r, ϕ})
l
ist der metrische Tensor g(x) = R (z) cos ϕ −R(z) sin ϕ R (z) cos ϕ R (z) sin ϕ 1 −R(z) sin ϕ R(z) cos ϕ 0
denn
x1 x2 x3
=
R(z) cos ϕ R(z) sin ϕ z
R (z) sin ϕ R(z) cos ϕ 1 0
Γϕ z,ϕ
(R (z))2 +1 0 0 (R(z))2
,
. Die Christoffel–Symbole lauten also
∂gz,z R (z)R (z) = ∂z (R (z))2 + 1 ∂gϕ,ϕ R(z)R (z) =− = − 12 g z,z ∂z (R (z))2 + 1 R (z) 1 ϕ,ϕ ∂gϕ,ϕ = Γϕ = ϕ,z = 2 g ∂z R(z)
Γzz,ϕ = Γzϕ,z = − 12 g z,z
Γzz,z = 12 g z,z Γzϕ,ϕ
=
∂gz,z =0 ∂ϕ
∂gz,z =0 ∂ϕ ∂gϕ,ϕ = 12 g ϕ,ϕ = 0. ∂ϕ
1 ϕ,ϕ Γϕ z,z = − 2 g
Γϕ ϕ,ϕ
Die allgemeine Geod¨atengleichung ist x ¨k + setzt sich das zur Behauptung.
i,j
Γkij x˙ i x˙ j = 0, und hier u ¨ber-
(b) Ein Meridian γ : I → M hat die Form R(z(t)) cos ϕ R (z(t))z(t) ˙ cos ϕ R(z(t)) sin ϕ (z(t)) z(t) ˙ sin ϕ R γ(t) = , also γ(t) ˙ = . z(t)
z(t) ˙
Nach Bogenl¨ange zu parametrisieren heißt γ(t)
˙ = 1 f¨ ur alle t zu fordern. Das bedeutet 2 2 −1 2 (R (z(t)))2 +1 , also z(t) 1 = γ(t)
˙ = z(t) ˙ ˙ = (R (z(t)))2 +1 . (H.2) Wir notieren z(t) ˙ = 0. Ableiten dieser Gleichung liefert uns −2 ˙ R z(t) R z(t) z(t) z(t)¨ ˙ z (t) = − (R (z(t)))2 + 1 Zusammen mit (H.2) und ϕ˙ = 0 ergibt das die Geod¨atengleichung f¨ ur z. Die Geod¨atengleichung f¨ ur ϕ ist trivialerweise erf¨ ullt. (c) Breitenkreise γ : R → M haben die Form −R(z)ϕ(t) ˙ sin ϕ(t) R(z) cos ϕ(t) γ(t) = R(z) sin ϕ(t) , also γ(t) ˙ = . R(z)ϕ(t) ˙ cos ϕ z
0
Nach der Geod¨atengleichung f¨ ur z und z˙ = z¨ = 0 ist R (z) = 0 und nach der Geod¨atengleichung f¨ ur ϕ die Parametrisierung von γ mit konstanter Geschwindigkeit. 2
576
H. L¨osungen der Aufgaben
Aufgabe 8.35 auf Seite 170 (Lichtbrechung): 1. Es ist ∇v L(q, v) = n(q)2 v und ∇q L(q, v) = n(q) v 2 ∇n(q), also d ˙ = 2n(q) ∇n(q), q ˙ q˙ + n(q)2 q¨, ∇v L(q, q) dt woraus sich (8.6.1) nach Division durch n > 0 ergibt. (8.35) folgt durch Substitution y˜(x(t)) = y(t) der unabh¨angigen Variablen x aus der in der Form y = n (x˙ 2 − y˙ 2 ) n¨ x = −2n x˙ y˙ , n¨ ¨(t) + x(t) ˙ 2 y˜ x(t) . geschriebenen Gleichung (8.6.1), denn y¨(t) = y˜ x(t) x 2. Auswertung von (8.6.1) f¨ ur einen nur von der y–Koordinate abh¨angigen Brechungsindex n ergibt also die Differentialgleichung 2n (y)y˙ x˙ + n(y)¨ x=0
, oder
d 2 n (y)x˙ = 0. dt
(H.3)
Also ist x˙ = c/n2 (y), mit einer Konstante c. Wenn man dies in die konstante Lagrange–Funktion L eintr¨agt, ergibt sich aus = 12 n2 (y)x˙ 2 1 + (y (x))2 die Beziehung 1 + (y (x))2 = c22 n2 (y) oder + 2 2 n (y) − 1. y (x) = ± c2 Diese Differentialgleichung ist durch Separation der Variablen l¨osbar. F¨ ur n von der Form (8.6.3) ergibt sich (8.6.4). Die Integration von (H.3) ist wegen der Translationsinvarianz der Lagrange– Funktion in x–Richtung m¨ oglich. 3. Mit den angegebenen Koordinaten der Punkte ai ist die Laufzeit x20 + y12 (x2 − x0 )2 + y22
a1 − a0 a2 − a0
T (a0 ) = + + + . c1 c2 c1 c2 Bezeichnen wir diese nur noch von x0 abh¨angige Funktion mit t(x0 ), dann ist t (x0 ) = sinc1α1 − sinc2α2 , denn sin α1 = √ x20 2 und sin α2 = √ x2 −x02 2 . x0 +y1
(x2 −x0 ) +y2
Bei minimalem t gilt t (x0 ) = 0, also das Brechungsgesetz von Snellius.
2
Aufgabe 8.41 auf Seite 173 (Reflektion von Licht an einer Tasse): sin ϕ (a) Die zur 1-Achse parallelen Strahlen, die an der Stelle A(ϕ) := cos ϕ mit ϕ ∈ [0, π] die Kreislinie treffen, werden an deren Normale A(ϕ) gespiegelt. π Die gespiegelten Strahlen haben also die Richtung A + 2ϕ = C(2ϕ) 2 cos ϕ mit C(ϕ) := − sin ϕ . Andererseits folgt bei Benutzung trigonometrischer Additionstheoreme, dass der zweite Schnittpunkt des gespiegelten Strahls mit S 1 der Punkt A(3ϕ) = A(ϕ) + 2 sin(ϕ) C(2ϕ) ist.
H. L¨osungen der Aufgaben
577
d A(ϕ) = C(ϕ) folgt (b) Aus JA(ϕ) = −C(ϕ) und dϕ 6 5 d Bt (ϕ), J A(3ϕ) − A(ϕ) = tC(ϕ) + 3(1 − t)C(3ϕ), C(ϕ) − C(3ϕ). dϕ
F¨ ur t =
3 4
ist dies gleich
3 4
C(ϕ) + C(3ϕ), C(ϕ) − C(3ϕ) = 0.
ur ϕ = (c) Daher ist die Kaustik die Kurve ϕ → B3/4 (ϕ). Genau f¨ d 3 dϕ B3/4 (ϕ) = 4 C(ϕ) + C(3ϕ) = 0. Dies entspricht dem Punkt 3π 1/2 π 1 . 3A +A = 0 4 2 2
π 2
ist
2
In diesem Brennpunkt sammeln sich die parallelen Lichtstrahlen.
Aufgabe 8.42 auf Seite 174 (Lineare Optik): A ∈ Sp(4, R), denn A ist symmetrisch, • Zun¨achst ist tats¨achlich N := 10l Δn 1l und daher ist das Kriterium aus Aufgabe 6.26 (b) erf¨ ullt. • An der Stelle O(q), q ∈ R3 der Grenzfl¨ache zeigt die Fl¨achennormale in 1 die Richtung −Aq + O( q 3 ). Der Strahl in dem ersten Medium besitze die 1 1 Richtung v1 := p1 /n1 / p1 /n1 , nach Brechung an der Grenzfl¨ache v2 := 1 1 Gesetz gilt mit dem Einheitsvektor p2 /n2 / p2 /n2 . Nach dem snellschen e(q) der Fl¨achennormale an der Stelle O(q), q , dass die durch wi := vi − in der n1 w1 = vi , e(q) e(q) gegebenen Tangentialkomponenten 1 1 Beziehung n2 w2 stehen. Hier ist e(q) = −Aq + O( q 2 ), denn −Aq
= 1 + O( q 2 ). 1 + O( x 2 ) = pi /n0i +Aq + O( x 2 ), mit Damit ergibt sich wi = vi − −Aq dem Phasenraumpunkt x = (p, q) ∈ R2 × R2 . Nach dem snellschen Gesetz ist damit 2 p2 = p1 + Δn Aq + O( x 2 ) , mit Δn := n1 − n2 . Aufgabe 8.45 auf Seite 175 (Optische Ger¨ ate): 1. Das dem Auge zugewandte Okular des Mikroskops ist eine D¨ unne Linse mit ur das dem Objekt zugewandte Objektiv nennen wir Brennweite fok , und f¨ die entsprechende Gr¨ oße fob . Um das Objekt entspannt zu betrachten, sollen die das Okular verlassenden, von einem Objektpunkt stammenden Strahlen ein paralleles B¨ undel bilden. Das erreichen wir z.B. durch Einstellen des Abstandes d zwischen den Linsen. F¨ ur den Abstand dob zwischen Objekt und Objektiv ergibt sich die Matrix Md des Mikroskops als 1+d(dob −fob )−dob (fok +fob ) d−fok −fob 1 −1/f 1 0 1 −1/f 1 0 fok fob fok fob ok ob . ( = ) ddob dob 1 d0 d 0 1 0 1 d+dob −
fob
1− f
ob
Nach unseren Anforderungen muss das von einem ausgehende Licht Punkt durch Md parallelisiert werden, das heißt Md 0c = c0 . Der linke obere Matrixeintrag muss also verschwinden, was f¨ ur Abstand d = fok + bob mit Bildweite
578
H. L¨osungen der Aufgaben
bob des Objektivs geschieht. W¨ahlt man diesen Parameter d = fok + von Md , dann ist fob 0 (dob −fob )fok Md = . dob fok fok dob fok −
fob
1− f + f ob
dob fob dob −fob
ob −fok
0 mit Md , dann Multipliziert man eine Ver¨anderung des Objektivpunktes Δq ergibt sich die Ver¨anderung des Winkels der ausgehenden Strahlen m22 Δq gegen die optische Achse. Bei Beobachtung des Objekts mit bloßem Auge mit Abstand D (z.B. D = 25 cm), ist dagegen diese Winkelver¨anderung von der Form Δq oßerung des Mikroskops um den D . Der Vergleich liefert die Vergr¨ Faktor d − fok − fob · D. fok · fob Zum Beispiel ergibt sich f¨ ur die Brennweiten fob = fok = 25 mm und den Linsenabstand d = 30 cm der Objektabstand dob = 27, 5 mm und eine Vergr¨oßerung um den Faktor 100. 2. Optiker rechnen gern in Dioptrien, also Kehrwerten von Brennweiten (Einheit 1 dpt = 1/m). Wie man an (8.7.5) abliest, addieren sich diese Kombina bei 1
1
tion von Linsen, wenn deren Abstand d = 0 ist, denn L0 = 1l f1 + f2 1l . 0 1l ur die GeF¨ ur positive Abst¨ande d liest man aus Ld die Gullstrand–Formel f¨ samtbrechkraft Dges ab: Dges = D1 + D2 − dD1 D2
, f¨ ur Di := 1/fi .
Ist D1 der Brechwert des Auges (also der Kombination von Hornhaut und Linse), Dges der Kehrwert des Abstandes zum Gelben Fleck, dann muss die Dges −D1 Brille D2 = 1−dD Dioptrien haben, um auf die Ferne zu korrigieren. 1 F¨ ur die beiden Brechzahlen des astigmatischen Auges gilt diese Formel auch, denn die Hauptkr¨ ummungsachsen stehen ja senkrecht aufeinander (siehe auch Beispiel 8.24). Typische Werte sind Dges = 60 dpt, und der Hornscheitelabstand (Abstand zwischen Glas und Hornhaut) d = 14 mm. F¨ ur Kontaktlinsen ist d = 0, und entsprechend ¨andert sich der notwendige Brechwert. 2
Kapitel 9, Ergodentheorie Aufgabe 9.6 auf Seite 180 (Invariantes Maß): Die Gauss–Abbildung h gleicht & 1 1 auf ihren Stetigkeitsintervallen den Abbildungen hn : n+1 , n → [0, 1), x → & 1 1 1 1 x − n (n ∈ N). Diese besitzen die Inversen fn : [0, 1) → n+1 , n , y → y+n . Das Bildmaß des Maßes mit Dichte x →
1 1+x
hat damit an der Stelle y ∈ [0, 1)
H. L¨osungen der Aufgaben
579
die Dichte ∞ ∞ ∞ |fn (y)|−1 1 1 = = (y+n)(y+n+1) y+n − 1 + f (y) n n=1 n=1 n=1
1 y+n+1
Das Maß ist also invariant unter der Gauss–Abbildung. Wegen ist μ ein Wahrscheinlichkeitsmaß.
1 . y+1
=
1
1 0 1+x
dx = log 2 2
Aufgabe 9.10 auf Seite 181 (Phasenraumvolumen): F¨ ur E < 0 ist das Volumen des Phasenraumbereichs mit dieser H¨ ochstenergie gleich dp dq V (E) = λ2n H −1 (−∞, E] = Bn
|E|−1/a
=
n B√
2(E+q−a )
−1/q
|E|
v (n) s(n−1)
n/2 r n−1 2(E + r−a ) dr,
0 (n)
n
(B1n )
das Lebesgue–Maß der n–dimensionalen Einheitskugel und wobei v = λ s(n−1) das Maß von S n−1 bezeichnen. Bei Radius r = 0 ist der Integrand zu a 2n/2 rn(1− 2 )−1 asymptotisch, ist also genau f¨ ur a ∈ (0, 2) integrabel. 2 Aufgabe 9.23 auf Seite 189 (Korrelationsabfall): Diese Aufgabe basiert auf [BrSi]. Wir benutzen die Orthonormalbasis ek der Charaktere aus (9.3.5). (a) Wir m¨ ussen den Ausdruck f, U n g − f, 1l1l, g -
. -
.-
.
= fk ek (x), g e (T n x) − fk ek (x), 1l 1l, g e (x) k∈Z2
=
∈Z2
k∈Z2
. fk g ek (x), e(Tˆ )n (x) − f0 g0 =
∈Z2
fk gT˜ −n k
k∈Z2 \{0}
k,∈Z2
kontrollieren. (b) Die Summe fassen wir als Skalarprodukt auf und wenden die H¨older–Ungleichung und die letzte Ungleichung aus dem Tipp darauf an (diese sieht man durch Einschieben von x: F¨ ur x ≥ y ≥ 1 ist xy ≥ x ≥ x+y 2 .) n n −1 ˜ ˜ fk gT˜ n k = ( k 2 fk )( T k 2 gT˜n k )( k 2 T k 2 ) k∈Z2 \{0} k∈Z2 \{0} 1 4 ≤ 12 L ( k 2 T˜n k 2 )−4 ≤L
k∈Z2 \{0}
( k 2 + T˜n k 2 )−4
k∈Z2 \{0}
14
(H.4)
580
H. L¨osungen der Aufgaben 1 1
2 2 2
4 4 4 . Es ist L < ∞, mit L := 2 k∈Z2 \{0} k 2 |fk | h∈Z2 \{0} h 2 |gh | p 2 2 da die –R¨aume monoton in p sind, also speziell (Z ) ⊂ 4 (Z2 ) ist. Damit ergibt sich die Behauptung.
(c) • Sei n = 2m zun¨achst gerade. Wir m¨ ussen die Terme k 2 + T˜n k 2 in (H.4) nach unten absch¨atzen, und benutzen daf¨ ur h := T˜ m k:
T˜m h 2 + T˜ −m h 2 ≥ C −1 ( T˜m h E + T˜−m h E ) = C −1 (λ−m hs 2 + λm hu 2 + λm hs 2 + λ−m hu 2 ) C −1 λm h E ≥ C −2 λm h 2 .
≥
Da die Abbildung k → h = T˜ m k eine Permutation von Z2 \ {0} ist, erhalten wir 1 −4 4 |f, U n g − f, 11, g| ≤ C 2 Lλ−m
h 2 . h∈Z2 \{0}
• F¨ ur ungerade n = 2m + 1 ist analog
T˜m +1 h 2 + T˜−m h 2 ≥ C −1 ( T˜ m +1 h E + T˜−m h E )
= C −1 (λ−m −1 hs 2 + λm +1 hu 2 + λm hs 2 + λ−m hu 2 )
≥ C −1 λm h E ≥ C −2 λm h 2 ,
also |f, U n g − f, 11, g| ≤ C 2 Lλ−m • Aus m =
n 2
=
n2
und m =
n−1 2
=
n2
h∈Z2 \{0}
−4
h 2
14
.
folgt die Behauptung.
2
Aufgabe 9.25 auf Seite 190 (Produktmaß auf dem Shiftraum): • Die Zylindermengen bilden ein Mengensystem S, das die σ–Algebra M erzeugt. Sind zun¨achst A, B ∈ S, dann gibt es ein T ∈ N mit μp (Φt (A) ∩ B) = μp (A) μp (B)
(|t| ≥ T )
f¨ ur die Produktmaße μp . Dies ist bei Zylindermengen A = [τ1 , . . . , τj ]k+j−1 k und B = [κ1 , . . . , κi ]+i−1 f¨ ur T := max( + i − k, k + j − ) der Fall. ˜ B ˜ der von • Sind nun A, B ∈ M, dann gibt es f¨ ur alle ε > 0 Elemente A, den Zylindermengen erzeugten Algebra A(S) mit symmetrischen Differenzen ˜ ˜ μp (AΔA) < ε und μp (BΔB) < ε (siehe zum Beispiel Elstrodt [El]). F¨ ur dieses Paar gibt es ebenfalls eine Minimalzeit T˜ mit ˜ ∩B ˜ = μp (A) ˜ μp (B) ˜ |t| ≥ T˜ . μp Φt (A) Andererseits ist wegen ˜ ∩B ˜ ⊆ Φt (A) Δ Φt (A) ˜ ∪ BΔB ˜ Φt (A) ∩ B Δ Φt (A)
H. L¨osungen der Aufgaben
581
f¨ ur alle Zeiten t das Maß der linken Seite kleiner als 2ε. Ist nun |t| ≥ T˜, dann folgt μp Φt (A) ∩ B − μp (A) μp (B) ≤ ˜ ∩B ˜ + μp Φt (A) ˜ ∩B ˜ − μp (A) ˜ μp (B) ˜ μp Φt (A) ∩ B − μp Φt (A) ˜ − μp (A)| μp (B) ˜ + μp (A) |μp (B) ˜ − μp (B)| + |μp (A) < 2ε + 0 + ε + ε = 4ε. Da ε > 0 beliebig war, folgt lim|t|→∞ μp Φt (A) ∩ B = μp (A) μp (B).
2
Aufgabe 9.27 auf Seite 193 (Shiftraum): • Wir finden zun¨achst einen Punkt ur m = {mk }k∈Z ∈ M mit H¨aufungsmenge [−1, 1] der Mittelwerte. Sei daf¨ 1 , k ∈ {−1, 0, 1} mk := log2 (log2 |k|) (−1) , k ∈ Z \ {−1, 0, 1}. Nun w¨ahlen wir die Teilfolge na := 2(2 k ∈ {n2a , . . . , n2a+1 − 1} k ∈ {n2a+1 , . . . , n2a+2 − 1}
a
)
und bemerken f¨ u r a ∈ N0 =⇒ =⇒
mk = 1 mk = −1.
Damit k¨onnen wir die Mittelwerte f¨ ur die Teilfolge absch¨atzen:
2a −1 |An2a f (m) + 1| = n12a nt=0 f ◦ Φt (m) + 1 n2a−1 −1
≤
1 n2a
≤
n2a−1 n2a
t=0
1 1+ n2a
n 2a −1
f ◦ Φt (m) + 1
t=n2a−1
a−1 a a−1 a→∞ n 2a−1 + n2a −n − 1 = 21+2 −2 = 21−2 −−−→ 0, ≤ 2 n2a−1 n2a 2a
das heißt lima→∞ An2a f (m) = −1. Ebenso erhalten wirlima→∞ An2a+1 f (m) = 1. Damit sind ±1 H¨aufungspunkte der Folge An f (m) n∈N . Wegen n 1 n−1 1 f ◦ T t (m) − f ◦ T t (m) |An f (m) − An+1 f (m)| = n t=0 n + 1 t=0
≤
1 n
−
n−1 n−1 n 1 2 1 |f ◦ T t (m)|+ f ◦T t (m)− f ◦T t (m) ≤ n + 1 t=0 n + 1 t=0 n + 1 t=0
m¨ ussen dann alle Punkte zwischen −1 und 1 H¨aufungspunkte sein. • Nun m¨ ussen wir {m} ⊆ M zu einer dichten Teilmenge U von M ausbauen. Wir setzen f¨ ur alle m ∈ M mk , |k| ≤ s (s ∈ N, k ∈ Z). xm ,s ∈ M mit xkm ,s := mk , |k| > s
582
H. L¨osungen der Aufgaben
Es ist also lims→∞ xm ,s = m . Die Menge U := xm ,s ∈ M | m ∈ M, s ∈ N ist damit dicht in M und hat die gew¨ unschte H¨aufungspunkteigenschaft. 2 Aufgabe 9.35 auf Seite 197 (Birkhoffscher Ergodensatz f¨ ur Fl¨ usse): • Der Fluss Φ : R × M → M ist stetig, also messbar. Die Zeit t–Abbildungen Φt : M → M (t ∈ R) erhalten das Maß μ. Also l¨asst sich f¨ ur alle T > 0 und das auf [0, T ] restringierte Lebesgue–Maß λT der Satz von Fubini anwenden; f ◦ Φ dλ dμ = T f dμ = f ◦ Φ(t, m) dλ(t) dμ. T [0,T ]×M M M [0,T ] Insbesondere existiert das innere Integral f¨ ur μ–fast alle m ∈ M . • Wir k¨onnen f¨ ur μ–fast alle Anfangsbedingungen m ∈ M das Zeitintegral T f ◦ Φ(t, m) dt durch das mit ganzzahliger oberer Grenze absch¨atzen, denn 0 1 mit G := 0 |f ◦ Φt | dt ∈ L1 (M, μ) ist T T (H.5) f ◦ Φ(t, m) dt − f ◦ Φ(t, m) dt ≤ G ◦ Φ T , m . 0 0 ur μ–fast alle Da nach dem birkhoffschen Ergodensatz (Satz 9.32) G(m) f¨ m ∈ M existiert, folgt mit dem Beweis von Lemma 9.28 auch lim 1 G n→∞ n
◦ Φn (m) = 0
(μ–fast u ¨berall).
Damit folgt aus (H.5) und dem Ergodensatz μ–fast u ¨berall T 1 T 1 lim f ◦ Φ(t, m) dt = lim f ◦ Φ(t, m) dt = F (m) T →∞ T 0 T →∞ T 0 1 mit F := 0 f ◦ Φt dt ∈ L1 (M, μ). Damit ist μ–fast u ¨berall f = F . Die weiteren Aussagen u ¨ber f folgen mit dem Ergodensatz und Bemerkung 9.33.1 aus analogen Aussagen f¨ ur F . 2 Aufgabe 9.36 auf Seite 197 (Normale reelle Zahlen): • Die Abbildung T : M → M, x → 2x (mod 1)
auf M := [0, 1)
ist ergodisch und sogar mischend bez¨ uglich des auf M ⊆ R eingeschr¨ankten ek : T –invarianten Lebesgue–Maßes λ. Denn L2 (M, λ) wird von den Funktionen M → S 1 , ek (x) = exp(2πikx) (k ∈ Z) aufgespannt, und ek T (x) = e2k (x). • Die Menge N ⊆ M der Zahlen mit nicht eindeutiger dyadischer Entwicklung (also die mit der Periode 0 oder 1) ist abz¨ahlbar, hat also das Lebesgue–Maß λ(N ) = 0. Außerdem gilt T (N ) = N . • Da T in der dyadischen Darstellung als Verschiebung (shift) um eine Ziffer wirkt, betrachten wir die Funktion f := 1l[0, 12 ) ∈ L1 (M, λ). Nach dem birkhoffschen Ergodensatz (Satz 9.32) existiert f¨ ur λ–fast alle ur x ∈ M das Zeitmittel f (x) von f . Nach der obigen Bemerkung l¨asst es sich f¨ λ–fast alle x ∈ M als Frequenz deuten. Wegen der Ergodizit¨ a t von T ist es f¨ ur 2 λ–fast alle x ∈ M gleich M f dλ = 12 .
H. L¨osungen der Aufgaben
583
Kapitel 10, Symplektische Geometrie Aufgabe 10.8 auf Seite 206 (Teilchen im Magnetfeld): (a) • ωB = ω0 + B1 dq2 ∧ dq3 + B2 dq3 ∧ dq1 + B3 dq1 ∧ dq2 ∈ Ω2 (P ) auf dem
3 Phasenraum P = R3q ×R3v mit der symplektischen Form ω0 = i=1 dqi ∧ dvi ist geschlossen, denn nach Voraussetzung ist div B = 0, und dωB
=
dB1 ∧ dq2 ∧ dq3 + dB2 ∧ dq3 ∧ dq1 + dB3 ∧ dq1 ∧ dq2
=
div(B) dq1 ∧ dq2 ∧ dq3 .
• ωB ist nicht degeneriert, denn f¨ ur einen Tangentialvektor X = 0 bei (q, v) ∈ P gibt es ein i ∈ {1, 2, 3} mit nicht verschwindender ∂q∂ i –Komponen∂ te, oder sonst mit nicht verschwindender ∂v –Komponente von X. i ∂ Im ersten Fall setzen wir Y := ∂vi , im zweiten Fall Y := ∂q∂ i . Immer gilt ωB (X, Y ) = ω0 (X, Y ) = 0.
3 (v) ∂ (v) ∂ (q) ∂ (q) ∂ (b) Mit X = 3i=1 Xi ∂v und Y = Y + X + Y i i i i=1 ∂q ∂v ∂q i i i * ) i * ) ist ωB (X, Y ) = X (q) , Y (v) − X (v) , Y (q) + det(B, X (q) , Y (q) ). ) *
3 (c) dH(q, v) = i=1 vi dvi , also dH(Y )(q, v) = v, Y (v) (q, v) . Koeffizienten* ) vergleich in ωB (XH , ·) = dH ergibt wegen ωB (X, Y ) = X (q) , Y (v) + ) * B × X (q) − X (v) , Y (q) : X (q) (q, v) = v, X (v) (q, v) = B(q) × v. (d) Aus (c) folgen die Bewegungsgleichungen der Lorentz–Kraft (siehe (6.3.13)): q˙ = v
, v˙ = B(q) × v
2
Aufgabe 10.30 auf Seite 214 (Kugel und Zylinder): Die der totalex1Ableitung x w 0 − w3 Abbildung F : Z → S 2 an der Stelle x ∈ Z ist DFx = 0 w − x2wx3 , mit der 0 0 1 ur die Wurzel. Abk¨ urzung w := 1 − x23 > 0 f¨ Das Fl¨achenelement ϕ auf dem Zylinder ist bei x ∈ Z durch ϕx (Y, Z) = det(˜ x, Y, Z) (Y, Z ∈ Tx Z) x1 gegeben, mit der Radialkomponente x ˜ := x2 von x. Damit ist 0
ωF (x)
DFx (Y ) , DFx (Z) = det
x
x x
Y1 w−Y3 1w 3 x x x2 w Y2 w−Y3 2w 3 x3 Y3 1w
x x
Z1 w−Z3 1w 3 x x Z2 w−Z3 2w 3 Z3
= x1 (Y2 Z3 − Y3 Z2 ) + x2 (Y3 Z1 − Y1 Z3 ) = ϕx (Y, Z). Bei der Berechnung der Determinante wurde benutzt, dass f¨ ur Tangentialvektoren Y, Z des Zylinders die 3–Komponente Y1 Z2 − Y2 Z1 ihres Kreuzproduktes Null ist. 2
584
H. L¨osungen der Aufgaben
Aufgabe 10.45 auf Seite 224 (Darstellung des Flusses mit erzeugenden Funktionen): (a) Die erzeugende Funktion H : (−π/2, π/2) × R2 → R ist auch in ihrer Zeitabh¨angigkeit stetig, denn limt→0 Ht (p, q) = H0 (p, q). Nach (10.5.1) gilt 1 p0 + p0 tan(t), − qt tan(t) , qt = q0 + qt 1 − pt = cos(t) cos(t) also qt = q0 cos(t)+p0 sin(t), pt = p0 cos(t)−q0 sin t. Dies ist die L¨osung der Differentialgleichung des harmonischen Oszillators mit Hamilton-Funktion H0 . (b) Die L¨osung der hamiltonschen Gleichungen f¨ ur die quadratische Hamilton– Funktion H0 (x) = 12 x, Ax und Anfangswert x0 = (p0 , q0 ) ist von der Form xt = (pt , qt ) = exp(JAt)x0 , also linear. Damit gibt es eine Zeit T > 0, sodass f¨ ur alle |t| < T der Ort zur Zeit t als Funktion der Anfangswerte die Eigenschaft hat, dass D2 qt (p0 , q0 ) maximalen Rang (also Rang n) besitzt. Nach dem Satz u ¨ber die implizite Funktion k¨onnen wir daher die Beziehung invertieren und eine glatte Abbildung Qt : R2n → Rn , q0 = Qt (p0 , qt ) finden. ullt die integrable Relation DHt (p0 , qt ) = Die Funktion Ht erf¨ erzeugende t J x0 −x , deren rechte Seite bekannt ist. Die Konvention Ht (0) = 0 legt Ht t 0 fest. Da xt = exp(JAt)x0 gilt, folgt limt→0 xt −x = JAx0 , also t 1 limt→0 DHt (x) = Ax0 , was sich zu H0 (x) = 2 x, Ax aufintegrieren l¨asst. (c) Der anharmonische Oszillator besitzt eine Hamilton–Funktion H0 : R2 → R
V (q) := 12 (q 2 + q4 ) ≥ 0. Nach Satz 11.1 erzeugt H0 damit einen Fluss Φ ∈ C 1 R × R2 , R2 . Da ur V (q) = q + 2q 3 eine ungerade Funktion des Ortes q ist, mit V (q) > 0 f¨ q > 0, ist (p0 , q0 ) = (0, 0) die einzige Ruhelage. ur alle h > 0 die EnergieDa außerdem lim|q|→∞ V (q) = +∞ ist, sind f¨ −1 2 kurven H0 (h) ⊂ R diffeomorph zu einer Kreislinie S 1 . Alle Orbits sind also periodisch. Die Periode ist eine Funktion T : (0, ∞) → (0, ∞) der Energie h. Es gilt limh→∞ T (h) = 0. Denn mit der Maximalauslenkung √
c(h) :=
c(h)
−c(h)
, H0 (p, q) = 12 p2 + V (q)
1+8h−1 2
dq =2 dq/dt
mit
und Q := q/c(h) ist T (h) gleich 0
c(h)
dq 2h − q 2 − q 4
Das Integral hat f¨ ur h → ∞ den Limes
1 0
=
2 c(h)
√ dQ
1−Q4
1 dQ
+ 0
2h c(h)4
2
Q −( c(h) ) −Q4
.
> 0, was die Behauptung
limh→∞ T (h) = 0 zeigt. Dies beweist aber, dass (im Gegensatz zu (b)) f¨ ur ur den anharmonischen Oszillator die implizite Beziehung q0 = Qt (p0 , qt ) f¨ kein Zeitintervall t ∈ (−T, T ) auf dem gesamten Phasenraum l¨osbar ist. 2
H. L¨osungen der Aufgaben
585
Kapitel 11, Bewegung im Potential Aufgabe 11.2 auf Seite 227 (In endlicher Zeit nach Unendlich): • F¨ ur c ≥ 0 ist V ∈ C ∞ (Rd , R) nicht negativ. Also erzeugt nach Satz 11.1 die hamiltonsche Differentialgleichung (11.1.2) einen Fluss. • F¨ ur c < 0 und eine L¨ osung x = (p, q) : I → P betrachten wir die Funktion f : I → [0, ∞), f (t) = 1 + q(t) 2 . Die Energie ist zeitlich konstant, und f¨ ur Anfangsbedingungen (p0 , q0 ) mit p0 = 2(E − V (q0 )) qq00 = 0 ist H(x(t)) = E. Außerdem gilt p˙ = −2c(1 + ε)(1 + q 2 )ε q, weswegen auch p(t) und q(t) in span(q0 ) liegen und ihre Betr¨age in der Zeit monoton wachsen. f erf¨ ullt f¨ ur E ≥ 0 die Differentialungleichung f (t) = 2 q(t), p(t) = 2 2(E + |c|(1 + q(t) 2 )1+ε ) q(t) ≥ kf (t)1+ε/2 mit k := |c| min(1, q0 ), denn q(t) 2 ≥ 12 (1 + q(t) 2 ) min(1, q0 2 ). Die entsprechende Differentialgleichung g (t) = kg(t)1+ε/2 besitzt die L¨osung − 2 . Setzt man g(0) := g(t) = g(0) − k 2ε t ε , divergiert also zum Zeitpunkt 2g(0) εk f (0), dann muss f¨ ur t ∈ I, t ≥ 0 auch f (t) ≥ g(t) gelten. Das impliziert die Divergenz von f in endlicher Zeit. Eine Modifikation des Arguments zeigt, dass auch L¨osungen f¨ ur Energie E < 0 divergieren. 2 Aufgabe 11.15 auf Seite 236 (Ballistische und gebundene Bewegung): (a) Wir verk¨ urzen die geschlossene Kurve c : S 1 → T, c (t) = t in der Jacobi– Metrik und erhalten wie in Satz 8.33 eine geschlossene Geod¨ate @ c : S 1 → T. Diese entspricht nach Satz 8.31 einer zeitperiodischen L¨osungskurve t → @ −1 (E) und einer Periode T > 0. q@(t, x ˆ0 ) mit Anfangswert x ˆ0 ∈ H ˆ0 gilt die F¨ ur jede Anfangsbedingung x0 ∈ ΣE mit Projektion π(x0 ) = x Aussage des Satzes. (b) Sei V˜ ∈ C 2 [0, ∞), (−∞, 0] eine reelle Funktion mit V˜ (0) = 0 und V˜ (r) = 0 f¨ ur alle r ≥ R > 0. Dann ist f¨ ur Dimension d ∈ N und das Gitter L := 2RZd das L–periodische Potential V˜ ( q − ) V : Rd → R , V (q) = ∈L
ebenfalls zweimal stetig differenzierbar. Außerdem ist V (q) = V˜ ( q ), falls
q ≤ R. Wie man aus der Betrachtung des effektiven Potentials (siehe Seite 308) ersieht, gibt es f¨ ur d ≥ 2 und geeignete Wahl von V˜ und E > 0 Anfangsbedingungen x0 = (p0 , q0 ) ∈ ΣE mit q(t, x0 ) ≤ R f¨ ur alle t ∈ R. Diese besitzen sogar positives Liouville-Maß. 2
586
H. L¨osungen der Aufgaben
Aufgabe 11.19 auf Seite 238 (Totale Integrabilit¨ at): Es sei das separable
d Potential V (q) = i=1 Vi (qi ) mit Ti –periodischen Funktionen Vi . Damit ist das regul¨are Gitter L := {(k1 T1 , . . . , kd Td ) | ki ∈ Z} ⊂ Rd Periodengitter von V . Dann ist f¨ ur Anfangswert x0 = (p0 , q0 ) = (p1,0 , . . . , pd,0 , q1,0 , . . . , qd,0 ) die L¨osung von der Form (p(t), q(t)), wobei (pi (t), qi (t)) die hamiltonschen Gleichunur d ≥ 2, Gesamtenergie gen f¨ ur Hi : R2 → R, Hi (pi , qi ) = 12 p2i + Vi (qi ) l¨ost. F¨
d E > Vmax = i=1 Vi, max und j ∈ {1, . . . , d} k¨onnen wir Anfangsbedingungen mit Hj (p1,j , q1,j ) = Vj, max und Hi (p1,i , q1,i ) > Vi, max f¨ ur alle i ∈ {1, . . . , d}\{j} w¨ahlen. Ist der Summand Vj nicht konstant, dann k¨onnen wir dabei p1,j > 0 annehmen. Dann ist zwar t → q1,j (t) streng monoton wachsend, aber beschr¨ankt. Das ist unvereinbar mit einer bedingt-periodischen, also nicht wandernden 5 Bewegung auf einem Torus. Die Bewegung in einem solchen separablen Potential ist zwar nicht total integrabel, aber die nicht auf einem invarianten Torus liegenden Phasenraumpunkte bilden eine Nullmenge. Nur gibt es invariante Phasenraumtori, die nicht diffeomorph auf den Konfigurationstorus projizieren. 2 Aufgabe 11.21 auf Seite 239 (Konstanten der Bewegung): • F¨ ur den Gesamtimpuls pN gilt p˙N =
n
p˙k = −
k=1
n k=1
∇qk V (q) =
n k=1 =k
mk m (q − qk ) = 0.
qk − q 3
• Der Schwerpunkt zur Zeit Null ist explizit zeitabh¨angig, und N N pk 1 1 q˙N = mk (mk q˙k − p˙ k t − pk ) = + ∇qk V (q) − pk mN mN mk k=1
p˙ N −m N
= denn L˙ i,j
= = =
k=1
= 0. Auch die Komponenten des Gesamtdrehimpulses sind konstant, n
q˙k,i pk,j + qk,i p˙ k,j − q˙k,j pk,i − qk,j p˙ k,i
k=1 n
1 1 pk,i pk,j − qk,i ∂qk,j V (q) − pk,j pk,i + qk,j ∂qk,i V (q) mk mk
k=1 n k=1 =k
mk m qk,i (q,j − qk,j ) − qk,j (q,i − qk,i ) = 0.
qk − q 3
n • Die Wahl der Konstanten pN = 0, qN = 0 impliziert k=1 mk qk = 0. Wegen der linearen Unabh¨angigkeit dieser Einzelgleichungen haben wir eine 2(n − 1)d–dimensionale Untermannigfaltigkeit des Phasenraums P@ definiert. 5 Definition: Ein Punkt eines topologischen dynamischen Systems Φ : G × M → M heißt ur alle t ≥ T . wandernd, wenn er eine Umgebung U ⊂ M besitzt mit U ∩ Φt (U ) = ∅ f¨
H. L¨osungen der Aufgaben
587
• F¨ ur n = 1 Teilchen ist das ein Punkt, und genau 2d Konstanten sind algebraisch unabh¨angig. • Im Fall von n = 2 Teilchen k¨ onnen wir zu Relativkoordinaten (pr , qr ) ∈ T ∗ Rd \{0} u ¨bergehen, in denen die Teilchenbewegung der eines Teilchens im Feld einer Zentralkraft gleicht. Deren Hamilton–Funktion ist Hr (pr , qr ) = pr 2 m1 m2 m1 m2 2mr − qr mit reduzierter Masse mr = m1 +m2 (siehe Beispiel 12.39). In d = 2 Freiheitsgraden ist (bei Weglassen des Index r) m1 m2 p1 dp1 + p2 dp2 + (q dq + q dq ) (dH ∧ dL)(p, q) = 1 1 2 2 m
q 3 ∧(q1 dp2 + p2 dq1 − q2 dp1 − p1 dq2 ) 2 m1 m2 = q, p dp1 ∧ dp2 − + dq ∧ dq fi,j (p, q)dqi ∧ dpj . 1 2
q 3 i,j=1 Die beiden Konstanten der Bewegung sind also algebraisch unabh¨angig. Eine analoge Betrachtung zeigt auch f¨ ur d = 3, dass H und die Drehimpulskomponenten Li,k algebraisch unabh¨angig sind. = 6, f¨ ur Gleiches gilt erst recht f¨ ur n > 2. F¨ ur d = 2 haben wir also d+2 2 d+2 d = 3 insgesamt 2 = 10 unabh¨angige Konstanten der Bewegung. 2 Aufgabe 11.22 auf Seite 240 (Laplace–Runge–Lenz–Vektor): (a) Der Laplace–Runge–Lenz–Vektor hat die Zeitableitung ˆ
q 2 p − p, q q −q2 L(x) d ˆ = 0, − A(x) = Z dt
q 3 q1
q 3 mit x(t) = p(t), q(t) . Das Perizentrum q der Bahn zeichnet sich dadurch aus, dass dort p, q = 0 gilt und gleichzeitig die Radialbeschleunigung positiv ist: Z 1 d2
q(t) 2 = p(t) 2 − ≥ 0. 2 dt2
q(t)
. ˆ Dann ist A(x), q ≥ 0 und Aˆ parallel zu q. (b) Am Perizentrum (und damit wegen (a) entlang der gesamten Bahn) ist ˆ 2 ˆ A,q A = Zq = /Z−q = e, denn die Exzentrizit¨at besitzt nach (1.7) Z q die Gestalt e =
2 ZR
− 1.
Aufgabe 11.25 auf Seite 245 (Regularisierbare singul¨ are Potentiale):
2
588
H. L¨osungen der Aufgaben 2
ur Drehimpuls > 0 der vom Ur1. Mit der Substitution r = 2−a R besitzt f¨ sprung aus gesehene Ablenkwinkel f¨ ur das a–homogene Potential die Form ∞ dR Δϕ(E, ) = 2 . 2a Rmin R 2E 2−a + 2ZR2−a − 1 ∞ 1 dR , mit Rmin = (2Z)− 2−a . Also ist Δϕ(E, 0+ ) = 2 Rmin R√2ZR 2−a −1 Die Substitution R = (2Z)− 2−a u zeigt, dass der Ablenkwinkel ∞weder von E noch von der Ladung Z > 0 abh¨angt, denn Δϕ(E, 0+ ) = 2 umin u√udu 2−a −1 2π mit umin = 1. Es folgt Δϕ(E, 0+ ) = 2−a . 1
2π Δϕ(E, ) ist ungerade in , also ist lim0 Δϕ(E, ) = − 2−a . Die beiden Winkel sind genau dann gleich mod 2π, wenn a = 2(1 − 1/n) mit n ∈ N.
2. Wir m¨ ussen entsprechend Bemerkung 11.24.4 die Orbits des geod¨atischen Flusses Ψ auf dem Einheitstangentenb¨ undel T1 S d parametrisieren. (a) F¨ ur d = 2 kann dies durch die Abbildung T1 S 2 → S 2
, (x, y) → x × y geschehen. Diese ist Ψ–invariant, denn mit x(t), y(t) = Ψt (x0 , y0 ) gilt x(t) × y(t) = cos2 (t)x0 × y0 − sin2 (t)y0 × x0 = x0 × y0 . Verschiedene Orbits liegen in verschiedenen orientierten Ebenen. Damit ist der Orbitraum die Sph¨are S 2 . (b) F¨ ur d = 3 ist der Orbitraum (analog zu d = 2) die Grassmann–Mannigfaltigkeit der orientierten zweidimensionalen Ebenen im R4 . Diese werden durch die Orthonormalbasen (x, y) ∈ T1 S 3 aufgespannt. Die Abbildung , (x, y) → (xy ∗ , y∗ x), a+bi c+di (bei der Punkte (a, b, c, d) ∈ R4 mit x = −c+di a−bi ∈ H identifiziert wurden), bildet wegen
mn = m
n f¨ ur m, n ∈ H in S 2 × S 2 ab. Außerdem gilt f¨ ur x(t), y(t) = Ψt (x0 , y0 ) ∗ x(t)y(t)∗ = cos(t)x0 + sin(t)y0 − sin(t)x0 + cos(t)y0 Φ : T1 S 3 → S 2 × S 2
=
sin(t) cos(t)(y0 y0∗ − x0 x∗0 ) + cos2 (t)x0 y0∗ − sin2 (t)y0 x∗0 = x0 y0∗ .
Denn x0 = y0 = 1, also x0 x∗0 = y0 y0∗ = 1l, und x0 y0∗ = −y0 x∗0 ∈ ImH, denn die Vektoren stehen aufeinander senkrecht, also tr(x0 y0∗ ) = 0. onnen also durch die Drehung Ψ Analog ist y ∗ (t)x(t) = y0∗ x0 . Wir k¨ faktorisieren. F¨ ur ein Quaternion z ∈ H der Norm z = 1 und das Bild (u, v) := (xy ∗ , y ∗ x) der Abbildung Φ ist z − uzv = 2(z, x x + z, y y).
(H.6)
H. L¨osungen der Aufgaben
589
Man kann daher aus dem Bild die von x und y aufgespannte Ebene rekonstruieren. Wegen Φ(y, x) = (yx∗ , x∗ y) = −(xy ∗ , y ∗ x) = −Φ(x, y) erhalten wir auch ihre Orientierung. Damit ist Φ/S 1 injektiv. Die Surjektivit¨at folgt ebenfalls mit (H.6), wenn wir (u, v) ∈ S 2 × S 2 beliebig w¨ahlen. Damit ist Φ/S 1 auch schon ein Diffeomorphismus. (c) Wegen der Regularisierung (11.3.12) der Richtung des Laplace–Runge– Lenz–Vektors ist auch dieser selbst regularisierbar. Die im Tipp angegebene Formel f¨ ur A folgt daher aus der in (11.3.13) bewiesenen Formel ˆ 2 H ˆ ˆ 2 = 2 L ˆ + Z 2 f¨ ur A.
A
Damit folgt f¨ ur E < 0, dass A ≤ Z ist. F¨ ur A < Z ist die Ellipse nicht degeneriert, und es gibt genau zwei periodische Orbits mit diesem Wert von A in ΣE . Dagegen entsprechen die Vektoren mit A = Z den Kollisionsbahnen, also denjenigen periodischen Orbits in ΣE , die mit ihrem Bild unter Zeitumkehr (Definition 11.3) u ¨bereinstimmen. Damit erhalten wir topologisch zwei entlang ihres Randes verklebte Kreisscheiben, also S 2 , als Orbitraum. Umgekehrt ist A ≥ Z, falls E > 0, und der Orbitraum ist dann ein Zylinder S 1 × R. 2
Kapitel 12, Streutheorie Aufgabe 12.7 auf Seite 264 (Asymptotik der Potentialstreuung): 1. Wegen der Reversibilit¨at des Flusses, gen¨ ugt es, f¨ ur alle Anfangswerte x0 ∈ P T die Existenz des Ces`aro-Limes p+ (x0 ) = limT →∞ T1 0 p(t, x0 ) dt zu zeigen. • F¨ ur E > 0 und x0 ∈ s+ E existiert dieser nach Satz 12.5. 0) = 0, denn • Ist x0 ∈ b+ , dann ist p+ (x0 ) = limT →∞ q(T,x T lim supT q(T, x0 ) < ∞. ∪ b+ ur E < 0 gilt ΣE = b+ • F¨ ur E > 0 ist ΣE = s+ E E , f¨ E . Es bleibt der Fall −ε 0 ) E = 0. Dann ist p = 2V (q) ≤ c q . W¨are lim supT →∞ q(T,x > T 0, g¨abe es also ein k > 0 und eine wachsende Folge von Zeiten tn → ∞ mit q(tn ,x0 ) ≥ k, dann w¨ urde f¨ ur alle n ≥ n0 insbesondere die Ungleichung tn 2c 1/ε gelten. Da dann aber q(tn+1 , x0 ) − q(tn , x0 )
q(tn , x0 ) > k kleiner als tn+1 tn+1 k −ε
p(t, x0 ) dt < c q(t, x0 ) dt < (tn+1 − tn ), 2 tn tn
also lim supm→∞
q(tm ,x0 ) tm
≤ k/2 w¨are, kann dies nicht sein.
590
H. L¨osungen der Aufgaben
2. Wir schreiben kurz p(t), q(t) := p(t, x0 ), q(t, x0 ) und setzen L(t) := q(t) ∧ p(t). ˜ ( q ) existiert, f¨ Da nach Voraussetzung ein Potential W mit W (q) = W ur das V − W kurzreichweitig ist, ist W automatisch langreichweitig. ¨ Bei der Uberpr¨ ufung des Cauchy–Kriteriums f¨ ur den Limes von L gilt: t
L(t2 ) − L(t1 ) = t12 q(t) ∧ ∇V q(t) dt t2 t2 −1−ε = ≤ q(t) ∧ ∇ V q(t) − W q(t) dt q(t) dt, t1
t1
analog zu (12.1.6). Die Anwendbarkeit auf die singul¨aren Molek¨ ulpotentiale (12.7) folgt aus der Zk Zk −2 − ). 2 Kurzreichweitigkeit der Differenzen q−s q = O( q
k Aufgabe 12.10 auf Seite 267 (Streuorbits): 1. F¨ ur vorgegebene Werte E > 0 und ∈ R gibt es einen Minimalradius rmin = Z Z2 2 − 2E + 4E 2 + 2E ≥ 0. F¨ ur r2 > r1 ≥ rmin existieren Zeiten t2 > t1 ≥ tmin , sodass die Bahn t → q(t) ∈ R2 diese Abst¨ande realisiert, das heißt
q(tmin ) = rmin , q(ti ) = ri . r r dr, da f¨ ur Zeiten t > tmin gilt: Es folgt t2 − t1 = r12 √2r2 E+2Zr− 2 d q(t), ˙ q(t)
q(t) = = dt
q(t)
H 2 E+
2 Z −
q(t) 2 q(t) 2
> 0.
2. Es sei t → p(t), q(t) eine L¨ osung der hamiltonschen Gleichungen mit limt→+∞ q1 (t) = +∞. Wir betrachten die Dynamik der zweiten Koordinate auf dem erweiterten Phasenraum R := Rp × Rq × Rt (lassen also den Index 2 weg). Diese wird durch die zeitabh¨angige Hamilton-Funktion h : R → R , h(p, q, t) := 12 p2 + q12 (t)q 2 ¨ beschrieben. Ahnlich wie in Beispiel 10.44 gehen wir zu Polarkoordinaten f¨ ur diesen explizit zeitabh¨angigen harmonischen Oszillator u ¨ber. Dazu setzen wir als erzeugende Funktion s(q, ϕ, t) := 12 q1 (t)q 2 cot(ϕ). Die zeitabh¨angige kanonische Transformation ist damit ∂s q p= , also ϕ = arctan q1 (t) ∂q p p2 ∂s , also J = 12 q1 (t)q 2 + J =− ∂ϕ q1 (t)
H. L¨osungen der Aufgaben
591
Damit ist h(p, q, t) = q1 (t)J(p, q, t). Die Hamilton–Funktion k mit k(J, ϕ, t) = q1 (t)J +
∂s q(J, ϕ, t), ϕ, t ∂t
erzeugt in den neuen Koordinaten die Dynamik. Explizit ist k(J, ϕ, t) = q1 (t)J +
1 q1 (t) 2 q (t) J 1
q (t) Damit ist J˙ = − q11 (t) J cos(2ϕ) und ϕ˙ = q1 (t) +
sin(2ϕ). 1 q1 (t) 2 q2 (t)
sin(2ϕ).
Unter unserer Annahme limt→+∞ q1 (t) = +∞ ist auf dieses Differentialgleichungssystem die St¨ orungstheorie des Kapitels 15.2 anwendbar. Nach Satz 15.13 gibt es also ein c > 0, sodass c 1 |J(t) − J(t0 )| < . t − t0 ∈ 0, q1 (t ) 0 q1 (t0 ) J ist also eine sogenannte adiabatische Invariante. Im Limes großer t0 folgt wegen der Energieschranke E ≥ h p(t), q(t), t = q (t)J p(t), q(t), t und 1 q1 (t) → +∞, dass J p(t0 ), q(t0 ), t0 = 0 gelten muss. Dann ist aber p(t0 ) = q(t0 ) = 0, und damit in den urspr¨ unglichen Koordinaten ur alle Zeiten t ∈ R. 2 p2 (t) = q2 (t) = 0 f¨ Aufgabe 12.13 auf Seite 272 (Møller-Transformationen in 1D): Da die Møller-Transformationen Ω± nach (12.2.2) die Energien erhalten, gilt H (0) ◦ S(x) = H (0) ◦ (Ω+ )−1 ◦ Ω− (x) = H ◦ Ω− (x) = H (0) (x). Damit muss f¨ ur x = (p, q) ∈ P+ und x = (p , q ) := S(x) gelten: |p | = |p|. Nun besteht f¨ ur E > Vmax die Energieschale ΣE = H −1 (E) aus genau zwei Zusammenhangskomponenten, f¨ ur die sign(p) gleich +1 beziehungsweise = −1 ist. Da diese invariant unter dem Fluss Φt sind, gilt p = p. Da Vmax ≥ 0 ist und E > Vmax angenommen wurde, existiert das τ (p) definierende Lebesgue-Integral f¨ ur kurzreichweitige V . Da f¨ ur beliebige Intervalle 2 −q1 , die I := [q1 , q2 ] ⊂ R die Aufenthaltsdauer des freien Teilchens in I gleich q√ 2E −1/2 q2 dq ist, folgt die Formel des Teilchens im Potential gleich q1 2(E − V (q)) −1/2 −1/2 τ (p) = R (2 E − V (q) dq. 2 − (2E) (0)
Aufgabe 12.24 auf Seite 278 (Streuung bei hohen Energien): p(t) ur alle Zeiten t die Richtung θ(t) := p(t) wohlde(a) Wegen E > V ∞ ist f¨ finiert. Die Richtungs¨anderung p(t) . −∇V q(t)
p(t)
+ ∇V q(t) , p(t) p(t) dθ = dt
p(t) 2
592
H. L¨osungen der Aufgaben ≤ besitzt eine durch dθ dt
p(t) ∈ [vmin , vmax ].
∇V ∞ p(t)
≤
∇V ∞ vmin
beschr¨ankte Norm, denn
(b) F¨ ur alle Zeiten t > 0 gilt
t ≤ vmax t.
q(t) − q(0) = p(s) ds 0
Eine untere Schranke erh¨alt man durch Projektion der Bahn auf ihre Anfangsrichtung. F¨ ur Zeiten t > 0 ist . t. p(0) p(0)
q(t) − q(0) ≥ q(t) − q(0) , p(0) = p(s) , p(0) ds 0 6 s t5 p(0) p(0) − ds ∇V (q(τ )) dτ , p(0) ≥ 0
0
≥ p(0) t − 12 ∇V ∞ t2 ≥ t (vmin − 12 ∇V ∞ t). Diese Schranke ist f¨ ur t < vmin . ∇V ∞
2vmin ∇V ∞
positiv, und sie ist maximal f¨ ur t =
(c) Es sei t0 ∈ R ein Zeitpunkt, an dem p(t0 ), q(t0 ) = 0 ist (falls es ein solches t0 nicht gibt, betrachtet man statt dessen eine Folge (tn )n∈N mit limn→∞ p(tn ), q(tn ) = 0). 2 Die untere Schranke an E impliziert vmin ≥ 4R ∇V ∞ .
-
.
p0 nach (b) gilt: q(t± ) − q0 , p(0)
asst die Da f¨ ur t± := t0 ± v2R ≥ R, verl¨ min Bahn nach t+ und vor t− die Kugel vom Radius R und bewegt sich außerhalb der Kugel geradlinig weiter.
Die Winkel¨anderung im Intervall [t− , t+ ] ist nach (a) h¨ochstens t+ dθ dt ≤ 4R ∇V ∞ = 2R ∇V ∞ ≤ 1. 2 dt vmin E − V ∞ t−
2
Aufgabe 12.35 auf Seite 288 (Billardkugeln): (a) Bezeichnet man in einer Dimension die Orte der Kugelmittelpunkte mit onnen wir annehmen, dass diese f¨ ur alle Zeiten qi ∈ R (i = 1, . . . , n), dann k¨ t aufsteigend geordnet sind. Sind die Radien der Kugeln gleich R und bezeichnet qN := Schwerpunkt, dann wird durch die Abbildung qk → qk − 2kR + Δ
mit
Δ := 2R
n m
=1 n =1 m
n mk qk
k=1 n k=1 mk
ihren
(k = 1, . . . , n)
der Schwerpunkt nicht ver¨andert, aber der Abstand qk+1 − qk um 2R vermindert. Die Dynamik wird damit auf die von n Punktteilchen mit Radius 0 zur¨ uckgef¨ uhrt (siehe Abbildung).
H. L¨osungen der Aufgaben
593
qk
qk
t
t
Besitzen nun diese Teilchen gleiche Massen m := m1 = . . . = mn , dann gilt f¨ ur die Geschwindigkeiten vi = pi /mi nach einem Zweierstoß zwischen dem i–ten und (i + 1)–ten Teilchen gem¨aß (12.5.1): − vi+ = vi+1
+ und vi+1 = vi−
Die Teilchen tauschen also paarweise ihre Geschwindigkeit aus. Tr¨agt man nun die Orte q1 , . . . , qn als Funktion der Zeit auf, dann ergeben sich n Geraden, mit Achsenabschnitten qi und Steigungen vi, siehe Abbildung. Da sich n Geraden h¨ ochstens n2 mal schneiden, ist n2 die Maximalzahl der Kollisionen. Diese wird genau dann realisiert, wenn alle Anfangsgeschwindigkeiten voneinander verschieden sind. ¨ Auch beim Kugelstoßpendel sind die Massen gleich. Ublicherweise ber¨ uhren die Kugeln einander in der Ruhelage fast. Zieht man die ersten k Kugeln nach links und l¨asst sie gemeinsam los, dann werden sich nach den (als eine Kollision wahrgenommenen) St¨ oßen die letzten k Kugeln nach rechts weiterbewegen. Da ihre Aufh¨angung eine r¨ ucktreibende Kraft erzeugt, wiederholt sich der Vorgang in gespiegelter Reihenfolge. (b) Wie aus der Aufgabe (a) hervorgeht, ur einen Zeitpunkt t, bei dem keine ist f¨ Kollision stattfindet, die L¨ osung p(t, x0 ), q(t, x0 ) stetig in den Anfangsbedingungen x0 . Auch Mehrfachkollisionen k¨ onnen stetig fortgesetzt werden. Dies ist bei voneinander verschiedenen Massen nicht mehr der Fall. Aber auch wenn wir nur Anfangsbedingungen betrachten, die nicht zu Mehrfachkollisionen f¨ uhren, wirkt sich die Verschiedenheit der Massen aus. Beispielsweise wird eine Kugel zwischen zwei Kugeln mit viel gr¨oßeren Massen oft kollidieren k¨onnen. Galperin hat in [Galp] gezeigt, dass f¨ ur drei Kugeln mit Massen m1 , m2 und m3 und voneinander verschiedene Anfangsgeschwindigkeiten die Zahl ihrer Kollisionen gleich I J π arccos
m1 m3 (m1 +m2 )(m2 +m3 )
(mit der ceil-Funktion ·) ist. Sie ist also mindestens gleich 2, gleich 3 f¨ ur gleiche Massen, und divergiert f¨ ur m2 ! 0.
594
H. L¨osungen der Aufgaben Dieses Ergebnis gewinnt man folgendermaßen: Im Konfigurationsraum R3q der drei Teilchen geht man zum Schwerpunktsystem, also zur Ebene ˜ := q ∈ R3 E
3 i=1 mi qi = 0
u Q := M q ¨ber. Die lineare Abbildung √ √ √ mit M := diag m1 , m2 , m3 ˜ = bildet diese ME 3auf√ E := 3 Q∈R mi Qi = 0 ab. Die i=1 Kollisionen entsprechen den Geraden √ √ Q ∈ E | Qi / mi = Qi+1 / mi+1 (i = 1, 2). Vorteil des Koordinatenwechsels ist, dass der Vektor der transformierten Geschwindigkeiten V := M v bei einer Kollision des i–ten und (i + 1)–ten Teilchens an der Gerade √ √ span ei / mi −ei+1 / mi+1 ⊂ E gespiegelt wird. Da der Winkel ϕ zwischen diesen beiden Geraden von der Form m1 m3 ϕ = arccos (m1 +m2 )(m2 +m3 ) ist, ergibt sich die Formel durch Entfaltung des Konfigurationsraumes in der Ebene E (siehe Abbildung). 2 Aufgabe 12.37 auf Seite 289 (Potential einer zentralsymmetrischen Massenverteilung): 3 (a) Sowohl das Lebesgue–Maß auf dem R3 als auch die Kugel BR sind invariant −1 unter der Wirkung von O ∈ SO(3). Es gilt also mit y := O x: V (Oq) =
3 BR
ρ(x) ρ(O−1 x) ρ(y) dx = dx = dy = V (q). −1 x)
3 3
Oq − x
O(q − O
O(q − y)
BR BR
(b) q − x =
x21 + x22 + (x3 − a)2 . Unter Benutzung der Kugelkoordinaten
x1 = r cos(θ) cos(ϕ) , x2 = r cos(θ) sin(ϕ) ist dies gleich r2 + a2 − 2ra sin(θ).
, x3 = r sin(θ)
¨ (c) Beim Ubergang zu den Kugelkoordinaten wird der Integrand mit der Funk-
H. L¨osungen der Aufgaben
595
ur a = q > 0 tionaldeterminante r2 cos(θ) multipliziert. Damit ist f¨
R
V (q) = 2π =
2π a
0
R
ar
−ar
0
π/2
ρ˜(r)r2 cos θ dθ dr r2 + a2 − 2ra sin θ −π/2 2π R ρ˜(r)r du √ dr = r |a + r| − |a − r| ρ˜(r) dr. 2 2 a r + a − 2u 0 √
2π a
(d) F¨ ur a > R ist also V (q) =
R 0
2r2 ρ˜(r) dr.
In Kugelkoordinaten ist das Integral f¨ ur die gesamte Masse beziehungsweise R π/2 R Ladung gleich M = 2π 0 −π/2 ρ˜(r)r2 cos θ dθ dr = 2π 0 2r2 ρ˜(r) dr. (e) F¨ ur a ∈ (0, R] ist V (q) =
2π a
a 0
2π R ρ(r) dr. a a 2ra˜ 4π a 2 − a3 0 2r ρ˜(r) dr und
2r 2 ρ˜(r) dr +
Damit gilt f¨ ur V˜ ( q ) = V (q): a2 ∂a V˜ (a) = a 2 ˜(r) dr − 4π ρ˜(a), also insgesamt −ΔV = 4πρ. ∂a2 V˜ (a) = + 4π a3 0 2r ρ 3
(f) Da mit der Gravitationskonstante G ≈ 6.67 · 10−11 kgm s2 wegen des newton 3π ist, h¨angt sie nur von der schen Kraftgesetzes die Umlaufzeit T = ρG mittleren Dichte ρ des Himmelsk¨ orpers, nicht von seinem Radius ab. Diese kg kg Dichte variiert verh¨altnism¨aßig wenig (ρErde ≈ 5 500 m 3 , ρSonne ≈ 1 400 m3 ), denn auch sie l¨asst sich n¨aherungsweise durch die Kombination von Naturkonstanten wie dem Bohr-Radius berechnen. 2 Aufgabe 12.45 auf Seite 293 (Clusterprojektionen): Die linearen Abbildun
1 E gen ΠE : M → M, Π (q) = m q (mit Teilchenindex ∈ Ci ) auf j j C C j∈Ci mCi dem euklidischen Vektorraum (M, ·, ·M ) sind orthogonale Projektionen:
E ΠE C ◦ ΠC (q) =
1 mj 1 mr qr = mr qr = ΠE C (q) mCi mCi mCi j∈Ci
r∈Ci
r∈Ci
und )
ΠE C (q ), q
* M
=
n
k . ) *
= m ΠE (q ) , q m m1C C r∈Ci mr qr , q i=1 ∈Ci
=1
=
k i=1 r∈Ci
=
)
i
k . ) *
1 m r qr , m C mr qr , ΠE C (q)r ∈Ci m q =
* q , ΠE C (q) M .
i
i=1 r∈Ci
Also ist auch ΠIC = 1lM − ΠE C eine orthogonale Projektion: E E E E I ΠIC ◦ ΠIC = 1lM − 1lm ◦ ΠE C − ΠC ◦ 1lM + ΠC ◦ ΠC = 1lm − ΠC = ΠC ∗ ∗ E I und ΠIC = 1lM − (ΠE C ) = 1lM − ΠC = ΠC .
2
596
H. L¨osungen der Aufgaben
Aufgabe 12.47 auf Seite 296 (Tr¨ agheitsmomente): Die Mengenpartition D ∈ P(N ) ist nach Annahme feiner als C ∈ P(N ). F¨ ur die SchwerpunktproE E E E jektionen gilt damit ΠE onnen also die externen C ΠD = ΠD ΠC = ΠD , wir k¨ E E E E E Tr¨agheitsmomente JCE = J ◦ ΠE C und JD = J ◦ ΠD durch JD = JC ◦ ΠD E E E vergleichen. Wegen Konvexit¨at von J, also auch von JC folgt JD ≤ JC . 2
Kapitel 13, Integrable Systeme und Symmetrien Aufgabe 13.12 auf Seite 322 (Wirkung des planaren Pendels): Wir benutzen die vollst¨andigen elliptischen Integrale erster Art, das heißt 6 K(k) =
π/2
−1/2 1 1 − k2 sin2 (ϕ) dϕ = 0 √
0
dx , (1−x2 )(1−k 2 x2 )
und zweiter Art: E(k) =
1/2 1 1−k2 x2 1 − k2 sin2 (ϕ) dϕ = 0 1−x2 dx.
π/2 0
Die Wirkung I(h) =
H −1 ([−1,h])
dpψ dψ ist
• f¨ ur h > 1 mit ϕ := ψ/2 gleich
π
=
2(h + cos(ψ)) dψ = 8 0 2 8 2(h + 1)E h+1 .
I(h) = 4
π/2
2(h + 1 − 2 sin2 ϕ) dϕ
0
• F¨ ur h ∈ (−1, 1) benutzen wir die Substitution x :=
1−cos(ψ) 1+h .
F¨ ur ψ ∈
[0, arccos(−h)] ist also x ∈ [0, 1]. Mit der Abk¨ urzung k := 1+h 2 ist der Inte arccos(−h) 2(h + cos(ψ)) dψ gleich 2(h + cos(ψ)) = grand von I(h) = 4 0 √ 2k 2 √ 2k 1 − x und dψ = 1−k2 x2 dx. Also ist I(h) = 16k
2 0
1
+
1 − x2 dx = 16 E(k) − (1 − k2 )K(k) . 2 2 1−k x
Die Ableitung der stetigen, monoton wachsenden Funktion I : [−1, ∞) → [0, ∞) existiert damit u ¨berall bis auf die Stelle h = 1. und ist gleich der Periode des Orbits. Bei h = 1 divergiert sie √ wegen der oberen Ruhelage. Im 2 Limes h , ∞ ist I(h) asymptotisch zu 4π 2h.
6 Bei
deren Benutzung ist darauf zu achten, dass diese oft anders definiert werden!
H. L¨osungen der Aufgaben
597
Aufgabe 13.29 auf Seite 337 (koadjungierte Orbits): (a) Mit O(ξ) = {gξg −1 | g ∈ G} und der Parametrisierung einer Umgebung von e ∈ G durch g = exp(u) mit g −1 = exp(−u) folgt die Behauptung Tξ O(ξ) = {[u, ξ] | u ∈ g ⊂ Mat(n, R)} aus der Produktregel der Ableitung. (b) Die durch Reduktion definierte symplektische Form auf der linken Seite von (13.5.14) ist Ad∗g –invariant. Wegen Adg [u, v] = [Adg u, Adg v] ist auch die Zwei–Form auf der rechten Seite von (13.5.14) Ad∗g –invariant. Ihre Identit¨at wird z.B. in Kapitel 14 von Marsden und Ratiu [MR] bewiesen. (c) Wegen der Formel (13.5.13) f¨ ur die Impulsabbildung J : T ∗ G → g∗ und der Definitionsgleichung Xξ (e) = ξ des infinitesimalen Erzeugers Xξ : G → T G ist die Restriktion von J auf Te∗ G = g∗ die Identit¨at. 2
Aufgabe 13.32 auf Seite 339 (Hamiltonsche S 1 -Wirkung auf S 2 ): Auf dem Zylinder Z := {x ∈ R3 | x21 + x22 = 1, |x3 | < 1} mit der Fl¨achenform cos t − sin t 0 erzeugt HZ : Z → R, x → x3 die S 1 –Wirkung Φt (x) = sin t cos t 0 x. Nach 0
0
1
Aufgabe 10.30 ist die radiale Projektion F : Z→ S2 ein Symplektomorphismus 0 auf das Bild, und H ◦ F = HZ . Nur die Pole 0 , auf denen H extremal ist, ±1
werden von F nicht getroffen. Damit erzeugt auch H eine S 1 –Wirkung.
2
Aufgabe 13.37 auf Seite 342 (Ky-Fan-Maximumsprinzip f¨ ur hermitesche Matrizen): Da A ∈ Herm(d, C) Eigenr¨aume zu den Eigenwerten λi besitzt, die f¨ ur Indices i > j orthogonal sind, sehen wir durch Wahl orthonormaler Eigenvektoren x1 , . . . , xk ∈ Cd zu den Eigenwerten λ1 , . . . , λk , dass jedenfalls k
λi ≤
i=1
max
k
(x1 ,...,xk )∈Vk (Cd )
xi , Axi
i=1
gilt. Umgekehrt sei (x1 , . . . , xk ) ∈ Vk (Cd ), und wir erg¨anzen zu einer Orthonormalbasis (x1 , . . . , xd ) ∈ Vd (Cd ). Dann besitzt die Darstellung von A in dieser Basis nach dem Satz von Schur und Horn Diagonalwerte bi,i , die sich als Konvexkombination der λσ (σ ∈ Sd ) darstellen lassen: bi,i =
σ∈Sd
cσ λσ(i)
mit
cσ ≥ 0 ,
cσ = 1.
σ∈Sd
k Das Maximum von i=1 bi,i wird aber an einer Ecke des Polytops Π Λ−1 (λ) angenommen. Eine solche Ecke ist wegen der schwachen Ordnung λ1 ≥ λ2 ≥ . . . der Eigenwerte die f¨ ur σ = Id. 2
598
H. L¨osungen der Aufgaben
Kapitel 14, Starre und bewegliche K¨ orper Aufgabe 14.2 auf Seite 345: Es ist (v, O)−1 = (−O−1 v, O−1 ).
2
Aufgabe 14.8 auf Seite 350 (Scheinkr¨ afte): 1. In der dimensionsunabh¨ angigen Formel (14.2.5) ist f¨ ur d = 2 die Matrix cos(ϕ) sin(ϕ) − sin(ϕ) − cos(ϕ) −1 B = O O = − sin(ϕ) cos(ϕ) ϕ = ϕ 10 −1 = ϕ J. 0 cos(ϕ) − sin(ϕ) Daraus folgt B 2 = −(ϕ )2 1l, B = ϕ J und die Behauptung.
2. Die Formel folgt sofort aus (14.2.5) und Bv = i(ω)v = ω ×v (siehe (13.4.8)). 3. Der Betrag 2m C
ω der Coriolis–Kraft h¨angt nicht von der geographischen Lage ab, da die Fahrtrichtung senkrecht auf der Drehachse der Erde ist. Mit ω = 2π/T , T = 86 400 s und C = 20 000/3 600 m/s betr¨agt sie etwa 0.08 Newton. Zum Vergleich: eine Schokoladentafel wiegt etwa 1N. Die Kraft wirkt vertikal gesehen nach unten und in ihrer Horizontalkomponente nach Norden, macht den den Radfahrer also schwerer und lenkt ihn nach rechts ab. Das sieht man mit der Rechte-Hand-Regel f¨ ur das Vektorprodukt in der Formel −2mω × C der Coriolis–Kraft. Die Aufteilung auf diese Komponenten entspricht bei der geographischen Breite Berlins von 53.5◦ etwa 0.048 N beziehungsweise 0.064 N. Der Betrag der nach rechts ablenkenden Kraftkomponente h¨angt nicht von der Fahrtrichtung ab. 2 Aufgabe 14.10 auf Seite 353 (Satz von Steiner): • Aus der Formel f¨ ur I(q) folgt schon die Minimalit¨at von I TqN (q) , denn der Summand mN qN 2 (1l3 − PN ) ist positiv semidefinit und genau dann gleich Null, wenn der Schwerpunkt qN = 0 ist. ˜ ˜ • Die Formel selbst denn ergibt
n sich aus I = J1l3 − I2 mit I aus (14.2.3), 2 J(q) − J TqN (q) = 2m (q , q −
q
) = m
q
. Analog ist k N k N N N k=1 2 I˜0 (q) − I˜qN (q) (q) = mN qN 2 PN . Aufgabe 14.11 auf Seite 354 (Haupttr¨ agheitsmomente): • Es gen¨ ugt, den Fall n = 3 zu betrachten, da f¨ ur q4 := . . . qn := 0 die Haupttr¨agheitsmomente von den ersten drei Massenpunkten bestimmt werden. Sei ur Masnun qk = ek . Dann ist I = diag(m2 + m3 , m1 + m3 , m1 + m2 ). F¨ sen 0 ≤ m3 ≤ m2 ≤ m1 ist damit (I1 , I2 , I3 ) = (m2 + m3 , m1 + m3 , m1 + m2 ). Die Ungleichungen der Massen u ¨bertragen sich in I1 ≤ I2 ≤ I3 ≤ I1 + I2 . • Analog zeigt man auch (in einer Orthonormalbasis, in dem I diagonal ist) die ur beliebige n ∈ N. allgemeine G¨ ultigkeit der Ungleichung I3 ≤ I1 + I2 f¨ • Wenn der Schwerpunkt der drei Massenpunkte der Ursprung des R3 ist, ist span(q1 , q2 , q3 ) h¨ochstens zweidimensional. Damit ist I1 + I2 = I3 , die Haupttr¨agheitsmomente sind also Konvexkombinationen von denen einer Scheibe und
H. L¨osungen der Aufgaben
599
eines Stabes. • Dass eine homogene Kugel mit Mittelpunkt 0 drei gleiche Haupttr¨agheitsmomente besitzt, folgt aus ihrer Symmetrie unter beliebigen Drehungen. • F¨ ur einen in 1–Richtung orientierten Stab ist I = diag(0, I2 , I2 ). • Den Tr¨agheitstensor I einer kreisf¨ ormigen Massenverteilung erh¨alt man durch π/2 Integration I = 0 I(ϕ) dϕ u ¨ber die Tr¨agheitstensoren I(ϕ) der Konfiguration gleicher Massen an den vier Punkten ±e1 (ϕ) und ±e2 (ϕ) mit e1 (ϕ) := cos(ϕ)e1 + sin(ϕ)e2
und e2 (ϕ) := cos(ϕ)e2 − sin(ϕ)e1 .
Da dabei I(ϕ) = I(0) gilt, folgt die Aussage I = diag(I1 , I1 , 2I1 ) daraus, dass die Projektion auf die 1–2–Ebene alle vier Punkte ±e1 , ±e2 invariant l¨asst, die Projektionen auf die 1–3–Ebene bzw. die 2–3–Ebene dagegen nur jeweils zwei von ihnen, w¨ahrend die beiden anderen auf die Null abgebildet werden. 2 Aufgabe 14.17 auf Seite 360 (Schneller Kreisel): Die Anfangsbedingung ˙ β(0) = 0 (also u(0) = 1) erfordert z = Z . Die Anfangsbedingung β(0) =0 2Z bedeutet E = Veff (0) = 2I3 + 1. Zusammen ergibt das 2 Ueff (u) = I1−1 (1 − u)2 2(1 + u) − IZ1 . Die Drehung ist also stabil f¨ ur
2Z I1
√ > 4, d.h. Frequenz |ω| > 2/ I1 .
2
Aufgabe 14.20 auf Seite 362 (Euklidische Symmetrien): 1. Die Wirkung von (v, O) ∈ SE(d) auf Rd ist gegeben durch x → Ox + v, siehe (14.1.2). Dabei ist v ∈ Rd und O ∈ SO(d). Ist nun K ⊂ Rd ×Rd kompakt, also beschr¨ankt mit Schranke b > 0, dann kann der Punkt (x, Ox + v) nur dann in K liegen, wenn v ≤ 2b gilt. Denn Ox + v ≥ v − Ox = v − x . Da die Drehgruppe SO(d)kompakt ist, ist damit auch das Urbild von K unter der Abbildung (O, v), x) → (x, Ox + v) kompakt. Die Diagonalwirkung von SE(d) auf Rnd kann als Wirkung einer abgeschlossenen Untergruppe von SE(nd) aufgefasst werden. Sie ist daher mit dem gleichen Argument eigentlich. Da die offene, dichte Teilmenge Q invariant unter dieser Wirkung ist, folgt die Aussage auch auf die auf Q restringierte Wirkung. 2. Die Wirkung von G := R+ × SE(2) auf R2 , gegeben durch x → λO(x + v), ist eine Wirkung der Lie–Gruppe G. In komplexer Schreibweise wirkt G auf R2 ∼ = C durch Multiplikation mit einer komplexen Zahl z = λO ∈ C∗ und Translation um v ∈ C. ∼ C3 dreier TeilG wirkt auch diagonal auf dem Konfigurationsraum (R2 )3 = chen in der Ebene. Setzen wir z := 1/(q2 − q1 ) und v := −q1 , dann wird q1 auf 0 ∈ C und q2 auf 1 ∈ C abgebildet. Das Bild w ∈ C \ {0, 1} von q3 parametrisiert dann die Gruppenorbits, und C \ {0, 1} ist das Bild der Formsph¨are unter stereographischer Projektion. 2
600
H. L¨osungen der Aufgaben
Kapitel 15, St¨ orungstheorie Aufgabe 15.5 auf Seite 371 (Bedingt-periodische Bewegung): Der bedingtperiodische Fluss auf T2 mit Frequenzvektor (1, 1/12) besitzt die Periode 12. Seine geschlossenen Orbits treffen die Diagonale {(x, x) ∈ T2 | x ∈ S 1 } elf Mal. Stunden- und Minutenzeiger treffen sich also innerhalb eines Tages 22 Mal. 2 Aufgabe 15.12 auf Seite 376 (Virialsatz f¨ ur Raummittel): d (a) {f, H}E = ΣE {f, H} dλE = ΣE dt f ◦ Φt |t=0 dλE = 0, denn das Maß λE ist Φ–invariant. (b) Klar. (c) F¨ ur f (p, q) := p, q hat die Poisson–Klammer {f, H}(p, q) =
N
1
pj 2 − qj , ∇Uj (qj ) − 2
j=1
N
qj , ∇Wj,k (qj − qk )
k=j+1
Mittelwert Null. Der erste Summand ist die mittlere kinetische Energie. (d) Wegen der Kompaktheit der berandeten Mannigfaltigkeit G gibt es ein ε > 0, f¨ ur das auf Gε := {q ∈ R3 | dist(q, G) ≤ ε} die Funktion q → U (q) = ur Parameterwerte dist(q, G)2 glatt ist. Auf ∂Gε ist U gleich ε2 . Also ist f¨ λ > E/ε2 auch die Energieschale ΣE,λ glatt, denn sie projiziert bez¨ uglich aller Teilchenindices j auf deren Ortsraumgebiet G√E/λ . Das Volumen VE/λ von G√E/λ f¨allt f¨ ur λ , ∞ auf das Volumen V von G. Da der Nachweis der idealen Gasgleichung l¨anglich ist, folgt hier nur eine Skizze. 1. Wenn das als Wahrscheinlichkeitsmaß μE,λ auf ΣE,λ normierte Liouville– Maß u ¨ber die Geschwindigkeiten integriert wird, bleibt die Dichte d/2−1 ˜ (˜ q )/E)+ d˜ q , mit v(E, λ) ∈ (V, VE/λ ), v(E, λ)−1 2(1 − λU
N ˜ (˜ q ) = k=1 U (qk ). q˜ = (q1 , . . . , qN ) und U Daher w¨achst im Limes λ , ∞ das Integral dieser Dichte u ¨ber GN gegen Eins. 2. Wegen U ≥ 0 ist die kinetische Energie T auf ΣE,λ kleiner als E. Aber da U G = 0 ist, folgt limλ∞ T E,λ = E. Also gilt nach dem Virialsatz
N ur Mλ (˜ q ) := k=1 qk , ∇λU (qk ). auch limλ∞ M E,λ = E, f¨ 3. Wenn G der W¨ urfel [−, ]3 ist, dann gilt mit den orthonormalen Basisvektoren e1 , e2 , e3 des R3 , dass die Summe der Projektionen auf diese Vektoren Eins ist. Der Gesamtdruck etwa auf die Seitenfl¨achen {±} × [−, ]2 l¨asst sich als limλ∞ R1 E,λ definieren, mit Ri (˜ q ) :=
N k=1
sign(qk ) ei , λ∇U (qk ) .
H. L¨osungen der Aufgaben
601
Nach dem Hauptsatz ist dieses Integral im Limes λ , ∞ gleich 2P V . Summiert man u ¨ber die drei Basisvektoren, ergibt sich P V = 23 T E . 4. F¨ ur beliebige glatt berandete G ⊂ R3 folgt bei Benutzung des Satzes von Stokes eine analoge Aussage. 2 Aufgabe 15.21 auf Seite 385 (Relativistische Periheldrehung): Die Hamilton-Funktion 7 (15.3.17) hat die Form Hε = H0 + εK, mit der Hamilton– Z Funktion H0 (p, q) = 12 p 2 − q der Kepler-Bewegung und K(p, q) = −1/ q 3 . Den maximalen von Hε erzeugten Fluss bezeichnen wir mit Φε . Der RungeLenz-Vektor A ist unter dem Kepler-Fluss Φ0 invariant. Daher ver¨andert sich A nach der hamiltonschen St¨ orungstheorie erster Ordnung innerhalb einer Periode T des Φε –Orbits t → x(t) um
T 0
T dA dt = ε −Dp A x(t) ∇q K x(t) +Dq A x(t) ∇p K x(t) dt+O(ε2 ). dt 0
Der zweite Integrand verschwindet, der erste liefert wegen q1 2q1 p2 −q2 p1 3 2 p2 und ∇q K(x) = − q Dp A(x) = 2q2−q 5 ( q2 ) p1 −q1 p2 −q1 p1 T q T dt = 3ε 0 −q21 / q 5 dt + O(ε2 ). den zu ε proportionalen Beitrag in 0 dA dt Wir parametrisieren mit dem Winkel ϕ statt mit der Zeit t. Unter Verwendung der Kegelschnittgleichung (1.7) der Kepler–Ellipse mit ϕ0 := 0 und mit ϕ˙ = /r2 ist T q2 2 sin ϕ 3εZ 2 2π −q1 1 + e cos(ϕ) 3ε dt = cos ϕ dϕ 5 4
q
0 0 0 6πεZ 2 0 6πεZ e −1 =
A −1 = 4 4 In der letzten Umformung wurde A = Ze aus Aufgabe 11.22 (b) verwandt. Diese St¨orung ist senkrecht auf dem A–Vektor (Aufgabe 11.22 (a)). Also bleibt dessen Norm bis auf Fehler der Ordnung ε2 konstant. Teilung durch A liefert die Ver¨anderung des Argumentes von A. 2 Aufgabe 15.37 auf Seite 403 (Nichtdegeneriertheitsbedingungen): 2 0 1 ω = 001 . 1. ω1 (I) = 1 + 2I1 , ω2 (I) = 1. Daher ist Dω = ( 20 00 ) und Dω ω 0 2. ω1 (I) = 1 + 2I1 , ω2 (I) = 1 − 2I2 . Dω =
2
0 0 −2
und
Dω
ω
ω 0
=
2
110
0 1 0 −2 1 1 1 0
.2
Aufgabe 15.45 auf Seite 407 (Kettenbruchentwicklung): • Dass limn→∞ ωn existiert, folgt aus den Teilen 1) und 3) von Satz 15.44. Denn diese sagen, dass die Teilfolgen mit (un-)geradem Index monoton steigend 7 Wir
lassen die H¨ ute aus (15.3.17) zur Vereinfachung weg.
602
H. L¨osungen der Aufgaben
(beziehungsweise fallend) sind, und die Differenz ihrer Glieder gegen Null geht. • Dass die Folge gegen ω konvergiert, ist eine Konsequenz der Beziehung ω= (H.7) folgt induktiv: pn+1 + h(ρ) pn qn+1 + h(ρ) qn
= =
pn + h(n) ({ω}) pn−1 qn + h(n) ({ω}) qn−1
p0 + h(0) ({ω}) p−1 q0 + h(0) ({ω}) q−1
=
ω + {ω} 1+0
(n ∈ N0 ).
(H.7)
= ω und, mit ρ := h(n) ({ω}),
an+1 pn + pn−1 + h(ρ) pn ( 1/ρ + h(ρ))pn + pn−1 = an+1 qn + qn−1 + h(ρ) qn
1/ρ + h(ρ))qn + qn−1 −1 ρ pn + pn−1 pn + ρpn−1 = = ω. ρ−1 qn + qn−1 qn + ρqn−1
• Denn (H.7) besagt wegen der Positivit¨at von h(n) ({ω}), dass ω zwischen n−1 ωn = pqnn und ωn−1 = pqn−1 liegt. Siehe auch Theorem 14 in Khinchin [Kh]. 2
Kapitel 16, Relativistische Mechanik Aufgabe 16.6 auf Seite 417 (Lorentz–boosts): 1. Die Lorentz–boosts sind nach Definition die positiven Matrizen in der restringierten Lorentz–Gruppe SO+ (3, 1). Zun¨achst sind die angegebenen L(v) von diesem Typ. Das ist f¨ ur L(0) klar. F¨ ur v ∈ R3 , 0 < v < 1 rechnet man L(v) IL(v) = I nach. Die Positivit¨at von L(v) erh¨alt man f¨ ur einen Vektor w = ww˜4 ∈ R4 aus der Identit¨at ˜ 2 ≥ 0. w, L(v)w = γ(v)(w, ˜ v + v4 )2 + w
Umgekehrt sei A = ca db ∈ SO+ (3, 1) (mit a ∈ Mat(3, R), b, c ∈ R3 und d ∈ R) positiv und A = 1l4 . Aus der Symmetrie von A folgt b = c und a = a, aus der Positivit¨at d > 0. Die Bedingung A IA = I beinhaltet die Relationen d2 − b 2 = 1, die Eigenwertgleichung ab = cb und a2 = 1l3 + b ⊗ b . Also ist d ≥ 1. Der Fall d = 1 kann nicht vorkommen, denn sonst w¨are b = 0 und a = 1l3 , was der Annahme A = 1l4 widerspr¨ache. Also ist d = γ mit γ := 1 + b 2 > 1, und f¨ ur v := b/γ gilt v ∈ (0, 1). Ebenso gilt die Relation γ = (1 − v 2 )−1/2 . ˜2 = 1l3 − Pv + a ˜ := 1l3 − Pv + γ(v)Pv ist positiv und besitzt das Quadrat a 2 γ(v) Pv = 1l3 + b ⊗ b . Wir haben damit bewiesen, dass A = L(v) gilt. 2. Die behauptete Relation d2 = 1 + b 2 wird so wie im ersten Aufgabenteil gezeigt.
H. L¨osungen der Aufgaben
603
˜ orthoWir wissen schon, dass P positiv ist. Es ist zun¨achst zu zeigen, dass O gonal ist. Dazu wertet man die Relation AIA = I aus (diese gilt, da mit A auch A ∈ O(3, 1) ist): aa − b ⊗ b = 1l3
, ac = bd
, c c = d2 − 1.
˜ = O ⊕ 1 mit O = a[1l3 − Pv + γPv ] − bc . Berechnung Wir erhalten O von OO ergibt 1l3 . Wegen [1l3 − Pv + γPv ]c = γc = dc und ac = bd ist Oc = (d2 − c c)b = b. 3. In der Gleichung P = L(c/d) k¨ onnen c und d aus dem Produkt A = ca db := L(v1 )L(v2 ) abgelesen werden. Es ist d = γ(v1 )γ(v2 )(1 + v1 , v2 ) und c = [(1l3 − Pv1 ) + γ(v1 )Pv1 ]γ(v2 )v2 + γ(v1 )γ(v2 )v1 . Also ist u = c/d gleich [(1l3 −Pv1 )/γ(v1 ) + Pv1 ]v2 +v1 1+v1 ,v2
=
v1 +v2 + 1−
√
1−v1 2 v1 v1 ,v2 /v1 2 −v2 1+v1 ,v2
.
Aus der Identit¨at v1 × (v1 × v2 ) = v1 v1 , v2 − v2 v1 2 ergibt sich (16.2.6). ×(v1 ×v2 ) K Das Quadrat von u = v1 + v2 + v1√ (1 + v1 , v2 ) hat den Z¨ahler 2 1+
1−v1
v × (v × v ) 2 , v × (v × v ) v 2 1 1 2 1 1 2
v1 + v2 2 + 2 + 2 2 1 + 1 − v1
1 + 1 − v1 1 − v1 2 ) − v1 2 2 2 2(1 + = v1 + v2 − v1 × v2
. (1 + 1 − v1 2 )2 2
Der letzte Faktor ist Eins. Wegen v1 × v2 2 + v1 , v2 = v1 2 v2 2 ergibt sich weiter 1 − v1 2 1 − v2 2
v1 + v2 2 − v1 × v2 2 2 = 1− < 1.
u = (1 + v1 , v2 )2 (1 + v1 , v2 )2 4. Aus der Relation D12 = D21 und (16.2.7) schließen wir, dass L(u21 ) = ˜ ist, also wegen (16.2.8) gilt: u21 = D12 u12 . Da u21 und u12 ˜ 12 L(u12 ) D D 12 sich im von v1 und v2 aufgespannten Unterraum befinden, liegt die Drehachse 2 von D12 senkrecht dazu.
Aufgabe 16.8 auf Seite 419 (Minkowski–Produkt): Durch Lorentz–Transformation erreichen wir, dass v = (0, 0, 0, v4 ) ist, also v, w3,1 = −v4 w4 . Andererseits ist nach Lorentz–Transformation ein raumartiger Vektor von der Form v = (v1 , 0, 0, 0) = 0, besitzt also etwa den ·, ·3,1 –orthogonalen raumar2 tigen Unterraum span(e2 , e3 ).
604
H. L¨osungen der Aufgaben
Aufgabe 16.14 auf Seite 423 (Modifiziertes Zwillingsparadox): In den Forv3 meln von Beispiel 16.13 ist die Zeitdifferenz tw − t0 = 2 uEc2vE + O cmax . 2 Dieser Altersunterschied der beiden Schnecken nach ihrer Erdumrundung ist also im Limes verschwindender Kriechgeschwindigkeit gleich 2 uEc2vE ≈ 0.41μs (Mikrosekunden). 2 Aufgabe 16.22 auf Seite 435 (Galilei–Gruppe): (a) Die Galilei–Transformation setzt sich aus einer Translation (p1 , . . . , pn , E; q1 , . . . , qn t) → (p1 , . . . , pn , E; q1 +Δq, . . . , qn +Δq, t+Δt), (H.8) einer Drehung (p1 , . . . , pn , E; q1 , . . . , qn , t) → (Op1 , . . . , Opn , E; Oq1 , . . . , Oqn , t) (H.9) und einem boost (H.10) (p1 , . . . , pn , E; q1 , . . . , qn , t) → 2 1 p1 + m1 v, . . . , pn + mn v, E + v, pN + 2 m v ; q1 + vt, . . . , qn + vt, t des erweiterten Phasenraums Pn zusammen. Die Translation besitzt Ableitung 1l, ist also symplektisch. Dass die Phasenraumdrehung symplektisch ist, folgt wie in Beispiel 13.17. A B ) mit Untermatrizen A, B, Die Ableitung des boosts besitzt die Form ( C D 1l 0 nd C, D ∈ Mat(nd + 1, R), B = C = 0 und A = D = v...v 1 .
Da wir die symplektische Form (16.5.5) mit Konfigurationsraum M = Rnd q benutzen, ergibt das mit der Zeitspiegelung I modifizierte Kriterium aus Aufgabe 6.26 (b), dass auch der boost symplektisch ist. (b) Da das Potential nur von den Abst¨anden qk − q abh¨angt, ist H unter den Translationen (H.8) invariant. Die Forderung Vk, (Oq) = Vk, (q) der Rotationsinvarianz impliziert Invarianz bez¨ uglich (H.9). Der boost (H.10) ver¨andert H nicht, denn m = m1 + . . . + mn und pN = p1 + . . . + pn . 2 Aufgabe 16.25 auf Seite 436 (konstante Beschleunigung): Die Beschleunigung g > 0 bewirkt eine raumartige Entfernung 1/g des Beobachters vom Kreuzungspunkt der Geraden. F¨ ur g = 10 m/s2 ist die Entfernung damit c2 /g ≈ 12 2 9 · 10 km, also ungef¨ahr ein Lichtjahr.
Kapitel 17, Symplektische Topologie Aufgabe 17.13 auf Seite 447 (elliptischer Billard): • Die Orbits {(±a1 , 0; ∓1, 0)} und {(0, ±a2 ; 0, ∓1)} auf den Achsen haben die Periode 2.
H. L¨osungen der Aufgaben
605
• Ein Orbit der Periode 2 muss zu einer Billardtrajektorie geh¨oren, die eine an ihren Endpunkten p1 , p2 ∈ C auf Tpi C senkrechte Strecke ist. Damit ist Tp1 C parallel zu Tp2 C und p1 = −p2 , die Strecke geht also durch den Mittelpunkt der Ellipse. Da a1 < a2 ist, ist die Strecke eine Halbachse. 2
Anh¨ ange Aufgabe A.47 auf Seite 468 (Differentialtopologie): 1. f : R → R, t → t3 besitzt die nur bei t = 0 verschwindende Ableitung f (t) = 3t2 , ist also injektiv und nur bei 0 nicht immersiv. Da limt→±∞ f (t) = ±∞ gilt, ist f (R) = R. 3 2 0 f (t) 2. F¨ ur f : R → R2 , t → tt2 ist f (t) = 3t 2t . Damit ist lim±t0 f (t) = ±1 und f (R) ist keine Untermannigfaltigkeit. sin t 3. Die Ableitungen der Rosenkurven fk : R → R2 , t → cos(kt) cos ur t sind f¨ sin t cos t k ∈ R gleich fk (t) = −k sin(kt) cos t + cos(kt) − sin t . Sie besitzen also die ur k = 0 ist Norm 1 + k2 sin2 (kt) > 0, weshalb die fk Immersionen sind. F¨ ur die 0 ∈ fk (R), aber es gibt im Allgemeinen verschiedene Richtungen fk (t) f¨ t–Werte mit fk (t) = 0. Dann ist fk (R) keine Untermannigfaltigkeit. 4. f ist 2π-periodisch, also nicht injektiv. Dass S 1 ⊂ R2 eine Untermannigfaltigkeit ist, folgt mit S 1 = g −1 (1) f¨ ur g(x) := x 2 . 2 −t2 = 0 als Ableitung. 5. f : R → R2 , t → exp(−t2 ) tt3 hat f (t) = t21−2t (3−2t2 ) e 2 f ist ungerade und f¨ ur t > 0 w¨achst t → ff21 (t) (t) = t streng monoton. Also ist f injektiv. Andererseits ist limt→±∞ f (t) = 0 = f (0), also ist f nur eine injektive Immersion und keine Einbettung. 6. F¨ ur f ∈ C 1 (M, N ) und m ∈ M ist rang(Tm f ) ≤ min dim(M ), dim(N ) .
7. Ist π : E → B ein C 1 –Faserb¨ undel, dann ist nach Definition F.1 die Abbildung π eine C 1 –Abbildung von Mannigfaltigkeiten. Ist b ∈ B, dann existiert eine Umgebung U ⊂ B von b und ein Diffeomorphismus Φ : π −1 (U) → U × F mit Φ π −1 (b ) = {b } × F . Also ist f¨ ur alle f ∈ F : π ◦ Φ−1 (b , f ) = 2 b . Daraus folgt die Submersionseigenschaft von π. Aufgabe B.9 auf Seite 474 (Volumenform): Im ¨außeren Produkt ω ∧n ∈ Ω2n (R2n ) gibt es bei Ausmultiplikation genau n! nicht verschwindende En Summanden. Um diese bez¨ uglich der Dualbasis α1 , . . . , α2n in der Form i=1 (αi ∧ αi+n ) zu ordnen, muss jeweils eine gerade Anzahl von Transpositionen vorgenommen werden. Dabei ¨andert sich das Vorzeichen nicht. Andererseits ist En (n2 ) E2n α , denn bei der sukzessiven Vertauschung i=1 (αi ∧ αi+n ) = (−1) j=1 j von α2n−1 , α2n−2 , . . . , αn+1 an die (2n − 1)–te, (2n − 2)-te, . . . , (n + 1)–te
606
H. L¨osungen der Aufgaben
Stelle m¨ ussen 1, 2, . . . , n − 1 Transpositionen vorgenommen werden.
2
Aufgabe B.16 auf Seite 476 (Invarianz der Volumenform): Wegen Satz B.15.5 ist f ∗ (ω ∧n ) = (f ∗ ω)∧n = ω ∧n . Wegen Aufgabe B.9 wird also die Volumenform invariant gelassen. 2 Aufgabe B.24 auf Seite 481 (Pull-back von ¨ außeren Formen): Die zu beweisende Formel f¨ ur den pull–back von Differentialformen folgt aus der entsprechenden Aussage f¨ ur ¨außere Formen, also Satz B.15.5. 2 Aufgabe B.32 auf Seite 487 (∧-Antiderivation): Die Behauptung, dass das innere Produkt eine ∧–Antiderivation ist, folgt durch Restriktion auf die Tangentialr¨aume Tm M , also aus einer analogen Formel f¨ ur ¨außere Formen. F¨ ur ¨außere Formen kann sie auf einer Basis der Grassmann–Algebra Ω∗ (E) u ¨ber dem Vektorraum E u uft werden. Hier folgt sie aus der Antisymmetrie des ¨berpr¨ 2 ¨außeren Produktes von Eins–Formen. Aufgabe E.25 auf Seite 516 (Exponentialabbildung f¨ ur GL(n, R)): (ξ) (ξ) Linksinvarianz des Vektorfelds X = XL : G → T G mit X (ξ) (e) = ξ ∈ g bedeutet mit der Linkswirkung Lh : G → G, g → h ◦ g (h ∈ G), dass gilt: (f ∈ G). (Lh )∗ X ξ (f ) = X ξ (f ) Nun ist f¨ ur ein Vektorfeld Y : G → T G dieser push–forward von der Form ((Lh )∗ Y ) (f ) = DLh (h−1 ◦ f ) Y (h−1 ◦ f ) . Im Fall Y = X (ξ) ist Y h−1 ◦ f = h−1 ◦ f ξ. Da f¨ ur G = GL(n, R) die Wirkung Lh von links mit der Matrix h (ξ) multipliziert, folgt die Behauptung XL (g) = g ξ. Der Beweis der Formel f¨ ur die rechtsinvarianten Vektorfelder ist analog. (ξ) d (ξ) Φt (g)|t=0 = Der von XL erzeugte Fluss Φ(ξ) : R × G → G ist wegen dt (ξ) (ξ) XL (g) = g ξ von der Form Φt (g) = g exp(ξt). Damit ist der Kommutator der linksinvarianten Vektorfelder, angewandt auf f ∈ C ∞ (G, R), von der Form & % (η) (η) (ξ) [X (ξ) , X (η) ] f (g) = lim ε−2 f Φ(ξ) ◦ Φ (g) − f Φ ◦ Φ (g) ε ε ε ε ε→0 −2 = lim ε f exp(εξ) exp(εη)g − f exp(εη) exp(εξ)g ε→0
= df (g)[ξ, η] = X ([ξ,η]) f (g).
2
Aufgabe E.27 auf Seite 517 (Lie–Gruppen und Lie–Algebren): 1. Unit¨ are Gruppe: Eine Kurve c ∈ C 1 I, U(n) hat einen Tangentialvektor ˙ Ist umgec(0) ˙ ∈ Alt(n, C), denn wegen c(s)∗ = c(s)−1 ist c˙∗ (0) = −c(0). kehrt X ∈ Alt(n, C), dann kommutieren X und X ∗ = −X, woraus sich exp(X) exp(X)∗ = exp(X) exp(X ∗ ) = exp(X + X ∗ ) = 1l,
H. L¨osungen der Aufgaben
607
also exp(X) ∈ U(n) ergibt. Damit ist die Lie–Algebra u(n) = Alt(n, C) und dim U(n) = dimR Alt(n, C) = n2 . Speziell unit¨ are Gruppe: F¨ ur einen Weg c ∈ C 1 I, SU(n) in der Unterd gruppe SU(n) von U(n) gilt zus¨atzlich wegen 0 = dt det(c(t))|t=0 = tr(c(0)), ˙ dass der Tangentialvektor c(0) ˙ ∈ Alt(n, C) verschwindende Spur besitzt. Daher ist die Lie–Algebra su(n) = {X ∈ Alt(n, C) | tr(X) = 0}, und dim SU(n) = dimR su(n) = n2 − 1. Symplektische Gruppe: Die Lie–Algebra sp(R2n ) von Sp(R2n ) wurde schon in Aufgabe 6.26 bestimmt, ebenso ihre Dimension n(2n + 1). 2. (Isomorphien von Lie–Algebren) (a) Mit i : R3 → so(3) aus (13.4.8) und i(a)b = a × b folgt mit der Jacobi– Identit¨at: i(a1 )i(a2 ) − i(a2 )i(a1 ) b = a1 × (a2 × b) − a2 × (a1 × b) = a1 × (a2 × b) + a2 × (b × a1 ) = (a1 × a2 ) × b. √ (b) Verwenden wir die Basis von su(2) der mit −1 multiplizierten Pauli– 0 Matrizen (τ1 , τ2 , τ3 ) := ( 0i 0i ) , 01 −1 , 0i −i , dann ist die Abbildung 0 so(3) −→ su(2) ,
0 −a3 a2 a3 0 −a1 −a2 a1 0
−→
1 2
3
i=1 ai τi
3 ein solcher Isomorphismus, denn [τi , τj ] = 2 k=1 εijk τk . (c) Mit der auf die imagin¨aren Quaternionen Im H restringierten Einbettung bi c+di = bτ3 − cτ2 + dτ1 bi + cj + dk → −c+di −bi wird ij auf −τ3 τ2 = τ1 , jk auf −τ2 τ1 = τ3 und ki auf τ1 τ3 = −τ2 abgebildet (sowie ii, jj und kk auf τ12 = τ22 = τ32 = −1l). 2 Aufgabe E.31 auf Seite 520 (adjungierte Mit Darstellung): dem Lie-AlgebrenIsomorphismus i : R3 → so(3) , a =
Formel
a1 a2 a3
→
0 a3 a2 a3 0 −a1 −a2 a1 0
aus (13.4.8) ist die
O ∈ SO(3), a ∈ R3 c −s 0 zu u ufen. F¨ ur die Elemente der Form O = s c 0 mit c2 + s2 = 1 sind ¨berpr¨ 0 0 1 0 −a3 ca2 +sa1 a3 0 −ca1 +sa2 . Jede Drehung aus SO(3) ist beide Seiten gleich O i(a) O −1 = i(Oa)
−ca2 −sa1 ca1 −sa2
0
aber zu einer solchen Drehung um die 3–Achse (und mit dem gleichen Winkel) konjugiert. 2
608
H. L¨osungen der Aufgaben
Aufgabe E.34 auf Seite 521 (adjungierte Wirkung): • F¨ ur die Lie–Gruppe G := GL(n, R) mit Lie–Algebra g := Mat(n, R) ist wegen Adg (η) = gηg −1
(η ∈ g, g ∈ G)
−1 gηg −1 − gηg −1 gξg −1 = [Adg (ξ), Adg (η)]. Adg ([ξ, η]) = Adg (ξη −ηξ) = gξg • Entsprechend ist exp Adg (ξ) = exp(gξg −1 ) = g exp(ξ)g −1 . • Die adjungierte Darstellung von ξ ∈ g ist, angewandt auf η ∈ g, gleich d d Adexp(tξ) η exp(tξ) η exp(−tξ) = dt dt t=0 t=0 d d exp(tξ) exp(−tξ) = η + η = [ξ, η]. 2 dt dt t−0 t=0
Aufgabe E.37 auf Seite 521 (Lie–Gruppenwirkungen): 1. Dass Φ : SO(n) × Rn → Rn , (O, m) → Om eine Wirkung der Lie–Gruppe SO(n) ist, ist klar. Da SO(n) kompakt ist (siehe Beispiel E.37.2), ist die Wirkung eigentlich. Sie ist f¨ ur n > 1 nicht frei, denn Φ(SO(n), {0}) = {0}. B = Rn /SO(n) = [0, ∞), denn die anderen Orbits sind Sph¨aren mit dem Nullpunkt als Mittelpunkt, parametrisiert durch den Radius. Also ist ∂B = {0}. t 0 x auf M = R2 \{0} ist 2. Die Abbildung Φ : R × M → M, (t, m) → e0 e−t eine Lie–Gruppenwirkung von (R, +), denn sie ist die Restriktion eines linearen dynamischen Systems auf eine offene flussinvariante Teilmenge des R2 . Sie ist frei, denn durch Entfernung des Ursprungs gibt es keine periodischen Orbits. Sie ist aber nicht eigentlich, denn das Urbild der kompakten Menge (x, y) ∈ M × M | x −e1 ≤ 12 ≥ y − e2 unter der Abbildung R × M → M × M, (t, m) → m, Φ(t, m) ist nicht kompakt. Der topologische Raum B = M/R ist nicht hausdorffsch, denn die Bilder der Punkte e1 und e2 sind voneinander verschieden, befinden sich aber nicht in disjunkten Umgebungen. 2 Aufgabe F.7 auf Seite 524 (Trivialit¨ at von Hauptfaserb¨ undeln): • Besitzt das Hauptfaserb¨ undel π : E → B mit der Lie–Gruppe G als typischer Faser einen Schnitt s : B → E (also π ◦ s = IdB ), dann ist, mit der Wirkung Ψ : E × G → E der Gruppe, die Abbildung ρ:B×G→E
, ρ(b, g) := Ψg ◦ s(b)
ein Hom¨oomorphismus. Denn ρ ist nach Definition stetig und bijektiv, mit stetiger Umkehrabbildung ρ−1 (e) = π(e)), g(s ◦ π(e), e) (e ∈ E). • Umgekehrt ist f¨ ur das neutrale Element e ∈ G der Gruppe bei Existenz einer Trivialisierung Φ : E → B × G die Abbildung s : B → E, s(b) = Φ−1 (b, e) ein Schnitt. 2
Literaturverzeichnis [AA] V.I. Arnol’d, A. Avez: Ergodic Problems of Classical Mechanics. Reading: Benjamin, 1968 [Aa] J. Aaronson: An Introduction to Infinite Ergodic Theory (Mathematical Surveys and Monographs). American Mathematical Society, 1997 [AB] R. Arens, D. Babbitt: The Geometry of Relativistic n Particle Interactions. Pacific Journal of Mathematics 28, 243–274 (1969) [AbMa] A. Abbondandolo, S. Matveyev: Middle-dimensional squeezing and non-squeezing behavior of symplectomorphisms. arXiv:1105.2931 (2011) [ACL] M. Audin, A. Cannas da Silva, E. Lerman: Symplectic Geometry of Integrable Hamiltonian Systems (Advanced Courses in Mathematics, CRM Barcelona). Basel: Birkh¨ auser, 2003 [AF] I. Agricola, T. Friedrich: Globale Analysis. Differentialformen in Analysis, Geometrie unf Physik. Braunschweig: Vieweg, 2001 [AG] V.I. Arnol’d, A. Givental: Symplectic geometry. Dynamical Systems IV, Symplectic Geometry and its Applications (Arnold, V., Novikov, S., eds.), Encyclopaedia of Mathematical Sciences 4, Berlin: Springer 1990 [AGV] V.I. Arnol’d, S.M. Gusein-Zade, A.N. Varchenko: Singularities of Differentiable Maps, Vol 1 (Monographs in Mathematics). Basel: Birkh¨ auser, 1985 [AK] J. Avron, O. Kenneth: Swimming in curved space or the Baron and the cat. New Journal of Physics 8, 68–82 (2006) link [AM] R. Abraham, J.E. Marsden: Foundations of Mechanics, second edition. Reading: Benjamin/Cummings, 1982. link [Am] H. Amann: Gew¨ ohnliche Differentialgleichungen. Berlin: de Gruyter [AN] V. Arnol’d, S. Novikov, eds.: Dynamical Systems VII: Integrable Systems. Nonholonomic Dynamical Systems. (Encyclopaedia of Mathematical Sciences 16) Berlin: Springer 1993 [AR] D. Arnold, J. Rogness: M¨ obius Transformations Revealed. Notices of the AMS 55, 1226– 1231 (2008). link [Ar1] V.I. Arnol’d: Gew¨ ohnliche Differentialgleichungen. Berlin: Springer, 1980 [Ar2] V.I. Arnol’d: Mathematical Methods of Classical Mechanics. Graduate Texts in Mathematics 60. Berlin: Springer 1989 [Ar3] V.I. Arnol’d: Geometrical Methods in the Theory of Ordinary Differential Equations. Grundlehren der mathematischen Wissenschaften 250. Berlin: Springer, 1997
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9,
609
610
Literaturverzeichnis
[Ar4] V.I. Arnol’d: Characteristic class entering in quantization conditions. Functional Analysis and Its Applications 1, 1–13 (1967) [Ar5] V.I. Arnol’d: First Steps in Symplectic Topology. Russian Mathematical Surveys 41, 1–21 (1986) [Ar6] V.I. Arnol’d: Huygens and Barrow, Newton and Hooke: Pioneers in Mathematical Analysis and Catastrophe Theory from Evolvents to Quasicrystals. Basel: Birkh¨ auser, 1990 [Art] E. Artin: Geometric Algebra. New York: Interscience Publishers, 1957 [At] M. Atiyah: Convexity and commuting Hamiltonians. Bull. Lond. Math. Soc. 14, 1-15 (1982) [Bala] V. Baladi: Positive Transfer Operators and Decay of Correlation. (Advanced Series in Nonlinear Dynamics). Singapore: World Scientific, 2000 [Ball] W. Ballmann: Lectures on Spaces of Nonpositive Curvature. Basel: Birkh¨ auser, 1995 [Ban] V. Bangert: On the existence of closed geodesics on two-spheres. International Journal of Mathematics 4, 1–10 (1993) [Bau] H. Bauer: Maß- und Integrationstheorie. Berlin: de Gruyter, 1992 [Berg] M. Berger: A Panoramic View of Riemannian Geometry. Berlin: Springer 2003 [Berr] M. Berry: Singularities in Waves and Rays, in Les Houches Lecture Series Session XXXV, eds. R. Balian, M. Kl´ eman and J-P. Poirier, North-Holland: Amsterdam, 453-543, 1981 [BFK] D. Burago, S. Ferleger, A. Kononenko: Uniform estimates on the number of collisions in semidisperging billiards. Annals of Mathematics 147, 695–708 (1998) [BH] H. Broer, G. Huitema: A proof of the isoenergetic KAM-theorem from the ’ordinary’ one. J. Differential Equations 90, 52–60 (1991) [Bi1] G.D. Birkhoff: Proof of the ergodic theorem. Proceedings National Acad. Sci. 17, 656– 660 (1931) link [Bi2] G.D. Birkhoff: An extension of Poincar´e s last geometric theorem. Acta Mathematica 47, 297–311 (1925) [Bi3] G.D. Birkhoff: Dynamical Systems. American Mathematical Society, 1927 [BJ] Th. Br¨ ocker, K. J¨ anich: Einf¨ uhrung in die Differentialtopologie. Berlin: Springer, 1990 [BKMM] A. Bloch, P. Krishnaprasad, J. Marsden, R. Murray: Nonholonomic mechanical systems with symmetry. Archive for Rational Mechanics and Analysis 136 21–99 (1996) [BMZ] A. Bloch, J. Marsden, D. Zenkov: Nonholonomic Dynamics. Notices of the AMS 52, 324–333 (2005). link [BoSu] A. Bobenko, Y. Suris: Discrete differential geometry: Integrable structure. Graduate Studies in Mathematics 98. Providence: Amer. Math. Soc. 2008 [Bo1] R. Bott: On the iteration of closed geodesics and the Sturm intersection theory. Comm. Pure Appl. Math. 9, 171–206 (1956) [Bo2] R. Bott: Lectures on Morse theory, old and new. Bull. Amer. Math. Soc. 7, 331–358 (1982) ¨ [Br] H. Bruns: Uber die Integrale des Vielk¨ orper-Problems. Acta Math. XI, 25–96 (1887)
Literaturverzeichnis
611
[BrSe] H. Broer, M. Sevryuk: KAM Theory: quasi-periodicity in dynamical systems. In: Handbook of Dynamical Systems, Eds: B. Hasselblatt, A. Katok. North-Holland: 2007 [BrSi] F. Brini, S. Siboni: Estimates of correlation decay in auto/endomorphisms of the n-torus. Computers & Mathematics with Applications 42, 941–951 (2001) [BT] R. Bott, L. Tu: Differential forms in algebraic topology. Graduate Texts in Mathematics 82, New York: Springer 1995 [Bu] L.A. Bunimovich et al: Dynamical Systems, Ergodic Theory and Applications. Encyclopaedia of Mathematical Sciences 100, Berlin: Springer, 2000 [CB] R. Cushman, L. Bates: Global aspects of classical integrable systems. Basel: Birkh¨ auser, 1997 [CDD] Y. Choquet-Bruhat, C. DeWitt-Morette, M. Dillard-Bleick: Analysis, Manifolds and Physics, Part 1: Basics. North-Holland, 1982 [CFKS] H.L. Cycon, R.G. Froese, W. Kirsch, B. Simon: Schr¨ odinger Operators with Application to Quantum Mechanics and Global Geometry. Texts and Monographs in Physics. Berlin: Springer 1987 [CFS] I.P. Cornfeld, S.U. Fomin, Ya.G. Sinai: Ergodic Theory. Grundlehren der mathematischen Wissenschaften 245. Berlin: Springer 1982 [CJS] D. Currie, T. Jordan, E. Sudarshan: Relativistic Invariance and Hamiltonian Theories of Interacting Particles. Reviews of Modern Physics 35, 350–375 (1963) [CM] A. Chenciner, R. Montgomery , A remarkable periodic solution of the three-body problem in the case of equal masses. Annals of Mathematics, 152, 881–901 (2000) [CN] C.A.A. de Carvalhoa, H.M. Nussenzveig: Time delay. Physics Reports 364, 83–174 (2002) [Cr] F. Croom: Basic Concepts of Algebraic Topology. Undergraduate Texts in Mathematics. New York: Springer (1978) [CSM] R. Carter, G. Segal, I. Macdonald: Lectures on Lie groups and Lie algebras. London Mathematical Society Student Texts 32. Cambridge: Cambridge University Press (1995) [Cv] P Cvitanovi´ c, R. Artuso, R. Mainieri, G. Tanner, G. Vattay, N. Whelan and A. Wirzba: Chaos: Classical and Quantum. link [CW] N. Calkin, H. Wilf: Recounting the rationals. American Mathematical Monthly 107, 360–363 (2000) link [DB] P. Deuflhard, F. Bornemann: Numerische Mathematik II: Gew¨ ohnliche Differentialgleichungen. Berlin: de Gruyter, 2002 [De] M. Denker: Einf¨ uhrung in die Analysis dynamischer Systeme. Berlin: Springer, 2004 [DFN] B.A. Dubrovin, A.T. Fomenko, S.P. Novikov: Modern Geometry — Methods and Applications, Band I–III. Berlin: Springer, 1992 [DG] J. Derezi´ nski, C. G´ erard: Scattering Theory of Classical and Quantum N -Particle Systems. Texts and Monographs in Physics. Berlin: Springer, 1997 [DH] F. Diacu, P. Holmes: Celestial Encounters: The Origins of Chaos and Stability. Princeton: Princeton University Press, 1996 [Do] R. Douady: Applications du th´ eor` eme des tores invariants. Th` ese de 3e cycle, Universit´e Paris, Paris 1982
612
Literaturverzeichnis
[Du] J.J. Duistermaat: Symplectic Geometry, Course notes of the Spring School 2004. link [Ei1] A. Einstein: Zur Elektrodynamik bewegter K¨ orper. Annalen der Physik und Chemie 17, 891–921 (1905). link [Ei2] A. Einstein: Die Grundlage der allgemeinen Relativit¨ atstheorie. Annalen der Physik 49 (der ganzen Reihe: 354), 770–822 (1916). [EH] I. Ekeland, H. Hofer: Symplectic topology and hamiltonian dynamics. Mathematische Zeitschrift 100, 355–378 (1989) [El]
J. Elstrodt: Maß- und Integrationstheorie. Berlin: Springer 2009
[Ep] M. Epple: Die Entstehung der Knotentheorie: Kontexte und Konstruktionen einer modernen Mathematischen Theorie. Braunschweig: Vieweg, 1999 [Eu] L. Euler: De motu rectilineo trium corporum se mutuo attrahentium. Novi commentarii academiæ scientarum Petropolitanæ 11, 144–151 (1767). link [Fei] M.J. Feigenbaum: The Metric Universal Properties of Period Doubling Bifurcations and the Spectrum for a Route to Turbulence. Ann. New York. Acad. Sci. 357, 330–336 (1980) [Fej1] J. F´ ejoz: D´emonstration du ‘th´ eor` eme d’Arnold’ sur la stabilit´e du syst`eme plan´ etaire (d’apr` es Herman). Ergodic Theory and Dynamical Systems 24, 1521–1582 (2004) [Fej2] J. F´ ejoz: A simple proof of invariant tori theorems. Journal of Modern Dynamics 5 (2011) [Fej3] J. F´ ejoz: A proof of the invariant torus theorem of Kolmogorov (2011) [FOF] J. Figueroa-O’Farrill: Deformations of the Galilean Algebra. Journal of Mathematical Physics 30, 2735–2739 (1989) [FP] D. Fowler, P. Prusinkiewicz: Shell models in three dimensions. In H. Meinhardt: The Algorithmic Beauty of Sea Shells. Springer 4. Auflage, 2009 [Gali] P. Galison: Einsteins Uhren, Poincar´ es Karten. Die Arbeit an der Ordnung der Zeit. Frankfurt am Main: S. Fischer, 2003 [Galp] G. Galperin: Billiard balls count π. MASS Selecta, AMS, Providence, RI, 197-204 (2003) [Gal1] G. Galilei: Dialog ¨ uber die beiden haupts¨ achlichen Weltsysteme, das ptolem¨ aische und das kopernikanische (Dialogo sopra i due massimi sistemi, Florenz 1632. link) Leipzig 1891 ¨ [Gal2] G. Galilei: Uber zwei neue Wissenszweige. (Discorsi e dimostrazioni matematiche, Leiden 1638, link) In: S. Hawking, Ed. Die Klassiker der Physik. Hamburg: Hoffmann und Campe. 2004 [Ge] H. Geiges: Contact geometry. In: Handbook of Differential Geometry vol. 2 (Herausgeber: F.J.E. Dillen and L.C.A. Verstraelen), North-Holland, Amsterdam (2006). link [GHL] S. Gallot, D. Hulin, J. Lafontaine: Riemannian Geometry. Berlin: Springer, 1993 [Gi]
V.L. Ginzburg: The Weinstein conjecture and the theorems of nearby and almost existence. in ’The Breadth of Symplectic and Poisson Geometry’. Festschrift in Honor of Alan Weinstein; J.E. Marsden and T.S. Ratiu (Eds.), Birkh¨ auser, 2005, pp. 139–172
[GiHi] M. Giaquinta, St. Hildebrandt: Calculus of Variations II: The Hamiltonian formalism. Grundlehren der mathematischen Wissenschaften 311. Berlin: Springer
Literaturverzeichnis
613
[GS1] V. Guillemin, S. Sternberg: Symplectic Techniques in Physics. Cambridge: Cambridge University Press, 1984 [GS2] V. Guillemin, S. Sternberg: Convexity properties of the moment mapping. Inventiones mathematicae 67, 491–513 (1982) [GuHo] J. Guckenheimer, P. Holmes: Nonlinear Oscillation, Dynamical Systems and Bifurcations of Vector Fields (Applied Mathematical Sciences). Berlin: Springer 2002 [GZR] T. Geisel, A. Zacherl, G. Radons: Chaotic diffusion and 1/f -noise of particles in twodimensional solids. Z. Phys. B - Condensed Matter 71, 117–127 (1988). link [HaMe] G. Hall, K. Meyer: Introduction to Hamiltonian Dynamical Systems and the N -Body Problem. Berlin: Springer, 1991 [HaMo] M. Hampton, R. Moeckel: Finiteness of relative equilibria of the four-body problem. Inventiones Mathematicae 163, 289–312 (2006) [Hel] S. Helgason: The Radon Transform. Second Edition. Basel: Birkh¨ auser, 1999 [Her] M. Herman: Sur la conjugaison diff´ erentiable des diff´eomorphismes du cercle ` a des rota´ tions. Publ. Math., Inst. Hautes Etud. Sci. 49, 5–233 (1979) [Heu] H. Heuser: Gew¨ ohnliche Differentialgleichungen. Teubner, 1995 [Hil] S. Hildebrandt: Analysis 1 und 2. Berlin: Springer, 2002 [Hirs] M. Hirsch: Differential Topology. Graduate Texts in Mathematics 33. Berlin: Springer, 1988 [Hirz] F. Hirzebruch: Divisionsalgebren und Topologie. In: Ebbinghaus, H.-D. et al: Zahlen. Berlin, Heidelberg, New York: Springer, 1992 [HK] J. Hafele, R. Keating: Around the world atomic clocks: predicted relativistic time gains; observed relativistic time gains. Science 177, 166–168; 168–170 (1972) [Hun] W. Hunziker: Scattering in Classical Mechanics. In: Scattering Theory in Mathematical Physics. J.A. La Vita and J.-P. Marchand, Eds., Dordrecht: Reidel, 1974 [Huy] Ch. Huygens: Discours de la cause de la pesanteur. Addition. 1690, link [HZ] H. Hofer, E. Zehnder: Symplectic Invariants and Hamiltonian Dynamics. Basel: Birkh¨ auser, 1994 [Jac] C.G.J. Jacobi: Vorlesungen u ¨ber Dynamik. Neunundzwanzigste Vorlesung. Œvres compl` etes, tome 8, 1–290, 1866. link [Jae] K. J¨ anich: Topologie. Berlin, Heidelberg, New York: Springer, 1987 [JLJ] J. Jost, X. Li-Jost: Calculus of Variations. Cambridge: Cambridge University Press, 1999 [Jo] J. Jost: Riemannian geometry and geometric analysis. Universitext. Berlin, Heidelberg, New York: Springer, 2008 [KB] U. Kraus, M. Borchers: Fast lichtschnell durch die Stadt. Physik in unserer Zeit, Heft 2/2005, 64–69 [KH] A. Katok, B. Hasselblatt: Introduction to the Modern Theory of Dynamical Systems. Cambridge: Cambridge University Press, 1997 [Kh] A. Ya. Khinchin: Continued Fractions, Mineola: Dover, 1997
614
Literaturverzeichnis
[Ki] A. A. Kirillov: Merits and demerits of the orbit method. Bull. Amer. Math. Soc. 36, 433–488 (1999). link [Kl] F. Klein: Vergleichende Betrachtungen u ¨ber neuere geometrische Forschungen. (Erlanger Programm). 1872. link [KL] V. Kaloshin, M. Levi: An example of Arnold diffusion for near-integrable Hamiltonians. Bull. Amer. Math. Soc. 45, 409–427 (2008). link [Kle] A. Klenke: Wahrscheinlichkeitstheorie. Berlin: Springer, 2006 [Kli1] W. Klingenberg: Eine Vorlesung u ¨ber Differentialgeometrie. Berlin: Springer, 1973 [Kli2] W. Klingenberg: Riemannian Geometry. (De Gruyter Studies in Mathematics 1), 2nd Edition. Berlin: de Gruyter, 1995 [KMS] I. Kol´ a˘r, P. Michor, J. Slov´ ak: Natural Operations in Differential Geometry. Berlin, Heidelberg, New York: Springer, 1993. link [KN] S. Kobayashi, K. Nomizu: Foundations of Differential Geometry 1. New York: John Wiley & Sons, 1996 [Kn1] A. Knauf: Ergodic and Topological Properties of Coulombic Periodic Potentials. Commun. Math. Phys. 110, 89–112 (1987) [Kn2] A. Knauf: Closed orbits and converse KAM theory. Nonlinearity 3, 961–973 (1990) [Kn3] A. Knauf: The n-Centre Problem of Celestial Mechanics for Large Energies. Journal of the European Mathematical Society 4, 1–114 (2002) [Kop] N. Kopernikus: De Revolutionibus Orbium Coelestium. N¨ urnberg, 1543. link ¨ Zitat aus deutscher Ubersetzung, Seite 31 in: S. Hawking, Ed. Die Klassiker der Physik. Hamburg: Hoffmann und Campe. 2004 [KP] Th. Kappeler, J. P¨ oschel: KdV & KAM (Ergebnisse der Mathematik und ihrer Grenzgebiete 45). Berlin: Springer, 2003 [KR] M. Koecher, R., Remmert: Hamiltonsche Quaternionen. In: Ebbinghaus, H.-D. et al: Zahlen. Berlin, Heidelberg, New York: Springer, 1992 [Kre] U. Krengel: Ergodic Theorems (De Gruyter Studies in Mathematics 6). Berlin: de Gruyter, 1985 [KS] A. Knauf, Ya. Sinai: Classical Nonintegrability, Quantum Chaos. DMV–Seminar Band 27. Basel: Birkh¨ auser, 1997 [KT] V.V. Kozlov, D.V. Treshchev: Billiards : a genetic introduction to the dynamics of systems with impacts. AMS Translations of mathematical monographs 89, 1991 [Lag] J. Lagrange: Essai sur le Probl´eme des trois Corps (1772). Œuvres de Lagrange/ publ. par les soins de J.-A. Serret, Tome 6. Paris: Gauthier-Villars, 1873. link [LaMe] A. Laub, K. Meyer: Canonical forms for symplectic and Hamiltonian matrices. Celestial Mechanics and Dynamical Astronomy 89, 213–238 (1974) ¨ [Lap] P. de Laplace: Philosophischer Versuch u R. von Mises ¨ber die Wahrscheinlichkeit. Ub.: Reihe Ostwalds Klassiker, Bd. 233. Frankfurt am Main: Verlag Harri Deutsch, 2003 [Las1] J. Laskar: Large Scale Chaos and Marginal Stability in the Solar System. Celestial Mechanics and Dynamical Astronomy64, 115–162 (1996) link
Literaturverzeichnis
615
[Las2] J. Laskar: Existence of collisional trajectories of Mercury, Mars and Venus with the Earth. Nature 459, 817–819 (2009). link [Leu] H. Leutwyler: A no-interaction theorem in classical relativistic Hamiltonian particle mechanics. Nuovo Cimento 37, 556–567 (1965) [Lev] M. Levi: The Mathematical Mechanic: Using Physical Reasoning to Solve Problems. Princeton: Princeton University Press, 2009 [LF] L. Lusternik, A. Fet: Variational problems on closed manifolds. Dokl. Akad. Nauk. SSSR 81, 17–18 (1951); Amer. Math. Soc. Transl. 90 (1953) [Li]
¨ P. Littelmann: Uber Horns Vermutung, Geometrie, Kombinatorik und Darstellungstheorie. Jahresberichte der Deutschen Mathematiker-Vereinigung 110, 75–99 (2008)
[LiMa] P. Libermann, Ch.-M. Marle: Symplectic Geometry and Analytical Mechanics. Dordrecht: Reidel, 1987 [LL] A. Lichtenberg, M. Lieberman: Regular and chaotic dynamics. Applied Mathematical Sciences. Berlin, Heidelberg, New York: Springer, 1993 [Lon] Y. Long: Index theory for symplectic paths with applications. Progress in Mathematics 207. Basel: Birkh¨ auser, 2002 [Lou] A.K. Louis: Inverse und schlecht gestellte Probleme. Stuttgart: Teubner, 1989 [LW] C. Liverani, M.P. Wojtkowski: Ergodicity in Hamiltonian Systems. Dynamics Reported IV, 130–202. Berlin: Springer, 1995. link [Mac] R.S. MacKay, I.C. Percival: Converse KAM: theory and practice. Commun. Math. Phys. 98, 469–512 (1985) [MaMe] L. Markus, K.R. Meyer: Generic Hamiltonian dynamical systems are neither integrable nor ergodic. Memoirs of the AMS 144 (1974) [Mat] J. N. Mather: Existence of quasiperiodic orbits for twist homeomorphisms of the annulus. Topology 21, 457–467 (1982) [McD] D. McDuff: Floer theory and low dimensional topology. Bull. Amer. Math. Soc. 43, 25–42 (2006). link [Me] B. Meißner: Die mechanische Wissenschaft und ihre Anwendung in der Antike. In: Physik/Mechanik. Astrid Sch¨ urmann (Hg.). Geschichte der Mathematik und der Naturwissenschaften 3. Franz Steiner Verlag, 2005 [Mi] J. Milnor: Morse Theory. Annals Math. Stud. 51. Princeton: Princeton University Press, 1963 [MKO] R.J. MacKay, R.W. Oldford: Scientific method, statistical method and the speed of light. Statistical Science 15, 254–278 (2000) [MM] R. MacKay, J. Meiss: Hamiltonian Dynamical Systems: A reprint selection. Taylor & Francis, 1987 [MMC] J. Marsden, M. McCracken: The Hopf Bifurcation and Its Applications. Applied Mathematical Sciences 19. New York: Springer-Verlag, 1976. link [MMR] J. Marsden, R. Montgomery, T. Ratiu: Reduction, symmetry, and phases in mechanics. Memoirs of the American Mathematical Society 436, Volume 88. Providence (1990)
616
Literaturverzeichnis
[Mon1] R. Montgomery: A Tour of Subriemannian Geometries, Their Geodesics and Applications. (Mathematical Surveys and Monographs 91). American Mathematical Society, 2002 [Mon2] R. Montgomery: A New Solution to the Three-Body Problem. Notices of the AMS 48, 471–481 (2001). link [Mos1] J. Moser: Is the Solar System Stable? The Math. Intelligencer 1, 65–71 (1978). link [Mos2] J. Moser: Various aspects of integrable Hamiltonian systems. Dynamical systems, C.I.M.E. Lect., Bressanone 1978, Prog. Math. 8, 233–290 (1980) [Mos3] J. Moser: Regularization of Kepler’s problem and the averaging method on a manifold. Communications on Pure and Applied Mathematics 23, 609–636 (1970) [Mos4] J. Moser: Stable and random motion in dynamical systems. Princeton: Princeton University Press, 1973 [Mos5] J. Moser: Recent developments in the theory of Hamiltonian systems. SIAM review 28, 459–485 (1986) [Mos6] J. Moser: Dynamical Systems – Past and Present. Proc. Int. Congress of Math., Documenta Mathematica Extra Volume ICM 1998. link [Mou] F. Moulton: The straight line solutions of the problem of N bodies. Annals of Mathematics 12, 1–17 (1910) [MPC] H. M¨ uller, A. Peters, St. Chu: A precision measurement of the gravitational redshift by the interference of matter waves. Nature 463, 926–929 (2010) [MR] J. Marsden, T. Ratiu: Einf¨ uhrung in die Mechanik und Symmetrie. Berlin: Springer, 2001 [MS] D. McDuff, D. Salamon: Introduction to Symplectic Topology. Oxford: Oxford University Press, 1999 [MV] B. Marx, W. Vogt: Dynamische Systeme: Theorie und Numerik. Spektrum, Akad. Verlag, 2010 [MW] J. Marsden, A. Weinstein: Reduction of symplectic manifolds with symmetry. Rep. Math. Phys. 5, 121–130 (1974). link [Nar] H. Narnhofer: Another Definition for Time Delay. Phys. Rev. D 22, 2387–2390 (1980) [Nat] F. Natterer: The Mathematics of Computerized Tomography. Teubner, 1986 [Ne] I. Newton: Philosophiae Naturalis Principia Mathematica. 1687. link Deutsch in: S. Hawking, Ed. Die Klassiker der Physik. Hamburg: Hoffmann und Campe. 2004 [Ni] L. Nicolaescu: An Invitation to Morse Theory. Universitext. New York: Springer, 2007 [No] E. Noether: Invariante Variationsprobleme. Nachrichten von der K¨ onigl. Gesellschaft der Wissenschaften zu G¨ ottingen, Mathematisch-physikalische Klasse, 235–257 (1918). link [NT] H. Narnhofer, W. Thirring: Canonical Scattering Transformation in Classical Mechanics. Phys. Rev. A 23, 1688–1697 (1981) [OV] A. Onishchik, E. Vinberg: Lie Groups and Lie Algebras III: Structure of Lie Groups and Lie Algebras. Encyclopaedia of Mathematical Sciences 41, Berlin: Springer 1994
Literaturverzeichnis
617
[Pai] P. Painlev´ e: Le¸cons sur la th´ eorie analytique des ´ equations differentielles. Le¸cons de Stockholm, in ”Œuvres de P. Painlev´e I”, Editions du C.N.R.S., Paris, 199–818, 1972. link [Pat] G. Paternain: Geodesic Flows (Progress in Mathematics). Basel: Birkh¨ auser, 1999 [PdM] J. Palis, W. de Melo: Geometric theory of dynamical systems. New York: Springer, 1982 [Pen] R. Penrose: The apparent shape of a relativistically moving sphere. Proc. Cambridge Philos. Soc. 55, 137–139 (1959) [Per] L. Perko: Differential equations and dynamical systems. Berlin: Springer, 2. Aufl., 1991 [Poe] J. P¨ oschel: Integrability of Hamiltonian Systems on Cantor Sets. Commun. Pure Appl. Math. 35, 635–695 (1982) [Poi1] H. Poincar´ e: Sur les courbes d´ efinies par les ´ equations diff´ erentielles. Journal des Math´ ematiques pures et appliqu´ ees 3, 375–422 (1881) [Poi2] H. Poincar´ e: Les M´ ethodes Nouvelles de la M´ ecanique C´ eleste, Band 3. Paris: GauthierVillars, 1899 [Poi3] H. Poincar´ e: The present and the future of mathematical physics. Bull. Amer. Math. Soc. 37, 25–38 (1999). link [PR1] R. Penrose, W. Rindler: Spinors and Space-Time: Volume 1, Two-Spinor Calculus and Relativistic Fields. Cambridge: Cambridge University Press 1987 [PR2] I. Percival, D. Richards: Introduction to Dynamics. Cambridge: Cambridge University Press, 1983 [Ro] C. Robinson: Dynamical Systems: Stability, Symbolic Dynamics, and Chaos. CRC Press, 1999 [Qu] E. Quaisser: Diskrete Geometrie. Heidelberg: Spektrum, Akad. Verlag, 1994 [Sa] D. Saari: Collisions, rings, and other Newtonian N –body problems. AMS, Providence, 2005 [SB] H. Schulz-Baldes: Sturm intersection theory for periodic Jacobi matrices and linear Hamiltonian systems. 2010 [Schm] St. Schmitz: Zum inversen Streuproblem der klassischen Mechanik. Dissertation, TU M¨ unchen (2006) [Scho] M Schottenloher: Geometrie und Symmetrie in der Physik: Leitmotiv der mathematischen Physik. Wiesbaden: Vieweg 1995 [Schw] M. Schwarz: Morse homology. Progress in Mathematics 111. Basel: Birkh¨ auser, 1993 [Sib] K.F. Siburg: The Principle of Least Action in Geometry and Dynamics. Lecture Notes in Mathematics 844. Berlin: Springer, 2004 [Sim] B. Simon: Wave operators for classical particle scattering. Commun. Math. Phys. 23, 37–48 (1971) [Sin] Ya. G. Sinai: Dynamical Systems with Elastic Reflections. Russian Math. Surveys 25, 137–191 (1970) [SM] C.L. Siegel, J. Moser: Lectures on Celestial Mechanics. Grundlehren der mathematischen Wissenschaften 187. Berlin: Springer 1971
618
Literaturverzeichnis
[Smi] U. Smilansky: The Classical and Quantum Theory of Chaotic Scattering. In: Chaos and Quantum Physics. M.-J. Giannoni et al, Eds. Les Houches LII. Amsterdam: North-Holland 1989 [Sm1] S. Smale: Differentiable dynamical systems. Bull. Amer. Math. Soc. 73, 747–817 (1967). link [Sm2] S. Smale: Topology and mechanics, Part I. Inventiones Mathematicae 10, 305–331 (1970); Part II: The planar n-body problem. Inventiones Mathematicae 11, 45–64 (1970) [Sob1] D. Sobel: L¨ angengrad. M¨ unchen: Btb 1998 [Sob2] D. Sobel: Galileos Tochter. Berlin: BTV 2008 [Som] A. Sommerfeld: Mechanik. Vorlesungen u ¨ber Theoretische Physik, Band I. Thun: Harry Deutsch, 1977 [StSc] E. Stiefel, G. Scheifele: Linear and regular celestial mechanics. Grundlehren der mathematischen Wissenschaften in Einzeldarstellungen 174. Berlin: Springer, 1971 [SV] J. Sanders, F. Verhulst: Averaging methods in nonlinear dynamical systems. Berlin: Springer 1985 [SW] H. Sussmann, J. Willems: 300 years of optimal control: from the brachystochrone to the maximum principle. IEEE Control Systems Magazine 17, 32–44 (1997) [Ta] S. Tabachnikov: Geometry and Billiards. American Mathematical Society, 2005. link [Te] J. Terrell: Invisibility of the Lorentz contraction. Physical Review 116, 1041–1045 (1959) [Th1] W. Thirring: Lehrbuch der Mathematischen Physik, Band 1. Klassische Dynamische Systeme. Wien: Springer, 1988 [Th2] W. Thirring: Lehrbuch der Mathematischen Physik, Band 2. Klassische Feldtheorie. Wien: Springer, 1990 [Un] A. Ungar: The relativistic velocity composition paradox and the Thomas rotation Foundations of Physics 19, 1385–1396 (1989) [Wa1] W. Walter: Gew¨ ohnliche Differentialgleichungen. Springer 1996 [Wa2] P. Walters: An Introduction to Ergodic Theory. Graduate Texts in Mathematics 79. Berlin, Heidelberg, New York: Springer, 1982 [WDR] H. Waalkens, HR. Dullin, P. Richter: The problem of two fixed centers: bifurcations, actions, monodromy. Physica D: Nonlinear Phenomena 196, 265–310 (2004) [Weid] J. Weidmann: Spectral Theory of Ordinary Differential Operators (Lecture Notes in Mathematics 1258) Berlin: Springer, 2009 [Wein] A. Weinstein: Symplectic geometry. Bull. Amer. Math. Soc. 5, 1–13 (1981). link ¨ [Wey] H. Weyl: Uber die Gleichverteilung von Zahlen mod. eins. Mathematische Annalen 77, 313–352 (1916). link [Whi] E. Whittaker: A treatise on the analytical dynamics of particles and rigid bodies. Cambridge, 1904. link Analytische Dynamik der Punkte und starren K¨ orper. Nach der 2. Auflage u ¨bersetzt; Berlin: Springer, 1924
Literaturverzeichnis
619
[Wil] J. Williamson: On the algebraic problem concerning the normal forms of linear dynamical systems. American Journal of Mathematics 58, 141–163 (1936) [Wit] E. Witten: Supersymmetry and Morse theory. J. Differential Geometry 17, 661–692 (1982) [WPM] J. Wisdom, S. Peale, F. Mignard: The chaotic rotation of Hyperion. Icarus 58, 137–152 (1984) [Wu] R. W¨ ust: H¨ ohere Mathematik f¨ ur Physiker, Bd. 1. Berlin: de Gruyter, 1995 [Xi]
Z. Xia: The Existence of Noncollision Singularities in Newtonian Systems. Annals of Mathematics 135, 411–468 (1992)
[Yo] H. Yoshida: Construction of higher order symplectic integrators. Physics Letters A 150, 262–268 (1990) [Zee] E. Zeeman: Causality Implies the Lorentz Group. Journal of Mathematical Physics 5, 490–493 (1964) [Zeh] E. Zehnder: Lectures on Dynamical Systems. Textbooks in Mathematics. Z¨ urich: European Mathematical Society, 2010 [Zei] E. Zeidler (Hg.): Teubner - Taschenbuch der Mathematik. Vieweg+Teubner, 2003 [ZP] W. Zurek, J. Paz: Why We Don’t Need Quantum Planetary Dynamics: Decoherence and the Correspondence Principle for Chaotic Systems. arxiv.org (1996)
Namensregister In der pdf-Version des Buches sind die Namen mit der deutschsprachigen Wikipedia verlinkt. A Jean-Baptiste d’Alembert (1717–1783), 365 Archimedes von Syrakus (-287 – -212), 214 Vladimir Arnol’d (1937–2010), 121, 237, 310, 400 Michael Atiyah (geb. 1929), 330, 340 B Stefan Banach (1892–1945), 506 Ivar Otto Bendixson (1861–1935), 384 Jakob Bernoulli (1655–1705), 158, 191 Johann Bernoulli (1667–1748), 157 Michael Berry (geb. 1941), 173 George Birkhoff (1884–1944), 195, 306 Raoul Bott (1923–2005), 121 Werner Boy (1879–1914), 469 Tycho Brahe (1546–1601), 413 Heinrich Bruns (1848–1919), 252 C Georg Cantor (1845–1918), 275, 384 ´ Cartan (1869–1951), 471 Elie Ernesto Ces` aro (1859–1906), 184 Boris Chirikov (1928–2008), 408 Wei-Liang Chow (1911–1995), 365 Elwin Christoffel (1829–1900), 161 Steven Chu (geb. 1948), 423 Alexis Clairaut (1713–1765), 164 Lothar Collatz (1910–1990), 12 Nicolaus Copernicus (1473-1543), 411 Gaspard Gustave de Coriolis (1792–1843), 351 Allan Cormack (1924–1998), 281 D Jean Darboux (1842–1917), 214 Guillaume de L’Hospital (1661–1704), 158 Arnaud Denjoy (1884–1974), 25 Georges de Rham (1903–1990), 497 Diophant von Alexandrien , 381 Jean Marie Duhamel (1797–1872), 68 E Charles Ehresmann (1905–1979), 527
Albert Einstein (1879–1955), xii, 161, 386, 411 Leonhard Euler (1707–1783), 71, 154, 351, 352, 538 F Werner Fenchel (1905–1988), 501 Pierre de Fermat (ca 1607–1665), 169 Leonardo Fibonacci (ca. 1180–1241), 405 Andreas Floer (1956–1991), 448 Jean Baptiste Fourier (1768–1830), 111, 282 Maurice Ren´ e Fr´ echet (1878–1973), 153 Ferdinand Georg Frobenius (1849–1917), 208, 532 G Galileo Galilei (1564–1642), 1, 158, 411 Carl Friedrich Gauss (1777–1855), 49, 109, 161, 379, 406, 493 Johannes Geiger (1882–1945), 275 Alexander Givental, 208 Hermann Grassmann (1809–1877), 119, 475 Mikhail Gromov (geb. 1943), 438, 440 Thomas Hakon Gr¨ onwall (1877–1932), 51 H William Hamilton (1805–1865), 93, 154, 324, 425 Felix Hausdorff (1868–1942), 453 Michael Herman (1942–2000), 25 Jakob Hermann (1678–1733), 241 David Hilbert (1862–1943), 17, 178 Helmut Hofer (geb. 1956), 213, 441 Eberhard Hopf (1902–1983), 136 Heinz Hopf (1894–1971), 108, 228, 546 Alfred Horn (1918–2001), 341 Godfrey Hounsfield (1919–2004), 281 Christiaan Huygens (1629–1695), 251, 413 J Carl Jacobi (1804–1851), 26, 65, 166, 247 Marie Ennemond Jordan (1838–1022), 60 J¨ urgen Jost (geb. 1956), 448 K Anatole Katok (geb. 1944), 11
620
Namensregister Lord Kelvin (1824–1907), 492 Johannes Kepler (1571–1630), 3, 175, 261 Felix Klein (1849–1925), 414 Andrei Kolmogorov (1903–1987), 178, 237, 400 Bernard Koopman (1900–1981), 183 Nikolaus Kopernikus (1473–1543), 260 Ky Fan (1914–2010), 342 L Joseph-Louis Lagrange (1736–1813), 94, 116, 145, 154, 220, 365, 508 Pierre-Simon Laplace (1749–1827), 12, 240, 368 Joseph Larmor (1857–1942), 114 Jacques Laskar (geb. 1955), 385 Henri L´ eon Lebesgue (1875–1941), 178, 272 Adrien-Marie Legendre (1752–1833), 501 Gottfried Wilhelm Leibniz (1646–1716), 2, 72, 158 Wilhelm Lenz (1888–1957), 240 Urbain Le Verrier (1811–1877), 386 Tullio Levi-Civita (1873–1941), 245, 531 Alexander Liapunov (1857–1918), 19, 131 Paulette Libermann (1919-2007), 126, 213 Sophus Lie (1842–1899), 65, 487, 511 Ernst Leonard Lindel¨ of (1870–1946), 37 Joseph Liouville (1809–1882), 180, 205, 310 Rudolf Lipschitz (1832–1903), 36 Jules Antoine Lissajous (1822–1880), 107 Lasar Aronowitsch Ljusternik (1899–1981), 550 Hendrik Lorentz (1853–1928), 113, 118, 414 M Ernest Marsden (1899–1970), 275 Jerrold Marsden (1942-2010), 330 Viktor Maslov (geb. 1930), 121 John Mather (geb. 1942), 410 Pierre-Louis Maupertuis (1698–1759), 168 Dusa McDuff (geb. 1945), 213, 448 Meton (5. Jahrhundert v. Chr.), 408 Milutin Milankovi´ c (1879–1958), 385 Hermann Minkowski (1864–1909), 414 August M¨ obius (1790–1868), 427, 460 Christian Møller (1904–1980), 268 Marston Morse (1892–1977), 168, 537, 547 J¨ urgen Moser (1928–1999), 237, 245, 266, 400 Forest Ray Moulton (1872–1952), 254 N Isaac Newton (1643–1727), 2, 83, 145, 158, 251, 387, 413 Emmy Noether (1882–1935), 330 P Paul Painlev´ e (1863–1933), 266 Raymond Paley (1907-1933), 381 Giuseppe Peano (1858–1932), 37, 458
621 Roger Penrose (geb. 1931), 427 Emile Picard (1856–1941), 37 Henri Poincar´ e (1854–1912), 7, 91, 198, 238, 252, 291, 387, 414, 494, 544 Louis Poinsot (1777–1859), 357 Sim´ eon Poisson (1781–1840), 209, 290, 338 R Johann Radon (1887–1956), 281 Bernhard Riemann (1826–1866), 160, 161 Olinde Rodrigues (1795–1851), 518 Ole Rømer (1644–1710), 413 Wilhelm Conrad R¨ ontgen (1845–1923), 281 Carl David Tolm´e Runge (1856–1927), 240 S Dietmar Salamon (geb. 1953), 213 Winfried Scharlau (geb. 1940), 387 Lew Genrichowitsch Schnirelman (1905–1938), 550 Robert Schrader (geb. 1939), xiv Issai Schur (1875–1941), 341 Karl Schwarzschild (1873–1916), 386 Jakow Grigorjewitsch Sinai (geb. 1935), 190 Steven Smale (geb. 1930), 28, 256 Willebrord van Roijen Snell (1580–1626), 171 Jean-Marie Souriau (geb. 1922), 336 Shlomo Sternberg (geb. 1936), 340 Eduard Stiefel (1909–1978), 245, 342 George Gabriel Stokes (1819–1903), 492 T Walter Thirring (geb. 1927), xiv, 274 Llewellyn Thomas (1903–1992), 419 Walther von Tschirnhaus (1651–1708), 158 W Karl Weierstraß (1815–1897), 59 Alan Weinstein (geb. 1943), 219, 330 Hermann Weyl (1885–1955), 372 Hassler Whitney (1907–1989), 469 Edmund Taylor Whittaker (1873–1956), 252, 360 Norbert Wiener (1894-1964), 381 Eugene Wigner (1902–1995), xii Herbert Wilf (geb. 1931), 13 Edward Witten (geb. 1951), 539 Joseph Marie Wronski (1778–1853), 67 Y Yukawa Hideki (1907–1981), 308 Z Eduard Zehnder (geb. 1940), 213
Symboltabelle AB = {f : B → A} α(x) α–Limesmenge, 19 Alt(n, R), 517 Brd Kugel, xv Cf,g Korrelationsfunktion, 185 d¨ außere Ableitung, 477 Dk Ableitung nach dem k–ten Argument deg(f ) Abbildungsgrad, 122 exp Exponentialfunktion auf Lin(V ), 58 E(n) euklidische Gruppe, 344 E(f | I) bedingte Erwartung, 194 Jr (λ) Jordan–Block, 60 F ⊥ ω–orthogonales Komplement, 116 Gr(v, n) Grassmann–Mannigfaltigk., 119 g riemannsche Metrik, 160 Γhi,j Christoffel–Symbol, 161 f Birkhoff-Zeitmittel, 191 iX inneres Produkt mit Vektorfeld X, 487 IdM , identische Abbildung, IdM (x) = x J Impulsabbildung, 324 LK(c1 , c2 ) Verschlingungsintegral, 109 LX Lie–Ableitung nach Vektorfeld X, 487 L(c) L¨ ange einer Kurve c, 160, 545 λd Lebesgue–Mass auf Rd , 179 Λ(E, ω) Lagrange–Grassmann– Mannigfaltigkeit, 119 L(v) Lorentz–boost, 418 O(d) metrische Topologie, 451 O(f ), o(f ) Landausche Symbole O(F ) von F erzeugte Topologie, 450 O(m) Orbit durch m, 14 ω(x) ω–Limesmenge, 19 ω0 kanonische symplektische Form, 205 Ω± Møller-Transformationen, 268 außeren k–Formen, 472 Ωk (E) Raum der ¨ Ωk (U ) Raum der Differentialformen k–ter Stufe, 477 ∗ Fußpunktprojektion, 204 πM p± asymptotische Impulse, 261
P(N ) Partitionsverband, 292 R erweiterte Zahlengerade, 48 RP (m) projektiver Raum, 119 Rvir Virialradius, 261 σ(·) erzeugte σ–Algebra, 178 S Streutransformation 274 S Rd Schwartz–Raum, 282 are, xv S d Sph¨ SE(d) orientierungserhaltende euklidische Gruppe, 345 Sym(n, K), 512 Td Torus 167 T Zeitumkehr, 227 T ± Fluchtzeiten, 48 T ∗ f Kotangentiallift von f , 216 T M Tangentialb¨ undel von M , 464 T ∗ M Kotangentialb¨ undel von M , 202 v transponierter Vektor θ0 tautologische Form, 205 X (M ) Raum der Vektorfelder, 466 f (t) iterierte Abbildung f , 12 · : R → R ceil–Funktion, 49 · : R → R floor –Funktion, 49 x˙ Zeitableitung , 118 · gegl¨ attete Betragsfunktion, 260 f Birkhoff-Zeitmittel von f , 191 ∂A Rand einer Teilmenge A, 452 ∂M Rand einer Mannigfaltigkeit M , 461 dσ differentieller Wirkungsquersch., 276 dθ f : M → N Einbettung, 468 ∧¨ außeres Produkt, 473
622
Symboltabelle
623
Abbildungsnachweis • Die Abbildungen auf den Seiten 1, 8, 127, 143, Abb. 8.6.2 auf Seite 170, Abb. 8.7.1 (rechts) auf Seite 173, die Abbildungen auf den Seiten 176, 190, 225, 259 und 281, in der Aufgabe 12.35 auf Seite 288, auf den Seiten 343, 358, 360, 408, 413, 437, 469 und 546 entstammen wikimedia. • Die Abbildungen auf Seite 11 entstammen dem von D. Fowler und P. Prusinkiewicz geschriebenen Kapitel 10 des Buchs [FP] von H. Meinhardt. • Die Abbildung 8.3.1 (links) auf Seite 157 entstammt dem Artikel [SW] von H. Sussmann und J. Willems. • Die Abbildung auf Seite 175 verwendet das mathematica-Notebook ,Ray Diagrams for Lenses’ von Ernest Lee (Wolfram Demonstrations Project) • Die Abbildung auf Seite 177 stammt von Rick Hanley. • Die Abbildung auf Seite 266 entstammt dem Artikel [Mos6] von J¨ urgen Moser. • Die Abbildung auf Seite 305 stammt von Ulrich Pinkall. • Die Abbildung auf Seite 350 (links) entstammt www.astronet.ru. • Die Abbildungen auf Seite 356 entstammen The Mathematica Journal (links), NASA/JPL/Space Science Institute (Mitte) und The Mathematical Sciences Research Institute (MSRI), DVD ’The Right Spin’ (rechts). • Die Abbildung auf Seite 361 entstammt Physics: A World View, von L. Kirkpatrick und G. Wheeler, Cengage • Die Abbildung auf Seite 367 entstammt NASA/JPL-Caltech • Die Abbildung auf Seite 402 entstammt Figure 8.3-3 im Buch Foundations of Classical Mechanics [AM] von Ralph Abraham und Jerrold E. Marsden. • Die Abbildungen auf Seite 411 stammen von Ute Kraus und Marc Borchers, www.spacetimetravel.org • Die Abbildung auf Seite 566 stammt von Christoph Schumacher • Die Abbildung auf Seite 594 stammt von Markus Stepan. Ich danke Allen, die den Abdruck der genannten Abbildungen erlaubten. Die anderen Abbildungen wurden vom Autor produziert.
Sachregister Fett: Seitenzahlen von Definitionen.
Abbildungsgleichung 174 Abbildungsgrad 109, 122, 443 Aberration chromatische 175 sph¨arische 172 abgeschlossen 453 Achromat 175 adjungierte Darstellung 519 ¨aquivariant 328 ¨außere Ableitung 486 ¨außerer Punkt 453 Aharonov-Bohm–Effekt 494 Algebra ¨außere 475 Grassmann– 475 Lie– 101, 515 sigma– 178 symplektische 95, 101 Alphabet 18, 190 Anfangsbedingung 36 Anfangswertproblem 36 anharmonischer Oszillator 224 anomale Diffusion 237 Anomalie (Kepler–Ellipsen) 5 Antikythera–Mechanismus 408 antisymmetrisch 472, 517 aperiodischer Grenzfall 71, 86 Arnol’d–Diffusion 446 Arnol’d–Vermutung 447 asymptotische Vollst¨andigkeit 273, 291, 299 Atlas 458, 461 ¨aquivalente Atlanten 458
nat¨ urlicher 465 Attraktor 20 Autokorrelationsfunktion 185 Bahnkurve 14 ballistisch 235 banachscher Fixpunktsatz 37, 272, 387, 506 Basis eines Faserb¨ undels 522 Bassin 20, 132 bedingte Erwartung 194 bedingt-periodische Bewegung 314, 371 Frequenzen der 371 rational unabh¨angige 106, 371 Bernoulli–Maß 191 Beschleunigung 94 Betti–Zahlen 497, 537 Bifurkation 134, 152, 256 Bilinearform 96 antisymmetrische 96 Billard 190, 287, 445 Boysche Fl¨ache 469 Brachistochrone 157 B¨ undel 522 Hauptfaser- 108, 124, 334, 524 horizontales/vertikales 527 Vektor- 202, 525 Cantor–Menge 13, 275, 384, 455 Cantorus 410 Cayley–Transformation 561 Ces`aro–Mittel 184, 191, 263 Charaktere 183, 188, 509 charakteristische Linien 218 Choreographie 257 Christoffel–Symbol 161, 531 Cluster 287, 292, 299 Computertomographie 281 624
Sachregister Coriolis–Kraft 351 Coulomb–Potential 236, 261, 276 darstellende Matrix 96 Darstellung 509 Definitionsbereich des Flusses 49 Deformation einer Lie–Algebra 431 Deformationsretrakt 540 Derivation 210, 338, 478, 488 dichte Teilmenge 452 Diffeomorphismus 26, 28, 55, 462 lokaler 26, 519 Differentialform 486 Differentialgleichung 30 autonome 36 explizite 32 explizit zeitabh¨angige 36 geod¨atische 161 Gradienten- 90, 216 hamiltonsche 93 homogene 32 lineare 32, 57 Ordnung der 31 differentieller Wirkungsquerschnitt 276 differenzierbare Struktur 458 Diffusion 236 Dilatation 243, 362, 375, 420 diophantische Bedingung 380, 403 diskrete Teilmenge 312 Dispersionsrelation 112 Distribution 149, 208, 532 Doppelpendel 166 Drehgruppe SO(3) 121, 326, 517, 520 Drehimpuls 4, 164, 239, 306, 323, 354 Dreiachsenstabilisation 535 Dreik¨orperproblem 7, 385 Dualbasis 472 D¨ unne Linse 174 Duhamel–Prinzip 68 dynamisches System 13, 36 diskretes 14 ergodisches 181 mischendes 184 maßerhaltendes 180 stetiges 16 effektives Potential 308
625 Ehresmann–Zusammenhang 527 eigentliche Abbildung 331, 521 Einbettung 161, 161, 468 einfach zusammenh¨angend 456 Einfangorbit 251, 261 Einheitstangentialb¨ undel 524 Einsteinsche Summenkonvention 161 elastischer Stoß 287 Ellipse 5, 552 elliptische Matrix 103, 115, 187 Energie kinetische 144 potentielle 144 Ruhe– 148 Energiefunktional 156, 538 Energieschale 94 Epizykeltheorie 350 Ergodentheorie 181 ff., 229 ergodisch 181 eindeutig 372 Erwartungswert 193 erweiterte Zahlengerade 48 erzwungene Schwingung 87 escape-Funktion 133 Euler–Kraft 351 Euler–Lagrange–Gleichung 154 Euler–Winkel 358 exakte Differentialform 493 Sequenz 543 Experimente Aharonov-Bohm 494 Hafele–Keating 422 Rutherford 275 Exponentialabbildung Differentialgeometrie 546 Lie–Gruppen 58, 516 Exponentialfunktion 58 Extremum 154 Faktor eines dynamischen Systems 22 Faktorgruppe 509 Faltungssingularit¨at 172, 278 Faserb¨ undel 108, 124, 141, 202, 362, 368, 431, 513, 522 Fasertranslation 216, 389
626 Fata Morgana 169 Feder 84 fermatsches Prinzip 169 Fibonacci–Zahlen 405 Fixpunkt einer Abbildung 506 eines dynamischen Systems 14 nicht degenerierter 448 Fliehkraft 351 Floer–Theorie 448 floor –Funktion 13, 49 Fluchtzeiten 48 Fluss 14, 47 maximaler 49 Formsph¨are 257, 362 freie Bewegung 18, 84, 133, 261, 335 Freiheitsgrad 94 Fundamentalgruppe 456 Fundamentalsystem 66 Fußpunkt 464 -projektion 204 Gauss–Abbildung 109 (Differentialgeometrie) 180, 406 (Zahlentheorie) Gebiet 80 gebundener Orbit 261 generisch 28, 342, 368, 537 geod¨atisch vollst¨andig 546 geod¨atische Bewegung 245, 161 geschlossene Differentialform 493 Mannigfaltigkeit 206, 549, 550 Geschwindigkeit 94 glatte Abbildung 462 Gleichzeitigkeit 431 Goldener Schnitt 405, 407, 409 Gradient 470 Gradientenfluss 90, 216 Graf–Partition 296 Grassmann–Algebra 475 Grassmann–Mannigfaltigkeit 119 Gronwall–Ungleichung 51 Gruppe affin symplektische 439
Sachregister allgemeine lineare GL(n, K) 64, 512, 526 Drehgruppe SO(3) 121, 326, 517, 520 Drehgruppe SO(n) 348, 513 Euklidische E(n) 344, 511 Faktor– 509 Galilei– 430 GL(2, Z) 186 Holonomie– 534 indefinite orthogonale O(m, n) 414 Isotropie– 312, 331, 509 Lie– 511 Lorentz– 414 orthogonale O(n) 513 Poincar´e– 414 projektive lineare PGL(V ) 426 spezielle lineare SL(n, R) 102, 115, 337, 439, 513 speziell unit¨are SU(n) 514 Struktur– 524 SU(2) 466, 514 symplektische Sp(R2n ) 98, 102, 117, 126, 176, 337 topologische 511 unit¨are U(n) 513 Gruppengeschwindigkeit 111 Gruppenwirkung 17, 509, 519 ¨aquivariante 328 diagonale 345 eigentliche 521 freie 312, 509 lokal freie 311, 331 (schwach) hamiltonsche 324 symplektische 324 transitive 312, 509 Gullstrand–Formel 578 Haar–Maß 179, 498 H¨aufungspunkt einer Teilmenge 452 halbeinfach 104 Hamilton–Funktion 93, 148 relativistische 148 hamiltonsch 93, 204, 213, 324 lokal 204 schwach 324
Sachregister hamiltonsches System 204 harmonischer Oszillator 69, 71, 105, 224, 524 Hauptfaserb¨ undel 362, 524 Hauptkr¨ ummung 161 Haupttr¨agheitsmoment 353 Hausdorff–Raum 453 Hillsches Gebiet 227, 249 Himmelskugel 109, 425 holonome Zwangsbedingung 149, 167 Holonomiegruppe 534 Hom¨oomorphismus 454 homogener Raum 123 Homogenit¨at der Raumzeit 424 Homologie 541 Homotopie 125, 258, 318, 456 Homotopie¨aquivalenz 456 Hookesches Kraftgesetz 83 Hopf–Abbildung 108, 245, 428 Hopf–Verzweigung 136 Hyperbel 5, 417 hyperbolisch 76 hyperbolische Matrix 103, 115, 187 ideales Gas 376 Immersion 468 Impuls 94, 144, 145 Impulsabbildung 324 Index eines kritischen Punktes 537 einer Matrix 76 Maslov– 122 einer Ruhelage 76 infinitesimaler Erzeuger 520 infinitesimal symplektisch 95, 101 inneres Produkt 487 instabile Ruhelage 20 instabiler Unterraum 76 integrabel hamiltonsche Systeme 400, 409 Distributionen 532 invariante Teilmenge des Phasenraums 16 involutiv Distributionen 532 Transformationen 503
627 Involution 310 isotrop Untermannigfaltigkeit 219 Unterraum 116 Isotropie der Raumzeit 416 Isotropiegruppe 312, 331, 509 iterierte Abbildung 12 Jacobi–Identit¨at 64, 101, 212, 366, 515 Jordan–Matrix, –Normalform 60 reelle 63 Jacobi–Metrik 166, 228 kanonische Koordinaten 210, 214 kanonische Transformation 213 Karte einer berandeten Mannigfaltigkeit 461 einer Mannigfaltigkeit 457 nat¨ urliche 465 Kartenwechsel 457 Kaustik 172 Kepler–Potential 239, 261 Keplersche Gesetze 3 Kepler–Teleskop 175 Kette (Homologietheorie) 541 Knoten 81; 109 Kohomologie 497 kohomologische Gleichung 390 Kollisionsunterraum 293 Kommutator 101, 211, 536 kommutierendes Diagramm 23 kompakt 453 komplexe Struktur 98 Konfigurationsraum 94, 149, 463 Konjugation (Gruppen) 510 konjugiert dynamische Systeme 22 Gruppen 509 Punkte auf einer Geod¨ate 547 Konstante der Bewegung 309 Kontaktmannigfaltigkeit 207 kontrahierbar 456 Kontraktion auf metrischem Raum 39, 506 einer Lie–Algebra 431 konvex 500
628 Koordinaten 27, 457 B¨ undel– 202 Impuls– 474 kanonische 210 k¨orpereigene 348 Kugel– 467 lokales Koordinatensystem 457 nat¨ urliche 465 Orts– 474 Polar– 307, 481 raumfeste 348 spheroid-prolate 247 Winkel-Wirkungs– 315 Koordinatenvektorfeld 488 Korrelationsfunktion 185 Kotangentialb¨ undel 202 Kotangentiallift 215, 216, 389 Kotangentialraum 202 Kotangentialvektor 202 kovariante Ableitung 531 Kreisel 352 Kreisrotationen 15, 24, 182, 185 Kriechfall 86 kritische Menge 299 kritischer Punkt 153 Kr¨ ummung 161, 535 innere 161 K¨ unneth–Formel 499 Kurve 456 regul¨are 468 zeitartige 421 L¨angenfunktional 153, 545 Kustaanheimo-Stiefel– Transformation 245 Lagrange-d’Alembert– Bewegungsgleichungen 365 Lagrange–Funktion 145, 468 Lagrange–Gleichung 145 Lagrange–Grassmann– Mannigfaltigkeit 119 Lagrange–Mannigfaltigkeit 173, 219, 310 Lagrange–Punkt 255 Lagrange–Unterraum 116 Laplace–Runge–Lenz–Vektor 240
Sachregister Lebesgue–Mass λd auf Rd , 179 Legendre–Transformierte 146, 501 Legierung 231 Lemma von Hadamard 271 Levi-Civita–Transformation 245 Levi-Civita–Zusammenhang 531, 532 Liapunov–Funktion 131 liapunov–stabil 19, 102, 128, 129, 360 lichtartig 419 Lichtgeschwindigkeit 148, 148, 412, 414 Lie–Ableitung 487 Lie–Algebra 101, 515 Lie–Gruppe 511 Lie–Klammer 211 Lift bei B¨ undeln 528 Linkslift einer Gruppenwirkung 327 Limes superior/inferior 49 Linse 171 Liouville–Form 205 Liouville–Maß 180, 310 Lipschitz–Bedingung 36 Lissajous–Figur 107 Ljusternik–Schnirelmann–Kategorie 550 L¨ osung einer Differentialgleichung 36 allgemeine 33 homographische 253 maximale 48 singul¨are 33 spezielle 33 vollst¨andige 33 L¨ osungsraum 66 L¨ osungsoperator 66 logistische Familie 21 lokalkompakt 453 lokal trivial 141, 522 Lorentz–Gruppe 414 Lorentz–Kraft 113, 583 Magnetfeld 8, 113, 206, 227 Mannigfaltigkeit 458 berandete 461 riemannsche 469 Untermannigfaltigkeit des Rn 25 Untermannigfaltigkeit einer Mf. 219
Sachregister Maslov–Index f¨ ur Lagrange–Unterr¨aume 122 f¨ ur symplektische Abbildungen 126 Maß 179 Haar–Maß 179 Liouville–Maß 180, 310 Wahrscheinlichkeitsmaß 179 Matrixexponential 58 Maupertuis–Prinzip 168 Maxwellsche Gleichungen 480 Mechanik hamiltonsche 93 lagrangesche 145 newtonsche 145 Menge integrable 310 messbare 178 perfekte 384 unabh¨angige 310 Messraum 178 metrischer Raum 450 metrischer Tensor 469, 483 metrisierbar 453 Milankovi´c-Zyklen 385 Minkowski–Raum 414 mischend 184 Mittelungsprinzip 369 M¨ obius–Band 26, 460, 526 M¨obius–Funktion 554 M¨ obius–Transformation 115, 426 Møller–Transformation 268 monotone Twistabbildung 444 Morse–Funktion 448, 537 Morse-Bott–Funktion 548 perfekte 538 Morse–Lemma 540 Morse–Theorie 168, 537 Multiindex-Notation 260, 375, 381 Multiplizit¨at 61; 547 musikalischer Isomorphismus 470 n–K¨orper-Problem 7, 252, 266 n–Zentren-Problem 247 nat¨ urliches mechanisches System 363 Newton–Verfahren 507 nichtrelativistisch 412
629 nichttrivial 81, 139, 168, 442, 629 nicht trivial 108, 342, 523, 549, 629 nirgends dichte Teilmenge 452 normale Matrix 105 Normalenb¨ undel 525 Nullschnitt 525 Numerik 39, 314 Nutation 360 Obere Halbebene 115 oberhalbstetig 49 ω–Limesmenge 19, 23, 75 Operatornorm 58 Optik geometrische 171 lineare 173 optische Achse 171 Orbit 14, 47, 509 Einfang–, gebundener, Streu– 261 homokliner 321 periodischer 14, 19, 47, 90, 106, 136, 152, 168, 182, 194, 549 Orbit–Methode von Kirillov 338 Orientierung 466, 526 Ort 94 Orthonormalbasis der Charaktere 188 Palais-Smale–Bedingung 548 Paley-Wiener–Absch¨atzung 381, 391 Parabel 5, 158, 245 parabolische Matrix 103, 115, 187 parakompakt 453, 453 Parallelisierung 466 Parameter einer DGL 56 Parseval–Gleichung 189 Pauli–Matrizen 607 Pendel 320 Periode 14, 47 periodische Randbedingungen 110 Perizentrum 240, 277 Phasenportrait 73 Phasenraum 12, 36 erweiterter 36, 217 Phononen 113 Picard–Abbildung 39 Picard–Iteration 39 Poincar´e–Abbildung 138
630 Poincar´e–Gruppe 414 Poincar´e–Lemma 494, 497 Poisson–Formel 290 Poisson–Klammer 209 Poisson–Struktur 338 Polarisationsidentit¨at 97 Polarkoordinaten 3, 307, 481, 489 Potential 225 effektives 308 Kepler– 239, 261 kurz- und langreichweitiges 260 periodisches 228 separables 234 Yukawa– 236, 308 Zentral– 148, 375 zuf¨alliges 231 Pr¨azession 360, 419 Prinzipalb¨ undel 362, 524 Produktmaß 190, 191, 231 Produkttopologie 454 projektiver Raum P(V ) 512 CP(k) 108 RP(k) 119, 402, 526 RP(1) 120, 523 RP(2) 469 RP(3) 121 pull-back 96, 219, 476, 486 Punkttransformation 216 Quadratur 318 Quantenmechanik 10, 17, 121, 238, 274, 292, 494 Quasipolynom 70 Quaternionen 246, 425, 517 Quotiententopologie 450 Radon–Transformation 280 Rand einer Teilmenge 452 einer Mannigfaltigkeit 461 einer Kette 541 Rang einer ¨außeren Form 474 einer Bilinearform 96 einer Mengenpartition 292 eines Vektorb¨ undels 525 Rapidit¨at 417
Sachregister rational unabh¨angig 106, 371 raumartig 419 Raummittel 369 reduzierte Masse 3, 291 Regenbogensingularit¨at 278 regul¨are Abbildung 27 regul¨arer Punkt 468 regul¨arer Wert 25, 315, 468 Reibung 84 relativistisch 148, 375, 412 relativistische Periheldrehung 385 Restklassengruppe 110, 509 Resonanz klassisch: 87, 401 quantenmechanisch: 275 restringiertes drei-K¨orper-Problem 256 retrograde Planetenbewegung 349 reversibel 227 riemannsche Metrik 160, 469 Rodrigues–Formel 517, 566 R¨ ontgen–Transformation 280 Rotationsfl¨ache 162 Rotationszahl 24, 409 Ruhelage 47 Satz u ¨ber Asymptotische Vollst¨andigkeit 273, 299 die Begradigung 55 Eigenwerte symplektischer Abbildungen 99 Energieerhaltung 94 Fourier–slice 282 Fundamental-Lemma der Variationsrechnung 154 hamiltonsches Variationsprinzip 154 Hauptsatz der DGL-Theorie 53 Hauptsatz der riemannschen Geometrie 532 Inverse Streutheorie 285 Isoenergetische Nichtdegeneriertheit 402 Normalform reeller Bilinearformen 97 Normalform von Ellipsoiden 440 Møller-Transformation 268
Sachregister Polarzerlegung 103, 512 den regul¨aren Wert 468 Tennisschl¨ager 357 Viriale 374 Winkel-Wirkungskoordinaten 315 Satz von Atiyah u. Guillemin–Sternberg 340 Banach 506 Birkhoff 195, 229, 375, 410 Bogoliubov und Krylov 180 Cantor–Bendixson 384 Chow 365 Clairaut 164 Darboux 214 Darboux – lineare Version 97 Frobenius 533 Gromov 440, 442 Gronwall 51 Hopf und Rinow 107, 546 Igel 467, 532 Jordan (Kurvensatz) 444 Kolmogorov, Arnol’d, Moser (KAM) 9, 237, 400 K¨ unneth 499 Ky Fan 342 Lagrange 255 Liapunov 131 Liouville-Arnol’d 310 Marsden und Weinstein 331 Morse (Index–Satz) 548 Moulton 254 Noether 330 Peano 37 Picard–Lindel¨ of 37, 505 Poincar´e (P.–Lemma) 494, 497 Poincar´e (Wiederkehrsatz) 198 Poincar´e–Birkhoff 443 Poinsot 357 Rutherford (Streuquerschnitt) 276 Sard 299, 444, 549 Schur und Horn 341 Schwarzschild 274 Steiner 353 Stokes 490 Sylvester 97, 414
631 Tychonoff 18, 455 Weierstraß 59 Weyl 372 Whitney 469 schlecht gestellte Probleme 282 Schnitt f¨ ur Faserb¨ undel 522 f¨ ur Vektorfelder 138 Schr¨ odinger–Gleichung 10, 17, 238 Schwartz–Raum 282 Schwerpunkt 239, 290, 293, 347 Schwingfall 85 semidirektes Produkt von Gruppen 345, 414, 511 semikonjugiert 22, 234 Separatrix 321 Shiftraum 18, 190, 192 sigma–Algebra 178 Simplex 254, 340, 541 Sinai–Billard 190 singul¨arer Punkt einer Abbildung 468 eines Vektorfeldes 47 singul¨arer Wert 468 Spirale 81 Spur einer Kurve 456 stabil asymptotisch 20, 128, 131 liapunov– 19, 102, 128, 129, 360 stark 129 stabiler Unterraum 76 Standardabbildung 408, 444 stereographische Projektion 108, 245, 426, 459 Sterngebiet 494 stetig 454 Stiefel–Mannigfaltigkeit 342 St¨ orfunktion 57 Streuorbit 261, 267 Streutransformation 274 Strukturgruppe 524 Submersion 331, 468, 521 superintegrabel 244 Supremumsmetrik 41 symplektische Fl¨ache 441
632 symplektische Form 97, 203, 206 symplektische Gruppe 98 symplektische Gruppenwirkung 324 symplektischer Integrator 314 symplektische Transformation 213 symplektischer Vektorraum 98 Symplektomorphismus 213 Systemmatrix 57 Tangentialabbildung 465 Tangentialb¨ undel 464 Tangentialvektor 463 Tautochronen-Problem 159 Tautologische Form 205 Teilraumtopologie 450 Thomas–Matrix 419 topologische Gruppe 511 topologischer Raum 449 topologisch transitiv 19 Torus 107, 167, 207, 229, 310, 314, 325, 371, 499, 513 Torusautomorphismus 187, 194 Totalraum eines Faserb¨ undels 522 Tr¨agheitsmoment 295, 535 Tr¨agheitstensor 348, 365 Trajektorie 14 Translationsinvarianz 111 triviales B¨ undel 523 lokal triviales 522 Twistabbildung 409 ¨ Uberlagerung 523 Umgebung 453 unterhalbstetig 49 Untermannigfaltigkeit des Rn 25, 469 einer Mannigfaltigkeit 219, 468 Vektorb¨ undel 525 Vektorfeld 47, 464 affines 113 Gradienten– 91, 145 hamiltonsches 93 hyperbolisches 76 links–invariantes 514 Lipschitz-Bedingung f¨ ur 36 lokal hamiltonsches 204 vollst¨andiges 42
Sachregister zeitabh¨angiges 36 Vektorprodukt 114, 326, 517 Verfeinerung 453 Verschlingungszahl 109 Verzweigung 134, 152, 256 Verzweigungsdiagramm 81, 250 Verzweigungsmenge 141, 250 Vortexlinien 218 vorw¨artsinvariant 16, 90 Wahrscheinlichkeitsraum 178 wandernd 586 Weg 456 Wellengleichung 31 Weltlinie 421 Whitney–Summe von Vektorb¨ undeln 525, 527 Wirkung 153, 168 Wirkung einer Gruppe 17, 509, 519 Wronski–Determinante 67 Yukawa–Potential 236, 308 zeitartig 419, 421 Zeitmittel 369 Zeitumkehr 227 Zeitverz¨ogerung 272, 283 Zentralkonfiguration 253 Zentrum einer Gruppe 426 f¨ ur einen Fluss 80, 81 Zerlegbarkeit (¨außere Form) 239, 474 Zerlegung der Eins 453, 459, 491, 530 Zodiacus 109 zusammenh¨angend 455 Zusammenhang 527 auf Hauptfaserb¨ undeln 529 auf Vektorb¨ undeln 530 Produkt– 528 Zusammenhangskomponente 455 Zwangsbedingung 149 Zweik¨ orperproblem 291 Zweizentrenproblem 247 Zwillingsparadox 423 Zykel 541 Zykloide 157 Zylindermenge 190