Grundlagen der Mechanik und Elektrodynamik Teil 1: Mechanik
Vorlesung an der Ruhruniversit¨ at Bochum
K.–U. Riemann
...
45 downloads
1164 Views
1MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Grundlagen der Mechanik und Elektrodynamik Teil 1: Mechanik
Vorlesung an der Ruhruniversit¨ at Bochum
K.–U. Riemann
Inhaltsverzeichnis
1.
Mechanik freier Massenpunkte
1.1
1.10
Newtons Axiome Maßsysteme Impuls, Energie und Drehimpuls Konservative Kr¨afte, Zentralkr¨afte Mathematische Gesichtspunkte Die Bewegung im konstanten Schwerefeld Der harmonische Oszillator Bahn, Hodograph und Phasenbahn Zentralkraft– und Keplerproblem Geometrie der Ellipse Coulombwechselwirkung Die Bewegung im konstanten elektrischen und magnetischen Feld Beschleunigte Koordinatensysteme und Scheinkr¨afte Drehungen Rotierende Koordinatensysteme, Zentrifugal– und Corioliskraft Systeme von Massenpunkten Schwerpunkts– und Relativbewegung Zerlegung der kinetischen Energie Zerlegung der potentiellen Energie Zerlegung des Drehimpulses Das Zweik¨orperproblem
2.
Lagrange–Mechanik
2.1
Zwangsbedingungen und Zwangskr¨afte Klassifikation von Zwangsbedingungen Das Selbstkonsistenzproblem Prinzip der virtuellen Arbeit und d’Alembertsches Prinzip Modell der glatten F¨ uhrungen Virtuelle Verr¨ uckungen und Bewegungsablauf Prinzip der virtuellen Arbeit und d’Alembertsches Prinzip Beispiele: Zentripetalkraft und schiefe Ebene Generalisierte Koordinaten und Lagrangesche Gleichungen Generalisierte Koordinaten und Kr¨afte Lagrangesche Gleichungen (zweiter Art) Beispiele Spiralbewegung in der Ebene Das ebene Pendel
1.2 1.3 1.4 1.5 1.6
1.7 1.8
1.9
2.2
2.3
2.4
i
1 5 9 11 12 14
19 22
27
32
35
37
41
46
2.5
2.6
2.7 2.8
2.9
Das Zykloidenpendel Geschwindigkeitsabh¨angige Kr¨afte Generalisierte Potentiale Lagrangefunktion f¨ ur elektromagnetische Kr¨afte Reibung und Dissipationsfunktion Die Methode der Lagrangeschen Multiplikatoren Lagrange–Multiplikatoren und Zwangskr¨afte Lagrangesche Gleichungen mit Nebenbedingungen Lagrangesche Gleichungen erster Art Beispiel: Die schiefe Ebene Berechnung von Zwangskr¨aften (ohne Multiplikatoren) Zyklische Koordinaten, Symmetrien und Erhaltungss¨atze Generalisierte Impulse Impulserhaltung und Homogenit¨at des Raumes Drehimpulserhaltung und Isotropie des Raumes Energieerhaltung und Homogenit¨at des Zeit Die Hamiltonfunktion Die Hamiltonfunktion rheonomer Systeme Routhsches Verfahren und kanonische Gleichungen Eliminierung zyklischer Variablen aus den Bewegungsgleichungen Eliminierung zyklischer Variablen aus der Lagrangefunktion Legendretransformationen Kanonische Gleichungen Beispiel: Zentralkraftproblem Hamiltonfunktion und generalisierter Impuls im Magnetfeld
3.
Dynamik des starren Ko ¨rpers
3.1
Modell und Koordinaten des starren K¨orpers Orientierung des starren K¨orpers Richtungskosinus und orthogonale Matrizen Eulersche Winkel 70 Das Eulersche Theorem Die Drehachse als Eigenvektor Das Eigenwertproblem orthogonaler Matrizen Eulersches Theorem und Satz von Cashle Der Tr¨agheitstensor Drehimpus und kinetische Energie des starren K¨orpers Das Tr¨agheitsmoment um eine feste Drehachse Der Satz von Steiner Beispiel: Physikalisches Pendel Tr¨agheitshauptachsen Das Eigenwertproblem selbstadjungierter Matrizen Hauptachsentransformationen
3.2
3.3
3.4
ii
48
51
54 56
62
69
74
78
82
3.9
Beispiel Tr¨agheitsellipsoid und Poinsotsche Konstruktion Geometrische Beschreibung des kr¨aftefreien Kreisels Die Eulerschen Kreiselgleichungen Die kr¨aftefreie Bewegung des starren K¨orpers Stabile Drehachsen des starren K¨orpers Der kr¨aftefreie symmetrische Kreisel Der Lagrangeformalismus f¨ ur den Kreisel Lagrangefunktion und zyklische Koordinaten des symmetrischen Kreisels Der kr¨aftefreie symmetrische Kreisel Der schwere symmetrische Kreisel Zum elementaren Verst¨andnis des Kreisels
4.
Stabilit¨ at und kleine Schwingungen
4.1
4.4 4.5
Gleichgewichte und kleine Abweichungen Quadratische Formen Eigenfrequenzen und Stabilit¨at Transformation auf Normalkoordinaten Gleichzeitige Diagonalisierung von T und V Die formale Durchf¨ uhrung Gekoppelte Pendel
5.
Spezielle Relativit¨ atstheorie
5.1
Galileiisches und Einsteinsches Relativit¨atsprinzip Das Problem der Lichtgeschwingkeit Das Michelson–Experiment Die Lorentztransformationen Minkowskiraum und orthogonale Transformationen Spezielle und allgemeine Lorentztransformationen Elementare Herleitung aus den physikalischen Postulaten Die Zeitdilatation Symmetrie des Uhrenvergleichs und Zwillingsparadoxon Die Lorentzkontraktion Zusammenhang mit der Zeitdilatation Unsichtbarkeit der Lorentzkontraktion Die Gruppeneigenschaft der Lorentztransformation Einsteinsches Additionstheorem der Geschwindigkeiten Kovariante Formulierung einer Theorie Vierer–Vektoren und Lorentz–Skalare Raumartige und zeitartige Vektoren, der Lichtkegel Vergangenheit, Gegenwart und Zukunft; kausale Ereignisse Bahn im Minkowskiraum und Eigenzeit Vierer–Geschwindigkeit und –Impuls
3.5 3.6 3.7
3.8
4.2 4.3
5.2 5.3
5.4 5.5
5.6 5.7
iii
87 90 92
94
100
103 105 106 110 112
116 117 119
125 126
128 131
5.8
5.11
Relativistische Mechanik Die Minkowski–Kraft und Bewegungsgleichung Der Energie–Impuls–Vektor Die Einheit von Impuls– und Energiesatz ¨ Die Aquivalenz von Masse und Energie Die relativistische Bewegungsgleichung Beispiel: Elektron im konstanten elektrischen Feld Longitudinale und transversale Beschleunigung Die Transformation von Kr¨aften Relativistischer Lagrangeformalismus Die relativistische Lagrange– und Hamiltonfunktion (nicht kovariant) Probleme: Instantane Fernwirkung, Zwangsbedingungen und Nicht–Inertial–Systeme Grundgedanken der allgemeinen Relativit¨atstheorie Vom Zwillingparadoxon zum Hamiltonprinzip
6.
Hamilton–Jacobi–Theorie
6.1
Das Hamiltonsche Prinzip Grundaufgabe der Variationsrechnung Bahnvariationen im Konfigurationsraum Das Wirkungintegral und die Quantenmechanik Das Hamiltonsche Prinzip im Phasenraum Die erweiterte Konkurrenz der Bahnen im Phasenraum Hamiltonsches Prinzip und kanonische Gleichungen Kanonische Transformationen Tabelle: Erzeugende und Transformationsgleichungen Beispiele kanonischer Transformationen Die Hamiltonsche partielle Differentialgleichung Das Wirkungsintegral als Erzeugende Klassische Mechanik und geometrische Optik Separation und Hamiltonsche charakteristische Funktion Der harmonische Oszillator als Beispiel Erg¨anzende Bemerkungen Infinitesimale kanonische Transformationen Liouvillescher Satz Poissonklammern
5.9
5.10
6.2
6.3 6.4 6.5
6.6 6.7
Literaturhinweise
136
140
142
144
147
149
151 154 156
159 162
164
iv
1
Mechanik freier Massenpunkte
1.1
Newtons Axiome
Die Entwicklung der Grundlagen der Mechanik in der Renaissance ist als Geburtsstunde der Naturwissenschaft im heutigen Sinn anzusehen. Sie ist durch pr¨azise Begriffsbildungen und eine Mathematisierung gekennzeichnet. Dadurch wurden Verallgemeinerungen m¨oglich, die durch weitere Beobachtungen best¨atigt oder falsifiziert werden konnten. Diesem Umstand ist es zu verdanken, daß kontroverse Auffassungen der Begr¨ under nicht zu widerstreitenden Schulen f¨ uhrten, sondern in eine allgemein akzeptierte Mechanik m¨ undeten. Wir k¨onnen den gewaltigen Umbruch des Denkens in jener Zeit nicht hier im Detail verfolgen, sondern charakterisieren den historischen Hintergrund durch wenige Meilensteine: • Nicolaus Copernicus (1473–1543) propagierte das heliozentrische System. • Tycho Brahe (1546–1601) lehnte das heliozentrische System ab und f¨ uhrte sehr genaue Beobachtungen durch — in der Absicht, das geozentrische System des Ptolem¨aus zu st¨ utzen. • Johannes Kepler (1571–1630) leitete aus den Beobachtungen T. Brahes seine Planetengesetze (1609–1618) her. Diese Gesetze sind rein kinematisch zu verstehen und nicht dynamisch begr¨ undet. • Galileo Galilei (1564–1642) ist als entschiedener Verfechter des heliozentrischen Systems bekannt. Dabei glaubte er jedoch an vollkommene Kreisbahnen und lehnte Keplers Ergebnisse ab. Er f¨ uhrte “Fallversuche” an der schiefen Ebene durch und kam f¨ ur den Spezialfall verschwindender Neigung zu einer Vorform des Tr¨agheitsprinzips. • Isaac Newton (1643–1727) ver¨offentlichte 1687 die Abhandlung “Philosophiae naturalis principia mathematica”. Darin formulierte er die “Newtonschen Gesetze” als Grundlage der Dynamik. Vor der Aufstellung dieser Gesetze formulierte Newton zwei grundlegende Vorausetzungen: • Die absolute Zeit Tempus absolutum, verum, et mathematicum, in se et natura sua sine relatione ad externum quodvis, aequabiliter fluit, alioque nomine dicitur duratio. Die absolute, wahre und mathematische Zeit verfließt an sich und verm¨oge ihrer Natur gleichf¨ormig und ohne Beziehung zu irgendeinem ¨außeren Geschehen. Sie wird auch mit dem Namen Dauer belegt.
1
• Der absolute Raum Spatium absolutum, natura sua sine relatione ad externum quodvis, semper manet similare et immobile. Der absolute Raum bleibt verm¨oge seiner Natur und ohne Beziehung zu irgendeinem a¨ußeren Geschehen stets gleich und unbeweglich. Wir verzichten hier auf eine Kritik dieser aus der intuitiver Vorstellung gewonnenen Definitionen und verweisen auf die Diskussion von Uhren und Maßst¨aben im 5. Kapitel. Bemerkenswert ist, daß Newton die Notwendigkeit erkannte, sich diese Voraussetzngen bewußt zu machen. LEX PRIMA (Tr¨agheitsgesetz) Corpus omne perseverare in statu suo quiescendi vel movendi uniformiter in directum, nisi quatenus illud a viribus impressis cogitur statum suum mutare. Jeder K¨orper beharrt in seinem Zustand der Ruhe oder der gleichf¨ormigen Bewegung, wenn er nicht durch einwirkende Kr¨afte gezwungen wird, seinen Zustand zu ¨andern. Die Lex prima stellt eigentlich einen Spezialfall der Lex secunda dar (vgl. Gl. (6). Wegen seiner f¨ ur die damalige Zeit revolutioniernden Aussage stellt Newton dieses Gesetz aber bewußt an die Spitze seines Systems. Widerspricht es doch der allt¨aglichen Erfahrung, daß jede Bewegung zum Stillstand kommt. (I. Kant 1747: Es gibt zweierlei Art von Bewegungen, solche, die nach einiger Zeit aufgeh¨ort haben, und solche, welche andauern. [Gegenst¨ande, die getragen oder geschoben ¨ werden und Geschoßkugeln.]) Die Aquivalenz von Ruhe und von gleichf¨ormiger Bewegung (wogegen?) dr¨angt schon fast eine Diskussion von Bezugssystemen und Relativit¨at auf. Wir verweisen dazu auf das 5. Kapitel. Der Formulierung seiner Lex secunda stellt Newton zun¨achst zwei Definitionen voran: Definitio I: Quantitas materiae est mensura eiusdem orta ex illius densitate et magnitudine coniunctim. Die Menge der Materie (Masse m) wird durch ihre Dichte und ihr Volumen vereint gemessen. Definitio II: Quantitas motus est mensura eiusdem orta ex velocitate et et quantitate materiae conjunctim. Die Gr¨oße der Bewegung (Bewegungsgr¨oße, Impuls p) wird durch die Geschwindigkeit und die Menge der Materie vereint gemessen: p = mv .
2
(1)
Es ist bemerkenswert, daß Newton die Notwendigkeit erkannte, den aus der allt¨aglichen Erfahrung scheinbar so vertrauten Begriff der Masse (Materiemenge) zu definieren1 . Seine Definitio I ist aber offensichtlich nur eine Scheindefinition: Man kann die Grundgr¨oße “Masse” nicht durch die abgeleitete Gr¨oße “Dichte” definieren. Im Gegensatz zur Masse m ist die Geschwindigkeit v = dr/dt nach der Einf¨ uhrung von Raum und Zeit eine abgeleitete Gr¨oße und ben¨otigt keine eigene Definition. Newton nennt mv die “Bewegungsgr¨oße”, das heute u ¨bliche Wort Impuls vertauscht im Grunde Ursache und Wirkung [vgl. Gl. (5)]. Mit der Definitio II kann die Lex prima auch als Satz der Erhaltung des Impulses formuliert werden [vgl. Gl. (6)]. Eigentlich erfordert die folgende lex secunda noch eine weitere vorbereitende Erl¨auterung: Sie bezieht sich auf das Modell eines Massenpunktes, eines massebehafteten Objekts ohne r¨aumliche Ausdehnung. Da alle K¨orper endlich ausgedehnt sind, ist die Tragf¨ahigkeit dieses Modells keineswegs von vornherein klar. Wir begn¨ ugen uns im Augenblick mit dem Hinweis, daß der Schwerpunkt eines ausgedehnten K¨orpers in vielen Aspekten dem Massenpunkt entspricht. LEX SECUNDA (Bewegungsgesetz) Mutationem motus proportionalem esse vi motrici impressae, et fieri secundum lineam rectam qua vis illa imprimitur. ¨ Die Anderung der Bewegung ist der Einwirkung der bewegenden Kraft proportional und geschieht nach der Richtung derjenigen geraden Linie, nach welcher jene Kraft wirkt: p˙ = F . (2) Dieses zentrale Gesetz der Newtonschen Mechanik wirft eine ganz fundamentale Frage auf: Handelt es sich wirklich um ein Naturgesetz oder bloß um die Definition der Kraft? Diese Frage ist typisch f¨ ur grundlegende Beziehungen der Physik, die sich durch die inhaltliche Deutung eben doch von mathematische Axiomen unter¨ scheiden. Wir k¨onnen Kr¨afte durch die Anderung des Bewegungszustandes messen, besitzen durch unsere Muskeln aber auch eine intuitive a priori-Erfahrung. F¨ ur eine Gesetzm¨aßigkeit sprechen auch Experimente mit verschiedenen Massen bei gleicher Kraft und verschiedenen Kr¨aften bei gleicher Masse (wenn man Unabh¨angigkeit und ggf. ungest¨orte Superposition veraussetzt; vgl. auch die Schwierigkeit, die (tr¨age) Masse zu definieren.) Ph¨anomenologisch unterscheiden wir Kr¨afte bei der Ber¨ uhrung verschiedener K¨orper (Druck, Zug, Reibung . . . ) und Fernwirkungen (besser: Felder) wie Gravitation oder Magnetismus. Von einem systematischen Standpunkt aus beruhen alle makroskopischen Kr¨afte auf elektromagnetischen Kr¨aften oder der Gravitation. 1
Zur Problematik des Begriffs “Masse” vgl. die Diskussion um “schwere Masse” und “tr¨ age Masse” beim Aufbau der allgemeinen Relativittstheorie.
3
(Auf die starke und schwache Wechselwirkung ist das klassische Konzept nicht anwendbar.) Newtons Lex secunda ¨andert sich nicht, wenn man von einem Bezugssystem S zu einem gleichf¨ormig dagegen bewegten Bezugssystem S 0 u ¨ bergeht (Galileitransformation): Die Lex secunda gilt in allen Inertialsystemen. In NichtInertialsystemen (z. B. rotierende Erde) treten neben den oben diskutireten Kr¨aften auch Scheinkr¨afte (z. B. Zentrifugalkraft und Corioliskraft) auf. Was aber unterscheidet “wahre” Kr¨afte und Scheinkr¨afte? Wir sp¨ uren hier wieder die Notwendigkeit, Bezugssysteme und Relativit¨at zu diskutieren und verweisen auf das 5. Kapitel. Abschließend erw¨ahnen wir die prophetische Sicherheit (Sommerfeld), mit der sich die Newtonsche Formulierung (2.) gegen¨ uber der sp¨ateren Formulierung “Kraft=Masse mal Beschleunigung” in der Relativit¨atstheorie bew¨ahrt hat. Bei der Interpretation des Unterschiedes ist allerdings Vorsicht geboten. Zum kritischen Verst¨andnis stellen wir die Frage, was an der folgenden Beschreibung einer Rakete falsch ist: d (mv) = F = 0, dt
mv = m0 v0 ,
v=
m0 v0 . m
LEX TERTIA (Reaktionsprinzip, “actio = reactio”) Actioni contrariam semper et aequalem esse reactionem: sive corporum duorum actiones in se mutuo semper esse aequales et in partes contrarias dirigi. Die Gegenwirkung ist der Wirkung stets entgegengesetzt und gleich, oder die Wirkungen zweier K¨orper aufeinander sind stets gleich und von entgegengesetzter Richtung: Fij = −Fji .
(3)
¨ Dieses Gesetz schafft die Grundlage zum Ubergang zur Mechanik eines Systems von Massenpunkten. Die G¨ ultigkeit ist allerdings eingeschr¨ankt: Gl. (3) gilt bei elektromagnetischer Wechselwirkug nur, wenn die Abstrahlung vernachl¨assigt werden kann. (Spielt die Strahlungsd¨ampfung eine Rolle, l¨aßt sich die Bewegungsgleichung nicht mehr durch die erste Ableitung v˙ formulieren!) H¨aufig (Zentralkr¨afte) l¨aßt sich die Lex tertia durch den Zusatz “Die Kr¨afte liegen in der Richtung der Verbindungslinie der K¨orper ” versch¨arfen. Diese Versch¨arfung wird aber bereits durch die Lorentzkraft verletzt. CORROLARIUM (“Lex quarta”, Parallelogramm der Kr¨afte) Corpus viribus coniunctis diagonalem parallelogrammi eodem tempore describere, quo latera separatis. 4
Bei vereinten Kr¨aften wird ein K¨orper durch die Diagonale des Parallelogramms beschrieben, dessen Seiten zur gleichen Zeit den getrennten Kr¨aften entsprechen, d. h. Kr¨afte addieren sich wie Vektoren: F=
X
Fi .
(4)
i
Dieses Gesetz ist keineswegs trivial, sondern fordert die Unabh¨angigkeit der einzelnen Kraftwirkungen. Newton formulierte die Aussage nicht als “Gesetz”, sondern als Corollarium (Zusatz) zu den Bewegungsgesetzen. Erg¨ anzung: Maße und Maßsysteme Newtons Grundvoraussetzungen und die Lex secunda erforden Meßvorschriften und Maßeinheiten f¨ ur die L¨ange, die Masse und die Zeit. Das internationale Maßsystem (SI) legt hierzu das Meter (m), das Kilogramm (kg) und die Sekunde (s) fest. (MKS–System). Daneben wird h¨aufig auch (noch) das CGS–System mit den Grundeinheiten Zentimeter (cm), Gramm (g) und Sekunde verwendet. Grunds¨atzlich k¨onnte f¨ ur die Kraft eine vierte Grundeinheit — etwa das Kilopond (kp) — festgelegt werden. Mit der Verf¨ ugung der Proportionalit¨atskonstante 1 in der Lex secunda wird die Kraft jedoch eine abh¨angige Gr¨oße und erh¨alt im SI die Maßeinheit 1N = 1 kg m s−2 (1 Newton). Die entsprechende Maßeinheit des CGS–Systems ist 1 dyn = 1 g cm s−2 = 10−5 N. Daneben sind veraltete Bezeichnungen und Maßeinheiten wie 1 Dyn = 1 N und 1 kp = 9.81 N in Gebrauch. Auf abgeleitete Gr¨oßen wie 1 J = 1 Nm = 1 kg m2 s−2 (Joule) f¨ ur Arbeit und −1 Energie oder 1 W = 1 J s (Watt) f¨ ur Leistung weisen wir nur am Rande hin. Im folgenden wollen wir Folgerungen aus den Newtonschen Gesetzen diskutiern und einfache Anwendungsbeispiele geben. Dabei beschr¨anken wir uns zun¨achst auf die Mechanik eines Massenpunktes.
1.2
Grundbegriffe: Impuls, Energie und Drehimpuls
Wir integrieren die Lex secunda:
∆p = p2 − p1 =
Zt2
F dt,
(5)
t1
¨ also Anderung der Bewegungsgr¨oße = Kraftstoß oder Impuls. Von hier aus ist der Begriff Impuls (eigentlich etwas ungenau!) auf die Bewegungsgr¨oße u ¨bertragen worden. Wir schließen uns trotzdem diesem allgemeinen Sprachgebrauch an. 5
F¨ ur die kr¨aftefreie Bewegung formulieren wir den Impulserhaltungssatz p = const
(6)
und erhalten so die Lex prima als Spezialfall. Zur Einf¨ uhrung der Begriffe Energie2 und Arbeit multiplizieren wir die Lex secunda vor der Integration skalar mit v: Zt2
t1
mv · v˙ dt =
Zt2
F · r˙ dt =
t1
Zr2
F· dr
r1
Das Integral auf der linken Seite k¨onnen wir in der Form Zt2
t1
mv · v˙ dt =
Zt2
t1
d m 2 v dt = T2 − T1 dt 2
schreiben, wenn wir durch T =
m 2 v 2
(7)
die kinetische Energie eines Massenpunktes definieren. Durch das Integral
A12 =
Zr2
F· dr
(8)
r1
auf der rechten Seite definieren wir die Arbeit, die von der Kraft F geleistet wird, wenn unser Massenpunkt von r1 nach r2 bewegt wird. Damit erhalten wir den Satz A12 = T2 − T1 ,
(9)
¨ der die Anderung der kinetischen Energie mit der am Massenpunkt geleisteten Arbeit in Beziehung bringt. Das Kunstwort Energie bedeutet so etwas wie ein Arbeitsverm¨ogen. Kinetische Energie deutet also auf ein Arbeitsverm¨ogen, das in der Bewegung steckt. Die Begriffe Energie und Kraft wurden lange Zeit nicht sauber getrennt. Bei Leibnitz wird die kinetische Energie vis viva genannt. 2
griech. ν (en) = in, griech. ργoν (ergon) = “Werk” (gleiche indogerm. Wurzel!), Arbeit
6
Von besonderer Bedeutung sind Kraftfelder F = F(r), bei denen das Integral (8) vom Weg unabh¨angig ist. Solche Kraftfelder heißen konservativ. F¨ ur konservative Kraftfelder gilt also I
F·dr = 0
und wir k¨onnen eine bis auf eine additive Konstante eindeutige Ortsfunktion
V (r) = −
Zr
F(r0 )· dr0
(10)
definieren, die wir als Potential oder potentielle Energie bezeichnen. F¨ ur konservative Kr¨afte haben wir [vgl. Gl. (8)] A12 = V1 − V2 ,
(11)
und k¨onnen [vgl. Gl. (9)] den Energieerhaltungssatz (daher der Name konservativ) V1 − V 2 = T 2 − T 1
oder E = T + V = const
(12)
formulieren. E = T + V wird als Gesamtenergie oder kurz Energie bezeichnet. Nach Gl. (10) l¨aßt sich eine konservative Kraft gem¨aß F=−
dV = −grad V dr
(13)
aus ihrem Potential V berechnen. Aus der Vertauschbarkeit der zweiten Ableitungen von V folgt ∂2V ∂2V ∂Fj ∂Fi =− =− = . ∂xj ∂xi ∂xj ∂xj ∂xi ∂xi Damit erhalten wir die Beziehung ∂Fj ∂Fi = ∂xj ∂xi
oder rot F = 0
als notwendige Bedingung daf¨ ur, daß die Kraft F ein Potential besitzt. Sie ist aber auch hinreichend, wie wir am Stokeschen Satz erkennen. Beispiel fu afte: ¨r konservative Kr¨ 7
Betrachten wir eine beliebige Zentralkraft F(r) = f (r)r,
(14)
also Fi = f (r)xi . Dann wird ∂xi ∂r ∂Fi = f (r) + f 0 (r) xi ∂xj ∂xj ∂xj Dazu rechnen wir ∂r/∂xj = xj /r, und f¨ ur i 6= j haben wir ∂xi /∂xj = 0, also ∂Fi f 0 (r) ∂Fj = xi xj = . ∂xj r ∂xi Alle Zentralkr¨afte sind folglich konservativ. F¨ ur ihr Potential gilt dV = −f (r)r, dr
d.h. V (r) = −
Zr
f (r 0 )r 0 dr 0 .
(15)
Als Spezialf¨alle erw¨ahnen wir (i) die elastische Kraft F(r) = −kr
=⇒
V (r) =
k 2 r 2
und
(16)
(ii) die Coulomb– und Gravitationskraft F(r) = −
c r r3
=⇒
c V (r) = − . r
(17)
Nat¨ urlich sind die Potentiale nur bis auf eine additive Konstante bestimmt. Bei (i) haben wir V (0) = 0 gew¨ahlt, d.h. wir haben bei “gespannter Feder” eine positive potentielle Energie. Im Fall (ii) haben wir dagegen V (∞) = 0 gesetzt. F¨ ur anziehende Kraftzentren wird daher die potentielle Energie negativ: Dies ist der Energiebetrag, der n¨otig ist, um einen Massenpunkt aus dem Einflußbereich des Kraftfeldes zu “befreien”. Beachte, daß V (∞) im Fall (i) und V (0) im Fall (ii) singul¨ar werden. Als ein letztes triviales Beispiel erw¨ahnen wir das Potential V = mg·r = mgz des konstanten Schwerefeldes F = −mg = −mgez . 8
(18)
Auf einen weiteren fundamentalen Grundbegriff werden wir gef¨ uhrt, wenn wir die Lex secunda vektoriell mit r multiplizieren: r × p˙ = r × F. Zur Interpretation der linken Seite f¨ uhren wir den Drall oder Drehimpuls l=r×p
(19)
ein. F¨ ur seine zeitliche Ableitung erhalten wir d l = r × p˙ + r˙ × p = r × p, ˙ dt da r˙ × p = mv × v = 0 gilt. Mit der analogen Definition des Drehmoments M=r×F
(20)
erhalten wir also die grundlegende Beziehung ˙l = M
(21)
zwischen der Drehimpuls¨anderung und dem einwirkenden Drehmoment. Sie spielt in der Dynamik des starren K¨orpers eine ¨ahnliche Rolle wie Newtons Lex secunda f¨ ur den Massenpunkt. Hinweise: 1. Drehimpuls wie Drehmoment h¨angen nach ihrer Definition von der Lage des gew¨ahlten Koordinatenursprungs ab und sind keine galileiinvarianten Begriffe. (Nat¨ urlich gilt Gl. (21) jedoch in jedem Inertialsystem). Bei der physikalischen Interpretation des Drehimpulses wird man sich also stets auf ein dem Problem nat¨ urlich angepaßtes Koordinatensystem beziehen m¨ ussen. 2. Man beachte die Reihenfolge der Faktoren in den Gln. (19, 20). 3. Zum Namen Drehimpuls gilt entsprechendes wie beim Impuls. Trotz des Namens ist die Bedeutung nicht auf Drehbewegungen beschr¨ankt. Von besonderer Wichtigkeit ist der Spezialfall eines verschwindenden Drehmoments. In diesem Fall gilt der Drehimpulserhaltungssatz l = const.
(22)
Wegen r × r = 0 treffen wir diesen Speziallfall f¨ ur alle Zentralkr¨afte an, wenn wir — was ja naheliegt — das Kraftzentrum als Koordinatenursprung w¨ahlen. Als wichtige Folgerung aus Gln. (19, 22) bemerken wir, daß die Bewegung bei Drehimpulserhaltung in einer Ebene — n¨amlich in der Ebene r · l = 0 — abl¨auft. 9
1.3
Mathematische Gesichtspunkte
Das Bewegungsproblem eines Massenpunktes wird durch drei gekoppelte gew¨ohnliche Differentialgleichungen m¨ xi = Fi (xj , x˙ j , t) (i, j = 1, 2, 3)
(23)
zweiter Ordnung oder durch sechs Differentialgleichungen x˙ i = pi /m,
p˙ i = Fi (xj , pj , t) (i, j = 1, 2, 3)
(24)
erster Ordnung beschrieben und stellt damit ein Problem sechster Ordnung dar. (Wir werden f¨ ur allgemeine Betrachtungen die zweite Form bevorzugen). Eine vollst¨andige L¨osung xi = ξi (t, ck ),
pi = πi (t, ck )
(25)
h¨angt also von sechs Integrationskonstanten c1 , . . . c6 ab. Als Integrationskonstanten k¨onnen insbesondere die Anfangsbedingungen r(t = 0) = r0
und p(t = 0) = p0
(26)
(bzw. v(t = 0) = v0 ) gew¨ahlt werden. Mit diesen Differentialgleichungen (Newtons Lex secunda) und den zugeh¨origen Anfangsbedingungen ist die Bewegung eindeutig festgelegt. (Kausalit¨at, physikalisches Geschehen als Uhrwerk!). Die Ordnung des Problems l¨aßt sich reduzieren, wenn es gelingt, einzelne Variable zu eliminieren. Hierzu k¨onnen Beziehungen der Form φ(xj , pj , t, C) = 0,
(27)
die eine Integrationskonstante C enthalten, dienen. Solche Beziehungen nennen wir Integrale. Als Beispiele erw¨ahnen wir insbesondere den Energiesatz T + V − E = 0 (1 Integral), den Impulssatz p = p0 (3 Integrale) und den Drehimpulssatz r × p = j (3 Integrale). Mit jedem Integral wird die Ordnung um eins reduziert und durch sechs Integrale wird das Problem vollst¨andig gel¨ost. Dabei ist allerdings folgendes zu beachten: 1. Die verwendeten Integrale m¨ ussen voneinander unabh¨angig sein. F¨ ur die kr¨aftefreie Bewegung sind beispielsweise Impulssatz v = v0 und Energiesatz v 2 = v02 trivialerweise nicht unabh¨angig. 10
2. Eine Beziehung der Form φ(xj , C1 , C2 ) = 0, die zwei Integrationskonstanten enth¨alt, z¨ahlt doppelt, da sich aus ihr durch Differentiation ein weiteres Integral gewinnen l¨aßt. Wir werden im folgenden einige grundlegende Bewegungsprobleme explizit l¨osen und auf diese Gesichtspunkte zur¨ uckkommen.
1.4
Die Bewegung im konstanten Schwerefeld
Mit der Kraft F = −mg lautet die Bewegungsgleichung ¨ r = v˙ = −g .
(28)
An Integralen steht zun¨achst (nur) der Energie–Erhaltungssatz zur Verf¨ ugung. Es ist in diesem Fall allerdings nicht sinnvoll, mit seiner Hilfe eine Variable zu eliminieren. Denn die Bewegungsgleichungen sind ungekoppelt, und die bequemste L¨osung besteht in der direkten zweifachen Integration: r˙ = v = v0 − gt,
1 r = r0 + v0 t − gt2 . 2
(29)
Als Integrationskonstanten haben wir den Anfangsort r0 und die Anfangsgeschwindigkeit v0 benutzt. Damit ist das Problem bereits vollst¨andig gel¨ost. Den Energieerhaltungssatz finden wir aus der L¨osung, wenn wir Gl. (29) skalar mit mg multiplizieren: mg·(r − r0 ) =
m 2 m v0 − (v0 − gt)2 . 2 2
Unter Beachtung von v = v0 − gt und V = mg · r [vgl. Gl. (18)] geht dies in T + V = T 0 + V0
oder v 2 − v02 = 2g·(r0 − r)
u ¨ber. Zur anschaulichen Beschreibung der Bewegung w¨ahlt man zweckm¨aßigerweise in ein kartesisches Koordinatensystem mit g in z–Richtung und vy0 = 0. Dann erh¨alt man
11
vx = vx0 ,
x = x0 + vx0 t
g z = z0 + vz0 t − t2 2
vz = vz0 − gt,
und erkennt die Wurfparabel in der x–z–Ebene (d.h. in der durch v0 und g aufgespannten Ebene). Man beachte, daß sich wegen der Unabh¨angigkeit der Koordinaten neben dem vollen Energiesatz auch ein separater Energiesatz 2 vz2 − vz0 = 2g(z0 − z)
formulieren l¨aßt. Aus dem selben Grund gilt auch ein Teil–Impulssatz mvx = const. Erhaltungss¨atze m¨ ussen also nicht immer in der im Abschnitt 1.3 angegebenen Form auftreten, sondern k¨onnen sich auch auf einzelne Koordinaten beziehen. Wir werden sp¨ater sehen, daß dieser Aspekt sogar wesentlich verallgemeinert werden kann.
1.5
Der harmonische Oszillator
F¨ ur das Bewegungsproblem der linearen elastischen Kraft F = −kr
(30)
haben wir mit dem Energie– und Drehimpuls–Erhaltungssatz vier Integrale (vgl. Abschnitte 1.3 und 1.6). Aber auch hier sind die drei Komponenten der Bewegungsgleichung ¨ r + ω 2 r = 0 mit ω 2 =
k m
(31)
ungekoppelt und man erh¨alt die L¨osung am bequemsten direkt in der Form r = a cos ωt + b sin ωt .
(32)
Alle drei Ortskoordinaten f¨ uhren also unabh¨angig harmonische Schwingungen der selben Frequenz ω aus. Offensichtlich gilt a = r0
und b =
12
1 v0 , ω
und die Bewegung verl¨auft — was wir auch aus der Drehimpulserhaltung schließen k¨onnen — in der durch a und b (bzw. in der durch r0 und v0 ) aufgespannten Ebene. Diese Ebene w¨ahlen wir zweckm¨aßig als x–y–Ebene (z = 0) eines speziell angepaßten Koordinatensystems. Offenbar ist die Bewegung beschr¨ankt (r 2 ≤ a2 + b2 ) und es gibt eine maximale Auslenkung rm (“Amplitude”). Wir wollen — was keine Einschr¨ankung bedeutet — den Zeitpunkt t = 0 in eine solche maximale Auslenkung legen. Dann gilt zur Zeit t = 0 r · r˙ = 0 oder a ⊥ b. W¨ahlen wir nun x in a– und y in b–Richtung, so erhalten wir die L¨osung in der bequemen Form x = a cos ωt,
y = b sin ωt
(33)
und erkennen als Bahnkurve eine Ellipse der Halbachsen a und b mit dem Ursprung im Zentrum. Wir benutzen die Gelegenheit, um den Begriff der Bahngleichung f (x, y) = 0 einzuf¨ uhren. Wir erhalten sie, indem wir die Zeit t aus den L¨osungen x = x(t), y = y(t) eliminieren. Die Bahngleichung erh¨alt also die Information u ¨ber die Bahnkurve ohne Ber¨ ucksichtigung des ’Fahrplans’. Im Fall des harmonischen Oszillators folgt aus cos2 + sin2 = 1 die Bahngleichung x2 y 2 + 2 − 1 = 0. a2 b F¨ ur manche Zwecke ist es auch n¨ utzlich, die “Bahn” im Geschwindigkeits– oder Impulsraum zu betrachten. Die entsprechende “Bahngleichung” g(x, ˙ y) ˙ heißt Hodograph [griech. oδoς (hodos) = Weg, γραϕω (grapho) = schreiben, zeichnen]. F¨ ur den harmonischen Oszillator mit x˙ = −aω sin ωt,
y˙ = bω cos ωt
beschreibt also der Hodograph x˙ 2 y˙ 2 + 2 − ω2 = 0 a2 b bis auf einen Maßstabsfaktor ω 2 die gleiche Ellipse wie die Bahngleichung. Als letzten Begriff dieser Art erw¨ahnen wir die Phasenbahn hi (xi , pi ) = 0 in dem aus Koordinate (xi ) und “zugeh¨origem” Impuls (pi ) aufgespannten Phasenraum
13
(Bedeutung: Statistische Mechanik, Bohr–Sommerfeldsche Quantentheorie). F¨ ur den Harmonischen Oszillator erhalten wir die Ellipsen x2 +
p2x = a2 m2 ω 2
und y 2 +
p2y = b2 m2 ω 2
als Phasenbahnen. Ihre Gleichungen lassen sich als separate (s.o.) Energies¨atze k 2 m 2 x + x˙ = const und 2 2
k 2 m 2 y + y˙ = const 2 2
deuten.
1.6
Zentralkraft– und Keplerproblem
Mit dem harmonischen Oszillator haben wir schon ein spezielles Zentralkraftproblem behandelt. Im Gegensatz zu diesem Spezialfall lassen sich die (kartesischen) Bewegungsgleichungen bei allen u ¨ brigen Zentralkr¨aften F=−
dV(r) r dr r
(34)
jedoch nicht separieren, da u ¨ ber r eine Kopplung besteht. Wir behandeln das allgemeine Problem daher mit systematischen Methoden und gehen von den Erhaltungss¨atzen aus: • Der Drehimpulssatz
l = mr × v = j
liefert uns drei Integrale und gestattet die Reduktion auf ein Problem dritter Ordnung. Da die Bewegung in der Ebene r · j = 0 verl¨auft, kann die Koordinate z = r · j/j senkrecht zu dieser Ebene (samt ihrer Ableitung!) entfallen. In dem verbleibenden Problem vierter Ordnung behalten wir das Integral l = mr 2 ϕ˙ = j,
(35)
wenn wir Polarkoordinaten r, ϕ in der Bewegungsebene benutzen. Dieses Integral besagt, daß der ’Fahrstrahl’ (radius vector) die Bahnebene mit konstanter ’Fl¨achengeschwindigkeit’ u ¨berstreicht. • Als zweites (unabh¨angiges) Integral notieren wir den Energiesatz T +V =
m 2 m 2 2 r˙ + r ϕ˙ + V (r) = E . 2 2 14
(36)
Das verbleibende Problem zweiter Ordnung besteht in der L¨osung der beiden gekoppelten Differentialgleichungen (35, 36) f¨ ur r(t) und ϕ(t). Da ϕ nicht explizit vorkommt, erreichen wir die Entkopplung, indem wir (35) nach ϕ˙ aufl¨osen und in (36) einsetzen: r˙ 2 =
2 (E − V ) − r 2 ϕ˙ 2 , m r˙ 2 =
mit ϕ˙ =
j mr 2
=⇒
j2 2 (E − V ) − 2 2 . m m r
(37)
Damit ist das Problem im Prinzip bis auf Quadraturen gel¨ost. Wir bemerken außerdem, daß Gl. (37) mit dem eindimensionalen Problem u ¨bereinstimmt, bei dem das Potential V (r) durch ein zus¨atzliches Fliehkraftpotential (Diskussion!) V˜ (r) =
j2 2mr 2
(38)
erg¨anzt ist. F¨ ur die weitere Diskussion wollen wir dem u ¨blichen Weg folgen und mittels 2 dr/dϕ = r/ ˙ ϕ˙ = mr r/j ˙ von Gl. (37) zur Differentialgleichung dr dϕ
!2
mr 2 j
=
!2 "
2 j2 (E − V ) − 2 2 m m r
#
der Bahngleichung u ¨ bergehen. Mit der Substitution s=
1 r
entsteht daraus die Differentialgleichung ds dϕ
!2
1 2m = 2 E − V ( ) − s2 , j s
(39)
Z1/r
(40)
die generell durch das Integral
ϕ = ϕ0 ±
1/r0
ds n
2m j2
h
E −V
gel¨ost wird. 15
( 1s )
i
−
s2
o1/2
Speziell f¨ ur das Gravitations– oder Coulomb–Potential V (r) = −
C = −Cs r
(41)
l¨aßt sich die Integration (nach quadratischer Erg¨anzung des Nenners) analytisch ausf¨ uhren (und f¨ uhrt auf die arccos–Funktion). Wir folgen jedoch der eleganteren Behandlung Sommerfelds (Bd. I, S. 37) und differenzieren Gl. (39) (mit V = −Cs) nach ϕ: ds d2 s 2mC ds ds 2 = − 2s . dϕ dϕ2 j 2 dϕ dϕ F¨ ur ds/dϕ 6= 0 ensteht daraus die einfache Differentialgleichung mC d2 s + s = dϕ2 j2 mit der allgemeinen L¨osung3 s=
mC + α cos ϕ + β sin ϕ. j2
Diese L¨osung enth¨alt zwei Integrationskonstanten α und β. Zur Festlegung einer Konstanten bemerken wir, daß s offenbar beschr¨ankt ist und verf¨ ugen ϕ = 0 f¨ ur das maximale s (minimale r, ’Perihel’). Dann haben wir β = 0 und α > 0. Nun ist unsere Ausgangsgleichung (39) aber erster Ordnung und l¨aßt gar keine zwei Integrationskonstanten frei. Nach der Wahl von β muß α also durch R¨ uckeinsetzen in (39) bestimmt werden. Dabei k¨onnen wir uns allerdings auf einen speziellen Punkt beschr¨anken. Der Bequemlichkeit halber w¨ahlen wir dazu ϕ = π/2 und erhalten ds mC und = −α. s= 2 j dϕ Setzen wir das [mit (41)] in (39) ein, erhalten wir α2 =
2mE 2mC mC m2 C 2 + 2 − , j2 j j2 j4
also 2j 2 m|C| 1+ E α= 2 j mC 2
!1/2
.
Damit lautet die Gleichung der Bahngkurve 3
Auf S. 35/36 (Bd. I) gibt Sommerfeld einen noch k¨ urzeren Weg zu dieser L¨ osung an.
16
2j 2 mC m|C| 1+ E s= 2 + 2 j j mC 2
!1/2
cos ϕ
oder r= j2 mit p = m|C|
p sgn C + ε cos ϕ
(42)
2j 2 und ε = 1 + E mC 2
!1/2
.
F¨ ur C > 0 und ε < 1 (also E < 0, Planetenbahnen) beschreibt Gl. (42) Ellipsen mit dem Brennpunkt F1 im Zentrum. Wir wollen das kurz an einer kleinen Skizze rekapitulieren: y
r q F2
ψ
e
e b
ϕ
p F1
x
a
Die Ellipse ist definiert durch die Beziehung q + r = 2a, wobei r und q die Abst¨ande zu den beiden Brennpunkten F1 und F2 sind und a die große Halbachse der Ellipse bezeichnet. Nach dem Kosinussatz gilt q 2 = r 2 + 4e2 − 4re cos ψ. Setzen wir q = 2a − r und cos ψ = − cos ϕ ein, erhalten wir 4a2 − 4ar + r 2 = r 2 + 4e2 + 4er cos ϕ r(a + e cos ϕ) = a2 − e2 17
oder
a2 − e 2 . a + e cos ϕ wird als Parameter p bezeichnet, f¨ ur ihn gilt also r=
Der Radius f¨ ur ϕ =
π 2
p=
a2 − e 2 . a
Damit erhalten wir schließlich r=
p 1 + ε cos ϕ
mit ε =
e . a
(43)
Abschließend notieren wir noch (Symmetrie, Pythagoras) die Beziehung b2 = a2 − e2 = ap
(44)
zur Berechnung der kleinen Halbachse b. Kehren wir nach diesem Exkurs zu unserem physikalischen Problem zur¨ uck, so folgt durch Vergleich der Gln. (42) und (43) f¨ ur attraktive Potentiale (C > 0) und gebundene Bahnen (E < 0, d.h. ε < 1) 1. Keplersches Gesetz: Der Planet beschreibt eine Ellipse, in deren einem Brennpunkt die Sonne steht. Das zweite Gesetz hatten wir schon bei Gl. (35) angesprochen. Es beruht allgemein auf der Drehimpulserhaltung und ist nicht auf 1/r–Potentiale beschr¨ankt: 2. Keplersches Gesetz: Der radius vector von der Sonne nach dem Planeten uberstreicht in gleichen Zeiten gleiche Fl¨achen. ¨ Die konstante Fl¨achengeschwindigkeit schreiben wir nach (35) 1 j A˙ = r 2 ϕ˙ = . 2 2m Wir wollen diese Beziehung benutzen, um mit der Fl¨ache A = πab = πa3/2 p1/2 der Ellipse [vgl. (44)] die Umlaufzeit T zu berechnen. Setzen wir [vgl. (42)] p = j 2 /(mC) ein, so erhalten wir A j 2m m T = = πa3/2 1/2 1/2 = 2πa3/2 ˙ m C j C A
1/2
.
F¨ ur die Gravitation haben wir C = γmM, 18
(45)
wobei γ die Gravitationskonstante und M die Sonnenmasse bezeichnet. Das Verh¨altnis m/C ist daher f¨ ur alle Planeten gleich; also gilt 3. Keplersches Gesetz: Die Quadrate der Umlaufszeiten der Planeten verhalten sich wie die dritten Potenzen der großen Achsen: T2 4π 2 = . a3 γM
(46)
Bei den gebundenen Bahnen mit E < 0 bleibt der Planet im Einflußbereich der Sonne ’eingefangen’. F¨ ur E > 0 ¨offnen sich die Bahnen (in unserer Darstellung auf der linken Seite) und lassen den Massenpunkt nach r = ∞ ’entweichen’: Statt der Planetenbahnen erhalten wir die Bahnen der Kometen, und das sind wieder Kegelschnitte. Wir k¨onnten analoge Betrachtungen wie bei der Ellipse durchf¨ uhren, ersparen uns jedoch die Rechnung und notieren nur kurz das Ergebnis: E < 0 ε < 1 Ellipse E = 0 ε = 1 Parabel E > 0 ε > 1 Hyperbel Betrachten wir statt der Gravitation die Coulombkraft, so wird C=−
e1 e2 . 4π0
(47)
Im attraktiven Fall (C > 0) erhalten wir die gleichen Bahnen wie f¨ ur Planeten und Kometen. Vom Wasserstoffatom wissen wir allerdings, daß die klassischen Begriffe f¨ ur ein Elektron–Proton–System nur noch sehr beschr¨ankt und vorsichtig angewendet werden d¨ urfen. F¨ ur gleichnamige Ladungen haben wir C < 0, und L¨osungen existieren nur noch f¨ ur E > 0. Als Bahnen finden wir nun Hyperbeln, bei denen das Kraftzentrum im ¨außeren Brennpunkt liegt (vgl. Skizze).
F2
F1
−
19
¨ Eine Ubersicht u ur die das Zentralkraftproblem ana¨ber weitere Kraftgesetze, f¨ lytisch oder mittels elliptischer Integrale l¨osbar ist, findet sich im Lehrbuch von Goldstein (S. 81f). Wegen der Konkurrenz zum Fliehkraftpotential V˜ (r) [vgl. (38)] stellt das Potential V (r) = Cr −2 einen (akademisch) interessanten Sonderfall dar ¨ (→ Ubungen).
1.7
Die Bewegung im konstanten elektrischen und magnetischen Feld
Als letztes Beispiel der Bewegung eines Massenpunktes im vorgegebenen Kraftfeld betrachten wir Newtons Lex secunda mv˙ = e (E + v × B)
(48)
f¨ ur ein geladenes Teilchen (e, m) unter dem Einfluß einer station¨aren Lorentzkraft. Obwohl sich die Lorentzkraft nicht aus einem Potential ableiten l¨aßt, gilt hier der Energiesatz m 2 v + eVel = = const . 2
(49)
Mathematisch erkennen wir dies, wenn wir Gl. (48) skalar mit v multiplizieren. Denn da sich ein statisches Feld E gem¨aß E = −∇Vel aus einem elektrostatischen Potential Vel herleiten l¨aßt, erhalten wir mv· v˙ + e
dVel · r˙ = 0, dr
aus der Gl. (49) durch Integration folgt. Aus physikalischer Sicht gilt der Energiesatz, weil (i) die magnetische Lorentzkraft senkrecht auf der Geschwindigkeit steht und nicht zum Wegintegral (8) der Arbeit beitr¨agt und (ii) im station¨aren Fall keine Energie durch Induktion aus dem Magnetfeld zu– oder abgef¨ uhrt wird. Wir wollen speziell die Bewegung in konstanten Feldern E = const und B = const untersuchen. Wie bei unseren ersten Beispielen ist es vorteilhaft, die Lex secunda direkt zu integrieren, ohne vom Energiesatz Gebrauch zu machen. Dazu spalten wir die Bewegung (z.B. durch skalare oder vektorielle Multiplikation mit B) in einen Anteil parallel und einen senkrecht zum Magnetfeld auf. Mit vk = v · B/B und Ek = E · B/B erhalten wir f¨ ur den parallelen Anteil mv˙ k = eEk oder vk = vk0 + 20
e Ek t . m
(50)
Die Bewegung parallel zum Magnetfeld (in z–Richtung) wird also (trivialerweise) gar nicht vom Magnetfeld beeinflußt und durch das Gesetz des freien Falls beschrieben. Zur Beschreibung der (interessanteren) Bewegung senkrecht zum Magnetfeld differenzieren wir Gl. (48) noch einmal nach der Zeit und erhalten e v˙ × B , m
v ¨⊥ =
da v ¨k = 0 ist. Auf der rechten Seite setzen wir das Kreuzprodukt [vgl. (48)] v˙ × B =
e e (E × B − B × (v × B)) = (E × B − B 2 v⊥ ) m m
ein. Mit der Zyklotronfrequenz ωc = erhalten wir dann v ¨⊥ =
ωc2
e B m
E×B − v⊥ B2
(51) !
.
Diese linear inhomogene Gleichung besitzt offenbar die spezielle konstante L¨osung vD =
E×B , B2
(52)
bei der sich die elektrische Kraft eE⊥ und die magnetische Lorentzkraft v × B gerade die Waage halten. (Eine Galileitransformation mit vD transformiert das Feld E⊥ weg!) Die homogene Gleichung beschreibt eine harmonische Schwingung, die allgemeine L¨osung der inhomogenen Gleichung lautet also v⊥ = vD + a cos ωc t + b sin ωc t . Wegen der Differentiation haben wir eine vektorielle Integrationskonstante (etwa b) zuviel. Zu ihrer Festlegung setzen wir die L¨osung speziell f¨ ur t = 0 noch einmal in die Ausgangsgleichung (48) ein und erhalten ωc b =
e (E⊥ + vD × B + a × B) . m
Aus Gl. (52) erkennen wir vD × B = −E⊥ , also muß gelten b=
a×B . B 21
Die Vektoren a und b sind also betragsgleich und stehen (in der Ebene senkrecht zu B) senkrecht aufeinander. Die Geschwindigkeit v⊥ = vD + a cos ωc t +
a×B sin ωc t B
(53)
beschreibt somit eine Kreisbewegung mit u ¨berlagerter konstanter Drift (’E × B– Drift’). Die Integrationskonstante a ergibt sich aus der Anfangsbedingung v⊥0 = vD + a.
1.8
Beschleunigte Koordinatensysteme und Scheinkr¨ afte
Gehen wir von unserem Inertialsystem K zu einem Koordinatensystem K0 u ¨ber, das sich relativ zu K mit der Geschwindigkeit u bewegt, so messen wir in K0 die Geschwindigkeit v0 = v − u. Aus Newtons Lex secunda folgern wir mv˙ 0 = F − mu. ˙
(54)
F¨ ur gleichf¨ormig bewegte Koordinatensysteme u˙ = 0 haben wir damit explizit die Galileiinvarianz der Newtonschen Grundgleichung angeschrieben. In beschleunigten Koordinatensystemen glauben wir dagegen, zus¨atzlich zu F eine Scheinkraft Fs = −mu˙
(55)
zu beobachten. Allt¨agliche Beispiele sind aus der pers¨onlichen Erfahrung in Fahrzeugen hinreichend bekannt. Die grunds¨atzliche Unterscheidung von “wahren” und von Scheinkr¨aften ist aber keineswegs trivial und unproblematisch. Von besonderer Bedeutung f¨ ur unsere Erfahrung auf der Erde – aber auch f¨ ur die sp¨atere Behandlung des starren K¨orpers – sind die Scheinkr¨afte in rotierenden Koordinatensystemen. Um sie zu behandeln, m¨ ussen wir uns zun¨achst mit der Beschreibung von Drehungen befassen. Es liegt zun¨achst nahe, Drehungen, die ja durch die Richtung der Drehachse und durch den Betrag des Drehwinkels eindeutig festgelegt sind, als Vektoren zu beschreiben. Das macht aber nur Sinn, wenn zusammengesetzte Drehungen den Rechenregeln der Vektoraddition gen¨ ugen. Das ist jedoch nicht der Fall, wie wir
22
an dem einfachen Beispiel den folgenden Skizzen erkennen (wir wollen ein Buch, das im Regal liegt, richtig aufstellen): z
y
Ausgangssituation x z
y
D1 = 90o – Drehung um die x–Achse x z y
D2 = 90o – Drehung um die z–Achse x
Die Hintereinanderausf¨ uhrung D2 D1 liefert also das gew¨ unschte Resultat, nicht dagegen die Drehung D1 D2 mit vertauschter Reihenfolge:
D2
z
D1D2
z y
y
x
x
Drehungen sind also nicht kommutativ. Sie werden durch orthogonale Matrizen4 beschrieben, die Hintereinanderausf¨ uhrung entspricht der Matrizenmultiplikation. Wir kommen jedoch zu der viel bequemeren Beschreibung durch Vektoren, wenn wir uns zun¨achst auf infinitesimale Drehungen beschr¨anken: F¨ ur kleine Drehwin4
Die 9 Koeffizienten einer orthogonalen Matrix sind durch 3 Orthogonalit¨ atsrelationen und 3 Normierungen verkn¨ upft, so daß 3 freie Parameter bleiben.
23
kel δ1 , δ2 schreiben wir D1 = 1 + δ1 D10 D2 = 1 + δ2 D20 und erhalten im Limes δ1 δ2 → 0 D1 D2 = 1 + δ 1 D1 + δ 2 D2 = D 2 D1 . Infinitesimale Drehungen sind also kommutativ und k¨onnen mit der Vektoraddition beschrieben werden. Zur sinnvollen Definition eines geeigneten Drehvektors ¨ legen wir die z–Achse in Richtung der Drehachse und betrachten die Anderung δa eines Vektors a durch eine infinitesimale Drehung δϕ. Dazu zerlegen wir a = ak + a⊥ mit ak = az ez . Dann bleibt ak bei der Drehung invariant, und wir erhalten δa = δa⊥ =
δϕ
a⊥+δa
= |a⊥ |δϕ eϕ = = δϕ ez × a⊥ =
ϕ
= δϕ ez × a .
a⊥
¨ Die Anderung δa kann also durch vektorielle Multiplikation von a mit einem infinitesimalen Drehvektor δϕ ez beschrieben werden. F¨ ur eine zeitliche Abfolge infinitesimaler Drehungen des Vektors a erhalten wir entsprechend da = ω × a, dt
(56)
wobei die Winkelgeschwindigkeit ω = ϕ˙ ez einen Vektor bezeichnet, dessen Richtung in die momentane Drehachse f¨allt und dessen Betrag durch die momentane Drehgeschwindigkeit ϕ˙ gegeben ist. Wir betrachten nun ein Koordinatensystem K0 , das mit konstanter Winkelgeschwindigkeit ω rotiert und wenden Gl. (56) auf seine Basisvektoren e0i an. Dann gilt e˙ 0i = ω × e0i ,
und wir erhalten f¨ ur die zeitliche Ableitung eines beliebigen Vektors x = x˙ = = =
X
x˙ i e0i +
X
x˙ i e0i + ω × x
X
x˙ i e0i +
24
X
X
xi e˙ 0i xi ω × e0i
P
xi e0i
Der linke Term auf der rechten Seite beschreibt die in K0 beobachtete (scheinbare) ¨ Anderung (dx/dt)0 von x, wir haben also dx = dt
dx dt
!0
+ω×x
oder in kurzer symbolischer Schreibweise d = dt
d dt
!0
+ω× .
(57)
Um nach diesem Exkurs u uckzu¨ber Drehungen zu Newtons Lex secunda zur¨ kehren, wenden wir diese Beziehung auf den Ortsvektor eines Massenpunktes an: dr = dt
dr dt
!0
+ ω × r oder
v = v0 + ω × r . Nochmalige Anwendung von (57) f¨ uhrt auf !0
+ω×v =
!0
+ ω × v0 + ω × (v0 + ω × r)
v˙ =
dv dt
=
dv0 dt
dv0 d ω × r + dt dt
!0
+ ω × (v0 + ω × r)
oder ¨r = (¨r)0 + 2 ω × v0 + ω × (ω × r) Hier bezeichnet (¨ r)0 die in K0 beobachtete (scheinbare) Beschleunigung. Mit der Grundgleichung m¨ r = F folgt m(¨ r)0 = F + 2m v0 × ω + m ω × (r × ω) .
(58)
Neben der Kraft F treten auf der rechten Seite also zwei Scheinkr¨afte auf. Der Term Z = m ω × (r × ω) = mω 2 r⊥
(59)
beschreibt die Zentrifugal– oder Fliehkraft. Sie beruht auf der Normalbeschleunigung eines Massenpunktes, der im rotierenden Koordinatensystem ruht. Damit der Massenpunkt in Ruhe bleiben kann, muß die Zentrifugalkraft durch die entgegengesetzt gleiche Zentripetalkraft (und das ist keine Scheinkraft!) kompensiert werden. Die Corioliskraft 25
C = 2m v0 × ω
(60)
beruht auf der scheinbaren seitlichen Ablenkung der Bahn eines bewegten Massenpunktes durch die Drehung des Koordinatensystems. Formal mathematisch hat sie die gleiche Struktur wie die magnetische Lorentzkraft. Auf der rotierenden Erde geht die Fliehkraft mit dem Cosinus der geographischen ¨ Breite. Am gr¨oßten ist sie am Aquator und macht dort ∼ 0.3 % der Erdbeschleunigung aus. Generell erg¨anzt sie ggrav zu dem beobachteten g = geff (Lot!). |g| nimmt also zu den Polen hin zu, und dieser Effekt wird durch die Abplattung der Erde – die selbst hierauf beruht! – verst¨arkt. Unter Vernachl¨assigung der Erdkr¨ ummung (aber nicht der Erddrehung!) wird der freie Fall also durch die Gleichung (¨ r)0 = g(eff) + 2 v0 × ω
(61)
beschrieben, die in ihrer mathematischen Struktur exakt mit der im vorigen Abschnitt behandelten Bewegungsgleichung (48) im konstanten elektrischen und magnetischen Feld u ¨ bereinstimmt. Dabei k¨onnen in dieser ebenen N¨aherung die Gyrationen nat¨ urlich nicht voll ausgebildet sein, denn sie w¨ urden Fallzeiten von mehreren Tagen voraussetzen. Der Effekt der Corioliskraft h¨angt generell von der Flugzeit ab, denn er beschreibt, wie sich die Erde unter der geraden Bahn wegdreht5 . Bei Fallversuchen ist dieser Effekt klein, er spielt aber bereits eine Rolle bei Geschoßbahnen und kann bei langdauernden Bewegungen dominant werden. Hierzu geh¨ort insbesondere das großr¨aumige Wettergeschehen: Durch die Corioliskraft wird die Luft, die auf der Nordhalbkugel in ein Tiefdrucksystem einstr¨omt, im Gegenuhrzeigersinn abgelenkt, so daß ein rotierender Wirbel, ein Zyklon, entsteht (vgl. Skizze). Ebenso bilden sich um Hochdruckgebiete Antizyklone mit entgegengesetztem Drehsinn aus.
H
T
Im reibungsfreien station¨aren Zustand halten sich Corioliskraft und Druckgradient sogar die Waage und die Windrichtung verl¨auft parallel zu den Isobaren. 5
Ein Teil der Corioliskraft l¨ aßt sich auch als Korrektur der Zentrifugalkraft interpretieren ¨ (Zug, der l¨ angs des Aquators f¨ ahrt).
26
Darauf beruht die hohe Lebensdauer großer Hoch– und Tiefdruckgebiete. (Aufgrund der Reibung weicht die Windrichtung tats¨achlich um einen Winkel von etwa 20 bis 300 von den Isobaren ab.)
1.9
Systeme von Massenpunkten
Wir erweitern nun die Mechanik des einzelnen Massenpunkts im vorgegebenen Krafteld und betrachten ein System von n Massenpunkten, die miteinander wechselwirken6 . Dazu gehen wir wieder von der Lex secunda p˙ i = Fi = Fai +
X0
Fij
(i, j = 1 . . . n)
(62)
j
aus. Fai bezeichnet dabei eine ¨außere Kraft und Fij die Kraft, die der j–te Massenpunkt auf den i–ten aus¨ ubt. Dabei deutet der Apostroph an der Summe an, daß wir eine Selbstwechselwirkung ausschließen, also Fii = 0 verlangen. Diese Forderung f¨ ugt sich auch zwanglos in Newtons Lex tertia Fij = −Fji
(63)
ein, von der wir von nun an Gebrauch machen werden. ¨ Nach den Uberlegungen in Abschnitt 1.3 wird die Dynamik eines Systems aus n Massenpunkten durch eine Differentialgleichungssystem 6n-ter Ordnung beschrieben. Durch jedes Integral, also jede Erhaltungsgr¨oße, wird die Ordnung um eins reduziert. Wir folgen daher den Ausf¨ uhrungen des Abschnitts 1.2, um grundlegende Erhaltungsstze zu formulieren. Zur Herleitung des Impulssatzes definieren wir den Gesamtimpuls P=
X
pi
i
und erhalten f¨ ur seine Ableitung ˙ = P
X
Fai +
i
X0
Fij .
i,j
Da die Doppelsumme nach der Lex tertia verschwindet, verh¨alt sich das System als Ganzes, als wirke nur die ¨außere Gesamtkraft Fa =
X
Fai .
i
6
Damit tun wir auch einen ersten Schritt zur Beschreibung der Dynamik ausgedehnter K¨ orper und kommen zur Begr¨ undung des Modells eines Massenpunktes.
27
Hierin liegt die eigentliche Begr¨ undung f¨ ur das Modell des Massenpunktes. Besonders pr¨agnant tritt dieses Modell in Erscheinung, wenn wir die Begriffe der Gesamtmasse X
M=
mi
(64)
i
und des Massenzentrums oder Schwerpunkts7 P
rS =
mi r i M
(65)
einf¨ uhren. Dann erhalten wir P=
X
mi r˙ i = M r˙ S
i
und k¨onnen die Lex secunda in der Form ˙ = M¨ P r S = Fa
(66)
formulieren: Der Schwerpunkt eines Systems von Massenpunkten bewegt sich so, als w¨are die Gesamtmasse in ihm vereinigt und als griffe die Resultierende aller ¨außeren Kr¨afte in ihm an. (Anschauliches Beispiel: Feuerwerksrakete). Verschwindet insbesondere die ¨außere Kraft, so ist der Gesamtimpuls des Systems konstant. Auch bei der Herleitung des Energiesatzes verfahren wir analog der Rechnungung im Abschnitt 1.2, wir multiplizieren also die Lex secunda skalar mit vi und summieren: mi v˙ i = Fi
=⇒
X i
mi vi ·v˙ i =
d X mi 2 X Fi ·˙ri . v = dt i 2 i i
Daraus folgt durch zeitliche Integration (2)
T2 − T 1 =
XZ
i (1)
Fi ·dri = A12 ,
(67)
wenn wir die (gesamte) kinetische Energie T =
X i
7
mi 2 v 2 i
Diese u ucklich gew¨ ahlt! ¨bliche Bezeichnung ist offensichtlich ungl¨
28
(68)
einf¨ uhren und die Summe der Wegintegrale aller Kr¨afte wieder als Arbeit A bezeichnen. In dieser Form ist der Energiesatz (67) noch wenig hilfreich. Eine erste Verbesserung erreichen wir, wenn wir die kinetische Energie in einen inneren und ¨außeren Anteil zerlegen. Dazu gehen wir wieder von der Definition (65) des Schwerpunkts aus und schreiben ri = r S + x i . Damit folgt 1X mi (˙rS + x˙ i ) · (˙rS + x˙ i ) 2 i X 1X 1 M r˙ 2S + r˙ S · mi x˙ i + = mi x˙ 2i . 2 2 i i
T =
Nun ist nach der Definition des Schwerpunkts offenbar mi xi = 0, also auch mi x˙ i = 0. Damit verschwindet der mittlere Term der unteren Zeile, und die kinetische Energie zerf¨allt gem¨aß P
P
1 1X T = M r˙ 2S + mi x˙ 2i 2 2 i
(69)
in die kinetische Energie “des Massenzentrums” und in den “inneren” Anteil aus der Relativbewegung. Dabei ist zu beachten, daß diese Zerlegung der kinetischen Energie nur bez¨ uglich des Schwerpunktes m¨oglich ist! Der entscheidende Nutzen des Energiesatzes kommt erst zum Tragen, wenn alle Kr¨afte aus Potentialen herleitbar sind. Denn nur dann l¨aßt sich das Wegintegral der Arbeit ohne vorherige L¨osung des Bewegungsproblems berechnen. Wir machen den Ansatz Fai = −
d a ∂ Vi (ri ) und Fij = − Vij (ri − rj ) dri ∂ri
(70)
und stellen mit der Zusatzforderung Vij = Vji die G¨ ultigkeit der Lex tertia sicher: Fij = −
∂ ∂ Vij = + Vij = −Fji . ∂ri ∂rj
Gleichzeitig weisen wir aber darauf hin, daß dieser naheliegende Ansatz keinesfalls allgemein ist. Zun¨achst einmal impliziert er sofort die Versch¨arfung der lex tertia, nach der die Kr¨afte in der Verbindungslinie der K¨orper liegen. Dar¨ uber hinaus 29
aber setz er die Annahme(!) einer Unabh¨angigkeit der Zweiteilchen–Wechselwirkung Vij vom Rest der Welt, insbesondere von den ¨außeren Kr¨aften, voraus. Der Ansatz ist f¨ ur die Coulomb–Wechselwirkung geladener Teilchen und die Gravitation von Punktmassen richtig, versagt aber schon bei der Wechselwirkung induzierter Dipole (N¨agel im Magnetfeld). Mit der Annahme der Gl. (70) zerf¨allt nun auch das Arbeitsintegral in Gl. (67) in zwei Anteile, n¨amlich den “¨außeren” Anteil (2)
Aa12
=−
XZ
i (1)
X dVia [Via (1) − Via (2)] · dri = dri i
und den Wechselwirkungs–Anteil (2)
AW 12
= −
X0 Z
i,j (1)
∂Vij · dri ∂ri
(2)"
Z 1 X0 = − 2 i,j
(1)
∂Vij ∂Vi · dri + · drj ∂ri ∂rj
#
(2)
(2)
1 X 0 Z ∂Vij 1 X 0 Z dVij = − · (dri − drj ) = − · drij , 2 i,j ∂ri 2 i,j drij (1)
(1)
wobei wir die Bezeichnung rij = ri − rj f¨ ur das Argument von Vij benutzt haben. Wir k¨onnen nun die Integration ausf¨ uhren und erhalten. 1 X0 [Vij (1) − Vij (2)] . AW 12 = 2 i,j Definieren wir also die gesamte potentielle Energie durch V (r1 , . . . , rn ) =
X
Via (ri ) +
i
1 X0 Vij (ri − rj ) , 2 i,j
(71)
so erhalten wir A12 = V1 − V2
(72)
und formulieren den Energiesatz T2 + V2 = T1 + V1 oder T + V = E = const. 30
(73)
Anmerkungen: 1. Die potentielle Energie (71) setzt sich zusammen aus der potentiellen Energie aller Teilchen in den ¨außeren Feldern und aus der Wechselwirkungsenergie. Letztere tr¨agt den Faktor 12 , da die Wechselwirkungsenergie je zweier Teilchen i, j bei der Summation doppelt gez¨ahlt wird. Eine h¨au benutzte alternative Anschrift lautet X 1 X0 Vij (ri − rj ) = Vij (ri − rj ) . 2 i,j i<j 2. Obwohl sowohl die kinetische als auch die potentielle Energie jeweils in einen inneren und einen ¨außeren Anteil zerlegt werden k¨onnen, gilt i.a. kein separater Energiesatz f¨ ur die innere und die ¨außere Gesamtenergie! Eine wichtige Ausnahme bildet der Spezialfall verschwindender ¨außerer Kr¨afte. In weiterer Anlehnung an die Darstellung in Abschnitt 1.2 wollen wir den Drehimpulssatz formulieren. Dazu multipliziern wir die Lex secunda p˙ i = Fi vektoriell mit ri und summieren u ¨ ber i: X i
ri × p˙ i =
X i
ri × F i .
Da r˙ i × pi = mi vi × vi = 0 gilt, steht auf der linken Seite die zeitliche Ableitung des Drehimpulses l :=
X i
ri × p i .
(74)
Die Kr¨afte auf der rechten Seite zerlegen wir nach Gl. (62) in ¨außere Kr¨afte und innere Wechselwirkung und erhalten X i
ri × F i =
X
ri × Fai +
X
ri × Fai +
i
X0 i,j
ri × Fij
1 X0 [ri × Fij + rj × Fji ] 2 i,j i X 1 X0 ri × Fai + = (ri −rj ) × Fij . 2 i,j i =
Hierbei haben wir bereits von der Lex tertia Fij = −Fji Gebrauch gemacht. Wir setzen nun außerdem wieder die Versch¨arfung “Die Kr¨afte liegen in der Verbindungslinie der K¨orper” voraus. Diese Versch¨arfung gilt f¨ ur Zentralkr¨afte. Dann wird (ri − rj ) × Fij = 0 31
und wir erhalten den Drehimpulssatz ˙l = M
(75)
mit dem Gesamt–Drehmoment M=
X i
ri × Fai ,
(76)
das nur von den ¨außeren Kr¨aften abh¨angt. Wirken insbesondere keine ¨außeren Kr¨afte, so ist der Drehimpuls konstant. ¨ Ahnlich wie die kinetische Energie l¨aßt sich auch der gesamte Drehimpuls in einen ¨außeren und einen innneren Anteil zerlegen. Wir schreiben dazu wieder ri = r S + x i und rechnen l =
X i
mi (rS + xi ) × (˙rS + x˙ i )
= M rS × r˙ S + rS ×
X
mi x˙ i +
i
X
mi xi × r˙ S +
X i
mi xi × x˙ i .
Wieder verschwinden wegen der Definition des Schwerpunkts die Summen P und mi x˙ i und wir erhalten die gew¨ unschte Zerlegung l = M rS × r˙ S +
X i
mi xi × x˙ i
P
mi xi
(77)
des gesamten Drehimpulses in den Drehimpuls rs ×P der Schwerpunktsbewegung und in den inneren Drehimpuls. Dabei sind auch entsprechende Hinweise wie bei der Energie zu beachten, n¨amlich 1. Die Zerlegung des Drehimpulses gilt nur bez¨ uglich des Schwerpunkts. 2. Trotz der Zerlegung gilt i.a. kein separater Erhaltungssatz f¨ ur den ¨außeren und den inneren Drehimpuls. Eine wichtige Ausnahme bildet wieder der Spezialfall verschwindender ¨außerer Kr¨afte. Schließlich erinnern wir noch einmal an die Voraussetzung der versch¨arften Lex tertia.
32
1.10
Das Zweik¨ orperproblem
Wir haben gesehen, daß die Bewegung des Schwerpunkts eines Systems nur von den ¨außeren Kr¨aften abh¨angt. Wie wir beim Energie– und Drehimpulssatz gesehen haben, gelingt eine v¨ollige Separation des Problems in Schwerpunkts– und Relativbewegung aber nur, wenn gar keine ¨außeren Kr¨afte angreifen. In diesem Fall wird die Schwerpunktsbewegung trivial. Die Gleichung rS = rS0 + vS0 t
(78)
enth¨alt sechs Integrationskonstanten und kann benutzt werden, um einen Satz der 6n Koordinaten und Impulse zu eliminieren: Das n–K¨orperproblem ohne ¨außere Kr¨afte ist also mathematisch einem (n − 1)–K¨orperproblem (Ordnung 6(n − 1)) a¨quivalent. Damit muß es m¨oglich sein, das Zweik¨orperproblem, das durch die Gleichungen (beachte die Lex tertia)
m1 v˙ 1 = F12 m2 v˙ 2 = −F12
(79) (80)
definiert ist, auf das ausf¨ uhrlich diskutierte Problem eines Massenpunktes zur¨ uckzuf¨ uhren. Die Addition der beiden Gleichungen liefert den bereits besprochenen Schwerpunktsatz. Multiplizieren wir die Gleichungen dagegen wechselseitig mit m2 und m1 und subtrahieren, so erhalten wir m1 m2 (v˙ 1 − v˙ 2 ) = (m1 + m2 )F12 , oder wenn wir die Relativkoordinaten
r12 = r1 − r2 u = r˙ 12 = v1 − v2
(81) (82)
und die reduzierte Masse µ=
m1 m2 m1 m2 = m1 + m 2 M
(83)
einf¨ uhren, µu˙ = F12 . 33
(84)
Damit ist die gesuchte Formulierung eines ¨aquivalenten Eink¨orperproblems bereits gefunden. Ausgehend von diesem Eink¨orperproblem k¨onnen wir nun auch wieder eine kinetische Energie Trel =
µ 2 u 2
(85)
und einen Drehimpuls lrel = µu × u˙
(86)
im Relativsystem definieren und entsprechende Erhaltungss¨atze formulieren. Unter Ausnutzung der Beziehungen m2 r12 M m1 = rS − r12 M
r1 = r S + r2
und
(87) (88)
rechnet man jedoch leicht nach, daß es sich hierbei um die bereits aus dem vorigen Abschnitt bekannten inneren Anteile der kinetischen Energie bzw. des Drehimpulses handelt. Nachtr¨aglich merken wir an, daß wir auf dieser Basis die Behandlung des Keplerproblems im Abschnitt 1.6 pr¨azisieren k¨onnen, indem wir die Planetenmasse durch die reduzierte Masse ersetzen. Wir weisen aber nochmals darauf hin, daß die einfache Reduktion des Zweik¨orperproblems nur m¨oglich ist, wenn keine ¨außeren Kr¨afte einwirken. Die Bewegung des Mondes um die Erde im (¨außeren) Schwerefeld der Sonne ist also beispielsweise kein Zweik¨orperproblem und und folgt nur in sehr grober N¨aherung den Keplerschen Gesetzen.
34
2
Lagrange–Mechanik
2.1
Zwangsbedingungen und Zwangskr¨ afte
¨ Bei unseren bisherigen Uberlegungen waren die Kr¨afte als Funktion von Teilchenkoordinaten, Geschwindigkeiten und eventuell der Zeit vorgegeben, und unsere Aufgabe bestand in der L¨osung der Newtonschen Differentialgleichungen mi¨ ri = Fi (rj , r˙ j , t)
(i, j = 1, . . . n) .
In vielen technischen Problemen ist aber die Bewegung durch Nebenbedingungen oder Zwangsbedingungen eingeschr¨ankt. Dabei treten Kr¨afte, die sogenannten Zwangskr¨ afte, auf, die nicht vonvornherein bekannt sind. Bevor wir uns mit dem damit verbundenen Selbstkonsistenzproblem befassen, wollen wir einige Begriffe zur sprachlichen Klassifikation von Zwangsbedingungen einf¨ uhren und an einfachen Beispielen erl¨autern. Zwangsbedingungen, die durch Beschr¨ankungsgleichungen der Form fk (r1 , . . . rn , t) = 0
(89)
formuliert werden k¨onnen8 , heißen holonom [griech. oλoς (holos) = lat. integer (“Integral!”), griech. νoµoς (nomos) = Gesetz], alle andern heißen anholonom [griech. αν (an) = lat. in = dtsch. un]. Zur Erl¨auterung notieren wir einige Beispiele:
holonom
anholonom
Pendel an einer Stange r2 − a 2 = 0
Pendel an einem Faden r 2 − a2 ≤ 0
Bewegung auf der Erdoberfl¨ache r2 − a 2 = 0
Bewegung außerhalb der Erde r 2 − a2 ≥ 0
Starrer K¨orper (ri − rj )2 − a2ij = 0
System harter Kugeln (ri − rj )2 − a2 ≥ 0
“Breite” Rolle dx = adϕ (vgl. 5 )
“Scharfkantiges” Rad dx = a cos ϑdϕ, dy = a sin ϑdϕ
Straßenbahn
Autobus
8
Hierzu geh¨ oren also auch integrable differentielle Bedingungen
35
P
∂fk/∂ri · dri = 0!
Abgesehen von bestimmten differentiellen Bedingungen (vgl. Abschnitt 2.5) ist man bei der Behandlung anholonomer Beschr¨ankungen auf individuelle Ans¨atze f¨ ur die speziellen Probleme angewiesen. So werden Bedingungen mit einem ≤– Zeichen i.a. auf eine Fallunterscheidung mit entprechender Untersuchung von Bahnst¨ ucken f¨ uhren (Fadenpendel) und/oder genauere Spezifizierungen der Bedingungen im Fall des =–Zeichens verlangen (Stoß harter Kugeln). Wie werden im folgenden, wenn nicht ausdr¨ ucklich etwas anderes gesagt wird, stets holonome Zwangsbedingungen voraussetzen. Eine weitere Unterscheidung trifft man bez¨ uglich der Zeitabh¨angigkeit: Enthalten Zwangsbedingungen die Zeit explizit, nennt man sie rheonom [griech. ρω (rheo) = fließen], andernfall skleronom [griech. σκληρoς (skleros) = starr]. Skleronome Bedingungen erscheinen zun¨achst einfacher, der Formalismus, den wir im folgenden entwickeln, l¨aßt aber ohne nennenswerten Mehraufwand auch die Behandlung rheonomer Bedingungen zu. Wir kommen nun auf das Problem der Selbstkonsistenz zur¨ uck. Wir stehen nmlich ¨ vor der grunds¨atzlichen Schwierigket, daß wir das Bewegungsproblem mit den Newtonschen Gesetzen allein nicht l¨osen k¨onnen, da die Zwangskr¨afte nicht apriori vorgegeben sind. Sie stellen vielmehr Reaktionen des Systems dar, die selbst vom Bewegungsablauf — also der L¨osung des Bewegungsproblems — abh¨angen. Um diesen Aspekt zu verdeutlichen, betrachten wir vergleichend das Problem influenzierter Oberfl¨achenladungen in der Elektrostatik: Elektrostatik
Mechanik
Grundproblem: Das Potential Φ ist mit der Poissongleichung
Grundproblem: Die Bahnen ri (t) sind mit Newtons Gesetz
Φ = −%/ε0
mi¨ ri = F i
aus den Ladungen % zu berrechnen.
aus den Kr¨aften Fi zu berechnen.
Beschr¨ankung: Φ ist auf den Leiteroberfl¨achen vorgegeben.
Beschr¨ankung: Die ri (t) unterliegen Zwangsbedingungen.
Schwierigkeit: Die Ladungen auf den Leiteroberfl¨achen (Reaktionen des Systems!) sind nicht apriori bekannt.
Schwierigkeit: Die Zwangskr¨afte (Reaktionen des Systems!) sind nicht apriori bekannt.
L¨osungskonzept: Wir versuchen, die unbekannten Oberfl¨achenladungen aus der Beschreibung zu eliminieren (z.B. durch die Methode der Spiegelladungen).
L¨osungskonzept: Wir versuchen, die unbekannten Zwangskr¨afte aus der Beschreibung zu eliminieren. Hierzu postulieren wir ein neues Prinzip.
36
2.2
Prinzip der virtuellen Arbeit und d’Alembertsches Prinzip
Da die Zerlegung von Kr¨aften Fi = Fei + Zi
(90)
in von außen angelegte oder “eingepr¨agte” Kr¨afte Fei und Zwangskr¨afte Zi nicht aus den Newtonschen Axiomen gefolgert werden kann, ben¨otigen wir ein neues, zus¨atzliches Postulat. In Analogie zum Modell des idealen Leiters in der Elektrostatik benutzen wir hierzu das Modell der glatten F¨ uhrungen. Dabei denken wir z.B. an reibungsfreie Schienen. Trotz der scheinbaren Trivialit¨at erweist sich die korrekte Formulierung des neuen Postulats als ziemlich schwierig. Darum beschr¨anken wir uns zun¨achst auf die Statik und bereiten die Aufstellung des Postulats durch die elementare Anschauung an der schiefen Ebene vor:
z
Z K G⊥
G||
δs
G
ϕ
x
An unseren Massenpunkt greift eine Federkraft K, eine Gewichtskraft G und die Zwangskraft Z an. Im statischen Gleichgewicht muß die Summe aller Kr¨afte verschwinden: F = K+G +Z = 0. Die intuitive L¨osung des Problems besteht nun darin, zu postulieren, daß die Zwangskraft senkrecht auf der F¨ uhrung steht. Zerlegen wir die Gewichtskraft entsprechend in die Anteile Gk und G⊥ mit Gk = mg sin ϕ und G⊥ = mg cos ϕ , so erhalten wir die beiden Beziehungen G⊥ + Z = 0 und Gk + K = 0 . 37
Die erste Gleichung interessiert uns nicht, da wir die Zwangskraft eliminieren wollen. Aus der zweiten finden wir K = −mg cos ϕ . Unsere intuitive Behandlung der Zwangsbedingung macht also Gebrauch von dem Postulat “Die Zwangskraft steht senkrecht auf der F¨ uhrung”. Wir k¨onnen diesen Sachverhalt mit Hilfe des Arbeitsintegrals ohne explizite Zerlegung der Kr¨afte ausdr¨ ucken: Prinzip der virtuellen Arbeit: Zwangskr¨afte leisten bei virtuellen Verr¨ uckungen δri keine Arbeit, X i
Zi · δri = 0 .
(91)
Die Gleichgewichtsbedingungen Fi = 0 gehen damit in die Bedingungen X i
Fei · δri = 0
(92)
u ¨ber, welche die Zwangskr¨afte gar nicht mehr enthalten! Hierin liegt bei komplexeren Problemen der entscheidende Vorteil gegen¨ uber der Zerlegung nach dem Kr¨afteparallelogramm. Virtuelle Verru ¨ckungen sind dabei differentielle System¨anderungen δri der Massenpunkte, • die mit den Zwangsbedingungen vertr¨aglich sind und • die “im Gedankenexperiment” ohne R¨ ucksicht auf den tats¨achlichen Bewegungsablauf vorgenommen werden. Hinweise: 1. Beachte, daß aus Gl. (92) nicht Fei = 0 gefolgert werden kann, da die δri nicht unabh¨angig sind. ¨ 2. Warum es so wichtig ist, die virtuellen Anderungen vom tats¨achlichen Bewegungsablauf zu unterscheiden, werden wir gleich sehen. 3. Wir weisen nochmals darauf hin, daß sich das Postulat nicht beweisen l¨aßt, sondern daß damit “glatte F¨ uhrungen” definiert werden. Wir werden es f¨ ur holonome und einfache differentielle anholonome Zwangsbedingungen benutzen. 38
F¨ ur unser Beispiel der schiefen Ebene erhalten wir also die Gleichgewichtsbedingung (G + K) · δs = 0 , wobei zu beachten ist, daß δs mit der Zwangsbedingung vertr¨aglich ist. Das heißt, daß die Richtung von δs l¨angs der schiefen Ebene zu w¨ahlen ist. Damit geht die Gleichgewichtsbedingung in (Gk + K)δs = 0 u ur δs 6= 0 folgt die oben formulierte Gleichung ¨ber, und f¨ Gk + K = 0 .
Wir verlassen nun die Statik und gehen wieder zur Dynamik u ¨ber, indem wir die Gleichgewichtsbedingung Fi = 0 durch Newtons Lex secunda p˙ i = Fi = Fei + Zi
(93)
ersetzen. Dabei halten wir am Modell der glatten F¨ uhrungen und damit an dem Prinzip, daß Zwangskr¨afte bei virtuellen Verr¨ uckungen keine Arbeit leisten, fest: X i
Zi · δri = 0 .
Damit erhalten wir sofort das d’ Alembertsche Prinzip X i
(p˙ i − Fei ) · δri = 0 .
(94)
Was wir hier so m¨ uhelos und scheinbar trivial erhalten haben, geht historisch auf uck, die ¨außerst scharfsinnige Analysen von Bernoulli und d’Alembert zur¨ auf einem dynamischen Gleichgewicht von eingepr¨agten Kr¨aften, Zwangskr¨aften und Tr¨agheitskr¨aften beruhen. Wie wenig trivial das Prinzip ist, zeigt sich darin, daß der pr¨azise Charakter der virtuellen Verr¨ uckungen erst jetzt voll zum Tragen kommt: Virtuelle Verr¨ uckungen sind gedachte Systemver¨anderungen, die mit den (momentanen) Zwangsbedingungen vertr¨aglich sind und nichts mit dem tats¨achlichen Ablauf der Bewegung zu tun haben. Ohne diesen letzteren Nachsatz w¨are das Prinzip falsch! Insbesondere bei rheonomen Zwangsbedingungen k¨onnen Zwangskr¨afte bei der tats¨achlichen Bewegung n¨amlich sehr wohl Arbeit am System leisten. Die Zwangskr¨afte stehen dann im Fall holonomer Bedingungen zwar weiterhin senkrecht 39
auf den momentanen beschr¨ankenden Fl¨achen, aber die resultierende Bewegung verl¨auft eben nicht mehr in diesen Fl¨achen. Als einfaches Beispiel dazu betrachten wir die Arbeit, die von der Zentripetalkraft geleistet wird, wenn ein Massenpunkt an einem Faden der L¨ange `(t) mit `˙ < 0 gef¨ uhrt wird:
δr
dr=rdt
l(t0) l(t)
F¨ ur die Ausf¨ uhrung der virtuellen Verr¨ uckung muß also in Gedanken die Zeit kurz “angehalten” werden, anschaulich: Wir f¨ uhren die virtuelle Verr¨ uckung nicht am bewegten System durch, sondern an einer Momentaufnahme, an einem Foto dieses Systems. In abstrakter mathematischer Form formulieren wir diese fundamental wichtige Erkl¨arung in der Form • Die Zeit darf bei virtuellen Verr¨ uckungen nicht variiert werden: δt = 0 .
(95)
Wir beenden diesen Abschnitt mit einem einfachen Beispiel zum d’Alembertschen Prinzip: Wir stellen die Bewegungsgleichung f¨ ur die schiefe Ebene (nun ohne Federkraft) auf. Dabei beziehen wir uns auf die Skizze
z m
δs
G
ϕ
40
x
und rechnen (m¨ r − G) · δs = 0 mit ¨ r = x¨ex + z¨ez ,
G = −mgez
und δs = (cos ϕex − sin ϕez )δs
=⇒ m(¨ xex + z¨ez + gez )(cos ϕex − sin ϕez )δs = 0 oder x¨ cos ϕ − z¨ sin ϕ − g sin ϕ = 0 . Diese eine Bewegungsgleichung enth¨alt noch zwei Unbekannte. Aber uns steht ja außerdem auch noch die Zwangsbedingung z = z0 − x tan ϕ zur Verf¨ ugung, mit der wir eine der Koordinaten eliminieren k¨onnen. Wir setzen z¨ = −¨ x tan ϕ ein und erhalten die Bewegungsgleichung sin2 ϕ x¨ cos ϕ + cos ϕ
!
= g sin ϕ
oder x¨ = g sin ϕ cos ϕ mit der L¨osung x = x0 + vx0 t +
2.3
g sin ϕ cos ϕ t2 . 2
Generalisierte Koordinaten und Lagrangesche Gleichungen
Das Beispiel der schiefen Ebene hat einen Nachteil unserer bisherigen Formulierung deutlich gemacht, der die Rechnung noch einigermaßen unbequem gestaltet: Unser n–Teilchen–Problem wird durch 3n Koordinaten beschrieben. Wenn alle Koordinaten unabh¨angig w¨aren, k¨onnten wir alle δri unabh¨angig w¨ahlen — etwa immer nur eine einzige Koordinate variieren — und erhielten aus dem d’Alembertschen Prinzip 3n Bewegungsgleichungen. Tats¨achlich sind die Koordinaten aber durch m Beschr¨ankungsgleichungen verkn¨ upft und so bleiben uns nur f = 3n − m
(96)
“Freiheitsgrade” f¨ ur die Variation. Damit liefert das d’Alembertsche Prinzip auch nur f unabh¨angige Gleichungen. (Im Beispiel der schiefen Ebene war das eine Gleichung). Mit den m Beschr¨ankungsgleichungen zusammen erhalten wir zwar die erforderliche Anzahl von 3n Gleichungen. Da wir im Fall holonomer Zwangsbedingungen, auf die wir uns hier beschr¨anken, aber nur f unabh¨angige Koordinaten haben, schleppen wir einen unn¨otigen Ballast mit uns. Im Falle der 41
schiefen Ebene w¨are es beispielsweise bequemer gewesen, statt der Koordinaten x und z, die durch eine Zwangsbedingung verkn¨ upft sind, sofort die eine freie Koordinate s zu verwenden. Im allgemeinen wird es freilich nicht ausreichen, einfach ein gedrehtes kartesisches Koordinatensystem zu benutzen. Vielmehr m¨ ussen wir bereit sein, von den kartesischen Koordinaten, die wir nun in der Form x1 , . . . x3n durchnumerieren wollen, zu ganz allgemeinen krummlinigen und schiefwinkligen Koordinaten q1 , . . . q3n u ¨berzugehen: Wir sprechen von generalisierten Koordinaten. Dabei streben wir an, daß die Zwangsbedingungen trivial zu handhaben sind. Schreiben wir diese wieder in der Form f1 (x1 , . . . x3n , t) = 0, . . . , fm (x1 , . . . x3n , t) = 0 , so w¨ahlen wir beispielsweise qf +1 = f1 (x1 , . . . x3n , t), . . . , q3n = fm (x1 , . . . x3n , t) als neue Koordinaten und erg¨anzen sie durch eine geeignete Wahl von q1 (x1 , . . . x3n , t), . . . , qf (x1 , . . . , x3n , t) zu einem vollst¨andigen Koordinatensatz. Die Zwangsbedingungen qf +1 = 0, . . . , q3n = 0 ussind dann in der Tat trivial und machen die m Koordinaten qf +1 , . . . q3n u ¨ berfl¨ sig. Auf jeden Fall beschreiben wir unser System von f Freiheitsgraden so durch f generalisierte Koordinaten q1 , . . . qf , daß die m Zwangsbedingungen bereits implizit in der R¨ ucktransformation x1 = x1 (q1 , . . . qf , t), . . . , x3n = x3n (q1 , . . . qf , t)
(97)
enthalten sind. Um dieses Konzept an einem einfachen Beispiel zu illustrieren, betrachten wir ein ebenes Pendel, d.h einen Massenpunkt mit den Koordinaten x1 , x2 , x3 und den Zwangsbedingungen f1 (x) = x21 + x22 + x23 − `2 = 0 und x2 − ϕ0 = 0 . f2 (x) = atn x1 42
Benutzen wir an Stelle der kartesischen Koordinaten x1 , x2 , x3 sph¨arische Polarkoordinaten r, ϑ, ϕ, so lauten die Zwangsbedingungen f1 (x) = r 2 − `2 = 0 und f2 (x) = ϕ − ϕ0 = 0 . Mit der Wahl der Koordinaten q3 = r − ` = 0 und q2 = ϕ − ϕ0 = 0 — die explizit gar nicht mehr ben¨otigt werden — sind die Zwangsbedingungen trivial erf¨ ullt und wir k¨onnen mit q1 = ϑ als einziger freier Koordinate arbeiten. Die R¨ ucktransformation x1 = ` sin ϑ cos ϕ0 x2 = ` sin ϑ sin ϕ0 x3 = ` cos ϑ stellt die Erf¨ ullung der Zwangsbedingungen bereits sicher. Unsere Aufgabe besteht nun also darin, das d’Alembertsche Prinzip 3n X i=1
(mi v˙ i − Fi )δxi = 0
(98)
in generalisierten Koodinaten zu formulieren. Hierbei bezeichnet Fi die einpr¨agte Kraft. Wir lassen also k¨ unftig den oberen Index e weg, da die Zwangskr¨afte Zi im d’Alembertschen Prinzip gar nicht vorkommen. Zur Umrechnung benutzen wir die differentiellen Beziehungen
δxi =
f X
∂xi δqk k=1 ∂qk
und
f X ∂ ∂ d = q˙j + . dt ∂qj ∂t j=1
(99) (100)
Die Umformung des zweiten Terms in Gl. (98) ist rasch erledigt: Wir schreiben einfach X ∂xi X X Fi Fi δxi = Qk δqk δqk = ∂qk i i,k k und definieren damit generalisierte Kr¨ afte Qk =
X
Fi
i
43
∂xi . ∂qk
(101)
[Beachte: Eine generalisierte Kraft Qk hat nur dann die Dimension einer Kraft, wenn qk die Dimension einer L¨ange hat. Die Produkte Qk δqk haben immer die Dimension einer Energie (virtuelle Arbeit!). Beschreibt z.B. qk einen Winkel, so ist Qk das zugeh¨orige Drehmoment.] Die Umformung des ersten Terms in Gl. (98) kostet etwas mehr M¨ uhe. Wir schreiben zun¨achst gem¨aß (99) v˙ i δxi = v˙ i
X k
"
X d ∂xi ∂xi vi δqk = ∂qk dt ∂qk k
!
#
d ∂xi − vi δqk . dt ∂qk
(102)
Im rechten Term k¨onnen wir nach Gl. (100)
f ∂xi ∂xi ∂vi ∂ 2 xi ∂ 2 xi ∂ X d ∂xi X q˙j q˙j = = + = + dt ∂qk ∂qj ∂qk ∂t∂qk ∂qk j=1 ∂qj ∂t ∂qk j
ersetzen, denn es gilt ja — ebenfalls nach Gl. (100) — vi =
dxi X ∂xi ∂xi q˙j = + . dt ∂qj ∂t j
(103)
An dieser Stelle u ¨ berlegen wir uns, daß wir in der neben den qk auch die q˙k als unabh¨angige Variable ben¨otigen. Dabei gilt nach Gl. (103) offenbar ∂vi ∂xi = . ∂qj ∂ q˙j
(104)
Dies setzen wir im ersten Term auf der rechten Seite von Gl. (102) ein und erhalten v˙ i δxi =
X k
"
d ∂vi vi dt ∂ q˙k
!
#
∂vi − vi δqk . ∂qk
Hier ersetzen wir nun keineswegs die vi nach Gl. (103), sondern multiplizieren mit mi , summieren und dr¨ ucken das Ergebnis mit Hilfe der kinetischen Energie 1 P 2 T = 2 mi vi aus: X
mi v˙ i δxi =
i
X k
"
#
∂T d ∂T − δqk . dt ∂ q˙k ∂qk
Damit erh¨alt das d’Alembertsche Prinzip (98) die Form X k
"
#
∂T d ∂T − − Qk δqk = 0 . dt ∂ q˙k ∂qk 44
(105)
Und nun kommt die entscheidende Schlußfolgerung: Wenn wir die generalisierten Koordinaten bei holonomen Zwangsbedingungen “richtig” gew¨ahlt haben, dann sind die Variationen δqk nicht mehr durch Nebenbedingungen verkn¨ upft 9 und k¨onnen frei gew¨ahlt werden . Damit m¨ ussen die Koefizienten der δqk in Gl. (104] einzeln verschwinden, und wir erhalten die Lagrangeschen Gleichungen ∂T d ∂T − = Qk . dt ∂ q˙k ∂qk
(106)
Meistens nimmt man bei der Formulierung der Lagrangeschen Gleichungen zus¨atzlich an, daß die Kr¨afte aus einem Potential hergeleitet werden k¨onnen. Dann erh¨alt man f¨ ur die generalisierten Kr¨afte Qk = − und kann schreiben
X i
∂V ∂V ∂xi =− ∂xi ∂qk ∂qk
(107)
d ∂T ∂T ∂V − + = 0. dt ∂ q˙k ∂qk ∂qk
Da das Potential V nicht von den q˙k abh¨angt, k¨onnen wir die Lagrangefunktion L(q1 , . . . qf , q˙1 , . . . q˙f , t) = T − V
(108)
einf¨ uhren und erhalten die Lagrangeschen Gleichungen in der u ¨blichen Form d ∂L ∂L − = 0. dt ∂ q˙k ∂qk
(109)
Beachte: Gl. (109) ist keine partielle Differentialgleichung zur Bestimmung von L. Vielmehr wird angenommen, daß die kinetische und die potentielle Energie mit Hilfe der Transformationsgleichungen durch die qk und q˙k ausgedr¨ uckt wurden und L bereits in der Form (108) vorliegt. Die Ausf¨ uhrung der Differentiationen in (109) liefert dann ein System von gew¨ohnlichen Differentialgleichungen gk (q1 , . . . qf , q˙1 , . . . q˙f , q¨1 , . . . q¨f , t) = 0 der Ordnung 2f zur Bestimmung der qk (t). Dies sind die “fertigen” Bewegungsgleichungen in den generalisierten Koordinaten, in denen bereits alle holonomen Zwangsbedingungen ber¨ ucksichtigt sind. So schwierig auch im Einzelfall die L¨osung dieser Bewegungsgleichungen sein mag, ihre Aufstellung ist nach diesem Standartverfahren fast m¨ uhelos. Der Rest ist Mathematik: Die (h¨aufig numerische) Integration eines Systems gew¨ohnlicher Differentialgleichungen. 9
Die Gleichung (104) selbst ist nicht an diese Vorraussetzung gebunden und gilt auch bei anholonomen Zwangsbedingungen.
45
2.4
Beispiele
Wir wollen uns das Verfahren, aus der Lagrangefunktion die Bewegungsgleichungen zu gewinnen, zun¨achst an dem allereinfachsten Spezialfall klarmachen: Wir haben keine Zwangsbedingungen und verwenden kartesische Koordinaten qi = xi . Dann wird L(xi , x˙ i ) = T − V =
X i
und aus den Lagrangeschen Gleichungen Newtonschen Bewegungsgleichungen mi x¨i = −
mi 2 x˙ − V (xi ) , 2 i d ∂L ∂L − = 0 folgen sofort die dt ∂ x˙ i ∂xi
∂V = Fi . ∂xi
Zur Verdeutlichung betrachten wir drei weitere einfache aber nicht mehr ganz so triviale Beispiele: 1. Spiralbewegung in der Ebene Wir greifen sogleich das Beispiel einer rheonomen Zwangsbedingung aus dem vorigen Abschnitt auf, und betrachten einen Massenpunkt in der Ebene, der durch einen Faden der vorgegebenen L¨ange `(t) auf eine Spirale um den Ursprung gezwungen wird. Wir gehen von ebenen Polarkoordinaten r, ϕ aus und behalten wegen der Zwangsbedingung r = `(t) den Winkel ϕ als einzige generalisierte Koordinate. Mit m m T = v 2 = (`˙2 + `2 ϕ˙ 2 ) und V = 0 2 2 folgt L(ϕ, ˙ t) =
m 2 m ˙2 v = (` + `2 ϕ˙ 2 ) . 2 2
Da L nicht von ϕ abh¨angt, lautet die Lagrangegleichung d ∂L = 0, dt ∂ ϕ˙
also
∂L = m`2 ϕ˙ = j = const . ∂ ϕ˙
In dieser Bewegungsgleichung erkennen wir den Drehimpulssatz wieder. Nach Vorgabe der Funktion `(t) erh¨alt man die L¨osung ϕ(t) durch Integration. Betrachten wir etwa speziell `(t) = `0 e−νt und dr¨ ucken den Drehimpuls in der 2 Form j = m`0 ϕ˙ 0 durch die Anfangsbedingung aus, so folgt explizit ϕ˙ = ϕ˙ 0 e2νt
und ϕ = ϕ0 + 46
ϕ˙ 0 2νt e . 2ν
2. Das ebene Pendel Wir benutzen sph¨arische Polarkoordinaten r, ϑ, ϕ mit der Polarachse nach unten. Wegen der beiden Zwangsbedingungen r = ` und ϕ = ϕ0 behalten wir ϑ als einzige generalisierte Koordinate. Damit formulieren wir T =
m 2 m 2 ˙2 v = ` ϑ 2 2
und V = mgz = −mg` cos ϑ (+const)
˙ = und erhalten die Lagrangefunktion L(ϑ, ϑ)
m 2 ˙2 `ϑ 2
+ mg` cos ϑ.
Aus der Lagrangegleichung d ∂L ∂L = 0 mit − dt ∂ ϑ˙ ∂ϑ
∂L ˙ = ml2 ϑ, ∂ ϑ˙
∂L = −mgl sin ϑ ∂ϑ
folgt die Bewegungsgleichung g m`2 ϑ¨ + mg` sin ϑ = 0 oder ϑ¨ + sin ϑ = 0 . ` F¨ ur kleine Auslenkunken (sin ϑ ≈ ϑ) erh¨alt man harmonische Schwingungen der Frequenz ω = (g/`)1/2 . Die Ber¨ ucksichtigung endlicher Auslenkugen f¨ uhrt auf elliptische Integrale. Die Schwingungsdauer h¨angt dabei von der Amplitude ab, das Pendel schwingt nicht mehr isochron [griech. ισoς (isos) = gleich, χρoνoς (chronos) = Zeit]. 3. Das Zykloidenpendel Im letzten Beispiel demonstrieren wir die Leistungsf¨ahigkeit des Verfahrens durch eine Umkehrung der Fragestellung: Wir suchen eine F¨ uhrung, also eine Zwangsbedingung, welche die Anharmonizit¨at (Anisochronie) des ebenen Pendels (in der x − z-Ebene) korrigiert. Mit einer geeigneten – noch unbekannten – dimensionslosen generalisierten Koordinate q postulieren wir also die Bewegungsgleichung g q¨ + q = 0 ` und gehen dementsprechend von einer geeigneten Lagrangefunktion L=
m 2 2 1 ` q˙ − mg`q 2 2 2
aus. Die Parameterdarstellung x(q), z(q) erhalten wir, indem wir L = T − V mit der kartesischen Darstellung T =
m 2 (x˙ + z˙ 2 ) und V = mgz 2 47
vergleichen. Daraus folgt 1 und z = q 2 `. 2
x˙ 2 + z˙ 2 = `2 q˙2
Setzen wir z˙ = `q q˙ in die erste Gleichung ein, erhalten wir x˙ 2 = `2 (1 − q 2 )q˙2
q
oder dx = ∓` 1 − q 2 dq.
Substituieren wir schließlich q = cos φ, dq = − sin φ dφ, so folgt dx = ±` sin2 φ dφ = ± 21 `(1 − cos 2φ)dφ und x = (±) 21 `(φ − 12 sin 2φ). Zusammen mit z = 21 `q 2 = Parameterdarstellung
1 ` cos2 2
` x = (2φ − sin 2φ), 4
2.5
+ cos 2φ) erhalten wir also die
` z = (1 + cos 2φ), 4
Zur Geometrie der Zykloide
0 π/3 2π/3 π Die Figur illustriert die Lage der Punkte,4π/3 die 5π/3 Rollwinkeln 2φ = nπ/3 entsprechen. 2π
4
4z/l
einer Zykloide, die beim Abrollen des Kreises x2 + z 2 = (`/4)2 an der Geraden z = `/2 entsteht (siehe Skizze, Rollwinkel 2φ; die Gleichgewichtslage q = 0 entspricht 2φ = π). Im Mechaniklehrbuch vonSommerfeld (Theor. Physik. Bd. 1, S. 84) ist beschrieben, wie Huygens eine solche F¨ uhrung bei der Konstruktion isochroner Pendeluhren realisiert hat.
1 `(1 4
φ =
2 2φ
0 0
2
4x/l
4
6
Geschwindigkeitsabh¨ angige Kr¨ afte
Unter der Voraussetzung, daß sich alle generalisierten Kr¨afte in der Form Qk = −
∂V ∂qk
aus einem Potential herleiten lassen, konnten wir die Lagrangeschen Bewegungsgleichungen aus einer Lagrangefunktion L = T − V gewinnen. Wir erhalten die selben Gleichungen etwas allgemeiner aus der Lagrangefunktion L=T −U, wenn sich die generalisierten Kr¨afte gem¨aß 48
(110)
Qk =
∂U d ∂U − dt ∂ q˙k ∂qk
(111)
aus einem generalisierten Potential U (q1 , . . . qf , q˙1 , . . . q˙f , t) gewinnen lassen. Dieser Zusammenhang ist gleichbedeutend mit Fi =
d ∂U ∂U − , dt ∂ x˙ i ∂xi
(112)
denn dann wird X
Qk =
i
∂xi X d ∂U ∂xi ∂U ∂xi Fi = − ∂qk dt ∂ x˙ i ∂qk ∂xi ∂qk i
!
,
und wegen ∂xi /∂qk = ∂ x˙ i /∂ q˙k [vgl. Gl. (104)] folgt Qk =
X i
d ∂U ∂ x˙ i ∂U ∂xi − dt ∂ x˙ i ∂ q˙k ∂xi ∂qk
!
=
d ∂U ∂U − . dt ∂ q˙k ∂qk
Diese spitzfindige Verallgemeinerung des Lagrangeschen Formalismus k¨onnte als akademische Spielerei abgetan werden, wenn sie nicht eine fundamental wichtige Anwendung bes¨aße: Das elektromagnetische Feld mit der geschwindigkeitsabh¨angigen Lorentzkraft F = e(E + v × B) .
(113)
Um diese Kraft in der gew¨ unschten Form notieren zu k¨onnen, m¨ ussen wir aus der 10 Elektrodynamik die allgemeine Darstellung E = −∇Φ −
∂ A; ∂t
B=∇×A
(114)
der Felder E und B durch “Potentiale” Φ und A u ¨bernehmen. Damit wird "
#
∂A F = −e ∇Φ + − v × (∇ × A) . ∂t Den letzten Term formen wir nach dem Entwicklungssatz um: v × (∇ × A) = ∇(v · A) − v·∇A . 10
Zur Erinnerung: B = rotA folgt aus divB = 0. Zur induzierten Feldst¨ arke −∂A/∂t vgl. das “Induktionsgesetz” rotE = −∂B/∂t.
49
Ber¨ ucksichtigen wir außerdem dA ∂A + v·∇A = , ∂t dt so erhalten wir "
#
dA F = −e ∇Φ + − ∇(v · A) dt # " d d = −e ∇(Φ − v · A) + v·A dt dv " # d d = −e ∇(Φ − v · A) − (Φ − v · A) dt dv Die letzte Umformung gilt, da Φ nicht von v abh¨angt. Mit U (r, v, t) = eΦ(r, t) − ev · A(r, t)
(115)
¨ gilt also in Ubereinstimmung mit (112) Fi =
∂U d ∂U − . dt ∂vi ∂xi
Damit erhalten wir die Bewegungsgleichungen im elektromagnetischen Feld aus einer Lagrangefunction L = T − eΦ + ev · A .
(116)
Im Gegensatz zur Behandlung im Abschnitt 1.7 ist hier die volle Zeitabh¨angigkeit der Felder zugelassen, es fehlt allerdings die Strahlungsd¨ampfung. Eine andere Gruppe von geschwindigkeitsabh¨angigen Kr¨aften bilden idealisierte Reibungskr¨ afte. Diese k¨onnen im allgemeinen nicht sinnvoll durch eine verallgemeinerte Lagrangefunktion erfaßt werden. Es steht uns aber nat¨ urlich frei, solche Kr¨afte — wie beliebige weitere Kr¨afte — zus¨atzlich zu den Kr¨aften, die wir aus einem generalisierten Potential ableiten, in den Lagrangeformalismus einzubringen: Schreiben wir Qk =
d ∂U ∂U ˜k , − +Q dt ∂ q˙k ∂qk
(117)
so erhalten wir die Lagrangeschen Bewegungsgleichungen ∂L d ∂L ˜k . − =Q dt ∂ q˙k ∂qk 50
(118)
Ein h¨aufig benutzter Ansatz nimmt einen linearen Zusammenhang Ri = −ai vi
(119)
zwischen den Reibungskr¨aften Ri und den Geschwindigkeiten vi an. In diesem Fall k¨onnen wir mit einer Dissipationsfunktion11 F=
1X 2 ai vi 2 i
schreiben Ri = −
(120)
∂F . ∂vi
F¨ ur die generalisierte Reibungskraft erh¨alt man dann ˜k = Q
X i
Ri
X ∂F ∂ x˙ i X ∂F ∂vi ∂xi =− =− , ∂qk i ∂vi ∂ q˙k i ∂vi ∂ q˙k
wobei wir wieder von Gl. (104) Gebrauch gemacht haben. Wenden wir schließlich noch die Kettenregel an, so folgt ˜ k = − ∂F . Q ∂ q˙k
2.6
(121)
Die Methode der Lagrangeschen Multiplikatoren
Wir wollen eine alternative Methode zur L¨osung der Bewegungsgleichungen mit Nebenbedingungen behandeln, die es auch erlaubt, eine einfache Klasse anholonomer Zwangbedingungen zu erfassen. Obwohl das bei dieser Methode grunds¨atzlich nicht erforderlich ist, nehmen wir an, daß unser System durch einen Satz q1 , . . . qm generalisierter Koordinaten12 beschrieben wird. Diese Koordinaten seien jedoch nicht unabh¨angig, sondern einer Zwangsbedingung f (q1 , . . . , qm , t) = 0 unterworfen. Die Gleichung f = 0 beschreibt eine Hyperfl¨ache im m–dimensionalen q–Raum. Virtuelle Verr¨ uckungen m¨ ussen in dieser Hyperfl¨ache ausgef¨ urt werden: X ∂f δqk = 0 . δf = ∇q f · δq = k ∂qk 11 12
lat. dissipo = zerstreuen, verteilen, vergeuden Darin mag ein Teil der Zwangsbedingungen bereits ber¨ ucksichtigt sein, also m ≤ 3n.
51
δq muß also senkrecht auf der Fl¨achennormalen stehen, und die Richtung der Fl¨achennormalen ist durch die Richtung des Gradienten ∇q f gegeben. Wir gehen nun wieder von dem Postulat aus, daß die Zwangskraft bei virtuellen Verr¨ uckungen keine Arbeit leistet oder — anders ausgedr¨ uckt — senkrecht auf der beschr¨ankenden Hyperfl¨ache steht. Dann ist die (generalisierte) Zwangskraft ˆ also parallel zum Gradienten und wir k¨onnen schreiben Q ˆ = λ(q, t) ∇q f (q, t) Q oder
ˆ k = λ ∂f . Q ∂qk Ehe wir Bewegungsgleichungen mit dieser Zwangskraft formulieren, u ¨berlegen wir zwei einfache Verallgemeinerungen: Erstens k¨onnen wir sofort mehrere Beschr¨ankungsgleichungen ber¨ ucksichtigen und diese durch einen Index i, u ¨ber den wir anschließend summieren, kennzeichnen. Zweitens ist es f¨ ur unserer Formulierung offenbar gar nicht wichtig, daß die Hyperfl¨ache fi = 0 als Ganzes (d.h. holonom) vorgegeben ist, denn wir haben nur von der lokalen Beschreibung der Tangentialfl¨ache Gebrauch gemacht. Solche lokalen Tangentialfl¨achen werden aber auch durch m¨oglicherweise anholonome (also nicht integrable13 ) Zwangsbedingungen der Form
ai (q, t) · dq + ait dt =
X
aik (q1 , . . . qn , t)dqk + ait dt = 0 (i = 1, . . . s)
(122)
k
definiert. Dabei u ¨bernehmen die Koeffizienten aik die Rolle der partiellen Ableitungen ∂fi /∂qk . Wir gehen also von (122) aus und beschreiben die Zwangskraft durch den Ansatz ˆk = Q
s X
λi aik
(k = 1, . . . m)
(123)
i=1
mit noch unbekannten “Lagrangeschen Multiplikatoren” λi . Diese Multiplikato¨ ren sind zun¨achst Funktionen von q1 , . . . qn und t. Uber den Ablauf der Bewegung k¨onnen sie aber auch als Funktionen von t allein aufgefaßt werden. Mit diesem Ansatz gehen wir in das d’Alembertsche Prinzip m X
k=1 13
(
)
d ∂L ∂L ˆ k δqk = 0 − −Q dt ∂ q˙k ∂qk
Die Bedingungen sind integrablel, wenn ∂aik /∂ql = ∂ail /∂qk und ∂ait /∂qk = ∂aik /∂t gilt.
52
ein. Nun d¨ urfen die δqk zun¨achst eigentlich nicht frei gew¨ahlt werden. Aus physikalischer Sicht k¨onnen wir jedoch argumentieren, daß wir die Zwangsbedingungen gar nicht explizit zu beachten brauchen, wenn wir von vornherein die entsprechenden Zwangskr¨afte ber¨ ucksichtigen. Vom mathematisch formalen Standpunkt k¨onnen wir die s unbekannten Koeffizienten λi so w¨ahlen, daß s Klammern im d’Alembertschen Prinzip verschwinden. Die restlichen m − s Variationen sind dann frei. In jedem Fall erhalten wir damit die m Bewegungsgleichungen s X ∂L d ∂L − = λi aik dt ∂ q˙k ∂qk i=1
(k = 1, . . . m) .
(124)
Zusammen mit den s Zwangsbedingungen (122) stellen sie ein System von m + s Differentialgleichungen zur Bestimmung der m + s unbekannten Funktionen q1 (t), . . . qm (t); λ1 (t), . . . λs (t) dar. Im Falle holonomer Zwangsbedingungen ist der Nachteil dieser Methode offenbar: Statt eines Problems mit f = m − s Unbekannten haben wir ein Problem mit m + s Unbekannten zu l¨osen. Daf¨ ur sind wir in der Lage, anholonome Bedingungen der Form (122) zu ber¨ ucksichtigen. Außerdem werden die Zwangskr¨afte bei dieser Methode explizit mitberechnet. Benutzen wir speziell kartesische Koordinaten xk , erhalten wir die Bewegungsgleichungen mk x¨k = Fke +
s X
λi aik ,
(125)
i=1
die auch als “Lagrangesche Gleichungen erster
14
Art” bezeichnet werden.
Beispiel: Die schiefe Ebene (vgl. S. 40, 41) Wir benutzen kartesische Koordinaten x, z. Die a¨ußeren Kr¨afte sind durch Fxe = 0 und Fze = −mg oder durch das Potential V = mgz gegeben. Die (in diesem Fall nat¨ urlich holonome) Zwangsbedingung schreiben wir in der differentiellen Form dz = −dx tan α oder dx tan α + dz = 0 . Mit der Lagrangefunktion L=
m 2 (x˙ + z˙ 2 ) − mgz 2
14
Die Lagrangegleichungen der vorigen Abschnitte werden auch Lagrangegleichungen zweiter Art oder allgemeine Lagrangegleichungen genannt.
53
und den Gln. (124) oder ¨aquivalent mit den Gln. (125) folgen dann die Bewegungsgleichungen m¨ x = λ tan α m¨ z = −mg + λ . Wir l¨osen die zweite Gleichung nach λ auf und setzen dies in die erste ein: m¨ x = tan α(m¨ z + mg) . Aus der Zwangsbedingung entnehmen wir außerdem z¨ = −¨ x tan α und erhalten m¨ x(1 + tan2 α) = mg tan α oder nach der gleichen Umformung wie auf S. 41 x¨ = g sin α cos α . Dies ist die fertige Bewegungsgleichung f¨ ur x(t) (L¨osung: siehe S. 41). z(t) erh¨alt man daraus (z.B.) u ¨ber die Zwangsbedingung. Mit der ersten Bewegungsgleichung finden wir außerdem λ = mg cos2 α , und daraus ergeben sich die Zwangskr¨afte Zx = λ tan α = mg sin α cos α
und
Zz = λ = mg cos2 α .
(Interpretation: Die Komponente mg cos α der Schwerkraft erscheint als Zwangskraft senkrecht zur schiefen Ebene. Zx und Zz sind wiederum die Komponenten dieser Zwangskraft.)
2.7
Berechnung von Zwangskr¨ aften
Wenn es auch unser Bestreben war, Zwangskr¨afte aus der Formulierung der Bewegungsgleichungen zu eliminieren, so w¨ unscht man doch gelegentlich, diese Zwangskr¨afte zu berechnen. Beispielsweise k¨onnte es ratsam sein, die Zwangskr¨afte mit der Belastbarkeit einer F¨ uhrung zu vergleichen. Mit den Lagrangeschen Multiplikatoren haben wir bereits eine Methode zur Berechnung der Zwangskr¨afte kennengelernt. Im Falle holonomer Zwangsbedingungen ist diese Methode jedoch viel zu schwerf¨allig und umst¨andlich. Wir geben daher einen bequemeren Weg an, der von der physikalischen Interpretation ausgeht: Wir beschreiben unser System von f Freiheitsgraden mit der Lagrangefunktion L(q1 , . . . qf , q˙1 , . . . q˙f , t) und l¨osen die Lagrangeschen Bewegungsgleichungen 54
∂L d ∂L − =0 dt ∂ q˙k ∂qk
(k = 1, . . . f ) .
(126)
Hierbei treten die Zwangskr¨afte nicht in Erscheinung. Dann bilden wir mit zus¨atzlichen Koordinaten qf +1 , . . . qm (f < m ≤ 3n) eine erweiterte Lagrangefunktion ˆ 1 , . . . qm , q˙1 , . . . q˙m , t) . L(q Wir denken uns nun wieder die Zwangsbedingungen durch die entsprechen (geneˆ k ersetzt. Dann gelten im erweiterten System die Lagranralisierten) Kr¨afte Q gegleichungen ˆ ˆ ∂L d ∂L ˆk − =Q dt ∂ q˙k ∂qk
(k = 1, . . . m)
(127)
Diese Lagrangegleichungen15 benutzen wir nicht zur L¨osung des Bewegungsproblems, denn das ist ja bereits gel¨ost! Vielmehr setzen wir hierin die L¨osung q1 , . . . qf der Bewegungsgleichungen (126) und die (m − f ) Zwangsbedingungen ein und erhalten damit explizit die interessierenden generalisierten Zwangskr¨afte Qk . Als Beispiel betrachten wir wieder die schiefe Ebene des vorigen Abschnitts. Wir w¨ahlen zun¨achst x als generalisierte Koordinate und erhalten aus der Lagrangefunktion m L(x, x) ˙ = x˙ 2 (1 + tan2 α) + mgx tan α 2 die Bewegungsgleichungen m¨ x(1 + tan2 α) = mg tan α oder x¨ = g sin α cos α . Nun f¨ uhren wir z als zus¨atzliche Koordinate ein und bilden die erweiterte Lagrangefunktion m ˆ z, x, L(x, ˙ z) ˙ = (x˙ 2 + z˙ 2 ) − mgz . 2 Daraus erhalten wir die wir die Lagrangegleichungen ˆx m¨ x = Q ˆz . m¨ z + mg = Q 15 Beachte, daß die Gln. (127) auch f¨ ur k ≤ f von den Gln. (126) verschieden sind und Zwangskr¨ afte enthalten!
55
Zusammen mit der Bewegungsgleichung und der Zwangsbedingung z¨ = −¨ x tan α erhalten wir daraus die Zwangskr¨afte ˆ x = mg sin α cos α Q ˆ z = −m¨ Q x tan α + mg = mg(1 − sin2 α) = mg cos2 α . Beachte, daß wir bei der Verwendung generalisierter Koordinaten qk die Zwangsˆ k i.a. in der entsprechend generalisierten Form erhalten. Falls erw¨ kr¨afte Q unscht, k¨onnen wir daraus gem¨aß X ˆ k ∂qk Zi = Q ∂xi k die nicht generalisierten Zwangskr¨afte berechnen. In unserem Beispiel haben wir jedoch von vornherein kartesiche Koordinaten x und z benutzt, und daher gilt ˆ x = Zx Q
2.8
und
ˆ z = Zz . Q
Zyklische Koordinaten, Symmetrien und Erhaltungss¨ atze
Wenn die Lagragefunktion L(q1 , . . . qf , q˙1 , . . . q˙f , t) von einer Koordinate qk gar nicht abh¨angt (wohl aber von q˙k !), so heißt diese Koordinate zyklisch16 . F¨ ur eine zyklische Koordinate erhalten wir die Lagrangegleichung d ∂L = 0. dt ∂ q˙k Um den entsprechenden Erhaltungssatz pr¨agnant formulieren zu k¨onnen, f¨ uhren wir allgemein (also nicht nur f¨ ur zyklische Koordinaten) durch pk =
∂L ∂ q˙k
(128)
den “zur Koordinate qk konjugierten generalisierten Impuls” pk ein. Der Name wird f¨ ur freie Teilchen ohne Magnetfeld unmittelbar verst¨andlich, wir haben dann n¨amlich X mi x˙ 2i − V (xj ) L=T −V = i
und erhalten mit pk =
∂L = mk x˙ k ∂ x˙ k
16
Der Name stammt von der Winkelkordinate bei Kreisbewegungen [griech. κυκλoς (kyklos) = Kreis].
56
den altbekannten Impuls. Wir weisen jedoch mit Nachdruck darauf hin, daß im allgemeinen pk vom Impuls, der in Newtons Lex secunda steht, verschieden ist. Betrachten wir beispielsweise ein geladenes Teilchen im elektromagnetischen Feld, so folgt aus X mX 2 x˙ i Ai L= x˙ i − eΦ + e 2 i i der generalisierte Impuls
pk = mx˙ k + eAk
oder p = mv + eA .
F¨ ur generalisierte Koordinaten qk , die nicht die Dimension einer L¨ange haben, hat pk nicht einmal die Dimension eines Impulses. Der zu einer Winkelkoordinate ϕ konjugierte Impuls pϕ ist beispielsweise ein Drehimpuls (s.u.). Aus der Definition von pk folgt, daß Produkte pk qk in jedem Fall die Dimension einer Wirkung, also Energie × Zeit, haben. Wir kehren nun zu den zyklischen Variablen zur¨ uck und formulieren den allgemeinen Erhaltungssatz • Der zu einer zyklischen Koordinate qk konjugierte generalisierte Impuls pk bleibt bei der Bewegung erhalten. Diese Formulierung stellt einen engen Zusammenhang zwischen Erhaltungss¨atzen und Symmetrieeigenschaften her: Ist die Koordinate qk zyklisch, so ist die Lagrangefunktion invariant gegen Ver¨anderungen von qk , und diese Invarianz begr¨ undet einen Erhaltungssatz, n¨amlich den des konjugierten Impulses pk . Ein kr¨aftefreies System ist invariant gegen Translationen, und hieraus folgt der Impulserhaltungssatz. Ebenso ergibt sich der Drehimpulserhaltungssatz aus der Rotationssymmetrie eines Systems, auf das kein Drehmoment wirkt. Wir wollen diese intuitiv formulierten Zusammenh¨ange gleich etwas genauer darlegen. Zuvor weisen wir aber darauf hin, daß unser neuer Erhaltungssatz allgemeiner ist als die fr¨ uher formulierten S¨atze der Impuls– und Drehimpulserhaltung. Betrachten wir etwa die Bewegung eines geladenen Teilchens im konstanten Magnetfeld B = Bez , so ist diese Bewegung nicht kr¨aftefrei und wir k¨onnen keinen Impulserhaltungssatz in x– oder y–Richtung formulieren. Mit V = const und der speziellen Darstellung A = Bxey wird dagegen die Ortskoordinate y zyklisch, und damit folgt, daß der generalisierte Impuls py = my˙ + eAy = my˙ + eBx bei der Bewegung konstant bleibt17 . 17
Aus den Bewegungsgleichungen finden wir unabh¨angig von der speziellen Wahl von A die beiden Invarianten my+eBx ˙ und mx−eBy. ˙ Dies sind jedoch nicht die generalisierten Impulse p y und px . F¨ ur A = αBxey −(1−α)Byex wird n¨ amlich py = my˙ +αBx und px = mx˙ +(1−α)By.
57
Um nun den Zusammenhang zwischen Impulserhaltung und Translationsinvarianz genauer zu fassen, betrachten wir einen Massenpunkt mit der Lagrangefunktion m L(r, r˙ ) = r˙ 2 − V (r) . 2 Die Aussage “L ist invariant gegen eine Translation in z–Richtung” heißt mathematisch, daß L0 = L gilt, wenn wir r durch r0 = r + δr mit δr = ez δz (δz → 0) ersetzen. Da die Geschwindigkeit durch die Translation nicht ge¨andert wird, gilt ∂L δz . ∂z L ist also invariant gegen eine Translation in z–Richtung, wenn L0 − L = δL =
∂L ∂V =− = Fz = 0 ∂z ∂z gilt oder wenn keine Kraft in z–Richtung wirkt. Als Folge dieser Invarianz bleibt der Impuls ∂L = mz˙ pz = ∂ z˙ ¨ erhalten. Die Ubertragung dieser Betrachtung auf eine beliebige Richtung und auf ein System von Massenpunkten ist trivial. Besteht Translationsinvarianz f¨ ur alle Richtungen, so ist der vektorielle Impuls konstant. Wir wollen eine ¨ahnliche Betrachtung auch f¨ ur den Drehimpulssatz durchf¨ uhren. Dazu nehmen wir an, daß die Lagrangefunktion L = T −V eines Massenpunkts invariant gegen Drehungen um die z–Achse ist. Eine infinitesimale Drehung um ¨ den Winkel δϕ um die z–Achse erzeugt eine Anderung δr = eϕ δϕ = ez × r δϕ (vgl. S. 24). Da sich T = mv2 /2 bei einer Drehung nicht ¨andert, folgt dV · δr = F · (ez × r) δϕ dr = ez · (r × F) δϕ = ez · M δϕ = Mz δϕ .
L0 − L = δL = −δV = −
L ist also invariant gegen Drehungen um die z–Achse, wenn die z–Komponente des Drehmoments M verschwindet. Den entsprechenden Erhaltungssatz erkennen wir, wenn wir Zylinderkoordinaten (r, ϕ, z) benutzen und m L = (r˙ 2 + r 2 ϕ˙ 2 + z˙ 2 ) − V 2 schreiben. Aus ∂L/∂ϕ = 0 folgt dann die Erhaltungsgr¨oße pϕ =
∂L = mr 2 ϕ˙ = mrvϕ = m(r × v)z = const , ∂ ϕ˙
also die Erhaltung der z–Komponente des Drehimpulses. Mit einem gewissen Pathos k¨onnen wir also formulieren 58
• Die Impulserhaltung ist eine Folge der Homogenit¨at des Raumes. • Die Drehimpulserhaltung ist eine Folge der Isotropie des Raumes. Unter diesem Gesichtspunkt fehlt uns eine Konsequenz der Homogenit¨at der Zeit. ¨ Wir erwarten n¨amlich aus relativistischen Gr¨ unden eine gewisse Aquivalenz von Raum und Zeit. Allerdings ist die Zeit in unserem Formalismus keine generalisierte Koordinate, sondern ein freier Parameter. Folglich ist ihr auch kein generalisierter Impuls zugeordnet. Wir fragen trotzdem nach m¨oglichen Folgen einer Invarianz der Lagrangefunktion gegen eine Zeitverschiebung, die durch ∂L/∂t = 0 gekennzeichnet ist. Dazu rechnen wir !
dL X ∂L ∂L ∂L = q˙k + q¨k + dt ∂qk ∂ q˙k ∂t k und setzen
∂L = pk ∂ q˙k
und
∂L d ∂L = = p˙ k ∂qk dt ∂ q˙k
ein. Damit folgt ∂L dL dL X d X pk q˙k . = − (p˙ k q˙k + pk q¨k ) = − ∂t dt dt dt k k Wir finden also in der Tat einen weiteren Erhaltungssatz: • H¨angt die Lagrangefunktion nicht explizit von der Zeit ab, so bleibt die Gr¨oße X pk q˙k − L (129) H= k
bei der Bewegung erhalten. H heißt die Hamiltonfunktion (s.u.) des Systems. Wenn wir wieder freie Teilchen betrachten und kartesische Koordinaten benutzen, so haben wir L=T −V =
1X mi x˙ 2i − V . 2 i
Also wird pk = mk x˙ k und folglich H=
X k
mk x˙ 2k − L = T + V = E .
Unserer Aufz¨ahlung eherner Gesetze k¨onnen wir also hinzuf¨ ugen: • Die Energieerhaltung ist eine Folge der Homogenit¨at der Zeit. 59
Wir merken jedoch an, daß in dieser markigen Formulierung nichts neues gegen¨ uber dem altbekannten Energiesatz enthalten ist — wohl aber in der obigen Formulierung mit der Hamiltonfunktion! Wir zeigen das am Beispiel eines Massenpunktes, der reibungsfrei auf einer Stange (x) gleitet, die mit konstanter Winkelgeschwindigkeit ω um eine senkrechte Achse (z) rotiert. Die Lagrangefunktion L=T =
m 2 (x˙ + x2 ω 2 ) 2
dieses Systems h¨angt nicht explizit von der Zeit ab. Mit px = mx˙ folgt also H = mx˙ 2 −
m m 2 (x˙ + x2 ω 2 ) = (x˙ 2 − x2 ω 2 ) = T − mx2 ω 2 = const. 2 2
Erhaltungsgr¨oße ist in diesem Fall also nicht die Energie E = T , sondern H = E − mx2 ω 2 . Und warum ist die Energie in diesem Beispiel nicht konstant? Weil Zwangskr¨afte bei rheonomen Zwangsbedingungen Arbeit leisten. Und was ist an H=
m 2 m 2 2 x˙ − x ω 2 2
anschaulich? Die (Pseudo–)Energie des ¨aquivalenten Problems im rotierenden Koordinatensystem mit dem “Potential” m2 x2 ω 2 der Fliehkraft18 mxω 2 . (Vgl. S. 26, g = geff auf der rotierenden Erde.) Das Beispiel l¨aßt uns noch etwas unbefriedigt: Wann ist denn nun die Hamiltonfunktion die Energie und wann nicht? Und was ist die Hamiltonfunktion, wenn sie nicht die Energie ist? Um das zu untersuchen rechnen wir von den generalisierten Koordinaten qk in die kartesischen Koordinaten xi = hi (q1 , . . . qf , t) zur¨ uck und bilden x˙ i =
X
hik q˙k + hit
mit hik =
k
∂hi ∂qk
und hit =
∂hi . ∂t
Damit wird T =
X i
18
X mi X hik hit q˙k + h2it = T2 + T1 + T0 . hik hil q˙k q˙l + 2 2 k,l k
Beachte, daß dieses effektive Potential f¨ ur ω = const und l =const verschieden aussieht, vgl. Gl. (38)!
60
Dabei bezeichnet Tν den Anteil der kinetischen Energie, der homogen vom Grade ν (s.u.) in den generalisierten Geschwindigkeiten q˙k ist. Entsprechend l¨aßt sich der “magnetische Anteil” X M= ei x˙ i Ai i
der Lagrangefunktion in zwei homogene zwei Anteile M1 undM0 zerlegen. Das Potential V h¨angt nicht von den Geschwindigkeiten ab, ist also homogen vom Grade Null in den q˙k . Nach diesen Vor¨ uberlegungen bilden wir nun die Lagrangefunktion L = T − V + M und stellen fest, daß sie offenbar in drei Anteile L L2 L1 L0
= = = =
L2 + L1 + L0 mit T2 T1 + M 1 T0 + M 0 − V ,
zerf¨allt, wobei die Lν homogen vom Grade ν in den generalisierten Geschwindigkeiten sind. Wir gehen nun etwas genauer auf den Begriff der Homogenit¨at ein: Eine Funktion f (x) heißt homogen vom Grade ν, wenn gilt f (λx) = λν f (x) .
(130)
Differenziern wir diese Definitionsgleichung nach λ und setzen anschließend λ = 1, so erhalten wir die Eulersche Homogenit¨atsrelation X i
xi
∂f = νf . ∂xi
(131)
Nach diesem Exkurs kehren wir zur Bedeutung der Hamiltonfunktion H=
X k
pk q˙k − L =
X
∂L q˙k − L ∂ q˙k
zur¨ uck: Setzen Wir L = L2 + L1 + L0 ein und beachten, daß nach (131) X
∂Lν q˙k = νLν ∂ q˙k
gilt , so folgt H = 2L2 + 1L1 + 0L0 − (L2 + L1 + L0 ) oder (mit der obigen Spezifizierung der Lν ) H = L 2 − L 0 = T2 + V − T 0 − M 0 . 61
(132)
Damit ist die obige Frage nach dem Zusammenhang und dem Unterschied von Hamiltonfunktion und Energie klar beantwortet: H ist die Gesamtenergie T +V , wenn T1 , T0 und M0 verschwinden, das heißt, wenn die generalisierten Koordinaten nicht explizit von der Zeit abh¨angen. Eine explizite Zeitabh¨angikeit der generalisierten Koordinaten kommt i.a. durch rheonome Zwangsbedingungen zustande. Als Beispiel betrachten wir noch einmal den Massenpunkt auf der rotierenden Stange. Hier haben wir19 m m L = (x˙ 2 + x2 ω 2 ), also L2 = x˙ 2 und L0 = x2 ω 2 . 2 2 Damit erhalten wir sofort m H = L2 − L0 = (x˙ 2 − x2 ω 2 ) . 2 Wie in diesem Beispiel l¨aßt sich −L0 h¨aufig als Pseudopotential interpretieren. H = const ist dann die (Pseudo–)Energie in dem entsprechenden Nicht– Inertialsystem. Wir bemerken, daß die Gr¨oße H u ¨berhaupt nicht von L1 = T1 + M1 abh¨angt, insbesondere also im Fall skleronomer Zwangsbedingungen nicht von M . Damit folgt, daß der Energieerhaltungssatz auch in Anwesenheit zeitunabh¨angiger Magnetfelder gilt [vgl. Gl. (49)].
2.9
Routhsches Verfahren und kanonische Gleichungen
Wir befassen uns nun mit der Frage, wie wir zyklische Koordinaten mit ihren Erhaltungss¨atzen m¨oglichst ¨okonomisch ausnutzen. Dazu nehmen wir an, daß unsere Lagrangefunktion die Form L(q2 , . . . qf , q˙1 , . . . q˙f , t)
(133)
hat, daß q1 also zyklisch ist. Zu q1 haben wir das Integral ∂L = p1 = const . ∂ q˙1
(134)
Die u ¨ brigen Lagrangegleichungen d ∂L ∂L − =0 dt ∂ q˙k ∂qk 19
(k = 2, . . . , f )
(135)
Beachte die wichtige Unterscheidung zwischen generalisierten Geschwingkeiten q˙k (hier x) ˙ und anderen Geschwindigkeiten (hier ωx), die auf den Zwangsbedingungen beruhen!
62
enthalten zwar noch q˙1 , wir k¨onnen jedoch Gl. (134) nach q˙1 = g(q2 , . . . qf , q˙2 , . . . q˙f , p1 , t)
(136)
aufl¨osen und in die Bewegungsgleichungen (135) einsetzen. Dort tritt dann weder die Koordinate q1 noch die Geschwindigkeit q˙1 explizit in Erscheinung: Wir haben das Gesamtproblem also in die separaten Probleme der L¨osung der Gln. (135) (Ordnung 2(f − 1)) und der Integration der Gl. (136) (Ordnung 1) aufgespalten. Falsch w¨are es, die Geschwindigkeit q˙1 gem¨aß Gl. (136) sofort in der Lagrangefunktion (134) zu eliminieren. Denn L ist stets als Funktion der generalisierten Koordinaten und Geschwindigkeiten und nicht der generasierten Impulse zu formulieren! Wir wollen uns das an einem Beispiel klarmachen und betrachten das Zentralkraftproblem in der Ebene. In ebenen Polarkoordinaten haben wir L=
m 2 (r˙ + r 2 ϕ˙ 2 ) − V (r) . 2
Die Winkelkoordinate ist zyklisch und liefert den Erhaltungssatz ∂L = mr 2 ϕ˙ = pϕ = const ∂ ϕ˙ des Drehimpulses (Fl¨achensatz, vgl. S. 14, 18). F¨ ur die radiale Koordinate erhalten wir die Bewegungsgleichung m¨ r − mr ϕ˙ 2 +
dV = 0. dr
In diese Bewegungsgleichung k¨onnen wir ϕ˙ =
pϕ mr 2
einsetzen und erhalten die separate Bewegungsgleichung20 m¨ r−
p2ϕ dV + =0 3 mr dr
f¨ ur r(t) allein. Nach ihrer L¨osung kann man ϕ(t) durch Integration des Fl¨achensatzes berechnen. Wenn wir dagegen versuchen, die Geschwindigkeit q˙1 gem¨aß Gl. (136) sofort in der Lagrangefunktion (134) zu eliminieren, erhalten wir aus 2 ˆ = m (r˙ 2 + pϕ ) − V (r) L 2 m2 r 2 20
Nach Multiplikation mit r˙ l¨ aßt sie sich zum Energiesatz (38) integrieren.
63
die offenbar falsche Bewegungsgleichung m¨ r ⊕
p2ϕ mr 3
+
dV dr
= 0.
Es gibt jedoch eine systematische M¨oglichkeit, q˙1 von vornherein zu eliminieren: Das Routhsche Verfahren. Dazu geht geht man von einer modifizierten Lagrangefunktion oder Routhfunktion R1 = L − p1 q˙1
(137)
aus. R1 h¨angt damit — so scheint es zun¨achst — von dem erweiterten Variablensatz q2 , . . . qf , q˙1 , . . . q˙f , p1 , t (138) ab. Tats¨achlich h¨angt R1 aber von der Geschwindigkeit q˙1 gar nicht mehr explizit ab, denn wir haben ∂R1 /∂ q˙1 = ∂L/∂ q˙1 − p1 = 0. Gl. (137) vermittelt also eine Transformation, welche die Variable q˙1 durch die neue Variable p1 ersetzt. Diese Konstruktion beruht nicht auf einem gl¨ ucklichen Zufall sondern folgt einem systematischen Weg des Variablenwechsels: Der Legendre–Transformation. Wir erl¨autern das am Beispiel einer Funktion f (x, y) mit dem Differential df = u dx + v dy . W¨ unscht man nun die Variable x durch u = ∂f /∂x zu ersetzen, so bildet man die neue Funktion g = f − ux . Ihr Differential
dg = df − u dx − x du = v dy − x du
zeigt, daß g in der Tat nur von den nat¨ urlichen Variablen y und u abh¨angt21 . Mit der Transformation (137) wird also ein systematischer Wechsel von der Variablen q˙1 zu der neuen Variablen p1 vollzogen. Setzen wir in R1 die Geschwindigkeit q˙1 = g(. . .) nach Gl. (136) ein, so erhalten wir f¨ ur k = 2, . . . , f !
∂L ∂g ∂L ∂L ∂R1 = + − p1 = ∂qk ∂qk ∂ q˙1 ∂qk ∂qk ! ∂L ∂L ∂R1 ∂L ∂g = + − p1 = . ∂ q˙k ∂ q˙k ∂ q˙1 ∂ q˙k ∂ q˙k Damit bleibt die Form der Lagrangegleichungen (mit R1 an Stelle von L) also invariant: d ∂R1 ∂R1 d ∂L ∂L − = − = 0 (k = 2, . . . , f ) . dt ∂ q˙k ∂qk dt ∂ q˙k ∂qk 21
(139)
Von solchen Transformationen wird in der Thermodynamik beim Wechsel der Variablen S und T bzw. V und p reichlich Gebrauch gemacht.
64
Wir u ¨berzeugen uns davon auch wieder an unserem Beispiel der Zentralkraft und rechnen m 2 (r˙ + r 2 ϕ˙ 2 ) − V (r) − pϕ ϕ˙ Rϕ = 2 ! p2 p2ϕ m 2 = r˙ + 2 2 − V (r) − ϕ2 2 mr mr 2 p m 2 = r˙ ϕ 2 − V (r) . 2 2mr Aus der modifizierten Lagrangefunktion Rϕ folgt dann gem¨aß Gl. (139) die korrekte Bewegungsgleichung m¨ r−
p2ϕ dV + = 0. 3 mr dr
Wir sind damit an einem Punkt angelegt, von dem aus es nur noch zweier kleiner, fast trivialer Schritte zu einer alternativen Formulierung der Bewegungsgleichungen bedarf: (1) Wir k¨onnen diesen Variablenwechsel von q˙1 nach p1 nat¨ urlich auch dann durchf¨ uhren, wenn q1 nicht zyklisch ist. Statt der Gleichung p1 = const haben wir dann die Lagrangegleichung p˙1 =
∂R1 ∂L = . ∂q1 ∂q1
Wir benutzen also f¨ ur k = 2, . . . , f die Variablen qk und q˙k und erhalten die Bewegungsgleichungen (zweiter Ordnung) d ∂R1 ∂R1 − = 0 (k = 2, . . . f ) . dt ∂ q˙k ∂qk F¨ ur k = 1 dagegen ersetzen wir q˙k durch pk und haben die beiden Bewegungsgleichungen erster Ordnung q˙1 = −
∂R1 ∂p1
und p˙ 1 =
∂R1 . ∂q1
(2) Was wir mit der Geschwindigkeit q˙1 gemacht haben, k¨onnen wir mit jeder anderen Geschwindigkeit q˙k , und schließlich auch mit allen Geschwindigkeiten machen. Wir definieren uns also durch die f –fache Legendretransformation R1...f (q1 , . . . qf , p1 , . . . pf , t) = L(q1 , . . . qf , q˙1 , . . . q˙f , t) − 65
f X i=1
pi q˙i
eine “neue Lagrangefunktion” oder Routhfunktion R1...f , in der s¨amtliche Geschwindigkeiten durch Impulse ersetzt sind, und erhalten alle Bewegungsgleichungen in der Form q˙k = −
∂R1...f ∂pk
und p˙ k =
∂R1...f . ∂qk
Die “neue Lagrangefunktion” R1...f ist gar nicht so neu f¨ ur uns, durch Vergleich mit Gl. (129) erkennen wir n¨amlich bis aufs Vorzeichen die Hamiltonfunktion
H(q1 , . . . qf , p1 , . . . pf , t) =
f X i=1
pi q˙i − R(q1 , . . . qf , q˙1 , . . . q˙f , t)
(140)
wieder. Mit der expliziten Anschrift betonen wir zugleich, daß wir die Hamiltonfunktion als Funktion der nat¨ urlichen Variablen q1 , . . . qf , p1 , . . . pf , t auffassen wollen. Generalisierte Geschwindigkeiten d¨ urfen also in der Hamiltonfunktion nicht mehr vorkommen! Aus dieser Hamiltonfunktion erhalten wir die Hamiltonschen Gleichungen oder kanonischen Bewegungsgleichungen22
∂H ∂pk ∂H , = − ∂qk
q˙k =
(141)
p˙ k
(142)
die nicht nur durch ihr hohes Maß an Symmetrie bestechen, sondern auch die Formulierung Newtons in suggestiver Weise verallgemeinern: Der erste Satz (141) stellt den Zusammenhang zwischen (generalisierten) Impulsen und Geschwindigkeiten her, der zweite Satz (142) dr¨ uckt die Impuls¨anderung durch (generalisierte) Kr¨afte und Scheinkr¨afte ∂H/∂qk aus. F¨ ur freie Teilchen im Kraftfeld mit Potential erh¨alt man ja tats¨achlich −
∂H ∂V =− = Fk . ∂xk ∂xk
Im Vergleich mit den Lagrangegleichungen bieten die kanonischen Bewegungsgleichungen also den Vorteil einer bequemeren Elimination zyklischer Koordinaten. Davon abgesehen sind die beiden Formulierungen aber v¨ollig ¨aquivalent und bringen im gegenseitigen Vergleich rechnerisch (s.u.) weder Vor- noch Nachteile. Wir haben ja auch physikalisch nichts Neues eingebracht, sondern nur mathematisch umgeformt. Ein essentieller Vorteil der Hamiltonschen Formulierung wird erst zum Tragen kommen, wenn wir im 6. Kapitel ihre Symmetrie ausnutzen, 22
griech. κανων (kanon) = Richtschnur, Gesetz
66
um die grunds¨atzliche Unterscheidung von Koordinaten und Impulsen fallen zu lassen. Selbstverst¨andlich lassen sich aus der Hamiltonfunktion die selben Erhaltungss¨atze wie aus der Lagrangefunktion ablesen, denn nach Konstruktion gilt ∂H ∂L =− ∂qk ∂qk
und
∂L ∂H =− . ∂t ∂t
(143)
Wir k¨onnen also auch sagen: Eine Koordinate qk ist zyklisch, wenn die Hamiltonfunktion H nicht explizit von qk abh¨angt. Aus Gl. (142) lesen wir dazu ab, daß der zu einer zyklischen Variablen qk konjugierte Impuls pk konstant ist. Entsprechend gilt, daß die Hamiltonfunktion H konstant ist, wenn sie nicht explizit von der Zeit abh¨angt. Rechnerisch folgt das auch sofort aus den kanonischen Gleichungen: !
X ∂H X dH ∂H ∂H − = p˙ k + q˙k = (q˙k p˙ k − p˙ k q˙k ) = 0 . dt ∂t ∂pk ∂qk k k
Praktisch geht man beim Rechnen mit den Hamiltonschen Gleichungen wie folgt vor: 1. Bilde die Lagrangefunktion L und berechne die generalisierten Impulse pk = ∂L/∂ q˙k . 2. Bilde die Hamiltonfunktion gem¨aß H = L2 − L0 [vgl. (132)]
P
i
pi q˙i − L [vgl. (129)] oder H =
3. Ersetze in H gem¨aß 1. alle q˙k durch pk . 4. Bilde die kanonischen Gleichungen. Dabei ist zu beachten, daß der erste Satz (141) keine neue Information liefert: Er l¨ost lediglich den aus pk = ∂L/∂ q˙k bereits bekannten Zusammenhang zwischen den pk und den q˙k nach q˙k auf. Der zweite Satz (142) liefert die eigentlichen Bewegungsgleichungen23 . Wir wollen dieses Verfahren am Beispiel des Zentralkraftproblems in der Ebene (vgl. S. 63) illustrieren: 1. Aus der Lagrangefunktion L = T − V = die generalisierten Impulse pr = 23
∂L = mr˙ ∂ r˙
und
m 2 (r˙ 2
pϕ =
+ r 2 ϕ˙ 2 ) − V (r) bilden wir
∂L = mr 2 ϕ. ˙ ∂ ϕ˙
Diese konstruktionsbedingte Unsymmetrie wird in Kapitel 6 aufgehoben.
67
2. Aus H = L2 −L0 oder aus H = T +V berechnen wir die Hamiltonfunktion zun¨achst in der vorl¨aufigen Form H=
m 2 (r˙ + r 2 ϕ˙ 2 ) ⊕ V (r). 2
3. Wir setzen anschließend r˙ = pr /r und ϕ˙ = pϕ /(mr 2 ) ein und erhalten die endg¨ ultige Hamiltonfunktion H(r, pr , pϕ ) =
p2 p2r + ϕ 2 + V (r). 2m 2mr
4. Daraus folgen die kanonischen Gleichungen r˙ =
pr , m
ϕ˙ =
pϕ , mr 2
p˙ r =
p2ϕ dV − , 3 mr dr
p˙ ϕ = 0 .
Die ersten beiden Gleichungen wiederholen den bereits vorher bekannten Zusammenhang zwischen Geschwindigkeiten und Impulsen. In der zweiten Zeile finden wir die radiale Bewegungsgleichung und die Konstanz des Drehimpulses. Die formale Rechnung ist wesentlich identisch mit der im Lagrangeformalismus. Der Vorteil der kanonischen Behandlung liegt allenfalls darin, daß wir uns um die Ausnutzung der zyklischen Koordinate ϕ gar nicht zu k¨ ummern brauchen. Um die Folgen eines h¨aufigen Fehlers zu verdeutlichen, betrachten wir noch einmal die Bewegung eines geladenen Teilchens im elektromagnetischen Feld mit L=
m 2 v − eΦ(r, t) + v · A(r, t) 2
=⇒
L2 =
m 2 v , L0 = −eΦ . 2
Und so ist es falsch: Die Hamiltonfunktion H = L2 − L0 = mv 2 /2 + eΦ h¨angt gar nicht von A und damit vom Magnetfeld B ab. Insbesondere ist die Bewegung im konstanten Magnetfeld ohne elektrische Felder kr¨aftefrei. Richtig ist dagegen: Wir m¨ ussen die Geschwindigkeit v durch den generalisierten Impuls p = mv + eA ersetzen und erhalten die Hamiltonfunktion H=
1 (p − eA)2 + eΦ , 2m
(144)
die sehr wohl vom Vektorpotential A und damit vom Magnetfeld abh¨angt. Ein konstantes Magnetfeld tr¨agt zwar nicht zum Zahlenwert von H, n¨amlich der Energie, bei (beachte F ⊥ v!), es beeinflußt aber die Abh¨angigkeit der Hamiltonfunktion von ihrer nat¨ urlichen Variablen p.
68
3 3.1
Dynamik des starren K¨ orpers Modell und Koordinaten des starren K¨ orpers
Bisher haben wir nur punktf¨ormige Massen betrachtet. Als idealisiertes Modell f¨ ur ausgedehnte Massenverteilungen f¨ uhren wir nun den Begriff des starren K¨ orpers ein. Wir verstehen darunter ein System von n Massenpunkten (meistens im Limes n → ∞) mit festen Abst¨anden, also mit den Zwangsbedingungen |ri − rj | = dij
(i, j = 1, . . . n) .
(145)
Die Zahl f der Freiheitsgrade des starren K¨orpers l¨aßt sich offenbar nicht ermitteln, indem man die Zahl der Nebenbedingungen von 3n subtrahiert. Denn die n(n − 1)/2 Bedingungen (145) k¨onnen nicht unabh¨angig sein. Wir ermitteln f daher, indem wir das Ger¨ ust aus Massenpunkten schrittweise aufbauen: Der erste Massenpunkt m1 hat drei Freiheitsgrade, die wir beispielsweise durch die drei Komponenten von r1 beschreiben. F¨ ugen wir einen zweiten Massenpunkt m2 hinzu, so ist m2 durch die Zwangsbedingung |r2 − r1 | = d12 an eine Kugeloberfl¨ache um m1 gebunden. Der zweite Massenpunkt bringt also zwei weitere Freiheitsgrade . Als entsprechende Koordinaten k¨onnen wir etwa zwei Polarkoordinaten zur Angabe der Richtung der Verbindungslinie von m1 nach m2 benutzen. Ein dritter Massenpunkt m3 außerhalb dieser Verbindungslinie kann sich wegen der beiden Zwangsbedingungen |r3 − r1 | = d13 und |r3 − r2 | = d23 nur noch auf einem Kreis bewegen. Dem entspricht ein weiterer Freiheitsgrad. Als zugeh¨orige Koordinate k¨onnen wir z.B. einen Winkel w¨ahlen, der die Rotation von m3 um die Achse durch m1 und m2 beschreibt. Bei diesen 3 + 2 + 1 = 6 Freiheitgraden bleibt es beim weiteren Aufbau, denn jeder weitere Massenpunkt ist bereits durch die Festlegung seiner Abst¨ande zu m1 , m2 und m3 fixiert. Im Prinzip k¨onnten wir die bei der obigen Konstruktion verwendeten sechs speziellen Koordinaten zur Beschreibung der Lage des starren K¨orpers benutzen. Eine solche willk¨ urliche Wahl erscheint jedoch weder rational noch ¨okonomisch. Wir wollen stattdessen einen bestimmten Punkt des starren K¨orpers (meist, aber nicht immer, seinen Schwerpunkt) als Koordinatenursprung eines k¨orpereigenen Koordinatensystems auszeichnen und seine Lage durch drei Koordinaten beschreiben. Die restlichen drei Koordinaten dienen zur Festlegung der Orientierung des k¨orpereigenen Koordinatensystems. Bezeichnen wir die Achsen eines raumfesten kartesischen Koordinatensystems mit e1 , e2 und e3 , die des k¨orperfesten Systems mit e01 , e02 und e03 , so bietet es sich
69
zun¨achst an, die Orientierung durch die Richtungskosinus aij = e0i · ej
(i, j = 1, . . . 3)
zu kennzeichnen. Mit ihrer Hilfe erh¨alt man auch sofort die Transformationsgleichungen 3 X
e0i =
aij ej
und ek =
3 X
ajk e0j
(146)
j=1
j=1
zwischen den raumfesten und k¨orpereigenen Basisvektoren. Nach dem selben Schema transformieren sich die Komponenten eines Vektors x=
X
xj e j =
Denn aus den inneren Produkten x · e0i =
X j
xj e0i · ej
X
x0j e0j .
und x · ek =
X j
x0j e0j · ek
lesen wir ab x0i =
X
aij xj
und xk =
ajk x0j .
(147)
j
j
Die Matrix
X
a11 a12 a13 A = a21 a22 a23 a31 a32 a33
ist also nicht nur geeignet, die Orientierung des starren K¨orpers zu beschrei¨ ben, sondern sie erm¨oglicht auch einen bequemen Ubergang vom raumfesten zum k¨orpereigenen Koordinatensystem und umgekehrt. Allerdings eignen sich die neun Richtungskosinus nicht als generalisierte Koordinaten, denn die Orientierung entspricht nur drei Freiheitsgraden. Die Elemente der Matrix A k¨onnen also nicht unabh¨angig sein, und in der Tat finden wir, daß sie durch die drei Orthogonalit¨atsrelationen e0i · e0k =
X
aij akj = 0
(i, k = 1, . . . 3, i 6= k)
j
(148)
und durch die drei Normierungen 2
e0i =
X
a2ij = 1
j
70
(i = 1, . . . 3)
(149)
eingeschr¨ankt sind. Matrizen mit diesen Einschr¨ankungen heißen orthogonal. Unsere orthogonale Matrix A muss sich also durch drei unabh¨angige Parameter (generalisiete Koordinaten) darstellen lassen. F¨ ur eine solche Darstellung verwendet man gern die Eulerschen Winkel φ, θ und ψ, die wir anhand einer Skizze einf¨ uhren:
e3
e3’
e2’
θ
φ
e1
e2
ψ
e1’ Knotenlinie
Ausgangspunkt ist die Knotenlinie, in der sich die e1 –e2 – und die e01 –e02 –Ebene schneiden. Von der Knotenlinie aus gemessen ist e1 durch den Winkel −φ und e01 durch den Winkel ψ charakterisiert. θ ist der Winkel zwischen den beiden ¨ Ebenen und damit der Winkel zwischen der e3 – und der e03 –Achse. Der Ubergang vom raumfesten Koordinatensystem (e1 , e2 , e3 ) zum k¨orpereigenen Koordinaten (e01 , e02 , e03 ) l¨aßt sich damit in drei Schritten vollziehen: Im ersten Schritt drehen wir das Koordinatensystem (e1 , e2 , e3 ) um den Winkel ˜1 in der Knotenlinie liegt. Diese Drehung beschreiben φ um die e3 –Achse, so daß e wir mit den Transformationsgleichungen ~
e2
˜1 = cos φe1 + sin φe2 e ˜2 = − sin φe1 + cos φe2 e ˜ 3 = e3 . e
e2 ~
e1
φ
e1
˜2 , e ˜3 ) um den Winkel θ um die KnotenAls n¨achstes kippen wir das System (˜ e1 , e linie (˜ e1 –Achse). F¨ ur diese Drehung gilt 71
(~) e3
e^ 3
ˆ1 = e ˜1 e ˆ2 = cos θ˜ e e2 + sin θ˜ e3 ˆ3 = − sin θ˜ e e2 + cos θ˜ e3 .
e^ 2 Θ
e~2
ˆ2 , e ˆ3 ) um den Winkel ψ um die e˜3 –Achse und Im letzen Schritt drehen wir (ˆ e1 , e erhalten damit das neue Koordinatensystem
e01 e02 e03
e2’
= cos ψˆ e1 + sin ψˆ e2 = − sin ψˆ e1 + cos ψˆ e2 ˆ3 . = e
e^ 2 e1’ ϕ
e1
Um die drei Schritte bequemer zu notieren, benutzen wir die Matrizenschreibweise
˜1 e1 e ˜ 2 = A 1 e2 e ˜3 e3 e ˆ1 e˜1 e ˆ2 = A2 e˜2 e ˆ3 e˜3 e
ˆ1 e e01 0 ˆ2 e2 = A 3 e 0 ˆ3 e e3
(150)
(151)
(152)
cos φ sin φ 0 A1 = − sin φ cos φ 0 , 0 0 1
mit
1 0 0 A2 = 0 cos θ sin θ , 0 − sin θ cos θ
mit
mit
cos ψ sin ψ 0 A3 = − sin ψ cos ψ 0 . 0 0 1
Hierbei haben wir Basisvektoren als Zeilenvektoren24 notiert. Die Matrizenmultiplikation folgt der Regel ’Zeile × Spalte’ oder genauer: Das Element in der i–ten Zeile und k– ten Spalte der Produktmatrix C=AB ist das innere Produkt cik =
X
aij bjk
j
der i–ten Zeile von A und der k–ten Spalte von B. Mit dieser Regel der Produktbildung wird auch die (nicht kommutative!) Hintereinanderausf¨ uhrung der Einzeltransformationen beschrieben. F¨ ur die Gesamttransformation [vgl. Gl. (146)] 24 Das entspricht gerade der Repr¨ asentation von Vektoren x durch ihre Koordinatenspalten xi , vgl. Gln. (146,147).
72
e1 e01 0 e2 = A e2 e3 e03
bzw.
e01 e1 ∗ 0 e2 = A e2 e03 e3
(153)
erh¨alt man damit nach einiger Rechnung25 A = A 3 A2 A1 =
(154)
cos ψ cos φ − cos θ sin φ sin ψ cos ψ sin φ + cos θ cos φ sin ψ sin θ sin ψ − sin ψ cos φ − cos θ sin φ cos ψ − sin ψ sin φ + cos θ cos φ cos ψ sin θ cos ψ . sin θ sin φ − sin θ cos φ cos θ
Die Matrix A∗ der R¨ uck transformation erh¨alt man f¨ ur orthogonale Transformationen nach (146) einfach durch Transposition, d.h. durch Vertauschung von Zeilen und Spalten oder durch Spiegelung an der Hauptdiagonalen.
Wir haben damit das prinzipielle R¨ ustzeug bereitgestellt, die sechs Freiheitsgrade des starren K¨orpers durch die drei Koordinaten x0 , y0 und z0 des Ursprungs eines k¨orpereigenen Koordinatensystems sowie die drei Eulerschen Winkel φ θ und ψ zu beschreiben. Wegen der Komplexit¨at werden wir diesen systematischen Weg jedoch nach M¨oglichkeit vermeiden. Der Vollst¨andigkeit halber notieren wir uns ¨ abschließend lediglich noch, wie sich die Winkelgeschwindigkeit ω durch die Anderung der Eulerschen Winkel ausdr¨ ucken l¨aßt. Wenn wir uns an die Drehachsen der drei Einzeltransformationen zur¨ uckerinnern, finden wir zun¨achst ˙ 3 + θˆ ˙ e1 + ψe ˙ 0. ω = φe 3
Diese gemischte Darstellung m¨ochten wir auf das k¨orpereigene Koordinatensystem umrechnen. Dazu erinnern wir daran, daß die R¨ uck transformation durch die transponierte Matrix beschrieben wird und lesen aus (153, 154) ab e3 = sin θ sin ψe01 + sin θ cos ψe02 + cos θe03 . Ebenso folgt aus Gl. (152) ˆ1 = cos ψe01 − sin ψe02 . e Damit erhalten wir ˙ 0 ω = (sin θ sin ψ φ˙ + cos ψ θ)e 1 ˙ 0 + (cos θ φ˙ + ψ)e ˙ 0. + (sin θ cos ψ φ˙ − sin ψ θ)e 2 3
(155)
Nat¨ urlich k¨onnten wir ω mit dem selben Rechenaufwand auch im raumfesten System (e1 , e2 , e3 ) darstellen. Dieses spielt — obwohl es im Gegensatz zu (e01 , e02 , e03 ) ein Inertialsystem ist — bei der Behandlung des starren K¨orpers jedoch eine untergeordnete Rolle, da die Massenverteilung nur im k¨orpereigenen System festliegt. 25
Beachte die Reihenfolge der Faktoren!
73
3.2
Das Eulersche Theorem
Wir betrachten die Bewegung eines starren K¨orpers und sehen zun¨achst einmal von der Translation des Ursprungs des k¨orpereigenen Koordinatensystems ab. Dann wird die Orientierung durch eine orthogonale Matrix A(t) beschrieben. Zum Zeitpunkt t = 0 falle das k¨orpereigene mit dem raumfesten Koordinatensystem zusammen, dann gilt also
1 0 0 A(0) = 1 = 0 1 0 . 0 0 1
(156)
Im vorigen Abschnitt haben wir gesehen, daß die Orientierung des K¨orpers zur Zeit t, die durch A(t) repr¨asentiert wird, durch drei Drehungen aus der Anfangslage erzeugt werden kann. Wir wollen nun untersuchen, ob hierzu auch eine einzige Drehung ausreicht. Der mathematische Formalismus zur Beantwortung dieser Frage wird uns gleichzeitig elementare Anschauung zu einem wichtigen abstrakten Kapitel der Mathematik liefern. Woran erkennt man, daß eine orthogonale Transformation A einer Drehung entspricht? Daran, daß Vektoren x, die in Richtung der Drehachse zeigen, durch die Transformation nicht ge¨andert werden: Ax = x . Diese Gleichung stellt einen Spezialfall des Eigenwertproblems (A − λ1)x = 0
(157)
dar, mit dem wir uns nun befassen m¨ ussen. Dabei bezeichnet 1 die Einheitsmatrix, λ heißt Eigenwert und x Eigenvektor der Matrix A. Trivialerweise ist mit x auch jeder gestreckte Vektor αx Eigenvektor von A. Damit aber u ¨berhaupt eine nicht triviale L¨osung von Gl. (157) existiert, muß die “charakteristische Gleichung” det (A − λ1) = 0
(158)
erf¨ ullt sein. Durch eine Induktion, bei der man die Determinante nach der ersten Zeile (oder Spalte) entwickelt, weist man leicht nach, daß die charakteristische Gleichung einer n×n–Matrix auf ein Polynom n–ten Grades in λ f¨ uhrt. L¨osungen der charakteristischen Gleichung k¨onnen daher i.a. komplex sein. Solche L¨osungen sind f¨ ur uns nat¨ urlich nicht interessant. Im Falle ungerader n, also insbesondere in unserem Fall n = 3, besitzt jede Polynomgleichung aber mindestens eine reelle
74
L¨osung λ mit einem nicht trivialen Eigenvektor x. Vektoren, die in die Richtung von x zeigen, behalten also bei einer Transformation mit A ihre Richtung bei. Nun ist es eine Besonderheit der orthogonalen Transformationen, daß sie Skalarprodukte (und damit Entfernungen) invariant lassen26 . Wir k¨onnen den Beweis in pr¨agnanter Form f¨ uhren, wenn wir das Skalarprodukt als Matrizenprodukt von Zeilenvektoren27 und Spaltenvektoren auffassen und uns den trivialen Zusammenhang (AB)∗ = B∗ A∗ (159) klarmachen. Aus x0 = Ax und y0 = Ay folgt dann n¨amlich 0
x0 · y0 = x ∗ y0 = (Ax)∗ Ay = x∗ A∗ Ay = x∗ y = x · y .
(160)
Hierbei haben wir in der Form A∗ A = 1 = AA∗
(161)
von unserer fr¨ uheren Feststellung [vgl. Gl. (153)] Gebrauch gemacht, daß die Umkehrtransformation einer orthogonalen Transformation A durch die Matrix A∗ beschrieben wird. (Die entsprechende Gleichung X
aij akj = δik
j
in Koeffizientenschreibweise faßt unsere Gln. (148) und (149) zusammen.) Insbesondere bleibt bei orthogonalen Transformationen also die Norm jedes Vektors erhalten: x0 · x0 = x · x . Da f¨ ur einen Eigenvektor x zu dem (reellen) Eigewertλ außerdem x0 = λx gilt, folgt λ2 = 1. F¨ ur orthogonale Matrizen sind also nur die reelen Eigenwerte λ = 1 und λ = −1 m¨oglich. F¨ ur die Ausgangsmatrix A(0) = 1 ist trivialerweise jeder Vektor Eigenvektor zum Eigenwert λ = +1. Mit den Koeefizienten der Matrix A(t) sind aber auch die Eigenwerte stetige Funktionen der Zeit. Wenn sich nun λ(t) stetig aus λ(0) = 1 entwickeln soll und u ¨berhaupt nur die Werte +1 und −1 26
Wir haben hiervon bereits in naiver Unschuld implizit Gebrauch gemacht, als wir die Zwangsbedingungen (145) aufgestellt und das k¨ orpereigene Koordinatensystem eingef¨ uhrt haben! 27 Die Zeilenvektoren sind mathematisch die Elemente des Dual raums zum Vektorraum der Spaltenvektoren.
75
infrage kommen, so bleibt λ = +1 als einzige M¨oglichkeit u ¨ ber28 . Zu jeder orthogonalen Transformation, die die Orientierung eines starren K¨orpers beschreibt, gibt es also eine ausgezeichnete Richtung, eine Drehachse, deren Vektoren bei der Transformation invariant bleiben. Gibt es noch mehrere solche Richtungen? Wenn ja, dann muß — wie man in der linearen Algebra zeigt — λ = 1 mehrfacher Eigenwert von A sein. Nun tauchen komplexe L¨osungen der charakteristischen Gleichung immer nur in konjugiert komplexen Paaren auf. Unser charakteristisches Polynom hat also genau eine oder gleich drei reelle L¨osungen. Ist λ = +1 dreifacher Eigenwert, dann gibt es auch drei linear unabh¨angige Eigenvektoren. Da auch jede Linearkombination wieder ein Eigenvektor ist, bleibt in diesem Fall jeder Vektor invariant, d.h. wir haben die identische Transformation A = 1. Zu jeder nicht identischen orthogonalen Transformation gibt es also genau eine invariante Drehachse. Wir wollen uns das an dem Beispiel der Drehungen eines Buchs von S. 23 verdeutlichen: z z z y
y
e01 e02 e03
e02 = e3 = A
x
x
x
Das Endresultat e01 = e2
y
e03 = e1 notieren wir in der Form
e1 e2 e3
mit A =
0 1 0 0 0 1 1 0 0
.
Nach S. 23 k¨onnen wir A durch zwei Drehungen D1 und D2 erzeugen. [Wenn wir beachten, daß D2 im k¨orpereigen System des Buchs formuliert werden muß, erhalten wir daf¨ ur die Matrizen
1 0 0 D1 = 0 0 1 0 −1 0
und
0 0 −1 D2 = 0 1 0 1 0 0
und u ¨berzeugen uns, daß tats¨achlich D2 D1 = A gilt.] Um das selbe Resultat durch eine Drehung zu erhalten, l¨osen wir das Eigenwertproblem von A. Zun¨achst erhalten wir die charakteristische Gleichung det(A − λ1) =
−λ 1 0 0 −λ 1 1 0 −λ
= 1 − λ3 = 0,
die — was von vornherein klar war — λ = +1 als einzigen reellen Eigenwert liefert. Der zugeh¨orige Eigenvektor muß das Gleichungssystem 28
Daneben kann auf dem Umweg u ¨ber die komplexe Ebene ein doppelter Eigenwert −1 auftreten (z.B. eine Drehung um π um die z–Achse, bei der sowohl x als auch y ihr Vorzeichen wechseln).
76
−1 1 0 x1 0 −1 1 x2 1 0 −1 x3
=
−x1 + x2 −x2 + x3 x1 − x 3
=
0 0 0
erf¨ ullen. Die Gleichungen sind nat¨ urlich nicht unabh¨angig, man erh¨alt beispielsweise die dritte Gleichung durch Addition der ersten beiden. Wir w¨ahlen daher eine Komponente beliebig, z.B. x3 = 1. Daraus folgt dann x1 = x2 = 1. Wir erhalten die gew¨ unschte Transformation also durch eine Drehung um die Achse, die in Richtung der Raumdiagonalen x = e1 + e2 + e3 zeigt. Den abstrakten mathematischen Satz formulieren wir physikalisch als das Eulersche Theorem • Die allgemeinste Auslenkung eines starren K¨orpers, der in einem Punkt festgehalten wird, ist eine Drehung um eine wohldefinierte Achse. Wenn wir nun noch die Bewegung des Koordinatenursprungs unseres k¨orpereigenen Koordinatensystems hinzunehmen, ergibt sich fast selbstverst¨andlich der Satz von Cashle • Die allgemeinste Auslenkung eines starren K¨orpers setzt sich aus einer Translation und einer Drehung zusammen. Wegen dieses Satzes liegt es nahe, das gesamte Bewegungsproblem des starren K¨orpers in die separaten Probleme der Translation und der Drehung zu zerlegen. Eine solche Zerlegung ist auch h¨aufig, aber keineswegs immer m¨oglich. Sie ist trivialerweise m¨oglich, wenn ein Punkt (oder gar eine ganze Drehachse) des K¨orpers festgehalten wird. Man wird dann den (bzw. einen) festgehalten Punkt als Ursprung des k¨orpereigenen Koordinatensystems benutzen und braucht nur die Drehung zu beschreiben. In diese Gruppe fallen die meisten Kreiselprobleme. Die Separation ist aber auch m¨oglich, wenn die potentielle Energie des starren K¨orpers nur von seiner Lage (Beispiel: homogenes Schwerefeld) oder nur von seiner Orientierung (Beispiel: Dipol im homogenen Magnetfeld) abh¨angt. Denn im Abschnitt 1.9 haben wir gesehen, daß die kinetische Energie [vgl. Gl. (69)] und der Drehimpuls [vgl. Gl. (77)] in einen Schwerpunkts– und einen inneren Anteil aufgespalten werden k¨onnen. In diesem Fall muß man also den Ursprung des k¨orpereigenen Koordinatensystems in den Schwerpunkt legen. Wegen der Komplexit¨at des Gesamtproblems werden wir uns im folgenden ausschließlich mit der Behandlung separierbarer Probleme befassen. (Selbst hierbei werden wir nur einige besonders einfache Probleme ausw¨ahlen). Da die Schwerpunktsbewegung als die Bewegung eines Massenpunktes beschreibbar ist, k¨onnen wir uns hierbei auf die Dynamik der Drehung beschr¨anken. 77
3.3
Der Tr¨ agheitstensor
Um die Untersuchung der Dynamik des starren K¨orpers vorzubereiten, berechnen wir zun¨achst seinen Drehimpuls. Wie erw¨ahnt wollen wir dabei von einer m¨oglichen Translation absehen und beziehen uns auf den Ursprung des k¨orpereigenen Koordinatensystems. Wir lassen von nun an auch den 0 zur Kennzeichnung dieses Systems weg, da wir uns im folgenden, wenn nicht ausdr¨ ucklich etwas anderes gesagt wird, immer darauf beziehen. Unter diesen Gegebenheiten erhalten wir nach Gl. (74) den Drehimpuls l=
X i
mi ri × r˙ i =
Z P
r × r˙ dm .
(162)
Z
Das Symbol Σ soll an dieser Stelle auf die verschiedenen Modelle der Massenverteilung im starren K¨orper hinweisen. Wir verstehen darunter insbesondere Z P
. . . dm =
X
(. . .)i mi
(163)
i
bzw. =
Z
. . . ρdV
Z
. . . σdA
bzw. = ,
. . . τ ds
bzw. =
Z
wenn der K¨orper als ein System von Massenpunkten mi , durch eine r¨aumliche Verteilung der Massendichte ρ, durch eine fl¨achenhafte Massenverteilung σ (z.B. Blech) oder durch eine linienhafte Verteilung τ (z.B. Draht) beschrieben wird. Nat¨ urlich k¨onnen solche Modelle auch kombiniert auftreten (z.B. Draht mit Perlen). Wir verzichten in Zukunft auf diese explizite Erinnerung und benutzen das Integralzeichen. Wenn wir uns nun an die Beziehung29 r˙ = ω × r [vgl. (57)] erinnern, erhalten wir aus (162) l= oder in Komponenten li = 29
Z
Z
r 2 ωi
r × (ω × r) dm =
− ri
X j
ωj r j
Z
dm =
(r 2 ω − r ω · r) dm
X j
ωj
Z
(r 2 δij − ri rj ) dm .
Beachte, wir rechnen im k¨ orpereigenen Koordinatensystem. Die zeitliche Ableitung r˙ = dr/dt in Gl. (162) ist aber im Intertialsystem zu bilden.
78
Mit dem Tr¨ agheistensor30 Θij =
Z
(r 2 δij − ri rj ) dm oder Θ =
Z
y 2 +z 2 −xy −xz 2 2 x +z −yz dm (164) −xy 2 2 −xz −yz x +y
gilt also li =
X
Θij ωj
oder l = Θ ω ,
(165)
j
wobei an die Regel “Zeile × Spalte” f¨ ur das Matrizenprodukt erinnert sei. Wir stellen also fest, daß wir bei der Berechnung des Drehimpulses l die Massenverteilung durch die symmetrische Matrix Θ repr¨asentieren k¨onnen. Der Drehimpuls l hat im allgemeinen nicht die selbe Richtung wie die Winkelgeschwindigkeit ω, sondern h¨angt mit ihr u ¨ber das Matrizenprodukt Θ ω zusammen. Auch bei der Berechnung der kinetischen Energie wird die Massenverteilung durch Θ repr¨asentiert, es gilt n¨amlich 1Z 2 1Z r˙ dm = r˙ · (ω × r) dm 2 2 Z 1 1 = ω · r × r˙ dm = ω · l . 2 2
T =
Mit Gl. (165) erhalten wir deshalb die einpr¨agsame Beziehung T =
1 1 1X ω · Θ ω = ω∗Θ ω = Θij ωi ωj , 2 2 2 ij
(166)
die T als quadratische Form in den Komponenten von ω ausweist. Wenn eine feste Drehachse n durch den Koordinatenursprung vorgegeben ist, kann der Tr¨agheitstensor Θ durch das Tr¨agheitsmoment Θn um diese Drehachse ersetzt werden. Mit ω = ωn folgt n¨amlich T =
1 Θn ω 2 2
mit Θn = n · Θn .
(167)
Mit der Definition des Tr¨agheitstensors folgt Θn = n ·
Z
[r 2 n − (n · r)r] dm =
Z
[r 2 − (n · r)2 ] dm .
Wenn wir im Integranden [r 2 − rk2 ] schließlich noch den Satz des Pythagoras ber¨ ucksichtigen, erhalten wir die vertraute Formel 30
Ein Tensor ist mathematisch durch sein Transformationsverhalten definiert. Wir verstehen darunter einfach eine Matrix.
79
Θn =
Z
2 r⊥ dm ,
(168)
die das Tr¨agheitsmoment durch den senkrechten Abstand r⊥ der Massen von der Drehachse ausdr¨ uckt. Dieser Ausdruck ergibt sich auch aus der elementaren Anschauung u ¨ ber vrot = ωr⊥ . F¨allt die Drehachse speziell mit einer Koordinatenachse zusammen (n = ei ), finden wir das zugeh¨orige Tr¨agheitsmoment Θn = Θii in der Hauptdiagonalen des Tr¨agheitstensors. Die Elemente Θi6=j außerhalb der Hauptdiagonalen werden auch Fliehkraft– oder Deviationsmomente genannt. Sie erzeugen bei einer gleichm¨aßigen Rotation Drehmomente in den Lagern. H¨aufig ist es w¨ unschenswert, einen Koordinatenursprung r0 außerhalb der Drehachse zu w¨ahlen. Ausgehend von der Drehachse schreiben wir dann r⊥ = r0⊥ + r0⊥ und erhalten Θ =
2 r0⊥
Z
dm + 2r0⊥ ·
2 = M r0⊥ + 2r0⊥ ·
Z
Z
r0⊥ dm
+
Z
0
r⊥2 dm
r0⊥ dm + Θ0 .
Links steht die gesamte Masse des K¨orpers multipliziert mit dem Quadrat des Abstandes des Koordinatenursprungs r0 von der Drehachse und rechts das Tr¨agheitsmoment um eine parallele Drehachse durch den Koordinatenursprung. Im allgemeinen verhindert jedoch der Term in der Mitte eine einfache Transformationsformel. Wenn jedoch der Schwerpunkt rS als Koordinatenursprung r0 gew¨ahlt wird, verschwindet das Integral im mittleren Term und wir erhalten den Satz von Steiner 2 Θ = ΘS + M rS⊥ ,
(169)
in Worten: • Das Tr¨agheitsmoment um eine gegebene Achse ist gleich dem Tr¨agheitsmoment um eine parallele Achse durch den Schwerpunkt plus dem Produkt aus der Gesamtmasse und dem Quadrat des Abstands des Schwerpunkts von der Drehachse.
80
Da der Schwerpunkt h¨aufig auch durch eine Symmetrie desK¨orpers ausgezeichnet ist, bietet der Steinersche Satz eine n¨ utzliche Rechenhilfe zur Bestimmung von T¨agheitsmomenten. Als weitere Rechenhilfe notieren wir f¨ ur eine ebene Massenverteilung in der x–y–Ebene die Beziehungen Θzz = Θxx + Θyy
und Θxz = Θyz = 0,
(170)
welche direkt aus Gl. (165) folgen. Beispiel: Wir betrachten ein physikalisches Pendel, also einen starren K¨orper, der sich frei um eine gegebene Achse drehen kann. Θ sei das Tr¨agheitsmoment um diese Achse und a der Abstand des Schwerpunkts von der Drehachse. Mit der generalisierten Winkelkoordinate ϕ erhalten wir dann dieLagrangefunktion 1 L = T − V = Θϕ˙ 2 + M ga cos ϕ 2 und die Bewegungsgleichung Θϕ¨ + M ga sin ϕ = 0 . Das entspricht der Gleichung f¨ ur das mathematische Pendel (vgl. S. 45) mit einer effektiven Pendell¨ange Θ `eff = . Ma Nach dem Steinerschen Satz k¨onnen wir Θ gem¨aß Θ = ΘS + M a2 aus dem Tr¨agheitsmoment ΘS um eine parallele Drehachse durch den Schwerpunkt berechnen. Die effektive Pendell¨ange `eff = a +
ΘS Ma
ist daher immer gr¨oßer als der Abstand a des Schwerpunkts vom Aufh¨angepunkt. Hierin zeigt sich der Beitrag der Rotation des starren K¨orpers um den Schwerpunkt zur gesamten kinetischen Energie. Als spezielles Beispiel f¨ ur die Massenverteilung w¨ahlen wir eine homogene Kreisscheibe vom Radius R um den Koordinatenursprung in der x–y–Ebene. Dann wird ZR Z R4 2 2 Θzz = (x + y ) dm = σ r 2 2πr dr = 2πσ , 4 0
2
oder wegen σ = M/(πR )
1 Θzz = M R2 . 2 81
Mit der Symmetrie und Gl. (170) folgt daraus sofort der gesamte Tr¨agheitstensor
1 0 0 Mr Θ= 0 1 0 . 4 0 0 2 2
F¨ ur eine Drehung um die z–Achse durch den Schwerpunkt haben wir das Tr¨agheitsmoment ΘS = Θzz = M R2 /2. Legen wir parallel dazu eine senkrechte Drehachse durch die Peripherie (a = R), so bildet die Kreisscheibe ein physikalisches Pendel mit der effektiven Pendell¨ange 3 `eff = R . 2 W¨ahlt man dagegen eine tangentiale Drehachse in der Peripherie, so m¨ ussen wir 2 von ΘS = Θxx = M R /4 ausgehen und erhalten 5 `eff = R . 4
3.4
Tr¨ agheitshauptachsen
¨ Uber den Drehimpuls und die kinetische Energie ist das dynamische Verhalten des starren K¨orpers wesentlich durch seinen Tr¨agheitstensor bestimmt. F¨ ur eine einfache Formulierung der Dynamik st¨oren hierbei die Nicht–Diagonal–Elemente. Darum fragen wir nach einem speziellen k¨orpereigenen Koordinatensystem, dem Hauptachsensystem, in dem der Tr¨agheitstensor die Diagonalgestalt
I1 0 0 Θ = 0 I2 0 0 0 I3
(171)
annimt. Im Hauptachsensystem gelten f¨ ur den Drehimpuls und die kinetische Energie die einfachen Beziehungen li = I i ω i
bzw. l =
X
I i ωi e i
(172)
i
und T =
1X Ii ωi2 . 2 i
(173)
Gibt es nun immer so ein sch¨ones Hauptachsensystem? Und wenn ja: Wie finde ich es? Zur Beantwortung dieser Frage gehen wir von der Beziehung (172) f¨ ur den Drehimpuls aus. 82
Wenn es eine Hauptachse e gibt, so gilt bei einer Rotation ω = ωe um diese Hauptachse l = Iω , l und ω haben also dieselbe Richtung. Vergleichen wir das mit der allgemeinen Beziehung l = Θω, so sehen wir uns mit dem Eigenwertproblem (Θ − I1)ω = 0
(174)
konfrontiert. Wir m¨ ussen insbesondere die Frage beantworten, ob wir drei reelle Eigenwerte I1 , I2 , I3 und zugeh¨orige linear unabh¨angige Eigenvektoren finden. Die Frage nach reellen L¨osungen ist im allgemeinen im Reellen viel schwieriger zu beantworten, als wenn man das Problem in eine komplexe Theorie einbettet. Wir verallgemeinern darum den Begriff der transponierten Matrix zum Begriff der adjungierten Matrix, die neben der Spiegelung an der Hauptdiagonalen durch ¨ einen Ubergang zu konjugiert komplexen Koeffizienten gekennzeichnet ist: (. . . aij . . .)∗ = (. . . a∗ji . . .) . ¨ Uber einspaltige Matrizen u ¨bertragen wir die Begriffsbildung auf Vektoren: Der zu einem komplexen Spaltenvektor a adjungierte Vektor a∗ ist also ein Zeilenvektor mit konjugiert komplexen Koeffizienten. Das im Sinne der Matrizenmultiplikation erkl¨arte Skalarprodukt a · b = a∗ b = α
b · a = b∗ a = α ∗
liefert eine komplexe Zahl und ist nicht mehr kommutativ. Reell ist dagegen das Skalarprodukt x · x = x∗ x = |x|2 , das man benutzen kann, um dem Vektor x eine Norm oder L¨ange zuzuordnen.
Nach diesen Erkl¨arungen sehen wir uns den Tr¨agheitstensor an und stellen fest, daß er reell und symmetrisch ist. Er ist also sowohl gegen die Spiegelung an der Hauptdiagonalen als auch gegen die komplexe Konjugierung invariant und erf¨ ullt die Relation Θ∗ = Θ . Matrizen (auch mit komplexen Koeffizienten), die diese Relation erf¨ ullen, heißen selbstadjungiert. Mathematisch handelt es sich bei unserer Fragestellung also um das Eigenwertproblem selbstadjungierter Matrizen A. Um das zu untersuchen, gehen wir von der Eigenwertbeziehung Axi = λi xi 83
aus und multiplizieren von links mit dem Eigenvektor x∗k : x∗k Axi = λi x∗k xi . Nun nutzen wir die Voraussetzung, daß A selbstadjungiert ist, zur Umformung der linken Seite aus und erhalten x∗k Axi = (A∗ xk )∗ xi = (Axk )∗ xi = (λk xk )∗ xi = λ∗k x∗k xi . Durch Vergleich finden wir die Relation (λ∗k − λi )x∗k xi = 0 , aus der wir (f¨ ur i = k bzw. i 6= k) zwei wichtige Folgerungen ablesen: 1. Alle Eigenwerte selbstadjungierter Matrizen sind reell. 2. Die Eigenvektoren zu verschieden Eigenwerten selbstadjungierter Matrizen sind orthogonal. F¨ ur eine beliebige n × n – Matrix A hat die charakteristische Gleichung [vgl. Gl. (158)]S det(A − λ1) = 0 , als Polynomgleichung n–ten Grades grunds¨atzlich n (m¨oglicherweise komplexe) L¨osungen λi . Bei einer selbstadjungierten Matrix sind diese n Eigenwerte s¨amtlich reell. Sind alle Eigenwerte zudem verschieden, so stehen die Eigenvektoren automatisch senkrecht aufeinander und definieren in nat¨ urlicher Weise ein Hauptachsensystem. Im Falle mehrfacher Eigenwerte spricht man von Entartung. Man kann nun zei¨ gen (was anschaulich durch einen stetigen Ubergang von verschiedenen zu gleichen Eigenwerten klar ist), daß die Eigenvektoren zu einem ν–fach entarteten Eigenwert einen ν–dimensionalen Unterraum aufspannen. Aus einer Basis dieses Unterraums lassen sich dann durch ein geeignetes Orthogonalisierungsverfahren stets ν orthogonale Eigenvektoren bilden. Wir k¨onnen also sicher sein, daß wir zu unserem Satz von n Eigenwerten immer n orthogonale Eigenvektoren angeben k¨onnen, die unser Hauptachsensystem aufspannen. Unser Ausgangsproblem, ein Hauptachsensystem zu finden, in dem der Tr¨agheitstensor Diagonalgestalt annimmt, besitzt also immer eine L¨osung, die sich nach dem folgenden Rezept gewinnen l¨aßt: 1. Benutze ein beliebiges rechnerisch g¨ unstiges (z.B. Symmetrie) k¨orpereigenes Koordinatensystem zur Bestimmung des Tr¨agheitstensors Θ nach Gl. (164).
84
2. Bilde die charakteristische Gleichung
Θ11 −I Θ12 Θ13 Θ12 Θ22 −I Θ23 det(Θ − I1) = Θ13 Θ23 Θ33 −I
= 0.
(175)
Die drei (reellen) L¨osungen (Eigenwerte) I1 , I2 und I3 dieser Gleichung sind die Haupttr¨agheitsmomente. 3. Bestimme aus den 3 Gleichungsystemen (ν = 1, 2, 3)
Θ11 −Iν Θ12 Θ13 Θ Θ −I Θ23 (Θ − Iν 1)eν = eν = 0 12 22 ν Θ13 Θ23 Θ33 −Iν
(176)
drei Eigenvektoren eν . Wegen der verschwindenden Determinante sind die L¨osungen nicht eindeutig und k¨onnen durch eine Zusatzforderung (z.B. Normierung) festgelegt werden. Wenn alle Haupttr¨agheitsmomente verschieden sind, sind die eν automatisch orthogonal und k¨onnen (ggf. nach einer Umnumerierung) als Basis des Hauptachsensystems benutzt werden. Sind zwei Haupttr¨agheitsmomente gleich, kann man aus der L¨osungsmenge von (176) zwei zugeh¨orige orthogonale Eigenvektoren ausw¨ahlen. [Sind alle drei Eigenwerte gleich, so ist jedes orthogonale Koordinatensystem ein Hauptachsensystem.] Wir behandeln als Beispiel einen Drahthaken in der x–y–Ebene (siehe Skizze) mit der homogen Massebelegung τ = M/(4a).
1. Wir bleiben im Koordinatensystem x, y, z und finden durch einfache Rechnungen und/oder Symmetrie¨ uberlegungen Θyy = τ
Za
−a
2 2 x2 dx = τ a3 = M a2 3 12 85
Θxx = Θyy + Θxy = −2τ
Za 0
8 M 2 a = M a2 2 12 ax dx = −τ a3 = −
3 M a2 . 12
Aus Gl. (170) lesen wir außerdem 10 M a2 und Θxz = Θyz = 0 12 ab. Damit erhalten wir den Tr¨agheitstensor Θzz = Θxx + Θyy =
8 −3 0 1 2 Θ = M a −3 2 0 . 12 0 0 10
2. Mit I = λM a2 /12 folgt daraus die charakteristische Gleichung
8 − λ −3 0 −3 2 − λ 0 0 0 10 − λ
= [(8 − λ)(2 − λ) − 9](10 − λ) = 0 .
Aus der Gleichung [. . .] = λ2 − 10λ + 7 = 0 finden wir √ √ λ1 = 5 − 3 2 und λ2 = 5 + 3 2 , und (. . .) = 0 ergibt sofort
λ3 = 10.
Damit haben wir die Haupttr¨agheitsmomente Iν = λν M a2 /12 ermittelt. 3. Da alle Eigenwerte verschieden sind, erhalten wir aus den Gleichungen
eν1 8 − λν −3 0 2 − λν 0 eν2 = 0 −3 eν3 0 0 10 − λν
automatisch drei orthogonale Eigenvektoren eν . Zu λ3 = 10 liest man unmittelbar e3 = (0, 0, 1) ab, die alte z–Achse ist also bereits Hauptachse. F¨ ur ν = 1 und 2 folgt sofort eν3 = 0, diese Eigenvektoren liegen also in der x–y–Ebene. Die beiden Gleichungen (8 − λν )eν1 − 3eν2 = 0 −3eν1 + (2 − λν )eν2 = 0 sind nicht linear unabh¨angig. Wir benutzen daher nur die erste und erhalten die Achsenneigungen eν2 8 − λν = tan αν = eν1 3 oder √ √ α1 = atn(1 + 2) = 67.5o und α2 = atn(1 − 2) = 157.5o . Die Hauptachsen mit diesen Richtungen sind in der Skizze bereits eingezeichnet. 86
3.5
Tr¨ agheitsellipsoid und Poinsotsche Konstruktion
Die Eigenwerte des Tr¨agheitstensors sind nicht nur reell, sondern sogar positiv, wie man an der Hauptachsenform (173) T =
1X Ii ωi2 2 i
der kinetischen Energie erkennt. Die F¨ache T = const beschreibt also ein Ellipsoid im ω–Raum31 . Das selbe Ellipsoid wird nat¨ urlich auch durch die (positiv definite!) quadratische Form [vgl. (166)] T =
1X Θij ωi ωj 2 i,j
(177)
in anderen Koordinatensystemen beschrieben. Die Ellipsoide zu verschiedenen Werten von T sind einander ¨ahnlich, und es ist u ¨blich (aber nicht notwendig), 1/2 das normierte Ellipsoid (setze etwa w = ω/(2T ) ) w · Θw =
X
Θij wi wj = 1
(178)
i,j
als Tr¨ agheitsellipsoid zu bezeichnen. Speziell im Hauptachsensystem erf¨ ullt das Tr¨agheitsellipsoid die Gleichung X ν
Iν wν2 = 1 .
(179)
Die Halbachsen aν des Tr¨agheitsellipsoids sind also durch 1 aν = √ Iν
(180)
gegeben; eine große Halbachse entspricht einem kleinen Haupttr¨agheitsmoment und umgekehrt. Allgemeiner folgt durch Vergleich der Gln. (167) und (178), daß der Abstand |w| = √
1 Θw
(181)
eines Punkts w auf dem Tr¨agheitsellipsoid vom Ursprung das Tr¨agheitsmoment Θw um die durch w angebene Drehachse charakterisiert. 31
Nur wenn die Massenverteilung ausschließlich auf eine Gerade beschr¨ ankt ist, wird ein Eigenwert Null, und das Ellipsoid entartet zu einem Kreiszylinder.
87
Durch einen Vergleich der Symmetrie eines Ellipsoids mit Symmetrien des starren K¨orpers folgt, daß die Entartung des Eigenwertproblems des T¨agheitstensors kein seltener Ausnahmefall ist. Vielmehr entartet das Tr¨agheitsellipsoid offenbar immer zum Rotationsellipsoid, wenn der K¨orper invariant gegen eine Drehung um 2π/n mit n ≥ 3 um eine Symmetrieachse ist. Die Symmetrieachse wird dann selbst Hauptachse32 , und die beiden andern Hauptachsen k¨onnen in der Ebene senkrecht dazu beliebig gew¨ahlt werden. Gibt es eine weitere entsprechende Symmetrieachse, so entartet das Tr¨agheitellipsoid sogar zur Kugel. In dem Fall ist jedes beliebige Orthogonalsystem Hauptachsensystem. Wir illustrieren das an einigen Beispielen: Gls. Dreieck
Vierkantstab
W¨ urfel
Tetraeder
Zugeh¨origes Tr¨agheitsellipsoid (schematisch):
Wir verzichten im folgenden auf die (triviale) Normierung und bezeichnen die Fl¨ache T = const im ω–Raum als Tr¨agheitsellipsoid. Wegen der fundamentalen Bedeutung des Drehimpulses bilden wir nach Gl. (177) li =
X
Θij ωj =
j
∂T ∂ωi
oder l = ∇ω T .
(182)
Der Gradient ∇ω T steht senkrecht auf der Fl¨ache T = const, denn f¨ ur alle dω aus der Tangentialebene gilt ja dT = ∇ω T · dω = 0 . Daraus folgt, daß der Drehimpulsvektor in die Richtung der Oberfl¨achennormalen des Tr¨agheitsellipsoids zeigt. Wir k¨onnen also die Drehimpulsrichtung zu einer 32
Das gilt bereits f¨ ur n = 2. Dabei liegt aber noch keine Entartung vor.
88
gegebenen Drehachse (ω) finden, indem wir im Punkt ω auf dem Tr¨agheitsellipsoid die Fl¨achennormale errichten (siehe Skizze). Diese geometrische Bestimmung heißt Poinsotsche Konstruktion. l ω
[Wir wenden die Poinsotsche Konstruktion auf die Bewegung des kr¨aftefreien Kreisels an. Darunter verstehen wir einen starren K¨orper, der in einem Punkt festgehalten wird, und auf den keine Kr¨afte wirken. Wegen V = 0 haben wir die Integrale T = const und l = const . Wir w¨ahlen die l–Richtung als raumfeste z–Achse. Dann ist ωz =
2T ω·l = |l| |l|
offenbar ebenfalls konstant. Der Bewegung des Kreisels entspricht eine Drehung des Tr¨agheitsellipsoids um den Ursprung. Diese Drehung erfolgt also so, daß das Tr¨agheitsellipsoid in jedem Zeitpunkt die “invariable Ebene” ωz = const ber¨ uhrt:
T=const ω
ωz
ωz =const
z,l
Bei der Bewegung wandert der Ber¨ uhrungspunkt weiter und beschreibt (a) auf dem Ellipsoid (also im k¨orperfesten Koordinatensystem) die “Polhodie” und (b) auf der invariablen Ebene (also im raumfesten Koordinatensystem) die “Herpolhodie”.
89
Die beiden Wanderungen erfolgen mit der selben Geschwindigkeit, denn wegen ω × ω = 0 gilt ! ! dω dω = . dt K¨orper dt Raum Damit l¨aßt sich die Bewegung des kr¨aftefreien Kreisels wie folgt charakterisieren: • Das Tr¨agheitsellipsoid rollt bei festgehaltenem Mittelpunkt ohne zu gleiten u ¨ber die invariable Ebene. Die momentane Winkelgeschwindigkeit ist dabei durch den Abstand des Ber¨ uhrungspunktes vom Mittelpunkt gegeben. Mit dieser geometrischen Beschreibung ist die Bewegung des kr¨aftefreien Kreisels vollst¨andig beschreiben. Die analytische Formulierung (die wir nicht mehr anstreben) ist jedoch recht verwickelt und f¨ uhrt auf elliptische Integrale. Beim symmetrischen Kreisel entartet das Tr¨agheitsellipsoid zum Rotationsellipsoid und Polhodie sowie Herpolhodie werden einfache Kreise. Vom K¨orper aus betrachtet beschreiben daher die Vektoren ω und l Kegel um die Figurenachse. Diese Bewegung wird Nutation (lat. nutare = nicken, wanken) oder auch regul¨are Pr¨azession33 genannt. Im raumfesten System bewegen sich ω und die Figurenachse auf Kegeln um den konstanten Drehimpuls l.]
3.6
Die Eulerschen Kreiselgleichungen
Wir hatten im Abschnitt 3.1 gesehen, daß die Eulerschen Winkel geeignete generalisierte Koordinaten zur Beschreibung der Drehung des starren K¨orpers sind. Wegen der recht komplexen Transformationsgleichungen ist es jedoch h¨aufig g¨ unstiger, direkt von der Grundgleichung d l=M dt
(183)
auszugehen, als denLagrangeschen Formalismus auf dieEulerschen Winkel anzuwenden. Gl. (183) bezieht sich nat¨ urlich zun¨achst auf ein raumfestes Koordinatensystem. Den Tr¨agheitstensor — und damit den Zusammenhang zwischen ω und l — k¨onnen wir jedoch nur in einem k¨orpereigenen Koordinatensystem angeben. Wir benutzen also die Beziehungen d = dt
d dt
!
K¨ orper
+ω×
und
33
dl dt
!
= Θ ω˙ , K¨ orper
Um die Begriffe Nutation und Pr¨azession herrscht eine bedauerliche Sprachverwirrung. Man muß alt/neu, deutsch/amerikanisch und physikalisch/astronomisch unterscheiden. Vgl. auch Fußnote 39, S. 97.
90
um Gl. (183) ins k¨orpereigene System zu transformieren und erhalten Θ ω˙ + ω × Θ ω = M . Die komponentenweise Anschrift dieser Gleichung wird wesentlich vereinfacht, wenn wir das Koordinatensystem der Tr¨agheitshauptachsen benutzen:
I1 ω˙ 1 ω1 I 1 ω1 I ω ˙ ω + × 2 2 2 I 2 ω2 = M . I3 ω˙ 3 ω3 I 3 ω3 Wenn wir schließlich das Kreuzprodukt noch explizit ausmultiplizieren, erhalten wir die Eulerschen Kreiselgleichungen
I1 ω˙ 1 + (I3 − I2 )ω2 ω3 = M1 I2 ω˙ 2 + (I1 − I3 )ω1 ω3 = M2 I3 ω˙ 3 + (I2 − I1 )ω1 ω2 = M3 .
(184)
Wir weisen nochmals darauf hin, daß sich diese Gleichungen auf das k¨orpereigene Hauptachsensystem bezieht. Eine dieser Gleichungen — mit unserer speziellen Festlegung der Koordinaten die dritte — erh¨alt man auch als Lagrangegleichung zum Eulerschen Winkel ψ. Die beiden andern folgen dann durch zyklische Vertauschung der Indizes. [Um das zu zeigen, bilden wir die kinetische Energie 1 1 1 T = I1 ω12 + I2 ω22 + I3 ω32 2 2 2 und setzen die Komponenten ω1 = sin θ sin ψ φ˙ + cos ψ θ˙ ω2 = sin θ cos ψ φ˙ − sin ψ θ˙ ω3 = cos θ φ˙ + ψ˙ aus Gl. (155) ein:
T =
I1 ˙ ˙ 2 + I2 (sin θ cos ψ φ−sin ˙ ˙ 2 + I3 (cos θ φ+ ˙ ψ) ˙ 2 . (185) (sin θ sin ψ φ+cos ψ θ) ψ θ) 2 2 2
Wenn wir damit die Lagrangegleichung ∂T ∂V d ∂T − =− dt ∂ ψ˙ ∂ψ ∂ψ 91
bilden, erhalten wir I3 ω˙ 3 − I1 ω1 ω2 + I2 ω2 ω1 = −
∂V . ∂ψ
Damit bleibt nur noch zu best¨atigen, daß −∂V /∂ψ die Komponente M3 des Drehmoments im k¨orpereigenen Koordinatensystem ist. Das folgt aber aus der Figur auf S. 71, da ψ die Drehung um die k¨orpereigene z–Achse beschreibt.]
3.7
Die kr¨ aftefreie Bewegung des starren K¨ orpers
Wir erinnern daran, daß wir annehmen, daß ein Punkt des K¨orpers festgehalten wird, oder daß wir die Schwerpunktsbewegung als uninteressant abspalten. Die verbleibende Drehung des kr¨aftefrein Kreisels wird durch die Eulerschen Gleichungen
I1 ω˙ 1 = (I2 − I3 )ω2 ω3 I2 ω˙ 2 = (I3 − I1 )ω1 ω3 I3 ω˙ 3 = (I1 − I2 )ω1 ω2 .
(186)
beschrieben. Die resultierende Bewegung haben wir im Abschnitt 3.5 mit der Poinsotschen Konstruktion bereits geometrisch beschrieben. Die analytische Beschreibung ist wegen der Nichtlinearit¨at der Eulerschen Gleichungen im allgemeinen schwierig34 . Wir werden uns daher auf zwei einfache Spezialf¨alle beschr¨anken, bei denen dieEulerschen Gleichungen linear werden. 1. Stabile Drehachsen des starren K¨ orpers Wenn alle Haupttr¨agheitsmomente verschieden sind, ist eine gleichf¨ormige kr¨aftefreie Rotation ω = const des Kreisels nach Gl.(186) nur um die Haupttr¨agheitsachsen m¨oglich. Wir nehmen an, daß der K¨orper um die z–Achse rotiert und fragen nach der Stabilit¨at dieser Rotation. Dazu betrachten wir kleine Abweichungen ω1 , ω2 von der ausgezeichneten Rotationsrichtung. Damit meinen wir, daß wir quadratische Terme (ω12 , ω22 und hier insbesondere ω1 ω2 ) vernachl¨assigen k¨onnen. Dadurch werden dieEulerschen Gleichungen linearisiert. Aus der letzten Gl. (186) folgt sofort die gleichf¨ormige Rotation ω3 = const. Daher erhalten wir aus den ersten beiden Gleichungen ω˙ 1 = −Ω1 ω2
mit Ω1 =
34
I3 − I 2 ω3 , I1
Die L¨ osung l¨ aßt sich zwar generell auf Quadraturen zur¨ uckf¨ uhren, f¨ uhrt jedoch auf nicht– elementare (elliptische) Funktionen.
92
I3 − I 1 ω3 . I2 Wenn wir eine dieser Gleichungen noch einmal nach t differenzieren und die andere einsetzen, folgt ω ¨ 1,2 = −Ω1 Ω2 ω1,2 . ω˙ 2 = Ω2 ω1
mit Ω2 =
Diese Gleichung entspricht einer Schwingungsgleichung
ω ¨ 1,2 + Ω2 ω1,2 = 0 mit Ω2 = Ω1 Ω2 , falls Ω1 und Ω2 das selbe Vorzeichen haben. Diese Vorraussetzung ist erf¨ ullt, wenn I3 das gr¨oßte oder das kleinste Haupttr¨agheitsmoment ist. In diesem Fall reagiert der Kreisel also auf eine kleine St¨orung mit kleinen Schwingungen um die Drehachse: • Eine Rotation um die Drehachse mit dem gr¨oßten oder kleinsten Haupttr¨agheitsmoment ist stabil. Ist I3 dagegen das mittlere Haupttr¨agheitsmoment, so ist Ω1 Ω2 < 0, und wir erhalten exponentiell wachsende St¨orungen ω1,2 ∼ exp(|Ω1 Ω2 |1/2 t) : • Eine Rotation um die Hauptachse mit dem mittleren Haupttr¨agheitsmoment ist labil. 2. Der kr¨ aftefreie symmetrische Kreisel Beim symmetrischen Kreisel werden zwei Haupttr¨agheitsmomente, etwa I1 und I2 , gleich. Damit folgt aus der dritten Gl. (186) ω3 = const , d.h. die Projektion der Winkelgeschwindigkeit auf die Symmetrieachse ist konstant. Da ω3 nun eine Integrationskonstante darstellt, werden auch die beiden u ¨brigenEulerschen Gleichungen linear: ω˙ 1 = −Ωω2 ω˙ 2 = Ωω1 mit Ω=
I3 − I 1 ω3 . I1
Die allgemeinen L¨osungen dieser Gleichungen sind Kreise ω1 = ω⊥ cos[Ω(t − t0 )] ω2 = ω⊥ sin[Ω(t − t0 )] , 93
(187)
wie man z.B. durch direktes Einsetzen erkennt35 . Die Spitze des Vektors ω durchl¨auft also mit der Nutationsfrequenz Ω einen Kreis um die Figurenachse, die Polhodie (vgl. S. 89). Mit der selben Frequenz rotiert auch der (raumfeste!) Drehimpuls (im k¨orpereigenen System!) um die Figurenachse. Die Nutation ist je nach dem Vorzeichen von I3 − I1 vor – oder r¨ uck l¨aufig. Sie verschwindet, wenn (außer I2 auch noch) I3 = I1 wird, wenn also das Tr¨agheitsellipsoid zur Kugel entartet. F¨ ur Kugel kreisel ist daher eine gleichf¨ormige Rotation um jede Achse m¨oglich, wie man auch sofort an Gl. (186) erkennt. Dies gilt angen¨ahert auch f¨ ur die rotierende Erde. Die Abplattung f¨ uhrt jedoch zu einer kleinen Abweichung I3 − I 1 1 ≈ , I1 300 die einer Nutationsfrequenz
2π 300 Tage entspricht. Tats¨achlich findet man bei der Erdrotation Polschwankungen einer Amplitude von rund 5 Metern. Der Pol wandert jedoch nicht auf einem Kreis sondern beschreibt eine eher irregul¨are Kurve. Und statt der erwarteten Nutationsperiode von 300 Tagen = 10 Monaten beobachtet man eine gewisse Periodizit¨at mit der Chandlerschen Periode von etwa 14 Monaten. Die Abweichungen werden auf die Deformierbarkeit des Erdk¨orpers und auf gr¨oßere Massenbewegungen zur¨ uckgef¨ uhrt. Ω=
Die Nutationsfrequenz (187) bezieht sich wohlgemerkt auf die Beobachtung im ¨ k¨orpereigenen Koordinatensystem, das selbst rotiert. Eine Ubersetzung ins raumfeste Koordinatensystem, in dem ω und die Figurenachse um den konstanten Drehimpuls l rotieren (vgl. Abschnitt 3.5), ist wegen der verschiedenen Achsrichtungen etwas un¨ ubersichtlich. F¨allt die Symmetrieachse ann¨ahernd mit der Drehimpulsrichtung zusammen (ω ≈ ω3 ), sieht ein raumfester Beobachter die Nutationsfrequenz I3 ωN ≈ ω + Ω ≈ ω . (188) I1 (Eine exakte Beschreibung folgt im n¨achsten Abschnitt.)
3.8
Der Lagrangeformalismus fu ¨ r den Kreisel
Wegen der Komplexit¨at des Problems beschr¨anken wir uns von vornherein auf den symmetrischen Kreisel mit I1 = I2 , denn die Symmetrie bewirkt erhebliche 35
Systematisch findet man das am einfachsten u ur w = ω1 + iω2 . Eine andere ¨ber die DGL f¨ M¨ oglichkeit beruht auf dem Nachdifferenzieren, vgl. vorige Seite und Abschnitt 1.7.
94
Vereinfachungen. Zun¨achst lassen sich in den ersten beiden Termen der kinetischen Energie (185) die Beitr¨age mit sin ψ und cos ψ entweder zusammenfassen (Pythagoras) oder sie verschwinden: 1 1 ˙ 2. T = I1 (sin2 θ φ˙ 2 + θ˙2 ) + I3 (cos θ φ˙ + ψ) 2 2 Bei den Kr¨aften, die auf den Kreisel einwirken, beschr¨anken wir uns auf ein homogenes Schwerefeld. Auch hier erhalten wir eine wesentliche Vereinfachung durch die Symmetrie, da der Schwerpunkt auf der Symmetrieachse liegt: Das zugeh¨orige Potential36 V = V0 cos θ
mit V0 = mgzS
h¨angt nur vom Winkel θ zwischen der raumfesten und der k¨orpereigenen z–Achse ab. Die Symmetrievoraussetzung hat nicht nur die Anschrift 1 1 ˙ 2 − V0 cos θ L = T − V = I1 (sin2 θ φ˙ 2 + θ˙ 2 ) + I3 (cos θ φ˙ + ψ) 2 2
(189)
derLagrangefunktion vereinfacht, ihr ist auch zu verdanken, daß neben der Koordinate φ auch noch ψ zyklisch geworden ist. Wir lesen aus (189) daher die beiden Erhaltungsgr¨oßen
˙ und pψ = I3 (cos θ φ˙ + ψ) pφ = I1 sin2 θ φ˙ + pψ cos θ
(190) (191)
ab. pψ und pφ sind (nicht orthogonale) Komponenten des Drehimpulses. Die Komponente [vgl. (155)] p ψ = I 3 ω3 (192) in Richtung der k¨orpereigenen z–Achse ist konstant, da der Kraftarm der Gewichtskraft in diese Richtung weist und folglich das entsprechende Moment verschwindet. Ebenso ist die Drehimpulskomponete pφ in Richtung der raumfesten z–Achse konstant, denn die Kraft selbst zeigt in diese Richtung, und daher verschwindet das entsprechende Moment. W¨ahrend also die Existenz der Erhaltungsgr¨oßen (190) und (191) auch aus der physikalischen Anschauung nachvollziehbar ist, wird die explizite Formulierung durch denLagrangeformalismus zumindest wesentlich erleichtert. 36
Die selbe Abh¨ angigkeit (mit V0 = µB) ergibt sich auch f¨ ur einen Kreisel mit konstantem Dipolmoment µ im homogenen Magnetfeld B.
95
Die Zahlenwerte von pφ und pψ ergeben sich aus den Anfangsbedingungen. Damit lassen sich φ(t) und ψ(t) durch Integration von (190) und (191) gewinnen, wenn θ(t) bekannt ist. θ(t) l¨aßt sich aus der Lagrangegleichung I1 θ¨ − I1 sin θ cos θ φ˙ 2 + pψ sin θ φ˙ − V0 sin θ = 0
(193)
bestimmen, wenn man φ˙ mit Gl. (191) eliminiert. Damit l¨aßt sich die L¨osung im Prinzip auf Quadraturen zur¨ uckf¨ uhren. Dieser systematische Weg ist jedoch ziemlich aufwendig und wenig instruktiv. Wir wollen daher versuchen, die Charakteristika der Bewegung mit geringerem Aufwand zu erkennen. Dazu unterscheiden wir noch einmal den kr¨aftefreien und den schweren Kreisel. 1. Der kr¨ aftefreie symmetrische Kreisel Hier haben wir V0 =0, und im raumfesten Koordinatensystem ist keine Richtung mehr a priori ausgezeichnet. Da der Drehimpuls nun konstant wird, ist es g¨ unstig, die raumfeste z–Achse in seine Richtung zu legen. Damit gilt
pφ = j und pψ = j cos θ ,
(194) (195)
wenn j den Betrag des Drehimpulses bezeichnet. Bei der Bewegung bleibt also auch der Winkel θ zwischen Figurenachse und Drehimpuls konstant: Die Figurenachse bewegt sich auf dem Mantel des Nutationskegels (vgl. Abschnitt 3.5, S. 90). Setzen wir (194) und (195) in (191) ein37 , so erhalten wir j = I1 sin2 θ φ˙ + j cos2 θ oder
j φ˙ = ωN = . I1
(196)
Die Knotenlinie — und damit auch die Figurenachse — l¨auft also mit konstanter Winkelgeschwindigkeit φ˙ um die Drehimpulsrichtung. Damit haben wir Gl. (188) pr¨azisiert und die Nutation im raumfesten System exakt beschrieben. Zus¨atzlich rotiert der der K¨orper mit der Winkelgeschwindigkeit ψ˙ um seine Figurenachse. F¨ ur diese Rotation erhalten wir aus Gl. (190) I3 ψ˙ = pψ − I3 cos θ φ˙ , oder mit (195) und (196) 37
Das selbe Ergebnis folgt mit θ = const 6= 0 auch aus den Gln. (193) und (191).
96
ψ˙ =
1 1 − j cos θ . I3 I1
(197)
Die gesamte momentane Winkelgeschwindigkeit ˙ 3 + φe ˙ l ω = ψe setzt sich additiv aus den beiden Rotationen mit ψ˙ und φ˙ zusammen und liegt in der Ebene, die von der Figurenachse e3 und dem Drehimpuls l aufgespannt wird. ω l¨auft also ebenfalls mit der konstanten Winkelgeschwindigkeit φ˙ auf einem Kegelmantel um den konstanten Drehimpuls. 2. Der schwere symmetrische Kreisel Im Gegensatz zum kr¨aftefreien Kreisel ist nun der gesamte Drehimpuls l nicht mehr konstant38 , und die z–Richtung des raumfesten Systems ist durch das Schwerefeld von außen vorgegeben. Trotzdem existieren auch beim schweren Kreisel partikul¨are L¨osungen mit θ = const und φ˙ = const, bei denen also die Figurenachse mit konstanter Winkelgeschwindigkeit auf einen Kegelmantel um die raumfeste z–Achse l¨auft. Diese Bewegung der Figurenachse des schweren Kreisels nennt man Pr¨ azession39 (lat. praecedere = vorangehen). Wenn wir θ = const in Gl. (193) einsetzen, erhalten wir f¨ ur φ˙ die quadratische Gleichung −I1 cos θ φ˙ 2 + pψ φ˙ − V0 = 0 .
(198)
Ihre L¨osung 1 I 3 ω3 φ˙ = 1∓ 2 I1 cos θ
s
4V0 I1 cos θ 1− I32 ω32
!
(199)
(bei der wir von der Gl. (192) pψ = I3 ω3 Gebrauch gemacht haben) zeigt zun¨achst, daß die gleichf¨ormige Pr¨azession einen Mindestwert ω3 f¨ ur die Rotation um die Figurenachse erfordert. Diese Bedingung ist trivial erf¨ ullt, wenn wir uns f¨ ur den “schnellen” Kreisel interessieren, der so rasch um seine Symmetrieachse rotiert, daß I3 ω3 bzw. I3 ω32 groß gegen alle konkurrierenden Drehimpulse bzw. Energien ist. F¨ ur den schnellen Kreisel gilt insbesondere pψ = I3 ω3 I1 φ˙ und I3 ω32 V0 . 38
Wohl aber die Komponenten pφ und pψ , vgl. (190) und (191). Auf der mathematischen Analogie beruht die alternative Bezeichnung “regul¨ are Pr¨ azession” f¨ ur die Nutation des kr¨ aftefreien Kreisels. Physikalisch stellt die Pr¨ azession des schweren Kreisels ein von der Nutation grundlegend verschiedenes Ph¨ anomen dar. Vgl. auch die beiden folgebden Fußnoten. 39
97
Damit scheidet das untere Vorzeichen in Gl. (199) aus. Durch Entwicklung der Wurzel oder durch direkte Vernachl¨assigung des quadratischen Terms in Gl. (198) erhalten wir f¨ ur die Pr¨azession eine gleichf¨ormige Winkelgeschwindigkeit V0 V0 φ˙ = ωP = = , pψ I 3 ω3
(200)
die nicht von der Neigung θ der Figureanchse gegen das Schwerefeld abh¨angt. Die Pr¨azession erfolgt um so langsamer, je schneller der Kreisel rotiert. Diese gleichf¨ormige Pr¨azession ist nur eine partikul¨are L¨osung des Problems. Um die grunds¨atzliche Struktur der allgemeinen L¨osung aufzuzeigen, nehmen wir kleine Abweichungen θ = θ0 + δ von der speziellen L¨osung θ = θ0 an. Dann folgt aus (191) eine ungleichf¨ormige Pr¨azessionsgeschwindigkeit pφ − pψ cos θ φ˙ = I1 sin2 θ pψ sin θ0 pφ − pψ cos θ0 pφ − pψ cos θ0 ≈ +δ − 2δ cos θ0 2 2 I1 sin θ0 I1 sin θ0 I1 sin3 θ0 pψ = ωP + δ − 2ωP tan θ0 δ . I1 sin θ0 Hierbei haben wir bereits f¨ ur θ = θ0 die gleichf¨ormige Pr¨azession ωP des schnellen Kreisels nach Gl. (200) eingesetzt. F¨ ur kleine δ k¨onnen wir schließlich noch den dritten Term gegen den ersten vernachl¨ssigen und erhalten φ˙ = ωP +
pψ δ. I1 sin θ0
(201)
Wenn wir dies in die Lagrangegleichung (193) einsetzen und gleichzeitig f¨ ur den ˙ schnellen Kreisel (pψ I1 φ) den zweiten gegen den dritten Term vernachl¨assigen, erhalten wir p2 δ¨ + ψ2 δ = 0 . (202) I1 δ und damit θ oszilliert also mit der selben Frequenz40 j pψ ≈ = ωN , I1 I1 40
Man beachte die verschiedenen Koordinatensysteme bei der Beschreibung des kr¨ aftefreien und des schweren Kreisels. Daß der Eulersche Winkel φ einmal die Nutation und einmal die Pr¨ azession beschreibt, mag wesentlich zu der sprachlichen Verwirrung beigetragen haben!
98
die nach Gl. (196) die Nutation des kr¨aftefreien Kreisels beschreibt. Mit der selben Frequenz schwankt daher nach Gl. (201) auch die Pr¨azessionsgeschwindigkeit φ˙ um ihren Mittelwert ωP . Wir schließen daraus, daß die allgemeine Bewegung des schnellen schweren Kreisels durch eine gleichf¨ormige Pr¨ azession mit u ¨berlagerter 41 Nutation beschrieben wird. Je nach der Amplitude δmax der Nutation kann die Bewegung eines Punktes auf der Kreiselachse (etwa des sogenannten Locus mit dem Abstand 1 von der festgehaltenen Kreiselspitze) wellig verlaufen oder mit zeitweise r¨ uckl¨aufiger Pr¨azession Schleifen bilden (siehe Skizze). Der Grenzfall einer zykloidischen Bahn mit Spitzen ˙ ˙ entspricht den Anfangsbedingungen θ(0) = 0 und φ(0) = 0. Dies ist kein akademischer Spezialfall, sondern beschreibt die Bewegung eines schweren Kreisels, der zun¨achst festgehalten, und dann pl¨otzlich dem Schwerefeld ausgesetzt wird.
Bahn des Locus eines schweren symmetrischen Kreisels (nach Goldstein)
Der Vollst¨ andigkeit halber erw¨ ahnen wir, daß sich der schwere symmetrische Kreisel auch ohne weitere Vorraussetzungen und N¨ aherungen exakt beschreiben l¨ aßt. Dazu erg¨ anzt man die beiden Integrale (190) und (191) durch den Energiesatz [vgl. (189)] T +V =
1 1 ˙ 2 + V0 cos θ = E . I1 (sin2 θ φ˙ 2 + θ˙2 ) + I3 (cos θ φ˙ + ψ) 2 2
Eliminieren wir hier ψ˙ und φ˙ durch (190) und (191), so erhalten wir 1 ˙2 I1 θ + Veff (θ) = E 2 mit dem effektiven Potential Veff (θ) =
p2ψ (pφ − pψ cos θ)2 + + V0 cos θ . 2I3 2I1 sin2 θ
41
Da die u ¨berlagerte Nutation bei einem hinreichend schnellen Kreisel kaum zu beobachten ist, spricht man auch von pseudoregul¨ arer Pr¨ azession.
99
Da das effektive Potential f¨ ur θ = 0 und θ = π unendlich wird, muß sich θ zwischen zwei Umkehrpunkten θ1 und θ2 bewegen. Hierin erkennen wir die Nutation wieder. Ihre exakte mathematische Beschreibung gem¨ aß r I1 dθ p = dt 2 E − Veff (θ) f¨ uhrt mit der Substitution u = cos θ auf das elliptische Integral Z I1 du t=− q p2ψ 2I1 (1 − u2 )(E − 2I3 − V0 u) − (pφ − pψ u)2
mit einem Polynom dritten Grades (f¨ ur V0 6= 0) in u unter der Wurzel im Nenner. Nach der Bestimmung von θ(t) lassen sich φ(t) und ψ(t) durch Integration von (190) und (191) bestimmen.
3.9
Zum elementaren Verst¨ andnis des Kreisels
Der Kreisel findet nicht nur zahlreiche technische Anwendungen sondern ist auch ein zeitlos beliebtes Spielzeug. Seine scheinbar paradoxe Reaktion auf ¨außere Kr¨afte stellt dabei eine nicht ganz triviale Aufgabe an die physikalische Anschauung. Wenn wir nun elementare Betrachtungen nachtragen, so zielen wir damit auf das anschauliche Verst¨andnis der Pr¨azession. Denn die u ¨ berlagerte Nutation ist mehr oder weniger selbsverst¨andlich, wenn die Richtung des Drehimpulses nicht mit einer Hauptachse (der Symmetrieachse) zusammenf¨allt (vgl. Abschnitt 3.5). Die einfachste elementare Begr¨ undung der Pr¨azession des schnellen Kreisels geht direkt vom Drehimpulssatz aus. Auf den Kreisel wirkt eine Kraft vom Betrag F = mg l¨angs der raumfesten zR –Achse. Diese Kraft greift im Schwerpunkt mit dem Kraftarm zS in Richtung der k¨orpereigenen zK –Achse an und erzeugt ein Drehmoment vom Betrag M = mgzS sin θ = V0 sin θ . Es steht senkrecht auf beiden z–Achsen, zeigt also in die Richtung der Knotenlinie (vgl. Skizze und die Figur auf S. 71). zR
M θ zS
100
F
zK
Dieses Drehmoment ver¨andert nun den Drehimpuls l, der f¨ ur den schnellen Kreisel angen¨ahert durch l = I3 ω3 e3 gegeben ist. Seine raumfeste zR –Komponente pφ ≈ I3 ω3 cos θ bleibt konstant, da das Drehmoment keine zR –Komponente besitzt. Die Projektion l⊥ in die raumfeste x–y–Ebene steht senkrecht auf der Knotenlinie, der Betrag l⊥ = I3 ω3 sin θ bleibt daher ebenfalls konstant. Durch das Drehmoment wird l⊥ jedoch gem¨aß l⊥ dφ = M dt ¨ gedreht. Damit erhalten wir in Ubereinstimmung mit (200) eine Pr¨azessionsgeschwindigkeit dφ M V0 sin θ = = = ωP , dt l⊥ I3 ω3 sin θ aus der sich die Abh¨angigkeit vom Neigungswinkel θ herausk¨ urzt. Die soweit skizzierte Betrachtung ist zwar mathematisch besonders einfach, aber noch wenig hilfreich f¨ ur das anschauliche Verst¨andnis. Sie geht n¨amlich von dem integralen Drehimpulssatz aus und sagt nichts dar¨ uber aus, welche Kr¨afte an welchen Massenpunkten des Kreisels die Wirkung der Schwerkraft kompensieren und das Kippen des Kreisels verhindern. Eine in dieser Hinsicht aufschlußreichere Interpretation der Pr¨azession ergibt sich in dem Koordinatensystem, das mit ωP um die zR –Achse rotiert, das also der Pr¨azession (nicht aber der Rotation) der Kreiselachse folgt. In diesem System erfahren die Massenpunkte des rotierenden Kreisels eine Corioliskraft FC1 , die senkrecht zur zR –Achse gerichtet ist (siehe Skizze). ZR FC1
ωp
FC1
Speziell bei den Massenpunkten am ’oberen’ Kreiselrand zeigt diese Kraft nach ’innen’, bei denen am ’unteren’ Rand nach ’außen’. Dadurch entsteht ein Drehmoment M1 , das den Kreisel aufzurichten versucht. Dieses Drehmoment kompensiert das entgegengesetzte Moment der Gewichtskraft.
101
Auch diese Interpretation kann noch nicht voll befriedigen, da sie bereits von der Pr¨azession ausgeht statt sie zu erkl¨aren. Welche Kraft zwingt also den Kreisel senkrecht auszuweichen, wenn er dem Schwerefeld ausgesetzt wird? Gar keine! Der Kreisel beginnt zu kippen, wie jeder K¨orper, der in einem Punkt festgehalten wird, im Schwerefeld kippt. Dabei erlangt er eine wachsende Winkelgeschwindigkeit θ˙ um die Knotenlinie. Und diese Drehung erzeugt nun ebenfalls eine Corioliskraft FC2 (siehe Skizze). zR
Fc2 Fc2 θ
Sie steht senkrecht auf der Knotenlinie und ist am ’rechten’ Kreiselrand nach ’innen’, am ’linken’ nach ’außen’ gerichtet. Dadurch entsteht ein Drehmoment M2 , dem der Kreisel ebenfalls folgt: Er beginnt zu pr¨azedieren. Die Pr¨azession erzeugt nun ihrerseits das oben beschriebene Drehmoment M1 , das dem Moment der Schwerkraft entgegenwirkt und es schließlich kompensiert. Aufgrund der Tr¨agheit schießt der Kreisel aber u ¨ber dieses ’Ziel’ hinaus, er kippt weiter und erf¨ahrt durch FC2 bzw. M2 eine weitere Beschleunigung der Pr¨azession, bis schließlich das wachsende Moment M1 die Kippbewegung zur Umkehr zwingt. Nun wird θ˙ < 0 und M2 wechselt das Vorzeichen. Dadurch wird die Pr¨azession verlangsamt, bis sie schließlich ganz zum Stillstand kommt. In diesem Punkt beginnt ein neuer Nutationszyklus. Die Kreiselachse f¨ uhrt also insgesamt die Bewegung aus, die in der mittleren Figur von S. 99 skizziert ist. Die Nutation ist daher am Aufbau der Pr¨azession wesentlich beteiligt, ja, wir k¨onnen die Pr¨azession als eine Folge von Versetzungen durch Nutationszyklen auffassen. Erst wenn durch Reibung (die in unserer Analyse nicht enthalten ist) die Amplitude der Nutation wegged¨ampft ist, erhalten wir die reine (regul¨are) Pr¨azession mit der oben skizzierten Kompensation von Schweremoment und M1 .
102
4
Stabilit¨ at und kleine Schwingungen
In diesem Kapitel befassen wir uns mit einer Anwendung des Lagrangeformalismus auf die Untersuchung der Bewegung in der N¨ahe von “Gleichgewichtszust¨anden”, d.h. von Ruhelagen des Systems. Reagiert das System mit Oszillationen auf kleine St¨orungen der Ruhelage (z.B. Kugel in einer Potentialmulde) , so heißt der Gleichgewichtszustand stabil. Ein labiler Gleichgewichtszustand dagegen (z.B. Kugel auf einem Potentialberg) wird endg¨ ultig verlassen, wenn die Ruhelage gest¨ort wird. Methodisch benutzen wir in diesem Kapitel das wichtige Werkzeug der Linearisierung. Wir behandeln das Problem hier im Anschluß an die Dynamik des starren K¨orpers, weil wir dabei von unserer mathematischen Vorarbeit bei der Hauptachsentransformation des Tr¨agheitstensors profitieren k¨onnen. Da es sich bei dem Problem – wie gesagt – um eine Anwendungen und nicht um Grundlagen handelt, kann dieses Kapitel ohne Schaden f¨ ur das folgende ausgelassen werden.
4.1
Gleichgewichte und kleine Abweichungen
Wir betrachten ein mechanisches System mit holonomen Zwangsbedingungen, das wir durch die generalisierten Koordinaten q1 , . . . qf beschreiben. Wenn wir uns außerdem auf skleronome42 Zwangsbedingungen beschr¨anken, erhalten wir aus der R¨ ucktransformation xν = hν (q) die kinetische Energie (vgl. S. 60) T = T2 =
f n X 1X ∂hν ∂hν mν q˙i q˙j . 2 ν=1 i,j=1 ∂qi ∂qj
Wir wollen schließlich noch annehmen, daß alle Kr¨afte aus einem Potential herleitbar sind. Dann erhalten wir die Lagrangefunktion f 1 X L= Tij (q)q˙i q˙j − V (q) 2 i,j=1
mit Tij (q) =
n X
mν
ν=1 42 ¨
∂hν ∂hν . ∂qi ∂qj
Uber ein effektives Potential lassen sich auch viele Systeme mit rheonomen Zwangsbedingungen nach dem gleichen Schema behandeln. Im allgemeinen erfordert jedoch ein Anteil L1 (vgl. S. 60) in der Lagrangefunktion einen gr¨ oßeren mathematischen Aufwand, wie man am Beispiel des Facaultschen Pendels oder des harmonischen Oszillators im Magnetfeld sieht.
103
Aus den Ableitungen X ∂L Tik q˙i , = ∂ q˙k i
und
X ∂Tik X d ∂L Tik q¨i + = q˙i q˙j dt ∂ q˙k i,j ∂qj i
∂L 1 X ∂Tij ∂V = q˙i q˙j − ∂qk 2 i,j ∂qk ∂qk
folgen dann die Bewegungsgleichungen X i
Tik q¨i +
X i,j
∂Tik 1 ∂Tij − ∂qj 2 ∂qk
!
q˙i q˙j +
∂V = 0. ∂qk
(203)
¨ = 0. Hierf¨ Wir interessieren uns nun speziell f¨ ur Gleichgewichte q = q0 , q˙ = q ur muß offenbar ∂V =0 (204) ∂qk q=q0 gelten, d.h. die generalisierte Kraft im Gleichgewichtspunkt muß verschwinden.
Wir nehmen o.B.d.A. (etwa, indem wir q durch q − q0 ersetzen) q0 = 0 an und betrachten kleine Abweichungen vom Gleichgewicht. Damit meinen wir, daß wir alle Glieder von h¨oher als ¨ in den Bewegungsgleichungen bzw. • linearer Ordnung in q, q˙ und q • quadratischer Ordnung in q und q˙ in der Lagrangefunktion vernachl¨assigen. Damit entf¨allt der mittlere Term in der Bewegungsgleichung (203). Außerdem k¨onnen wir die kinetische Energie durch die symmetrische quadratische Form f 1 X T = Tij q˙i q˙j 2 i,j=1
mit Tij = Tji = Tij (0)
(205)
in q˙ repr¨asentieren. Entsprechend k¨onnen wir V (q) = V (0) +
X i
∂V 1 X ∂ 2 V qi + qi qj ∂qi 0 2 i,j ∂qi ∂qj 0
bis zur quadratischen Ordnung in q entwickeln. Die bedeutungslose Konstante V0 k¨onnen wir o.B.d.A. gleich Null setzen. Im Gleichgewicht gilt nach Gl. (204) außerdem ∂V /∂qi |0 = 0. Daher wird das Potential durch die symmetrische quadratische Form
104
f 1 X V = Vij qi qj 2 i,j=1
∂ 2 V mit Vij = Vji = ∂qi ∂qj 0
(206)
in q repr¨asentiert. Kleine Abweichungen vom Gleichgewicht werden also durch die Lagrangefunktion L=
1X 1 1X 1 Tij q˙i q˙j − Vij qi qj = q˙ ∗ Tq˙ − q∗ Vq 2 i,j 2 i,j 2 2
(207)
und die Bewegungsgleichungen X
(Tik q¨i + Vik qi ) = 0 oder T¨ q + Vq = 0
(208)
i
mit symmetrischen f×f –Matrizen T = (Tik ) und V = (Vik ) beschrieben.
4.2
Eigenfrequenzen und Stabilit¨ at
Gl. (208) ist ein linear homogenes Differentialgleichungssystem mit konstanten Koeffizienten, das grunds¨atzlich elementar l¨osbar ist. Die einzige Schwierigkeit liegt darin, daß die Gleichungen gekoppelt sind. Wir streben daher an, die Gleichungen durch eine Transformation q = Aξ
oder qi =
X
ail ξl
(209)
l
zu entkoppeln, so daß Gl. (208) in ξ¨l + λl ξl = 0
(210)
u ¨bergeht. Die entkoppelten Koordinaten ξl heißen Normalkoordinaten. Die Eigenwerte λl erhalten wir, wenn wir d2 → −λ dt2 in Gl. (208) einsetzen: f X i=1
(Vik − λTik )qk = 0 oder (V − λT)q = 0 105
Dieses linear homogene Gleichungssystem f¨ ur q besitzt nur dann nicht–triviale L¨osungen, wenn det(V − λT) = 0
(211)
gilt. Wir werden im n¨achsten Abschnitt zeigen, daß dieses Polynom f –ten Grades in λ tats¨achlich f reelle L¨osungen besitzt. F¨ ur Eigenwerte λl > 0 erhalten wir harmonische Eigenschwingungen ξl = cl cos ωl t + dl sin ωl t mit ωl =
q
λl .
Wir nennen ωl eine Eigenfrequenz oder Normalfrequenz des Systems. F¨ ur Eigenwerte λl < 0 erhalten wir dagegen exponentielle L¨osungen ξl = cl exp(γl t) + dl exp(−γl t) mit γl =
q
−λl .
Der Sonderfall λl = 0 f¨ uhrt auf eine gleichf¨ormige Variation ξl = c l + d l t . Dieser Fall erfordert im allgemeinen eine gesonderte Untersuchung, bei der h¨ohere Terme in den Abweichungen vom Gleichgewicht ber¨ ucksichtigt werden m¨ ussen. Zur Klassifizierung des Gleichgewichts k¨onnen wir daher die folgenden F¨alle unterscheiden: • Alle λl > 0:
Das System f¨ uhrt bei einer kleinen St¨orung kleine Schwingungen um die Gleichgewichtslage aus, das Gleichgewicht ist stabil.
• Mindestens ein λl < 0:
Das System l¨auft bei einer St¨orung exponentiell aus dem Gleichgewicht, das Gleichgewicht ist labil.
• Alle λl ≥ 0 und mindestens ein λl = 0:
Das Gleichgewicht ist zun¨achst indifferent. In diesem Sonderfall kommen jedoch im allgemeinen h¨ohere Entwicklungsglieder zum Tragen und entscheiden letzendlich u ¨ber die Stabilit¨at.
Die folgende Analyse wird zeigen, daß diese Klassifizierung mit der elementaren Anschauung u ¨bereinstimmt, die man aus der Beurteilung des Potentials in der Umgebung des Gleichgewichts (Minimum, Sattelpunkt, Maximum) gewinnt:
106
Quadratische Form q∗ Vq positiv definit positiv semidefinit negativ– oder indefinit
4.3
Gleichgewicht stabil indifferent labil
Transformation auf Normalkoordinaten
Mit der Transformation (209) erhalten wir die kinetische Energie 1 ∗ˆ ˙ ˆ = A∗ TA T = ξ˙ T ξ mit T 2 und die potentielle Energie 1 ˆ ˆ = A∗ VA . mit V V = ξ ∗ Vξ 2 Wenn wir angenommen haben, mit dieser Transformation entkoppelte Bewegungsgleichungen (210) zu erhalten, so ist das gleichbedeutend mit der optimistischen Erwartung, mit ein und derselben Transformation A sowohl T als auch V diagonalisieren zu k¨onnen: Vl Tˆkl = Tl δkl , Vˆkl = Vl δkl und λl = . Tl Bei entsprechender Dehnung oder Stauchung der Achsen k¨onnen wir dann sogar ˆ = 1 verlangen. T Bevor wir diese u ¨berraschende Aussage beweisen, erinnern wir daran, daß T und V reell symmetrische und damit selbstadjungierte Matrizen sind, und weisen auf das im Abschnitt 3.4 zusammengestellte mathematische R¨ ustzeug hin. Danach ist zun¨achst klar, das sowohl T als auch V einzeln mit verschiedenen orthogonalen Matrizen diagonalisiert werden k¨onnen. Wir werden hiervon bei unserem Existenzbeweis Gebrauch machen. Als Ergebnis werden wir eine nicht orthogonale Matrix A finden, die das Gew¨ unschte leistet. Zum Beweis geben wir in schematischer Form Einzeltransformationen an und verdeutlichen ihr Wesen anhand kleiner Skizzen: Die Ausgangssituation sei durch 1 ˙ q˙ , T = qT 2
q2
1 V = qVq 2
mit nicht diagonalen Matrizen T und V charakterisiert. (Wir skizzieren rechts die Fl¨achen T = const und V = const schematisch f¨ ur ein zweidimensionales stabiles System.) 107
q2
q1
q1
1. Schritt: Wir diagonalisieren T durch eine orthogonale Matrix A1 : q = A1 η ,
1 T = η˙ ∗ T1 η˙ , 2
1 V = η ∗ V1 η , 2
η2
η2
τ1 · · · 0 . .. . T1 = A∗1 TA1 = . .. .. 0 · · · τf
η1
η1
V1 = A∗1 VA1 .
Da die kinetische Energie positiv definit ist, sind alle Eigenwerte τi > 0. Dies bietet die Grundlage f¨ ur den zweiten Schritt. 2. Schritt: Wir dehnen oder stauchen das Ellipsoid T = const durch eine Transformation mit der Matrix
A2 =
−1/2
τ1
.. . 0
··· 0 .. .. . . −1/2 · · · τf
ζ2
ζ2
zur Einheitskugel: η = A2 ζ ,
1 ∗ T = ζ˙ T2 ζ˙ , 2
1 V = ζ ∗ V2 ζ , 2
ζ1
ζ1
T2 = 1 , V2 = A∗2 VA2 . In dieser Stauchung liegt der nicht orthogonale Kern der Gesamttransformation. 3. Schritt: Diagonalisieren wir nun V durch eine orthogonale Matrix A3 . Da T2 = 1 gegen orthogonale Transformationen invariant ist, erhalten wir ζ = A3 ξ ,
1 ∗ T = ξ˙ T3 ξ˙ , 2
ξ2
1 V = ξ ∗ V3 ξ , 2
T3 = A∗3 T2 A3 = 1 ,
ξ2
ξ1
λ1 · · · 0 . . ∗ . . ... V3 = A3 V2 A3 = .. . 0 · · · λf 108
ξ1
Mit A = A1 A2 A3 erhalten wir also die angestrebte Gesamttransformation q = Aξ ,
(212)
durch welche die Matrizen T und V in ˆ = A∗ TA = 1 T und
(213)
λ1 · · · 0 . ∗ ˆ V = A VA = .. . . . ... 0 · · · λf
(214)
u ¨bergehen. Damit erhalten wir die einfache Lagrangefunktion 1 X ˙2 1 X ξ − λi ξi2 , 2 i i 2 i
L=
die zu den Bewegungsgleichungen (210) f¨ uhrt. Zur Berechnung der Transformationsmatrix A brauchen wir nicht von der Zerlegung des Existenzbeweises in Einzelschritte auszugehen, sondern k¨onnen sogleich die Gesamttransformation in einem Schritt konstruieren. Dazu setzen wir A in der Form A = (a1 , . . . , af )
(215)
aus Spaltenvektoren al zusammen und notieren die Transformation in der Form q = Aξ =
X
ξ l al .
l
Mit den Bewegungsgleichungen T¨ q + Vq = 0 [vgl. Gl. (208)] und ξ¨l = −λl ξl [vgl. Gl. (210)] erhalten wir dann X l
ξl (V − λl T)al = 0 .
Da die Koordinaten ξl unabh¨angig sind, erhalten wir f¨ ur die gesuchten al das linear homogene Gleichungssystem (V − λl T)al = 0 . 109
(216)
Die Vektoren al erf¨ ullen also eine Beziehung, die die Definition von Eigenvektoren verallgemeinert. Die Bedingung, daß nicht–triviale L¨osungen existieren, f¨ uhrt wieder auf Gl. (211). Unser Existenzbeweis stellt sicher, daß diese Polynomgleichung tats¨achlich f reelle Werte λl liefert. Nat¨ urlich ist al durch Gl. (216) nur bis auf einen konstanten Faktor bestimmt. Im Prinzip sollte dieser Faktor durch die Normierung [vgl. (213)] a∗l Tal = 1
(217)
festgelegt werden. Tats¨achlich kann auf die Normierung aber verzichtet werden43 , wenn die Umkehrtransformation A−1 = A∗ T
(218)
nach Gl. (213) nicht ben¨otigt wird.
4.4
Die formale Durchfu ¨ hrung
¨ Wir fassen die obigen Uberlegungen in dem folgenden Rechenprogramm zusammen. Dabei setzen wir zun¨achst voraus, daß keine Entartung vorliegt, d.h. daß alle λl verschieden sind. ˜ 0 und benutze die Abweichungen 1. Suche die fragliche Gleichgewichtslage q qk = q˜k − q˜k0 als generaliesierte Koordinaten. 2. Entwickle T und V in der Umgebung der Gleichgewichtslage bis zur quadratischen Ordnung und bringe sie in die Form T =
1X 1 Tij q˙i q˙j = q˙ ∗ Tq˙ , 2 i,j 2
V =
1X 1 Vij qi qj = q∗ Tq . 2 i,j 2
Dabei ist unbedingt darauf zu achten, daß T und V symmetrisch gew¨ahlt werden (Tij = Tji und Vij = Vji )! 3. Bilde das charakteristische Polynom [vgl. (211)] det(V − λT) = 0 . 43
Das bedeutet, daß die Achsen zum Schluß noch einmal gestaucht werden. Hierbei bleibt die Entkoppelung erhalten. Nat¨ urlich spielt auch das Vorzeichen von al keine Rolle.
110
Es besitzt f relle L¨osungen λl deren Vorzeichen Auskunft u ¨ber die Stabilit¨at des Gleichgewichts geben: Sind alle λl > 0, so ist das System stabil, ist mindestens ein λl < 0, labil. Indifferentes Gleichgewicht (das aber i.a. genauer untersucht werden muß) liegt vor, wenn alle λl ≥ 0 sind und mindestens ein λl = 0 ist. F¨ ur stabile Systeme erh¨alt man die Eigenfrequenzen ωl =
q
λl .
4. Bestimme f¨ ur jedes λl einen Eigenvektor al aus der Beziehung [vgl. (216)] (V − λl T)al = 0 . Eine Normierung der Eigenvektoren nach Gl. (217) ist nur dann erforderlich,wenn die Umkehrtransformation (218) ben¨otigt wird. 5. Die Normalkoordinaten erf¨ ullen die einfachen Bewegungsgleichungen [vgl. (210)] ξ¨l + λl ξl = 0 . Ihre L¨osungen lassen sich mit der Matrix [vgl. (215)] A = (a1 , . . . , af ) gem¨aß [vgl. (212)] q = Aξ
oder qk =
X
alk ξl
l
auf die alten Koordinaten q u ¨bertragen. Nimmt man insbesondere an, daß nur eine “mode”, d.h. eine isolierte Eigenschwingung ξl , angeregt ist (ξi = 0 f¨ ur i 6= l), so erh¨alt man durch q(l) = ξl al
eine Beschreibung des Bewegungsablaufs dieser isolierten Mode. 6. Ist der Bewegungsablauf durch Anfangsbedingungen q(0) und q(0) ˙ vorgege˙ ben, so erh¨alt man die entsprechenden Anfangsbedingungen ξ(0) und ξ(0) aus der Umkehrtransformation ξ = A−1 q . Hat man die Eigenvektoren nach Gl. (217) normiert (vgl. Punkt 4.), so erh¨alt man A−1 aus Gl. (218). [Abschließend m¨ ussen wir in unserem Konzept noch den Sonderfall der Entartung er¨ortern. Dieser stellt eher ein Problem f¨ ur die theoretische Begr¨ undung als f¨ ur die praktische Auswertung dar. Wenn n¨amlich zwei oder mehr Eigenwerte des charakteristischen Polynoms (211) gleich werden, so brauchen wir nur den Punkt 4 unseres Programms zu modifizieren: Ist λl eine m–fache Nullstelle von Gl. (211), so spannen die L¨osungen von Gl. (216) einen m–dimensionalen Unterraum U m auf.
111
• Wenn die Umkehrtransformation (218) nicht ben¨otigt wird, k¨onnen wir einfach (1) (m) m beliebige linear unabh¨angige Vektoren al , . . . , al aus Um ausw¨ahlen. • Wollen wir jedoch die Umkehrtransformation nach Gl. (218) bilden (vgl. 6.), so m¨ ussen wir m Vektoren a1l , . . . , am l konstruieren, die im Einklang mit Gl. (217) den “Orthogonalit¨atsrelationen” µ aν∗ l Tal = δνµ
gen¨ ugen. Hierzu kann man wieder von einem beliebigen linear unabh¨angigen Sy(1) (m) stem al , . . . , al ausgehen und etwa nach dem Schmidtschen Verfahren orthogonalisieren: Dabei setzt man (1)
(1)
a1l = α11 al , a2l = α21 al
(2)
+ α22 al
...
und bestimmt die α’s sukzessive so, daß 1 1∗ 2 2∗ 2 a1∗ l Tal = 1, al Tal = 0, al Tal = 1, . . .
gilt.]
4.5
Gekoppelte Pendel
Zur Illustration des Verfahrens betrachten wir das einfache Beispiel zweier gleicher mathematischer Pendel (Masse m, L¨ange `), die durch eine (schwache) Feder (k) gekoppelt sind. Die L¨ange der entspannten Kopplungsfeder sei gleich dem Abstand d der Aufh¨angepunkte (siehe Skizze), so daß die Gleichgewichtslage nicht ver¨andert wird.
y
d
ϑ2 l
ϑ1 m
l
m
Von S. 47 u ucke ¨ bernehmen wir die Ausdr¨ x m T = `2 ϑ˙ 2 und V = −mg` cos ϑ x20 x2 x10 x1 2 f¨ ur die kinetische und die potentielle Energie eines Pendels. Bei unseren gekoppelten Pendeln m¨ ussen wir nun die entsprechenden Terme f¨ ur beide Pendel addieren. Außerdem ist die potentielle Energie durch die Kopplungsenergie Vk ≈
k k (x2 − x1 − d)2 = `2 (sin ϑ1 − sin ϑ2 )2 2 2
zu erg¨anzen. Damit erhalten wir T =
m 2 ˙2 ˙2 ` ( ϑ1 + ϑ2 ) 2 112
und
k V = −mg`(cos ϑ1 + cos ϑ2 ) + `2 (sin ϑ1 − sin ϑ2 )2 . 2
Wir gehen nun nach den Programmpunkten des vorigen Abschnitts vor: 1. Die Gleichgewichtslage liegt nach Konstruktion bei ϑ1 = ϑ2 = 0. (Nat¨ urlich kann man das auch aus ∂V /∂ϑi = 0 ausrechnen.) 2. Wir sehen nun ϑi (und ϑ˙ i ) als klein an und entwickeln bis zur quadratischen Ordnung, d.h. wir setzen sin ϑi ≈ ϑi
1 cos ϑi ≈ 1 − ϑ2i 2
und
und erhalten m 2 ˙2 ˙2 ` ( ϑ1 + ϑ2 ) 2 k m V = V0 + g`(ϑ21 + ϑ22 ) + `2 (ϑ1 − ϑ2 )2 . 2 2 Dabei ist die Konstante V0 = −2mg` ohne Bedeutung und kann weggelassen werden. Wir k¨onnen T und V deshalb mit den Matrizen T =
T = m`
2
!
1 0 0 1
und V = m`
g `
2
k +m k −m
k −m g k +m `
!
in der Form 1 T = (ϑ˙ 1 , ϑ˙ 2 )T 2
ϑ˙ 1 ϑ˙ 2
!
1 und V = (ϑ1 , ϑ2 )V 2
ϑ1 ϑ2
!
schreiben. 3. Das charakteristische Polynom det(V − λT) = 0 oder
g `
k +m −λ k −m
g `
− mk k +m −λ
=
k g + −λ ` m
!2
−
k2 = 0 m2
besitzt die beiden positiven L¨osungen g g k und λ2 = + 2 . ` ` m Das Gleichgewicht ist also (nat¨ urlich) stabil. Das Pendelsystem f¨ uhrt bei einer St¨orung Schwingungen der Eigenfrequenzen λ1 =
ω1 =
r
g `
und/oder ω2 =
aus. 113
s
g k +2 ` m
4. Wir bestimmen die Eigenvektoren al aus (V − λl T)al = 0 . F¨ ur l = 1, d.h. λl = g/`, erhalten wir k m
1 −1 −1 1
!
!
a11 a12
= 0,
α α
also a1 =
!
mit beliebigem α. Entsprechend folgt f¨ ur l = 2, d.h. λl = g/` + 2k/m k − m
1 1 1 1
!
!
a21 a22
= 0,
also a2 =
α −α
!
.
Da T bis auf den Vorfaktor m`2 gleich der Einheitsmatrix ist, sind a1 und a2 bereits urde √ orthogonal. Eine Normierung nach der formalen Vorschrift w¨ 2 α = 1/ 2m` erfordern. Wir verzichten darauf und w¨ahlen der Einfachheit halber α = 1. 5. Die Normalkoordinaten ξl f¨ uhren harmonische Schwingungen der Frequenz ωl aus. Mit der Matrix 1 1 1 −1
A = (a1 , a2 ) =
!
lassen sich daraus die urspr¨ unglichen Koordinaten ϑ1 ϑ2
!
ξ1 ξ2
=A
!
=
ξ1 + ξ 2 ξ1 − ξ 2
!
berechnen. F¨ uhrt das System insbesondere nur die Eigenschwingung 1 aus (ξ2 = 0), so folgt ϑ1 = ϑ 2 . Beide Pendel schwingen also gleichsinnnig mit gleicher Amplitude, so daß die Koppelfeder gar nicht gedehnt wird. Daher erhalten wir die ungest¨orte Pendelfrequenz q ω1 = g/` . F¨ ur die Eigenschwingung 2 (ξ1 = 0) erhalten wir dagegen ϑ1 = −ϑ2 . Die Pendel schwingen also gegensinnig mit gleicher Amplitude, so daß die Koppelfeder maximal beansprucht wird. Da ihr Mittelpunkt bei dieser Mode in Ruhe bleibt, kann sie durch zwei Federn halber L¨ange und doppelter Federkonstante ersetzt werden. Dies erkl¨art die Eigenfrequenz ω2 =
q
g/` + 2k/m .
114
6. Unter Beachtung der Orthogonalit¨at und der Normierung erhalten wir die Matrix ! 1 ∗ 1 1 1 −1 A = A = 2 2 1 −1 der Umkehrtransformation. Daher gilt 1 1 ξ1 = (ϑ1 + ϑ2 ) und ξ2 = (ϑ1 − ϑ2 ) . 2 2 Wenn wir die Pendel beispielsweise mit den Anfangsbedingungen ϑ1 (0) = 2c ,
ϑ2 (0) = ϑ˙ 1 (0) = ϑ˙ 2 (0) = 0
starten, so folgt ξ1 (0) = ξ2 (0) = c ,
ξ˙1 (0) = ξ˙2 (0) = 0 .
Wir erhalten also die spezielle L¨osung ξ1 = c cos ω1 t ,
ξ2 = c cos ω2 t
oder nach R¨ ucktransformation c 1 1 t cos ω2 +ω t cos ω2 −ω 2 2 2 c 1 1 = c(cos ω1 t − cos ω2 t) = t sin ω2 +ω t. sin ω2 −ω 2 2 2
ϑ1 = c(cos ω1 t + cos ω2 t) = ϑ2
F¨ ur schwache Kopplung (d.h. k/m g/` oder ω2 ≈ ω1 ) ergibt dies die bekannte Schwebung, bei der die gesamte Schwingungsenergie mit der kleinen Differenzfrequenz zwischen den beiden Pendeln ausgetauscht wird.
115
5
Spezielle Relativit¨ atstheorie
5.1
Galileisches und Einsteinsches Relativit¨ atsprinzip
Wir betrachten ein Koordinatensystem K0 , das sich gegen¨ uber unserem Inertialsystem K mit der konstanten Geschwindigkeit v bewegt. Der Zusammenhang44 r0 = r − vt
(219)
zwischen den Ortskoordinaten (x, y, z) in K und den entsprechenden Koordinaten (x0 , y 0 , z 0 ) in K0 heißt Galileitransformation. Wir hatten bereits in den Abschnitten 1.1 und 1.8 festgestellt, daß die Grundgesetze der Mechanik “Galileiinvariant”, d.h. invariant gegen Galileitransformationen, sind. Denn wegen v˙ = 0 folgt aus (219) mi ¨r0i = mi ¨ri = Fi .
(220)
Die Newtonschen Bewegungsgleichungen bieten also keine M¨oglichkeit, zwischen den Koordinatensystemen K und K0 zu unterscheiden, ⇒ • Galileisches Relativit¨ atsprinzip: Alle gleichf¨ormig gegeneinander bewegten Koordinatensysteme sind ¨aquivalent. Es gibt keine M¨oglichkeit, durch mechanische Messungen ein Inertialsystem prinzipiell vor einem andern auszuzeichnen. Im Rahmen der klassischen Mechanik kann also prinzipiell nicht entschieden werden, ob sich ein System im Zustand der ‘Ruhe’ oder der ‘gleichf¨ormigen Bewegung’ (wogegen eigentlich?) befindet45 . Es liegt nun einmal aus philosophisch–¨asthetischen Gr¨ unden, mehr noch aber aufgrund der experimentellen Erfahung, die um die Wende zum 20. Jahrhundert gewonnen wurde, nahe, dieses Relativit¨atsprinzip auf die gesamte Physik zu u ¨bertragen. Wir postulieren daher • Einsteinsches Relativit¨ atsprinzip: Alle gleichf¨ormig gegeneinander bewegten Koordinatensysteme sind ¨aquivalent. Es gibt keine M¨oglichkeit, durch physikalische Messungen ein Inertialsystem prinzipiell vor einem andern auszuzeichnen. Mit diesem Postulat kommen wir aber sogleich in Schwierigkeiten mit den Grundlagen der Elektrodynamik, wenn wir an der Galileitransformation festhalten. 44
Wir setzen hier und im folgenden voraus, daß die Koordinatenurspr¨ uge von K und K0 zur Zeit t = 0 zusammenfallen. 45 Man kann nicht einmal immer zwischen Scheinkr¨ aften in Nicht–Inertialsystemen und “wahren” (was ist das?) Kr¨ aften in Inertialsystemen unterscheiden! Vgl. dazu auch Abschnitt 5.11.
116
Denn nach dem Relativit¨atsprinzip erhalten wir in jedem Inertialsystem eine Lichtgeschwindigkeit c = (ε0 µ0 )−1/2 . Nach Gl. (219) m¨ ussen wir dagegen in K0 die anisotrope Lichtgeschwindigkeit c0 = c − v cos α
(221)
erwarten, wenn α den Winkel bezeichnet, der zwischen v und der Ausbreitungsrichtung des Lichts liegt. Wenn wir also am Relativit¨atsprinzip festhalten, m¨ ussen wir die Galileitrans¨ formation ab¨andern. Andern wir die aber ab, sind die Newtonschen Bewegungsgleichungen nicht mehr transformationsinvarint und m¨ ussen ebenfalls abge¨andert werden. Wir stehen also vor der grunds¨atzlichen Frage, ob wir an den Newtonschen Bewegungsgleichungen oder (lat. ‘aut’, nicht ‘vel’ !) am Relativit¨atsprinzip festhalten wollen. Wegen der fundamentalen Bedeutung f¨ ur die Grundlagen der gesamten Physik und Naturphilosophie soll das historische experimentum crucis (Michelson 1881, Michelson und Morley 1887, Morley und Miller 1904, Joos 1930) zu dieser Frage im folgenden in seinen Grundgedanken skizziert werden.
5.2
Das Michelson–Experiment
Das Experiment zielt auf einen Vergleich der Lichtgeschwindigkeit in verschiedenen Koordinatensystemen K und K0 , und der erste Grundgedanke liegt darin, die große – und doch gegen c so kleine! – Geschwindigkeit v ≈ 30 km/s ≈ 10−4 c der Erde auf ihrer Bahn um die Sonne auszunutzen. Eine hinreichend genaue Bestimmung der Lichtgeschwindigkeit (mit den damaligen Mitteln!) durch die Messung der Laufzeit u ¨ ber eine bestimmte Strecke scheidet aus, weil die erforderliche Synchronisation am Start– und am Zielpunkt selbst von der Lichtgeschwindigkeit abh¨angt. Man muß also den Hin– und R¨ uckweg eines Lichtstrahls verfolgen. Dabei hebt sich der Einfluß von v aber in erster N¨ahererung weg. Der verbleibende Einfluß der Gr¨oßenordnung v 2 /c2 ∼ 10−8 ist aber so klein, daß nur ein Interferenzversuch infrage kommt. Hierzu brauchen wir noch einen zweiten Hin– und R¨ uckweg. Nach dieser Vorkl¨arung k¨onnen wir den grunds¨atzlichen Aufbau des Experiments schematisch skizzieren: Das Licht einer monochromatischen Lichtquelle L wird durch einen halbdurchl¨assigen Spiegel S0 in zwei Strahlen (x– und y–Richtung) aufgespalten, die nach Reflexion an den Spiegeln Sx und Sy auf dem Schirm Sch interferieren. Die Wege lx und ly sind dabei etwa gleich lang (siehe Skizze). 117
Sy
ly S0
lx
L
Sx
Sch Wir nehmen nun an, daß Gl. (221) gilt und daß sich die Lichtgeschwindigkeit c ¨ auf einen ruhenden “Ather” bezieht. Die Apparatur bewege sich mit einer Ge¨ schwindigkeit v in x–Richtung gegen den Ather. Dann braucht das Licht f¨ ur den Weg S0 –Sx –S0 die Laufzeit tx =
lx 2lx lx + = , c−v c+v c(1 − β 2 )
wenn wir hier und im folgenden die u urzung ¨bliche Abk¨ β = v/c
(222)
benutzen. F¨ ur die konkurrierende Laufzeit ty auf dem Weg S0 –Sy –S0 gilt (nach Pythagoras) die Beziehung q
cty = 2 ly2 + ( 21 vty )2 =
q
4ly2 + v 2 t2y .
L¨osen wir nach ty auf, so erhalten wir (5.2) 2ly ty = √ . c 1 − β2 Insgesamt folgt also eine Laufzeitdifferenz "
lx ly 2 √ − δtk = tx − ty = c 1 − β2 1 − β2
#
Und nun kommt der entscheidende Schritt: Drehen wir die Apparatur um 90o , so vertauschen x und y ihre Rollen, und wir erhalten "
#
l ly 2 √ x 2− . δt⊥ = c 1 − β2 1−β 118
Die Differenz #
"
lx + l y 2 1 2(lx + ly ) 1 ≈ −√ β ∆t = δtk − δt⊥ = 2 2 c 1−β c 1−β sollte man als Verschiebung des Interferenzmusters beobachten k¨onnen. Um allerding einen Gangunterschied von c∆t ∼ 5 · 10−7 m , der der Wellenl¨ange von gelbem Licht entspricht, zu erzielen, ben¨otigt man f¨ ur −4 β = 10 Wegstrecken lx + ly ∼ 50m , die im Sub–µm–Bereich stabil sind! Dies ist mit verschiedenen technischen Tricks tats¨achlich erreicht worden. Man hat den Versuch unter verschiedenen Bedingungen und Annahmen mehrfach mit steigender Genauigkeit wiederholt und immer ein negatives Ergebnis gefunden: • Die Lichtgeschwindigkeit ist unter allen Bedingungen isotrop und gleich c. Wir m¨ ussen daraus schließen, daß die Galileitransformation und die Galileiinvarianten Newtonschen Bewegungsgleichungen f¨ ur hohe Geschwindigkeiten zu korrigieren sind.
5.3
Die Lorentztransformationen
Die Ausbreitung eines Lichtblitzes, der zur Zeit t = 0 im Ursprung erzeugt wurde, folgt im System K der Gleichung x2 + y 2 + z 2 = c 2 t 2 . Da wir festgestellt haben, daß auch in K0 eine isotrope Lichtausbreitung mit der Geschwindigkeit c beobachtet wird, liegt es zun¨achst nahe, anzunehmen, daß dort 2
2
2
x0 + y 0 + z 0 = c 2 t 2 gilt. Das heißt aber, daß K0 und K durch eine orthogonale Transformation im R3 verkn¨ upft sind: r0 geht durch eine reine Drehung aus r hervor. Daß eine isotrope Kugelwelle bei einer reinen Drehung des Koordinatensystems invariant bleibt, ist trivial. Eine solche Drehung beschreibt aber offensichtlich nicht die gew¨ unschte Relativbewegung der Koordinatensysteme. Das Fatale ist nun, daß die Drehung die einzige M¨oglichkeit ist, unseren ersten Ansatz zu befriedigen. 119
Wir stehen deshalb vor der befremdlichen Notwendigkeit, unseren Ansatz zu modifizieren und neben der Transformation r → r0 auch eine Transformation t → t0 der Zeit zuzulassen. Die Konstanz der Lichtgeschwindigkeit wird dann durch die Gleichung 2
2
2
x2 + y 2 + z 2 − c 2 t 2 = x 0 + y 0 + z 0 − c 2 t 0
2
= 0
(223)
beschrieben. Die rein formale Anschrift dieser Beziehung legt es nahe, einen vierdimensionalen Raum mit den Koordinaten x1 = x ,
x2 = y ,
x3 = z ,
x4 = ict
einzuf¨ uhren. Die Konstanz der Lichtgeschwindigkeit schreibt sich dann in der Form46 4 X
x2ν =
4 X
2
x0 ν = 0 .
(224)
ν=1
ν=1
Hierbei ist allerdings st¨orend, daß wir eine imagin¨are Koordinate x4 = ict benutzen, die zu recht seltsamen Konsequenzen f¨ uhrt. Beispielsweise kann die Summe von Quadraten negativ werden, und wir k¨onnen rechtwinklig gleichschenklige Dreiecke mit der Hypothenuse Null bilden. Wir bewegen uns also nicht mehr in dem vertrauten euklidischen Raum, sondern in einem vierdimensionalen Raum mit einer ungewohnten Metrik, im Minkowskiraum. Es gibt nun verschiedene Argumente, eine lineare Transformation x0ν
=
4 X
ανµ xµ
oder kurz x0 = Ax
(225)
µ=1
zwischen den Koordinaten in K und K0 zu fordern. Einmal soll f¨ ur kleine v c die lineare Galileitransformation reproduziert werden. Gewichtiger aber ist, daß nicht–lineare Terme die Homogenit¨at von Raum und Zeit verletzen w¨ urden. Denn wir erwarten, daß die Koeffizienten ανµ =
∂x0µ ∂xν
nicht von x, also von der Lage r und der Zeit t, abh¨angen. Sie sollen dagegen allein von der Geschwindigkeit v zwischen K und K0 abh¨angen. 46
Wir folgen in diesem Kapitel dem allgemeinen Gebrauch, im vier dimensionalen Raum griechische Indizes, im dreidimensionalen Ortsraum dagegen lateinische Indizes zu verwenden.
120
Eine invertierbare lineare Transformation (225), die Gl. (224) erf¨ ullt, ist aber 47 notwendigerweise eine orthogonale Transformation im vierdimensionalen Minkowskiraum. Eine solche Transformation heißt Lorentztransformation. Orthogonale Transformationen lassen sich vorteilhaft als Drehungen veranschaulichen. Bei der Interpretation einer Lorentztransformation als Drehung sollten wir aber vorsichtig sein, weniger wegen der Schwierigkeit, unsere Anschauung auf vier Dimensionen auszudehnen, als wegen des imagin¨aren Charakters der Koordinate x4 (oder besser: wegen der nicht–euklidischen Metrik des Minkowskiraumes). Aber selbstverst¨andlich sind reine Drehungen im R3 (s.o.) auch Lorentztransformationen. Sie dr¨ ucken die Isotropie des Raumes und speziell der Lichtausbreitung aus. Wegen der Isotropie k¨onnen wir o.B.d.A. annehmen, daß v in der x3 –Richtung liegt. Wir sprechen nun von einer speziellen Lorentztransformation, wenn sie keine r¨aumliche Drehung enth¨alt. Da keine Drehachse vorliegt, ist x3 dabei die einzige ausgezeichnete Raumrichtung. Die Koordinaten x1 und x2 sind daher im wesentlichen an der Transformation unbeteiligt. Insbesondere wird die Zugeh¨origkeit eines Punktes zur x2 –x3 –Ebene (x1 = 0) oder zur x1 –x3 –Ebene (x2 = 0) nicht ber¨ uhrt, es gilt also x01 = ax1
und x02 = ax2
oder α11 = α22 = a und α12 = α13 = α14 = α21 = α23 = α24 = 0 . Der Koeffizient a kann nur vom Betrag der Geschwindigkeit v abh¨angen. Darum ¨ gilt umgekehrt nach dem Auivalenzprinzip auch x1 = ax01
und x2 = ax02 ,
und wir folgern a = 1. urfen nat¨ urlich auch nicht von x1 und x2 abh¨angen, Die Koordinaten x03 und x04 d¨ es gilt also α31 = α32 = α41 = α42 = 0 Die spezielle Lorentztransformation wird also durch eine Matrix der Form
As = 47
1 0 0 0
0 0 0 1 0 0 0 α33 α34 0 α43 α44
(226)
Wir benutzen imagin¨ are Zahlen nur als formales Hilfsmittel. Daher meinen wir wirklich ‘orthogonal’ und nicht ‘unit¨ ar’.
121
beschrieben. Die allgemeine Lorentztransformation erh¨alt man durch Kombination von (226) mit r¨aumlichen Drehungen48 . Wegen dieses Zusammenhangs interessieren wir uns nur f¨ ur die speziellen Lorentztransformationen. Dabei k¨onnen wir uns auf den zweidimensionalen Unterraum (x3 , x4 ) beschr¨anken und die vereinfachte zweidimensionale(!) Anschrift x03 x04
!
=A
!
x3 x4
mit A =
α33 α34 α43 α44
!
(227)
benutzen. Zur Bestimmung der vier Koeffizienten steht uns erstens die Aussage zur Verf¨ ugung, daß sich der Koordinatenursprung von K0 mit der Geschwindigkeit v l¨angs der z–Achse bewegt, also x03 = 0 f u ¨r x3 = vt = −iβx4 . Mit x03 = α33 x3 + α34 x4 [vgl. Gl. (227)] folgt daraus −α33 iβ + α34 = 0 oder α34 = iβα33 .
(228)
Damit ist die Herleitung schon fast abgeschlossen, denn der Rest folgt einfach aus den drei Orthogonalit¨atsbeziehungen 2 2 α33 + α34 = 1 2 α43 + α44 = 1 α33 α43 + α34 α44 = 0 .
(229)
2 Aus Gl. (228) und der ersten Gl. (229) folgt sofort (1 − β 2 )α33 = 1, also
α33 = √
1 1 − β2
und α34 = √
iβ . 1 − β2
Nach den beiden andern Gln. (229) ist der Zeilenvektor (α43 , α44 ) zum Vektor (α33 , α34 ) orthogonal und hat den selben Betrag, bei richtiger Wahl des Vorzeichens gilt also α43 = −α34 und α44 = α33 . Damit ist die Matrix
A=
√1
1−β 2 −iβ √ 1−β 2
√ iβ
1−β 2 √1 1−β 2
(230)
der spezielle Lorentztransformation bereits eindeutig festgelegt. 48
Die allgemeine Form ist A = D2 As D1 . Dabei bezeichnet D1 eine r¨ aumliche Drehung in K und D2 eine in K0 .
122
Die elegante mathematische Herleitung birgt die Gefahr in sich, daß der physikalische Hintergrund nicht mehr deutlich genug gesehen wird. Wir wollen deshalb zus¨atzlich eine elementare Herleitung der Lorentztransformation anf¨ ugen, die unmittelbar an unsere Grundprinzipien ankn¨ upft, ohne explizit auf die lineare Algebra zur¨ uckzugreifen. Zur St¨ utzung der Anschauung benutzen wir hierbei auch die urspr¨ unglichen Bezeichnungen und vermeiden imagin¨are Gr¨oßen. Wir suchen also die Koeffizienten der Transformation z 0 = Az + Bt ,
t0 = Cz + Dt
und benutzen dazu vier unabh¨angige Forderungen: 1. Wie oben spezifizieren wir die Bewegung des Koordinatenursprungs z 0 = 0 von K0 durch z = vt in K und erhalten entsprechend Gl. (228) B = −Av . 2. Die Lichtgeschwindigkeit in positiver z–Richtung ist in beiden Koordinatensystemen gleich: z = ct =⇒ z 0 = ct0 . Mit den Transformationsgleichungen erhalten wir daraus Ac + B = Cc2 + Dc . 3. Das selbe gilt f¨ ur die negative z–Richtung: z = −ct
=⇒
z 0 = −ct0 .
Wir finden entsprechend Ac − B = −Cc2 + Dc . Wir k¨onnen nun die Beziehungen aus 2. und 3. addieren und subtrahieren und erhalten B D = A und C = 2 . c Mit 1. nimmt dann unsere Transformation bereits die Gestalt z 0 = (z − vt)A ,
t0 = (− cv2 z + t)A
an. Lediglich der Faktor A kann noch nicht festgelegt werden. Das ist auch verst¨andlich, da ein gemeinsamer Faktor in der Transformation von Ort und Zeit die Lichtgeschwindigkeit nicht beeinflußt. Wir brauchen also noch eine vierte Bedingung, und die finden wir im 123
4. Relativit¨atsprinzip: K und K0 sind ¨aquivalent, die Transformation zwischen K und K0 muß abgesehen von dem Vorzeichen von v symmetrisch sein. L¨osen wir die Transformation nach z und t auf, erhalten wir z=
1 (z 0 + vt0 ) v2 (1 − c2 )A
t=
Das Relativit¨atsprinzip verlangt also
1 ( cv2 z 0 + t0 ). v2 (1 − c2 )A
1 2 (1 − vc2 )A
A=
oder
A= q
1 1−
v2 c2
.
Auf diese Weise sehen wir ohne Anleihen bei der linearen Algebra, daß die grundlegenden Postulate, welche die Erfahrungen entsprechender Experimente zusammenfassen, notwendig auf die Transformationsgleichungen 0
z =
z − vt
q
1−
v2 c2
0
,
− cv2 z + t
t = q
1−
v2 c2
(231)
mit den Umkehrungen v
z 0 + vt0 z=q , 2 1 − vc2
c2 t= q
z 0 + t0 1−
v2 c2
(232)
f¨ uhren. Man u ¨berzeugt sich leicht, daß die Transformation (231) mit den Gln. (227) und (230) u ¨ bereinstimmt.
5.4
Die Zeitdilatation
F¨ ur unsere Anschauung bleibt es eine ¨außerst befremdliche Eigenschaft der Lorentztransformation, daß wir keine universelle Zeit einf¨ uhren k¨onnen, sondern die Zeiten t und t0 unterscheiden m¨ ussen. Gleichzeitige Ereignisse an verschiedenen Orten in K sind in K0 nicht mehr gleichzeitig, und umgekehrt. Die Uhren in K und in K0 gehen außerdem verschieden schnell. Und welche geht dabei schneller? Eine Uhr bei z = z0 in K gebe die Zeitsignale t1 und t2 . Dann erscheint das Zeitintervall t2 − t 1 t02 − t01 = √ 1 − β2
(233)
√ in K0 um den Faktor 1/ 1 − β 2 gegen¨ uber dem Zeitintervall t2 − t1 in K gedehnt.
124
Wir wollen das formale Ergebnis direkt auf die Konstanz der Lichtgeschwindigkeit zur¨ uckf¨ uhren. Zur Zeit t1 = 0 werde in K am Ort z0 = 0 ein Lichtblitz in y– Richtung ausgesandt, an einem Spiegel Sy im Abstand ly reflektiert und zur Zeit t2 = 2ly /c wieder am Ort z = 0 empfangen. Ein Beobachter in K0 registriert das Aussenden des Lichtblitzes am Ort z10 = 0 zur Zeit t01 = 0. Er empf¨angt das reflektierte Licht aber an einem anderen Ort z20 = −vt02 (siehe Skizze). y ly
0
y
K Sy
ly
z
0
0
K’
Sy
z’ −vt’2
0
In K0 hat das Licht also nicht den Weg 2ly , sondern den l¨angeren Weg q
2 ly2 + ( 12 vt02 )2 zur¨ uckgelegt und daf¨ ur eine l¨angere Zeit gebraucht. Die Auswertung k¨onnen wir direkt vom Lichtweg cty im Michelson–Experiment (S. 118) u ¨bernehmen, wir erhalten Gl. (233). Ein Beobachter in K0 stellt also fest, daß die Uhren in K nachgehen. Woher kommt diese Unsymmetrie? Kann ich nun doch zwischen ’ruhenden’ und ’bewegten’ Koordinatensystemen unterscheiden? Ist etwa dasjenige System absolut ruhend, in dem die Uhren am allerlangsamsten gehen? Nat¨ urlich nicht! Das Ergebnis ist inhaltlich auch gar nicht unsymmetrisch, denn ein Beobachter in K wird genauso feststellen, daß die Uhren in K0 nachgehen! Die formale Unsymmetrie wird ausschließlich durch unsymmetrische Beobachtungsbedingungen erzeugt. Wir haben oben n¨amlich eine Uhr an einem bestimmten Ort in K mit zwei synchronisierten Uhren an verschiedenen Orten in K0 verglichen. Langsamer geht also immer die eine Uhr, die in ihrem Koordinatensystem ruht. Eine nat¨ urliche Uhr, die das illustriert, finden wir in den Myonen, welche die kosmische Strahlung am Rand der Atmosph¨are, also in etwa 10 km H¨ohe bildet. W¨ahrend seiner typischen Lebensdauer von τµ = 2.2 · 10−6 s kann ein Myon n¨amlich h¨ochstens die Strecke cτµ = 660 m zur¨ ucklegen. Wenn wir an der Erdoberfl¨ache trotzdem solche Myonen finden, so bedeutet das, daß unsere Uhren schneller gehen als die innere Uhr des Myons. Denn zwischen der Erzeugung des 125
Myons und seinem Nachweis vergeht auf der schnellebigen Erde eine Zeit von etwa 15τµ . Man beachte hier wieder die Unsymmetrie einer Uhr (τµ ) im System des Myons und zweier r¨aumlich getrennter Uhren (Erzeugung und Nachweis) auf der Erde. Von der ruhenden Erde aus gesehen kann ein schnelles Myon also ein biblisches Alter von mehr als 15τµ erreichen. Und von diesem Gedanken aus ist nur noch ein kurzer Schritt zum Zwillingsparadoxon. Der Zwilling, der seinen Bruder im schnellen Raumschiff ins All geschickt hat, findet n¨amlich, daß dessen Uhr, Herzschlag, Gedanken, Gef¨ uhle und schließlich der gesamte Alterungprozeß verlangsamt ablaufen. Ein leicht vergessener Haken hierbei ist allerding zun¨achst, daß der Zwilling im Raumschiff das selbe u ¨ber seinen Bruder auf der Erde feststellt. Zum Paradoxon wird diese Science fiction story erst, wenn der jugendliche Raumfahrer zur Erde zur¨ uckkeht und nun im ¨ selben Bezugssystem seinem greisen Bruder gegen¨ ubersteht. Die Aquivalenz der beiden Systeme ist nun durch die Umkehr des Raumschiffes aufgehoben.
5.5
Die Lorentzkontraktion
Im Bezugssystem K seien zwei Meilensteine bei z1 und z2 aufgestellt. Diese Meilensteine werden nun von K0 aus zu einer Zeit t0 vermessen. Da wir beide Meilensteine zur gleichen Zeit t0 (und nicht t !) beobachten, gehen wir von der Umkehr transformation (232) aus und erhalten den Zusammenhang z20 − z10 =
q
1 − β 2 (z2 − z1 ) .
(234)
√ Wegstrecken und Maßst¨abe in K erscheinen also in K0 um den Faktor 1 − β 2 verk¨ urzt. Man nennt diesen Effekt Lorentzkontraktion oder Lorentz–Fitzgeraldsche L¨angenkontraktion. Wir brauchen kaum noch zu erl¨autern, daß wir wieder nur eine scheinbare Unsymmetrie zwischen K und K0 haben. Ein in K0 ruhender Maßstab erscheint von K aus gemessen genau so verk¨ urzt, wie der in K ruhende von K0 aus. Formal haben wir eine Unsymmetrie durch die Forderung der Gleichzeitigkeit t01 = t02 in K0 erzeugt. In Wirklichkeit ist immer nur dasjenige System ausgezeichnet, in dem der Maßstab ruht. In diesem System ist der Maßstab l¨anger als in allen anderen Systemen. Entsprechend war bei der Zeitdilatation dasjenige Koordinatensystem ausgezeichnet, in dem die beobachtete Uhr ruht: In diesem System geht die Uhr langsamer als in allen andern Koordinatensystemen. Nun sind Raum und Zeit als Komponenten einer zusammengeh¨origen Raum– Zeit im Minkowskiraum im wesentlichen gleichberechtigt, und auch die Lor126
entztransformation spiegelt die wesentliche Symmetrie von Raum und Zeit wider. Woher kommt denn dann die Unsymmetrie einer Zeitdehnung und einer L¨angenkontraktion, wenn man das durch die Versuchsbedingungen ausgezeichnete Eigensystem, in dem Uhr und Maßstab ruhen, verl¨aßt? Diese Unsymmetrie zwischen Raum und Zeit ist in der unsymmetrischen Meßvorschrift begr¨ undet: • Bei der Zeitdilatation messen wir zwei Zeitmarken einer Uhr, die in K lokalisiert ist. Die beiden Zeitmessungen in K0 erfolgen also bei gleichen Ortskoordinaten in K. • Bei der Lorentzkontraktion f¨ uhren wir dagegen die beiden Ortsmessungen in K0 gleichzeitig, d.h. bei gleichen Zeitkoordinaten in K0 aus. Tats¨achlich besteht ein enger innerer Zusammenhang zwischen der Lorentzkontraktion und der Zeitdilation, wie man sofort an einer Uminterpretation der Myonenbeobachtung aus dem vorigen Abschnitt erkennt: Der Abstand zwischen dem Erzeugungsort (Atmosph¨arenrand) und dem Nachweisort (Erdoberfl¨ache) definiert einen Maßstab, der im System der Erde ruht. Vom System eines schnellen Myons aus gesehen erscheint dieser Abstand (∼ 10 km) so verk¨ urzt (< 660 m), daß es ihn w¨ahrend seiner kurzen Lebensdauer τµ durchlaufen kann. Aufgrund der Lorentzkontraktion erwartet man typische Verzerrungen der Gestalt schnell bewegter Objekte auf der Photoplatte oder auf der Netzhaut. Denn gerade der Verschluß des Fotoapparats demonstriert uns anschaulich die Bedin¨ urlich ist eine experimentelle Uberpr¨ ufung gung der Gleichzeitigkeit in K0 . Nat¨ wegen der Kleinheit des Effekts bei realistischen Fotoobjekten nicht m¨oglich. Darum war die Menschheit in dieser Frage auch lange einem Irrtum erlegen. In Wirklichkeit machen n¨amlich konkurrierende Laufzeiteffekte des Lichts die Lorentzkontraktion (lokal) unsichtbar ! Wir zeigen das beispielhaft an einem achsenparallelen W¨ urfel (in der Skizze durch das Quadrat ABCD repr¨asentiert), der sich mit der Geschwindigkeit v in z– Richtung bewegt, und durch ein paralleles Lichtb¨ undel auf eine Fotoplatte in der xy-Ebene abgebildet wird (siehe Skizze auf der folgenden Seite). Das Bild A0 B0 der Grundseite AB erscheint zwar auf der Photoplatte wegen der Lorentzkontraktion mit der verk¨ urzten L¨ange q
l2 = l 1 − β 2 . Wegen der Endlichkeit der Lichtgeschwindigkeit erreicht aber zum gleichen Zeitpunkt auch noch Licht die Photoplatte, das zu fr¨ uheren Zeitpunkten von Punkten der Seite DA ausgesandt wurde. Das Bild D0 A0 dieser Seite hat die L¨ange l1 =
vl = βl . c 127
D
C
D
C
C D
B l
α
l
v
l
A A’
l
A B
l
A B’
l1
D’
α
B
l2
A’
B’
D’
l1
l2
A’
B’
Auf dem Bild sieht man folglich ein unverzerrtes Quadrat der unver¨anderten Seitenl¨ange l, das aufgrund der Lorentzkontraktion und der endlichen Laufzeit des Lichts um einen Winkel α mit sin α = β gedreht erscheint. Entsprechende Verh¨altnisse findet man bei parallelen Lichtb¨ undeln (kleinen Raumwinkeln) f¨ ur alle Beobachtungsrichtungen. Da der Drehwinkel jedoch von der Richtung abh¨angt, erscheinen gr¨oßere Objekte verbogen.
5.6
Die Gruppeneigenschaft der Lorentztransformation
Wir gehen mit einer Lorentztransformation x03 x04
!
x3 x4
=A
!
mit A = q
1 1 − β12
1 iβ1 −iβ1 1
!
von einem Koordinatensystem K zu einem System K0 und von da aus mit einer zweiten Lorentztransformation x003 x004
!
x03 x04
=B
!
mit B = q
1 1 − β22
1 iβ2 −iβ2 1
!
zu einem Kordinatensystem K00 u ¨ ber. Wie sieht dann die Gesamttransformation x003 x004
!
=C
x3 x4
!
mit C = BA
aus? Zur Beantwortung dieser Frage rechnen wir BA = AB = q
1 (1 − β12 )(1 − β22 ) 128
1 + β 1 β2 i(β1 + β2 ) −i(β1 + β2 ) 1 + β1 β2
!
1
1 + β 1 β2
= q
1 − β12 − β22 + β12 β22
= q
(1 + β1 β2 )2 − 2β1 β2 − β12 − β22
= q
(1 + β1 β2 )2 − (β1 + β2 )2
= q
β1 +β2 −i 1+β 1 β2
1 + β 1 β2
1 + β 1 β2
1
(1 − β 2
1 iβ −iβ 1
!
β1 +β2 i 1+β 1 β2 1
!
1 iβ −iβ 1
1 iβ −iβ 1
mit β =
!
!
β1 + β 2 . 1 + β 1 β2
Die Hintereinderausf¨ uhrung zweier spezieller Lorentztransformationen mit β1 = v1 /c und β2 = v2 /c ergibt also wieder eine Lorentztransformation mit β=
β1 + β 2 1 + β 1 β2
oder v = βc =
v1 + v 2 . 1 + v1c2v2
(235)
Die Lorentztransformationen bilden also eine em Gruppe49 . Dieses Ergebnis ist nicht u ¨berraschend. Physikalisch h¨atten wir es eigentlich sofort aus dem Relativit¨atsprinzip postulieren k¨onnen, und mathematisch lassen sich sich die Lorentztransformationen der x3 –x4 –Ebene eineindeutig auf die Drehungen in der Ebene abbilden, die ebenfalls eine Gruppe bilden. Wichtiger als die Feststellung, daß die Hintereinanderausf¨ uhrung von Lorentztransformationen wieder eine Lorentztransformation ergibt, ist f¨ ur uns die Aussage, wie wir die Gesamttransformation erhalten. Die Vorschrift (235), nach der die Gesamtgeschwindigkeit v zu bilden ist, nennt man das Einsteinsche Additionstheorem der Geschwindigkeiten. Die Tatsache, daß sich Geschwindigkeiten nicht einfach additiv zusammensetzen, kann uns nach der Relativierung von Raum und Zeit kaum noch u ¨berraschen. Das additive Gesetz unserer Alltagserfahrung ergibt sich lediglich im Grenzfall v1/c, v2/c → 0, sonst gilt f¨ ur v1 , v2 > 0 immer v < v1 + v2 . Eine wichtige Konsequenz von Gl. (235) ist die prinzipielle Unm¨oglichkeit, durch ¨ Addition von Geschwindigkeiten v1 < c und v2 < c Uberlichtgeschwindigkeiten v > c zu erhalten. Denn f¨ ur 0 < β1 < 1 und 0 < β2 < 1 folgt 1 + β1 β2 = (1 − β1 )(1 − β2 ) + β1 + β2 > β1 + β2 , also β < 1. 49
Hierzu muß außerdem das Assoziationsgesetz, das Einselement und die Umkehrtransformation nachgewiesen werden. Die Ausf¨ uhrung spezieller Lorentztransformationen ist nach der obigen Rechnung sogar kommutativ, sie bilden also eine abelsche Gruppe.
129
F¨ ur v2 = c wird v = c unabh¨angig von v1 . Dies zeigt noch einmal die Lorentzinvarianz der Lichtgeschwindigkeit. Wir kommen noch einmal darauf zur¨ uck, daß wir eine Transformationsmatrix
A=
√1
1−β 2
√−iβ
1−β 2
√ iβ
1−β 2
√1
1−β 2
als Drehung in der Ebene auffassen k¨onnen. Der Drehwinkel ϕ = iϑ ist dabei allerdings imagin¨ar. Wir k¨onnen dem Rechnung tragen, indem wir die von Drehungen in der Ebene vertrauten Kreisfunktionen durch Hyperbelfunktionen ersetzen. Mit β=
v = tanh ϑ c
folgt dann A=
cosh ϑ i sinh ϑ −i sinh ϑ cosh ϑ
!
.
Das Additionstheorem (235) entspricht der Additionsformel tanh (ϑ1 + ϑ2 ) =
tanh ϑ1 + tanh ϑ2 1 + tanh ϑ1 tanh ϑ2
des Hyperbeltangens und zeigt, daß die Hintereinanderausf¨ uhrung zweier Transformationen mit ϑ1 und ϑ2 einer Gesamttransformation mit ϑ = ϑ1 +ϑ2 entspricht. Damit wird auch die Unerreichbarkeit der Lichtgeschwindigkeit noch einmal illustriert (siehe Skizze). c v
ϑ
v2
ϑ2
v1
ϑ1
ϑ1 c tanh ϑ
0
5.7
0
1
ϑ
2
Kovariante Formulierung einer Theorie
Das Relativit¨atsprinzip verlangt, daß Naturgesetze Lorentz–invariant sind, daß sie also in gleicher Form in K und in K0 gelten, wenn K und K0 durch eine Lorentztransformation verkn¨ upft sind. Wie stellen wir die Lorentzinvarianz sicher? 130
Der Vierervektor x = (xν ) = (x, y, z, ict) transformiert sich bei einer Lorentztransformation gem¨aß der Beziehung x0 = Ax oder x0ν =
X
aνµ xµ ,
µ
wobei die Matrix A = (aνµ ) eine Drehung des Minkowskiraums beschreibt. Alle andern Vektoren y = (yν ) des Minkowskiraums transformieren sich daher nach dem selben Schema X aνµ yµ , y0 = Ay oder yν0 = µ
ihre Koeffizienten yν ¨andern sich kovariant mit den Koeefizienten xν . Da die Lorentztransformationen A orthogonal sind, lassen sie Skalarprodukte50 zwischen den Vektoren des Minkowskiraums invariant. Wir brauchen uns um die Lorentzinvarianz eines physikalischen Gesetzes also gar nicht mehr zu k¨ ummern, wenn wir es konsistent als Beziehung a=b zwischen Vektoren a = (aν ) und b = (bν ) oder als Beziehung a=b zwischen Skalaren a und b des Minkowskiraums formulieren. Die entsprechende Feststellung f¨ ur Vektoren und Skalare im dreidimensionalen Euklidischen Raum erscheint uns so selbstverst¨anlich, daß wir sie nie explizit erw¨ahnt haben. Newtons Lex secunda p˙ = F und der Energiesatz E = const beispielsweise gelten unabh¨angig von der Orientierung des Koordinatensystems. (Beachte dabei aber, daß eine Vektorkomponente, etwa Fz , kein Skalar ist!) Eine solche konsistente Formulierung heißt kovariant, ihre Elemente51 nennen wir Vierer–Vektoren und Vierer–Skalare oder Lorentz–Skalare. Nicht kovariant ist also z.B. eine Beziehung a3 = b zwischen einer Vektorkomponente und einem Skalar, denn der Skalar bleibt bei einer Lorentztransformation invariant, w¨ahrend die Vektorkomponente sich ¨andert. Nun ist nat¨ urlich nicht jedes Schema von vier Zahlen (z.B. [L¨ange, Breite, H¨ohe, Gewicht]) ein Vektor des Minkowskiraums, und — was f¨ ur uns besonders wichtig ist — nicht jeder Vektor des R3 l¨aßt sich zu einem Vierer–Vektor erg¨anzen. Vektorbeziehungen im R3 m¨ ussen vor einer vierdimensionalen Erg¨anzung also im allgemeinen abge¨andert werden. 50
Wir erinnern an Fußnote 47, S. 121. Skalarprodukte sind also ebenfalls ohne komplexe Konjugation zu verstehen! 51 Eine Verallgemeinerung auf Vierer–Tensoren sparen wir uns hier. Neben der hier bevorzugten Terminologie werden auch die Bezeichnung Welt–Vektoren und Welt–Skalare verwendet.
131
Wie finde ich dann Vierer–Vektoren? Erstens, indem ich von bekannten Vierer–Vektoren a, b, . . . ausgehe und mich u ¨berzeuge, daß damit auch a ± b und ca Vierer–Vektoren sind, wenn nur c einen Skalar ist. Und Skalare sind neben reinen Zahlwerten und physikalischen Konstanten (Lichtgeschwindigkeit, Ladung, (Ruh–)Masse usw.) insbesondere die Skalarprodukte a·b=
4 X
a ν bν
ν=1
von Vierer–Vektoren. Die zweite M¨oglichkeit besteht darin, eine als Lorentz–invariant erkannte (oder postulierte) Gr¨oße a als Skalarprodukt mit einem bereits bekannten Vierervektor zu deuten. Hiervon wird insbesondere bei der kovarianten Formulierung der Elektrodynamik Gebrauch gemacht52 . Wir nutzen hier die erste M¨oglichkeit und gehen von dem Vierer–Ortsvektor x = (x, y, z, ict) aus, der uns ein Punkt–Ereignis (Ort, Zeitpunkt) im Minkowskiraum lokalisiert. Als ersten neuen Vierer–Vektor bilden wir den Differenzvektor d = x 2 − x1 , der den Abstand zweier Punktereignisse x1 und x2 im Minkowskiraum repr¨asentiert. Sein Abstandsquadrat 2
d =
3 X i=1
2 (x2i − x1i )2 − c2 (t2 − t1 )2 = r12 − c2 (t2 − t1 )2
kann kleiner oder gr¨oßer als Null sein, je nachdem die r¨aumliche Distanz r12 in der Zeitspanne |t2 − t1 | durch Licht u uckt werden kann oder nicht, oder — ¨berbr¨ salopp ausgedr¨ uckt — je nachdem die zeitliche oder r¨aumliche Distanz u ¨berwiegt. Finden die Ereignisse x1 und x2 insbesondere am selben Ort statt, so wird d2 = −c2 (t2 − t1 )2 < 0, 52
Ein Beispiel: Der Vierer–Vektor (Aν ) = (Ax , Ay , Az , iϕ/c) wird eingef¨ uhrt, indem man die −2 als Lorentz–invariant postulierte Lorentzeichung div A + c ∂ϕ/∂t = 0 u ¨ber das SkalarproP dukt ∂Aν /∂xν mit dem Vierer–Vektor ∇4 = (d/dxν ) deutet.
132
der Abstand ist “zeitartig”. Finden sie dagegen zur gleichen Zeit statt, so ist der Abstand “raumartig” und es gilt 2 d2 = r12 > 0.
Wir verallgemeinern die Begriffe und nennen • Vierervektoren mit negativem Betragsquadrat zeitartig und • Vierervektoren mit positivem Betragsquadrat raumartig. Man kann durch eine r¨aumliche Drehung im R3 stets erreichen, daß der r¨aumliche Anteil des Abstandes in x3 = z–Richtung f¨allt. Mit Gl. (231) lassen sich dann die folgenden beiden Aussagen leicht beweisen: Ist der Abstand d = x2 − x1 zweier Punktereignisse x1 und x2 • zeitartig, so l¨aßt sich immer eine Lorentztransformation mit v < c in ein Koordinatensystem K0 angeben, in dem die beiden Ereignisse am gleichen Ort stattfinden. • raumartig, so l¨aßt sich immer eine Lorentztransformation mit v < c in ein Koordinatensystem K0 angeben, in dem die beiden Ereignisse gleichzeitig stattfinden. Der Minkowskiraum wird durch den Lichtkegel (seine Projektion auf den R3 ist die Lichtkugel) r 2 = c 2 t2 in zeit– und raumartige Gebiete geteilt (siehe Skizze). Dabei ist wichtig, daß all diese Begriffe wegen der Definition u ¨ ber ein Skalarprodukt Lorentz–invariant sind. ct
l
Li
e eg
ch
tk
tk
ch
eg e
l
Li
Zukunft zeitartig Gegenwart Gegenwart raumartig raumartig Vergangenheit zeitartig
133
z
Die Gegenwart wird im Minkowskiraum durch die Hyperebene t = 0 (also durch die z–Achse in der Skizze) repr¨asentiert. Da sich alle raumartigen Vektoren so transformieren lassen, daß die Zeitkomponente t0 = 0 wird, ist es sinnvoll, den gesamten raumartigen Bereich als Gegenwart zu bezeichnen. Die Gegenwart teilt den zeitartigen Bereich in die Zukunft und in die Vergangenheit. H¨angt das Ereignis 2 kausal von Ereignis 1 ab, so liegt x2 von x1 aus gesehen in der Zukunft. Der Abstand x2 − x1 ist also zeitartig und es gilt (in allen Koordinatensystemen) t2 > t 1 . Wir betrachten nun insbesondere Punktereignisse, die zur Bahn eines Teilchens im Minkowskiraum geh¨oren. Ihr Abstand ist wegen v < c auf jeden Fall zeitartig, und wir benutzen ihn, um das Lorentz–invariante Differential dτ der Eigenzeit zu definieren: 2
2
c dτ = −
4 X
ν=1
2
2
3 X
2
(dxν ) = c dt − oder
dτ =
i=1
q
(dxi )2 = (c2 − v 2 )dt2
1 − β 2 dt .
(236)
Offenbar ist die Eigenzeit τ die Zeit, welche in einem System abl¨auft, in dem das Teilchen (momentan) ruht (β = 0). Sie verl¨auft langsamer als die Zeit in jedem andern Kordinatensystem. Wir k¨onnen hier unmittelbar an die Diskussionen im Abschnitt 5.5 ankn¨ upfen: Die Eigenzeit τ ist ein Maß f¨ ur die Zahl der Herzschl¨age des Raumfahrers im Zwillingsparadoxon, und sie mißt die myonische Lebenserwartung τµ im System des Myons. In der Anschrift dt = √
dτ 1 − β2
sehen wir auch unmittelbar die Zeitdilatation, mit der ein ¨außerer (also gegen¨ uber dem Teilchen bewegter !) Beobachter die innere Uhr des Teilchens registriert. Da das Differential dτ der Eigenzeit Lorentz–invariant ist, w¨are es verlockend, hiervon ausgehend eine Weltzeit τ zu definieren. Das ist aber nicht m¨oglich, da die im System gemessene Zeitspanne ∆τ =
Z
dτ
Weg
nach Ausweis des Zwillingparadoxonsnicht wegunabh¨angig ist. Aus dem Vierer–Vektor x und dem Lorentz–Skalar dτ k¨onnen wir den Vektor der Vierer–Geschwindigkeit u=
dx dτ
oder
uν = 134
dxν 1 dxν =√ dτ 1 − β 2 dt
(237)
bilden. Aus der expliziten Anschrift ui = √
vi (i = 1, 2, 3) 1 − β2
und
u4 = √
ic 1 − β2
(238)
lesen wir erstens ab, daß seine r¨aumlichen Komponenten f¨ ur β → 0 in die ge53 w¨ohnlichen Geschwindigkeiten vi u ¨bergehen, w¨ahrend als vierte Komponente die Lichtgeschwindigkeit c erscheint. Zweitens finden wir, daß sein Betragsquadrat X ν
u2ν =
c2 v2 − = −c2 1 − β2 1 − β2
(239)
konstant und negativ ist. u ist also ein zeitartiger Vierer–Vektor. Schließlich liegt es noch nahe, durch Multiplikation mit der Masse m0 den Vierer– Impuls p = m0 u oder pν = m0 uν
(240)
mit den expliziten Koeffizienten m0 v i pi = √ = mr vi (i = 1, 2, 3) 1 − β2
und
im0 c p4 = √ = imr c 1 − β2
(241)
zu bilden. Durch die Einf¨ uhrung der “relativistischen Masse” mr = √
m0 1 − β2
(242)
wird diese Beziehung besonders suggestiv. Um Verwechslungen auszuschließen, haben wir die Lorentz-invariante Masse m0 mit dem Index 0 versehen und bezeichnen sie als Ruhmasse. Im Gegensatz zu m0 w¨achst mr also mit der Geschwindigkeit und h¨angt damit ¨ vom Bezugssystem ab. Uber die Frage, ob die Ruhmasse oder die relativistische 54 Masse als die eigentliche Masse m angesehen werden soll, ist gelegentlich mit Eifer gestritten worden. W¨ahrend die Unabh¨angigkeit vom Bezugssystem f¨ ur m0 spricht, liefert der folgende Abschnitt auch starke Argumente f¨ ur mr . Wir sehen in dem Problem letztlich eine Geschmacksfrage und vermeiden die mißverst¨andliche Bezeichnung m ohne Index 0 oder r. Damit haben wir die Elemente zusammengetragen, die wir f¨ ur eine relativistische Korrektur der klassischen Mechanik ben¨otigen. 53
Beachte: v selbst l¨ aßt sich f¨ ur β 6= 0 nicht zu einem Vierer–Vektor erg¨ anzen! In a ¨lteren Darstellungen findet man daneben auch noch longitudinale und transversale Massen, vgl. Gl. (258) und Fußnote 55 auf S. 141. 54
135
5.8
Relativistische Mechanik
Daß die drei Komponenten der Vektoren p˙ = m0 v˙ und F aus Newtons Lex secunda dpi = Fi dt
(243)
sich nicht zu einem Vierer–Vektor erg¨anzen lassen, wissen wir bereits. Denn die Lex secunda ist Galilei– und nicht Lorentz–invariant. Wir haben aber bereits den kovarianten Vierer–Impuls p eingef¨ uhrt [Gln. (240, 241)]. Seine Ableitung nach der Lorentz–invarianten Eigenzeit τ ist wieder ein Vierervektor. In Anlehnung an die Lex secunda bezeichnen wir diesen Vierer–Vektor als Minkowski– Kraft K=
dp dτ
oder Kν =
dpν . dτ
(244)
Wie h¨angen nun die r¨aumlichen Komponenten Ki mit den Newtonschen Kraftkomponenten Fi zusammen? Um das zu entscheiden, brauchen wir eine kovariante Formulierung der Kraft. Die steht zwar eigentlich nur f¨ ur elektromagnetische Kr¨afte zur Verf¨ ugung, man kann jedoch argumentieren, daß andere Kr¨afte sich ebenso transformieren m¨ ussen wie elektromagnetische. Denn der Begriff des Gleichgewichts muß Lorentz–invariant sein. Wir verzichten hier auf diese Anleihe bei der kovarianten Elektrodynamik, verlassen uns auf die “prophetische Sicherheit” der Newtonschon Formulierung (Sommerfeld, vgl. S. 3) und definieren die Newtonsche Kraft F durch Gl. (243). Allerdings soll dabei pi nicht m0 vi , sondern im Einklang mit den Gln. (241) und (244) die r¨aumlichen Komponenten m0 v i pi = m r vi = √ 1 − β2 √ des Viererimpulses bezeichnen. Wegen dτ = 1 − β 2 dt folgt so der Zusammenhang Ki = √
Fi (i = 1, 2, 3) , 1 − β2
(245)
der nat¨ urlich mit der elektrodynamischen Formulierung u ¨bereinstimmt. Wir k¨onnten nun an dieser Stelle das ganze Raum–Zeit–Gef¨ uge der Speziellen Relativit¨atstheorie vergessen, den Minkowskiraum verlassen und als einzige relativistische Korrektur die ver¨anderliche Masse mr in Newtons Lex secunda 136
aufnehmen:
d (mr vi ) = Fi . dt
(246)
So werden wir im n¨achsten Abschnitt verfahren. Im Augenblick bleiben wir jedoch noch im Minkowskiraum und fragen nach der vierten Komponente der Minkowski–Kraft. Dazu bilden wir nach Gln. (240) und (244) du m0 d 2 K · u = m0 u · = u = 0, dτ 2 dτ denn u2 ist nach Gl. (239) konstant. Die Minkowski–Kraft steht also stets senkrecht auf der Vierer–Geschwindigkeit. Damit l¨aßt sich die Komponente K4 aus K1 , K2 , K3 berechnen, denn aus X ν
3 X 1 √ Kν uν = Ki vi + icK4 = 0 1 − β 2 i=1
!
folgt wegen Gl. (245) i F·v K4 = √ . c 1 − β2
(247)
K4 h¨angt also eng mit der von der Kraft F je Zeiteinheit geleisteten Arbeit F · v zusammen. Sehen wir uns dazu die vierte Komponente der “Bewegungsgleichung” (244) an [vgl. auch (241)]: dmr dp4 i F·v √ = ic . = K = 4 c 1 − β2 dτ dτ Mit dτ =
√
1 − β 2 dt folgt also d mr c 2 = F · v . dt
Der Zusammenhang dA = F · vdt = dT zwischen der durch die Kraft F geleisteten Arbeit dA und der Zunahme dT der kinetischen Energie zwingt uns also, den Ausdruck m0 c 2 T = m r c2 = √ 1 − β2
(248)
— abgesehen von einer zun¨achst bedeutungslosen additiven Konstanten — als die relativistische kinetische Energie anzusehen. Durch Entwicklung der Wurzel folgt 137
T → m0 c
2
β2 1+ 2
!
1 = m 0 c 2 + m0 v 2 2
(β → 0) .
(249)
Damit ist der Zusammenhang mit der nicht-relativistischen Energie T = m0 v 2 /2 hergestellt. Die willk¨ urlich erscheinende additive Konstante E0 = m 0 c2 ,
(250)
die Ruhenergie des Teilchens, ziehen wir nicht ab, weil T nur mit dieser Konstanten als vierte Komponente des Vierer-Impulses [vgl. Gl. (241)] angesehen werden kann: m0 v i = mr vi (i = 1, 2, 3) pi = √ 1 − β2
und
i p4 = T . c
(251)
Der Vierer–Vektor p wird darum auch als Energie–Impuls–Vektor bezeichnet. Wegen p = m0 u ist sein Betragsquadrat konstant und es gilt [vgl. Gl. (239)] p2 = −m20 c2 =
X i
p2i −
T2 . c2
Daraus folgt die h¨aufig benutzte relativistische Beziehung 2
T =
m20 c4
+c
2
3 X
p2i
(252)
i=1
zwischen kinetischer Energie und Impuls. Die Bewegungsgleichungen (244) im Minkowskiraum lassen sich mit den Gln. (245), (247) und (251) in der klassischen Form dpi = Fi dt
und
dT =F·v dt
(253)
schreiben, der man ihren relativistischen Hintergrund gar nicht mehr ansieht. Speziell f¨ ur die kr¨aftefreie Bewegung mit F = 0 folgt auch wieder, daß sowohl p als auch T konstant sind. Im Gegensatz zur nicht–relativistischen Mechanik ist nun aber T keine sekund¨are, abgeleitete Gr¨oße mehr, sondern der Impuls p und die kinetische Energie T geh¨oren nun a priori zu einem einheitlichen Ganzen zusammen. Das hat f¨ ur Systeme mit inneren Freiheitsgraden Konsequenzen von fundamentaler Bedeutung: W¨ahrend es in der nicht–relativistischen Mechanik — etwa bei inelastischen Stoßprozessen — sehr wohl Situationen gibt, in denen der Impuls, nicht aber die kinetische Energie erhalten bleibt, verlangt die Lorentz–invarianz nach Ausweis der 138
kovarianten Formulierung, daß bei Impulserhaltung auch die kinetische Energie T = mr c2 erhalten bleibt. Das ist in voller Allgemeinheit offenbar nur m¨oglich, wenn die Masse m0 nicht generell konstant ist, sondern u uhmte Ein¨ber die ber¨ steinsche Beziehung ∆E = ∆m0 c2
(254)
¨ mit einer eventuellen Anderung ∆E der inneren Energie verkn¨ upft ist. Betrachten wir etwa den Zerfallsprozeß eines ruhenden Teilchens der Masse m0 , so haben wir vor bzw. nach dem Zerfall die kinetische Energien T0 = m 0 c 2
bzw. T1 =
X
mir c2 =
X
(mi0 c2 + i ),
wenn mi0 die Massen und i die Bewegungsenergien der Zerfallsprodukte bezeichnet. Da wegen der Impulserhatung aber T1 = T0 gelten muß, folgt m0 =
X
mi0 + ∆E/c2 ,
P ¨ wobei der “Massendefekt” ∆E/c2 der Anderung ∆E = i der inneren Energie entspricht.
F¨ ur unsere allt¨agliche Erfahrung ist diese Massen¨anderung allerdings nicht sehr ¨ groß: Das Aquivalent einer Kilowattstunde betr¨agt ∆m(1kWh) =
3.6 · 106 Ws = 0.4 · 10−10 kg = 4 · 10−8 g , 9 · 1016 m2 /s2
oder anders ausgedrckt: Der Preis von 16 ct f¨ ur Energie aus der Steckdose entspricht einem Preis von 4 Mio. EUR f¨ ur 1g Materie! ¨ Als Einstein im Jahr 1905 die Aquivalenz von Masse und Energie formulierte, war es noch nicht m¨oglich, diese fundamentale Aussage experimentell zu u ¨ berpr¨ ufen. Heute ist die Best¨atigung bekanntlich keine Frage mehr.
5.9
Die relativistische Bewegungsgleichung
Wie bereits angk¨ undigt, verlassen wir nun den Minkowskiraum und wenden uns den praktischen Problemen der relativistischen Bewegungsgleichung [vgl. (246)] d m0 mr v = F mit mr = q dt 1−
v2 c2
(255)
zu. Der einzige Unterschied zur nicht–relativistischen Mechanik zeigt sich also darin, daß sich die zeitliche Ableitung auch auf die ver¨anderliche Masse mr erstreckt. Die Auswirkung demonstrieren wir an einem einfachen Beispiel: 139
Wir berechnen die Bewegung z(t) eines zur Zeit t = 0 ruhenden Elektrons in einem konstanten elektrischen Feld E = Eez . Die Bewegungsgleichung d m0 v √ = eE dt 1 − β 2 l¨aßt sich sofort einmal integrieren: √
m0 v = eEt . 1 − β2
Wenn wir nach v aufl¨osen, erhalten wir v=q
ceEt m20 c2 + e2 E 2 t2
=q
cvnr
mit vnr =
2 c2 + vnr
e Et . m0
(256)
F¨ ur kleine Zeiten eEt/m0 c folgt also wie erwartet das nicht–relativistische Ergebnis v → vnr . Im Gegensatz zu vnr bleibt v aber immer kleiner als c und strebt f¨ ur große Zeiten gegen c. Wenn wir Gl. (256) in der Form c dq 2 2 dz = m 0 c + e 2 E 2 t2 dt eE dt schreiben, k¨onnen wir sogleich nochmals integrieren und erhalten s
m0 c 2 z= eE
!
e 2 E 2 t2 1+ −1 . m20 c2
Auch hier l¨aßt sich das Grenzverhalten z → große Zeiten wieder leicht interpretieren.
1 eE 2 t 2 m0
f¨ ur kleine bzw. z → ct f¨ ur
Wenn wir das Ergebnis in der Form s
eEz + m0 c2 = m0 c2 1 +
2 vnr c2
schreiben und Gl. (256) nach 1+
2 vnr 1 = . 2 c 1 − v 2 /c2
umformen, sehen wir, daß die Bewegung den Energiesatz
erf¨ ullt.
m c2 √ 0 2 − eEz = T + V = m0 c2 = const 1−β
140
(257)
In diesem einfachen Beispiel haben wir eine eindimensionale Bewegung betrachtet. Allgemein erhalten wir aus Gl. (255) m0 v · v˙ m0 v · v˙ v= √ v v˙ + 2 F = mr v˙ + v 2 3/2 2 c (1 − β 2 ) 1−β (1 − c2 )
!
.
F und v˙ haben also im allgemeinen nicht mehr die selbe Richtung55 . F¨ ur die Komponenten parallel (k) und senkrecht (⊥) zu v erhalten wir m0 v˙ k = Fk (1 − β 2 )3/2
√
und
m0 v˙ ⊥ = F⊥ . 1 − β2
(258)
[Zur Vertiefung unseres Verst¨andnisses wollen wir Gl. (258) aus der unterschiedlichen Sicht verschiedener Koordinatensysteme interpretieren. K 0 sei das Koordinatensystem, in dem das Teilchen momentan ruht. Die Beschleunigung wird in K 0 also durch Newtons Lex secunda dvk0 dv 0 m0 0 = Fk0 und m0 ⊥0 = F⊥0 dt dt beschrieben. Nach dem Additionstheorem (235) gilt v + dvk =
v + dvk0 1 + vdvk0 /c2
= (v + dvk0 )(1 − vdvk0 /c2 ) = v + (1 − v 2 /c2 )dvk0 ,
also
dvk . 1 − β2 F¨ ur die ⊥–Bewegung gilt x0 = x, also haben wir dt 0 v⊥ = 0 v⊥ . dt dvk0 =
Mit dt0 =
p
1 − β 2 dt folgt also m0 v˙ k = Fk0 (1 − β 2 )3/2
m0 v˙ ⊥ = F⊥0 . 1 − β2
und
(259)
Zur Transformation der Kraft beziehen wir uns zun¨achst auf die kovariante Minkowskikraft F. Wegen v 0 = 0 in K0 erhalten wir nach (245) und (247) Ki0 = Fi0
und K40 = 0 .
Ki0 transformiert sich nun mit der selben Lorentztransformation wie x 0i , also Kk = p
Fk 1 (Kk0 − iβK40 ) = p 2 1−β 1 − β2
Im System K gilt schließlich nach (245) F i = Fk = Fk0
0 und K⊥ = K⊥ = F⊥0 .
p
und F⊥ =
1 − β 2 Ki , also q
1 − β 2 F⊥0 .
(260)
Damit geht die Bewegungsgleichung (259) in (258) u ¨ ber.] 55
Aufgrund dieser Tatsache sprach man fr¨ uher der Masse einen Tensorcharakter zu und unterschied entsprechend Gl. (258) insbesondere die longitudinale und die transversale Masse.
141
5.10
Relativistischer Lagrangeformalismus
Ausgehend von der Bewegungsgleichung (255) kann man wie im nicht–relativistischen Fall einen Lagrangeformalismus aufbauen: Der relativistische Impuls m0 v i pi = √ 1 − β2 l¨aßt sich als Ableitung eines kinetischen Potentials G schreiben: ∂G pi = ∂vi
mit G = −m0 c
2
s
1−
v2 . c2
(261)
Ist die Kraft in der Form
∂V ∂xi aus einem Potential V herleitbar, k¨onnen wir daher die relativistische Lagrangefunktion Fi = −
L = G − V = −m0 c
2
q
1 − β2 − V
(262)
einf¨ uhren und erhalten die Bewegungsgleichung (255) in der Form d ∂L ∂L − = 0. dt ∂ x˙ i ∂xi
(263)
Wir k¨onnen auch wieder eine Hamiltonfunktion H=
X i
pi x˙ i − L mit pi =
∂G ∂L = ∂ x˙ i ∂ x˙ i
(264)
bilden, deren Wert q m0 v 2 m0 c 2 2 2 √ √ H= + m0 c 1 − β + V = +V =T +V 1 − β2 1 − β2
(265)
die Gesamtenergie repr¨asentiert. Wenn wir hier noch β durch die pi ausdr¨ ucken, erhalten wir die Bewegungsgleichungen in der kanonischen Form p˙ i = −
∂H ∂xi
und x˙ i =
142
∂H . ∂pi
(266)
Wir k¨onnen auch Systeme von Massenpunkten betrachten, generalisierte Koordinaten einf¨ uhren und erhalten wie im nicht–relativistischen Fall die Lagrangegleichungen d ∂L ∂L − = 0. dt ∂ q˙k ∂qk
(267)
Es gilt auch weiterhin, daß der zu einer zyklischen Variblen konjugierte Impuls konstant ist, und daß aus ∂L ∂H =− =0 ∂t ∂t der Energiesatz in der Form H = T + V = const
(268)
folgt. Schließlich k¨onnen wir wie fr¨ uher die elektromagnetischen Kr¨afte in den Formalismus einbinden, indem wir V durch ein generalisietes Potential (vgl. Abschnitt 2.4) U = eΦ − ev · A (269) ersetzen. Obwohl die Rechnung im Detail wesentlich komplizierter sein kann, l¨auft das Verfahren im Prinzip also wie im nicht–relativistischen Fall ab. Trotzdem sind einige kritischen Punkte zu erw¨ahnen. • Zun¨achst ist aus systematischer Sicht zu bem¨angeln, daß der Formalismus zwar die relativistisch korrekten Bewegungsgleichungen liefert, aber nicht kovariant formuliert ist. Vielmehr bezieht er sich auf ein festes System K und benutzt die Zeit t in K als Parameter. Dies macht es schwierig, die Ergebnisse in ein anderes System zu u ¨bertragen. Nun ist es zwar grunds¨atzlich nicht schwierig, einen kovarianten Lagrangeformalismus aufzubauen, der direkt von der vierdimensionalen Bewegungsgleichung (244) ausgeht und mit u und τ statt mit v und t arbeitet (vgl. z.B. Goldstein Abschnitt 6-6). Es muß aber darauf hingewiesen werden, daß eine konsistente kovariante Beschreibung von Kr¨aften nur in der Elektrodynamik zur Verf¨ ugung steht. Damit kommen wir bereits zu den wesentlichen Defiziten unserer speziellrelativistischen Theorie: • Statische Kr¨afte mit einer instantanen Fernwirkung (Wechselwirkungspotentiale Vij (rij ), Gravitation!) k¨onnen nicht Lorentz–invariant formuliert werden, denn eine Wechselwirkung kann h¨ochstens mit Lichtgeschwindigkeit u ¨ bertragen werden. 143
• Aus dem selben Grund sind die meisten Zwangsbedingungen nicht mit der Lorentzinvarianz vertr¨aglich. Das gilt insbesondere f¨ ur das gesamte Konzept des starren K¨orpers. • Beschleunigte Bezugssysteme, (insbesondere rotierende) Koordinatensysteme k¨onnen nicht problemlos in eine speziell-relativistische Theorie integriert werden. Mit diesen Bemerkungen stehen wir bereits an der Schwelle zur allgemeinen Relativit¨ atstheorie. Wenn wir diese umfassendere Theorie hier auch nicht mehr ¨ behandeln k¨onnen, so wollen wir ihren Grundgedanken doch zur Uberleitung in das letzte Kapitel dieser Vorlesung aufgreifen:
5.11
Grundgedanken zur allgemeinen Relativit¨ atstheorie
Wir hatten bereits im Zusammenhang mit dem Relativit¨atsprinzip (Fußnote 45 auf S. 116) die Schwierigkeit angedeutet, wahre und Scheinkr¨afte zu unterschei¨ den. Aus solchen Uberlegungen heraus verallgemeinerte Einstein das Relati¨ vit¨atsprinzip bewegter Inertialsysteme zum allgemein relativistischen Aquiva¨ lenzprinzip beschleunigter Bezugssysteme: Mit der grunds¨atzlichen Aquivalenz von tr¨ager und schwerer Masse postulierte er, daß die Scheinkr¨afte in beschleunigten Koordinatensystem prinzipiell nicht von der Gravitation unterschieden werden k¨onnen. Dieses Postulat hat die Konsequenz, daß der ohnehin schon befremdliche Minkowskiraum in der N¨ahe großer Massen auch noch gekr¨ ummt ist. Damit ist beispielsweise gemeint, daß die Erdoberfl¨ache (unmeßbar) kleiner ist als 4πrE2 . Die Kr¨ ummung betrifft aber auch die Zeit: • Uhren im Tal gehen langsamer als Uhren auf dem Berg! Darum ist es nicht gleichg¨ ultig, ob man erst eine Stunde das Tal entlang geht und dann eine Stunde lang aufsteigt oder ob man erst aufsteigt und dann einen H¨ohenweg benutzt. Die Differenz der Endpunkte dieser verschiedenen Wege in der Raum–Zeit deutet auf eine Kr¨ ummung der x3 –x4 –Ebene. Das Maß der Zeitdehnung findet man am leichtesten aus der Frequenzverstimmung h ¯ ω (1 + φ/c2 ) = h ¯ ω0 , welche der Energiesatz f¨ ur Photonen im Gravitationspotential φ verlangt. Addieren wir versuchsweise die entsprechende Zeitverstimmung mit der Zeitdilation der speziellen Relativit¨atstheorie, so erhalten wir 144
q
dτ = ( 1 − β 2 + φ/c2 )dt
(270)
als Differential der Eigenzeit. Und nun kommen wir noch einmal auf das Zwillingsparadoxon zur¨ uck: Der Bruder, der im gravitationsfreien Fall in seinem unbeschleunigten Inertialsystem bleibt, der also immer Newtons Lex prima p˙ = 0 erf¨ ullt, altert schneller als sein Bruder, der irgendeinen andern Weg im Minkowskiraum w¨ahlt. Die gleichf¨ormige Bewegung der Lex prima Newtons ist also im kr¨aftefreien Fall dadurch ausgezeichnet, daß die Zeitspanne τ12 =
Z(2)
dτ
(1)
gr¨oßer wird als bei jeder anderen Bewegung. Sollen nun Gravitation und Beschleunigung wirklich ¨aquivalent sein, dann muß auch das “schwerelose” System K0 , das einem frei fallenden K¨orper folgt, ein kr¨aftefreies Inertialsystem sein. Der frei fallende K¨orper, der nach der Lex prima in K0 ruht, muß also ebenfalls durch ein maximales τ12 ausgezeichnet sein. In dem nicht–schwerelosen “festen” System K ist dτ durch Gl. (270) gegeben. Mit der Lagrangefunktion [vgl Gl. (262] q
L = −m0 c2 1 − β 2 − m0 φ finden wir den Zusammenhang dτ = −
L dt . m0 c 2
¨ Das Aquivalenzprinzip verlangt also f¨ ur die Bewegung im Gravitationsfeld eine maximale Eigenzeit
τ12
1 =− m0 c 2
Z(2)
L dt .
(271)
(1)
Wird diese Forderung von den Bewegungsgleichungen der Lex secunda erf¨ ullt? Mit dieser Frage kommen wir zum Hamiltonschen Prinzip, mit dem wir nun das Schlußkapitel einleiten.
145
6
Hamilton–Jacobi–Theorie
6.1
Das Hamiltonsche Prinzip
Wir haben das letzte Kapitel mit der Frage beendet, ob die Bewegung im Schwerefeld so verl¨auft, daß die Eigenzeit maximal wird. Wir fragen nun allgemeiner nach den Bedingungungen daf¨ ur, daß das Integral J=
Z(2)
˙ t)dt F (q, q,
(272)
(1)
extremal — oder genauer: station¨ar — wird. Mit dieser Frage soll pr¨aziser das folgende Problem charakterisiert werden: Wie muß bei • vorgebenem Startpunkt q(t1 ) = q1 zur Zeit t = t1 und bei • vorgebenem Endpunkt q(t2 ) = q2 zur Zeit t = t2 die Bahn q(t) im Konfigurationsraum gew¨ahlt werden, damit das Integral J ein Extremum annimmt? Dieses Problem stellt die Grundaufgabe der Variationsrechnung dar. Sie erinnert an das Aufsuchen von Extrema in der Differentialrechnung und l¨aßt sich auch in der Tat darauf zur¨ uckf¨ uhren. Wenn wir n¨amlich die (noch unbekannte) L¨osung mit q(t) bezeichnen, setzen wir qk0 (t) = qk (t) + εηk (t) = qk + δqk
(273)
mit beliebigen Variationen ηk (t), die allein der Bedingung ηk (t1 ) = ηk (t2 ) = 0 unterworfen sind. Damit wird J eine Funktion von ε, die f¨ ur ε = 0 ein Extremum annehmen soll. Das f¨ uhrt auf die Bedingung
dJ δJ = ε = dε ε=0
Z(2) X f (
(1) k=1
)
∂F ∂F δqk + δ q˙k dt = 0 . ∂qk ∂ q˙k
(274)
Ehe wir Gl. (274) auswerten, machen wir uns klar, daß wir notwendige Bedingungen f¨ ur Extrema herleiten, die keineswegs hinreichend sind. Statt von extremalem 146
Verhalten sollten wir daher besser von station¨arem Verhalten sprechen: δJ = 0 bedeutet, daß sich J bei einer infinitesimalen Variation der Bahn nicht ¨andert. Falls wirklich ein Extremum vorliegt, ist das im allgemeinen lokal zu verstehen. Außerdem k¨onnen wir nicht zwischen einem Maximum und einem Minimum unterscheiden. Wegen der wichtigen Unterscheidung zu anderen Variationsprinzipien der Mechanik weisen wir auch nochmals auf unsere Variationsregeln hin: • Die Variationen δq beziehen sich ausschließlich auf die Bahn q(t) zwischen zwei festen Endpunkten q1 (t1 ) und q2 (t2 ) im Konfigurationsraum. • Die Zeit wird nicht variiert: δt = 0. Damit ist auch klar, was die Variationen δ q˙k der Geschwingkeiten in Gl. (274) bedeuten: Wenn wir Gl. (273) nach t differenzieren, erhalten wir n¨amlich q˙k0 (t) = q˙k (t) + εη˙ k (t) = q˙k + δ q˙k oder
d (δqk ) . (275) dt Die generalisierten Geschwindigkeiten k¨onnen also nicht unabh¨angig variiert werden. Um diesen Zusammenhang einzuarbeiten, integrieren wir Gl. (274) partiell und erhalten δ q˙k = εη˙ k =
δJ =
Z(2)X (
(1)
k
∂F d ∂F − ∂qk dt ∂ q˙k
)
δqk dt +
X k
t=t
2 ∂F δqk . ∂ q˙k t=t1
Der letzte Term dieser Gleichung verschwindet, weil wir die Randpunkte nicht variieren d¨ urfen. Davon abgesehen sind die δqk = εηk (t) aber beliebige Bahnvariationen. Wir k¨onnen deshalb insbesondere ηi = 0 f u ¨r i 6= k
und ηk (t0 ) = 0 f u ¨r t0 6∈ (t − τ, t + τ ) (τ → 0)
w¨ahlen und daraus schließen, daß die Klammern{} einzeln und in jedem Bahnpunkt verschwinden m¨ ussen: Bedingung daf¨ ur, daß das Integral (272) ein Extremum annimmt (station¨ar wird) ist also, daß q(t) die Euler– Lagrange–Gleichungen ∂F d ∂F − =0 dt ∂ q˙k ∂qk
(276)
erf¨ ullt. Die Form dieser Gleichungen ist uns von den Lagrangeschen Gleichungen vertraut. Die Bewegung in konservativen Systemen mit holonomen Zwangsbedingungen l¨auft also so ab, daß die Hamiltonsche Prinzipalfunktion oder kurz das Wirkungsintegral 147
S=
Z(2)
Ldt
(277)
(1)
station¨ar wird. Die Stationarit¨atsbedingung δS = δ
Z(2)
Ldt = 0
(278)
(1)
wird als Hamiltonsches Prinzip der kleinsten56 Wirkung bezeichnet. F¨ ur den Spezialfall der Gravitation sehen wir im Hamiltonschen Prinzip das relativistische Postulat (271) der maximalen Eigenzeit best¨atigt. Das Prinzip gilt ¨ aber allgemeiner und besitzt dabei kein Korrelat relativistischer Aquivalenzpostulate mehr. Eine allgemeine anschauliche Interpretation gewinnt das Hamiltonsche Prinzip ¨ aber beim Ubergang zur Quantenmechanik. Dort wird ein Teilchen nicht durch seine Bahn beschrieben, sondern durch eine Wellenfunktion, welche die Aufenthaltswahrscheinlichkeit repr¨asentiert. Man kann nun zeigen, daß S 1 = h ¯ h ¯
Z
Ldt
die Phase der Wellenfunktion beschreibt. Die Stationarit¨at δS = 0 besagt dann, daß sich in der N¨ahe des klassischen Weges die Wellenamplituden nicht durch Interferenz wegl¨oschen. Das Teilchen folgt danach nicht einfach der Bahn, sondern es “riecht” alle Wege der Nachbarschaft (Feynman Lectures, Bd. II, Kap. 19). Versperrt man die benachbarten Konkurrenzwege, so st¨ort man die Bewegung (Beugung!). Diese Interpretation macht auch deutlich, daß die Stationarit¨at des Wirkungsintegrals und nicht ein minimaler oder maximaler Wert entscheidend ist.
6.2
Das Hamiltonsche Prinzip im Phasenraum
Das Hamiltonsche Prinzip erm¨oglicht einen eleganten (allerdings recht abstrakten) Aufbau der Mechanik: Wir k¨onnen dieses Prinzip statt der Newtonschen Axiome an die Spitze stellen und die Lagrangegleichungen deduktiv daraus herleiten (siehe z.B. Landau–Lifshitz). Aus den Lagrangegleichungen folgen 56
Es sei nochmals ausdr¨ ucklich darauf hingewiesen, daß die Behauptung eines Minimums weder bewiesen noch allgemein g¨ ultig ist. Hier liegt offenbar noch ein Rest mittelalterlich teleologischer Denkweise verborgen.
148
weiter die v¨ollig ¨aquivalenten Hamiltonschen Bewegungsgleichungen oder kanonischen Gleichungen (siehe Abschnitt 2.8). Wir wollen nun versuchen, die kanonischen Gleichung ohne den Umweg u ¨ber die Lagrangeschen Gleichungen direkt aus dem Hamiltonschen Prinzip herzuleiten. Dazu gehen wir von ˙ t) = L(q, q,
X k
pk q˙k − H(p, q, t) mit pk =
∂L ∂ q˙k
aus und bilden
δS = δ
Z(2)(X
(1)
k
)
pk q˙k − H(p, q, t) dt = 0 .
(279)
Wenn wir die Variation schematisch ausf¨ uhren, erhalten wir Z(2)X (
(1)
k
)
∂H ∂H δpk − δqk dt = 0 pk δ q˙k + q˙k δpk − ∂pk ∂qk
oder nach partieller Integration des ersten Terms Z(2)X (
(1)
k
!
∂H ∂H δpk − p˙ k + q˙k − ∂pk ∂qk
!
)
δqk dt = 0 .
(280)
Ehe wir voreilig versuchen, die kanonischen Gleichungen q˙k =
∂H ∂pk
und p˙ k = −
∂H ∂qk
(281)
aus dem Verschwinden der Klammern () in Gl. (280) abzulesen, m¨ ussen wir uns u ¨berlegen, was unter den Variationen δpk denn u ¨berhaupt zu verstehen ist. Im Prinzip m¨ ussen wir die δpk u ¨ber δ q˙k aus den Variationen δqk im Konfigurationsraum berechnen. Diese Variationen sind also zun¨achst nicht unabh¨angig, und daher d¨ urfen wir nicht ohne weiteres auf die G¨ ultigkeit der Gleichungen (281) schließen. Andererseits kennen wir aber bereits die G¨ ultigkeit der kanonischen 57 Gleichungen und k¨onnen daraus umgekehrt folgern : • Das Hamiltonsche Prinzip gilt sogar unter der erweiterten Konkurrenz beliebiger Variationen δqk und δpk im Phasenraum. 57
Man beachte dazu, daß die Beziehungen q˙k = ∂H/∂pk , die eine unabh¨angige Variation der δpk gestatten, bereits ohne die Bewegungsgleichungen aus der Konstruktion der Hamiltonfunktion folgen (vgl. S. 67 und Fußnote 23).
149
Umgekehrt k¨onnen wir aus dem erweiterten Hamiltonprinzip im Phasenraum die kanonischen Gleichungen deduzieren.
6.3
Kanonische Transformationen
Aus dem erweiterten Hamiltonsche Prinzip im Phasenraum folgt, daß die pk des Hamiltonformalislismus im Gegensatz zu den q˙k der Lagrangeschen Formulierung eine eigenst¨andige, den qk gleichwertige Bedeutung haben. Die Gleichwertigkeit der pk und qk l¨aßt es sinnvoll erscheinen, ganz auf die grunds¨atzliche Unterscheidung von Koordinaten und Impulsen zu verzichten. Statt generalisierte Koordinaten ausschließlich durch Punkttransformationen qk = hk (xi , t) im Konfigurationsraum zu gewinnen, kann man dann durch allgemeinere Transformationen Qk = Qk (p, q, t) und Pk = Pk (p, q, t)
(282)
im Phasenraum zu neuen S¨atzen von verallgemeinerten Koordinaten und Impulsen u ur die Qk und ¨bergehen. Die Transformationen (281) heißen kanonisch, wenn f¨ die Pk wieder kanonische Gleichungen ∂K ∂K Q˙ k = und P˙ k = − (283) ∂Pk ∂Qk mit einer geeignet transformierten Hamiltonfunktion K(P, Q, t) gelten. Um das sicherzustellen, brauchen wir nur zu fordern, daß f¨ ur die neuen Koordinaten ein Hamiltonsches Prinzip
δ
Z(2)(X
(1)
k
)
Pk Q˙ k − K(P, Q, t) dt = 0
(284)
gilt. Wegen unserer Vorschrift, die Randpunkte nicht zu variieren, ist das aber sicher gew¨ahrleistet, wenn sich die Integranden von (279) und (284) nur um eine totale Zeitableitung unterscheiden, etwa X k
Pk Q˙ k − K(P, Q, t) =
X k
pk q˙k − H(p, q, t) −
dΦ . dt
(285)
Φ kann dabei außer von der Zeit etwa von q und p abh¨angen. Wir k¨onnen uns aber auch denken, daß (nach Ausf¨ uhrung der Transformation) p durch einen Halbsatz der neuen Koordinaten ersetzt wird und schreiben Φ(q, p, t) = R1 (q, Q, t) . 150
Setzen wir
!
dΦ X ∂R1 ∂R1 ∂R1 ˙ Qk + = q˙k + dt ∂qk ∂Qk ∂t k
in Gl. (285) ein, so erhalten wir X k
!
!
X ∂R1 ˙ ∂R1 ∂R1 Pk + q˙k = K − H − pk − Qk − ∂Qk ∂qk ∂t k
!
.
Diese Gleichung k¨onnen wir am einfachsten erf¨ ullen, wenn wir die Transformation so ausf¨ uhren, daß alle Klammern () einzeln verschwinden. Wir erhalten damit die Transformationsgleichungen
und
∂R1 , ∂qk ∂R1 , = − ∂Qk
pk =
(286)
Pk
(287)
K(P, Q, t) = H(p, q, t) +
∂R1 . ∂t
(288)
R1 (q, Q, t) heißt die Erzeugende der kanonischen Transformation (286-288). Die Gln. (286) liefern die erste H¨alfte der Transformationsgleichungen. Sie legen in impliziter Form fest, wie die neuen Koordinaten Qk von den alten Koordinaten q und Impulsen p abh¨angen. Hat man sie nach den Qk aufgel¨ost, so erh¨alt man die konjugierten Impulse Pk explizit durch die Gln. (287). Aus Gl. (288) liest man zudem die neue Hamiltonfunktion K ab, mit der die kanonischen Gleichungen (283) gelten. Sie stimmt mit der alten Hamiltonfunktion u ¨berein, wenn die 58 Transformationsgleichungen die Zeit nicht explizit enth¨alt. Die formale Sonderstellung, die wir den Koordinaten q und Q bei der Konstruktion der Erzeugenden R1 zugewiesen haben, war rein willk¨ urlich. Tats¨achlich k¨onnen wir Koordinaten und Impulse v¨ollig gleichwertig behandeln. Um zu Transformationsgleichungen zu gelangen, m¨ ussen wir nur darauf achten, daß wir von einer Erzeugenden ausgehen, die von einem Halbsatz der alten und einem Halbsatz der neuen Variablen abh¨angt. Um das zu sehen machen wir von einer Legendretransformation (siehe Abschnitt 2.8) Gebrauch und bilden eine neue Erzeugende R2 (p, Q, t) = R1 (q, Q, t) −
X
p k qk .
k
Aus ihrem Differential ¨ Bei explizit zeitabh¨ angigen Transformationen l¨ aßt sich die Anderung der Hamiltonfunktion durch Pseudopotentiale von Scheinkr¨ aften interpretieren. Vgl. dazu S. (62). 58
151
dR2 =
X k
(
!
)
∂R1 ∂R1 ∂R1 − pk dqk + dQk − qk dpk + dt ∂qk ∂Qk ∂t
und den Gl. (286-288) lesen wir sofort die partiellen Ableitungen ∂R2 ∂R1 = = −Pk ∂Qk ∂Qk
∂R2 = −qk , ∂pk
und
∂R2 ∂R1 = =K−H ∂t ∂t
ab. In voller Analogie zu Gln. (286-288) ergibt das die Transformationsgleichungen qk = −
∂R2 , ∂pk
Pk = −
∂R2 ∂Qk
und K = H +
∂R2 . ∂t
(289)
Nach dem selben Schema k¨onnen wir Q durch P ersetzen, indem wir von der Erzeugenden R3 (q, P, t) = R1 (q, Q, t) +
X
Pk Q k
k
ausgehen. Wir erhalten dann entsprechend die Transformationsgleichungen pk =
∂R3 , ∂qk
Qk =
∂R3 ∂Pk
und K = H +
∂R3 . ∂t
(290)
Schließlich k¨onnen wir noch beide Halbs¨atze von Variablen austauschen und aus der Erzeugenden R4 (p, P, t) = R1 (q, Q, t) −
X k
p k qk +
X
Pk Q k
k
die Transformationsgleichungen qk = −
∂R4 , ∂pk
Qk =
∂R4 ∂Pk
und K = H +
∂R4 . ∂t
(291)
gewinnen. ¨ Wir wollen die vier F¨alle der besseren Ubersicht wegen in einer Tabelle zusammenfassen. Dabei verzichten wir in den Transformationsgleichungen auf eine Kennzeichnung der Erzeugenden durch Indizes:
152
.. . .. .
Q q
R1 (q, Q, t)
∂R · · · · · · Pk = − ∂Q k
p
R2 (p, Q, t)
P ∂R ∂qk
pk = .. .
R3 (q, P, t)
···+··· .. .
Qk =
∂R qk = − ∂p k .. .
∂R ∂Pk
···
R4 (p, P, t)
K = H + ∂R/∂t In jedem Fall gehen wir also von einer Erzeugenden R aus, die von einem alten und einem neuen Variablen–Halbsatz abh¨angt. Der jeweils konjugierte Halbsatz ist dann durch die partiellen Ableitungen von R gegeben. Das richtige Vorzeichen erh¨alt man aus der Merkregel, daß Ableitungen nach neuen Variablen und Ableitungen nach Impulsen jeweils ein Minuszeichen bringen.
6.4
Beispiele fu ¨ r kanonische Transformationen
Wir beginnen mit einem trivialen Beispiel: Die Erzeugende R1 (q, Q) =
X
qi Q i
(292)
i
f¨ uhrt auf die Transformationsgleichungen pk =
∂R1 = Qk ∂qk
und Pk = −
∂R1 = −qk . ∂Qk
(293)
Abgesehen von einer Vorzeichen¨anderung, die zur unver¨anderten Anschrift der kanonischen Gleichungen n¨otig ist, werden durch diese Transformation also Koordinaten und Impulse vertauscht. So trivial und nutzlos diese Operation auch ist, so f¨ uhrt sie uns doch die Gleichwertigkeit von Koordinaten und Impulsen deutlich vor Augen. Die selbe Vertauschung Qk = pk und Pk = −qk von Koordinaten und Impulsen erhalten wir auch aus der Erzeugenden R4 (p, P) =
X
p i Pi .
(294)
i
Es ist also nicht m¨oglich, einer vorgebenen Transformation eindeutig eine Erzeugende zuzuordnen. 153
Ebenfalls einfach, aber bereits n¨ utzlicher ist die Erzeugende R2 (p, Q) = −
X
pi fi (Q).
(295)
i
Sie erzeugt Punkttransformationen qk = −
∂R2 = fk (Q) ∂pk
(296)
zwischen einem alten (q) und einem neuen (Q) Satz generalisierter Koordinaten. Die zweite H¨alfte X ∂R2 ∂fi Pk = − pi = (297) ∂Qk ∂Qk i liefert die zugeh¨origen neuen Impulse Pk .
Auch die Erzeugende R3 (q, P) =
X
Pi gi (q) .
(298)
i
mit den Transformationsgleichungen Qk =
∂R3 X ∂gi ∂R3 Pi = gk (q) und pk = = ∂Pk ∂qk ∂qk i
(299)
liefert Punkttransformationen. Im Gegensatz zur Darstellung durch R2 erh¨alt man hierbei die neuen Koordinaten Qk jedoch explizit, daf¨ ur aber die neuen Impulse Pk nur noch implizit. Eine triviale Punkttransformation stellt die identische Transformation Qk = q k
und Pk = pk
(300)
dar. Wir k¨onnen sie gleichwertig aus den aus den Erzeugenden R2 id = −
X
pi Qi
oder R3 id =
i
X
Pi q i
(301)
i
gewinnen. Trotz der Trivialit¨at sind diese Darstellungen ein n¨ utzlicher Ausgangspunkt zur Erzeugung infinitesimaler kanonischer Transformationen (siehe Abschnitt 6.6). Nach diesen mehr oder weniger trivialen Beispielen wollen wir die L¨osung eines konkreten Problems durch eine nicht–triviale kanonischen Transformation demonstrieren: Zur Behandlung des harmonischen Oszillators bildet man gern die Erzeugende k 2 x cot ωQ mit ω 2 = k/m . (302) R1 (x, Q) = 2ω Sie generiert die Transformationsgleichungen p=
k ∂R1 = x cot ωQ und ∂x ω 154
sin ωQ cos2 ωQ k ∂R1 = x2 + P =− ∂Q 2 sin ωQ sin2 ωQ
!
=
kx2 . 2 sin2 ωQ
L¨osen wir die zweite Gleichung nach x auf und setzen sie anschließend in die erste Gleichung ein, so erhalten wir s √ 2 1/2 2k 1/2 x= P sin ωQ und p= P cos ωQ . (303) k ω Mit dieser Transformation geht die Hamiltonfunktion H(p, x) =
p2 k + x2 2m 2
des harmonischen Oszillators in K(P, Q) = H =
!
k cos2 ωQ + sin2 ωQ P 2 mω
u ¨ber. Mit ω 2 = k/m erhalten wir also die besonders einfache Hamiltonfunktion K = P,
(304)
und die einzige Variable Q wird zyklisch. Darum ist P konstant, und es gilt offenbar P =K =H =E. Die kanonische Gleichung
∂K =1 Q˙ = ∂P
zeigt, daß die neue Koordinate Q = t − t0
(305)
die Zeit beschreibt. Mit P = E und Q = t − t0 liefern die Transformationsgleichungen (303) explizit den Bewegungsablauf. Die kanonische Transformation gestattet also in der Tat eine u ¨ beraus elegante Probleml¨osung — vorausgesetzt man hat Gl¨ uck, und der Himmel verr¨at eine geeignete Erzeugende. Was aber macht man, wenn man kein Gl¨ uck hat und der Himmel schweigt?
6.5
Die Hamiltonsche partielle Differentialgleichung
Wie bereits angedeutet, ist es nicht sehr befriedigend, bei der Suche nach einer geeigneten kanonischen Transformation auf den Zufall oder die Intuition angewiesen zu sein. Wir suchen daher nach einem systematischen Weg, besonders 155
vorteilhafte Erzeugende zu finden. Der g¨ unstigste Fall liegt sicher vor, wenn die neue Hamiltonfunktion K u ¨ berhaupt nicht mehr von den neuen Variablen Pk und Qk abh¨angt. Dann folgt n¨amlich
∂K = 0, P˙ k = − ∂Qk ∂K Q˙ k = = 0, ∂Pk
also
P k = αk
also
Q k = βk
und
(306) (307)
mit geigneten Integrationskonstanten αk und βk . Die neue Hamiltonfunktion ist selbst konstant und kann gleich Null gew¨ahlt werden. Diese ’ideale’ Transformation auf einen vollst¨andigen Satz von 2f Integrationskonstanten wollen wir dem allgemeinen Brauch folgend aus einer Erzeugenden vom Typ R3 gewinnen, die wir mit S bezeichnen und Wirkungsfunktion nennen. Mit (306) und (307) gelten dann die Transformationsgleichungen
∂ S(q, α, t) und ∂qk ∂ = S(q, α, t) . ∂αk
pk =
(308)
βk
(309)
In diesen Transformationsgleichungen ist bereits die gesamte Probleml¨osung enthalten (Satz von Jacobi): Bei vorgegebenen Integrationskonstanten αk , βk sind die Koordinaten qk (t) implizit durch Gl. (309) bestimmt. Gl. (308) liefert die zugeh¨origen Impulse pk (t). Die 2f Integrationskonstanten αk und βk folgen mit den selben Gleichungen aus den Anfangsbedingungen qk (0) und pk (0). Existiert eine so wunderbare Erzeugende denn wirklich? Wenn ja: Hat sie eine physikalische Bedeutung? Wie finde ich sie? Wir hatten verlangt, daß S die neue Hamiltonfunktion zum Verschwinden bringt: K = H(p, q, t) + Setzen wir hierin
∂S = 0. ∂t
(310)
dS X ∂S ∂S = − q˙k ∂t dt ∂qk k
ein, so erhalten wir mit Gl. (308) X dS = pk q˙k − H = L . dt k
156
(311)
Die Wirkungsfunktion S ist also identisch mit dem im Abschnitt 6.1 [Gl. (277)] definierten Wirkungsintegral. Bei der Diskussion des Hamiltonschen Prinzips hatten wir erw¨ahnt, daß S/¯ h die Phase der quantenmechanischen Wellenfunktion beschreibt. Die Gleichung S = const beschreibt also Wellenfl¨ achen gleicher Phase. Auf diesen Wellenfl¨achen steht der generalisierte Impuls nach Gl. (308) senkrecht. Betrachten wir speziell ein Teilchen in kartesischen Koordinaten, so sind die Wellenfl¨achen S(x, α, t) = const also die orthogonalen Trajektorien aller mit den Integrationskonstanten α vertr¨aglichen Teilchenbahnen. Oder umgekehrt: Man erh¨alt die m¨oglichen Teilchenbahnen als orthogonale Trajektorien der Wellenfl¨achen. Damit l¨aßt sich ein B¨ undel m¨oglicher Teilchenbahnen mit einem B¨ undel von Lichtstrahlen in der geometrischen Optik vergleichen, und man kann tats¨achlich zeigen, daß die Gleichungen der Wellenmechanik in der N¨aherung der geometrischen Optik (λ → 0) auf die Hamilton–Jacobi–Theorie f¨ uhren: Die klassische Mechanik unterscheidet sich von der Quantenmechanik genau durch das Fehlen von Interferenz– und Beugungseffekten. So ¨asthetisch sch¨on und inhaltsschwanger die Beziehung (311) auch sein mag, so wenig ist sie allerdings zur Berechnung von S geeignet. Denn die Integration von Gl. (311) setzt ja bereits die Kenntnis der Teilchenbahnen, also die L¨osung des Problems, voraus. Zu einer Bestimmungsgleichung f¨ ur S kommen wir aber, wenn wir die Transformationsgleichungen (308) in Gl. (310) einsetzen. Wir erhalten dann die Hamiltonsche partielle Differentialgleichung H
!
∂S ∂S , q, t + =0 ∂q ∂t
(312)
und sehen, welch hohen Preis wir f¨ ur die wunderbare Erzeugende zu zahlen haben: W¨ahrend uns das Bewegungsproblem selbst ’nur’ mit einem System gew¨ohnlicher Differentialgleichungen der Ordnung 2f konfrontiert, m¨ ussen wir zur Bestimmung von S ein vollst¨andiges Integral der partiellen Differentialgleichung finden, das 2f freie Integrationskonstanten59 αk enth¨alt. F¨ ur diesen hohen Preis wird allerdings auch eine ad¨aquat hohe Leistung geboten. Denn die eine Funktion S enth¨alt bereits die vollst¨andige und fertig ausintegrierte Information u ur beliebige An¨ber s¨amtliche L¨osungen des Bewegungsproblems f¨ fangsbedingungen. Der hohe Preis – und hier wird es wieder unbefriedigend – ist jedoch nur selten bezahlbar. Praktisch kommt man nur in den F¨allen zu der erw¨ unschten Wirkungs59
Wegen der f + 1 partiellen Ableitungen geh¨ oren zur allgemeinen L¨ osung von Gl. (312) eigentlich f +1 Integrationskonstanten. Eine davon ist jedoch die triviale additive Konstante, die in den Transformationsgleichungen nicht auftaucht.
157
funktion S, in denen die Hamiltonsche partielle Differentialgleichung durch Separation gel¨ost werden kann. Damit meinen wir, daß S in eine Summe S=
X
Sk (qk , α) + St (t, α)
(313)
k
zerf¨allt. Dieser gl¨ uckliche Umstand beschr¨ankt sich aber auch wieder auf diejenigen F¨alle, in denen das Bewegungsproblem auch ohne Hamilton–Jacobi– Theorie in allgemeiner Form l¨osbar ist60 . Der zeitliche Anteil St l¨aßt sich immer abseparieren, wenn die Hamiltonfunktion nicht explizit von t abh¨angt. Dann gilt n¨amlich H = Eˆ = const61 und aus Gl. (312) folgt ∂S = −Eˆ , ∂t
ˆ . S = S0 (q, α) − Et
also
(314)
Die Hamiltonsche charakteristische Funktion (oder ’verk¨ urzte Wikungsfunktion’) S0 ist nun aus der (“verk¨ urzten”) Hamiltonschen partiellen Differentialgleichung H
!
∂S0 , q = Eˆ ∂q
(315)
zu bestimmen. Dabei ist zu beachten, daß Eˆ selbst eine Integrationskonstante ist, die von den αk abh¨angt oder mit einem der α’s identisch ist. Es ist u ¨blich, α1 = Eˆ
(316)
zu verf¨ ugen. Damit zerf¨allt Gl. (309) in die beiden Gleichungen βk =
∂ ˆ α) (k ≥ 2) S0 (q, E, ∂αk
und
β1 =
∂S0 − t, ∂ Eˆ
(317)
welche die Bahn und den “Fahrplan” getrennt beschreiben.
6.6
Der harmonische Oszillator als Beispiel
Aus der Hamiltonfunktion H=
p2 k + x2 2m 2
60 Ob die Hamiltonsche partielle Differentialgleichung separierbar ist, h¨ angt außerdem von den verwendeten Koordinaten ab. 61 ˆ die Gesamtenergie des Systems ist, siehe Abschnitt 2.7 Zur Frage, wann E
158
des harmonischen Oszillators erhalten wir die Hamiltonsche partielle Differentialgleichung [vgl. Gl. (312)] ∂S ∂x
1 2m
!2
k ∂S + x2 + = 0. 2 ∂t
(318)
Da die Hamiltonfunktion die Zeit nicht explizit enth¨alt und H = E = α gilt, k¨onnen wir die Zeitabh¨angigkeit abseparieren und setzen gem¨aß (314) S(x, E, t) = S0 (x, E) − Et . Die charakteristische Funktion S0 gen¨ ugt dann der Gleichung [vgl. Gl. (315)] 1 2m
∂S0 ∂x
!2
k + x2 = E . 2
(319)
Daraus erhalten wir durch Integration S0 (x, E) =
Z
s
k 2m(E − x2 ) dx . 2
Die Integration ist elementar (siehe unten), wir brauchen sie aber gar nicht auszuf¨ uhren, da die Transformationsgleichungen nur Ableitungen von S0 enthalten: ∂S0 ∂S = = p= ∂x ∂x
s
k 2m(E − x2 ) , 2
Z ∂S ∂S0 m dx −t. β= = −t= q ∂α ∂E 2m(E − k2 x2 )
Die erste Gleichung liefert uns (in der Form des Energiesatzes) die Gleichung der Bahn des harmonischen Oszillators. Die zweite Gleichung, die den “Fahrplan” liefern soll, m¨ ussen wir weiter auswerten: t+β =
r
m 2E
Z
dx q
1−
k 2 x 2E
=
r
m k
Z
√
du , 1 − u2
u=
q
k 2E
x.
Mit einer Formelsammlung oder einer zweiten Substitution u = sin v finden wir die L¨osung r q m 1 k arcsin u = arcsin 2E t+β = x k ω oder s 2E x= sin[ω(t + β)] . (320) k [Obwohl das Problem damit vollst¨andig gel¨ost ist, wollen wir zur Vertiefung die charakteristische Funktion S0 (x, E) selbst noch einmal als Erzeugende einer kanonischen
159
Transformation betrachten. Um diesen Aspekt zu verdeutlichen, benutzen wir auch die Bezeichnungen E → P und S0 (x, E) → R3 (x, P ) und schreiben R3 (x, P ) =
Z q
2m(P − k2 x2 ) dx .
Die formale Rechnung ist nat¨ urlich identisch mit der oben und liefert die Transformationsgleichungen ∂R3 q p= = 2m(P − k2 x2 ) ∂x und q 1 ∂R3 k = arcsin Q= 2P x . ∂P ω
Wegen K=H=P folgt die Beziehung Q = t + β nun aus der kanonischen Gleichung ∂K Q˙ = = 1. ∂P
Die Erzeugende R3 (x, P ) = S0 (x, P ) liefert also die selben neuen Variablen P = E und Q = t+ const wie die Erzeugende R1 (x, Q) nach Gl. (302). Um den Zusammenhang zwischen R3 und R1 zu untersuchen, rechnen wir R3 nun doch explizit aus: R3 (x, P ) =
Z q √ 2mP 1−
= 2 =
r
m P k
Z p
k 2P
x2 dx
1 − u2 du
P p (u 1 − u2 + arcsin u) ω
(u =
q
k 2P
x) .
Nun f¨ uhren wir eine Legendretransformation
R1 (x, Q) = R3 (x, P ) − P Q aus. Mit den Beziehungen P =
kx2 , 2u2
arcsin u = ωQ
und u = sin ωQ
erhalten wir R1 (x, Q) = =
P (sin ωQ cos ωQ + ωQ) − P Q ω kx2 kx2 sin ωQ cos ωQ cot ωQ . = 2ω 2ω sin2 ωQ
Damit verliert die Erzeugende R1 (x, Q) aus Gl. (302) den magischen Zauber eines gn¨adigen Himmelsgeschenks und entpuppt sich als biederes Produkt zielstrebigen Fleißes.]
160
6.7
Erg¨ anzende Bemerkungen
Wir beenden an dieser Stelle die Einf¨ uhrung in die Hamilton–Jacobi–Theorie und weisen nur noch andeutungsweise auf die folgenden wichtigen Erg¨anzungen hin: 1. Zur Verdeutlichung der Zusammenh¨ange ist es n¨ utzlich, infinitesimale kanonische Transformationen Qk = qk + δqk () ,
Pk = pk + δpk ()
mit δqk , δpk = O() ,
(321)
→0
zu betrachten. Ausgehend von der identischen Transformation (300,301) kann man sie zum Beispiel durch R3 (q, P) =
X
qk Pk + G(q, P) =
k
X
qk Pk + G(q, p) + O(2 )
(322)
k
erzeugen und findet gem¨aß Qk = ∂R3 /∂Pk und pk = ∂R3 /∂qk in erster Ordnung in δqk =
∂ ∂ G(q, p) und δpk = − G(q, p) . ∂pk ∂qk
(323)
Man nennt G(q, p) die Erzeugende der infinitesimalen kanonischen Transformation (323). W¨ahlt man speziell die Hamiltonfunktion H als Erzeugende, so folgt mit den kanonischen Gleichungen δqk = q˙k
und δpk = p˙ k .
Die Hamiltonfunktion ist also die Erzeugende einer infinitesimalen Zeitverschiebung = δt. Daraus folgt die wichtige Feststellung, daß der Bewegungsablauf selbst als Folge infinitesimaler kanonischer Transformationen oder als kanonische Transformation aufgefaßt werden kann62 . Auf ¨ahnliche Weise sieht man, daß der Impuls und der Drehimpuls die Erzeugenden infinitesimaler Translationen bzw. Drehungen sind. Man kann dies zum Ausgangspunkt der Diskussion von Symmetrien und Erhaltungss¨atzen machen, die wir im Abschnitt 2.7 gef¨ uhrt haben. 62
Diese Folgerung kann man auch aus der Transformation auf die Konstanten αk und βk im Abschnitt 6.5 ziehen.
161
2. Kanonische Transformationen bilden Gebiete des Phasenraums volumentreu ab. Da auch der Bewegungsablauf durch kanonische Transformationen beschrieben werden kann, folgt daraus, daß das Phasenraum–Volumen, das ein Ensemble von gleichartigen mechanischen Systemen im Phasenraum einnimmt, im Lauf der Zeit erhalten bleibt (Satz von Liouville). Das Phasenraumvolumen kann allerdings durch die Bewegung wie Zuckerwatte in feine F¨aden gezogen und zu hochkomplexen, scheinbar volumin¨oseren Strukturen verwickelt werden. Der Satz von Liouville spielt eine wichtige Rolle in der Statistischen Mechanik. Es besteht ein enger Zusammenhang zwischen dem Phasenraumvolumen und der Entropie. 3. Neben dem Phasenraumvolumen und den kanonischen Gleichungen gibt es zahlreiche weitere Invarianten kanonischer Transformationen. Wir erw¨ahnen hier noch die Invarianz der Poissonklammern63
{A, B} =
X k
∂A ∂B ∂A ∂B − ∂qk ∂pk ∂pk ∂qk
!
=
X k
∂A ∂B ∂A ∂B − ∂Qk ∂Pk ∂Pk ∂Qk
!
.
(324)
Mit Hilfe der Poissonklammern und der kanonischen Gleichungen erh¨alt man die zeitliche Variation einer dynamischen Gr¨oße A(q, p, t) in der knappen Form !
X ∂A dA ∂A ∂A ∂A = q˙k + p˙ k + = {A, H} + . dt ∂qk ∂pk ∂t ∂t k
(325)
Die tiefere Bedeutung dieser Notation liegt im Korrespondenzprinzip, nach dem ¨ die Poissonklammern beim Ubergang zur Quantenmechanik in die Kommutatorklammern u bergehen: ¨ {A, B} →
1 [A, B] . i¯ h
(326)
Aus der klassischen Gleichung (325) ensteht so die quantenmechanische Heisenberggleichung dA 1 ∂A = [A, H] + . dt i¯ h ∂t
63
(327)
Das Vorzeichen wird gelegentlich (z. B. im Lehrbuch der Quantenmechanik von E. Fick) umgekehrt definiert.
162
Literaturhinweise Alle u ucher gehen im Umfang wesentlich u ¨blichen Lehrb¨ ¨ ber den Inhalt dieser Vorlesung hinaus, eignen sich aber, einzelne Probleme nachzulesen und zu vertiefen. Dabei richtet sich die optimale Wahl nicht zuletzt nach dem pers¨onlichen Geschmack. Die folgende Aufstellung ist deshalb nicht als Empfehlung zu verstehen, sondern gibt die Quellen an, die ich bei der Ausarbeitung der Vorlesung vornehmlich benutzt habe. a) H. Goldstein: Klassische Mechanik, Akademische Verlagsgesellschaft, Frankfurt Ein a¨lteres Standardlehrbuch, das an Vollst¨andigkeit un¨ ubertroffen ist. Leider vermittelt es ein wenig den falschen Eindruck, als w¨aren die meisten Probleme mit den Mitteln der analytischen Mechanik analytisch l¨osbar. b) W. Greiner: Theoretische Physik, Band 1 Mechanik I und Band II Mechanik II Verlag Harri Deutsch, Thun und Frankfurt Stark didaktisch ausgerichtete, f¨ ur meinen Geschmack etwas langatmige Einf¨ uhrung in die Mechanik, die erst im letzten Drittel des zweiten Bandes den Lagrange- und Hamiltonformalismus behandelt. c) A. Sommerfeld: Mechanik (Bd. I der Vorlesungen u ¨ber Theoretische Physik), VAG Leipzig bzw. Teubner. Eine ausgezeichnete Darstellung, die tiefsinnig und spielerisch (Exkurse u ¨ber das Billardspiel und das Radfahren) die physikalischen Grundideen herausarbeitet und verst¨andlich und elegant mit der Mathematik umgeht. Leider ist Sommerfelds Darstellung viel zu unsystematisch, um die Vorlesung zu begleiten. Das Lehrbuch eignet aber hervorragend, um den Stoff zu vertiefen. d) Feynman/Leighton/Sands: Vorlesungen u ¨ber Physik, Bd. 1 und 2, R. Oldenbourg Verlag Mu ¨nchen Diese ausgezeichnete Darstellung der gesamten Physik weicht stark von der u ¨blichen Gliederung in Teilgebiete ab. Sie legt großen Wert auf die Didaktik und vermittelt ein tiefes Verst¨andnis der Grundlagen. Wegen der Gliederung ist das Werk zur direkten Begleitung der Vorlesung weniger geeignet, ich empfehle aber einzelne Kapitel daraus zur Erg¨anzung und Vertiefung.
163