Springer-Lehrbuch
Armin Wachter · Henning Hoeber
Repetitorium Theoretische Physik Geleitwort von Klaus Schilling
Zweite, u¨ berarbeitete Auflage Mit 80 Abbildungen, 67 Anwendungen und vollst¨andigen L¨osungswegen sowie einem kommentierten Literaturverzeichnis
123
Dr. Armin Wachter Internet: www.wachter-hoeber.com
Dr. Henning Hoeber Internet: www.wachter-hoeber.com
E-mail:
[email protected] E-mail:
[email protected] ISBN 3-540-21457-7 Springer Berlin Heidelberg New York ISBN 3-540-62989-0 Springer Berlin Heidelberg New York
Bibliografische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar. Dieses Werk ist urheberrechtlich gesch¨utzt. Die dadurch begr¨undeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielf¨altigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielf¨altigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zul¨assig. Sie ist grunds¨atzlich verg¨utungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Springer ist ein Unternehmen von Springer Science+Business Media springer.de © Springer-Verlag Berlin Heidelberg 1998, 2005 Printed in Germany Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daß solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten w¨aren und daher von jedermann benutzt werden d¨urften. Satz:A. Wachter und Satztechnik Katharina Steingraeber, Heidelberg unter Verwendung eines Springer LATEXMakropakets Einbandgestaltung: design & production GmbH, Heidelberg Gedruckt auf s¨aurefreiem Papier
SPIN: 10998205
56/3141/jl - 5 4 3 2 1 0
Geleitwort
Das Physikstudium orientiert sich – auch bei der Betrachtung der Einzelph¨ anomene – an strukturellen Zusammenh¨ angen in Begriffsentwicklung und Theoriebildung. Wer als Physikstudent w¨ ahrend seines Studiums die Abstraktionen innerhalb der vier kanonischen Teilgebiete der Theoretischen Physik (Klassische Mechanik, Klassische Elektrodynamik, Quantenmechanik und Thermodynamik/Statistische Physik) im Hinblick auf deren experimentelle Beobachtung sowie in ihrer operationalen Bedeutung erfaßt hat, der ist f¨ ur sein Abschlußexamen in Theoretischer Physik wohl vorbereitet. Genau dies wollen die beiden jungen Autoren dieses Repetitoriums erreichen. Dank ihrer wissenschaftlichen Jugend k¨ onnen sie sich noch gut in die Situation der Studierenden w¨ ahrend der Pr¨ ufungsvorbereitung hineinversetzen, wenn diese den Stoff der theoretischen Kursvorlesungen in der Gesamtschau noch einmal Revue passieren lassen. ¨ Aus ihrer Erfahrung als Lernende und Pr¨ uflinge, aber auch als Ubungsleiter haben sie den Versuch unternommen, das Material der theoretischphysikalischen Kursvorlesungen zur Pr¨ ufungsvorbereitung auf des Pudels ” Kern“ zu konzentrieren, nicht formelhaft-verk¨ urzt aber auch nicht als Ersatz f¨ ur bew¨ ahrte Lehrb¨ ucher. W¨ ahrend letztere aus der Vogelperspektive“ erfah” rener Professoren verfaßt sein m¨ ogen, wollen die Autoren mit dem vorliegenden Werk einen erg¨ anzenden Stoffzugang aus der eigenen Studienerfahrung anbieten. Physik ist seit jeher und in besonderem Maße eine internationale Wissenschaft. Dem entsprechend k¨ onnen die Autoren europ¨ aische Erfahrungshorizonte aus dem Lehrbetrieb der Universit¨ aten Hamburg, Wuppertal und Edinburgh aus eigener Anschauung einbringen. Inwieweit ihnen dies tats¨ achlich gelungen ist, m¨ ussen die Leser, also wiederum die Studierenden entscheiden. M¨ oge also das Repetitorium vielen Examenskandidaten bei ihrer Pr¨ ufungsvorbereitung von Nutzen sein!
Wuppertal, Juli 1998
Prof. Dr. K. Schilling
Danksagung
Wir bedanken uns f¨ ur die freundliche Unterst¨ utzung der Robert Gordon University, Aberdeen, wo ein Großteil des Kapitels Elektrodynamik entstand (und wo besser u ¨ber Elektrodynamik schreiben als in Aberdeen?); bei Klaus K¨ ampf f¨ ur die großz¨ ugige B¨ ucherspende; bei den Kollegen und Studenten der Bergischen Universit¨ at Wuppertal und des H¨ ochstleistungsrechenzentrums J¨ ulich f¨ ur die zahlreichen Diskussionen und Anregungen; bei der Pallas GmbH und der Compagnie G´en´erale de G´eophysique f¨ ur die freundliche Unterst¨ utzung in der hektischen Schlußphase. Schließlich bedanken wir uns bei unseren Freunden und Familien, ohne die dieses Projekt schlichtweg undenkbar gewesen w¨ are.
Vorwort zur 2. Auflage
Es ist sehr erfreulich, daß das Repetitorium Theoretische Physik in den letzten sechs Jahren immer mehr Anh¨ anger gefunden hat. Offenbar trifft dieses Buch mit seinem axiomatisch-deduktiven Ansatz den Nerv“ vieler Studierenden, ” die an einer kompakten und u ¨bersichtlichen Darstellung der kanonischen Gebiete der Theoretischen Physik interessiert sind. Genau dies jedenfalls wird uns durch die zahlreichen Zuschriften unserer Leser best¨ atigt. Unter anderem aufgrund der Fehlerhinweise, die uns von aufmerksamen Lesern erreicht haben und f¨ ur die wir uns an dieser Stelle bedanken m¨ ochten, haben wir die 2. Auflage des Repetitorium Theoretische Physik zum Anlaß genommen, das Buch einer gr¨ undlichen Pr¨ ufung zu unterziehen. Dabei stellte sich heraus – und wir sind uns nicht zu schade, dies zuzugeben –, daß die 1. Auflage neben textuellen und argumentativen Schwachstellen auch Formelfehler enth¨alt, von denen allerdings die meisten marginaler Natur sind. Gleichwohl ist uns bewußt, daß es auch kleine Zeichenfehler in mathematischen Formeln sind, die dem Leser unter Umst¨ anden viel Zeit kosten, weil er verst¨ andlicherweise dazu neigt, die Ursache von Nachvollziehbarkeitsproblemen zun¨ achst bei sich zu suchen. Obwohl wir nat¨ urlich auch f¨ ur die vorliegende 2. Auflage keine Garantie f¨ ur Fehlerfreiheit geben k¨ onnen, so sind wir aufgrund unserer kritischen ¨ Uberarbeitung doch sehr sicher, die Lesbarkeit und Nachvollziehbarkeit von Text, Argumentation und Formeln erheblich verbessert zu haben. M¨ oge also die 2. Auflage des Repetitorium Theoretische Physik einen ¨ ahnlich großen oder gar gr¨ oßeren Zuspruch bei Studierenden der Theoretischen Physik finden; f¨ ur Anregungen, Kommentare und Hinweise sind wir selbstverst¨ andlich auch weiterhin sehr dankbar.
K¨oln und Newcastle, Juli 2004
Armin Wachter Henning Hoeber
P.S.: Zur Vermeidung von Mißverst¨ andnissen sei darauf hingewiesen, daß wir in dieser 2. Auflage dazu u ¨bergegangen sind, die Elektronladung mit +e zu bezeichnen, anstelle von −e wie in der 1. Auflage.
Vorwort zur 1. Auflage
Unser Buch Repetitorium Theoretische Physik enth¨ alt die Gebiete • Mechanik, • Elektrodynamik, • Quantenmechanik sowie • Statistische Physik und Thermodynamik, also den kanonischen Lehrstoff“ der Theoretischen Physik der ersten sechs ” Semester an deutschen Universit¨ aten. Es wendet sich haupts¨ achlich an Studierende der Physik h¨ oherer Semester, die an einer u ¨bersichtlichen und zusammenh¨ angenden Darstellung des Lehrstoffes interessiert sind oder sich in Pr¨ ufungsvorbereitungen zum Diplom oder Magister befinden. Dar¨ uber hinaus ist dieses Buch auch als begleitendes und erg¨ anzendes Lehrbuch f¨ ur Physikstudenten in den ersten Semestern geeignet. F¨ ur sie gibt das Buch einen n¨ utzlichen Leitfaden zur Klassifizierung und Einordnung des in den verschiedenen theoretischen Physikvorlesungen vermittelten Wissens. Schließlich soll¨ ten auch Physiker im Beruf oder in der Forschung aus diesem Uberblick der Theoretischen Physik Nutzen ziehen k¨ onnen. Selbstverst¨ andlich gibt es zu jedem der o.g. Gebiete ausgesprochen gute Lehrb¨ ucher (einige Anregungen sind in unserem kommentierten Literaturverzeichnis zu finden). Dieses Buch ist deshalb keinesfalls als Ersatz zum Durcharbeiten solcher B¨ ucher gedacht; kein Student wird auf eine ausf¨ uhrliche Erarbeitung des Lehrstoffes mittels anderer, didaktisch und historisch gut aufbereiteter Darstellungen der Theoretischen Physik verzichten k¨ onnen. Dennoch erschien uns das Schreiben eines Buches in der vorliegenden Form notwendig, um den Lernenden einen zu vielen anderen Lehrb¨ uchern komplement¨ aren Zugang zur Theoretischen Physik zu bieten, in welchem der Aufbau, die Struktur und nicht zuletzt auch die Eleganz physikalischer Theorien – u.a. durch den Verzicht auf historisch-ph¨ anomenologische Begr¨ undungen – hervorgehoben und leichter erkennbar wird. Wir verfolgen durchweg den axiomatisch-deduktiven Ansatz, indem wir die Grundgleichungen der verschiedenen Theorien voranstellen und aus ihnen konsequent die einzelnen physikalischen Zusammenh¨ ange und Gesetzm¨ aßigkeiten in logischer (und nicht chronologischer) Reihenfolge entwickeln. Unser
XII
Vorwort zur 1. Auflage
Ziel ist, durch den konsequenten Gebrauch einer einheitlichen Darstellung und Notation die Verbindungen zwischen den verschiedenen Theorien deutlich herauszuarbeiten. Man denke hierbei etwa an den Hamilton-Formalismus, der nicht nur in der Mechanik, sondern auch in der Quantenmechanik und der Statistischen Physik ein grundlegendes Konzept darstellt. Im ersten Kapitel Mechanik stellen wir den oftmals u ¨berbetonten Newtonschen Zugang zur Mechanik mit den Lagrangeschen und Hamiltonschen Formulierungen Seite an Seite. Denn jeder dieser ¨aquivalenten Darstellungen zeichnet sich durch spezielle Vorteile aus. W¨ahrend der Newtonsche Ansatz durch das Aufstellen von Bewegungsgleichungen u ¨ber die Kraft intuitiv am leichtesten zug¨anglich ist, wird erst mit dem Lagrange- und HamiltonFormalismus ein tieferes Verst¨andnis der Mechanik sowie anderer theoretischer Konzepte erm¨oglicht. Zum Beispiel eignet sich gerade der LagrangeFormalismus besonders zum Verst¨andnis der Verkn¨ upfung von Symmetrien und Erhaltungss¨atzen. Dementsprechend besch¨aftigen sich die ersten drei Abschnitte in gleichberechtigter Weise mit diesen drei Zug¨angen und ihrer inneren Verbindung. Dar¨ uber hinaus f¨ uhren wir in Abschnitt Relativistische Mechanik bereits die korrekte Lorentz-Tensorschreibweise ein und erleichtern ¨ dem Leser somit den Ubergang zur relativistischen Theorie der Elektrodynamik, in der sich die disziplinierte Einhaltung dieser Notation als sehr bequem und u ¨bersichtlich erweist. Der Vorteil der deduktiven Methode wird vielleicht besonders in unserem zweiten Kapitel Elektrodynamik deutlich. Im Gegensatz zu fast allen Lehrb¨ uchern der Elektrodynamik stellen wir die Maxwell-Gleichungen in ihrer allgemeinsten Form oben an. Dies erm¨oglicht es, sofort die Struktur der Theorie zu erkennen und die allgemeine L¨osung der Maxwell-Gleichungen mittels des u ¨beraus wichtigen Konzeptes der Eichinvarianz zu erarbeiten. Aus ihr ergeben sich dann auf recht u ¨bersichtliche Weise die verschiedenen Gesetzm¨ aßigkeiten wie etwa die L¨osungen im freien Raum oder die Spezialf¨ alle der Elektro- und Magnetostatik. Aufbauend auf der relativistischen Mechanik wenden wir auch hier an geeigneten Stellen die kovariante Schreibweise an und diskutieren den Lagrange- und Hamilton-Formalismus in Bezug auf den feldtheoretischen Charakter der Elektrodynamik. Abweichend von allen anderen Kapiteln beginnen wir das Kapitel Quantenmechanik mit einem mathematischen Einf¨ uhrungsteil, in dem einige Gebiete der linearen Algebra in der Diracschen Schreibweise rekapituliert werden. Insbesondere wird dort das f¨ ur die Quantenmechanik unentbehrliche Konzept des Operators und das mit ihm verbundene Eigenwertproblem diskutiert. Hieran schließt sich der allgemeine Aufbau der Quantentheorie an, wo die fundamentalen quantenmechanischen Konzepte darstellungsfrei eta¨ bliert und diskutiert werden. Uberhaupt versuchen wir in diesem Kapitel die ¨ Uberbetonung einer bestimmten Darstellung zu vermeiden. ¨ Ahnlich wie in der Mechanik gibt es auch in der Statistischen Physik/Thermodynamik verschiedene Zug¨ange zur Beschreibung von Viel-Teil-
Vorwort zur 1. Auflage
XIII
chensystemen. Zum einen hat man den statistischen Ansatz, welcher quantenmechanische bzw. mechanische Gesetzm¨ aßigkeiten mit einem statistischen Prinzip zu einer mikroskopischen Beschreibungsweise in Form von Ensemble-Theorien verkn¨ upft. Demgegen¨ uber steht die Thermodynamik, als eine rein ph¨ anomenologische Theorie, die lediglich von makroskopischen Erfahrungss¨ atzen ausgeht. Ein dritter Zugang ist der informationstheoretische andigkeit von InforAnsatz, bei dem ein System vom Standpunkt der Unvollst¨ mation aus betrachtet wird. Um die innere Verbindung dieser drei Zugangsweisen deutlich zu machen, diskutieren wir in Kapitel Statistische Physik und ¨ Thermodynamik alle drei Konzepte und zeigen die Aquivalenz der Zug¨ ange auf. Wichtige Gleichungen und Zusammenh¨ ange werden in Form von Definitions- und Satzk¨asten zusammengefaßt, um so dem Leser ein strukturiertes Lernen und schnelles Nachschlagen zu erm¨ oglichen. Zudem geben wir uns M¨ uhe, zusammenh¨ angende Argumentationen auch optisch deutlich zu gliedern; im Prinzip sollte es dem Leser jederzeit m¨ oglich sein, das Ende eines Argumentationsstranges, etwa eine Herleitung oder ein Beweis, zu erkennen. Desweiteren befinden sich nach jedem Abschnitt eine Kurzzusammenfassung sowie einige Anwendungen samt L¨ osungen, mit deren Hilfe das Verst¨ andnis des behandelten Stoffes u berpr¨ u ft werden kann und die zum Teil wei¨ terf¨ uhrende Themen behandeln. Im Anhang geben wir schließlich eine kurze Zusammenstellung einiger wichtiger und h¨ aufig benutzter mathematischer Formeln. Nat¨ urlich erheben wir keinesfalls den Anspruch auf Vollst¨ andigkeit. Stattdessen wurden die Themen der vier behandelten Gebiete so ausgew¨ ahlt, daß sie einerseits die jeweils grundlegenden Ideen und Konzepte enthalten, andererseits aber auch die wichtigsten pr¨ ufungsrelevanten und mehr anwendungsorientierten Gebiete abdecken. Aufbauend auf dem hier pr¨ asentierten Stoff sollte der Leser in der Lage sein, andere Gebiete der Physik selbst zu erarbeiten. Zu diesem Zweck haben wir im Anhang einige Literaturvorschl¨ age gemacht. Insgesamt hoffen wir, mit diesem Buch einen Vermittler zwischen Lehrb¨ uchern, Vorlesungen und Kurzrepetitorien geschaffen zu haben, mit dem es m¨oglich ist, die Konzepte der Theoretischen Physik besser zu verstehen.
K¨oln und London, Juli 1998
Armin Wachter Henning Hoeber
Inhaltsverzeichnis
Anwendungsverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .XXI 1.
Mechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Newtonsche Mechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Koordinatensysteme und Vektoren . . . . . . . . . . . . . . . . . . 1.1.2 Newtonsche Axiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.3 Physikalische Folgerungen, Erhaltungss¨ atze . . . . . . . . . . 1.1.4 Beschleunigte Koordinatensysteme und Inertialsysteme, Galilei-Invarianz . . . . . . . . . . . . . . . 1.1.5 N -Teilchensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Lagrange-Formalismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Zwangskr¨ afte, d’Alembertsches Prinzip und Lagrange-Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Erhaltungss¨ atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.3 Hamilton-Prinzip und Wirkungsfunktional . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Hamilton-Formalismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Hamiltonsche Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.2 Erhaltungss¨ atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.3 Poisson-Klammer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.4 Kanonische Transformationen . . . . . . . . . . . . . . . . . . . . . . 1.3.5 Hamilton-Jacobi-Gleichung . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Bewegung starrer K¨ orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Allgemeine Bewegung starrer K¨ orper . . . . . . . . . . . . . . . 1.4.2 Rotation des starren K¨ orpers um einen Punkt . . . . . . . . 1.4.3 Eulersche Winkel und Lagrange-Gleichungen . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Zentralkraftprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5.1 Zwei-Teilchensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5.2 Konservative Zentralkr¨ afte, 1/r-Potentiale . . . . . . . . . . . 1.5.3 Keplersche Gesetze und Gravitationspotential . . . . . . . .
1 2 3 5 8 13 20 23 28 29 35 37 42 49 49 51 53 55 59 62 65 66 68 70 73 76 76 78 82
XVI
Inhaltsverzeichnis
1.5.4 Ein-Teilchenstreuung an ein festes Target . . . . . . . . . . . . 1.5.5 Zwei-Teilchenstreuung . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Relativistische Mechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.1 Grundvoraussetzungen, Minkowski-Raum, Lorentz-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.2 Relativistische Effekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.3 Kausalit¨atsprinzip, raum-, zeit- und lichtartige Vektoren . . . . . . . . . . . . . . . . 1.6.4 Lorentzkovariante Formulierung der relativistischen Mechanik . . . . . . . . . . . . . . . . . . . . . . 1.6.5 Lagrange-Formulierung der relativistischen Mechanik . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.
Elektrodynamik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Formalismus der Elektrodynamik . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Maxwell-Gleichungen und Lorentz-Kraft . . . . . . . . . . . . . 2.1.2 Interpretation der Maxwell-Gleichungen . . . . . . . . . . . . . 2.1.3 Energie- und Impulserhaltungssatz . . . . . . . . . . . . . . . . . 2.1.4 Physikalische Einheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 L¨ osungen der Maxwell-Gleichungen in Form von Potentialen . 2.2.1 Skalarpotential und Vektorpotential . . . . . . . . . . . . . . . . 2.2.2 Eichtransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Allgemeine L¨osung der homogenen Wellengleichungen . 2.2.4 Spezielle L¨osung der inhomogenen Wellengleichungen, retardierte Potentiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Lorentzkovariante Formulierung der Elektrodynamik . . . . . . . . 2.3.1 Lorentz-Tensoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Lorentzkovariante Maxwell-Gleichungen . . . . . . . . . . . . . 2.3.3 Transformationsverhalten elektromagnetischer Felder . 2.3.4 Lorentz-Kraft und Kovarianz . . . . . . . . . . . . . . . . . . . . . . 2.3.5 Energie- und Impulserhaltung . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Strahlungstheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Li´enard-Wiechert-Potentiale . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Strahlungsenergie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.3 Dipolstrahlung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Zeitunabh¨angige Elektrodynamik . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Elektrostatik und Magnetostatik . . . . . . . . . . . . . . . . . . . 2.5.2 Multipolentwicklung statischer Potentiale und Felder . . 2.5.3 Randwertprobleme der Elektrostatik I . . . . . . . . . . . . . . 2.5.4 Randwertprobleme der Elektrostatik II . . . . . . . . . . . . . .
86 89 94 98 99 103 105 106 111 113 117 118 119 121 124 128 130 132 133 133 137 138 141 144 144 146 149 150 151 153 155 156 159 162 165 167 168 171 176 181
Inhaltsverzeichnis
XVII
2.5.5 Feldverteilungen in der Magnetostatik . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Elektrodynamik in Materie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.1 Makroskopische Maxwell-Gleichungen . . . . . . . . . . . . . . . 2.6.2 Materialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.3 Stetigkeitsbedingungen an Grenzfl¨ achen . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Elektromagnetische Wellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7.1 Ebene Wellen in nichtleitenden Medien . . . . . . . . . . . . . . 2.7.2 Reflexion und Brechung . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ 2.7.3 Uberlagerung von Wellen, Wellenpakete . . . . . . . . . . . . . 2.7.4 Ebene Wellen in leitenden Medien . . . . . . . . . . . . . . . . . . 2.7.5 Zylindrischer Hohlleiter . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8 Lagrange-Formalismus in der Elektrodynamik . . . . . . . . . . . . . . 2.8.1 Lagrange- und Hamilton-Funktion eines geladenen Teilchens . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8.2 Lagrange-Dichte des elektromagnetischen Feldes . . . . . . 2.8.3 Erhaltungss¨ atze, Noether-Theorem . . . . . . . . . . . . . . . . . 2.8.4 Interne Symmetrien und Eichprinzip . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.
Quantenmechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Mathematische Grundlagen der Quantenmechanik . . . . . . . . . . 3.1.1 Hilbert-Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.2 Lineare Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.3 Eigenwertproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.4 Darstellung von Vektoren und linearen Operatoren . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Allgemeiner Aufbau der Quantentheorie . . . . . . . . . . . . . . . . . . . 3.2.1 Grenzen der klassischen Physik . . . . . . . . . . . . . . . . . . . . . 3.2.2 Postulate der Quantenmechanik . . . . . . . . . . . . . . . . . . . . 3.2.3 Quantenmechanische Messung . . . . . . . . . . . . . . . . . . . . . 3.2.4 Schr¨ odinger-Bild und Schr¨ odinger-Gleichung . . . . . . . . . 3.2.5 Andere Bilder der Quantentheorie . . . . . . . . . . . . . . . . . . 3.2.6 Darstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Eindimensionale Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Betrachtungen zur Schr¨ odinger-Gleichung im Ortsraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.2 Zerfließen eines freien Wellenpaketes . . . . . . . . . . . . . . . . 3.3.3 Potentialstufe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.4 Potentialkasten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.5 Harmonischer Oszillator . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
186 189 192 192 198 200 202 205 206 209 214 218 219 221 224 224 226 228 230 234 237 239 240 244 246 250 253 255 255 257 260 264 266 270 275 278 278 281 283 287 290 293
XVIII Inhaltsverzeichnis
3.4 Quantenmechanische Drehimpulse . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Allgemeine Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.2 Bahndrehimpuls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.3 Spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.4 Addition von Drehimpulsen . . . . . . . . . . . . . . . . . . . . . . . . 3.4.5 Spin-Bahn- und Spin-Spin-Kopplung . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Schr¨ odinger-Gleichung in drei Dimensionen . . . . . . . . . . . . . . . . 3.5.1 Zwei-Teilchensysteme und Separation der Schwerpunktsbewegung . . . . . . . . . . 3.5.2 Radiale Schr¨odinger-Gleichung . . . . . . . . . . . . . . . . . . . . . 3.5.3 Freies Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.4 Kugelsymmetrischer Potentialtopf . . . . . . . . . . . . . . . . . . 3.5.5 Naives Wasserstoffatom . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Elektromagnetische Wechselwirkung . . . . . . . . . . . . . . . . . . . . . . 3.6.1 Elektron im elektromagnetischen Feld . . . . . . . . . . . . . . . 3.6.2 Eichinvarianz der Schr¨odinger-Gleichung . . . . . . . . . . . . 3.6.3 Stern-Gerlach-Experiment . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7 St¨ orungsrechnung und reales Wasserstoffatom . . . . . . . . . . . . . . 3.7.1 Zeitunabh¨angige St¨orungstheorie . . . . . . . . . . . . . . . . . . . 3.7.2 Stark-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7.3 Feinstrukturaufspaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7.4 Anomaler Zeeman-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7.5 Hyperfeinstrukturaufspaltung . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ 3.8 Atomare Uberg¨ ange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.8.1 Zeitabh¨angige St¨orungstheorie . . . . . . . . . . . . . . . . . . . . . 3.8.2 Spontane Emission, Phasenraum der Photonen . . . . . . . 3.8.3 Auswahlregeln in der Dipoln¨aherung . . . . . . . . . . . . . . . . 3.8.4 Intensit¨atsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ 3.8.5 2p3/2 → 1s1/2 -Ubergang ........................... Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.9 N -Teilchensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.9.1 Unterscheidbare Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . 3.9.2 Identische Teilchen, Pauli-Prinzip . . . . . . . . . . . . . . . . . . 3.9.3 Druck der Fermionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.10 Streutheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.10.1 Streuamplitude und Wirkungsquerschnitt . . . . . . . . . . . . 3.10.2 Streuphasenanalyse bei zentralsymmetrischen Potentialen . . . . . . . . . . . . . . .
296 296 299 301 302 305 307 310 310 312 314 316 318 322 324 324 327 330 332 334 335 339 341 343 345 347 349 349 355 357 360 362 363 366 366 367 370 372 375 375 380
Inhaltsverzeichnis
XIX
3.10.3 Resonanzstreuung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384 3.10.4 Gegenseitige Streuung von Teilchen . . . . . . . . . . . . . . . . . 387 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391 4.
Statistische Physik und Thermodynamik . . . . . . . . . . . . . . . . . 4.1 Grundlagen der statistischen Physik . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Zust¨ ande, Phasenraum, Ensembles und Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.2 Klassische statistische Physik: Wahrscheinlichkeitsdichte . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.3 Quantenstatistische Physik: Dichteoperator . . . . . . . . . . 4.1.4 Zeitliche Entwicklung eines Ensembles . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Ensemble-Theorie I: Mikrokanonisches Ensemble und Entropie . . . . . . . . . . . . . . . . . 4.2.1 Mikrokanonisches Ensemble . . . . . . . . . . . . . . . . . . . . . . . . 4.2.2 Prinzip der maximalen Entropie . . . . . . . . . . . . . . . . . . . . 4.2.3 Gleichgewichtsbedingungen und generalisierte Kr¨ afte . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Ensemble-Theorie II: Kanonisches und großkanonisches Ensemble . . . . . . . . . . . . . . . . 4.3.1 Kanonisches Ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Großkanonisches Ensemble . . . . . . . . . . . . . . . . . . . . . . . . 4.3.3 Vergleich der Ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Entropie und Informationstheorie . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1 Informationstheorie und Shannon-Entropie . . . . . . . . . . 4.4.2 Variation der Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Thermodynamik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.1 Haupts¨ atze der Thermodynamik . . . . . . . . . . . . . . . . . . . 4.5.2 Thermodynamische Potentiale . . . . . . . . . . . . . . . . . . . . . 4.5.3 Zustands¨ anderungen und thermische Koeffizienten . . . . 4.5.4 Gleichgewicht und Stabilit¨ at . . . . . . . . . . . . . . . . . . . . . . . 4.5.5 W¨ armekraftmaschinen und Kreisprozesse . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 Klassische Maxwell-Boltzmann-Statistik . . . . . . . . . . . . . . . . . . . 4.6.1 Klassischer Grenzfall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ 4.6.2 Virial- und Aquipartitionstheorem .................. 4.6.3 Harmonischer Oszillator . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.4 Ideale Spinsysteme, Paramagnetismus . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7 Quantenstatistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7.1 Allgemeiner Formalismus . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7.2 Ideales Fermi-Gas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
395 397 398 402 402 405 410 412 413 415 417 421 424 425 429 433 435 438 438 442 447 449 451 454 457 458 462 467 470 470 472 473 479 484 486 487 496
XX
Inhaltsverzeichnis
4.7.3 Ideales Bose-Gas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 501 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 507 A. Mathematischer Anhang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.1 Vektoroperationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2 Integrals¨atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.3 Partielle Differentialquotienten . . . . . . . . . . . . . . . . . . . . . . . . . . . A.4 Vollst¨ andige Funktionensysteme, Fourier-Analyse . . . . . . . . . . . A.5 Bessel-Funktionen, sph¨arische Bessel-Funktionen . . . . . . . . . . . A.6 Legendre-Funktionen, Legendre-Polynome, Kugelfl¨achenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
511 511 513 514 515 517
B. Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.1 Allgemeine Lehrb¨ ucher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.2 Mechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.3 Elektrodynamik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.4 Quantenmechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.5 Statistische Physik und Thermodynamik . . . . . . . . . . . . . . . . . .
523 523 524 524 525 526
519
Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 529
Anwendungsverzeichnis
Mechanik 1. Raketenproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Ged¨ ampfter harmonischer Oszillator . . . . . . . . . . . . . . . . . . . . . . 3. Erzwungene Schwingung des Oszillators . . . . . . . . . . . . . . . . . . . 4. Invarianz der Lagrange-Gleichung unter beliebigen Koordinatentransformationen . . . . . . . . . . . . . 5. Brachystochrone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6. Mathematisches Doppelpendel . . . . . . . . . . . . . . . . . . . . . . . . . . . 7. Kleine Schwingungen und Normalmoden . . . . . . . . . . . . . . . . . . . 8. Unabh¨ angigkeit der Erzeugenden von Randbedingungen . . . . . 9. Poisson-Klammern des Drehimpulses . . . . . . . . . . . . . . . . . . . . . . 10. Hamilton-Jacobi-Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11. Physikalisches Pendel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12. Rollender Hohlzylinder auf schiefer Ebene . . . . . . . . . . . . . . . . . 13. Periheldrehung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14. Elastische Streuung von Kugeln . . . . . . . . . . . . . . . . . . . . . . . . . . 15. Rutherford-Streuung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16. Zwillingsparadoxon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ 17. Ubergang zum momentanen Ruhesystem . . . . . . . . . . . . . . . . . . 18. Massendefekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19. Compton-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42 43 45 47 62 63 64 73 75 94 95 96 113 114 115 116
Elektrodynamik 20. Magnetische Monopole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21. Leiterschleife mit Plattenkondensator . . . . . . . . . . . . . . . . . . . . . 22. Retardierte Potentiale und Lorentz-Bedingung . . . . . . . . . . . . . 23. Vektorpotential einer stromdurchflossenen Leiterschleife . . . . . 24. Gleichf¨ormig bewegte Ladung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25. Verallgemeinertes Faradaysches Induktionsgesetz . . . . . . . . . . . 26. Lineare Dipolantenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27. Kreisf¨ormig bewegte Punktladung . . . . . . . . . . . . . . . . . . . . . . . . 28. Multipolentwicklung in sph¨ arischer Darstellung . . . . . . . . . . . . . 29. Kapazit¨ at eines Plattenkondensators . . . . . . . . . . . . . . . . . . . . . . 30. Selbstinduktivit¨ at einer Spule . . . . . . . . . . . . . . . . . . . . . . . . . . . .
130 131 141 142 153 154 165 167 189 190 191
23 24 25
XXII
Anwendungsverzeichnis
31. 32. 33. 34. 35.
Dielektrische Kugel im homogenen elektrischen Feld . . . . . . . . . Permeable Kugelschale im homogenen Magnetfeld . . . . . . . . . . Totalreflexion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Hohlraumresonator mit kreisf¨ormigem Querschnitt . . . . . . . . . . Lagrange-Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
202 204 221 222 234
Quantenmechanik 36. Eigenschaften von Projektionsoperatoren . . . . . . . . . . . . . . . . . . 37. Kommutierende Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38. Ehrenfest-Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39. Meßwahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40. Potentialwall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41. δ-Potential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42. Spin-1-Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43. Zeitliche Entwicklung eines Spin-1/2-Systems . . . . . . . . . . . . . . 44. Dreidimensionaler anisotroper Oszillator . . . . . . . . . . . . . . . . . . . 45. Erwartungswerte im Wasserstoffatom . . . . . . . . . . . . . . . . . . . . . 46. Kontinuit¨atsgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47. Elektron im konstanten Magnetfeld . . . . . . . . . . . . . . . . . . . . . . . 48. Naives Heliumatom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49. Lichtelektrischer Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50. Z¨ ahlung unterschiedlicher Konfigurationen . . . . . . . . . . . . . . . . . 51. Identisches Zwei-Teilchensystem . . . . . . . . . . . . . . . . . . . . . . . . . . 52. Streuung an einer harten Kugel . . . . . . . . . . . . . . . . . . . . . . . . . . 53. Streuung am kugelsymmetrischen Potentialtopf . . . . . . . . . . . . .
253 254 275 276 293 294 307 308 322 323 332 333 347 363 372 373 391 392
Statistische Physik und Thermodynamik 54. Klassischer Phasenraum des harmonischen Oszillators . . . . . . . 55. Postulat der a priori zuf¨alligen Phasen . . . . . . . . . . . . . . . . . . . . 56. Ideales Gas I: Phasenraumvolumen, mikrokanonische Zustandssumme und Zustandsgleichungen . . 57. Ideales Gas II: Gibbs-Paradoxon . . . . . . . . . . . . . . . . . . . . . . . . . . 58. Ideales Gas III: Kanonisches und großkanonisches Ensemble . . 59. Maxwellsche Geschwindigkeitsverteilung . . . . . . . . . . . . . . . . . . . 60. Master-Gleichung und Boltzmannsches H-Theorem . . . . . . . . . 61. Extremalit¨atsbedingungen im kanonischen und großkanonischen Ensemble . . . . . . . . . . . . . 62. Vollst¨ andige thermodynamische Information . . . . . . . . . . . . . . . 63. Adiabatische Expansion des idealen Gases . . . . . . . . . . . . . . . . . 64. Kanonische Dichtematrix des Elektrons im magnetischen Feld in speziellen Darstellungen . . . . . . . . . . . 65. Kanonische Dichtematrix des freien Teilchens in der Ortsdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66. Ideales Photonengas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67. Ideales Phononengas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
410 411 421 424 435 437 447 448 467 469 484 485 507 508
1. Mechanik
Die klassische Mechanik besch¨ aftigt sich mit der Dynamik materieller K¨ orper. Bis zu Anfang des 20. Jahrhunderts galt sie als die fundamentale Theorie der Wechselwirkung zwischen materiellen Objekten. Durch das Aufkommen der speziellen Relativit¨ atstheorie im Jahre 1905 und der Quantentheorie in den 20er Jahren wurde der G¨ ultigkeitsbereich der klassischen Mechanik in der Weise eingeschr¨ ankt, daß sie als Grenzfall kleiner Geschwindigkeiten im Vergleich zur Lichtgeschwindigkeit innerhalb der Relativit¨ atstheorie und als Grenzfall großer Energien im Vergleich zu atomaren Energien innerhalb der Quantentheorie einzuordnen ist. Das auffallendste Merkmal der klassischen Mechanik ist die Vielfalt der ¨ Zug¨ange, mit denen es m¨ oglich ist, ein spezielles Problem zu l¨ osen. Aquivalente Formulierungen der Mechanik sind • die Newtonsche Mechanik, • das d’Alembert-Prinzip, • die Lagrange-Gleichungen und generalisierte Koordinaten, • das Hamilton-Prinzip und • die Hamilton-Jacobi-Theorie. Im Prinzip ist es m¨ oglich, ein gegebenes Problem mit jedem dieser Zug¨ ange zu l¨osen. Wie sich jedoch zeigen wird, sind spezielle Arten von Problemen mit einigen dieser Ans¨ atze sehr viel einfacher zu formulieren als mit anderen. Ein Beispiel hierf¨ ur sind Probleme mit Zwangsbedingungen (man denke etwa an die Bewegung von Perlen auf einer Schnur), die in der Lagrangeschen Mechanik auf sehr einfache Art gel¨ ost werden k¨ onnen. Weiterhin zeigt sich, daß in bestimmten Formulierungen tiefere Zusammenh¨ ange, insbesondere zwischen Symmetrien und Erhaltungss¨ atzen, leichter erkennbar sind. Schließlich spielen gewisse formale Strukturen der Mechanik, etwa die Poisson-Klammer und die Hamilton-Jacobi-Gleichung, eine besondere Rolle im Zusammenhang mit ¨ dem Ubergang zur Quantenmechanik. Im ersten Abschnitt dieses Kapitels werden die physikalischen Grundlagen der Newtonschen Mechanik dargelegt und einige erste grundlegende Folgerungen diskutiert. Wir diskutieren ferner physikalische Konsequenzen, die sich innerhalb von beschleunigten Bezugssystemen ergeben. Dies wird uns
2
1. Mechanik
zum u ¨beraus wichtigen Begriff des Inertialsystems und zur Galilei-Invarianz der Newtonschen Mechanik in Inertialsystemen f¨ uhren. Die n¨ achsten beiden Abschnitte besch¨aftigen sich mit der Lagrangeschen und Hamiltonschen Mechanik, welche zwei alternative Formulierungen zur Newtonschen Mechanik darstellen. Sie sind von großem praktischen Nutzen, wenn man es mit Systemen zu tun hat, die gewissen Zwangsbedingungen unterworfen sind. Im Newtonschen Zugang hat man diese Restriktionen explizit durch Einf¨ uhren von Zwangskr¨aften in den Newtonschen Bewegungsgleichungen zu ber¨ ucksichtigen, w¨ahrend sie im Lagrange- und Hamilton-Formalismus durch geschickte Wahl von generalisierten Koordinaten, Geschwindigkeiten und Impulsen eliminiert werden k¨onnen. Dar¨ uber hinaus gew¨ahrleisten beide Zug¨ ange einen tieferen Einblick in die Struktur der Mechanik und ihren inneren Zusammenhang mit anderen physikalischen Theorien. Abschnitt. 1.4 behandelt die Dynamik von starren K¨orpern. In diesem Zusammenhang erweist es sich als g¨ unstig, verschiedene Koordinatensysteme einzuf¨ uhren, da sich hierdurch die kinematischen Gr¨oßen u ¨bersichtlich und transparent formulieren lassen. In Abschn. 1.5 betrachten wir die wichtige Klasse von Zentralkraftproblemen. Neben der Reduktion von Zwei-Teilchensysteme auf effektive EinTeilchensysteme besch¨aftigen wir uns mit der Bewegungsgleichung in Zentralpotentialen und bestimmen die m¨oglichen Teilchenbahnen in 1/r-Potentialen. Desweiteren behandeln wir die Methode der Streuung von Teilchen. Obwohl diese Methode fast ausschließlich in der Hochenergiephysik Anwendung findet und somit eine quantentheoretische Beschreibung erfordert, ist es dennoch sinnvoll, sie bereits im Rahmen der klassischen Mechanik zu diskutieren, da viele der hier entwickelten Konzepte und Begriffe in anderen Streutheorien wiederkehren. Der letzte Abschnitt besch¨aftigt sich mit der relativistischen Verallgemeinerung der Newtonschen Mechanik. Ausgangspunkt hierbei ist die experimentelle Tatsache, daß die Ausbreitungsgeschwindigkeit von Licht in allen Inertialsystemen dieselbe ist. Hieraus ergibt sich als notwendige Konsequenz, daß Raum und Zeit, anders als in der Newtonschen Mechanik, nicht absolut sind, sondern vom jeweiligen Bezugssystem abh¨angen.
1.1 Newtonsche Mechanik Dieser Abschnitt besch¨aftigt sich mit den fundamentalen Begriffen und Annahmen der Newtonschen Mechanik. Nach einer kurzen Rekapitulation einiger wichtiger mathematischer Begriffe im Zusammenhang mit der Beschreibung von Teilchenpositionen stellen wir die Axiome der Newtonschen Mechanik vor und leiten hieraus einige erste physikalische Folgerungen und Erhaltungss¨ atze her, deren Kenntnis f¨ ur das Verst¨andnis der folgenden Abschnitte von grundlegender Bedeutung ist. Im Anschluß diskutieren wir Teilchenbewegungen in beschleunigten Bezugssystemen und zeigen, wie die Newton-
1.1 Newtonsche Mechanik
3
sche Bewegungsgleichung in solchen Systemen zu modifizieren ist. In diesem Zusammenhang werden wir auf die innere Verbindung zwischen der Galilei-Invarianz und dem Begriff des Inertialsystems stoßen. Desweiteren besch¨ aftigen wir uns mit allgemeinen dynamischen Eigenschaften von VielTeilchensystemen und leiten verschiedene Erhaltungss¨ atze f¨ ur abgeschlossene Systeme her. 1.1.1 Koordinatensysteme und Vektoren Bevor wir auf den allgemeinen Aufbau der Newtonschen Mechanik zu sprechen kommen, ist es zweckm¨ aßig, einige Bemerkungen zu den in diesem Kapitel verwendeten mathematischen Konzepten und Notationen zu machen, die dem Leser eigentlich vertraut sein sollten und lediglich der Klarstellung dienen. Zur Beschreibung mechanischer Systeme benutzen wir, wie allgemein u außerst effektive Konzept des idealisierten mathematischen Mas¨blich, das ¨ senpunktes (Teilchen), dessen ¨ ortliche Lage durch einen basisunabh¨ angigen Vektor x in einem dreidimensionalen reellen Vektorraum repr¨ asentiert wird. Um diesen Ort quantifizieren zu k¨ onnen, ben¨ otigt man ein Koordinatensystem, welches durch Angabe seines Ursprungs und dreier linear unabh¨ angiger Basisvektoren spezifiziert wird. Die Wahl eines solchen Bezugssystems wird zumeist durch die Dynamik des betrachteten physikalischen Systems nahegelegt. Solange nicht explizit etwas anderes vereinbart wird, verwenden wir kartesische Koordinatensysteme mit jeweils kanonischer Orthonormalbasis. Wir schreiben f¨ ur ein solches Bezugssystem K : {e1 , e2 , e3 } , mit ei ej = δij und
ei ej = 1
(Orthonormalit¨ atsrelation)
(Vollst¨ andigkeitsrelation) .
j
Der Ort x eines Massenpunktes l¨ aßt sich nun durch Angabe der Projektionen xi von x auf die Achsen von K entlang der ei eindeutig spezifizieren: ei xi , xi = xei . (1.1) x= i
Man nennt xi auch die Koordinaten von x bez¨ uglich K. Oftmals faßt man diese zu einem Koordinatentripel zusammen und schreibt ⎛ ⎞ x1 (1.2) x = ⎝ x2 ⎠ , x3
4
1. Mechanik
ohne ein neues Symbol einzuf¨ uhren. Wir werden dieser Konvention folgen, wobei wir mit Nachdruck darauf hinweisen, daß der basisunabh¨angige physikalische Vektor x in (1.1) und der basisabh¨angige Tripel x in (1.2) zwei verschiedene mathematische Objekte sind. Aus dem jeweiligen Sinnzusammenhang sollte immer klar sein, ob es sich bei x um einen physikalischen Vektor oder um seine Projektion auf ein bestimmtes Koordinatensystem handelt. Zeitliche Ableitung von Vektoren. Ein weiterer wichtiger Punkt in diesem Zusammenhang sind zeitliche Ableitungen eines Vektors x. Wir werden f¨ ur sie, wie allgemein u ¨blich, ein oder mehrere Punkte u ¨ber x schreiben, ¨ f¨ also x˙ f¨ ur die erste Ableitung, x ur die zweite usw. Beobachtet man die zeitliche Ver¨ anderung von x von einem zeitabh¨angigen Koordinatensystem K : {e1 , e2 , e3 } bzw. K : {e1 , e2 , e3 } aus, dessen Basisvektoren sich im Laufe der Zeit ¨ andern, dann ist man in der Regel nicht an der totalen zeitlichen Ableitung (e˙ i xi + ei x˙ i ) = (e˙ i xi + ei x˙ i ) x˙ = i
i
interessiert, sondern lediglich an der zeitlichen Ver¨anderung, wie sie von K bzw. K aus gesehen wird. Um dies deutlich zu machen, werden in solchen F¨allen die Symbole D und D anstelle des Punktes verwendet, die folgende Bedeutung haben: Dx = ei x˙ i . (1.3) ei x˙ i , D x = i
i
Rotierende Koordinatensysteme. Betrachtet man zwei Koordinatensysteme K : {e1 , e2 , e3 } und K : {e1 , e2 , e3 } mit demselben Koordinatenursprung, die relativ zueinander rotieren (bzw. deren Basen relativ zueinander ¨ rotieren), dann wird der Ubergang von K zu K durch eine eigentliche orthogonale Rotationsmatrix R vermittelt, f¨ ur die gilt: T ei = ej Rji , Rij = ei ej (1.4) ej Rji , ei = j
j
und RRT = RT R = 1 , det R = 1 .
(1.5)
Mit diesen Beziehungen lassen sich die Koordinaten xi eines Vektors x bez¨ uglich K in folgender Weise aus den Koordinaten xi von x in K berechnen: x= ei xi = ej Rji xi = ej xj =⇒ xj = Rji xi . i
i,j
j
i
Die letzte Beziehung schreibt man oft auch in der Matrixnotation x = Rx ,
1.1 Newtonsche Mechanik
5
wobei auch hier zu ber¨ ucksichtigen ist, daß diese Gleichung zwischen den basisabh¨angigen Koordinatentripeln in K und K und nicht zwischen zwei verschiedenen physikalischen Vektoren vermittelt. 1.1.2 Newtonsche Axiome Nach diesen einleitenden Bemerkungen wenden wir uns nun dem eigentlichen Aufbau der Newtonschen Mechanik zu. Bevor wir die Newtonschen Axiome vorstellen, erweist es sich als notwendig, drei mechanische Grundgr¨ oßen zu definieren sowie die Begriffe Impuls und Inertialsystem einzuf¨ uhren. Definition: Mechanische Grundgr¨ oßen im SI- (oder MKS-)System Alle mechanischen Gr¨ oßen lassen sich aus den folgenden drei Grundgr¨ oßen ableiten: • L¨ ange mit der Einheit Meter: m. • Zeit mit der Einheit Sekunde: s. • Masse mit der Einheit Kilogramm: kg. Wir arbeiten in dem f¨ ur die Ingenieurswissenschaften laut Gesetz u ¨ber Einheiten im Meßwesen vorgeschriebenen SI-System (Syst`eme International d’Unit´es). Der mechanische Zustand eines Systems ist in der Newtonschen Formulierung der Mechanik durch die Angabe aller Teilchenpositionen und -geschwindigkeiten zu einem bestimmten Zeitpunkt eindeutig bestimmt, d.h. diese Gr¨ oßen erlauben die eindeutige Vorhersage der zuk¨ unftigen Bewegung des Systems aus den Newtonschen Bewegungsgleichungen. Die Bewegungsgleichungen ergeben sich aus den Newtonschen Axiomen, welche die Bewegung von Massenpunkten mit Hilfe des Impulses beschreiben: Definition: Impuls p Der Impuls eines Massenpunktes ist das Produkt aus seiner tr¨ agen Masse und seinem momentanen Geschwindigkeitsvektor: ˙ p(t) = m(t)x(t) . ˙ Somit hat p stets die Richtung von x. Die Bewegung eines Massenpunktes heißt geradlinig gleichf¨ ormig, falls sein Geschwindigkeitsvektor konstant ist. Wie bereits erw¨ ahnt wurde, wird die Bewegung von Teilchen innerhalb von Bezugssystemen bzw. relativ zu Bezugssystemen beschrieben. Es stellt sich heraus, daß die Bewegungsgleichungen in verschiedenen Bezugssystemen
6
1. Mechanik
i.a. verschiedene Formen haben. Die Mechanik der Massenpunkte in der Newtonschen Mechanik bezieht sich grunds¨atzlich auf Inertialsysteme. Dies sind eben jene Bezugssysteme, in denen die Newtonschen Bewegungsgleichungen ihre einfache definierte Form haben. Definition: Inertialsysteme Ein Bezugssystem, bez¨ uglich dessen • der Raum homogen und isotrop und • die Zeit homogen ist, heißt Inertialsystem. Homogenit¨ at und Isotropie des Raumes besagen, daß kein Punkt und keine Richtung im Raum ausgezeichnet sind. Homogenit¨at der Zeit bedeutet, daß kein Zeitpunkt ausgezeichnet ist. Hieraus folgt, daß Bezugssysteme, • die relativ zu einem Inertialsystem verschoben sind oder • die sich relativ zu einem Inertialsystem mit konstanter Geschwindigkeit, also geradlinig gleichf¨ormig bewegen oder • die relativ zu einem Inertialsystem gedreht sind oder • deren Zeitursprung relativ zu dem eines Inertialsystems verschoben ist, ebenfalls Inertialsysteme sind. Obige Definition f¨ uhrt also nicht zu einem speziellen Inertialsystem, sondern zu einer ganzen Klasse von Inertialsystemen, die alle u ¨ber die genannten vier Punkte in Beziehung stehen. Diese Punkte konstituieren die Gruppe der Galilei-Transformationen. Wir werden auf sie im n¨ achsten Unterabschnitt genauer eingehen und sie insbesondere mit dem fundamentalen Prinzip der Galilei-Invarianz in Verbindung bringen. Wir sind nun in der Lage, die vier von Isaac Newton postulierten Grunds¨ atze zu pr¨ asentieren, auf denen die gesamte Newtonsche Mechanik basiert: Satz 1.1: Newtonsche Axiome Tr¨ agheitssatz (Lex prima) In einem Inertialsystem ist der Impuls eines freien Massenpunktes, d.h. eines Massenpunktes, auf den keine Kraft wirkt, erhalten (Impulserhaltungssatz): F = 0 ⇐⇒ p(t) = const . Bewegungsgleichung und Definition der Kraft (Lex secunda) ¨ In einem Inertialsystem wird die Anderung des Impulses eines Massenpunktes durch eine Kraft F hervorgerufen, so daß gilt:
1.1 Newtonsche Mechanik
F =
dp . dt
7
(1.6)
Wechselwirkungsgesetz (Lex tertia) F¨ ur die Kr¨ afte F ij und F ji , die zwei Massenpunkte i und j aufeinander aus¨ uben, gilt F ij = −F ji . Somit sind die Kr¨ afte dem Betrage nach gleich und einander entgegengerichtet (Actio = Reactio). Superpositionsprinzip (Lex quarta) Kr¨afte addieren sich vektoriell: F = Fi . i
Diese vier Axiome implizieren, daß • in allen Inertialsystemen eine absolute Zeit existiert und • die Masse eines abgeschlossenen Systems zeitlich erhalten bleibt. Vorausgreifend sei hier erw¨ ahnt, daß beide Punkte im Rahmen der speziellen Relativit¨ atstheorie (Abschn. 1.6) fallengelassen werden. Zur Lex prima. Das erste Newtonsche Axiom, offensichtlich ein Spezialfall des zweiten, beinhaltet die M¨ oglichkeit der Konstruktion eines Inertialsystems. Man nehme dazu die Bahnen dreier kr¨ aftefreier Massenpunkte, die sich vom Ursprung aus wie ein kartesisches Koordinatensystem wegbewegen. Die Zeit l¨aßt sich dann festlegen, indem man fordert, daß ein kr¨ aftefreier Massenpunkt, der sich in dem so definierten Koordinatensystem geradlinig gleichf¨ ormig bewegt, in gleichen Zeiten gleiche Strecken zur¨ ucklegt. Zur Lex secunda. Das zweite Newtonsche Axiom definiert zum einen die Kraft und besitzt andererseits auch Gesetzescharakter. Ist die Kraft bekannt, dann stellt (1.6) die dynamische Bewegungsgleichung dar. F¨ ur den Spezialfall einer zeitlich konstanten Masse ergibt sich aus ihr die bekannte Gleichung d d p = m x˙ = m¨ x , m = const . (1.7) dt dt Bei den meisten, in der Praxis vorkommenden physikalischen Problemen ist die Kraft lediglich eine Funktion des Teilchenortes, der Teilchengeschwindig˙ t). keit sowie der Zeit: F = F (x, x, Das Grundproblem der Mechanik besteht in der Bestimmung der Teilchenbahn x(t) bei gegebener Kraft. Dies geschieht im Newtonschen Formalismus durch das L¨ osen der drei (i.a. nichtlinearen) gekoppelten gew¨ ohnlichen Differentialgleichungen 2. Ordnung (1.7). Aus der Tatsache, daß das Grundgesetz der Newtonschen Mechanik von 2. Ordnung in der Zeit ist, folgt, daß F =
8
1. Mechanik
zur eindeutigen Bestimmung der Teilchenbahn genau zwei Anfangsbedingungen spezifiziert werden m¨ ussen. Tr¨ age und schwere Masse. Nach dem 2. Newtonschen Gesetz erf¨ahrt ein K¨ orper bei Krafteinwirkung eine Beschleunigung, die proportional zu seiner Masse ist. Neben dieser tr¨ agen Masse gibt es noch eine andere Masse. In Unterabschn. 1.5.3 betrachten wir z.B. die Gravitationskraft F G , die eine schwere Masse m aufgrund der Anwesenheit einer schweren Masse M erf¨ahrt: x F G = −γmM 3 . x Es ist nun ein experimentelles Faktum, daß tr¨age und schwere Masse zueinander proportional sind. Man w¨ahlt deshalb praktischerweise die Maßeinheiten so, daß beide Massen u ¨bereinstimmen.1 Diese Erkenntnis der Proportionalit¨ at von tr¨ ager und schwerer Masse ist der Ausgangspunkt des Einsteinschen ¨ Aquivalenzprinzips und der Allgemeinen Relativit¨atstheorie. Zur Lex tertia. Das dritte Axiom bezieht sich auf physikalische Vorg¨ange, in denen zwei oder mehrere Teilchen miteinander wechselwirken. Ihm ist es zu verdanken, daß ein System aus mehreren Teilchen unter gewissen Umst¨anden als ein einziges Teilchen aufgefaßt werden kann. 1.1.3 Physikalische Folgerungen, Erhaltungss¨ atze Aus den Newtonschen Axiomen folgen unmittelbar einige wichtige Erhaltungss¨ atze, die im folgenden dargestellt werden. Dabei werden wir weitere grundlegende mechanische Gr¨oßen kennenlernen. Definition: Arbeit W , Leistung P und kinetische Energie T • Die Arbeit W , die von einer Kraft F gegen die Tr¨agheit eines Massenpunktes entlang des Weges Γx = {x(t), t ∈ [t1 : t2 ]} verrichtet wird, ist gegeben durch x2 W (x1 , x2 , Γx ) = W (t1 , t2 , Γx ) =
˙ t)dx F (x, x, x1 ,Γx
t2 ˙ t)xdt ˙ , [W ] = Nm . F (x, x,
= t1
• Die Leistung P ist gegeben durch P (t) = 1
Nm dW ˙ t) · x(t) ˙ = F (x, x, , [P ] = = W (Watt) . dt s
Man findet dann f¨ ur die Newtonsche Gravitationskonstante den experimentellen Wert γ = (6.67259 ± 0.00085) · 10−11 m3 kg−1 s−2 .
1.1 Newtonsche Mechanik
9
• Die kinetische Energie T ist definiert als mx˙ 2 (t) m2 p2 (t) = , [T ] = kg 2 = J (Joule) . 2m 2 s Hieraus folgt sofort: Die Arbeit, die von einer Kraft gegen die Tr¨ agheit eines Massenpunktes verrichtet wird, ist gleich der Differenz der kinetischen Energien des Massenpunktes am Ende und Anfang der Bahn: T (t) =
t2 ˙ t)xdt ˙ = F (x, x,
W (t) =
m ˙ 2 )2 − x(t ˙ 1 )2 x(t 2
t1
=
1 2 p (t2 ) − p2 (t1 ) = T2 − T1 . 2m
Konservative Kr¨ afte und Energieerhaltung. Die differentielle Arbeit bei einer Verschiebung eines Massenpunktes um dx lautet ˙ t)dx . dW = F (x, x, Dabei ist zu beachten, daß dW i.a. kein totales Differential darstellt, d.h. es gilt i.a. dW = 0 . Kr¨ afte, die nicht explizit von der Zeit und der Geschwindigkeit abh¨ angen und f¨ ur die F (x)dx ein totales Differential ist, bilden die wichtige Klasse der konservativen Kr¨ afte. Satz 1.2: Konservative Kr¨ afte Die folgenden Aussagen sind ¨ aquivalent: • F (x) ist eine konservative Kraft. • F (x) ist wirbelfrei: ∇ × F = 0. • F (x) ist als Gradient eines skalaren Feldes, dem Potential V (x), darstellbar, und es gilt x F (x) = −∇V (x) =⇒ V (x) = −
dxF (x) .
x0
Dabei ist das Potential nur bis auf eine Konstante bestimmt, die wir so w¨ ahlen k¨ onnen, daß der Ausdruck f¨ ur das Potential besonders einfach wird.
10
1. Mechanik
• Die Arbeit ist unabh¨angig vom Weg; sie h¨angt nur vom Anfangs- und Endpunkt der Kurve ab: t2 W (x1 , x2 , Γx ) = W (x1 , x2 ) = −
˙ ∇V (x)xdt t1
= − [V (x2 ) − V (x1 )] . • Die differentielle Arbeit dW = F (x)dx ist ein totales Differential. Aus diesem Satz und der Definition der kinetischen Energie erhalten wir sofort den wichtigen Satz 1.3: Erhaltung der Energie in konservativen Systemen Bei der Bewegung eines Massenpunktes in einem konservativen Kraftfeld bleibt die Gesamtenergie E erhalten: E = T + V = const . Ist die Energie in einem konservativen System zu irgend einem Zeitpunkt bekannt, dann k¨onnen wir dies als eine der erforderlichen Anfangswertbedingungen benutzen. Eindimensionale Bewegung, konservative Kr¨ afte. Die eindimensionale Bewegung in einem konservativen Kraftfeld kann grunds¨atzlich auf ein Integral zur¨ uckgef¨ uhrt werden. Aus
1 2 2 [E − V (x)] E = mx˙ + V (x) =⇒ x˙ = ± 2 m erhalten wir2 x t − t0 = ±
dx
− 12 2 [E − V (x )] , m
(1.8)
x0
wobei das Vorzeichen durch die Anfangsbedingung x(t ˙ 0) > < 0 determiniert ist. Der lineare harmonische Oszillator ist ein Beispiel f¨ ur diesen Fall. Mit V (x) = kx2 /2 folgt
1 m k 2 t − t0 = ± arcsin x k 2E und mit x0 = x(t0 ) = 0, x(t ˙ 0) > 0 2
Man beachte, daß sich das Teilchen nur in den Bereichen aufhalten kann, f¨ ur die gilt: E ≥ V (x). Wir werden diese Gleichungen im Rahmen von Zentralkraftproblemen in Unterabschn. 1.5.2 genauer diskutieren.
1.1 Newtonsche Mechanik
11
2E k sin [ω(t − t0 )] , ω = . m k Drehimpuls und Drehmoment. Neben der Kraft F und dem Impuls p sind zwei weitere grundlegende Gr¨ oßen gegeben durch: x=
Definition: Drehimpuls l und Drehmoment N Der Drehimpuls ist definiert als der axiale Vektor l(t) = x(t) × p(t) , [l] = kg
m2 . s
¨ Seine zeitliche Anderung definiert das Drehmoment 2
m ˙ = x(t) × p(t) ˙ N (t) = l(t) , [N ] = kg 2 . s Der Drehimpuls ist erhalten, falls das Drehmoment verschwindet. Wir sehen, daß zur Erhaltung des Drehimpulses entweder F = 0 oder F ||x erf¨ ullt sein muß. Im ersten Fall kann man durch eine Verschiebung des Bezugssystems um einen konstanten Vektor stets erreichen, daß gilt: l = 0. Der zweite Fall f¨ uhrt auf die Klasse der Zentralkr¨ afte: Satz 1.4: Zentralkr¨ afte und Drehimpulserhaltung Eine Zentralkraft h¨ angt nur vom Ortsvektor x ab und wirkt in seine Richtung: F = F (x) = xf (x) , f beliebiges Skalarfeld . Der Drehimpuls einer Zentralkraft ist erhalten. Konservative Zentralkr¨ afte. Zentralkr¨ afte sind nicht notwendigerweise konservativ. Jedoch sind es praktisch ausschließlich konservative Zentralkr¨afte, die in physikalischen Fragestellungen auftreten. F¨ ur sie gilt x × F = −x × ∇V (x) = 0 . In Polarkoordinaten ausgedr¨ uckt liefert diese Gleichung ∂V ∂V =0, =0. ∂ϕ ∂θ Hieraus folgt V (x) = V (|x|). Satz 1.5: Rotationssymmetrisches Potential F¨ ur konservative Zentralkr¨ afte ist das Potential V rotationssymmetrisch (zentralsymmetrisch): V (x) = V (|x|) .
12
1. Mechanik
Ist umgekehrt V = V (|x|), dann sehen wir aus F = −∇V = −
dV x , d|x| |x|
daß F eine konservative Zentralkraft ist. Beispiele sind die Gravitationskraft und die Coulomb-Wechselwirkung. Wir betrachten die Bewegungsgleichungen dieser Art Kr¨afte im Detail in Abschnitt 1.5. Homogene Potentiale. Eine weitere wichtige Klasse von Potentialen ist wie folgt definiert: Definition: Homogenes Potential Ein homogenes Potential ist ein rotationssymmetrisches Potential der Form V (x) = V (|x|) = α|x|d , d ∈ R . F¨ ur ein einzelnes Teilchen gilt d ˙ = m(x˙ 2 + x¨ (mxx) x) = 2T + xF . dt Mittelt man diese Gleichung u ¨ber ein Zeitintervall τ , dann folgt τ 1 m ˙ ) − x(0)x(0)] ˙ [x(τ )x(τ = 2 T + xF , T = dtT . τ τ
(1.9)
0
Ist die Teilchenbewegung im Intervall [0 : τ ] periodisch, d.h. x(τ ) = x(0), ˙ ) = x(0), ˙ x(τ dann verschwindet die linke Seite von (1.9), und man erh¨alt 1 T = − xF (Virialsatz) . 2 Speziell f¨ ur homogene Potentiale finden wir daher Satz 1.6: Virialtheorem f¨ ur homogene Potentiale F¨ ur homogene Potentiale, V (x) = α|x|d , F = −∇V (x), gilt α xF = − τ
τ 0
und es folgt T =
α dtx∇|x| = − τ
τ dtd|x|d = −d V ,
d
d V . 2
0
(1.10)
1.1 Newtonsche Mechanik
13
Selbst wenn die Bewegung des Teilchens nicht periodisch ist, gelangt man zu (1.10), vorausgesetzt die Orts- und Geschwindigkeitskoordinaten besitzen eine obere Grenze, so daß f¨ ur hinreichend große τ die linke Seite von (1.9) ebenfalls verschwindet. Satz 1.7: Skalentransformation bei homogenen Potentialen Sei V (x) = α|x|d . Dann ist d2 x = −∇V (x) = −αd|x|d−2 x . dt2 F¨ uhrt man nun eine Skalentransformation der Art m
x = λx , t = λ(2−d)/2 t durch, so folgt 2 d2 x d−1 d x = λ , ∇V (x) = λd−1 ∇ V (x ) dt2 dt2
=⇒ m
d2 x = −∇ V (x ) . dt2
Das heißt unter obiger Skalierung ist die Newtonsche Bewegungsgleichung forminvariant. Seien nun T, T spezifische Zeiten (z.B. Umlaufzeit) und R, R spezifische L¨ angen (z.B. Amplitude) zweier Bewegungsabl¨ aufe, die durch obige Skalentransformation ineinander u uhrt werden, dann gilt ¨berf¨ 2 2−d T R d V (x) = α|x| =⇒ = . T R Insbesondere ergibt sich hieraus f¨ ur die Gravitations- und Coulomb-Wechselwirkung mit d = −1 2 3 T R = , T R d.h. die Quadrate der Umlaufzeiten zweier Teilchen um ein Zentrum verhalten sich wie die Kuben ihrer Abst¨ ande zum Zentrum. Dies ist das dritte Keplersche Gesetz (siehe Unterabschn. 1.5.3). 1.1.4 Beschleunigte Koordinatensysteme und Inertialsysteme, Galilei-Invarianz Die Newtonschen Bewegungsgleichungen beziehen sich auf mechanische Vorg¨ange in Inertialsystemen, die sich relativ zueinander geradlinig gleichf¨ ormig bewegen. Die Frage, der wir uns in diesem Unterabschnitt widmen wollen, lautet: Wie sieht die Bewegungsgleichung einer Teilchenbewegung in einem
14
1. Mechanik
x(t)
z(t)
ω(t)
x0 (t)
raumfestes System K
k¨ orperfestes System K
Abb. 1.1. Zur Definition von raum- und k¨ orperfestem System
nichtinertialen System K aus, welches sich relativ zum Inertialsystem K beschleunigt bewegt (siehe Abb. 1.1)? Im Hinblick auf die Diskussion von starren K¨orpern in Abschn. 1.4 f¨ uhren wir bereits hier f¨ ur das Inertialsystem K die Bezeichnung raumfestes System ein. Das beschleunigte System K nennen wir k¨ orperfestes System. Die beschleunigte Bewegung von K relativ zu K umfaßt im allgemeinsten Fall eine Rotationsbewegung um den Ursprung von K und eine translatorische Bewegung, die durch den Vektor x0 (t) beschrieben wird. Wir behandeln zun¨achst den Fall einer reinen Rotationsbewegung und beziehen im Anschluß Translationsbewegungen mit ein. Rotierende Koordinatensysteme. Wie bereits in Unterabschn. 1.1.1 erw¨ ahnt wurde, sind zwei Bezugssysteme K : {e1 , e2 , e3 } und K : {e1 , e2 , e3 }, die relativ zueinander eine reine Drehbewegung ausf¨ uhren, durch eine zeitabh¨ angige 3×3-Matrix R miteinander verbunden, die den Relationen (1.4) und (1.5) gen¨ ugt. Differenziert man die Orthogonalit¨atsrelation in (1.5) nach der Zeit, so ergibt sich R˙ T R + RT R˙ = 0 . Daraus ist zu erkennen, daß die Matrix Ω = RT R˙ schiefsymmetrisch sein muß: ⎞ ⎛ 0 ω3 −ω2 Ω = RT R˙ = ⎝ −ω3 0 ω1 ⎠ , Ωjk = ijk ωi , ωi ∈ R . (1.11) i ω2 −ω1 0 Diese Relation l¨aßt sich invertieren, und man erh¨alt 1 ijk Ωjk . ωi = 2
(1.12)
j,k
Wie wir gleich sehen werden, sind dies die raumfesten Komponenten eines zeitabh¨ angigen Vektors ω = ei ωi , der die Drehachse von K relativ zu i
1.1 Newtonsche Mechanik
15
K beschreibt. Man nennt deshalb ω die momentane Drehachse oder auch momentane Winkelgeschwindigkeit. Da die Basen von K und K relativ zum jeweils anderen System zeitabh¨ angig sind, verwenden wir zur Vermeidung von Mißverst¨ andnissen die in Unterabschn. 1.1.1 eingef¨ uhrte Schreibweise f¨ ur die zeitliche Ableitung eines Vektors x bez¨ uglich K und K (siehe (1.3)). Damit berechnen wir f¨ ur einen beliebigen Vektor x ei x˙ i = ei Rij x˙ j + R˙ ij xj D x = i
=
i,j
ej x˙ j +
j
= Dx −
T ˙ ek Rki Rij xj = Dx +
k,i,j
ek Ωkj xj
k,j
ek kij ωi xj = Dx − ω × x ,
k,i,j
und es folgt der Satz 1.8: Satz von Coriolis Sei ω die momentane Winkelgeschwindigkeit eines relativ zum System K rotierenden Systems K und Dx, D x die zeitlichen Ableitungen eines Vektors x bez¨ uglich K bzw. K . Dann gilt D x = Dx − ω × x . Hieraus folgt, daß die Zeitableitung der Winkelgeschwindigkeit unabh¨ angig vom Bezugssystem ist: D ω = Dω . Betrachten wir zum besseren Verst¨ andnis dieses Satzes den einfachen Fall, daß gilt: D x = 0 =⇒ Dx = ω × x. Vom Referenzsystem K aus gesehen a¨ndert sich der Vektor x in der Zeit δt um δx = ω × xδt. Dieser Vektor ist zu ω und x orthogonal. In K wird die Ver¨ anderung von x also durch eine (rechtsh¨ andige) Rotation von x um den Betrag |ω|δt um eine Achse parallel zu ω erreicht. Dies rechtfertigt f¨ ur ω den Namen momentane Winkelge” schwindigkeit“. Bewegungsgleichung in beschleunigten Systemen. Wir kommen nun zur allgemeinen Relativbewegung zweier Referenzsysteme K und K (siehe Abb. 1.1), wobei wir f¨ ur K ein Inertialsystem voraussetzen. x(t) und z(t) beschreiben die Ortsbahn eines Teilchens, wie sie von K bzw. K aus gesehen wird. Ferner sei x0 der Ursprung von K relativ zu K, so daß gilt: z(t) = x(t) − x0 (t) . Nun gilt im Inertialsystem K die Newtonsche Gleichung mD2 x = F .
(1.13)
16
1. Mechanik
Um den entsprechenden Zusammenhang im Nicht-Inertialsystem K zu bestimmen, ziehen wir den Satz von Coriolis heran und rechnen wie folgt: F = D 2 x = D 2 z + D 2 x0 m = D (D z + ω × z) + D2 x0 = D2 z + (D ω) × z + 2ω × D z + ω × (ω × z) + D2 x0 . Hieraus l¨ aßt sich sofort die Bewegungsgleichung ablesen, die wir im beschleunigten System K anstelle der einfachen Newtonschen Gleichung (1.13) anzusetzen haben: Satz 1.9: Newtonsche Bewegungsgleichung in beschleunigten Systemen Beschreiben x und z die Teilchenbewegung im Inertialsystem K bzw. im relativ zu K beschleunigten System K , dann lauten die Bewegungsgleichungen in beiden Bezugssystemen mD2 x = F mD2 z = F + F T + F z + F L + F C , mit F T = −mD2 x0
(Translationskraft)
F Z = −mω × (ω × z)
(Zentrifugalkraft)
F L = −m(D ω) × z
(Linearkraft)
F C = −2mω × D z
(Coriolis-Kraft) .
Neben der urspr¨ unglichen Kraft F treten in beschleunigten Systemen also vier zus¨ atzliche Scheinkr¨ afte auf, von denen F T von der translatorischen Bewegung des Koordinatenursprungs x0 und die anderen drei von der Rotationsbewegung herr¨ uhren. Galilei-Invarianz der Bewegungsgleichung. Mit Hilfe dieses Satzes k¨onnen wir nun den in Unterabschn. 1.1.2 qualitativ diskutierten Begriff des Inertialsystems mathematisch genauer fassen. Nach dem zweiten Newtonschen Axiom ist die Newtonsche Bewegungsgleichung in allen Inertialsystemen forminvariant. Dies ist offensichtlich gleichbedeutend mit der Forderung D 2 x0 = 0 , ω = 0 , weil dann alle Scheinkr¨afte verschwinden. Wir k¨onnen diese Bedingung im allgemeinsten Fall erf¨ ullen, indem wir setzen: x0 (t) = vt + q , R(t) = R , v, q, R = const . Das heißt relativ zu K darf das System K konstant gedreht und verschoben sein und sich mit konstanter Geschwindigkeit bewegen. Ist u ¨berdies die
1.1 Newtonsche Mechanik
17
Kraft F nicht explizit zeitabh¨ angig, dann darf zus¨ atzlich der Zeitursprung uhrt die Forderung nach von K relativ zu K verschoben sein. Wie man sieht, f¨ (bzw. die axiomatische Voraussetzung von) Forminvarianz der Newtonschen Bewegungsgleichung wieder genau auf die in Unterabschn. 1.1.2 genannten vier Punkte, durch die Inertialsysteme ausgezeichnet sind. Wir erhalten somit den fundamentalen Satz 1.10: Inertialsysteme und Galilei-Invarianz ¨ Der Ubergang von einem Inertialsystem zu einem anderen wird durch die Koordinatentransformationen xi −→ xi = Rij xj + vi t + qi , t −→ t = t + t0 , mit R, v, q, t0 = const , RRT = 1 , det R = 1 vermittelt. Diese Transformationen bilden eine eigentliche orthochrone 10-parametrige Lie-Gruppe, welche man die Gruppe der GalileiTransformationen nennt. Die Newtonschen Bewegungsgleichungen sind in allen Inertialsystemen forminvariant. Man sagt auch: Die Newtonsche Mechanik ist galileiinvariant. In Inertialsystemen bewegen sich kr¨ aftefreie K¨ orper geradlinig gleichf¨ormig. Die Mechanik ist demnach nicht in der Lage, den Zustand der Ruhe von dem der gleichf¨ormigen Bewegung zu unterscheiden. Es ist ein generelles Prinzip der Physik, nicht nur der klassischen Mechanik, daß eine Symmetrie mit einer Erhaltungsgr¨ oße zusammenh¨ angt. Da die Galilei-Gruppe durch 10 Parameter beschrieben wird, folgern wir, daß die Bewegung eines Systems von Teilchen bei Abwesenheit ¨ außerer Kr¨ afte durch 10 entsprechende Erhaltungsgr¨ oßen gekennzeichnet ist. Wie wir im n¨ achsten Unterabschnitt und in Unterabschn. 1.2.2 sehen werden, sind dies der Impuls, der Drehimpuls, die Energie und die Schwerpunktsbewegung. Absolute Zeit. Die Form der Galilei-Gruppe zeigt, daß der Zeit in der nichtrelativistischen Mechanik eine besondere Bedeutung zukommt. Unter GalileiTransformationen bleiben Zeitabst¨ ande invariant; in diesem Sinne hat Zeit einen absoluten Charakter. Dagegen ist der Abstand zweier Punkte, in denen sich ein Teilchen aufgrund seiner Bewegung zu zwei verschiedenen Zeiten aufh¨ alt, in zwei unterschiedlichen Inertialsystemen nicht identisch, denn die Geschwindigkeiten des Teilchens sind in beiden Systemen verschieden. Der Ortsraum ist also in diesem Sinne nicht absolut. Foucaultsches Pendel. Als Beispiel f¨ ur den Umgang mit der Newtonschen Bewegungsgleichung in beschleunigten Koordinatensystemen diskutieren wir die von der Erdrotation hervorgerufene Drehung der Schwingungsebene ei-
18
1. Mechanik y ω
z3
z2
L
k¨ orperfestes System K
z3 q
z1
ω x
λ
FP
raumfestes System K
z2
m z
FG z1
Abb. 1.2. Zur Festlegung des raum- und k¨ orperfesten Systems auf der Erdoberfl¨ ache
nes Pendels. Abbildung 1.2 legt die Achsen des Inertialsystems3 K und des relativ zu K beschleunigten (erdfesten) Systems K fest. Wir betrachten ein mathematisches Pendel, das aus einem masselosen Seil der L¨ange L besteht, dessen oberes Ende frei drehbar aufgeh¨angt ist und an dessen unterem Ende eine Punktmasse m befestigt ist. Der Koordinatentripel der Winkelgeschwindigkeit ω in K lautet ⎛ ⎞ 0 2π ω = ω ⎝ cos λ ⎠ , ω ≈ . 24 h sin λ Nach Satz 1.9 gilt m¨ z = F G (z) + F P (z) +F T (q) + F Z (ω, z) + F L (ω, z) + F C (ω, z) , wobei die Koordinatentripel der Gravitationskraft F G und Zentripetalkraft F P des Pendels in K gegeben sind durch ⎛ ⎞ ⎛ z1 ⎞ 0 −LS F G = −mg ⎝ 0 ⎠ , F P = ⎝ − zL2 S ⎠ , S3 1 mit den zun¨ achst unbekannten Seilspannungen S und S3 . Wegen ω 2 1 und ω˙ ≈ 0 k¨ onnen Zentrifugal- und Linearkraft, F Z , F L , vernachl¨assigt werden. Die Translationskraft F T wirkt in Richtung der z3 -Achse und sorgt f¨ ur eine Abschw¨ achung der Gravitationskraft auf der Erdoberfl¨ache in Abh¨angigkeit 3
Streng genommen ist dieses System nat¨ urlich schon allein aufgrund seiner beschleunigten Bewegung um die Sonne kein Inertialsystem. Dies k¨ onnen wir jedoch f¨ ur unsere Zwecke vernachl¨ assigen.
1.1 Newtonsche Mechanik
19
von der geographischen Breite; sie kann deshalb in der Konstanten g absorbiert werden. Es verbleibt die zu l¨ osende Gleichung m¨ z = F G + F P (z) − 2mω × z˙ bzw. z1 S − 2mω(z˙3 cos λ − z˙2 sin λ) L z2 m¨ z2 = − S − 2mω z˙1 sin λ L m¨ z3 = −mg + S3 + 2mω z˙1 cos λ . m¨ z1 = −
Interessiert man sich nur f¨ ur kleine Auslenkungen aus der vertikalen z3 Richtung, dann gilt S ≈ mg , z˙3 z˙2 , und es folgt f¨ ur die z1 z2 -Bewegung des Pendels g z¨1 = − z1 + 2ω z˙2 , ω = ω sin λ L g z¨2 = − z2 − 2ω z˙1 . L Die Parametrisierung z1 (t) = u1 (t) cos ω t + u2 (t) sin ω t z2 (t) = u2 (t) cos ω t − u1 (t) sin ω t f¨ uhrt auf
g g cos ω t u ¨1 + u1 + sin ω t u ¨ 2 + u2 = 0 L L g =⇒ u ¨i + ui = 0 , i = 1, 2 . L
Dies sind die Bewegungsgleichungen eines einfachen Pendels mit den L¨ osungen
g , i = 1, 2 , ui (t) = ai cos Ωt + bi sin Ωt , Ω = L wobei die vier Integrationskonstanten a1 , b1 , a2 , b2 u ¨ber gewisse Anfangsbedingungen festgelegt werden. Das Pendel schwingt also mit der Frequenz Ω = g/L um seine Ruhelage, w¨ ahrend seine Schwingungsebene mit der Frequenz ω = 2π/24 h · sin λ rotiert. Dies f¨ uhrt zu sog. Rosettenbahnen, deren Form wesentlich von den Anfangsbedingungen abh¨ angt. Die linke Figur von Abb. 1.3 zeigt die Bahn f¨ ur ein Pendel, das bei Maximalausschlag losgelassen wurde. Bei der rechten Figur wurde das Pendel aus seiner Ru¨ helage herausgestoßen. Offensichtlich ist am Aquator (λ = 0) die Rotation der Erde mit Hilfe des Foucaultschen Pendels nicht nachweisbar. Dort beschreibt das Pendel unter obigen N¨ aherungen die gleiche Bahnkurve wie in einem Inertialsystem, n¨ amlich eine Ellipse, gegeben durch die Parametrisierung zi (t) = ui (t) , i = 1, 2.
20
1. Mechanik z2
z2
z1
z1
Abb. 1.3. Verschiedene Rosettenbahnen des Foucaultschen Pendels
1.1.5 N -Teilchensysteme Wir erweitern nun unsere Betrachtungen auf Systeme, die aus vielen Massenpunkten bestehen, und diskutieren insbesondere ihre kinematischen Eigenschaften. Man unterscheidet die auf ein solches System wirkenden Kr¨ afte wie folgt: • Innere Kr¨ afte: Diese wirken nur zwischen den einzelnen Teilchen. Um die nachfolgende Diskussion zu vereinfachen, nehmen wir an, daß die inneren Kr¨ afte konservative und zentrale Zwei-Teilchenkr¨ afte sind, die sich in der Weise F ij = F ij (xi − xj ) = −∇i Vij (|xi − xj |) aus Potentialen herleiten lassen. ¨ • Außere Kr¨ afte: Hiermit sind alle u afte gemeint, die von außen auf ¨brigen Kr¨ das System wirken. Sind keine ¨ außeren Kr¨ afte vorhanden, dann nennen wir das System abgeschlossen. Unter diesen Voraussetzungen lauten die Newtonschen Bewegungsgleichungen f¨ ur ein N -Teilchensystem ¨i = mi x F ij + F i , i = 1, . . . , N . (1.14) j=i
Bevor wir die zugeh¨ origen kinematischen Gr¨ oßen Impuls, Drehimpuls und Energie untersuchen, bietet es sich an, den Begriff des Schwerpunktes einzuf¨ uhren. Er ist wie folgt definiert: Definition: Schwerpunkt xS eines N -Teilchensystems xS (t) =
N N 1 mi xi (t) , M = mi . M i=1 i=1
1.1 Newtonsche Mechanik
21
Im Falle einer kontinuierlichen Massendichte ρ(x, t) gehen diese Gleichungen u ¨ber in 1 3 xρ(x, t)d x , M = ρ(x, t)d3 x = const . xS (t) = M Gesamtimpuls p und Schwerpunkt xS . Addieren wir die einzelnen Gleichungen in (1.14), dann heben sich die Beitr¨ age der inneren Kr¨ afte aufgrund des Prinzips Actio=Reactio“ auf, und wir erhalten ” 1 ¨i = mi x (F ij + F ji ) + Fi = Fi . p˙ = p˙ i = 2 i,j i i i i Das heißt der Gesamtimpuls p ergibt sich allein aus den ¨ außeren Kr¨ aften. Falls alle ¨ außeren Kr¨ afte verschwinden, ist der Gesamtimpuls eine erhaltene Gr¨ oße. Desweiteren gilt M x˙ S = p , d.h. der Schwerpunkt bewegt sich so, als sei die gesamte Masse in ihm vereinigt und als ob alle ¨ außeren Kr¨ afte auf ihn einwirken. Im Falle abgeschlossener Systeme ergibt sich deshalb eine geradlinig gleichf¨ ormige Bewegung des Schwerpunktes. Gesamtdrehimpuls l und Drehmoment N . F¨ ur den Gesamtdrehimpuls und das Gesamtdrehmoment findet man l = li = mi xi × x˙ i i
N = l˙ =
i
¨i = mi x i × x
i
1 (xi − xj ) × F ij + xi × F i . 2 i,j i = 0 f¨ ur Fij zentral
Demnach ist auch der Gesamtdrehimpuls in einem abgeschlossenen System erhalten. Zerlegen wir den Ortsvektor xi in den Schwerpunktsvektor xS und in einen zum Schwerpunkt bezogenen Vektor xSi , also xi = xS + xSi , dann ur den Drehimpuls schreiben: mi xSi = 0 f¨ k¨onnen wir wegen l =
i
=
i
mi xi × x˙ i =
mi (xS + xSi ) × (x˙ S + x˙ Si )
i
mi (xS × x˙ S ) + (xS × x˙ Si ) + (xSi × x˙ S ) + (xSi × x˙ Si )
i
= lS +
xSi × pSi , lS = xS × pS .
i
Der Drehimpuls setzt sich also zusammen aus dem Drehimpuls des Schwerpunktes, bezogen auf den Koordinatenursprung, plus der Summe der Teilchendrehimpulse, bezogen auf den Schwerpunkt xS .
22
1. Mechanik
Energie. Durch skalare Multiplikation von (1.14) mit x˙ i und anschließender Summation u ¨ber alle i erh¨alt man 1 d 1 mi x˙ 2i = (x˙ i − x˙ j )F ij + x˙ i F i 2 i,j dt 2 i i =⇒ wobei T =
d x˙ i F i , (T + Vinnen ) = dt i 1 1 Vij (|xi − xj |) mi x˙ 2i , Vinnen = 2 i,j 2 i
die gesamte kinetische bzw innere potentielle Energie bedeuten. Demnach ist ¨ die Anderung der gesamten inneren Energie gleich der Leistung der a¨ußeren Kr¨ afte. F¨ ur abgeschlossene Systeme folgt hieraus direkt die Erhaltung der Gesamtenergie. Sind andererseits die a¨ußeren Kr¨afte ebenfalls durch Potentiale darstellbar, dann gilt d dVaußen =⇒ (T + Vinnen + Vaußen ) = 0 , x˙ i F i = − dt dt i d.h. die totale Energie ist auch hier eine Erhaltungsgr¨oße. Machen wir wieder ur die gesamte von der Aufteilung xi = xS + xSi Gebrauch, dann l¨aßt sich f¨ kinetische Energie auch schreiben: 2 1 1 M 2 1 T = mi x˙ 2i = mi (x˙ S + x˙ Si )2 = mi x˙ Si . x˙ S + 2 i 2 i 2 2 i ¨ Ahnlich wie beim Drehimpuls setzt sich diese zusammen aus der kinetischen Energie des Schwerpunktes plus der kinetischen Energie der Bewegung des Systems um den Schwerpunkt. Satz 1.11: Erhaltungsgr¨ oßen im abgeschlossenen N -Teilchensystem Bei einem N -Teilchensystem, auf das keine ¨außeren Kr¨afte wirken, gelten folgende Erhaltungss¨atze: p = const M xS − tp = const l = const E = T + V = const
(Impulssatz) (Schwerpunktsatz) (Drehimpulssatz) (Energiesatz) .
Das System besitzt somit 10 Erhaltungsgr¨oßen, die den 10 Parametern der Galilei-Gruppe entsprechen.
Anwendungen
23
Zusammenfassung • Alle dynamischen Variablen eines Teilchens sind Funktionen seines Orts- und Impulsvektors x, p. • Die zeitliche Entwicklung eines Teilchens in Inertialsystemen ist durch die Newtonsche Gleichung F = dp/dt determiniert, wobei F der auf das Teilchen einwirkende Kraftvektor ist. atze f¨ ur • Je nach Form der einwirkenden Kraft ergeben sich Erhaltungss¨ gewisse dynamische Gr¨ oßen. • Die Newtonschen Bewegungsgleichungen sind galilei-invariant, d.h. sie beziehen sich auf Inertialsysteme, die u ¨ber Galilei-Transformationen miteinander verbunden sind. In beschleunigten (nichtinertialen) Bezugssystemen treten in den Bewegungsgleichungen zus¨ atzliche Scheinkr¨ afte auf, die aus der translatorischen und rotierenden Bewegung des Koordinatensystems resultieren. • In abgeschlossenen Systemen sind der Gesamtimpuls, -drehimpuls und die Gesamtenergie erhalten.
Anwendungen 1. Raketenproblem. Man betrachte eine Rakete, die in Abwesenheit ¨ außerer Kraftfelder geradlinig gleichf¨ ormig mit der Geschwindigkeit v relativ zu einem Inertialsystem K fliegt. Ihre Gesamtmasse setze sich zusammen aus der Leermasse M0 der Rakete und der Treibstoffmasse m0 . Zum Zeitpunkt t = 0 beginne die Rakete, Gas in Flugrichtung mit der Austrittsrate α = dm/dt = const und der konstanten Geschwindigkeit ω relativ zur Rakete auszustoßen. Wann kommt die Rakete in K zum Stillstand? L¨ osung. Die Masse der Rakete zur Zeit t ist M (t) = M0 + m0 − αt . Damit ergibt sich f¨ ur ihren Impuls P : P (t) = M (t)x(t) ˙ =⇒ P˙ = M˙ x˙ + M x ¨ = (M0 + m0 − αt)¨ x − αx˙ . F¨ ur den Treibstoffimpuls p gilt dp(t) = dm(t)[ω + x(t)] ˙ =⇒ p˙ = α(ω + x) ˙ . Da keine a afte wirksam sind, gilt ¨ußeren Kr¨ F = P˙ + p˙ = 0
24
1. Mechanik
⇐⇒ (M0 + m0 − αt)¨ x = −αω x(t) ˙ t ⇐⇒ dx˙ = −αω
dt M0 + m0 − αt v 0 αt . ⇐⇒ x(t) ˙ − v = ω ln 1 − M 0 + m0 Der Zeitpunkt t1 , an dem die Rakete zum Stillstand kommt, x(t ˙ 1 ) = 0, ergibt sich somit zu M 0 + m0 1 − e−v/ω . t1 = α Da nur eine begrenzte Treibstoffmasse zur Verf¨ ugung steht, muß zus¨atzlich gelten: m0 ≥ αt1 . 2. Ged¨ ampfter harmonischer Oszillator. Man betrachte eine eindimensionale Feder, deren eine Ende fixiert und an deren anderem Ende eine Masse m befestigt ist, welche auf einer Schiene entlanggleitet. Zus¨atzlich wirke auf das Massenst¨ uck eine Reibungskraft, die proportional zu seiner Geschwindigkeit ist. Wie lauten die Newtonsche Bewegungsgleichung und ihre L¨osungen? L¨ osung. Nach dem Hookeschen Gesetz ist die Kraft, welche die Feder auf die Masse aus¨ ubt, proportional zur Auslenkung der Masse aus ihrer Ruhelage. Legen wir den Ursprung unseres Koordinatensystems in den Ruhepunkt der Masse, dann gilt f¨ ur die Federkraft FF bzw. f¨ ur das Potential VF d k 2 FF = − VF (x) , VF (x) = x , k > 0 , (1.15) dx 2 wobei k die Federkonstante ist. F¨ ur die Reibungskraft setzen wir an: FR = −cx˙ , c > 0 , mit c als konstantem Reibungskoeffizienten. Die Bewegungsgleichung f¨ ur das vorliegende nichtkonservative Problem lautet c k m¨ x = FF + FR =⇒ x , ω02 = . (1.16) ¨ + 2γ x˙ + ω02 x = 0 , γ = 2m m Zur L¨ osung dieser Differentialgleichung des eindimensionalen ged¨ ampften harmonischen Oszillators bietet sich der Ansatz x(t) = eiΩt f (t) an, der, in (1.16) eingesetzt, zu folgender Bestimmungsgleichung f¨ ur Ω und die Funktion f f¨ uhrt: f¨ + f˙(2γ + 2iΩ) + f (ω02 + 2iγΩ − Ω 2 ) = 0 . (1.17) Das Problem vereinfacht sich, wenn der letzte Klammerterm identisch verschwindet. Dies k¨onnen wir erreichen, indem wir setzen: Ω1,2 = iγ ± ω02 − γ 2 . Je nach dem Wert der Wurzel sind nun drei F¨alle zu unterscheiden:
Anwendungen
25
• Schwache D¨ ampfung: ω02 > γ 2 . Wir erhalten f¨ ur f (t) = 1 zwei linear unabh¨angige L¨ osungen von (1.16): x1 (t) = e−γt eiω t , x2 (t) = e−γt e−iω t , ω = ω02 − γ 2 . Die allgemeine reelle L¨ osung lautet somit x(t) = e−γt (a cos ω t + b sin ω t) , wobei a und b zwei Integrationskonstanten sind, die durch Anfangsbedingungen z.B. der Form x(0) = x0 , x(0) ˙ = v0 festgelegt werden. ur f (t) = 1 ergeben sich wieder zwei • Starke D¨ ampfung: ω02 < γ 2 . F¨ L¨ osungen, x1 (t) = e−(γ+ω )t , x2 (t) = e−(γ−ω )t , ω = γ 2 − ω02 , deren Linearkombination zu der allgemeinen L¨ osung x(t) = e−γt ae−ω t + beω t f¨ uhrt. alt man f¨ ur f (t) = 1 • Kritische D¨ ampfung: ω02 = γ 2 . In diesem Fall erh¨ die L¨ osung x1 (t) = e−γt . Da nun auch der erste Klammerterm in (1.17) verschwindet, ergibt sich f¨ ur f (t) = t eine zweite L¨ osung zu x2 (t) = te−γt . Insgesamt folgt x(t) = e−γt (a + bt) . Abbildung 1.4 zeigt verschiedene L¨ osungen in Abh¨ angigkeit von der Gr¨ oße ˙ gew¨ ahlt wurde. ω02 − γ 2 , wobei u ¨berall die Anfangsbedingung x(0) = −x(0) Ist keine Reibungskraft vorhanden, γ = 0, dann reduziert sich (1.16) auf die Gleichung des unged¨ ampften harmonischen Oszillators, deren allgemeine L¨osung nach dem Fall der schwachen D¨ ampfung gegeben ist durch x(t) = a cos ω0 t + b sin ω0 t . Der harmonische Oszillator findet in vielen Problemen der Physik Anwendung, da kleine Auslenkungen eines Systems aus dem Gleichgewicht grunds¨atzlich durch harmonische Schwingungen beschrieben und damit auf ein harmonisches Potential der Form (1.15) zur¨ uckgef¨ uhrt werden k¨ onnen. 3. Erzwungene Schwingung des Oszillators. Man betrachte die Bewegung eines ged¨ ampften harmonischen Oszillators, dessen Schwingung durch eine zeitabh¨ angige ¨ außere Kraft f (t) erzwungen wird: m¨ x + 2γmx˙ + mω02 x = f (t) .
26
1. Mechanik x(t) ω02 > γ 2 t
x(t)
x(t) ω02 < γ 2
ω02 = γ 2 t
t
Abb. 1.4. Verschiedene L¨ osungstypen des ged¨ ampften harmonischen Oszillators
L¨ osung. Zur L¨ osung dieses Problems verwenden wir die Methode der GreenFunktionen, die uns insbesondere in der Elektrodynamik von besonderem Nutzen sein wird. Demnach l¨aßt sich die L¨osung f¨ ur lineare inhomogene Gleichungen der obigen Art ganz allgemein mit x(t) = xhom (t) + G(t, t )f (t )dt ansetzen. xhom (t) ist die allgemeine L¨osung des homogenen Problems und G(t, t ) die Green-Funktion, die offenbar folgender Gleichung zu gen¨ ugen hat: 2 ˙ t ) + mω G(t, t ) = δ(t − t) . ¨ t ) + 2γmG(t, (1.18) mG(t, 0
Sobald die Green-Funktion gefunden ist, k¨onnen wir mit ihr f¨ ur jede Inhomogenit¨ at sofort die zugeh¨orige L¨osung konstruieren. Nehmen wir nun die Fourier-Zerlegung 1 iω(t−t ) ˜ G(t, t ) = √ dω G(ω)e 2π 1 dωeiω(t−t ) δ(t − t ) = 2π vor und setzen diese Ausdr¨ ucke in (1.18) ein, dann folgt 1 1 ˜ G(ω) =− √ 2 m 2π ω − 2iγω − ω02 1 1 =− √ = ω02 − γ 2 , ω m 2π (ω − iγ + ω )(ω − iγ − ω )
Anwendungen
bzw. G(t, t ) = −
1 2πm
27
dω
eiω(t−t ) . (ω − iγ + ω )(ω − iγ − ω )
(1.19)
Dieses Integral wertet man am besten mit Hilfe des Residuensatzes in der komplexen ω Ebene aus (siehe Abb. 1.5), wobei folgende Punkte zu beachten sind: Im ω
C t > t
iγ − ω
iγ + ω
Re ω C t < t
Abb. 1.5. Zur Festlegung des Integrationsweges bei der ω-Integration in (1.19)
• Der Integrand von (1.19) besitzt in der oberen Halbebene zwei Pole 1. ur ω02 = γ 2 . Ordnung f¨ ur ω02 = γ 2 bzw. einen Pol 2. Ordnung f¨ ahlen, damit der Beitrag der • F¨ ur t − t > 0 ist der obere Weg C zu w¨ Kr¨ ummung exponentiell ged¨ ampft ist und somit im Limes R → ∞ verschwindet. Entsprechend ist f¨ ur t − t < 0 der untere Weg C zu nehmen. F¨ ur t−t < 0 liefert die Integration somit keinen Beitrag, was im Einklang mit dem Kausalit¨ atsprinzip steht, nach dem der Zustand eines Systems zur Zeit t nur von der Vergangenheit (t < t) beeinflußt werden kann. F¨ u r t − t > 0 erhalten wir: • Schwache D¨ ampfung: ω02 > γ 2 . G(t, t ) =
1 −γ(t−t ) e sin[ω (t − t )] , ω = mω
ω02 − γ 2 .
• Starke D¨ ampfung: ω02 < γ 2 . G(t, t ) =
1 −γ(t−t ) e sinh[ω (t − t )] , ω = mω
γ 2 − ω02 .
28
1. Mechanik
• Kritische D¨ ampfung: ω02 = γ 2 . G(t, t ) =
t − t −γ(t−t ) . e m
1.2 Lagrange-Formalismus In den bisherigen mechanischen Problemstellungen sind wir von den Newtonschen Bewegungsgleichungen ausgegangen und haben daraus die physikalisch relevanten Zusammenh¨ange abgeleitet. Voraussetzung f¨ ur diese Vorgehensweise ist die Kenntnis aller auf das zu untersuchende System einwirkenden Kr¨ afte. In vielen F¨allen kann jedoch die Bestimmung dieser Kr¨afte sehr aufwendig werden, insbesondere dann, wenn die Dynamik des Systems durch Nebenbedingungen eingeschr¨ankt wird. Man betrachte z.B. ein Teilchen, daß sich unter dem Einfluß der Schwerkraft entlang einer vorgegebenen Bahn (z.B. Rutsche) bewegt. Hier m¨ ußte man die Einschr¨ankung der Bewegungsfreiheit durch Zwangskr¨ afte beschreiben, die w¨ahrend des gesamten Bewegungsablaufes die Einhaltung der vorgeschriebenen Teilchenbahn garantieren. Desweiteren haben wir in Unterabschn. 1.1.4 gesehen, daß die G¨ ultigkeit der Newtonschen Axiome in Inertialsystemen (und eben nur in Inertialsystemen) auch bedeutet, daß man recht komplizierte Formen der Bewegungsgleichungen in beschleunigten Bezugssystemen erh¨alt. In der Lagrangeschen Formulierung wird das Hindernis der Bestimmung aller einwirkenden Kr¨afte elegant umgangen, indem physikalische Problemstellungen so umformuliert werden, daß die Zwangsbedingungen in den zu l¨ osenden Lagrange-Gleichungen nicht mehr vorkommen, sondern in geschickt gew¨ ahlten Koordinaten absorbiert sind. Dar¨ uber hinaus sind die LagrangeGleichungen gerade so konstruiert, daß sie in allen Koordinatensystemen gelten und somit wesentlich flexibler anzuwenden sind als die Newtonschen Gleichungen. Die Herleitung der Lagrange-Gleichungen kann auf verschiedene Arten erfolgen. Wir benutzen hier zun¨achst das d’Alembertsche Prinzip der virtuellen Verr¨ uckungen. Es besagt, daß die Summe der Arbeiten der an einem System angreifenden Zwangskr¨afte verschwindet. Im Anschluß zeigen wir, wie man den Lagrange-Formalismus auch aus dem Hamiltonschen Prinzip aufbauen kann, einem Extremalit¨atsprinzip, das auch u ¨ber die klassische Mechanik hinaus von fundamentaler Bedeutung ist. Auf dem Weg dorthin wird es sich als notwendig erweisen, eine Einf¨ uhrung in die Konzepte der Variationsrechnung zu geben.
1.2 Lagrange-Formalismus
29
1.2.1 Zwangskr¨ afte, d’Alembertsches Prinzip und Lagrange-Gleichungen Wir betrachten ein N -Teilchensystem, dessen Bewegung durch Zwangsbedingungen eingeschr¨ ankt wird, so daß weniger als 3N Freiheitsgrade vorhanden sind. Man unterscheidet folgende Arten von Zwangsbedingungen: • Holonome Zwangsbedingungen: Sie lassen sich in unabh¨ angigen Gleichungen der Form fk (x1 , . . . , xN , t) = 0 , k = 1, . . . , s
(1.20)
darstellen. Beim Vorliegen s holonomer Zwangsbedingungen lassen sich die angige generalisierte Koor3N Koordinaten der xi auf n = 3N − s unabh¨ dinaten qj reduzieren, die implizit die gegebenen Bedingungen enthalten: xi = xi (q1 , . . . , qn , t) , i = 1, . . . , N , n = 3N − s .
(1.21)
• Nichtholonome Zwangsbedingungen: Sie erlauben keine Darstellung der Form (1.20). Besitzt ein N -Teilchensystem außer s holonomen zus¨ atzlich r nichtholonome Zwangsbedingungen, dann sind die generalisierten Koordinaten qj nicht mehr unabh¨ angig voneinander, sondern z.B. u ¨ber Zwangsbedingungen in der nichtintegrablen, differentiellen Form alj dqj + alt dt = 0 , l = 1, . . . , r (1.22) j
miteinander verkn¨ upft. • Rheonome Zwangsbedingungen: Sie sind explizit zeitabh¨ angig. • Skleronome Zwangsbedingungen: Sie sind nicht explizit zeitabh¨ angig. Im folgenden wollen wir uns bei nichtholonomen Zwangsbedingungen immer auf den Spezialfall (1.22) beschr¨ anken. Die weiteren Herleitungen sind dann f¨ ur holonome und nichtholonome Systeme in diesem Sinne g¨ ultig. Gleichung (1.21) entsprechend lautet die Geschwindigkeit des i-ten Massenpunktes, ausgedr¨ uckt durch die generalisierten Koordinaten, x˙ i =
n ∂xi j=1
∂qj
q˙j +
∂xi = x˙ i (q1 , . . . , qn , q˙1 , . . . , q˙n , t) , ∂t
(1.23)
wobei die q˙j = dqj /dt als generalisierte Geschwindigkeiten bezeichnet werden. Virtuelle Verr¨ uckungen und d’Alembertsches Prinzip. Unter einer virtuellen Verr¨ uckung δxi versteht man eine infinitesimale Verschiebung des i-ten Massenpunktes zu einer festen Zeit t (dt = 0), die mit den vorgegebenen holonomen und nichtholonomen Zwangsbedingungen vertr¨ aglich ist: δxi =
n ∂xi j=1
∂qj
δqj ,
n j=1
alj δqj = 0 , l = 1, . . . , r .
(1.24)
30
1. Mechanik
Diese Verr¨ uckung wird virtuell“ genannt, um sie von einer reellen Verr¨ uckung ” zu unterscheiden, die sich w¨ahrend eines Zeitintervalls dt ereignet, in dem sich die Kr¨ afte und Zwangsbedingungen ¨andern k¨onnen. Betrachten wir zun¨achst ¨ i = 0), dann gilt f¨ ein N -Teilchensystem im Gleichgewicht (mi x ur die Summe der virtuellen Verr¨ uckungen N
F i δxi = 0 ,
(1.25)
i=1
wobei in dieser Summe sogar jeder Term einzeln verschwindet. Teilt man die Kr¨ afte F i in der Weise F i = F ai + F zi auf, wobei F ai die von außen angelegten Kr¨afte bezeichnen und F zi die Zwangskr¨ afte, welche f¨ ur die Einhaltung der gegebenen Zwangsbedingungen sorgen, dann wird (1.25) zu F ai δxi + F zi δxi = 0 . i
i
In vielen F¨ allen, z.B. bei Bewegungen auf Fl¨achen oder Kurven, ist die virtuelle Verr¨ uckung δxi senkrecht zur Zwangskraft F zi , die auf den i-ten Massenpunkt wirkt, so daß von keiner Zwangskraft Arbeit verrichtet wird (δxi F zi = 0). Es gibt jedoch auch Beispiele daf¨ ur, daß die einzelnen Zwangskr¨afte durchaus Arbeit verrichten. Das Prinzip der virtuellen Arbeit sagt nun aus, daß in jedem Fall die Summe der Arbeiten aller Zwangskr¨afte verschwindet:4 Satz 1.12: Prinzip der virtuellen Arbeit (Gleichgewichtsprinzip der Statik) Ein N -Teilchensystem ist im Gleichgewicht, wenn die Summe der virtuellen Arbeiten aller Zwangskr¨afte verschwindet: N i=1
F zi δxi
= 0 =⇒
N
F ai δxi = 0 .
i=1
Aus diesem Prinzip l¨aßt sich nun durch einen Trick von d’Alembert ein ahnliches Prinzip gewinnen, welches die allgemeine Bewegung eines Systems ¨ umfaßt: D’Alembert dachte sich das System mit den Bewegungsgleichungen F i = p˙i als ein System im Gleichgewicht, mit den Kr¨aften F i und den sie kompensierenden Gegenkr¨aften −p˙i . Dadurch reduziert sich das dynamische Problem auf ein Problem der Statik, und man erh¨alt 4
Dies gilt nicht mehr, wenn Reibungskr¨ afte auftreten; wir m¨ ussen deshalb solche Systeme aus unseren Betrachtungen herauslassen.
1.2 Lagrange-Formalismus
31
Satz 1.13: D’Alembertsches Prinzip Wegen (F i − p˙ i )δxi = (F ai + F zi − p˙ i )δxi = 0 und N
N i=1
F zi δxi = 0 folgt
(F ai − p˙ i ) δxi = 0 .
i=1
Wie man sieht, sind die Zwangskr¨ afte mittels dieses Prinzips eliminiert. Im allgemeinen folgt das d’Alembertsche Prinzip nicht aus den Newtonschen Gesetzen, sondern kann als weiteres Axiom der klassischen Mechanik angesehen werden; auf ihm baut der Lagrangesche Formalismus auf. Unter Ber¨ ucksichtigung von (1.24) folgt aus dem d’Alembertschen Prinzip die Gleichung n n N ∂xi d ∂xi d x˙ i − x˙ i = mi Qj δqj . (1.26) δqj ∂qj dt ∂qj dt j=1 j=1 i=1 Hierbei ist Qj die sog. generalisierte Kraft: Definition: Generalisierte Kraft Qj Qj =
N
F ai
i=1
∂xi . ∂qj
Da die qj nicht die Dimension einer L¨ ange haben m¨ ussen, besitzen die Qj i.a. nicht die Dimension einer Kraft. In jedem Fall ist aber das Produkt Qj δqj eine Arbeit. Unter Ausnutzung der aus (1.23) folgenden Beziehungen ∂xi 1 d ∂ x˙ 2i ∂xi ∂ x˙ i d d ∂xi ∂ x˙ i x˙ i = = , , = ∂qj ∂ q˙j dt ∂qj 2 dt ∂ q˙j dt ∂qj ∂qj geht (1.26) u ¨ber in n d ∂T ∂T δqj − − Qj = 0 , n = 3N − s , dt ∂ q˙j ∂qj j=1
(1.27)
wobei T =
N mi i=1
2
x˙ 2i (q1 , . . . , qn , q˙1 , . . . , q˙n , t)
die gesamte kinetische Energie des Systems ist. Gleichung (1.27) beschreibt die Zeitabh¨ angigkeit der generalisierten Koordinaten qj . Dank des d’Alembertschen Prinzips treten hier die Zwangskr¨ afte nicht mehr explizit auf, sondern sind in den generalisierten Koordinaten verborgen. Im Falle rein holonomer Zwangsbedingungen sind alle virtuellen Verr¨ uckungen der generalisierten Koordinaten unabh¨ angig voneinander, so daß
32
1. Mechanik
jeder Klammerterm in der Summe (1.27) identisch Null gesetzt werden kann. Wir wollen jedoch annehmen, daß unser N -Teilchensystem s holonome Zwangsbedingungen und r nichtholonome Bedingungen der Form (1.22) besitzt. Von den insgesamt n virtuellen Verr¨ uckungen δqj sind dann r u ¨ber n
alj δqj = 0 , l = 1, . . . , r
(dt = 0)
j=1
voneinander abh¨ angig und die verbleibenden n − r Verr¨ uckungen voneinander unabh¨ angig. Um die Zahl der δqj auf die der unabh¨angigen Verr¨ uckungen zu reduzieren, f¨ uhren wir die frei w¨ahlbaren Lagrange-Multiplikatoren λl , l = 1, . . . , r ein. Im allgemeinen sind dies zeitabh¨angige Funktionen, die zudem von den generalisierten Koordinaten und Geschwindigkeiten abh¨angen. Mit ihnen schreiben wir die letzte Beziehung um zu n j=1
δqj
r
λl alj = 0 .
(1.28)
l=1
Die Differenz der Gleichungen (1.27) und (1.28) ergibt n r d ∂T ∂T δqj − − Qj − λl alj = 0 . dt ∂ q˙j ∂qj j=1 l=1
F¨ ur die unabh¨ angigen δqj lassen sich die entsprechenden Koeffizienten (Klammerterme) gleich Null setzen. Die Lagrange-Multiplikatoren k¨onnen wir so w¨ ahlen, daß die Koeffizienten der abh¨angigen Differentiale ebenfalls verschwinden. Wir erhalten also insgesamt d ∂T ∂T λl alj = 0 , j = 1, . . . , n . − − Qj − ∂qj dt ∂ q˙j r
(1.29)
l=1
Dies sind die Lagrange-Gleichungen I. Art. F¨ ur den Fall, daß die a¨ußeren Kr¨ afte konservativ sind, ergibt sich F ai = −∇i V (x1 , . . . , xN ) =⇒ Qj = −
∂V ∂V , =0, ∂qj ∂ q˙j
und es folgt der5 Satz 1.14: Lagrange-Gleichungen I. Art f¨ ur konservative Kr¨ afte mit s holonomen und r nichtholonomen Zwangsbedingungen Die Lagrange-Funktion eines konservativen N -Teilchensystems ist gegeben durch 5
Man beachte, daß (1.30) keine Bestimmungsgleichung (also keine Differentialgleichung) f¨ ur L darstellt. Diese Gleichung ist vielmehr ein Funktional, aus dem man die Bestimmungsgleichungen f¨ ur die generalisierten Koordinaten erh¨ alt.
1.2 Lagrange-Formalismus
L=T −V =
N mi
2
i=1
33
x˙ 2i (q1 , . . . , qn , q˙1 , . . . , q˙n , t) − V (q1 , . . . , qn ) .
Aus ihr ergeben sich die Bewegungsgleichungen (Lagrange-Gleichungen) f¨ ur die generalisierten Koordinaten im Falle s holonomer und r nichtholonomer Zwangsbedingungen zu d ∂L ∂L − − λl alj = 0 , j = 1, . . . , 3N − s = n , dt ∂ q˙j ∂qj r
(1.30)
l=1
n
alj q˙j + alt = 0 , l = 1, . . . , r .
j=1
Die Lagrange-Gleichungen sind ein System gekoppelter gew¨ ohnlicher Differentialgleichungen 2. Ordnung f¨ ur die Zeitabh¨ angigkeit der generalisierten Koordinaten. Zusammen mit den aus (1.22) stammenden r nichtholonomen Zwangsbedingungen, die jetzt als Differentialgleichungen aufzufassen sind, ergeben sich also insgesamt n + r Gleichungen f¨ ur die n generalisierten Koordinaten und die r Lagrange-Multiplikatoren. Im Falle rein holonomer Zwangsbedingungen reduziert sich Satz 1.14 auf n Lagrange-Gleichungen f¨ ur die n generalisierten Koordinaten: Satz 1.15: Lagrange-Gleichungen II. Art f¨ ur konservative Kr¨ afte mit s holonomen Zwangsbedingungen d ∂L ∂L − = 0 , j = 1, . . . , 3N − s = n . dt ∂ q˙j ∂qj Ein wichtiger Satz, dessen Beweis wir in Anwendung 4 f¨ uhren, ist der folgende: Satz 1.16: Invarianz der Lagrange-Gleichungen unter Koordinatentransformationen Die Lagrange-Gleichungen sind forminvariant unter den Koordinatentransformationen q → Q(q, t). Das heißt aus d ∂L ∂L − = 0 , j = 1, . . . , 3N − s = n dt ∂ q˙j ∂qj folgt die G¨ ultigkeit der Lagrange-Gleichungen auch f¨ ur ˙ t) = L[q(Q, t), q(Q, ˙ t), t] . ¯ ˙ L(Q, Q, Q,
34
1. Mechanik
¨ Aquivalenz des Lagrange- und Newton-Formalismus. Bei Abwesenheit von Zwangsbedingungen muß der Lagrange-Formalismus f¨ ur ein N -Teilchensystem auf die Newtonschen Bewegungsgleichungen f¨ uhren. W¨ahlen wir die kartesischen Koordinaten als generalisierte Koordinaten, q = x, dann sehen wir dies (in Vektornotation) wie folgt: L=T −V =
N mi i=1
2
x˙ 2i − V (x1 , . . . , xN , t)
=⇒ ∇xi L = −∇xi V = F i ,
d ¨i . ∇x˙ i L = mi x dt
Die Lagrange-Gleichungen lauten demnach d ¨ i = F i , i = 1, . . . , N . ∇x˙ i L = ∇xi L ⇐⇒ mi x dt Interpretation der Lagrange-Multiplikatoren. Es steht uns frei, die Zwangskr¨ afte F zi als zus¨atzliche ¨außere Kr¨afte F ∗i zu interpretieren, die so angelegt werden, daß sich die Bewegung des Systems nicht ¨andert. Die Zwangsbedingungen sind dann eliminiert, und wir erhalten die Lagrange-Gleichungen d ∂L ∂L − = Q∗j . dt ∂ q˙j ∂qj Ein Vergleich mit Satz 1.14 liefert Q∗j
=
r
λl alj ,
l=1
d.h. die Lagrange-Multiplikatoren bestimmen die generalisierten Zwangskr¨ afte. Generalisiertes Potential. Wie man anhand von (1.29) erkennt, bleiben die S¨ atze 1.14 und 1.15 auch dann g¨ ultig, wenn sich die generalisierten Kr¨afte Qj durch ein generalisiertes Potential V (q1 , . . . , qn , q˙1 , . . . , q˙n , t) in folgender Weise darstellen lassen: ∂V d ∂V Qj = − + . (1.31) ∂qj dt ∂ q˙j Ein Beispiel f¨ ur diesen Fall ist die geschwindigkeitsabh¨angige Lorentz-Kraft x˙ a ˙ t) = F L (x, x, ˙ t) = q E(x, t) + × B(x, t) , QL (x, x, c welche die Bewegung eines Teilchens der Ladung q in einem elektromagnetischen Feld E, B beschreibt (c=Lichtgeschwindigkeit). Man erh¨alt sie aus (1.31) f¨ ur q ˙ t) = qφ(x, t) − A(x, t)x˙ , V (x, x, c wobei die Skalar- und Vektorpotentiale φ, A u ¨ber
1.2 Lagrange-Formalismus
35
1 ∂A − ∇φ c ∂t mit E und B verbunden sind (siehe Unterabschn. 2.2.1). B =∇×A , E =−
1.2.2 Erhaltungss¨ atze In diesem Unterabschnitt betrachten wir Transformationen der verallgemeinerten Koordinaten, Geschwindigkeiten und der Zeit, welche die LagrangeFunktion invariant lassen oder auf eine ¨ aquivalente Lagrange-Funktion f¨ uhren. Solche Transformationen nennt man Symmetrietransformationen. Nach einem Theorem von E. Noether (siehe Unterabschn. 2.8.3) ist jede Symmetrieeigenschaft eines Systems mit einem Erhaltungssatz verkn¨ upft. Wir zeigen dies hier anhand der uns aus Satz 1.11 bekannten Erhaltungss¨ atze f¨ ur ein abgeschlossenes System von N Punktmassen mit der Lagrange-Funktion L(xi , x˙ i , t) =
N 1 i=1
2
mi x˙ 2i − V , V =
V (|xi − xj |) .
i,j
Erhaltung der Energie, Homogenit¨ at der Zeit. Soll die Zeitverschiebung t → t = t + δt , δxi = δ x˙ i = 0 eine Symmetrietransformation der Lagrange-Funktion sein, so muß gelten: ∂L ∂L ˙ t + δt) − L(x, x, ˙ t) = δt = 0 =⇒ =0. δL = L(x, x, ∂t ∂t Ganz allgemein gilt aber f¨ ur die Lagrange-Funktion (in Vektornotation) ∂L dL ¨ i ∇x˙ i L . = + x˙ i ∇xi L + x dt ∂t i i Unter Ber¨ ucksichtigung der Lagrange-Gleichungen d ∇xi L − ∇x˙ i L = 0 dt folgt daher d ∂L L− x˙ i ∇x˙ i L = . dt ∂t i Im vorliegenden Fall ist ∂L/∂t = 0, so daß x˙ i ∇x˙ i L − L = const . i
Wegen i
x˙ i ∇x˙ i L =
x˙ i ∇x˙ i T =
i
mi x˙ 2i = 2T
i
erhalten wir schließlich die Erhaltung der Gesamtenergie: T + V = E = const .
36
1. Mechanik
Erhaltung des Gesamtimpulses, Homogenit¨ at des Raumes. Betrachten wir als n¨ achstes die Transformation xi −→ xi = xi + δx , δt = 0 . Analog zur obigen Herleitung ergibt sich δL = L(xi + δxi , x˙ i , t) − L(xi , x˙ i , t) = δx
∇xi L = 0 .
i
Da δx eine beliebige Verschiebung ist, folgt d pi = const . ∇xi L = 0 =⇒ ∇x˙ i L = 0 =⇒ p = dt i i i Die Invarianz der Lagrange-Funktion unter Verschiebungen aller Teilchen um dieselbe Strecke δx ist also gleichbedeutend mit der Erhaltung des Gesamtimpulses des Systems. Erhaltung des Gesamtdrehimpulses, Isotropie des Raumes. Damit infinitesimale Drehungen der Form δxi = δφ × xi , δ x˙ i = δφ × x˙ i , δt = 0 Symmetrietransformationen sind, muß gelten: δL = δxi ∇xi L + δ x˙ i ∇x˙ i L = 0 . i
i
Dies f¨ uhrt auf die Erhaltung des Gesamtdrehimpulses: d δφ (xi × p˙ i + x˙ i × pi ) = δφ (xi × pi ) = 0 dt i i =⇒ l =
li = const .
i
Schwerpunktsatz, Invarianz unter gleichf¨ ormiger Bewegung. Im Falle der Transformation xi −→ xi = xi + vt , v = const , δt = 0 ergibt sich die transformierte Lagrange-Funktion zu v2 L = L + v mi x˙ i + mi 2 i i =⇒ δL =
d 1 (M xS v) + M v 2 . dt 2
(1.32)
Nun sind zwei Lagrange-Funktionen, die sich nur um eine Konstante oder um eine Zeitableitung einer reinen Zeitfunktion unterscheiden, ¨aquivalent und f¨ uhren auf dieselben Bewegungsgleichungen. Auf der anderen Seite k¨onnen wir f¨ ur δL auch schreiben:
1.2 Lagrange-Formalismus
δL =
(δxi ∇xi L + δ x˙ i ∇x˙ i L) =
i
i
d = dt
37
(vtp˙ i + vpi )
vt
pi
.
(1.33)
i
Durch Vergleich von (1.32) und (1.33) erhalten wir somit den Schwerpunktsatz pi = const . M xS − t i
Insgesamt sehen wir, daß die hier betrachteten Symmetrietransformationen gerade den 10 Erhaltungsgr¨ oßen aus Satz 1.11 entsprechen. Satz 1.17: Symmetrien und Erhaltungss¨ atze Die Invarianz des Lagrange-Funktion unter einer Symmetrietransformation ist stets gleichbedeutend mit einer Erhaltungsgr¨ oße: • Invarianz unter zeitlichen Translationen: Erhaltung der Gesamtenergie. • Invarianz unter r¨ aumlichen Translationen: Erhaltung des Gesamtimpulses. • Invarianz unter r¨ aumlichen Drehungen: Erhaltung des Gesamtdrehimpulses. • Invarianz unter gleichf¨ ormiger Bewegung: Schwerpunktsatz.
1.2.3 Hamilton-Prinzip und Wirkungsfunktional Mit der Newtonschen Formulierung der Mechanik und dem auf dem d’Alembertschen Prinzip aufbauenden Lagrange-Formalismus haben wir bereits zwei Ans¨atze zur Behandlung der Punktmechanik gefunden. In diesem Unterabschnitt formulieren wir ein weiteres Prinzip, das Hamilton-Prinzip, das ebenfalls als Ausgangspunkt der klassischen Mechanik betrachtet werden kann. Desweiteren zeigen wir, daß aus diesem Prinzip die uns bereits bekannten Lagrange-Gleichungen II. Art folgen. Wirkungsfunktional. Das Wirkungsfunktional ist definiert als Integral u oglichen Bahnen, die ein gegebenes System von Massenpunkten ¨ber alle m¨ durchlaufen kann. Das Hamilton-Prinzip macht nun folgende Aussage u ¨ber die tats¨achliche Bahn, l¨ angs derer die Bewegung des Systems verlaufen wird:
38
1. Mechanik
Satz 1.18: Hamiltonsches Prinzip f¨ ur konservative holonome Systeme Gegeben sei die Lagrange-Funktion L(q1 , . . . , qn , q˙1 , . . . , q˙n , t) = T −V eines konservativen Systems mit holonomen Zwangsbedingungen. Seine L¨osungen sind dadurch charakterisiert, daß das zugeh¨orige Wirkungsfunktional, also das Zeitintegral der Lagrange-Funktion, l¨angs der tats¨achlichen Bahn extremal wird: t2 ˙ S[q] = dtL[q(t), q(t), t] −→ extremal . t1
¨ Aquivalent hierzu ist die Bedingung, daß die Variation der Wirkung, δS, l¨ angs der tats¨ achlichen Bahn verschwindet. Offensichtlich beschreibt das Hamiltonsche Prinzip ein Optimierungsproblem, bei dem es allerdings nicht, wie in der gew¨ohnlichen Differentialrechnung, um die Bestimmung von Extremstellen einer Funktion geht, sondern um das Auffinden von Funktionen selbst, f¨ ur die ein gegebenes Funktional Extremwerteigenschaft annimmt. F¨ ur die weitere Diskussion des Hamiltonschen Prinzips ist es daher notwendig, einige Elemente der Variationsrechnung zu behandeln. Variationsproblem mit festen Endpunkten. Ein Beispiel f¨ ur Variationsprobleme ist die Brachystochrone, bei der die Form einer Kurve zwischen zwei festen Punkten gefunden werden soll, auf der ein Massenpunkt unter dem Einfluß der Schwerkraft reibungsfrei m¨oglichst schnell den Endpunkt erreicht (siehe Anwendung 5). Es zeigt sich, daß bei sehr vielen physikalischen Problemen dieser Art die allgemeine Struktur des zu optimierenden Funktionals gegeben ist durch x2 S[y1 , . . . , yn ] = dxF (y1 , . . . , yn , y1 , . . . , yn , x) , (1.34) x1
wobei F nur von den Funktionen yj (x), deren ersten Ableitungen yj (x) sowie der unabh¨ angigen Variablen x abh¨angt. Wir beschr¨anken uns auf den Fall, daß die Endpunkte der aufzusuchenden Funktionen yj fixiert sind, [x1 , y(x1 )] , [x2 , y(x2 )] fest , y = (y1 , . . . , yn ) , und suchen nach einer Art Taylor-Entwicklung von (1.34). Hierzu variieren uhren von Hilfsfunktionen hj , die an den wir die Funktionen yj durch Einf¨ Endpunkten verschwinden: y(x) −→ γ(x) = y(x) + δy(x) , δy(x) = h(x) , h(x1 ) = h(x2 ) = 0 . F¨ ur beliebig kleine | | liegen alle variierten Funktionen γ in einer beliebig kleinen Nachbarschaft von y, und wir k¨onnen schreiben: S[γ] = S[y] + δS + . . . ,
1.2 Lagrange-Formalismus
mit
39
dS[γ] δS = d =0 x2 = dx [h∇γ F (γ, γ , x) + h ∇γ F (γ, γ , x)]=0 x1 x2
d ∇γ F (γ, γ , x) dx h ∇γ F (γ, γ , x) − dx =0 x1 x 2 + h∇γ F (γ, γ , x)|=0 x 1 x2 d = dx h ∇y F (y, y , x) − ∇y F (y, y , x) dx =
x1
+ [h∇y F (y, y , x)]x21 . x
Da die Hilfsfunktionen an den Endpunkten Null sind, verschwindet der letzte Term. Sei nun y Extremale des Wirkungsfunktionals, dann ist δS = 0, so daß der vorletzte Term ebenfalls verschwindet. Wir erhalten somit den Satz 1.19: Variationsformel und Euler-Lagrange-Gleichungen f¨ ur feste Endpunkte In der linearen N¨ aherung variiert das Wirkungsintegral f¨ ur feste Endpunkte in der Weise S[y + δy] = S[y] + δS + . . . , mit x2 δS =
d ∇y F (y, y , x) . dxδy ∇y F (y, y , x) − dx
x1
Hieraus folgen als notwendiges Kriterium f¨ ur die Extremalit¨ at des Wirkungsfunktionals die Euler-Lagrange-Gleichungen (ELG): ∂F (y, y , x) d ∂F (y, y , x) − = 0 , j = 1, . . . , n . ∂yj dx ∂yj Man beachte, daß dieser Satz ein notwendiges aber nicht hinreichendes Kriohnlichen terium f¨ ur ein Extremum liefert (genau wie f (x) = 0 in der gew¨ Differentialrechnung). Offensichtlich sind die ELG mit den Lagrange-Gleichungen in Satz 1.15 f¨ ur den rein holonomen Fall identisch, wenn F durch die Lagrange-Funktion L ersetzt wird und die Funktionen yj (x) als die generalisierten Koordinaten qj (t) interpretiert werden. Wir haben also
40
1. Mechanik
Satz 1.20: Hamiltonsches Prinzip und Lagrange-Gleichungen II. Art Aus dem Hamilton-Prinzip folgt, daß die tats¨achliche Bahn eines konservativen Teilchensystems mit rein holonomen Zwangsbedingungen den Lagrange-Gleichungen II. Art gen¨ ugt: t2 dtL −→ extremal =⇒
S=
d ∂L ∂L − =0. dt ∂ q˙j ∂qj
t1
Es sei daran erinnert, daß die Lagrange-Gleichungen unter Koordinatentransformationen invariant sind. Demnach ist auch das Hamilton-Prinzip vom Koordinatensystem, in dem L ausgedr¨ uckt wird, unabh¨angig. Desweiteren beachte man, daß das Hamilton-Prinzip gegen¨ uber dem Lagrange-Formalismus eigentlich keine neue Physik liefert. Es ist jedoch von u ¨bergeordneter Bedeutung, da es auch außerhalb der Mechanik, insbesondere bei der Formulierung moderner Feldtheorien, eine entscheidende Rolle spielt. ¨ Aquivalenz des d’Alembert- und des Hamilton-Prinzips. Betrachten wir ein holonomes System und dessen Bewegungsablauf in einem endlichen Zeitintervall [t1 : t2 ], dann k¨onnen wir das d’Alembertsche Prinzip wie folgt umformen: (F ai − mi x ¨i )δxi = 0 i
=⇒
mi d mi x˙ i δxi = F ai δxi + δ x˙ 2i = δW + δT , dt i 2 i i
¨ wobei δT die virtuelle Anderung der kinetischen Energie bezeichnet. Integration dieser Beziehung im Intervall [t1 : t2 ] liefert mit δxi (t2 ) = δxi (t1 ) = 0 t2 (δW + δT )dt = mi [x˙ i (t2 )δxi (t2 ) − xi (t1 )δxi (t1 )] = 0 . i
t1
Beschr¨ ankt man sich auf den Spezialfall konservativer Kr¨afte, dann l¨aßt sich f¨ ur die virtuelle Arbeit der eingepr¨agten Kr¨afte schreiben: δW = F ai δxi = − δxi ∇i V (x1 , . . . , xN ) = −δV , i
i
so daß folgt: t2 t2 t2 (δW + δT )dt = δ(T − V )dt = δLdt = 0 . t1
t1
t1
1.2 Lagrange-Formalismus
41
Da wir die Endpunkte nicht variieren, k¨ onnen wir die Variation vor das Integral ziehen: t2 Ldt = δS = 0 .
δ t1
¨ Damit ist die Aquivalenz des d’Alembert- und Hamilton-Prinzips f¨ ur konservative holonome Systeme gezeigt. Nichtkonservative Systeme mit holonomen Zwangsbedingungen. Unter Benutzung der generalisierten Kr¨ afte k¨ onnen wir das Hamiltonsche Prinzip auch f¨ ur den Fall eines nichtkonservativen Systems formulieren. Die Stationarit¨ atsforderung t2 δS =
dtδ(T + W ) = 0 , t1
mit δW =
N
F ai δxi =
i=1
und δT =
n
δqj
Qj δqj
j=1
j=1
n
∂T d ∂T − ∂qj dt ∂ q˙j
f¨ uhrt dann sofort auf (1.27). ¨ Aquivalente Lagrange-Funktionen, Eichtransformation. Man macht sich leicht klar, daß mit der Lagrange-Funktion L auch die Klasse der Lagrange-Funktionen d F (q, t) dt zu denselben station¨ aren Bahnen f¨ uhrt, denn die Addition der totalen Zeitableitung einer skalaren Funktion F (q, t) bedeutet lediglich die Addition eines konstanten Terms in der neuen Wirkung S : L = αL +
t2
S =
d dt αL + F (q, t) = αS + F [q(t2 ), t2 ] − F [q(t1 ), t1 ] dt
t1
= αS + const . Transformationen dieser Art, welche die Lagrange-Funktion derart ver¨ andern, daß physikalische Resultate unver¨ andert bleiben, nennt man Eichtransformationen. Wir werden ihnen in der Elektrodynamik und Quantenmechanik wieder begegnen, wo sie (ebenso wie in der theoretischen Hochenergiephysik, die allgemein als Eichtheorien formuliert werden) eine wesentliche Rolle spielen.
42
1. Mechanik
Zusammenfassung • Das d’Alembertsche Prinzip besagt, daß die gesamte, von den Zwangskr¨ aften verrichtete Arbeit verschwindet. Auf diesem Postulat kann der Lagrange-Formalismus aufgebaut werden. • Die Lagrange-Gleichungen sind ein System gekoppelter gew¨ohnlicher Differentialgleichungen 2. Ordnung. Sie beschreiben alternativ zur Newtonschen Bewegungsgleichung die Dynamik eines mechanischen Systems, wobei Zwangsbedingungen nicht mehr explizit auftreten, sondern in geschickt gew¨ahlten Koordinaten absorbiert sind. Hier treten die generalisierten Koordinaten und Geschwindigkeiten als Paare von Variablen auf. • Die Lagrange-Gleichungen gelten in allen Koordinatensystemen. • Die Erhaltungss¨atze der Mechanik sind eine Folge von Symmetrien des mechanischen Systems. • Die Lagrange-Gleichungen folgen aus dem Hamilton-Prinzip der extremalen Wirkung.
Anwendungen 4. Invarianz der Lagrange-Gleichung unter beliebigen Koordinatentransformationen. Man zeige, daß die Lagrange-Gleichungen invariant sind unter den Koordinatentransformationen qi −→ Qi = Qi (q, t) . L¨ osung. Es gilt d ∂L ∂L ˙ t) . − = 0 , qi = qi (Q, t) , q˙i = q˙i (Q, Q, dt ∂ q˙i ∂qi Wegen q˙i =
∂qi (Q, t) j
∂Qj
∂qi Q˙ j + ∂t
gilt ∂ q˙i ∂qi = . ∂Qj ∂ Q˙ j ˙ t) berechnen Ausgehend von der transformierten Lagrange-Funktion L(Q, Q, wir nun die Lagrange-Gleichungen in den neuen Koordinaten. Dazu ben¨otigen wir:
Anwendungen
∂L = ∂Qi
j
∂L ∂qj ∂L ∂ q˙j + ∂qj ∂Qi ∂ q˙j ∂Qi
43
∂L ∂ q˙j ∂L ∂qj ∂L = = ∂ q˙j ∂ Q˙ i ∂ q˙j ∂Qi ∂ Q˙ i j j d ∂L ∂qj ∂L d ∂qj d ∂L = + dt ∂ Q˙ i dt ∂ q˙j ∂Qi ∂ q˙j dt ∂Qi j j
=⇒
d ∂L d ∂L ∂L ∂L ∂qj − = − ∂Qi dt ∂ q˙j ∂qj ∂Qi dt ∂ Q˙ i j d ∂qj ∂ q˙j ∂L − . + dt ∂Qi ∂Qi ∂ q˙j j
Hierbei verschwindet die erste Summe, denn es gelten die Lagrange-Gleichungen in den alten Koordinaten. Die zweite Summe ist ebenso Null, weil ∂ 2 qj ∂ q˙j ∂ 2 qj d ∂qj = . Q˙ l + = ∂Qi ∂Qi ∂Ql ∂Qi ∂t dt ∂Qi l
5. Brachystochrone. Dies ist das Paradebeispiel der Variationsrechnung. Zu bestimmen ist die Form der Bahnkurve zwischen zwei fixierten Punkten, auf der ein Teilchen unter dem Einfluß der Schwerkraft am schnellsten reibungsfrei entlanggleitet. L¨ osung. Wir legen das Koordinatensystem so, daß Anfangs- und Endpunkt durch die Koordinaten (0, h) und (a, 0) gegeben sind. Der Ortsvektor des Teilchens ist x(t) x(t) = , y[x(t)] wobei y(x) die gesuchte Bahnkurve beschreibt. Zur Bestimmung des zu minimierenden Funktionals S nutzen wir die Energieerhaltung des Teilchens: m m T = x˙ 2 = x˙ 2 1 + y 2 (x) , V = mgy(x) 2 2 m =⇒ E = T + V = x˙ 2 1 + y 2 (x) + mgy(x) = mgh = const 2 dx 2g(h − y) =⇒ = dt 1 + y 2 τ a 1 + y 2 1 =⇒ τ = dt = S[y] = dxF (y, y , x) , F (y, y , x) = √ . h−y 2g 0
0
Zur Bestimmung der ELG ben¨ otigen wir folgende Ableitungen:
44
1. Mechanik
1 ∂F 1 + y 2 = √ ∂y 2 2g (h − y)3/2 ∂F y 1 = √ ∂y 2g (1 + y 2 )(h − y) 2
y d ∂F 1 y (h − y) + 2 (1 + y 2 ) = √ . dx ∂y 2g [(1 + y 2 )(h − y)]3/2
Es folgt 1 (1 + y 2 ) . 2 Diese Gleichung, die nicht mehr von x abh¨angt, ist l¨osbar etwa mit Hilfe der Substitution y = p(y), y = (dp/dy)p. Wir verfahren hier anders und nutzen die folgende Identit¨at, die gilt, da F nicht von x abh¨angt: d ∂F d ∂F ∂F − F −y = . dx ∂y ∂y ∂y dx y (h − y) =
Hieraus folgt entlang von L¨osungen der ELG H = y
∂F − F = const . ∂y
Wir werden diesen Zusammenhang im n¨achsten Abschnitt als Erhaltung der Hamilton-Funktion wiederfinden. Somit ergibt sich 1 1 −√ = c = const 2g (1 + y 2 )(h − y) 1 e − (h − y) dy =− , e= =⇒ dx h−y 2gc2 y(x) h−y . =⇒ x = − dy e − (h − y) h
Mit der Substitution y = h − e sin2 ψ =⇒ dy = −2e sin ψ cos ψdψ folgt ψ x = 2e
1 dψ sin2 ψ = e ψ − sin 2ψ . 2
0
Insgesamt erhalten wir als L¨osung eine Parametrisierung [x(ψ), y(ψ)] von Zykloiden mit einem freien Parameter e, der u ¨ber die Bedingung y(x = a) = 0 zu fixieren ist. Abbildung 1.6 zeigt die drei m¨oglichen L¨osungstypen in Abh¨ angigkeit vom Verh¨altnis a/h.
Anwendungen
y
45
h
x a
π h 2
Abb. 1.6. Verschiedene L¨ osungstypen des Brachystochrone-Problems
6. Mathematisches Doppelpendel. Ein ebenes mathematisches Doppelpendel mit den Stangenl¨ angen l1 = l2 = l und den Punktmassen m1 = m2 = m bewege sich reibungsfrei unter dem Einfluß der Schwerkraft (Abb. 1.7). Man bestimme die Schwingungsfrequenzen f¨ ur kleine Auslenkungen aus der Vertikalen. L¨ osung. Die Ortsvektoren der Massenpunkte, ausgedr¨ uckt durch die generalisierten Koordinaten ϕ und θ, sind gegeben durch cos ϕ(t) cos ϕ(t) + cos θ(t) x1 (t) = l , x2 (t) = l . sin ϕ(t) sin ϕ(t) + sin θ(t) Die rein holonomen Zwangsbedingungen des Systems, x21 − l2 = 0 , (x2 − x1 )2 − l2 = 0 , sind somit vollst¨ andig ber¨ ucksichtigt. F¨ ur die kinetische und potentielle Energie ergibt sich ! m ˙ T = T1 + T2 = l2 2ϕ˙ 2 + θ˙2 + 2ϕ˙ θ(cos ϕ cos θ + sin ϕ sin θ) 2 V = V1 + V2 = −mgl(2 cos ϕ + cos θ) . Die Lagrange-Funktion lautet demnach ! m L = T − V = l2 2ϕ˙ 2 + θ˙2 + 2ϕ˙ θ˙ cos(ϕ − θ) + mgl(2 cos ϕ + cos θ) . 2 Die Lagrange-Gleichungen ergeben sich aus folgenden Ableitungen:
46
1. Mechanik y l
ϕ m θ
l m
x Abb. 1.7. Zweidimensionales mathematisches Doppelpendel
∂L = −ml2 ϕ˙ θ˙ sin(ϕ − θ) − 2mgl sin ϕ ∂ϕ ∂L = 2ml2 ϕ˙ + ml2 θ˙ cos(ϕ − θ) ∂ ϕ˙ d ∂L ˙ ϕ˙ − θ) ˙ sin(ϕ − θ) = 2ml2 ϕ¨ + ml2 θ¨ cos(ϕ − θ) − ml2 θ( dt ∂ ϕ˙ ∂L = ml2 ϕ˙ θ˙ sin(ϕ − θ) − mgl sin θ ∂θ ∂L = ml2 θ˙ + ml2 ϕ˙ cos(ϕ − θ) ∂ θ˙ d ∂L ˙ sin(ϕ − θ) ˙ ϕ˙ − θ) = ml2 θ¨ + ml2 ϕ¨ cos(ϕ − θ) − ml2 ϕ( dt ∂ θ˙ ⎧ ⎨ 2lϕ¨ + lθ¨ cos(ϕ − θ) + lθ˙2 sin(ϕ − θ) = −2g sin ϕ =⇒ ⎩ lθ¨ + lϕ¨ cos(ϕ − θ) − lϕ˙ 2 sin(ϕ − θ) = −g sin θ . Da wir nur kleine Auslenkungen betrachten wollen, gilt cos(ϕ − θ) ≈ 1, sin ϕ ≈ ϕ , ϕ˙ 2 , θ˙2 1, und es folgt g 2ϕ¨ + θ¨ = −2 ϕ l g ¨ θ + ϕ¨ = − θ . l Der L¨ osungsansatz ϕ(t) = αeiωt , θ(t) = βeiωt f¨ uhrt zu g 2 − 2ω 2 α − ω 2 β = 0 l g −ω 2 α + − ω2 β = 0 . l
Anwendungen
47
Damit dieses lineare Gleichungssystem in α und β nichttriviale L¨ osungen besitzt, muß die Koeffizientendeterminante verschwinden: g √ 2 − 2ω 2 −ω 2 g 2 l = 0 =⇒ ω1,2 = (2 ± 2) . g 2 2 l −ω −ω l Setzt man dieses Ergebnis in obiges Gleichungssystem ein, so ergibt sich: √ √ g 1. ω 2 = (2 + 2) =⇒ β = − 2α l √ √ g 2. ω 2 = (2 − 2) =⇒ β = 2α . l √ g Das heißt im ersten Fall ist ω = 2), und die Pendel schwinl (2 + gen entgegengesetzt, w¨ a hrend im zweiten Fall die Pendel mit der Frequenz √ g ω = l (2 − 2) in gleicher Richtung schwingen. 7. Kleine Schwingungen und Normalmoden. In dieser Anwendung wird der allgemeinere mathematische Rahmen der Anwendung 6 aufgezeigt. Man entwickle einen Formalismus zur L¨ osung gekoppelter Schwingungen, die durch Lagrange-Funktionen der Form ˙ = T (q, q) ˙ − V (q) L = L(q, q)
(1.35)
beschrieben werden, in denen das Potential nur von den Koordinaten abh¨ angt. Dazu beachte man, daß die kinetische Energie ganz allgemein als 1 T = c(q, t) + bi (q, t)q˙i + aij (q, t)q˙i q˙j , aij = aji 2 i,j i geschrieben werden kann, was durch Quadrieren von (1.23) ersichtlich wird. Sind die Gleichungen zwischen qi und xj zeitunabh¨ angig, dann ist die kinetische Energie eine homogene quadratische Form 1 T = aij (q)q˙i q˙j . (1.36) 2 i,j Mit diesem Ausdruck suche man nach einer Bedingung f¨ ur den Gleichgewichtszustand, leite hieraus die Lagrange-Gleichungen f¨ ur kleine Auslenkungen aus der Gleichgewichtslage her und bestimme die zugeh¨ origen Eigenmoden. L¨ osung. Aus (1.35) und (1.36) folgen die Lagrange-Gleichungen ∂aki 1 ∂aij ∂V q˙i q˙j + aki q¨i − q˙i q˙j + =0. ∂q 2 ∂q ∂q j k k i,j i i,j Hieraus ergeben sich f¨ ur ein System im Gleichgewicht (q˙i = q¨i = 0) die Gleichgewichtsbedingungen
48
1. Mechanik
∂V =0, ∂qi q0 d.h. die potentielle Energie muß in q 0 station¨ar sein.6 Der Einfachheit halber nehmen wir an, daß gilt: q 0 = 0 und entwickeln das Potential sowie die kinetische Energie in der Weise ∂V ∂ 2 V qi + 1 qi qj V (q) ≈ V (0) + ∂qi 0 2 i,j ∂qi ∂qj 0 i =0
1 ˙ ≈ T (q, q) aij (0)q˙i q˙j . 2 i,j Das System wird demnach in der N¨ahe seiner Gleichgewichtslage durch die Lagrange-Funktion 1 1 L=T −V = Bij qi qj − V (0) , Aij q˙i q˙j − 2 i,j 2 i,j mit
∂ 2 V Aij = aij (0) , Bij = ∂qi ∂qj 0
beschrieben, woraus man folgende Lagrange-Gleichungen erh¨alt: Aki q¨i + Bki qi = 0 . i
i
Beschr¨ anken wir uns auf Eigenschwingungen, bei denen alle qj mit derselben Frequenz ω schwingen, dann lassen sich diese Gleichungen durch den Ansatz qj (t) = Qj eiωt in die zeitunabh¨angige Eigenwertgleichung (B − λA)Q = 0 , λ = ω 2
(1.37)
u uhren, welche nur dann nichttriviale L¨osungen besitzt, wenn die zu¨berf¨ geh¨ orige Koeffizientendeterminante verschwindet: det(B − λA) = 0 . Diese Gleichung bestimmt die m¨oglichen Eigenfrequenzen ω des Problems und – u ¨ber (1.37) – die zugeh¨origen Eigenvektoren Q. Fassen wir die normierten Eigenvektoren als Spalten einer (orthogonalen) Transformationsmatrix D auf, dann kann man zeigen, daß gilt:
6
Genauer gesagt: Das Potential muß in q 0 ein lokales Minimum besitzen, damit das System dort im stabilen Gleichgewicht ist.
1.3 Hamilton-Formalismus
⎛ ⎜ D BD = ⎝
λ1
0 ..
T
0
.
49
⎞ ⎟ T ⎠ , D AD = I .
λn
Das heißt D erzeugt eine Hauptachsentransformation, die zur gleichzeitigen Diagonalisierung der Matrizen A und B und somit zur Diagonalisierung der Lagrange-Funktion 1 1 L = q˙ T Aq˙ − q T Bq − V (0) 2 2 f¨ uhrt.
1.3 Hamilton-Formalismus In diesem Abschnitt besch¨ aftigen wir uns mit der Hamiltonschen Formulierung der Mechanik und erg¨ anzen somit den Newtonschen Zugang aus Abschn. 1.1 und den Lagrangeschen Zugang aus Abschn. 1.2 um ein weiteres ¨ aquivalentes Konzept zur Beschreibung mechanischer Systeme. Der HamiltonFormalismus ist insofern gegen¨ uber den anderen beiden Zug¨ angen ausgezeichnet, als daß er einen engen formalen Zusammenhang zwischen der klassischen Mechanik und der Quantenmechanik erkennen l¨ aßt. In der Tat basiert die Quantenmechanik (und auch die statistische Physik) gr¨ oßtenteils auf dem Hamiltonschen Formalismus. Wir beginnen mit der Herleitung der Hamiltonschen Bewegungsgleichungen, die im Gegensatz zu den Newtonschen und Lagrangeschen Gleichungen Differentialgleichungen 1. Ordnung sind. Im Anschluß diskutieren wir einige Erhaltungss¨ atze und f¨ uhren die Notation der Poisson-Klammern ein, durch die die formale Verwandtschaft von klassischer Mechanik und Quantenmechanik besonders deutlich wird. Desweiteren besch¨ aftigen wir uns mit kanonischen Transformationen. Dies f¨ uhrt uns auf die Hamilton-Jacobi-Gleichung, die eine spezielle kanonische Transformation definiert, bei der alle transformierten Koordinaten und Impulse erhalten sind. 1.3.1 Hamiltonsche Gleichungen Die Lagrange-Funktion L f¨ uhrt zu Bewegungsgleichungen, in denen die generalisierten Koordinaten qj sowie deren Geschwindigkeiten q˙j als Paare von Variablen auftreten. Die Hamiltonsche Theorie verwendet als gleichberechtigte Variablenpaare die generalisierten Koordinaten zusammen mit ihren generalisierten Impulsen, die wie folgt definiert sind: Definition: Generalisierter Impuls pj pj =
∂L . ∂ q˙j
(1.38)
50
1. Mechanik
Diese Definition bildet implizite Gleichungen f¨ ur die q˙j , ausgedr¨ uckt durch die Gr¨ oßen qj , pj , t: q˙j = q˙j (q1 , . . . , qn , p1 , . . . , pn , t) . Wir beschr¨ anken uns auf den Fall, daß alle Zwangsbedingungen durch s = 3N − n holonome Bedingungen gegeben sind. Um die Variablentransformation ∂L L(qi , q˙i , t) −→ H qi , ,t ∂ q˙i durchzuf¨ uhren, benutzen wir die Legendre-Transformation H = H(q1 , . . . , qn , p1 , . . . , pn , t) =
n
pi q˙i − L
i=1
und bilden unter Ber¨ ucksichtigung von (1.38) die Ableitungen ∂ q˙i ∂L ∂ q˙i ∂H = q˙j + pi − = q˙j ∂pj ∂pj ∂ q˙i ∂pj i=1 i=1 n
n
n n ∂L ∂L ∂ q˙i ∂L ∂H ∂ q˙i − − =− = −p˙j . = pi ∂q ∂q ∂ q ˙ ∂q ∂q ∂qj j j i j j i=1 i=1
Es folgt der Satz 1.21: Hamilton-Gleichungen f¨ ur s holonome Zwangsbedingungen Die Hamilton-Funktion eines N -Teilchensystems mit jeweils n generalisierten Koordinaten und Impulsen ist gegeben durch H=
n
pi q˙i − L(q1 , . . . , qn , p1 , . . . , pn , t) .
i=1
Aus ihr ergeben sich die Bewegungsgleichungen (Hamilton-Gleichungen) f¨ ur die generalisierten Koordinaten und Impulse im Falle s holonomer Zwangsbedingungen zu ∂H ∂H = q˙j , = −p˙j , j = 1, . . . , 3N − s = n . ∂pj ∂qj Weiterhin gilt −
∂L ∂H = . ∂t ∂t
Dies sind die grundlegenden Bewegungsgleichungen in der Hamiltonschen Formulierung der Mechanik. Man nennt sie auch die kanonischen Gleichungen. Sie bilden ein System von 2n gew¨ohnlichen Differentialgleichungen
1.3 Hamilton-Formalismus
51
1. Ordnung f¨ ur die n generalisierten Koordinaten und deren Impulse. F¨ ur ein System aus N Teilchen mit n = 3N − s Freiheitsgraden beschreiben die kanonischen Gleichungen die Bewegung des Systems in einem abstrakten 2n-dimensionalen Raum, dem Phasenraum, der von den generalisierten Koordinaten und Impulsen aufgespannt wird. Die folgende Tabelle stellt die Resultate der Lagrangeschen Theorie denen des Hamilton-Formalismus geuber: gen¨ Formulierung
Variablen
Funktion
Gleichungen
Lagrangesche
(qj , q˙j )
L=T −V
Hamiltonsche
(qj , pj )
H=
∂L d ∂L − =0 dt ∂ q˙j ∂qj ∂H ∂H = q˙j , = −p˙ j ∂pj ∂qj
pi q˙i − L
i
1.3.2 Erhaltungss¨ atze Aus den Hamilton-Gleichungen ergeben sich folgende Erhaltungss¨ atze: Satz 1.22: Impulserhaltung H¨ angt H nicht explizit von einer generalisierten Koordinate qj ab, so ist der zugeh¨ orige Impuls pj eine zeitlich erhaltene Gr¨ oße: ∂H = 0 =⇒ pj = const . ∂qj Man nennt solch eine Koordinate zyklisch. Differenziert man die Hamilton-Funktion nach der Zeit, n dH ∂H ∂H ∂H = , q˙j + p˙j + dt ∂q ∂p ∂t j j j=1 dann ergibt sich unter Verwendung der Hamilton-Gleichungen dH ∂H = . dt ∂t Hieraus folgt der Satz 1.23: Erhaltung der Hamilton-Funktion H¨ angt H (bzw. L) nicht explizit von t ab, dann ist H entlang von L¨ osungen der Hamilton-Gleichungen (bzw. der zugeh¨ origen Lagrange-Gleichungen) konstant:
52
1. Mechanik
∂H = 0 =⇒ H = const . ∂t Energieerhaltung und Interpretation der Hamilton-Funktion. Die Erhaltung der Hamilton-Funktion l¨aßt sich f¨ ur den Fall skleronomer und holonomer Zwangsbedingungen, xi = xi (q1 , . . . , qn ), mit konservativen ¨außeren Kr¨ aften (∂V /∂ q˙j = 0) als Energieerhaltung verstehen. In diesem Fall gilt n¨ amlich ∂L ∂T pj = = ∂ q˙j ∂ q˙j und n N N n ∂T mi 2 mi ∂xi ∂xi T = q˙k q˙l =⇒ q˙j = 2T . x˙ i = ∂ q˙j 2 ∂qk ∂ql 2 i=1 j=1 i=1 k,l=1
Damit folgt n n ∂T ∂L H= q˙j − L = q˙j − L = 2T − (T − V ) = T + V = E . ∂ q ˙ ∂ q˙j j j=1 j=1 Satz 1.24: Energieerhaltung F¨ ur holonome und nicht explizit zeitabh¨angige Systeme ist die HamiltonFunktion identisch mit der Gesamtenergie und eine Erhaltungsgr¨oße: H(q, p) = T + V = E = const . Vollst¨ andige mechanische Information. In der Newtonschen Mechanik haben wir festgestellt, daß alle dynamischen Variablen eines Systems Funktionen des Orts- und Impulsvektors sind. In der Lagrangeschen Theorie gingen wir u ¨ber zu dem n-dimensionalen Raum der generalisierten Koordinaten (Konfigurationsraum). Im Zusammenhang mit der Hamiltonschen Theorie sehen wir nun, daß die Bewegung des Systems ebenso durch die kanonisch konjugierten Variablen q und p beschrieben werden kann, also durch Punkte im Phasenraum bzw. in dem durch die Zeit t erweiterten Phasenraum. Der Zustand eines mechanischen Systems ist dann durch Angabe der konjugierten Variablen zu einem bestimmten Zeitpunkt und durch eine zeitliche Evolutionsvorschrift f¨ ur das System eindeutig bestimmt. Da sich der Zustand des Systems zu einem sp¨ateren Zeitpunkt eindeutig aus einem fr¨ uheren Zustand ergibt, muß der Evolutionsprozeß des Systems durch eine Differentialgleichung 1. Ordnung in der Zeit beschrieben werden. Die Hamiltonschen Gleichungen sind gerade von dieser Form. Dagegen sind die Lagrange-Gleichungen Differentialgleichungen 2. Ordnung in der Zeit, so daß zur eindeutigen Spezifikation eines Zustandes f¨ ur jede generalisierte Koordinate jeweils zwei Anfangswerte, z.B. qj (t0 ) und q˙j (t0 ), notwendig sind. Der Vorteil der kanonischen
1.3 Hamilton-Formalismus
53
Beschreibung besteht also darin, daß sich der Zustand des Systems eindeutig bestimmen l¨ aßt, sobald die kanonischen Variablen zu einem Zeitpunkt bekannt sind. Fassen wir die kanonischen Variablen zu einem Punkt π im Phasenraum zusammen, dann wird die Zustandsentwicklung eines mechanischen Systems grunds¨ atzlich durch eine geeignete Funktion F [π(t), t] beschrieben, f¨ ur die gilt: π(t) ˙ = F [π(t), t]. 1.3.3 Poisson-Klammer Da sich jede mechanische Gr¨ oße F als Funktion der konjugierten Variablen und der Zeit schreiben l¨ aßt, k¨ onnen wir folgende Bewegungsgleichung aufstellen: ∂F ∂F ∂F dF q˙i + p˙i + F = F (q, p, t) =⇒ = dt ∂q ∂p ∂t i i i ∂F ∂H ∂F ∂F ∂H = + − . (1.39) ∂q ∂p ∂p ∂q ∂t i i i i i Diese Formel l¨ aßt sich mit Hilfe der folgenden Definition etwas einfacher schreiben: Definition: Poisson-Klammer F¨ ur mindestens einmal differenzierbare Funktionen F und G in den Variablen x und y definieren wir die folgende Abbildung, genannt PoissonKlammer: ∂F ∂G ∂F ∂G {F, G}x,y = . (1.40) − ∂xi ∂yi ∂yi ∂xi i Sie besitzt folgende Eigenschaften: • Antikommutativit¨ at: {F, G} = − {G, F }. • Linearit¨ at und Distributivit¨ at: {αF1 + βF2 , G} = α {F1 , G} + β {F2 , G} . • Identit¨ aten: {F, G1 G2 } = {F, G1 } G2 + G1 {F, G2 } {F, {G, J}} + {G, {J, F }} + {J, {F, G}} = 0 Mit dieser Schreibweise geht (1.39) u ¨ber in dF ∂F = {F, H}q,p + , dt ∂t und es folgt der
(Jacobi-Identit¨ at) .
54
1. Mechanik
Satz 1.25: Bewegungsgleichung, Erhaltungsgr¨ oßen und Poisson-Theorem Die Bewegungsgleichung f¨ ur eine mechanische Gr¨oße F (q, p, t) lautet dF ∂F = {F, H}q,p + . dt ∂t Ist F eine Erhaltungsgr¨oße, dF/dt = 0, und zudem nicht explizit zeitabh¨ angig, so gilt {F, H}q,p = 0 . Der Umkehrschluß gilt ebenso. Sind weiterhin F und G zwei solche Erhaltungsgr¨ oßen, dann ist auch {F, G}q,p eine Erhaltungsgr¨oße. Dies ist das Poisson-Theorem. Es folgt aus der Jacobi-Identit¨at. Beachten wir, daß die qi und pi unabh¨angige Variablen sind, ∂qi ∂pi ∂qi ∂pi =0, = δij , = δij , = ∂pj ∂qj ∂qj ∂pj dann k¨ onnen wir (1.40) auch auf sie anwenden, und es folgen die kanonischen Gleichungen in der neuen Schreibweise: q˙i = {qi , H}q,p , p˙i = {pi , H}q,p . Ebenso findet man f¨ ur die Poisson-Klammern der Impulse und Koordinaten {qi , pk }q,p = δik , {qi , qk }q,p = {pi , pk }q,p = 0 .
(1.41)
Hamilton-Theorie und Quantenmechanik. Die algebraischen Eigenschaften der Poisson-Klammer stellen die Grundlage f¨ ur deren Verwendung ¨ bzw. Ubertragung in die Quantenmechanik dar. Dort werden physikalische Gr¨ oßen durch lineare hermitesche Operatoren beschrieben, und die PoissonKlammer wird durch den Kommutator ersetzt, der alle algebraischen Eigenschaften der Poisson-Klammer besitzt: {F, G} −→ −i¯ h[F , G] = −i¯ h(F G − GF ) . Man kann in der Tat die Mechanik und Quantenmechanik als zwei verschiedene Realisierungen der algebraischen Struktur auffassen, welche die PoissonKlammer definieren. Ein Beispiel f¨ ur dieses Korrespondenzprinzip ist die in der Quantenmechanik geltende Heisenbergsche Bewegungsgleichung dF ∂F = [F , H] + , dt ∂t die sich aus der in Satz 1.25 stehenden Bewegungsgleichung durch die obige Ersetzung ergibt. i¯ h
1.3 Hamilton-Formalismus
55
1.3.4 Kanonische Transformationen Nachdem wir den formalen Aufbau der Hamiltonschen Theorie erarbeitet haben, wollen wir uns nun der Frage widmen, ob es Transformationen gibt, welche die kanonischen Gleichungen invariant lassen, und ob es m¨ oglich ist, einen speziellen Satz von Transformationen zu finden, die die Hamiltonschen Gleichungen besonders vereinfachen. Man denke etwa an eine Transformation, welche die Hamilton-Funktion in eine Funktion transformiert, die nur noch von Impulsen abh¨ angt (n¨ achster Unterabschnitt). In diesem Fall w¨ aren alle Koordinaten zyklisch, d.h. s¨ amtliche Impulse w¨ aren in dieser Darstellung Invarianten der Bewegung. Wir definieren zun¨ achst: Definition: Kanonische Transformation Eine Koordinatentransformation qi −→ Qi = Qi (q, p, t) , pi −→ Pi = Pi (q, p, t) heißt kanonisch, wenn die Form der zugeh¨ origen kanonischen Gleichungen erhalten bleibt: ∂H ∂H H = H(q, p, t) : q˙i = , p˙i = − ∂pi ∂qi ∂H ∂H H = H (Q, P , t) : Q˙ i = , P˙i = − . ∂Pi ∂Qi Notwendige Bedingung f¨ ur das Vorliegen einer kanonischen Transformation ist, daß f¨ ur die alte und neue Hamilton-Funktion das Hamilton-Prinzip gilt, d.h. t2 t2 ˙ δ pi q˙i − H(q, p, t) dt = δ Pi Qi − H (Q, P , t) dt = 0 t1
bzw. δ
i
t2 t1
t1
i
pi q˙i − Pi Q˙ i + (H − H) dt = 0 .
i
Sehen wir von der trivialen M¨ oglichkeit ab, daß die Transformation nur in der Multiplikation von H und pi mit einer Konstanten besteht, dann kann der Unterschied zwischen den Integranden in der alten und neuen Wirkung nur eine totale Zeitableitung dF/dt sein. Wir k¨ onnen daher schreiben: dF = (pi dqi − Pi dQi ) + (H − H)dt . (1.42) i
Man nennt die Funktion F die Erzeugende der kanonischen Transformation. Sie ist eine Funktion der 4n + 1 Variablen q, p, Q, P und t, von denen
56
1. Mechanik
allerdings 2n u ¨ber obige Transformationsgleichungen voneinander abh¨angig sind und zugunsten von 2n + 1 unabh¨angigen Variablen eliminiert werden k¨ onnen. F kann deshalb eine der folgenden Abh¨angigkeiten annehmen: F1 (q, Q, t) , F2 (q, P , t) , F3 (Q, p, t) , F4 (p, P , t) .
(1.43)
Offensichtlich ist (1.42) gerade das totale Differential von F1 = F1 (q, Q, t) = (pi qi − Pi Qi ) + H − H , i
woraus sofort folgt: H = H +
∂F1 ∂F1 ∂F1 , pi = , Pi = − . ∂t ∂qi ∂Qi
Mit Hilfe der letzten beiden Beziehungen lassen sich die qi und pi als Funktionen der neuen Variablen ausdr¨ ucken: qi = qi (Q, P , t), pi = pi (Q, P , t). Diese Ausdr¨ ucke, in die rechte Seite der ersten Gleichung eingesetzt, ergeben dann die transformierte Hamilton-Funktion in den neuen Koordinaten. Alle weiteren, in (1.43) angegebenen Abh¨angigkeiten ergeben sich durch Legendre-Transformationen von F1 . Man erh¨alt f¨ ur F2 die Relationen Qi Pi = (pi dqi + Qi dPi ) + (H − H)dt d F1 + i
i
=⇒ F2 = F2 (q, P , t) = F1 +
Pi Qi
i
=⇒ H = H + und f¨ ur F3 d F1 −
∂F2 ∂F2 ∂F2 , pi = , Qi = ∂t ∂qi ∂Pi
q i pi
=−
i
(1.44)
(qi dpi + Pi dQi ) + (H − H)dt
i
=⇒ F3 = F3 (Q, p, t) = F1 −
pi q i
i
=⇒ H = H +
∂F3 ∂F3 ∂F3 , Pi = − , qi = − ∂t ∂pi ∂Qi
und schließlich f¨ u r F4 d F1 − q i pi + Pi Qi = − (qi dpi − Qi dPi ) + (H − H)dt i
i
=⇒ F4 = F4 (p, P , t) = F1 −
i
i
pi q i +
i
Pi Qi
1.3 Hamilton-Formalismus
=⇒ H = H +
57
∂F4 ∂F4 ∂F4 , qi = − , Qi = . ∂pi ∂Pi ∂t
Wir sehen also, daß es vier verschiedene Typen von kanonischen Transformationen gibt, deren Erzeugende jeweils von anderen 2n + 1 unabh¨ angigen Variablen abh¨ angen. In der Praxis ist es oftmals nicht so einfach, die richtige Erzeugende zu finden, die zu einer Vereinfachung des Problems f¨ uhrt. Dies gelingt meistens nur bei solchen Problemen, die auch auf anderem Wege bequem zu l¨ osen sind. Der eigentliche Vorteil der Charakterisierung von kanonischen Transformationen durch erzeugende Funktionen besteht darin, daß man hierdurch ein tieferen Verst¨ andnis der Struktur der Hamiltonschen Mechanik an sich erlangt. Infinitesimale kanonische Transformationen. Als eine spezielle kanonische Transformation betrachten wir die Erzeugende F2 = F2 (q, P , ) = qi Pi + f (q, P ) + O( 2 ) , kontinuierlich . i
Sie setzt sich zusammen aus der identischen Abbildung und einer geeigneten Funktion f (q, P ), durch welche die infinitesimale Transformation bestimmt ist. Nach (1.44) gilt Qi =
∂F2 ∂f ∂F2 ∂f = qi + + O( 2 ) , pi = = Pi + + O( 2 ) . ∂Pi ∂Pi ∂qi ∂qi
Da die Ausdr¨ ucke ∂f /∂Pi und ∂f /∂qi von 1. Ordnung in sind, k¨ onnen wir dort die Variable Pi durch ihre nullte N¨ aherung pi ersetzen, so daß δqi = Qi − qi =
∂f (q, p) ∂f (q, p) , δpi = Pi − pi = − . ∂pi ∂qi
Dies k¨ onnen wir auch schreiben als δqi = {qi , f }q,p , δpi = {pi , f }q,p . Setzen wir nun speziell = dt und f = H, so daß F2 (q, P , δt) = qi Pi + H(q, p)dt , i
dann erhalten wir gerade die Hamiltonschen Gleichungen: δqi = dt {qi , H}q,p = q˙i dt = dqi , δpi = dt {pi , H}q,p = p˙i dt = dpi . Diese Gleichungen bedeuten, daß die durch H erzeugte Transformation die Koordinaten und Impulse qi , pi zur Zeit t auf diejenigen neuen Werte bringt, die sie zur Zeit t + dt besitzen. Wir finden also, daß die Hamilton-Funktion die Erzeugende der infinitesimalen kanonischen Transformation ist, die der tats¨ achlichen Bewegungsbahn im Intervall dt entspricht.
58
1. Mechanik
Invarianz der Poisson-Klammer unter kanonischen Transformationen. Wir sind nun in der Lage, die fundamentale Bedeutung der PoissonKlammer herauszuarbeiten, n¨amlich ihre Invarianz unter kanonischen Transformationen. Dazu zeigen wir zun¨achst die Invarianz der Relationen (1.41) zwischen den kanonischen Variablen. Wir f¨ uhren den Beweis nur f¨ ur zeitunabh¨ angige Transformationen. Es gilt ∂Pi ∂Pi ∂H ∂Pi ∂Pi ∂H ˙ Pi = q˙j + p˙j = − ∂qj ∂pj ∂qj ∂pj ∂pj ∂qj j j ∂Pi ∂Pk ∂Pi ∂Pk ∂H ∂Pi ∂Qk ∂Pi ∂Qk ∂H = − + − ∂qj ∂pj ∂qj ∂qj ∂Pk ∂qj ∂pj ∂pj ∂qj ∂Qk j,k
∂H ∂H {Pi , Qk }q,p . {Pi , Pk }q,p + = ∂Pk ∂Qk k
k
Hieraus folgt {Pi , Pk }q,p = 0 , {Qi , Pk }q,p = δik . Analog verl¨ auft der Beweis f¨ ur {Qi , Qk }q,p = 0 . Mit Hilfe der letzten beiden Beziehungen k¨onnen wir nun schreiben: ∂F ∂G ∂F ∂G {F, G}Q,P = − ∂Qi ∂Pi ∂Pi ∂Qi i ∂F ∂G ∂qj ∂qk ∂qj ∂qk = − ∂qj ∂qk ∂Qi ∂Pi ∂Pi ∂Qi i,j,k ∂F ∂G ∂qj ∂pk ∂qj ∂pk + − ∂Pi ∂Qi ∂qj ∂pk ∂Qi ∂Pi ∂F ∂G ∂pj ∂qk ∂pj ∂qk + − ∂pj ∂qk ∂Qi ∂Pi ∂Pi ∂Qi ∂F ∂G ∂pj ∂pk ∂pj ∂pk + − ∂pj ∂pk ∂Qi ∂Pi ∂Pi ∂Qi ∂F ∂G ∂F ∂G = {F, G}q,p , = − ∂q ∂p ∂p j j j ∂qj j womit die Invarianz der Poisson-Klammer unter kanonischen Transformationen bewiesen ist. Der Beweis f¨ ur zeitabh¨angige Transformationen l¨aßt sich auf ¨ ahnliche Weise f¨ uhren. Satz 1.26: Kanonische Transformation und Poisson-Klammer Eine Transformation ˙ t) , pi −→ Pi = Qi (q, q, ˙ t) qi −→ Qi = Qi (q, q,
1.3 Hamilton-Formalismus
59
der kanonischen Variablen (q, p) ist genau dann kanonisch, falls gilt: {Pi , Pj }q,p = {Qi , Qj }q,p = 0 , {Pi , Qj }q,p = δij . Die Poisson-Klammer ist invariant unter kanonischen Transformationen {F, G}q,p = {F, G}Q,P . Sie wird deshalb meistens ohne Bezug auf ein spezielles Paar von kanonischen Variablen geschrieben.
1.3.5 Hamilton-Jacobi-Gleichung Wir betrachten nun eine kanonische Transformation mit einer Erzeugenden vom Typ F2 (q, P , t), welche die Eigenschaft haben soll, daß alle transformierten Koordinaten und Impulse konstant sind. Man kann dies am einfachsten erreichen, indem man fordert, daß die transformierte Hamilton-Funktion identisch verschwindet: ∂F2 ∂H ∂H = 0 =⇒ Q˙ i = H = H + = 0 , P˙i = − =0. (1.45) ∂t ∂Pi ∂Qi Leiten wir F2 nach der Zeit ab und ber¨ ucksichtigen, daß gilt (siehe (1.44)): Qi =
∂F2 ∂F2 , pi = , ∂qi ∂Pi
dann k¨onnen wir schreiben: ∂F2 ∂F2 ˙ ∂F2 dF2 = = pi q˙i + Qi P˙i − H q˙i + Pi + dt ∂qi ∂Pi ∂t i i pi q˙i − H = L . = i
Hieraus folgt ˙ t)dt + const . F2 = L(q, q, Das heißt die Erzeugende der kanonischen Transformation, welche die Hamilton-Funktion identisch zum Verschwinden bringt, ist l¨ angs der Bewegungsbahn bis auf eine Konstante identisch mit dem Wirkungsfunktional S. Dies kann allerdings nicht zur Ermittlung der L¨ osung benutzt werden, da die generalisierten Koordinaten und Geschwindigkeiten ja gerade die Unbekannten des Problems darstellen. Schreiben wir in (1.45) also statt F2 nun S, so ergibt dies die Hamilton-Jacobi-Differentialgleichung:
60
1. Mechanik
Satz 1.27: Hamilton-Jacobi-Gleichung Die Hamilton-Jacobi-Gleichung ∂S ∂S + H qi , ,t = 0 , ∂t ∂qi S = S(qi , βi , t) , βi = Pi = const , i = 1, . . . , n ist eine partielle Differentialgleichung 1. Ordnung in den n + 1 Variablen q und t. Sie ist ¨ aquivalent zum System der 2n gew¨ohnlichen Hamiltonschen Differentialgleichungen 1. Ordnung. S ist diejenige erzeugende Funktion, welche die Hamilton-Funktion H auf rein konstante Koordinaten Q und Impulse P transformiert. Hat man aus dieser Gleichung S bestimmt, dann ergeben sich die urspr¨ unglichen Koordinaten und Impulse aus den rein algebraischen Gleichungen Qi =
∂S ∂S := αi , pi = =⇒ qi = qi (α, β, t) , pi = pi (α, β, t) . ∂βi ∂qi
Die 2n Integrationskonstanten α = Q = const , β = P = const sind hierbei aus den Anfangsbedingungen q(t0 ), p(t0 ) zu bestimmen. L¨ osung mittels Trennung der Variablen. Besitzt die Hamilton-Funktion keine explizite Zeitabh¨angigkeit, dann gilt nach Satz 1.23: H = γ = const. In diesem Fall reduziert sich die Hamilton-Jacobi-Gleichung durch den Ansatz S(q, β, t) = S0 (q, β) − γ(β)t auf die Gleichung ∂S0 H qi , =γ , ∂qi wobei S0 verk¨ urzte Wirkungsfunktion genannt wird. F¨ ur skleronome Systeme ist γ gerade die Gesamtenergie des Systems. Nehmen wir weiter an, daß die Koordinate q1 nur in der Kombination ∂S0 φ1 q1 , ∂q1 eingeht, also von allen anderen Koordinaten entkoppelt, dann haben wir ∂S0 ∂S0 H φ1 q1 , , qi=1 , =γ , ∂q1 ∂qi=1 und der Separationsansatz S0 (q, β, t) = S1 (q1 , β1 ) + S (qi=1 , αi=1 ) f¨ uhrt zu
1.3 Hamilton-Formalismus
61
∂S1 ∂S , qi=1 , =γ . H φ1 q1 , ∂q1 ∂qi=1 Angenommen wir haben eine L¨ osung f¨ ur S0 gefunden. Dann muß die letzte ur alle Werte von q1 gelten. Da diese KoGleichung nach Einsetzen von S0 f¨ ordinate aber nur in die Funktion φ1 eingeht, muß φ1 eine Konstante sein. Wir erhalten also aus der urspr¨ unglichen partiellen Differentialgleichung mit n unabh¨ angigen Variablen eine gew¨ ohnliche Differentialgleichung in q1 , ∂S1 φ1 q1 , = β1 , ∂q1 und eine partielle Differentialgleichung mit n − 1 unabh¨ angigen Variablen: ∂S H φ1 = β1 , qi=1 , =γ . ∂qq=1 L¨aßt sich dieses Verfahren sukzessive auf alle Koordinaten anwenden, dann ist die Hamilton-Jacobi-Gleichung auf n gew¨ ohnliche Differentialgleichungen reduziert, ∂Si φi qi , = αi , H(φi = βi ) = γ , ∂qi und die allgemeine L¨ osung ist die Summe der Si . Schließlich betrachten wir obige Methode noch f¨ ur den Fall, daß die Koordinate q1 zyklisch ist. Dann ist die Funktion φ1 durch ∂S1 /∂q1 gegeben, und es folgt S1 (q1 , β1 ) = β1 q1 . Die Konstante ist hierbei gleich dem Impuls: p1 = β1 . Hamilton-Jacobi-Gleichung und Quantenmechanik. Betrachtet man die eindimensionale Hamilton-Funktion p2 + V (q) = E , H(q, p) = 2m dann folgt die Hamilton-Jacobi-Gleichung 2 1 ∂S0 + V (q) = E . 2m ∂q Nun werden wir in Kapitel 3 sehen, daß f¨ ur den zugeh¨ origen quantenmechanischen Hamilton-Operator die Schr¨ odinger-Gleichung −
¯ 2 ∂2ψ h + V (q)ψ = Eψ 2m ∂q 2
gilt, mit der Wellenfunktion ψ. Setzen wir hier die zeitunabh¨ angige Wellenfunktion ψ = eiS0 /¯h ein, dann folgt 2 ∂S0 1 i¯ h ∂S02 − + V (q) = E . 2m ∂q 2m ∂q 2
62
1. Mechanik
Offensichtlich resultiert hieraus im Limes h ¯ → 0 wieder obige HamiltonJacobi-Gleichung. F¨ ur eine ausf¨ uhrlichere und sehr lesbare Darstellung des Zusammenhangs zwischen der Hamilton-Jacobi-Theorie und der Quantenmechanik verweisen wir auf [3]. Zusammenfassung • Aus den Lagrange-Gleichungen ergeben sich durch eine LegendreTransformation die Hamilton-Gleichungen. Sie bilden ein System von gekoppelten gew¨ohnlichen Differentialgleichungen 1. Ordnung in den generalisierten Koordinaten und den generalisierten Impulsen. • Die zeitliche Entwicklung eines mechanischen Systems ist im HamiltonFormalismus durch Angabe der generalisierten Koordinaten und Impulse zu einem Zeitpunkt sowie der Hamilton-Funktion eindeutig bestimmt. • Die Poisson-Klammer erlaubt ein tieferes algebraisches Verst¨andnis der Hamiltonschen Mechanik. Sie ist invariant unter kanonischen Transformationen. • Die Wirkungsfunktion ist die Erzeugende der Bewegung. • Die Forderung nach einer Hamilton-Funktion mit rein zyklischen Koordinaten f¨ uhrt auf die Hamilton-Jacobi-Gleichung, eine partielle Differentialgleichung 1. Ordnung.
Anwendungen 8. Unabh¨ angigkeit der Erzeugenden von Randbedingungen. Man zeige, daß die Variation der Wirkung t2 dF1 ˙ S = dt Pi Qi − H (Q, P , t) + dt i t1
t2 =
dt t1
Pi Q˙ i − H (Q, P , t)
t
+ F1 (q, Q, t)|t21
i
die neue Hamilton-Funktion eindeutig festlegt, unabh¨angig von den Randbedingungen, und daß die so erzeugte Transformation kanonisch ist. L¨ osung. Beachten wir, daß die Anfangs- und Endpunkte [t1 , q(t1 )], [t2 , q(t2 )] fest sind, dann erh¨alt man f¨ ur die Variation der Wirkung den Ausdruck t2 t2 ∂F1 ∂H ∂H ˙ ˙ δS = dt Qi δPi + Pi δ Qi − δQi − δPi + δQi . ∂Qi ∂Pi ∂Qi t1 i i t1
Anwendungen
63
Partielle Integration der δ Q˙ i -Terme liefert t2 ∂H ∂H ˙ ˙ δS = δQi Qi − δPi − Pi + dt ∂Pi ∂Qi i i t1
+
i
∂F1 Pi + ∂Qi
t2 δQi . t1
Offenbar verschwindet der letzte Term, und zwar unabh¨ angig von δQi an den Endpunkten t1,2 , weil die Klammer bereits Null ist. Es folgen deshalb die Hamiltonschen Bewegungsgleichungen in den neuen Variablen Qj und Pj , da diese (und somit nat¨ urlich auch ihre Variationen) unabh¨ angig voneinander sind. 9. Poisson-Klammern des Drehimpulses. Man bestimme die PoissonKlammern des Impulses und Drehimpulses eines einzelnen Massenpunktes in kartesischen Koordinaten sowie die Poisson-Klammern der Komponenten des Drehimpulses untereinander. L¨ osung. Nach (1.40) gilt f¨ ur eine beliebige Funktion G(q, p, t) kanonisch konjugierter Variablen qj und pj : {G, pj } = ∂G/∂qj . Diese Relation benutzen wir hier wie folgt: ∂ (ypz − zpy ) = 0 ∂x ∂ {lx , py } = (ypz − zpy ) = pz ∂y ∂ (ypz − zpy ) = −py . {lx , pz } = ∂z Insgesamt erh¨ alt man {lx , px } =
{li , pj } = ijk pk . F¨ ur die Komponenten des Drehimpulses ergibt sich {lx , lx } = {ly , ly } = {lz , lz } = 0 {lx , ly } = {ypz − zpy , zpx − xpz } = {ypz , zpx } − {zpy , zpx } − {ypz , xpz } + {zpy , xpz } = {ypz , zpx } + {zpy , xpz } = y {pz , z} px + x {z, pz } py = −ypx + xpy = lz . Die Berechnung der verbleibenden Poisson-Klammern f¨ uhrt auf {li , lj } = ijk lk . Hieraus folgt, daß niemals zwei Drehimpulskomponenten gleichzeitig als kanonische Impulse auftreten k¨ onnen, da sonst nach Satz 1.26 ihre PoissonKlammer verschwinden m¨ ußte. Es l¨ aßt sich jedoch leicht zeigen, daß gilt:
64
1. Mechanik
'
( l2 , li = 0 ,
so daß der Betrag des Drehimpulses und eine Drehimpulskomponente gleichzeitig kanonische Impulse sein k¨onnen. Dieses Resultat werden wir in der Quantenmechanik wiederfinden. 10. Hamilton-Jacobi-Gleichung. Man l¨ose mit Hilfe der Hamilton-JacobiGleichung folgende Systeme: a) Freies Teilchen, b) harmonischer Oszillator. L¨ osung. Zu a) In diesem einfachen Fall folgt aus der Hamilton-Funktion 1 2 H= p1 + p22 + p23 2m und der Separation S(q, β, t) = S0 (q, β) − Et die Hamilton-Jacobi-Gleichung
2 2 2 1 ∂S0 ∂S0 ∂S0 =E . + + ∂q1 ∂q2 ∂q3 2m Alle drei Koordinaten sind zyklisch, so daß sich diese Gleichung vollst¨andig separieren l¨ aßt. Man erh¨alt als L¨osung 1 2 S0 (q, β) = βi qi , βi = pi , β =E . 2m i i i Zu b) Betrachten wir zun¨achst die allgemeine eindimensionale HamiltonFunktion p2 + V (q) , 2m dann erhalten wir mit der Separation H(q, p) =
S(q, β, t) = S0 (q, β) − βt , β = E die Hamilton-Jacobi-Gleichung 2 ∂S0 + 2mV (q) = 2mβ , ∂q mit der L¨ osung q S0 (q, β) = q0
dq
2m[β − V (q )] .
1.4 Bewegung starrer K¨ orper
65
Weiterhin haben wir q m ∂S −t α = = dq ∂β 2m[β − V (q )] q0
∂S p = = 2m[β − V (q)] . ∂q F¨ ur den speziellen Fall des harmonischen Oszillators, V (q) = kq 2 /2, findet man aus der ersten Beziehung ohne M¨ uhe als L¨ osung des Problems
2β k q(t) = sin (t − α ) , k m mit den u ¨ber Anfangsbedingungen zu bestimmenden Integrationskonstanten α und β. Die Erweiterung auf drei Dimensionen, 1 2 1 H(q, p) = p + ki qi2 , 2m i i 2 i f¨ uhrt mit S(q, β, t) = S(q, β) − E(β)t auf die Hamilton-Jacobi-Gleichung ∂S0 2 + mki qi2 = 2mE(β) . ∂q i i i Sie l¨ aßt sich durch den Ansatz S0 (q, β) = S0,i (qi , βi ) i
vollst¨ andig in die drei eindimensionalen Gleichungen 2 ∂S0,i βi = E + mki qi2 = 2mβi , ∂qi i separieren, welche soeben gel¨ ost wurden.
1.4 Bewegung starrer Ko ¨rper Die bisherigen Betrachtungen bezogen sich ausschließlich auf einzelne Massenpunkte bzw. auf K¨ orper, deren r¨ aumliche Ausdehnung im Hinblick auf die zu untersuchende Physik vernachl¨ assigt werden konnte. In diesem Abschnitt wenden wir uns den physikalischen Auswirkungen zu, die ein K¨ orper aufgrund seiner r¨ aumlichen Struktur erf¨ ahrt. Die allgemeine Bewegung eines N -Teilchensystems (K¨ orper) kann beschrieben werden durch die Bewegung eines beliebigen Punktes q (Drehpunkt) und einer Bewegung aller Teilchen um diesen Punkt. Je nach Art dieser Bewegung unterscheidet man zwei Klassen von K¨ orpern, n¨ amlich
66
1. Mechanik
• laminare K¨ orper, die ihre r¨aumliche Geometrie mit der Zeit ¨andern (z.B. Fl¨ ussigkeiten, Gase, Galaxien), und • starre K¨ orper, deren Teilchenpositionen xi die Bedingung |xi (t) − xj (t)| = const ∀ i, j, t erf¨ ullen (z.B. Stein, Haus). Hierbei bleibt die r¨aumliche Gestalt f¨ ur alle Zeiten erhalten. Wir beschr¨ anken uns in diesem Abschnitt auf starre K¨orper. Nach einer allgemeinen Diskussion der Dynamik starrer K¨orper richten wir unsere Aufmerksamkeit auf die reine Rotationsbewegung um einen festen Punkt und zeigen, wie sich die zugeh¨origen dynamischen Gr¨oßen in eleganter Weise durch den Tr¨ agheitstensor des K¨orpers ausdr¨ ucken lassen. Desweiteren leiten wir mit Hilfe der Eulerschen Winkel die Lagrange-Gleichungen f¨ ur die allgemeine Dynamik starrer K¨orper her. 1.4.1 Allgemeine Bewegung starrer K¨ orper F¨ ur die folgende Diskussion ben¨otigen wir zwei Koordinatensysteme (siehe Abb. 1.8), die wir bereits in Unterabschn. 1.1.4 benutzt haben.
ω(t) xi (t)
zi
q(t)
raumfestes System K
k¨ orperfestes System K
Abb. 1.8. Zur Definition von raum- und k¨ orperfestem System
• Raumfestes System: K : {e1 , e2 , e3 }. Dieses System setzen wir als Inertialsystem voraus, bez¨ uglich dessen ein starrer K¨orper eine beschleunigte Bewegung ausf¨ uhrt. Von ihm aus betrachtet lauten die Teilchenpositionen xi . • K¨ orperfestes System: K : {e1 , e2 , e3 }. Dieses beschleunigte System mit Ursprung im Drehpunkt q ist fest mit dem betrachteten K¨orper verbunden; in ihm befindet sich der K¨orper in Ruhe. Die zugeh¨origen zeitunabh¨angigen Teilchenvektoren bezeichnen wir mit z i . Sie sind mit den xi u ¨ber
1.4 Bewegung starrer K¨ orper
67
xi (t) = q(t) + z i verbunden. So wie in Unterabschn. 1.1.4 wollen wir auch hier zur Vermeidung von Mißverst¨andnissen die Schreibweise Dx = ei x˙ i , D x = ei x˙ i i
i
verwenden. Unter Beachtung von D z i = 0 und des Satzes 1.8 berechnen wir nun die kinematischen Gr¨ oßen Gesamtimpuls, Gesamtdrehimpuls, Gesamtdrehmoment und gesamte kinetische Energie des K¨ orpers, wobei 1 zS = mi z i , M = mi M i i den K¨ orperschwerpunkt im k¨ orperfesten System bezeichnet. Gesamtimpuls p: p= mi x˙ i = M q˙ + M z˙ S . i
Gesamtdrehimpuls l: l = mi xi × Dxi i
=
mi (q + z i ) × (Dq + Dz i )
i
= M q × Dq + M z S × Dq + M q × (ω × z S ) +
Gesamtdrehmoment N : N = mi x i × D 2 x i i
=
mi (q + z i ) × D2 q + D2 z i
i
= M q × D2 q + M z S × D2 q + M q × D2 z S + mi z i × [(D ω) × z i + ω × (ω × z i )] .
i
N rot
i
mi z i × (ω × z i ) .
lrot
68
1. Mechanik
Gesamte kinetische Energie T : 1 T = mi (Dxi )2 2 i 1 = mi (Dq)2 + 2(Dq)(Dz i ) + (Dz i )2 2 i M 1 (Dq)2 + M (Dq)(ω × z S ) + = mi (ω × z i )2 . 2 2 i
(1.46)
Trot
In den meisten praxisrelevanten Problemstellungen f¨allt entweder der Drehpunkt mit dem Schwerpunkt des K¨orpers zusammen (z S = 0) oder der Drehpunkt ist fixiert (z.B. Pendel, Kreisel), so daß der Ursprung des raumfesten Systems K in den Drehpunkt verlegt werden kann (q = 0). Im ersten Fall lassen sich f¨ ur starre K¨orper p, l, N und T jeweils aufspalten in einen reinen Drehpunktsanteil und einen reinen Rotationsanteil um den Drehpunkt (ohne Mischterme), w¨ ahrend im zweiten Fall p, l, N und T mit ihren Rotationsanteilen identisch sind. 1.4.2 Rotation des starren K¨ orpers um einen Punkt Im folgenden konzentrieren wir uns auf die reine Rotationsbewegung des starren K¨ orpers um einen beliebigen fixierten Drehpunkt und verlegen unser raumfestes System in diesen Punkt (q = 0). Unser Ziel ist, die o.a. Ausdr¨ ucke lrot , N rot , und T rot in eine bequemere Form zu bringen. Hierzu bietet es sich an, den sog. Tr¨ agheitstensor Θ im k¨orperfesten System einzuf¨ uhren, dessen Namensgebung und Bedeutung gleich verst¨andlich wird: Definition: Tr¨ agheitstensor, Tr¨ agheitsmomente Der k¨ orperfeste Tr¨agheitstensor eines starren K¨orpers ist definiert durch die symmetrische 3×3-Matrix 2 Θab = mi z i δab − zia zib , Θab = d3 zρ(z) z 2 δab − za zb , i
wobei die zweite Gleichung im Falle einer kontinuierlichen Massenverteilung ρ(z) anzuwenden ist. Die Diagonalelemente heißen Tr¨ agheitsmomente, die Nicht-Diagonalelemente Deviationsmomente. Offensichtlich ist Θ eine bewegungsunabh¨angige Gr¨oße, die nur von der Geometrie des betrachteten K¨orpers abh¨angt. F¨ ur den Rotationsanteil lrot (Rotationsdrehimpuls) des Gesamtdrehimpulses k¨ onnen wir nun schreiben:
1.4 Bewegung starrer K¨ orper
lrot =
69
mi z i × (ω × z i ) = mi z 2i ω − (z i ω)z i i
(Vektorgleichung)
i
=⇒ lrot = Θω
(Koordinatengleichung bzgl. K ) .
Hieraus folgt sofort f¨ ur den Rotationsanteil N rot (Rotationsdrehmoment) des Gesamtdrehmomentes N rot = Dlrot = D lrot + ω × lrot (Vektorgleichung) =⇒ N rot = Θω˙ + ω × lrot
(Koordinatengleichung bzgl. K ).
F¨ ur den Rotationsanteil Trot (Rotationsenergie) der gesamten kinetischen Energie ergibt sich 1 Trot = mi (ω × z i )2 2 i 1 = mi z 2i ω 2 − (z i ω)2 (Vektorgleichung) 2 i 1 =⇒ Trot = ω T Θω (Koordinatengleichung bzgl. K ). 2 Satz 1.28: Rotationsdrehimpuls, -drehmoment und -energie Bezeichnet ω die momentane Winkelgeschwindigkeit eines relativ zu einem Inertialsystem K rotierenden K¨ orpers und Θ seinen Tr¨ agheitstensor im k¨ orperfesten System K , dann sind sein Rotationsdrehimpuls, sein Rotationsdrehmoment und seine Rotationsenergie in Koordinatendarstellung bez¨ uglich K gegeben durch lrot = Θω , N rot = Θω˙ + ω × lrot , Trot =
1 T ω Θω . 2
Steinerscher Satz. Wir wollen nun den Zusammenhang aufzeigen, der zwischen dem Tr¨ agheitstensor Θ, bezogen auf das k¨ orperfeste System K mit Ursprung im Drehpunkt, und dem Tr¨ agheitstensor ΘS , bezogen auf das zu K parallele k¨ orperfeste Schwerpunktsystem KS mit Ursprung in 1 z i mi , besteht. Hierzu nehmen wir eine kontinuierliche Massen∆ = M i
verteilung an, um uns vom Teilchenindex zu befreien. Der Tr¨ agheitstensor Θ, ausgedr¨ uckt durch die KS-Vektoren Z i = z i − ∆, mit d3 Zρ(Z) = M , d3 ZZρ(Z) = 0 , lautet
70
1. Mechanik
Θab = = =
d3 zρ(z) z 2 δab − za zb d3 Zρ(Z) [(Z + ∆)(Z + ∆)δab − (Za + ∆a )(Zb + ∆b )] d3 Zρ(Z)
2 Z + ∆2 δab − (Za Zb + ∆a ∆b ) .
Es folgt der Satz 1.29: Satz von Steiner Zwischen den Tr¨agheitstensoren eines K¨orpers im k¨orperfesten Systems K und dem dazu im Abstand ∆ befindlichen parallelen k¨orperfesten Schwerpunktsystem KS gilt S Θab = Θab + M ∆2 δab − ∆a ∆b . Der Unterschied zwischen Θ und ΘS besteht gerade im Tr¨agheitstensor eines Massenpunktes der Gesamtmasse M , der um ∆ vom Schwerpunkt entfernt ist. Ist also der Tr¨agheitstensor eines K¨orpers bez¨ uglich seines Schwerpunktes bekannt, so l¨aßt sich u ¨ber den Steinerschen Satz leicht der entsprechende Tr¨ agheitstensor f¨ ur jeden beliebigen Punkt berechnen. Haupttr¨ agheitsmomente und Haupttr¨ agheitsachsen. Es ist klar, daß die Form des Tr¨agheitstensors Θ von der Wahl des k¨orperfesten Koordinatensystems K : {e1 , e2 , e3 } abh¨angt. Da der Tr¨agheitstensor in jedem System reell und symmetrisch ist, existiert immer ein k¨orperfestes System K : {e1 , e2 , e3 }, indem der zugeh¨orige Tr¨agheitstensor Ξ diagonal ist. Der ¨ Ubergang von K zu einem solchen Hauptachsensystem K (mit demselben Ursprung) wird durch eine orthogonale Drehmatrix D und der folgenden ¨ Ahnlichkeitstransformation vermittelt: ⎞ ⎛ Ξ1 0 0 Ξ = DΘDT = ⎝ 0 Ξ2 0 ⎠ . 0 0 Ξ3 D bestimmt sich hierbei aus der charakteristischen Gleichung von Θ: Θei = Ξi ei , 0 ≤ Ξi ∈ R , i = 1, 2, 3 =⇒ Dij = ei ej . Die orthonormierten Eigenvektoren von Θ (bzw. die Basisvektoren von K ), also ei , heißen Haupttr¨ agheitsachsen, die Eigenwerte von Θ, also Ξi , werden Haupttr¨ agheitsmomente genannt. 1.4.3 Eulersche Winkel und Lagrange-Gleichungen Kommen wir nun zu den Lagrange-Gleichungen f¨ ur die allgemeine Bewegung eines starren K¨ orpers. Nach unserer bisherigen Diskussion ist klar, daß diese Bewegung im allgemeinsten Fall durch 6 Freiheitsgrade festgelegt wird,
1.4 Bewegung starrer K¨ orper
71
entsprechend den drei Koordinaten des Drehpunktsvektors q sowie den drei Koordinaten der Winkelgeschwindigkeit ω.7 Das Problem beim Aufstellen der Lagrange-Funktion besteht darin, 6 unabh¨ angige generalisierte Koordinaten zu finden, welche die Bewegung des K¨orpers eindeutig festlegen. Drei von ihnen k¨ onnen wir sofort angeben, ahlen n¨amlich die Koordinaten q1 , q2 und q3 des Drehpunktsvektors q. W¨ ur unser k¨ orperfestes System K ein Hauptachsensystem mit Ursprung wir f¨ im K¨ orperschwerpunkt (z S = 0), dann gilt nach (1.46) und Satz 1.28 A M 2 B C q˙1 + q˙22 + q˙32 + ω12 + ω22 + ω32 , T = (1.47) 2 2 2 2 wobei A, B, C die Haupttr¨ agheitsmomente und ωi die Koordinaten von ω bzgl. K bezeichnen. Desweiteren hat man die Euler-Gleichungen ⎫ Nrot,1 = Aω˙ 1 + (C − B)ω2 ω3 ⎪ ⎪ ⎪ ⎬ Nrot,2 = B ω˙ 1 + (A − C)ω1 ω3 (1.48) ⎪ ⎪ ⎪ Nrot,3 = C ω˙ 1 + (B − A)ω1 ω2 . ⎭ Unsere Aufgabe besteht darin, die k¨ orperfesten Komponenten ωi in (1.47) durch drei generalisierte Koordinaten zu ersetzen, welche die reine Rotationsbewegung des K¨ orpers beschreiben. Hierzu gibt es verschiedene M¨ oglichkeiten. Wir verwenden das Eulersche Verfahren und dr¨ ucken die allgemeine Rotationsbewegung durch drei hintereinander folgende Drehungen aus. Nimmt man an, daß die Achsen des raumfesten Systems K und des k¨ orperfesten Systems K zu einem Anfangszeitpunkt parallel sind, dann kann man sich die Drehung von K bez¨ uglich K folgendermaßen vorstellen: Zuerst dreht man K um den Winkel φ um seine dritte Achse. Dann dreht man dieses so entstandene Zwischensystem um den Winkel θ um seine zweite Achse. Schließlich dreht man das neu entstandene System um seine dritte Achse um ψ. Auf diesem Wege l¨ aßt sich jede Drehung durch drei unabh¨ angige Gr¨ oßen parametrisieren. Definition: Eulersche Winkel Seien K und K zwei Orthonormalsysteme. Die (zeitabh¨ angige) Drehmatrix berf¨ u hrt, kann mit Hilfe der Euler-Winkel φ, θ und ψ R, welche K in K u ¨ geschrieben werden als ⎛ ⎞⎛ ⎞⎛ ⎞ cos ψ sin ψ 0 cos θ 0 − sin θ cos φ sin φ 0 0 ⎠ ⎝ − sin φ cos φ 0 ⎠ , R = ⎝ − sin ψ cos ψ 0 ⎠ ⎝ 0 1 0 0 1 sin θ 0 cos θ 0 0 1
7
Nat¨ urlich kann der starre K¨ orper außer seiner Starrheit noch zus¨ atzlichen Zwangsbedingungen unterliegen, so daß die Zahl seiner Freiheitsgrade weiter reduziert ist.
72
1. Mechanik
mit 0 ≤ ψ ≤ 2π , 0 ≤ θ ≤ π , 0 ≤ φ ≤ 2π . Die Winkel sind durch diese Drehung eindeutig definiert, falls |R33 | = 1. Man beachte, daß die Reihenfolge der einzelnen Drehungen durchaus eine Rolle spielt. Mit Hilfe der Beziehungen (1.11) und (1.12) lassen sich nun die Komponenten von ω im raumfesten System K berechnen. Man erh¨alt f¨ ur sie nach einiger Rechnung ω1 = −θ˙ sin φ + ψ˙ sin θ cos φ ω2 = θ˙ cos φ + ψ˙ sin θ sin φ ω3 = φ˙ + ψ˙ cos θ . Die zugeh¨ origen Komponenten im k¨orperfesten System K ergeben sich aus ωi = Rij ωj zu j
ω1 = ω2 =
θ˙ sin ψ − φ˙ sin θ cos ψ θ˙ cos ψ + φ˙ sin θ sin ψ
ω3 = ψ˙ + φ˙ cos θ . Unser Satz von 6 unabh¨angigen generalisierten Koordinaten lautet also ur {q1 , q2 , q3 , φ, θ, ψ}, und wir sind nun in der Lage, die Lagrange-Funktion f¨ die allgemeine Bewegung eines starres K¨orpers hinzuschreiben: M 2 q˙1 + q˙22 + q˙32 L(q1 , q2 , q3 , φ, θ, ψ) = 2 2 A ˙ + θ sin ψ − φ˙ sin θ cos ψ 2 2 B ˙ θ cos ψ + φ˙ sin θ sin ψ + 2 2 C˙ ψ + φ˙ cos θ − V . + 2 Im Falle V = 0 erh¨alt man hieraus f¨ ur die Winkel die Lagrange-Gleichungen Aω˙ 1 = (B − C)ω2 ω3 , B ω˙ 2 = (C − A)ω1 ω3 , C ω˙ 3 = (A − B)ω1 ω2 , welche f¨ ur N rot = 0 identisch sind mit den Euler-Gleichungen (1.48). Zusammenfassung • Die Bewegung eines starren K¨ orpers l¨aßt sich in eine translatorische Bewegung eines beliebigen Punktes und eine Rotationsbewegung des K¨ orpers um diesen Punkt zerlegen.
Anwendungen
73
• Die dynamischen Gr¨ oßen der Rotationsbewegung lassen sich bequem mit Hilfe des Tr¨ agheitstensors ausdr¨ ucken. Er ist eine bewegungsunabh¨ angige Gr¨ oße und h¨ angt nur von der Geometrie des betrachteten K¨ orpers ab. • Der Satz von Steiner erlaubt bei Kenntnis des Tr¨ agheitstensors im Schwerpunktsystem eine einfache Berechnung des Tr¨ agheitstensors f¨ ur jeden beliebigen Punkt. • Die reine Rotationsbewegung eines starren K¨ orpers l¨ aßt sich mit Hilfe der drei unabh¨ angigen Eulerschen Winkel in bequemer Weise parametrisieren.
Anwendungen 11. Physikalisches Pendel. Ein massiver W¨ urfel der Kantenl¨ ange a und der Masse M rotiere unter dem Einfluß der Schwerkraft reibungsfrei um eine seiner Kanten (Abb. 1.9). Man berechne die Schwingungsfrequenz des W¨ urfels f¨ ur kleine Auslenkungen aus seiner Ruhelage. z
z3
raumfestes System
x ϕ
∆
KS-System
z1 k¨ orperfestes System
y
Abb. 1.9. Zur Festlegung des raum- und k¨ orperfesten Systems sowie des k¨ orperfesten Schwerpunktsystems eines rotierenden W¨ urfels
L¨ osung. Da die Drehachse fixiert ist (und damit auch der Drehpunkt q irgendwo entlang der Drehachse), verlegen wir unser raum- und k¨ orperfestes System in eine an die Drehachse grenzende W¨ urfelecke, so daß q = 0 und T = Trot . F¨ ur die k¨ orperfesten Komponenten von ω und ∆ gilt ⎛ ⎞ ⎛ ⎞ 1 0 a ω = ϕ˙ ⎝ 0 ⎠ , ∆ = ⎝ 1 ⎠ . 2 1 1
74
1. Mechanik
Wir ben¨ otigen den Tr¨agheitstensor Θ bez¨ uglich des k¨orperfesten Systems, den wir uns unter Anwendung des Steinerschen Satzes u ¨ber den Tr¨agheitstensor ΘS des k¨ orperfesten Schwerpunktsystems beschaffen: S Θ11 =ρ
= S Θij =i
2
2 dZ1 −a 2
−a 2 S Θ22
a
a
a
2
=
dZ2
dZ3 (Z23 + Z32 ) =
−a 2
M a2 M , ρ= 3 6 a
S Θ33
= 0.
Offensichtlich ist das KS-System ein Hauptachsensystem. F¨ ur Θ folgt aus Satz 1.29 ⎛ ⎞ 8 −3 −3 2 Ma ⎝ −3 8 −3 ⎠ . Θ= 12 −3 −3 8 Die kinetische Energie des Systems ist gegeben durch M a2 2 ϕ˙ . 3 Die potentielle Energie ist gleich derjenigen des Schwerpunktes, a V = −M g √ cos ϕ , 2 √ wobei a/ 2 den Abstand des Schwerpunktes zur Drehachse angibt. Die Energieerhaltung liefert eine Bewegungsgleichung f¨ ur ϕ: T = Trot =
E = Trot + V =
M a2 2 a ϕ˙ − M g √ cos ϕ = const . 3 2
Differentiation nach der Zeit ergibt 2M a2 M ga 3g ϕ˙ ϕ¨ + √ ϕ˙ sin ϕ = 0 ⇐⇒ ϕ¨ + √ sin ϕ = 0 . 3 2 2 2a Da wir uns nur f¨ ur kleine Auslenkungen interessieren, gilt sin ϕ ≈ ϕ und somit √ g 2 2a ϕ¨ + ϕ = 0 , L = 0 in (1.54) erf¨ ullt ist. Es lassen sich nun folgende F¨ alle unterscheiden: Attraktiver Fall: α < 0 =⇒ k > 0. • E < 0 =⇒ | | < 1 =⇒ r = 1+||kcos ϕ > 0 f¨ ur ϕ ∈ [0 : π]. In der oberen Halbebene durchl¨auft ϕ den Bereich [0 : π]. Die geometrische Bahnform k ist eine Ellipse (Abb. 1.12a) mit großer und kleiner Halbachse a = 1− 2 , k b = √1−2 (siehe Abb. 1.13 und (1.55) im n¨achsten Unterabschnitt). r r(ϕ) =
k k oszilliert dabei zwischen den Umkehrpunkten r1 = 1− und r2 = 1+ . F¨ ur = 0 ergibt sich als Spezialfall ein Kreis mit Radius R = r1 = r2 = k.
• E > 0 =⇒ | | > 1 =⇒ r = 1+||kcos ϕ > 0 f¨ ur ϕ ∈ [0 : ϕmax [ , 1 cos ϕmax = − || . Die Bahnkurve ist eine Hyperbel (Abb. 1.12b). • E = 0 =⇒ | | = 1 =⇒ r = eine Parabel (Abb. 1.12c).
k 1+cos ϕ
> 0 f¨ ur ϕ ∈ [0 : π[. Die Bahnkurve ist
Repulsiver Fall: α > 0 =⇒ E > 0 , k < 0 , | | > 1 −|k| 1 =⇒ r = 1−|| ur ϕ ∈ [0 : ϕmax [ , cos ϕmax = || . Als Bahnkurve cos ϕ > 0 f¨ ergibt sich wieder eine Hyperbel (Abb. 1.12d). Offensichtlich f¨ uhrt nur der attraktive Fall mit α < 0 und E < 0 auf eine gebundene, elliptische Bewegung. Bei allen anderen F¨allen n¨ahert sich das Teilchen aus dem Unendlichen kommend dem Kraftzentrum, um danach wieder im Unendlichen zu verschwinden. F¨ ur die elliptische Bewegung wird die Gr¨ oße Exzentrizit¨ at genannt. Sie stellt ein Maß f¨ ur die Abweichung der Teilchenellipse relativ zur Kreisform ( = 0) dar.8 F¨ ur die Halbachsen, ausgedr¨ uckt durch die physikalischen Gr¨oßen der Bewegung, finden wir 8
Die Exzentrizit¨ at des Mondes um die Erde und der Erde um die Sonne ist = 0.055 bzw. = 0.017, d.h. die Bahnen sind fast kreisf¨ ormig.
1.5 Zentralkraftprobleme a
81
b r
r ϕ
ϕ
c
ϕmax
d r ϕ
r ϕ
ϕmax
Abb. 1.12. M¨ ogliche Bahnformen in einem Coulomb-Potential. a, b und c entsprechen dem attraktiven und d dem repulsiven Fall
a=
l α , b= . 2E 2m|E|
Die Energie ist demnach unabh¨ angig vom Drehimpulsbetrag und allein durch die große Halbachse a bestimmt. Exzentrizit¨ at und Runge-Lenz-Vektor. Wir zeigen nun noch kurz einen alternativen Weg zur Herleitung von (1.54). Dazu betrachte man den Vektor l × p und berechne unter Ber¨ ucksichtigung von p˙ = αx/r3 und r = |x| seine zeitliche Ableitung: α d x d mα ˙ − xr ˙ 2 = mα (l × p) = l × p˙ = 3 l × x = − 3 x(xx) . dt r r dt r Hieraus folgt f¨ ur den Vektor der Exzentrizit¨ at l×p x − = const . mα r Dieses zus¨ atzliche Integral der Bewegung wird auch Runge-Lenz-Vektor genannt. Er steht senkrecht zum Drehimpuls und liegt somit stets in der Bewegungsebene. Durch Quadrieren findet man nach wenigen Schritten
2 p 2l2 2El2 α 2 + 1 =⇒ = ± 1 + . + = mα2 2m r mα2 =
82
1. Mechanik
Die Bewegungsgleichung (1.54) ergibt sich aus x =
l2 (l × p)x −r =− −r mα mα
und x = r cos ϕ
zu r(ϕ) = −
l2 /mα . 1 + cos ϕ
1.5.3 Keplersche Gesetze und Gravitationspotential Die Gravitationskraft zwischen zwei Punktmassen m und M , mM , r ist ein spezielles Beispiel f¨ ur attraktive 1/r-Potentiale, wie sie soeben besprochen wurden. Mit unserer bisherigen Kenntnis lassen sich aus der Form dieser Kraft sofort die drei Keplerschen Gesetze herleiten, die da lauten:9 F G (x) = −∇VG (|x|) , VG (|x|) = VG (r) = −γ
1. Jeder Planet unseres Sonnensystems bewegt sich auf einer Ellipsenbahn, in deren einem Brennpunkt die Sonne steht. 2. In gleichen Zeiten u ¨berstreicht die gedachte Verbindungslinie zwischen Sonne und Planet gleiche Fl¨achen. 3. Die Quadrate der Umlaufzeiten verhalten sich wie die Kuben der großen Halbachsen der Bahnen zweier Planeten. Wir wollen hier jedoch den umgekehrten Weg einschlagen und zeigen, daß sich die Gravitationskraft allein aus den Keplerschen Gesetzen ergibt. Obwohl Sonne und Planet nat¨ urlich eine r¨ aumliche Struktur besitzen, ist es hier dennoch gerechtfertigt, sie als Punktteilchen zu betrachten, da ihre Ausdehnungen im Vergleich zu den betrachteten L¨angen (Abstand Sonne– Planet) sehr klein sind. Wie sich sp¨ater herausstellen wird, ist diese Betrachtungsweise sogar exakt, sofern Sonne und Planeten kugelf¨ormig sind. Legen wir den Ursprung unseres Inertialsystems in die Sonne (dies ist aufgrund der sehr viel gr¨oßeren Sonnenmasse gegen¨ uber den Planetenmassen erlaubt), dann folgt aus dem ersten Keplerschen Gesetz, daß die Bahn eines Planeten eben und somit die Richtung seines Drehimpulses bez¨ uglich der Sonne erhalten ist. Wir k¨onnen unser Inertialsystem wieder so w¨ahlen, daß die Beziehungen (1.50) gelten. Das zweite Gesetz bedeutet die Betragserhaltung des Drehimpulses, also l = mr2 ϕ˙ = const . Die Kraft zwischen Sonne und Planet ist also zentral, 9
Diese Gesetze sind so zu verstehen, daß die Wechselwirkung der Planeten untereinander sowie die Bewegung der Sonne vollst¨ andig vernachl¨ assigt werden.
1.5 Zentralkraftprobleme
a b
r B
83
a r B
a Abb. 1.13. Zur Definition einer Ellipse
d(r2 ϕ) ˙ = r(2r˙ ϕ˙ + rϕ) ¨ =0, dt und wir k¨ onnen schreiben: ⎛ ⎞ cos ϕ r − rϕ˙ 2 ) ⎝ sin ϕ ⎠ . F G = m(¨ 0 Aus der geometrischen Form einer Ellipse (siehe Abb. 1.13) erhalten wir den gew¨ unschten Zusammenhang zwischen r und ϕ. Sie ist definiert als die Menge aller Punkte, die von zwei Brennpunkten B, B den gleichen Abstand haben. Bezeichnet man mit a die große und mit b die kleine Halbachse, so lautet die uhrt nach ein wenig Algebra zu Ellipsenbedingung: r + r = 2a. Sie f¨ √ k a2 − b2 b2 r = , k= , = b gravisch genauso verh¨ alt, wie ein Punktteilchen der gleichen Masse. Gravitationspotential auf der Erdoberfl¨ ache. F¨ ur physikalische Prozesse, die sich in der N¨ ahe der Erdoberfl¨ ache abspielen, gilt r = R + r , r R , wobei R = 6.35 · 106 m der Erdradius und r der radiale Abstand des betrachteten Teilchens zur Erdoberfl¨ ache ist. Wir k¨ onnen deshalb das Gravitationspotential der Erde um R entwickeln und erhalten mit der Erdmasse M = 5.98 · 1024 kg m γmM N = −mgR + mgr + . . . , g ≈ 9.8 = 9.8 2 . VG (r) = − r kg s Hierbei bezeichnet g die Erdbeschleunigung. Da der Term mgR eine physikalisch irrelevante Konstante ist, kann er ignoriert werden, und wir erhalten f¨ ur das Gravitationspotential in Bezug auf die Erdoberfl¨ ache VGO (r ) ≈ mgr .
86
1. Mechanik
1.5.4 Ein-Teilchenstreuung an ein festes Target Das Problem beim Auffinden von Wechselwirkungskr¨aften mikroskopischer Objekte wie Molek¨ ule, Atome, Atomkerne und Elementarteilchen besteht darin, daß diese den menschlichen Sinnen nicht direkt zug¨anglich sind, so daß Methoden ben¨otigt werden, die Wechselwirkungseffekte in geeigneter Weise verst¨ arken und so wahrnehmbar machen. Eine solche Methode ist die Streuung von Teilchen aneinander. Hiermit lassen sich aus Kenntnis der Teilchenpositionen und -geschwindigkeiten weit vor und weit hinter dem Ort der Streuwechselwirkung R¨ uckschl¨ usse auf die an der Streuung beteiligten Kr¨afte ziehen. Dies sieht in der Praxis so aus, daß man Streuprozesse f¨ ur verschiedene, physikalisch motivierte Test-Wechselwirkungen“ durchrechnet und dann ” die Ergebnisse mit dem Experiment vergleicht. Obwohl solche Streuprozesse von o.g. Objekten meistens eine quantenmechanische Beschreibung erfordern (siehe Abschn. 3.10), stellt in vielen F¨allen die rein klassische Beschreibung eine sehr gute N¨aherung dar. In diesem Unterabschnitt behandeln wir die Streuung von Teilchen an ein fest installiertes Teilchen (Targetteilchen) und verallgemeinern im n¨achsten Unterabschnitt die Resultate auf den experimentell relevanteren Fall der Zwei-Teilchenstreuung, bei dem aus entgegengesetzten Richtungen Teilchen aufeinander geschossen bzw. aneinander gestreut werden. Wir nehmen dabei immer an, daß sich die Wechselwirkungskr¨afte durch rotationssymmetrische Potentiale darstellen lassen, die f¨ ur große Abst¨ande, im Vergleich zur Ausdehnung der Streuobjekte, gen¨ ugend stark abfallen, so daß die Teilchen lange vor und lange nach der Streuung als quasi frei betrachtet werden k¨onnen. Bei der Ein-Teilchenstreuung an ein festes Potential hat man es mit der in Abb. 1.15 skizzierten Situation zu tun. Ein Teilchen fliegt in z-Richtung mit konstantem Anfangsimpuls pA = mv 0 und vertikalem Abstand b auf das Streuzentrum geradlinig zu, wird in einem relativ lokalisierten Bereich um das Streuzentrum abgelenkt und fliegt danach geradlinig mit Endimpuls pE y
Detektor
pE π − θmin pA b
χ rmin
θmin
Abb. 1.15. Ein-Teilchenstreuung an ein festes Streuzentrum
z
1.5 Zentralkraftprobleme
87
weiter, bis es in großer Entfernung zum Streuzentrum von einem Detektor registriert wird. F¨ ur den Streuwinkel χ gilt cos χ =
pA pE . |pA ||pE |
(1.56)
Der gesamte Streuprozeß ist makroskopisch durch Angabe der Anfangsgeschwindigkeit v0 , des Impaktparameters b und des Wechselwirkungspotentials V (r) determiniert. Wir legen nun den Ursprung des Koordinatensystems in das Streuzentrum betrachten und die Kinematik des Streuprozesses in Polarkoordinaten y sin θ =r : z cos θ • Anfangsbedingungen: ˙ r(0) = ∞ , θ(0) = π , r(0) ˙ = −v0 , θ(0) =0. • Erhaltung der Gesamtenergie: m 2 p2 m + V (r) = r˙ + r2 θ˙2 + V (r) = v02 = const . E= 2m 2 2 Insbesondere sind die Impulsbetr¨ age des Teilchens lange vor und lange nach der Streuung (V (r = ∞) = 0) gleich: |pA | = |pE |. • Erhaltung des Drehimpulses: |l| = l = mr2 θ˙ = mbv0 = const =⇒ dt =
mr2 dθ . l
• Bahnkurve des Teilchens: Sie ist symmetrisch zur rmin -Achse. Hieraus folgt f¨ ur den Streuwinkel χ χ = 2θmin − π und f¨ ur rmin dr dr (rmin ) = 0 =⇒ (rmin ) = 0 . (1.57) dt dθ Unter Beachtung dieser Punkte l¨ aßt sich nun θmin und damit χ berechnen: 2 dr m 2 l2 l2 v0 = + + V (r) 4 2 2mr dθ 2mr2 r(r ˙ min ) =
2
−1 r2 2V (r) 1 =⇒ =− 2 1− 2 1− r b mv02 −1/2 r 2V (r ) r2 dr 1− 2 1− =⇒ θ − θ0 = ± . r b mv02
dθ dr
r0
88
1. Mechanik
Offensichtlich ist das Vorzeichen der Wurzel des Integranden gleich dem Vorzeichen von dθ/dr bzw. dr/dθ, welches im Bereich θmin ≤ θ ≤ π positiv ist. Setzen wir also θ0 = π , θ = θmin , r0 = ∞ , r = rmin , so folgt der Satz 1.32: Bestimmung des Streuwinkels χ χ = 2θmin − π ∞ θmin = θmin (b, v0 ) = π − rmin
dr r
−1/2 2 1 − r 1 − 2V (r) . 2 2 b mv0
Der minimale Abstand rmin = rmin (b, v0 ) ist nach (1.57) durch die Nullstelle des Integranden gegeben. In der Regel hat man es bei Streuexperimenten nicht mit der Streuung eines einzelnen Teilchens an ein Target zu tun, sondern mit einem Strahl von gleichartigen Teilchen, die mit gleicher Geschwindigkeit v0 auf das Streuzentrum treffen. Da dieser Strahl einen gewissen Querschnitt aufweist, haben verschiedene Teilchen i.a. auch verschiedene Impaktparameter und werden dementsprechend unter verschiedenen Winkeln gestreut. Dieser Sachverhalt ist in Abb. 1.16 verdeutlicht. Alle Teilchen, die durch das Segmentst¨ uck b|db|dϕ treten, treffen auf das Kugelfl¨achenelement R2 dΩ = R2 sin χdχdϕ und werden dort vom Detektor registriert. Der Detektor mißt also effektiv den Wirkungsquerschnitt, der wie folgt definiert ist: Definition: Wirkungsquerschnitt dσ dσ = mit
(Zahl der nach dΩ gestreuten Teilchen)/s 2
(Zahl der einfallenden Teilchen)/s/m
=
Ib|db|dϕ , I
I = Teilchenstrom
db =⇒ dσ = b|db|dϕ = b(χ) dϕdχ . dχ
(1.58)
Der differentielle Wirkungsquerschnitt ergibt sich durch Normierung von dσ auf das Einheitskugelfl¨achenelement dΩ: Definition: Differentieller Wirkungsquerschnitt dσ/dΩ der Ein-Teilchenstreuung db dσ 1 = b(χ) . dΩ sin χ dχ
(1.59)
Im Experiment erh¨alt man also den differentiellen Wirkungsquerschnitt, indem man den gemessenen Wirkungsquerschnitt durch die Detektorfl¨ache teilt. Er ist somit eine von der Geometrie des Detektors unabh¨angige Gr¨oße.
1.5 Zentralkraftprobleme
89
R sin χdϕ Rdχ χ
db b
dϕ
R sin χ R
db
b|db|dϕ
b
Abb. 1.16. Verlauf eines Teilchenstrahls bei der Ein-Teilchenstreuung. Links: senkrecht zur Strahlrichtung. Rechts: in Strahlrichtung
Man beachte, daß die Gleichungen (1.58) und (1.59) auch f¨ ur nichtrotationssymmetrische Potentiale gelten. In diesem Fall ist dann allerdings zu ber¨ ucksichtigen, daß b auch vom Azimutwinkel ϕ abh¨ angt. Integriert man dσ/dΩ u ¨ber dΩ, so erh¨alt man den totalen Wirkungsquerschnitt σtot : Definition: Totaler Wirkungsquerschnitt σtot (Zahl der gestreuten Teilchen)/s dσ = σtot = dΩ 2 . dΩ (Zahl der einfallenden Teilchen)/s/m
(1.60)
Wie auch dσ hat die Gr¨ oße σtot die Dimension einer Fl¨ ache. Sie ist gleich derjenigen (fiktiven) Fl¨ ache eines Streuzentrums, die Projektile senkrecht durchsetzen m¨ ussen, um u ¨berhaupt abgelenkt zu werden. 1.5.5 Zwei-Teilchenstreuung Wir gehen nun zum realistischeren Fall u ¨ber, bei dem kein fest installiertes Streuzentrum mehr existiert, sondern Teilchen aufeinander geschossen werden. Wie bereits in Unterabschn. 1.5.1 diskutiert wurde, k¨ onnen wir die Dynamik dieser Zwei-Teilchenstreuung in eine Relativbewegung m1 m2 µ¨ xR = −∇V (|xR |) , xR = x1 − x2 , µ = , M = m 1 + m2 M und eine Schwerpunktsbewegung M 2 m1 x1 + m2 x2 x˙ S = const , xS = 2 M aufteilen. Die Relativbewegung entspricht einem effektiven Ein-Teilchenproblem und kann als Streuung eines Teilchens der reduzierten Masse µ an ein festes Streuzentrum bei xR = 0 interpretiert werden. Hierf¨ ur gelten die entsprechenden, im letzten Unterabschnitt angef¨ uhrten Erhaltungss¨ atze: M x˙ S = const =⇒ ES =
90
1. Mechanik
•
ER =
•
lR = µxR × x˙ R = const .
µ 2 ˙ 2 xR
E ˙R + V (xR ) = const =⇒ |pA R | = |pR | , pR = µx
Aus der Erhaltung der Schwerpunkts- und Relativenergie folgt nat¨ urlich die Erhaltung der Gesamtenergie: m1 2 m2 2 E = ES + ER = x˙ + x˙ + V (|x1 − x2 |) = const . 2 1 2 2 Die gleichf¨ ormige Schwerpunktsbewegung nimmt keinen Einfluß auf die Dynamik des Streuprozesses und ist lediglich eine Folge der Wahl unseres raumfesten Inertialsystems, von dem aus die Streuung betrachtet wird (GalileiInvarianz). Wir k¨onnen deshalb zum (gesternten) Schwerpunktsystem u ¨bergehen, indem der Schwerpunkt f¨ ur alle Zeiten ruht: xi = xS + x∗i , x∗S = 0 . Das Schwerpunktsystem bietet den Vorteil, daß sich in ihm der Zusammenhang zwischen Streuwinkel χ und Impaktparameter b oftmals einfacher herstellen l¨ aßt als im Laborsystem, in dem das zweite Teilchen lange vor der Streuung ruht. F¨ ur die Schwerpunktsimpulse p∗i = mi x˙ ∗i gilt wegen ∗ ∗ m1 x˙ 1 + m2 x˙ 2 = 0 m1 m2 m1 m2 m1 ∗ ∗ ∗ ∗ p1 = −p2 = x˙ 1 + = (x˙ ∗ − x˙ ∗2 ) = pR . x˙ m1 + m 2 m2 1 m1 + m2 1 Abbildung 1.17 zeigt den Verlauf der Zwei-Teilchenstreuung im Schwerpunktsystem. Die Teilchen laufen aus dem Unendlichen mit den Anfangsimpulsen = −pA∗ = pA pA∗ 1 2 R aufeinander zu. Nach der Streuung sind die Impulse E∗ E∗ p1 = −p2 = pE uber den Anfangsimpulsen um den Streuwinkel χ R gegen¨ gedreht (vgl. (1.56)):
pE R
pA R
χ
b −pA R
χ
−pE R Abb. 1.17. Verlauf der Zwei-Teilchenstreuung im Schwerpunktsystem
1.5 Zentralkraftprobleme
cos χ =
91
E pA R pR . 2 |pA R|
Den Zusammenhang zwischen Impaktparameter b und Streuwinkel χ im Schwerpunktsystem kann man sich also einfach u ¨ber (1.59) mit der Ersetzung m → µ verschaffen, und es folgt der Satz 1.33: Differentieller Wirkungsquerschnitt der Zwei-Teilchenstreuung im Schwerpunktsystem db dσ 1 = b(χ) , mit b(χ) aus Satz 1.32 und m → µ. ∗ dΩ sin χ dχ Der Geschwindigkeitsparameter v0 ist hierbei als Relativgeschwindigkeit der beiden Teilchen lange vor der Streuung aufzufassen. Zwei-Teilchenstreuung im Laborsystem. Mit Hilfe der Gleichungen der Zwei-Teilchenstreuung im Schwerpunktsystem lassen sich nun leicht die entsprechenden Zusammenh¨ ange im Laborsystem (Abb. 1.18) herleiten, wo das zweite Teilchen lange vor der Streuung ruht: ˙S = pA 2 = 0 =⇒ x
m1 x˙ 1 (0) 1 A = p . m1 + m 2 m2 R
pE 1
pA 1
θ1 θ2 pE 2
Abb. 1.18. Verlauf der Zwei-Teilchenstreuung im Laborsystem
Zwischen Anfangs- und Endimpulsen im Schwerpunkt- und Laborsystem gelten folgende Beziehungen: m1 A m1 ∗ ∗A ˙ ˙ pA = m [ x + x (0)] = p + p = + 1 pA 1 S 1 1 1 R m2 R m2 ∗A ˙ S + x˙ ∗2 (0)] = pA pA 2 = m2 [x R + p2 = 0 m1 A m1 A ˙ S + x˙ ∗1 (∞)] = p + p∗E p + pE pE 1 = m1 [x 1 = R m2 R m2 R ∗E A E ˙ S + x˙ ∗2 (∞)] = pA pE 2 = m2 [x R + p2 = pR − pR .
92
1. Mechanik
Damit lassen sich die Streuwinkel θ1 und θ2 im Laborsystem durch den Streuwinkel χ im Schwerpunktsystem ausdr¨ ucken: m1 A m1 A E + 1 p p + p A E R R R m2 m2 p p
cos θ1 = A1 1E = 2 |p1 ||p1 | 2 E 2 m1 m1 A A E 1 pA + pR + 2 m R m2 + 1 |pR | m2 m2 pR pR =
m1 m2
1 + 1 + 2m m2 cos χ m1 E A + 1 pA A E R (pR − pR ) m χ p p 1 − cos χ 2 = sin cos θ2 = A1 2E = =√ m1 2 A A E 2 − 2 cos χ |p1 ||p2 | m2 + 1 |pR ||pR − pR |
=⇒
m1 m2
+ cos χ
2
θ2 =
π−χ . 2
Satz 1.34: Zusammenhang differentieller Wirkungsquerschnitt im Labor- und Schwerpunktsystem −1 dσ d cos θ1 dσ dΩ ∗ dσ = = dΩ ∗ dΩL dΩ ∗ d cos χ dΩL =
dσ dΩ ∗
m1 m2
2 +1+ m1 m2
1 2m m2
3/2 cos χ(θ1 )
cos χ(θ1 ) + 1
,
mit cos θ1 =
m1 m2
m1 m2
2
+ cos χ
1 + 1 + 2m m2 cos χ
und dΩ ∗ = sin χdχdϕ = Raumwinkelelement im Schwerpunktsystem, Raumwinkelelement im Laborsystem, in das dΩL = sin θ1 dθ1 dϕ = die Projektilteilchen gestreut werden. (Die azimutalen Winkelabh¨angigkeiten im Labor- und Schwerpunktsystem sind gleich: ϕL = ϕ.) Man beachte: F¨ ur m2 m1 sind die differentiellen Wirkungsquerschnitte dσ/dΩL und dσ/dΩ ∗ gleich und entsprechen dem differentiellen Wirkungs¨ querschnitt dσ/dΩ der Ein-Teilchenstreuung. Der Ubergang vom Schwerpunktsystem zum Laborsystem l¨aßt sich folgendermaßen graphisch darstellen:
1.5 Zentralkraftprobleme
93
ahrend • m1 /m2 < 1: θ1 u ¨berstreicht im Laborsystem den Bereich [0 : π], w¨ χ im Schwerpunktsystem ebenfalls diesen Bereich durchl¨ auft (Abb. 1.19). Die Zuordnung χ(θ1 ) ist in diesem Bereich bijektiv.
pE 1
pE R
θ1
pE 2
χ
θ2
m1 A p m2 R
pA R Abb. 1.19. Zusammenhang zwischen der Zwei-Teilchenstreuung im Schwerpunktund Laborsystem f¨ ur m1 < m2
• m1 /m2 > 1: θ1 u ur ¨berstreicht hier nur noch den Bereich [0 : θmax ] f¨ χ ∈ [0 : π], mit sin θmax = m2 /m1 . Außerdem gibt es nun zu jedem θ1 zwei m¨ ogliche Werte f¨ ur χ (Abb. 1.20). Zur endg¨ ultigen Festlegung von χ ben¨otigt man deshalb außer θ1 noch den Endimpuls |pE 1 | des ersten Teilchens.
pE 1 pE R
pE R oder
χ
θ1 θmax m1 A p m2 R
pE 2
θ2
χ pA R
Abb. 1.20. Zusammenhang zwischen der Zwei-Teilchenstreuung im Schwerpunktund Laborsystem f¨ ur m1 > m2
Zusammenfassung • Die relevanten Kenngr¨ oßen von Ein-Teilchenstreuungen sind der differentielle und der totale Wirkungsquerschnitt, da sie dem Experiment leicht zug¨ anglich sind. Der differentielle Wirkungsquerschnitt gibt die Winkelverteilung der gestreuten Teilchen an und der totale Wirkungsquerschnitt die fiktive Fl¨ ache des Streuzentrums, die die Projektile durchsetzen m¨ ussen, um abgelenkt zu werden.
94
1. Mechanik
• Die gegenseitige Streuung von Teilchen (Zwei-Teilchenstreuung) l¨aßt sich in eine Relativbewegung und eine gleichf¨ormige Schwerpunktsbewegung aufteilen. Da die Schwerpunktsbewegung die Dynamik des Streuvorgangs nicht beeinflußt, entspricht die relative Bewegung einem effektiven Ein-Teilchenproblem. • Betrachtet man die Zwei-Teilchenstreuung vom Schwerpunktsystem aus, so lassen sich die zugeh¨origen Streubeziehungen aus denen der EinTeilchenstreuung mit der Ersetzung m −→ µ ableiten. Die entsprechenden Zusammenh¨ange im Laborsystem, wo das zweite Teilchen lange vor der Streuung ruht, ergeben sich problemlos aus den Betrachtungen im Schwerpunktsystem.
Anwendungen 13. Periheldrehung. Das Gravitationspotential der Sonne wird durch allgemein-relativistische Korrekturen folgendermaßen modifiziert: a α V (r) = + 2 , α < 0 , a > 0 . r r Man zeige, daß dieses Potential zu einer Drehung der Planetenellipsen f¨ uhrt. L¨ osung. Entsprechend der radialen Bewegungsgleichung (1.51) bzw. (1.52) gilt f¨ ur die Planetenbahnen in Polarkoordinaten (mit ϕ0 = 0) r ϕ =± r0
r2
ldr
2m E −
α r
−
a r 2
−
l r 2
1 λ/r + mα +c , = − √ arcsin mαγ d wobei m die Masse des Planeten ist und
2ma 2E d= 2 +1 , γ =± 1+ (2ma + l2 ) . l mα2 Bei geeigneter Wahl der Integrationskonstanten c ergibt sich hieraus k λ2 √ . (1.61) , k=− mα 1 + γ cos( dϕ) √ Bis auf den Vorfaktor d ist (1.61) formgleich mit der Ellipsengleichung √ (1.54). Wegen d > 1 wird jedoch z.B. der minimale Abstand rmin = k/(1 + |γ|) zur Sonne nicht nach ∆ϕ = 2π erreicht, wie im reinen Coulomb√ Fall, sondern eher, n¨amlich bei ∆ϕ = 2π/ d. Dies f¨ uhrt zur Drehung der Ellipsenbahnen, der sog. Periheldrehung (Abb. 1.21). r=
Anwendungen
95
r ϕ
Abb. 1.21. Drehung der Planetenellipsen aufgrund eines zus¨ atzlichen zum Gravitationspotential
1 -Terms r2
14. Elastische Streuung von Kugeln. Zwei harte Kugeln mit den Massen m1 = m2 = m und den Radien R1 = R2 = R werden aneinander elastisch gestreut (gestoßen). Man berechne den differentiellen Wirkungsquerschnitt im Schwerpunkt- und Laborsystem. Wie groß ist der totale Wirkungsquerschnitt? L¨ osung. Wir betrachten zuerst den Stoß der ersten Kugel an die fest verankerte zweite Kugel (Abb. 1.22). Da es sich hierbei um eine elastische Streuung handelt, erh¨alt man den Zusammenhang zwischen Streuwinkel χ und Impakt¨ parameter b aus rein geometrischen Uberlegungen. Es gilt b θmin = π − arcsin 2R =⇒ χ = 2θmin − π = 2 arccos =⇒ b = 2R cos
χ 2
b 2R
y
v0
• b
2R
•
θmin
z
Abb. 1.22. Elastische Streuung einer Kugel an einer fixierten Kugel
96
1. Mechanik
db χ =⇒ = R sin . dχ 2 F¨ ur den differentiellen Wirkungsquerschnitt der Ein-Teilchenstreuung folgt somit nach (1.59) 2R2 sin χ2 cos χ2 dσ dσ = = R2 = = const . dΩ sin χ dΩ ∗ Da dσ/dΩ massenunabh¨angig ist, ist er nach Satz 1.33 gleich dem differentiellen Wirkungsquerschnitt im Schwerpunktsystem. Der totale Wirkungsquerschnitt berechnet sich nach (1.60) zu 2π σtot = R
2
π dχ sin χ = 4πR2 .
dϕ 0
0
Den differentiellen Wirkungsquerschnitt im Laborsystem erh¨alt man u ¨ber Satz 1.34 zu [2 + 2 cos χ]3/2 dσ = R2 = 2R2 2 + 2 cos χ = 4R2 cos θ1 . dΩL 1 + cos χ Zur Berechnung des totalen Wirkungsquerschnitts σtot,L , der nat¨ urlich gleich dem der Ein-Teilchenstreuung sein muß, ist zu beachten, daß sich die Integration u ¨ber θ1 nur bis zur ersten Nullstelle von dσ/dΩL erstreckt: π
2 σtot,L = 8πR
2
dθ1 sin θ1 cos θ1 = 4πR2 . 0
15. Rutherford-Streuung. Man berechne f¨ ur die Elektron-Proton-Streuung den differentiellen Wirkungsquerschnitt im Labor- und Schwerpunktsystem, wobei die Wechselwirkung durch ein Coulomb-Potential V (r) = α/r gegeben sei. L¨ osung. Wir beginnen wieder mit der Betrachtung der Ein-Teilchenstreuung an ein festes Streuzentrum, wobei das Elektron (m1 = me ) auf ein fixiertes Proton (m2 = mp ) geschossen wird. Der Zusammenhang zwischen Streuwinkel und Impaktparameter ist nach Satz 1.32 −1/2 ∞ r2 2α dr χ+π 1 − 1 − , θmin = =π− 2 2 2 r b me v0 r rmin
wobei rmin die Nullstelle des Integranden ist. Die Substitution u = 1/r =⇒ dr = −r2 du liefert u −1/2 min 2 2α 1 du u + u − 2 . (1.62) θmin = π − me b 2 v 2 b 0
0
Anwendungen
97
Eine weitere Substitution
2 2α 1 1 α u2 + (1 − ω 2 ) u− 2 =− 2 + me b2 v02 b b me b2 v02 =⇒ ω =
α u+ me b2 v02
1 + b2
α me b2 v02
2 −1/2
f¨ uhrt zu ω(u min )
dΩ(1 − ω 2 )−1/2 = π + arccos ω(0) − arccos ω(umin ) .
θmin = π + ω(0)
Da umin Nullstelle des Integranden aus (1.62) ist, gilt ω(umin ) = 1 und somit arccos ω(umin ) = 0. Wir erhalten schließlich
2 −1/2 1 χ−π α χ α cos + = sin = ω(0) = 2 2 me b2 v02 b2 me b2 v02
b2 m2e v04 α2 |α| χ =⇒ b(χ) = cot me v02 2 db |α| 1 . =⇒ = dχ 2me v02 sin2 χ2 =⇒ sin2
χ = 2
−1
1+
Damit ergibt sich f¨ ur den differentiellen Wirkungsquerschnitt der Ein-Teilchenstreuung α2 1 dσ = 4m2e v04 sin4 dΩ
χ 2
.
(1.63)
Er ist monoton fallend mit der Energie me v02 /2 der Elektronen sowie mit dem Streuwinkel χ und divergiert f¨ ur χ = 0. Dies ist eine Folge der langen Reichweite des Coulomb-Potentials. Bemerkenswerterweise gibt es keinen Unterschied zwischen dem attraktiven (α < 0) und repulsiven Fall (α > 0). Der totale Wirkungsquerschnitt ist π π dχ sin χ 1 πα2 πα2 σtot = =− 2 4 −→ ∞ . 2m2e v04 me v0 sin2 χ2 sin4 χ2 0
0
Der Grund f¨ ur diese Divergenz liegt wiederum am langreichweitigen 1/r-Verhalten des Wechselwirkungspotentials. Der differentielle Wirkungsquerschnitt im Schwerpunktsystem ergibt sich durch die Ersetzung me → µ = me mp /(me + mp ) zu
98
1. Mechanik
dσ 1 α2 = 4 ∗ 2 4µ v0 sin4 dΩ
χ 2
,
mit v0 als anf¨ anglicher Relativgeschwindigkeit von Elektron und Proton. Das Massenverh¨ altnis von Elektron und Proton ist me ≈ 5.4 · 10−4 1 . mp In nullter N¨ aherung gilt daher me /mp ≈ 0 , µ ≈ me , und wir k¨onnen schreiben: dσ dσ dσ ≈ . ≈ dΩ dΩ ∗ dΩL
1.6 Relativistische Mechanik Zu Anfang des 20. Jahrhunderts glaubte man, daß das gesamte Weltall von ¨ einem Medium, dem sog. Ather, erf¨ ullt sei, das die Propagation des Lichts ¨ durch den Raum erm¨oglicht. Diese Atherhypothese h¨atte zur Folge, daß die Lichtgeschwindigkeit in Inertialsystemen, die sich mit verschiedenen Ge¨ schwindigkeiten relativ zum Ather bewegen, unterschiedlich groß sein m¨ ußte. ¨ Uberraschenderweise konnte durch keines der damals mit hoher Pr¨azision durchgef¨ uhrten Experimente (z.B. Michelson-Moreley-Experiment) dieser Effekt beobachtet werden. Alle experimentellen Ergebnisse deuten im Gegenteil darauf hin, daß Licht in allen Inertialsystemen die gleiche Ausbreitungsgeschwindigkeit besitzt. 1905 ver¨ offentlichte Albert Einstein seine spezielle Relativit¨ atstheorie, welche die Konstanz der Lichtgeschwindigkeit zum Axiom erhebt und die ¨ Atherhypothese vollst¨andig verwirft. Die spezielle Relativit¨atstheorie – urspr¨ unglich im Rahmen der Elektrodynamik formuliert – bildet eine selbstkonsistente Theorie, die die Newtonsche Mechanik als Grenzfall kleiner Geschwindigkeiten im Vergleich zur Lichtgeschwindigkeit enth¨alt. Nach einer Besprechung der grundlegenden Voraussetzungen der speziellen Relativit¨ atstheorie, in der sich der Begriff der Lorentz-Transformation als entscheidend erweisen wird, diskutieren wir daraus folgende relativistische Effekte im Kontext der Mechanik und zeigen, daß das Kausalit¨atsprinzip, d.h. die chronologische Abfolge von Ereignissen in der Vergangenheit, Gegenwart und Zukunft auch hier seine G¨ ultigkeit beh¨alt. Desweiteren besch¨aftigen wir uns mit der ad¨aquaten Definition relativistischer kinematischer Vierergr¨ oßen, die eine forminvariante Formulierung der relativistischen Mechanik gew¨ ahrleisten. Der letzte Unterabschnitt besch¨aftigt sich mit der Lagrangeschen Formulierung der relativistischen Mechanik.
1.6 Relativistische Mechanik
99
1.6.1 Grundvoraussetzungen, Minkowski-Raum, Lorentz-Transformation atstheorie beruht auf folgenden Axiomen: Die spezielle Relativit¨ • Konstanz der Lichtgeschwindigkeit: Die Lichtgeschwindigkeit im Vakuum ist f¨ ur alle gleichf¨ ormig bewegten Bezugssysteme gleich groß, n¨ amlich c ≈ 3 · 108 m/s. • Relativit¨ atsprinzip: Physikalische Gesetze sind in allen Inertialsystemen gleichermaßen g¨ ultig, d.h. es existiert kein ausgezeichnetes Bezugssystem. Im Relativit¨atsprinzip sind enthalten die Homogenit¨ at von Raum und Zeit, nach der kein ausgezeichneter Ort und Zeitpunkt existiert, und die Isotropie des Raumes, nach der es keine bevorzugte Raumrichtung gibt. Im Kontext der Mechanik kann als weiteres Axiom das Korrespondenzprinzip angesehen werden. Es besagt, daß alle physikalischen Gesetzm¨ aßigkeiten der speziellen Relativit¨ atstheorie im Grenzfall v/c → 0 in die entsprechenden Gesetze der Newtonschen Mechanik u ¨bergehen. Das erste Axiom hat zur Folge, daß die Voraussetzung der Newtonschen Mechanik einer absoluten Zeit in allen Bezugssystemen aufgegeben werden muß. Insofern erweist es sich als g¨ unstig, physikalische Ereignisse mathematisch in einem vierdimensionalen Raum zu beschreiben, in dem die Zeit t (bzw. das Produkt aus Zeit und Lichtgeschwindigkeit, ct) als eigene Dimension gleichberechtigt zu den drei Raumdimensionen erscheint. Dies ist der sog. Minkowski-Raum. Bevor wir uns ihm zuwenden, wollen wir einige Vereinbarungen treffen, die es gestatten, die Relativit¨ atstheorie in sehr u ¨bersichtlicher Weise zu formulieren: ¨ • Uber gleiche Indizes, von denen der eine unten und der andere oben zu stehen hat, wird summiert, so daß Summenzeichen fortgelassen werden k¨ onnen. Summationen, in denen zwei gleiche Indizes oben oder unten stehen, sind nicht definiert (Einsteinsche Summenkonvention). • Vektoren, deren Index oben steht, heißen kontravariant, solche mit unten stehendem Index kovariant. Obwohl diese Unterscheidung im Rahmen der relativistischen Mechanik keine große Rolle spielt, wollen wir sie dennoch schon jetzt einf¨ uhren; ihr voller Nutzen wird sich sp¨ atestens im Kontext der forminvarianten Formulierung der Elektrodynamik (Abschn. 2.3) erweisen. • Bei Matrizen steht der Zeilenindex vor dem Spaltenindex. Definition: Minkowski-Raum Der Minkowski-Raum ist ein vierdimensionaler linearer Vektorraum u ¨ber dem K¨ orper der reellen Zahlen. Seine Elemente x werden durch vierkomponentige Koordinatenvektoren bzw. Vierervektoren (im folgenden oftmals auch einfach nur: Vektoren)
100
1. Mechanik
(xµ (t)) =
ct x(t)
⎛
⎞ ct ⎜ x(t) ⎟ ⎟ =⎜ ⎝ y(t) ⎠ z(t)
repr¨ asentiert. Man beachte die Notation: xµ , µ = 0, 1, 2, 3 bezeichnet die µ-te kontravariante Koordinate von x. Metrik des Minkowski-Raumes Das Skalarprodukt zweier Vierervektoren ist in folgender Weise definiert: (xµ ) · (y ν ) = xµ gµν y ν = xµ yµ (xµ ) · (yν ) = xµ g µν xν = xµ y µ ⎛ ⎞ 1 0 0 0 ⎜ 0 −1 0 0 ⎟ µ µ µ ⎟ (gµν ) = (g µν ) = ⎜ ⎝ 0 0 −1 0 ⎠ , g ν = gν = δν . 0 0 0 −1
(1.64)
Hieraus folgt unmittelbar: • g µα gαν = δνµ , • xµ = gµν xν , xµ = g µν xν , d.h. ko- und kontravariante Vektoren unterscheiden sich allein im Vorzeichen der r¨aumlichen Komponenten, • xµ y µ = xµ yµ . gµν ist der (nichteuklidische) metrische Tensor des Minkowski-Raumes. Im Gegensatz zum dreidimensionalen euklidischen Fall ist hier die Norm eines Vektors offenbar nicht mehr positiv definit, und es k¨onnen die F¨alle ⎧ ⎨> 0 xµ xµ = c2 t2 − x2 = 0 ⎩ t1 , c(t2 − t1 ) ≥ |x2 − x1 | ≥ x2 − x1 . In dem zu K mit der Geschwindigkeit v bewegten System K ergibt sich (cosh α ≥ 1, | tanh α| ≤ 1) c(t2 − t1 ) = c(t2 − t1 ) cosh α + (x2 − x1 ) sinh α = [c(t2 − t1 ) + (x2 − x1 ) tanh α] cosh α ≥ c(t2 − t1 )(1 + tanh α) ≥ 0 . Das Kausalit¨atsprinzip beh¨ alt also auch in der relativistischen Mechanik seine G¨ ultigkeit. Insbesondere bleibt in jedem Inertialsystem die chronologische Abfolge Vergangenheit-Gegenwart-Zukunft erhalten. In Abb. 1.23 sind diese drei Zeitbereiche im Minkowski-Raum graphisch dargestellt, wobei eine Raumrichtung unterdr¨ uckt ist. Vergangenheit, Gegenwart und Zukunft eines gegenw¨ artigen Ereignisses E sind jeweils getrennt durch Lichtkegel, deren Mantelfl¨achen durch Vektoren erzeugt werden, f¨ ur die gilt: ˙ =c. dxµ dxµ = 0 ⇐⇒ |x| Vektoren mit dieser Eigenschaft heißen lichtartig, da sie eine sich mit Lichtgeschwindigkeit ausbreitende Bewegung beschreiben. Die Ereignisse, die E beeinflußen k¨onnen (Vergangenheit) oder durch E beeinflußt werden k¨ onnen (Zukunft), liegen auf dem unteren bzw. oberen Lichtkegel oder in deren Innern. Der innere Bereich wird durch zeitartige Vektoren mit der Eigenschaft ˙ 0 ⇐⇒ |x|
106
1. Mechanik t
zeitartig
Zukunft
raumartig lichtartig
x
E Gegenwart
y
Vergangenheit
Abb. 1.23. Zur Einteilung der drei Zeitbereiche Vergangenheit, Gegenwart und Zukunft
beschrieben. Die Komplement¨armenge zur Vergangenheit und Zukunft von ¨ E ist die Gegenwart von E. Sie ist das Außere des Lichtkegels und wird durch raumartige Vektoren beschrieben, mit ˙ >c. dxµ dxµ < 0 ⇐⇒ |x| Dies ist der Bereich von Ereignissen, f¨ ur die E weder Ursache noch Wirkung sein kann. 1.6.4 Lorentzkovariante11 Formulierung der relativistischen Mechanik Nach dem Relativit¨atsprinzip muß es eine lorentzkovariante (forminvariante) Formulierung der relativistischen Mechanik geben, so daß die physikalischen Gesetze wie in der Newtonschen Mechanik in allen Inertialsystemen das gleiche Aussehen haben. Dies ist aber nur dann gew¨ahrleistet, wenn sich die entsprechenden Gr¨oßen (Geschwindigkeit, Impuls, Kraft, etc.) wie Vierervektoren transformieren. Offenbar trifft diese Forderung auf die Ableitung eines Vierervektors xµ nach seiner 0-ten Komponente nicht zu, weil das Zeitdifferential dx0 = cdt kein Lorentz-Skalar, d.h. unter beliebigen LorentzTransformationen nicht invariant ist: 11
Wie in vielen anderen Lehrb¨ uchern wird auch in diesem Buch das definierte Transformationsverhalten relativistischer Vierergr¨ oßen unter LorentzTransformationen mit lorentzkovariant“ umschrieben, ungeachtet das feinen ” Unterschiedes zwischen kovariant“ und kontravariant“. Dasselbe gilt f¨ ur re” ” lativistische Gleichungen, die ihre Form unter Lorentz-Transformationen nicht andern. Lorentzinvariant“ sind Gr¨ oßen bzw. Gleichungen, deren Wert unter ¨ ” Lorentz-Transformationen unver¨ andert bleibt (Lorentz-Skalar).
1.6 Relativistische Mechanik
107
ν dxµ µ dx = Λ . ν dx0 dx0 Da nun aber c die obere Grenzgeschwindigkeit jeglicher physikalischer Bewegung darstellt, ist xµ ein zeitartiger Vektor, so daß es zu jedem Zeitpunkt t ein Inertialsystem gibt, in dem das Teilchen ruht (momentanes Ruhesystem). Das heißt
dxµ dxµ = c2 dt2 − dx2 = c2 dt2 − dx2 = dxµ dxµ = c2 dτ 2 > 0 ,
(1.67)
wobei dτ das Zeitdifferential des Ruhesystems (Eigenzeitdifferential) ist. Division der letzten Beziehung durch dτ 2 ergibt 2 2 dxµ dxµ dt dx dxµ dxµ = c2 − = dτ dτ dτ dτ dτ dτ 2 2 dt dx = c2 . − = c2 dτ dτ Demnach ist dxµ /dτ ein zeitartiger Vierervektor mit der L¨ ange c, transformiert sich also unter beliebiger Lorentz-Transformation Λ wie dxµ dxν = Λµ ν , dτ dτ und wir erhalten mit (1.67) den
(1.68)
Satz 1.36: Eigenzeitdifferential dτ Das Eigenzeitdifferential 2 2 1 dx 1 dx dτ = dt 1 − 2 = dt 1 − 2 = ... c dt c dt ist ein Lorentz-Skalar und gibt die Zeitskala im Ruhesystem eines relativ zu Inertialsystemen K, K , . . . bewegten Objektes an. Diese Gleichung dr¨ uckt noch einmal die Zeitdilatation in differentieller Form, verallgemeinert auf beschleunigte Bewegungen, aus. Aufgrund seines Transformationsverhaltens (1.68) heißt dxµ /dτ Vierergeschwindigkeit. Sie ist mit der physikalischen Geschwindigkeit x˙ in folgender Weise verbunden: Definition: Vierergeschwindigkeit uµ , physikalische Geschwindigkeit x˙ µ dt dxµ 1 dx = = (uµ ) = dτ dτ dt 1−
˙2 x c2
c x˙
.
108
1. Mechanik
Die Ableitung eines Vierervektors nach der Eigenzeit τ f¨ uhrt immer wieder auf Vierervektoren, so daß sich nun die u ¨brigen Gr¨oßen der lorentzkovarianten relativistischen Mechanik leicht konstruieren lassen. Der Impuls wird analog zur Newtonschen Mechanik definiert durch: Definition: Viererimpuls pµ , physikalischer Impuls p (pµ ) = m0 (uµ ) µ m0 dx cm = , p = mx˙ , = 2 p dt 1 − xc˙ 2
(1.69)
wobei m0 ein Lorentz-Skalar, also die Masse des Teilchens, gemessen in seinem Ruhesystem, (Ruhemasse) sein muß. Aus dieser Definition folgt, daß die Masse m keine Konstante mehr ist, sondern explizit geschwindigkeitsabh¨angig und sich gem¨ aß der Gleichung m0 m = m(t) = 2 1 − xc˙ 2 verh¨ alt. Die Kraft definieren wir entsprechend durch: Definition: Viererkraft F µ , physikalische Kraft F µ µ 1 dp dp µ = (F ) = 2 dt dτ 1 − xc˙ 2 c dm 1 dp dt . = , F = 2 dt F 1 − x˙
(1.70)
c2
Gleichung (1.70) stellt gleichzeitig die lorentzkovariante Bewegungsgleichung der relativistischen Mechanik dar. Man u uft leicht, daß die Gleichungen ¨berpr¨ (1.69) und (1.70) neben dem Relativit¨atsprinzip auch das Korrespondenzprin˙ c in die entsprechenden zip erf¨ ullen und f¨ ur kleine Geschwindigkeiten |x| Ausdr¨ ucke der Newtonschen Mechanik u ¨bergehen. Es ist nicht immer m¨oglich, eine vollst¨andig kovariante Formulierung eines gegebenen mechanischen Problems durch (1.70) anzugeben, da nicht alle Typen von Kr¨ aften als Vierergr¨oßen zur Verf¨ ugung stehen. Hierzu geh¨ort z.B. die Gravitationskraft. Sie setzt als statische Fernwirkungskraft“ eine ” unendlich große Ausbreitungsgeschwindigkeit voraus und steht somit im Widerspruch zum ersten Axiom der Relativit¨atstheorie. Ein anderes Beispiel sind die Zwangsbedingungen eines starren K¨orpers, da sie nur die Raumanteile von Vierervektoren beinhalten. Das gesamte Gebiet der Dynamik starrer K¨ orper besitzt deshalb kein relativistisches Analogon.
1.6 Relativistische Mechanik
109
Physikalische Folgerungen. Bewegt sich ein Teilchen in einem konservativen Kraftfeld, dann gilt ⎛ ⎞ d ⎝ m0 x˙ ⎠ dp = = −∇V (x) . F = 2 dt dt 1 − x˙ c2
Multiplikation dieser Gleichung mit x˙ liefert ⎛ ⎛ ⎞ ⎞ 2 d ⎝ m0 c ⎠ d d ⎝ m0 x˙ ⎠ x˙ = = −∇V (x)x˙ = − V (x) . dt dt dt ˙2 ˙2 x x 1− 1− c2
c2
Hieraus folgt der Satz 1.37: Relativistische Energieerhaltung in konservativen Kraftfeldern mc2 + V (x) = E = const . Im Falle kleiner Geschwindigkeiten x˙ 2 /c2 1 geht diese Beziehung u ¨ber in m 0 2 m0 c2 + x˙ + . . . + V (x) = E , 2 was bis auf die physikalisch irrelevante Konstante m0 c2 der klassischen Energieerhaltung entspricht. Wir definieren deshalb: Definition: Kinetische Energie T m0 c2 − m0 c2 . T = mc2 − m0 c2 = ˙2 x 1 − c2 Der Ausdruck m0 c2 wird als Ruheenergie des Teilchens bezeichnet. Man beachte, daß die in der klassischen Mechanik geltende Beziehung dT ˙ x = F x˙ = mx¨ dt auch in der relativistischen Mechanik gilt, denn wir haben ⎛ ⎞ ˙x x˙ d dT d ⎝ ⎠ = m0 x¨ F x˙ = m0 x˙ = (mc2 ) = . 3/2 2 dt dt dt 2 1 − xc˙ 2 c2 1 − xc˙ 2 Bei Abwesenheit ¨ außerer Kr¨ afte reduziert sich Satz 1.37 auf die ber¨ uhmte Einsteinsche Gleichung E = mc2 = p0 c . Sie besagt, daß Energie und Masse ¨ aquivalent, also auch ineinander transformierbar sind. Weiterhin folgt hieraus zusammen mit (1.69) der
110
1. Mechanik
Satz 1.38: Relativistische Energie-Impuls-Beziehung f¨ ur freie Teilchen 2
pµ pµ = p0 − p2 = m20 c2 ⇐⇒ E 2 = m20 c4 + p2 c2 . Es sei hier vermerkt, daß die Definitionen des Viererimpulses und der Viererkraft eindeutig sind, wenn man gr¨oßtm¨ogliche Analogie zur Newtonschen Mechanik unter Beachtung des Relativit¨ats- und Korrespondenzprinzips fordert. Die Definitionen der physikalischen Dreiergr¨oßen p und F folgen jedoch a priori nicht eindeutig aus denen der zugeh¨origen Vierervektoren. Sie sind vielmehr eine Konsequenz aus experimentellen Erfahrungen. Man beobachtet z.B., daß bei Teilchenbeschleunigern immer mehr Energie aufgewendet werden muß, um Teilchen auf nahezu Lichtgeschwindigkeit zu bringen. Dies deutet auf eine mit der Geschwindigkeit zunehmende Masse hin, so daß die Definitionsgleichung (1.69) physikalisch sinnvoller ist als p = m0 dx/dt. Eine andere Beobachtung ist der sog. Massendefekt, der besagt, daß z.B. die Masse eines Atomkerns kleiner ist als die Summe der Konstituentenmassen. Daraus folgt offensichtlich, daß ein Teil der Konstituentenmassen im Atomkern als Bindungsenergie auftritt bzw. absorbiert wird. Durch die hier gew¨ahlte ¨ Definition der physikalischen Kraft (1.70) wird diese Masse-Energie-Aquivalenz automatisch vorhergesagt. Die Tatsache also, daß bis auf die Ersetzung m0 → m die relativistischen kinematischen Dreiergr¨oßen mit den entsprechenden Gr¨ oßen der Newtonschen Mechanik formal identisch sind (Einfachheit der Theorie), hat uns zusammen mit experimenteller Konsistenz zu obigen Definitionen gef¨ uhrt. Betrachten wir zum Schluß die gegenseitige Wechselwirkung relativistischer Teilchen ohne ¨außere Krafteinwirkung. Dann lassen sich Energie- und Impulserhaltung in eine einzige Gleichung f¨ ur die Viererimpulse der Teilchen ausdr¨ ucken: µ µ pi = pj , (1.71) i
j
wobei die Anfangsviererimpulse und pµ j die Viererimpulse im Endzustand ¨ sind. Aufgrund der Energie-Masse-Aquivalenz gilt diese Gleichung in einem sehr allgemeinen Sinne: Es k¨onnen in dem betrachteten Wechselwirkungsprozeß Teilchen erzeugt und vernichtet werden. F¨ ur alle beteiligten Teilchen gelten dabei nach Satz 1.38 die Massenschalenbedingungen pµi
2 2 pµi pµ,i = m2i c2 , pµ j pµ,j = mj c ,
(1.72)
wobei mi und mj die Ruhemassen der Teilchen im Anfangs- bzw. Endzustand bezeichnen. Viele physikalische Effekte wie z.B. der Massendefekt (Anwendung 18) oder Compton-Effekt (Anwendung 19) lassen sich auf die Erhaltung des Viererimpulses zur¨ uckf¨ uhren.
1.6 Relativistische Mechanik
111
1.6.5 Lagrange-Formulierung der relativistischen Mechanik Nachdem eine mit der speziellen Relativit¨ atstheorie im Einklang stehende Verallgemeinerung der Newtonschen Bewegungsgleichung gefunden wurde, soll nun die Lagrange-Formulierung der relativistischen Mechanik untersucht werden. Der einfachste Weg zum Aufstellen einer relativistischen LagrangeFunktion ist, das Hamiltonsche Prinzip, Satz 1.18, zu verwenden und eine Lagrange-Funktion L zu suchen, f¨ ur die die Lagrange-Gleichungen die richtigen relativistischen Bewegungsgleichungen liefern. Betrachten wir von vornherein den Fall, daß sich die Kraft aus einem generalisierten Potential nach (1.31) in der Weise d ˙ t) ˙ t) = −∇Vx (x, x, ˙ t) + ∇x˙ V (x, x, F (x, x, dt darstellen l¨aßt, dann f¨ uhrt der folgende Ansatz f¨ ur die Lagrange-Funktion eines einzelnen Teilchens in diesem Kraftfeld zum richtigen Ergebnis: x˙ 2 L = −m0 c2 1 − 2 − V . (1.73) c Denn es gilt m0 x˙ ∇x L = −∇x V , ∇x˙ L = − ∇x˙ V 2 1 − xc˙ 2 ⎛ ⎞ d ⎝ m0 x˙ ⎠ d =⇒ = −∇x V + ∇x˙ V = F . 2 dt dt 1 − x˙ c2
Hierbei ist zu beachten, daß (1.73) nicht mehr durch L = T − V gegeben ist. Man kann bisher Gesagtes leicht auf Systeme mit vielen Teilchen verallgemeinern und von kartesischen Koordinaten xj auf irgend einen Satz generalisierter Koordinaten qi u ¨bergehen. Auch hierbei sind die Hamilton-Funktion H und der generalisierte Impuls pi definiert durch H=
n i=1
pi q˙i − L , pi =
∂L , ∂ q˙i
so daß die S¨ atze 1.22 und 1.23 ihre G¨ ultigkeit behalten. Beschr¨ ankt man sich u afte (∂V /∂ q˙i = 0), dann liefert auch hier ¨berdies auf konservative Kr¨ die Hamilton-Funktion die Gesamtenergie des Systems. Beispielsweise folgt unter Ber¨ ucksichtigung von Satz 1.37 im Fall eines einzelnen Teilchens m0 c2 ˙ x˙ L − L = + V = E = const . H = x∇ 2 1 − xc˙ 2
112
1. Mechanik
Lorentzkovariante Lagrange-Formulierung. Das soeben angegebene dreidimensionale Lagrange-Verfahren liefert die korrekten relativistischen Bewegungsgleichungen innerhalb eines Inertialsystems. Es handelt sich hierbei jedoch nicht um eine (vierdimensionale) lorentzkovariante Formulierung, die in jedem Inertialsystem das gleiche Aussehen hat. Um zu ihr zu gelangen, hat man vom lorentzinvarianten Hamiltonschen Prinzip ˜ −→ extremal S = dτ L auszugehen, aus dem sich z.B. f¨ ur ein einzelnes Teilchen die LagrangeGleichungen ˜ ˜ ∂L d ∂L − =0 (1.74) µ dτ ∂u ∂xµ ˜ die lorentzinvariante Lagrange-Funktion, dτ das herleiten lassen. Hierbei ist L µ Eigenzeitdifferential, x der Vierervektor und uµ die Vierergeschwindigkeit ˜ in der Weise zu w¨ahlen, des Teilchens. Im Falle eines freien Teilchens ist L daß (1.74) auf die kovariante Bewegungsgleichung dpµ duµ = m0 =0 dτ dτ f¨ uhrt. Dies ist offensichtlich der Fall f¨ ur m m 0 0 α α β ˜= u uα = u gαβ u , L 2 2 denn es gilt ˜ ˜ ∂L m0 ∂L (gµβ uβ + uα gαµ ) = m0 gµα uα = m0 uµ =0, = µ µ ∂u 2 ∂x duµ duµ = 0 ⇐⇒ m0 =0. =⇒ m0 dτ dτ Es wurde bereits im letzten Unterabschnitt auf die Unm¨oglichkeit einer kovarianten Formulierung beim Vorliegen der Gravitationskraft oder anderer Fernwirkungskr¨afte“ hingewiesen. Eine besonders erw¨ahnenswerte Kraft, die ” indes eine kovariante Formulierung erm¨oglicht, ist die Lorentz-Kraft, welche die Bewegung eines geladenen Teilchens in einem elektromagnetischen Feld beschreibt. Wir werden dies im Rahmen der Elektrodynamik in den Abschnitten 2.3 und 2.8 diskutieren. Zusammenfassung • Die spezielle Relativit¨ atstheorie beruht auf zwei Axiomen, n¨amlich der Konstanz der Lichtgeschwindigkeit und dem Relativit¨ atsprinzip. In dieser Theorie stellt die Zeit eine zu den drei Raumrichtungen gleichberechtigte Dimension im Minkowski-Raum dar und nicht, wie in der Newtonschen Mechanik, einen ¨außeren Parameter.
Anwendungen
113
¨ • Der Ubergang von einem Inertialsystem zu einem anderen wird durch Lorentz-Transformationen beschrieben. Durch sie ergeben sich typisch-relativistische Effekte wie z.B. die Zeitdilatation und die L¨ angenkontraktion. • Anhand der Additionsformeln relativistischer Geschwindigkeiten erkennt man explizit, daß die Lichtgeschwindigkeit die obere Grenze f¨ ur jede Art von Teilchenbewegung ist. • Mit Hilfe des Konzepts von Vierervektoren l¨ aßt sich die relativistische Mechanik – wie im Relativit¨ atsprinzip gefordert – in lorentzkovarianter Weise formulieren. Hierbei spielt das momentane Ruhesystem bzw. das Eigenzeitdifferential eine entscheidende Rolle. ˙ c gehen die Gesetzm¨ • F¨ ur kleine Geschwindigkeiten |x| aßigkeiten der relativistischen Mechanik dem Korrespondenzprinzip entsprechend in die der Newtonschen Mechanik u ¨ber. • Zur Beschreibung der relativistischen Mechanik mittels des LagrangeFormalismus bedient man sich des Hamiltonschen Prinzips und sucht eine Lagrange-Funktion, f¨ ur die die zugeh¨ origen Lagrange-Gleichungen die richtigen Bewegungsgleichungen liefern.
Anwendungen 16. Zwillingsparadoxon. Eine Rakete starte zur Zeit t = 0 von der Erde aus und beschleunige mit 20-facher Erdbeschleunigung gleichm¨ aßig auf 0.9c. Danach fliege sie mit konstanter Geschwindigkeit ein Jahr und bremse dann wieder gleichm¨ aßig mit 20-facher Erdbeschleunigung auf 0 herunter. Der R¨ uckflug zur Erde geschehe auf die gleiche Weise. Man vergleiche die Gesamtflugzeiten, die im Erd- und Raketensystem gemessen werden, wobei sich alle gemachten Angaben auf das Erdsystem beziehen. L¨ osung. Der Raketenflug enth¨ alt zwei Beschleunigungs- und zwei Brems2 phasen, f¨ ur die gilt (c = 3 · 108 m/s, g = 10 m/s ): m x(t) ˙ = ±g t , g = 20g = 200 2 , ∆x˙ = ±0.9c s =⇒ ∆t1 = 1.35 · 106 s = 15.6 Tage , und zwei konstante Flugphasen mit x(t) ˙ = ±0.9c , ∆t2 = 365 Tage . Damit ergibt sich als Gesamtflugzeit im Erdsystem T = 4∆t1 + 2∆t2 = 792.4 Tage .
114
1. Mechanik
Die entsprechenden Etappenzeiten im Raketensystem berechnen sich nach Satz 1.36 zu
∆t1
∆t1 g 2 2 1 g 2 2 c g t 1 − 2 t + arcsin ∆τ1 = dt 1 − 2 t = t c 2 c g c 0
0
= 1.13 · 10 s = 13.1 Tage 6
∆t2 √ ∆τ2 = dt 1 − 0.81 = 159.1 Tage . 0
Die Gesamtflugzeit im Raketensystem ist somit τ = 4∆τ1 + 2∆τ2 = 370.6 Tage . Nach R¨ uckkehr auf die Erde ist also der Astronaut um weniger als die H¨alfte gegen¨ uber einem Erdbewohner gealtert. Dieser Sachverhalt beinhaltet eine paradoxe Aussage. Denn man kann sich aufgrund des Relativit¨atsprinzips nat¨ urlich auch auf den Standpunkt stellen, daß sich die Erde von der Rakete entfernt und wieder zu ihr zur¨ uckkommt. Demnach m¨ ußte der Astronaut gegen¨ uber einem Erdbewohner schneller gealtert sein. Die Aufl¨osung dieser vermeintlich parit¨atischen Situation ist, daß faktisch nur der Astronaut eine (absolute) Beschleunigung erfahren hat und somit nicht immer in einem Inertialsystem war. ¨ 17. Ubergang zum momentanen Ruhesystem. Eine Rakete habe eine konstante Beschleunigung a, gemessen in ihrem momentanen Ruhesystem K . Man zeige, daß ihre Geschwindigkeit in dem Bezugssystem K, von dem aus die Rakete bei t = 0 in x-Richtung startet, gegeben ist durch c x˙ = . 2 1 + ac2 t2 L¨ osung. Wir ben¨otigen die momentane Lorentz-Transformation ⎛ ⎞ cosh α sinh α 0 0 ⎜ sinh α cosh α 0 0 ⎟ ⎟ , (Λµ ν ) = ⎜ ⎝ 0 0 1 0⎠ 0 0 01 uhrt. F¨ ur sie gilt die K in K u ¨berf¨ ⎛ ⎞ ⎛ ⎞ c c ⎟ ⎜0⎟ dt ⎜ x ˙ µ µ ν µ µ ⎜ ⎟ , (u ) = ⎜ ⎟ u = Λ ν u , (u ) = ⎝0⎠ dτ ⎝ 0 ⎠ 0 0 =⇒ cosh α =
x˙ dt dt , sinh α = − . dτ c dτ
Anwendungen
115
Die Viererbeschleunigung bµ in K ist ⎛ ⎞ ⎛ ⎞ 0 c ⎟ ⎜ dx˙ ⎟ d µ d2 t ⎜ ⎜ x˙ ⎟ + dt ⎜ dτ ⎟ (u ) = (bµ ) = ⎝ ⎠ 2 0 dτ dτ dτ ⎝ 0 ⎠ 0 0 ⎛ ⎞ ⎛ ⎞ c 2 0 ⎟ ⎜x ⎟ d2 t ⎜ x ˙ ⎜ ⎟ + dt ⎜¨⎟ . = ⎝ ⎠ ⎝ 2 0 0⎠ dτ dτ 0 0 Damit ergibt sich f¨ ur die x-Komponente der Viererbeschleunigung der Rakete in ihrem Ruhesystem 3 dt x ¨ 1 1 ν b = Λ νb = x ¨ = , 2 3/2 dτ 1 − xc˙ 2 2 und es folgt f¨ ur x˙ = c/ 1 + ac2 t2 b1 = a . 18. Massendefekt. Man betrachte einen ruhenden Kern der Ruhemasse allt. Wie M , der in zwei leichtere Kerne mit den Ruhemassen m1 und m2 zerf¨ groß sind die Energien der Zerfallsprodukte. L¨ osung. Der Viererimpuls pµ des Kerns vor dem Zerfall und die Viererimµ pulse pµ 1 , p2 der beiden Zerfallsprodukte sind p10 p20 Mc µ , (p , ) = ) = , (pµ (pµ ) = 1 2 p1 p2 0 wobei die Massenschalenbedingung (1.72) f¨ ur den ruhenden Kern bereits ber¨ ucksichtigt ist. Die Viererimpulserhaltung (1.71) und Massenschalenbedingungen f¨ ur die Zerfallskerne liefern zusammen 4 Gleichungen f¨ ur die Gr¨ oßen p10 , p20 , p1 , p2 : p10 + p20 = M c p1 + p2 = 0 2 2 2 p2 10 − p1 = m1 c 2 2 2 p2 20 − p2 = m2 c .
Es folgt f¨ ur die Energie der Zerfallsprodukte 2 2 2 2 p2 10 − p20 = (m1 − m2 )c ⇐⇒ (p10 + p20 )(p10 − p20 ) = M c(p10 − p20 ) = (m21 − m22 )c2 ⎧ E1 c ⎪ = (M 2 + m21 − m22 ) ⎨ p10 = c 2M =⇒ ⎪ ⎩ p = E2 = (M 2 − m2 + m2 ) c . 1 2 20 c 2M
116
1. Mechanik
Schreibt man die ersten beiden Bedingungen der obigen vier Gleichungen in der Form m21 c2 + p2 + m22 c2 + p2 1 1 = Mc , so ergibt sich offensichtlich f¨ ur |p1 | > 0 M > m1 + m2 , d.h. die Ruhemasse des zerfallenden Kerns muß gr¨oßer sein als die Summe der Ruhemassen der Zerfallskerne. Die Differenz M − (m1 + m2 ) ist der Massendefekt; er wird beim Zerfallsprozeß in kinetische Energie der Zerfallskerne umgesetzt. 19. Compton-Effekt. Ein Photon (der Ruhemasse 0) trifft auf ein ruhendes Elektron. Man berechne den Impuls des Photons nach der Streuung am Elektron in Abh¨angigkeit von seinem anf¨anglichen Impuls und seines Streuwinkels (Abb. 1.24).
k k
θ p
Abb. 1.24. Zur Streuung eines Photons an ein ruhendes Elektron
L¨ osung. Die Viererimpulse k µ , k µ des Photons und pµ , pµ des Elektrons vor und nach der Streuung sind |k| me c |k | p0 µ µ µ µ , (p ) = , , (k ) = , (p ) = (k ) = k 0 p k wobei die Massenschalenbedingungen f¨ ur k µ , pµ und k µ bereits ber¨ ucksichtigt sind. Die Viererimpulserhaltung und Massenschalenbedingung f¨ ur das gestreute Elektron ergeben zusammen das Gleichungssystem |k| + me c = |k | + p0 k = k + p 2 p2 = m2e c2 , 0 −p
woraus folgt: 2 2 2 2 2 2 p2 0 = me c + p = me c + (k − k )
⇐⇒ (|k| + me c − |k |)2 = m2e c2 + (k − k )2 . Dies f¨ uhrt mit kk = |k||k | cos θ zu 1 1 1 + = (1 − cos θ) . |k | |k| me c
2. Elektrodynamik
Die Elektrodynamik ist eine klassische Feldtheorie, die sich mit elektromagnetischen Ph¨ anomenen besch¨ aftigt. Sie beruht u.a. auf Beobachtungen, die bis zur zweiten H¨ alfte des 18. Jahrhunderts zur¨ uckreichen, als Coulomb die Kr¨afte zwischen elektrisch geladenen K¨ orpern untersuchte. Etwa 50 Jahre sp¨ater studierte Faraday die Auswirkungen von Str¨ omen und magnetischen Feldern. Die heutige moderne Form der Elektrodynamik basiert auf den vier von James Clerk Maxwell im Jahre 1864 formulierten Maxwell-Gleichungen, aus denen sich alle elektromagnetischen Effekte herleiten lassen. Die Verbindung zwischen der Bewegung geladener Teilchen und den elektromagnetischen Feldern wird durch die Lorentz-Kraftgleichung hergestellt. Vom mathematischen Standpunkt aus gesehen ist die Elektrodynamik u okonomisch. Im Gegensatz zur Newtonschen Mechanik ¨beraus elegant und ¨ ist sie u ¨berdies eine relativistische Theorie, in der die endliche Ausbreitungsgeschwindigkeit von Information ber¨ ucksichtigt ist. Demzufolge k¨ onnen Teilchen, deren Abstandsvektor raumartig ist, nicht miteinander wechselwirken. ¨ Ahnlich wie in der Mechanik hat sich auch in der Elektrodynamik das Konzept der Punktteilchen ¨ außert erfolgreich bew¨ ahrt. Allerdings ist die klassische Elektrodynamik nicht bis hinunter zu kleinsten Abst¨ anden g¨ ultig, sondern als klassischer Grenzfall einer modernen Quantenfeldtheorie, der sog. Quantenelektrodynamik, zu betrachten. Am Anfang dieses Kapitels steht die Einf¨ uhrung in den formalen Aufbau der Elektrodynamik. Es werden die Grundgleichungen der Theorie, die Maxwell-Gleichungen und die Lorentz-Kraftgleichung, dargelegt, interpretiert und ph¨anomenologisch begr¨ undet. Abschnitt 2.2 besch¨ aftigt sich mit der allgemeinen L¨ osung der MaxwellGleichungen. Hierzu f¨ uhren wir ein Skalar- und ein Vektorpotential ein, so daß die homogenen Maxwell-Gleichungen automatisch erf¨ ullt sind und die inhomogenen Maxwell-Gleichungen in zwei inhomogene Potentialgleichungen u uhrt werden k¨ onnen. Durch Ausnutzen gewisser, mit den Potentialen ¨berf¨ verbundener Eichfreiheiten lassen sich diese Gleichungen entkoppeln und somit relativ leicht l¨ osen. Man erh¨ alt als inhomogene L¨ osung die sog. retardierten Potentiale, in denen die endliche Ausbreitungsgeschwindigkeit von Signalen explizit zum Ausdruck kommt.
118
2. Elektrodynamik
Da die Elektrodynamik eine relativistische Theorie ist, k¨onnen wir sie so umformulieren, daß ihre relativistische Forminvarianz offensichtlich zu Tage tritt. Dies ist Gegenstand des Abschn. 2.3. Wir zeigen, daß sich alle elektrodynamischen Grundgr¨oßen zu relativistischen Vierergr¨oßen zusammenfassen lassen, die ein definiertes Transformationsverhalten unter LorentzTransformationen besitzen. upft an Abschn. 2.2 an und besch¨aftigt sich mit der Abschnitt 2.4 kn¨ Berechnung der retardierten Potentiale f¨ ur beliebig bewegte Punktladungen bzw. r¨ aumlich begrenzte Ladungs- und Stromdichten. Hierbei wird sich als ein wesentliches Resultat herausstellen, daß nur beschleunigte Ladungen elektromagnetische Strahlung emittieren. Im Falle ausschließlich statischer (zeitunabh¨angiger) Ladungs- und Stromdichten entkoppeln die Maxwell-Gleichungen in zwei Gleichungssysteme, welche die Grundgleichungen der Elektrostatik und der Magnetostatik bilden. Mit diesen beiden Spezialf¨allen der Elektrodynamik wollen wir uns in Abschn. 2.5 besch¨ aftigen. Abschnitt 2.6 ist der Elektrodynamik in Materie gewidmet. Obwohl die Maxwell-Gleichungen sowohl im Vakuum als auch in materiellen Medien gelten, ist es im letzteren Fall aufgrund der großen Zahl geladener Teilchen im betrachteten Medium (und deren Variation auf atomarer L¨angenskala) g¨ unstiger, die Gleichungen in Termen makroskopischer Felder umzuformulieren. Hierzu werden zwei weitere materialabh¨angige Felder eingef¨ uhrt, die mit den makroskopischen Feldern u ¨ber ph¨anomenologische Material-Gleichungen verbunden sind. Abschnitt 2.7 besch¨aftigt sich mit der Ausbreitung elektromagnetischer Wellen in leitenden und nichtleitenden Medien. Wir untersuchen u.a. die Reflexion und Brechung elektromagnetischer Wellen an der Grenzschicht zweier verschiedener Medien. Ein interessanter Effekt ist das Zerfließen von Wellenpaketen in dispersiven Medien, das durch die unterschiedliche Ausbreitungsgeschwindigkeit der Fourier-Komponenten des Wellenpaketes zustande kommt. Der letzte Abschnitt dieses Kapitels behandelt die Lagrangesche Formulierung der Elektrodynamik. Ihre Bedeutung liegt nicht so sehr, wie etwa in der Mechanik, in ihrem praktischen Nutzen, sondern eher darin, daß man durch sie ein fundamentaleres Verst¨andnis von Symmetrieprinzipien, insbesondere von Eichsymmetrien und den damit verbundenen Implikationen, erlangt. Man findet die hier vorgef¨ uhrten Argumentationen in allen (Quanten-) Feldtheorien der modernen Physik wieder.
2.1 Formalismus der Elektrodynamik In diesem Abschnitt wird der allgemeine Formalismus der Elektrodynamik vorgestellt. Wir beginnen unsere Diskussion mit den Maxwell-Gleichungen
2.1 Formalismus der Elektrodynamik
119
und der Lorentz-Kraft, welche eine Verbindung zwischen der Elektrodynamik und der Mechanik herstellt, sowie der Kontinuit¨ atsgleichung, die die Erhaltung der Ladung in einem abgeschlossenen System widerspiegelt. Anschließend werden die Maxwell-Gleichungen im Hinblick auf deren zugrunde liegenden ph¨ anomenologischen Erkenntnisse sowie auf allgemein mathematische Eigenschaften interpretiert. Zum Schluß leiten wir den Energie- und Impulssatz der Elektrodynamik her. 2.1.1 Maxwell-Gleichungen und Lorentz-Kraft Elektromagnetische Ph¨ anomene werden durch zwei fundamentale Vektorfelder beschrieben, • dem elektrischen Feldvektor E(x, t) und • dem magnetischen Induktionsfeldvektor B(x, t).1 Ursache dieser Felder sind • die elektrische Ladungsdichte ρ(x, t) und • der elektrische Stromdichtevektor j(x, t). Die Felder E und B sind mit den Gr¨ oßen ρ und j u ¨ber ein gekoppeltes System von partiellen Differentialgleichungen 1. Ordnung verbunden, die wir als Ausgangspunkt der Theorie axiomatisch voranstellen: Satz 2.1: Maxwell-Gleichungen ∇E(x, t) = 4πρ(x, t) ∇ × E(x, t) +
1 ∂B(x, t) =0 c ∂t
∇B(x, t) = 0 ∇ × B(x, t) −
(I) (II) (III)
1 ∂E(x, t) 4π = j(x, t) . c ∂t c
(IV)
Wir verwenden in diesem Kapitel durchweg das Gaußsche Einheitensystem, auf das am Ende dieses Abschnittes genauer eingegangen wird. Die Theorie des Elektromagnetismus wird durch jene Gleichung vervollst¨ andigt, die die Kraft auf ein geladenes Teilchen angibt, das sich in einem elektromagnetischen Feld befindet:
1
Wir werden im weiteren Verlauf die Begriffe magnetisches Induktionsfeld“ und ” Magnetfeld“ synonym verwenden, obwohl letzterer eigentlich dem (makrosko” pischen) Feld H vorbehalten ist. Siehe Fußnote 15 auf Seite 197.
120
2. Elektrodynamik
Satz 2.2: Lorentz-Kraft Die gesamte elektromagnetische Kraft auf ein Teilchen der Ladung q, welches sich mit der Geschwindigkeit x˙ innerhalb der Felder E und B bewegt, ist gegeben durch ˙ x(t) × B(x, t) . (2.1) F L (x, t) = q E(x, t) + c Der erste Term dieser Gleichung beschreibt die Kraft des elektrischen Feldes auf die Ladung und ist parallel zu E gerichtet. Der zweite Term liefert die durch das magnetische Feld hervorgerufene Kraft. Sie steht senkrecht zu B und der Geschwindigkeit x˙ der Ladung. Hieraus folgt unmittelbar, daß das magnetische Feld keine Arbeit an dem Teilchen verrichtet. Interpretation der Lorentz-Kraft. Die meisten Probleme der Elektrodynamik lassen sich in zwei Klassen unterteilen. Zum einen stellt sich die Frage nach den elektromagnetischen Feldern bei vorgegebener Strom- und Ladungsdichte. Zum anderen ist man bei gegebenen Feldern an deren Wirkung auf eine Testladung interessiert. Es scheint so, als seien diese zwei Problemstellungen v¨ ollig entkoppelt. Jedoch ist zu beachten, daß sich die Felder in (2.1) im Prinzip aus der Superposition aller Felder ergeben. Das heißt, daß die Felder, welche die Testladung selbst erzeugt, einzubeziehen sind. Im Prinzip m¨ ußten derlei R¨ uckwirkungseffekte in einem selbstkonsistenten Formalismus ber¨ ucksichtigt werden. Nun ist es jedoch m¨oglich, zu zeigen, daß solche Effekte zumeist vernachl¨assigbar klein sind. Bezeichnet λ einen charakteristischen Abstand des Problems, dann k¨onnen wir R¨ uckwirkungseffekte vernachl¨assigen, falls gilt:
0 . c ∂t c ∂t Es wird also eine positive Umlaufspannung induziert; der Strom fließt im mathematisch positiven Sinne. BF = −|B||F | =⇒ V = −
2.2 L¨ osungen der Maxwell-Gleichungen in Form von Potentialen Die Maxwell-Gleichungen stellen ein System von vier gekoppelten Differentialgleichungen 1. Ordnung f¨ ur die Felder E und B dar. Nun ist es durch Einf¨ uhren eines Vektorpotentials A und eines Skalarpotentials φ m¨oglich, die Maxwell-Gleichungen in zwei Differentialgleichungen 2. Ordnung zu u uh¨berf¨ ren. Oftmals erweist es sich als g¨ unstiger, diese Potentiale zu berechnen und daraus dann die Felder E und B abzuleiten. Dabei stellt sich heraus, daß die Potentiale nicht eindeutig definiert sind; ganze Klassen von Potentialen 8
Man beachte: Die Richtung des Stromes ist der Bewegungsrichtung der freien Leitungselektronen mit negativer Ladung entgegengesetzt (technische Stromrichtung).
2.2 L¨ osungen der Maxwell-Gleichungen in Form von Potentialen
133
f¨ uhren zu denselben elektromagnetischen Feldern und sind u ¨ber Eichtransformationen miteinander verbunden, welche gerade auch in modernen Quantenfeldtheorien eine u ¨beraus wichtige Rolle spielen. Dieser Abschnitt besch¨ aftigt sich mit der allgemeinen L¨ osung der MaxwellGleichungen in Form von Potentialen. Nach deren Einf¨ uhrung werden Eichtransformationen und damit verbundene Eichbedingungen ausf¨ uhrlich diskutiert. Es schließen sich Herleitungen der allgemeinen homogenen und einer speziellen inhomogenen L¨ osung (retardierte Potentiale) der MaxwellGleichungen an. 2.2.1 Skalarpotential und Vektorpotential Die Potentiale A und φ sind in folgender Weise definiert: Definition: Vektorpotential A, Skalarpotential φ ⎫ B(x, t) = ∇ × A(x, t) ⎪ ⎬ E(x, t) +
1 ∂A(x, t) ⎭ = −∇φ(x, t) . ⎪ c ∂t
(2.15)
Man u ¨berzeugt sich leicht davon, daß durch diese Definitionen die homogenen Maxwell-Gleichungen (II) und (III) automatisch erf¨ ullt sind. F¨ ur die verbleibenden inhomogenen Maxwell-Gleichungen (I) und (IV) folgen die Potentialgleichungen 1 ∂ ∇A(x, t) = −4πρ(x, t) (2.16) c ∂t 1 ∂ 2 A(x, t) 1 ∂φ(x, t) ∇2 A(x, t) − 2 − ∇ ∇A(x, t) + c ∂t2 c ∂t 4π (2.17) = − j(x, t) . c Durch Einf¨ uhren von Potentialen reduziert sich also das Problem des Auffindens von insgesamt sechs Komponenten der Felder E und B auf die Bestimmung von insgesamt vier Komponenten von A und φ. Dennoch ist in (2.16) und (2.17) noch keine Vereinfachung des Problems zu erkennen, da diese Beziehungen nach wie vor in den Feldern A und φ gekoppelt sind. Nun enthalten die Potentiale jedoch gewisse Eichfreiheiten, die man benutzen kann, um das Vektorpotential derart zu adjustieren, daß (2.16) und (2.17) entkoppeln. Dies ist Gegenstand des folgenden Unterabschnittes. ∇2 φ(x, t) +
2.2.2 Eichtransformationen In der Elektrodynamik sind Eichtransformationen in folgender Weise definiert:
134
2. Elektrodynamik
Definition: Eichtransformationen Transformationen der Art A(x, t) −→ A (x, t) = A(x, t) + ∇χ(x, t) 1 ∂χ(x, t) φ(x, t) −→ φ (x, t) = φ(x, t) − , c ∂t mit einer beliebigen skalaren Funktion χ(x, t) heißen Eichtransformationen. Sie lassen die elektromagnetischen Felder E und B invariant. Man beachte, daß alle Feldgleichungen und somit auch alle physikalischen Vorhersagen unter diesen Eichtransformationen eichinvariant sind. Da die Potentiale in der Elektrodynamik nicht direkt beobachtbar sind, werden sie h¨ aufig als unphysikalisch angesehen. Diese Aussage ist jedoch nur auf klassischem Level korrekt. Im Rahmen der Quantenmechanik werden wir sehen, daß es Situationen gibt, in denen das Vektorpotential selbst durchaus eine Rolle spielt (Quantisierung des magnetischen Flusses, Bohm-AharanovEffekt, Unterabschn. 3.6.2). Die Wahl der Eichtransformation, also der Eichfunktion χ, h¨angt im wesentlichen vom betrachteten physikalischen Problem ab. Im folgenden stellen wir die zwei am h¨aufigsten benutzten Eichungen vor, die zu einer großen Vereinfachung der inhomogenen Potentialgleichungen (2.16) und (2.17) f¨ uhren. Coulomb-Eichung. Die Coulomb-Eichung ist durch folgende Bedingung definiert: Definition: Coulomb-Eichung (transversale Eichung) ∇A(x, t) = 0 . In dieser Eichung folgt f¨ ur die Potentialgleichungen (2.16) und (2.17) ∇2 φ(x, t) = −4πρ(x, t) (Poisson-Gleichung) (2.18) 2 1 ∂ A(x, t) 4π 1 ∂φ(x, t) ∇2 A(x, t) − 2 = − j(x, t) + ∇ . (2.19) 2 c ∂t c c ∂t Die L¨ osung der Poisson-Gleichung (2.18) ist durch das instantane CoulombPotential ρ(x , t) 3 d x φ(x, t) = (2.20) |x − x | gegeben. Man sieht dieser Gleichung unmittelbar an, daß sie mit der Relativit¨ atstheorie unvereinbar ist. Auf beiden Seiten steht n¨amlich dasselbe Zeitargument, so daß sich Ladungen am Ort x instantan (ohne Zeitverz¨ogerung) auf das Potential φ am Beobachtungspunkt x auswirken. Mit anderen Worten: Die Coulomb-Eichung ist nicht relativistisch invariant. Augenscheinlich ist nicht klar, daß die Coulomb-Eichung wirklich zur Entkopplung von (2.16) und (2.17) f¨ uhrt. Um dies zu sehen, benutzen wir den
2.2 L¨ osungen der Maxwell-Gleichungen in Form von Potentialen
135
Helmholtzschen Integralsatz (2.5) und schreiben den Stromdichtevektor j in der Form j(x, t) = j T + j L , wobei
∇ × j(x , t) 1 ∇ × d3 x 4π |x − x | ∇ j(x , t) 1 j L (x, t) = − ∇ d3 x 4π |x − x |
j T (x, t) =
(2.21) (2.22)
den transversalen bzw. longitudinalen Anteil von j bezeichnen. Kombinieren wir nun (2.20) mit der Kontinuit¨ atsgleichung zu ∇ j(x , t) 3 ∂φ(x, t) = −∇ ∇ d x , ∂t |x − x | so folgt durch Vergleich dieser Gleichung mit (2.22) ∂φ = 4πj L . ∂t Das heißt die rechte Seite von (2.19) ist proportional zur transversalen Stromdichte (2.21), und es folgt aus (2.19) die inhomogene Wellengleichung ∇
1 ∂2A 4π = − jT . c2 ∂t2 c Dies erkl¨ art, weshalb die Coulomb-Eichung auch transversale Eichung“ ge” nannt wird. ∇2 A −
Lorentz-Eichung. Die zweite Klasse von Eichtransformationen, die wir betrachten wollen, ist definiert durch: Definition: Lorentz-Eichung ∇A(x, t) = −
1 ∂φ(x, t) . c ∂t
Diese Transformationen f¨ uhren zu den in A und φ symmetrischen und entkoppelten inhomogenen Wellengleichungen 1 ∂2 ∇2 − 2 2 φ(x, t) = −4πρ(x, t) c ∂t 4π 1 ∂2 ∇2 − 2 2 A(x, t) = − j(x, t) . c ∂t c Der große Vorteil der Lorentz-Eichung gegen¨ uber der Coulomb-Eichung liegt in ihrer relativistischen Invarianz. Dies werden wir in Unterabschn. 2.3.2 explizit zeigen.
136
2. Elektrodynamik
Existenz der Eichungen. Um zu zeigen, daß die beiden soeben diskutierten Eichungen existieren, bestimmen wir nun die explizite Form der zugeh¨origen Eichfunktionen χ. • Coulomb-Eichung: Man hat eine Funktion χ zu finden, so daß ∇A = ∇A + ∇2 χ = 0 =⇒ ∇2 χ = −∇A . Dies ist wieder die Poisson-Gleichung, welche gel¨ost wird durch ∇ A(x , t) 3 1 χ(x, t) = d x . 4π |x − x | • Lorentz-Eichung: Hier ist χ derart zu w¨ahlen, daß gilt: 1 ∂2χ 1 ∂φ 1 ∂φ = ∇A + ∇2 χ + − 2 2 =0 c ∂t c ∂t c ∂t 2 1 ∂φ 1 ∂ 2 . =⇒ ∇ − 2 2 χ = − ∇A + c ∂t c ∂t
∇A +
Die L¨ osungsfunktion χ dieser inhomogenen Wellengleichung ist nicht eindeutig, da man eine beliebige L¨osung Λ der zugeh¨origen homogenen Gleichung 1 ∂2 2 ∇ − 2 2 Λ=0 c ∂t zu χ addieren kann. Der durch diese Gleichung definierte Typ von beschr¨ ankten Eichtransformationen kann immer dazu benutzt werden, um zu erreichen, daß gilt: φ(x, t) = 0. Satz 2.6: Maxwell-Gleichungen in Form von Potentialen Die Maxwell-Gleichungen lassen sich durch Einf¨ uhren eines Vektorpotentials A und eines Skalarpotentials φ als zwei gekoppelte Differentialgleichungen 2. Ordnung (Potentialgleichungen) schreiben. Mit diesen Potentialen sind Eichfreiheiten verbunden, die man zur Entkopplung dieser Gleichungen benutzen kann. In der Coulomb-Eichung ∇A(x, t) = 0 lauten die Potentialgleichungen ∇2 φ(x, t) = −4πρ(x, t) 1 ∂ 2 A(x, t) 4π ∇2 A(x, t) − 2 = − j T (x, t) , 2 c ∂t c mit 1 ∇× j T (x, t) = 4π
d3 x
∇ × j(x , t) . |x − x |
2.2 L¨ osungen der Maxwell-Gleichungen in Form von Potentialen
137
Die entsprechenden Zusammenh¨ ange in der Lorentz-Eichung 1 ∂φ(x, t) c ∂t sind gegeben durch 1 ∂2 ∇2 − 2 2 φ(x, t) = −4πρ(x, t) c ∂t 4π ∂2 1 2 ∇ − 2 2 A(x, t) = − j(x, t) c ∂t c ∇A(x, t) = −
(2.23) ⎫ ⎪ ⎪ ⎬ ⎪ ⎭ .⎪
(2.24)
Allgemeine L¨ osung der Maxwell-Gleichungen. Mit Hilfe der Eichtransformationen konnten wir das Problem der L¨ osung der Maxwell-Gleichungen signifikant vereinfachen. Die Wellengleichungen (2.24) des Skalarpotentials sowie f¨ ur die Komponenten des Vektorpotentials sind alle von der gleichen Struktur, 1 ∂2 2 (2.25) ∇ − 2 2 g(x, t) = −4πf (x, t) , c ∂t wobei f eine bekannte Quell- bzw. Stromfunktion ist. Dies ist eine lineare Gleichung, so daß sich ihre L¨ osung als Superposition der allgemeinen homogenen L¨ osung und einer speziellen inhomogenen L¨ osung ergibt. Dabei ist zu beachten, daß die L¨ osung insgesamt die Lorentz-Eichung zu erf¨ ullen hat. In den folgenden beiden Unterabschnitten werden wir die allgemeine L¨osung der homogenen sowie eine speziellen L¨ osung der inhomogenen Wellengleichungen (2.24) in der Lorentz-Eichung (2.23) anhand von (2.25) herleiten. 2.2.3 Allgemeine L¨ osung der homogenen Wellengleichungen Im homogenen Fall reduziert sich (2.25) auf 1 ∂2 ∇2 − 2 2 ghom (x, t) = 0 . c ∂t
(2.26)
Zur L¨osung dieser Gleichung zerlegen wir die gesuchte Funktion ghom in ihre komplexen Fourier-Komponenten, 1 3 d k dωei(kx−ωt) g˜(k, ω) , (2.27) ghom (x, t) = √ 4 2π und setzen diesen Ausdruck in (2.26) ein: ω2 k2 − 2 g˜(k, ω) = 0 . c Demnach ist g˜ notwendigerweise u ¨berall Null bis auf ω = ±c|k|, so daß wir schreiben k¨ onnen:
138
2. Elektrodynamik
g˜(k, ω) = g˜1 (k)δ(ω − c|k|) + g˜2 (k)δ(ω + c|k|) , wobei g˜1 , g˜2 frei w¨ahlbare komplexe Koeffizientenfunktionen sind. Somit geht (2.27) u ¨ber in 1 3 i[kx−ω(k)t] i[kx+ω(k)t] ghom (x, t) = d , (2.28) k g ˜ (k)e + g ˜ (k)e 1 2 (2π)2 mit ω(k) = c|k| . Dies ist die allgemeine homogene L¨osung von (2.26). Da die Potentiale A und φ reell sind, ist der Realteil von (2.28) zu betrachten. Es folgt der9 Satz 2.7: L¨ osungen der homogenen Wellengleichungen Die L¨ osungen der homogenen Wellengleichungen (2.24) lauten in ihrer allgemeinsten Form i[kx−ω(k)t] ˜ , ω(k) = c|k| φhom (x, t) = Re d3 k φ(k)e Ahom,i (x, t) = Re d3 k A˜i (k)ei[kx−ω(k)t] , i = 1, 2, 3 , ˜ A˜i durch Anfangsbewobei die komplexwertigen Fourier-Koeffizienten φ, ˙ dingungen z.B. der Art φ(x, 0) = φ0 (x), φ(x, 0) = ψ0 (x), A(x, 0) = A0 (x), ˙ A(x, 0) = B 0 (x) sowie durch die Lorentz-Bedingung (2.23) fixiert werden. Die L¨ osungen φhom und Ahom stellen Wellen dar, die in Abschn. 2.7 n¨aher untersucht werden. 2.2.4 Spezielle L¨ osung der inhomogenen Wellengleichungen, retardierte Potentiale Die L¨ osung der inhomogenen Gleichung (2.25) l¨aßt sich ganz allgemein in der Weise g(x, t) = d3 x dt G(x, t, x , t )f (x , t ) (2.29) schreiben, wenn G, die Green-Funktion unseres Problems, der Gleichung 1 ∂2 2 ∇ − 2 2 G(x, t, x , t ) = −4πδ(x − x )δ(t − t ) (2.30) c ∂t gen¨ ugt. Um dieses G zu finden, gehen wir zur fourier-transformierten Gleichung von (2.30) u ¨ber. Mit 9
Wegen Re(a1 + ia2 )e±iωt = a1 cos ωt ∓ a2 sin ωt gen¨ ugt es, sich auf die L¨ osung anken. mit e−iωt zu beschr¨
2.2 L¨ osungen der Maxwell-Gleichungen in Form von Potentialen
G(x, t, x , t ) =
˜ dω G(k, ω)eik(x−x ) eiω(t−t )
d3 k
139
(2.31)
und
1 3 δ(x − x )δ(t − t ) = d k dωeik(x−x ) eiω(t−t ) (2π)4 ergibt sich 1 ω2 ˜ 2 −k + 2 G(k, ω) = − 3 c 4π 1 1 c 1 1 1 ˜ , k = |k| . = =⇒ G(k, ω) = − 8π 3 k ω + ck ω − ck 4π 3 k2 − ωc22
Hieraus folgt f¨ ur (2.31) G(x, t, x , t ) =
c eik∆x d3 k 3 (2π) k 1 1 − , × dωeiω∆t ω + ck ω − ck
(2.32)
mit ∆x = x − x , ∆t = t − t . Offensichtlich besitzt der Integrand in (2.32) zwei Pole 1. Ordnung an den Stellen ω = ∓ck. Zur Berechnung des ω-Integrals benutzen wir das CauchyTheorem und gehen in gleicher Weise vor, wie f¨ ur die erzwungene Schwingung des harmonischen Oszillators in Anwendung 3 vorgef¨ uhrt wurde. Das heißt wir w¨ahlen wieder einen geschlossenen Halbkreis mit Radius R in der komplexen ω-Ebene (siehe Abb. 1.5). Wie in Anwendung 3 ist auch hier zu beachten, daß f¨ ur ∆t > 0 (∆t < 0) der obere Weg C (untere Weg C ) zu w¨ ahlen ist. Aufgrund des Kausalit¨ atsprinzips m¨ ussen wir weiterhin fordern, daß in (2.29) die Integration F¨ ur ∆t < 0 nichts beitr¨ agt, d.h. G(x, t, x , t ) = 0 ∀ t < t . Diese Bedingung k¨ onnen wir mathematisch realisieren, indem wir die Pole in die obere Halbebene verschieben, also in (2.32) die Ersetzung ck −→ ck ∓ i mit 0 < 1 vornehmen, da dann die Integration f¨ ur ∆t < 0 in der unteren Halbebene keinen Beitrag liefert. F¨ ur ∆t > 0 folgt somit im Limes → 0 ik∆x c 3 e G(x, t, x , t ) = d k sin(ck∆t) 2π 2 k ∞ 1 c dkk sin(ck∆t) d cos θeik|∆x| cos θ = π 0
=
2c π|∆x|
∞
−1
dk sin(ck∆t) sin(k|∆x|) . 0
(2.33)
140
2. Elektrodynamik
Da der Integrand in (2.33) gerade ist, kann der Integrationsbereich auf das Intervall [−∞ : ∞] erweitert werden. Mit Hilfe der Variablensubstitution κ = ck k¨ onnen wir dann schreiben: ∞ |∆x| |∆x| 1 iκ ∆t− c iκ ∆t+ c −e G(x, t, x , t ) = dκ e 2π|∆x| −∞ 1 |∆x| |∆x| = δ ∆t − − δ ∆t + , |∆x| c c wobei nur der erste Term einen Beitrag liefert, da das Argument der zweiten δ-Funktion f¨ ur ∆t > 0 niemals verschwindet. Die explizite Form der gesuchten Green-Funktion lautet somit | δ t − t + |x−x c G(x, t, x , t ) = . (2.34) |x − x | Diese Funktion wird auch retardierte Green-Funktion genannt, weil sie dem kausalen Verhalten Rechnung tr¨agt, daß ein am Ort x zur Zeit t beobachteter uheren Zeit t = t − |x − x |/c Effekt durch eine St¨orung am Ort x zur fr¨ verursacht wird. Durch Einsetzen von (2.34) in (2.29) erh¨alt man schließlich als retardierte L¨osung von (2.25) bei Abwesenheit von Randbedingungen |x − x | 3 f (x , t ) g(x, t) = d x . dt δ t −t+ |x − x | c Hieraus folgt unmittelbar der Satz 2.8: L¨ osung der inhomogenen Wellengleichungen in Form retardierter Potentiale Spezielle L¨ osungen der inhomogenen Potentialgleichungen (2.24) sind durch die retardierten Potentiale ρ(x , t ) 3 φret (x, t) = dt d x δ(t − tret ) |x − x | ρ(x , tret ) = d3 x (2.35) |x − x | j(x , t ) 1 d3 x dt Aret (x, t) = δ(t − tret ) c |x − x | 1 j(x , tret ) = d3 x , (2.36) c |x − x | mit tret = t −
|x − x | c
(retardierte Zeit)
Anwendungen
141
gegeben. Sie ber¨ ucksichtigen die aus der Relativit¨ atstheorie folgende Tat¨ sache, daß Anderungen der Ladungs- bzw. Stromdichte die Zeit |x − x |/c ben¨ otigen, um vom Quellpunkt x zum Meßpunkt x zu propagieren. Wie in Anwendung 22 explizit gezeigt wird, erf¨ ullen φret und Aret automatisch die Lorentz-Bedingung (2.23). Die Ber¨ ucksichtigung etwaiger Randbeugen geeignet gew¨ ahlter homogener L¨ osundingungen wird durch das Hinzuf¨ gen φhom und Ahom realisiert, die ebenfalls der Lorentz-Bedingung zu gen¨ ugen haben. Ersetzt man in (2.35) und (2.36) tret durch tav = t + |x − x |/c, dann erh¨ alt man die avancierten Potentiale φav und Aav , welche ebenfalls eine spezielle L¨ osung der inhomogenen Wellengleichungen (2.24) sind. Diese L¨ osung alleine genommen widerspricht jedoch der o.g. Kausalit¨ atsforderung. Der Unterschied zwischen retardierter und avancierter L¨ osung, also (φret , Aret ) − (φav , Aav ), ist L¨ osung der homogenen Wellengleichungen und daher in (φhom , Ahom ) enthalten. Zusammenfassung • Durch Einf¨ uhren eines Vektorpotentials und eines Skalarpotentials k¨ onnen die vier Maxwell-Gleichungen in zwei gekoppelte partielle Differentialgleichungen 2. Ordnung (Potentialgleichungen) umgeschrieben werden. • Diese Potentiale sind nicht eindeutig, sondern besitzen gewisse Eichfreiheiten, die man zur Entkopplung der Potentialgleichungen benutzen kann. Die am h¨ aufigsten benutzten Eichungen sind die nicht-lorentzinvariante Coulomb-Eichung und die lorentzinvariante Lorentz-Eichung. • W¨ahlt man die Lorentz-Eichung, so erh¨ alt man zwei inhomogene Wellengleichungen. Ihre allgemeinste L¨ osung setzt sich zusammen aus der homogenen L¨ osung, die als Superposition ebener monochromatischer Wellen geschrieben werden kann, und einer speziellen inhomogenen L¨osung in Termen retardierter Potentiale, welche im Einklang mit dem Kausalit¨ atsprinzip stehen. • Die Maxwell- und Potentialgleichungen sind eichinvariant.
Anwendungen 22. Retardierte Potentiale und Lorentz-Bedingung. Man zeige, daß die retardierten Potentiale (2.35) und (2.36) die Lorentz-Bedingung (2.23) erf¨ ullen.
142
2. Elektrodynamik
L¨ osung. Zu zeigen ist die Beziehung 1 ∂ φret (x, t) c ∂t ρ(x , tret ) j(x , tret ) 3 ˆ 3 ∂ =− d x , ⇐⇒ d x ∇ |x − x | ∂tret |x − x | ∇Aret (x, t) = −
(2.37)
mit |x − x | . c ˆ die totale vektorielle Ableitung nach x. Zur Herleitung Hierbei bedeutet ∇ dieser Beziehung ben¨otigen wir die Kontinuit¨atsgleichung tret = t −
∇ j(x , tret ) = −
∂ρ(x , tret ) ∂tret
sowie die Identit¨aten 1 1 ∇tret = ∇|x − x | = − ∇ |x − x | = −∇ tret c c und ∂j(x , tret ) ∂j(x , tret ) ˆ ∇j(x , tret ) = ∇tret = − ∇ tret ∂tret ∂tret ˆ j(x , tret ) + ∇ j(x , tret ) = −∇
ˆ j(x , tret ) − = −∇
∂ρ(x , tret ) . ∂tret
Hiermit l¨ aßt sich der linke Integrand in (2.37) folgendermaßen umformen: ˆ ˆ j(x , tret ) = |x − x |∇j(x , tret ) − j(x , tret )∇|x − x | ∇ 2 |x − x | |x − x |
ˆ j(x , tret ) + j(x , tret )∇ |x − x | −|x − x |∇ |x − x |2 ∂ρ(x , t) 1 − |x − x | ∂tret ∂ j(x , tret ) ρ(x , tret ) ˆ − . (2.38) = −∇ |x − x | ∂tret |x − x | =
Setzt man (2.38) in (2.37) ein, dann verschwindet aufgrund des Gaußschen Satzes der Divergenzterm, und es folgt die Behauptung. 23. Vektorpotential einer stromdurchflossenen Leiterschleife. Man betrachte einen d¨ unnen Leiter, der zu zwei Halbkreisen mit den Radien a und b zusammengebogen ist (Abb. 2.4). Durch diesen Leiter fließe ein zeitlich variabler Strom I(t). Man berechne das retardierte Vektorpotential im Ursprung x = 0.
Anwendungen
143
y 1
I(t) 2
3
4 x a b Abb. 2.4. Stromdurchflossene, zu zwei Halbkreisen zusammengebogene Leiterschleife
L¨ osung. Im Falle von stromdurchflossenen Leitern gilt dl , jd3 x = j|dl|dF = Idl = It(s)ds , t(s) = ds wobei dl ein Linienelement, dF die Querschnittsfl¨ ache und t(s) den (durch s parametrisierten) Tangentialvektor des Leiters bezeichnet. Die retardierten Vektorpotentiale der einzelnen Leitersegmente im Ursprung lassen sich hiermit in der Form s2 1 I(tret )ti (s) dli (s) |li (s)| Aret,i (0, t) = , tret = t − ds , ti (s) = c |0 − li (s)| ds c s1
schreiben, mit ⎛ l1 (s) =
l2 (s) =
l3 (s) =
l4 (s) =
⎞ cos s b ⎝ sin s ⎠ 0 ⎛ ⎞ cos s a ⎝ sin s ⎠ 0 ⎛ ⎞ s ⎝ 0 ⎠ , s1 0 ⎛ ⎞ s ⎝ 0 ⎠ , s1 0
Dies f¨ uhrt zu
, s1 = 0, s2 = π
, s1 = π, s2 = 0
= −b, s2 = −a
= a, s2 = b .
⎛1⎞ 2I t − cb ⎝0⎠ Aret,1 (0, t) = c 0 ⎛ ⎞ 1 2I t − ac ⎝0⎠ Aret,2 (0, t) = − c 0
144
2. Elektrodynamik
⎛ ⎞ −a 1 I t + sc 1 Aret,3 (0, t) = − ⎝ 0 ⎠ ds c s 0 −b ⎛ ⎞ b 1 I t − sc 1⎝ ⎠ 0 Aret,4 (0, t) = ds . c s 0 a Insgesamt hat man also Aret (0, t) =
4
Aret,i (0, t)
i=1
⎛ ⎞⎡ ⎤ b 1 s I t − b a 2 c ⎦ + ds −I t− . = ⎝ 0 ⎠ ⎣I t − c c c s 0 a
2.3 Lorentzkovariante10 Formulierung der Elektrodynamik Es ist eine experimentelle Tatsache, daß die Elektrodynamik, anders als die Newtonsche Mechanik, im Einklang mit der speziellen Relativit¨atstheorie steht, was sich z.B. darin zeigt, daß die elektrische Ladung eines Teilchens, im Gegensatz etwa zu seiner Masse, unabh¨angig von der Teilchengeschwindigkeit ist. Dies bedeutet, daß sich die Form der Maxwell-Gleichungen (und der Lorentz-Kraft) unter Lorentz-Transformationen nicht ¨andert. Man kann dies explizit zeigen, indem man die Maxwell-Gleichungen in manifest lorentzkovarianter Weise schreibt. Hiermit wollen wir uns in diesem Abschnitt besch¨aftigen. Nach einer kurzen mathematischen Zwischenbetrachtung u ¨ber die Transformationseigenschaften von Lorentz-Tensoren bringen wir die Maxwell-Gleichungen unter Verwendung des elektromagnetischen Feldst¨ arketensors in lorentzkovariante Form und besprechen das hieraus folgende Transformationsverhalten elektromagnetischer Felder. Wir zeigen ferner, daß die LorentzKraft die korrekte relativistische Beschreibung von Teilchenbewegungen liefert. Zum Schluß diskutieren wir die in Unterabschn. 2.1.3 hergeleitete Energie- und Impulserhaltung mit Hilfe des kovariant verallgemeinerten Maxwellschen Spannungstensors. 2.3.1 Lorentz-Tensoren Im Zusammenhang mit der relativistischen Mechanik wurden bereits einige grundlegende Begriffe der speziellen Relativit¨atstheorie eingef¨ uhrt (Unter10
Siehe Fußnote 11 auf Seite 106
2.3 Lorentzkovariante Formulierung der Elektrodynamik
145
abschn. 1.6.1). Im Hinblick auf eine kovariante Formulierung der Elektrodynamik erweist es sich als g¨ unstig, diesen Begriffsapparat zu erweitern und insbesondere Lorentz-Transformationen in einem allgemeineren mathematischen Rahmen zu betrachten. Definition: Kontravarianter Tensor n-ter Stufe Unter einem kontravarianten Tensor n-ter Stufe versteht man die Gesamtoßen (alle Indizes oben), die sich unter heit T α1 ...αn n-fach indizierter Gr¨ Lorentz-Transformationen Λα β in der Weise T α1 ...αn = Λα1 β1 . . . Λαn βn T β1 ...βn transformieren. Man beachte, daß die Matrix Λα β kein Tensor ist, da sie ¨ in keinem Inertialsystem definiert ist, sondern den Ubergang zwischen zwei Inertialsystemen beschreibt. Mit Hilfe des metrischen Tensors gαα (siehe (1.64)) lassen sich aus kontravarianten Tensoren die entsprechenden kovarianten Gr¨ oßen (alle Indizes unten) konstruieren: Tα1 ...αn = gα1 β1 . . . gαn βn T β1 ...βn . F¨ ur das Transformationsverhalten kovarianter Tensoren folgt unter Ber¨ ucksichtigung von Satz 1.35 Tα 1 ...αn = gα1 β1 . . . gαn βn T β1 ...βn = gα1 β1 . . . gαn βn Λβ1 γ1 . . . Λβn γn T γ1 ...γn = gα1 β1 . . . gαn βn Λβ1 γ1 . . . Λβn γn g γ1 1 . . . g γn n T1 ...n = T1 ...n [Λ−1 ]1 α1 [Λ−1 ]n αn , mit [Λ−1 ] α = gαβ Λβ γ g γ . Neben ko- und kontravarianten Tensoren gibt es auch gemischte Tensoren, deren Indizes oben und unten stehen. Ihr Transformationsverhalten l¨ aßt sich aus dem der ko- bzw. kontravarianten Tensoren herleiten. Man hat z.B. f¨ ur einen gemischten Tensor 2-ter Stufe (einmal ko- und einmal kontravariant): T α β = T αγ gγβ = Λα µ Λγ ν T µν gγβ = Λα µ Λγ ν T µ g ν gγβ = Λα µ T µ [Λ−1 ] β . F¨ ur zwei Tensoren A und B sind folgende algebraischen Operationen definiert: • Addition: aAα1 ...αn + bB β1 ...βn ist ein (kontravarianter) Tensor n-ter Stufe, sofern a und b Lorentz-Skalare sind. • Multiplikation: Aα1 ...αn B β1 ...βm ist ein (kontravarianter) Tensor n + m-ter Stufe.
146
2. Elektrodynamik
β1 ...βm γ1 ...γr 1 ...αn • Kontraktion: Aα ist ein (kontravarianter) Tensor n + rβ1 ...βm B ter Stufe. Die Gesamtstufe ist also gegen¨ uber der Multiplikation um die Zahl der Indizes reduziert, u ¨ber die summiert wird.
Tensorfelder und Differentialoperatoren. Das bisher Gesagte l¨aßt sich auf Tensorfelder, also auf Funktionen des Raum-Zeit-Vierervektors xµ , erweitern. Definition: Kontravariantes Tensorfeld n-ter Stufe Unter einem kontravarianten Tensorfeld n-ter Stufe versteht man die Gesamtheit T α1 ...αn (xµ ) n-fach indizierter Funktionen von xµ (alle Indizes oben), die sich unter Lorentz-Transformationen Λα β in der Weise T α1 ...αn (xµ ) = Λα1 β1 . . . Λαn βn T β1 ...βn ([Λ−1 ]µ ν xν ) transformieren. Hierbei ist zu beachten, daß das Argument entsprechend mitzutransformieren ist. Tensorfelder11 k¨ onnen nach ihren Argumenten abgeleitet werden. F¨ ur die partielle Ableitung ∂/∂xα gilt wegen xν = [Λ−1 ]ν µ xµ ∂xν ∂ ∂ ∂xν ∂ −1 ν = [Λ ] =⇒ = = [Λ−1 ]ν µ . µ ∂xν ∂xµ ∂xν ∂xµ ∂xµ Also transformiert sich ∂ = ∂µ ∂xµ wie ein kovarianter Vierervektor und dementsprechend ∂ = ∂µ ∂xµ wie ein kontravarianter Vierervektor. Weiterhin folgt, daß der d’Alembert-Operator 1 ∂2 − ∇2 c2 ∂t2 ein Lorentz-Skalar ist. 2 = ∂ µ ∂µ =
2.3.2 Lorentzkovariante Maxwell-Gleichungen Da die Kontinuit¨atsgleichung ∂ρ(x, t) + ∇j(x, t) = 0 ∂t 11
Im weiteren Verlauf wird zwischen Tensor“ und Tensorfeld“ sprachlich nicht ” ” weiter unterschieden.
2.3 Lorentzkovariante Formulierung der Elektrodynamik
147
aus den Maxwell-Gleichungen folgt, von denen wir wissen, daß sie lorentzkovariant sind, muß diese lorentzinvariant sein. Hieraus folgt, daß die Ladungsdichte ρ(x, t) und der Stromdichtevektor j(x, t) die Viererstromdichte cρ(x, t) µ , x = (xµ ) (j (x)) = j(x, t) bilden, so daß die Kontinuit¨ atsgleichung in der manifest invarianten Weise ∂µ j µ (x) = 0 geschrieben werden kann. Aufgrund der Tatsache, daß die Ladungsdichte die zeitliche Komponente eines Vierervektors darstellt, folgt unmittelbar, daß dq = d3 xρ = d3 xj 0 /c und somit die Ladung q eines Systems (im Gegensatz zu seiner Masse) ein Lorentz-Skalar ist. Betrachten wir nun die inhomogenen Maxwell-Gleichungen (I) und (IV). ahrend die linken Ihre rechten Seiten bilden zusammen den Vierervektor j µ , w¨ Seiten partielle Ableitungen enthalten. Der einfachste manifest kovariante Ansatz f¨ ur diese Gleichungen lautet deshalb ⎞ ⎛ 0 −Ex −Ey −Ez ⎜ Ex 0 −Bz By ⎟ ⎟ , ∂µ F µν = 4πj µ , (F µν ) = ⎜ (2.39) ⎝ Ey Bz 0 −Bx ⎠ Ez −By Bx 0 aus dem f¨ ur ν = 0 die erste und f¨ ur ν = i die letzte Maxwell-Gleichung folgt. Da (I) und (IV) insgesamt 6 Gleichungen ergeben, muß F µν ein antisymmetrischer kontravarianter Tensor 2-ter Stufe sein. Um dies zu sehen, betrachten wir noch einmal die Potentialgleichungen (2.24), 2φ(x, t) = 4πρ(x, t) , 2A(x, t) =
4π j(x, t) , c
(2.40)
in der Lorentz-Eichung (2.23), 1 ∂φ(x, t) . (2.41) c ∂t Da die rechten Seiten von (2.40) wieder den Vierervektor j µ bilden und der d’Alembert-Operator 2 ein Lorentz-Skalar ist, m¨ ussen notwendigerweise auch die Potentiale φ und A zu dem Vierervektorpotential φ(x, t) µ (A (x)) = A(x, t) ∇A(x, t) = −
kombinieren, damit (2.40) und (2.41) in die manifest kovariante Form 4π µ j (x) , ∂µ Aµ (x) = 0 c gebracht werden k¨ onnen. Dr¨ uckt man jetzt die Definitionsgleichungen (2.15) der Potentiale durch die kontravarianten Gr¨ oßen ∂ µ und Aν aus, dann folgt durch Vergleich mit (2.39) 2Aµ (x) =
148
2. Elektrodynamik
F µν = ∂ µ Aν − ∂ ν Aµ . Das heißt F µν ist in der Tat ein kontravarianter Tensor 2-ter Stufe. Die verbleibenden homogenen Maxwell-Gleichungen (II) und (III) lassen sich ebenfalls durch Einf¨ uhren des zu F µν dualen Pseudotensors 2-ter Stufe, 1 µναβ Fαβ , 2 in der kovarianten Weise Gµν =
∂µ Gµν = 0 ausdr¨ ucken, wobei ⎧ ⎨ +1 falls (µναβ) gerade Permutation von (0123) µναβ = −1 falls (µναβ) ungerade Permutation von (0123) ⎩ 0 sonst das Levi-Civita-Symbol bezeichnet. Insgesamt folgt der Satz 2.9: Maxwell-Gleichungen in lorentzkovarianter Form Da die Elektrodynamik mit der speziellen Relativit¨atstheorie im Einklang steht, lassen sich ρ und j sowie φ und A jeweils zu Vierervektoren cρ φ µ µ (j ) = , (A ) = . j A zusammenfassen. Hiermit lauten die Maxwell-Gleichungen in lorentzkovarianter Form ⎧ ⎨ ν = 0 : ∇E = 4πρ 4π jν ∂µ F µν (x) = ⎩ ν = i : ∇ × B − 1 ∂E = 4π j c c ∂t c ⎧ ν = 0 : ∇B = 0 ⎨ ∂µ Gµν (x) = 0 ⎩ ν = i : ∇ × E + 1 ∂B = 0 , c ∂t mit ⎛ ⎞ 0 −Ex −Ey −Ez ⎜ Ex 0 −Bz By ⎟ ⎟ , F µν = ∂ µ Aν − ∂ ν Aµ (F µν ) = ⎜ ⎝ Ey Bz 0 −Bx ⎠ Ez −By Bx 0 und 1 µναβ Fαβ . 2 Der total antisymmetrische Tensor F µν heißt Feldst¨ arketensor, der total antisymmetrische Pseudotensor Gµν dualer Feldst¨ arketensor. Gµν =
2.3 Lorentzkovariante Formulierung der Elektrodynamik
149
Die homogenen Maxwell-Gleichungen lassen sich auch in der Form ∂α F βγ + ∂γ F αβ + ∂β F γα = 0 schreiben. Diese Gleichung ist ebenfalls forminvariant, da sich jeder der Terme in gleicher Weise wie ein gemischter Tensor 3-ter Stufe (einmal ko- und zweimal kontravariant) transformiert. 2.3.3 Transformationsverhalten elektromagnetischer Felder Die Transformationseigenschaften der E- und B-Felder sind durch das Transformationsverhalten F µν = Λµ α Λν β F αβ des zweistufigen Feldst¨ arketensors F µν determiniert. F¨ ur eine allgemeine Lorentz-Transformation von einem Inertialsystem K zu einem relativ zu K mit der Geschwindigkeit v bewegten System K ergibt sich f¨ ur die transformierten E- und B-Felder v 1 γ 2 v(vE) E = γ E + × B − , γ= 2 2 c γ+1 c 1 − vc2 γ 2 v(vB) v B = γ B − × E − c γ + 1 c2 oder
⎫ E = E , B = B ⎬ (2.42) v v E ⊥ = γ E ⊥ + × B , B ⊥ = γ B ⊥ − × E , ⎭ c c wobei und ⊥ die zu v parallelen bzw. senkrechten Komponenten der Felder bezeichnen. Wir erkennen hieraus, daß E und B nicht unabh¨ angig voneinander sind. Ein reines E- oder B-Feld in einem System K erscheint in einem anderen System K als Kombination elektrischer und magnetischer Felder. Da also die Unterscheidung zwischen E- und B-Feldern vom betrachteten Inertialsystem abh¨ angt, sollte man besser vom elektromagnetischen Feld F µν als von E und B getrennt sprechen. ¨ Lorentzinvariante. Aufgrund der Uberlegungen in Unterabschn. 2.3.1 kann man aus jedem zweistufigen Tensor durch Kontraktion des Tensors mit sich selbst u.a. folgende Lorentz-Skalare konstruieren: Tµν T νµ , Tµν T ν γ T γµ , Tµν T νγ Tγ T µ , . . . . Im Falle des elektromagnetischen Feldst¨ arketensors F µν ist die kubische Invariante Null. Die anderen beiden ergeben Fµν F νµ = 2 E 2 − B 2 = I1 = invariant 2 Fµν F νγ Fγ F µ = 2 E 2 − B 2 + 4(EB)2 = invariant =⇒ (EB) = invariant . Hieraus lassen sich einige Folgerungen f¨ ur die E- und B-Felder ziehen:
150
2. Elektrodynamik
• Gilt in einem Inertialsystem E ⊥ B, dann gilt dies auch in jedem anderen. Im Falle I1 > 0 gibt es ein Inertialsystem, in dem gilt: B = 0. Im Falle I1 < 0 gibt es ein Inertialsystem, in dem gilt: E = 0. • Der erste Punkt gilt auch in umgekehrter Richtung: Falls in einem Inertialsystem E = 0 oder B = 0, dann gilt E ⊥ B in jedem anderen. • Gilt in einem Inertialsystem |E| = |B|, dann gilt dies auch in jedem anderen. 2.3.4 Lorentz-Kraft und Kovarianz Nachdem wir die Kompatibilit¨at der Maxwell-Gleichungen mit der speziellen Relativit¨ atstheorie durch eine lorentzkovariante Formulierung zum Ausdruck gebracht haben, m¨ ussen wir nun noch die durch die Lorentz-Kraft F L beschriebene Bewegungsgleichung f¨ ur ein Teilchen in einem elektromagnetischen Feld kovariant schreiben. Von ihr k¨onnen wir zun¨achst nur annehmen, daß ˙ sie im nichtrelativistischen Grenzfall |x|/c → 0 gilt, also d x˙ m0 x˙ = F L = q E + × B . (2.43) dt c Hier bezeichnet q die Ladung, x˙ die Geschwindigkeit und m0 die Ruhemasse des Teilchens. Aus Unterabschn. 1.6.4 wissen wir, daß die kovariante Bewegungsgleichung der relativistischen Mechanik gegeben ist durch dpµ 1 = dτ 1− mit
µ
(p ) = wobei
cm mx˙
˙2 x c2
dpµ = Fµ , dt
, (F ) = µ
1 1−
˙2 x c2
c dm dt F
,
dτ = dt 1 −
x˙ 2 m0 , m= 2 2 c 1 − xc˙ 2
das Eigenzeitdifferential bzw. die relativistische Masse des Teilchens sind. Da der Ausdruck (2.43) linear in den Feldern E und B sowie der Teilchengeschwindigkeit x˙ ist, lautet sein einfachst m¨oglicher kovarianter Ansatz dpµ dxν dxµ q = F µν , = Vierergeschwindigkeit . (2.44) dτ c dτ dτ Man beachte: Weil q (wie auch c) ein Lorentz-Skalar ist, stehen auf beiden Seiten kontravariante Vierervektoren. Dr¨ ucken wir jetzt diese Gleichung durch die Dreiervektoren E, B und x˙ aus, dann ergibt sich
2.3 Lorentzkovariante Formulierung der Elektrodynamik
151
d m0 c2 = qE x˙ dt 1 − x˙ 2 2 c d m0 x˙ x˙ µ=i: =q E+ ×B . dt 1 − x˙ 2 c 2 c
µ=0:
˙ Offenbar liefern die r¨ aumlichen µ-Komponenten f¨ ur |x|/c → 0 den richtigen nichtrelativistischen Zusammenhang (2.43). Wir folgern hieraus einerseits, daß der Ansatz (2.44) die richtige relativistische Verallgemeinerung von (2.43) ist, und andererseits, daß die Lorentz-Kraft F L auch f¨ ur relativistische Geschwindigkeiten die Teilchenbewegung korrekt beschreibt, wenn in der Bewegungsgleichung die Ersetzung m0 → m vorgenommen wird. Die Gleichung f¨ ur die µ=0-Komponente bringt den folgenden Erhaltungssatz zum Ausdruck: ¨ Die zeitliche Anderung der Teilchenenergie ist gleich der Leistung, die das elektromagnetische Feld auf das Teilchen u agt. ¨bertr¨ Satz 2.10: Kovariante Bewegungsgleichung, Lorentz-Kraft Die relativistische Verallgemeinerung der Newtonschen Bewegungsgleichung f¨ ur ein Teilchen in einem elektromagnetischen Feld lautet in kovarianter Notation dpµ q dxν = F µν . dτ c dτ Die r¨ aumlichen Komponenten dieser Gleichung f¨ uhren auf d m0 x˙ x˙ = FL = q E + × B , dt 1 − x˙ 2 c c2 ˙ d.h. F L liefert in allen Ordnungen von |x|/c die korrekte Beschreibung der Teilchenbewegung.
2.3.5 Energie- und Impulserhaltung In der Herleitung des Impulssatzes der Elektrodynamik, Satz 2.5, haben wir den Maxwellschen Spannungstensor 1 δik 2 Ei Ek + Bi Bk − E + B2 Tik = (2.45) 4π 2 eingef¨ uhrt. Seine Viererversion ist der symmetrische Tensor 2. Stufe 1 1 µν µν µα βν αβ g Fαβ F + g Fαβ F , T = 4π 4
(2.46)
dessen r¨ aumliche Komponenten gerade das Negative des Dreierspannungstensors sind. Er l¨ aßt sich mit Hilfe der elektromagnetischen Energie- und Impulsdichte em und g em durch folgende Matrix darstellen:
152
2. Elektrodynamik
⎛
T ⎞ E2 + B2 E × B ⎜ ⎟ em [cgem ]T µν ⎜ ⎟ 8π 4π (T ) = ⎝ , ⎠ = cgem −(Tik ) E×B −(Tik ) 4π mit Tik aus (2.45). Man kann nun mit ein wenig Tensoralgebra zeigen, daß sich die in den S¨ atzen 2.4 und 2.5 stehenden differentiellen Erhaltungss¨atze f¨ ur Energie und Impuls durch folgende lorentzkovariante Gleichung ausdr¨ ucken lassen: 5 ν = 0 : Energieerhaltung, Satz 2.4 1 νρ µν ∂µ T = − F jρ c ν = i : Impulserhaltung, Satz 2.5. Betrachten wir jetzt ein System, in dem es keine Ladungen gibt, dann folgt hieraus 1 0 = ∂µ T µν = ∂t T 0ν + ∂i T iν . c Integration dieser Gleichung u ¨ber ein hinreichend großes Volumen bringt den zweiten Term auf der rechten Seite zum verschwinden, und es ergibt sich 1 pνem = d3 xT 0ν = const . c Eem /c enth¨alt die Energie sowie Das heißt der Viererimpuls (pµem ) = P em den Impuls des elektromagnetischen Feldes und ist in einem abgeschlossenen System ohne Ladungen eine Erhaltungsgr¨oße. Zusammenfassung • Die Theorie der Elektrodynamik ist eine relativistische Feldtheorie. Mit Hilfe des elektromagnetischen Feldst¨ arketensors und des dualen Feldst¨ arketensors lassen sich die Maxwell-Gleichungen in manifest lorentzkovarianter Form schreiben. • Hierbei geht ein, daß Ladungs- und Stromdichte sowie Skalar- und Vektorpotential jeweils zu Vierervektorfeldern kombinieren. • Aus der Lorentz-Kovarianz der Theorie folgt, daß E- und B-Felder beim Wechsel des Bezugssystems ineinander u ¨bergehen, also die Unterscheidung zwischen E und B vom betrachteten Inertialsystem abh¨angt. • Die Lorentz-Kraft liefert nicht nur im nichtrelativistischen Grenzfall, son˙ dern in allen Ordnungen von |x|/c die korrekte Beschreibung der Bewegung von Teilchen in elektromagnetischen Feldern. • Die Erhaltungss¨atze f¨ ur Energie und Impuls lassen sich durch Verwendung des Maxwellschen Spannungstensors in einer lorentzkovarianten Gleichung zusammenfassen.
Anwendungen
153
Anwendungen 24. Gleichf¨ ormig bewegte Ladung. Man berechne das elektromagnetische Feld einer Ladung q, die sich in einem Inertialsystem K mit konstanter Geschwindigkeit v in positiver x-Richtung bewegt. L¨ osung. Der einfachste und eleganteste L¨ osungsweg besteht darin, zum Ruhesystem K der Ladung u ¨berzugehen, da sich in ihm die E - und B -Felder origen Potentiale φ , A sofort angeben lassen: bzw. die zugeh¨ ⎫ ⎧ (I): ∇ E (x , t ) = 4πqδ(x ) ⎪ ⎬ ⎨ E (x , t ) = q x |x |3 =⇒ 1 ∂E(x , t ) ⎪ ⎩ ⎭ (IV): ∇ × B (x , t ) − =0 B (x , t ) = 0 c ∂t ⎛ ⎞ ⎛ q ⎞ φ (x , t ) |x | ⎟ ⎜ ⎜ ⎟ A (x , t ) x ⎟ ⎜ 0 ⎟ =⇒ (Aµ (x )) = ⎜ ⎝ Ay (x , t ) ⎠ = ⎝ 0 ⎠ . Az (x , t ) 0 ¨ Der Ubergang zum urspr¨ unglichen System K wird durch die Lorentz-Transformation ⎞ ⎛ γ γv c 0 0 γv ⎜ 1 γ 0 0⎟ c ⎟ (Λ(1)µ ν )−1 = ⎜ ⎝ 0 0 1 0⎠ , γ = 2 1 − vc2 0 0 0 1 vermittelt (siehe Unterabschn. 1.6.1). Damit folgt f¨ ur die Potentiale in K ⎞ ⎛ ⎞ ⎛ q φ(x , t ) |x | ⎟ ⎜ ⎜ vq ⎟ A (x , t ) x µ ⎟ ⎜ c|x | ⎟ (A (x )) = ⎜ ⎝ Ay (x , t ) ⎠ = γ ⎝ 0 ⎠ , Az (x , t ) 0 mit
⎛
⎞ ⎛ ct γ − γv c ⎜ x ⎟ ⎜ − γv γ ⎜ ⎟=⎜ c ⎝y ⎠ ⎝ 0 0 0 0 z
0 0 1 0
⎞⎛ ⎞ ⎛ ⎞ ct γ(ct − vx 0 c ) ⎜ ⎟ ⎜ ⎟ 0⎟ ⎟ ⎜ x ⎟ = ⎜ γ(x − vt) ⎟ ⎠ 0⎠⎝ y ⎠ ⎝ y 1 z z
⎛ ⎞ 1 v =⇒ φ(x, t) = , A(x, t) = φ(x, t) ⎝ 0 ⎠ . c γ 2 (x − vt)2 + y 2 + z 2 0 γq
F¨ ur die E- und B-Felder in K erh¨ alt man schließlich
154
2. Elektrodynamik
⎛ B(x, t) = ∇ × A(x, t) = E(x, t) = −∇φ(x, t) −
vγq c[γ 2 (x − vt)2 + y 2 + z 2 ]3/2
1 ∂A(x, t) c ∂t
⎛
γq [γ 2 (x − vt)2 + y 2 + z 2 ]3/2
=
⎞ 0 ⎝ z ⎠ −y
⎞ x − vt ⎝ y ⎠ . z
25. Verallgemeinertes Faradaysches Induktionsgesetz. Wie bereits in Unterabschn. 2.1.2 festgestellt wurde, gilt das Faradaysche Induktionsgesetz ∂B(x, t) 1 , dF E(x, t)dl = − c ∂t C
F
wobei C die geschlossene Kontour z.B. einer Leiterschleife und F deren konstante Fl¨ ache bezeichnet. Man zeige hiermit und mit Hilfe von (2.42), daß die Lorentz-Kovarianz der Elektrodynamik das verallgemeinerte Faradaysche Induktionsgesetz 1 d 1 dΦm (t) V (t) = E (x , t)dl = − dF B(x, t) = − c dt c dt C
F (t)
impliziert, wobei sich die gestrichenen Gr¨oßen auf das Ruhesystem der Leiterschleife beziehen. L¨ osung. Im ungestrichenen Beobachtungssystem gilt dΦm ∂B dF dF dF Edl + = + B = −c B. dt ∂t dt dt F (t)
C(t)
Nehmen wir an, daß sich die Leiterschleife mit der konstanten Geschwindigkeit v bewegt (Abb. 2.5), dann ist dF = v × dldt. Somit folgt C
dl
vdt
dF = v × dldt
Abb. 2.5. Mit konstanter Geschwindigkeit v bewegte Leiterschleife
2.4 Strahlungstheorie
dΦm = −c dt
C(t)
= −c
155
v dl E + × B c v (dl + dl⊥ ) E + E ⊥ + × B . c
(2.47)
C(t)
und ⊥ indizieren hierbei die zu v parallel bzw. senkrechte Komponenten. Unter Beachtung von (2.42) und dl =
1 1 dl , dl⊥ = dl⊥ , γ = γ 1−
v2 c2
l¨aßt sich die rechte Seite von (2.47) in folgender Weise durch die gestrichenen Gr¨oßen ausdr¨ ucken: dΦm 1 v E + E⊥ + × B = −c dl + dl⊥ dt γ c C 1 1 v E + γ E⊥ + × B = −c (dl + dl⊥ ) γ γ c C c dl (E + E ⊥ ) . =− γ C
Es folgt schließlich dΦm 1 dΦm c = =− dt γ dt γ ⇐⇒
dΦm (t) = −c dt
dl E (x , t )
C
dl E (x , t) .
C
2.4 Strahlungstheorie Dieser Abschnitt besch¨ aftigt sich mit elektromagnetischen Strahlungsph¨ anomenen, die durch zeitlich ver¨ anderliche Ladungs- und Stromdichteverteilungen hervorgerufen werden. Im allgemeinen ist f¨ ur beliebige Verteilungen die Berechnung der zugeh¨ origen elektromagnetischen Felder mit Hilfe der retardierten Potentiale nur numerisch durchf¨ uhrbar, da zu jedem Aufpunkt x eine retardierte Zeit tret geh¨ ort, die auch noch explizit von x abh¨ angt. Wir beschr¨ anken uns deshalb auf beschleunigte Punktladungen bzw. Verteilungen geringer Ausdehnung, f¨ ur die eine analytische Bestimmung der retardierten Potentiale m¨ oglich ist. Wir beginnen unsere Diskussion mit der Berechnung der retardierten Potentiale f¨ ur beliebig bewegte Punktladungen (Li´enard-Wiechert-Potentiale)
156
2. Elektrodynamik
und leiten hieraus die zugeh¨origen E- und B-Felder ab. Wie sich herausstellen wird, k¨ onnen diese jeweils als Summe zweier Terme geschrieben werden, von denen die einen die Felder einer gleichf¨ormig bewegten und die anderen die Felder einer beschleunigten Ladung beschreiben. Desweiteren berechnen wir die Energie bzw. Leistung, welche durch die Beschleunigungsanteile der Felder nach außen abgestrahlt wird, und besch¨aftigen uns zum Schluß mit dem Strahlungsfeld ¨ortlich begrenzter Ladungs- und Stromdichteverteilungen in der Dipoln¨ aherung. 2.4.1 Li´ enard-Wiechert-Potentiale Eine Punktladung q mit der Ortsbahn x0 (t) und der Geschwindigkeit x˙ 0 (t) besitzt die Ladungsdichte- und Stromdichteverteilung ρ(x, t) = qδ[x − x0 (t)] , j(x, t) = q x˙ 0 δ[x − x0 (t)] . Setzt man diese Gr¨oßen in die retardierten Potentiale (2.35) und (2.36) ein, so l¨ aßt sich die r¨aumliche Integration direkt ausf¨ uhren, und man erh¨alt 1 |x − x0 (t )| δ t φ(x, t) = q dt − t + |x − x0 (t )| c ˙ q (t ) |x − x0 (t )| x 0 A(x, t) = dt δ t −t+ . c |x − x0 (t )| c Bei der zeitlichen Integration ist zu beachten, daß das Argument der δFunktion eine Funktion der Integrationsvariablen t ist. In diesem Fall gilt ganz allgemein g(tk ) , tk =Nullstellen von f . dt g(t )δ[f (t )] = df k dt tk
Unter Ber¨ ucksichtigung dieses Punktes folgt der Satz 2.11: Li´ enard-Wiechert-Potentiale einer beliebig bewegten Punktladung Die retardierten Potentiale einer Punktladung q, die sich auf einer beliebigen Bahnkurve x0 (t) mit der Geschwindigkeit x˙ 0 (t) bewegt, sind durch die Li´enard-Wiechert-Potentiale q φ(x, t) = 1 R(tret ) − c R(tret )x˙ 0 (tret ) q x˙ 0 (tret ) A(x, t) = , c R(tret ) − 1c R(tret )x˙ 0 (tret ) R(tret ) = x − x0 (tret ) , R(tret ) = |R(tret )|
(2.48)
2.4 Strahlungstheorie
157
gegeben. Hierbei bezeichnet R(tret ) den Abstandsvektor zwischen Beobachtungspunkt x und Teilchenort x0 zur retardierten Zeit tret = t −
|x − x0 (tret )| R(tret ) =t− . c c
(2.49)
Bevor wir uns der Berechnung der E- und B-Felder zuwenden, zeigen wir, wie man zu diesem Ergebnis auf etwas elegantere Weise mit Hilfe des lorentzkovarianten Formalismus gelangt. Zun¨ achst stellen wir fest, daß R c(t − tret ) = (Rµ ) = |x − x0 (tret )| R ein Vierervektor ist, da nach (2.48) und (2.49) in jedem Inertialsystem gilt: Rµ Rµ = c2 (tret − t)2 − R2 (tret ) = 0 . Nun lassen sich die retardierten Potentiale im (gestrichenen) momentanen Ruhesystem des Teilchens leicht angeben. Sie lauten dort q q φ (x , t ) = = , A (x , t ) = 0 |x − x0 (tret )| R (tret ) bzw. Aµ = q
uµ Rν uν
⎛ ⎞ c ⎜0⎟ µ ⎟ , (u ) = ⎜ ⎝0⎠ , 0
(2.50)
wobei uµ die Vierergeschwindigkeit im Ruhesystem bezeichnet. Offensichtlich transformieren sich beide Seiten von (2.50) wie ein kontravarianter Vierervektor, so daß diese Gleichung forminvariant und somit in jedem Inertialsystem g¨ ultig ist. Gehen wir jetzt zum urspr¨ unglichen (ungestrichenen) Inertialsystem u ¨ber, dann ist uµ 1 c µ µ , A =q , (u ) = x˙ 0 Rν u ν ˙2 x 1 − c20 woraus sofort die in Satz 2.11 stehenden Potentiale folgen. Bestimmung der elektromagnetischen Felder. Die Berechnung von 1 ∂A , B =∇×A (2.51) c ∂t aufgrund von Satz 2.11 erfordert die Kenntnis von ∂tret /∂t und ∇tret , da die Li´enard-Wiechert-Potentiale in Termen der retardierten Zeit tret gegeben angt. Zur Bestimmung von sind, wobei tret u ¨berdies auch noch von x abh¨ ∂tret /∂t und ∇tret rechnen wir: E = −∇φ −
∂R2 ∂R ∂R = 2R = 2R = −2Rx˙ 0 ∂tret ∂tret ∂tret
158
2. Elektrodynamik
Rx˙ 0 ∂tret ∂R ∂tret ∂R =− = R ∂t ∂t ∂tret ∂t ∂tret ∂R =c 1− . R(tret ) = c(t − tret ) =⇒ ∂t ∂t
(2.52)
=⇒
(2.53)
Kombiniert man (2.52) und (2.53), dann folgt ∂tret 1 = , ∂t 1 − nβ
mit
n=
R x˙ 0 , β= . R c
(2.54)
Die Ableitung von R nach seinen Komponenten liefert einerseits ∇R = ∇c(t − tret ) = −c∇tret und andererseits ∇R = ∇|x − x0 (tret )| =
∂R R + ∇tret = n − nx˙ 0 ∇tret , ∂tret R
so daß ∇tret =
1 n . c nβ − 1
(2.55)
Mit Hilfe von (2.54) und (2.55) – alles an der Stelle tret genommen – lassen sich nun die Rechnungen in (2.51) ausf¨ uhren. Nach einigen Zwischenschritten gelangt man zum Satz 2.12: E- und B-Felder einer beliebig bewegten Punktladung Die elektromagnetischen Felder einer beliebig, mit der Geschwindigkeit x˙ 0 bewegten Punktladung q werden beschrieben durch
˙ q n × [(n − β) × β] (n − β)(1 − β 2 ) + E(x, t) = q R2 (1 − nβ)3 tret c R(1 − nβ)3 = B(x, t) = =
E 0 (x, t)
+
E a (x, t)
n × E 0 (x, t)
+
n × E a (x, t)
B 0 (x, t)
+
B a (x, t) ,
tret
mit x˙ 0 R , β= . R c Das magnetische Feld steht sowohl zum elektrischen Feld als auch zum Verbindungsvektor zwischen Beobachtungspunkt und retardierter Teilchenposition senkrecht. n=
In diesem Satz sind die E- und B-Felder jeweils als Summe zweier Terme angegeben. Die ersten Terme sind unabh¨angig von der Teilchenbeschleunigung
2.4 Strahlungstheorie
159
ahrend die zweiten wie β˙ und verhalten sich f¨ ur große Abst¨ ande wie 1/R2 , w¨ ˙ 1/R abfallen und f¨ ur β = 0 verschwinden. E 0 und B 0 liefern deshalb die Felder einer gleichf¨ ormig bewegten Ladung. Wir k¨ onnen uns hiervon explizit u ¨berzeugen, indem wir zum Beispiel eine Punktladung q betrachten, die sich entlang der x-Achse mit konstanter Geschwindigkeit v bewegt. W¨ ahlen wir als Beobachtungspunkt den Ursprung, dann ist ⎛ ⎞ ⎛ ⎞ ⎛v⎞ vt −1 c x0 (t) = ⎝ 0 ⎠ , x = 0 , R(tret ) = vtret , n = ⎝ 0 ⎠ , β = ⎝ 0 ⎠ 0 0 0 ⎛ ⎞ 1 1 q ⎝ 0⎠ , γ = =⇒ E 0 (0, t) = − . v 2 2 2 2 1 − β2 γ v tret 1 + c 0 Die retardierte Zeit berechnet sich zu |x − x0 (tret )| t vtret tret = t − =t− =⇒ tret = c c 1+
v c
,
so daß schließlich folgt:
⎛ ⎞ 1 q ⎝ ⎠ , B 0 (0, t) = n × E(0, t) = 0 . E 0 (0, t) = − 2 2 2 0 γ v t 0
Diese Felder entsprechen genau denjenigen aus Anwendung 24 f¨ ur x = 0. Dort hatten wir die E- und B-Felder einer gleichf¨ormig in x-Richtung bewegten Ladung mit Hilfe des lorentzkovarianten Formalismus berechnet. 2.4.2 Strahlungsenergie In diesem Unterabschnitt berechnen wir die von einer bewegten Punktladung abgestrahlte Leistung P . Es wird hierbei vorausgesetzt, daß alle Gr¨ oßen zur retardierten Zeit tret zu nehmen sind. Durch das Fl¨ achenelement R2 dΩ geht der Energiestrom bzw. die Leistung dP = SnR2 dΩ, also dP dE cR2 = R2 Sn = = n(E × B) . 4π dtdΩ dΩ Setzt man in diese Gleichung die Felder aus Satz 2.12 ein, so erkennt man anhand des asymptotischen R-Verhaltens der einzelnen Terme, daß nur die Kombination E a × B a einen Beitrag liefert. Mit anderen Worten: Nur beschleunigte Ladungen emittieren Strahlung. Wir haben deshalb 2 ˙ dP cR2 q 2 n × [(n − β) × β] = n(E a × B a ) = . dΩ 4π 4πc (1 − nβ)6 Vom Standpunkt der Ladung ist es naheliegend, die pro retardiertem Zeitintervall dtret abgestrahlte Energie zu betrachten. Unter Ber¨ ucksichtigung von (2.54) ergibt sich diese zu
160
2. Elektrodynamik
2 ˙ dP ∂t q 2 n × [(n − β) × β] dP = = . (2.56) 4πc (1 − nβ)5 dΩ dΩ ∂tret Um diese Gleichung weiter auszuwerten, betrachten wir zun¨achst die Grenzf¨ alle β 1 und β β˙ und setzen dabei nβ nβ˙ cos θ = . , cos θ = β β˙ 1. Grenzfall: β 1. In diesem Fall reduziert sich (2.56) auf den Ausdruck dP q2 ˙ 2 2 dP = = (2.57) β sin θ . dΩ dΩ 4πc Offensichtlich ist er von der Richtung der Teilchengeschwindigkeit unabh¨angig. Die Winkelabh¨angigkeit dieser Strahlungsleistung ist in Abb. 2.6 dargestellt. F¨ uhrt man die Winkelintegration in (2.57) aus, dann ergibt sich die Larmorsche Formel 2q 2 ˙ 2 P = (2.58) β . 3c
n
θ β˙
Abb. 2.6. Abgestrahlte Leistung dP/dΩ einer beschleunigten Punktladung im Grenzfall β 1. θ bezeichnet den Winkel zwischen der Teilchenbeschleunigung β˙ und der Ausstrahlungsrichtung n
˙ Hier ist θ = θ , und (2.56) geht u 2. Grenzfall: β β. ¨ber in dP sin2 θ q2 ˙ 2 . = β dΩ 4πc (1 − β cos θ)5 F¨ ur die Richtung maximaler Strahlungsemission erh¨alt man hieraus d dP 1 = 0 =⇒ cos θmax = 15β 2 + 1 − 1 . d cos θ dΩ 3β
2.4 Strahlungstheorie
161
Das heißt der Strahlungskegel neigt sich bei wachsender Teilchengeschwindigkeit immer mehr nach vorne, wie in Abb. 2.7 zu erkennen ist.
n θ β, β˙
β, β˙
Abb. 2.7. Abgestrahlte Leistung dP/dΩ einer beschleunigten Punktladung im Grenzfall β β˙ f¨ ur β = 0.5 (links) und β = 0.81 (rechts). Zum maßstabsgerechten Vergleich ist die rechte Figur um den Faktor 100 zu vergr¨ oßern
Lorentzinvariante Verallgemeinerung. Aus dem ersten Spezialfall l¨ aßt sich nun leicht mit Hilfe des lorentzkovarianten Formalismus die abgestrahlte Leistung einer Punktladung f¨ ur beliebige Geschwindigkeiten bestimmen. Da sowohl die Energie E als auch die Zeit t (bis auf die Konstante c) 0Komponenten von Vierervektoren sind, ist P = dE/dt ein Lorentz-Skalar. Um den ersten Spezialfall auf beliebige β zu erweitern, reicht es deshalb aus, einen Lorentz-Skalar zu finden, der f¨ ur β 1 in (2.58) u ¨bergeht. Zu diesem Zweck dr¨ ucken wir (2.58) durch den nichtrelativistischen Impuls pnr aus und verallgemeinern das Resultat in invarianter Weise, indem wir pnr und dt durch 1 cm µ 0 bzw. die Eigenzeit dτ = dt 1 − β 2 den Viererimpuls (p ) = √ 2 1−β β ersetzen: P =
2q 2 dpµ dpµ 2q 2 dpnr dpnr −→ − . 3m20 c3 dt dt 3m20 c3 dτ dτ
Die rechte Seite dieser Gleichung ist ganz offensichtlich ein Lorentz-Skalar, und man u ¨berzeugt sich leicht davon, daß sie im Grenzfall β 1 mit (2.58) identisch ist. F¨ ur beliebige Teilchengeschwindigkeiten folgt daher der Satz 2.13: Strahlungsleistung einer beliebig bewegten Punktladung Die Strahlungsleistung einer beliebig, mit der Geschwindigkeit x˙ 0 bewegten Punktladung q ist gegeben durch
162
2. Elektrodynamik
P =
! 2q 2 6 ˙ 2 ˙ 2 , β = x˙ 0 , γ = 1 γ β − (β × β) . 3c c 1 − β2
Diese Gleichung impliziert: Nur beschleunigte Ladungen emittieren Strahlung. Die mit einer beschleunigten Ladung verbundene Strahlungsleistung P reduziert die kinetische Energie dieses Teilchens. Man spricht daher auch von Strahlungsverlusten. Diese treten z.B. bei Linear- oder Kreisbeschleunigern auf. Auch R¨ ontgenstrahlen sind eine Form von Strahlungsverlusten. Sie werden erzeugt, indem in einer Elektronenr¨ohre eine hohe Spannung zwischen Anode und Kathode angelegt wird. Die Elektronen werden beim Durchlaufen dieser Potentialdifferenz beschleunigt und treffen mit hoher Energie auf ˙ groß) und strahlen die Anode. Beim Aufprall werden sie stark gebremst (|β| elektromagnetische Energie (Bremsstrahlung) ab. 2.4.3 Dipolstrahlung Wir wollen nun das Strahlungsfeld eines Systems von zeitlich ver¨anderlichen Ladungs- und Stromdichteverteilungen berechnen, die in der Weise 5 beliebig f¨ ur |x| ≤ R0 ρ(x, t), j(x, t) = 0 f¨ ur |x| > R0 auf ein Gebiet mit dem Radius R0 beschr¨ankt sind. Aufgrund der Linearit¨at der Maxwell-Gleichungen reicht es aus, sich auf jeweils eine zeitliche FourierKomponente dieser Verteilungen zu beschr¨anken, die sinusf¨ormig mit der Zeit variiert, ρ(x, t) = ρ(x)e−iωt , j(x, t) = j(x)e−iωt , wobei zu beachten ist, daß sich die physikalischen Gr¨oßen durch Realteilbildung ergeben. Das zugeh¨orige retardierte Vektorpotential ist gegeben durch 1 j(x , tret ) Aret (x, t) = d3 x = Aret (x)e−iωt , c |x − x | mit Aret (x) =
1 c
d3 x
j(x )eik|x−x | ω , k= . |x − x | c
(2.59)
Aufgrund von (IV) und (2.15) folgt hieraus f¨ ur die E- und B-Felder im außeren Bereich |x| > R0 ¨ ⎫ B(x, t) = B(x)e−iωt , B(x) = ∇ × Aret (x) ⎪ ⎬ (2.60) i ⎭ E(x, t) = E(x)e−iωt , E(x) = ∇ × B(x) . ⎪ k
2.4 Strahlungstheorie
163
Zur weiteren Auswertung von (2.59) nehmen wir an, daß gilt: R0 |x|, λ, wobei λ = 2π/k die Wellenl¨ ange des durch (2.60) beschriebenen Strahlungsfeldes bezeichnet. Unter dieser Voraussetzung ist es erlaubt, den in (2.59)
stehenden Ausdruck
eik|x−x | |x−x |
in folgender Weise zu entwickeln:
x2 xx |x − x | = |x| 1 + 2 − 2 2 x x
=⇒
1/2
eik|x−x | eik|x| e−ikxx /|x| ≈ |x − x | |x|
mit r = |x| , n =
1/2 xx ≈ |x| 1 − 2 2 x xx ≈ |x| 1 − 2 x −1 xx ≈ |x| 1 + 2 x xx eikr −iknx e 1+ 2 ≈ , x r
(2.61) (2.62)
x . |x|
Wegen 2π/k R0 ⇐⇒ k 2π/R0 k¨ onnen wir desweiteren die Langwellenbzw. Dipoln¨ aherung vornehmen:
e−iknx ≈ 1 − iknx + . . . ≈ 1 .
(2.63)
Unter Ber¨ ucksichtigung dieser Approximationen geht (2.59) u ¨ber in ikr 1e d3 x j(x ) . Aret (x) = c r Der Integrand dieser Gleichung l¨ aßt sich unter Zuhilfenahme der Kontinuit¨atsgleichung ∂ρ(x, t) =⇒ ∇j(x) = iωρ(x) ∂t und der Identit¨ at (j∇ )x = j umformen zu d3 x j(x ) = d3 x [j(x )∇ ]x = − d3 x x [∇ j(x )] = −iω d3 x x ρ(x ) , ∇j(x, t) = −
(2.64)
so daß folgt: Aret (x) = −ikp wobei p=
3
eikr , r
d x x ρ(x ) , p(t) =
(2.65)
d3 x x ρ(x )e−iωt
164
2. Elektrodynamik
das elektrische Dipolmoment der Ladungsverteilung bezeichnet. Offensichtlich beschreibt (2.65) eine auslaufende Kugelwelle, deren Wellenzahl k = ω/c durch die Frequenz der Ladungsverteilung bestimmt ist. Setzen wir nun (2.65) in (2.60) ein, dann erh¨alt man schließlich den Satz 2.14: E- und B-Felder einer zeitlich oszillierenden Ladungs- und Stromdichteverteilung Gegeben sei eine auf den Bereich r = |x| < R0 beschr¨ankte Ladungs- und Stromdichteverteilung ρ(x, t) = Re ρ(x)e−iωt , j(x, t) = Re j(x)e−iωt . Die zugeh¨ origen elektromagnetischen Felder sind dann f¨ ur R0 r, 2πc/ω in der Dipoln¨ aherung gegeben durch B(x, t) = Re B(x)e−iωt , E(x, t) = Re E(x)e−iωt , mit
eikr 2 1 B(x) = k 1− (n × p) r ikr 6 7 eikr 1 1 2 E(x) = k [(n × p) × n] + − ik [3n(np) − p] r r r
Hierbei ist n = x/|x| und p = d3 x x ρ(x ) , p(t) = pe−iωt
⎫ ⎪ ⎪ ⎬ ⎪ ⎭ .⎪
(2.66)
(2.67)
das elektrische Dipolmoment der Ladungsverteilung. Das E-Feld besitzt offenbar sowohl eine longitudinale als auch eine transversale Komponente relativ zur Ausbreitungsrichtung n, w¨ahrend das B-Feld transversal zu n polarisiert ist. Es ist instruktiv, dieses Ergebnis f¨ ur zwei Spezialf¨ alle zu untersuchen: • Fern- oder Strahlungszone: R0 λ r. Hierf¨ ur vereinfacht sich (2.66) zu eikr 2 eikr 2 B(x) = k (n × p) , E(x) = k (n × p) × n = B(x, t) × n . r r E und B bilden mit n in dieser Reihenfolge ein orthogonales Dreibein. Die zeitgemittelte Energiestromdichte berechnet sich zu c ck 4 [(n × p)(n × p∗ )]n Re(E × B ∗ ) = 8π 8πr2 und zeigt in Richtung von n, also von der oszillierenden Ladungsverteilung radial nach außen. F¨ ur die zeitgemittelte Strahlungsleistung folgt somit S=
dP ck 4 = r2 nS = (n × p)(n × p∗ ) . dΩ 8π
(2.68)
Anwendungen
165
Das Verhalten E, B ∼ 1/r ist charakteristisch f¨ ur Strahlungsfelder. Es impliziert, daß die Strahlungsleistung im Limes r → ∞ unabh¨ angig von r ist, d.h., daß Strahlung nach außen abgegeben wird. • Nahzone: R0 r λ. In diesem Fall gilt 1 1 kr 1 =⇒ m , eikr ≈ 1 , krrm r und (2.66) reduziert sich auf ik 3n(np) − p (n × p) , E(x) = . 2 r r3 Ignorieren wir den Term e−iωt , so ist das elektrische Feld gleich dem eines elektrostatischen Dipols (siehe Unterabschn. 2.5.2). Das magnetische Feld ist um den Faktor kr 1 kleiner als das elektrische, d.h. die Felder in der Nahzone sind dominant elektrischer Natur. B(x) =
Ber¨ ucksichtigt man in (2.63) den n¨ achstf¨ uhrenden Term −iknx , dann werden die Felder (2.66) um magnetische Dipol- und elektrische Quadrupolfelder erweitert. Im allgemeinen werden die verschiedenen Strahlungsfelder mit E1 (elektrisches Dipolfeld), E2 (elektrisches Quadrupolfeld), M1 (magnetisches Dipolfeld) usw. bezeichnet. Zusammenfassung • Die Li´ enard-Wiechert-Potentiale beschreiben die retardierten Potentiale einer beliebig bewegten Punktladung. Die hierzu geh¨ orenden Eund B-Felder lassen sich jeweils als Summe zweier Terme schreiben, von denen die ersten die Felder einer gleichf¨ ormig bewegten Ladung beschreiben, w¨ahrend die zweiten proportional zur Teilchenbeschleunigung sind. • In die Strahlungsleistung einer beliebig bewegten Punktladung gehen nur die Beschleunigungsterme ein, woraus folgt, daß ausschließlich beschleunigte Ladungen Strahlung emittieren. • Einen interessanten Spezialfall stellen r¨ aumlich begrenzte und zeitlich oszillierende Ladungs- und Stromdichteverteilungen dar, f¨ ur die sich die zugeh¨ origen elektromagnetischen Felder in der Dipoln¨ aherung leicht berechnen lassen.
Anwendungen 26. Lineare Dipolantenne. Man betrachte eine stromdurchflossene lineare Dipolantenne der L¨ ange L, die entlang der z-Achse von z = −L/2 bis z = L/2 ausgerichtet ist (Abb. 2.8). Der Strom habe in der Mitte den Wert I0 und falle zu beiden Enden linear auf Null ab:
166
2. Elektrodynamik z L 2
n θ ∼
y ϕ
x − L2 Abb. 2.8. Dipolantenne. Durch einen Wechselstrom werden die beiden Dr¨ ahte abwechselnd positiv und negativ aufgeladen
I(z)e
−iωt
= I0
2|z| 1− L
e−iωt , L λ =
2πc . ω
Wie groß ist die zeitgemittelte Strahlungsleistung der Antenne in der Fernzone? L¨ osung. Aus der Kontinuit¨atsgleichung (2.64) folgt f¨ ur die lineare Ladungsdichte ρ (z) (Ladung pro Einheitsl¨ange) 2iI0 i dI(z) =± , ω dz ωL wobei das obere (untere) Vorzeichen f¨ ur positive (negative) z gilt. Das Dipolmoment (2.67) ist parallel zur z-Achse und hat den Wert ρ (z) = −
L/2
p=
dzzρ (z) =
iI0 L . 2ω
−L/2
F¨ ur die zeitgemittelte Winkelverteilung (2.68) ⎛ ⎞ der Strahlungsleistung in der cos ϕ sin θ Fernzone erh¨ alt man mit n = ⎝ sin ϕ sin θ ⎠ cos θ dP I 2 (ωL)2 sin2 θ . = 0 dΩ 32πc3 Integration dieser Gleichung u ¨ber die Winkel ergibt die totale Strahlungsleistung P =
I02 (ωL)2 . 12c3
2.5 Zeitunabh¨ angige Elektrodynamik
167
27. Kreisf¨ ormig bewegte Punktladung. Wie groß ist die Strahlungsleistung einer Punktladung q in der Fernzone, die sich mit konstanter Winkelgeschwindigkeit ω auf einem Kreis mit Radius r0 (r0 λ = 2πc/ω) in der xy-Ebene bewegt? L¨ osung. Die Ladungsdichte f¨ ur dieses Problem lautet ⎛ ⎞ cos ωt ρ(x, t) = qδ[x − x0 (t)] , x0 (t) = r0 ⎝ sin ωt ⎠ . 0 Hieraus ergibt sich das Dipolmoment p(t) = q
⎛ ⎞ 1 d3 x x δ[x − x0 (t)] = qx0 (t) = Re pe−iωt , p = qr0 ⎝ i ⎠ , 0
welches in dieser Form die richtige, in (2.67) vorausgesetzte ⎛ Zeitabh¨ angigkeit ⎞ cos ϕ sin θ besitzt. Setzen wir nun p in (2.68) ein, dann folgt mit n = ⎝ sin ϕ sin θ ⎠ cos θ ω 4 q 2 r02 ω 4 q 2 r02 dP 2 = θ =⇒ P = . 1 + cos dΩ 8πc3 3c3
2.5 Zeitunabh¨ angige Elektrodynamik Hat man es mit statischen Ladungs- und Stromdichten zu tun, dann zerfallen die vier Maxwell-Gleichungen in zwei entkoppelte Gleichungssysteme, welche die Grundgleichungen der Elektrostatik und Magnetostatik bilden. In vielen Lehrb¨ uchern der Elektrodynamik werden diese statischen Gleichungen (aus historischen Gr¨ unden) vor den allgemeinen Maxwell-Gleichungen diskutiert und ph¨ anomenologisch begr¨ undet. Entsprechend unserem axiomatischdeduktiv orientierten Ansatz gehen wir den umgekehrten Weg und betrachten den statischen Fall von vornherein als ein Spezialfall der Gleichungen (I) bis (IV). Aus den Ergebnissen der vorherigen Abschnitte lassen sich dann durch Elimination jeglicher Zeitabh¨ angigkeiten viele der statischen physikalischen Gesetzm¨aßigkeiten leicht ableiten. Nach der Herleitung der aus vorigen Abschnitten folgenden Beziehungen f¨ ur den elektro- und magnetostatischen Fall diskutieren wir die Multipolentwicklung statischer Potentiale f¨ ur große Entfernungen. Desweiteren betrachten wir mit elektrischen Leitern verbundene Randwertprobleme der Elektrostatik, sowohl im Rahmen des formalen Green-Funktionen-Kalk¨ uls als auch mit Hilfe praktischer Berechnungsmethoden. Zum Schluß wenden wir uns einem Standardbeispiel f¨ ur magnetostatische Feldverteilungsprobleme zu.
168
2. Elektrodynamik
2.5.1 Elektrostatik und Magnetostatik Sind Ladungs- und Stromdichte zeitlich konstant, dann fallen aus den Maxwell-Gleichungen alle Zeitabh¨angigkeiten heraus, und es liegt der statische Fall der Elektrodynamik vor: Definition: Statischer Fall der Elektrodynamik (Elektrostatik, Magnetostatik) Im statischen Fall der Elektrodynamik entkoppeln die MaxwellGleichungen (I) bis (IV) in zwei Differentialgleichungssysteme: ∇E(x) = 4πρ(x) Elektrostatik (2.69) ∇ × E(x) = 0 ⎫ ⎪ ∇B(x) = 0 ⎬ Magnetostatik . (2.70) 4π ⎭ ∇ × B(x) = j(x) ⎪ c Das erste System bildet die Grundgleichungen der Elektrostatik, das zweite die der Magnetostatik. Aufgrund der Zeitunabh¨angigkeit der Ladungsdichte reduziert sich die Kontinuit¨atsgleichung auf ∇j(x) = 0 . Das heißt es existiert kein Nettoladungsfluß. Da es sich beim statischen Fall um einen Spezialfall der Elektrodynamik handelt, k¨ onnen wir viele der aus (2.69) und (2.70) folgenden statischen Gesetzm¨ aßigkeiten aus den allgemein g¨ ultigen Beziehungen vorheriger Abschnitte ableiten. Wir wollen dies tun, indem wir die in Frage kommenden Abschnitte nacheinander durchgehen. Aus Abschn. 2.2 k¨onnen alle Definitionen und S¨ atze u ¨bernommen werden, wenn u ¨berall die Zeitabh¨angigkeit entfernt wird. Definition: Statisches Skalarpotential φ und statisches Vektorpotential A Skalarpotential φ und Vektorpotential A sind im statischen Fall implizit definiert durch E(x) = −∇φ(x) , B(x) = ∇ × A(x) . E und B sind invariant unter den Eichtransformationen A(x) −→ A (x) = A(x) + ∇χ(x) φ(x) −→ φ (x) = φ(x) + const .
2.5 Zeitunabh¨ angige Elektrodynamik
169
Offenbar sind im statischen Fall die Coulomb- und die Lorentz-Eichung identisch und f¨ uhren deshalb auf dieselben Potentialgleichungen, deren L¨ osungen aus den S¨ atzen 2.7 und 2.8 ersichtlich sind: Satz 2.15: Statische Maxwell-Gleichungen in Form von Potentialen Im statischen Fall f¨ uhrt die Coulomb- und Lorentz-Eichung ∇A(x) = 0 auf die Potentialgleichungen ∇2 φ(x) = −4πρ(x) (Statische Poisson-Gleichung) 4π ∇2 A(x) = − j(x) . c Ihre allgemeine homogene L¨ osung lautet ikx ˜ , Ahom,i (x) = Re d3 k A˜i (k)eikx . φhom (x) = Re d3 k φ(k)e Eine inhomogene L¨ osung der Potentialgleichungen ist 1 3 ρ(x ) 3 j(x ) d φ(x) = d x x , A(x) = . |x − x | c |x − x |
(2.71)
Da keine Zeitabh¨ angigkeit vorhanden ist, macht es hier nat¨ urlich keinen Sinn, bei der inhomogenen L¨ osung von retardierten Potentialen“ zu sprechen. Zu” sammen mit B = ∇ × A folgt aus der letzten Gleichung dieses Satzes der Satz 2.16: Biot-Savartsches Gesetz Bei gegebener Stromdichte berechnet sich das magnetische Induktionsfeld wie folgt: 1 x − x B(x) = d3 x j(x ) × . c |x − x |3 Die lorentzkovariante Formulierung der Elektrodynamik (Abschn. 2.3) l¨ aßt sich nat¨ urlich nicht auf den statischen Fall u bertragen, denn in der Relati¨ vit¨ atstheorie stellt die Zeit eine zu den drei Raumrichtungen gleichwertige Dimension dar. Da der statische Fall jedoch keine Zeitabh¨ angigkeiten beinhaltet, kann er sich nur auf ein Inertialsystem beziehen. In Abschn. 2.4 besitzen nur die ersten beiden S¨ atze 2.11 und 2.12 statische Analoga, die wir wie folgt zusammenfassen: Satz 2.17: Potentiale und Felder einer statischen, in x0 ruhenden Punktladung q (Coulomb-Gesetz) φ(x) =
q x − x0 , A(x) = 0 , B(x) = 0 . , E(x) = q |x − x0 | |x − x0 |3
170
2. Elektrodynamik
Wie vern¨ unftigerweise zu erwarten ist, stellen die Potentiale dieses Satzes einen Spezialfall von (2.71) f¨ ur ρ(x) = qδ(x − x0 ) und j(x) = 0 dar. Die weiteren S¨ atze 2.13 und 2.14 in Abschn. 2.4 setzen ausschließlich bewegte Ladungen voraus und liefern deshalb f¨ ur den statischen Fall keinen Beitrag. Elektrostatische Feldenergie und Selbstenergieproblem. Betrachten wir als n¨ achstes eine ruhende Ladungsverteilung ρ(x). Mit ihr ist nach Satz 2.4 die elektromagnetische (in diesem Fall: elektrostatische) Feldenergie 1 Eem = d3 xE 2 (x) 8π 1 1 3 d x[∇φ(x)]∇φ(x) = d3 xρ(x)φ(x) = 8π 2 verbunden, wobei φ das von der Ladungsdichte selbst erzeugte elektrostatische Potential bezeichnet. Setzen wir nun in diese Gleichung das φ aus Satz 2.15 ein, dann folgt ρ(x)ρ(x ) 1 3 Eem = d x d3 x . (2.72) 2 |x − x | Hierbei ist zu beachten, daß diese Formel nur f¨ ur eine kontinuierliche Ladungsverteilung Sinn macht. Hat man es n¨amlich mit einem System von diskreten Punktladungen qi an den Orten xi zu tun, also ρ(x) = qi δ(x − xi ) , i
dann geht (2.72) u ¨ber in qi qj δ(x − xi )δ(x − xj ) 1 Eem = d3 x d3 x 2 i,j |x − x | =
1 qi qj . 2 i,j |xi − xj |
(2.73)
Offenbar liefern in dieser Summe die Terme mit i = j divergente Beitr¨age. Sie entsprechen der Selbstenergie der Ladungen qi aufgrund ihrer eigenen Felder an ihren Aufenthaltsorten xi . Die Ursache dieses unphysikalischen Sachverhaltes liegt im Konzept der Punktladung, das durch Verwendung der δ-Funktion zum Ausdruck kommt. Die Elektrodynamik – als eine klassische Feldtheorie – ist nicht bis hinunter zu kleinsten Abst¨anden g¨ ultig! Im Hinblick auf eine grobe Absch¨atzung des G¨ ultigkeitsbereiches der Elektrodynamik ist es vern¨ unftig, anzunehmen, daß die Selbstenergie eines Teilchens in der Gr¨ oßenordnung seiner Ruheenergie liegt. Nehmen wir weiterhin an, daß das Teilchen, z.B. ein Elektron, eine endliche Ausdehnung R0 hat, dann ist seine Selbstenergie von der Gr¨oßenordnung e2 /R0 , und wir k¨onnen R0 absch¨ atzen durch e2 e2 ≈ me c2 =⇒ R0 ≈ = 2.8 · 10−15 m , R0 me c2
2.5 Zeitunabh¨ angige Elektrodynamik
171
wobei e die Ladung und me die Ruhemasse des Elektrons bezeichnet. Dies ist der sog. klassische Elektronradius. Aus der Quantenmechanik wissen wir allerdings, daß Quanteneffekte noch auf einer sehr viel gr¨ oßeren L¨ angenskala eine Rolle spielen, die von der Gr¨ oßenordnung h ¯ 2 /(me e2 ) = 0.5 · 10−10 m (Bohrscher Radius) ist. Wir m¨ ussen uns offensichtlich damit abfinden, daß das Selbstenergieproblem innerhalb der Elektrodynamik nicht gel¨ ost werden ur ad¨ aquaten Rahmen liefert die Quantenelektrodynamik, eine kann. Den hierf¨ Quantenfeldtheorie, welche die klassische Elektrodynamik und die relativistische Quantenmechanik in sich vereinigt. Subtrahiert man von (2.73) die unphysikalischen Selbstenergiebeitr¨ age, so erh¨ alt man die potentielle Energie einer diskreten Ladungsverteilung, die sich aus den Wechselwirkungsenergien zwischen den verschiedenen Ladungen zusammensetzt: 1 qi qj Eem = . |xi − xj | 2 i=j
2.5.2 Multipolentwicklung statischer Potentiale und Felder Im folgenden betrachten wir statische Ladungs- und Stromdichteverteilunortlich begrenzt sind. Unter dieser Vorgen, die auf einen Bereich |x| ≤ R0 ¨ aussetzung ist es m¨ oglich, die zugeh¨ origen Potentiale und Felder in großen Entfernungen |x| R0 approximativ zu berechnen. Das hierzu verwendete Verfahren heißt Multipolentwicklung. Sowohl das Skalar- als auch das Vektorpotential besitzen nach Satz 2.15 dieselbe 1/|x − x |-Abh¨ angigkeit, die wir in folgender Weise um x = 0 entwickeln: 1 1 1 ∂ x = + i |x − x | |x − x | |x| ∂x i i x =0 1 1 ∂ ∂ xx + ... . + 2 i,j i j ∂xi ∂xj |x − x | x =0
Unter Ber¨ ucksichtigung von 1 1 ∂ ∂ =− ∂x |x − x | ∂xi |x − x | i
x =0
x =0
folgt x xi 1 1 1 i + xx = + |x − x | |x| |x|3 2 i,j i j i
=−
∂ 1 ∂xi |x|
3xi xj δij − 5 |x| |x|3
+ ... .
(2.74)
Elektrostatische Multipolentwicklung. Setzen wir diese Entwicklung in (2.71) ein, so ergibt sich in den ersten drei f¨ uhrenden Ordnungen f¨ ur φ:
172
2. Elektrodynamik
• Elektrisches Monopolmoment (Ladung): 1 Q d3 x ρ(x ) = , Q = d3 x ρ(x ) . φ0 (x) = |x| |x| Das heißt: Von weiter Entfernung betrachtet verh¨alt sich eine statische Ladungsverteilung wie eine Punktladung. • Elektrisches Dipolmoment: xp x 3 d x x ρ(x ) = , p = d3 x x ρ(x ) . φ1 (x) = |x|3 |x|3 Hierbei bezeichnet p das elektrische Dipolmoment der Ladungsverteilung. • Elektrisches Quadrupolmoment: 3xi xj − |x|2 δij φ2 (x) = d3 x xi xj ρ(x ) . 5 2|x| i,j Dieser Ausdruck l¨aßt sich vereinfachen, indem man die Null in Form von 3xi xj − |x|2 δij d3 x |x |2 δij ρ(x ) 5 6|x| i,j subtrahiert, so daß 3xi xj − |x|2 δij φ2 (x) = d3 x (3xi xj − |x |2 δij )ρ(x ) 5 6|x| i,j =
3xi xj − |x|2 δij Qij . 6|x|5 i,j
(2.75)
Dabei definiert Qij = d3 x (3xi xj − |x |2 δij )ρ(x ) das elektrische Quadrupolmoment. Da Qij spurlos ist, verschwindet der zweite Term in (2.75), und wir erhalten schließlich xi xj φ2 (x) = Qij . 2|x|5 i,j Satz 2.18: Multipolentwicklung des Skalarpotentials Das Skalarpotential einer auf den Bereich |x| ≤ R0 begrenzten statischen Ladungsverteilung ρ(x) l¨aßt sich f¨ ur große Abst¨ande |x| R0 in der Weise Q xi xj 1 xp φ(x) = + Qij + . . . (2.76) + |x| |x|3 2 i,j |x|5 entwickeln, mit
2.5 Zeitunabh¨ angige Elektrodynamik
Q= p= Qij =
. . .
173
d3 x ρ(x )
(el. Monopolmoment, Ladung)
d3 x x ρ(x )
(el. Dipolmoment)
d3 x (3xi xj − |x |2 δij )ρ(x )
(el. Quadrupolmoment) .
Die zum Mono- und Dipolmoment geh¨ orenden elektrischen Felder lauten E Mo (x) = Q
x 3x(xp) − p|x|2 , E (x) = . Di |x|5 |x|3
Die Matrix Qij verh¨ alt sich unter orthogonalen Transformationen wie ein Tensor 2. Stufe und besitzt 9 Komponenten. Aufgrund ihrer Symmetrieeigenschaften (Qij = Qji , Q11 + Q22 + Q33 = 0) sind nur f¨ unf von ihnen unber, dann reduziert abh¨ angig. Geht man zum Hauptachsensystem von Qij u ¨ sich die Zahl unabh¨ angiger Komponenten sogar auf zwei. Der n¨ achstf¨ uhrende Term in der Entwicklung (2.76) enth¨ alt das Oktupolmoment. Es besteht aus einem Tensor 3. Stufe mit 27 Komponenten, von denen ebenfalls nur einige unabh¨ angig voneinander sind. Sollte es notwendig sein, h¨ ohere Dipolmomente zu berechnen, dann liefert die Multipolentwicklung in sph¨ arischen Koordinaten den wesentlich leichteren Ansatz. Wir diskutieren dies in Anwendung 28. Magnetostatische Multipolentwicklung. Unter Mitnahme der ersten beiden Terme in (2.74) ergibt sich aus (2.71) f¨ ur A: • Magnetisches Monopolmoment: 1 A0 (x) = d3 x j(x ) . c|x| Wegen ∇j = 0 gilt f¨ ur jede skalar- oder vektorwertige Funktion f (x ) 0 = d3 x f (x )∇ j(x ) = − d3 x [∇ f (x )]j(x ) . (2.77) . Setzen wir f (x ) = x , dann folgt: d3 x j = 0 =⇒ A0 (x) = 0. Das heißt die Stromdichteverteilung j besitzt keinen Monopolanteil. • Magnetisches Dipolmoment: 1 d3 x (xx )j(x ) . A1 (x) = c|x|3 Dieser Ausdruck l¨ aßt sich mit Hilfe der Integralbeziehung (2.77) in folgender Weise umformen: f (x ) = xk xl =⇒ d3 x (xl jk + xk jl ) = 0 1 3 =⇒ d x xl jk = d3 x (xl jk − xk jl ) 2
174
2. Elektrodynamik
1 d x d3 x (xl xl jk − xl xk jl ) =⇒ = 2 l l 1 3 d3 x [(xx )j − x (xj)] =⇒ d x (xx )j = 2 1 = − x × d3 x x × j (2.78) 2 µ×x 1 =⇒ A1 (x) = d3 x x × j . , µ= 2c |x|3 3
xl xl jk
Hierbei bezeichnet µ das magnetische Dipolmoment. Satz 2.19: Multipolentwicklung des Vektorpotentials Das Vektorpotential einer auf den Bereich |x| ≤ R0 begrenzten statischen Stromdichteverteilung j(x) l¨aßt sich f¨ ur große Abst¨ande |x| R0 in der Weise µ×x A(x) = + ... |x|3 entwickeln, mit 1 d3 x x × j(x ) µ= 2c
(magn. Dipolmoment) .
Im Gegensatz zum Skalarpotential besitzt das statische Vektorpotential keinen Monopolanteil. Das zugeh¨orige magnetische Dipolfeld ist B Di (x) =
3x(xµ) − µ|x|2 |x|5
und besitzt dieselbe Struktur wie das elektrische Dipolfeld. Offenbar verschwinden manche Momente in der Multipolentwicklung von φ und A, falls die Ladungs- bzw. Stromdichteverteilung eine r¨aumliche Symmetrie besitzt. Zum Beispiel verschwindet das elektrische Monopolmoment, wenn eine gleiche Zahl negativer und positiver Ladungen vorhanden ist. Das elektrische Dipolmoment verschwindet, wenn zu jedem Dipol ein gleich großer entgegengesetzter Dipol existiert, usw. Magnetischer Dipol im ¨ außeren Magnetfeld. Wir berechnen nun die Kraft und das Drehmoment auf einen magnetischen Dipol in einem a¨ußeren Magnetfeld B. Dabei setzen wir wieder voraus, daß die Stromdichteverteilung j um x = 0 o ¨rtlich begrenzt ist und ferner, daß das Magnetfeld o¨rtlich nur schwach variiert. Entwickelt man das Magnetfeld um den Ursprung, B(x ) = B(0) + (x ∇)B(x)|x=0 + . . . , dann kann man f¨ ur die Kraft F auf die Stromdichteverteilung schreiben:
2.5 Zeitunabh¨ angige Elektrodynamik
175
1 d3 x j(x ) × B(x ) c 1 1 = d3 x j(x ) ×B(0) + d3 x j(x ) × (x ∇)B(x)|x=0 c c =0 1 d3 x j(x ) × (x ∇)B(x)|x=0 = c 1 3 d x (∇x )j(x ) × B(x)|x=0 . = c
F =
Diese Gleichung l¨ aßt sich mit Hilfe von (2.78) weiter auswerten, wenn dort x durch den ∇-Operator ersetzt wird, der bez¨ uglich der x -Integration ebenfalls einen konstanten Vektor darstellt. Es folgt dann 1 3 ∇ × d x x × j(x ) × B(x)|x=0 F =− 2c = −(∇ × µ) × B(x)|x=0 = ∇[µB(x)]|x=0 − µ [∇B(x)]|x=0 =0
= ∇[µB(x)]|x=0 . F¨ ur das Drehmoment N von µ ergibt sich in niedrigster Ordnung 1 d3 x x × [j(x ) × B(0)] N = c 1 = d3 x {[x B(0)]j(x ) − [x j(x )]B(0)} c 1 B(0) d3 x x j(x ) . = d3 x [x B(0)]j(x ) − c c
(2.79)
Unter Zuhilfenahme von ∇(x2 j) = 2x j + x2 ∇j = 2x j und dem Gaußschen Satz erkennt man, daß der zweite Term in (2.79) verschwindet. Bei nochmaliger Verwendung von (2.78) folgt schließlich x × j(x ) 1 3 d x [x B(0)]j(x ) = −B(0) × d3 x N= = µ × B(0). 2c c Satz 2.20: Magnetischer Dipol im ¨ außeren Magnetfeld Gegeben sei ein magnetischer Dipol µ einer um x = 0 begrenzten statischen Stromdichteverteilung sowie ein ¨ ortlich schwach variierendes Magnetfeld B. Kraft und Drehmoment auf µ sind dann gegeben durch F = ∇[µB(x)]|x=0 , N = µ × B(0) .
176
2. Elektrodynamik
F¨ ur die Energie des magnetischen Dipols folgt W = − dxF = −µB(0) .
2.5.3 Randwertprobleme der Elektrostatik I In der Elektrostatik wird man oftmals mit folgender Problemstellung konfrontiert: Gegeben sei ein Volumen V , das von einer Fl¨ache F begrenzt wird. Innerhalb von V sei eine statische Ladungsverteilung ρ gegeben. Gesucht ist das Skalarpotential φ und das zugeh¨orige elektrische Feld E innerhalb von V . Ist keine begrenzende Fl¨ache vorhanden (bzw. das Volumen unendlich groß), dann k¨ onnen wir die L¨osung des Problems sofort aus der statischen Poisson-Gleichung angeben: ρ(x ) φ(x) = d3 x . (2.80) |x − x | Die Anwesenheit einer begrenzenden Fl¨ache impliziert dagegen gewisse Randbedingungen, die bei der L¨osung zu ber¨ ucksichtigen sind. In diesem Fall ist die inhomogene L¨osung (2.80) um eine homogene L¨osung zu erweitern, welche die Einhaltung der Randbedingungen garantiert. Im folgenden besch¨aftigen wir uns mit der L¨osung solcher Randwertprobleme, wobei wir voraussetzen, daß es sich bei der begrenzenden Fl¨ache um einen elektrischen Leiter handelt. Hierunter versteht man Materialien (in der Regel Metalle), in denen es frei bewegliche Ladungen gibt. Solche Ladungen f¨ uhren i.a. zu zeitabh¨angigen Feldern. In einem abgeschlossenen System stellt sich aber nach einer gewissen Zeit ein zeitunabh¨angiger Zustand ein, f¨ ur den wir uns ausschließlich interessieren. F¨ ur ihn gilt innerhalb von Leitern E = 0. Andernfalls g¨abe es n¨amlich Kr¨ afte auf die Ladungen, und es k¨ ame zu Ladungsverschiebungen innerhalb der Leiter, die im Widerspruch zum statischen Fall stehen.12 Wir beginnen unsere Diskussion mit der Kl¨arung der Frage, welche Stetigkeitsbedingungen das elektrische Feld E an leitenden Fl¨achen zu erf¨ ullen hat. Hierzu denken wir uns einen leitenden K¨orper, in dessen Grenzfl¨ache wir ein Volumenelement ∆V bzw. Fl¨achenelement ∆F mit der H¨ohe h hineinlegen (Abb. 2.9). Wendet man den Gaußschen Satz auf die Divergenzgleichung und den Stokesschen Satz auf die Rotationsgleichung in (2.69) an, dann tragen im Limes h → 0 jeweils nur die zur Grenzfl¨ache parallelen Fl¨achenelemente δF bzw. Linienelemente δl bei, und man erh¨alt (E 2 − E 1 )nδF = 4πδq , (E 2 − E 1 )tδl = 0 . 12
Aufgrund der im Kristallgitter gebundenen Ladungstr¨ ager gilt diese Aussage streng genommen nur f¨ ur das u angeneinheiten gemittelte ¨ber viele atomare L¨ elektrische Feld. F¨ ur unsere Zwecke brauchen wir jedoch diesen Punkt hier nicht weiter zu ber¨ ucksichtigen. Er wird im n¨ achsten Abschnitt eingehend diskutiert.
2.5 Zeitunabh¨ angige Elektrodynamik n
177
δF E2
h ∆V δl
E1 = 0 h
∆F Abb. 2.9. Zur Festlegung der Integrationsgebiete an der Grenzfl¨ ache eines elektrischen Leiters
Wegen E 1 = 0 folgt der Satz 2.21: Stetigkeitsbedingungen bei Leitern An der Grenzfl¨ ache F eines Leiters gelten folgende Stetigkeitsbedingungen f¨ ur das elektrostatische Feld E bzw. f¨ ur das zugeh¨ orige Skalarpotential φ: • Die Tangentialkomponenten von E verschwinden: E(x)t = 0 ⇐⇒ φ(x) = const , x ∈ F . • Die Normalkomponente von E ist proportional zur Oberfl¨ achenladungsdichte σ (Ladung/Einheitsfl¨ ache) des Leiters: ∂φ (x) = −4πσ(x) , x ∈ F . ∂n Hierbei ist n der in den Vakuumbereich zeigende Normalenvektor und t ein Tangentialvektor der Grenzfl¨ ache. ∂/∂n steht f¨ ur n∇. E(x)n = 4πσ(x) ⇐⇒
Falls die Oberfl¨achenladungsdichte der begrenzenden Leiterfl¨ ache gegeben ist, ist die Ladungsverteilung im gesamten Raum bekannt; denn ρ in V wird als gegeben vorausgesetzt, und im Leiter gilt wegen E = 0: ρ = ∇E/4π = 0. In diesem Fall l¨ aßt sich die gesuchte L¨ osung wieder mit Hilfe von (2.80) bestimmen. Dirichletsche und Neumannsche Randbedingungen. Oftmals ist an Stelle der Oberfl¨ achenladungsdichte lediglich das Oberfl¨ achenpotential gegeben. Es erweist sich dann als g¨ unstig, die statische Poisson-Gleichung in eine Integraldarstellung zu bringen, in der das Oberfl¨ achenpotential und dessen Normalableitung explizit auftreten. Ausgangspunkt hierzu ist die zweite Greensche Identit¨ at (A.2). Setzt man in ihr ψ(x ) = 1/|x − x | ein und interpretiert φ als das elektrostatische Potential, dann ergibt sich unter Ber¨ ucksichtigung von ∇2 |x − x |−1 = −4πδ(x − x ) und ∇2 φ(x ) = −4πρ(x )
178
2. Elektrodynamik
d x −4πφ(x )δ(x − x ) + 3
V
= F
4π ρ(x ) |x − x |
∂φ(x ) 1 ∂ 1 . dF φ(x ) − ∂n |x − x | |x − x | ∂n
Liegt der Beobachtungspunkt x innerhalb von V , dann folgt weiter ρ(x ) φ(x) = d3 x |x − x | V ∂φ(x ) 1 1 1 ∂ , + dF − φ(x ) ∂n |x − x | 4π |x − x | ∂n
(2.81)
F
andernfalls ist φ(x) = 0. Offenbar geht diese Gleichung, wie eingangs erw¨ ahnt, im Limes V → ∞ in den bekannten Ausdruck (2.80) u ¨ber. Gilt andererseits im gesamten Volumen V : ρ(x) = 0, dann ist φ(x) allein durch seine Werte und Ableitungen auf der Oberfl¨ache F determiniert. Man unterscheidet nun aufgrund von (2.81) zwei Arten von Randbedingungen: • Dirichletsche Randbedingung:13 φ(x)|x∈F = φ0 (x). ∂φ(x) = −4πσ(x). • Neumannsche Randbedingung: ∂n x∈F Jede dieser Bedingungen f¨ uhrt zu eindeutigen L¨osungen. Dies l¨aßt sich folgendermaßen zeigen: Nehmen wir an, es existieren zur Poisson-Gleichung ∇2 φ = −4πρ zwei L¨osungen φ1 und φ2 , die beide einer Dirichletschen oder Neumannschen Randbedingung gen¨ ugen. Dann gilt f¨ ur u = φ1 − φ2 ∂u(x) ∇2 u(x)x∈V = 0 , u(x)|x∈F = 0 , =0. (2.82) ∂n x∈F
Aufgrund der ersten Greenschen Identit¨at (A.1) gilt weiterhin mit ψ = φ = u ∂u =⇒ d3 x u∇2 u + (∇u)2 = dF u d3 x(∇u)2 = 0 ∂n V
F
V
=⇒ ∇u = 0 , d.h. u ist innerhalb von V konstant. Hieraus folgt zusammen mit (2.82) f¨ ur die Dirichletsche Randbedingung: φ1 = φ2 und f¨ ur die Neumannsche Randbedingung: φ1 = φ2 + const. Ein Beispiel f¨ ur die Eindeutigkeit der L¨osungen ist das Problem des Faradayschen K¨ afigs. Er besteht aus einer beliebig geformten geschlossenen Metallfl¨ache, in dessen Innern es keine Ladungen gibt, d.h. 13
Man beachte, daß diese Randbedingung eine Verallgemeinerung der ersten, in Satz 2.21 stehenden Bedingung ist, da hier φ nicht (wie beim Metall) auf dem Rand einen konstanten Wert haben muß.
2.5 Zeitunabh¨ angige Elektrodynamik
179
∇2 φ(x)x∈V = 0 , φ(x)|x∈F = const . osung und – wegen der EindeutigOffensichtlich ist φ(x)|x∈V = const eine L¨ keit – bereits die gesuchte. Formale L¨ osung elektrostatischer Randwertprobleme durch GreenFunktionen. Im allgemeinen existiert keine L¨ osung f¨ ur das gleichzeitige Vorhandensein einer Dirichletschen und Neumannschen Randbedingung, da es f¨ ur beide Probleme getrennt eine eindeutige L¨ osung gibt, die i.a. verschieden sind. Insofern ist die Integraldarstellung (2.81) ung¨ unstig, da dort beide Randbedingungen auftreten. Es bietet sich daher an, diese Gleichung so umzuschreiben, daß eine der beiden Randbedingungen in ihr nicht mehr vorkommt. Zur Herleitung von (2.81) haben wir in der zweiten Greenschen Identit¨ at ψ(x ) = 1/|x − x | gesetzt, da sie eine L¨ osung von ∇2 ψ(x ) = −4πδ(x − x ) ist. Dieses ψ ist jedoch nur eine spezielle Green-Funktion G, welche die Gleichung ∇2 G(x, x ) = −4πδ(x − x ) l¨ost. Die allgemeine L¨ osung lautet vielmehr G(x, x ) =
1 + g(x, x ) , |x − x |
wobei g innerhalb von V die Laplace-Gleichung ∇2 g(x, x ) = 0 erf¨ ullt. Wiederholen wir jetzt, ausgehend von der zweiten Greenschen Identit¨ at, unsere Argumentation mit ψ = G, dann erhalten wir d3 x ρ(x )G(x, x ) φ(x) = V
1 + 4π
∂φ(x ) ∂G(x, x ) . dF G(x, x ) − φ(x ) ∂n ∂n
F
Mittels der Funktion g haben wir nun die Freiheit, G auf dem Rand so zu w¨ ahlen, daß eine der beiden Randbedingungen verschwindet: • Dirichletsche Randbedingung: Hier setzen wir G(x, x )|x ∈F = 0 . Dann ist
φ(x) = V
d3 x ρ(x )G(x, x ) −
1 4π
dF φ(x )
∂G(x, x ) ∂n
F
eine L¨ osung des Problems, sofern wir eine L¨ osung der Laplace-Gleichung mit der Randbedingung
180
2. Elektrodynamik
g(x, x )|x ∈F = −
1 |x − x |
besitzen. • Neumannsche Randbedingung: In Analogie zum Dirichlet-Problem ist man versucht, ∂G/∂n |x ∈F = 0 zu setzen. Dieser Ansatz ist jedoch unvereinbar mit ∂G 2 ∇ G(x, x ) = −4πδ(x − x ) =⇒ dF = −4π . ∂n F
Man hat deshalb richtigerweise ∂G 4π =− ∂n F x ∈F
zu w¨ ahlen. Sofern wir nun in der Lage sind, eine L¨osung der LaplaceGleichung mit der Randbedingung ∂g(x, x ) ∂ 1 4π − =− ∂n F ∂n |x − x | x ∈F
zu finden, ist 1 ∂φ(x ) 3 φ(x) = d x ρ(x )G(x, x ) + dF G(x, x ) + φF 4π ∂n V
F
eine L¨ osung des Neumann-Problems, wobei φF =
1 F
8
dF φ(x ) den Mit-
F
telwert von φ auf der Oberfl¨ache F bedeutet. Satz 2.22: Randwertprobleme in der Elektrostatik Ein Volumen V werde durch eine Fl¨ache F begrenzt. Innerhalb von V sei die Ladungsdichte ρ bekannt. Weiterhin gelte G(x, x ) =
1 + g(x, x ) . |x − x |
Man betrachtet dann u ¨blicherweise zwei Arten von Randwertproblemen: • Dirichlet-Problem: Das elektrostatische Potential φ ist auf F gegeben: φ(x)|x∈F = φ0 (x). Hier lautet die L¨osung innerhalb von V 1 ∂G(x, x ) dF φ(x ) , φ(x)|x∈V = d3 x ρ(x )G(x, x ) − 4π ∂n V
F
mit ∇2 g(x, x )x ∈V = 0 , g(x, x )|x ∈F = −
1 . |x − x |
(2.83)
2.5 Zeitunabh¨ angige Elektrodynamik
181
• Neumann-Problem: Die Normalableitung von φ ist auf F gegeben: ∂φ(x) orige L¨ osung = −4πσ(x). Innerhalb von V ist die zugeh¨ ∂n x∈F
φ(x) =
d3 x ρ(x )G(x, x ) +
V
mit
1 4π
dF G(x, x )
∂φ(x ) + φF , ∂n
F
∂ 1 4π ∂g(x, x ) − .(2.84) ∇ g(x, x ) x ∈V = 0 , =− ∂n F ∂n |x − x | x ∈F 2
Offensichtlich bringt die Verwendung des Green-Funktionen-Kalk¨ uls auf der einen Seite eine Vereinfachung mit sich, da die Randbedingungen nicht mehr von den speziellen Dirichlet- bzw. Neumann-Randwerten abh¨ angen. Auf der anderen Seite erweist es sich oft als schwierig, die Funktion g (und damit G) mit dem richtigen Randwertverhalten (2.83) bzw. (2.84) zu finden. Die Funktion g(x, x ) l¨ ost die Laplace-Gleichung innerhalb des Volumens V . Sie stellt daher das Potential einer außerhalb von V liegenden Ladungsverteilung dar. Diese externe Ladungsverteilung ist gerade so beschaffen, daß die Greensche Funktion auf dem Rand F die Werte G = 0 bzw. ∂G/∂n = −4π/F annehmen kann. Bei vielen Randwertproblemen mit relativ einfacher Geometrie kann man deshalb so vorgehen, daß man eine Ladungsverteilung außerhalb von V so bestimmt, daß sie zusammen mit den Ladungen in V ein Potential ergeben, das die vorgegebenen Bedingungen auf F erf¨ ullt. Man nennt dieses Verfahren die Methode der Bildladungen, welche u.a. Gegenstand des n¨ achsten Unterabschnitts ist. 2.5.4 Randwertprobleme der Elektrostatik II In diesem Unterabschnitt greifen wir zwei Standardbeispiele aus der großen Vielzahl der in Lehrb¨ uchern der Elektrodynamik diskutierten elektrostatischen Randwertprobleme heraus. Das erste Beispiel illustriert die Verwendung der Methode der Bildladungen, das zweite beinhaltet die L¨ osung der Laplace-Gleichung in Kugelkoordinaten. Punktladung vor geerdeter Metallkugel. Wir betrachten eine geerdete Metallkugel mit dem Radius R im Feld einer Punktladung q, die sich im Abstand a > R zum Kugelmittelpunkt befindet (Abb. 2.10). Gesucht ist das elektrostatische Potential außerhalb der Kugel (d.h. innerhalb von V ) sowie die influenzierte Ladungsdichte σ auf der Kugeloberfl¨ ache. Aufgrund der Erdung ist das Kugelpotential gleich dem Erdpotential (φ0 = 0). Innerhalb von V ist die Poisson-Gleichung ∇2 φ(x) = −4πδ(x − aex ) mit der Dirichletschen Randbedingung
182
2. Elektrodynamik y xn R
n
ex
q
q
b
a
x
Abb. 2.10. Geerdete Metallkugel vor einer Punktladung
φ(x)||x|=R = 0
(2.85)
zu l¨ osen. Wir verwenden hierzu die Methode der Bildladungen und versuchen eine geeignete Ladungsverteilung außerhalb von V (d.h. innerhalb der Kugel) so zu plazieren, daß die Randbedingung (2.85) erf¨ ullt ist. Aus Symmetriegr¨ unden ist es naheliegend, einen Ansatz zu machen, bei dem die Bildladung eine Punktladung q ist, die sich im Abstand b < R auf der x-Achse befindet, also q q + , xn = x . φ(x) = |xn − aex | |xn − bex | Somit folgt auf dem Rand der Kugel φ(x)||x|=R =
q R n−
q + a b R n − ex . R ex b
Obige Randbedingung ist offenbar erf¨ ullt, wenn wir R2 Rq , q = − a a setzen. Das elektrostatische Potential innerhalb und außerhalb der Kugel lautet deshalb ⎧ q Rq ⎪ f¨ − ur x ∈ V ⎨ |xn − aex | a xn − R2 e x φ(x) = (2.86) a ⎪ ⎩ 0 f¨ ur x ∈ V . b=
Bei Verwendung von ∂φ = −4πσ(x) ∂x x=R
erh¨ alt man die auf der Kugeloberfl¨ache influenzierte Ladungsdichte (d.h. die aus der Erde auf die Kugeloberfl¨ache geflossene Ladung) zu
2.5 Zeitunabh¨ angige Elektrodynamik
q σ(γ) = − 4πaR 1 −
1−
2R a
183
2
R a2
cos γ +
R2 3/2 a2
,
unfwobei γ den Winkel zwischen n und ex bezeichnet. Wie man es vern¨ tigerweise erwartet, besitzt diese Verteilung ein Maximum bei γ = 0, also in Richtung der Punktladung q. Die Integration von σ u ¨ber die gesamte ¨ ache ergibt in Ubereinstimmung mit dem Gaußschen Gesetz die Kugeloberfl¨ Bildladung q . Ausgehend von diesen Ergebnissen k¨ onnen wir unsere Aufgabenstellung ein wenig erweitern und danach fragen, wie das elektrostatische Potential bei einer isolierten Kugel mit dem Radius R und der Ladung Q im Feld einer im Abstand a > R zum Kugelmittelpunkt befindlichen Punktladung q aussieht. Hierzu betrachten wir zun¨ achst wieder den geerdeten Fall, f¨ ur den wir die Verteilung der influenzierten Ladung q gerade berechnet haben. Nehmen wir jetzt die Erdung weg und bringen auf die nun isolierte Kugel die Restladung Q − q an, dann wird sich diese gleichm¨ aßig auf der Kugeloberfl¨ ache verteiaftegleichgewicht herrscht. Die Ladung len, da zwischen q und q bereits ein Kr¨ Q−q wird daher in V so wirken, als sei sie im Kugelmittelpunkt konzentriert.14 Das in (2.86) berechnete Potential in V wird somit um den entsprechenden Term erweitert, so daß φ(x)|x∈V =
Q + Rq Rq q a − . + |xn − aex | a xn − R2 e |x| a x
Metallkugel im homogenen elektrischen Feld, Laplace-Gleichung in Kugelkoordinaten. Bevor wir uns der konkreten Problemstellung zuwenden, gehen wir kurz auf die L¨ osung der Laplace-Gleichung in Kugelkoordinaten ein. Sie wird immer dann gebraucht, wenn es sich um kugelsymmetrische Probleme handelt, bei denen im betrachteten Volumen V keine Ladungen vorhanden sind. Die Laplace-Gleichung lautet in Kugelkoordinaten 1 ∂2 ∂2φ ∂ ∂φ 1 1 sin θ + 2 2 (rφ) + =0. 2 2 r ∂r r sin θ ∂θ ∂θ r sin θ ∂ϕ2 Sie geht mit dem Ansatz φ(x) =
U (r) P (θ)Q(ϕ) r
u ¨ber in PQ
d2 U UQ d + 2 dr2 r sin θ dθ
sin θ
dP dθ
+
r2
U P d2 Q =0. sin2 θ dϕ2
Multiplikation dieser Gleichung mit r2 sin2 θ/(U P Q) liefert 14
Man zeigt dies in vollst¨ andiger Analogie zur Berechnung des Gravitationspotentials einer Hohlkugel in Unterabschn. 1.5.3, wobei die Massen durch Ladungen und die Gravitationskraft durch die Coulomb-Kraft zu ersetzen sind.
184
2. Elektrodynamik
1 d2 U 1 d r sin θ + 2 2 U dr r sin θP dθ 2
2
dP sin θ dθ
+
1 d2 Q =0. Q dϕ2
(2.87)
Der letzte Term besitzt nur eine ϕ-Abh¨angigkeit und ist deshalb konstant: 1 d2 Q = −m2 = const . Q dϕ2 ¨ ¨ uhren zu zwei separaten Gleichungen in U und P : Ahnliche Uberlegungen f¨ ⎫ 2 d U l(l + 1) ⎪ ⎪ − U = 0 , l = const ⎬ dr2 r2 (2.88) ⎪ dP m2 1 d ⎪ ⎭ P = 0 . sin θ + l(l + 1) − sin θ dθ dθ sin2 θ Ohne Beweis stellen wir fest, daß f¨ ur physikalisch sinnvolle L¨osungen die Konstanten l und m nur die ganzzahligen Werte l = 0, 1, 2, . . . , m = −l, −l + 1, . . . , l − 1, l annehmen k¨ onnen. Die L¨osungen von (2.88) sind gegeben durch U (r) = Arl+1 + Br−l , Q(ϕ) = e±imϕ . Die Substitution x = cos θ in (2.87) f¨ uhrt auf die Legendresche Differentialgleichung (siehe Abschn. A.6) d m2 dP (1 − x2 ) + l(l + 1) − P =0, dx dx 1 − x2 deren L¨ osung die Legendre-Funktionen Pl,m (x) sind. Wir erhalten somit insgesamt den Satz 2.23: L¨ osung der Laplace-Gleichung in Kugelkoordinaten Die L¨ osung der Laplace-Gleichung ∇2 φ(x) = 0 in Kugelkoordinaten lautet φ(x) =
∞ l Alm rl + Blm r−l−1 eimϕ Pl,m (cos θ) . l=0 m=−l
Besitzt das betrachtete Problem eine azimutale Symmetrie (keine ϕAbh¨ angigkeit), dann ist m = 0, und es folgt φ(x) =
∞ Al rl + Bl r−l−1 Pl (cos θ) ,
(2.89)
l=0
wobei Pl = Pl,0 die Legendre-Polynome bezeichnen. Nach diesen vorbereitenden Betrachtungen wenden wir uns nun folgender konkreter Aufgabenstellung zu: Gesucht ist das Potential außerhalb einer geerdeten Metallkugel, die in ein anf¨anglich homogenes elektrisches Feld
2.5 Zeitunabh¨ angige Elektrodynamik
185
E 0 = E0 ez gebracht wird. Legen wir den Ursprung unseres Koordinatensystems in den Kugelmittelpunkt, dann ist das Problem azimutalsymmetrisch, so daß (2.89) zur Anwendung kommt. Die Koeffizienten Al und Bl werden durch folgende Randbedingungen determiniert: • Bei z → ∞ ist das elektrische Feld gleich dem urspr¨ unglichen Feld: φ(z → ∞) = −E0 r cos θ =⇒ A1 = −E0 , Al=1 = 0 . • Auf dem Rand der Kugel verschwindet das Potential: φ(R, θ) = 0 =⇒ B1 = E0 R3 , Bl=1 = 0 . Es folgt schließlich ⎧ 3 ⎨ E cos θ −r + R f¨ ur r > R 0 r2 φ(r, θ) = ⎩ 0 f¨ ur r < R . Das zugeh¨ orige elektrische Feld f¨ ur x = 0 ist in Abb. 2.11 dargestellt. F¨ ur die influenzierte Oberfl¨ achenladungsdichte ergibt sich 1 ∂φ 3 σ(θ) = − E0 cos θ . = 4π ∂r 4π r=R
Offenbar verschwindet das Integral von σ u ache, ¨ber die gesamte Kugeloberfl¨ woraus folgt, daß insgesamt keine Ladung influenziert wird. Es ist deshalb bei dieser Aufgabe nicht notwendig, zwischen einer geerdeten und einer isolierten Kugel zu unterscheiden. y
z
Abb. 2.11. Elektrisches Feld in Anwesenheit einer Metallkugel, die in ein anf¨ anglich in z-Richtung verlaufendes homogenes Feld gebracht wird
186
2. Elektrodynamik
2.5.5 Feldverteilungen in der Magnetostatik Innerhalb der Magnetostatik betrachten wir als erstes den zur Elektrostatik analogen Fall bei der L¨osung von Randwertproblemen. Wir nehmen an, daß im betrachteten Volumen V keine Str¨ome vorhanden sind. Dann ist ∇ × B = 0, so daß sich B als Gradient eines Skalarfeldes schreiben l¨aßt: B(x) = ∇ψ(x) , j(x) = 0 , x ∈ V . Zusammen mit ∇B = 0 folgt hieraus in V wieder die Laplace-Gleichung ∇2 ψ(x) = 0 , deren L¨ osung sich unter Beachtung etwaiger Dirichletscher oder Neumannscher Randbedingungen im Prinzip in gleicher Weise konstruieren l¨aßt, wie in den letzten beiden Unterabschnitten besprochen wurde. Im elektrostatischen Fall wurde davon ausgegangen, daß es sich bei der V begrenzenden Fl¨ache um einen Leiter handelt, so daß das elektrostatische Feld innerhalb des Leiters verschwindet, wenn man von den elektrischen Feldern absieht, die durch die im Leiterkristall gebundenen Ladungstr¨ager hervorgerufen werden und sich in guter N¨aherung auf makroskopischem Level wegmitteln. Die analoge Situation in der Magnetostatik best¨ unde in einer Begrenzung, in der das magnetostatische Feld verschwindet. Dieses Szenario ist jedoch i.a. unrealistisch, da die aufgrund der gebundenen Ladungen hervorgerufenen elektrischen und magnetischen Dipolmomente einen sich auf makroskopischer Skala nicht wegmittelnden Strom und somit ein B-Feld im begrenzenden Material erzeugen. Die Bestimmung von Randbedingungen in der Magnetostatik erfordert deshalb eine Diskussion der Polarisation und Magnetisierung von Materie, die wir im n¨achsten Abschnitt behandeln werden. Magnetfeld einer stromdurchflossenen Spule. Wir diskutieren nun ein typisches Feldverteilungsproblem in der Magnetostatik, n¨amlich die Bestimmung des Magnetfeldes einer (unendlich) langen stromdurchflossenen Spule. Zur Vorbereitung betrachten wir zuerst einen kreisf¨ormigen d¨ unnen Leiterdraht mit dem Radius R, durch den ein konstanter elektrischer Strom I fließt (Abb. 2.12 links), und fragen nach dem induzierten magnetischen Feld B weit außerhalb des Leiters sowie in einem beliebigen Punkt auf der z-Achse. Zur Beantwortung der ersten Frage k¨onnen wir Satz 2.19 heranziehen, da sich die Leiterschleife bei großen Abst¨anden |x| R wie ein magnetischer Dipol verh¨ alt. Dieser berechnet sich unter Verwendung von ⎛ ⎞ ⎛ ⎞ − sin s cos s dl(s) d3 x j(x ) = It(s)ds , t(s) = = R ⎝ cos s ⎠ , l(s) = R ⎝ sin s ⎠ ds 0 0 zu ⎛ ⎞ 2π 0 I πIR2 ⎝ ⎠ 0 µ= . dsl(s) × t(s) = 2c c 1 0
2.5 Zeitunabh¨ angige Elektrodynamik
187
z z y R x
x
I
Abb. 2.12. Kreisf¨ ormiger stromdurchflossener Leiterdraht (links) und sein magnetisches Dipolfeld (rechts)
F¨ ur das magnetische Dipolfeld ergibt sich hieraus IπR2 3zx − ez |x|2 , |x| R . c |x|5 Sein Verlauf ist in Abb. 2.12 rechts dargestellt. Die zweite Frage l¨ aßt sich bequem mit Hilfe des Biot-Savartschen Gesetzes, Satz 2.16, l¨ osen: ⎛ ⎞ 2π 0 2 I zez − l(s) 2πIR ⎝ 0⎠ . B(0, 0, z) = (2.90) dst(s) × = √ 3 c |zez − l(s)|3 2 + z2 c R 1 0 B(x) =
Betrachten wir nun eine l¨ angs der z-Achse gewundene stromdurchflossene Spule der L¨ ange L, die wir uns vereinfachend aus N u ¨bereinander gelegten Kreisleitern zusammengesetzt denken (Abb. 2.13 links). Aufgrund von Abb. 2.12 rechts ist intuitiv klar, daß sich im Limes L → ∞ innerhalb der Spule ein Magnetfeld in z-Richtung ausbildet, w¨ ahrend das Feld außerhalb der Spule verschwindet. Ohne Beweis stellen wir fest, daß das innere Feld u ¨berdies homogen ist. Man erh¨ alt seinen Wert im Ursprung, indem man in (2.90) f¨ ur z jeweils die z-Koordinaten der einzelnen Leiterschleifen einsetzt und diese Beitr¨ age aufsummiert. Liegen die Leiterschleifen sehr dicht beieinander, dann kann die Summe in der Weise N −→ n dz , n = , N = Zahl der Spulenwindungen L durch ein Integral ersetzt werden, und wir erhalten ⎛ ⎞ L/2 ⎛ ⎞ 0 0 2 dz 2πILn ⎝ ⎠ 2πIR n ⎝ ⎠ 0 0 = B(0) = √ 3 2 c c R2 + L4 1 −L/2 R2 + z 2 1
188
2. Elektrodynamik L→∞
=
⎛ ⎞ 0 4πIn ⎝ ⎠ 0 = B( x2 + y 2 < R, z) . c 1
(2.91)
Zu diesem Ergebnis gelangt man u ¨brigens auch leicht mit Hilfe des Amp`ereschen Gesetzes (2.4). Legen wir n¨amlich den Integrationsweg wie in Abb. 2.13 rechts angedeutet, dann umfaßt er auf der Teill¨ange l Nl Windungen, d.h. der Strom I fließt Nl mal durch das Integrationsgebiet. Bei Vernachl¨assigung des ¨ außeren Magnetfeldes folgt dann 4πINl 4πINl 4πIn Bdl = |B|l = =⇒ |B| = = . c cl c
z
z L 2
. . .
. . . B
l
− L2
. . .
. . .
Nl Windungen
. . .
Abb. 2.13. Links: idealisierte Spule, die aus u ¨bereinander liegenden Kreisleitersegmenten zusammengesetzt ist. Rechts: zur Festlegung des Integrationsweges bei der Bestimmung der Magnetfeldst¨ arke innerhalb der Spule
Zusammenfassung • Im Falle zeitunabh¨angiger Ladungs- und Stromdichteverteilungen zerfallen die Maxwell-Gleichungen in zwei entkoppelte Differentialgleichungssysteme. Sie definieren jeweils die Grundgleichungen der Elektrostatik und der Magnetostatik. • Die aus den vorigen Abschnitten hergeleiteten Beziehungen lassen sich auf den statischen Fall durch Elimination jeglicher Zeitabh¨angigkeiten u ¨bertragen. Insbesondere sind hierbei die Coulomb- und LorentzEichung identisch und f¨ uhren auf statische Poisson-Gleichungen in den Skalar- und Vektorpotentialen.
Anwendungen
189
• Sind die statischen Ladungs- und Stromdichteverteilungen auf einen kleinen Bereich o origen Skalar- und ¨rtlich begrenzt, dann lassen sich die zugeh¨ Vektorpotentiale f¨ ur große Abst¨ ande in Potenzen von 1/|x| entwickeln (Multipolentwicklung). Im Gegensatz zum Skalarpotential enth¨ alt das ¨ Vektorpotential in Ubereinstimmung mit (III) keinen Monopolanteil. • In der Elektrostatik unterscheidet man innerhalb von Randwertproblemen u ¨blicherweise zwischen Dirichletschen und Neumannschen Randbedingungen, die jeweils verschiedenen Stetigkeitsbedingungen des E-Feldes an (leitenden) Grenzfl¨ achen entsprechen. Beide Randbedingungen getrennt f¨ uhren jeweils zu eindeutigen L¨ osungen, die sich mit Hilfe des Green-Funktionen-Kalk¨ uls formal angeben lassen. Aus diesem Kalk¨ ul gewinnt man eine in vielen F¨ allen praktisch anwendbare Methode zur L¨ osung von Randwertproblemen, n¨ amlich die Methode der Bildladungen. • Aufgrund der i.a. permanenten Polarisierung und Magnetisierung von Materie, lassen sich Randwertprobleme in der Magnetostatik nur bei genauerer Kenntnis der Eigenschaften des begrenzenden Materials diskutieren. • Innerhalb einer langgestreckten, stromdurchflossenen Spule ist das induzierte Magnetfeld homogen und proportional zur Stromst¨ arke sowie zur Windungsdichte der Spule.
Anwendungen 28. Multipolentwicklung in sph¨ arischer Darstellung. Wie lautet die Multipolentwicklung des elektrostatischen Potentials φ in der sph¨ arischen Darstellung und welcher Zusammenhang besteht zwischen den einzelnen kartesischen und sph¨ arischen Momenten? L¨ osung. Unter Verwendung der Kugelkoordinaten ⎛ ⎞ ⎛ ⎞ cos ϕ sin θ cos ϕ sin θ x = r ⎝ sin ϕ sin θ ⎠ , x = r ⎝ sin ϕ sin θ ⎠ cos θ cos θ gilt nach (A.15) l ∞ 1 4π rl ∗ = Y (θ , ϕ )Yl,m (θ, ϕ) , |x − x | 2l + 1 rl+1 l,m l=0 m=−l
woraus sich aufgrund von (2.71) folgende Darstellung f¨ ur das Skalarpotential ergibt:
190
2. Elektrodynamik
φ(x) =
∞ l l=0 −l
4π ql,m Yl,m (θ, ϕ) . 2l + 1 rl+1
Die Entwicklungskoeffizienten ∗ (θ , ϕ ) ql,m = d3 x rl ρ(x )Yl,m sind die elektrischen Multipolmomente in der sph¨arischen Darstellung. Ist die Ladungsdichte reell, dann sind die Momente mit m < 0 aufgrund von (A.13) ∗ u mit den entsprechenden Momenten mit m > 0 ver¨ber ql,−m = (−1)m ql,m bunden. Dr¨ ucken wir die ersten paar Momente durch kartesische Koordinaten aus, 1 1 Q d3 x ρ(x ) = q0,0 = 4π 4π
3 3 3 d x (x − iy )ρ(x ) = − q1,1 = − (px − ipy ) 8π 8π
3 3 d3 x z ρ(x ) = q1,0 = pz , 4π 4π dann erkennt man den Zusammenhang zwischen sph¨arischen und kartesischen Momenten: Das sph¨arische l=0-Moment entspricht dem kartesischen Monopolmoment, die sph¨arischen l=1-Momente beinhalten die kartesischen Dipolmomentkomponenten usw. 29. Kapazit¨ at eines Plattenkondensators. Man betrachte einen Kondensator, bestehend aus zwei leitenden Platten der Fl¨ache F , die im Abstand d parallel zueinander angeordnet sind (Abb. 2.14). Auf der einen Platte sei die Ladung Q, auf der anderen die Ladung −Q aufgebracht. Man bestimme die Potentialdifferenz (Spannung) zwischen den beiden Platten, wobei der elektrische Feldverlauf außerhalb des Kondensators zu vernachl¨assigen ist. Q
−Q
+ + + + + + + + + +
-
E
F
x
d Abb. 2.14. Geladener Plattenkondensator
Anwendungen
191
L¨ osung. An beiden Kondensatorplatten gelten die Randbedingungen ∂φ 4πQ ∂φ 4πQ =⇒ . ex E(x = 0) = ex E(x = d) = = =− F ∂x x=0 ∂x x=d F Offensichtlich werden diese Bedingungen (und ∇2 φ = 0 innerhalb des Kondensators) durch den Ansatz ⎛ ⎞ 1 4πQ ⎝ ⎠ 4πQ 0 x =⇒ E(x) = φ(x) = − F F 0 erf¨ ullt. F¨ ur die Spannung an den Kondensatorplatten folgt somit 4πQ V = F
d dx = −[φ(x = d) − φ(x = 0)] =
Q F , C= . C 4πd
(2.92)
0
Hierbei bedeutet C die Kapazit¨ at des Kondensators. Sie ist eine nur von der Kondensatorgeometrie abh¨ angige Gr¨ oße und beschreibt die Aufnahmef¨ ahigkeit des Kondensators von Ladung bei vorgegebener Spannung. Bei einer ¨ zeitlichen Anderung der Ladungen auf dem Kondensator bleibt (2.92) unter gewissen Umst¨ anden g¨ ultig, n¨ amlich dann, wenn in (II) der Induktionsterm 1 ∂B vernachl¨ a ssigen werden kann (quasistatische N¨ aherung). In diesem Fall c ∂t sind (I) und (II) formgleich zu den elektrostatischen Gleichungen (2.69). 30. Selbstinduktivit¨ at einer Spule. Gegeben sei eine zylindrisch gewundene Spule mit der Windungszahl N und der L¨ ange L, durch die ein zeitlich variierender Strom I(t) fließt. Man berechne mit Hilfe des Faradayschen Induktionsgesetzes die an den Spulenenden induzierte Spannung in der quasistatischen N¨ aherung. L¨ osung. Wenn in (IV) der Verschiebestrom 1c ∂E assigt werden kann ∂t vernachl¨ (quasistatische N¨ aherung), dann sind (III) und (IV) formgleich zu den magnetostatischen Gleichungen (2.70). In dieser N¨ aherung gilt dann wegen (2.91) f¨ ur das magnetische Feld innerhalb der Spule im Falle eines zeitlich variierenden Stromes ⎛ ⎞ 0 4πI(t)N ⎝ ⎠ 0 . B(t) = cL 1 Die Spannung an den Spulenenden ist gleich der N -fachen Spannung, die durch das Magnetfeld in einer der Leiterschleifen erzeugt wird. Zusammen mit (2.2) folgt N dI 4π 2 R2 N 2 ∂B(t) V (t) = − = −S , S= . dF c ∂t dt c2 L F
Offenbar ist S eine nur von der Spulengeometrie abh¨ angige Gr¨ oße. Sie wird Selbstinduktivit¨ at der Spule genannt.
192
2. Elektrodynamik
2.6 Elektrodynamik in Materie Die Maxwell-Gleichungen und das Lorentz-Kraftgesetz sind grundlegende Naturgesetze mit einem weiten G¨ ultigkeitsbereich. Sie gelten insbesondere auch in Materie. Dort werden die fundamentalen mikroskopischen Felder E und B sowohl durch frei bewegliche Ladungen, als auch durch die intrinsischen Dipolmomente gebundener Teilchen (Elektronen, Protonen und Neutronen) hervorgerufen. Allerdings sind hierbei die Maxwell-Gleichungen (I) bis (IV) aufgrund der großen Teilchenzahl (≈ 1023 ) praktisch nicht anwendbar. Ist man mehr an elektromagnetischen Ph¨anomenen in Materie auf makroskopischer L¨ angenskala interessiert, dann ist es vern¨ unftig, anzunehmen, daß die detaillierte Kenntnis der Ladungs- und Stromdichteverteilungen sowie der Felder E und B nicht notwendig ist. Von Interesse sind vielmehr die u ¨ber viele atomare L¨ angeneinheiten gemittelten makroskopischen Gr¨oßen. Dieser Abschnitt besch¨aftigt sich mit der Formulierung der makroskopischen Elektrodynamik in Materie. Es wird gezeigt, wie man makroskopische Erscheinungen mit Hilfe der makroskopischen Maxwell-Gleichungen beschreiben kann, in denen an Stelle der mikroskopischen Verteilungen und Felder geeignete r¨ aumlich gemittelte Ausdr¨ ucke treten. In diese Gleichungen gehen die Eigenschaften des betrachteten Materials in Form der Polarisation und der Magnetisierung ein, und wir werden sehen, daß sich in vielen F¨allen empirisch ein linearer Zusammenhang zwischen diesen Gr¨oßen und den makroskopischen Feldern herstellen l¨aßt. Zum Schluß diskutieren wir die Stetigkeitsbedingungen makroskopischer Felder an Grenzfl¨achen. 2.6.1 Makroskopische Maxwell-Gleichungen Um zu einer makroskopischen Formulierung der Elektrodynamik zu gelangen, ben¨ otigen wir als erstes ein geeignetes r¨aumliches Mittelungsverfahren f¨ ur die mikroskopischen Gr¨oßen ρ, j, E und B. Einen sinnvollen Ansatz hierf¨ ur bietet die Definition: Makroskopischer Mittelwert · · · Der makroskopische Mittelwert G(x, t) eines Feldes G(x, t) ist durch seine Faltung mit einer geeigneten Funktion f (x) definiert, G(x, t) = d3 x G(x , t)f (x − x ) , wobei f folgende Eigenschaften besitzt: • f (x) ist bei x = 0 lokalisiert. • Bezeichnet a die mikroskopische L¨angenskala (z.B. atomarer Abstand) und b die makroskopische L¨angenskala (z.B. 1 cm), dann gilt f¨ ur die Breite ∆ von f : a ∆ b.
2.6 Elektrodynamik in Materie
193
Durch diese Definition ist gew¨ ahrleistet, daß sich einerseits die i.a. uninteressanten atomaren Fluktuationen herausmitteln und andererseits die interessierenden r¨ aumlichen Abh¨ angigkeiten auf makroskopischer Skala nicht verloren gehen. Desweiteren vertauschen Mittelung und partielle Ableitungen. F¨ ur die Zeitableitung ist dies trivial und f¨ ur Ortsableitungen folgt es aus ∂ G(x, t) ∂f (x − x ) = d3 x G(x , t) ∂x ∂x ∂f (x − x ) = − d3 x G(x , t) ∂x ∂G(x , t) = d3 x f (x − x ) ∂x : 9 ∂G(x, t) . = ∂x Wenden wir nun das Mittelungsverfahren auf die homogenen Maxwell-Gleichungen (II) und (III) an, dann folgen die makroskopischen Gleichungen 1 ∂ B(x, t) = 0 , ∇ B(x, t) = 0 . c ∂t Eine entsprechende Mittelung der inhomogenen Maxwell-Gleichungen (I) und (IV) erfordert einige Vor¨ uberlegungen: Wie eingangs bereits erw¨ ahnt wurde, setzen sich die in Materie befindlichen Ladungen aus zwei Anteilen zusammen. Der eine Teil resultiert aus den in Atomen und Molek¨ ulen gebundenen Teilchen, wobei die Atome und Molek¨ ule selbst nach außen elektrisch neutral sind. Der andere Teil ist durch Ladungen gegeben, die sich ann¨ ahernd frei im Kristallgitter bewegen k¨ onnen. Wir k¨ onnen deshalb Ladungs- und Stromdichte in jeweils einen gebundenen neutralen (nt) und einen freien (fr) Anteil aufspalten: ρ(x, t) = ρnt (x, t) + ρfr (x, t) , ρnt (x, t) = ρi [x − xi (t), t] (2.93) ∇ × E(x, t) +
i
j(x, t) = j nt (x, t) + j fr (x, t) , j nt (x, t) =
j i [x − xi (t), t] .
(2.94)
i
Hierbei bezeichnet die in ρnt stehende Komponente ρi die Ladungsverteilung einer am Ort xi befindlichen neutralen Einheit, also etwa die Ladungsverteilung von Kern und H¨ ulle eines insgesamt ungeladenen Atoms. F¨ ur sie gilt d3 x ρi (x , t) = 0 . Da sowohl die freien als auch die gebundenen Ladungen Erhaltungsgr¨ oßen sind, gelten f¨ ur sie die Kontinuit¨ atsgleichungen ∂ρfr (x, t) ∂ρnt (x, t) + ∇j fr (x, t) = 0 , + ∇j nt (x, t) = 0 . (2.95) ∂t ∂t Betrachten wir die Faltungsfunktion f nur bis zur linearen Ordnung,
194
2. Elektrodynamik
f (x − x ) ≈ f (x) + x ∇ f (x − x )|x =0 = f (x) − x ∇f (x) , dann ergibt die Mittelung u ¨ber ρnt d3 x ρi (x − xi )f (x − x ) ρnt (x, t) = i
=
d3 x ρi (x )f (x − xi − x )
i
=
d3 x ρi (x ) i 0 − ∇f (x − xi ) d3 x x ρi (x ) f (x − xi )
i
=−
pi ∇f (x − xi ) , pi =
d3 x x ρi (x ) ,
i
wobei pi das elektrische Dipolmoment der neutralen Ladungsverteilung ρi ist. Eine weitere Umformung liefert ρnt (x, t) = − pi ∇f (x − xi ) i
= −∇
d3 x
pi δ(x − xi )f (x − x )
i
= −∇ P (x, t) . Hierbei ist P (x, t) =
;
(2.96)
0, > 0. Analog zu den elektrischen Materialien klassifiziert man magnetische Substanzen wie folgt: • Diamagneten: Diamagneten sind charakterisiert durch χm < 0. Es werden magnetische Dipole durch Anlegen eines Magnetfelds induziert. Nach der Lenzschen Regel sind diese Dipole so orientiert, daß sie dem ¨außeren Magnetfeld entgegenwirken (daher χm < 0). • Paramagneten: Paramagneten haben permanente magnetische Dipole, die sich in Anwesenheit eines ¨außeren Magnetfeldes ausrichten. Ohne Magnetfeld sind die Richtungen der Dipole statistisch verteilt. Im Gegensatz zu Diamagneten ist χm positiv und temperaturabh¨angig. • Ferromagneten: Ferromagnetische Substanzen besitzen permanente magnetische Dipole, die sich bei Anlegen eines ¨außeren Magnetfeldes ausrichten. Der Zusammenhang zwischen Magnetisierung und Magnetfeld ist nicht linear, und es kommt ¨ahnlich wie bei Ferroelektrika zu magnetischen Hy¨ steresis-Effekten. Bei Uberschreiten einer kritischen Temperatur gehen die ferromagnetischen Eigenschaften verloren, und das Material wird paramagnetisch. 2.6.3 Stetigkeitsbedingungen an Grenzfl¨ achen Wir untersuchen nun das Verhalten der makroskopischen Felder E, B, D und H an einer Grenzfl¨ache, die zwei unterschiedliche Medien 1 und 2 voneinander trennt. Hierzu k¨ onnen wir der Argumentation aus Unterabschn. 2.5.3 folgen, indem wir wieder ein Volumenelement ∆V bzw. Fl¨achenelement ∆F der H¨ohe h in die Grenzebene hineinlegen (Abb. 2.15). Die Anwendung des Gaußschen Satzes auf (I’) und (III’) liefert dann im Limes h → 0 (D 2 − D 1 )n = 4πσ , σ =
δq δF
(B 2 − B 1 )n = 0 , Medium 2
δF
h
n δl h
t Medium 1
∆V ∆F Abb. 2.15. Zur Festlegung der Integrationsgebiete an einer zwei Medien trennenden Grenzfl¨ ache
2.6 Elektrodynamik in Materie
201
wobei n den in das Medium 2 zeigenden Normalenvektor und σ die Fl¨ achenladungsdichte der Grenzfl¨ ache bezeichnet. Die Anwendung des Stokesschen Satzes auf (IV’) ergibt 1 ∂D 4π dF ∇ × H = dsH = dF dF j . + c ∂t c ∆F
C
∆F
∆F
Nehmen wir an, daß die Gr¨ oße ∂D/∂t an der Grenzfl¨ ache endlich ist, dann geht dieser Beitrag mit h gegen Null, und wir erhalten 4π i , J , J= c δl wobei t einen Tangentialvektor der Grenzfl¨ ache, i den senkrecht zu t durch ∆F fließenden Strom und J die zugeh¨ orige Oberfl¨ achenstromdichte (Strom/L¨ange=(Ladung/Fl¨ ache)×Geschwindigkeit) bezeichnet. Eine entsprechende Rechnung ergibt f¨ ur (II’) t(H 2 − H 1 ) =
t(E 2 − E 1 ) = 0 . Satz 2.25: Stetigkeitsbedingungen an Grenzfl¨ achen An einer zwei Medien 1 und 2 trennenden Grenzfl¨ ache gelten folgende Stetigkeitsbedingungen f¨ ur die makroskopischen elektromagnetischen Felder: achenladungsdichte n(D 2 − D 1 ) = 4πσ , σ = Oberfl¨ n(B 2 − B 1 ) = 0 4π t(H 2 − H 1 ) = J , J = Oberfl¨ achenstrom (senkrecht zu n und t) c t(E 2 − E 1 ) = 0 , wobei n den in das Medium 2 zeigenden Normalenvektor und t einen Tangentialvektor der Grenzfl¨ ache bezeichnet.
Zusammenfassung • Makroskopische elektrodynamische Ph¨ anomene in Materie werden durch die makroskopischen Maxwell-Gleichungen beschrieben, in denen die u angeneinheiten r¨ aumlich gemittelten Felder ¨ber viele atomare L¨ E = E, B = B, D = D und H = H sowie die freien Ladungsund Stromdichteverteilungen ρ = ρfr und j = j fr vorkommen. • Diese Gleichungen sind im Gegensatz zu den mikroskopischen Beziehungen (I) bis (IV) nicht fundamental sondern ph¨ anomenologischer Natur.
202
2. Elektrodynamik
• Die im Material gebundenen neutralen Ladungs- und Stromdichteverteilungen lassen sich durch die Polarisierung P = P und die Magnetisierung M = M beschreiben und sind in den Feldern D und H enthalten. • F¨ ur eine große Klasse von Materialien gilt n¨aherungsweise ein linearer Zusammenhang zwischen P und E sowie zwischen M und B, so daß sich mit Hilfe der Dielektrizit¨ atskonstanten und der Permeabilit¨ atskonstanten µ schreiben l¨aßt: D = E, B = µH. • Die Anwendung des Gaußschen und Stokesschen Satzes auf die makroskopischen Maxwell-Gleichungen liefert Stetigkeitsbedingungen f¨ ur die makroskopischen elektromagnetischen Felder an Grenzfl¨achen.
Anwendungen 31. Dielektrische Kugel im homogenen elektrischen Feld. Gegeben sei eine ladungsfreie Kugel mit dem Radius R und der Dielektrizit¨atskonstanten , die in ein anf¨anglich homogenes elektrisches Feld E 0 = E0 ez gebracht wird. Man berechne das elektrostatische Potential in- und außerhalb der Kugel sowie das zugeh¨orige E-Feld. L¨ osung. Nach Voraussetzung sind innerhalb (Bereich I) und außerhalb (Bereich II) der Kugel keine freien Ladungen vorhanden. Das Problem besteht deshalb im L¨ osen der Laplace-Gleichung in beiden Bereichen unter Beachtung von entsprechenden Randbedingungen. Legen wir den Koordinatenursprung in den Mittelpunkt der Kugel, dann liegt eine azimutale Symmetrie vor, und wir k¨ onnen aufgrund von Satz 2.23 ansetzen: φI (x) =
∞
Al rl Pl (cos θ)
l=0 ∞ Bl rl + Cl r−l−1 Pl (cos θ) . φII (x) = l=0
(Aufgrund der Ladungsfreiheit der Kugel kann das innere Potential im Ursprung nicht singul¨ar werden.) Die Koeffizienten Al , Bl und Cl bestimmen sich aus folgenden Randbedingungen: • Im Limes |x| → ∞ ist das E-Feld gleich dem Urspr¨ unglichen Feld: ∇φII ||x|→∞ = −E 0 =⇒ B1 = −E0 , Bl=1 = 0 .
Anwendungen
203
• Die Tangentialkomponenten von E sind auf der Kugeloberfl¨ ache stetig: ∂φI C1 Cl ∂φII = =⇒ A1 = −E0 + 3 , Al = 2l+1 , l = 1 . R ∂θ R ∂θ r=R
r=R
• Die Normalkomponenten von D sind auf der Kugeloberfl¨ ache stetig: ⎧ 2C1 ⎪ ⎨ A1 = −E0 − 3 ∂φII ∂φI R = =⇒ ⎪ ∂r r=R ∂r r=R ⎩ lA = −(l + 1) Cl , l = 1 . l R2l+1 Hieraus folgt 3 −1 , Al=1 = Cl=1 = 0 . , C1 = E0 R3 +2 +2 Wir haben somit insgesamt A1 = −E0
φI (x) = −E0
3 r cos θ +2
− 1 R3 cos θ . + 2 r2 Das zugeh¨orige E-Feld ist in Abb. 2.16 dargestellt. Innerhalb der Kugel ergibt 3 sich ein konstantes elektrisches Feld der Gr¨ oße EI = +2 E0 < E0 in zRichtung. Außerhalb der Kugel hat man das urspr¨ ungliche Feld plus dem Feld eines in z-Richtung orientierten elektrischen Dipols p = E0 R3 ( − 1)/( + 2). φII (x) = −E0 r cos θ + E0
y
z I II
Abb. 2.16. Elektrisches Feld in Anwesenheit einer dielektrischen Kugel, die in ein anf¨ anglich in z-Richtung verlaufendes homogenes Feld gebracht wird
204
2. Elektrodynamik
32. Permeable Kugelschale im homogenen Magnetfeld. Gegeben sei eine Kugelschale mit innerem Radius a, ¨außerem Radius b und der Permeabilit¨ atskonstanten µ, die in ein anf¨anglich homogenes Magnetfeld B 0 = B0 ez gebracht wird (Abb. 2.17 links). Man berechne das Magnetfeld B in den Bereichen I, II und III. y B0
y
b
a
z
z
I II III
Abb. 2.17. Magnetfeld in Anwesenheit einer hochpermeablen Kugelschale, die in ein anf¨ anglich in z-Richtung verlaufendes homogenes Feld gebracht wird
L¨ osung. Da keine Str¨ome anwesend sind, gilt in allen drei Bereichen ∇ × B = 0, so daß sich B als Gradient eines Skalarfeldes ψ darstellen l¨aßt: B(x) = −∇ψ(x) . Wegen ∇B = 0 folgt hieraus in allen drei Bereichen die zu l¨osende LaplaceGleichung ∇2 ψ(x) = 0 . Unser Ansatz f¨ ur das Skalarpotential ψ lautet deshalb ∞ ψI (x) = αl rl Pl (cos θ) l=0 ∞ l βl r + γl r−l−1 Pl (cos θ) ψII (x) = l=0
ψIII (x) = −B0 r cos θ +
∞
δl r−l−1 Pl (cos θ) ,
l=0
ucksichtigt ist. Man wobei bereits die Bedingung B(|x| → ∞) = B 0 ber¨ erh¨ alt die Konstanten αl , βl , γl und δl aus folgenden Randbedingungen:
2.7 Elektromagnetische Wellen
205
• Die Tangentialkomponenten von H sind bei r = a und r = b stetig: 1 ∂ψII 1 ∂ψII ∂ψIII ∂ψI = , = . ∂θ r=a µ ∂θ r=a µ ∂θ r=b ∂θ r=b • Die Normalkomponenten von B sind bei r = a und r = b stetig: ∂ψII ∂ψII ∂ψIII ∂ψI = , = . ∂r r=a ∂r r=a ∂r r=b ∂r r=b Nach einiger Rechnung ergibt sich hieraus 9µB0 , αl=1 = 0 3 (2µ + 1)(µ + 2) − 2 ab3 (µ − 1)2 3(2µ + 1)B0 , βl=1 = 0 β1 = − 3 (2µ + 1)(µ + 2) − 2 ab3 (µ − 1)2
α1 = −
γ1 = − δ1 =
3a3 (µ − 1)B0 , γl=1 = 0 3 (2µ + 1)(µ + 2) − 2 ab3 (µ − 1)2
(2µ + 1)(µ − 1)(b3 − a3 )B0 , δl=1 = 0 . 3 (2µ + 1)(µ + 2) − 2 ab3 (µ − 1)2
Außerhalb der Kugel ist das Potential ¨ aquivalent zum urspr¨ unglichen Feld B 0 plus dem Feld eines in z-Richtung orientierten magnetischen Dipols der oße Gr¨ oße δ1 . Im inneren Bereich hat man ein konstantes Magnetfeld der Gr¨ −α1 in z-Richtung. Insbesondere ist f¨ ur µ 1 α1 = −
9B0 3 . 2µ 1 − ab3
Das innere Magnetfeld wird demnach durch eine hochpermeable Kugelschale (mit µ ≈ 103 bis 106 ) selbst bei relativ kleiner Schalendicke stark reduziert. Dieser magnetische Abschirmungseffekt ist das magnetische Analogon zur elektrischen Abschirmung innerhalb eines Faradayschen K¨ afigs und ist in Abb. 2.17 rechts dargestellt.
2.7 Elektromagnetische Wellen Dieser Abschnitt besch¨ aftigt sich mit der Ausbreitung elektromagnetischer Wellen. Ausgehend von den makroskopischen Maxwell-Gleichungen werden die Eigenschaften von ebenen monochromatischen Wellen in nichtleitenden Medien diskutiert. Unter Beachtung der Stetigkeitsbedingungen an Grenzfl¨ achen folgern wir hieraus das Reflexions- und Brechungsgesetz. Desweiteren betrachten wir aus ebenen Wellen zusammengesetzte Wellenpakete sowie deren Zerfließen“ in dispersiven Medien. Wir erweitern unsere Betrachtungen ” auf die Wellenausbreitung in leitenden Medien. Hierbei treten komplexe Wellenvektoren auf, die zu D¨ ampfungseffekten f¨ uhren. Am Ende besprechen wir
206
2. Elektrodynamik
als konkretes Anwendungsbeispiel die Wellenpropagation in einem zylindrisch geformten Hohlleiter. 2.7.1 Ebene Wellen in nichtleitenden Medien Man betrachte ein nichtleitendes homogenes isotropes Medium, das durch die Dielektrizit¨ atskonstante und die Permeabilit¨atskonstante µ charakterisiert ist. F¨ ur die folgenden Betrachtungen nehmen wir an, daß beide Gr¨oßen reell und positiv sind, wobei sie durchaus von der Wellenfrequenz ω abh¨angig sein d¨ urfen. Mit D = E , B = µH lauten die quellfreien (ρ = 0, j = 0) makroskopischen Maxwell-Gleichungen ⎫ 1 ∂B ⎪ ∇E = 0 , ∇ × E + =0 ⎪ ⎬ c ∂t (2.103) ∂E B ⎪ ⎪ − = 0 .⎭ ∇B = 0 , ∇ × µ c ∂t F¨ ur = µ = 1 wird hiermit rein formal auch der Vakuumfall ber¨ ucksichtigt. Es sei jedoch auch hier noch einmal daran erinnert, daß im Vakuum die mikroskopischen E- und B-Felder eine andere Interpretation besitzen, als die gemittelten makroskopischen Felder. Kombiniert man unter Ber¨ ucksichtigung der Divergenzgleichungen die Rotationsgleichungen miteinander, so erh¨alt man die in E und B symmetrischen Wellengleichungen ∇2 E −
1 ∂2E 1 ∂2B c 2 = 0 , ∇ B − =0, v= √ , 2 2 2 2 µ v ∂t v ∂t
(2.104)
wobei die ebenfalls frequenzabh¨angige Gr¨oße v die Dimension einer Geschwindigkeit hat. Zur L¨osung der Wellengleichungen zu einer bestimmten Frequenz ω machen wir den Ansatz E(x, t) = E 0 ei(kx−ωt) , B(x, t) = B 0 ei(kx−ωt) .
(2.105)
Diese Felder beschreiben ebene monochromatische, d.h. unifrequente Wellen, die sich in Richtung des Wellenvektors k ausbreiten, wobei die physikalischen Felder jeweils durch den Realteil gegeben sind. Durch Einsetzen dieser Gleichungen in (2.104) erh¨alt man folgenden Zusammenhang zwischen ω und k (Dispersionsrelation): ω2 =
c2 k2 c2 k2 √ = 2 , n = µ , µ n
(2.106)
mit dem frequenzabh¨angigen Brechungsindex n des betrachteten Mediums. Aufgrund obiger Voraussetzung ist n und damit auch ω sowie k reell,17 17
Ein komplexes n und damit k f¨ uhrt zu exponentiell ged¨ ampften Wellen (dissipative Effekte).
2.7 Elektromagnetische Wellen
207
w¨ahrend die Amplitudenvektoren E 0 , B 0 i.a. komplexwertig sind. Gleichung (2.106) bestimmt die L¨ osungen (2.105) noch nicht vollst¨ andig. Setzen wir n¨ amlich (2.105) in die Maxwell-Gleichungen (2.103) ein, so ergeben sich die zus¨ atzlichen Beziehungen ω kE 0 = 0 , k × E 0 = B 0 c ω kB 0 = 0 , k × B 0 = − µ E 0 , c woraus folgt: c k ⊥ E0, B0 , B0 = k × E0 . (2.107) ω Das heißt k, E 0 , B 0 bilden in dieser Reihenfolge ein orthogonales Dreibein. Demnach handelt es sich also in (2.105) um transversale Wellen, bei denen die Schwingungsrichtungen E 0 , B 0 senkrecht zur Ausbreitungsrichtung k stehen. Energie und Impuls. Unter Ber¨ ucksichtigung von (2.99) lauten die zu (2.11) und (2.12) analogen Gleichungen f¨ ur die zeitgemittelten Gr¨ oßen S und em
c c ˆ, k ˆ= k Re [E 0 × B ∗0 ] = |E 0 |2 k S = 8πµ 8π µ |k| 1 1 |E 0 |2 . |E 0 |2 + |B 0 |2 = em = 16π µ 8π Teilt man beide Gr¨ oßen durch einander, so ergibt sich die Geschwindigkeit des Energieflusses in Ausbreitungsrichtung: S c ˆ ˆ. = vk =√ k em µ Wir k¨ onnen also v mit der Phasengeschwindigkeit vϕ identifizieren, welche diejenige Geschwindigkeit angibt, mit der sich Wellenz¨ uge konstanter Phase in Richtung k ausbreiten: ω kx − ωt = const =⇒ |k|(|x| − vϕ t) = const , vϕ = . |k| Neben der Frequenz ω und der Phasengeschwindigkeit vϕ ist ein weiteres Charakteristikum ebener monochromatischer Wellen die Wellenl¨ ange λ. Sie gibt die L¨ ange zwischen Punkten gleicher Phase (in Ausbreitungsrichtung) zu einem festen Zeitpunkt an: |k|(|x| + λ) = |k||x| + 2π =⇒ λ =
2π . |k|
208
2. Elektrodynamik
Polarisation. Aufgrund der Linearit¨at der Wellengleichungen ergibt die li¨ neare Uberlagerung (Superposition) von L¨osungen wieder eine L¨osung. Wir wollen nun zwei spezielle L¨osungen zur selben Frequenz ω der Form c E 1 (x, t) = E1 e1 ei(kx−ωt) , B 1 (x, t) = k × E 1 (x, t) ω c E 2 (x, t) = E2 e2 ei(kx−ωt) , B 2 (x, t) = k × E 2 (x, t) ω betrachten, wobei e1 und e2 reelle orthogonale Einheitsvektoren bezeichnen. Diese Felder beschreiben linear polarisierte Wellen, da ihre Schwingungsrichˆ × ei vertungen f¨ ur alle Zeiten entlang der Polarisationsvektoren ei bzw. k laufen. Die Superposition der beiden E-Felder f¨ uhrt zu der neuen L¨osung E(x, t) = (e1 E1 + e2 E2 )ei(kx−ωt) = (e1 |E1 |eiδ1 + e2 |E2 |eiδ2 )ei(kx−ωt) , deren physikalischer Anteil gegeben ist durch ReE(x, t) = e1 |E1 | cos(kx − ωt + δ1 ) + e2 |E2 | cos(kx − ωt + δ2 ).(2.108) F¨ ur die B-Felder gilt Entsprechendes. Der letzte Ausdruck l¨aßt sich je nach Gr¨ oße der Phasen δ1 , δ2 und der Amplituden |E1 |, |E2 | nach drei Polarisationszust¨ anden klassifizieren: • Elliptische Polarisation: δ1 = δ2 . Dies ist der allgemeinste Fall. Betrachtet man einen festen Ort, dann rotiert der elektrische Feldvektor ReE(x = const, t) auf einer Ellipse in der durch e1 und e2 aufgespannten Ebene mit der Periode T = 2π/ω. • Zirkulare Polarisation: δ2 = δ1 ± π/2, |E1 | = |E2 |. F¨ ur diesen Spezialfall lautet (2.108) ReE(x, t) = |E1 | [e1 cos(kx − ωt + δ1 ) ∓ e2 sin(kx − ωt + δ1 )] . Das heißt ReE(x = const, t) beschreibt einen Kreis mit dem Radius |E1 |. Der Umlaufsinn ist dabei je nach Vorzeichen von δ2 − δ1 = ±2π (+): positiv (links zirkular polarisiert, positive Helizit¨ at), (−): negativ (rechts zirkular polarisiert, negative Helizit¨ at). • Lineare Polarisation: δ1 = δ2 . Hier wird (2.108) zu ReE(x, t) = (e1 |E1 | + e2 |E2 |) cos(kx − ωt + δ1 ) . ReE(x = const, t) bewegt sich also entlang einer Geraden in der e1 e2 Ebene. Satz 2.26: Ebene Wellen in nichtleitenden Medien Ebene monochromatische elektromagnetische Wellen in nichtleitenden Medien ( , µ reell) werden durch die Realteile der transversalen Felder E(x, t) = E 0 ei(kx−ωt) , B(x, t) = B 0 ei(kx−ωt) beschrieben, mit
2.7 Elektromagnetische Wellen
ω2 =
209
c2 k2 c √ , n = µ , k ⊥ E 0 B 0 , B 0 = k × E 0 , n2 ω
ω, k, n reell , E 0 , B 0 komplex . Kenngr¨ oßen dieser Wellen sind die Frequenz ω, welche u ur das ¨ber die f¨ betrachtete Medium charakteristische Dispersionsrelation mit dem Wellenvektor k verbunden ist, die Phasengeschwindigkeit vϕ = ω/|k| sowie die Wellenl¨ ange λ = 2π/|k|. Durch Superposition zweier linear polarisierter Wellen erh¨ alt man i.a. elliptisch polarisierte Felder. Spezialf¨ alle der elliptischen Polarisation sind die lineare und die zirkulare Polarisation.
2.7.2 Reflexion und Brechung In diesem Unterabschnitt wird untersucht, wie sich ebene monochromatische Wellen an einer in der xy-Ebene verlaufenden Grenzfl¨ ache verhalten, √ die zwei √ Medien mit unterschiedlichen Brechungsindizes n = µ und n = µ voneinander trennt (siehe Abb. 2.18). Hierzu ist es sinnvoll, folgenden Ansatz f¨ ur die E- und B-Felder der einfallenden, der durch die Grenzfl¨ ache hindurchtretenden (gebrochenen) und der an der Grenzfl¨ ache reflektierten Wellen zu machen: z
n = n=
√
√
k
n ϕ
µ
y , µ k
ϕ ϕ
k
Abb. 2.18. Reflexion und Brechung elektromagnetischer Wellen an einer zwei Medien trennenden Grenzfl¨ ache
• Einfallende Wellen: E(x, t) = E 0 ei(kx−ωt) , B(x, t) = k ⊥ E 0 , ω2 =
c2 k2 . n2
c k × E(x, t) ω
210
2. Elektrodynamik
• Gebrochene Wellen:
E (x, t) = E 0 ei(k x−ω t) , B (x, t) = k ⊥ E 0 , ω = 2
c k × E (x, t) ω
c2 k . n2 2
• Reflektierte Wellen: E (x, t) = E 0 ei(k
x−ω t)
, B (x, t) =
c k × E (x, t) ω
c2 k . n2 Dieser Ansatz erf¨ ullt die in den betrachteten Medien geltenden Wellengleichungen (2.104) inklusive der aus den Maxwell-Gleichungen folgenden Orthogonalit¨ atsbeziehungen (2.107). Nach Satz 2.25 m¨ ussen dar¨ uber hinaus gewisse Stetigkeitsbedingungen an der Grenzfl¨ache (z = 0) f¨ ur die Tangential(t)- und Normal(n)-Komponenten der Felder erf¨ ullt sein. Sie lauten in Abwesenheit von Oberfl¨ achenladungen und -str¨omen k ⊥ E 0 , ω =
2
2
[E t , H t , B n , D n ]z=0 stetig .
(2.109)
Man erkennt leicht, daß diese Bedingungen nur dann f¨ ur alle Zeiten zu erf¨ ullen sind, wenn (bis auf ganzzahlige Vielfache von 2π, die wir ohne Beschr¨ankung der Allgemeinheit nicht zu ber¨ ucksichtigen brauchen) gilt: [kx − ωt = k x − ω t = k x − ω t]z=0 . F¨ ur x = 0 folgt hieraus weiter ω = ω = ω =⇒ |k| = |k | und f¨ ur t = 0 [kx = k x = k x]z=0 . Die letzte Beziehung bedeutet, daß alle Wellenvektoren in einer Ebene liegen m¨ ussen, die z.B. durch den Wellenvektor k der einfallenden Welle und dem Normalenvektor n der Grenzfl¨ache aufgespannt wird. Definiert man nun die Winkel ϕ, ϕ und ϕ wie in Abb. 2.18 angedeutet durch ky = |k| sin ϕ , ky = |k | sin ϕ , ky = |k| sin ϕ , dann erh¨ alt man den Satz 2.27: Reflexions- und Brechungsgesetz Treffen ebene unifrequente Wellen auf eine, zwei unterschiedliche Medien (n, n ) trennende Grenzfl¨ache, dann gilt: • Einfallende, reflektierte und gebrochene Wellen haben dieselbe Frequenz. • Die Betr¨ age der Wellenvektoren der einfallenden und reflektierten Wellen sind gleich.
2.7 Elektromagnetische Wellen
211
• Der Einfallswinkel ist gleich dem Ausfallwinkel: ϕ = ϕ (Reflexionsgesetz) . • Zwischen Einfalls- und Brechungswinkel sowie den Brechungsindizes der beiden Medien gilt sin ϕ n = (Brechungsgesetz) . sin ϕ n
Totalreflexion. Treten die elektromagnetischen Wellen vom optisch dichteren ins optisch d¨ unnere Medium u ¨ber (n > n ), dann gilt nach dem Brechungsgesetz n sin ϕ < 1 . n Das heißt es gibt einen Einfallswinkel sin ϕ =
n , n bei dem der Brechungswinkel den Wert π/2 annimmt und sich die gebro” chenen“ Wellen entlang der Grenzschicht ausbreiten. F¨ ur gr¨ oßere Winkel andig reflektiert (siehe Anwenϕ > ϕTR werden die einfallenden Wellen vollst¨ dung 33). Durch die Bestimmung dieses Grenzwinkels ϕTR , ab dem Totalreflexion eintritt, l¨ aßt sich z.B. die optische Dichte eines unbekannten Mediums experimentell messen. ϕTR = arcsin
Intensit¨ atsbeziehungen. Im Gegensatz zum Reflexions- und Brechungsgesetz h¨ angen die Intensit¨ at und Polarisation der reflektierten und gebrochenen Wellen wesentlich vom Vektorcharakter der Wellen ab. Um dies zu sehen, schreiben wir die Stetigkeitsbedingungen (2.109) noch einmal explizit an: ⎫ (E 0 + E 0 − E 0 )t = 0 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 1 1 (k × E 0 + k × E 0 ) − k × E 0 t = 0 ⎬ µ µ (2.110) ⎪ ⎪ (k × E 0 + k × E 0 − k × E 0 )n = 0 ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ [ (E 0 + E 0 ) − E 0 ]n = 0 , ⎛ ⎞ ⎛ ⎞ 0 t1 wobei n = ⎝ 0 ⎠ den Normalenvektor und t = ⎝ t2 ⎠ einen Tangentialvek1 0 tor der Grenzfl¨ ache bezeichnen. Zur weiteren Auswertung dieser Gleichungen ist es instruktiv, zwei Spezialf¨ alle zu betrachten, bei denen die einfallenden Wellen jeweils in verschiedenen Richtungen linear polarisiert sind:
212
2. Elektrodynamik
a) Senkrechte Polarisation: Der Polarisationsvektor des einfallenden elektrischen Feldes stehe senkrecht zu der von n und k aufgespannten Einfallsebene (Abb. 2.19). In diesem Fall k¨onnen wir f¨ ur die vektoriellen Gr¨oßen z
n = n=
√
√
n ϕ
µ
k
E y
, µ k
ϕ ϕ
k E
E
Abb. 2.19. Reflexion und Brechung elektromagnetischer Wellen, deren E-Feld senkrecht zur Einfallsebene polarisiert ist
der E-Felder ansetzen: ⎛ ⎞ ⎞ ⎛ ⎞ ⎛ 0 0 0 k = ⎝ k2 ⎠ , k = ⎝ k2 ⎠ , k = ⎝ k2 ⎠ k3 k3 −k3 ⎛ ⎛ ⎞ ⎛ ⎞ ⎞ E1 E1 E1 E 0 = ⎝ 0 ⎠ , E 0 = ⎝ E2 ⎠ E 0 = ⎝ E2 ⎠ , 0 E3 E3 mit 0 = k2 E2 + k3 E3
(k E 0 = 0)
0 = k2 E2 − k3 E3
(k E 0 = 0) .
(2.111)
Die erste und letzte Beziehung in (2.110) beinhalten die Gleichungen 0 = E2 − E2 0 = E3 − E3 und bilden mit (2.111) ein homogenes Gleichungssystem f¨ ur die vier Unbekannten E2 , E3 , E2 , E3 , dessen einzige L¨osung die Triviall¨osung E2 = E3 = E2 = E3 = 0 ist. Das heißt auch die reflektierten und gebrochenen E-Felder sind in gleicher Richtung polarisiert, wie das einfallende Feld. Die verbleibenden Gleichungen in (2.110) bilden ein inhomogenes Gleichungssystem f¨ ur E1 , E1
2.7 Elektromagnetische Wellen
213
und k3 , woraus sich die Fresnelschen Formeln f¨ ur elektromagnetische Wellen ergeben, die senkrecht zur Einfallsebene polarisiert sind: E1 2n cos ϕ = µ E1 n cos ϕ + µ n2 − n2 sin2 ϕ n cos ϕ − µµ n2 − n2 sin2 ϕ E1 . = E1 n cos ϕ + µ n2 − n2 sin2 ϕ
(2.112)
µ
b) Parallele Polarisation: Der Polarisationsvektor des einfallenden elektrischen Feldes sei parallel zu der von n und k aufgespannten Einfallsebene polarisiert (Abb. 2.20). Hierf¨ ur setzen wir an: z
E n = n=
√
√
n ϕ
µ
k y
, µ k
E
ϕ ϕ
k
E
Abb. 2.20. Reflexion und Brechung elektromagnetischer Wellen, deren E-Feld parallel zur Einfallsebene polarisiert ist
⎛ ⎞ ⎞ ⎛ ⎞ 0 0 0 k = k ⎝ sin ϕ ⎠ , k = k ⎝ sin ϕ ⎠ , k = k ⎝ sin ϕ ⎠ , cos ϕ − cos ϕ cos ϕ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 0 0 0 E 0 = E0 ⎝ − cos ϕ ⎠ , E 0 = E0 ⎝ − cos ϕ ⎠ , E 0 = E0 ⎝ cos ϕ ⎠ . sin ϕ sin ϕ sin ϕ ⎛
Die Tangentialgleichungen in (2.110) liefern dann ein inhomogenes Gleichungssystem f¨ ur E0 und E0 , cos ϕ E0 + cos ϕE0 = cos ϕE0 k k k E − E = E0 , µ 0 µ 0 µ dessen L¨osung gegeben ist durch
214
2. Elektrodynamik
E0 = E0 E0 E0
2nn cos ϕ µ 2 2 2 2 µ n cos ϕ + n n − n sin ϕ µ 2 2 2 2 µ n cos ϕ − n n − n sin ϕ . = µ 2 2 2 2 µ n cos ϕ + n n − n sin ϕ
(2.113)
Dies sind die Fresnelschen Formeln f¨ ur den parallelen Polarisationsfall. Brewster-Winkel. Es gibt offenbar einen Winkel, den sog. Brewster-Winkel, f¨ ur den die Amplitude der reflektierten Welle in (2.113) im Fall b) verschwindet. Dieser ist f¨ ur µ = µ gegeben durch n . n (Im Fall a) ist (2.112) immer ungleich Null.) Da nichtpolarisierte Wellen in beide Polarisationsrichtungen a) und b) aufgeteilt werden k¨onnen, gibt es keine reflektierten Wellen mit E 0 parallel zur Einfallsebene, wenn der Einfallswinkel gleich dem Brewster-Winkel ist. Die reflektierten Wellen sind also in diesem Fall senkrecht zur Einfallsebene linear polarisiert. Dieser Effekt l¨ aßt sich z.B. zur Herstellung von linear polarisiertem Licht ausnutzen. ϕB = arctan
¨ 2.7.3 Uberlagerung von Wellen, Wellenpakete In realistischen Situationen hat man es nie mit den in den letzten Unterabschnitten diskutierten idealisierten elektromagnetischen Wellen mit definierter Frequenz und definiertem Wellenvektor zu tun, sondern mit Lichtimpulsen mit einem endlichen, wenn auch sehr schmalen Frequenz- bzw. Wellenl¨angenbereich. Da die Wellengleichungen (2.104) linear sind, lassen sich Lichtimpulse (Wellenpakete) mit vorgegebenem Frequenzbereich durch Superposition von ebenen monochromatischen Wellen konstruieren. Hierdurch ergeben sich u.a. folgende, bisher unber¨ ucksichtigte Effekte: • Ist das betrachtete Medium dispersiv – d.h. der (reelle) Brechungsindex besitzt eine Frequenzabh¨angigkeit –, dann ist die Phasengeschwindigkeit f¨ ur jede der superponierten Wellen verschieden. Hieraus folgt, daß sich die einzelnen Wellenkomponenten im Medium unterschiedlich schnell ausbreiten, wodurch sich ihre relative Phasenlage ¨andert. Dies f¨ uhrt zu einer mit der Zeit wachsenden Verzerrung des Wellenpaketes. Desweiteren werden die Wellenanteile an einer Grenzfl¨ache zwischen zwei Medien unterschiedlich stark gebrochen und laufen deshalb auseinander.18 • In einem dispersiven Medium ist die Geschwindigkeit, mit der sich das Wellenpaket ausbreitet, die sog. Gruppengeschwindigkeit vg , i.a. verschieden 18
Dieser Effekt ist z.B. f¨ ur die spektrale Aufteilung eines Lichtstrahls in einem Prisma verantwortlich.
2.7 Elektromagnetische Wellen
215
von den Phasengeschwindigkeiten vϕ der einzelnen Wellen. Die Gruppengeschwindigkeit bestimmt den Energietransport und die Signalgeschwindigkeit des Wellenpaketes. • In einem dissipativen Medium – d.h. der Brechungsindex ist komplex – treten D¨ampfungseffekte auf. Hierbei kann es vorkommen, daß die Gruppengeschwindigkeit gr¨ oßer ist als die Lichtgeschwindigkeit c. Da aber die Ausbreitung des Wellenpaketes durch Absorption begrenzt ist, steht vg > c nicht im Widerspruch zur Relativit¨ atstheorie, nach der c die maximale Signalgeschwindigkeit darstellt. Um zu verstehen, was der Begriff Gruppengeschwindigkeit“ bedeutet, be” trachten wir die Propagation eines Wellenpaketes in einem Medium. Der Einfachheit halber nehmen wir an, daß es sich in z-Richtung ausbreitet, und beschr¨ anken uns auf eine Komponente des E-Feldes, die wir mit ψ bezeichnen. Die allgemeinste Form lautet dann ∞ 1 ψ(z, t) = √ dkA(k)ei[kz−ω(k)t] . (2.114) 2π −∞
Desweiteren setzen wir folgende, ganz allgemein gehaltene Dispersionsrelation zwischen ω und k voraus: ck ⇐⇒ ω = ω(k) . ω= n(ω) F¨ ur t = 0 ist (2.114) gerade die Fourier-Darstellung der Funktion ψ(z, 0), mit den Fourier-Komponenten ∞ 1 A(k) = √ dzψ(z, 0)e−ikz . (2.115) 2π −∞
Falls die Verteilung A(k) ein scharfes Maximum um k0 besitzt, ist es gerechtfertigt, ω(k) in einer Taylor-Reihe um k0 zu entwickeln: dω 1 d2 ω ω(k) = ω(k0 ) + (k − k0 ) + (k − k0 )2 + . . . dk k0 2 dk 2 k0 = ω0 + vg (k − k0 ) + γ(k − k0 )2 + . . . ,
(2.116)
mit ω0 = ω(k0 ) dω vg = dk
(Gruppengeschwindigkeit)
k0 2
1 d ω γ = 2 dk 2 k0
(Dispersionsparameter) .
Setzen wir in der linearen N¨ aherung (2.116) in (2.114) ein, dann ergibt sich
216
2. Elektrodynamik
1 ψ(z, t) ≈ √ ei(vg k0 −ω0 )t 2π
∞ dkA(k)ei(kz−vg kt)
−∞
≈ ei(vg k0 −ω0 )t ψ(z − vg t, 0) . Die Intensit¨ at dieser Welle ist |ψ(z, t)|2 = |ψ(z − vg t, 0)|2 . ¨ In der linearen N¨aherung wird also das Wellenpaket ohne Anderung seiner Form, d.h. ohne Dispersion mit der Gruppengeschwindigkeit vg in z-Richtung verschoben. F¨ ur lineare Dispersionsrelationen ω ∼ |k| (nichtdispersive Medien) wie z.B. im Vakuumfall ist diese N¨aherung sogar exakt. Geht man im dispersiven Fall u ¨ber die lineare N¨aherung hinaus, dann ¨andert das Wellenpaket im Laufe der Zeit seine Form; es fließt auseinander. Dieser Effekt wird in f¨ uhrender Ordnung durch den Dispersionsparameter γ beschrieben. Die Gruppengeschwindigkeit gibt hierbei die Geschwindigkeit des Schwerpunktes des Wellenpaketes an. Wellenpaket in einem dispersiven Medium. Zur Illustration von Dispersionseffekten wollen wir nun die in z-Richtung verlaufende Propagation eines eindimensionalen Lichtimpulses in einem Medium ohne N¨aherungen berechnen, dem folgende Dispersionsrelation zu Grunde liegen soll: a2 k 2 ω(k) = ν 1 + . 2 ν ist hierbei eine konstante Frequenz und a eine konstante L¨ange. Wie weiter unten deutlich wird, kann letztere als charakteristische Wellenl¨ange f¨ ur das Auftreten von Dispersionseffekten interpretiert werden. F¨ ur die Form des anf¨ anglichen Lichtimpulses zur Zeit t = 0 nehmen wir eine Gauß-Verteilung an: z2
ψ(z, 0) = e− 2∆2 eik0 z . Hieraus ergibt sich nach (2.115) folgende Verteilung der zugeh¨origen FourierAmplituden: ∞ ∆2 (k−k0 )2 z2 1 2 A(k) = √ dze− 2∆2 e−i(k−k0 )z = ∆e− . 2π −∞
Nach (2.114) berechnet sich die Form des Lichtimpulses zu einem sp¨ateren Zeitpunkt t zu ∞ 1 ψ(z, t) = √ dkA(k)ei[kz−ω(k)t] 2π ∆ = √ 2π
−∞ ∞
−∞
dke−
∆2 (k−k0 )2 2
e
i kz−ν 1+ a
2 k2 2
t
2.7 Elektromagnetische Wellen
∆ − = √ e 2π
∆2 k2 0 2
+iνt
∞
dke−
α(t) 2 2 2 k +k(∆ k0 +iz)
,
217
(2.117)
−∞
mit α(t) = ∆2 + iνa2 t . Die Integration in (2.117) l¨ aßt sich mit Hilfe einer quadratischen Erg¨ anzung ausf¨ uhren, und man erh¨ alt schließlich a2 k02 (z − νa2 tk0 )2 ∆ t . exp ik0 z − iν 1 + exp − ψ(z, t) = 2 2α(t) α(t) Die Intensit¨ at dieses Wellenpaketes ist
∆ (z − νa2 tk0 )2 , exp − |ψ(z, t)| = ψ (z, t)ψ(z, t) = β(t) β(t) 2
∗
mit ν 2 a4 t2 . ∆2 Die Breite des Wellenpaketes wird durch die zeitabh¨ angige Gr¨ oße β beschrie¨ ben und w¨ achst mit der Zeit an (Abb. 2.21). Die Anderungsrate der Breite pro Zeiteinheit erh¨ alt man durch Differentiation von β nach t: β(t) = ∆2 +
2ν 2 a4 t . ∆2 Man sieht hieraus, daß ∆ a das Kriterium f¨ ur eine kleine Verzerrung und damit f¨ ur eine (fast) dispersionsfreie Ausbreitung des Wellenpaketes im Medium darstellt. β (t) =
|ψ(z, t)|2
z vg t Abb. 2.21. Zerfließen eines Wellenpaketes in einem dispersiven Medium
218
2. Elektrodynamik
2.7.4 Ebene Wellen in leitenden Medien Ist das Medium, in dem sich elektromagnetische Wellen ausbreiten, ein Leiter, dann ergeben sich einige Unterschiede zum nichtleitenden Fall. In einem Leiter gilt neben den makroskopischen Maxwell-Gleichungen zus¨atzlich das Ohmsche Gesetz j = σE , wobei σ die Leitf¨ahigkeit des Leiters bezeichnet. Wir haben somit µ ∂H =0 c ∂t 4πσ ∂E = E. µ∇H = 0 , ∇ × H − c ∂t c Man erh¨ alt hieraus durch Kombination der beiden Rotationsgleichungen die in E und H symmetrischen Telegraphengleichungen: ∇E = 0 , ∇ × E +
µ ∂ 2 E 4πµσ ∂E µ ∂ 2 H 4πµσ ∂H = 0 , ∇2 H − =0. − 2 − 2 2 2 c ∂t c ∂t c ∂t c ∂t Zu ihrer L¨ osung machen wir analog zu Unterabschn. 2.7.1 den Ansatz ∇2 E −
E(x, t) = E 0 ei(kx−ωt) , H(x, t) = H 0 ei(kx−ωt)
(2.118)
und erhalten folgende Dispersionsrelation: ω2 ω2 2 4πiσ √ µη = p , η = + , p = µη , c2 c2 ω wobei η verallgemeinerte Dielektrizit¨ atskonstante und p verallgemeinerter Brechungsindex genannt wird. Der Wellenvektor ist also in leitenden Medien komplex, so daß wir eine ged¨ampfte Ausbreitung erwarten. Betrachten wir z.B. eine Welle, die sich in x-Richtung fortpflanzt, dann l¨aßt sich der exponentielle Teil der Wellenfunktion mit k = α + iβ schreiben als k2 =
ei(kx−ωt) = e−βx ei(αx−ωt) , β > 0 . Das heißt die Amplitude der Welle f¨allt exponentiell in der Fortpflanzungsrichtung ab. β stellt hierbei ein Maß f¨ ur die Eindringtiefe der Welle in das Medium dar. Die zu (2.107) korrespondierenden Orthogonalit¨atsrelationen ergeben sich durch Einsetzen von (2.118) in obige Maxwell-Gleichungen: ωµ H0 kE 0 = 0 , k × E 0 = c ωη kH 0 = 0 , k × H 0 = − E 0 c c =⇒ k ⊥ E 0 , H 0 , H 0 = k × E0 . ωµ Demnach sind auch in leitenden Medien die elektromagnetischen Wellen transversale Wellen, und es bilden auch hier k, E 0 , H 0 in dieser Reihenfolge ein orthogonales Dreibein.
2.7 Elektromagnetische Wellen
219
2.7.5 Zylindrischer Hohlleiter Unter Hohlleitern versteht man hohle langgestreckte Metallk¨ orper, die an ihren Enden nicht abgeschlossen sind, w¨ ahrend solche K¨ orper mit Abschluß Hohlraumresonatoren genannt werden. Im folgenden wird die Ausbreitung elektromagnetischer Wellen in zylindrischen Hohlleitern mit konstantem ache S des Querschnitt entlang der z-Achse diskutiert (Abb. 2.22). Die Oberfl¨ Hohlleiters wird als idealer Leiter angenommen. Der Innenraum sei mit einem atskonstante und der Permeabilit¨ at µ dispersiven Medium der Dielektrizit¨ gef¨ ullt. Aufgrund der Zylindergeometrie des Problems erwarten wir Wellen, die sich l¨ angs der positiven bzw. negativen z-Achse ausbreiten, und machen daher den Ansatz E(x, t) = E(x, y)e±ikz−iωt , B(x, t) = B(x, y)e±ikz−iωt .
(2.119)
Bevor wir diese Felder in die Wellengleichungen (2.104) einsetzen, ist es g¨ unstig, sie in Komponenten parallel und senkrecht zur z-Achse aufzuspalten: E(x, t) = [E z (x) + E t (x)] e−iωt , mit
⎞ ⎞ ⎛ 0 Ex E z = (ez E)ez = ⎝ 0 ⎠ , E t = (ez × E) × ez = ⎝ Ey ⎠ . 0 Ez ⎛
Entsprechendes gilt f¨ ur B. Aus den Rotationsgleichungen in (2.103) ergeben sich dann nach einigen Zwischenrechnungen und unter Ber¨ ucksichtigung der expliziten z-Abh¨ angigkeit (2.119) folgende Ausdr¨ ucke f¨ ur die transversalen Felder: ⎫ ω ∂Ez 1 ⎪ ⎪ − i (ez × ∇t )B z E t = 2 ∇t ⎬ γ ∂z c (2.120) ⎪ ω ∂Bz 1 ⎭ + i µ(ez × ∇t )E z , ⎪ B t = 2 ∇t ∂z c γ mit ω2 ∂ . µ − k 2 , ∇t = ∇ − c2 ∂z Das heißt die transversalen Felder sind allein durch die longitudinalen Felder determiniert, so daß es gen¨ ugt, die Wellengleichungen (2.104) f¨ ur die Longitudinalfelder E z und B z zu l¨ osen: γ2 =
z
Abb. 2.22. Hohlleiter mit zylindrischer Symmetrie
220
2. Elektrodynamik
∂2 ∂2 + + γ2 ∂x2 ∂y 2
Ez Bz
=0.
(2.121)
Da gem¨ aß Voraussetzung die Zylinderoberfl¨ache S als idealer Leiter angenommen wird, gelten dort die Randbedingungen nB = 0 , n × E = 0 , wobei n den Normalenvektor von S bezeichnet. Diese Bedingungen sind ¨aquivalent zu den Forderungen Ez |x∈S = 0 , n∇Bz |x∈S = 0 .
(2.122)
Ez und Bz haben also derselben Wellengleichung (2.121) zu gen¨ ugen, allerdings mit unterschiedlichen Randbedingungen (2.122), die i.a. f¨ ur beide Felder nicht gleichzeitig erf¨ ullt werden k¨onnen. Man unterscheidet deshalb drei Klassen von L¨osungen: • Transversale magnetische Moden (TM): Hierbei l¨ost man die Eigenwertgleichung (2.121) f¨ ur Ez mit der Randbedingung Ez |x∈S = 0, was zu einem 2 bestimmten Eigenwertspektrum γTM f¨ uhrt. Als L¨osung der Eigenwertgleichung f¨ ur Bz w¨ahlt man die triviale L¨osung Bz = 0 ∀ x. • Transversale elektrische Moden (TE): Es wird (2.121) f¨ ur Bz mit der Randbedingung n∇Bz |x∈S = 0 gel¨ost, was zu einem bestimmten Eigen2 wertspektrum γTE f¨ uhrt. Als L¨osung der Eigenwertgleichung f¨ ur Ez w¨ahlt man die triviale L¨osung Ez = 0 ∀ x. • Transversale elektrische und magnetische Moden (TEM): Diese Moden sind durch verschwindende longitudinale Komponenten des elektrischen und magnetischen Feldes charakterisiert: Ez = Bz = 0 ∀ x. Anhand von (2.120) erkennt man, daß hierbei f¨ ur nichtverschwindende transversale Felder die Bedingung ω2 µ − k 2 = 0 c2 erf¨ ullt sein muß. Dies ist aber gerade die Dispersionsrelation f¨ ur ein dispersives Medium. TEM-Wellen breiten sich also aus, als bef¨anden sie sich in einem unbegrenzten Medium. 2 = γTEM
Zusammenfassung • Die Wellenausbreitung in nichtleitenden Medien wird durch die in E und B symmetrischen Wellengleichungen beschrieben. Ihre L¨osungen setzen sich aus ebenen monochromatischen Wellen zusammen, deren Wel-
Anwendungen
221
lenvektoren und Frequenzen u angige Dispersions¨ber eine medienabh¨ relation miteinander verkn¨ upft sind. • Durch Superposition zweier verschieden linear polarisierter Wellen erh¨ alt man i.a. elliptisch polarisiertes Licht. Spezialf¨ alle der elliptischen Polarisation sind zirkulare und lineare Polarisation. • Trifft eine monochromatische Welle auf eine, zwei verschiedene optische Medien trennende Grenzfl¨ ache, dann gilt f¨ ur die einfallenden, reflektierten und transmittierten Anteile das Reflexions- und das Brechungsgesetz. • In dispersiven Medien besitzen die verschiedenen monochromatischen Anteile eines Wellenpaketes unterschiedliche Phasengeschwindigkeiten, so daß das Wellenpaket mit der Zeit immer mehr verzerrt. Die f¨ ur die Bewegung des Wellenpaketes maßgebliche Geschwindigkeit ist die Gruppengeschwindigkeit. Sie ist gleich der Schwerpunktsgeschwindigkeit des Wellenpaketes. • Die in E und H symmetrischen Telegraphengleichungen beschreiben die Ausbreitung elektromagnetischer Wellen in leitenden Medien. Da hierbei die Wellenvektoren komplex sind, ist die Ausbreitung ged¨ ampft (Dissipation). • Die Ausbreitung elektromagnetischer Wellen in zylindrischen Hohlleitern ist durch die Wellengleichung f¨ ur die longitudinalen E- und BKomponenten mit den zugeh¨ origen Stetigkeitsbedingungen eindeutig bestimmt. Man unterscheidet drei Klassen von L¨ osungen, n¨ amlich transversale magnetische Moden (TM), transversale elektrische Moden (TE) sowie transversale elektrische und magnetische Moden (TEM).
Anwendungen 33. Totalreflexion. Man zeige, daß im Falle der Totalreflexion ϕ > ϕTR der zeitgemittelte Energiefluß nS durch die Grenzfl¨ ache verschwindet. L¨ osung. Unter Bezugnahme auf Abb. 2.18 gilt ⎛ ⎞ ⎛ ⎞ 0 0 k = k ⎝ sin ϕ ⎠ , n = ⎝ 0 ⎠ . 1 cos ϕ Im Falle der Totalreflexion ist sin ϕ = α > 1 ,
222
2. Elektrodynamik
d.h. ϕ ist komplex. Hieraus folgt, daß cos ϕ rein imagin¨ar ist: cos ϕ = 1 − sin2 ϕ = i sin2 ϕ − 1 . Nun gilt f¨ ur die zeitgemittelte Normalkomponente des Energieflusses nS =
c c2 Re[n(E × B ∗ )] = Re[nk |E 0 |2 ] . 8πµ 8πωµ
Da nk = k cos ϕ rein imagin¨ar ist, folgt: nS = 0. 34. Hohlraumresonator mit kreisf¨ ormigem Querschnitt. Man bestimme die Schwingungsmoden eines ideal leitenden, hohlen Metallvolumens mit kreisf¨ ormigem Querschnitt. Der Querschnittsradius betrage R und die L¨ ange L. Der Innenraum dieses Hohlraumresonators sei mit einem dispersiven Medium ( , µ) gef¨ ullt. L¨ osung. Aufgrund der abschließenden Endfl¨ achen bei z = 0 und z = L werden elektromagnetische Wellen an diesen reflektiert, und es kommt zur Ausbildung von stehenden Wellen entlang der z-Achse. F¨ ur TM-Wellen machen wir deshalb folgenden Ansatz f¨ ur die longitudinalen Anteile: pπz Bz (x) = 0 , Ez (x) = ψ(x, y) cos , p = 1, 2, . . . . L Die transversalen Anteile ergeben sich hieraus zu pπz pπz pπ i µω E t (x) = − 2 sin ∇t ψ , B t (x) = ez × ∇t ψ , cos Lγ L cγ 2 L mit
pπ 2 ω2 µ − . 2 c L Offensichtlich sind durch diesen Ansatz die Randbedingungen E t (z = 0) = E t (z = L) an den Abschl¨ ussen automatisch ber¨ ucksichtigt. F¨ ur TE-Moden bietet sich f¨ ur die longitudinalen Komponenten der Ansatz pπz , p = 1, 2, . . . Ez (x) = 0 , Bz (x) = ψ(x, y) sin L an, aus dem die transversalen Komponenten pπz pπz iω pπ E t (x) = − 2 sin ez × ∇t ψ , B t (x) = ∇t ψ cos 2 cγ L Lγ L γ2 =
folgen. Auch hierbei sind die entsprechenden Randbedingungen an den Endfl¨ achen, Bz (z = 0) = Bz (z = L), bereits ber¨ ucksichtigt. Zur L¨osung der Wellengleichung 2 ∂ ∂2 2 (2.123) + 2 + γ ψ(x, y) = 0 ∂x2 ∂y benutzen wir aufgrund der Geometrie des Problems Zylinderkoordinaten:
Anwendungen
223
x = r cos ϕ , y = r sin ϕ . Damit geht (2.123) u ¨ber in 2 1 ∂2 ∂ 1 ∂ 2 + ψ(r, ϕ) = 0 . + + γ ∂r2 r ∂r r2 ∂ϕ2 Der Ansatz ψ(r, ϕ) = J(r)eimϕ , m = 0, ±1, ±2, . . . f¨ uhrt zu
1 dJ m2 d2 J 2 + γ − 2 J =0. + dr2 r dr r
Diese Gleichung l¨ aßt sich mit Hilfe der Substitution x = γr in die Besselsche Differentialgleichung u uhren (siehe Abschn. A.5): ¨berf¨ d2 J 1 dJ m2 J =0. + + 1 − dx2 x dx x2 L¨osungen dieser Gleichung sind die Bessel-Funktionen ∞ x m (−1)i x 2i Jm (x) = . 2 i!(i + m)! 2 i=0 F¨ ur TM-Moden ergeben sich somit die Longitudinalkomponenten pπz , Bz = 0 . Ez (x) = Jm (γr)eimϕ cos L Die zugeh¨ orige Randbedingung an der Mantelfl¨ache liefert die Einschr¨ ankung Ez (x)|√x2 +y2 =R = 0 =⇒ Jm (γR) = 0 . Das heißt die zul¨ assigen Eigenwerte γ der Wellengleichung bestimmen sich aus den verschiedenen (mit n indizierten) Nullstellen der Bessel-Funktionen. Diese liegen z.B. f¨ ur rotationssymmetrische Eigenschwingungen (m = 0) bei γm=0,n=0 R = 2.405 , γm=0,n=1 R = 5.520 , γm=0,n=2 R = 8.654 , . . . . Zu jedem γmn geh¨ oren die Eigenfrequenzen
pπ 2 c 2 2 + =√ γmn . ωmnp µ L F¨ ur TE-Moden hat man f¨ ur die longitudinalen Felder pπz Ez (x) = 0 , Bz (x) = Jm (γr)eimϕ sin , L wobei die Randbedingung dJm (x) √ = 0 n∇Bz (x, y)| x2 +y2 =R = 0 =⇒ =0 dx x=γR
224
2. Elektrodynamik
zu ber¨ ucksichtigen ist, welche die zul¨assigen γ mit den Nullstellen der ersten Ableitung der Bessel-Funktionen in Beziehung setzt. Die ersten Nullstellen f¨ ur m = 0 lauten x0,n = γ0,n R = 3.832 , 7.016 , 10.173 , . . . . Im allgemeinen f¨ uhren die xmn zu TE-Eigenfrequenzen ωmnp , die von den TM-Eigenfrequenzen verschieden sind.
2.8 Lagrange-Formalismus in der Elektrodynamik Der Lagrange- und Hamilton-Formalismus spielt in der Elektrodynamik nicht solch eine dominierende Rolle wie beispielsweise in der klassischen Mechanik. Dort liefert die Lagrange-Funktion einen direkten Weg zu den Bewegungsgleichungen. Diese sind nun aber in der Elektrodynamik in Form der MaxwellGleichungen bereits gegeben. Trotzdem bietet der Lagrange-Formalismus einen alternativen Zugang zur Elektrodynamik, der insbesondere auch f¨ ur den Aufbau anderer Feldtheorien von Interesse ist. Wir stellen deshalb in diesem Abschnitt kurz die wichtigsten Zusammenh¨ange vor. Dabei betrachten wir zun¨ achst die Lagrange-Formulierung der Bewegungsgleichungen eines Teilchens in einem gegebenen elektromagnetischen Feld und diskutieren anschließend die Erweiterung des Lagrange-Formalismus auf die Felder selbst. Desweiteren besprechen wir die sich in diesem Formalismus ergebenden Erhaltungss¨ atze und gehen zum Abschluß auf den Zusammenhang zwischen Symmetrien und dem Prinzip der Eichinvarianz ein. 2.8.1 Lagrange- und Hamilton-Funktion eines geladenen Teilchens Nach Satz 2.10 gilt folgende relativistische Bewegungsgleichung f¨ ur ein Teilchen der Ruhemasse m0 und der Ladung q in den elektromagnetischen Feldern E und B: d m0 x˙ x˙ = p˙ = F L = q E + × B . dt 1 − x˙ 2 c c2
Dr¨ ucken wir die elektromagnetischen Felder durch Skalar- und Vektorpotentiale aus, so ergibt sich d m0 x˙ 1 ∂A x˙ + × (∇ × A) = q −∇φ − dt 1 − x˙ 2 c ∂t c 2 c 1 ∂A 1 1 ˙ − (x∇)A ˙ = q −∇φ − + ∇(Ax) c ∂t c c q dA Ax˙ −φ − . (2.124) = q∇ c c dt
2.8 Lagrange-Formalismus in der Elektrodynamik
225
Durch Vergleich dieses Ausdrucks mit der Lagrange-Gleichung (in vektorieller Form), d ∇x˙ L = 0 , dt erkennen wir, daß sich (2.124) aus der Lagrange-Funktion x˙ 2 q L = −m0 c2 1 − 2 − qφ + Ax˙ c c ∇x L −
(2.125)
ergibt. Hieraus berechnet sich der generalisierte Impuls P des Teilchens zu m0 x˙ q q P = ∇x˙ L = p + A = + A. 2 c c 1 − xc˙ 2
(2.126)
Die zugeh¨ orige Hamilton-Funktion ist daher gegeben durch m0 c2 H = P x˙ − L = + qφ . 2 1 − xc˙ 2 Hierin eliminieren wir mit Hilfe von (2.126) x˙ zugunsten von P und erhalten schließlich
q 2 H = m20 c4 + c2 P − A + qφ . c Satz 2.28: Lagrange- und Hamilton-Funktion einer Ladung q im elektromagnetischen Feld x˙ 2 q L = −m0 c2 1 − 2 − qφ + Ax˙ c c
2 q H = m20 c4 + c2 P − A + qφ . c Aus Unterabschn. 1.6.5 ist bekannt, daß die relativistische Lagrange-Funktion eines freien Teilchens gegeben ist durch x˙ 2 Lfrei = −m0 c2 1 − 2 . c Wir schließen hieraus, daß die Lagrange-Funktion q q 1 L = L − Lfrei = −qφ + Ax˙ = − uµ Aµ , γ = c γc 1−
˙2 x c2
die Wechselwirkung des Teilchens mit dem elektromagnetischen Feld beschreibt.
226
2. Elektrodynamik
2.8.2 Lagrange-Dichte des elektromagnetischen Feldes Wir erweitern jetzt unsere Diskussion und zeigen, wie sich der relativistische Lagrange-Formalismus von Punktteilchen auf kontinuierliche Felder erweitern l¨ aßt. Hierzu betrachten wir zun¨achst ganz allgemein ein System von Feldern φi (x), die von den Vierervektoren xµ abh¨angen. Ausgangspunkt ist die Lagrange-Funktion L, welche zu einer Lagrange-Dichte L(φi , ∂µ φi , x) der Felder φi verallgemeinert wird, aus der sich die Wirkung S durch Integration u ¨ber die vierdimensionale Raum-Zeit ergibt: S = d4 xL(φi , ∂µ φi , x) . Nun ist es sinnvoll, eine Reihe von Bedingungen an die Form der LagrangeDichte zu stellen. Zuerst fordern wir nat¨ urlich, daß der Formalismus die uns bekannten Bewegungsgleichungen, also im Falle der Elektrodynamik die Maxwell-Gleichungen, liefert. Hieraus folgt, daß die Lagrange-Dichte Ableitungen in den Feldern von h¨ochstens 1. Ordnung enthalten darf. Da wir ferner nur lokale Feldtheorien betrachten wollen, kann die Lagrange-Dichte nur von den Feldern an einem Ort x abh¨angen. Schließlich sollte L unter Eichtransformationen h¨ ochstens um eine totale Divergenz ge¨andert werden, damit die Wirkung invariant bleibt. Lagrange-Gleichungen. Betrachten wir zun¨achst die Variation der Wirkung S unter der Variation δφ einer beliebigen Feldkomponente φ(x), ∂L ∂L δS = d4 x δφ + δ(∂µ φ) ∂φ ∂(∂µ φ) ∂L ∂L ∂L − ∂µ δφ , (2.127) δφ + d4 x∂µ = d4 x ∂φ ∂(∂µ φ) ∂(∂µ φ) wobei wir analog zu Unterabschn. 1.2.3 davon ausgehen, daß φ(x) auf der im Unendlichen liegenden Raum-Zeit-Hyperfl¨ache fixiert ist ( feste Endpunkte“) ” bzw. dort verschwindet: δφ(x)||xµ |→∞ = [φ (x) − φ(x)]|xµ |→∞ = 0 . Weil der letzte Term von (2.127) eine totale Divergenz ist, kann er mit Hilfe des vierdimensionalen Gaußschen Satzes in das Oberfl¨achenintegral ∂L ∂L 4 d x∂µ δφ = dσµ δφ ∂(∂µ φ) ∂(∂µ φ) umgeschrieben werden, das nach unserer Voraussetzung verschwindet. Folglich f¨ uhrt die Stationarit¨atsforderung der Wirkung auf die Lagrange-Gleichung des Feldes φ: δS = 0 =⇒
∂L ∂L − ∂µ =0. ∂φ ∂(∂µ φ)
(2.128)
2.8 Lagrange-Formalismus in der Elektrodynamik
227
Lagrange-Dichte des elektromagnetischen Feldes. Aufgrund der o.g. Forderungen an die Lagrange-Dichte kann man zeigen, daß L prinzipiell nur folgende Lorentz-Skalare enthalten darf: ∂µ Aν ∂ µ Aν , ∂µ Aν ∂ν Aµ , (∂µ Aµ )2 , Aµ Aµ , jµ Aµ . Diese Terme m¨ ussen in der Lagrange-Funktion derart auftreten, daß (2.128) gerade die inhomogenen Maxwell-Gleichungen 4π ∂ µ Fµν = jν c liefert (siehe Satz 2.9).19 Man verifiziert leicht (Anwendung 35), daß die folgende Lagrange-Dichte diese Bedingung erf¨ ullt: Satz 2.29: Lagrange-Dichte des elektromagnetischen Feldes L=−
1 1 Fµν F µν − jµ Aµ + totale Divergenz . c 16π
Eichinvarianz. F¨ uhrt man jetzt eine Eichtransformation Aµ −→ Aµ = Aµ − ∂ µ χ aus, dann enth¨ alt L im Vergleich zu L den zus¨ atzlichen Term jµ ∂ µ χ/c, den wir als eine totale Divergenz schreiben k¨ onnen, falls der Strom erhalten ist: jµ ∂ µ χ = ∂ µ (jµ χ) . Mit anderen Worten: Die Erhaltung des Viererstromes j µ ist notwendig und hinreichend f¨ ur die Eichinvarianz der Theorie. Hamilton-Formalismus. Nachdem wir eine formale Analogie zwischen dem Lagrange-Formalismus eines Teilchens und dem des Feldes gefunden haben, fragen wir nun nach der Verallgemeinerung der Hamilton-Funktion pi q˙i − L H= i
f¨ ur Felder. Dazu betrachten wir die Hamilton-Dichte ∂L ∂φ H = ∂φ −L ∂( ∂t ) ∂t und verallgemeinern sie zu einem kontravarianten Tensor zweiter Stufe, dem sog. Energie-Impuls-Tensor: Θµν =
∂L ∂ ν φ − g µν L . ∂(∂µ φ)
(2.129)
Dieser Tensor ist in Verbindung mit Satz 2.29 allerdings nicht identisch mit dem Maxwellschen Spannungstensor T µν aus (2.46) in Unterabschn. 2.3.5. 19
Die homogenen Maxwell-Gleichungen ∂µ Gµν = 0 sind aufgrund der Definition von F µν automatisch erf¨ ullt.
228
2. Elektrodynamik
Insbesondere ist Θµν nicht unbedingt symmetrisch, wie es die Drehimpulserhaltung fordert. Jedoch k¨onnen wir zu Θµν immer einen Term ¯ µν = ∂κ ϕκµν , Θ mit ϕκµν = −ϕµκν , ∂µ ∂κ ϕκµν = 0 hinzuaddieren. W¨ahlt man im Fall der Elektrodynamik ¯ µν = 1 ∂κ (F κµ Aν ) , Θ 4π so folgt der symmetrisierte Energie-Impuls-Tensor des elektromagnetischen Feldes, ¯ µν = T µν = 1 g µκ Fκλ F λν + 1 g µν Fκλ F κλ , Θµν + Θ 4π 4 der nun in der Tat mit dem Spannungstensor (2.46) u ¨bereinstimmt. 2.8.3 Erhaltungss¨ atze, Noether-Theorem Wir wollen nun analog zu Unterabschn. 1.2.2 den Zusammenhang zwischen Symmetrien und Erhaltungss¨atzen aufzeigen. Dazu betrachten wir zun¨achst ein einzelnes skalares Feld φ(x) und berechnen die Variation der Wirkung unter einer sehr allgemein gehaltenen gleichzeitigen Variation von x und φ: xµ −→ xµ = xµ + δxµ , φ(x) −→ φ (x ) = φ(x) + ∆φ(x) . Dabei ist zu beachten, daß ∆φ die totale Variation von φ an zwei verschiedenen Raumzeitpunkten bedeutet und u ¨ber ∆φ(x) = φ (x ) − φ(x ) + φ(x ) − φ(x) = δφ + (∂ν φ)δxν (2.130) δφ(x)||xµ |→∞ = 0 mit der Variation δφ von φ am selben Raumzeitpunkt zusammenh¨angt. Die letzte Beziehung reflektiert wieder die Fixierung von φ auf dem Rand der Raum-Zeit. F¨ ur die Berechnung der Variation 4 δS = δ(d x)L + d4 xδL ben¨ otigen wir noch die Funktionaldeterminante µ ∂x 4 4 d x = |det[δνµ + ∂ν (δxµ )]| d4 x = [1 + ∂µ (δxµ )]d4 x d x = det ∂xν =⇒ δ(d4 x) = ∂µ (δxµ )d4 x. Insgesamt folgt
2.8 Lagrange-Formalismus in der Elektrodynamik
229
∂L ∂L 4 µ 4 µ δφ + δS = d xL∂µ (δx ) + d x (∂µ L)δx + ∂µ (δφ) ∂φ ∂(∂µ φ) ∂L ∂L − ∂µ δφ + δSσ , = d4 x ∂φ ∂(∂µ φ)
mit
∂L δSσ = d x∂µ (Lδx ) + d x∂µ δφ ∂(∂µ φ) ∂L ν 4 µ 4 (∆φ − (∂ν φ)δx ) = d x∂µ (Lδx ) + d x∂µ ∂(∂µ φ) 7 6 ∂L ∂L = d4 x∂µ ∆φ + Lg µν − (∂ ν φ) δxν ∂(∂µ φ) ∂(∂µ φ) 6 7 ∂L ∆φ − Θµν δxν , = d4 x∂µ ∂(∂µ φ)
4
µ
4
wobei partielle Integration, die Beziehung (2.130) und der Energie-ImpulsTensor (2.129) benutzt wurden. Betrachten wir nun infinitesimale Transformationen der Art20 δxν = Xνa (x)δ a , ∆φ = Ψa (x)δ a , mit einer Matrix X und einem Vektor Ψ sowie den infinitesimalen Parametern δ a . Dann folgt aus der Invarianzforderung der Wirkung und der Annahme, daß das transformierte Feld der Lagrange-Gleichung (2.128) gen¨ ugt, der Stromerhaltungssatz ∂µ jaµ = 0 ⇐⇒ ∂0 ja0 = −∇j a , jaµ =
∂L Ψa − Θµν Xνa , ∂(∂µ φ)
wobei jaµ f¨ ur jeden Index a einen sog. Noether-Strom darstellt. Desweiteren liefert die Integration dieser Beziehung u aumliches ¨ber ein hinreichend großes r¨ Volumen zu jedem Noether-Strom einen entsprechenden Ladungserhaltungssatz: 1 d 3 0 3 d xja = − d x∇j a = − dF j a = 0 c dt =⇒ Qa = d3 xja0 = const .
Satz 2.30: Noether-Theorem Aus der Invarianz der Wirkung S = mationen 20
.
d4 xL(φ, ∂µ φ, x) unter den Transfor-
In Anwesenheit mehrerer Felder ist die zweite Beziehung auf ∆φi = Ψia δa zu erweitern.
230
2. Elektrodynamik
xµ −→ xµ = xµ + δxµ
,
δxν = Xνa (x)δ a
φ(x) −→ φ (x ) = φ(x) + ∆φ(x) , ∆φ(x) = Ψa (x)δ a folgt die Erhaltung der Noether-Str¨ome jaµ =
∂L Ψa − Θµν Xνa , ∂µ jaµ = 0 ∂(∂µ φ)
sowie der Ladungen d Qa = 0 . Qa = d3 xja0 , dt Als Beispiel dieses Satzes betrachte man eine Transformation, die den Ursprung der Zeit und des Ortes verschiebt: Xνa = δνa , Ψa = 0 =⇒ δxν = ν , ∆φ = 0 . Hieraus ergibt sich sofort jaµ = −Θaµ , Θa0 d3 x = const . . Nun wissen wir aus unser vorherigen Diskussion, daß Θν0 d3 x der Viererimpuls des Feldes ist. Dies bedeutet: Die Invarianz des Wirkungsintegrals unter Raum- und Zeittranslationen f¨ uhrt zur Erhaltung des Impulses und der Energie des elektromagnetischen Feldes. Dieses Resultat ist uns bereits aus der klassischen Mechanik wohlvertraut. Auf ¨ahnliche Weise folgen die Erhaltung des Drehimpulses und der Schwerpunktsatz aus der Invarianz der Wirkung unter Rotationen von xµ bzw. unter Verschiebung von xµ mit konstanter Geschwindigkeit. 2.8.4 Interne Symmetrien und Eichprinzip Die 10 klassischen Erhaltungss¨atze ergeben sich aus der Invarianz der Wirkung unter Transformationen, die Raum und Zeit betreffen. Hat man es mit mehr als einer Feldkomponente zu tun, dann sind neben den Raum-ZeitSymmetrien zus¨atzliche Symmetrien unter internen Transformationen mit δxµ = 0 m¨ oglich (interne Symmetrien). In diesem Fall ist die Invarianz der Wirkung gleichbedeutend mit der Invarianz der Lagrange-Dichte, bis auf eine etwaige totale Divergenz. Als einfaches Beispiel betrachten wir im folgenden ein zweikomponentiges Feld und diskutieren die Invarianz der Lagrange-Dichte unter Rotationen der zwei Komponenten. Dabei beginnen wir mit einer globalen Eichtransformation, bei der beide Feldkomponenten an allen Orten der gleichen Transformation unterliegen. Im Anschluß diskutieren wir die Implikationen, die sich
2.8 Lagrange-Formalismus in der Elektrodynamik
231
ergeben, falls wir die Invarianz der Theorie unter lokalen Eichtransformationen fordern. Dies f¨ uhrt auf das f¨ ur die Hochenergiephysik so wichtige Prinzip der lokalen Eichinvarianz. Globale Eichinvarianz. Als Ausgangspunkt unserer Diskussion w¨ ahlen wir die Lagrange-Dichte L = (∂µ φ)(∂ µ φ∗ ) − m2 φφ∗ ,
(2.131)
die von den zweikomponentigen Skalarfeldern 1 1 φ = √ (φ1 + iφ2 ) , φ∗ = √ (φ1 − iφ2 ) 2 2 abh¨ angt. Sie beschreibt z.B. die relativistische Bewegung eines freien Elektrons mit zwei inneren Zust¨ anden (Spin up und Spin down). Die LagrangeGleichungen f¨ uhren auf die Klein-Gordon-Gleichungen (∂µ ∂ µ + m2 )φ = 0 , (∂µ ∂ µ + m2 )φ∗ = 0 , welche relativistische Verallgemeinerungen der nichtrelativistischen Schr¨ odinger-Gleichung sind. Neben der o.g. Raum-Zeit-Symmetrie besitzt die Lagrange-Dichte (2.131) eine zus¨ atzliche Symmetrie: Sie ist invariant unter der internen globalen Transformation φ(x) −→ φ (x) = e−iqΛ φ(x) ≈ φ(x)(1 − iqΛ) , δxµ = 0 , φ∗ (x) −→ φ∗ (x) = eiqΛ φ∗ (x) ≈ φ∗ (x)(1 + iqΛ) wobei q und Λ reelle Konstanten bezeichnen. In obiger Notation haben wir Xνa = 0 , Ψ = −iqφ , Ψ ∗ = iqφ∗ , δ = Λ , woraus der zugeh¨ orige erhaltene Noether-Strom jµ =
∂L ∂L Ψ+ Ψ ∗ = iq(φ∗ ∂ µ φ − φ∂ µ φ∗ ) ∂(∂µ φ) ∂(∂µ φ∗ )
folgt. Lokale Eichinvarianz. Als n¨ achstes wollen wir untersuchen, was passiert, wenn wir fordern, daß unsere Theorie auch dann invariant ist, wenn wir statt der globalen Eichtransformation eine lokale Eichtransformation ausf¨ uhren. Zu diesem Zweck ersetzen wir die Konstante Λ durch eine Funktion Λ(x). Mit φ (x) = [1 − iqΛ(x)]φ(x) , φ∗ (x) = [1 + iqΛ(x)]φ∗ (x) und ∂µ φ = (1 − iqΛ)∂µ φ − iqφ∂µ Λ , ∂ µ φ∗ = (1 + iqΛ)∂ µ φ∗ + iqφ∗ ∂ µ Λ sehen wir, daß sich jetzt die Terme ∂µ φ und ∂ µ φ∗ anders transformieren als φ und φ∗ selbst. Als Konsequenz kann die Lagrange-Dichte (2.131) nicht mehr unter dieser Transformation invariant sein. Einsetzen und Ausnutzen
232
2. Elektrodynamik
¨ der Lagrange-Gleichungen f¨ ur φ und φ∗ ergibt f¨ ur die Anderung der LagrangeDichte ∂L ∂L φ − iq φ∂µ Λ − (φ → φ∗ ) . δL = −iqΛ∂µ ∂(∂µ φ) ∂(∂µ φ) ¨ Der erste Term ist eine totale Divergenz, die zu keiner Anderung der Wirkung f¨ uhrt. Somit verbleibt δL = −iq [φ(∂ µ φ∗ )∂µ Λ − φ∗ (∂ µ φ)∂µ Λ] = j µ ∂µ Λ . Es gibt nun aber einen Weg, die lokale Eichinvarianz der Theorie zu retten, indem man n¨ amlich zwei weitere Terme L1 = −j µ Aµ = −iq(φ∗ ∂ µ φ − φ∂ µ φ∗ )Aµ L2 = q 2 Aµ Aµ φ∗ φ zu L hinzuf¨ ugt und eine Vorschrift definiert, wie sich der Vierervektor Aµ unter der lokalen Eichtransformation verh¨alt: Aµ (x) −→ Aµ (x) = Aµ (x) + ∂µ Λ(x) . Mit diesen Vereinbarungen findet man wie gew¨ unscht δL + δL1 + δL2 = 0 . Wir sehen also, daß die Eichinvarianz der Theorie nur dann gew¨ahrleistet wird, falls wir den Strom j µ an ein neues Feld Aµ koppeln. Die St¨arke der Kopplung ist durch die Kopplungskonstante q gegeben, die man mit der Ladung des Feldes φ identifiziert. Unsere Theorie wird schließlich vervollst¨ andigt, indem wir auch f¨ ur das Feld Aµ einen kinetischen, quadratischen Term zulassen. Von diesem m¨ ussen wir dann allerdings wieder lokale Eichinvarianz fordern. Aus unseren bisherigen Betrachtungen wissen wir, daß 1 Fµν F µν , Fµν = ∂µ Aν − ∂ν Aµ 16π diese Forderung erf¨ ullt. Wir erhalten somit insgesamt die lokal eichinvariante Lagrange-Dichte L3 = −
1 Fµν F µν . (2.132) 16π Zusammenfassend ergibt sich folgendes bemerkenswertes Resultat: Um die globale Eichinvarianz unserer Theorie auf lokale Eichinvarianz zu erweitern, hat man ein elektromagnetisches Feld Aµ , das sog. Eichpotential, mit einem bestimmten Transformationsverhalten einzuf¨ uhren, welches an den NoetherStrom j µ koppelt. Dies ist der Inhalt des Eichprinzips. Durch Hinzuf¨ ugen eines in Aµ quadratischen Terms werden die Aµ selbst zu dynamischen Objekten der Theorie. Unter Einf¨ uhrung der eichkovarianten Ableitungen L = (∂µ + iqAµ )φ(∂ µ − iqAµ )φ∗ − m2 φ∗ φ −
Dµ = ∂µ + iqAµ , D∗µ = ∂ µ − iqAµ ,
2.8 Lagrange-Formalismus in der Elektrodynamik
233
mit Dµ φ = (1 − iqΛ)Dµ φ , D∗µ φ∗ = (1 + iqΛ)Dµ φ∗ , l¨aßt sich (2.132) in der Weise 1 Fµν F µν 16π schreiben. Die Lagrange-Gleichungen f¨ ur die Felder Aµ f¨ uhren auf L = (Dµ φ)(D∗µ φ∗ ) − m2 φ∗ φ −
∂ν F µν = −4πj µ , wobei j µ = iq(φ∗ Dµ φ − φD∗µ φ∗ ) der erhaltene Noether-Strom der lokal eichinvarianten Theorie ist. Man beachte schließlich, daß das Hinzuf¨ ugen eines Terms der Art m2 Aµ Aµ die Eichinvarianz der Theorie verletzt. Hieraus schließen wir, daß das elektromagnetische Eichfeld masselos ist. Satz 2.31: Eichprinzip Die Lagrange-Dichte eines komplexen skalaren Feldes L = (∂µ φ)(∂ µ φ∗ ) − m2 φ∗ φ ist nur dann invariant unter den lokalen Eichtransformationen φ (x) = e−iqΛ(x) φ(x) , φ∗ (x) = eiqΛ(x) φ∗ (x) , falls • ein Vektorfeld Aµ (x) eingef¨ uhrt wird, das sich gem¨ aß Aµ −→ Aµ = Aµ + ∂µ Λ transformiert, und • die Ableitung ∂µ durch die eichkovariante Ableitung Dµ = ∂µ + iqAµ
bzw.
Dµ∗ = ∂µ − iqAµ
ersetzt wird. Die lokal eichinvariante Lagrange-Dichte lautet dann 1 Fµν F µν . 16π Aus der Forderung der lokalen Eichinvarianz folgt die Existenz des elektromagnetischen Feldes. L = Dµ φD∗µ φ∗ − m2 φ∗ φ −
234
2. Elektrodynamik
Zusammenfassung • Die Dynamik eines geladenen Teilchens im elektromagnetischen Feld l¨aßt sich mit Hilfe einer Lagrange- bzw. einer Hamilton-Funktion beschreiben. • Man kann den Lagrange-Formalismus (mit einigen wenigen Freiheitsgraden) auf kontinuierliche Systeme (mit unendlich vielen Freiheitsgraden) verallgemeinern, indem die Lagrange-Funktion durch eine LagrangeDichte ersetzt wird. Mit ihrer Hilfe gelangt man zu LagrangeGleichungen, die analog zur Punktmechanik die Dynamik kontinuierlicher Systeme beschreiben. Im Falle der Elektrodynamik erh¨alt man aus ihnen wieder die Maxwellschen Gleichungen. • Die Invarianz der Wirkung unter Transformationen des Raum-ZeitVierervektors und der Felder f¨ uhrt auf Erhaltungss¨atze. Dies ist das Noether-Theorem. Es gilt auch f¨ ur interne Symmetrien. • Die Forderung nach Invarianz einer Lagrange-Theorie unter lokalen Eichtransformationen f¨ uhrt auf die Existenz von Eichfeldern.
Anwendungen 35. Lagrange-Gleichungen. Man berechne die Lagrangeschen Bewegungsgleichungen, die sich aus der Lagrange-Dichte des elektromagnetischen Feldes sowie aus der Lagrange-Dichte eines reellen skalaren Teilchens ergeben. L¨ osung. Die Lagrange-Dichte des elektromagnetischen Feldes ist 1 1 Fαβ F αβ − Aα jα L=− 16π c 1 1 γ ρ gαγ gβρ (∂ A − ∂ ρ Aγ )(∂ α Aβ − ∂ β Aα ) − Aα jα . =− 16π c Daraus berechnen wir ∂L 1 = − jν ∂Aν c und 1 ∂L =− gαγ gβρ (δµγ δνρ − δµρ δνγ )F αβ + (δµα δνβ − δµβ δνα )F γρ µ ν ∂(∂ A ) 16π 1 1 (Fµν − Fνµ + Fµν − Fνµ ) = − Fµν . =− 16π 4π Somit folgt 4π jν . ∂ µ Fµν = c Die Lagrange-Dichte des reellen skalaren Feldes ist
Anwendungen
L = (∂α φ)(∂ α φ) − m2 φ2 = g αβ (∂α φ)(∂β φ) − m2 φ2 . Damit berechnen wir ∂L = −2m2 φ ∂φ und ∂L = g αβ (δαµ ∂β φ + δβµ ∂α φ) = 2∂ µ φ . ∂(∂µ φ) Es folgt (∂µ ∂ µ + m2 )φ = 0 .
235
3. Quantenmechanik
Die Quantenmechanik handelt von der Beschreibung mikroskopischer Ph¨ anomene auf atomarer L¨ angenskala (∼ 10−10 m). Sie wurde durch Max Planck, Niels Bohr, Erwin Schr¨ odinger, Werner Heisenberg und andere Physiker in den zwanziger Jahren des 20. Jahrhunderts entwickelt, als man erkannte, daß sich die Naturprinzipien des Mikrokosmos fundamental von denen der makroskopischen Welt unterscheiden. Zwei wesentliche Merkmale im Bereich mikroskopischer Naturerscheinungen sind zum einen, daß es dort keine strikte Zweiteilung zwischen wellenartigen und korpuskularen Ph¨ anomenen gibt. Je nach experimenteller Anordnung lassen sich Teilchen wie etwa das Elektron als Korpuskel oder als Welle interpretieren. Zum anderen k¨ onnen gewisse dynamische Gr¨ oßen, z.B. die Energie oder der Drehimpuls eines gebundenen Systems, nicht jeden beliebigen Wert annehmen sondern sind gequantelt, d.h. auf bestimmte diskrete Vielfache einer Konstanten festgelegt. Durch Abkehr von klassischen physikalischen Vorstellungen des ausgehenden 19. Jahrhunderts und Einf¨ uhren eines neuen mathematischen Konzeptes ist die Quantentheorie in der Lage, diesen Aspekten der Mikrowelt Rechnung zu tragen und quantitative Vorhersagen zu machen, die im Experiment best¨ atigt werden. Da sie eine nichtrelativistische Theorie ist – sie wurde erst in den dreißiger Jahren durch Paul Dirac zur relativistischen Quantentheorie erweitert – beschr¨ankt sich ihr G¨ ultigkeitsbereich auf kleine Geschwindigkeiten im Vergleich zur Lichtgeschwindigkeit bzw. auf kleine Bindungsenergien im Vergleich zu den Konstituentenmassen gebundener Systeme. Trotzdem bildet sie auch heute noch die physikalisch-mathematische Grundlage f¨ ur die Entwicklung der Atom- und Elementarteilchenphysik bis hin zu modernen Quantenfeldtheorien, welche die Wechselwirkung elementarer Teilchen durch virtuelle Austauschprozesse von Feldquanten beschreiben. Im Gegensatz zu allen klassischen korpuskularen Theorien ist die Quantenmechanik eine probabilistische Theorie, die lediglich Wahrscheinlichkeitsaussagen u ¨ber physikalische Systeme macht. Jeder Zustand wird durch einen abstrakten Vektor im Hilbert-Raum repr¨ asentiert, der die Wahrscheinlichkeitsamplituden f¨ ur alle m¨ oglichen Zustandskonfigurationen enth¨ alt. Die zeitliche Entwicklung dieses Vektors ist allerdings streng deterministisch und folgt einer partiellen Differentialgleichung, der sog. Schr¨ odinger-Gleichung. Sie stellt die Grundgleichung der Quantenmechanik dar. Die Quantisierung
238
3. Quantenmechanik
der Theorie kommt im wesentlichen dadurch zustande, daß den klassischen dynamischen Gr¨oßen wie Energie, Impuls etc. Operatoren zugeordnet werden. Eine zentrale Folge des probabilistischen Konzeptes ist, daß sich die quantenmechanische Beschreibung von Messungen grundlegend von der klassischen unterscheidet und mit dem Eigenwertproblem hermitescher Operatoren eng verkn¨ upft ist. uhren wir den von Paul Dirac entIm ersten Abschnitt dieses Kapitels f¨ wickelten mathematischen Formalismus ein, der im wesentlichen aus Gebieten der linearen Algebra mit einer neuartigen Notation besteht. Wir besprechen insbesondere die Darstellung quantenmechanischer Zust¨ande durch Bra- und Ketvektoren sowie das Eigenwertproblem linearer Operatoren. Abschnitt 3.2 besch¨aftigt sich mit den physikalischen Grundlagen der Quantentheorie. Es werden die quantenmechanischen Postulate vorgestellt und in einem allgemeinen Rahmen diskutiert. Dabei werden wir sehen, daß sich die Quantentheorie in unendlich vielen a ¨quivalenten Bildern abstrakt beschreiben l¨ aßt, die u ber unit¨ a re Transformationen miteinander verbunden ¨ sind. W¨ ahlt man innerhalb eines Bildes eine spezielle Basis, dann liefert dies eine konkrete Darstellung der Theorie. Innerhalb eines Bildes gelangt man von einer Darstellung zur anderen ebenfalls mittels unit¨arer Transformationen. Als erste konkrete Anwendungsbeispiele betrachten wir in Abschn. 3.3 eindimensionale Systeme, f¨ ur die man die Schr¨odinger-Gleichung exakt l¨osen kann und anhand derer sich einige typische Quanteneffekte studieren lassen. Wir begegnen auch hier dem aus der Elektrodynamik bekannten Effekt des Zerfließen eines Wellenpaketes, der hier allerdings anders zu interpretieren ist. In Abschn. 3.4 diskutieren wir den Drehimpulsoperator, der in der dreidimensionalen Quantenmechanik eine u ¨beraus wichtige Rolle spielt. Er ist ganz allgemein u ¨ber bestimmte Kommutatorrelationen definiert; insofern stellt das quantenmechanische Pendant zum klassischen Drehimpuls lediglich einen Spezialfall dar. Ein weiterer Drehimpuls ist der Spin, den man sich als eine Art Eigenrotation von Teilchen vorstellen kann. Ein wichtiger Punkt f¨ ur nachfolgende Er¨ orterungen ist die Addition bzw. Kopplung quantenmechanischer Drehimpulse. Der Abschn. 3.5 ist dreidimensionalen Quantensystemen mit zentraler Symmetrie gewidmet. Bei solchen Systemen l¨ aßt sich der Winkelanteil der Schr¨ odinger-Gleichung vollst¨andig separieren und f¨ uhrt auf Eigenl¨osungen des Drehimpulsoperators. Es verbleibt eine radiale Schr¨odinger-Gleichung, welche f¨ ur einige Systeme, u.a. f¨ ur das naive Wasserstoffatom, gel¨ost wird. Abschnitt 3.6 besch¨aftigt sich mit quantenmechanischen Implikationen elektromagnetischer Wechselwirkungen. Wir zeigen, wie man aus den Gesetzen der Elektrodynamik die quantenmechanische Beschreibung der Elektronbewegung in einem ¨außeren elektromagnetischen Feld erh¨alt. Weitet man das elektrodynamische Eichprinzip auf die Quantenmechanik aus, dann erge-
3.1 Mathematische Grundlagen der Quantenmechanik
239
ben sich interessante physikalische Konsequenzen, die sich in der Tat experimentell beobachten lassen. Wir besprechen desweiteren das Stern-GerlachExperiment und liefern somit die physikalische Begr¨ undung des o.g. Spinfreiheitsgrades. Da sich die meisten Quantensysteme analytisch nicht exakt l¨ osen lassen, muß man auf bestimmte N¨ aherungsverfahren zur¨ uckgreifen. Im Falle statiangige St¨ orungstheorie scher gebundener Systeme bietet sich die zeitunabh¨ an, die wir in Abschn. 3.7 besprechen. Sie liefert insbesondere den ad¨ aquaten Rahmen zu einer realistischeren Beschreibung des Wasserstoffatoms, in der die Kopplung zwischen Bahndrehimpuls und Spin des Elektrons (Feinstrukturaufspaltung) sowie die Kopplung zwischen Elektron- und Kernspin (Hyperfeinstrukturaufspaltung) ber¨ ucksichtigt ist. ¨ Abschnitt 3.8 handelt von atomaren Uberg¨ angen. Sie sind eine Folge der Wechselwirkung zwischen Atomen und elektromagnetischer Strahlung (Strahlungsemission bzw. -absorption), bei der die H¨ ullenelektronen ihren Quantenzustand wechseln. Da auch diese Probleme i.a. nicht exakt l¨ osbar und u berdies zeitabh¨ a ngig sind, verwendet man hierbei die zeitabh¨ a ngige ¨ St¨orungstheorie. Mit Hilfe dieser Methode berechnen wir die Matrixelemente ¨ ¨ (Ubergangsraten) f¨ ur verschiedene atomare Uberg¨ ange in der Dipoln¨ aherung. Im Gegensatz zur klassischen Mechanik, in der selbst identische Teilchen anhand ihrer verschiedenen Trajektorien im Prinzip immer unterschieden werden k¨ onnen, gibt es in der Quantenmechanik neben unterscheidbaren Teilchen auch identische Teilchen. Die hieraus folgenden Implikationen f¨ ur quantenmechanische Viel-Teilchensysteme sind Gegenstand des Abschn. 3.9. Der letzte Abschnitt besch¨ aftigt sich mit der Streuung von Teilchen. Die Idee hierbei ist, den Streuvorgang durch eine asymptotische Wellenfunktion zu beschreiben, die in einen einfallenden und einen gestreuten Anteil aufgeteilt wird. Aus der Amplitude des gestreuten Teils l¨ aßt sich dann der differentielle Wirkungsquerschnitt des Streuprozesses leicht berechnen.
3.1 Mathematische Grundlagen der Quantenmechanik In diesem Abschnitt werden einige mathematische Grundkonzepte der Quantenmechanik vorgestellt. Es sind dies im wesentlichen Elemente aus der Linearen Algebra, die dem Leser bereits vertraut sein sollten. Dieser Abschnitt wiederholt daher nur das Wesentliche und f¨ uhrt dabei zugleich die von Dirac eingef¨ uhrte Schreibweise der Bras und Kets ein. Neben dem zentralen Begriff des Hilbert-Raumes diskutieren wir insbesondere lineare Operatoren und ihre Eigenwertprobleme. Es schließen sich Betrachtungen u ¨ber die Beschreibung von Vektoren und Operatoren in bestimmten Darstellungen (Basissystemen) an.
240
3. Quantenmechanik
3.1.1 Hilbert-Raum Im allgemeinen wird jedem quantenmechanischen Zustand eine bestimmte Art von Vektor zugeordnet, der nach der Diracschen Notation Ketvektor oder Ket genannt und durch das Symbol | · gekennzeichnet wird. Um verschiedene Kets voneinander zu unterscheiden, setzt man in dieses Symbol ein oder mehrere Indizes ein, die diskrete oder kontinuierliche Werte annehmen k¨onnen. Die Gesamtheit der Kets bilden einen Vektorraum, den sog. Hilbert-Raum. Er erlaubt es, die Quantenmechanik auf allgemeine, von bestimmten Darstellungen unabh¨ angige Weise zu formulieren. Definition: Hilbert-Raum H Der Hilbert-Raum H ist ein linearer Vektorraum u ¨ber dem K¨orper der komplexen Zahlen mit einem hermiteschen Skalarprodukt. Auf dem HilbertRaum sind zwei Verkn¨ upfungen definiert: • Mit | v ∈ H und λ ∈ C ist auch λ | v ein Element des Hilbert-Raumes. • Aus | v , | u ∈ H folgt | v + | u ∈ H
(Superpositionsprinzip).
Metrik des Hilbert-Raumes Das Skalarprodukt des Kets | u mit dem Ket | v ist die i.a. komplexe Zahl v||u = v| u. Es besitzt folgende Eigenschaften: • Das Skalarprodukt von | v mit | u ist komplex konjugiert zum Skalarprodukt von | u mit | v : ∗
v| u = u| v .
(3.1)
• Jeder Vektor hat ein reelles, positives Normquadrat: u| u ≥ 0
(= 0 genau dann, wenn | u = 0) .
• Das Skalarprodukt v| u ist linear in | u und antilinear in | v : v| (λ1 | u1 + λ2 | u2 ) = λ1 v| u1 + λ2 v| u2 ( v1 | λ1 + v2 | λ2 ) | u = λ∗1 v1 | u + λ∗2 v2 | u , λ1,2 ∈ C . Hieraus folgt die Schwarzsche Ungleichung | v| u |2 ≤ v| v u| u . Das Gleichheitszeichen gilt genau dann, wenn | v und | u proportional zueinander sind, d.h. | v = λ | u . In der Quantenmechanik hat man es je nach physikalischer Fragestellung mit endlich- oder unendlichdimensionalen Hilbert-R¨aumen zu tun. Wir setzen im weiteren Verlauf stets voraus, daß die betrachten R¨aume bez¨ uglich der durch das Skalarprodukt gegebenen Norm | u| u | vollst¨andig sind, ohne dies jedesmal explizit zu zeigen.
3.1 Mathematische Grundlagen der Quantenmechanik
241
Dualer Raum. Aus der linearen Algebra ist bekannt, daß man jedem Vektorraum einen dualen Vektorraum zuordnen kann. Seine Elemente sind alle linearen Funktionen χ(| u ) der Kets | u und besitzen die f¨ ur Vektoren charakteristische Superpositionseigenschaft. Sie werden Bravektoren oder einfach Bras genannt und durch das Symbol ·| dargestellt. Das Skalarprodukt zweier Ketvektoren | v und | u l¨ aßt sich demnach interpretieren als der Wert der linearen Funktion v, angewandt auf den Ket | u : v| u = v(| u ) . Zwischen den Elementen des Ket- und des Bra-Raums existiert eine eindeutige antilineare Zuordnung, die sog. Konjugation: | u = i| λ∗i . (3.2) λi | i ←→ u| = i
i
F¨ ur das physikalische Verst¨ andnis der folgenden Abschnitte ist es ausreichend, das Skalarprodukt als Abbildung zweier Vektoren des Hilbert-Raumes zu betrachten: ·| · : H × H → C . Definition: Orthonormalbasis, Projektionsoperator • Zwei Vektoren | n , | m heißen orthonormal, falls n| m = δnm . • Eine minimale Menge von orthonormalen Vektoren {| n , n = 1, 2, . . .} heißt Orthonormalbasis von einem Teilraum von H, wenn sich jeder Vektor | u dieses Raumes als Linearkombination in der Weise | u = | n cn , cn = n| u n
=
| n n| u
n
= P {n} | u , P {n} =
| n n| = 1
n
darstellen l¨aßt. Entsprechendes gilt f¨ ur Bravektoren: v| = v| n n| = v| P {n} . n
P {n} definiert den Einsoperator. Er besteht aus der Summe der Projektionsoperatoren P n = | n n| , die jeweils auf den Basisvektor | n projizieren. F¨ ur das Skalarprodukt zweier Vektoren | v , | u l¨ aßt sich mit Hilfe des Einsoperators schreiben: v| u = v| P {n} P {n} | u = v| n n| m m| u =
n
n,m
v| n n| u .
242
3. Quantenmechanik
Hieraus folgt die Vollst¨ andigkeitsrelation u| u = | n| u |2 . n
Mit Hilfe dieser Beziehung kann man explizit pr¨ ufen, ob eine Menge von orthonormalen Vektoren eine Basis darstellt. Uneigentliche Hilbert-Vektoren. Wie wir sp¨ater sehen werden, ist es notwendig, auch Vektoren einzubeziehen, die keine endliche Norm besitzen und von mindestens einem kontinuierlichen Index abh¨angen. Solche uneigentlichen Hilbert-Vektoren geh¨oren in voller Strenge nicht zu H. Aber Linearkombinationen der Art ν2 | ω = λ(ν) | ν dν ν1
geh¨ oren dazu und erf¨ ullen alle Eigenschaften von Hilbert-Vektoren. F¨ ur uneigentliche Hilbert-Vektoren sind obige Begriffe und Beziehungen in folgender Weise zu erg¨ anzen: Definition: Orthonormalbasis, Projektionsoperator (im kontinuierlichen Fall) • Zwei uneigentliche Hilbert-Vektoren | µ , | ν heißen orthonormal, falls µ| ν = δ(µ − ν). • Eine minimale Menge von orthonormalen uneigentlichen HilbertVektoren {| ν , ν ∈ R} heißt Orthonormalbasis von einem Teilraum von H, wenn sich jeder eigentliche Vektor | u dieses Teilraums als Integral u ¨ber ν in der Weise | u = dν | ν λ(ν) , λ(ν) = ν| u = dν | ν ν| u = P {ν} | u , P {ν} = dν | ν ν| = 1 darstellen l¨ aßt. Mit diesen Definitionen ergibt sich in v¨olliger Analogie zum endlichen, diskreten Fall f¨ ur das Skalarprodukt v| u v| u = v| P {ν} P {ν} | u = dν dν v| ν ν| ν ν | u = dν dν v| ν δ(ν − ν ) ν| ν ν | u
3.1 Mathematische Grundlagen der Quantenmechanik
243
=
dν v| ν ν| u .
Die Vollst¨ andigkeitsrelation lautet hier u| u = dν| ν| u |2 . Kombinierte Systeme. Im Zusammenhang mit N -Teilchensystemen werden wir die Kombination von Teilchen aus verschiedenen Vektorr¨ aumen otigen. Dazu definieren wir: ben¨ Definition: Tensorprodukt zweier Vektorr¨ aume: (1) = = ∈ 1 , u(2) ∈ 2 . Dann u Seien 1 und 2 zwei (2)a=ume und (1) =Vektorr¨ = ⊗u = u(1) ; u(2) den Tensorraum 1 ⊗ 2 auf, spannen die Kets u der per definitionem folgende Eigenschaften besitzt: • dim( 1 ⊗ 2 ) = dim( 1 ) · dim( 2 )
(sofern 1 und 2 endlichdimensional).
= = • Kommutativit¨ at: u(1) ; u(2) = u(2) ; u(1) . • Distributivit¨ at bzgl. der Addition: > > > (1) = λ v (1) + µ w(1) u > > > =⇒ u(1) ; u(2) = λ v (1) ; u(2) + µ w(1) ; u(2) und
> > > (2) = λ v (2) + µ w(2) u > > > =⇒ u(1) ; u(2) = λ u(1) ; v (2) + µ u(1) ; w(2) .
Seien A(1) und A(2) Operatoren (siehe n¨ achster Unterabschnitt) auf den Vektorr¨ aumen 1 bzw. 2 . Dann gilt = = = = A(1) u(1) = v (1) =⇒ A(1) u(1) ; u(2) = v (1) ; u(2) = = = = A(2) u(2) = v (2) =⇒ A(2) u(1) ; u(2) = u(1) ; v (2) . Hieraus folgt f¨ ur den Kommutator (siehe Seite 245) [A(1) , A(2) ] = A(1) A(2) − A(2) A(1) = 0 , d.h. die Operatoren auf 1 kommutieren mit denen auf 2 . Entsprechendes gilt f¨ ur den dualen Tensorraum.
244
3. Quantenmechanik
3.1.2 Lineare Operatoren1 Lineare Operatoren spielen in der Quantenmechanik eine zentrale Rolle, da sie im engen Zusammenhang mit physikalischen Gr¨oßen stehen. Zudem werden Ver¨ anderungen an Zust¨anden, insbesondere solche, die durch Messungen hervorgerufen werden, durch lineare Operationen dargestellt. Definition: Linearer Operator A Ein linearer Operator A ordnet jedem Ket (Bra) eines Teilraums des Hilbert-Raumes H, dem Definitionsbereich, einen Ket (Bra) aus einem Teilraum von H, dem Wertebereich, zu: A | u = | v ,
u | A = v | .
Er besitzt die Eigenschaften A(λ1 | u1 + λ2 | u2 ) = λ1 A | u1 + λ2 A | u2 ( u1 | λ1 + u2 | λ2 )A = ( u1 | A)λ1 + ( u2 | A)λ2 . Zwei Operatoren sind identisch, wenn sie denselben Definitionsbereich besitzen und f¨ ur jeden Zustand auf denselben Zustand des Wertebereiches abbilden. Demnach ist u(A | v ) eine lineare Funktion von | v , da u und A linear sind. Daraus folgt u(A | v ) = ( u| A) | v = u| A |v . Die Reihenfolge der Wirkung von u und A auf | v spielt somit keine Rolle, und man kann etwaige Klammern weglassen. Die wichtigsten algebraischen Operationen mit linearen Operatoren sind: • Multiplikation mit einer Konstante c: (cA) | u = c(A | u ) , u | (cA) = ( u | A)c . • Operatorsumme S = A + B: S | u = A | u + B | u , u | S = u | A + u | B . • Operatorprodukt P = AB: P | u = A(B | u ) , u | P = ( u | A)B . Hierbei muß der Definitionsbereich von A nat¨ urlich den Wertebereich von B umfassen. 1
Zur Verdeutlichung und um Verwechslungen mit klassischen Gr¨ oßen zu vermeiden, werden quantenmechanische Operatoren durchweg fett und mit Großbuchstaben dargestellt. Dies gilt sowohl f¨ ur Vektoroperatoren (etwa den Drehimpuls L) als auch f¨ ur skalare Operatoren (z.B. die einzelnen Komponenten des Drehimpulses, Lx , Ly , Lz ).
3.1 Mathematische Grundlagen der Quantenmechanik
245
Kommutator. Im Gegensatz zur Summe ist das Produkt zweier linearer Operatoren A und B i.a. nicht kommutativ, d.h. der Kommutator [A, B] = AB − BA ist i.a. von Null verschieden. Einige n¨ utzliche Rechenregeln, die sich aus der Definition des Kommutators ergeben, sind [A, B] = −[B, A] [A, B + C] = [A, B] + [A, C] [A, BC] = [A, B]C + B[A, C] 0 = [A, [B, C]] + [B, [C, A]] + [C, [A, B]] [A, B n ] =
n−1
B s [A, B]B n−s−1 .
s=0
Hermitesche und unit¨ are Operatoren. Aus der eindeutigen Zuordnung (3.2) zwischen Bra- und Ketvektoren l¨ aßt sich eine analoge Beziehung zwischen linearen Operatoren des Hilbert-Raumes und des zu ihm dualen Raumes finden, die sog. Adjunktion: | v = A | u ←→ v| = u| A† . Diese Zuordnung definiert den zu A hermitesch konjugierten oder adjungierten Operator A† . Aus der Definition des Skalarproduktes (3.1) ergibt sich die Konjugationsbeziehung ? =∗ u| A |v = v| A† |u , woraus sofort folgt: (A† )† = A
, (cA)† = c∗ A† , c ∈ C ,
(A + B)† = A† + B † , (AB)† = B † A† . Die Bildung des Adjungierten bei Operatoren entspricht der Konjugation zwischen Bra- und Ketvektoren und der Bildung des komplex Konjugierten bei Zahlen. Definition: Hermitescher, antihermitescher Operator • Der lineare Operator H heißt hermitesch, wenn er gleich seinem Adjungierten ist: H = H † . • Der lineare Operator I ist antihermitesch, wenn er gleich dem Negativen seines Adjungierten ist. I = −I † . Hieraus ergeben sich folgende Eigenschaften: • Jeder lineare Operator A kann eindeutig als Summe eines hermiteschen und eines antihermiteschen Operators geschrieben werden:
246
3. Quantenmechanik
A = HA + IA , HA =
A + A† A − A† , IA = . 2 2
• Jede Linearkombination hermitescher Operatoren mit reellen Koeffizienten ist hermitesch. Eine weitere wichtige Klasse von Operatoren liefert die Definition: Unit¨ arer Operator Ein Operator U ist unit¨ ar, wenn er zu seinem Adjungierten invers ist: U U † = U †U = 1 . Es folgt unmittelbar: • Das Produkt zweier unit¨arer Operatoren ist ein unit¨arer Operator. • Unit¨ are Operatoren lassen das Skalarprodukt zweier Vektoren, auf die sie wirken, invariant. • Beschreibt U die infinitesimale unit¨are Transformation U = 1 + i F , | | 1 , dann gilt U U † = 1 = (1 + i F )(1 − i F † ) =⇒ F = F † , d.h. der Operator F ist hermitesch. • Ebenso folgt: Ist F hermitesch, dann ist eiF unit¨ar. 3.1.3 Eigenwertproblem Viele Probleme der Quantenmechanik lassen sich als Eigenwertprobleme formulieren. Definition: Eigenvektoren, Eigenwerte Sei A ein linearer Operator. Die i.a. komplexe Zahl a heißt Eigenwert von A und der Ket | u Eigenket oder Eigenzustand zu a, wenn A | u = a | u . Entsprechend ist u | Eigenbra zum Eigenwert a , falls u | A = u | a . Hieraus ergibt sich: • Ist | u Eigenket von A, dann ist jedes Vielfache c | u dieses Vektors Eigenket von A zum selben Eigenwert.
3.1 Mathematische Grundlagen der Quantenmechanik
247
• Existieren mehrere linear unabh¨ angige Eigenkets zum selben Eigenwert a, so ist jede Linearkombination dieser Kets Eigenwert von A zu diesem Eigenwert. Das heißt die Menge der Eigenkets von A zu einem bestimmten Eigenwert a bildet einen Vektorraum, n¨ amlich den Unterraum zum Eigenwert a. Der Entartungsgrad des Eigenwertes a ist durch die Dimension des Unterraumes von a gegeben. • Jeder Eigenvektor von A zum Eigenwert a ist auch Eigenvektor von f (A) zum Eigenwert f (a): A | u = a | u =⇒ f (A) | u = f (a) | u . Dieselben Aussagen gelten auch f¨ ur die Eigenbras von A. Die Gesamtheit der Eigenwerte eines Operators heißt Eigenwertspektrum. Dem Eigenwertproblem hermitescher Operatoren kommt besondere Bedeutung zu, da wir physikalische Meßgr¨ oßen in der Quantenmechanik grunds¨atzlich mit hermiteschen Operatoren identifizieren k¨ onnen. Satz 3.1: Eigenwertproblem hermitescher Operatoren Ist A hermitesch auf dem Hilbert-Raum H, so gilt: 1. Das Ket- und Bra-Eigenwertspektrum ist identisch. 2. Alle Eigenwerte sind reell. 3. Jeder, zum Eigenket von A konjugierte Bravektor ist Eigenbra zum selben Eigenwert und umgekehrt. Mit anderen Worten, der Unterraum der Eigenbras zu einem bestimmten Eigenwert ist der Dualraum zum Unterraum der Eigenkets zum selben Eigenwert. 4. Eigenvektoren zu verschiedenen Eigenwerten sind orthogonal zueinander. Beweis. Zu 2. Ist A = A†
und A | u = a | u ,
dann folgt ∗
u| A |u = u| A |u = a u| u . Da u| u reell ist, ist es auch a. Analog wird der Beweis f¨ ur die Eigenwerte der Bravektoren gef¨ uhrt. Zu 1., 3. Da jeder Eigenwert reell ist, folgt aus A | u = a | u notwendigerweise u| A = u| a. Damit ergeben sich die Behauptungen. Zu 4. Sei A | u = a | u , A | v = b | v , a = b , dann ergibt skalare Multiplikation der ersten Gleichung mit v| und der zweiten Gleichung mit | u sowie anschließender Subtraktion beider Gleichungen (a − b) v| u = 0 =⇒ v| u = 0 .
248
3. Quantenmechanik
Kontinuierliches Spektrum. Bisher wurde vorausgesetzt, daß die Eigenvektoren zum Hilbert-Raum geh¨oren, bzw. daß das Eigenwertspektrum diskret ist. Im allgemeinen Fall besitzt das Spektrum jedoch neben einem diskreten auch einen kontinuierlichen Teil, dessen Eigenvektoren keine endliche Norm besitzen und folglich nicht zum Hilbert-Raum geh¨oren. Durch die Normierung solcher uneigentlichen Hilbert-Vektoren auf die δ-Funktion k¨onnen sie jedoch ohne Probleme in das Eigenwertproblem einbezogen werden. Alle Aussagen des letzten Satzes bleiben auch hierf¨ ur g¨ ultig. Observable und Vollst¨ andigkeit. Betrachten wir als Beispiel das folgende, sehr allgemein gehaltene Eigenwertspektrum eines hermiteschen Operators A: n, r ∈ A | nr = an | nr , A | ν, ρ, r = a(ν, ρ) | ν, ρ, r , ν, ρ ∈ R an , a(ν, ρ) ∈ R . Es besteht aus einem diskreten Anteil {an } und einem kontinuierlichen Anteil {a(ν, ρ)}. Die Eigenkets zum Eigenwert an sind | nr , w¨ahrend die Eigenkets zum Eigenwert a(ν, ρ) durch | ν, ρ, r gegeben sind. Die jeweilige Entartung ist durch den Laufindex r gegeben. Die Eigenvektoren lassen sich so normieren, daß folgende Orthonormalit¨atsrelationen erf¨ ullt sind: n, r| n , r = δnn δrr n, r| ν , ρ , r = 0 ν, ρ, r| ν , ρ , r = δ(ν − ν )δ(ρ − ρ )δrr . Spannen diese Vektoren den gesamten Raum auf, d.h. kann jeder Vektor mit endlicher Norm nach diesen Vektoren entwickelt werden (als Reihe oder Integral), so sagt man, daß sie ein vollst¨ andiges System bilden und daß der hermitesche Operator eine Observable ist. Daß dies der Fall ist, l¨aßt sich oftmals nur f¨ ur hermitesche Operatoren mit diskretem Spektrum relativ leicht zeigen. Der Beweis f¨ ur Operatoren mit gemischtem oder rein kontinuierlichem Spektrum ist dagegen i.a. recht aufwendig und kompliziert. Wir setzen im weiteren Verlauf die Vollst¨andigkeit des Eigenketsystems eines hermiteschen Operators im diskreten und kontinuierlichen Fall stets voraus. Der zu obigem Basissystem geh¨orende Einsoperator ist P = P {n,r} + P {ν,ρ,r} dν dρ | ν, ρ, r ν, ρ, r| , = | nr nr| + n,r
r
und die Entwicklung eines Kets | u lautet | u = P | u = dν dρ | ν, ρ, r ν, ρ, r| u . | nr nr| u + n,r
r
3.1 Mathematische Grundlagen der Quantenmechanik
249
F¨ ur das vorliegende Basissystem lautet die Vollst¨ andigkeitsrelation dν dρ| ν, ρ, r| u |2 . | nr| u |2 + u| u = n,r
r
Im folgenden Abschnitt werden wir Observable mit physikalischen Messungen identifizieren. Der folgende Satz ist deshalb besonders wichtig: Satz 3.2: Kommutierende Observable Zwei Observable A und B sind genau dann miteinander vertauschbar, wenn sie mindestens ein gemeinsames Orthonormalsystem besitzen. Beweis. Es sei {| n } ein vollst¨ andiges Orthonormalsystem von A mit A | n = an | n . Dann gilt A = P {n} AP {n} = | n n| A |n n | = | n an n| n,n
B = P {n} BP {n} =
n
| n n| B |n n | .
n,n
Es folgt AB =
| n an n| n n | B |n n |
n,n ,n
=
| n an n| B |n n |
n,n
BA =
| n n| B |n n | n an n |
n,n ,n
=
| n n| B |n an n | .
n,n
Aus [A, B]=0 ergibt sich n| B |n (an − an ) = 0 . Liegt keine Entartung vor (an = an f¨ ur n = n ) dann gilt n| B |n = 0 f¨ ur n = n ,
(3.3)
d.h. jeder Eigenvektor von A ist auch Eigenvektor von B. Falls aber Eigenwerte an entartet sind, kann man die Freiheit in der Wahl der Basisvektoren so ausnutzen, daß (3.3) erf¨ ullt ist. Damit ist die Vorw¨ artsrichtung bewiesen. Sind andererseits die | n auch Eigenvektoren von B, so gilt B | n = bn | n =⇒ n| B |n = bn δnn =⇒ [A, B] = 0 .
250
3. Quantenmechanik
3.1.4 Darstellung von Vektoren und linearen Operatoren Betrachten wir ein beliebiges vollst¨andiges, diskretes und nichtentartetes Eigenwertspektrum {| n } eines hermiteschen Operators Q: Q | n = qn | n , m| n = δmn , P Q = | n n| = 1 . n
Dann folgt f¨ ur die Entwicklung beliebiger Kets, Bras und Operatoren des Hilbert-Raumes nach den Eigenkets {| n } | n n| u | u = P Q | u = n
v| = v| P Q =
v| n n| =
n
A = P Q AP Q =
∗
n| v n|
n
| n n| A |m m| .
n,m
Die Projektionen n| u, v| n auf die Basisvektoren sowie die n| A |m lassen sich interpretieren als die Elemente von Koordinatenvektoren (| u )Q , ( v| )Q bzw. Matrizen (A)Q , welche die abstrakten Gr¨oßen | u , v| und A in der Q-Darstellung beschreiben: ⎛ ⎞ 1| u ⎜ ⎟ (| u )Q = ⎝ 2| u ⎠ , ( v| )Q = ( v| 1 , v| 2 , . . .) .. . ⎛ ⎞ 1| A |1 1| A |2 . . . ⎜ ⎟ (A)Q = ⎝ 2| A |1 2| A |2 . . . ⎠ . .. .. .. . . . Offensichtlich gilt: • Die zur Ket-Spaltenmatrix (| u )Q konjugierte Bra-Zeilenmatrix ( u| )Q ist die komplex konjugierte und transponierte Matrix der Ket-Matrix: ∗ u| n = n| u . • Die zur quadratischen Operatormatrix (A)Q adjungierte Matrix (A† )Q ergibt sich ebenfalls durch komplexe Konjugation und Transposition der Ausgangsmatrix: ∗ ? = Q ∗ . (A† )mn = m| A† |n = n| A |m = (A)Q nm Man u ¨berzeugt sich leicht davon, daß die algebraischen Operationen von Vektoren und Operatoren dieselben Operationen f¨ ur die sie darstellenden Matrizen sind. Die Erweiterung f¨ ur den kontinuierlichen Fall ist unproblematisch; die Matrixelemente erhalten in diesem Fall kontinuierliche Indizes, und die bei den Matrixoperationen auftretenden Summen sind durch Integrale zu ersetzen.
3.1 Mathematische Grundlagen der Quantenmechanik
251
Man beachte, daß die Observable Q in der Q-Darstellung durch eine besonders einfache Matrix, n¨ amlich eine Diagonalmatrix dargestellt wird, bei der alle Nicht-Diagonalelemente verschwinden. Das gleiche gilt f¨ ur jede Funktion f (Q) und nach Satz 3.2 auch f¨ ur jede andere Observable, die mit Q vertauscht (wobei u.U. bei Entartung von Eigenwerten die Freiheit der Wahl eines geeigneten Basissystems auszunutzen ist). Darstellungswechsel. Wir betrachten zwei Basissysteme, bestehend aus den Eigenvektoren {| n , n = 1, 2, . . .} der Observablen Q und {| χ , χ ∈ R} der Observablen Θ: | n n| = 1 Q | n = qn | n , n| m = δnm , P Q = n
Θ | χ = θ(χ) | χ , χ| χ = δ(χ − χ ) , P Θ =
dχ | χ χ| = 1 .
Die Basisvektoren der einen Darstellung k¨ onnen nach der Basis der anderen Darstellung entwickelt werden: | n = P Θ | n = dχ | χ χ| n , | χ = P Q | χ = | n n| χ . n
Die Entwicklungskoeffizienten χ| n und n| χ lassen sich als Elemente einer Matrix S(χ, n) bzw. T (n, χ) interpretieren, die in unserem konkreten Fall einen kontinuierlichen und einen diskreten Index besitzen. Wegen ∗ χ| n = n| χ folgt: T = S † . Weiter ist χ| n n| χ = δ(χ − χ ) χ| χ = n
n| n =
dχ n| χ χ| n = δnn
=⇒ SS † = 1 , T T † = S † S = 1 . Das heißt S ist unit¨ ar. Sei nun ein Ket | u und ein Operator A in der QDarstellung gegeben: | u = | n n| u , A = | n n| A |n n | . n,n
n
Dann folgt f¨ ur die Θ-Darstellung dχ | χ χ| n n| u | u = n
⇐⇒ (| u )Θ = S(| u )Q sowie A=
n,n
dχ
und entsprechend
( v| )Θ = ( v| )Q S †
dχ | χ χ| n n| A |n n | χ χ |
252
3. Quantenmechanik
⇐⇒ (A)Θ = S(A)Q S † . Man gelangt also von den Matrizen der Q-Darstellung zu denen der ΘDarstellung durch eine unit¨are Transformation S. Die Elemente dieser Matrix haben folgende bemerkenswerte Eigenschaften: • Als Funktion des Spaltenindex n betrachtet, sind die Elemente χ| n der χ-ten Zeile die Komponenten des Zeilenvektors ( χ| )Q , also des Eigenbras χ| von Θ in der Q-Darstellung. • Als Funktion des Zeilenindex χ betrachtet, sind die Elemente der n-ten Spalte die Komponenten des Spaltenvektors (| n )Θ , also des Eigenkets | n von Q in der Θ-Darstellung. Die L¨ osung des Eigenwertproblems des Operators Θ in der Q-Darstellung ist also mathematisch ¨aquivalent zur Bestimmung der Transformation S, die zur Diagonalisierung der Matrix (Θ)Q f¨ uhrt. Zusammenfassung • Eigentliche Ketvektoren sind Elemente des Hilbert-Raumes, eines linearen Vektorraumes von h¨ochstens abz¨ahlbar unendlicher Dimension. Sie besitzen im Sinne der Hilbert-Metrik eine endliche Norm. Ihnen konjugiert sind die eigentlichen Bravektoren, die zum dualen HilbertRaum geh¨ oren. • Uneigentliche Hilbert-Vektoren, die keine endliche Norm besitzen, lassen sich auf die δ-Funktion normieren. F¨ ur sie gelten nach entsprechender Ersetzung die gleichen Beziehungen wie f¨ ur die eigentlichen HilbertVektoren. • Der Begriff des Operators spielt in der Quantenmechanik eine fundamentale Rolle. Das gr¨oßte Interesse gilt dabei hermiteschen Operatoren. Sie besitzen reelle Eigenwerte, wobei Eigenvektoren zu verschiedenen Eigenwerten orthogonal zueinander sind. Ist die Eigenbasis eines hermiteschen Operators vollst¨andig – dies setzen wir stets voraus – dann nennt man ihn Observable. • Zwei Observable sind genau dann miteinander vertauschbar, wenn sie mindestens ein gemeinsames Orthonormalsystem besitzen. • Entwickelt man Kets und Operatoren nach einer gegebenen Basis des Hilbert-Raumes, dann beschreiben die Entwicklungskoeffizienten diese Gr¨ oßen in der durch die Basis definierten Darstellung.
Anwendungen
253
Anwendungen 36. Eigenschaften von Projektionsoperatoren. Ein endlichdimensionaler Teilraum des Hilbert-Raumes werde durch das Orthonormalsystem | a1 , . . . , | an aufgespannt. Es ist zu zeigen, daß der Operator P {a} =
n
| ai ai |
i=1
die typischen Eigenschaften eines Projektionsoperators besitzt: a) P {a} ist linear, b) P 2{a} = P {a} , c) P {a} ist hermitesch: P †{a} = P {a} . Wie lauten die Eigenwerte und -vektoren von P {a} ? L¨ osung. Zu a) Es gilt P {a} (λ1 | ψ1 + λ2 | ψ2 ) = =
n i=1 n
| ai ai | λ1 ψ1 + λ2 ψ2 | ai ai | λ1 ψ1 +
i=1
= λ1
n
| ai ai | λ2 ψ2
i=1
n
| ai ai | ψ1 + λ2
i=1
n
| ai ai | ψ2
i=1
= λ1 P {a} | ψ1 + λ2 P {a} | ψ2 . Das heißt P {a} ist linear. Zu b) P 2{a} =
n
| ai ai | aj aj | =
i,j=1
n i,j=1
Zu c) ;
| ai δij aj | =
n
| ai ai | = P {a} .
i=1
< n n n ∗ ∗ ψ1 | ai ai | ψ2 = ψ1 | ai ai | ψ2 = ψ2 | ai ai | ψ1 i=1 i=1 i=1 1/2 @ >1/2 ˆ2 ˆ2 ˆ= B ∆A = ∆Aˆ = A , ∆B = ∆B . Es folgt unter Ausnutzung der Schwarzschen Ungleichung > @ >2 @ >@ ˆB ˆ |ψ . ˆ 2 |ψ ˆ 2 |ψ ≥ ψ| A (∆A)2 (∆B)2 = ψ| A ψ| B ˆB ˆ in seinen hermiteschen und antihermiteschen Zerlegung des Operators A Anteil liefert > @ >2 1 @ ˆ B} ˆ |ψ + ψ| [A, ˆ B] ˆ |ψ , (∆A)2 (∆B)2 ≥ ψ| {A, 4 ˆ B} ˆ =A ˆB ˆ +B ˆA ˆ den Antikommutator definiert. Da {A, ˆ B} ˆ herwobei {A, ˆ ˆ mitesch ist, ist sein Erwartungswert reell, w¨ ahrend [A, B] = [A, B] antihermitesch ist und somit einen rein imagin¨ aren Erwartungswert besitzt. Damit ergibt sich @ >2 >2 1@ ˆ B} ˆ |ψ + 1 ψ| [A, B] |ψ , (∆A)2 (∆B)2 ≥ ψ| {A, 4 4 und es folgt der Satz 3.5: Heisenbergsche Unsch¨ arferelation Seien A und B zwei hermitesche Operatoren. Dann gilt > 1 @ ∆A · ∆B ≥ [A, B] . 2 Man beachte,> daß das Gleichheitszeichen nur dann gilt, wenn @ ˆ B} ˆ |ψ = 0 und A ˆ | ψ = cB ˆ | ψ . Ein interessanter Spezialfall der ψ| {A, Heisenbergschen Unsch¨ arferelation ergibt sich f¨ ur kanonisch konjugierte Operatoren, wie z.B. den Ort und Impuls, f¨ ur die gilt: [X i , P i ] = i¯ h. Denn f¨ ur solche Gr¨ oßen ist Satz 3.5 zustandsunabh¨ angig: ∆Xi · ∆Pi ≥
¯ h . 2
264
3. Quantenmechanik
3.2.4 Schr¨ odinger-Bild und Schr¨ odinger-Gleichung Die in Postulat V beschriebene zeitliche Entwicklung von Quantensystemen bezieht sich auf ein spezielles Bild der Quantentheorie, n¨amlich das Schr¨ odinger-Bild. Da alle physikalischen, d.h. beobachtbaren Gr¨oßen wie z.B. Erwartungswerte invariant sind unter unit¨aren Transformationen, gibt es im Prinzip eine unendliche Zahl von ¨aquivalenten Bildern, die alle u ¨ber unit¨are Transformationen miteinander verbunden sind. In diesem Unterabschnitt diskutieren wir das Schr¨odinger-Bild, welches sich dadurch auszeichnet, daß in ihm quantenmechanische Zust¨ande i.a. zeitabh¨ angig sind, w¨ahrend die Operatoren h¨ ochstens explizit von der Zeit abh¨ angen. Neben dem Schr¨odinger-Bild sind zwei weitere, h¨aufig benutzte Bilder das Heisenberg-Bild und das Dirac-Bild, auf die wir im n¨achsten Unterabschnitt eingehen werden. Schr¨ odinger-Gleichung und Zeitentwicklungsoperator. Ist der Zustand | ψ eines Quantensystems zu einem bestimmten Zeitpunkt bekannt (pr¨ apariert in obigem Sinne), so ergibt sich seine eindeutige zeitliche Entwicklung im Schr¨odinger-Bild durch L¨osen der Schr¨odinger-Gleichung d | ψ(t) = H(t) | ψ(t) , (3.7) dt sofern das System im interessierenden Zeitintervall nicht gest¨ort wird (z.B. durch eine Messung). Dabei darf der Hamilton-Operator noch explizit von der Zeit abh¨ angen, d.h. dH/dt = ∂H/∂t, etwa aufgrund des Vorhandenseins zeitabh¨ angiger Felder. Die allgemeine L¨osung dieser Gleichung l¨aßt sich in der Form i¯ h
| ψ(t) = U (t, t0 ) | ψ(t0 ) , U (t0 , t0 ) = 1 schreiben, wobei U (t, t0 ) den Zeitentwicklungsoperator bezeichnet. Setzt man diesen Ausdruck in (3.7) ein, so ergibt sich die zur Schr¨odinger-Gleichung aquivalente Operatorgleichung ¨ d (3.8) U (t, t0 ) = H(t)U (t, t0 ) , dt aus der wiederum i U (t + ∆t, t) = 1 − ∆tH(t) , ∆t 1 ¯h folgt. Da wir einen hermiteschen Hamilton-Operator H voraussetzen, ist U (t+∆t, t) ein infinitesimaler unit¨arer Operator. Der volle Operator U (t, t0 ) ergibt sich nun als Produkt der infinitesimalen unit¨aren Transformationen, i¯ h
U (t, t0 ) = lim U (t, t − ∆t)U (t − ∆t, t − 2∆t) · · · U (t0 + ∆t, t0 ) , ∆t→0
und ist somit ebenfalls unit¨ar. Die Unitarit¨atseigenschaft des Entwicklungsoperators U bzw. die Hermitezit¨at des Hamilton-Operators H ergibt sich notwendigerweise aus der Forderung, daß die Norm des Zustandsvektors | ψ
3.2 Allgemeiner Aufbau der Quantentheorie
265
zeitlich konstant ist, denn nur dann k¨ onnen wir Wahrscheinlichkeitsaussagen formulieren. Satz 3.6: Erhaltung der Norm Aufgrund der Hermitezit¨ at des Hamilton-Operators H und der daraus folgenden Unitarit¨ at des Zeitentwicklungsoperators U ist die Norm eines Zustandsvektors | ψ(t) zeitlich erhalten: ? = ψ(t)| ψ(t) = ψ(t0 )| U † (t, t0 )U (t, t0 ) |ψ(t0 ) = ψ(t0 )| ψ(t0 ) . Formal handelt es sich bei (3.8) um eine gew¨ ohnliche Differentialgleichung 1. Ordnung. Man beachte jedoch, daß der naive L¨ osungsansatz ⎞ ⎛ t i U (t, t0 ) = exp ⎝− H(t )dt ⎠ h ¯ t0
i.a. nicht korrekt ist, da in der Exponentialfunktion beliebige Potenzen . von H(t )dt auftreten, die in der Regel nicht miteinander kommutieren: [H(t), H(t )] = 0.4 Im folgenden betrachten wir jedoch eine wichtige Ausnahme. Konservativer Hamilton-Operator, zeitunabh¨ angige Schr¨ odingerGleichung. F¨ ur den Spezialfall eines abgeschlossenen konservativen Systems, d.h. ∂H/∂t = 0, k¨ onnen wir den Entwicklungsoperator U nach (3.8) in der Form U (t, t0 ) = e−iH(t−t0 )/¯h , schreiben. Wir suchen nun einen expliziten Ausdruck f¨ ur U bzw. | ψ in Termen von Energieeigenzust¨ anden | En , also den normierten Eigenkets zu H, die der zeitunabh¨ angigen Schr¨ odinger-Gleichung H | En = E n | E n gen¨ ugen. Entwickelt man | ψ(t) nach diesen Eigenvektoren, | En En | ψ(t) = an (t) | En , an (t) = En | ψ(t) , | ψ(t) = n
n
und setzt diesen Ausdruck in (3.7) ein, so ergibt sich die Gleichung i¯ ha˙ n (t) = En an (t) , 4
Allerdings ist es mit Hilfe des Zeitordnungsoperators T in der Tat m¨ oglich, eine formale L¨ osung dieser Art anzugeben, n¨ amlich:
⎧ ⎨
⎛
i U (t, t0 ) = T exp ⎝− h ¯ ⎩
t
⎞⎫ ⎬ H(t )dt ⎠ . ⎭
t0
Hierbei werden die einzelnen Ausdr¨ ucke in chronologischer Reihenfolge geordnet.
266
3. Quantenmechanik
die durch an (t) = an (t0 )e−iEn (t−t0 )/¯h gel¨ ost wird. Hieraus folgt En | ψ(t) = En | ψ(t0 ) e−iEn (t−t0 )/¯h =⇒ | ψ(t) = | En En | ψ(t0 ) e−iEn (t−t0 )/¯h . n
Satz 3.7: Allgemeine L¨ osung der Schr¨ odinger-Gleichung f¨ ur konservative Systeme i¯ h
d | ψ(t) = H | ψ(t) =⇒ | ψ(t) = U (t, t0 ) | ψ(t0 ) , dt
mit U (t, t0 ) =
| En En | e−iEn (t−t0 )/¯h , H | En = En | En .
n
Im Falle einer Entartung gilt entsprechend U (t, t0 ) = | En , r En , r| e−iEn (t−t0 )/¯h , n,r
und im kontinuierlichen Fall sind die Summen durch Integrale zu ersetzen. Die Zust¨ ande | En e−iEn (t−t0 )/¯h sind station¨ are L¨ osungen der zeitabh¨angigen Schr¨ odinger-Gleichung, die sich periodisch in der Zeit ver¨andern, wobei ihre Frequenz ω im Einklang mit der Einsteinschen Beziehung E = h ¯ ω steht. F¨ ur solche Zust¨ ande ist die Wahrscheinlichkeitsverteilung W (λ) einer Variablen Λ zeitunabh¨ angig, denn es gilt 2 W (λ, t) = | λ| E(t) |2 = λ| E e−iE(t−t0 )/¯h = | λ| E |2 = W (λ, t0 ) . 3.2.5 Andere Bilder der Quantentheorie Die Ausf¨ uhrungen des letzten Unterabschnittes bezogen sich auf ein bestimmtes Bild der Quantenmechanik, dem Schr¨odinger-Bild. In ihm wird die Dynamik eines Systems durch Drehungen des Zustandsvektors im Hilbert-Raum bei festem Basissystem beschrieben. Aufgrund der Invarianz von Skalarprodukten unter unit¨aren Transformationen k¨onnen wir auch zu anderen Beschreibungsarten u ¨bergehen, in denen etwa der Zustandsvektor fest ist und sich das Basissystem dreht. Dies ist das Heisenberg-Bild, in dem Observable durch zeitabh¨ angige Operatoren beschrieben werden, w¨ahrend Zust¨ande zeitunabh¨ angig sind. Von Interesse ist desweiteren das Dirac-Bild, in welchem die Zeitabh¨ angigkeit des Systems auf Zustandsvektor und Basissystem in einer Weise aufgeteilt wird, die besonders f¨ ur st¨orungstheoretische Rechnungen
3.2 Allgemeiner Aufbau der Quantentheorie
267
von großem praktischen Nutzen ist. Mit den beiden zuletzt genannten Bildern wollen wir uns nun besch¨ aftigen. Heisenberg-Bild. Das Heisenberg-Bild ist in folgender Weise definiert: Definition: Heisenberg-Bild Bezeichnet | ψS (t) = U (t, t0 ) | ψS (t0 ) einen Zustandsvektor und AS einen Operator im Schr¨ odinger-Bild, dann sind die entsprechenden Gr¨ oßen | ψH und AH im Heisenberg-Bild definiert durch | ψH = U † (t, t0 ) | ψS (t) = | ψS (t0 ) AH (t) = U † (t, t0 )AS U (t, t0 ) . Im Heisenberg-Bild sind also die Zust¨ ande zeitunabh¨ angig, wogegen die Operatoren auf jeden Fall eine Zeitabh¨ angigkeit besitzen, selbst wenn AS nicht explizit von der Zeit abh¨ angt. F¨ ur die zeitliche Entwicklung von AH ergibt sich d ∂AS dU dU † AH (t) = i¯ AS U + i¯ U + i¯ hU † AS h hU † dt dt ∂t dt † ∂AS † † hU U + U AS H S U = −U H S AS U + i¯ ∂t ∂AS U . = U † [AS , H S ]U + i¯ hU † ∂t Hierbei wurde (3.8) und ihre adjungierte Gleichung ausgenutzt. Wegen ∂AH † ∂AS 5 † † † ∂t = U ∂t U und U AS H S U = U AS U U H S U = AH H H folgt: i¯ h
Satz 3.8: Heisenberg-Gleichung und Erhaltungsgr¨ oßen Die zur Schr¨ odinger-Gleichung korrespondierende Beziehung im Heisenberg-Bild lautet dAH ∂AH = [AH , H H ] + i¯ (Heisenberg-Gleichung) . h dt ∂t Hieraus ergibt sich unter Ber¨ ucksichtigung von : 9 d AH dAH d | ψH = ψH ψH , =0 dt dt dt i¯ h
die Heisenberg-Gleichung der Mittelwerte : 9 d A 1 ∂A . = [A, H] + dt i¯ h ∂t 5
(3.9)
S Diese Beziehung wird klar, wenn man sich vor Augen h¨ alt, daß ∂A eine ∂t bestimmte Observablenfunktion ist und als solche wie jeder andere Operator transformiert.
268
3. Quantenmechanik
Aufgrund der Invarianz von Skalarprodukten ist diese Gleichung bildunabh¨ angig, weshalb der Index H weggelassen wurde. Desweiteren folgt der Erhaltungssatz: Eine Observable A, die nicht explizit zeitabh¨ angig ist und mit dem Hamilton-Operator H vertauscht, ist eine Erhaltungsgr¨ oße. Ist der Operator A nicht explizit zeitabh¨angig, dann reduziert sich (3.9) auf das Ehrenfestsche Theorem d A 1 = [A, H] . (3.10) i¯ h dt Als eine Anwendung dieser Gleichung leiten wir die Energie-Zeit-Unsch¨ arferelation her. Dazu betrachten wir einen zeitunabh¨angigen Hamilton-Operator H eines Systems sowie eine ebenfalls zeitunabh¨angige Observable A. Bezeichnen ∆A und ∆E die mittleren quadratischen Abweichungen ihrer Erwartungswerte, dann gilt nach Satz 3.5 1 ∆A · ∆E ≥ | [A, H] | , 2 und somit ¯h d A . ∆A · ∆E ≥ 2 dt Umstellen dieser Gleichung liefert den Satz 3.9: Energie-Zeit-Unsch¨ arferelation ∆τ · ∆E ≥
¯ h ∆A , ∆τ = d A . 2 dt
∆τ ist hierbei das Zeitintervall, indem sich der Erwartungswert von A um ∆A ¨ andert. Es stellt also die minimale Zeitspanne dar, die f¨ ur eine nennens¨ werte Anderung von A notwendig ist, und kann somit als ein charakteristisches Zeitmaß f¨ ur die Entwicklung des Systems aufgefaßt werden. Obige Beziehung ist in dem Sinne zu verstehen, daß die Energie eines Systems, das sich in einem Zeitintervall ∆τ in einem festen Zustand befindet, mit einer Unsicherheit ∆E ≥ ¯h/(2∆τ ) behaftet ist. Eine andere Interpretation ist, daß Verletzungen der klassischen Energieerhaltung um ∆E in einem Zeitintervall ∆τ ∼ ¯ h/∆E m¨ oglich sind. Man beachte, daß sich die Zeit-Energie-Unsch¨arferelation qualitativ von der Unsch¨arfebeziehung des Satzes 3.5 unterscheidet, da ∆τ keine dynamische Variable, sondern einen a¨ußeren Entwicklungsparameter darstellt. Dirac-Bild. Ein weiteres Bild, das besonders dann Verwendung findet, wenn der Hamilton-Operator eine Zeitabh¨angigkeit besitzt, ist das Dirac- oder Wechselwirkungsbild. Hierbei wird der Hamilton-Operator H S im Schr¨odinger-Bild zun¨ achst in zwei hermitesche Terme aufgespalten,
3.2 Allgemeiner Aufbau der Quantentheorie
269
H S (t) = H S + H S (t) , (0)
orung H S (t) wobei der ungest¨ orte Anteil H S zeitunabh¨angig und die St¨ zeitabh¨ angig ist. Zur L¨ osung der Schr¨ odinger-Gleichung d i¯ h U (t, t0 ) = H S (t)U (t, t0 ) dt wird der unit¨are Operator U als Produkt zweier unit¨ arer Operatoren geschrieben, (0)
U (t, t0 ) = U (0) (t, t0 )U (t, t0 ) , U (0) (t0 , t0 ) = U (t0 , t0 ) = 1 , osung der ungest¨ orten Schr¨ odinger-Gleichung wobei U (0) L¨ (0) (0) (0) i¯ hU˙ = HS U ist. Das Dirac-Bild ist nun in folgender Weise definiert: Definition: Dirac-Bild Hamilton-Operator, Zustandsvektor und Operator seien im Schr¨ odinger(0) Bild gegeben durch H S (t) = H S + H S (t), | ψS (t) und AS . Bezeichnet (0) U (0) (t, t0 ) den unit¨ aren Operator, f¨ ur den gilt: i¯ hU˙ (0) = H S U (0) , dann sind die entsprechenden Gr¨ oßen im Dirac-Bild gegeben durch | ψI (t) = U (0)† (t, t0 ) | ψS (t) AI (t) = U (0)† (t, t0 )AS U (0) (t, t0 ) . Dieses Bild liegt in gewisser Weise zwischen dem Schr¨ odinger- und HeisenbergBild, da hier sowohl Zustandsvektoren als auch Operatoren zeitabh¨ angig sind. Es folgt d (0)† (0)† d ˙ i¯ h | ψI (t) = i¯ | ψS (t) + U h U | ψS (t) dt dt (0)
= −U (0)† H S | ψS (t) + U (0)† H S | ψS (t) = U (0)† H S | ψS (t) = U (0)† H S U (0) | ψI = H I | ψI und somit Satz 3.10: Zustands- und Operatorgleichung im Dirac-Bild Die zur Schr¨ odinger-Gleichung korrespondierenden Beziehungen im DiracBild lauten d i¯ h | ψI (t) = H I | ψI (t) (Zustandsgleichung) dt bzw. mit | ψI (t) = U (t, t0 ) | ψI (t0 ) i¯ h
d U = H I U dt
270
3. Quantenmechanik
und dAI ∂AI (0) (Operatorgleichung) . = [AI , H I ] + i¯ h ∂t dt Letztere folgt analog zur Herleitung der Heisenberg-Gleichung. i¯ h
W¨ ahrend also die zeitabh¨angigen Zust¨ande | ψI einer Schr¨odinger-Gleichung gen¨ ugen, in der die St¨orung H I auftritt, gehorchen die ebenfalls zeitabh¨angigen Observablen der Heisenberg-Gleichung mit dem ungest¨orten Hamilton(0) Operator H I . 3.2.6 Darstellungen Mittels des abstrakten Hilbert-Raumes haben wir die Theorie der Quantenmechanik bislang auf darstellungsunabh¨angige Weise entwickeln k¨onnen. Jedoch ist klar, daß sich die Angabe der Komponenten eines Vektors immer auf ein Basissystem beziehen muß, das den gesamten Vektorraum aufspannt. Eine solche Darstellung ist durch die Eigenvektoren eines vollst¨andigen Satzes kommutierender Observablen definiert. Die Projektionen des Zustandsvektors | ψ auf ein System {| q } von Basisvektoren bilden einen Koordinatenvektor, der den Zustand in der q-Darstellung repr¨asentiert, w¨ahrend Operatoren durch die Elemente der hermiteschen Matrix q| A | q dargestellt werden. Erst durch Projektion des Vektors | ψ auf eine spezielle Basis gelangen wir von der abstrakten Schr¨odinger-Gleichung (oder der Bewegungsgleichung der Operatoren) zu Differentialgleichungen und algebraischen Beziehungen, die wir l¨ osen k¨ onnen und die zu quantitativen Aussagen f¨ ur Meßwerte f¨ uhren. Nun gibt es in jedem Bild der Quantenmechanik unendlich viele Darstellungen der Theorie, die durch unit¨are Transformationen miteinander verbunden sind.6 Besonders ausgezeichnet sind dabei jene Darstellungen, in denen die Matrixdarstellungen der f¨ ur das Problem relevanten Operatoren diagonal sind, denn in diesen Darstellungen vereinfacht sich die Auswertung der Schr¨ odinger-Gleichung betr¨achtlich. Ist z.B. der Hamilton-Operator eine reine Funktion der Koordinaten und Impulse, H = H(X, P ), dann empfehlen sich sowohl die Ortsdarstellung als auch die Impulsdarstellung. Welche Darstellung geeigneter ist, ergibt sich aus der konkreten Form des Wechselwirkungspotentials V . Beide Darstellungen sind erlaubt, da sowohl die Ortsoperatoren X i als auch die Impulsoperatoren P i , i = 1, 2, 3 jeweils ein vollst¨ andiges System kommutierender Observablen (f¨ ur spinlose Teilchen) bilden (Postulat III). Ortsdarstellung (Wellenmechanik). Die Ortsdarstellung ist definiert als diejenige Darstellung, in der der Ortsoperator diagonal ist. Da dieser ein 6
Diese Transformationen sollte man nicht mit denjenigen verwechseln, mit denen man das Bild der Quantentheorie selbst wechselt.
3.2 Allgemeiner Aufbau der Quantentheorie
271
kontinuierliches Spektrum besitzt, lautet die Bedingung im eindimensionalen Fall: Definition: Ortsdarstellung x| X |x = xδ(x − x ) , P X =
dx | x x| , ψ(x, t) = x| ψ(t) .
ur diese Darstellung. Zusammen mit der P X bezeichnet den Einsoperator f¨ Vertauschungsrelation [X, P ] = i¯ h l¨ aßt sich hieraus die entsprechende Beziehung f¨ ur den Impuls ableiten: i¯ hδ(x − x ) = x| XP − P X |x = (x − x ) x| P |x h =⇒ x| P |x = i¯
d d δ(x − x ) = −i¯ h δ(x − x ) . dx dx
Nun gilt | ψ(t) = P X | ψ(t) =
dx | x x| ψ(t) =
dx | x ψ(x, t) ,
wobei ψ(x, t) = x| ψ(t) die Komponenten des Zustandsvektors | ψ(t) in der Ortsbasis beschreibt. Dieser Ausdruck ist die Ortswellenfunktion der Wellenmechanik. Weiterhin gilt X | ψ(t) = P X XP X | ψ(t) = dx dx | x x| X |x x | ψ(t) = dx | x xψ(x, t) P | ψ(t) = P X P P X | ψ(t) = dx dx | x x| P |x x | ψ(t) d = i¯ h dx | x dx δ(x − x ) ψ(x , t) dx d = −i¯ h dx | x dx δ(x − x ) ψ(x , t) dx d = −i¯ h dx | x ψ(x, t) , dx woraus sich folgende Zuordnungen zwischen Operatoren und den sie beschreibenden Gr¨ oßen ergeben:
272
3. Quantenmechanik
Satz 3.11: Operatoren in der Ortsdarstellung d , h X −→ X X = x , P −→ P X = −i¯ dx d Ω(X, P ) −→ Ω X = Ω X → x, P → −i¯ . h dx odinger-Gleichung und die Berechnung von Erwartungswerten in F¨ ur die Schr¨ der Ortsdarstellung gilt entsprechend d ψ(x, t) = H X ψ(x, t) dt Ω = dxψ ∗ (x, t)Ω X ψ(x, t) = ψ| Ω X |ψ = Ω X . i¯ h
(3.11) (3.12)
Den eigentlichen Hilbert-Vektoren mit endlicher Norm entsprechen Ortswellenfunktionen, f¨ ur die gilt: ψ| ψ = dx|ψ(x, t)|2 = dx|ψ(x, 0)|2 < ∞ . Sie bilden den Hilbert-Raum der quadratintegrablen Funktionen. N -Teilchensysteme. Die Erweiterung des bisher Gesagten auf ein System mit N Freiheitsgraden ist unproblematisch.7 Hier gilt entsprechend x1 , . . . , xN | X i |x1 , . . . , xN = xi δ(x1 − x1 ) · · · δ(xN − xN ) d δ(xi − xi ) dxi × · · · δ(xN − xN )
x1 , . . . , xN | P i |x1 , . . . , xN = i¯ hδ(x1 − x1 ) · · · PX =
dx1 · · · dxN | x1 , . . . , xN x1 , . . . , xN |
und
| ψ(t) = P X | ψ(t) =
dx1 · · · dxN | x1 , . . . , xN ψ(x1 , . . . , xN , t) ,
mit ψ(x1 , . . . , xN , t) = x1 , . . . , xN | ψ(t) . Insbesondere folgt hieraus f¨ ur Erwartungswerte Ω = dx1 · · · dxN ψ ∗ (x1 , . . . , xN , t)Ω X ψ(x1 , . . . , xN ) . 7
Man beachte, daß die Beschreibung eines eindimensionalen N -Teilchensystems mathematisch ¨ aquivalent zur Beschreibung eines N -dimensionalen EinTeilchensystems ist.
3.2 Allgemeiner Aufbau der Quantentheorie
273
Impulsdarstellung. In der Impulsdarstellung besitzt die den Impuls beschreibende Matrix diagonale Gestalt (wir betrachten wieder den eindimensionalen Fall): Definition: Impulsdarstellung
p| P |p = pδ(p − p ) , P P =
dp | p p| , ϕ(p, t) = p| ψ(t) .
In dieser Darstellung folgt f¨ ur die Matrixelemente des Ortsoperators i¯ hδ(p − p ) = p| XP − P X |p = (p − p) p| X |p =⇒ p| X |p = −i¯ h
d d δ(p − p ) = i¯ h δ(p − p ) . dp dp
Analog zur Ortsdarstellung ist | ψ(t) = P P | ψ(t) = dp | p p| ψ(t) = dp | p ϕ(p, t) . Der Ausdruck ϕ(p, t) = p| ψ(t) beschreibt die Komponenten von | ψ(t) in der Impulsbasis und wird deshalb Impulswellenfunktion genannt. Die zur Ortsdarstellung korrespondierenden Zuordnungen ergeben sich aus X | ψ(t) = P P XP P | ψ(t) = dp dp | p p| X |p p | ψ(t) d ϕ(p, t) = i¯ h dp | p dp P | ψ(t) = P P P P P | ψ(t) = dp dp | p p| P |p p | ψ(t) = dp | p pϕ(p, t) zu Satz 3.12: Operatoren in der Impulsdarstellung d , P −→ P P = p , dp d Ω(X, P ) −→ Ω P = Ω X → i¯ h ,P → p . dp X −→ X P = i¯ h
Weiterhin lauten die zu (3.11) und (3.12) geh¨ orenden Beziehungen in der Impulsdarstellung d i¯ h ϕ(p, t) = H P ϕ(p, t) dt
274
3. Quantenmechanik
Ω =
dpϕ∗ (p, t)Ω P ϕ(p, t) = ϕ| Ω P |ϕ = Ω P .
Die Verallgemeinerung der Impulsdarstellung auf den N -dimensionalen Fall geschieht in analoger Weise zur Ortsdarstellung und l¨auft im wesentlichen wieder auf die Ersetzung dp −→ dp1 · · · dpN | p −→ | p1 , . . . , pN ϕ(p, t) −→ ϕ(p1 , . . . , pN , t) hinaus. Transformation von Orts- auf Impulsdarstellung. Zwischen der Ortsund der Impulsdarstellung besteht ein besonderer Zusammenhang, denn die Wellenfunktionen der einen Darstellung sind gerade die fourier-transformierten Wellenfunktionen der anderen Darstellung. Um dies zu sehen, schreiben wir ψ(x, t) = x| ψ(t) = dp x| p p| ψ(t) = dp x| p ϕ(p, t) , wobei f¨ ur die Entwicklungskoeffizienten x| p gilt: p x| p = x| P |p = dx x| P |x x | p d d x| p . δ (x − x ) x | p = −i¯ h = i¯ h dx dx dx Dies ist eine Differentialgleichung f¨ ur x| p, deren L¨osung x| p ∼ eipx/¯h ist. Es folgt somit der Satz 3.13: Zusammenhang zwischen Orts- und Impulsdarstellung, De-Broglie-Beziehung Die Wellenfunktionen der Orts- und Impulsdarstellung sind FourierTransformierte voneinander:
¯h 1 ikx dke ϕ(k, t) = √ ψ(x, t) = dpeipx/¯h ϕ(p, t) 2π 2π¯h 1 ϕ(k, t) = √ dxe−ikx ψ(x, t) . 2π¯h Die Wellenzahl k und der Impuls p sind u ¨ber die De-Broglie-Beziehung p=h ¯k miteinander verkn¨ upft.
Anwendungen
275
Zusammenfassung • Jeder quantenmechanische Zustand wird durch einen eigentlichen Hilbert-Vektor beschrieben, dessen zeitliche Entwicklung durch die Schr¨ odinger-Gleichung determiniert ist. • Eine ideale quantenmechanische Messung einer Observablen Ω lieuhrt dabei das Quanfert einen ihrer Eigenwerte ω. Der Meßprozeß u ¨berf¨ tensystem in einen zu ω geh¨ orenden Eigenzustand von Ω (Zustandsreduktion). Die gleichzeitige Messung zweier nichtvertauschender Observablen f¨ uhrt zu Unsicherheiten dieser Gr¨ oßen, die sich aus der Heisenbergschen Unsch¨ arferelation ergeben. • Neben dem am h¨ aufigsten verwendeten Schr¨ odinger-Bild gibt es unendlich viele ¨ aquivalente Bilder, die durch unit¨ are Transformationen auseinander hervorgehen. Hierbei sind vor allem das Heisenberg-Bild und das Dirac- oder Wechselwirkungsbild zu nennen. • Die Wahl eines vollst¨ andigen Basissystems innerhalb eines Bildes definiert eine spezielle Darstellung, in der quantenphysikalische Gr¨ oßen (Zustandsvektoren und Observable) durch Spaltenvektoren bzw. quadratische Matrizen beschrieben werden. Alle Darstellungen sind gleichwertig und lassen sich ebenfalls durch unit¨ are Transformationen ineinander u uhren. Zwei der am meisten benutzten Darstellungen innerhalb des ¨berf¨ Schr¨ odinger-Bildes sind die Orts- und Impulsdarstellung. Da Ortsund Impulsoperator zueinander kanonisch konjugiert sind, besteht ein besonderer Zusammenhang zwischen den Orts- und Impulswellenfunktionen: Sie sind gerade Fourier-Transformierte voneinander.
Anwendungen 38. Ehrenfest-Gleichungen. Man zeige mit Hilfe des Ehrenfestschen Theorems, daß f¨ ur ein quantenmechanisches Teilchen in einem skalaren, ortsabh¨ angigen Potential die Ehrenfest-Gleichungen 9 9 : : ∂H d P ∂H d X = , =− dt ∂P dt ∂X gelten. L¨ osung. Nach (3.10) gelten mit P2 + V (X) 2m die darstellungsfreien Beziehungen H=
276
3. Quantenmechanik
= 1 ? d X = [X, P 2 ] dt 2mi¯ h 1 d P = [P , V (X)] . dt i¯ h Unter Ber¨ ucksichtigung von
(3.13) (3.14)
hP [X, P 2 ] = P [X, P ] + [X, P ]P = 2i¯ geht (3.13) u ¨ber in d X P = = dt m
9
∂H ∂P
: .
Zur Auswertung von (3.14) ist es g¨ unstig, die Ortsdarstellung zu verwenden: P −→ −i¯ h∇ , V (X) −→ V (x) . Man sieht nun n¨amlich, daß gilt: [∇, V (x)]ψ(x, t) = ∇(V (x)ψ(x, t)) − V (x)∇ψ(x, t) = (∇V (x))ψ(x, t) , so daß wir ganz allgemein schließen k¨onnen: [∇, V (X)] = ∇V (X) d P = − ∇V (X) = − =⇒ dt
9
∂H ∂X
: .
¨ Man beachte die formale Ahnlichkeit der Ehrenfestschen Gleichungen mit den Hamiltonschen Gleichungen der klassischen Mechanik. 39. Meßwahrscheinlichkeiten. Gegeben seien die folgenden hermiteschen Operatoren: ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 0 0 0 1 0 0 −i 0 1 1 Lx = √ ⎝ 1 0 1 ⎠ , Ly = √ ⎝ i 0 −i ⎠ , Lz = ⎝ 0 0 0 ⎠ . 2 0 1 0 2 0 i 0 0 0 −1 a) Was sind die m¨oglichen Eigenwerte lz und Eigenvektoren von Lz ? b)Man u ufe die Heisenbergsche Unsch¨arferelation der Operatoren Lx ¨berpr¨ und Ly f¨ ur den Eigenzustand von Lz mit lz = 1. c) Wie lauten die m¨oglichen Meßergebnisse mit den zugeh¨origen Wahrscheinlichkeiten, die bei einer Messung von Lx zu erwarten sind, wenn sich ein Quantensystem im Eigenzustand von Lz mit lz = −1 befindet? L¨ osung. Zu a) Aus der Form von Lz erkennt man unmittelbar, daß die zugeh¨origen Eigenwerte und -vektoren gegeben sind durch ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 0 0 lz = +1 : e+ = ⎝ 0 ⎠ , lz = 0 : e0 = ⎝ 1 ⎠ , lz = −1 : e− = ⎝ 0 ⎠ . 0 0 1
Anwendungen
277
Zu b) Es sind folgende Gr¨ oßen f¨ ur den Zustand e+ zu berechnen: = ? 1 Lx = e†+ Lx e+ = 0 , L2x = e†+ L2x e+ = 2 1 2 =⇒ ∆Lx = L2x − Lx = √ 2 ? = 1 Ly = e†+ Ly e+ = 0 , L2y = e†+ L2y e+ = 2 ? = 1 2 =⇒ ∆Ly = L2y − Ly = √ 2 | [Lx , Ly ] | = |e†+ [Lx , Ly ]e+ | = e†+ Lz e+ = 1 . Damit folgt 1 1 = | [Lx , Ly ] | . 2 2 Zu c) Zur Bestimmung der m¨ oglichen Meßergebnisse von Lx sind die Eigenwerte und -vektoren von Lx zu bestimmen: ∆Lx · ∆Ly =
Lx x = lx x ⇐⇒ (Lx − lx I)x = 0 −lx √1 0 √1 −l2 √1 = −lx (lx + 1)(lx − 1) = 0 . =⇒ 2 x 2 0 √1 −lx 2
Man erh¨ alt
⎛
⎞ ⎛ ⎞ 1 1 √ 1 1 lx = 1 : f + = ⎝ 2 ⎠ , lx = 0 : f 0 = √ ⎝ 0 ⎠ , 2 2 −1 1 ⎛ ⎞ 1 √ 1 lx = −1 : f − = ⎝ − 2 ⎠ . 2 1
Als n¨achstes hat man den Zustand e− nach den Eigenbasiszust¨ anden f + , f 0 , f − von Lx zu entwickeln: e− = f + f + | e− + f 0 f 0 | e− + f − f − | e− . Die Betr¨ age der Entwicklungskoeffizienten geben dann die entsprechenden Meßwahrscheinlichkeiten an: 1 W (lx = 1) = | f + | e− |2 = 4 1 W lx = 0) = | f 0 | e− |2 = 2 1 W (lx = −1) = | f − | e− |2 = . 4
278
3. Quantenmechanik
Dabei gilt erwartungsgem¨aß W (lx = 1) + W (lx = 0) + W (lx = −1) = 1 .
3.3 Eindimensionale Systeme Nachdem bisher vom allgemeinen Aufbau der Quantentheorie die Rede war, besch¨ aftigt sich dieser Abschnitt mit der einfachsten Klasse quantenmechanischer Probleme, n¨amlich die eines einzigen Teilchen in einer Dimension. Obwohl solche Systeme etwas k¨ unstlich konstruiert erscheinen, so beinhalten sie doch die meisten Ph¨anomene der dreidimensionalen Quantentheorie und lassen sich aufgrund des reduzierten Komplexit¨atsgrades relativ leicht l¨osen. Nun haben wir bereits gesehen, daß es zur L¨osung der Schr¨odingerGleichung zumeist vorteilhaft ist, eine spezielle Darstellung zu w¨ahlen, in der die Form des Problems eine einfache Struktur annimmt. In einzelnen F¨allen ist es auch m¨oglich, rein algebraisch vorzugehen. Beispiele, die wir im folgenden n¨ aher betrachten wollen, sind: • Freies Teilchen und Wellenpakete: L¨osung im Impulsraum. • Potentialstufe und Potentialkasten: L¨osung im Ortsraum. • Harmonischer Oszillator: Algebraische L¨osung. Die verbreitetste Methode zur L¨osung der Schr¨odinger-Gleichung besteht im Aufstellen der Differentialgleichung im Ortsraum, also der Verwendung der Wellenmechanik. Wir stellen daher einige allgemeine Betrachtungen zu diesem L¨ osungsverfahren an den Anfang dieses Abschnitts. 3.3.1 Betrachtungen zur Schr¨ odinger-Gleichung im Ortsraum In Unterabschn. 3.2.6 fanden wir, daß die Dynamik eines eindimensionalen nichtrelativistischen quantenmechanischen Systems ohne Spin in der Ortsdarstellung durch die Differentialgleichung d ψ(x, t) = H X ψ(x, t) dt gegeben ist, wobei H X in vielen F¨allen die Form i¯ h
(3.15)
P 2X ¯h2 d2 + V (X X , t) = − + V (x, t) , V ∈ R (3.16) 2m 2m dx2 besitzt, mit einem Wechselwirkungspotential V . In dieser Darstellung interpretieren wir |ψ(x, t)|2 als die Wahrscheinlichkeitsdichte, bei einer Messung das Teilchen zur Zeit t am Ort x zu finden. Oder anders ausgedr¨ uckt: Bei einer Ortsmessung von N identisch pr¨aparierten, nichtwechselwirkenden Teilchen, die jeweils durch ψ beschrieben werden, ist N |ψ(x, t)|2 dx gleich der Zahl der HX =
3.3 Eindimensionale Systeme
279
Teilchen im Ortsintervall [x : x + dx] zum Zeitpunkt t. Dies ist die Bornsche Interpretation der Quantenmechanik. Ein wichtiger Satz, den wir sp¨ ater noch ben¨ otigen werden, ist Satz 3.14: Kontinuit¨ atsgleichung in der Ortsdarstellung Aus der Schr¨ odinger-Gleichung (3.15), (3.16) und ihrer Adjungierten folgt die Kontinuit¨ atsgleichung d d j(x, t) = 0 , |ψ(x, t)|2 + dt dx wobei h ¯ dψ ∗ ∗ dψ j(x, t) = ψ −ψ 2im dx dx
(3.17)
die Wahrscheinlichkeitsstromdichte oder auch Teilchenstromdichte bezeichnet. ¨ Eine Anderung der Wahrscheinlichkeitsdichte in einem x-Bereich hat demnach einen Nettoteilchenstrom zur Folge: d dt
b dx|ψ(x, t)|2 = j(a, t) − j(b, t) . a
Zeitunabh¨ angige Schr¨ odinger-Gleichung. Nach Unterabschn. 3.2.4 k¨ onnen wir im Falle eines konservativen Hamilton-Operators die Zeitabh¨ angigkeit der Schr¨odinger-Gleichung durch den Ansatz ψ(x, t) = Ψ (x)e−iωt , ω = E/¯ h im Ortsraum separieren. Dies f¨ uhrt von (3.15), (3.16) auf die zeitunabh¨ angige Eigenwertgleichung h2 d2 ¯ + V (x) Ψ (x) = EΨ (x) − 2m dx2 bzw. d2 Ψ (x) 2mV (x) 2mE = [U (x) − ] Ψ (x) , U (x) = , = . (3.18) 2 2 dx h ¯ h2 ¯ Stetigkeitsbedingungen. Im allgemeinen wollen wir auch Potentiale betrachten, die endliche Sprungstellen aufweisen. Sei x = a eine solche Unstetigkeit des Potentials U (x). Dann ist die L¨ osung Ψ (x) in a immer noch stetig differenzierbar, denn nach (3.18) gilt in der Umgebung [a − δ : a + δ], δ 1 a+δ a+δ d Ψ (a + δ) − Ψ (a − δ) = dx Ψ (x) = dx [U (x) − ] Ψ (x) = 0 , dx
a−δ
a−δ
280
3. Quantenmechanik
wobei die Stetigkeit von Ψ an der Stelle x = a ausgenutzt wurde. Demnach sind sowohl Ψ als auch Ψ in a stetig.8 Symmetriebetrachtungen. Eine Besonderheit ergibt sich, falls das Potential V (x) bzw. U (x) reflexionssymmetrisch ist. Um dies zu sehen, definieren wir den Parit¨ atsoperator P durch P q(x) = q(−x) . Seine Eigenwerte sind +1 f¨ ur gerade und −1 f¨ ur ungerade Funktionen q. Sei nun P V (x) = V (x). Da der kinetische Teil des Hamilton-Operators nur die zweite Ableitung nach dem Ort enth¨alt, kommutieren H und P in diesem Fall. Wenden wir jetzt den Parit¨atsoperator auf HΨ (x) = EΨ (x)
(3.19)
an, so folgt HΨ (−x) = EΨ (−x) . Demnach ist mit Ψ (x) auch Ψ (−x) L¨osung von (3.19) zum selben Eigenwert E. Aus diesen beiden L¨osungen lassen sich zwei neue L¨osungen Ψ± (x) = Ψ (x) ± Ψ (−x) , P Ψ± = ±Ψ± konstruieren, die gleichzeitig Eigenzust¨ande von H und P sind. F¨ ur symmetrische Potentiale k¨onnen wir die Basiszust¨ande also immer in gerade und ungerade Funktionen unterteilen. Qualitative Diskussion des Spektrums. Bei unseren Untersuchungen in diesem Abschnitt werden wir einige Eigenschaften der L¨osungen zur zeitunabh¨ angigen Schr¨odinger-Gleichung finden, die ganz allgemein gelten. F¨ ur ein gegebenes Potential ist stets zu untersuchen, ob es sowohl gebundene Zust¨ ande als auch Streuzust¨ ande zul¨aßt. Genau wie in der klassischen Mechanik sind je nach Art der Wechselwirkung und Energie des Teilchens prinzipiell beide Bewegungstypen m¨oglich (man denke etwa an das KeplerProblem mit seinen gebundenen elliptischen Zust¨anden und seinen hyperbolischen Streuzust¨anden). Jedoch ergibt sich bei gebundenen Zust¨anden ein wesentlicher Unterschied zur klassischen Physik: Gebundene Zust¨ande in der Quantenmechanik sind stets diskret. Wir wollen diese Aussage hier nicht allgemein beweisen. Anschaulich ist dieses Verhalten aber wie folgt zu verstehen: F¨ ur ein kastenf¨ormiges Potential V mit V (x ∈ [−a : a]) = −V0 < 0, V (x ∈ [−a : a]) = 0 gibt es zwei Umkehrpunkte, n¨amlich die Potentialw¨ande bei x = ±a, zwischen denen ein klassisches Teilchen mit beliebiger Energie oszillieren kann. Quantenmechanisch kann sich das Teilchen jedoch auch im klassisch verbotenen Gebiet (hinter den W¨anden) aufhalten, also u ¨ber die Umkehrpunkte hinausschießen. Allerdings muß in diesem Bereich die Wellenfunktion der zeitunabh¨angigen Schr¨odinger-Gleichung exponentiell abfallen. 8
F¨ ur unendliche Sprungstellen (z.B. δ-Potential) gilt diese Argumentation nicht (siehe Anwendung 41).
3.3 Eindimensionale Systeme
281
Die Stetigkeitsbedingungen der Wellenfunktion an der Grenze zwischen klassisch erlaubtem (oszillatorischem) und verbotenem (exponentiellem) Bereich f¨ uhrt dazu, daß nur L¨ osungen zu ganz bestimmten, diskreten Energien existieren. In den nun zu besprechenden Beispielen werden wir folgende Punkte explizit verifizieren: • Das gebundene Spektrum ist diskret, und es existiert stets ein gebundener Zustand, der sog. Grundzustand. Seine Wellenfunktion hat keinen Nulldurchgang. • Im eindimensionalen Fall sind die gebundenen Zust¨ ande nichtentartet. • Liegen bei einem symmetrischen Potential mehrere gebundene Zust¨ ande vor, so wechseln sich gerade und ungerade Wellenfunktionen ab, wobei die Zahl ihrer Nulldurchg¨ ange jeweils um Eins zunimmt. 3.3.2 Zerfließen eines freien Wellenpaketes Das einfachste eindimensionale Problem ist das eines freien Teilchens. Die zugeh¨orige klassische Hamilton-Funktion lautet p2 , 2m wobei m die Masse des Teilchens bezeichnet. Da in dieser Gleichung nur der Impuls als dynamische Variable auftritt, bietet sich zur L¨ osung des entsprechenden quantenmechanischen Problems die Impulsdarstellung an, in der die Schr¨ odinger-Gleichung die Gestalt H(x, p) =
i¯ h
d p2 ϕ(p, t) = ϕ(p, t) dt 2m
bzw. d h2 k 2 ¯ ϕ(k, t) = ϕ(k, t) dt 2m annimmt. Die allgemeine L¨ osung dieser Gleichung ist i¯ h
¯ k2 h , 2m wobei φ(k) eine beliebige Funktion von k ist, die f¨ ur ein physikalisches Teilchen mit endlicher Impulsbreite die Normierungsbedingung 1 φ(k)| φ(k) = ϕ(k, t)| ϕ(k, t) = h ¯ zu erf¨ ullen hat. Die entsprechende L¨ osung im Ortsraum ergibt sich nach Satz 3.13 zu
h ¯ h ¯ ikx dkϕ(k, t)e = dkφ(k)ei(kx−ωt) . ψ(x, t) = 2π 2π ϕ(k, t) = φ(k)e−iωt , ω =
282
3. Quantenmechanik
Es soll nun die zeitliche Entwicklung einer Ortswellenfunktion ψ untersucht werden, wobei wir annehmen, daß sie zum Zeitpunkt t = 0 durch folgende normierte Gauß-Funktion gegeben sei: x2 1 ψ(x, 0) = √ e− 2∆2 eik0 x , k0 > 0 . (3.20) ∆π 1/4 Sie beschreibt ein Teilchen, das sich mit dem mittleren Impuls P = h ¯ k0 bewegt. Damit folgt nach Satz 3.13 √ 2 1 ∆ − ∆2 (k−k0 )2 − x 2 −i(k−k0 )x 2 φ(k) = √ dxe 2∆ e =√ e . 3/4 2¯ h∆π ¯hπ 1/4 F¨ ur die Ortswellenfunktion ergibt sich √ 2 ∆2 i¯ hk 2 t ∆ dke− 2 (k−k0 ) eikx e− 2m ψ(x, t) = √ 3/4 2π √ k0 t 2 x − h¯ m ¯hk0 t ∆ exp ik0 x − , (3.21) = exp − 2α(t) 2m α(t)π 1/4 mit ¯t h . m Man erh¨ alt schließlich f¨ ur die Wahrscheinlichkeitsdichte |ψ(x, t)|2 k0 t 2 x − h¯ m 1 2 ∗ , |ψ(x, t)| = ψ (x, t)ψ(x, t) = exp − β(t) πβ(t) α(t) = ∆2 + i
mit ¯ 2 t2 h . ∆ 2 m2 Offenbar folgt |ψ(x, t)|2 einer Gauß-Verteilung, deren Breite β(t) mit der Zeit zunimmt. Der Schwerpunkt des Wellenpaketes bewegt sich dabei mit der Geschwindigkeit h ¯ k0 /m = p0 /m. Anhand dieses Beispiels k¨onnen wir die Heisenbergsche Unsch¨arferelation f¨ ur Ort und Impuls explizit nachpr¨ ufen: h ¯ k0 t 2 x− m ¯hk0 t 1 = dxx exp − X = √ β m πβ 2 k0 t ? 2= x − h¯ m β 1 ¯h2 k02 t2 = + dxx2 exp − X = √ 2 m2 β πβ 2 2 ∆ dkke−∆ (k−k0 ) = h P = √ ¯ k0 π ? 2= 2 2 ∆¯h ¯h2 dkk2 e−∆ (k−k0 ) = P = √ +h ¯ 2 k02 . 2∆2 π ¯h β(t) ¯h =⇒ ∆X · ∆P = ≥ . 2∆ 2 β(t) = ∆2 +
3.3 Eindimensionale Systeme
283
3.3.3 Potentialstufe Man betrachte ein Teilchen, das sich in einem stufenf¨ ormigen Potential der Form 5 0 f¨ ur x < 0 V (x) = V0 Θ(x) , Θ(x) = , V0 > 0 ur x ≥ 0 1 f¨ bewegt (siehe Abb. 3.1). Zur L¨ osung dieses Problems bestimmen wir zun¨ achst ur ein Teilchen mit festem Imdie Eigenfunktionen und Energieeigenwerte f¨ puls. Sie ergibt sich in der Ortsdarstellung als L¨ osung der station¨ aren Schr¨ odinger-Gleichung (3.18). Anschließend betrachten wir den quantenmechanisch realistischeren Fall der Streuung eines Wellenpaketes an diesem Potential. V
V0
I
II x
Abb. 3.1. Eindimensionale Potentialstufe
L¨ osung der Schr¨ odinger-Gleichung f¨ ur festen Impuls. Bei der Angabe der station¨ aren L¨ osungen in den Bereichen I und II sind zwei F¨ alle zu unterscheiden: 1. Fall: > U0 . Hier setzt sich die allgemeine L¨ osung in beiden Bereichen aus Sinus- und Cosinus-Schwingungen zusammen, und wir k¨ onnen ansetzen: √ ik1 x −ik1 x ΨI (x) = Ae + Be , k1 = √ ΨII (x) = Ceik2 x , k2 = − U0 = k12 − U0 . Prinzipiell k¨ onnte ΨII noch einen Term proportional zu e−ik2 x enthalten, der einer von +∞ in negativer x-Richtung einlaufenden Welle entspricht. Wir wollen uns hier aber auf den Fall beschr¨ anken, daß nur von links eine Welle auf die Potentialstufe zul¨ auft, so daß im Bereich II nur ein nach rechts laufender transmittierter Anteil erscheint. Die Konstanten A, B und C ergeben sich aus den Stetigkeitsbedingungen
284
3. Quantenmechanik
⎧ − k 2 − U0 k ⎪ 1 ⎪ 1 ⎪ ⎨B = A ΨI (0) = ΨII (0) k1 + k12 − U0 =⇒ ⎪ 2k ⎪ ΨI (0) = ΨII (0) ⎪ 1 . ⎩C = A k1 + k12 − U0 2. Fall: 0 ≤ ≤ U0 . Im Bereich II zeigt die L¨osung ein exponentielles Verhalten, was uns zu folgendem Ansatz f¨ uhrt: √ ik1 x −ik1 x ΨI (x) = Ae + Be , k1 = √ ΨII (x) = Ce−k2 x , k2 = U0 − = U0 − k12 . Ein exponentiell anwachsender Term ek2 x im Bereich II ist unphysikalisch, da seine Norm dort divergiert; er scheidet deshalb aus. F¨ ur die Konstanten folgt ik1 + U0 − k12 ik1 + k2 B =A =A ik1 − k2 ik1 − U0 − k12 C =A
2ik1 2ik 1 =A . ik1 − k2 ik1 − U0 − k12
In beiden F¨ allen setzt sich die L¨osung aus einer einfallenden Welle ψI , einer reflektierten Welle ψR und einer transmittierten Welle ψT zusammen und unterscheidet sich damit wesentlich von der jeweiligen klassischen Situation. Im ersten Fall w¨ urde ein klassisches Teilchen ab der Stelle x = 0 langsamer weiterfliegen, ohne reflektiert zu werden, w¨ahrend es im zweiten Fall vollst¨andig reflektiert w¨ urde. Die Tatsache, daß die Aufenthaltswahrscheinlichkeit f¨ ur ein quantenmechanisches Teilchen hinter dem Potentialsprung f¨ ur < U0 nicht Null ist, nennt man Tunneleffekt. Zwei interessante, einen Streuprozeß charakterisierende Gr¨oßen sind der Reflexions- und Transmissionskoeffizient, die in folgender Weise definiert sind: Definition: Reflexions- und Transmissionskoeffizient R, T Seien jI , jR , jT die Stromdichten der einlaufenden, reflektierten und transmittierten Wellenfunktionen, dann ist jT jR R = , T = , T = 1 − R . jI jI Die letzte Beziehung spiegelt die globale Stromerhaltung wider und folgt aus Satz 3.14. Reflexions- und Transmissionskoeffizient beschreiben also den Anteil des reflektierten bzw. transmittierten Teilchenstroms relativ zum einfallenden Strom. Sie lauten f¨ ur dieses Problem:
3.3 Eindimensionale Systeme
1. Fall:
2 B 2k12 − U0 − 2k1 k12 − U0 R = = 2 A 2k1 − U0 + 2k1 k12 − U0 2 2 C 4k1 k12 − U0 k1 − U0 T = = 2 A k1 2k1 − U0 + 2k1 k12 − U0
285
⎫ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ .⎪ ⎭
(3.22)
2. Fall: R = 1 , T = 0. Ist beim 1. Fall sehr viel gr¨ oßer als U0 , dann findet praktisch keine Reflexion statt, d.h. die von links einfallende Welle tritt ungehindert durch. Man beachte: Obwohl beim 2. Fall die Aufenthaltswahrscheinlichkeit im Bereich II ungleich Null ist, findet keine Nettobewegung in positiver x-Richtung statt. Streuung eines Wellenpaketes. Um nun die Bewegung eines physikalischen Teilchens zu beschreiben, hat man aus obigen L¨ osungsfunktionen ein Wellenpaket zu bilden und seine Propagation in der Zeit zu verfolgen. In realen experimentellen Situationen besitzt dieses Wellenpaket einen relativ scharfen Impuls, was zu einer großen Ortsunsch¨ arfe f¨ uhrt. Der bisher betrachtete Fall (mit seinen im ganzen Raum ausgedehnten L¨ osungsfunktionen) ist somit als Grenzfall einer verschwindenden Impulsunsch¨ arfe anzusehen und ¨ stellt eine gute N¨ aherung f¨ ur sehr kleine Impulsbreiten dar. Diese Uberlegung u bertr¨ a gt sich auch auf andere Potentialformen, und wir k¨ o nnen ganz ¨ allgemein festhalten: Satz 3.15: Reflexions- und Transmissionskoeffizient eines Wellenpaketes Der reflektierte und transmittierte Anteil eines Wellenpaketes mit kleiner Impulsunsch¨ arfe h¨ angt nur vom Mittelwert der Impulsverteilung ab. Im folgenden u ufen wir die G¨ ultigkeit dieses Satzes, indem wir zeigen, ¨berpr¨ daß Reflexions- und Transmissionskoeffizient bei scharfem Impuls identisch sind mit den Aufenthaltswahrscheinlichkeiten 0 ∞ dx|ψ(x, t → ∞)|2 , T = dx|ψ(x, t → ∞)|2 R = −∞
0
f¨ ur ein Teilchen, dessen einlaufendes Wellenpaket einen mittleren und scharfen Impuls h ¯ k0 hat und durch folgende Gauß-Verteilung (vgl. (3.20)) gegeben ist: (x+a)2 1 e− 2∆2 eik0 (x+a) , a ∆ 1 . ψ(x, 0) = ΨI (x) = √ 1/4 ∆π Hierbei w¨ ahlen wir a ∆, so daß sich das gesamte Wellenpaket anfangs weit links vor der Potentialstufe befindet. Unter der Annahme, daß k02 > U0
286
3. Quantenmechanik
(1. Fall), l¨ aßt sich die allgemeine L¨osung von (3.18) zu festem Impuls in der Form 6 B(k1 ) −ik1 x ik1 x e Ψk1 (x) = A e Θ(−x) + A 7 C(k1 ) ik2 (k1 )x + e Θ(x) A schreiben. F¨ ur die Projektion Ψk1 | ΨI gilt dann bis auf eine Konstante φ(k1 ) = Ψk1 | ΨI 6 ∗ B ∗ −ik1 x ik1 x dx e Θ(−x)ΨI (x) =A + e A 7 ∗ C + dx e−ik2 x Θ(x)ΨI (x) . A Das dritte Integral liefert in sehr guter N¨aherung keinen Beitrag, weil ΨI (x) nach unseren Voraussetzungen keine Ausdehnung im Bereich x ≥ 0 hat. Ebenso verschwindet das zweite Integral, da ΨI im Impulsraum ein ausgepr¨ agtes Maximum um k0 > 0 hat und somit orthogonal zu negativen Impulszust¨ anden ist. φ ist also gerade die Fourier-Transformierte von ΨI : ∗ dxe−ik1 x ΨI (x) φ(k1 ) ≈ A (x+a)2 A∗ = √ dxe−ik1 x eik0 (x+a) e− 2∆2 1/4 ∆π √ ∗ A 2π∆ ik1 a − ∆2 (k1 −k0 )2 = e e 2 . π 1/4 Wie wir gleich sehen werden, liefert 1 A = A∗ = √ 2π die korrekte Normierung. F¨ ur ψ(x, t) folgt nun E(k1 )t ψ(x, t) ≈ dk1 φ(k1 )Ψk1 (x)e−i h¯ √ i¯ hk 2 t 2 ∆2 ∆ 1 dk1 eik1 a e− 2 (k1 −k0 ) e− 2m = √ 3/4 2π C ik2 x B −ik1 x ik1 x Θ(−x) + e × e + e Θ(x) . A A Der erste Term berechnet sich unter Verwendung von (3.21) zu Θ(−x)G(−a, k0 , t) = ψI (x, t) , mit
(3.23)
3.3 Eindimensionale Systeme
√
k0 t x + a − h¯ m 2α(t) α(t)π 1/4 hk0 t ¯ , × exp ik0 x + a − 2m
G(−a, k0 , t) =
∆
287
2
exp −
und stellt das von x = −a kommende, in positive Richtung auf das Potential zulaufende Wellenpaket dar. Sein Schwerpunkt ist f¨ ur große Zeiten gegeben durch X = −a + h ¯ k0 t/m ≈ ¯ hk0 t/m > 0 so daß das Produkt Θ(−x)G(−a, k0 , t) im Limes t → ∞ verschwindet. F¨ ur t = 0 haben wir ψI (x, 0) = ΨI (x), was obige Wahl der Normierungskonstante A rechtfertigt. Der zweite Term liefert B(k0 ) G(a, −k0 , t) = ψR (x, t) , (3.24) Θ(−x) A wobei der Quotient B/A aufgrund der scharfen Impulsverteilung von φ(k1 ) um k0 vor das Integral gezogen wurde. ψR (x, t) beschreibt das reflektierte Wellenpaket, welches, urspr¨ unglich von x = +a kommend, in negativer Richtung l¨ auft. F¨ ur große t befindet sich sein Schwerpunkt bei X = a − ¯ hk0 t/m ≈ −¯ hk0 t/m < 0 so daß der Faktor Θ(−x) in (3.24) fortgelassen werden kann. Es ergibt sich somit
0
R ≈
∞ dx|ψ(x, t → ∞)| ≈
dx|ψR (x, t → ∞)|2
2
−∞
−∞
∞ B(k0 ) 2 B(k0 ) 2 2 . dx|G(a, −k0 , t → ∞)| = ≈ A A −∞
Der dritte Term in (3.23) beschreibt den transmittierten Anteil ψT von ψ, dessen Berechnung zur Bestimmung von T nicht erforderlich ist, da aufgrund der Erhaltung der Norm und der Orthonormalit¨ at von ψR und ψT gilt: ψI | ψ I = ψR + ψ T | ψ R + ψ T = R + T = 1 C(k0 ) 2 k02 − U0 =⇒ T ≈ . A k0 R und T stimmen also in der Tat mit den Reflexions- und Transmissionskoeffizienten R und T aus (3.22) f¨ ur ein Teilchen mit festem Impuls u ¨berein. 3.3.4 Potentialkasten Gegeben sei der kastenf¨ ormige Potentialverlauf 5 0 f¨ ur −a ≤ x ≤ a V (x) = , V0 > 0 , V0 sonst
288
3. Quantenmechanik V
V0
I
II −a
III a
x
Abb. 3.2. Eindimensionaler Potentialkasten
in dem sich ein Teilchen bewegt (siehe Abb. 3.2). Ausgangspunkt zur L¨osung dieses Problems ist wieder die zeitunabh¨angige Schr¨odinger-Gleichung (3.18) in der Ortsdarstellung. In ihr ergeben sich je nach Gr¨oße von folgende zwei Fallunterscheidungen: Gebundene Zust¨ ande: < U0 . ΨI (x) = Aek1 x
, k1 =
ΨII (x) = B cos(k2 x) + C sin(k2 x) , k2 =
√ √
U0 − =
U0 − k22
ΨIII (x) = De−k1 x . Hierbei wurde ΨII aus Bequemlichkeitsgr¨ unden in trigonometrischer Form angesetzt. Die Konstanten ergeben sich wieder aus den Stetigkeitsbedingungen der Funktionen und ihrer Ableitungen an den Bereichsgrenzen: Ae−k1 a = B cos(k2 a) − C sin(k2 a) k1 Ae−ik1 a = k2 [B sin(k2 a) + C cos(k2 a)] De−k1 a = B cos(k2 a) + C sin(k2 a) −k1 De−k1 a = k2 [−B sin(k2 a) + C cos(k2 a)] . Die Kombination der ersten und der letzten beiden Gleichungen f¨ uhrt zu k1 = k2
B sin(k2 a) + C cos(k2 a) B sin(k2 a) − C cos(k2 a) = k2 , B cos(k2 a) − C sin(k2 a) B cos(k2 a) + C sin(k2 a)
woraus sich die Bedingung BC = 0 ergibt. Das heißt entweder ist C = 0, und die L¨ osungen sind in x gerade (positive Parit¨at), oder es gilt B = 0, und die L¨ osungen sind in x ungerade (negative Parit¨at). Dieser Zusammenhang ergibt sich nat¨ urlich aus der symmetrischen Form des Potentials. F¨ ur die geraden L¨ osungen folgt die Bedingung U0 − k22 k1 tan k2 a = = k2 k2
3.3 Eindimensionale Systeme
bzw.
289
U0 − y 2 , y = k2 a , U0 = a2 U0 . y In Abb. 3.3 sind die Funktionen tan y und U0 − y 2 /y gegen y aufgetragen. Die zul¨ assigen y-Werte sind gerade die Schnittpunkte der beiden Kurven. Man erkennt, daß es um so mehr gebundene Zust¨ ande gibt, je h¨ oher der Potentialkasten ist. In jedem Fall liegt jedoch mindestens ein gebundener Zustand vor, der Grundzustand. Die entsprechende Bedingung f¨ ur die ungeraden L¨ osungen lautet U0 − y 2 π = − cot y = tan y + 2 y tan y =
U0 groß
U0 klein
y 0 π 2π 3π 4π Abb. 3.3. Graphische Schnittpunktsbestimmung der Funktionen tan y und U0 − y 2 /y f¨ ur die geraden L¨ osungen des gebundenen Falls
U0 groß
U0 klein
y 0 π 2π 3π 4π Abb. 3.4. Graphische Schnittpunktsbestimmung der Funktionen tan (y + π/2) und U0 − y 2 /y f¨ ur die ungeraden L¨ osungen des gebundenen Falls
290
3. Quantenmechanik
und ist in Abb. 3.4 graphisch veranschaulicht. Hier kann es offensichtlich vorkommen, daß es keinen gebundenen Zustand gibt, wenn der Potentialtopf zu flach ist. Betrachtet man die gefundenen L¨osungen im Zusammenhang mit Abb. 3.3 und 3.4, so l¨aßt sich folgendes feststellen: Die Wellenfunktion des Grundzustandes ist eine gerade Funktion und besitzt keinen Nulldurchgang. ¨ Beim Ubergang zu h¨oheren Anregungen wechselt die Symmetrie der Wellenfunktion zwischen gerade und ungerade, wobei die Zahl der Nulldurchg¨ange jeweils um Eins zunimmt. Ungebundene Zust¨ ande: ≥ U0 . Hier wollen wir uns wieder auf eine nur von links einlaufende Welle beschr¨anken. Die allgemeine L¨osung lautet dann ⎫ √ ΨI (x) = Aeik1 x + Be−ik1 x , k1 = − U0 = k22 − U0 ⎪ ⎪ ⎪ ⎬ √ ik2 x −ik2 x (3.25) ΨII (x) = Ce + De , k2 = ⎪ ⎪ ⎪ ⎭ ΨIII (x) = Eeik1 x , wobei sich die Konstanten aus den Stetigkeitsbedingungen k1 k2
Ae−ik1 a + Beik1 a = Ce−ik2 a + Deik2 a Ae−ik1 a − Beik1 a = k2 Ce−ik2 a − Deik2 a
Ceik2 a + De−ik2 a = Eeik1 a Ceik2 a − De−ik2 a = k1 Eeik1 a
ergeben. Nach einiger Rechnung erh¨alt man f¨ ur den Reflexions- und Transmissionskoeffizienten (k12 − k22 )2 sin2 2k2 a 4k12 k22 + (k12 − k22 )2 sin2 2k2 a 4k12 k22 T = . 4k12 k22 + (k12 − k22 )2 sin2 2k2 a
R =
Wie im vorigen Beispiel gibt es auch hier f¨ ur U0 praktisch keine Reflexion. Ein interessanter Spezialfall ergibt sich f¨ ur sin 2k2 a = 0, also f¨ ur nπ 2 = , n = 1, 2, . . . , 2a wo der Reflexionskoeffizient exakt verschwindet. 3.3.5 Harmonischer Oszillator Manchmal ist es einfacher, ein quantenmechanisches Problem algebraisch, d.h. darstellungsunabh¨angig zu l¨osen. Ein Beispiel hierf¨ ur ist der harmonische Oszillator, dessen klassische Hamilton-Funktion gegeben ist durch H(x, p) =
p2 mω 2 2 + V (x) , V (x) = x . 2m 2
3.3 Eindimensionale Systeme
291
Die zugeh¨orige darstellungsfreie Schr¨ odinger-Gleichung lautet i¯ h
d | ψ(t) = H(X, P ) | ψ(t) dt
H(X, P ) = H =
mω 2 2 P2 + X . 2m 2
F¨ uhrt man nun die Operatoren √ i 1 P mωX + √ A= √ mω 2¯ h √ 1 i A† = √ P mωX − √ mω 2¯ h ein, so gilt
1 H=h ¯ω A A + 2 †
(Absteigeoperator) (Aufsteigeoperator)
und [A, A† ] = 1 , [H, A] = −¯ hωA , [H, A† ] = h ¯ ωA† . Die Berechnung des Spektrums des hermiteschen Hamilton-Operators H aus der Eigenwertgleichung 1 ¯ω n + H | n = En | n , En = h 2 ist offenbar ¨ aquivalent zur Bestimmung des Spektrums des ebenfalls hermiteschen Operators N = A† A aus der Gleichung N | n = n | n , wobei N den Besetzungszahloperator bezeichnet. Die Eigenvektoren und Eigenwerte des Operators N ergeben sich aus folgenden Betrachtungen: • Aus obigen Kommutatorrelationen ergibt sich N A | n = A(N − 1) | n = (n − 1)A | n N A† | n = A† (N + 1) | n = (n + 1)A† | n . Ist also | n ein Eigenzustand von N zum Eigenwert n, dann sind A | n und A† | n Eigenzust¨ ande zu den Eigenwerten n − 1 bzw. n + 1. Mit Hilfe der Auf- und Absteigeoperatoren lassen sich somit die zu | n benachbarten Zust¨ande und Energien in auf- bzw. absteigender Richtung konstruieren, und man erh¨ alt auf diese Weise einen vollst¨ andigen diskreten Satz von Eigenzust¨anden mit den zugeh¨ origen Energien.
292
3. Quantenmechanik
• S¨ amtliche Energieeigenwerte sind positiv: = 1 ? ¯ω En = n| H |n = h + n| A† A |n 2 = 1 ? † + n| A |m m| A |n =h ¯ω 2 m 1 =h ¯ω + | m| A |n |2 > 0 . 2 m • Sei | 0 der Zustand mit dem kleinsten Energieeigenwert E0 = h ¯ ω/2 (Nullpunktsenergie), dann muß offensichtlich gelten: A | 0 = 0 . In der Ortsdarstellung ergibt sich hieraus die Differentialgleichung √ 1 ¯h d √ Ψ0 (x) = 0 , mωx + √ mω dx 2¯ h deren normierte L¨osung durch √ b2 2 b mω Ψ0 (x) = 1/4 e− 2 x , b2 = ¯h π gegeben ist. • Mit A† | n = αn+1 | n + 1 , A | n = βn−1 | n − 1 finden wir f¨ ur die Koeffizienten ? = 2 |αn+1 | = n| AA† |n = n| N + 1 |n = n + 1 ? = |βn−1 |2 = n| A† A |n = n| N |n = n . Hierbei k¨ onnen etwaige Phasen vernachl¨assigt werden, so daß folgt: | n + 1 = √
1 1 A† | n , | n − 1 = √ A | n . n n+1
Die Iteration der ersten Beziehung f¨ uhrt zu der Gleichung 1 | n = √ (A† )n | 0 , n ∈ N . n! Diese geht im Ortsraum u ¨ber in
n mω 1 d Ψn (ˆ x. x) = √ Ψ0 (ˆ x) , x ˆ= x ˆ− n dˆ x ¯h 2 n!
Anwendungen
293
Zusammenfassung • Eindimensionale Systeme sind aufgrund ihrer Einfachheit besonders geeignet, die wesentlichen Eigenschaften der Quantentheorie zu studieren. Es zeigt sich z.B., daß die Breite eines Teilchenwellenpaketes mit der Zeit zunimmt; das Wellenpaket zerfließt“. ” • L¨ auft ein Teilchenwellenpaket auf eine Potentialstufe zu, dann h¨ angt sein Verhalten in folgender Weise von seiner Energie ab: Ist seine Energie gr¨ oßer als das Potential, dann wird ein Teil des Wellenpaketes reflektiert (Reflexionskoeffizient R), w¨ ahrend der andere transmittiert wird (Transmissionskoeffizient T ). Ist dagegen die Energie des einlaufenden Wellenpaketes kleiner, dann findet keine Transmission statt (T = 0). Trotzdem dringt auch hier das Wellenpaket in den klassisch verbotenen Bereich ein. Im allgemeinen reicht es zur Berechnung von R und T aus, sich auf die statischen L¨ osungen mit ihren im ganzen Raum ausgedehnten Ortswellenfunktionen zu beschr¨ anken, da sie reale experimentelle Situationen (kleine Impulsunsch¨ arfe) gut approximieren. • Beim Studium des Potentialkastens ergeben sich je nach Teilchenenergie zwei Klassen von L¨ osungen. Ist die Teilchenenergie gr¨ oßer als das Potential, dann erh¨ alt man ungebundene Zust¨ ande (kontinuierliches Spektrum), die wieder reflektierte und transmittierte Anteile enthalten. Ist die Teilchenenergie kleiner, dann ergeben sich nur f¨ ur bestimmte Werte der Teilchenenergie gebundene Zust¨ande (diskretes Spektrum). • Der harmonische Oszillator ist ein Beispiel daf¨ ur, daß sich manche Probleme auch darstellungsfrei und somit sehr elegant l¨ osen lassen.
Anwendungen 40. Potentialwall. Ein eindimensionales Teilchen der Masse m und der Energie E werde von x = −∞ kommend auf den Potentialwall 5 ur −a ≤ x ≤ a V0 f¨ , V0 > 0 V (x) = 0 sonst geschossen (Abb. 3.5). Man berechne den Transmissionskoeffizienten T f¨ ur die beiden F¨ alle 0 ≤ E ≤ V0 und E > V0 . L¨ osung. Die station¨ are Schr¨ odinger-Gleichung f¨ ur das vorliegende Problem lautet d2 Ψ 2mV (x) 2mE = [U (x) − ]Ψ (x) , U (x) = , = dx2 h2 ¯ h2 ¯ und wird gel¨ ost durch den Ansatz
294
3. Quantenmechanik V
V0
I
II
III
−a
a
x
Abb. 3.5. Eindimensionaler Potentialwall
√ , κ2 = − U0
ΨI (x) = Aeiκ1 x + Be−iκ1 x , κ1 = ΨII (x) = Ceiκ2 x + De−iκ2 x ΨIII (x) = Eeiκ1 x .
Dieser ist formgleich zum Ansatz (3.25) f¨ ur den ungebundenen Fall des Potentialkastens, wenn man dort die Ersetzung k1 −→ κ1 , k2 −→ κ2 vornimmt. Wir k¨onnen den dortigen Transmissionskoeffizienten unmittelbar u ¨bernehmen und erhalten: 1. Fall: ≥ U0 . T =
4 ( − U0 ) √ . 4 ( − U0 ) + U02 sin2 (2a − U0 )
2. Fall: 0 ≤ < U0 . T =
4 (U0 − ) . √ 4 (U0 − ) + U02 sinh2 (2a U0 − )
Beim ersten Fall n¨ahert sich der Transmissionskoeffizient f¨ ur U0 der Eins. F¨ ur die speziellen Energiewerte nπ 2 = U0 + , n = 1, 2, . . . 2a ist T exakt gleich Eins, d.h. es findet keine Reflexion statt. Im zweiten Fall sinkt T bei vorgegebener Energie erwartungsgem¨aß mit wachsender Potentialh¨ ohe U0 und Potentialbreite a. 41. δ-Potential. Man betrachte ein eindimensionales Teilchen der Masse m und der Energie E, das von x = −∞ kommend auf das δ-Potential V (x) = V0 δ(x − x0 ) zul¨ auft. Wie lauten die L¨osungen der zugeh¨origen Schr¨odinger-Gleichung? Man zeige, daß f¨ ur V0 < 0 genau ein gebundener Zustand existiert.
Anwendungen
295
L¨ osung. Die Schr¨ odinger-Gleichung lautet d2 Ψ = [U (x) − ]Ψ (x) , U (x) = U0 δ(x − x0 ) , dx2
(3.26)
mit 2mV0 2mE , = . ¯h2 h2 ¯ Da wir es hier mit einer unendlichen Unstetigkeit an der Stelle x0 zu tun haben, m¨ ussen die ersten Ableitungen der Wellenfunktionen der Bereiche I (x < x0 ) und II (x ≥ x0 ) folgender Bedingung gen¨ ugen, die sich aus (3.26) ergibt: x0 +δ d Ψ (x0 + δ) − Ψ (x0 − δ) = dx Ψ (x) dx U0 =
x0 −δ
x0 +δ
x0 +δ
dxδ(x − x0 )Ψ (x) −
= U0 x0 −δ
dxΨ (x)
x0 −δ
=⇒ Ψ (x0 + δ) − Ψ (x0 − δ) = U0 Ψ (x0 ) . F¨ ur ≥ 0 lautet der L¨ osungsansatz ΨI (x) = Aeikx + Be−ikx , k = ΨII (x) = Ceikx .
√
Die Konstanten ergeben sich aus den Stetigkeitsbedingungen Aeikx0 + Be−ikx0 = Ceikx0 ik(Ceikx0 − Aeikx0 + Be−ikx0 ) = U0 Ceikx0 zu U0 e2ikx0 2ik , C=A , 2ik − U0 2ik − U0 woraus f¨ ur den Transmissions- und Reflexionskoeffizienten folgt: 2 C 4k 2 U02 T = = 2 , R = 1 − T = . A 4k + U 2 4k 2 + U 2 B=A
0
0
Ist U0 < 0, dann sind auch gebundene Zust¨ ande ( < 0) denkbar. Hierf¨ ur lautet der physikalisch sinnvolle Ansatz √ ΨI (x) = Aekx , k = − ΨII (x) = Be−kx . Die zugeh¨ origen Stetigkeitsbedingungen f¨ uhren hier zu den Gleichungen ke2kx0 , U0 + k osbar sind. Das heißt es gibt die offensichtlich nur f¨ ur k = −U0 /2 gleichzeitig l¨ nur einen einzigen gebundenen Zustand. B = Ae2kx0 , B = −A
296
3. Quantenmechanik
3.4 Quantenmechanische Drehimpulse Viele dreidimensionale quantenmechanische Probleme sind zentralsymmetrisch und lassen sich daher am einfachsten in der polaren Ortsdarstellung l¨ osen, in der die kartesischen Koordinaten durch Kugelkoordinaten ausgedr¨ uckt werden. Dabei spielt der Begriff des quantenmechanischen Drehimpulses eine u ¨beraus wichtige Rolle. Zur Vorbereitung auf folgende Abschnitte, die sich mit der dreidimensionalen Schr¨odinger-Gleichung besch¨aftigen, wollen wir nun den Drehimpuls etwas n¨aher betrachten. Uns interessiert hierbei vor allem die L¨ osung des Eigenwertproblems sowie die Addition bzw. Kopplung von Drehimpulsoperatoren. 3.4.1 Allgemeine Eigenschaften Der quantenmechanische Drehimpulsoperator ist seiner klassischen Definition entsprechend gegeben durch L=X ×P und besitzt in der kartesischen ∂ ∂ Lx = −i¯ −z h y ∂z ∂y ∂ ∂ Ly = −i¯ h z −x ∂x ∂z ∂ ∂ Lz = −i¯ −y h x ∂y ∂x
Ortsdarstellung die Komponenten ⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ (3.27)
⎪ ⎪ ⎪ ⎪ ⎪ ⎪ .⎪ ⎭
Man erh¨ alt hieraus z.B. die Vertauschungsrelationen [Lx , Ly ] = i¯ hLz , , [Lz , Lx ] = i¯ hLy , , [Ly , Lz ] = i¯ hLx und allgemein h ijk Lk . [Li , Lj ] = i¯ Wie sp¨ ater gezeigt wird, gibt es neben L noch andere Operatoren, die ebenfalls diesen Vertauschungsrelationen gen¨ ugen. Wir wollen deshalb den Drehimpuls-Begriff allgemeiner fassen und definieren: Definition: Drehimpuls J Ein hermitescher Vektoroperator J heißt Drehimpuls, falls seine Komponenten der Kommutatoralgebra [J i , J j ] = i¯ h ijk J k , [J i , J 2 ] = 0
(3.28)
gen¨ ugen. Letztere Beziehung folgt dabei automatisch aus der ersten.
3.4 Quantenmechanische Drehimpulse
297
Dementsprechend ist der soeben eingef¨ uhrte Drehimpuls L als ein Spezialfall anzusehen. Wir werden ihn im weiteren Verlauf mit Bahndrehimpuls bezeichnen. Aufgrund der Hermitezit¨ at von J (und damit seiner Komponenten) gilt f¨ ur das Normquadrat der Zustandsvektors J i | ψ ? = 0 ≤ ψJ i | J i ψ = ψ| J 2i |ψ . Das heißt die Operatoren J 2i besitzen nur nichtnegative Eigenwerte und somit auch J 2 . Da die Drehimpulskomponenten J i mit J 2 vertauschen, existiert ein System von gemeinsamen Eigenvektoren von J 2 und einem der Komponenten, z.B. J z . Ohne Beweis setzen wir voraus, daß dieses Basissystem vollst¨ andig ist (sonst w¨ are J keine Observable). Wir fassen nun die L¨ osung des Eigenwertproblems von J 2 und J z im folgenden Satz zusammen, der direkt im Anschluß bewiesen wird: Satz 3.16: Eigenwertproblem des Drehimpulsoperators J Bezeichnen | j, m die Vektoren der gemeinsamen Eigenbasis von J 2 und J z , so k¨onnen die zugeh¨ origen Eigenwertgleichungen in der Form J 2 | j, m = h ¯ 2 j(j + 1) | j, m , J z | j, m = h ¯ m | j, m geschrieben werden. Es gilt dann: 1. Die m¨ oglichen Werte f¨ ur die Quantenzahl j von J 2 sind 3 1 j = 0, , 1, , 2, . . . . 2 2 2. Die m¨oglichen Werte f¨ ur die Quantenzahl m von J z sind m = −j, −j + 1, . . . , j − 1, j . Das heißt j ist (2j + 1)-fach entartet. 3. Geht man davon aus, daß die Zust¨ ande | j, j und | j, −j auf Eins normiert sind (sie beschreiben die Zust¨ ande, deren Drehimpulse in bzw. gegen die z-Richtung orientiert sind), dann ergeben sich die normierten Zust¨ ande mit den Quantenzahlen (j, m) zu (j + m)! | j, m = h ¯ m−j J j−m | j, j (2j)!(j − m)! − (j − m)! −m−j =h ¯ J j+m | j, −j , (2j)!(j + m)! + mit J + = J x + iJ y , J − = J †+ = J x − iJ y .
298
3. Quantenmechanik
Beweis. Zu 2. F¨ ur die Operatoren J + und J − gelten die Relationen [J z , J ± ] = ±¯ hJ ± , [J + , J − ] = 2¯ hJ z , [J 2 , J ± ] = 0 und 1 (J + J − + J − J + ) + J 2z 2 = J 2 − J 2z + h ¯J z 2 2 = J − J z − ¯hJ z .
J2 = J +J − J −J + Somit folgt
⎫ ¯ 2 (j − m)(j + m + 1) j, m| j, m ⎬ j, m| J − J + |j, m = h j, m| J + J − |j, m = h ¯ 2 (j + m)(j − m + 1) j, m| j, m . ⎭
(3.29)
Diese Ausdr¨ ucke sind gerade das Normquadrat der Zust¨ande J + | j, m bzw. J − | j, m und somit nichtnegativ. Hieraus ergibt sich f¨ ur m die Beschr¨ankung −j ≤ m ≤ j .
(3.30)
Die Anwendung von J 2 und J z auf die Zust¨ ande J + | j, m und J − | j, m liefert J 2 J + | j, m = J + J 2 | j, m = h ¯ 2 j(j + 1)J + | j, m J z J + | j, m = (J + J z + h ¯ J + ) | j, m = h ¯ (m + 1)J + | j, m und J 2 J − | j, m = h ¯ 2 j(j + 1)J − | j, m J z J − | j, m = h ¯ (m − 1)J − | j, m . Ist also | j, m Eigenzustand von J 2 und J z mit den Eigenwerten h ¯ 2 j(j + 1) und h ¯ m, dann sind J ± | j, m Eigenzust¨ande mit den Eigenwerten h ¯ 2 j(j + 1) und h ¯ (m ± 1). J + und J − k¨onnen also wie im Fall des harmonischen Oszillators (Unterabschn. 3.3.5) als Auf- und Absteigeoperatoren interpretiert werden, die durch Anwendung auf einen bekannten Zustand | j, m alle weiteren, zur Quantenzahl j geh¨orenden Zust¨ande | j, −j , | j, −j + 1 , . . . , | j, j − 1 , | j, j liefern, wobei die Beschr¨ankung (3.30) zu den Bedingungen J + | j, j = 0 , J − | j, −j = 0 f¨ uhrt. ¨ Zu 1. Die m¨ oglichen Werte von j ergeben sich durch folgende Uberlegung: Die p-fache Anwendung von J + auf | j, m liefert den Zustand | j, j , d.h. m + p = j, w¨ ahrend die q-fache Anwendung von J − auf | j, m zum Zustand | j, −j f¨ uhrt, also m − q = −j. Hieraus folgt, daß die Summe der nichtnegativen ganzen Zahlen p und q, also
3.4 Quantenmechanische Drehimpulse
299
p + q = j − m + j + m = 2j ebenfalls nichtnegativ und ganz ist, woraus sich die in 1. genannte Beschr¨ankung ergibt. Zu 3. Aus (3.29) ergibt sich ⎫ J + | j, m = h ¯ (j − m)(j + m + 1) | j, m + 1 ⎬ J − | j, m = h ¯ (j + m)(j − m + 1) | j, m − 1 . ⎭
(3.31)
Durch Iteration dieser Beziehungen folgt die 3. Behauptung. 3.4.2 Bahndrehimpuls Ausgehend von den vorherigen Betrachtungen wird nun das Eigenwertproblem des eingangs eingef¨ uhrten Bahndrehimpulsoperators L in der polaren Ortsdarstellung behandelt. Unter Einf¨ uhrung von Kugelkoordinaten r, ϕ, θ, x = r cos ϕ sin θ , y = r sin ϕ sin θ , z = r cos θ , erh¨ alt man aus den Gleichungen (3.27) nach einiger Rechnung f¨ ur die Komponenten von L ∂ ∂ Lx = i¯ h sin ϕ + cos ϕ cot θ ∂θ ∂ϕ ∂ ∂ Ly = i¯ + sin ϕ cot θ h − cos ϕ ∂θ ∂ϕ ∂ . Lz = −i¯ h ∂ϕ Hieraus ergibt sich ∂ 1 ∂2 1 ∂ 2 2 sin θ + h L = −¯ sin θ ∂θ ∂θ sin2 θ ∂ϕ2 ∂ ∂ ±iϕ L± = Lx ± iLy = h + i cot θ . ± ¯e ∂θ ∂ϕ
(3.32)
Aufgrund der Bedeutung des Bahndrehimpulses wollen wir auch hier die Ergebnisse des Eigenwertproblems von L2 und Lz in u ¨bersichtlicher Form voranstellen und anschließend begr¨ unden: Satz 3.17: Eigenwertproblem des Bahndrehimpulses L in der polaren Ortsdarstellung Die L¨ osungen des Eigenwertproblems L2 Yl,m (θ, ϕ) = h ¯ 2 l(l + 1)Yl,m (θ, ϕ) Lz Yl,m (θ, ϕ) = h ¯ mYl,m (θ, ϕ)
300
3. Quantenmechanik
sind die Kugel߬ achenfunktionen
(l + m)! (−1)l (2l + 1)! Yl,m (θ, ϕ) = l 2 l! 4π (2l)!(l − m)! ×eimϕ sin−m θ
dl−m sin2l θ . d(cos θ)l−m
Sie bilden ein vollst¨andiges Orthonormalsystem von quadratintegrablen Funktionen auf der Einheitskugel, ∗ Yl,m (θ, ϕ)Yl ,m (θ, ϕ)dΩ = δll δmm , wobei das im Skalarprodukt auftretende Integrationsmaß das Kugelfl¨achenelement dΩ = dϕ sin θdθ bezeichnet. Die Quantenzahlen l (Orbitalquantenzahl) und m (magnetische Quantenzahl) sind auf die ganzzahligen Werte l = 0, 1, 2, . . . , m = −l, . . . , l beschr¨ ankt. Beweis. Wegen der Gestalt von Lz ist Yl,m notwendigerweise von der Form Yl,m (θ, ϕ) = fl,m (θ)eimϕ , wobei m und damit auch l ganzzahlig sein m¨ ussen, um Eindeutigkeit von Yl,m (θ, ϕ) gegen¨ uber der Ersetzung ϕ → ϕ + 2π zu gew¨ahrleisten. F¨ ur die Eigenfunktion mit der gr¨oßten m-Quantenzahl m = l muß offensichtlich gelten: L+ Yl,l (θ, ϕ) = 0 , woraus sich unter Verwendung von (3.32) die Differentialgleichung ∂ − l cot θ fl,l (θ) = 0 ∂θ ergibt. Ihre L¨ osung ist gegeben durch fl,l (θ) = cl sinl θ . Der Betrag der Konstante cl folgt aus der Normierungsbedingung 2π 1=
π dϕ
0
∗ dθ sin θYl,l (θ, ϕ)Yl,l (θ, ϕ)
0
1 =⇒ |cl | = √ 4π
π = 2π|cl |
dθ sin2l+1 θ
2 0
(2l + 1)! . 2l l!
3.4 Quantenmechanische Drehimpulse
301
Alle weiteren, zur Orbitalquantenzahl l geh¨ orenden Eigenfunktionen ergeben sich nach Satz 3.16 zu (l + m)! Ll−m Yl,l (θ, ϕ) , Yl,m (θ, ϕ) = h ¯ m−l (2l)!(l − m)! − und man erh¨ alt nach Ausf¨ uhren der Rechnungen die in Satz 3.17 angegebenen aß so gew¨ ahlt Kugelfl¨ achenfunktionen, wenn die Phase von cl konventionsgem¨ wird, daß cl = (−1)l . |cl | Einige Eigenschaften der Kugelfl¨ achenfunktionen, sind in Abschn. A.6 angegeben. 3.4.3 Spin Wie in Unterabschn. 3.6.3 dargelegt wird, ist es notwendig, den meisten quantenmechanischen Teilchen einen neuen Freiheitsgrad zuzuordnen, den sog. Spin. Da er kein klassisches Gegenst¨ uck besitzt, ist es nicht m¨ oglich, seine Form aus dem dritten quantenmechanischen Postulat abzuleiten. Vielmehr geschieht seine Einf¨ uhrung rein intuitiv und durch experimentelle Erfahrung. Es zeigt sich, daß der Spin als ein intrinsischer Drehimpuls (Eigendrehung) eines Teilchens aufgefaßt werden kann und als solcher ebenfalls der Drehimpulsalgebra (3.28) gen¨ ugt. Dar¨ uber hinaus ist er von allen anderen Freiheitsgraden eines Teilchens entkoppelt; der Spin kommutiert mit allen anderen dynamischen Gr¨oßen. Wir beschr¨ anken uns im folgenden auf die Diskussion des Eigenwertproblems eines Elektronspinoperators S, dessen Quantenzahlen s und ms auf die Werte s = 1/2, ms = ±1/2 festgelegt sind. Die entsprechenden Folgerungen f¨ ur Spins anderer Teilchen mit gr¨ oßeren Quantenzahlen lassen sich problemlos hieraus ableiten (siehe Anwendung 42). Der Elektronspinoperator besitzt genau zwei Basiszust¨ ande, die zu den Quantenzahlen (s = 1/2, ms = 1/2) und (s = 1/2, ms = −1/2) geh¨ oren. Der Einfachheit halber bezeichnen wir sie mit | + (Spin oben) und | − (Spin unten): : : 1 1 1 1 ,− , = | + , 2 2 = | − . 2 2 Sie erf¨ ullen per definitionem die Eigenwertgleichungen 3¯ h2 h ¯ | ± , S z | ± = ± | ± . 4 2 Geht man zur Matrixdarstellung u ande | + und | − ¨ber, in der die Spinzust¨ durch die Spaltenvektoren (Spinoren) 1 0 χ(+) = , χ(−) = 0 1 S 2 | ± =
302
3. Quantenmechanik
repr¨ asentiert werden, so sind die beschreibenden Matrizen von S 2 und S z gegeben durch 3¯ h2 ¯h 1 0 I , Sz = , S2 = 4 2 0 −1 wobei I die 2×2-Einheitsmatrix bezeichnet. Die Komponenten S x und S y ergeben sich aus den Auf- und Absteigeoperatoren S ± , die nach (3.31) in folgender Weise auf die Basiszust¨ande wirken: 0 1 ¯ ¯ χ(+) =⇒ S + = h S + χ(+) = 0 , S + χ(−) = h 0 0 0 0 ¯ . ¯ χ(−) , S − χ(−) = 0 =⇒ S − = h S − χ(+) = h 1 0 Hieraus folgt 1 ¯h 0 −i 1 ¯h 0 1 . , S y = (S + − S − ) = S x = (S + + S − ) = 2i 2 i 0 2 2 1 0 In der Matrixdarstellung ist es u ¨blich, den Elektronspinoperator in der Weise h ¯ S= σ 2 zu schreiben, wobei sich σ aus den Pauli-Matrizen zusammensetzt: 0 −i 1 0 0 1 σx = , σz = . , σy = i 0 0 −1 1 0 Einige ihrer Eigenschaften sind [σ i , σ j ] = 2i ijk σ k , {σ i , σ j } = 2Iδij , σ 2i = I . 3.4.4 Addition von Drehimpulsen Als n¨ achstes betrachten wir das Eigenwertproblem einer Summe von zwei Drehimpulsoperatoren J = J 1 + J 2 , J z = J 1z + J 2z , wobei J 1 bzw. J 2 den Drehimpuls des Systems 1 bzw. 2 bedeuten, aus denen das gesamte zu untersuchende System bestehe. Die gemeinsame Eigenbasis der simultan kommutierenden Operatoren J 21 , J 1z , J 22 , J 2z setzt sich aus den tensoriellen Produkten der Eigenzust¨ande von J 21 , J 1z und J 22 , J 2z zusammen: | j1 m1 ⊗ | j2 , m2 = | j1 , m1 ; j2 , m2 . Andererseits bilden die Operatoren J 21 , J 22 , J 2 , J z ebenfalls einen vollst¨andigen Satz kommutierender Observablen, so daß man eine Eigenbasis dieser Operatoren konstruieren kann, deren Elemente wir mit | j1 , j2 , J, M bezeichnen.9 Sie erf¨ ullen die Eigenwertgleichungen 9
Man beachte das Semikolon in den Produktbasiszust¨ anden. Dies erleichtert die Unterscheidung zwischen der Produktbasis und der Gesamtdrehimpulsbasis.
3.4 Quantenmechanische Drehimpulse
303
J 21 | j1 , j2 , J, M = h ¯ 2 j1 (j1 + 1) | j1 , j2 , J, M 2 J 2 | j1 , j2 , J, M = h ¯ 2 j2 (j2 + 1) | j1 , j2 , J, M J 2 | j1 , j2 , J, M = h ¯ 2 J(J + 1) | j1 , j2 , J, M J z | j1 , j2 , J, M = h ¯ M | j1 , j2 , J, M , M = m1 + m2 . ¨ Aus den Uberlegungen des letzten Unterabschnittes schließen wir, daß bei gegebenem j1 und j2 die Quantenzahl J nur die Werte J = |j1 − j2 |, . . . , j1 + j2 − 1, j1 + j2 annehmen kann, w¨ ahrend M auf die Werte M = m1 + m2 = −J, . . . , J − 1, J beschr¨ ankt ist. Dies wird durch folgende Dimensionsbetrachtung unterst¨ utzt: Die Anzahl der Eigenproduktzust¨ ande betr¨ agt (2j1 + 1)(2j2 + 1), und sie ist gleich der Zahl der Eigenzust¨ ande zum Gesamtdrehimpuls:10 j 1 +j2
(2J + 1) =
J=j1 −j2
2j2
[2(j1 − j2 + n) + 1] = (2j1 + 1)(2j2 + 1) .
n=0
Die Vollst¨ andigkeit der Produktbasis erlaubt eine Entwicklung der Gesamtdrehimpulseigenzust¨ ande nach diesen: | j1 , j2 , J, M = | j1 , m1 ; j2 , m2 j1 , m1 ; j2 , m2 | j1 , j2 , J, M . (3.33) m1 ,m2
Die Entwicklungskoeffizienten j1 , m1 ; j2 , m2 | j1 , j2 , J, M = j1 , m1 ; j2 , m2 | J, M sind die Clebsch-Gordan-(CG-)Koeffizienten oder Vektoradditionskoeffizienten.11 Einige ihrer Eigenschaften sind: 1. j1 , m1 ; j2 , m2 | J, M = 0 =⇒ |j1 − j2 | ≤ J ≤ j1 + j2 . 2. j1 , m1 ; j2 , m2 | J, M = 0 =⇒ M = m1 + m2 . 3. Die CG-Koeffizienten sind konventionsgem¨ aß reell. 4. j1 , m1 ; j2 , m2 | J, J ist konventionsgem¨ aß positiv. 5. j1 , m1 ; j2 , m2 | J, M = (−1)j1 +j2 −J j1 , −m1 ; j2 , −m2 | J, −M . 6. Als die Koeffizienten einer unit¨ aren Transformation gen¨ ugen die CGKoeffizienten den Orthogonalit¨ atsrelationen j1 , m1 ; j2 , m2 | J, M j1 , m1 ; j2 , m2 | J , M = δJJ δM M m1 ,m2 10 11
Ohne Beschr¨ ankung der Allgemeinheit nehmen wir hier an, daß j1 ≥ j2 . Da die Indizes j1 und j2 im Bravektor auftreten, k¨ onnen sie im Ketvektor unterdr¨ uckt werden.
304
3. Quantenmechanik
j1 , m1 ; j2 , m2 | J, M j1 , m1 , j2 , m2 | J, M = δm1 m1 δm2 m2 .
J,M
Die explizite Berechnung der CG-Koeffizienten ist i.a. sehr aufwendig. In einigen einfachen F¨allen l¨aßt sich jedoch die Linearkombination (3.33) direkt bestimmen (siehe n¨achster Unterabschnitt). Hierzu beachte man, daß der Zustand mit den Quantenzahlen J = j1 + j2 , M = J gegeben ist durch | j1 , j2 , j1 + j2 , j1 + j2 = | j1 , j1 ; j2 , j2 , denn unter Verwendung von J 2 = J 21 + J 22 + 2J 1z J 2z + J 1+ J 2− + J 1− J 2+ gilt J 2 | j1 , j2 , J, J = h ¯ 2 (j1 (j1 + 1) + j2 (j2 + 1) + 2j1 j2 ) | j1 , j1 ; j2 , j2 =h ¯ 2 J(J + 1) | j1 , j2 , J, J und J z | j1 , j2 , J, J = h ¯ (j1 + j2 ) | j1 , j1 ; j2 , j2 = h ¯ J | j1 , j2 , J, J . Durch Anwendung des Absteigeoperators J − = J 1− + J 2− erh¨alt man die u ande | j1 , j2 , J, J − 1 , . . . , | j1 , j2 , J, −J . Der Zustand ¨brigen Zust¨ | j1 , j2 , j1 + j2 − 1, j1 + j2 − 1 ergibt sich nun eindeutig aus seiner Orthogonalit¨ at zu | j1 , j2 , j1 + j2 , j1 + j2 − 1 zusammen mit obiger CG-Phasenbedingung unter Punkt 4. Hieraus lassen sich mit Hilfe von J − wieder alle u ande mit J = j1 + j2 − 1 konstruieren usw. ¨brigen Zust¨ Satz 3.18: Addition von Drehimpulsen Seien J 1 und J 2 zwei Drehimpulsoperatoren eines Teilchens, J = J 1 + J 2 und J z = J 1z + J 2z der Gesamtdrehimpuls bzw. dessen z-Komponente. Dann besitzen die Operatoren J 21 , J 22 , J 2 , J z ein gemeinsames vollst¨andiges Basissystem. Seine Elemente | j1 , j2 , J, M lassen sich nach den vollst¨andigen Produktbasiszust¨anden | j1 , m1 ; j2 , m2 von J 21 , J 1z und J 22 , J 2z in der Weise | j1 , j2 , J, M = | j1 , m1 ; j2 , m2 j1 , m1 ; j2 , m2 | J, M m1 ,m2 CG-Koeffizienten entwickeln. Bei gegebenem j1 und j2 sind die Gesamtdrehimpulsquantenzahlen auf die Werte J = |j1 − j2 |, . . . , j1 + j2 , M = m1 + m2 = −J, . . . , J beschr¨ ankt.
3.4 Quantenmechanische Drehimpulse
305
3.4.5 Spin-Bahn- und Spin-Spin-Kopplung Zwei n¨ utzliche Anwendungsbeispiele zur Addition von Drehimpulsen, die wir im folgenden besprechen, sind die Kopplung des Bahndrehimpulses mit dem Elektronspin sowie die Kopplung zweier Elektronspins. Wir werden auf sie u.a. bei der Diskussion des realen Wasserstoffatoms in den Unterabschnitten 3.7.3 bis 3.7.5 zur¨ uckgreifen. Spin-Bahn-Kopplung. Man betrachte das Eigenwertproblem des Gesamtdrehimpulses J = L + S , J z = Lz + S z , der sich aus dem Bahndrehimpuls L und dem Elektronspin S eines Teilchens zusammensetzt. Die Quantenzahlen von L, S und J seien durch (l, m), (s = 1/2, ms = ±1/2) und (J, M ) gegeben. Offensichtlich gibt es zu jedem l > 0 nur zwei m¨ ogliche Werte f¨ ur J, n¨ amlich J = l ± 1/2. Da ms nur die Werte ±1/2 annehmen kann, setzt sich jeder Vektor der Gesamtdrehimpulsbasis aus genau zwei Produktbasisvektoren zusammen. Sie lauten unter = Verwendung der Spinbasis-Notation 12 , ± 12 = | ± : : : 1 l, , l + 1 , M = α l, M − 1 ; + + β l, M + 1 ; − 2 2 2 2 : : : 1 l, , l − 1 , M = α l, M − 1 ; + + β l, M + 1 ; − , 2 2 2 2 wobei M halbzahlig ist. Die Orthonormalit¨ atsbedingungen dieser Zust¨ ande liefern drei Bestimmungsgleichungen f¨ ur die Entwicklungskoeffizienten: α2 + β 2 = 1 α2 + β 2 = 1 αα + ββ = 0 . Eine 4. Bedingung ergibt sich z.B. aus : : 1 3 1 1 1 2 2 1 ¯ l+ l+ l, , l + , M J l, , l + , M = h 2 2 2 2 2 2 zu l + 21 − M β , = α l + 12 + M wobei J 2 = L2 + S 2 + 2Lz S z + L+ S − + L− S + . Unter Ber¨ ucksichtigung der CG-Phasenkonventionen folgt schließlich
306
3. Quantenmechanik
: : 1 1 1 1 1 l, , l ± , M = √ ± l + ± M l, M − ; + 2 2 2 2 2l + 1
: 1 1 . + l + ∓ M l, M + ; − 2 2
(3.34)
Diese Gleichung ist auch f¨ ur l = 0 =⇒ J = 1/2 richtig. Man hat dann : : 1 1 1 1 1 1 0, , , 0, , , − = | 0, 0; + , 2 2 2 2 2 2 = | 0, 0; − . Spin-Spin-Kopplung. Die Situation wird noch einfacher, wenn man sich auf den Gesamtspin S = S 1 + S 2 , S z = S 1z + S 2z ur zweier Elektronspins S 1 und S 2 (s1,2 = 1/2, m1,2 = ±1/2) beschr¨ankt. F¨ die Gesamtdrehimpulsquantenzahlen S und M gibt es offensichtlich nur die M¨ oglichkeiten S = 0 =⇒ M = 0
oder S = 1 =⇒ M = −1, 0, 1 ,
und man erh¨ alt folgende Entwicklung der Gesamtspinbasis nach den Produktspinzust¨ anden: : 1 1 , , 1, 1 = | +; + 2 2 : 1 1 , , 1, 0 = √1 (| +; − + | −; + ) 2 2 2 : 1 1 , , 1, −1 = | −; − 2 2 : 1 1 , , 0, 0 = √1 (| +; − − | −; + ) . 2 2 2 Zusammenfassung • Hermitesche Operatoren J , die einer bestimmten Kommutatoralgebra gen¨ ugen, nennt man Drehimpulse. Zu J 2 und J z existiert ein gemeinsames Eigenbasissystem | j, m , mit j = 0, 1/2, 1, 3/2, . . . und m = −j, −j + 1, . . . , j − 1, j. • Ein spezieller Drehimpuls ist der Bahndrehimpuls L. In der Ortsdarstellung sind die Eigenzust¨ande | l, m von L2 und Lz durch die Kugelfl¨ achenfunktionen Yl,m , l ganzzahlig, gegeben. Der Elektronspin S ist ein weiterer Drehimpuls mit nur zwei Einstellungen: s = 1/2, ms = ±1/2. In der Matrixdarstellung werden die Eigenzust¨ande von S 2 und S z durch Spinoren beschrieben.
Anwendungen
307
• Bei der Addition zweier Drehimpulse, J = J 1 + J 2 , setzt sich eine Basis aus den tensoriellen Produkten der Eigenzust¨ ande von J 21 , J 1z und J 22 , J 2z zusammen. Eine andere Basis (Gesamtdrehimpulsbasis) bilden die Eigenzust¨ ande von J 21 , J 22 , J 2 , J 2z . Beide Basen sind u ¨ber eine unit¨ are Transformation (Clebsch-Gordan-Koeffizienten) miteinander verbunden. Die Quantenzahlen J, M von J 2 und J z sind auf die Werte J = |j1 − j2 |, . . . , j1 + j2 , M = m1 + m2 = −J, . . . , J festgelegt.
Anwendungen 42. Spin-1-Algebra. Wie lauten die Komponenten eines s=1-Spinoperators S in der Matrixdarstellung, wenn seine Eigenzustande | 1, 1 , | 1, 0 und | 1, −1 durch die Vektoren ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 0 0 χ(+) = ⎝ 0 ⎠ , χ(0) = ⎝ 1 ⎠ bzw. χ(−) = ⎝ 0 ⎠ 0 0 1 dargestellt werden? L¨ osung. Die verschiedenen Komponenten von S werden in der Matrixdarstellung durch hermitesche 3×3-Matrizen beschrieben, wobei die Wirkung von S 2 und S z auf die Basiszust¨ ande per definitionem gegeben ist durch h2 χ(0) , S 2 χ(−) = 2¯ h2 χ(−) S 2 χ(+) = 2¯ h2 χ(+) , S 2 χ(0) = 2¯ S z χ(+) = h ¯ χ(+) , S z χ(0) = 0 , S z χ(−) = −¯ hχ(−) . Man erh¨ alt hieraus
⎛
⎞ 10 0 h2 I , S z = h ¯⎝0 0 0⎠ , S 2 = 2¯ 0 0 −1
wobei I die 3×3-Einheitsmatrix bezeichnet. Die entsprechenden Matrizen f¨ ur alt man aus den Auf- und Absteigeoperatoren S + und S − , S x und S y erh¨ die nach (3.31) in folgender Weise auf die Basiszust¨ ande operieren: √ √ S + χ(+) = 0 , S + χ(0) = 2¯ hχ(+) , S + χ(−) = 2¯ hχ(0) ⎛ ⎞ 010 √ =⇒ S + = 2¯ h⎝0 0 1⎠ 000 und S − χ(+) =
√
2¯ hχ(0) , S − χ(0) =
√
2¯ hχ(−) , S − χ(−) = 0
308
3. Quantenmechanik
=⇒ S − =
√
Somit folgt
⎛
⎞ 0 0 0 2¯h ⎝ 1 0 0 ⎠ . 0 1 0 ⎛
⎞ 0 1 0 1 ¯h S x = (S + + S − ) = √ ⎝ 1 0 1 ⎠ 2 2 0 1 0 ⎛ ⎞ 0 −i 0 1 ¯h S y = (S + − S − ) = √ ⎝ i 0 −i ⎠ . 2i 2 0 i 0
43. Zeitliche Entwicklung eines Spin-1/2-Systems. Wie in Unterabschn. 3.6.3 gezeigt wird, lautet der Hamilton-Operator f¨ ur die Wechselwirkung des Spins S eines Elektrons der Ladung e und der Masse me mit einem außeren Magnetfeld B ¨ e H=− SB . me c Man betrachte ein lokalisiertes Elektron, dessen einziger Freiheitsgrad sein Spin ist. Dieses Teilchen befinde sich zur Zeit t = 0 in einem Eigenzustand von S x mit dem Eigenwert ¯h/2. Zu diesem Zeitpunkt wird ein Magnetfeld B = Bez eingeschaltet, in dem das Teilchen w¨ahrend der Zeitspanne T pr¨ azedieren kann. Danach wird das Magnetfeld instantan in die y-Richtung gedreht: B = Bey . Nach wiederum einer Zeitspanne T wird eine Messung von S x ausgef¨ uhrt. Mit welcher Wahrscheinlichkeit wird der Wert h ¯ /2 gefunden? L¨ osung. In der Matrixdarstellung l¨aßt sich die zeitliche Entwicklung des Elektrons durch den Spinor ψ+ (t) ψ(t) = ψ+ (t)χ(+) + ψ− (t)χ(−) = ψ− (t) beschreiben, mit 1 0 χ(+) = , χ(−) = . 0 1 Im Zeitintervall 0 ≤ t ≤ T lautet somit die Schr¨odinger-Gleichung d ψ+ eB 1 0 ψ+ i¯ h =h ¯ω , ω=− 0 −1 ψ− dt ψ− 2me c und wird gel¨ ost durch ψ+ (t) a0 e−iωt . = ψ− (t) 1 b0 eiωt Die Konstanten a0 und b0 ergeben sich aus der Normierungsbedingung a20 + b20 = 1
Anwendungen
309
und der Voraussetzung S x ψ(0) =
¯ h ψ(0) 2
zu 1 a0 = b0 = √ . 2 Die Schr¨ odinger-Gleichung f¨ ur das Zeitintervall T ≤ t ≤ 2T lautet d ψ+ 0 −i ψ+ =h ¯ω . i¯ h i 0 ψ− dt ψ− Ihre L¨ osung berechnet sich zu ψ+ (t) aeiωt + be−iωt , = ψ− (t) 2 −iaeiωt + ibe−iωt wobei die Stetigkeitsbedingung ψ+ (T ) ψ+ (T ) = ψ− (T ) 1 ψ− (T ) 2 die Konstanten a und b auf die Werte 1 1 a = √ e−2iωT + i , b = √ 1 − ie2iωT 2 2 2 2 festlegt. Zur Zeit 2T ist also der Elektronzustand gegeben durch 1 ψ+ (2T ) 1 − i + e−2iωT + ie2iωT = √ . 2iωT ψ− (2T ) 2 + ie−2iωT 2 2 1−i+e
(3.35)
Die gesuchte Wahrscheinlichkeit, jetzt bei einer Messung von S x den Eigenwert ¯h/2 zu finden, ergibt sich aus der Projektion von (3.35) auf den zu h ¯ /2 geh¨ orenden Eigenzustand von S x : 2 1 1 1 1 − i + e−2iωT + ie2iωT = √ (1, 1) √ W sx = 2iωT + ie−2iωT 2 2 2 2 1−i+e 1 = (1 + cos2 2ωT ) . 2 Entsprechend ist 2 1 1 1 1 − i + e−2iωT + ie2iωT = √ (1, −1) √ W sx = − 2iωT + ie−2iωT 2 2 2 2 1−i+e 1 = sin2 2ωT 2 1 = 1 − W sx = 2 die Wahrscheinlichkeit daf¨ ur, den Wert −¯ h/2 zu messen.
310
3. Quantenmechanik
3.5 Schr¨ odinger-Gleichung in drei Dimensionen Die dreidimensionale Schr¨odinger-Gleichung f¨ ur ein Teilchen, das sich in einem skalaren zeitunabh¨angigen Potential befindet, lautet in der kartesischen Ortsdarstellung ¯h2 2 d ψ(x, t) = Hψ(x, t) , H = − ∇ + V (x) . dt 2m Mit Hilfe des Ansatzes i¯ h
ψ(x, t) = Ψ (x)e−iωt geht sie analog zum eindimensionalen Fall in die zeitunabh¨angige Schr¨odinger-Gleichung HΨ (x) = EΨ (x) , E = h ¯ω u osung dieser Gleichung wird besonders einfach, wenn sich das ¨ber. Die L¨ Potential in der Weise V (x) = V1 (x) + V2 (y) + V3 (z) schreiben l¨ aßt. Dann lassen sich n¨amlich die Koordinaten x, y, z separieren, und man kann als allgemeine L¨osung ansetzen: Ψ (x) = u1 (x)u2 (y)u3 (z) , wobei die Funktionen ui jeweils der eindimensionalen Schr¨odinger-Gleichung h2 d2 ¯ − + Vi (ξ) ui (ξ) = Ei ui (ξ) , i = 1, 2, 3 2m dξ 2 gen¨ ugen, mit E = E1 + E 2 + E 3 . Sind mindestens zwei der Potentiale Vi gleich, so tritt Entartung auf, da die zugeh¨ origen Gleichungen auf dieselben Eigenwerte f¨ uhren. Im weiteren Verlauf wollen wir uns auf Systeme konzentrieren, die eine Zentralsymmetrie aufweisen. Sie besitzen die Eigenschaft, daß ihre Behandlung in der polaren Ortsdarstellung eine vollst¨andige Separation des Winkelund Radialteils erlaubt, wodurch sich ebenfalls eine enorme Vereinfachung ergibt. Zuvor wollen wir jedoch zeigen, wie sich Zwei-Teilchenprobleme auf effektive Ein-Teilchenprobleme zur¨ uckf¨ uhren lassen. 3.5.1 Zwei-Teilchensysteme und Separation der Schwerpunktsbewegung Der Hamilton-Operator eines Zwei-Teilchensystems sei in der kartesischen Ortsdarstellung gegeben durch
3.5 Schr¨ odinger-Gleichung in drei Dimensionen
H=
311
P 21 P2 + 2 + V (x1 , x2 ) , 2m1 2m2
wobei P 1 = −i¯ h∇1 , P 2 = −i¯ h∇2 , [P 1 , P 2 ] = 0 die Impulse der beiden Teilchen sind. H¨ angt das Potential allein vom gegenseitigen Abstand der beiden Teilchen ab, V (x1 , x2 ) = V (x1 − x2 ) , so l¨ aßt sich das vorliegende sechsdimensionale Problem in zwei dreidimensionale Probleme aufspalten, von denen das eine die konstante Bewegung des Schwerpunktes und das andere die Relativbewegung, d.h. die Bewegung eines effektiven Ein-Teilchensystems beschreibt. Erinnern wir uns, wie hierzu in der klassischen Mechanik vorgegangen wird (vgl. Unterabschn. 1.5.1). Dort f¨ uhrt man Schwerpunkts- und Relativkoordinaten m1 x1 + m2 x2 , xR = x1 − x2 xS = M sowie Schwerpunkts- und Relativimpulse m2 p1 − m1 p2 pS = p1 + p2 = M x˙ S , pR = = µx˙ R M ein, mit m 1 m2 (reduzierte Masse) , M = m1 + m2 (Gesamtmasse) , µ = m1 + m2 so daß die Newtonschen Bewegungsgleichungen in zwei Gleichungen f¨ ur die Schwerpunkts- und Relativbewegung entkoppeln. In der Quantenmechanik werden diese Gr¨ oßen als Operatoren u ¨bernommen: m2 P 1 − m1 P 2 = −i¯ h∇R . M F¨ ur sie gelten die Vertauschungsrelationen h∇ S , P R = P S = P 1 + P 2 = −i¯
[P S , P R ] = 0 , [xSi , P Sj ] = [xRi , P Rj ] = i¯ hδij sowie P2 P 21 P2 P2 + 2 = S + R . 2m1 2m2 2M 2µ Die zeitunabh¨ angige Schr¨ odinger-Gleichung nimmt somit die Gestalt 2 2 PS PR + + V (xR ) Ψ (xS , xR ) = EΨ (xS , xR ) 2M 2µ an. Mit Hilfe des Ansatzes Ψ (xS , xR ) = ΨS (xS )ΨR (xR )
312
3. Quantenmechanik
zerf¨ allt diese Gleichung in zwei separate Schr¨odinger-Gleichungen f¨ ur die Schwerpunkts- und Relativbewegung: H S ΨS (xS ) = ES ΨS (xS ) , H S =
P 2S 2M
H R ΨR (xR ) = ER ΨR (xR ) , H R =
P 2R + V (xR ) , [H S , H R ] = 0 . 2µ
Die erste Gleichung beschreibt die freie Bewegung eines Teilchens der Gesamtmasse M w¨ahrend die zweite die Dynamik eines im Potential V befindlichen Teilchens der reduzierten Masse µ bestimmt. Bis auf die Ersetzungen m ↔ µ und x ↔ xR besteht also auch in der Quantenmechanik formal kein Unterschied zwischen der Beschreibung der Relativbewegung eines ZweiTeilchensystems und der Bewegung eines Ein-Teilchensystems. 3.5.2 Radiale Schr¨ odinger-Gleichung Ist das Potential V zentralsymmetrisch, V (x) = V (|x|), dann weist der Hamilton-Operator eine Kugelsymmetrie auf (d.h. er ist invariant unter r¨ aumlichen Drehungen), so daß es sich als g¨ unstig erweist, Kugelkoordinaten zu verwenden: x = r cos ϕ sin θ , y = r sin ϕ sin θ , z = r cos θ . Man zeigt nun leicht, daß sich das Quadrat des Impulsoperators P in folgender Weise durch die Kugelkoordinaten ausdr¨ ucken l¨aßt: P 2 = −¯ h2 ∇2 = P 2r + wobei P r = −i¯ h
1 ∂ r = −i¯ h r ∂r
L2 , r2
∂ 1 + ∂r r
der Radialimpuls (nicht zu verwechseln mit dem Relativimpuls P R ) und L der in Unterabschn. 3.4.2 besprochene Bahndrehimpuls des Teilchens ist. Hiermit geht die zeitunabh¨angige Schr¨odinger-Gleichung eines Ein-Teilchensystems u ¨ber in 2 Pr L2 HΨ (r, θ, ϕ) = EΨ (r, θ, ϕ) , H = + V (r) . (3.36) + 2m 2mr2 Bevor man sich der L¨osung dieser Gleichung zuwendet, ist zu pr¨ ufen, unter welchen Voraussetzungen P r (und somit H) hermitesch ist. Hierzu muß gelten:
3.5 Schr¨ odinger-Gleichung in drei Dimensionen
313
∗
0 = Ψ | P r |Ψ − Ψ | P r |Ψ 2π π ∞ ∂ ∗ ∂ ∗ (rΨ ) + Ψ (rΨ ) = −i¯ h dϕ dθ sin θ drr Ψ ∂r ∂r 0
0
0
2π
π
∞
= −i¯ h
dϕ 0
dθ sin θ 0
dr
∂ |rΨ |2 . ∂r
0 r→∞
Da f¨ ur quadratintegrable Funktionen rΨ −→ 0 gilt, ist das Integral u ¨ber r gleich seinem Wert im Ursprung. P r ist also nur dann hermitesch, wenn man sich auf quadratintegrable Funktionen Ψ beschr¨ ankt, die lim rΨ = 0
r→0
(3.37)
erf¨ ullen. Desweiteren w¨ are noch zu untersuchen, ob (3.36) der Schr¨ odingerGleichung im gesamten r-Bereich, einschließlich des Ursprungs, ¨ aquivalent ist. Man kann zeigen, daß auch dies tats¨ achlich der Fall ist, wenn Ψ obiger Hermitezit¨ atsbedingung gen¨ ugt. Nun gilt [H, L2 ] = [H, Lz ] = [L2 , Lz ] = 0 . Da es keine weiteren Gr¨ oßen gibt, die untereinander vertauschen, bilden die Operatoren H, L2 und Lz einen vollst¨ andigen Satz kommutierender Observablen und besitzen folglich ein eindeutiges gemeinsames Basissystem. Dieses setzt sich zusammen aus den Kugelfl¨ achenfunktionen Yl,m , also den Basisangigen Funktionen zust¨ anden von L2 und Lz , sowie nur vom Radius r abh¨ gl (r): Ψ (r, θ, ϕ) = gl (r)Yl,m (θ, ϕ) . Setzt man diesen Ausdruck in (3.36) ein, so ergibt sich zusammen mit der Hermitezit¨ atsbedingung (3.37) der Satz 3.19: Radialgleichung f¨ ur zentralsymmetrische Potentiale 2 2 2 h l(l + 1) ¯ d 2 d ¯h + + + V (r) gl (r) = Egl (r) , (3.38) − 2m dr2 r dr 2mr2 mit lim rgl (r) = 0 .
r→0
Durch die Substitution ul (r) = rgl (r) folgt ¯h2 d2 h2 l(l + 1) ¯ − + + V (r) ul (r) = Eul (r) , ul (r = 0) = 0. (3.39) 2m dr2 2mr2
314
3. Quantenmechanik
Einige erste Folgerungen hieraus sind: • Unter den L¨ osungen ul sind nur diejenigen physikalisch sinnvoll, die auf Eins oder die δ-Funktion normierbar sind. • Divergiert das Potential im Ursprung langsamer als 1/r2 : lim r2 V (r) = 0 r→0
(dies ist meistens der Fall), dann gilt in der N¨ahe des Ursprungs die Gleichung d2 ul l(l + 1) − ul = 0 , 2 dr r2 deren L¨ osungen ul (r) ∼ rl+1 (regul¨are L¨osung) und ul (r) ∼ r−l sind. • Geht das Potential f¨ ur r → ∞ schneller gegen Null als 1/r: lim rV (r) = 0, r→∞ dann gilt f¨ ur große r d2 u 2mE + 2 u=0. dr2 h ¯ Die L¨ osungsfunktionen dieser Gleichung verhalten sich asymptotisch wie E < 0 : u(r) ∼ e−kr , ekr E > 0 : u(r) ∼ e
ikr
,e
−ikr
2mE , k = 2 . ¯h 2
3.5.3 Freies Teilchen Als erstes Anwendungsbeispiel betrachten wir wieder das einfachste System, n¨ amlich ein freies Teilchen. Die zugeh¨orige radiale Schr¨odinger-Gleichung lautet 2 h2 ¯ d ¯h2 l(l + 1) 2 d − + + − E gl (r) = 0 . 2m dr2 r dr 2mr2 Unter Einf¨ uhrung der dimensionslosen Gr¨oßen 2mE , ρ = kr h2 ¯ geht diese Gleichung u arische Besselsche Differentialgleichung ¨ber in die sph¨ (siehe Abschn. A.5) 2 l(l + 1) d 2 d +1− gl (ρ) = 0 . + (3.40) dρ2 ρ dρ ρ2 k2 =
Ihre L¨ osungen sind die sph¨ arischen Bessel-Funktionen, deren Form und asymptotisches Verhalten in folgender Weise gegeben sind: ⎧ ρl ⎪ ⎪ l f¨ ur ρ → 0 ⎨ 1 d sin ρ (2l + 1)!! jl (ρ) = (−ρ)l ∼ ⎪ ρ dρ ρ sin(ρ − lπ/2) ⎪ ⎩ f¨ ur ρ → ∞ ρ
3.5 Schr¨ odinger-Gleichung in drei Dimensionen
315
⎧ (2l − 1)!! ⎪ ⎪ l f¨ ur ρ → 0 ⎨ d 1 cos ρ ρl+1 ∼ nl (ρ) = (−ρ)l ⎪ cos(ρ − lπ/2) ρ dρ ρ ⎪ ⎩ f¨ ur ρ → ∞ . ρ Von besonderem Interesse sind gewisse Kombinationen dieser Funktionen, die Hankel-Funktionen i(ρ− lπ 2 ) ρ→∞ e (+) hl (ρ) = nl (ρ) + ijl (ρ) −→ ρ −i(ρ− lπ 2 ) ρ→∞ e (−) . hl (ρ) = nl (ρ) − ijl (ρ) −→ ρ Ihr asymptotisches Verhalten f¨ ur k 2 > 0 entspricht aus- bzw. einlaufenden Kugelwellen. Je nach Vorzeichen von E sind nun zwei F¨ alle zu unterscheiden: (+)
• E < 0: Hier ist hl die einzige beschr¨ ankte L¨ osung von (3.40). Sie weist allerdings im Ursprung einen Pol der Ordnung l + 1 auf. Das Eigenwertproblem besitzt deshalb keine L¨ osung; es gibt erwartungsgem¨ aß keine Eigenzust¨ande eines freien Teilchens mit negativer Energie. • E ≥ 0: Die Gleichung besitzt genau eine u ankte L¨ osung, ¨berall beschr¨ n¨amlich jl (ρ). Damit ergibt sich die Gesamtl¨ osung der zeitunabh¨ angigen Schr¨odinger-Gleichung zu Ψl,m (r, θ, ϕ) = jl (kr)Yl,m (θ, ϕ) .
(3.41)
Man beachte, daß bisher Gesagtes leicht auf den Fall u ¨bertragbar ist, bei dem ein Potential V (r) vorliegt, das in Bereiche konstanter Potentialwerte Vi aufgeteilt werden kann. In diesem Fall ist f¨ ur jeden Bereich E durch E − Vi zu ersetzen. Entwicklung ebener Wellen nach Kugelfunktionen. Neben den Kugelwellen (3.41) kann ein freies Teilchen mit der (unendlichfach entarteten) Energie E = h ¯ 2 k2 /2m auch durch ebene Wellen eikr beschrieben werden. Sie stellen das Teilchen mit dem Impuls ¯hk dar, w¨ ahrend (3.41) das Teilchen mit einem bestimmten Drehimpuls beschreibt. Da die Kugelwellen ein vollst¨ andiges System bilden, spannt die abz¨ ahlbare Gesamtheit der Kugelwellen zu einem bestimmten Wert der Wellenzahl k den Raum der Eigenfunktionen zur Energie E = h ¯ 2 k2 /2m auf. Folglich kann die ebene Welle eikr nach diesen Funktionen entwickelt werden: eikr =
l ∞
al,m (k)jl (kr)Yl,m (θ, ϕ) .
l=0 m=−l
Legt man die z-Achse in Richtung von k, dann ist eikr = eikr cos θ , Lz eikr cos θ = 0 .
316
3. Quantenmechanik
Das heißt die Entwicklung ist unabh¨angig von ϕ und beschr¨ankt sich auf Terme mit m = 0. Unter Verwendung von (A.14) und al = al,0 folgt dann eiuρ =
∞
al jl (ρ)Pl (u) , u = cos θ ,
(3.42)
l=0
wobei Pl = Pl,0 die Legendre-Polynome (siehe Abschn. A.6) bezeichnen. Zur Bestimmung der Entwicklungskoeffizienten al kann man wie folgt vorgehen: Differentiation von (3.42) liefert ∞ djl Pl (u) . al iueiuρ = dρ l=0
Andererseits gilt nach (A.11) ∞ ∞ l+1 l iuρ al jl uPl = i iue = i al+1 jl+1 + al−1 jl−1 Pl . 2l + 3 2l − 1 l=0
l=0
Setzt man nun die Koeffizienten von Pl in den letzten beiden Entwicklungen gleich, dann erh¨alt man unter Verwendung von (A.9) und (A.10) 1 i 1 i al − al−1 jl−1 = (l + 1) al + al+1 jl+1 l 2l + 1 2l − 1 2l + 1 2l + 3 und somit 1 i al+1 = al =⇒ al = (2l + 1)il a0 . 2l + 3 2l + 1 ur ρ = 0 folgt wegen jl (0) = δl0 und P0 (u) = 1: Aus der Entwicklung von eiuρ f¨ a0 = 1. Dies f¨ uhrt schließlich zum Satz 3.20: Entwicklung ebener Wellen nach Kugelfunktionen Definiert der Wellenvektor k die z-Richtung, dann gilt eikr = eikr cos θ =
∞
(2l + 1)il jl (kr)Pl (cos θ)
l=0
=
∞
4π(2l + 1)il jl (kr)Yl,0 (θ, ϕ) .
l=0
3.5.4 Kugelsymmetrischer Potentialtopf Man betrachte folgenden kugelsymmetrischen Potentialverlauf (Abb. 3.6): 5 −V0 f¨ ur r < a V (r) = , V0 > 0 . 0 f¨ ur r ≥ a Im inneren Bereich I ist die einzige, im Ursprung regul¨are L¨osung der radialen Schr¨ odinger-Gleichung (3.38)
3.5 Schr¨ odinger-Gleichung in drei Dimensionen
317
V
a
I
r
II
−V0 Abb. 3.6. Kugelsymmetrischer Potentialtopf
(I) gl (k1 r)
= Al jl (k1 r) , k1 =
2m(E + V0 ) . h2 ¯
Im Bereich II sind zwei F¨ alle zu unterscheiden: Gebundene Zust¨ ande: E < 0. Hier ist
−2mE (II) (+) gl (ik2 r) = Bl hl (ik2 r) , k2 = h2 ¯ die einzige, im Unendlichen beschr¨ ankte L¨ osung. Die Stetigkeitsbedingungen am Punkt r = a, d (I) d (II) (I) (II) gl (k1 r) gl (ik2 r) = , gl (k1 a) = gl (ik2 a) , dr dr r=a
r=a
legen das Verh¨ altnis der Integrationskonstanten Al und Bl fest. Beide Bedingungen k¨ onnen nur f¨ ur diskrete Werte von E gleichzeitig erf¨ ullt werden; sie bestimmen die Energieniveaus der gebundenen Zust¨ ande des Teilchens. Handelt es sich um l=0-Zust¨ ande, so folgt hieraus die Bedingung tan k1 a = −
k1 . k2
Ungebundene Zust¨ ande: E > 0. Die allgemeine L¨ osung ist eine Linearkombination der sph¨ arischen Bessel-Funktionen, die wir so ansetzen k¨ onnen:
2mE (II) gl (k2 r) = Bl [jl (k2 r) cos δl + nl (k2 r) sin δl ] , k2 = . h2 ¯ Im Falle l = 0 ergibt sich aus den entsprechenden Stetigkeitsbedingungen f¨ ur die Phase δ0 tan(k2 a + δ0 ) =
k2 tan k1 a . k1
(3.43)
318
3. Quantenmechanik
3.5.5 Naives Wasserstoffatom Das Paradebeispiel f¨ ur Zwei-Teilchensysteme ist das Wasserstoffatom. Es besteht aus einem positiv geladenen Proton und einem umkreisenden Elektron. Wir behandeln von vornherein den allgemeineren Fall von wasserstoff¨ ahnlichen Atomen. Sie besitzen ebenfalls nur ein Elektron, wobei der Kern aber aus mehreren Protonen (und Neutronen) bestehen darf. Effekte, die durch den Kern- und Elektronspin hervorgerufen werden, bleiben hierbei zun¨achst unber¨ ucksichtigt; diese werden in den Unterabschnitten 3.7.3 bis 3.7.5 behandelt. Zwischen Elektron und Kern herrscht das elektrostatische CoulombPotential Ze2 V (r) = − , r wobei e die Elementarladung des Elektrons und Z die Kernladungszahl ist. Die radiale Schr¨ odinger-Gleichung f¨ ur die Relativbewegung von Elektron und Kern lautet nach (3.39) h2 d2 ¯ ¯h2 l(l + 1) Ze2 m e mk − ul (r) = Eul (r) , µ = + − . 2µ dr2 2µr2 r me + m k me bezeichnet hierbei die Masse des Elektrons und mk die Masse des Kerns.12 Beschr¨ ankt man sich auf den Fall gebundener Zust¨ande mit E < 0, so ist es zweckm¨ aßig, die dimensionslosen Gr¨oßen 1/2 1/2 8µE µc2 Ze2 µ 1/2 − ρ= − 2 = Zαe − r, λ= ¯h 2E 2E h ¯ einzuf¨ uhren, mit der Feinstrukturkonstanten 1 e2 ≈ . hc ¯ 137 Obige radiale Schr¨odinger-Gleichung erh¨alt dann n¨amlich die einfache Form 2 d l(l + 1) λ 1 − ul (ρ) = 0 . − + (3.44) dρ2 ρ2 ρ 4 αe =
F¨ ur ρ → 0 reduziert sich diese auf 2 d l(l + 1) ul (ρ) = 0 , − dρ2 ρ2 ur deren regul¨ are L¨ osung proportional zu ρl+1 ist. Auf der anderen Seite gilt f¨ ρ → ∞ die Gleichung 2 d 1 u(ρ) = 0 . − dρ2 4 12
Man beachte: Die Masse des Protons ist etwa 1840 mal gr¨ oßer als die des Elektrons, so daß f¨ ur alle wasserstoff¨ ahnlichen Atome in sehr guter N¨ aherung gilt: µ ≈ me .
3.5 Schr¨ odinger-Gleichung in drei Dimensionen
319
Ihre im Unendlichen abfallende (normierbare) L¨ osung verh¨ alt sich wie e−ρ/2 . Insgesamt bietet sich daher zur L¨ osung von (3.44) der Ansatz ul (ρ) = e−ρ/2 ρl+1 H(ρ) an, woraus die Differentialgleichung ρH + (2l + 2 − ρ)H + (λ − l − 1)H = 0
(3.45)
folgt. Der Potenzreihenansatz ∞
H(ρ) =
ai ρi
i=0
f¨ uhrt schließlich zu ∞ [(i + 1)(i + 2l + 2)ai+1 + (λ − l − 1 − i)ai ] ρi = 0 , i=0
und man erh¨ alt folgende Rekursionsformel f¨ ur die Entwicklungskoeffizienten ai : i+l+1−λ ai . ai+1 = (i + 1)(i + 2l + 2) Damit ul im Unendlichen das geforderte asymptotische Verhalten hat, muß die Potenzreihe ab irgend einem i = n abbrechen, d.h. λ = n + l + 1 .
(3.46)
Dies ist gerade die Quantisierungsbedingung f¨ ur λ und damit f¨ ur die Ener¨ gieniveaus der gebundenen Zust¨ ande zum Drehimpuls (l, m). Ublicherweise f¨ uhrt man die Gr¨ oße n = n + l + 1 ein und bezeichnet sie als Hauptquantenzahl. Somit geh¨ ort zu jedem n > 0 der radiale Zustand un,l (ρ) = e−ρ/2 ρl+1
n−l−1 i=0
(−1)i
(n − l − 1)!(2l + 1)! ρi (n − l − 1 − i)!(2l + 1 + i)!i!
(n − l − 1)!(2l + 1)! 2l+1 Ln−l−1 (ρ) , = e−ρ/2 ρl+1 [(n + l)!]2
(3.47)
wobei Lkp (ρ) =
p i=0
(−1)i
[(p + k)!]2 ρi (p − i)!(k + i)!i!
die Laguerreschen Polynome sind. Die zu (3.47) geh¨ orenden Energieeigenwerte lauten Z 2 e4 µ E1 Z 2 e4 µ 1 = − µc2 Z 2 αe2 . (3.48) En = − 2 2 = 2 , E1 = − 2 n 2 2¯ h n 2¯ h
320
3. Quantenmechanik Kontinuierliches Spektrum
0 E1 /16 E1 /9
4s 3s
4p 3p
E1 /4
2s
2p
E1
1s s(l = 0)
p(l = 1)
4d 3d
d(l = 2)
4f
f (l = 3)
Abb. 3.7. Termschema des naiven Wasserstoffatoms“ ”
Offensichtlich h¨ angt En nicht von l ab, d.h. bei gegebenem n haben alle durch l < n und −l ≤ m ≤ l charakterisierten Zust¨ande die gleiche Energie und sind somit entartet. Der Entartungsgrad betr¨agt13 n−1
(2l + 1) = n2 .
l=0
In der Atomspektroskopie ist es u ¨blich, die durch l definierten Zust¨ande in aufsteigender Reihenfolge mit den Buchstaben s, p, d, f, g, . . . zu bezeichnen, denen die jeweilige Hauptquantenzahl n vorangestellt wird. Die mit der Orientierung des Systems verbundene magnetische Quantenzahl m wird dabei stillschweigend unterdr¨ uckt. Abbildung 3.7 zeigt eine graphische Darstellung der Energieniveaus des Wasserstoffatoms (Termschema). 1s ist der nichtentartete Grundzustand. Das erste angeregte Niveau ist vierfach entartet und enth¨ alt einen 2s- und drei 2p-Zust¨ande. Das zweite angeregte Niveau enth¨alt einen 3s-, drei 3p- und f¨ unf 3d-Zust¨ande und ist neunfach entartet usw. In den Unterabschnitten 3.7.3 bis 3.7.5 wird gezeigt, daß die Energieniveaus dieses naiven Spektrums“ durch Ber¨ ucksichtigung der Spinfreiheitsgrade von ” Elektron und Proton sowie relativistischer Korrekturen in weitere Linien aufspalten und damit die Entartung aufgehoben wird.
13
Streng genommen sind hierbei noch die zwei Spineinstellungen des Elektrons zu ber¨ ucksichtigen; der Entartungsgrad ist also eigentlich 2n2 .
3.5 Schr¨ odinger-Gleichung in drei Dimensionen
321
Nach R¨ uckkehr zur alten Relativkoordinate r ergeben sich aus (3.47) die ersten normierten radialen Wellenfunktionen des Wasserstoffatoms zu 3/2 Z g1,0 (r) = 2 e−Zr/r0 r0 3/2 Zr Z 1− e−Zr/2r0 g2,0 (r) = 2 2r0 2r0 3/2 Zr −Zr/2r0 1 Z g2,1 (r) = √ e r0 3 2r0 3/2 2Zr 2Z 2 r2 Z 1− e−Zr/3r0 g3,0 (r) = 2 + 3r0 3r0 27r02 √ 3/2 Zr Zr 4 2 Z 1− e−Zr/3r0 g3,1 (r) = 3 3r0 3r0 6r0 √ 3/2 2 Zr 2 2 Z √ g3,2 (r) = e−Zr/3r0 , r0 27 5 3r0 wobei r0 =
¯h µcαe
den Bohrschen Radius bezeichnet. Wir geben nun einige hieraus folgende Erwartungswerte an, deren Herleitung in Anwendung 45 vorgef¨ uhrt wird: r0 2 3n − l(l + 1) (3.49) nlm| r |nlm = rnl = 2Z = ? = ? r 2 n2 nlm| r2 |nlm = r2 nl = 0 2 5n2 + 1 − 3l(l + 1) 2Z 9 : 9 : ⎫ 1 1 Z ⎪ ⎪ nlm nlm = = ⎪ ⎪ r r nl r0 n 2 ⎪ ⎪ : 9 : 9 ⎪ 2 ⎬ 1 1 Z nlm 2 nlm = = (3.50) r r2 nl r02 n3 l + 12 ⎪ ⎪ ⎪ 9 : 9 : ⎪ ⎪ 1 1 Z3 ⎪ ⎪ ⎭ nlm 3 nlm = . = 1 3 3 3 r r r n l l + (l + 1) nl
0
2
Nimmt l seinen maximalen Wert l = n − 1 an, dann folgt f¨ ur die mittlere quadratische Radialabweichung des Elektrons vom Kern r 2 ∆r = r2 − r = √ . 2n + 1 Im Falle großer n wird die Gr¨ oße ∆r/ r sehr klein, und das Elektron ist praktisch in der Umgebung einer Kugeloberfl¨ ache vom Radius R = n2 r0 /Z lokalisiert, w¨ ahrend die zugeh¨ orige Energie E = −Z 2 e2 /(2r0 n2 ) = −Ze2 /2R der kinetischen Energie eines klassischen Elektrons entspricht, das den Kern auf einer Kreisbahn mit Radius R umkreist. Dies ist ein Beispiel f¨ ur das
322
3. Quantenmechanik
Korrespondenzprinzip, auf das in Unterabschn. 3.2.1 hingewiesen wurde und nach dem die Gesetze der Quantenmechanik im Grenzfall großer Quantenzahlen bzw. im Grenzfall h ¯ → 0 in die entsprechenden Gesetze der klassischen Theorie m¨ unden. Zusammenfassung • H¨ angt bei dreidimensionalen Zwei-Teilchenproblemen das Potential nur von der relativen Lage der beiden Teilchen ab, dann l¨aßt sich die Schr¨ odinger-Gleichung wie im Falle der klassischen Mechanik in zwei Gleichungen aufspalten, von denen die eine die Schwerpunktsbewegung und die andere die Relativbewegung der Teilchen beschreibt. Letztere kann als Gleichung f¨ ur ein effektives Ein-Teilchenproblem in Anwesenheit des Potentials aufgefaßt werden. • Bei zentralsymmetrischen Potentialen l¨aßt sich in der polaren Ortsdarstellung der radiale Anteil vom Winkelanteil separieren, wobei letzterer durch die Kugelfl¨achenfunktionen, also den Eigenfunktionen des Bahndrehimpulses gel¨ost wird. Die L¨osungen des Radialteils ergeben sich aus der Radialgleichung f¨ ur zentralsymmetrische Potentiale. • F¨ ur den freien Fall (und f¨ ur den Fall konstanter Potentialabschnitte) geht diese u arische Besselsche Differentialgleichung, deren ¨ber in die sph¨ L¨ osungen die sph¨ arischen Bessel-Funktionen sind. • Die Bindungszust¨ande wasserstoff¨ahnlicher Atome werden naiv durch drei Quantenzahlen charakterisiert, der Hauptquantenzahl n, der Orbitalquantenzahl l < n und der magnetischen Quantenzahl m = −l, . . . , l. Die entsprechenden Bindungsenergien h¨angen nur von der Hauptquantenzahl n ab und sind somit ohne Ber¨ ucksichtigung der zwei Spineinstellungen des H¨ ullenelektrons n2 -fach entartet.
Anwendungen 44. Dreidimensionaler anisotroper Oszillator. Man bestimme die Energieeigenwerte eines dreidimensionalen anisotropen Oszillators, dessen station¨ are Schr¨ odinger-Gleichung in der Ortsdarstellung gegeben ist durch HΨ (x) = EΨ (x) , H = −
¯2 2 m 2 2 h ∇ + ω1 x + ω22 y 2 + ω32 z 2 . 2m 2
L¨ osung. Der Produktansatz Ψ (x, y, z) = u1 (x)u2 (y)u3 (z) u uhrt (3.51) in die Gleichung ¨berf¨
(3.51)
Anwendungen
323
¯ 2 h m u1 (x) + ω12 x2 u1 (x) − E1 u1 (x) u2 (y)u3 (z) 2m 2 2 m h ¯ u2 (y) + ω22 y 2 u2 (y) − E2 u2 (y) u1 (x)u3 (z) + − 2m 2 2 m 2 2 h ¯ + − u (z) + ω3 z u3 (z) − E3 u3 (z) u1 (x)u2 (y) = 0 , 2m 3 2 −
(3.52)
mit E = E1 + E 2 + E 3 . Offensichtlich ist (3.52) erf¨ ullt, wenn die Klammerterme verschwinden, d.h. 2 h ¯ m 2 2 − u (ξ) + ωi ξ ui (ξ) = Ei ui (ξ) , i = 1, 2, 3 . 2m i 2 Das vorliegende Problem reduziert sich also auf drei Gleichungen f¨ ur jeweils einen eindimensionalen Oszillator, der in Unterabschn. 3.3.5 diskutiert wurde. Wir k¨ onnen daher die dort erarbeiteten Ergebnisse u ¨bernehmen und erhalten f¨ ur die Gesamtenergie des Systems 1 1 1 +h ¯ ω 2 n2 + +h ¯ ω 3 n3 + . E=h ¯ ω 1 n1 + 2 2 2 F¨ ur die Grundzustandswellenfunktion (n1 = n2 = n3 = 0) ergibt sich √ b1 b2 b3 − 12 (b21 x2 +b22 y2 +b23 z2 ) mωi , b2i = . Ψ0,0,0 (x) = e h ¯ π 3/4 45. Erwartungswerte im Wasserstoffatom. Man zeige mit Hilfe der radialen Schr¨ odinger-Gleichung, daß f¨ ur wasserstoff¨ ahnliche Atome gilt: 2 Z Z ? s−1 = (s + 1) 2 2 rs nl − (2s + 1) r nl r0 n r0 ? = s + (2l + 1)2 − s2 rs−2 nl = 0 . (3.53) 4 L¨ osung. Nach (3.39) gilt f¨ ur wasserstoff¨ ahnliche Atome u (r) −
Z2 l(l + 1) 2Z u(r) − u(r) + u(r) = 0 , u(r) = un,l (r) . (3.54) r2 r0 r r02 n2
Es folgt somit ∞ ∞ ∞ 2Z s s−2 2 drr u(r)u (r) = l(l + 1) drr u (r) − drrs−1 u2 (r) r0 0
0 2
+
Z r02 n2
0
∞ drrs u2 (r) 0
? = 2Z ? s−1 = Z2 = l(l + 1) rs−2 nl − r + rs nl . (3.55) nl r0 r02 n2
324
3. Quantenmechanik
Andererseits erh¨alt man durch partielle Integration ∞ ∞ ∞ s s−1 drr u(r)u (r) = −s drr u(r)u (r) − drrs u2 (r) 0
0
0
∞ = −s
drrs−1 u(r)u (r)
0
2 + s+1
∞
drrs+1 u (r)u (r) ,
(3.56)
0
wobei sich der letzte Term mit Hilfe von (3.54) umschreiben l¨aßt zu ∞ ∞ ∞ 2Z s+1 s−1 drr u (r)u (r) = l(l + 1) drr u(r)u (r) − drrs u(r)u (r) r0 0
0
+
Z2 r02 n2
∞
0
drrs+1 u(r)u (r) .
(3.57)
0
Ber¨ ucksichtigt man nun, daß gilt: ∞ ∞ = k k? k drr u(r)u (r) = − drrk−1 u2 (r) = − rk−1 , 2 2 0
0
dann f¨ uhrt die Kombination von (3.55), (3.56) und (3.57) auf die Beziehung (3.53).
3.6 Elektromagnetische Wechselwirkung In Unterabschn. 3.5.5 wurde die Wechselwirkung eines Elektrons mit einem elektrostatischen Coulomb-Feld anhand des Wasserstoffatoms diskutiert. In diesem Abschnitt wollen wir uns nun allgemeiner mit der Dynamik eines Elektrons befassen, das sich in einem elektromagnetischen Feld befindet. Hierbei spielt der Begriff der Eichinvarianz eine wichtige Rolle, aus dem sich einige interessante Quanteneffekte ableiten lassen. Am Ende liefern wir nachtr¨aglich die physikalische Begr¨ undung des Elektronspins, dem wir bisher schon einige Male begegnet sind. 3.6.1 Elektron im elektromagnetischen Feld F¨ ur die folgende Diskussion wird empfohlen, sich insbesondere die Abschnitte 2.1 und 2.2 ins Ged¨achtnis zu rufen. Ausgangspunkt f¨ ur die quantenmechanische Beschreibung der Elektronbewegung in einem ¨außeren elektromagnetischen Feld ist die klassische Bewegungsgleichung eines Elektrons der Masse me und der Ladung e:
3.6 Elektromagnetische Wechselwirkung
x˙ ¨ = e E(x, t) + × B(x, t) . me x c
325
(3.58)
Das elektrische Feld E und das Magnetfeld B sind u ¨ber 1 ∂A − ∇φ B =∇×A , E =− c ∂t mit dem Skalarpotential φ und dem Vektorpotential A verbunden. Gleichung (3.58) l¨ aßt sich aus den Gesetzen der Hamiltonschen Mechanik herleiten, wenn man f¨ ur die Hamilton-Funktion folgende Form ansetzt: 1 e2 e 2 1 2e H= p2 − pA + 2 A2 + eφ . p − A + eφ = 2me c 2me c c Denn es gilt e e2 ∇x (A2 ) + e∇x φ = −p˙ ∇x (pA) + 2me c2 me c 1 e ∇p H = p− A = x˙ me c me und somit ∂A e ˙ ¨ = p˙ − , ∇ = ∇x (x∇)A + me x ∂t c e = [(p∇)A + p × (∇ × A)] me c e2 [2(A∇)A + 2A × (∇ × A)] − 2me c2 ∂A e ˙ (x∇)A + −e∇φ − c ∂t 7 6 e 1 1 e e = A ∇ A+ A × (∇ × A) p− p+ c me me c me me c e ∂A ˙ −e∇φ − (x∇)A + c ∂t e = x˙ × B + eE . c ¨ Der Ubergang zur Quantenmechanik geschieht durch die u ¨bliche Ersetzung, und wir erhalten den ∇x H = −
Satz 3.21: Elektron in einem ¨ außeren elektromagnetischen Feld Bezeichnen A und φ das Vektor- bzw. Skalarpotential der elektromagnetischen Felder E und B, so ist der Hamilton-Operator in der Ortsdarstellung f¨ ur ein mit E und B wechselwirkendes Elektron gegeben durch 2 1 e h ¯ H= ∇ − A(x, t) + eφ(x, t) . 2me i c
326
3. Quantenmechanik
In der Coulomb-Eichung ∇A = 0 geht dieser u ¨ber in H=−
e2 ie¯ h ¯2 h A∇ + ∇2 + A2 + eφ . 2me me c 2me c2
(3.59)
Nimmt man an, daß das magnetische Feld nur eine Komponente in zRichtung besitzt, ⎛ ⎞ ⎛ ⎞ −y 0 1 B B = ∇ × A = B ⎝ 0 ⎠ , mit A = ⎝ x ⎠ = − x × B , 2 2 0 1 dann folgt f¨ ur den zweiten und dritten Term von (3.59) ie¯ h ie¯ h e A∇Ψ = B(x × ∇)Ψ = −M BΨ , M = L me c 2me c 2me c e2 e2 B 2 2 e2 2 2 x B − (xB)2 Ψ = (x + y 2 )Ψ , A2 Ψ = 2 2 2me c 8me c 8me c2 wobei die Gr¨ oße M als magnetisches Dipolmoment des Elektrons mit dem Bahndrehimpuls L interpretiert werden kann. F¨ ur die meisten atomaren Systeme ist bei der Gr¨oße der im Labor erreichbaren B-Felder (≈ 10−4 Gauß) der in A quadratische Term um etliche Gr¨oßenordnungen kleiner als der lineare und kann daher vernachl¨assigt werden. Normaler Zeeman-Effekt. Betrachten wir als Anwendungsbeispiel das in Unterabschn. 3.5.5 naiv besprochene Wasserstoffatom in einem ¨außeren konstanten Magnetfeld in z-Richtung, B = Bez . Die zugeh¨orige Schr¨odingerGleichung lautet unter Vernachl¨assigung des A2 -Terms (H (0) + H (1) )Ψ = (E (0) + E (1) )Ψ , mit H (0) = −
¯2 2 h Ze eB ∇ + eφ , φ(x) = − , H (1) = − Lz . 2µ |x| 2µc
Da die L¨ osungen Ψn,l,m der Wasserstoffgleichung µc2 Z 2 αe2 2n2 auch Eigenzust¨ ande von Lz sind, ergibt sich E (1) unmittelbar aus H (0) Ψn,l,m = E (0) Ψn,l,m , E (0) = En(0) = −
H (1) Ψn,l,m = E (1) Ψn,l,m zu (1)
E (1) = Elm = −
eB ¯hm . 2µc
Die zu festem l geh¨orenden (2l + 1)-fach entarteten Niveaus werden also bei Anwesenheit eines konstanten Magnetfeldes in 2l + 1 ¨aquidistante Niveaus aufgespalten (Abb. 3.8).
3.6 Elektromagnetische Wechselwirkung
l=2
327
m +2 +1 0 −1 −2
+1 0 −1 Abb. 3.8. Linienaufspaltung der naiven l=1- und l=2-Wasserstoffniveaus in Anwesenheit eines ¨ außeren Magnetfeldes (normaler Zeeman-Effekt) l=1
3.6.2 Eichinvarianz der Schr¨ odinger-Gleichung Im Gegensatz zu den Maxwellschen Gleichungen ist die Schr¨ odinger-Gleichung
2 1 h ¯ e ∂ψ(x, t) = ∇ − A(x, t) + eφ(x, t) ψ(x, t) (3.60) i¯ h ∂t 2m i c nicht invariant unter den Eichtransformationen 1 ∂χ . A −→ A = A + ∇χ , φ −→ φ = φ − c ∂t Man kann nun aber ihre Eichinvarianz gew¨ ahrleisten, indem man die Wellenfunktion ψ mit einer Phase multipliziert, die geeignet zu w¨ ahlen ist: ψ(x, t) −→ ψ (x, t) = eiΛ(x,t) ψ(x, t) . Dr¨ uckt man in (3.60) A, φ und ψ durch die transformierten Gr¨ oßen A , φ und ψ aus, so ergibt sich ∂Λ ∂ψ −iΛ ψ + −i i¯ he ∂t ∂t h ¯ e h ¯ e e e 1 ∇ − A + ∇χ ∇ − A + ∇χ e−iΛ ψ = 2m i c c i c c ∂χ 1 e−iΛ ψ +e φ + c ∂t h ¯ h ¯ 1 e e e e = ∇ − A + ∇χ e−iΛ ∇ − A + ∇χ − ¯ h∇Λ ψ 2m i c c i c c ∂χ 1 e−iΛ ψ +e φ + c ∂t 2 h 1 −iΛ ¯ e e = e ∇ − A + ∇χ − ¯ h∇Λ ψ 2m i c c
328
3. Quantenmechanik
1 ∂χ +e φ + c ∂t
e−iΛ ψ .
(3.61)
Mit der Wahl e χ(x, t) hc ¯ geht (3.61) u ¨ber in die zur Schr¨odinger-Gleichung (3.60) formgleiche Gleichung
2 ∂ψ (x, t) ¯h e 1 i¯ h ∇ − A (x, t) + eφ (x, t) ψ (x, t) . (3.62) = ∂t 2m i c Λ(x, t) =
Das heißt (3.60) ist nun, wie gew¨ unscht, invariant unter obigen Eichtransformationen. Hat man es mit einem Raum ohne Magnetfeld zu tun (B = 0), dann gibt es zwei M¨ oglichkeiten zur Beschreibung der Bewegung eines Elektrons in einem elektrischen Potential φ. Entweder man l¨ost die Schr¨odinger-Gleichung ∂ψ ¯h2 i¯ h (3.63) ∇2 + eφ ψ , = − ∂t 2me in der das Vektorpotential u ¨berhaupt nicht vorkommt, oder man beachtet die Eichfreiheit und verwendet die allgemeinere Gleichung (3.62), wobei jetzt A = ∇χ
(3.64)
zu w¨ ahlen ist. Die Wellenfunktion ψ ist dann mit ψ aus (3.63) u ¨ber ψ (x, t) = eie/(¯hc)χ(x,t) ψ(x, t) verkn¨ upft. Man k¨onnte meinen, daß der Phasenfaktor in der Wellenfunktion keine physikalischen Konsequenzen hat, da ja nur ihr Betragsquadrat experimentell zug¨ anglich ist. Es gibt jedoch Situationen, in denen die Wellenfunktion selbst, das heißt ihre Phase durchaus eine Rolle spielt. Zwei Effekte dieser Art werden im folgenden vorgestellt. Quantisierung des magnetischen Flusses. Man betrachte einen torusf¨ ormigen Supraleiter in einem konstanten Magnetfeld unterhalb seiner kritischen Temperatur Tc (Abb. 3.9). Aufgrund des Meißner-Effektes wird das Magnetfeld aus dem Torus verdr¨angt, so daß er feldfrei ist. Der Phasenfaktor χ der Wellenfunktion eines im Torus befindlichen Elektrons kann gem¨ aß (3.64) ausgedr¨ uckt werden durch x χ(x, t) = dx A(x , t) , x0
wobei x0 einen beliebigen Fixpunkt innerhalb des Torus und A(= A ) das Vektorpotential des Magnetfeldes außerhalb des Torus bezeichnet. Dieses Wegintegral ist jedoch aufgrund des durch das Loch des Torus hindurchtretende Magnetfeld nicht eindeutig und h¨angt vom gew¨ahlten Integrationsweg
3.6 Elektromagnetische Wechselwirkung
329
T > Tc T < Tc Abb. 3.9. Feldlinienverteilung eines ¨ außeren Magnetfeldes in Anwesenheit eines supraleitenden Mediums oberhalb der kritischen Temperatur Tc (links) und unterhalb von Tc (rechts)
ab. Betrachtet man z.B. zwei Wege 1 und 2, die sich um eine Windung l¨ angs des Torus unterscheiden, so ist die Differenz gegeben durch dx A(x , t) = dF ∇ × A(x , t) dx A(x , t) − dx A(x , t) = 1
2
F
dF B(x , t) = Φm .
= F
Φm ist gerade der magnetische Fluß, der durch die von den Wegen 1 und 2 aufgespannte Fl¨ ache (Loch des Torus) hindurchtritt. Aus physikalischen Gr¨ unden m¨ ussen wir fordern, daß die Wellenfunktion selbst eindeutig ist, also den Unterschied in den Wegen 1 und 2 nicht sp¨ urt. Dies bedeutet, daß der magnetische Fluß gequantelt sein muß: 2π¯hc n , n = 0, ±1, ±2, . . . . Φm = e Im Experiment l¨ aßt sich tats¨ achlich eine Quantisierung beobachten, allerdings mit einer Modifikation: 2π¯hc Φm = n. 2e Eine Erkl¨ arung des Faktors 2 im Nenner liefert die Coopersche Theorie, nach der jeweils zwei Elektronen in supraleitenden Metallen korrelierte Zust¨ ande (Cooper-Paare) bilden. Bohm-Aharanov-Effekt. Ein weiteres Experiment, das die Abh¨ angigkeit der Phase vom magnetischen Fluß zeigt, ist in Abb. 3.10 zu sehen. Es besteht aus einem Doppelspaltexperiment, bei dem hinter die beiden Spalte eine elektrische Spule angebracht wird, die ihrerseits einen magnetischen Fluß Φm erzeugt. Das auf dem Beobachtungsschirm entstehende Interferenzmuster kommt von der Superposition der beiden, auf den Wegen 1 und 2 entlanglaufenden Wellenfunktionen zustande:
330
3. Quantenmechanik
Elektronenquelle
Weg 1 magn. Fluß Weg 2
Schirm Abb. 3.10. Experimentelle Anordnung zur Messung der relativen Phasenlage von auf verschiedenen Wegen entlanglaufenden Elektronwellen, die einen magnetischen Fluß umschließen
⎛ ψ = ψ1 + ψ2 = ψ1 exp ⎝
ie ¯c h
⎞
⎛
dx A⎠ + ψ2 exp ⎝
ie ¯c h
1
⎞ dx A⎠
2
⎛ ⎞ ie ie = ψ1 exp Φm + ψ2 exp ⎝ dx A⎠ . ¯hc ¯hc 2
Die relative Phase der beiden Wellenfunktionen unterscheidet sich also bei eingeschaltetem Spulenstrom gegen¨ uber dem abgeschalteten Zustand durch den Faktor exp h¯iec Φm . Dieser Effekt, auf den zuerst Bohm und Aharanov hingewiesen haben, wurde in der Tat experimentell beobachtet. 3.6.3 Stern-Gerlach-Experiment Wir holen nun zum Schluß dieses Abschnittes die Begr¨ undung des bereits in Unterabschn. 3.4.3 eingef¨ uhrten Elektronspinoperators anhand eines von Stern und Gerlach durchgef¨ uhrten Experimentes nach. Hierzu betrachten wir einen homogenen Strahl von Wasserstoffatomen, die ein in z-Richtung verlaufendes und in dieser Richtung stark inhomogenes Magnetfeld B = B(z)ez durchfliegen (Abb. 3.11).14 Besitzt ein Atom des Strahls ein magnetisches Moment M , so ist seine potentielle Energie im Magnetfeld gegeben durch V (z) = −M B = −Mz B(z) . Klassisch gesehen wirkt dann auf das Atom eine Kraft in z-Richtung, ∂B ∂V Fz = − = Mz , ∂z ∂z die es ablenkt. Da hierbei Mz alle reellen Werte in einem bestimmten Intervall um Null annehmen kann, erwarten wir eine verschmierte Auff¨acherung des Strahls. Aus quantenmechanischer Sicht besitzt dagegen der Operator M z nach Satz 3.21 die diskreten Eigenwerte 14
Das Experiment wurde eigentlich mit Silberatomen durchgef¨ uhrt. Die folgenden Betrachtungen gelten jedoch auch f¨ ur die einfacher gebauten Wasserstoffatome.
3.6 Elektromagnetische Wechselwirkung
331
S z y x
Schirm N
Abb. 3.11. Experimentelle Anordnung zum Nachweis des intrinsischen Drehimpulses (Spin) von Elektronen
¯he m , m = −l, . . . , l . 2me c Befinden sich die Atome alle im gleichen Zustand, dann sollte der Strahl also in 2l + 1 ¨aquidistante Teilstrahlen aufspalten. Insbesondere erwartet man keine Aufspaltung f¨ ur den Fall, daß alle Atome im Grundzustand (n = 1, l = 0) sind. Was man jedoch tats¨ achlich beobachtet, ist eine Aufspaltung in zwei Strahlen. Neben dem magnetischen Moment, das von der Bahnbewegung des Elektrons um den Kern herr¨ uhrt, muß es offensichtlich ein weiteres Dipolmoment geben, das auch bei verschwindendem Bahndrehimpuls vorhanden ist. Der hierzu geh¨ orende Drehimpulsoperator ist gerade der in Unterabschn. 3.4.3 besprochene Elektronspin S, dessen Quantenzahlen s = 1/2 und ms = ±1/2 aus der zweifachen Aufspaltung des Strahls folgen. Die Gr¨ oße des magnetischen Moments des Elektronspins kann durch dieses Experiment ebenfalls bestimmt werden und ist ege S , ge ≈ 2 , M (e) = (3.65) 2me c wobei ge das gyromagnetische Verh¨ altnis des Elektrons bezeichnet. Aus ¨ ahnlichen Experimenten geht hervor, daß auch das Proton einen elektronartigen Spin S mit s = 1/2 besitzt, der mit einem sehr viel kleineren magnetischen Dipolmoment (e=Elektronladung) egp S , gp ≈ 5.56 M (p) = 2mp c ur verbunden ist. Die Wechselwirkung zwischen M (e) und M (p) ist gerade f¨ die Hyperfeinstrukturaufspaltung des Wasserstoffatoms verantwortlich, auf die wir in Unterabschn. 3.7.5 zu sprechen kommen werden.
332
3. Quantenmechanik
Zusammenfassung • Der Hamilton-Operator f¨ ur ein Elektron, das mit einem ¨außeren elektromagnetischen Feld wechselwirkt, ergibt sich durch die u ¨bliche Operatorersetzung aus der die klassische Bewegung des Elektrons beschreibenden Hamilton-Funktion. Ein Term des Hamilton-Operators l¨aßt sich als magnetisches Dipolmoment des Elektrons interpretieren, das durch seinen Bahndrehimpuls hervorgerufen wird. • Durch Multiplikation der Elektronwellenfunktion mit einem geeigneten Phasenfaktor (Eichtransformation) erweist sich die Schr¨odingerGleichung als invariant unter Eichtransformationen des elektromagnetischen Feldes. • Dieser Phasenfaktor zeigt in bestimmten Situationen tats¨achlich physikalische Auswirkungen (Quantisierung des magnetischen Flusses, Bohm-Aharanov-Effekt). • Aus dem Stern-Gerlach-Experiment und ¨ahnlichen Versuchen folgt, daß Elektron und Proton einen intrinsischen Drehimpuls (Spin) besitzen, der auf zwei Einstellungen beschr¨ankt ist. Mit ihm ist jeweils ein magnetisches Dipolmoment verbunden, wobei das Dipolmoment des Protons etwa um den Faktor mp /me ≈ 2000 kleiner ist als das des Elektrons.
Anwendungen 46. Kontinuit¨ atsgleichung. Man zeige, daß f¨ ur ein System, welches durch die Schr¨ odinger-Gleichung 2 d e 1 i¯ h ψ(x, t) = Hψ(x, t) , H = P − A(x, t) + eφ(x, t) (3.66) dt 2m c beschrieben wird, die Kontinuit¨atsgleichung d ∗ (ψ ψ) + ∇j = 0 dt gilt, wobei die Teilchenstromdichte j gegeben ist durch h ¯ 2ie ∗ ∗ ∗ j= ψ ∇ψ − ψ∇ψ − Aψ ψ . 2im ¯hc L¨ osung. Multipliziert man (3.66) mit ψ ∗ , ihre adjungierte Gleichung mit ψ und zieht anschließend beide Gleichungen voneinander ab, dann folgt i¯ h
d ∗ ¯h2 ∗ 2 (ψ ψ) + [ψ ∇ ψ − ψ∇2 ψ ∗ dt 2m 2ie ∗ − (ψ A∇ψ + ψA∇ψ ∗ + ψ ∗ ψ∇A)] = 0 ¯hc
Anwendungen
333
d ∗ ¯2 h 2ie (ψ ψ) + ∇ ψ ∗ ∇ψ − ψ∇ψ ∗ − Aψ ∗ ψ = 0 dt 2m hc ¯ d h ¯ 2ie ψ ∗ ∇ψ − ψ∇ψ ∗ − Aψ ∗ ψ . =⇒ (ψ ∗ ψ) + ∇j = 0 , j = dt 2im hc ¯
=⇒ i¯ h
Man beachte, daß bei dieser Herleitung keine Eichbedingung benutzt wurde. 47. Elektron im konstanten Magnetfeld. Ein Elektron der Masse me und der Ladung e bewege sich in einem konstanten Magnetfeld B = Bez . Wie lauten die station¨ aren L¨ osungen der zugeh¨origen Schr¨ odinger-Gleichung? L¨ osung. W¨ ahlt man f¨ ur A die Form ⎛ ⎞ −y B A = ⎝ x ⎠ , ∇A = 0 , 2 0 dann ist der Hamilton-Operator f¨ ur das vorliegende Problem nach Satz 3.21 gegeben durch H=−
¯2 h eB e2 B 2 2 Lz + x + y2 . ∇2 − 2 2me 2me c 8me c 2
2
e B 2 2 Die Gegenwart des Potentials“ 8m 2 (x + y ) legt zur Separation der Vaec ” riablen die Verwendung von Zylinderkoordinaten nahe:
x = r cos ϕ , y = r sin ϕ . Damit folgt f¨ ur die Differentialoperatoren Lz und ∇2 Lz = −i¯ h
1 ∂2 ∂ ∂2 ∂2 1 ∂ , ∇2 = 2 + 2 + + 2 ∂ϕ ∂z ∂r r ∂r r ∂ϕ2
und f¨ ur den Hamilton-Operator 2 h2 ¯ 1 ∂2 e2 B 2 2 ∂ i¯ heB ∂ ∂2 1 ∂ H=− + + + + + r . 2me ∂z 2 ∂r2 r ∂r r2 ∂ϕ2 2me c ∂ϕ 8mc2 ande Offensichtlich gilt [H, Lz ] = 0, so daß es sich anbietet, die Eigenzust¨ von H in der Weise Ψ (r, ϕ, z) = u(r)v(ϕ)w(z) , v(ϕ) = eimϕ , w(z) = eikz zu schreiben, wobei v(ϕ) Eigenfunktion von Lz mit dem Eigenwert ¯hm ist. Die station¨ are Schr¨ odinger-Gleichung geht somit in folgende Differentialgleichung f¨ ur u u ¨ber: 2me E e2 B 2 2 u (r) meB m2 2 + − 2 2 r − k − 2 u(r) = 0. (3.67) u (r) + + r hc ¯ r h2 ¯ 4¯ h c Unter Einf¨ uhrung der neuen Gr¨ oßen
2 2 h k eB 4me c ¯ x= − − E − 2m r, Λ= 2¯ hc heB 2me ¯
334
3. Quantenmechanik
folgt weiter
1 m2 2 u (x) + u (x) + Λ − x − 2 u(x) = 0 . x x
Man erkennt hieraus das folgende asymptotische Verhalten von u f¨ ur große bzw. kleine x: 2
x → ∞ : u (x) − x2 u(x) = 0 =⇒ u(x) ∼ e−x /2 1 m2 x → 0 : u (x) + u (x) − 2 u(x) = 0 =⇒ u(x) ∼ x|m| . x x Zur L¨ osung von (3.67) machen wir daher den Ansatz 2
u(x) = G(x)e−x
/2 |m|
x
,
woraus sich die Differentialgleichung 2|m| + 1 − 2x G (x) + (Λ − 2 − 2|m|)G(x) = 0 G (x) + x ergibt. Substituieren wir jetzt y = x2 , dann folgt schließlich die zu (3.45) formgleiche Differentialgleichung Λ − 2 − 2|m| G(y) = 0 , 4 wenn man in (3.45) die Ersetzungen yG (y) + (|m| + 1 − y)G (y) +
Λ |m| − 1 , λ −→ 2 4 vornimmt. Ein Vergleich mit (3.46) liefert die Energieeigenwerte unseres Problems: Λ |m| + 1 − = n = 0, 1, 2, . . . 4 2 ¯h2 k 2 ¯heB (2n + |m| + 1 + m) . ⇐⇒ En = − 2me 2me c l −→
Die zugeh¨ origen unnormierten Eigenfunktionen erh¨alt man durch Vergleich mit (3.47) zu |m|
G(y) = Ln (y) .
3.7 Sto ¨rungsrechnung und reales Wasserstoffatom Die meisten quantenmechanischen Systeme lassen sich auf analytischem Wege nicht exakt berechnen. Unter gewissen Umst¨anden kann man jedoch N¨aherungsverfahren heranziehen, die einer exakten L¨osung des Problems sehr nahe kommen. In diesem Abschnitt diskutieren wir ein solches Verfahren, n¨amlich
3.7 St¨ orungsrechnung und reales Wasserstoffatom
335
die zeitunabh¨ angige St¨ orungstheorie. Sie l¨ aßt sich oftmals dann anwenden, wenn man es mit gebundenen Systemen zu tun hat, deren Hamilton-Operator zeitunabh¨ angig ist. Der Abschnitt beginnt mit einer allgemeinen Diskussion der zeitunabh¨ angigen St¨ orungstheorie f¨ ur den nichtentarteten und entarteten Fall. Realistische Anwendungsbeispiele dieser Methode sind z.B. der Stark- und der anomale Zeeman-Effekt, die ebenfalls hier besprochen werden. Desweiteren werden wir sehen, wie das in Unterabschn. 3.5.5 bereits naiv diskutierte Wasserstoffatom mit Hilfe der zeitunabh¨ angigen St¨ orungstheorie in einer realistischeren Weise beschrieben werden kann (Feinstruktur- und Hyperfeinstrukturaufspaltung). 3.7.1 Zeitunabh¨ angige St¨ orungstheorie Man betrachte die zeitunabh¨ angige Schr¨ odinger-Gleichung (H (0) + H ) | n = En | n .
(3.68)
Wir nehmen an, daß zu H ein vollst¨ andiger Satz von nichtentarteten, or= (0) (0) samt zugeh¨origer Eigenwerte En bekannt thonormalen Eigenvektoren n sei: > > H (0) n(0) = En(0) n(0) . (0)
Desweiteren soll H in einem sp¨ ater zu definierenden Sinne klein“ gegen¨ uber ” ¨ H (0) sein. Ublicherweise bezeichnet man H (0) als ungest¨ orten Hamiltonoroperator oder St¨ orung. Zur L¨ osung von (3.68) f¨ uhren Operator und H als St¨ wir einen fiktiven St¨ orparameter λ ein, den wir weiter unten wieder entfernen bzw. Eins setzen und formulieren (3.68) um zu (H (0) + λH ) | n = En | n , wobei sich die Kleinheit von H zun¨ achst im Parameter λ widerspiegelt. Nun ist es sinnvoll, anzunehmen, daß sich die Energien En und die (unnormierten) Zust¨ ande | n in Potenzreihen von λ ausdr¨ ucken lassen, En = En(0) + λEn(1) + λ2 En(2) + . . . > > > | n = n(0) + λ n(1) + λ2 n(2) + . . . ,
(3.69)
wobei die gest¨ orten Gr¨ oßen f¨ ur λ → 0 kontinuierlich in die entsprechenden Gr¨ oßen des ungest¨ orten Problems u ¨bergehen: > λ → 0 =⇒ | n → n(0) , En → En(0) . = Aufgrund der Vollst¨ andigkeit der ungest¨ orten Basiszust¨ ande n(0) lassen = sich die Kets n(r) , r > 0, nach diesen entwickeln,
336
3. Quantenmechanik
> > (r) (r) (0) = , Cm m n m
und wir erhalten > > > (1) (0) (2) (0) + λ2 + ... Cm Cm | n = n(0) + λ m m m
m (r) Cm
bzw. nach geeigneter Umskalierung der > > > (1) (0) (2) (0) + λ2 + ... . | n = n(0) + λ Cm Cm m m m=n
(3.70)
m=n
Setzt man nun die Gleichungen (3.69) und (3.70) in das Ausgangsproblem (3.68) ein und ordnet die Terme nach Potenzen von λ, dann ergeben sich in den niedrigsten Ordnungen die Gleichungen: 0. Ordnung: > > H (0) n(0) = En(0) n(0) 1. Ordnung: > > > (1) (0) (1) (0) + H n(0) = En(0) Cm Cm H (0) m m m=n
m=n
> +En(1) n(0)
(3.71)
2. Ordnung: > > > (1) (0) (2) (0) (2) (0) H (0) + H = En(0) Cm Cm Cm m m m m=n
m=n
m=n
+En(1)
> (1) (0) Cm m
m=n
> +En(2) n(0) .
(3.72)
Die 0. Ordnung f¨ uhrt offensichtlich wieder auf die Gleichung ur das un f¨ ? gest¨ orte Problem. Multipliziert man (3.71) von links mit n(0) , so folgt > @ En(1) = n(0) H n(0) , (0)
d.h. die Korrekturenergie 1. Ordnung zur ungest¨orten Energie En ist gleich Erwartungswert der St¨orung H im entsprechenden ungest¨orten Zustand dem = (1) n(0) . Die Entwicklungskoeffizienten Cm erh¨alt man durch Linksmultipli? (0) ? (0) = n : kation von (3.71) mit k
3.7 St¨ orungsrechnung und reales Wasserstoffatom
337
> (1) (1) (0) Cm δkm Cm Em δkm + k (0) H n(0) = En(0) @
m=n
m=n
? (1) =⇒ Cm =
= m(0) H n(0) (0)
(0)
En − Em
.
Die unnormierten Zust¨ ande des gest¨ orten Problems lauten somit in 1. Ordnung (und mit λ = 1) = ? > > m(0) H n(0) (0) | n = n + (3.73) m(0) . (0) (0) En − Em m=n Zur Bestimmung der entsprechenden Gr¨ oßen in 2. Ordnung verf¨ ahrt man genauso. Wir begn¨ ugen uns hier mit der Angabe der ?Korrekturenergie 2. alt: Ordnung, die man durch Multiplikation von (3.72) mit n(0) erh¨ = ? | m(0) H n(0) |2 (2) En = . (0) (0) En − Em m=n Anhand von (3.73) l¨ aßt sich nun die Kleinheit“ von H und damit die G¨ ute ” der st¨ orungstheoretischen Entwicklung quantifizieren. Eine notwendige Be = = dingung daf¨ ur, daß n(1) klein ist gegen¨ uber n(0) , liefert die Ungleichung ? m(0) H n(0) = 1. (0) En(0) − Em Sie h¨angt offenbar von drei Faktoren ab, n¨ amlich • der absoluten Gr¨ oße der St¨ orung H , • den Matrixelementen von H zwischen ungest¨ orten Zust¨ anden und • den Energiedifferenzen zwischen diesen Zust¨ anden. (0)
(0)
Im Falle einer Entartung, En = Em , ist es offensichtlich nicht so ohne weiteres m¨ oglich, obige Bedingung f¨ ur die Anwendbarkeit der St¨ orungstheorie zu erf¨ ullen. Sie w¨ are nur dann erf¨ ullt, wenn mit den Koeffizientennennern auch gleichzeitig die Z¨ ahler also die nichtdiagonalen Matrixelemente von H verschwinden. Genauer ausgedr¨ uckt: Die Eigenvektoren von H (0) zum selben Energieeigenwert m¨ ussen gleichzeitig eine Eigenbasis von H sein. Dies l¨aßt sich aber stets erreichen, da H (0) f¨ ur diese Vektoren nicht nur diagonal sondern proportional zur Einheitsmatrix ist. Da H mit der Einheitsmatrix kommutiert, kann man H in diesem entarteten Unterraum diagonalisieren, ohne dabei die Diagonalit¨ at von H (0) zu zerst¨ oren. Man beachte also: Auch wenn die Gesamtheit der Eigenvektoren von H (0) einen unendlichdimensionalen Raum aufspannen, so betrifft die gleichzeitige Diagonalisierung von H (0) und H in der Regel jeweils nur einen kleinen endlichdimensionalen Unterraum, der gerade von den zum selben Eigenwert geh¨ orenden Eigenkets von H (0) aufgespannt wird.
338
3. Quantenmechanik
Satz 3.22: Zeitunabh¨ angige St¨ orungstheorie Gegeben sei die zeitunabh¨angige Schr¨odinger-Gleichung (H (0) + H ) | n = En | n , mit H als kleinem St¨oroperator. F¨ ur das ungest¨orte Problem > > H (0) n(0) = En(0) n(0) seien ein vollst¨ andiger Satz nichtentarteter orthonormierter L¨osungskets mit den zugeh¨origen Eigenenergien bekannt. Die Korrekturenergien in 1. und 2. Ordnung St¨orungstheorie sind dann gegeben durch ? = > @ | m(0) H n(0) |2 (0) (0) (2) (1) En = n H n , En = . (3.74) (0) (0) En − Em m=n Ist ein Energieeigenwert entartet, so hat man in dem damit verbundenen degenerierten Teilraum eine Basis zu w¨ahlen, die H diagonalisiert. Es sei an dieser Stelle darauf hingewiesen, daß sich st¨orungstheoretische Berechnungen oftmals durch Ber¨ ucksichtigung von Symmetrien vereinfachen lassen. Hat man beispielsweise [Ω, H ] = 0 , Ω | α, ω = ω | α, ω , so gilt 0 = α1 ω1 | ΩH − H Ω |α2 , ω2 = (ω1 − ω2 ) α1 , ω1 | H |α2 , ω2 . Hieraus folgt die Auswahlregel ω1 = ω2 =⇒ α1 , ω1 | H |α2 , ω2 = 0 .
(3.75) (2)
Desweiteren l¨ aßt sich die in (3.74) stehende Summe von En auf die Berechnung von drei Matrixelementen reduzieren, wenn man einen Operator Ω finden kann, f¨ ur den gilt: > > H n(0) = [Ω, H (0) ] n(0) . Unter Ausnutzung der Vollst¨andigkeit der ungest¨orten Eigenkets ergibt sich dann n¨ amlich ? =? = n(0) H m(0) m(0) ΩH (0) − H (0) Ω n(0) (2) En = (0) (0) En − Em m=n >@ > @ n(0) H m(0) m(0) Ω n(0) = m=n
@
=
> @ >@ > n(0) H Ω n(0) − n(0) H n(0) n(0) Ω n(0) .
(3.76)
3.7 St¨ orungsrechnung und reales Wasserstoffatom
339
3.7.2 Stark-Effekt Als eine erste Anwendung der zeitunabh¨ angigen St¨ orungstheorie betrachten wir das naive Wasserstoffatom in einem konstanten elektrischen Feld in zRichtung der St¨arke (Stark-Effekt). Der Hamilton-Operator f¨ ur dieses Problem lautet in der Ortsdarstellung H = H (0) + H , H (0) = −
¯ 2 2 Ze2 h ∇ − , H = −e z . 2µ r
Die Eigenfunktionen von H (0) sind Ψn,l,m (r, θ, ϕ) = gn,l (r)Yl,m (θ, ϕ) . Die Energieverschiebung des nichtentarteten Grundzustandes (n = 1) in 1. Ordnung verschwindet, da Ψ1,0,0 eine definierte Parit¨ at besitzt und somit |Ψ1,0,0 |2 gerade ist, w¨ ahrend z ungerade ist: (1) E1,0,0 = e 100| z |100 = e drr2 dΩ|Ψ1,0,0 (r)|2 z = 0 . Das Wasserstoffatom besitzt also im Grundzustand kein permanentes Dipolmoment. F¨ ur die Energieverschiebung 2. Ordnung des Grundzustandes erwarten wir dagegen einen von Null verschiedenen Beitrag, da das ¨ außere Feld die Elektronh¨ ulle deformiert und so ein Dipolmoment induziert, das mit dem elektrischen Feld wechselwirkt: | nlm| z |100 |2 (2) . E1,0,0 = e2 2 (0) (0) E1 − En n>1,l,m Nun l¨ aßt sich zeigen, daß f¨ ur den Operator 2 r0 r µr0 e r + cos θ Ω= 2 2 Z Z¯ h in der Ortsdarstellung gilt: H | 100 = [Ω, H (0) ] | 100 . Damit folgt unter Anwendung von (3.76) E1,0,0 = 100| H Ω |100 − 0 3 3 r0 r 2 r µr0 e2 2 1 Z 2 −2Zr/r0 + cos2 θ drr dΩe =− 2 Z Z¯ h2 π r0 9 2 r03 =− . 4 Z4 Als n¨achstes betrachten wir den Stark-Effekt f¨ ur das entartete n = 2-Niveau des Wasserstoffatoms, das die folgenden vier Zust¨ ande gleicher Energie beinhaltet: (2)
340
3. Quantenmechanik
Ψ2,0,0 = 2 1 Ψ2,1,0 = √ 3 Ψ2,1,1
1 = √ 3
1 Ψ2,1,−1 = √ 3
Z 2r0
3/2
Z 2r0 Z 2r0 Z 2r0
1− 3/2 3/2 3/2
Zr 2r0
e−Zr/2r0 Y0,0
Zr −Zr/2r0 e Y1,0 r0 Zr −Zr/2r0 e Y1,1 r0 Zr −Zr/2r0 e Y1,−1 . r0
Zun¨ achst m¨ ussen wir aus ihnen Basisvektoren α1 Ψ2,0,0 + α2 Ψ2,1,0 + α3 Ψ2,1,1 + α4 Ψ2,1,−1 konstruieren, die H diagonalisieren. Von den insgesamt 16 Matrixelementen 2lm| H |2l m liefern die Diagonaleintr¨age keinen Beitrag, da alle vier Zust¨ ande eine definierte Parit¨at besitzen. Weiterhin kommutiert H mit Lz , so daß wegen (3.75) alle Matrixelemente mit m = m ebenfalls verschwinden. Es verbleibt das zu l¨osende Eigenwertproblem ⎛ ⎞⎛ ⎞ ⎛ ⎞ 0 ∆ 0 0 α1 α1 ⎜ ∆ 0 0 0 ⎟ ⎜ α2 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = E (1) ⎜ α2 ⎟ , ⎝ 0 0 0 0 ⎠ ⎝ α3 ⎠ ⎝ α3 ⎠ 0 0 0 0 α4 α4 mit 3e r0 . Z Die zugeh¨ origen L¨osungen sind ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 0 0 1 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 1 0 ±1 ⎟ , E (1) = 0 : α = ⎜ ⎟ , ⎜ 0 ⎟ . E (1) = ±∆ : α = √ ⎜ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ 1 0 0 2 0 1 0 ∆ = −e 200| z |210 =
Die ungest¨ orten n=2-Zust¨ande, welche stabil unter der St¨orung H sind, lauten also zusammen mit ihren Energieverschiebungen 1. Ordnung 1 3e r0 √ (Ψ2,0,0 + Ψ2,1,0 ) , E (1) = Z 2 1 3e r0 √ (Ψ2,0,0 − Ψ2,1,0 ) , E (1) = − Z 2 Ψ2,1,1 , E (1) = 0 Ψ2,1,−1 , E (1) = 0 .
3.7 St¨ orungsrechnung und reales Wasserstoffatom
341
3.7.3 Feinstrukturaufspaltung Wir wenden uns nun einer realistischeren Beschreibung wasserstoff¨ ahnlicher Atome zu. Ausgangspunkt ist wieder der ungest¨ orte Hamilton-Operator H (0) =
Ze2 P2 − , 2µ r
wobei der Relativimpuls P = P R im Schwerpunktsystem (P S = 0) in folgender Weise mit den Elektron- und Kernimpulsen zusammenh¨ angt: P2 P2 P 2e + k . = 2µ 2me 2mk Als erstes wollen wir relativistisch kinematische Effekte in niedrigster Ordnung ber¨ ucksichtigen, indem wir P 2e /2me + P 2k /2mk durch den Ausdruck P2 P2 P2 P 4e P 2e c2 + m2e c4 + k ≈ me c2 + e + k − 8m3e c2 2mk 2me 2mk 2 4 P P − 3 2 ≈ me c2 + 2µ 8µ c ersetzen. Der erste Term auf der rechten Seite ist eine irrelevante Konstante und der zweite der oben stehende nichtrelativistische Ausdruck. Der dritte Term f¨ uhrt zur relativistischen Korrektur HT = −
P 4e , 8µ3 c2
die als kleine St¨orung zu H (0) hinzukommt. Da der Operator H T rotationsinvariant ist, hat er diagonale Gestalt in der (nlm)-Basis des ungest¨ orten Problems. Mit anderen Worten: Die (nlm)-Basis ist stabil unter dieser St¨ orung, und wir brauchen die Tatsache nicht weiter zu ber¨ ucksichtigen, daß die verschiedenen ungest¨ orten Energieniveaus entartet sind. Die Energieverschiebung 1. Ordnung ergibt sich somit einfach aus = 1 ? (1) ET = − 3 2 nlm| P 4 |nlm . 8µ c Unter Verwendung von 2 2 2 P Ze2 P 4 = 4µ2 = 4µ2 H (0) + 2µ r und (3.50) folgt (1)
9 : 9 : 1 1 En2 + 2En Ze2 + Z 2 e4 r nlm r2 nlm Z 4 αe4 µc2 3 1 . = − 3 2 4n4 n l + 12
ET = −
1 2µc2
342
3. Quantenmechanik
Ein anderer Effekt kommt von der Ber¨ ucksichtigung des Spins des Elektrons zustande, dessen Ursprung in klassischer Betrachtungsweise wie folgt verstanden werden kann: Bewegt sich das Elektron im Ruhesystem des Kerns mit der (konstanten) Geschwindigkeit v, so hat der Kern im Ruhesystem des Elektrons die Geschwindigkeit −v und produziert nach dem Biot-Savartschen Gesetz, Satz 2.16, ein Magnetfeld B=
Ze v × x Ze =− x×p . c |x|3 me c|x|3
Dieses Magnetfeld tritt mit dem magnetischen Moment M (e) des Elektrons in Wechselwirkung, und liefert den Energiebeitrag HSB = −M (e) B . Aus quantenmechanischer Sicht folgt hieraus und mit (3.65) der St¨oroperator f¨ ur die Spin-Bahn-Wechselwirkung: H SB = −
Ze2 e SB = 2 2 3 LS , r = |x| . me c me c r
Wie sich zeigt, muß dieser Ausdruck um den Faktor 2 reduziert werden, der sich aus relativistischen Effekten zusammen mit der nicht geradlinigen Bewegung des Elektrons um den Kern (Thomas-Pr¨ azession) ergibt. Vernachl¨assigen wir den Unterschied zwischen me und µ, dann lautet also der korrekte St¨ oroperator H SB =
Ze2 LS . 2µ2 c2 r3
Die Berechnung der entsprechenden Energieverschiebungen erfordert wieder (0) eine Diagonalisierung von H SB in den zu den ungest¨orten Energien En geh¨ orenden 2(2l+1)-dimensionalen Unterr¨aumen, wobei der Faktor 2 von den zwei Spineinstellungen des Elektrons kommt. Der damit verbundene Aufwand l¨ aßt sich wesentlich reduzieren, wenn man ber¨ ucksichtigt, daß gilt: J = L + S =⇒ J 2 = L2 + S 2 + 2LS Ze2 2 =⇒ H SB = J − L2 − S 2 . 2 2 3 4µ c r Wir k¨ onnen n¨ amlich nun die in =Unterabschn. 3.4.5 erarbeiteten Gesamtdrehimpulseigenzust¨ ande l, 12 , J, M verwenden, f¨ ur die H SB bereits diagonale Gestalt besitzt. Nach (3.34) folgt dann den zwei Gesamtdrehimpulseinstellungen J = l ± 1/2, l > 0 entsprechend 9 : 1 1 1 1 (1) ESB = n, l, , l ± , M H SB n, l, , l ± , M 2 2 2 2 : 9 1 1 1 1 1 = n, l, , l ± , M 3 n, l, , l ± , M 2 2 r 2 2
3.7 St¨ orungsrechnung und reales Wasserstoffatom
343
1 1 3 l ± + 1 − l(l + 1) − l± 2 2 4 6 9 : 1 l+ 2 ±M 1 1 1 = n, l, M − ; + 3 n, l, M − ; + 2l + 1 2 r 2 9 :7 1 l+ 2 ∓M 1 1 1 n, l, M + ; − 3 n, l, M + ; − + 2l + 1 2 r 2 2 2 3 1 1 h Ze ¯ l ± + 1 − l(l + 1) − l± × 2 2 2 4 4µ c 2 9 : 6 7 2 2 Ze ¯ h 1 l = . 4µ2 c2 r3 nl −l − 1 ×
h2 Ze2 ¯ 4µ2 c2
Aufgrund der Orthogonalit¨ at der Kugelfl¨ achenfunktionen und der Elektronspinbasiszust¨ande liefern die Matrixelemente : 9 1 1 1 n, l, M ± ; ∓ 3 n, l, M ∓ ; ± 2 r 2 keinen Beitrag. Mit (3.50) ergibt sich schließlich 6 7 l −l − 1 Z 4 αe4 µc2 (1) ESB = . 3 4 n l l + 12 (l + 1) (1)
(3.77) (1)
alt man als Kombiniert man die Energieverschiebungen ET und ESB , so erh¨ Gesamtverschiebung die Feinstrukturverschiebung oder -aufspaltung: 1 Z 4 αe4 µc2 3 1 (1) (1) (1) , J =l± . EFS = ET + ESB = − (3.78) 2n3 4n J + 12 2 Man beachte, ur den Fall l > 0 hergeleitet wurde. Bei l = 0 ? =daß diese Formel f¨ divergiert r13 nl und LS verschwindet. Setzen wir aber in (3.78) l = 0, dann erhalten wir ein endliches Resultat, und es zeigt sich, daß es im Rahmen der relativistischen Quantenmechanik tats¨ achlich die korrekte Energieverschiebung f¨ ur l=0-Zust¨ ande liefert. (1) (1) Die durch ESB und EFS hervorgerufenen Aufspaltungen sind in Abb. 3.12 dargestellt. Ein interessantes Ergebnis aus (3.78) ist, daß die Korrekturen so zusammenwirken, daß die Zust¨ ande 2s1/2 und 2p1/2 genau zusammenfallen. Im Jahre 1947 konnten Lamb und Retherford in einem Hochpr¨ azisionsexperiment jedoch eine kleine Abweichung zwischen den 2s1/2 - und 2p1/2 -Niveaus messen. Dieser, unter dem Namen Lamb-Shift bekannte Effekt l¨ aßt sich nur im Rahmen der Quantenelektrodynamik erkl¨ aren, nach der die Differenz als Folge der Wechselwirkung des Elektrons mit seinem eigenen Strahlungsfeld zustande kommt. 3.7.4 Anomaler Zeeman-Effekt Wir wollen nun untersuchen, wie sich die Spin-Bahn-Wechselwirkung auf wasserstoff¨ ahnliche Atome in einem konstanten Magnetfeld B = Bez in zRichtung auswirkt. Hierzu betrachten wir
344
3. Quantenmechanik 2p3/2
2s1/2 , 2p1/2 , 2p3/2 n = 2, l = 0, s =
2s1/2
1 2
2p3/2 2p1/2 2s1/2 , 2p1/2
Spin-BahnSpin-Bahn- und Aufspaltung rel. Korrektur Abb. 3.12. Linienaufspaltungen des n=2,l=0-Wasserstoffniveaus unter Ber¨ ucksichtigung der Spin-Bahn-Wechselwirkung sowie kinematisch relativistischer Korrekturen
H (0) =
P2 Ze2 Ze2 LS − + 2µ r 2m2e c2 r3
als ungest¨ orten Hamilton-Operator und H AZ = −
eB e eB (L + 2S)B = − (Lz + 2S z ) = − (J z + S z ) 2me c 2me c 2me c
als kleine St¨ orung. Letztere ber¨ ucksichtigt die Wechselwirkung des ¨außeren Magnetfeldes sowohl mit dem durch den Bahndrehimpuls des Elektrons hervorgerufenen magnetischen Dipolmoment als auch mit dem magnetischen Dipolmoment des Elektronspins. Die Wahl von H (0) zwingt uns wieder, die Gesamtdrehimpulseigenzust¨ande aus (3.34) zur Berechnung der entsprechenden Energieverschiebungen zu verwenden. Wir erhalten somit : 9 1 1 1 1 (1) EAZ = n, l, , l ± , M H AZ n, l, , l ± , M 2 2 2 2 6 9 :7 eB 1 1 1 1 =− ¯hM + n, l, , l ± , M S z n, l, , l ± , M 2me c 2 2 2 2 6 9 : 1 l+ 2 ±M eB 1 1 =− ¯hM + n, l, M − ; + S z n, l, M − ; + 2me c 2l + 1 2 2 9 :7 1 l+ 2 ∓M 1 1 + n, l, M + ; − S z n, l, M + ; − 2l + 1 2 2 1 1 eB¯hM (1) 1± , J =l± . =⇒ EAZ = − 2me c 2l + 1 2 Die Zust¨ ande mit festem J = l ± 1/2 werden also in 2j ¨aquidistante Linien eB¯ h 2l+2 eB¯ h 2l aufgespalten, die jeweils einen Abstand von 2m bzw. 2m haben e c 2l+1 e c 2l+1 (siehe Abb. 3.13). Da man f¨ ur diese Aufspaltungen zur Zeit ihrer Entdeckung noch keine Erkl¨arung (durch den Elektronspin) hatte, nannte man sie anomaler Zeeman-Effekt.
3.7 St¨ orungsrechnung und reales Wasserstoffatom M l−
1 2 1 2
−l −
1 2
l−
1 2 3 2
l+ J =l+
l, s =
1 2
. . .
1 2
J =l−
1 2
. . .
l−
345
−l + 12 Abb. 3.13. Linienaufspaltungen der zu den Gesamtdrehimpulsquantenzahlen J = l ± 1/2 geh¨ orenden Wasserstoffniveaus in Anwesenheit eines ¨ außeren Magnetfeldes (anomaler Zeeman-Effekt)
3.7.5 Hyperfeinstrukturaufspaltung Bei Zust¨ anden mit der Bahndrehimpulsquantenzahl l = 0 erwartet man nach (3.78) keine Feinstrukturaufspaltung in wasserstoff¨ ahnlichen Atomen. Trotzdem zeigen Pr¨ azisionsexperimente auch hierbei eine Aufspaltung in zwei Linien. Die Erkl¨ arung hierf¨ ur liefert das bisher vernachl¨ assigte magnetische Dipolmoment (und der damit verbundene Spin) des Kerns, M (k) =
Zegk I , I = Kernspin , 2mk c
der mit dem magnetischen Dipolmoment e (e) S M (e) = me c des Elektrons in Wechselwirkung tritt. Beschr¨ ankt man sich auf l=0-Zust¨ ande von Wasserstoffatomen (Z = 1 , gk = gp , I = S (p) ), dann kann man zeigen, daß der durch die magnetischen Momente von Elektron und Proton hervorgerufene St¨ oroperator gegeben ist durch15 H HF =
4gp m2e c2 αe4 (e) (p) S S . 3mp n3 ¯ h2
Da die Spins von den u ollig entkoppelt sind, ben¨ oti¨brigen Freiheitsgraden v¨ gen wir zur Bestimmung der entsprechenden Energieverschiebungen lediglich eine Spinbasis, die H HF diagonalisiert. Hierzu verfahren wir analog zur LSKopplung und schreiben 15
F¨ ur l>0-Zust¨ ande kann die Spin-Spin-Wechselwirkung aufgrund der großen Kernmasse gegen¨ uber der Spin-Bahn-Wechselwirkung vernachl¨ assigt werden.
346
3. Quantenmechanik 2
2
S = S (e) + S (p) =⇒ S 2 = S (e) + S (p) + 2S (e) S (p) ! 4gp m2e c2 αe4 2 (e) 2 (p) 2 S . =⇒ H HF = − S − S 6mp n3 ¯h2 Nun bietet sich die Gesamtspinbasis aus Unterabschn. 3.4.5 an, f¨ ur die H HF diagonal ist. F¨ ur die drei Triplettzust¨ ande mit Gesamtspinquantenzahl S = 1 ergibt sich (1)
EHF =
gp m2e c2 αe4 3mp n3
und f¨ ur den Singulettzustand mit S = 0 (1)
EHF = −
gp m2e c2 αe4 . mp n 3
Die Energiedifferenz zwischen den Triplett- und Singulettzust¨anden f¨ ur n = 1, l = 0 betr¨ agt (1)
∆EHF =
4gp m2e c2 αe4 = 5.857 · 10−12 MeV . 3mp
¨ Die mit diesem Ubergang verbundene Emissionsfrequenz ist (1)
∆EHF ≈ 1420 MHz 2π¯ h und liegt somit im Mikrowellenbereich (λ ≈ 21 cm). Sie spielt eine wichtige Rolle in der Radioastronomie, da man hier¨ uber Aussagen u ¨ber die Dichteverteilung von atomarem Wasserstoffgas in Galaxien gewinnen kann. ν=
Zusammenfassung • Viele station¨are Probleme, die analytisch nicht exakt gel¨ost werden k¨ onnen, lassen sich durch Anwendung der zeitunabh¨ angigen St¨ orungstheorie n¨aherungsweise l¨osen. Die Korrekturen zu den ungest¨ orten Zust¨anden und Energien ergeben sich im wesentlichen aus Matrixelementen des St¨oroperators zwischen ungest¨orten Zust¨anden. Ist ein ungest¨ orter Energieeigenwert entartet, so hat man den St¨oroperator in dem durch die Eigenzust¨ande dieses Energiewertes aufgespannten Teilraum zu diagonalisieren. • Realistische Anwendungsbeispiele der zeitunabh¨angigen St¨orungstheorie sind z.B. der Stark-Effekt, die Feinstruktur- und Hyperfeinstrukturaufspaltung.
Anwendungen
347
• Die Feinstrukturaufspaltung wasserstoff¨ ahnlicher Atome resultiert aus der Ber¨ ucksichtigung zweier Effekte: (i) Relativistisch kinematische Korrektur (P 4 -Term) und (ii) Wechselwirkung zwischen dem durch die Elektronbewegung hervorgerufenem Magnetfeld und dem intrinsischen Dipolmoment des Elektrons. Letztere l¨ aßt sich sehr einfach durch Verwendung von Gesamtdrehimpulszust¨ anden beschreiben. • Die Ber¨ ucksichtigung der Wechselwirkung zwischen den durch den Kern- und Elektronspins hervorgerufenen magnetischen Momenten f¨ uhrt zur Hyperfeinstrukturaufspaltung. Auch sie l¨ aßt sich (f¨ ur l=0Wasserstoffatomzust¨ ande) durch Gebrauch von Gesamtspinzust¨ anden einfach berechnen.
Anwendungen 48. Naives Heliumatom. Man betrachte ein Heliumatom, bestehend aus zwei Protonen (Z = 2) und zwei H¨ ullenelektronen, wobei in sehr guter N¨ aherung angenommen werden kann, daß der Atomkern unendlich schwer ist. Im Ruhesystem des Kerns haben wir somit ein Zwei-Teilchenproblem vorliegen, dessen Hamilton-Operator unter Vernachl¨ assigung relativistischer und durch Spins hervorgerufener Effekte durch H = H1 + H2 + V , Hi =
P 2i 2e2 e2 , V (x1 , x2 ) = − 2me |xi | |x1 − x2 |
gegeben ist. Hierbei beschreibt V die abstoßende Wechselwirkung zwischen den beiden Elektronen. Man berechne die Grundzustandsenergie dieses Systems in 1. Ordnung St¨ orungstheorie, wobei V als St¨ orterm zu betrachten ist. L¨ osung. Die station¨ are Schr¨ odinger-Gleichung f¨ ur das ungest¨ orte Problem (0. Ordnung) lautet (H 1 + H 2 )Ψ (x1 , x2 ) = E (0) Ψ (x1 , x2 ) . Zu ihrer L¨ osung machen wir den Produktansatz Ψ (x1 , x2 ) = Ψ1 (x1 )Ψ2 (x2 ) . Damit zerf¨ allt die Schr¨ odinger-Gleichung in zwei Gleichungen f¨ ur wasserstoff¨ahnliche Atome, (0)
(0)
(0)
H i Ψi (xi ) = Ei Ψi (xi ) , E (0) = E1 + E2
,
deren L¨ osungen durch (0)
Ψi (x) = Ψni ,li ,mi (x) = gni ,li (r)Yli ,mi (θ, ϕ) , Ei
=−
2me c2 αe2 n2i
348
3. Quantenmechanik
gegeben sind. F¨ ur die nichtentartete Grundzustandsenergie des Heliumatoms (n1 = n2 = 1) folgt somit in 0. Ordnung (0)
E1,1 = −4me c2 αe2 = −108.8 eV . Zum Vergleich: Der experimentelle Wert betr¨agt: -78.98 eV. F¨ ur die Korrektur in 1. Ordnung hat man das Integral e2 (1) 3 E1,1 = d x1 d3 x2 |Ψ1,0,0 (x1 )|2 |Ψ1,0,0 (x2 )|2 |x1 − x2 | 6 e2 2 dr1 r12 e−4r1 /r0 dr2 r22 e−4r2 /r0 = 2 π r0 1 × dΩ1 dΩ2 |x1 − x2 | zu berechnen. Man sieht leicht, daß der Ausdruck dΩ2 |x1 − x2 | ur einen Vektor, z.B. nur von |x1 | abh¨angt. Wir brauchen ihn deshalb nur f¨ x1 = r1 ez , zu berechnen. F¨ uhren wir f¨ ur x2 Kugelkoordinaten ein, ⎛ ⎞ cos ϕ cos θ x2 = r2 ⎝ sin ϕ cos θ ⎠ , sin θ so folgt
1
2π
dΩ2 = |x1 − x2 |
dϕ
d cos θ(r12 + r22 − 2r1 r2 cos θ)−1/2
−1
0
2π r12 + r22 − 2r1 r2 − r12 + r22 + 2r1 r2 r1 r2 2π = (r1 + r2 − |r1 − r2 |) r1 r2
=−
(1)
=⇒ E1,1 = 8e2
2 r0
6 ∞
dr1 r1 e−4r/r0
0
⎡ × ⎣2
r1
dr2 r22 e−4r2 /r0 + 2r1
0
∞
⎤ dr2 r2 e−4r2 /r0 ⎦
r1
5 = me c2 αe2 = 34 eV . 4 Insgesamt ergibt sich f¨ ur die Grundzustandsenergie des Heliumatom bis zur 1. Ordnung (0)
(1)
E1,1 ≈ E1,1 + E1,1 = −74.8 eV .
¨ 3.8 Atomare Uberg¨ ange
349
¨ 3.8 Atomare Uberg ange ¨ ¨ Dieser Abschnitt besch¨ aftigt sich mit Uberg¨ angen zwischen atomaren, wasserstoff¨ ahnlichen Energieniveaus, die von Strahlungsemission bzw. -absorption begleitet werden. Zu ihrer Beschreibung interessiert vor allem die Wechselwirkung zwischen Atomen und elektromagnetischen Feldern, wobei letzte¨ re entweder von außen angelegt werden (induzierte Uberg¨ ange) oder aber ¨ spontan entstehen (spontane Uberg¨ ange). W¨ ahrend in Abschn. 3.7 atomare Effekte besprochen wurden, die durch konstante elektromagnetische Felder hervorgerufen werden (Stark-Effekt, Zeeman-Effekt), haben wir es hier nun mit schwingenden und somit zeitabh¨ angigen Feldern zu tun, deren Einfl¨ usse durch die zeitabh¨ angige St¨ orungstheorie ad¨ aquat beschrieben werden k¨ onnen. Der Abschnitt beginnt mit einer allgemeinen Diskussion zeitabh¨ angiger St¨ orungen. Anschließend leiten wir Fermis goldene Regel her, welche ¨ die Ubergangswahrscheinlichkeit zwischen zwei ungest¨ orten atomaren Niveaus in Anwesenheit einer periodischen St¨ orung beschreibt. Wir erweitern unsere Ergebnisse auf den Fall spontaner Emissionen, deren Ursprung allerdings nur im Rahmen der Quantenelektrodynamik erkl¨ art werden kann und die durch Quantenfluktuationen des elektromagnetischen Feldes um den makroskopischen Mittelwert Null zustande kommen. Wie sich herausstellen ¨ wird, verschwinden die Ubergangswahrscheinlichkeiten f¨ ur bestimmte atoma¨ re Uberg¨ ange in der Dipoln¨ aherung. Dies f¨ uhrt uns zu den Dipolauswahlregeln. Als konkrete Beispiele berechnen wir zum Schluß das Intensit¨ atsverh¨ alt¨ nis zwischen den beiden Uberg¨ angen 2p3/2 → 1s1/2 und 2p1/2 → 1s1/2 sowie ¨ die Ubergangsrate von 2p1/2 → 1s1/2 . 3.8.1 Zeitabh¨ angige St¨ orungstheorie Ausgangspunkt unserer Diskussion ist die zeitabh¨ angige Schr¨ odinger-Gleichung i¯ h
d | ψ(t) = H(t) | ψ(t) , H(t) = H (0) + λH (t) . dt
angigen, ungest¨ orten Anteil und H (t) eine H (0) bezeichnet den zeitunabh¨ zeitabh¨ angige St¨ orung. Wie in Unterabschn. 3.7.1 haben wir auch hier einen fiktiven St¨ orparameter λ eingef¨ ugt, der weiter unten wieder entfernt wird. F¨ ur das ungest¨ orte Problem sei ein vollst¨ andiger Satz von Eigenfunktionen bereits gefunden: ⎫ > = d ⎪ ⎪ i¯ h n(0) (t) = H (0) n(0) (t) ⎬ dt (3.79) (0) ⎪ (0) = (0) = E ⎪ n −iω t ⎭ n n (t) = e n . , ωn = h ¯ Die Frage, der wir im folgenden nachgehen wollen, lautet: Zum Zeitpunkt = t = 0 befinde sich das System im ungest¨ orten Eigenzustand i(0) . Wie
350
3. Quantenmechanik
groß ist orten Zu die= Wahrscheinlichkeit, das System zur Zeit t im ungest¨ stand f (0) vorzufinden? Hierzu entwickeln wir | ψ(t) nach den ungest¨orten Zust¨ anden, > | ψ(t) = cni (t)e−iωn t n(0) , n
wobei die Entwicklungskoeffizienten cni der Anfangsbedingung cni (0) = δni unterliegen. Setzt man diese Entwicklung in (3.79) ein, so ergibt sich > > ! i¯ h En(0) + λH (t) cni e−iωn t n(0) [c˙ni − iωn cni ] e−iωn t n(0) = n
=⇒ i¯ h
n
> > c˙ni e−iωn t n(0) = λH cni e−iωn t n(0) .
n
n
? Durch Multiplikation der letzten Beziehung mit f (0) eiωf t folgt schließlich das Differentialgleichungssystem > @ i¯ hc˙f i (t) = f (0) λH (t) n(0) eiωf n t cni (t) , ωf n = ωf − ωn . (3.80) n
Dieses System l¨ aßt sich nun iterativ in den verschiedenen λ-Ordnungen l¨osen, indem auf der rechten Seite sukzessive die L¨osung der vorangegangenen Ordnung eingesetzt wird. In wir die rechte Seite von (3.80), ignorieren = ? 0. Ordnung da das Matrixelement f (0) λH n(0) selbst von 1. Ordnung ist, und erhalten (0)
c˙f i (t) = 0 =⇒ cf i (t) = cf i (0) = δf i , was im Einklang mit der Erwartung steht. Liegt n¨amlichkeine = ¨außere St¨orung vor, so verbleibt das System f¨ ur alle Zeiten im Zustand i(0) . In 1. Ordnung (0) ergibt sich durch Einsetzen von cni auf der rechten Seite von (3.80) (und mit λ = 1) i @ (0) (0) > iωf i t f H (t) i e c˙f i (t) = − h ¯ =⇒
(1) cf i (t)
i = δf i − ¯h
t
@ > dt f (0) H (t ) i(0) eiωf i t .
0
H¨ ohere Ordnungen folgen in entsprechender Weise. Insgesamt ergibt sich
¨ 3.8 Atomare Uberg¨ ange
351
cf i (t) = δf i i − h ¯
t
@ > dt f (0) H (t ) i(0) eiωf i t
0 2 t t > @ −i f (0) H (t ) n(0) + dt dt h ¯ n 0 0 @ > × n(0) H (t ) i(0) eiωf n t eiωni t
+... .
(3.81)
Man beachte, daß diese st¨ orungstheoretische Entwicklung nur Sinn macht, (1) falls f¨ ur f = i gilt: cf i (t) 1. Andernfalls werden die Rechnungen aufgrund (0)
der Zuweisung cf i (t) = δf i inkonsistent. Aus den Entwicklungskoeffizienten ¨ ¨ bzw. Ubergangsamplituden cf i (t) erh¨ alt man nun die Ubergangswahrschein (0) = t (0) = ¨ lichkeiten f¨ ur den Ubergang i −→ f zu 2
Wf i (t) = |cf i (t)| . ¨ Interpretation der Entwicklungsterme. Die zu den Ubergangsamplituden (3.81) beitragenden Terme erlauben eine einfache Interpretation der Wechselwirkung des betrachteten Systems mit der St¨ orung. Um dies zu sehen, gehen wir vom Schr¨ odinger-Bild zum Wechselwirkungsbild (siehe Unterabschn. 3.2.5) u ¨ber. Zwischen beiden Bildern gelten die Beziehungen | ψS (t) = U | ψI,S (t0 ) = U (0) | ψI (t) | ψI (t) = U | ψI,S (t0 ) ! (0) i¯ hU˙ = H S + λH S (t) U , U = U (0) U (0) (0) i¯ hU˙ = H S U (0) i¯ hU˙ = λH I (t)U .
Das Wechselwirkungsbild bietet den Vorteil, daß die gesamte zeitliche Entwicklung des Systems allein durch den St¨ orterm H I determiniert ist. Integration der letzten Beziehung f¨ uhrt zu i U (t, t0 ) = I − h ¯
t
dt λH I (t )U (t , t0 ) ,
t0
wobei I den Einsoperator bezeichnet. Die iterative L¨ osung dieser Gleichung in den verschiedenen λ-Ordnungen liefert (mit λ = 1)
352
3. Quantenmechanik
U (t, t0 ) = I
(0. Ordnung)
i − ¯h +
t t0
−i ¯h
H I (t )dt 2 t
(1. Ordnung)
t
dt t0
dt H I (t )H I (t )
(2. Ordnung)
t0
+... . Multipliziert man diese Gleichung von links mit U (0) (t, t0 ) und dr¨ uckt H I durch H S aus, so erh¨alt man die zeitliche Entwicklung des Systems im Schr¨ odinger-Bild: | ψS (t) = U (t, t0 ) | ψS (t0 ) , mit U (t, t0 ) = U (0) (t, t0 ) t i dt U (0) (t, t )H S (t )U (0) (t , t0 ) − ¯h t0
+
−i ¯h
2 t t0
dt
t
dt U (0) (t, t )H S (t )U (0) (t , t )
t0
×H S (t )U (0) (t , t0 ) +... .
(3.82)
Der erste Term repr¨asentiert die 0. Ordnung und liefert die st¨orungsfreie Propagation des Systems. Liest man alle nachfolgenden Terme von rechts nach links, so sagt z.B. der Term 1. Ordnung folgendes aus: Das System propagiert ungest¨ ort von t0 nach t . Dort wechselwirkt es einmal mit der St¨orung und propagiert daraufhin bis nach t ungest¨ort weiter. Das Integral u ¨ber t summiert dabei u aren Zeiten, bei denen die ein¨ber alle m¨oglichen intermedi¨ malige Wechselwirkung mit der St¨orung stattfinden kann. Dementsprechend beinhaltet der Term p-ter Ordnung p Kontaktwechselwirkungen des Systems mit der St¨ orung zu den Zeiten t ≥ t ≥ . . . ≥ t(p) , u ¨ber die integriert wird. Zwischen diesen Zeitpunkten propagiert das System jeweils st¨orungsfrei. In Abb. 3.14 ist diese Sichtweise graphisch veranschaulicht. ¨ Man beachte: Die Ubergangsamplitude cf i (t) gibt gerade die Projektion > > (0) (0) des Zustandes U (t, t0 ) iS auf den ungest¨orten Zustand e−iωf t fS zur Zeit t an, also > @ cf i (t) = f (0) eiωf t U (t, t0 ) i(0) , und man u ur t0 = 0 wieder ¨berzeugt sich leicht davon, daß dieser Ausdruck f¨ auf (3.81) f¨ uhrt.
¨ 3.8 Atomare Uberg¨ ange t
t
t
t U (0)
U (0) U
U (0)
=
t H
+
t H
U (0)
+
U (0)
Zeit
353
+ ...
t H U (0)
t0 t0 t0 t0 Abb. 3.14. Graphische Darstellung der zur St¨ orungsreihe (3.82) beitragenden Terme
Satz 3.23: Zeitabh¨ angige St¨ orungstheorie Gegeben sei die zeitabh¨ angige Schr¨ odinger-Gleichung ! d i¯ h | ψ(t) = H (0) + H (t) | ψ(t) , dt mit H als kleiner zeitabh¨ angiger St¨ orung. F¨ ur das ungest¨ orte Problem (0) > > > > d En i¯ h n(0) (t) = H (0) n(0) (t) , n(0) (t) = e−iωn t n(0) , ωn = dt h ¯ sei ein vollst¨ andiger Satz von Eigenkets bekannt. Dann ist die Wahrschein (0) = t (0) = i ¨ lichkeitsamplitude cf i (t) f¨ gegeben durch ur den Ubergang −→ f cf i (t) = δf i
(0. Ordnung)
i − h ¯
t
@ > dt f (0) H (t ) i(0) eiωf i t
(1. Ordnung)
0
+
−i h ¯
2 t 0
dt
t 0
dt
@
> f (0) H (t ) n(0)
n
= × n(0) H (t ) i(0) eiωf n t eiωni t ?
(2. Ordnung)
+... . Die Entwicklungsterme p-ter Ordnung lassen sich interpretieren als p-fache Kontaktwechselwirkungen des ungest¨ orten Systems mit der St¨ orung zu den Zeiten t ≥ t ≥ . . . ≥ t(p) , u ¨ber die integriert wird.
354
3. Quantenmechanik
Periodische St¨ orungen und Fermis goldene Regel. Neben adiabatischen und instantanen St¨orungen sind insbesondere periodische St¨orungen der allgemeinen Form16 H (t) = H e±iωt von Interesse, die z.B. bei der Emission und Absorption innerhalb von Atomen auftreten. F¨ ur diese ergibt sich unter Anwendung von Satz 3.23 die ¨ Ubergangsamplitude in 1. Ordnung (f = i), t @ > i cf i (t) = − dt f (0) H i(0) ei(ωf i ±ω)t h ¯ 0
i @ (0) (0) > ei(ωf i ±ω)t − 1 f H i , =− h ¯ i(ωf i ± ω) ¨ bzw. die Ubergangswahrscheinlichkeit 1 @ (0) (0) >2 4 sin2 (ωf i ± ω) 2t Wf i (t) = 2 f H i . (ωf i ± ω)2 h ¯ 2 In Abb. 3.15 ist die Funktion sin2 ∆t 2 /∆ gegen ∆ graphisch dargestellt. Man erkennt ein stark ged¨ampftes oszillatorisches Verhalten nach beiden Seiten sowie ein ausgepr¨agtes Maximum bei ∆ = 0. F¨ ur große t l¨aßt sich das Verhalten dieser Funktion in folgender Weise mit der δ-Funktion verkn¨ upfen: sin2 ( ∆t 2 ) ∆2
− 6π t
− 4π t
− 2π t
Abb. 3.15. sin2
16
∆t 2
0
2π t
4π t
6π t
∆
/∆2 als Funktion von ∆
Man beachte, daß H in dieser Form nicht hermitesch ist. Dies ist jedoch f¨ ur die nachfolgenden Betrachtungen ohne Belang und dient lediglich der bequemeren mathematischen Handhabung.
¨ 3.8 Atomare Uberg¨ ange
∞ −∞
4 d∆f (∆) 2 sin2 ∆
=⇒ lim
t→∞
4 sin2 ∆2
∆t 2
∆t 2
t→∞
∞
≈ 2f (0)t
−∞
dy
355
sin2 y = 2πtf (0) y2
= 2πtδ(∆) .
¨ Somit folgt f¨ ur die Ubergangsamplitude im Limes großer Zeiten 2πt @ (0) (0) >2 lim Wf i (t) = 2 f H i δ(ωf i ± ω) . t→∞ h ¯ Satz 3.24: Fermis goldene Regel Liegt eine periodische St¨ orung der Form H (t) = H e±iωt ¨ ¨ vor, so ist die Ubergangsrate Pf i , f = i (Ubergangswahrscheinlichkeit pro Zeit) f¨ ur große Zeiten in 1. Ordnung gegeben durch >2 Wf i (t) 2π @ Pf i = lim = 2 f (0) H i(0) δ(ωf i ± ω) t→∞ t h ¯ 2π @ (0) (0) >2 (0) (0) = hω . f H i δ Ef − Ei ± ¯ h ¯ Die in diesem Satz stehende δ-Funktion dr¨ uckt offensichtlich einen Energieerhaltungssatz aus. So ist z.B. induzierte Absorption und Emission innerhalb eines Atoms nur dann m¨ oglich, wenn das eingestrahlte Licht genau die Frequenz besitzt, die der Energiedifferenz des End- und Anfangszustandes entspricht. Bei der induzierten Absorption ist diese Differenz positiv (⇒ negatives Vorzeichen), bei der induzierten Emission negativ (⇒ positives Vorzeichen). Zur Beschreibung realistischer experimenteller Situationen hat man (aus mehreren Gr¨ unden) u ¨ber die δ-Funktion zu integrieren, so daß Fermis goldene Regel in jedem Fall zu einem wohldefinierten Ausdruck wird. 3.8.2 Spontane Emission, Phasenraum der Photonen Die Quantenmechanik ist nicht in der Lage, spontane Emission in Atomen zu erkl¨ aren, da ein Atom bei Abwesenheit einer St¨ orung f¨ ur alle Zeiten im = arung der spontanen station¨ aren Anfangszustand i(0) verbleibt. Eine Erkl¨ Emission liefert die Quantenelektrodynamik. Hierbei wird auch das ¨ außere elektromagnetische Feld quantisiert, so daß elektromagnetische Quantenfluktuationen um den makroskopischen Mittelwert Null m¨ oglich sind, die letztlich die spontane Emission verursachen. In der Quantenelektrodynamik sind die Photonen die Feldquanten des elektromagnetischen Feldes und besitzen als solche auch Teilchencharakter. Sie haben die Energie E = h ¯ ω, den Impuls
356
3. Quantenmechanik
p=h ¯ k und wegen der Dispersionsrelation ω = c|k| eine verschwindende Ruhemasse m0 im Sinne der speziellen Relativit¨atstheorie (siehe Satz 1.38). Ferner besitzen Photonen den Spin s = 1, der mit der Polarisation (λ) des Lichts zusammenh¨ angt. Wegen k = 0 gibt es nur zwei unabh¨angige Polarisationsvektoren und somit nur zwei (statt drei) Spineinstellungen (Helizit¨at λ = ±1). Liegt kein ¨ außeres Feld vor, so haben wir einen Null-Photonen- oder Vakuumzustand. Spontane Emission bedeutet dann offenbar, daß der St¨oroperator einen Null-Photonenzustand in einen Ein-Photonenzustand u uhrt; er ¨berf¨ muß also einen Erzeugungsoperator f¨ ur ein Photon enthalten. Im Experiment werden die von Atomen emittierten Photonen mit einem Detektor mit endlichem Aufl¨osungsverm¨ogen nachgewiesen, d.h. es werden alle Photonen mit Impulsen in einem bestimmten Bereich [¯ hk : h ¯ (k + ∆k)] ¨ gemessen. Die Ubergangsrate ist also u ¨ber alle Photonenzust¨ande in diesem Impulsintervall zu summieren: Rf i = Pf i . (3.83) ∆k
Zur Bestimmung der Anzahl der Photonenzust¨ande in diesem Intervall stellen wir uns vor, daß alle Photonen in einem Kasten mit dem Volumen V = L3 eingeschlossen sind.17 Jedem Photon mit der Energie E = h ¯ ω, dem Impuls p=h ¯ k und der Helizit¨at λ ordnen wir ganz allgemein eine ebene Welle zu, A(x, t) = A0 (λ) e−i(kx−ωt) + ei(kx−ωt) , wobei f¨ ur Photonemission nur der erste und f¨ ur Photonabsorption nur der zweite Term eine Rolle spielt. Die Normierungskonstante A0 l¨aßt sich u ¨ber die Forderung festlegen, daß die mittlere Energie E der Welle A, E =
3
d x em , em V
1 = T
T dt
2π |E|2 + |B|2 , T = 8π ω
0
(siehe Satz 2.4 und die Definition auf Seite 128), gerade gleich derjenigen eines einzelnen Photons, also ¯hω sein soll. Hieraus folgt 1/2 2πc2 ¯h A0 = . ωV Weiterhin fordern wir periodische Randbedingungen an den R¨andern des Kastens, also A(x + L, y, z, t) = A(x, y, z, t)
usw.
Dies f¨ uhrt automatisch zur Quantisierung der Wellenzahlen: 17
Diese Sichtweise umgeht die mit den Wellenfunktionen von freien Teilchen (hier die Photonen) verbundenen Normierungsprobleme. Sp¨ ater betrachten wir nat¨ urlich den Limes V → ∞.
¨ 3.8 Atomare Uberg¨ ange
357
2π (2π)3 ni , ni = 0, ±1 . . . , ∆k = ∆kx ∆ky ∆kz = ∆nx ∆ny ∆nz . L V Es folgt somit f¨ ur die Summe in (3.83) im Limes V → ∞ V Rf i = d3 kPf i . Pf i = d3 nPf i = (2π)3 ki =
∆k
Beschr¨ anken wir uns in Satz 3.21 auf den in A linearen Term (und verassigen die Wechselwirkung des Photon-B-Feldes mit dem intrinsischen nachl¨ Dipolmoment des H¨ ullenelektrons: −M (e) B = − mee c SB), so lautet der St¨ oroperator f¨ ur die spontane Emission eines Photons eA0 −ikx e H (t) = H eiωt , H = − (λ)P . me c ¨ Damit ergibt sich unter Ber¨ ucksichtigung Fermis goldener Regel f¨ ur die Ubergangsrate @ >2 V 2 d|k||k| dΩk f (0) H i(0) δ(ωf i + ω) Rf i = 2 (2π¯h) @ > 1 V (0) (0) 2 2 dωω dΩ f H = δ(ωf i + ω) i k (2π¯h)2 c3 @ > ω2 V (0) (0) 2 dΩ f H , = i k (2π¯ h)2 c3 ω=−ωf i
wobei dΩk das Raumwinkelelement im Impulsraum bedeutet. Es folgt der ¨ Satz 3.25: Ubergangsrate f¨ ur spontane Photonenemission > @ αe ω (0) 2 (0) −ikx dΩ e . |M | , M = f (λ)P Rf i = i k f i f i 2πm2e c2 ω=−ωf i Wenn das Experiment nicht zwischen den Polarisationszust¨ anden des Photons unterscheidet, muß u ¨ber diese ebenfalls summiert werden. 3.8.3 Auswahlregeln in der Dipoln¨ aherung ¨ Im folgenden besch¨ aftigen wir uns mit Uberg¨ angen in wasserstoff¨ ahnlichen ¨ Atomen. Uns interessiert hier vor allem die Frage, f¨ ur welche Uberg¨ ange das Matrixelement > @ Mf i = f (0) e−ikx P i(0) ¨ einen nichtverschwindenden Beitrag liefert, d.h. welche Uberg¨ ange erlaubt sind. F¨ ur den Exponenten der ebenen Photonwelle gilt im gesamten Ausdehnungsbereich der elektronischen Wellenfunktionen gr¨ oßenordnungsm¨ aßig18 18
Im weiteren Verlauf wird zwischen der reduzierten Masse µ und der Elektronmasse me nicht weiter unterschieden.
358
3. Quantenmechanik
ω E me cZ 2 αe2 = ≈ (siehe (3.48)) c ¯c h 2¯h h ¯ |x| < (siehe (3.49)) ~ me cZαe αe Z =⇒ kx ≤ |k||x| < ~ 2 . Somit l¨ aßt sich f¨ ur αe Z 1 das Exponential entwickeln: |k| =
e−ikx = 1 − ikx + . . . . Wir wollen uns im weiteren Verlauf auf die Dipoln¨aherung beschr¨anken, bei der nur der erste Term dieser Entwicklung mitgenommen wird, d.h. > @ Mf i ≈ f (0) P i(0) . Als ungest¨ orten Hamilton-Operator w¨ahlen wir P2 Ze2 Ze2 + a(r)LS + V (r) , a(r) = , V (r) = − . 2me 2m2e c2 r3 r = Die ungest¨ orten Eigenzust¨ande sind somit durch die n, l, 12 , J, M -Basis gegeben. Zur Berechnung der Mf i ist es g¨ unstig, folgende Darstellung des Impulses zu benutzen: ! ime ime P 2 H (0) − a(r)LS, x . + V (r), x = P = h 2me ¯ ¯h Damit folgt 9 : ! ime 1 1 (0) n , l , , J , M H − a(r)LS, x n, l, , J, M Mf i = h ¯ 2 2 6 : 9 ime 1 1 = (En − En ) n , l , , J , M x n, l, , J, M h ¯ 2 2 1 − [j (j + 1) − l (l + 1) − j(j + 1) + l(l + 1)] 2 :7 9 1 1 . (3.84) × n , l , , J , M a(r)x n, l, , J, M 2 2 Streng genommen besteht En aus der Energie des naiven Wasserstoffatoms (3.48) plus der Korrekturenergie der Spin-Bahn-Kopplung (3.77). F¨ ur unsere Zwecke kann letzterer jedoch im folgenden vernachl¨assigt werden. Der Ausdruck (3.84) l¨aßt sich weiter auswerten, wenn man ber¨ ucksichtigt, daß gilt:
8π r [Y1,1 (θ, ϕ) − Y1,−1 (θ, ϕ)] x=− 3 2
8π ir y = [Y1,1 (θ, ϕ) + Y1,−1 (θ, ϕ)] 3 2
π z = rY1,0 (θ, ϕ) 3 H (0) =
¨ 3.8 Atomare Uberg¨ ange
⎡
=⇒ x = r
4π 3
359
⎤
⎢ − + i ⎥ 1 + i 2 ⎢ 1 ⎥ 2 Y1,1 + √ Y1,−1 + 3 Y1,0 ⎥ . ⎢ √ ⎣ ⎦ 2 2 e0 e1
e−1
¨ Somit nimmt das Ubergangsmatrixelement folgende Gestalt an:
9 : 1 1 1 4π ime Mf i = l , , J , M eq Y1,q l, , J, M 3 ¯ h q=−1 2 2 ⎧ ∞ ⎨ × (En − En ) drr3 gn∗ ,l (r)gn,l (r) ⎩ 0
1 − [j (j + 1) − l (l + 1) − j(j + 1) + l(l + 1)] 2 ⎫ ∞ ⎬ × drr3 a(r)gn∗ ,l (r)gn,l (r) . ⎭
(3.85)
0
Unter Ber¨ ucksichtigung von (3.34) ergibt sich f¨ ur den Winkelanteil von (3.85) : 1 9 1 1 l , , J , M q Y1,q l, , J, M 2 2 q=−1 : 6 9 1 1 1 c1 (l )c1 (l) l , M − ; + q Y1,q l, M − ; + = 2 2 q=−1 9 :7 1 1 + c2 (l )c2 (l) l , M + ; − q Y1,q l, M + ; − 2 2 6 1 c1 (l )c1 (l) dΩYl∗ ,M − 1 q Y1,q Yl,M − 12 = 2
q=−1
+ c2 (l )c2 (l) mit
c1 (l) = ±
dΩYl∗ ,M + 1 q Y1,q Yl,M + 12 2
l + 12 ± M , c2 (l) = 2l + 1
l + 12 ∓ M 2l + 1
7 ,
1 f¨ ur J = l ± . 2
(3.86)
(3.87)
Hieraus lassen sich nun einige wichtige Folgerungen ziehen: • Da die in (3.86) stehenden Kugelfl¨ achenfunktionen eine definierte Parit¨ at haben, Yl,m (−e) = (−1)l Yl,m (e), folgt die Bedingung
(−1)l (−1)1 (−1)l = 1 ⇐⇒ l + l + 1 = gerade . ¨ Das heißt die Parit¨ at des Atomzustandes muß beim Ubergang wechseln.
360
3. Quantenmechanik
• Unter Verwendung des Additionstheorems f¨ ur Kugelfl¨achenfunktionen, Yl1 ,m1 Yl2 ,m2 =
l 1 +l2
l1 , m1 ; l2 , m2 | L, m1 + m2 YL,m1 +m2 ,
L=|l1 −l2 |
folgt
dΩYl∗ ,M ± 1 Y1,q Yl,M ± 12 2
=
l+1 9 L=|l−1|
: 1 1 δl L δM ,M +q 1, q; l, M ± L, q + M ± 2 2
=⇒ l = |l − 1|, l, l + 1 , M = M + q . Aufgrund der 1. Folgerung scheidet jedoch l = l aus, so daß ∆l = ±1 und ∆M = 0, ±1 u ¨brig bleibt. ¨ Satz 3.26: Auswahlregeln bei atomaren Uberg¨ angen in der Dipoln¨ aherung ¨ Bei atomaren Uberg¨ angen wasserstoff¨ahnlicher Atome gelten in der Dipoln¨ aherung die Auswahlregeln ∆l = ±1 , ∆M = 0, ±1 .
3.8.4 Intensit¨ atsregeln ¨ Wir wollen nun das Ubergangsratenverh¨ altnis (Intensit¨ atsverh¨ altnis) zwi¨ schen den beiden erlaubten Uberg¨ angen 2p3/2 → 1s1/2 und 2p1/2 → 1s1/2 in wasserstoff¨ ahnlichen Atomen berechnen. Vernachl¨assigen wir hierzu in (3.85) den zweiten, durch die Spin-Bahn-Kopplung hervorgerufenen Term, dann ergeben die dortigen Integrationen u ur beide ¨ber den radialen Anteil f¨ ¨ Uberg¨ ange dasselbe Resultat und fallen deshalb heraus. Wie wir gleich sehen werden, gilt dasselbe f¨ ur die Integrationen u ¨ber den Phasenraum in Satz 3.25, wenn wir davon ausgehen, daß im Experiment nicht zwischen verschiedenen Gesamtdrehimpulseinstellungen im Anfangs- und Endzustand unterschieden wird, bzw. daß alle m¨oglichen Einstellungen gleichermaßen gemessen werden. Unter diesen Voraussetzungen erh¨alt man das Intensit¨atsverh¨altnis beider ¨ Ubergange allein aus dem Verh¨altnis der zugeh¨origen Winkelanteile: ? 1 3 = 1, , , M q Y1,q 0, 1 , 1 , M 2 2 R(2p3/2 → 1s1/2 ) = R(2p1/2 → 1s1/2 )
M = − 3 , . . . , 3 2 2 M = −1, 1 2 2 q = −1, 0, 1
2
M = − 1 , 1 2 2 M = −1, 1 2 2 q = −1, 0, 1
2 2
2 2
? 1 1 = 1, , , M q Y1,q 0, 1 , 1 , M 2 2 2
2 2
.
¨ 3.8 Atomare Uberg¨ ange
361
Dabei erstrecken sich die Summen neben q u oglichen Gesamtdreh¨ber alle m¨ impulseinstellungen des jeweiligen Anfangs- und Endzustandes. Der Faktor 2 im Z¨ ahler und Nenner enth¨ alt die beiden m¨ oglichen Polarisationsrichtungen des Photons. Unter Ber¨ ucksichtigung von (3.86) und (3.87) folgt f¨ ur die Matrixelemente im Z¨ ahler : 9 1 1 1 3 1, , , M Y1,q 0, , , M 2 2 ⎧ 2 2
1 ⎨ 32 + M 1 = √ + M δM, 12 δM − 12 ,q 3 2 4π ⎩ ⎫
⎬ 3 − M 1 2 − M δM,− 12 δM + 12 ,q + ⎭ 3 2
2−q 2+q 1δ 1 = δ δ 1δ 1 + 12π M, 2 M ,q+ 2 12π M,− 2 M ,q− 2 und im Nenner 9 : 1 1 1 1 1, , , M Y1,q 0, , , M 2 2 ⎧ 2 2
3 1 1 ⎨ 2 −M √ + M δM, 12 δM − 12 ,q − = 3 2 4π ⎩ ⎫
⎬ 3 1 2 +M − M δM,− 12 δM + 12 ,q + ⎭ 3 2
1−q 1+q 1δ 1 . =− δM, 12 δM ,q+ 12 + δ 12π 12π M,− 2 M ,q− 2 Damit ergibt sich R(2p3/2 → 1s1/2 ) R(2p1/2 → 1s1/2 ) 2 M = − 3 , . . . , 3 2 2 M = −1, 1 2 2 q = −1, 0, 1
= 2
M = − 1 , . . . , 1 2 2 M = −1, 1 2 2 q = −1, 0, 1
=
2/(3π) , 2/(6π)
| q |2
| q |2
2+q 1 1 12π δM ,q+ 2 δM, 2
+
2−q 1 1 12π δM,− 2 δM ,q− 2
1−q 1 1 12π δM ,q+ 2 δM, 2
+
1+q 1 1 12π δM,− 2 δM ,q− 2
(3.88)
wobei | −1 |2 + | 0 |2 + | +1 |2 = 1 benutzt wurde. Offenbar fallen aufgrund angigkeiten heraus, so daß die der Summationen u ¨ber M und M die q -Abh¨
362
3. Quantenmechanik
Phasenraumintegrationen f¨ ur Z¨ahler und Nenner in der Tat dasselbe Resultat liefern und deshalb von vornherein weggelassen werden durften. Das Endresultat lautet R(2p3/2 → 1s1/2 ) =2. R(2p1/2 → 1s1/2 ) Da der 2p3/2 -Zustand mehr Gesamtdrehimpulseinstellungen enth¨alt als der ¨ 2p1/2 -Zustand, ist die Intensit¨at des Ubergangs 2p3/2 → 1s1/2 doppelt so groß ¨ wie die Intensit¨ at des 2p1/2 → 1s1/2 -Ubergangs, sofern man die Beitr¨age der LS-Kopplung vernachl¨assigt. ¨ 3.8.5 2p3/2 → 1s1/2 -Ubergang ¨ ¨ Berechnen wir zum Schluß die Ubergangsrate f¨ ur den Ubergang 2p3/2 → 1s1/2 , wobei die LS-Kopplung wieder vernachl¨assigt werden soll. ¨ Der radiale Anteil des Ubergangsmatrixelementes (3.85) lautet ∞ 2 15 2 ∗ drr3 g2,1 = 2 r0 . (r)g (r) 1,0 39 Z 2 0
Der Winkelanteil wurde bereits berechnet und ist gerade der Z¨ahler von (3.88). Dieses Ergebnis ist noch mit dem Faktor 1/3 zu multiplizieren, weil aufgrund von Satz 3.26 zu gegebenem M = ±1 drei (und nicht vier) M Werte m¨ oglich sind und statistisch zu jeweils einem Drittel zur Gesamtheit der angeregten 2p3/2 -Atome beitragen: 9 :2 2 1, 1 , 3 , M q Y1,q 0, 1 , 1 , M = 2 . 3 2 2 2 2 9π 3 3 M
= − ,..., 2 2 M = −1, 1 2 2 q = −1, 0, 1
¨ Damit folgt f¨ ur das Ubergangsmatrixelement 218 r02 m2e ωf2 i . 312 Z2 Setzen wir jetzt diesen Ausdruck in Satz 3.25 ein und ber¨ ucksichtigen, daß ¨ die Ubergangsfrequenz gegeben ist durch me c2 Z 2 αe2 1 3me c2 Z 2 αe2 E1 − E2 ωf i = =− 1− =− , h ¯ 2¯h 4 8¯h |Mf i |2 =
dann erhalten wir insgesamt αe ωf i 218 r02 m2e ωf2 i ¯h 4π , r0 = 2πm2e c2 312 me cαe Z2 210 α5 me c2 Z 4 ≈ 0.8 · 109 Z 4 s−1 . = 9 e 3 ¯h
R(2p3/2 → 1s1/2 ) = −
Anwendungen
363
Zusammenfassung • Mit Hilfe der zeitabh¨ angigen St¨ orungstheorie lassen sich quantenmechanische Probleme l¨ osen, die eine kleine zeitabh¨ angige St¨ orung bein¨ halten. Sie erlaubt insbesondere die Berechnung von Ubergangsraten zwischen ungest¨ orten atomaren Zust¨ anden in Anwesenheit periodischer St¨orfelder (Fermis goldene Regel). ¨ • Im Gegensatz zu induzierten Uberg¨ angen, bei denen die St¨ orfel¨ der von außen angelegt werden, kommen spontane Uberg¨ ange durch Quantenfluktuationen elektromagnetischer Felder zustande – ein Effekt, der nur innerhalb der Quantenelektrodynamik erkl¨ art werden kann. Zur ¨ Bestimmung der zugeh¨ origen Ubergangsraten hat man jeweils die Einzelraten u ¨ber den Phasenraum der Photonen aufzusummieren. • Beschr¨ ankt man sich auf die Dipoln¨ aherung, dann lassen sich die in den ¨ ¨ Ubergangsraten auftretenden Ubergangsmatrixelemente relativ leicht berechnen. Man erh¨ alt hieraus die Dipolauswahlregeln, welche ein not¨ wendiges Kriterium f¨ ur nichtverschwindende Ubergangswahrscheinlichkeiten darstellen. ¨ • Konkrete Beispiele zur Berechnung von Ubergangsraten sind das ¨ Intensit¨ atsverh¨ altnis der (erlaubten) Uberg¨ ange 2p3/2 → 1s1/2 und ¨ 2p1/2 → 1s1/2 sowie die Ubergangsrate von 2p3/2 → 1s1/2 .
Anwendungen 49. Lichtelektrischer Effekt. Man betrachte wasserstoff¨ ahnliche Atome, die einer elektromagnetischen Strahlung A(x, t) = A0 ei(kx−ωt) ausgesetzt sind. Ist die Energie h ¯ ω dieser Strahlung gr¨ oßer als die Bindungsenergie des H¨ ullenelektrons im Atom, so wird das Atom ionisiert, und das Elektron bewegt sich frei mit der kinetischen Energie p2f (0) =h ¯ ω + Ei = h ¯ (ω + ωi ) . 2me ¨ Man berechne die Ubergangsrate daf¨ ur, daß das abgel¨ oste Elektron im Raumwinkelelement dΩ in Richtung pf zu finden ist, wenn sich das Atom vor der Ionisation im Grundzustand befand. Relativistische und durch Spins hervorgerufene Effekte sollen hierbei vernachl¨ assigt werden ( naives Wasserstoffa” tom“).
364
3. Quantenmechanik
L¨ osung. Der St¨oroperator hat die Gestalt eA0 ikx e P . me c Die Elektronwellenfunktionen des Anfangs- und Endzustandes lauten 3/2 2 Z (0) Ψi (x) = Ψ1,0,0 (x) = √ e−Zr/r0 r 4π 0 1 (0) Ψf (x) = √ eipf x/¯h , V H (t) = H e−iωt , H = −
(0)
wobei wir Ψf innerhalb eines Kastens mit dem Volumen V = L3 auf Eins ¨ normiert haben. Damit ergibt sich nach Fermis goldener Regel f¨ ur die Ubergangsrate Pf i in der Dipoln¨aherung 2 p2f 2π eA0 2 Pf i = − ¯h(ωi + ω) , |Mf i | δ 2me h me c ¯ mit
> @ > (0) (0) ∗ (0) (0) = Ψi P Ψf Ψf P Ψi = N pf d3 xe−Zr/r0 e−ipf x/¯h @
Mf i =
und
3/2 Z 1 . πV r0 W¨ ahlt man die z-Achse entlang von pf , dann gilt weiter N=√
∞ Mf i = N pf
2π drr2
0
= 2πi¯ hN
1 dϕ
pf pf
drr e−r(Z/r0 +ipf /¯h) − e−r(Z/r0 −ipf /¯h)
0
⎡ = 2πi¯ hN
!
⎤
pf ⎢ ⎣ pf Z r0
3/2 8 Vπ rZ0 pf = pf r0 2 !2 1 + h¯ Z =⇒ Pf i
(3.89)
−1
0
∞
d cos θe−Zr/r0 e−ipf r cos θ/¯h
128π 2 r03 e2 A20 = ¯hV m2e c2 Z 3
1 +
i h ¯ pf
2 −
1 Z r0
|pf |2 p r 2 !4 δ 1 + h¯fZ0
−
i h ¯ pf
⎥ 2 ⎦
p2f − ¯h(ωi + ω) . 2me
Anwendungen
365
Um eine realistische experimentelle Situation zu beschreiben, in der das Aufl¨osungsverm¨ogen von Detektoren begrenzt ist, hat man u ¨ber die zum pf Zustand benachbarten Elektronzust¨ ande zu integrieren. Wir verfahren hierzu analog zum Photonenfall in Unterabschn. 3.8.2 und fordern, daß die ebenen Elektronwellen periodische Randbedingungen im Kastenvolumen V = L3 besitzen, was zur Quantisierung der Impulswerte f¨ uhrt: 2π¯ h n , nx , ny , nz = 0, ±1, . . . . L ¨ Die gesuchte Ubergangsrate ergibt sich nun durch Summation u ogli¨ber alle m¨ chen Elektronzust¨ ande und l¨ aßt sich wie beim Photonenfall n¨ aherungsweise durch ein Integral darstellen: V dpf p2 Rf i dΩ = dΩ f Pf i . (2π¯ h)3 pf =
Unter Ber¨ ucksichtigung von p2 p2f p2 me f f = δ(pf − pf ) −¯ h(ωi + ω) = δ − δ 2me 2me 2me pf folgt Rf i dΩ =
16r03 e2 A20 pf |pf |2 p r 2 !4 dΩ . π¯h4 me c2 Z 3 1 + h¯fZ0
Offenbar h¨ angt diese Rate von der Amplitude des eingestrahlten Photonfeldes, vom Winkel zwischen Photonpolarisation und Elektronimpuls pf sowie vom Betrag pf (bzw. der Photonfrequenz ω) ab. Sie ist dagegen unabh¨ angig von der Richtung des eingestrahlten Lichts, da wir die Dipoln¨ aherung eikx ≈ 1 verwendet haben. Man beachte jedoch, daß man sich das entsprechende Ergebnis f¨ ur den ungen¨ aherten Fall leicht verschaffen kann, indem ab (3.89) die Ersetzung pf −→ pf − ¯ hk vorgenommen wird. Integriert man Rf i u ¨ber alle Winkel, so ergibt sich die totale Ionisationsrate. Zu ihrer Berechnung w¨ ahlen wir aus Bequemlichkeitsgr¨ unden die z-Achse in Richtung von und erhalten Rftot i
16r03 e2 A20 p3f = p r 2 !4 π¯h4 me c2 Z 3 1 + h¯fZ0 =
64r03 e2 A20 p3f 3¯ h4 me c2 Z 3 1 +
2π dϕ 0
pf r0 2 !4 . h ¯Z
1 −1
d cos θ cos2 θ
366
3. Quantenmechanik
3.9 N -Teilchensysteme Bisher haben wir unsere Aufmerksamkeit ein- und dreidimensionalen Systemen mit wenigen Freiheitsgraden gewidmet. In diesem Abschnitt wollen wir einige quantenmechanische Implikationen von Viel-Teilchensystemen studieren. Uns interessieren hierbei vor allem die Unterschiede in der Beschreibung unterscheidbarer und identischer Teilchensysteme. Wir werden zeigen, daß die quantenmechanische Betrachtung von Systemen identischer Teilchen zu u uhrt, die kein Analogon in der klassischen Me¨berraschenden Resultaten f¨ chanik besitzen. Auf dem Weg dorthin besch¨ aftigen wir uns zuerst mit der Beschreibung eines Systems von unterscheidbaren Teilchen und rekapitulieren einige ihrer Eigenschaften unter dem Gesichtspunkt der Interpretation von Messungen. 3.9.1 Unterscheidbare Teilchen Gegeben sei ein System von N dreidimensionalen spinlosen Teilchen, die unterscheidbar sind, d.h. die sich in mindestens einer ihrer intrinsischen Eigenschaften wie etwa Masse oder Ladung unterscheiden. In der klassischen Mechanik werden diese Teilchen durch ihre Orts- und Impulsvektoren (x1 , p1 ), . . .,(xN , pN ) beschrieben, und man erh¨alt die zugeh¨orige quantenmechanische Beschreibung durch die Operatorersetzung (Postulat III) xi −→ X i , pi −→ P i , wobei die Orts- und Impulsoperatoren den kanonischen Vertauschungsrelationen [X ik , P j l ] = i¯ hδij δkl , [X ik , X j l ] = [P ik , P j l ] = 0 gen¨ ugen. In manchen F¨allen, wie z.B. beim harmonischen Oszillator in Unterabschn. 3.3.5, ist es m¨oglich, die gesamte Physik aus den Kommutatorrelationen herzuleiten. Meistens verwendet man jedoch eine bestimmte Basis, die durch die simultanen Eigenkets | ω1 ⊗ · · · ⊗ | ωN = | ω1 , . . . , ωN der kommutierenden Observablen Ω i (X i , P i ), i = 1, . . . , N (Ω-Basis) gegeben ist und durch die der N -Teilchen-Hilbert-Raum aufgespannt wird: H = H1 ⊗ · · · ⊗ HN . Wird das System durch den Zustandsvektor | ψ beschrieben, dann lautet die Wahrscheinlichkeit, bei einer Messung das erste Teilchen im Zustand ω1 , das zweite im Zustand ω2 usw. zu finden (diskreter, nichtentarteter Fall) 2
W (ω1 , . . . , ωN ) = | ω1 , . . . , ωN | ψ| , falls | ψ auf Eins normiert ist:
3.9 N -Teilchensysteme
1 = ψ| ψ =
367
W (ω1 , . . . , ωN ) .
ω1 ,...,ωN
Dementsprechend ergibt sich z.B. die Wahrscheinlichkeit daf¨ ur, das erste Teilchen im Zustand ω1 , das zweite im Zustand ω2 und die restlichen Teilchen in einem beliebigen Zustand vorzufinden, zu W (ω1 , ω2 , Rest beliebig) = W (ω1 , . . . , ωN ) . ω3 ,...,ωN
W¨ ahlt man als Darstellung die kontinuierliche Ortsbasis, dann lauten die zum diskreten Fall korrespondierenden Beziehungen | x1 ⊗ · · · ⊗ | xN = | x1 , . . . , xN ψ(x1 , . . . , xN ) = x1 , . . . , xN | ψ 2
W (x1 , . . . , xN ) = |ψ(x1 , . . . , xN )| 1 = ψ| ψ = d3 x1 · · · d3 xN W (x1 , . . . , xN ) W (x1 , x2 , Rest beliebig) =
d3 x3 · · · d3 xN W (x1 , . . . , xN ) .
Hierbei ist W (x1 , x2 , Rest beliebig) als die Wahrscheinlichkeitsdichte aufzufassen, das erste Teilchen im Volumenelement [x1 : x1 + d3 x], das zweite im Volumenelement [x2 : x2 + d3 x] und die restlichen Teilchen irgendwo zu finden. Die zeitliche Entwicklung der Ortswellenfunktion ψ ist durch die Schr¨ odinger-Gleichung h ¯ d i¯ h ψ(x1 , . . . , xN , t) = H X i → xi , P i → ∇i ψ(x1 , . . . , xN , t) dt i gegeben. 3.9.2 Identische Teilchen, Pauli-Prinzip In der klassischen Mechanik ist es prinzipiell immer m¨ oglich, zwischen Teilchen zu unterscheiden, selbst wenn sie dieselben intrinsischen Eigenschaften besitzen, indem man n¨ amlich ihre nichtidentischen Trajektorien verfolgt, nat¨ urlich ohne diese dabei zu st¨ oren. Das heißt, daß zwei Konfigurationen, die durch Austausch zweier identischer Teilchen auseinander hervorgehen, im klassischen Sinne physikalisch verschieden sind. In der Quantenmechanik existiert dagegen i.a. keine M¨ oglichkeit, zwischen identischen Teilchen zu unterscheiden, da sie keine definierten Trajektorien besitzen, die man verfolgen k¨ onnte, sondern lediglich Aufenthaltswahrscheinlichkeiten.19 Deshalb 19
Der einzige Spezialfall, bei dem identische Teilchen quantenmechanisch unterschieden werden k¨ onnen ist der, wo ihre Gebiete nichtverschwindender Aufenthaltswahrscheinlichkeit v¨ ollig disjunkt sind. Man denke etwa an zwei Elektronen, die in verschiedenen K¨ asten eingesperrt sind, oder von denen sich das eine auf der Erde und das andere auf dem Mond befindet.
368
3. Quantenmechanik
sind zwei Konfigurationen, die sich durch den Austausch zweier identischer Teilchen ergeben, im quantenmechanischen Sinne als physikalisch ¨aquivalent zu betrachten und m¨ ussen durch denselben Zustandsvektor beschreibbar sein. Betrachten wir zum n¨aheren Verst¨andnis ein System von zwei identischen Teilchen in der Ortsdarstellung. Da zwei Zust¨ande, die sich nur um eine Phase α unterscheiden, physikalisch ¨aquivalent sind, bedeutet obige Forderung unter der Vertauschungsoperation x1 ↔ x2 x ↔x
x ↔x
2 2 1 1 ψ(x1 , x2 ) −→ αψ(x2 , x1 ) −→ α2 ψ(x1 , x2 ) .
Da die zweimalige Anwendung der Vertauschungsoperation wieder auf die urspr¨ ungliche Wellenfunktion f¨ uhrt, folgt α = ±1. Die Wellenfunktion kann also nur symmetrisch (α = +1) oder antisymmetrisch (α = −1) unter der Vertauschung sein. Besitzen die identischen Teilchen zus¨atzlich einen Spin, dann sind bei der Vertauschungsoperation alle Freiheitsgrade, also Ort x und Spinprojektionsquantenzahl m auszutauschen, und wir haben dann ψ(x1 , m1 , x2 , m2 ) = ±1ψ(x2 , m2 , x1 , m1 ) . Ob nun die symmetrische oder antisymmetrische Variante zu w¨ahlen ist, h¨ angt von der Art der identischen Teilchen ab, genauer gesagt: von deren Spin. Man kann im Rahmen von Quantenfeldtheorien zeigen, daß identische Teilchen, deren Spinquantenzahl s ganzzahlig ist (Bosonen), durch symmetrische Wellenfunktionen beschrieben werden, w¨ ahrend Teilchen, die eine halbzahlige Spinquantenzahl besitzen (Fermionen), durch antisymmetrische Wellenfunktionen dargestellt werden.20 Die Verallgemeinerung auf N Teilchen ist unproblematisch, und wir erhalten den Satz 3.27: Symmetrisierungsregel Die Zust¨ ande eines Systems von N identischen Teilchen sind gegen¨ uber der Vertauschung zweier Teilchen notwendigerweise entweder alle symmetrisch (→ Bosonen) oder alle antisymmetrisch (→ Fermionen). Anders ausgedr¨ uckt: Sei P eine Permutation von 1, . . . , N , 1 ... N P = , P1 . . . PN dann gilt f¨ ur Fermionen (Spin halbzahlig) ψ(x1 , m1 , . . . , xN , mN ) = (P )ψ(xP1 , mP1 , . . . , xPN , mPN ) und f¨ ur Bosonen (Spin ganzzahlig) ψ(x1 , m1 , . . . , xN , mN ) = ψ(xP1 , mP1 , . . . , xPN , mPN ) , wobei (P ) = +1 f¨ ur gerade Permutationen und (P ) = −1 f¨ ur ungerade Permutationen ist. 20
Man sagt auch: Fermionen folgen der Fermi-Dirac-Statistik und Bosonen der Bose-Einstein-Statistik.
3.9 N -Teilchensysteme
369
Aus der Symmetrisierungsregel ergibt sich eine sehr weitreichende Konsequenz: Nehmen wir an, eine Messung der Observablen Ω an einem fermionischen Zwei-Teilchensystem ergibt die Werte ω1 und ω2 . Dann ist sein antisymmetrischer Zustandsvektor unmittelbar nach der Messung gegeben durch 1 | ψ = √ (| ω1 , ω2 − | ω2 , ω1 ) . 2 Setzen wir jetzt ω1 = ω2 , dann ist | ψ = 0. Hieraus folgt der Satz 3.28: Paulisches Ausschließungsprinzip Zwei identische Fermionen k¨ onnen sich nicht im gleichen Quantenzustand befinden. Dieses Prinzip hat folgenschwere Auswirkungen im Bereich der statistischen Mechanik, im Verst¨ andnis des Aufbaus und der chemischen Eigenschaften von Atomen sowie vieler anderer Gebiete. Bosonische und fermionische Hilbert-R¨ aume. Kehren wir noch einmal zum identischen Zwei-Teilchensystem zur¨ uck. Verwenden wir zu seiner Darstellung die Ω-Basis, wobei Ω ein diskretes, nichtentartetes Spektrum besitzen soll, dann besteht der Zwei-Teilchen-Hilbert-Raum H1 ⊗ H2 aus allen Vektoren der Form | ω1 , ω2 . Zu jedem Paar von Vektoren | ω1 , ω2 und | ω2 , ω1 existiert genau ein bosonischer Vektor 1 | ω1 , ω2 , S = √ (| ω1 , ω2 + | ω2 , ω1 ) 2 und ein dazu orthogonaler fermionischer Vektor 1 | ω1 , ω2 , A = √ (| ω1 , ω2 − | ω2 , ω1 ) 2 und umgekehrt. Im Falle ω1 = ω2 ist der Vektor | ω1 , ω1 bereits symmetrisch und somit bosonisch; aufgrund des Pauli-Prinzips existiert kein entsprechender fermionischer Vektor. Der Zwei-Teilchen-Hilbert-Raum setzt sich also aus der Summe eines symmetrischen (S) und antisymmetrischen (A) HilbertRaumes zusammen, H1 ⊗ H2 = H(S) ⊕ H(A) , wobei die Dimension von H(S) ein wenig gr¨ oßer ist als die H¨ alfte der Dimension von H1 ⊗ H2 . Ist nun ein bosonisches (fermionisches) Zwei-Teilchensystem durch den Ket | ψS (| ψA ) gegeben, dann interpretieren wir 2
WS (ω1 , ω2 ) = | ω1 , ω2 , S| ψS | 1 2 = | ω1 , ω2 | ψS + ω2 , ω1 | ψS | 2 2 = 2 | ω1 , ω2 | ψS |
370
3. Quantenmechanik
bzw. 2
WA (ω1 , ω2 ) = | ω1 , ω2 , A| ψA | 1 2 = | ω1 , ω2 | ψA − ω2 , ω1 | ψA | 2 2 = 2 | ω1 , ω2 | ψA | als die Wahrscheinlichkeit, eines der beiden Teilchen im Zustand ω1 und das andere im Zustand ω2 bei einer Messung vorzufinden.21 Die zugeh¨orige Normierungsbedingung von | ψS,A lautet WS,A (ω1 , ω2 ) 1 = ψS,A | ψS,A = versch.
= 2
2
| ω1 , ω2 | ψS,A | ,
versch.
wobei nur u ¨ber physikalisch verschiedene Zust¨ande zu summieren ist. Im Falle der kontinuierlichen Ortsbasis gilt entsprechend 1 | x1 , x2 , S, A = √ (| x1 , x2 ± | x2 , x1 ) 2 2
2
WS,A (x1 , x2 ) = | x1 , x2 , S, A| ψS,A | = 2 | x1 , x2 | ψS,A | 1 2 3 3 d x1 d x2 WS,A (x1 , x2 ) = d3 x1 d3 x2 | x1 , x2 | ψS,A | . 1= 2 Der Faktor 1/2 ber¨ ucksichtigt hierbei die doppelte Z¨ahlung physikalisch ¨aquiur die der Faktor 1/2 nicht valenter Zust¨ ande. (Die Zust¨ande mit x1 = x2 , f¨ zutrifft, stellen nur einen infinitesimalen Beitrag zur Integration im x1 x2 Hyperraum dar.) 3.9.3 Druck der Fermionen Die Bedeutung des Pauli-Prinzips l¨aßt sich am einfachsten an einem System von N freien Elektronen erkennen, die in einem Kasten der Seitenl¨ange L eingeschlossen sind. Die zugeh¨orige station¨are Schr¨odinger-Gleichung N
H i Ψ = EΨ , H i = −
i=1
¯2 h ∇2 2me i
wird gel¨ ost mit dem Produktansatz Ψ=
N A i=1
Ψki (xi , mi ) , E =
N
Ei ,
i=1
mit 21
Man beachte: a, b| ψS = b, a| ψS und a, b| ψA = − b, a| ψA .
3.9 N -Teilchensysteme
371
Ψki (x, m) = sin(kix x) sin(kiy y) sin(kiz z)χi (m) . χ(m) bezeichnet den zweikomponentigen Elektronspinor. Da die Teilchen eingeschlossen sind, verschwinden die Wellenfunktionen an den R¨ andern des Kastens, d.h. die Wellenvektoren sind in der Weise π ki = ni , ni = (nix , niy , niz ) , nix , niy , niz = 1, 2, . . . L quantisiert. Da Elektronen Fermionen sind, muß die Gesamtwellenfunktion noch antisymmetrisiert werden. Dies l¨ aßt sich wie bei allen faktorisierenden Funktionen durch die Slater-Determinante erreichen:22 Ψk1 (x1 , m1 ) . . . Ψk1 (xN , mN ) 1 Ψk2 (x1 , m1 ) . . . Ψk2 (xN , mN ) Ψ (x1 , m1 , . . . , xN , mN ) = √ . .. .. .. N ! . . . Ψk (x1 , m1 ) . . . Ψk (xN , mN ) N N Offenbar bewirkt der Austausch zweier Teilchen den Austausch zweier Spalten, was bei einer Determinante bekanntlich zu einem Minuszeichen f¨ uhrt. Anhand der Determinantenform erkennt man, daß die antisymmetrische Wellenfunktion verschwindet, wenn zwei Teilchen dieselbe Spineinstellung haben (mi = mj ) und sich nahe kommen (xi ≈ xj ). Das heißt die Wahrscheinlichkeitsdichte, beide Teilchen nahe beieinander zu finden, ist klein. Die Symmetrisierungsregel Satz 3.27 wirkt also wie eine abstoßende Wechselwirkung zwischen den Teilchen. Dar¨ uber hinaus verschwindet die Wellenfunktion auch dann, wenn sich zwei Teilchen im selben Zustand befinden (Pauli-Prinzip): (ki , mi ) = (kj , mj ). Der Zustand niedrigster Energie ist also nicht einfach dadurch gegeben, daß alle N Teilchen den kleinst m¨ oglichen Wellenvektor |ki | = π/L haben. Vielmehr kann jeder Wellenvektor ki nur mit zwei Elektronen besetzt“ sein; das eine Elektron mit Spin up (m = 1/2), das andere ” mit Spin down (m = −1/2). Demnach ergibt sich die Grundzustandsenergie durch Summation der niedrigsten Teilchenenergien zu h2 π 2 2 ¯ E=2 n , 2me L |n|≤nF
achst unbekannten Maximalwert bezeichnet. Ist N hinwobei nF einen zun¨ reichend groß, dann ist es eine gute N¨ aherung, zu fordern, daß alle Tripel (nx , ny , nz ) innerhalb des positiven Oktanden einer Kugel vom Radius nF liegen m¨ ussen. Die Anzahl der Tripel ist dann (aufgrund der zweifachen Besetzbarkeit) 1/3 N 1 4π 3 3N 1 3 d n= . = n =⇒ nF = 2 8 8 3 F π |n|≤nF 22
Die Slater-Determinante kann auch benutzt werden, um bosonische Gesamtwellenfunktionen zu symmetrisieren. In diesem Fall sind alle Vorzeichen der Determinantenentwicklung positiv zu nehmen.
372
3. Quantenmechanik
Damit folgt f¨ ur die Grundzustandsenergie des gesamten Systems h2 π 2 1 ¯ E = 2 d3 nn2 2me L 8 |n|≤nF
nF ¯ 2 π 2 1 h 4π dnn4 = 2 2me L 8 3 2
=
h π ¯ 10me L2
0
3N π
5/3 .
Man beachte, daß die Energie mit der Teilchenzahl N st¨arker als linear anw¨ achst. Die Energie pro Teilchen, E/N , w¨achst also selbst mit der Teilchenzahl und f¨ allt mit dem Volumen L3 des Kastens, in dem die Teilchen eingeschlossen sind. Zusammenfassung • Im Gegensatz zur klassischen Mechanik, in der sich Teilchen immer durch ihre nichtidentischen Trajektorien unterscheiden lassen, gibt es in der Quantenmechanik Systeme unterscheidbarer und identischer Teilchen. Letztere sind in allen Hinsichten als physikalisch ¨aquivalent zu betrachten und werden folglich durch denselben Zustandsvektor beschrieben. • Die Symmetrisierungsregel besagt: Handelt es sich bei identischen Teilchen um Bosonen/Spin ganzzahlig (Fermionen/Spin halbzahlig), dann ist die zugeh¨orige Wellenfunktion symmetrisch (antisymmetrisch) unter dem Austausch zweier Teilchen. • Aus dieser Regel folgt das Paulische Ausschließungsprinzip, nach dem sich zwei identische Fermionen nicht im selben Quantenzustand befinden k¨ onnen.
Anwendungen 50. Z¨ ahlung unterschiedlicher Konfigurationen. Man stelle sich ein System von drei Teilchen vor, die jeweils die Zust¨ande | a , | b und | c annehmen k¨ onnen. Es soll gezeigt werden, daß die Gesamtzahl verschiedener Systemkonfigurationen gegeben ist durch: a) 27 im Falle unterscheidbarer Teilchen, b) 10 im Falle identischer Bosonen, c) 1 im Falle identischer Fermionen.
Anwendungen
373
L¨ osung. Zu a) Bei unterscheidbaren Teilchen ist der allgemeinste Zustandsvektor onnen, | ω1 , ω2 , ω3 , wobei alle drei Indizes die Werte a, b oder c annehmen k¨ was jeweils einer anderen physikalischen Situation entspricht. Insgesamt hat man also 3 · 3 · 3 = 27 verschiedene Konfigurationen. Zu b) Hier lautet der allgemeinste, unter dem Austausch zweier Teilchen symmetrische Zustandsvektor | ω1 ω 2 ω 3 + | ω1 ω 3 ω 2 + | ω 2 ω 1 ω 3 + | ω2 ω 3 ω 1 + | ω 3 ω 1 ω 2 + | ω 3 ω 2 ω 1 , wobei auch hier alle drei Werte f¨ ur ωi erlaubt sind. Sind alle drei Indizes verschieden, dann hat man eine Konfiguration. L¨ aßt man genau zwei gleiche Indizes zu, so kann man damit sechs verschiedene Konfigurationen beschreiben. Bei drei gleichen Indizes ergeben sich drei unterschiedliche Situationen. Wir haben somit 1 + 6 + 3 = 10 unterscheidbare Konfigurationen. Zu c) Hier muß der Zustandsvektor antisymmetrisch unter dem Austausch zweier Teilchen sein. Seine allgemeinste Form ist | ω1 ω 2 ω 3 − | ω1 ω 3 ω 2 − | ω2 ω 1 ω 3 + | ω2 ω 3 ω 1 + | ω3 ω 1 ω 2 − | ω3 ω 2 ω 1 . Nach dem Pauli-Prinzip m¨ ussen alle drei Indizes verschieden sein. Da der Austausch zweier Indizes lediglich ein physikalisch irrelevantes Vorzeichen am Zustandsvektor bewirkt, existiert nur eine einzige Konfiguration. 51. Identisches Zwei-Teilchensystem. Zwei identische eindimensionale Teilchen der Masse m sind im Bereich 0 ≤ x ≤ L in einem Kasten eingeschlossen. Eine Energiemessung des Systems liefert die Werte ¯ 2 π2 h 5¯ h2 π 2 , (b) E = . mL2 mL2 Wie lauten die jeweiligen Gesamtwellenfunktionen im Falle identischer Spin1/2-Fermionen bzw. identischer Spin-0-Bosonen? (Es wird angenommen, daß der Spin die Energiemessung nicht beeinflußt.) (a) E =
L¨ osung. Die normierte L¨ osungsfunktion lautet f¨ ur Spin-1/2-Fermionen Ψ (x1 , m1 , x2 , m2 ) = Ψk1 (x1 , m1 )Ψk2 (x2 , m2 ) , mit
2 sin(ki x)χi (m) L und f¨ ur Spin-0-Bosonen Ψki (x, m) =
Ψ (x1 , x2 ) = Ψk1 (x1 )Ψk2 (x2 ) , Ψki (x) = wobei die Wellenzahlen ki in der Weise nπ , n = 1, 2, . . . ki = ki (n) = L
2 sin(ki x) , L
374
3. Quantenmechanik
gequantelt sind. Die Gesamtenergie des Zwei-Teilchensystems betr¨agt ¯h2 π 2 2 ¯2 h k1 (n1 )2 + k2 (n2 )2 = (n + n22 ) . 2m 2mL2 1 Im Fall a) befinden sich beide Teilchen im Grundzustand (n1 = n2 = 1). Die ussen sich deshalb aufgrund des Pauli-Prinzips in identischen Fermionen m¨ ihrem Spinzustand unterscheiden, so daß die antisymmetrische Gesamtwellenfunktion lautet: 1 Ψ (x , +) Ψk1 (1) (x2 , −) Ψ (A) (x1 , +, x2 , −) = √ k1 (1) 1 2 Ψk2 (1) (x1 , +) Ψk2 (1) (x2 , −) 1 Ψ (x , −) Ψk1 (1) (x2 , +) = − √ k1 (1) 1 2 Ψk2 (1) (x1 , −) Ψk2 (1) (x2 , +) √ 2 = sin(πx1 /L) sin(πx2 /L) L × [χ1 (+)χ2 (−) − χ1 (−)χ2 (+)] . E=
Die symmetrische Wellenfunktion f¨ ur identische Bosonen ist 2 sin(πx1 /L) sin(πx2 /L) . L ur identische Fermionen Im Fall b) ist n1 = 1, n2 = 2 oder n1 = 2, n2 = 1. F¨ ergeben sich hieraus vier unterschiedliche Konfigurationen und Wellenfunktionen: Ψ (S) (x1 , x2 ) = Ψk1 (1) (x1 )Ψk1 (1) (x2 ) =
(i)+(ii) Beide Spins sind gleichorientiert: 1 Ψk1 (1) (x1 , ±) Ψk1 (1) (x2 , ±) (A) Ψ (x1 , ±, x2 , ±) = √ 2 Ψk2 (2) (x1 , ±) Ψk2 (2) (x2 , ±) 1 Ψk1 (2) (x1 , ±) Ψk1 (2) (x2 , ±) = −√ 2 Ψk2 (1) (x1 , ±) Ψk2 (1) (x2 , ±) √ 2 = [sin(2πx1 /L) sin(πx2 /L) L − sin(πx1 /L) sin(2πx2 /L)] χ1 (±)χ2 (±) . (iii) Das Teilchen mit n = 1 hat Spin up, dasjenige mit n = 2 Spin down: 1 Ψ (x , +) Ψk1 (1) (x2 , −) Ψ (A) (x1 , +, x2 , −) = √ k1 (1) 1 2 Ψk2 (2) (x1 , +) Ψk2 (2) (x2 , −) 1 Ψ (x , −) Ψk1 (1) (x2 , +) = − √ k1 (1) 1 2 Ψk2 (2) (x1 , −) Ψk2 (2) (x2 , +) √ 2 = [sin(πx1 /L) sin(2πx2 /L)χ1 (+)χ2 (−) L − sin(2πx1 /L) sin(πx2 /L)χ1 (−)χ2 (+)] .
3.10 Streutheorie
375
(iv) Das Teilchen mit n = 1 hat Spin down, dasjenige mit n = 2 Spin up: 1 Ψ (x , +) Ψk1 (2) (x2 , −) Ψ (A) (x1 , +, x2 , −) = √ k1 (2) 1 2 Ψk2 (1) (x1 , +) Ψk2 (1) (x2 , −) 1 Ψk1 (2) (x1 , −) Ψk1 (2) (x2 , +) = −√ 2 Ψk2 (1) (x1 , −) Ψk2 (1) (x2 , +) √ 2 = [sin(2πx1 /L) sin(πx2 /L)χ1 (+)χ2 (−) L − sin(πx1 /L) sin(2πx2 /L)χ1 (−)χ2 (+)] . F¨ ur identische Bosonen hat man √ 2 [sin(πx1 /L) sin(2πx2 /L) + sin(2πx1 /L) sin(πx2 /L)] . Ψ (S) (x1 , x2 ) = L
3.10 Streutheorie Eine der erfolgreichsten Methoden, die Struktur von Teilchen und die Wechselwirkung zwischen ihnen zu verstehen, ist ihre gegenseitige Streuung. Die quantenmechanische Beschreibung geschieht wie im Falle der klassischen Streuung durch die Angabe von Wirkungsquerschnitten, die im direkten Zusammenhang mit dem asymptotischen Verhalten der station¨ aren L¨ osungen der Schr¨odinger-Gleichung stehen. Wir beginnen die Diskussion der quantenmechanischen Streuung mit der Streuung an ein festes Streuzentrum und f¨ uhren die Berechnung des differentiellen Wirkungsquerschnittes auf die Streuamplitude der gestreuten Teilchen zur¨ uck. Im Anschluß besprechen wir die Methode der Streuphasen, die sich bei zentralsymmetrischen Wechselwirkungen zwischen Projektilen und Streuzentrum anbietet. Hierbei wird eine Partialwellenzerlegung der Streuamplitude vorgenommen, bei der der Streuprozeß in die einzelnen Drehimpulsmoden zerlegt wird. Sp¨ ater u ¨bertragen wir unsere Ergebnisse auf den Fall der gegenseitigen Streuung von unterscheidbaren und identischen Teilchen, wobei wir wie im klassischen Fall besonders an der Beschreibung im Schwerpunkt- und Laborsystem interessiert sind. Im folgenden wird vorausgesetzt, daß sich die Wirkung des Streuers durch ein zeitunabh¨ angiges Potential V (x) darstellen l¨ aßt, das im Unendlichen st¨arker als 1/|x| abf¨ allt, so daß einfallende und gestreute Teilchen in diesem Limes asymptotisch frei sind. 3.10.1 Streuamplitude und Wirkungsquerschnitt Die Problemstellung bei der quantenmechanischen Streuung von Teilchen an ein festes Streuzentrum ist dieselbe, wie bei der in den Unterabschnitten 1.5.4 und 1.5.5 besprochenen Streuung von klassischen Teilchen und ist in Abb. 3.16 graphisch veranschaulicht. Ein homoenergetischer Strahl von Teilchen mit dem mittleren Impuls P = h ¯ kez fliegt in positiver z-Richtung auf
376
3. Quantenmechanik Detektor r y
dΩ
x θ
z
Abb. 3.16. Streuung von Teilchen an ein festes Streuzentrum
ein in x = 0 fest installiertes, lokal begrenztes Streuzentrum zu und wird von diesem abgelenkt (gestreut). Wie im klassischen Fall ist man auch hier an der Zahl der gestreuten Teilchen interessiert, die in großer Entfernung zum Streuzentrum im Raumwinkelelement dΩ von einem Detektor nachgewiesen werden. Die hierf¨ ur relevante Gr¨oße ist der differentielle Wirkungsquerschnitt dσ/dΩ, der definiert ist durch dσ (Zahl der nach dΩ gestreuten Teilchen)/s dΩ = . 2 dΩ (Zahl der einfallenden Teilchen)/s/m Zur Berechnung von dσ/dΩ m¨ ußte man eigentlich jedes Teilchen durch ein Wellenpaket beschreiben und dessen Propagation in der Zeit verfolgen. Man h¨ atte dann in der asymptotischen Region |x| → ∞, t → ±∞ jeweils den gestreuten und einfallenden Anteil zu isolieren und hieraus den differentiellen Wirkungsquerschnitt zu bestimmen. Nun hatten wir bei der Diskussion der eindimensionalen Streuung in Unterabschn. 3.3.3 bereits festgestellt, daß es zur Berechnung der charakteristischen Streugr¨oßen ausreicht, sich auf den statischen Fall zu beschr¨anken (Satz 3.15). Dies u ¨bertr¨agt sich auch auf den dreidimensionalen Fall. Je mehr wir n¨amlich die einfallenden Wellenpakete im Impulsraum begrenzen, umso ausgedehnter werden die zugeh¨origen Wellenpakete im Ortsraum und gehen im Falle verschwindender Impulsunsch¨arfe in die L¨ osungen der station¨aren Schr¨odinger-Gleichung ⎛ ⎞ 0 2 2m 2mE ∇ + k 2 Ψk (x) = 2 V (x)Ψk (x) , k = ⎝ 0 ⎠ , k 2 = (3.90) ¯h ¯h2 k u ¨ber. In diesem Limes beginnen die einlaufenden und gestreuten Wellen zeitlich zu koexistieren, d.h. der eigentliche Streuvorgang ist nicht mehr zeitlich begrenzt sondern erstreckt sich u ¨ber die gesamte Zeitachse. Wie wir gleich
3.10 Streutheorie
377
zeigen werden, lassen sich die Eigenfunktionen Ψk im Limes |x| = r → ∞ in zwei Anteile aufspalten, eikr , (3.91) r wobei Ψin die einlaufende (incident) Welle ist, welche L¨ osung der freien Schr¨ odinger-Gleichung ist, und Ψsc die vom Streuzentrum weglaufende, gestreute (scattered) Welle bedeutet. f ist die Streuamplitude, in der die gesamte Information des Streuprozesses enthalten ist. Bezeichnen jetzt j in (k, x) und j sc (k, x) die zu Ψin und Ψsc geh¨ orenden Wahrscheinlichkeitsstromdichten, die sich aus der dreidimensionalen Verallgemeinerung von (3.17) ergeben, r→∞
Ψk −→ Ψin + Ψsc , Ψin (x) = eikz , Ψsc (x) = f (θ, ϕ)
h ¯ (Ψ ∗ ∇Ψ − Ψ ∇Ψ ∗ ) , 2im dann stellt der Ausdruck ⎛ ⎞ cos ϕ sin θ r2 dΩj sc (k, x)nsc , nsc = ⎝ sin ϕ sin θ ⎠ cos θ j=
die Wahrscheinlichkeit pro Zeiteinheit dar, daß Teilchen vom Detektor im Raumwinkelelement dΩ nachgewiesen werden. Entsprechend bedeutet ⎛ ⎞ 0 j in (k, x)nin , nin = ⎝ 0 ⎠ 1 die in z-Richtung einfallende Teilchenstromdichte. F¨ ur den differentiellen Wirkungsquerschnitt ergibt sich somit dσ r2 j sc (k, x)nsc = lim = |f (θ, ϕ)|2 , dΩ |x|→∞ j in (k, x)nz wobei benutzt wurde, daß ¯hk ∂ ∗ h ¯ ∗ ∂ Ψin = j in nin = Ψin − Ψin Ψin 2mi ∂z ∂z m h ¯ ∗ j sc nsc = ) (Ψ ∗ nsc ∇Ψsc − Ψsc nsc ∇Ψsc 2mi sc −ikr ∂ eikr e h ¯ eikr ∂ e−ikr 2 = |f (θ, ϕ)| − 2mi r ∂r r r ∂r r hk ¯ = |f (θ, ϕ)|2 . mr2 Als n¨achstes ist die G¨ ultigkeit von (3.91) zu zeigen. Hierzu schreiben wir (3.90) um in eine Integralgleichung: (3.92) Ψk (x) = Ψin (x) + d3 x G(x − x )V (x )Ψk (x ) .
378
3. Quantenmechanik
Dabei bezeichnet G(x−x ) die Green-Funktion unseres Problems. Man u ¨berzeugt sich leicht davon, daß sie der Differentialgleichung 2 2m ∇ + k 2 G(x − x ) = 2 δ(x − x ) (3.93) ¯h zu gen¨ ugen hat, deren physikalische L¨osung gegeben ist durch
G(x − x ) = −
2m eik|x−x | . 4π¯h2 |x − x |
Wir erhalten somit Ψk (x) = eikz −
2m 4π¯h2
d3 x
eik|x−x | V (x )Ψk (x ) . |x − x |
(3.94)
In der Praxis ist die effektive Reichweite des Streupotentials auf einen kleinen Bereich r0 beschr¨ankt, w¨ahrend die Teilchen in einer großer Entfernung zum Streuzentrum detektiert werden, d.h. |x | ≤ r0 |x| → ∞ . ik|x−x |
Wir k¨ onnen deshalb den Ausdruck e|x−x | in gleicher Weise entwickeln, wie in (2.61) und (2.62) in Unterabschn. 2.4.3 vorgef¨ uhrt wurde: xx eikr −iknsc x eik|x−x | |x|→∞ eik|x| e−ikxx /|x| e 1 + ≈ −→ . (3.95) |x − x | |x| x2 r Hierbei ist, wie gehabt, r = |x| und nsc = x/|x| die Einheitsrichtung des detektierten Teilchens. Setzt man (3.95) in (3.94) ein, so erh¨alt man das gew¨ unschte Resultat: r→∞
Ψk (x) −→ eikz + f (θ, ϕ)
eikr , r
(3.96)
mit23
m d3 x e−iknsc x V (x )Ψk (x ) . 2π¯h2 Um die Streuamplitude berechnen zu k¨onnen, ben¨otigt man einen expliziten Ausdruck f¨ ur die Wellenfunktion Ψk . Dieser ergibt sich durch iteratives L¨osen der Integralgleichung (3.92) in den verschiedenen Ordnungen des Potentials V zu f (θ, ϕ) = −
23
Man beachte: Die zweite L¨ osung der Differentialgleichung (3.93),
G(x − x ) = −
2m e−ik|x−x | , 4π¯ h2 |x − x |
w¨ urde in (3.96) offenbar zu der unphysikalischen Situation einer Kugelwelle f¨ uhren, die von außen auf das Streuzentrum zul¨ auft; sie scheidet daher aus.
3.10 Streutheorie
Ψk (x) = Ψin (x) + d3 x G(x − x )V (x )Ψin (x ) + d3 x d3 x ×G(x − x )V (x )G(x − x )V (x )Ψin (x ) +... .
379
(0. Ordnung) (1. Ordnung)
(2. Ordnung)
Diese Entwicklung definiert die Bornsche Reihe. Beschr¨ ankt man sich auf die 0. Ordnung (Bornsche N¨ aherung), dann folgt f¨ ur die Streuamplitude m f (θ, ϕ) = − d3 x ei∆x V (x ) , ∆ = k(nin − nsc ) . 2 2π¯ h Satz 3.29: Streuamplitude und differentieller Wirkungsquerschnitt Man betrachte die Streuung von Teilchen, die entlang der z-Achse mit dem mittleren Impuls P = h ¯ kez auf ein Streupotential V (x) fliegen. Ist die effektive Reichweite r0 des Streupotentials im Vergleich zur Entfernung r des Detektors zum Streumittelpunkt klein, r0 r, dann l¨ aßt sich die asymptotische L¨ osung der zugeh¨ origen zeitunabh¨ angigen Schr¨ odinger-Gleichung in der Form eikr r→∞ ikz Ψk (x) −→ e + f (θ, ϕ) r Ψin Ψsc
schreiben, wobei die Streuamplitude f gegeben ist durch m d3 x e−iknsc x V (x )Ψk (x ) . f (θ, ϕ) = − 2 2π¯ h F¨ ur den differentiellen Wirkungsquerschnitt gilt
(3.97)
dσ = |f (θ, ϕ)|2 . dΩ In der Bornschen N¨ aherung reduziert sich (3.97) auf die Gleichung 2m d3 x ei∆x V (x ) , ∆ = k(nin − nsc ) . f (θ, ϕ) = f (∆) = − 4π¯ h2 Bis auf einen konstanten Faktor entspricht sie der Fourier-Transformierten des Potentials V in Abh¨ angigkeit des Impuls¨ ubertrages h ¯ ∆. Bei zentralsymmetrischen Potentialen V (x) = V (|x|) f¨ allt die ϕ-Abh¨ angigkeit weg, so daß f = f (θ) = f (|∆|). Coulomb-Streuung. Als Beispiel dieses Satzes berechnen wir den differentiellen Wirkungsquerschnitt in der Bornschen N¨ aherung f¨ ur die Streuung ei-
380
3. Quantenmechanik
nes Teilchens der Masse m und der Ladung Z1 e an einem Coulomb-Potential der Ladung Z2 e. Dabei betrachten wir aus Gr¨ unden, die gleich deutlich werden, zun¨ achst den allgemeineren Fall eines Yukawa-Potentials e−βr . r Aufgrund der Rotationssymmetrie des Potentials gen¨ ugt es, f (|∆|) f¨ ur uhrung von Kugelkoordinaten, ∆ = ez zu berechnen. Unter Einf¨ V (r) = g
x = r cos ϕ sin θ , y = r sin ϕ sin θ , z = r cos θ , ergibt sich 2m f (|∆|) = − 2πg 4π¯h2
∞ drr 0
∞
2e
−βr
r
1 d cos θei∆r cos θ −1
1 i∆r e − e−i∆r i∆r 0 img 1 1 = 2 − h ∆ β − i∆ β + i∆ ¯ 2mg 1 =− 2 2 , ¯h β + ∆2
=−
mg h2 ¯
drre−βr
(3.98)
mit ∆2 = k 2 (n2in + n2sc − 2nin nsc ) = 2k 2 (1 − cos θ) = 4k 2 sin2
θ . 2
Setzen wir jetzt g = Z1 Z2 e2 , β = 0 , dann folgt f¨ ur den differentiellen Wirkungsquerschnitt der Coulomb-Streuung die aus der klassischen Mechanik bekannte Rutherfordsche Streuformel (vgl. (1.63)) 2 2 dσ 2mZ1 Z2 e2 Z1 Z2 e2 = = . (3.99) dΩ 4E sin2 θ2 4¯ h2 k 2 sin2 θ2 Jetzt wird klar, warum wir von einem Yukawa-Potential ausgegangen sind: Wir brauchten den Abschirmfaktor β, damit die r-Integration in (3.98) konvergiert. Es sei noch vermerkt, daß (3.99) exakt und nicht nur in der hier vorgef¨ uhrten Bornschen N¨aherung gilt. 3.10.2 Streuphasenanalyse bei zentralsymmetrischen Potentialen Hat man es bei der Streuung mit einem zentralsymmetrischen Potential zu tun, dann ist ist der Drehimpuls eine Erhaltungsgr¨oße, und es bietet sich an, die Streuamplitude f = f (θ) nach den Legendre-Polynomen
3.10 Streutheorie
Pl (cos θ) =
381
4π Yl,0 (θ) , Yl,0 (θ) = Yl,0 (θ, ϕ) 2l + 1
zu entwickeln, um den Streuprozeß f¨ ur jeden l-Sektor getrennt studieren zu k¨onnen. Unter Ber¨ ucksichtigung von Satz 3.20 erh¨ alt man dann f¨ ur die asymptotische Form der Wellenfunktion Ψk ∞ eikr eikr r→∞ = Pl (cos θ) . (2l + 1)il jl (kr) + al Ψk (x) −→ eikz + f (θ) r r l=0
Ber¨ ucksichtigt man ferner das asymptotische Verhalten von jl , sin(kr − lπ/2) , kr dann k¨onnen wir diese Gleichung so umformulieren, daß die ein- und auslaufenden Wellen getrennt sind: ikr (2l + 1)il −ilπ/2 r→∞ e Ψk (x) −→ + al Pl (cos θ) e r 2ik r→∞
jl (kr) −→
l
e−ikr (2l + 1)il ilπ/2 e Pl (cos θ) . − r 2ik
(3.100)
l
Auf der anderen Seite l¨ aßt sich Ψk ganz allgemein in der Weise
∞ ∞ 2l + 1 gl (r)Pl (cos θ) Al gl (r)Yl,0 (θ) = Al Ψk (x) = 4π l=0
l=0
entwickeln. Im Unendlichen reduziert sich hierbei der radiale Anteil auf die asymptotische (regul¨ are) L¨ osung jl (kr) f¨ ur freie Teilchen, bis auf eine Phasenverschiebung δl , die sog. Streuphase, welche die gesamte Information des Streuprozesses im Drehimpuls-l-Sektor beinhaltet: sin(kr − lπ/2 + δl ) . kr Wir haben somit
ikr 2l + 1 eiδl −ilπ/2 r→∞ e e Ψk (x) −→ Al Pl (cos θ) 4π 2ik r l
e−ikr 2l + 1 e−iδl ilπ/2 − Al Pl (cos θ) . e r 4π 2ik r→∞
gl (r) −→
(3.101)
l
Koeffizientenvergleich in den Gleichungen (3.100) und (3.101) liefert 2l + 1 iδl Al = 4π(2l + 1)il eiδl , al = e sin δl . k Damit ergibt sich schließlich folgende Partialwellenzerlegung der Streuamplitude:
382
3. Quantenmechanik
f (θ) =
1 (2l + 1)eiδl sin δl Pl (cos θ) . k l
Aus dieser Darstellung erh¨alt man einen interessanten Zusammenhang zwischen dem totalen Wirkungsquerschnitt und der Streuamplitude, der unter dem Namen Optisches Theorem bekannt ist: 2 1 σ = dΩ|f (θ)|2 = 2 dΩ 4π(2l + 1)eiδl sin δl Yl,0 (θ) k l 4π 1 Imf (θ = 0) . 4π(2l + 1) sin2 δl = = 2 k k l
Demnach berechnet sich der totale Wirkungsquerschnitt aus dem Imagin¨arteil der Streuamplitude in Vorw¨artsrichtung. Um nun die Streuphasen f¨ ur ein gegebenes Streupotential zu berechnen, betrachten wir die radiale Schr¨odinger-Gleichung (3.39) mit und ohne Potential, l(l + 1) 2m ul (r) + k 2 ul (r) = 2 V (r)ul (r) 2 r ¯h l(l + 1) 2 vl (r) − vl (r) + k vl (r) = 0 , r2 wobei wir die L¨ osungen des freien Falls mit vl und die des Streufalls mit ul bezeichnen. Durch Multiplikation der ersten Gleichung mit vl , der zweiten mit ul und anschließender Subtraktion beider Gleichungen folgt 2m d [u (r)vl (r) − vl (r)ul (r)] = 2 V (r)ul (r)vl (r) dr l ¯h bzw. ∞ 2m ∞ [ul (r)vl (r) − vl (r)ul (r)]0 = 2 drV (r)ul (r)vl (r) . (3.102) ¯h ul (r) −
0
Ber¨ ucksichtigen wir das asymptotische Verhalten von ul und vl ,24 r→0:
ul (r), vl (r) ∼ rl+1 ⎧ sin(kr − lπ/2 + δl ) ⎪ ⎪ ⎨ ul (r) = Al (δl ) k r→∞: ⎪ sin(kr − lπ/2) ⎪ ⎩ vl (r) = Al (δl = 0) , k dann folgt aus (3.102) ∞ 2mk 1 drV (r)ul (r)vl (r) eiδl sin δl = − 4π(2l + 1)i2l ¯h2 0 24
Hierbei wird vorausgesetzt, daß lim r2 V (r) = 0 und, wie gehabt, lim rV (r) = 0. r→0
r→∞
3.10 Streutheorie
383
und mit vl (r) = Al (δl = 0)rjl (kr) 2mk 1 eiδl sin δl = − h2 4π(2l + 1)il ¯
∞ drV (r)ul (r)rjl (kr) .
(3.103)
0
Ist V (r) gen¨ ugend klein, so unterscheidet sich ul nur sehr wenig von der odinger-Gleichung, und die Streuphase δl L¨ osung vl der freien radialen Schr¨ liegt in der N¨ ahe von Null. Man kann dann in (3.103) ul durch vl ersetzen und erh¨ alt somit in der Bornschen N¨ aherung (d.h. in 0. Ordnung) ∞ 2mk eiδl sin δl = − 2 drV (r)r2 jl2 (kr) . h ¯ 0
Satz 3.30: Partialwellenzerlegung der Streuamplitude und optisches Theorem Gegeben sei das zentralsymmetrische Streupotential V (r), mit lim r2 V (r) = 0 und lim rV (r) = 0. Dann l¨ aßt sich die Streuamplitude r→∞
r→0
f in der Weise 1 f (θ) = (2l + 1)eiδl sin δl Pl (cos θ) k l
nach den Legendre-Polynomen entwickeln, wobei δl die Streuphasen sind, die die gesamte Information des Streuprozesses in den jeweiligen l-Sektoren beinhalten. F¨ ur sie gilt ∞ 2mk 1 iδl drV (r)ul (r)rjl (kr) . (3.104) e sin δl = − h2 4π(2l + 1)il ¯ 0
Hierbei sind die ul L¨ osungen der radialen Schr¨ odinger-Gleichung in Anwesenheit von V . In der Bornschen N¨ aherung werden diese L¨ osungen durch diejenigen f¨ ur den freien Fall ersetzt, so daß (3.104) u ¨bergeht in e
iδl
2mk sin δl = − 2 h ¯
∞ drV (r)r2 jl2 (kr) . 0
Desweiteren gilt f¨ ur den totalen Wirkungsquerschnitt (optisches Theorem) 1 4π Imf (θ = 0) . σ = dΩ|f (θ)|2 = 2 4π(2l + 1) sin2 δl = k k l
Nehmen wir an, daß das Streupotential auf eine endliche Reichweite r0 begrenzt ist, V (r > r0 ) = 0, dann k¨ onnen wir das unendliche Integral in (3.104) durch ein endliches ersetzen. Ber¨ ucksichtigen wir ferner das asymptotische Verhalten der sph¨ arischen Bessel-Funktionen jl (kr) im Limes k → 0,
384
3. Quantenmechanik
ρl , (2l + 1)!!
ρ→0
jl (ρ) −→
dann geht (3.104) u ¨ber in e
iδl
2mk l+1 sin δl −→ − 2 4π(2l + 1)il ¯h (2l + 1)!! k→0
1
r0 drV (r)ul (r)rl+1 , 0
d.h. bei niedrigen Energien sind die kleinen Partialwellen l = 0, 1, . . . domiur den differentiellen Wirkungsquerschnitt bedeutet dies nant. F¨ dσ k→0 1 2 −→ 2 sin δ0 + 6 sin δ0 sin δ1 cos(δ0 − δ1 ) cos θ dΩ k + 9 sin2 δ1 cos2 θ + . . . . Er ist in f¨ uhrender Ordnung isotrop, d.h. vom Streuwinkel θ unabh¨angig. In der Bornschen N¨ aherung folgt nun f¨ ur die Streuphasen k→0
sin δl ≈ δl ∼ −k 2l+1 .
(3.105)
Wie sich zeigt, gilt dieses Schwellenverhalten f¨ ur eine große Klasse von Potentialen ganz allgemein und nicht nur in der hier betrachteten Bornschen N¨ aherung. 3.10.3 Resonanzstreuung Im allgemeinen bedeutet Resonanzstreuung, daß der differentielle Wirkungsquerschnitt f¨ ur eine gewisse Energie, die sog. Resonanzenergie, von einer bestimmten Partialwelle l = L dominiert wird: dσ dσL 2L + 1 1 2iδL ≈ = e |TL |2 PL2 (cos θ) , TL = eiδL sin δL = −1 . 2 dΩ dΩ k 2i Dies hat offensichtlich zur Voraussetzung, daß die zugeh¨orige Partialwellenamplitude TL an der Resonanzstelle groß wird. Tats¨achlich spricht man im engeren Sinne nur dann von einer Resonanz, wenn die resonante Streuphase δL einen halbzahligen Wert von π durchl¨auft: 1 π , n = 0, 1, . . . δL = n + 2 In Abb. 3.17 ist eine typische Resonanzsituation dargestellt. Nimmt die Energie zu, dann steigt die Streuphase δL rasch von 0 nach π (allgemeiner: von nπ nach (n + 1)π) und durchl¨auft dabei an der Resonanzstelle E0 den Wert π/2. An dieser Stelle wird der Wirkungsquerschnitt maximal. Zur genaueren Untersuchung der Energieabh¨angigkeit des differentiellen Wirkungsquerschnitts in der N¨ ahe einer Resonanzstelle E0 entwickeln wir δL um E0 : δL (E) ≈ δL (E0 ) + (E − E0 )δL (E0 ) .
Bei der Entwicklung der zugeh¨ origen Partialwellenamplitude ist darauf zu achten, daß die Beziehungen e2iδL (E) = 1 und e2iδL (E0 ) = −1 erhalten bleiben. Dies wird durch folgende Entwicklung gew¨ahrleistet:
3.10 Streutheorie
385
δL π
π 2
E
sin2 δL E
E E0 Abb. 3.17. Partialwellenstreuquerschnitt in Zusammenhang mit der zugeh¨ origen Streuphase
e2iδL (E) ≈
(E0 ) eiδL (E0 ) ei(E−E0 )δL (E0 ) 1 + i(E − E0 )δL . (E ) ≈ − −i(E−E )δ −iδ (E ) 0 0 L 1 − i(E − E0 )δL (E0 ) e L 0 e
Es folgt somit TL (E) ≈ −
Γ 2
E − E0 +
iΓ 2
,
1 Γ = , 2 δL (E0 )
und wir erhalten den Satz 3.31: Breit-Wigner-Formel In der N¨ahe einer Resonanzstelle E0 wird der Wirkungsquerschnitt durch den Wirkungsquerschnitt σL der resonanten Partialwelle dominiert. Dieser ist gegeben durch Γ 2 4π(2l + 1) 4π(2l + 1) 2 2 sin δ (E) = σL (E) = l 2 , k2 k2 (E − E0 )2 + Γ 2
mit der Resonanzbreite Γ : Γ 1 . = 2 δL (E0 )
386
3. Quantenmechanik
Im allgemeinen treten Streuresonanzen dann auf, wenn das effektive Potential in der radialen Schr¨odinger-Gleichung – Streupotential plus Zentrifugalbarriere – bei kleinen Abst¨anden stark attraktiv und bei großen Abst¨anden repulsiv wirkt. Betrachten wir z.B. einen tiefen kugelsymmetrischen Potentialtopf, mit 5 ur r < a −V0 f¨ V (r) = , V0 > 0 , 0 f¨ ur r ≥ a ur l > 0 den in Abb. 3.18 gezeigdann hat das effektive Potential Veff f¨ ten Verlauf. Ignorieren wir Tunnelprozesse, so kann ein Teilchen der Energie
Vc (r) ∼ Veff
l(l+1) r2
Vmax E0 r
−V0
V (r)
Abb. 3.18. Effektives Potential (durchgezogene Linie), das sich aus einem tiefen Potentialtopf (gepunktete Linie) und der Zentrifugalbarriere (gestrichelte Linie) zusammensetzt
0 < E0 < Vmax einen gebundenen Zustand innerhalb der attraktiven Region bilden. Da aber nat¨ urlich Tunnelprozesse stattfinden, wird das Teilchen irgendwann nach r → ∞ entkommen. Dementsprechend kann auf der anderen Seite ein freies Teilchen, das vom Unendlichen kommend auf das Potential geschossen wird, die Zentrifugalbarriere durchtunneln und einen metastabilen Zustand innerhalb des attraktiven Bereiches bilden. Bei wachsendem l wird der Zentrifugalterm gr¨oßer, so daß die Wahrscheinlichkeit des Durchtunnelns und damit die Resonanzbreite kleiner wird. Demzufolge w¨achst die Lebensdauer T metastabiler Zust¨ande. Ganz allgemein gilt aufgrund der Heisenbergschen Energie-Zeit-Unsch¨arferelation h ¯ T ∼ . Γ Im Fall l = 0 ist keine repulsive Barriere vorhanden. Ist dann V = Veff rein attraktiv, so sind nur echte gebundene Zust¨ande mit negativer Energie und
3.10 Streutheorie
387
unendlicher Lebensdauer m¨ oglich. Einer Streuresonanz am n¨ achsten kommen hierbei Zust¨ ande mit Energien nahe der Null (siehe Anwendung 53). 3.10.4 Gegenseitige Streuung von Teilchen In einem typischen Streuexperiment beschießt man ein Target, das aus Teilchen des Typs 2 besteht, mit einem monoenergetischen Teilchenstrahl vom Typ 1 und z¨ ahlt die Teilchen eines Typs, z.B. die Teilchen 1, die in eine bestimmte Richtung gestreut werden. Im folgenden wollen wir voraussetzen, daß das Wechselwirkungspotential zwischen den beiden Teilchentypen nur vom Abstand der Teilchen abh¨ angt. Wir haben es dann mit einem ZweiTeilchenproblem zu tun, dessen Hamilton-Operator gegeben ist durch P 21 P2 + 2 + V (x1 − x2 ) . 2m1 2m2 Da keine ¨ außeren Kr¨ afte einwirken, ist die Schwerpunktsbewegung frei und kann durch Einf¨ uhren von Schwerpunkts- und Relativkoordinaten separiert werden (siehe Unterabschn. 3.5.1). Die verbleibende Relativbewegung lautet m 1 m2 ¯h2 , x = x1 − x2 , − ∇2 + V (x) Ψ (x) = EΨ (x) , µ = 2µ m1 + m 2 mit der reduzierten Masse µ und dem Abstandsvektor x der beiden Teilchen. Betrachten wir den Streuprozeß vom Schwerpunktsystem aus, in dem der Schwerpunkt ruht, dann erh¨ alt man die Streuamplitude aus dem asymptotischen Verhalten der Wellenfunktion der Relativbewegung, H=
eikr , r wobei θ und ϕ die Streuwinkel im Schwerpunktsystem bezeichnen. Zur Berechnung der Streuamplitude, des differentiellen Wirkungsquerschnittes und der Partialwellenzerlegung k¨ onnen wir dann die Diskussion in den Unterabschnitten 3.10.1 und 3.10.2 und insbesondere die S¨ atze 3.29 und 3.30 u ¨bernehmen, wenn u ¨berall m durch µ und dΩ durch das Raumwinkelelement dΩ ∗ des Schwerpunktsystems ersetzt wird. F¨ ur die Schwerpunktsimpulse der TeilA∗ E∗ E∗ chen vor (pA∗ 1 , p2 ) und nach der Streuung (p1 , p2 ) ergibt sich das in Abb. 3.19a gezeigte Bild: Die Teilchen 1 und 2 fliegen mit entgegengesetzt gleichen Ψ (x) = eikz + f (θ, ϕ)
y
a
b
x z pA∗ 1
pE 1
pE∗ 1
θL
θ pA∗ 2
pA 1
π−θ pE pE∗ 2 2 Abb. 3.19. Zwei-Teilchenstreuung im Schwerpunktsystem (a) und im Laborsystem (b)
388
3. Quantenmechanik
Anfangsimpulsen pA∗ = −pA∗ aufeinander zu, werden aneinander gestreut 1 2 E∗ und entfernen sich danach voneinander mit den Endimpulsen pE∗ 1 = −p2 . Um vom Schwerpunktsystem zum Laborsystem (Abb. 3.19b) u ¨berzugehen, in dem das Teilchen 2 lange vor der Streuung ruht (pA ussen wir 2 = 0), m¨ uns nach links mit der Geschwindigkeit pA∗ 2 /m2 bewegen. In diesem System erh¨ alt jeder Schwerpunktsimpuls wie im klassischen Fall einen Beitrag in positiver z-Richtung. Die Transformation beider Systeme geschieht in exakt der gleichen Weise, wie es bei der klassischen Zwei-Teilchenstreuung in Unterabschn. 1.5.5 – mit den Ersetzungen χ → θ, θ1 → θL – vorgef¨ uhrt wurde. Unter Verwendung von Satz 1.34 k¨onnen wir somit festhalten: Satz 3.32: Zwei-Teilchenstreuung F¨ ur die Zwei-Teilchenstreuung im Schwerpunktsystem gelten die in Satz 3.29 und 3.30 stehenden Zusammenh¨ange, wenn man u ¨berall die Ersetzungen m → µ und dΩ → dΩ ∗ vornimmt. Der Zusammenhang zwischen den differentiellen Wirkungsquerschnitten im Schwerpunktsystem, dσ/dΩ ∗ , und im Laborsystem, dσ/dΩL , ist gegeben durch 3/2 2 m1 m1 + 1 + 2 m2 cos θ(θL ) m2 dσ dσ = , m1 dΩL dΩ ∗ m2 cos θ(θL ) + 1 mit cos θL =
m1 m2
m1 m2
+ cos θ
2
+1+
1 2m m2
, ϕL = ϕ cos θ
und dΩ ∗ = sin θdθdϕ = Raumwinkelelement im Schwerpunktsystem, Raumwinkelelement im Laborsystem, in das dΩL = sin θL dθL dϕ = die Projektilteilchen gestreut werden. Streuung unterscheidbarer Teilchen. Bei der gegenseitigen Streuung von unterscheidbaren Teilchen gibt dσ = |f (θ, ϕ)|2 dΩ ∗ den differentiellen Wirkungsquerschnitt im Schwerpunktsystem daf¨ ur an, daß Teilchen 1 in Richtung (θ, ϕ) und Teilchen 2 in Richtung (π−θ, ϕ+π) gestreut wird. Dementsprechend ist dσ = |f (π − θ, ϕ + π)|2 dΩ ∗ der differentielle Wirkungsquerschnitt f¨ ur den Fall, daß Teilchen 1 in Richtung (π − θ, ϕ + π) und Teilchen 2 in Richtung (θ, ϕ) gestreut wird. Falls der
3.10 Streutheorie
389
Detektor alle Teilchen nachweist und keinen Unterschied zwischen Teilchen der Sorte 1 und 2 macht, dann sind beide Wirkungsquerschnitte zu addieren, so daß dσ = |f (θ, ϕ)|2 + |f (π − θ, ϕ + π)|2 (3.106) dΩ ∗ den differentiellen Wirkungsquerschnitt f¨ ur die Streuung eines der beiden Teilchen in Richtung (θ, ϕ) angibt. Streuung identischer Spin-0-Bosonen. Bei der Streuung identischer Teilchen ist noch die Symmetrisierungsregel zu ber¨ ucksichtigen. Haben wir es mit identischen Spin-0-Bosonen, z.B. π-Mesonen, zu tun, dann muß die Gesamtwellenfunktion und somit auch ihre asymptotische L¨ osung symmetrisch sein: eikr . r Berechnet man mit dieser symmetrisierten Form die Stromdichten der einfallenden und gestreuten Teilchen, so erh¨ alt man f¨ ur den Wirkungsquerschnitt Ψ (x) −→ eikz + e−ikz + [f (θ, ϕ) + f (π − θ, ϕ + π)] r→∞
dσ = |f (θ, ϕ) + f (π − θ, ϕ + π)|2 . (3.107) dΩ ∗ Man beachte den Unterschied zwischen den Gleichungen (3.106) und (3.107): In (3.106) sind die einzelnen Wirkungsquerschnitte zu addieren, w¨ ahrend man in (3.107) die Streuamplituden zu addieren hat. Streuung identischer Spin-1/2-Fermionen. Betrachten wir schließlich noch die Streuung von identischen Spin-1/2-Fermionen, z.B. Elektronen. Die Gesamtwellenfunktion muß nun antisymmetrisch sein. Solange keine explizit spinabh¨ angigen Terme im Hamilton-Operator auftreten, l¨ aßt sich die Gesamtwellenfunktion aus symmetrisierten und antisymmetrisierten Orts- und Spinwellenfunktionen zusammensetzen: 7 6 eikr Ψ (±) (x, m1 , m2 ) = eikz ± e−ikz + [f (θ, ϕ) ± f (π − θ, ϕ + π)] r S 1 ×χ A (m1 , m2 ) , m1 , m2 = ± . 2 Dabei sind χ(S) (+, +) = χ1 (+)χ2 (+) 1 χ(S) (+, −) = √ (χ1 (+)χ2 (−) + χ1 (−)χ2 (+)) = χ(S) (−, +) 2 (S) χ (−, −) = χ1 (−)χ2 (−) 1 χ(A) (+, −) = √ (χ1 (+)χ2 (−) − χ1 (−)χ2 (+)) = −χ(A) (−, +) 2 die zu den Gesamtspins S = 1 (Triplett) und S = 0 (Singulett) geh¨ orenden Spinoren. Hieraus ergibt sich f¨ ur den differentiellen Wirkungsquerschnitt
390
3. Quantenmechanik
dσ = dΩ ∗
5
|f (θ, ϕ) + f (π − θ, ϕ + π)|2 Triplettzustand |f (θ, ϕ) − f (π − θ, ϕ + π)|2 Singulettzustand .
Sind beide Teilchenstrahlen v¨ollig unpolarisiert, d.h. jede der vier m¨oglichen Spinkonfigurationen hat dasselbe Gewicht, dann ist der Gesamtwirkungsquerschnitt das arithmetische Mittel aus den Wirkungsquerschnitten der drei Triplettzust¨ ande und des einen Singulettzustandes: dσ 3 1 = |f (θ, ϕ) + f (π − θ, ϕ + π)|2 + |f (θ, ϕ) − f (π − θ, ϕ + π)|2 . ∗ dΩ 4 4 Zusammenfassung • Zur Beschreibung von quantenmechanischen Streuprozessen reicht es aus, sich auf die statischen L¨osungen der zugeh¨origen Schr¨odinger-Gleichung zu beschr¨ anken. Die asymptotische Wellenfunktion von Teilchen, die an ein festes Streuzentrum gestreut werden, setzt sich zusammen aus einer einlaufenden ebenen Welle und einer vom Streuzentrum weglaufenden Kugelwelle. Letztere enth¨alt die Streuamplitude; sie umfaßt die gesamte Information des Streuprozesses. • Der differentielle Wirkungsquerschnitt berechnet sich aus den Wahrscheinlichkeitsstromdichten (in Flugrichtung) des einlaufenden und gestreuten Anteils und ist gleich dem Betragsquadrat der Streuamplitude. • Die Berechnung des differentiellen Wirkungsquerschnitts f¨ ur die Coulomb-Streuung f¨ uhrt in der Bornscher N¨ aherung und exakt auf die klassische Rutherfordsche Streuformel. • Bei zentralsymmetrischen Streupotentialen l¨aßt sich der Streuprozeß f¨ ur jeden Drehimpuls-l-Sektor getrennt studieren, indem man die Streuamplitude nach den Legendre-Polynomen entwickelt (Partialwellenzerlegung). Die hierin auftretenden Streuphasen geben die jeweilige Phasenverschiebung der asymptotischen Wellenfunktion gegen¨ uber den L¨ osungen f¨ ur freie Teilchen an. Aus der Partialwellenzerlegung folgt das optische Theorem, nach dem sich der totale Wirkungsquerschnitt aus dem Imagin¨ arteil der Streuamplitude in Vorw¨artsrichtung berechnet. • Resonanzstreuung tritt auf, wenn der differentielle Wirkungsquerschnitt bei einer bestimmten Energie von einer Partialwelle dominiert wird. Die zugeh¨orige Resonanzbreite berechnet sich mit Hilfe der Breit-Wigner-Formel. Im allgemeinen bedeuten Streuresonanzen metastabile Zust¨ande positiver Energie, die sich in dem von der Zentrifugalbarriere abgeschirmten attraktiven Bereich des effektiven Potentials herausbilden.
Anwendungen
391
• Die gegenseitige Streuung von Teilchen l¨ aßt sich wie im klassischen Fall durch Separation der Schwerpunktsbewegung auf eine effektive EinTeilchenstreuung zur¨ uckf¨ uhren. F¨ ur die Zusammenh¨ ange zwischen den differentiellen Wirkungsquerschnitten im Schwerpunkt- und Laborsystem gelten dieselben Beziehungen wie bei der klassischen Streuung. • Weist der Detektor bei der Streuung unterscheidbarer Teilchen beide Teilchensorten nach, so sind die differentiellen Wirkungsquerschnitte f¨ ur die Vorg¨ ange Teilchen 1 → (θ, ϕ), Teilchen 2 → (π − θ, ϕ + π) und umgekehrt zu addieren. Bei der Streuung identischer Teilchen hingegen hat man die zu obigen Vorg¨ angen geh¨ orenden Streuamplituden zu addieren bzw. zu subtrahieren.
Anwendungen 52. Streuung an einer harten Kugel. Wir betrachten die Streuung an einer harten Kugel, die durch das Potential 5 0 f¨ ur r ≤ a V (r) = ∞ f¨ ur r > a dargestellt wird. Man gebe das Verhalten der verschiedenen Streuphasen f¨ ur kleine Energien an. Wie lautet der differentielle und totale Wirkungsquerschnitt f¨ ur den l=0-Sektor? L¨ osung. Die physikalische L¨ osung der radialen Schr¨ odinger-Gleichung (3.38) f¨ ur den ¨ außeren Bereich lautet gl (r) = Al jl (kr) + Bl nl (kr) . Auf der Kugeloberfl¨ ache muß die Wellenfunktion aus Stetigkeitsgr¨ unden verschwinden, d.h. gl (a) = 0 =⇒
Bl jl (ka) . =− Al nl (ka)
Die u are ¨bliche Forderung, daß sich gl bis auf die Streuphase δl auf die regul¨ L¨ osung f¨ ur freie Teilchen reduziert, sin(kr − lπ/2 + δl ) , kr liefert den gew¨ unschten Zusammenhang f¨ u r δl : r→∞
gl (r) −→
Al sin(kr − lπ/2) + Bl cos(kr − lπ/2) = Cl sin(kr − lπ/2 + δl ) = Cl [sin(kr − lπ/2) cos δl + cos(kr − lπ/2) sin δl ]
392
3. Quantenmechanik
=⇒ tan δl = −
jl (ka) . nl (ka)
Beschr¨ anken wir uns auf kleine Energien, dann gilt k→0
jl (ka) ≈
k→0 (2l − 1)!! (ka)l , , nl (ka) ≈ (2l + 1)!! (ka)l+1
und es folgt das bereits in (3.105) erw¨ahnte Schwellenverhalten k→0
δl ≈ tan δl ≈ −
(2l − 1)!! (ka)2l+1 , (2l + 1)!!
was mit der Erwartung u ¨bereinstimmt, daß bei kleinen Energien die Streuung in h¨ oheren l-Sektoren vernachl¨assigt werden kann. F¨ ur l = 0 folgt unter Verwendung von Satz 3.30 ⎧ 1 ⎪ ⎪ f0 (θ) = − e−ika sin ka ⎪ ⎪ k ⎪ ⎪ ⎨ 2 sin ka δ0 = arctan − = −ka =⇒ dσ0 = sin ka ⎪ cos ka dΩ k2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ σ0 = 4π sin2 ka . k2 53. Streuung am kugelsymmetrischen Potentialtopf. Man betrachte die s-Wellen-Streuung an einem kugelsymmetrischen Potentialtopf der Form 5 −V0 f¨ ur r < a V (r) = , V0 > 0 . 0 f¨ ur r ≥ a Es ist zu zeigen, daß f¨ ur kleine Teilchenenergien die Streuphase δ0 resonant ist, wenn die Wellenzahl f¨ ur den inneren Bereich die Werte n + 12 π k1 = , n = 0, 1, . . . a annimmt. Wie groß sind die zugeh¨origen Resonanzbreiten? L¨ osung. Wie in Unterabschn. 3.5.4 gezeigt wurde, lautet die L¨osung der radialen Schr¨ odinger-Gleichung f¨ ur den kugelsymmetrischen Potentialtopf im ungebundenen Fall (E > 0)
⎧ 2m(E + V0 ) ⎪ ⎪ A rj (k r) , k = f¨ ur r < a ⎨ l l 1 1 2 h ¯ ul (r) =
⎪ ⎪ ⎩ Bl [rjl (k2 r) cos δl + rnl (k2 r) sin δl ] , k2 = 2mE f¨ ur r ≥ a . ¯h2 Im Unendlichen geht sie u unschte asymptotische Form ¨ber in die gew¨ ul (r)
r→∞
∼ =
cos(k2 r − lπ/2) sin(k2 r − lπ/2) cos δl + sin δl k2 k2 sin(k2 r + lπ/2 + δl ) , k2
Anwendungen
393
so daß δl in der Tat die Streuphasen bezeichnen. Beschr¨ anken wir uns nun auf kleine Teilchenenergien, dann findet die Streuung bevorzugt in s-Zust¨ anden (l = 0) statt. Hierf¨ ur kennen wir bereits den Zusammenhang zwischen Energie und Streuphase (vgl. (3.43)): k2 tan k1 a k1 k2 →0 k2 k2 tan k1 a − k2 a ≈ arctan tan k1 a . =⇒ δ0 = arctan k1 k1
tan(k2 a + δ0 ) =
Man erkennt hieraus, daß die Resonanzenergien bei 2 h2 n + 12 π 2 ¯ n + 21 π bzw. En = k1,n = − V0 2ma2 a liegen. Zur Bestimmung der zugeh¨ origen Resonanzbreiten hat man die Abuhrt zu leitung von δ0 an der Stelle En zu berechnen. Dies f¨ K2 K2 2 a) + k a 1 − tan k a tan(k 1 1 K1 1 K1 δ0 (En ) = 2 2 2 1− K tan k a 1 K1 k1,2 =k1,2 (En )
=
ak1 (En )k1 (En )
k2 (En ) ma = 2 h k2 (En ) ¯ =⇒
Γn 1 ¯ 2 k2 (En ) h = = . 2 δ0 (En ) ma
Ist V0 = h ¯ 2 π 2 /(8ma2 ), dann entspricht der niedrigste resonante s-Zustand eiaßt sich als ein ner Resonanzenergie von E0 = 0. Dieser Null-Energiezustand l¨ pseudo-metastabiler gebundener Zustand in einem rein attraktiven Potential interpretieren und kommt einer echten Streuresonanz am n¨ achsten. Wird der Potentialtopf immer weiter abgesenkt, dann entsteht bei V0 = 9¯ h2 π 2 /(8ma2 ) ein zweiter Null-Energiezustand usw. Die jeweils darauf folgenden Zust¨ ande mit gr¨ oßeren Resonanzenergien entsprechen virtuellen Zust¨ anden, die mit echten Streuresonanzen wenig zu tun haben.
4. Statistische Physik und Thermodynamik
Das Fundament der theoretischen Beschreibung makroskopischer Systeme (Gase, Fl¨ ussigkeiten und Festk¨ orper) in der heute vorliegenden Form wurde im 18. Jahrhundert gelegt. Die damals und in der Folgezeit von Rumford, Davy, Mayer, Joule u.v.a. empirisch gefundenen Gesetze bilden auch heute noch die Grundlage der Thermodynamik, die durch Lord Kelvin 1850 erstmals in konsistenter Darstellung formuliert wurde. Etwa um diese Zeit begann sich die Meinung durchzusetzen, daß Materie Substrukur in Form von Atomen und Molek¨ ulen besitzt, und man fing an, makroskopische Systeme mikroskopisch zu untersuchen. Die Entwicklung der Quantenmechanik um 1920 lieferte schließlich den ad¨ aquaten Rahmen f¨ ur eine realistische mikroskopische Beschreibung solcher Systeme. Obwohl heute die mikroskopischen Wechselwirkungsmechanismen zwischen den einzelnen Teilchen eines Systems in Form von quantenmechanischen bzw. mechanischen Gesetzen prinzipiell verstanden sind, so ist es dennoch aus folgenden Gr¨ unden nicht m¨ oglich, diese ohne zus¨ atzliche statistische Annahmen konsequent auf ein makroskopisches System anzuwenden: • Zur Festlegung des Systemzustandes m¨ ußte man gr¨ oßenordnungsm¨ aßig etwa 1023 Freiheitsgrade bestimmen, was nicht nur praktisch, sondern aufgrund des Heisenbergschen Unsch¨ arfeprinzips auch theoretisch unm¨ oglich ist. • Selbst wenn sie bekannt w¨ aren und man die Bewegungsgleichungen f¨ ur alle Teilchen im System hinschreiben k¨ onnte, w¨ are kein Computer in der Lage, diese in einer akzeptablen Zeit zu l¨ osen. • Aufgrund der immens großen Teilchenzahlen treten qualitativ neuartige Effekte auf, die im Rahmen einer rein deterministischen Beschreibung ein sehr tiefes, u ¨ber klassische Mechanik und Quantenmechanik hinausgehendes Verst¨ andnis der Wechselwirkung zwischen den einzelnen Teilchen erfordern. Ein Beispiel hierf¨ ur ist die abrupte Kondensation eines Gases zum fl¨ ussigen Zustand mit qualitativ sehr verschiedenen Eigenschaften. Nun wissen wir allerdings aus eigener Erfahrung, daß es zur makroskopischen Beschreibung von Systemen oftmals garnicht notwendig ist, den exakten mikroskopischen Zustand des Systems festzulegen und in der Zeit zu verfolgen. Betrachtet man etwa ein Gas in einem Beh¨ alter, dann ¨ andert sich ohne
396
4. Statistische Physik und Thermodynamik
außere Einwirkung seine Temperatur und sein Druck nicht, obwohl sein Mi¨ krozustand laufend wechselt. Diese Tatsache bildet den Ausgangspunkt der statistischen Physik. Dort wird das Bild eines einzigen zeitlich propagierenden Systems durch ein anderes Bild ersetzt, in dem viele fiktive gleichartige makroskopische Systeme in unterschiedlichen mikroskopischen Zust¨anden und mit unterschiedlichen Antreff- oder Besetzungswahrscheinlichkeiten koexistieren. In diesem Kapitel wird die statistische Physik und die Thermodynamik behandelt. Wir betonen, daß sich diese Theorien ausschließlich auf Gleichgewichtssysteme beziehen, welche sich durch zeitlich konstante makroskopische Eigenschaften auszeichnen. Die zeitliche Entwicklung, die von Ungleichgewichtszust¨ anden zu Gleichgewichtszust¨anden f¨ uhrt, bleibt hierbei unber¨ ucksichtigt und ist Gegenstand der kinetischen Theorie. Da in der Regel Systeme mit sehr großer Teilchenzahl (N ≈ 1023 ) und sehr großem Volumen (V ≈ 1023 Molekularvolumina) untersucht werden, betrachten wir oftmals den thermodynamischen Limes, der durch folgende Grenzwertbildung definiert ist: N = const . V Der erste Abschnitt dieses Kapitels behandelt die grundlegenden Ideen der statistischen Physik. Es wird dort das probabilistische Konzept des statistischen Ensembles vorgestellt und dessen zeitliche Entwicklung im Hinblick auf die Klassifizierung von Gleichgewichtssystemen diskutiert. Die n¨ achsten beiden Abschnitte 4.2 und 4.3 besch¨aftigen sich mit drei speziellen Ensemble-Typen, n¨amlich dem mikrokanonischen, kanonischen und großkanonischen Ensemble. Sie alle beschreiben Gleichgewichtssysteme mit unterschiedlichen, von außen vorgegebenen Randbedingungen. Im Zusammenhang mit dem mikrokanonischen Ensemble wird der Begriff der Entropie eingef¨ uhrt, der sowohl in der statistischen Physik als auch in der Thermodynamik von fundamentaler Bedeutung ist. Als ein wesentliches Resultat dieser Abschnitte wird sich herausstellen, daß alle drei Ensembles im thermodynamischen Limes ¨ aquivalente Beschreibungen liefern. Neben dem statistischen Zugang zur Entropie gibt es den informationstheoretischen Ansatz, in dem ein System vom Standpunkt des u ¨ber ihn bekannten Informationsgrades betrachtet wird. Dies ist Gegenstand von Abschn. 4.4. Der hier entwickelte Entropie-Begriff stellt ein Maß f¨ ur die Unkenntnis u ¨ber ein System dar, und wir werden sehen, daß er ¨aquivalent zur statistischen Entropie-Definition ist. Abschnitt 4.5 behandelt die ph¨anomenologische Theorie der Thermodynamik. Ausgehend von den drei thermodynamischen Haupts¨atzen werden Gleichgewichts- und Stabilit¨atsbedingungen offener Systeme unter Einf¨ uhrung geeigneter thermodynamischer Potentiale sowie die Beschreibung von Zustands¨ anderungen mit Hilfe von thermischen Koeffizienten diskutiert. Desweiteren betrachten wir W¨armekraftmaschinen unter dem Gesichtspunkt ihrer prinzipiellen Realisierbarkeit. N →∞, V →∞,
4.1 Grundlagen der statistischen Physik
397
In Abschn. 4.6 besch¨ aftigen wir uns mit der klassischen Maxwell-Boltzmann-Statistik. Hierunter versteht man die statistische Behandlung von Systemen, ausgehend von der klassischen Hamilton-Funktion oder auch vom quantenmechanischen Hamilton-Operator, wobei allerdings die Quantennatur der Teilchen, also ihr bosonischer bzw. fermionischer Charakter unber¨ ucksichtigt bleibt. Neben der Diskussion des echten klassischen“ Grenzfalls so” ¨ wie der Virial- und Aquipartitionstheoreme f¨ ur echte klassische“ Systeme ” besprechen wir das harmonische Oszillatorsystem sowie das ideale Spinsystem in verschiedenen Ensembles. Der letzte Abschnitt dieses Kapitels widmet sich der Quantenstatistik, welche die vollst¨andige quantenmechanische Beschreibung statistischer Systeme mit Ber¨ ucksichtigung des quantenmechanischen Teilchencharakters liefert. Neben einer allgemeinen Gegen¨ uberstellung der Fermi-Dirac-, BoseEinstein- und Maxwell-Boltzmann-Statistik interessieren wir uns insbesondere f¨ ur die Zustandsgleichungen des idealen Fermi- und Bose-Gases. Dies f¨ uhrt uns auf interessante Effekte, die in der Maxwell-Boltzmann-Statistik nicht auftreten. Es sei betont, daß wir in diesem Kapitel ausschließlich Gleichgewichtszust¨ande betrachten. F¨ ur die Behandlung von Nicht-Gleichgewichtszust¨ anden (Phasen¨ uberg¨ ange, Kinetik etc.) verweisen wir auf die im Anhang angegebene Literaturliste. Anmerkung. Im gesamten Kapitel 4 werden wir aus Bequemlichkeitsgr¨ unden f¨ ur partielle Ableitungen einer Funktion f oftmals die Klammerschreibweise ∂f ∂E V,N verwenden. Sie bedeutet, daß f – als Funktion der Variablen E, V und N – bei festgehaltenem V und N nach E abgeleitet wird. Werden in dieser Funktion die Variablen E, V und N in neue Variablen, z.B. T , P und µ, transformiert, dann verwenden wir hierf¨ ur ebenfalls die bequeme und unmathematische Schreibweise f (T, P, µ), obwohl f (T, P, µ) einen anderen funktionalen Zusammenhang darstellt als f (E, V, N ).
4.1 Grundlagen der statistischen Physik Die statistische Physik besch¨ aftigt sich mit der Beschreibung makroskopischer Systeme, indem sie die mikroskopischen physikalischen Grundgesetze von Teilchenwechselwirkungen mit einem statistischen Prinzip verbindet und so in der Lage ist, Aussagen u ¨ber das makroskopische Verhalten solcher Systeme zu machen. Insofern kann sie als eine fundamentale Theorie angesehen werden, welche die tieferen physikalischen Begr¨ undungen f¨ ur die rein ph¨ anomenologisch gefundenen Grundgesetze der Thermodynamik liefert.
398
4. Statistische Physik und Thermodynamik
In diesem Abschnitt werden die grundlegenden Ideen der statistischen ¨ Physik erl¨ autert. Die entscheidende Uberlegung besteht darin, das Bild eines zeitlich propagierenden Mikrozustandes eines Systems durch ein anderes, statistisches Bild zu ersetzen, wo alle m¨oglichen Mikrozust¨ande gleichzeitig existieren und mit ihren relativen Antreffwahrscheinlichkeiten gewichtet werden. Dieses Ensemble propagiert dann als ganzes durch den Phasenraum und wird klassisch durch seine Dichte bzw. quantenmechanisch durch seinen Dichteoperator charakterisiert. Wir diskutieren ferner die Bedingungen, die solche Dichten im klassischen und quantenmechanischen Fall erf¨ ullen m¨ ussen, damit sie Gleichgewichtssysteme beschreiben, welche sich durch zeitunabh¨angige makroskopische Eigenschaften auszeichnen. 4.1.1 Zust¨ ande, Phasenraum, Ensembles und Wahrscheinlichkeiten Innerhalb der statistischen Physik unterscheidet man zwei Arten von Zust¨anden zur Beschreibung physikalischer Systeme, n¨amlich Mikrozust¨ ande und Makrozust¨ ande. Der Mikrozustand eines Systems enth¨alt die detaillierte Information u ¨ber die Bewegungszust¨ande aller Teilchen. Im allgemeinen sind die Zust¨ ande der Teilchen und deren gegenseitige Wechselwirkung durch die Gesetze der Quantenmechanik determiniert. Das System kann demnach durch einen quantenmechanischen Zustandsvektor | ψ(n1 , . . . , nf ) repr¨asentiert werden, wobei n1 , . . . , nf einen systemspezifischen Satz von f Quantenzahlen bedeuten. Diese Beschreibung ist in dem Sinne vollst¨andig, daß bei gegebenem Zustandsvektor | ψ zu einer festen Zeit seine zeitliche Propagation durch die quantenmechanischen Bewegungsgleichungen eindeutig determiniert ist. Numeriert man nun alle m¨oglichen Quantenzust¨ande des Systems in geeigneter Weise durch (r = 1, 2, 3, . . .), dann ist ein spezieller Mikrozustand des Systems durch Angabe des Index r eindeutig festgelegt: Quantenmechanischer Mikrozustand: r = (n1 , . . . , nf ) .
(4.1)
Obwohl i.a. die Quantenmechanik den ad¨aquaten Rahmen zur Spezifikation eines Systems liefert, stellt die klassische Beschreibung oftmals eine gute und n¨ utzliche Approximation dar. In diesem Fall wird der vollst¨andige Mikrozustand eines N -Teilchensystems durch Vorgabe der 3N generalisierten Koordinaten und 3N generalisierten Impulse aller Teilchen zu einem festen Zeitpunkt festgelegt. Die zeitliche Entwicklung des Systems ist dann durch die klassischen Bewegungsgleichungen ebenfalls eindeutig bestimmt. Klassischer Mikrozustand: r = (q1 , . . . , q3N , p1 , . . . , p3N ) .
(4.2)
Ein n¨ utzliches Konzept zur Beschreibung klassischer Systeme ist der Phasenraum, der durch die 6N generalisierten Koordinaten und Impulse aufgespannt wird. Hierbei entspricht die Vorgabe der 6N Teilchenwerte der Spezifikation eines Punktes im Phasenraum. Nun stehen im Gegensatz zu (4.1)
4.1 Grundlagen der statistischen Physik
399
auf der rechten Seite von (4.2) kontinuierliche Gr¨ oßen. F¨ ur eine statistischphysikalische Behandlung ist es jedoch notwendig, die Zust¨ ande r abz¨ ahlen zu k¨onnen. Es ist deshalb sinnvoll, den Phasenraum zu diskretisieren, also in Zellen zu unterteilen, die jeweils genau einen Mikrozustand aufnehmen k¨ onnen. Die exakte Zellgr¨ oße l¨ aßt sich hierbei nur u ¨ber den Vergleich mit der Quantenmechanik bestimmen. Die Untersuchung einfacher Quantensysteme (z.B. harmonischer Oszillator, Anwendung 54) zeigt, daß ein quantenmechanischer Zustand einem Phasenraumvolumen der Gr¨ oße (2π¯ h)3N = h3N entspricht. Wir k¨ onnen uns deshalb den Phasenraum in Zellen mit der Zellgr¨ oße = h3N zerlegt denken. Numeriert man nun diese Zellen geeignet durch (r = 1, 2, . . .), dann l¨ aßt sich ein klassischer Mikrozustand ebenfalls durch Angabe des diskreten Index r eindeutig festlegen. Die zweite Art einen Systemzustand zu beschreiben, ist der Makrozustand. Er enth¨alt lediglich die eigentlich interessanten makroskopischen Kenngr¨ oßen, wie z.B. Druck oder Temperatur. Im Prinzip sollte sich der Makrozustand eines Systems aus seinem Mikrozustand eindeutig ergeben. Wie jedoch bereits in der Einleitung erw¨ ahnt wurde, ist es bei einer Zahl von etwa 1023 Teilchen weder m¨ oglich noch sinnvoll, den exakten Mikrozustand eines Systems festzulegen und zu verfolgen. Aus den gleichen Gr¨ unden ist es uns unm¨ oglich, den Vorgang einer Messung in einer mikroskopischen Rechnung zu verfolgen, denn er bedeutet ja die Mittelung u ¨ber einen angemessenen Teil der zeitlichen Propagation des Mikrozustandes bzw. der zugeh¨ origen Phasenraumtrajektorie. In der von Gibbs um 1900 entwickelten Ensemble-Theorie wird nun das Bild eines zeitlich propagierenden Mikrozustandes durch ein anderes Bild ersetzt, wo s¨ amtliche Mikrozust¨ ande, die ein System im Laufe der Zeit durchl¨auft, zu einer festen Zeit koexistieren und jeweils die mikroskopische Ausgangssituationen f¨ ur sehr viele gleichartige makroskopische Systeme darstellen. Diese fiktiven Systeme bilden ein statistisches Ensemble, dessen Mitglieder unabh¨ angig voneinander in der Zeit propagieren und nicht miteinander wechselwirken. Aus klassischer Sicht entspricht dies der Koexistenz aller, dem betrachteten System zug¨ anglichen Phasenraumpunkte, die man zu einer Phasenraumtrajektorie zusammenfaßt. Dieses Ensemble-Bild ist die entscheidende Grundlage der statistischen Physik, welche auf folgenden zwei fundamentalen Annahmen beruht: ¨ Die erste Annahme ist die Aquivalenz von Zeitmittel und Ensemble-Mittel eines makroskopischen Systems im statistischen Gleichgewicht. Hierbei versteht man unter dem Begriff statistisches Gleichgewicht“ einen Zustand, ” in dem Messungen makroskopischer Gr¨ oßen, wie etwa Druck oder Temperatur zeitunabh¨ angig sind. Betrachten wir zum genaueren Verst¨ andnis ein Gas, das in einem Volumen eingeschlossen ist. Wird dieses System von außen eine Zeit lang erhitzt, dann ist intuitiv klar, daß sich das System unmittelbar nach dem Erhitzen in keinem Gleichgewichtszustand befindet. Erfah-
400
4. Statistische Physik und Thermodynamik
rungsgem¨ aß wird sich jedoch nach einer f¨ ur das System charakteristischen Zeit, der sog. Relaxationszeit, erneut ein Gleichgewichtszustand einstellen, in dem das Gas seine urspr¨ ungliche Temperatur wieder erreicht hat. In der Phasenraum-Terminologie impliziert die Gleichsetzung von Zeitmittel und Ensemble-Mittel, daß die Phasenraumtrajektorie des betrachteten Systems alle, mit der systemspezifischen Physik im Einklang stehenden Phasenraumalt bzw. daß jeder m¨ogliche Mikrozustand nach unendlich langer punkte enth¨ Zeit durchlaufen wird (Ergodenhypothese).1 Der Begriff statistisches Gleich” gewicht“ bedeutet, daß sich die Phasenraumtrajektorie (bzw. Phasenraumdichte) im Laufe der Zeit nicht ¨andert (Abb. 4.1). p
p
q p
q p
q q t2 > t 1 t1 Abb. 4.1. Zeitliche Entwicklung der Phasenraumtrajektorie eines Ungleichgewichtssystems (oben) und eines Gleichgewichtssystems (unten)
Innerhalb des Ensemble-Bildes erscheint es nun plausibel, anzunehmen, daß keines der im Ensemble vorkommenden Systeme gegen¨ uber anderen ausgezeichnet ist. Dies ist die zweite grundlegende Annahme der statistischen Physik. Satz 4.1: Grundlegende Postulate der statistischen Physik 1. Postulat: In einem abgeschlossenen System im Gleichgewicht sind Zeitmittel und Ensemble-Mittel ¨aquivalent. 2. Postulat: Die Wahrscheinlichkeit, ein zuf¨allig gew¨ahltes Element aus dem Ensemble zu einem bestimmten Mikrozustand zu finden, ist proportio1
Es ist bekannt, daß es auch nichtergodische Systeme gibt. Diese werden im weiteren jedoch nicht betrachtet.
4.1 Grundlagen der statistischen Physik
401
nal zur Anzahl der Elemente des Ensembles in eben diesem Mikrozustand. Anders ausgedr¨ uckt: Jeder, im Ensemble vorkommende Mikrozustand ist gleichwahrscheinlich (Postulat der gleichen a priori Wahrscheinlichkeiten). Wir betonen, daß es f¨ ur diese Postulate keine tiefere Begr¨ undung gibt; sie ¨ werden a posteriori gerechtfertigt, indem man Ubereinstimmung mit den aus ihnen abgeleiteten Resultaten und experimentellen Befunden feststellt. In ihnen dr¨ uckt sich der probabilistische Charakter der statistischen Physik aus: Es interessiert nicht die detaillierte Struktur eines Mikrozustandes, sondern lediglich die Anzahl der verschiedenen m¨ oglichen Mikrozust¨ ande innerhalb des statistischen Ensembles. In der Regel kennt man einige Eigenschaften des zu untersuchenden Systems. Zum Beispiel k¨ onnte die Gesamtenergie vorgegeben sein. Das System kann dann nur in einem der Mikrozust¨ ande sein, die mit dieser Gesamtenergie vertr¨ aglich sind (zug¨ angliche Mikrozust¨ ande). In diesem Fall best¨ unde das statistische Ensemble aus einer Vielzahl makroskopischer Systeme, mit eben dieser Gesamtenergie. Der Makrozustand eines Systems ist also durch die Besetzungswahrscheinlichkeiten Pr der zug¨ anglichen Mikrozust¨ ande eindeutig festgelegt: Makrozustand: {Pr } = (P1 , P2 , . . .) . Obige zwei Hypothesen lassen sich deshalb wie folgt zusammenfassen: Makroskopische Gr¨ oßen eines Gleichgewichtssystems sind durch ihre EnsembleMittel aller zug¨ anglichen Mikrozust¨ ande gegeben, wobei jeder Mikrozustand mit seiner relativen Besetzungswahrscheinlichkeit gewichtet wird. Satz 4.2: Ensemble-Mittel Sei Pr die Wahrscheinlichkeit, ein Gleichgewichtssystem in dem Mikrozustand zu finden, in welchem die makroskopische Gr¨ oße A den station¨ aren Wert Ar annimmt. Dann ist das Ensemble-Mittel A von A Pr A r , (4.3) A= r
wobei f¨ ur die Pr folgende Normierungsbedingung gilt: Pr = 1 , 0 ≤ Pr ≤ 1 . r
Die Summe in (4.3) ist u anglichen Mikrozust¨ ande zu nehmen, ¨ber alle zug¨ wobei je nach Wahl von A zu definieren ist, was zug¨ anglich“ bedeutet. Des” weiteren setzt sie eine große Zahl M gleichartiger Systeme voraus, von denen Mr im Mikrozustand r sind: Pr =
lim
Mr
M hinreichend groß M
.
402
4. Statistische Physik und Thermodynamik
Aus (4.3) erkennen wir ferner, daß h¨ochstens solche Verteilungen zu zeitunabh¨ angigen Ensemble-Mitteln f¨ uhren, f¨ ur die gilt: dPr /dt = 0. 4.1.2 Klassische statistische Physik: Wahrscheinlichkeitsdichte Das Ziel der statistischen Physik ist die Bestimmung der Anzahl von Ensemble-Mitgliedern in verschiedenen Mikrozust¨anden, also in verschiedenen Regionen des Phasenraums. Setzen wir voraus, daß die Zahl M der Elemente im Ensemble sehr groß ist, dann l¨aßt sich das betrachtete physikalische System durch eine Wahrscheinlichkeitsdichte ρ beschreiben, die angibt, wie die M Elemente im Phasenraum verteilt sind. Sei dΓ = dq1 · · · dq3N dp1 · · · dp3N ein Volumenelement des Phasenraums, dann enth¨alt dieses Volumen gerade 1 ρ(q, p, t)dΓ h3N Elemente. Entsprechend ist die Wahrscheinlichkeit, daß ein zuf¨allig ausgew¨ ahlter Phasenraumpunkt aus dem Volumenelement dΓ entstammt, gegeben durch dM =
dM 1 ρdΓ = 3N . M h M Die Gesamtzahl der Elemente ist nat¨ urlich 1 M = dM = 3N dΓ ρ(q, p, t) . h Im weiteren Verlauf wird stets davon ausgegangen, daß die Phasenraumdichte auf die Gesamtzahl M der Elemente normiert ist. Das Ensemble-Mittel einer klassischen Observablen A(q, p) ist dann 1 dΓ ρ(q, p, t)A(q, p) . (4.4) A = 3N h Nimmt man desweiteren an, daß A keine explizite Zeitabh¨angigkeit besitzt, wie es f¨ ur abgeschlossene Systeme sicherlich der Fall ist, so erkennt man anhand von (4.4) abermals, daß nur solche Verteilungen zu zeitunabh¨angigen Mittelwerten f¨ uhren, f¨ ur die gilt: ∂ρ/∂t = 0. 4.1.3 Quantenstatistische Physik: Dichteoperator In der Quantenmechanik werden Observable durch hermitesche Operatoren A repr¨ asentiert, und Messungen von A f¨ uhren auf die Erwartungswerte A = ψ| A |ψ .
(4.5)
Ein quantenmechanischer Zustand wird durch die Messung eines vollst¨andigen Satzes kommutierender Observablen pr¨apariert. Solche reinen Zust¨ ande
4.1 Grundlagen der statistischen Physik
403
werden durch Hilbert-Vektoren in einem komplexen Hilbert-Raum beschrieben. Im allgemeinen sind reine Zust¨ ande jedoch eine Idealisierung. Insbesondere ist es f¨ ur sehr große Systeme nicht m¨ oglich, eine vollst¨ andige Pr¨ aparation durchzuf¨ uhren. Der allgemeine Fall des gemischten Zustandes liegt vor, wenn der Satz von gemessenen Observablen nicht vollst¨ andig ist. In diesem Fall ist der Zustand nicht mehr durch einen Hilbert-Vektor beschreibbar. Man anden | ψr zusammen mit betrachtet deshalb ein Ensemble von reinen Zust¨ ihren relativen Besetzungswahrscheinlichkeiten Pr . Nach (4.3) und (4.5) gilt f¨ ur das quantenmechanische Ensemble-Mittel2 A= Pr ψr | A |ψr , r
wobei zu beachten ist, daß die zwei Mittelungsprozeduren in dieser Gleichung fundamental verschieden sind. Die quantenmechanische Mittelung f¨ uhrt zu den bekannten Interferenzeffekten innerhalb der Quantentheorie. Dagegen ist die Mittelung u ¨ber die Elemente des Ensembles eine Mittelung u ¨ber inkoh¨arente Zust¨ande | ψr , so daß hierbei keine Interferenzeffekte auftreten k¨onnen (siehe Anwendung 55). Nehmen wir nun an, die Zust¨ ande | ψr seien normiert (aber nicht notwendig orthogonal). Dann k¨ onnen wir A in folgender Weise nach einer vollst¨ andigen Orthonormalbasis | ui , mit | ui ui | = 1 i
entwickeln: A = ψr | uj uj | A |ui ui | ψr Pr r,i,j
=
5 i,j
=
Pr ui | ψr ψr | uj uj | A |ui
r
ρij Aji = tr(ρA) .
i,j
Hierbei bezeichnen ρ= | ψ r Pr ψ r | r
den Dichteoperator und Aji = uj | A |ui , ρij =
Pr ui | ψr ψr | uj = ui | ρ |uj
r
die Matrixelemente von A bzw. ρ in der u-Darstellung. Folgende Eigenschaften lassen sich f¨ ur ρ feststellen: • ρ ist hermitesch.
2
Wir bezeichnen im folgenden mit A die kombinierte Mittelung aus quantenmechanischem Erwartungswert und Ensemble-Mittel.
404
4. Statistische Physik und Thermodynamik
• Sind W (α, ψr ) und W (α, ρ) die Wahrscheinlichkeiten daf¨ ur, bei einer Messung der Observablen A an einem System im reinen Zustand | ψr bzw. in dem durch ρ charakterisierten gemischten Zustand den Eigenwert α zu messen, dann gilt (vgl. (3.5)) W (α, ρ) = Pr W (α, ψr ) = Pr ψr | P α |ψr = tr(ρP α ) , r
r
wobei P α der Projektionsoperator auf den Eigenraum von A zum Eigenwert α ist. • ρ ist normiert: Pr = 1 . tr(ρ) = r
• ρ ist positiv definit, denn f¨ ur jedes | v gilt v| ρ |v = Pr | v| ψr |2 ≥ 0 . v| ψr Pr ψr | v = r
r
ρ ist also ein positiv definiter hermitescher Operator, dessen vollst¨andig diskretes Eigenwertspektrum zwischen 0 und 1 liegt. Satz 4.3: Dichteoperator Ein quantenmechanisches statistisches System wird durch den hermiteschen Dichteoperator ρ= | ψr Pr ψr | , tr(ρ) = 1 r
vollst¨ andig beschrieben. Hierbei ist die Summe u ¨ber alle reinen Zust¨ande | ψr zu nehmen. Die Wahrscheinlichkeit, bei einer Messung der Observablen A den Eigenwert α zu finden, ist W (α, ρ) = tr(ρP α ) . Der Erwartungswert von A ist der Ensemble-Mittelwert A = tr(ρA) . Der obige Formalismus kann auch auf reine Zust¨ande angewandt werden. Weiß man mit Sicherheit, daß sich das System im reinen Zustand | ψ befindet, so reduziert sich ρ auf den Projektionsoperator ρ = P ψ = | ψ ψ| , und man erh¨ alt
ρ2 = ρ =⇒ tr ρ2 = 1 .
Ist umgekehrt ρ2 = ρ, dann k¨onnen wir schreiben:
4.1 Grundlagen der statistischen Physik
ρ2 =
| ψ r Pr ψ r | ψ m Pm ψ m | =
r,m
=
405
Pr2 | ψr ψr |
r
Pr | ψ r ψ r | = ρ .
r
Da die Wahrscheinlichkeiten Pr normiert sind, kann die Bedingung Pr2 = Pr f¨ ur alle r nur dann erf¨ ullt werden, wenn ein Pr den Wert 1 annimmt und alle anderen identisch verschwinden. Die Bedingung ρ2 = ρ bzw. tr ρ2 = 1 ur dar, daß ρ stellt also ein notwendiges und hinreichendes Kriterium daf¨ einen reinen Zustand beschreibt. Quantenmechanische Messung eines statistischen Systems. In Unterabschn. 3.2.3 sind wir ausf¨ uhrlich auf den Prozeß der Messung an reinen Zust¨ anden eingegangen. Wird an einem, im reinen und normierten Zustand | ψ befindlichen System eine Messung der Observablen A ausgef¨ uhrt, dann befindet sich dieses System unmittelbar nach der Messung mit einer Wahrscheinlichkeit von ψ| P α |ψ im normierten Zustand √ P α | ψ . Im
ψ|P α |ψ
gemischten Fall ist daher der Dichteoperator nach der Messung mit einer Wahrscheinlichkeit von Pr gegeben durch P | ψ ψ| P α α ρr = ψ| P α |ψ . ψ| P α |ψ ψ| P α |ψ α Der volle statistische Operator lautet somit P α ρP α . ρ = Pr ρr = α
r
Satz 4.4: Quantenmechanische Messung und Dichteoperator Der Dichteoperator eines gemischten Zustandes sei vor der Messung der Observablen A durch ρ gegeben. Unmittelbar nach der Messung wird das System dann durch den Dichteoperator ρ = P α ρP α α
beschrieben. Die Summe l¨ auft u ¨ber alle Eigenwerte α von A.
4.1.4 Zeitliche Entwicklung eines Ensembles Es wurde bereits festgestellt, daß die klassische bzw. quantenmechanische Bedingung ∂ρ/∂t = 0 notwendig ist, damit Ensemble-Mittelwerte zeitunabh¨angig sind, wie wir es f¨ ur Systeme im Gleichgewicht voraussetzen. In diesem Unterabschnitt besch¨ aftigen wir uns mit der allgemeinen Zeitabh¨ angigkeit der klassischen Wahrscheinlichkeitsdichte und des quantenmechanischen
406
4. Statistische Physik und Thermodynamik
Dichteoperators f¨ ur physikalische Systeme. Wir leiten f¨ ur diese Gr¨oßen Bewegungsgleichungen ab, die uns helfen werden, obige Stationarit¨atsbedingung genauer zu spezifizieren. Klassisches Bild: Liouville-Gleichung. Im Ensemble-Bild wird ein physikalisches System durch ein statistisches Ensemble repr¨asentiert. Die Ensemble-Mitglieder sind gleichartige imagin¨are makroskopische Systeme. Zu ihnen geh¨ oren jeweils Phasenraumpunkte, die unabh¨angig voneinander in der Zeit durch den Phasenraum propagieren. Betrachten wir nun ein fixes Volumenelement dΓ im Phasenraum, dann ver¨andert sich i.a. die Zahl der darin liegenden Punkte mit der Zeit, da die Koordinaten und Impulse der ¨ einzelnen Ensemble-Mitglieder in Ubereinstimmung mit den Hamiltonschen Gleichungen ∂H ∂H = q˙i , = −p˙i ∂pi ∂qi
(4.6)
ebenfalls variieren. Da jedoch keine Phasenraumpunkte erzeugt oder vernichtet werden,3 k¨ onnen wir eine Kontinuit¨atsgleichung formulieren, die besagt, ¨ daß die Anderungsrate der Dichte im Volumenelement dΓ proportional zum Fluß der Punkte durch die Oberfl¨ache dω dieses Volumenelements ist (siehe Abb. 4.2): ∂ dΓ ρ = − dωρ(vn) . ∂t Γ
ω
Dabei ist v die Geschwindigkeit der Phasenraumpunkte und n der nach außen zeigende Normalenvektor der Oberfl¨ache dω. Unter Ausnutzung von (4.6) und des verallgemeinerten Gaußschen Satzes folgt p v n
dω q Abb. 4.2. Zeitlicher Fluß von Phasenraumpunkten durch ein Phasenraumvolumenelement
3
Zwei verschiedene Phasenraumpunkte k¨ onnen sich im Laufe ihrer Bewegung nie u osungen besitzen. ¨berdecken, da die Hamiltonschen Gleichungen eindeutige L¨
4.1 Grundlagen der statistischen Physik
∂ρ + ∇(ρv) = 0 , ∂t mit
407
(4.7)
∂ ∂ (ρq˙i ) + (ρp˙i ) ∂qi ∂pi i 2 ∂ρ ∂H ∂2H ∂ρ ∂H ∂ H − − +ρ = ∂pi ∂qi ∂qi ∂pi ∂pi ∂qi ∂qi ∂pi i
∇(ρv) =
= {ρ, H} .
(4.8)
Desweiteren gilt f¨ ur die totale zeitliche Ableitung von ρ:4 ∂ρ ∂H dρ ∂ρ ∂ρ ∂H − = + ∂pi ∂qi dt ∂t ∂qi ∂pi i ∂ρ + {ρ, H} . ∂t Die Gleichungen (4.7), (4.8) und (4.9) f¨ uhren schließlich zum =
(4.9)
Satz 4.5: Liouville-Gleichung Die totale Zeitableitung der Wahrscheinlichkeitsdichte im Phasenraum verschwindet: dρ ∂ρ = + {ρ, H} = 0 . dt ∂t Dieser Satz bedeutet, daß f¨ ur einen Beobachter, der sich auf einem Phasenraumpunkt des Ensembles mitbewegt, die Phasenraumdichte zeitunabh¨ angig aussieht. Mit anderen Worten: Das Ensemble bewegt sich durch den Phasenraum wie eine inkompressible Fl¨ ussigkeit. F¨ ur ein station¨ ares Ensemble, ∂ρ/∂t = 0, impliziert die Liouville-Gleichung die Bedingung {ρ, H} = 0 .
(4.10)
Ein station¨ ares Ensemble ist somit eine Konstante der Bewegung. Die einfachste Art, diese Bedingung zu erf¨ ullen, ist die Wahl einer Wahrscheinlichkeitsdichte, die in einem Teilraum Ω von Γ konstant und sonst u ¨berall Null ist. In diesem Ensemble sind alle Mikrozust¨ ande gleichf¨ ormig u ¨ber Ω verteilt, so daß f¨ ur den Ensemble-Mittelwert einer Observablen A gilt: 1 1 A= A(p, q)dΓ , Ω = 3N dΓ . Ωh3N h Ω
Ω
Eine weniger restriktive M¨ oglichkeit, die Bedingung (4.10) zu erf¨ ullen, ist eine Wahrscheinlichkeitsdichte, deren Abh¨ angigkeit von q und p nur durch 4
Siehe Satz 1.25 und anschließende Betrachtungen.
408
4. Statistische Physik und Thermodynamik
die explizite Abh¨angigkeit einer Konstanten der Bewegung h(q, p) gegeben ist: ρ(q, p) = ρ[h(q, p)] . In diesem Fall gilt n¨amlich ∂ρ ∂ρ ∂h ∂ρ ∂ρ ∂h = =0, = = 0 =⇒ {ρ, H} = 0 . ∂qi ∂h ∂qi ∂pi ∂h ∂pi Aus der Mechanik ist bekannt, daß es ohne die Schwerpunktsbewegung sieben Konstanten der Bewegung gibt, n¨amlich Energie, Impuls und Drehimpuls (siehe Satz 1.11). F¨ ur sehr große Systeme k¨onnen wir annehmen, daß es stets m¨ oglich ist, den Impuls und Drehimpuls durch eine Koordinatentransformation zu Null zu transformieren. Wir werden uns deshalb im weiteren Verlauf auf station¨ are Ensembles beschr¨anken, die nur u ¨ber die Hamilton-Funktion H(q, p) = E von den generalisierten Koordinaten und Impulsen abh¨angen. Quantenmechanisches Bild: Von Neumann-Gleichung. Um das quantenmechanische Analogon der Liouville-Gleichung zu finden, arbeiten wir im Schr¨ odinger-Bild (siehe Unterabschn. 3.2.4) und rechnen unter Verwendung von d d H | ψ = i¯ h | ψ , ψ| H = −i¯ h ψ| dt dt und dPr /dt = 0 wie folgt: d dρ = i¯ h | ψ r Pr ψ r | i¯ h dt dt r = (H | ψr Pr ψr | − | ψr Pr ψr | H) = [H, ρ] . r
Satz 4.6: Von Neumann-Gleichung Die zeitliche Entwicklung des Dichteoperators ist gegeben durch dρ i = − [H, ρ] . dt h ¯ Die L¨ osung dieser verallgemeinerten Schr¨odinger-Gleichung ist ρ(t) = e−iHt/¯h ρ(0)eiHt/¯h . In Analogie zum klassischen Fall ist die Dichtematrix station¨ar, falls dρ = [H, ρ] = 0 . dt Hieraus folgt f¨ ur die Zeitabh¨angigkeit von Operatoren ∂A d d ∂A = i¯ h h tr(ρA) = tr [H, ρ]A + i¯ i¯ h A = i¯ hρ . dt dt ∂t ∂t i¯ h
(4.11)
4.1 Grundlagen der statistischen Physik
409
Das heißt die Messung von nicht explizit zeitabh¨ angigen Observablen liefert im station¨aren Fall, wie gew¨ unscht, zeitunabh¨ angige Ergebnisse. Im weiteren Verlauf werden wir der Stationarit¨ atsbedingung (4.11) durch Dichteoperatoren der Form ρ = ρ(H, x)
(4.12)
Rechnung tragen, wobei x einen Satz von zeitunabh¨ angigen Observablen (z.B. Teilchenzahloperator N ) bezeichnet, die mit H vertauschen. Wir k¨ onnen aus unseren bisherigen Betrachtungen bereits ganz konkrete Aussagen u ¨ber die Form des Dichteoperators bzw. der klassischen Wahrscheinlichkeitsdichte gewinnen. Betrachten wir hierzu zwei Subsysteme, die durch die statistisch unabh¨ angigen Verteilungen ρ1 und ρ2 beschrieben werden. F¨ ur das kombinierte System dieser Ensembles muß gelten: ρ12 = ρ1 ρ2 =⇒ ln ρ12 = ln ρ1 + ln ρ2 .
(4.13)
Der Logarithmus des Dichteoperators ist somit eine lineare Funktion der additiven Erhaltungsgr¨ oßen. Nehmen wir nun an, daß sowohl die Teilchenzahl N als auch die Energie E beider Systeme vorgegeben sind, dann sind die Dichteoperatoren der Subsysteme konstant und die Mikrozust¨ ande in ihnen gleichverteilt (mikrokanonisches Ensemble). K¨ onnen die Subsysteme untereinander Energie austauschen (kanonisches Ensemble), dann muß aufgrund von (4.13) gelten: ρ1,2 ∼ e−β1,2 H . K¨ onnen sowohl Energie als auch Teilchenzahl ausgetauscht werden (großkanonisches Ensemble), dann folgt wegen (4.13) ρ1,2 ∼ e−β1,2 H+α1,2 N . Die Vorzeichen von α1,2 und β1,2 sind hierbei willk¨ urlich. Die Form der Dichtematrizen ergibt sich also allein aus der Stationarit¨ atsbedingung (4.12) und der Annahme (4.13). In den n¨ achsten beiden Abschnitten werden wir die drei soeben genannten Ensembles auf anderem Wege herleiten. Spezielle Rolle der Energie. Es ist offensichtlich besonders einfach, den Dichteoperator in der Energieeigenbasis {| ψr } zu berechnen, denn dann ist die Dichtematrix diagonal, falls, wie vorausgesetzt, ρ und H kommutieren: [H, ρ] = 0 =⇒ ρmn = ψn | ρ(H) |ψm = ρ(En )δnm . Wir werden diese Basis meistens benutzen. Es sollte jedoch klar sein, daß alle Resultate von der Wahl der Basis unabh¨ angig sind.
410
4. Statistische Physik und Thermodynamik
Zusammenfassung • Die statistische Physik umgeht die praktisch unm¨ogliche Bestimmung des Mikrozustandes eines makroskopischen Systems durch das Konzept des statistischen Ensembles, welches aus sehr vielen gleichartigen (fiktiven) makroskopischen Systemen mit jeweils anderen mikroskopischen Ausgangssituationen besteht. Das urspr¨ ungliche Problem wird hiermit auf die Bestimmung der Anzahl m¨oglicher Mikrozust¨ande zu einem bestimmten Makrozustand reduziert. • Der Makrozustand eines Systems wird im Ensemble-Bild durch den Satz relativer Besetzungswahrscheinlichkeiten der verschiedenen Mikrozust¨ ande des Ensembles definiert. • Zeitmittel und Ensemble-Mittel eines Systems sind im statistischen Gleichgewicht (station¨ ares System) identisch. • Statistische Ensembles werden durch eine Dichteverteilung (klassisch) bzw. durch einen Dichteoperator (quantenmechanisch) beschrieben. • Station¨ are Systeme zeichnen sich dadurch aus, daß die Poisson-Klammer von Dichteverteilung und Hamilton-Funktion bzw. der Kommutator von Dichteoperator und Hamilton-Operator verschwindet.
Anwendungen 54. Klassischer Phasenraum des harmonischen Oszillators. Man berechne die Phasenraumtrajektorie des klassischen eindimensionalen harmonischen Oszillators sowie das Phasenraumvolumen, das von E − δE und E eingeschlossen wird. Wie groß ist dieses Volumen, wenn δE gerade der Abstand zweier aufeinander folgender Energieeigenwerte des quantenmechanischen Oszillators ist? L¨ osung. Die klassische Hamilton-Funktion des Problems lautet k 2 p2 q + . 2 2m Die L¨ osung der zugeh¨origen Hamiltonschen Gleichungen ist
H(q, p) =
q(t) = A cos(ωt + ϕ) , p(t) = −mωA sin(ωt + ϕ) , ω = und l¨ aßt sich unter Verwendung von mω 2 A2 = const 2 umschreiben zur Phasenraumtrajektorie H(q, p) = E =
k m
Anwendungen
(q, p) =
=⇒
√ 2E cos(ωt + ϕ), − 2mE sin(ωt + ϕ) mω 2
411
q2 p2 + =1. (2E/mω 2 ) 2mE
Wie man sieht, entspricht dies einer Ellipse mit der Fl¨ ache 2πE/ω. Man beachte, daß nach einer Periode T = 2π/ω jeder Punkt der Ellipse durchlaufen wurde und die Ergodenhypothese somit exakt erf¨ ullt ist. Wir nehmen nun an, die Energie des Oszillators sei unscharf und auf den Bereich [E − δE : E] begrenzt. Die Phasenraumtrajektorie ist dann auf das Volumen 2πδE dqdp = dΓ = ω E−δE≤H≤E
E−δE≤H≤E
begrenzt. Nehmen wir das quantenmechanische Resultat f¨ ur die Energieeigenwerte, 1 , En = h ¯ω n + 2 dann ist die Zahl der Eigenzust¨ ande innerhalb des erlaubten Energieintervalls f¨ ur große Energien praktisch gleich δE/¯ hω. In diesem Fall ist das Phasenraumvolumen eines Eigenzustandes ν=
(2πδE/ω) = 2π¯ h=h. (δE/¯hω)
Betrachtet man ein System von N harmonischen Oszillatoren, so ergibt sich ahlung von Mikrozust¨ anden innerhalb eines entsprechend: ν = hN . Zur Abz¨ Phasenraumvolumenelementes hat man daher dieses Volumen durch ν zu teilen. 55. Postulat der a priori zuf¨ alligen Phasen. Der quantenstatistische Mittelwert einer Observablen A berechnet sich in jeder Basis {| ψr } formal u ¨ber A= Pr ψr | A |ψr , (4.14) r
wobei Pr die Besetzungswahrscheinlichkeiten der reinen Zust¨ ande | ψr sind. Betrachten wir nun ein System mit konstanter, von außen vorgegebener Energie, dann tragen in (4.14) nur solche Zust¨ ande bei, die mit eben dieser Energie vertr¨ aglich sind. Interpretieren wir weiterhin die Kets | ψr als die Energieeigenzust¨ ande des Systems, dann sind die Wahrscheinlichkeiten Pr nach dem 2. statistischen Postulat alle gleich: Pr = P = const. Hiervon ausgehend leite man das Postulat der a priori zuf¨ alligen Phasen ab, indem man von der Energieeigenbasis zu einer anderen Basis (desselben Hilbert-Raumes) u ¨bergeht.
412
4. Statistische Physik und Thermodynamik
L¨ osung. Zwischen der Energieeigenbasis {| ψr } und einer Basis {| n } bestehe der Zusammenhang | n anr , anr = n| ψr . | ψr = n
Damit folgt f¨ ur den Mittelwert von A im Falle eines gemischten Zustands A = P ψr | n n| A |m m| ψr r,n,m
=
P a∗nr anr n| A |n +
r,n
P a∗nr amr n| A |m (1 − δnm ) .
r,n,m
Der Vergleich dieser Beziehung mit (4.14) liefert f¨ ur n = m die Bedingung a∗nr amr = 0 ⇐⇒ |anr ||amr |ei(φmr −φnr ) = 0 , r
r
die nur dann zu erf¨ ullen ist, wenn man postuliert, daß die Phasen φ v¨ollig zuf¨ allig u ¨ber dem betrachteten Ensemble verteilt sind: a∗nr amr = 0 , n = m . Dieses Postulat der a priori zuf¨alligen Phasen bedeutet die Forderung, daß alle Zust¨ ande | ψr inkoh¨arente Superpositionen sind, so daß Korrelationen zwischen den einzelnen Ensemble-Mitgliedern ausgeschlossen sind. F¨ ur gemischte Zust¨ ande ist es zus¨atzlich zum Postulat der a priori gleichen Wahrscheinlichkeiten zu fordern.
4.2 Ensemble-Theorie I: Mikrokanonisches Ensemble und Entropie Im letzten Abschnitt haben wir gefunden, daß ein statistisches Ensemble im Gleichgewicht durch eine Wahrscheinlichkeitsdichte bzw. einen Dichteoperator beschrieben wird, die nur von Erhaltungsgr¨oßen (z.B. Energie oder Teilchenzahl) abh¨ angen. Drei solcher Ensembles, die in der statistischen Physik am h¨ aufigsten angewandt werden, sind: • Mikrokanonisches Ensemble: Es beschreibt ein vollst¨andig isoliertes System im Gleichgewicht bei fester Energie E. • Kanonisches Ensemble: Das System kann mit seiner Umgebung Energie austauschen, wobei seine Temperatur vorgegeben ist. • Großkanonisches Ensemble: Das System kann mit seiner Umgebung Energie und Teilchen bei vorgegebener Temperatur und vorgegebenem chemischen Potential austauschen.
4.2 Ensemble-Theorie I: Mikrokanonisches Ensemble und Entropie
413
In diesem Abschnitt behandeln wir das mikrokanonische Ensemble, w¨ ahrend die anderen beiden im n¨ achsten Abschnitt genauer untersucht werden. Desweiteren lernen wir hier den zentralen Begriff der Entropie kennen, die sehr eng mit der mikrokanonischen Zustandssumme verkn¨ upft ist, und leiten das Prinzip der maximalen Entropie f¨ ur Gleichgewichtszust¨ ande her. Dieses Prinzip f¨ uhrt uns schließlich unter Einf¨ uhrung der Begriffe Temperatur und geneafte zur Formulierung von Gleichgewichtsbedingungen. ralisierte Kr¨ 4.2.1 Mikrokanonisches Ensemble Das mikrokanonische Ensemble beschreibt ein abgeschlossenes System bei vorgegebener Energie E. Dementsprechend bestehen die Ensemble-Mitglieder aus Mikrozust¨ anden, die eben diese Energie besitzen und mit etwaigen, von außen vorgegebenen (externen) Parametern, z.B. Volumen V oder Teilchenzahl N , vertr¨ aglich sind. Wir bezeichnen diese Parameter zusammenfassend mit x = (V, N, . . .). Da s¨ amtliche Mikrozust¨ ande im Ensemble aufgrund des 2. statistischen Postulates gleichwahrscheinlich sind, ist die Wahrscheinlichkeit Pr (E, x), das betrachtete System im Mikrozustand r zu finden, konstant: ⎧ 1 ⎨ f¨ ur alle zug¨ angl. Mikrozust¨ ande mit Er = E Ω(E, x) Pr (E, x) = ⎩ 0 sonst . Ω bezeichnet die mikrokanonische Zustandssumme. Sie ist gleich der Gesamtzahl der zug¨ anglichen Mikrozust¨ ande, d.h. Ω = Ω(E, x) = 1. (4.15) r:Er (x)=E
Da die Energie E i.a. nur mit einer begrenzten Genauigkeit δE (aus theoretischen und praktischen Gr¨ unden) gemessen werden kann, ist es vern¨ unftig, (4.15) umzuformulieren in 1. Ω(E, x) = r:E−δE≤Er (x)≤E
Damit die statistische Betrachtungsweise sinnvoll ist, muß allerdings noch gezeigt werden, daß die Unsch¨ arfe δE im thermodynamischen Limes so gew¨ ahlt werden kann, daß Ω von dieser Gr¨ oße unabh¨ angig ist. Zusammenfassend definieren wir: Definition: Mikrokanonisches Ensemble Das mikrokanonische Ensemble bestimmt den Gleichgewichtszustand eines abgeschlossenen Systems zu vorgegebener Energie E und etwaigen ¨ außeren Parametern x: 1 Pr (E, x) = , Pr (E, x) = 1 Ω(E, x) r
414
4. Statistische Physik und Thermodynamik
⎧ 1 ⎪ ⎪ ⎨ r:E−δE≤Er (x)≤E Ω(E, x) = . 1 ⎪ ⎪ ⎩ h3N N !
(quantenmechanisch) dΓ
(klassisch) .
E−δE≤H(q,p,x)≤E
F¨ ur den Fall, daß es sich um ununterscheidbare Teilchen handelt, haben wir bei der klassischen Zustandssumme zus¨atzlich den Faktor 1/N ! angeschrieben. Er ist aus quantenstatistischer Sicht notwendig, da beliebige Permutationen der Teilchen zu keinen neuen Elementen im Ensemble f¨ uhren.5 Im quantenmechanischen Dichteoperator-Formalismus geh¨oren die mikrokanonischen Wahrscheinlichkeiten Pr zu den entarteten Energieeigenzust¨ anden | ψr von H zur festen Energie E. Der mikrokanonische Dichteoperator lautet deshalb nach Satz 4.3 ⎧ ⎨ 1 f¨ ur alle zug¨angl. Mikrozust¨ande 1 ρ= | ψr ψr | = Ω ⎩ Ω r 0 sonst und ist somit in jeder Darstellung diagonal. Dichteverhalten der mikrokanonischen Zust¨ ande. Wir wollen nun eine grobe Absch¨ atzung f¨ ur die Energieabh¨angigkeit der mikrokanonischen Zustandssumme vornehmen, wobei wir systemspezifische Details außer Acht lassen. Hierzu ist es zweckm¨aßig, folgende Gr¨oßen zu definieren: Definition: Phasenraumvolumen ω und Phasenraumdichte g 1 klassisch 1 −→ dΓ ω(E) = h3N N ! r:Er ≤E
g(E) =
H(q,p)≤E
Ω(E) ∂ω(E) = lim . δE→0 δE ∂E
(4.16)
Das Phasenraumvolumen gibt also die Zahl der Mikrozust¨ande an, welche eine Energie kleiner oder gleich E besitzen, w¨ahrend die Phasenraumdichte die Zahl der Zust¨ ande pro Energieeinheitsintervall beschreibt. Ist die Energie E des betrachteten Systems nicht zu klein, dann ist es plausibel, anzunehmen, daß sich E gleichm¨aßig auf die f Freiheitsgrade des Systems verteilt, so daß zu jedem Freiheitsgrad der Energiebetrag = E/f geh¨ ort. Wir k¨ onnen weiter annehmen, daß das Phasenraumvolumen ω1 ( ) eines Freiheitsgrades, also die m¨oglichen Werte eines Freiheitsgrades, die zum 5
Falls mehrere Teilchensorten vorhanden sind, muß der Faktor 1/N ! durch 1/
B i
Ni !
ersetzt werden, mit
Ni = N . In Anwendung 57 zeigen wir, daß
i
die Unterdr¨ uckung des Faktors 1/N ! zu Widerspr¨ uchen innerhalb thermodynamischer Relationen f¨ uhrt (Gibbs-Paradoxon).
4.2 Ensemble-Theorie I: Mikrokanonisches Ensemble und Entropie
415
Gesamtsystem den Energiebetrag oder weniger beitragen, ungef¨ ahr proportional zu ist: ω1 ( ) ∼ α , α ≈ 1 . F¨ ur das gesamte Phasenraumvolumen ergibt sich dann E ω(E) ∼ [ω1 ( )]f = f , = . f Hieraus erh¨ alt man die Zahl der Zust¨ ande im Intervall [E − δE : E] zu ∂ω1 ∂ω δE ∼ f ω1f −1 δE . (4.17) ∂E ∂E F¨ ur makroskopische Systeme ist f und somit der Exponent dieser Gleichung achst deshalb extrem schnell mit der Enervon der Gr¨ oßenordnung 1023 . Ω w¨ gie des Systems an. Wir werden im weiteren Verlauf sehen, daß dies ein allgemeines Charakteristikum von Zustandssummen ist. Bilden wir den Logarithmus von (4.17), dann folgt ∂ω1 ln Ω ≈ (f − 1) ln ω1 + ln f δE . ∂E Ω(E) = ω(E) − ω(E − δE) =
Die beiden Terme der rechten Seite haben die Gr¨ oßenordnung f bzw. ln f . Somit ist der zweite Term f¨ ur große f vernachl¨ assigbar, und wir finden ln Ω(E) ≈ ln ω(E) ≈ ln g(E) ≈ f ln ω1 ( ) ≈ O(f ) . Insgesamt folgt Satz 4.7: Energieabh¨ angigkeit der mikrokanonischen Zustandssumme F¨ ur makroskopische Systeme (Zahl der Freiheitsgrade f sehr groß) sind die Gr¨ oßen ln Ω(E) , ln ω(E) , ln g(E) aherung ¨aquivalent. Weiterhin gilt in grober N¨ Ω(E) ∼ E f . Mit diesem Satz ist gezeigt, daß die Zustandssumme Ω f¨ ur makroskopische Systeme praktisch nicht von der Energieunsch¨ arfe δE abh¨ angt. Anders ausgedr¨ uckt: Zum gegebenen Energieintervall [E − δE : E] befinden sich praktisch alle Mikrozust¨ande selbst auf der durch δE gegebenen Skala sehr dicht bei E (siehe Anwendung 56). 4.2.2 Prinzip der maximalen Entropie Ein zentraler Begriff der statistischen Physik ist die Entropie. Sie ist in folgender Weise mit der mikrokanonischen Zustandssumme verkn¨ upft:
416
4. Statistische Physik und Thermodynamik
Definition: Entropie S Die statistische Entropie eines Systems im Gleichgewicht ist durch die Boltzmann-Gleichung S(E, x) = k ln Ω(E, x)
(4.18)
definiert, wobei der Proportionalit¨atsfaktor J (K = Kelvin) K die Boltzmann-Konstante bezeichnet. k = 1.38054 · 10−23
Wir zeigen nun, daß die Entropie eines abgeschlossenen Gleichgewichtssystems maximal ist. Sei x eine extensive6 makroskopische Gr¨oße, die unabh¨ angig von der Energie E des Systems verschiedene Werte annehmen kann, dann sind nach dem 2. statistischen Postulat alle Ω(E, x) = exp [S(E, x)/k] Mikrozust¨ ande gleichwahrscheinlich. Die Wahrscheinlichkeit W (x), das System in einem mit x vertr¨aglichen Zustand zu finden, ist daher proportional zur Anzahl Ω(E, x) der Mikrozust¨ande mit eben diesem Wert: S(E, x) . W (x) ∼ exp k Wir entwickeln ln W (x) um eine beliebige Stelle x ˜: 1 ∂S 1 ∂ 2 S ln W (x) = ln W (˜ x) + (x − x ˜ ) + (x − x ˜)2 + . . . . (4.19) k ∂x x=˜x 2k ∂x2 x=˜x Sei nun bei x ˜ das Maximum von W (x). Dann gilt ∂S =0, ∂x x=˜x und wir k¨ onnen W (x) als eine normierte Gauß-Verteilung schreiben: ∞ (x − x ˜ )2 1 , W (x)dx = 1 , exp − W (x) = √ 2(∆x)2 2π∆x −∞
wobei ∆x =
−
k
∂2S ∂x2 x=˜ x
die Schwankung (1σ-Abweichung) der Verteilung ist. Die relative Kleinheit der Schwankung f¨ ur große N rechtfertigt die Vernachl¨assigung h¨oherer Terme in (4.19). Sie bedeutet auch, daß praktisch alle Mikrozust¨ande beim Maximum liegen. Daher gilt f¨ ur den gesuchten Erwartungswert x: x = x ˜. 6
Man nennt Gr¨ oßen extensiv, wenn sie proportional zur Teilchenzahl N sind. Dagegen heißen Gr¨ oßen, die von N unabh¨ angig sind, intensiv.
4.2 Ensemble-Theorie I: Mikrokanonisches Ensemble und Entropie
417
Satz 4.8: Gesetz der maximalen Entropie Sei x eine extensive makroskopische, von der Energie E unabh¨ angige Gr¨ oße. Dann bestimmt sich sein Erwartungswert x f¨ ur ein abgeschlossenes Gleichgewichtssystem aus der Maximumsbedingung ∂S =0. S(E, x) = maximal ⇐⇒ ∂x x=x Die Entropie ist nur in Gleichgewichtszust¨ anden definiert. Es stellt sich daher die Frage, wie S einen Maximalwert erreichen kann, ohne jemals nicht in einem Gleichgewichtszustand zu sein. Das folgende Argument erm¨ oglicht die Definition der Entropie f¨ ur makroskopische Zust¨ ande außerhalb des Gleichgewichts: Man unterteilt das System in Untersysteme, die jeweils im lokalen Gleichgewicht sind, wobei deren Relaxationszeiten als klein angenommen werden im Vergleich zur Beobachtungsdauer. Damit ist es m¨ oglich, ihre Entropien zu berechnen, und es kann – da die Entropie additiv ist – die Gesamtentropie definiert werden. 4.2.3 Gleichgewichtsbedingungen und generalisierte Kr¨ afte Mit Satz 4.8 sind wir nun in der Lage, Gleichgewichtsbedingungen zwischen Systemen herzuleiten, die in Kontakt miteinander stehen, also z.B. Energie, Volumen oder Teilchen austauschen k¨ onnen. Wir betrachten hierzu ganz allgemein ein isoliertes System, bestehend aus zwei Teilsystemen 1 und 2, die durch eine Wand voneinander getrennt sind. Aufgrund der Isolierung des Systems ist die Gesamtenergie konstant, E1 + E2 = E = const , d.h. wir k¨ onnen im mikrokanonischen Ensemble arbeiten. Desweiteren lassen wir neben Energieaustausch den Austausch eines ¨ außeren extensiven Parameters x zwischen den Systemen 1 und 2 zu, wobei dieser ebenfalls erhalten sein soll: x = x1 + x2 = const . In diesem Zusammenhang weisen wir vorausgreifend darauf hin, daß man zwei Arten von Energie¨ anderungen unterscheidet: • W¨ armeaustausch oder auch thermischer Austausch: Energieaustausch bei konstanten ¨außeren Parametern. • Mechanischer Energieaustausch bei thermischer Isolierung, d.h. ausschlieߨ lich hervorgerufen durch Anderung außerer Parameter. ¨ Der allgemeinste Energieaustausch ist demnach der kombinierte Austausch von W¨ arme und mechanischer Energie.
418
4. Statistische Physik und Thermodynamik
Die Frage, der wir nun nachgehen wollen lautet: Welchen Wert x1 besitzt System 1 im Gleichgewichtszustand? Nach Satz 4.8 lautet die zugeh¨orige Maximumsbedingung S(x1 ) = S1 (E1 , x1 ) + S2 (E − E1 , x − x1 ) ∂S1 dx1 + ∂x1 ∂S1 = dx1 − ∂x1
0 = dS =
∂S2 dx2 + ∂x2 ∂S2 dx1 + ∂x2
∂S1 dE1 + ∂E1 ∂S1 dE1 − ∂E1
∂S2 dE2 ∂E2 ∂S2 dE1 , ∂E2
(4.20)
wobei die Ableitungen an den Stellen x1 bzw. x2 = x − x1 zu nehmen sind. Betrachten wir zun¨achst den Fall, daß die Trennwand lediglich einen thermischen Kontakt erlaubt, also dx1 = 0, dann reduziert sich (4.20) auf ∂S1 ∂S2 dS = dE1 = 0 . − ∂E1 ∂E2 Wir definieren: Definition: Temperatur T Die Temperatur T eines Gleichgewichtssystems mit der Energie E ist definiert als7 ∂S ∂ ln Ω(E, x) 1 ∂S(E, x) = =k . (4.21) = T (E, x) ∂E x ∂E ∂E F¨ ur das betrachtete System im thermischen Gleichgewicht gilt somit T1 = T 2 .
(4.22)
Erlauben wir nun auch noch den Austausch des Parameters x (Austausch von W¨ arme plus mechanischer Energie), dann l¨aßt sich (4.20) mit Hilfe der folgenden Definition vereinfachen: Definition: Generalisierte Kraft X Die generalisierte, zum ¨außeren Parameter x konjugierte Kraft ist definiert als ∂S ∂S(E, x) ∂ ln Ω(E, x) X=T =T = kT . (4.23) ∂x ∂x ∂x E 7
Man beachte die Klammerschreibweise, die in der Anmerkung auf Seite 397 erkl¨ art wurde und im weiteren Verlauf noch oft verwendet wird. Ferner ist anzumerken, daß die Gr¨ oße kT gerade der Energie pro Freiheitsgrad entspricht, denn es gilt unter Ber¨ ucksichtigung von Satz 4.7 1 ∂ ln Ω ∂ ln E f = =f = . kT ∂E ∂E E
4.2 Ensemble-Theorie I: Mikrokanonisches Ensemble und Entropie
Hiermit wird (4.20) zu X1 X2 1 1 dx1 + dE1 . 0 = dS = − − T1 T2 T1 T2
419
(4.24)
Zur korrekten Interpretation dieser Gleichung ist zu beachten, daß aufgrund der o.g. Energieaustauschm¨ oglichkeiten die Variation dE1 i.a. nicht ater zeigen werden, gilt f¨ ur reversible unabh¨ angig von dx1 ist. Wie wir sp¨ Austauschprozesse die Beziehung Xi dxi . dE = −Xdx allgemein: dE = − i
Es folgt somit aus (4.24) der Zusammenhang X1 X2 X1 X1 dx1 = 0 =⇒ X1 = X2 . − − + T1 T2 T1 T2 Unter Ber¨ ucksichtigung dieses Punktes und (4.22) erhalten wir das allgemeine Resultat Satz 4.9: Gleichgewichtsbedingungen eines zweiteiligen abgeschlossenen Systems Ein, aus zwei Systemen 1 und 2 bestehendes isoliertes System befindet sich bez¨ uglich des Austausches von Energie und eines ¨ außeren extensiven Parameters x im Gleichgewicht, falls f¨ ur die Temperaturen und generalisierten Kr¨ afte der Subsysteme gilt: T 1 = T2
(Gleichgewicht gegen¨ uber thermischen Austausch)
X1 = X2
(Gleichgewicht gegen¨ uber x-Austausch) .
In den folgenden Abschnitten werden wir es neben der Temperatur T h¨ aufig mit zwei weiteren intensiven Gr¨ oßen zu tun haben, n¨ amlich dem Druck P und dem chemischen Potential µ: ∂S (Druck) P =T ∂V E,N ∂S µ = −T (chemisches Potential) . ∂N E,V Sie sind die zu den extensiven Austauschgr¨ oßen Volumen V und Teilchenzahl N konjugierten generalisierten Kr¨ afte. Betrachten wir zur Illustration von Satz 4.9 ein Gas, das in einem Glaskasten mit einem beweglichen Kolben eingeschlossen ist. Wird dieses Gas nun eine Zeit lang erhitzt und gleichzeitig das Volumen durch Hineindr¨ ucken des Kolbens verkleinert, dann wird es, nachdem es sich wieder sich selbst u ¨berlassen ist, bestrebt sein, einen Gleichgewichtszustand zu erreichen. Nach Satz
420
4. Statistische Physik und Thermodynamik
4.9 impliziert dieses Bestreben einen W¨armeaustausch mit der Umgebung u ¨ber die Glaswand sowie einen Volumenaustausch mit der Umgebung u ¨ber den Kolben, bis die Temperaturen und Dr¨ ucke des Gases und der Umgebung u ¨bereinstimmen. Wir k¨onnen somit in der Tat eine Temperaturdifferenz als treibende Kraft f¨ ur W¨armeaustausch und eine Druckdifferenz als treibende Kraft f¨ ur Volumenaustausch interpretieren. Dies rechtfertigt die Bezeichnung generalisierte Kr¨afte“. ” Statistische Physik und Thermodynamik. Zum Ende dieses Abschnittes weisen wir noch einmal auf die fundamentale Bedeutung der EntropieDefinition (4.18) hin. Durch sie wird die mikroskopische Betrachtungsweise der statistischen Physik mit der makroskopischen Thermodynamik verkn¨ upft. Ist die mikrokanonische Zustandssumme eines Gleichgewichtssystems bekannt, so folgt hieraus die Entropie als makroskopische Zustandsgr¨oße. Aus letzterer lassen sich dann alle weiteren makroskopischen thermodynamischen Zustandsgr¨ oßen wie etwa Temperatur, Druck, chemisches Potential usw. berechnen (siehe Abschn. 4.5). Wir k¨onnen somit folgendes einfache Schema angeben, um aus einem gegebenen Hamilton-Operator bzw. einer gegebenen Hamilton-Funktion die thermodynamischen Relationen eines Systems abzuleiten: 6 7 thermodyn. H(x) −→ Er (x) −→ Ω(E, x) −→ S(E, x) −→ . (4.25) Relationen
Zusammenfassung • Das mikrokanonische Ensemble beschreibt ein Gleichgewichtssystem bei vorgegebener Energie E. Es setzt sich aus vielen gleichartigen Systemen zusammen, die mit dieser Energie und etwaigen anderen ¨außeren Parametern innerhalb einer Unsch¨arfetoleranz δE vertr¨aglich sind. Alle Ensemble-Mitglieder sind hierbei gleich gewichtet. • Die zugeh¨ orige mikrokanonische Zustandssumme w¨achst extrem rasch mit E an, so daß sie faktisch von der Wahl der Unsch¨arfe δE unabh¨ angig ist. • Der Zusammenhang zwischen statistischer Physik und Thermodynamik ist durch die Boltzmann-Gleichung gegeben, welche die mikrokanonische Zustandssumme mit der makroskopischen Gr¨oße Entropie in Beziehung setzt. • Die Entropie nimmt bei einem abgeschlossenen System im Gleichgewicht ihren Maximalwert an (Prinzip der maximalen Entropie). • Aus diesem Prinzip folgen Gleichgewichtsbedingungen f¨ ur Systeme, die miteinander wechselwirken (thermischer und/oder mechanischer Austausch).
Anwendungen
421
Anwendungen 56. Ideales Gas I: Phasenraumvolumen, mikrokanonische Zustandssumme und Zustandsgleichungen. Gegeben sei ein ideales Gas, bestehend aus N ununterscheidbaren, nichtwechselwirkenden Teilchen der Masse m, die in einem Volumen L3 = V eingeschlossen sind. a) Man zeige durch Vergleich der klassisch und quantenmechanisch berechneten Phasenraumvolumen ω(E), daß die korrekte klassische Phasenraumzelle die Gr¨ oße h3N besitzt. b)Man berechne aus der Phasenraumdichte die mikrokanonische Zustandssumme Ω(E) und verifiziere, daß sie unabh¨ angig von der gew¨ ahlten Energieunsch¨ arfe δE ist. c) Man bestimme die kalorische Zustandsgleichung E = E(T, V, N ) und die thermische Zustandsgleichung P = P (T, V, N ) des idealen Gases. L¨ osung. Zu a) Die klassische Hamilton-Funktion f¨ ur unser Problem lautet H(q, p) =
N 3N p2i p2i = = E = const . 2m 2m i=1 i=1
Hieraus ergibt sich das klassische Phasenraumvolumen zu 1 VN ω(E) = 3N dΓ = 3N dp , ν N ! ν N ! 2 2 pi ≤2mE
i
(4.26)
pi ≤2mE
i
wobei ν 3n die gesuchte Phasenraumzellengr¨ oße bezeichnet. Um sein quantenmechanisches Analogon zu finden, benutzen wir, daß die N Teilchen im Volumen L3 = V eingeschlossen sind, so daß jeder der 3N kartesischen Impulse auf die gequantelten Werte π¯ h ni , ni = 0, 1, . . . L beschr¨ankt ist. Die Energieeigenwerte sind deshalb pi =
En =
3N π 2 ¯h2 2 n . 2mL2 i i=1
Wir nehmennun an, daß diese Energien so dicht liegen, daß die Summe ω(E) = 1 durch ein Integral ersetzt werden kann. Voraussetzung n:En ≤E
hierf¨ ur ist, daß die Teilchenimpulse sehr viel gr¨ oßer sind als das kleinstm¨ ogliche Impulsquantum. F¨ ur das quantenmechanische Phasenraumvolumen folgt dann
422
4. Statistische Physik und Thermodynamik
ω(E) =
1 23N
dn , En ≤E
wobei durch den Vorfaktor 1/23N auch negative n-Werte zugelassen werden. Ersetzen wir dni durch dpi , dann ergibt sich schließlich VN dp . (4.27) ω(E) = (2π¯h)3N 2 pi ≤2mE
i
Ber¨ ucksichtigen wir auch hier die Ununterscheidbarkeit der Teilchen durch Einf¨ ugen des Faktors 1/N ! und vergleichen dann diese Beziehung mit dem klassischen Resultat (4.26), so finden wir ν=h. Dasselbe Resultat haben wir bereits f¨ ur den eindimensionalen harmonischen Oszillator in Anwendung 54 hergeleitet. Zu b) F¨ ur die mikrokanonische Zustandssumme ist das Integral in (4.27) zu berechnen. Es repr¨asentiert das Volumen K einer 3N -dimensionalen Kugel √ mit dem Radius R = 2mE und ist gegeben durch8 π 3N/2 K = 3N R3N . 2 ! Somit finden wir die Beziehung N N 3N/2 V V 1 π 1 3N (2mE)3N/2 , ω(E, V, N ) = K = N ! h3 N ! h3 2 ! worin der Korrekturfaktor 1/N ! wieder ber¨ ucksichtigt ist. Unter Benutzung der Stirlingschen Formel N 1
ln N ! ≈ N (ln N − 1) folgt weiterhin ln ω(E, V, N ) = N
5
V ln N
(4.28)
4πm E 3h2 N
3/2
5 + 2
.
(4.29)
Von dieser Gleichung ausgehend k¨onnen wir nun die Unabh¨angigkeit der mikrokanonischen Zustandssumme Ω von δE verifizieren. Nach (4.16) gilt Ω(E, V, N ) ≈ δEg(E) = δE 8
∂ω(E, V, N ) 3N δE = ω(E, V, N ) ∂E 2 E
Streng genommen ist dieses Resultat nur f¨ ur gerade N korrekt. Ist N ungerade, dann kann man sicher ein Teilchen hinzuaddieren oder subtrahieren. Im Limes großer N kann dies keine Auswirkungen haben.
Anwendungen
=⇒ ln Ω ≈ ln ω + ln
3N 2
+ ln
δE E
423
.
Nun ist δE sicherlich klein gegen¨ uber der Energie E; typischerweise gilt √ onnen die letzten beiden O(ln N )-Terme geδE/E = O(1/ N ). Deshalb k¨ gen¨ uber ln ω = O(N ) vernachl¨ assigt werden. Damit ist gezeigt, daß die Energiebreite δE keine physikalischen Konsequenzen hat. F¨ ur sehr große N ist die Zunahme der Gesamtzahl der Mikrozust¨ ande mit der Energie so groß, daß der Hauptbeitrag zur Zustandssumme immer von Zust¨ anden herr¨ uhrt, die in enger N¨ ahe zu der Hyperfl¨ ache der Energie E liegen. Wir k¨ onnen deshalb sogar u ande zwischen 0 und E summieren, ohne daß die ¨ber alle Zust¨ zus¨atzlichen Zust¨ ande signifikant beitragen. Zu c) Die kalorischen und thermischen Zustandsgleichungen berechnen sich aus der mikrokanonischen Zustandssumme zu 1 ∂S ∂ ln Ω 3N k 3 = =k = =⇒ E = N kT (4.30) ∂E V,N ∂E 2E 2 T V,N P ∂ ln Ω Nk ∂S N kT =k = = =⇒ P = . (4.31) T ∂V E,N ∂V V V E,N Setzen wir die erste Gleichung in (4.29) ein, dann erhalten wir f¨ ur die mikrokanonische Zustandssumme des idealen Gases die Sackur-Tetrode-Gleichung 5 3/2 5 V 2πmkT (4.32) + ln ω(T, V, N ) = ln Ω(T, V, N ) = N ln N h2 2 bzw.
ln Ω(T, V, N ) = N mit 3 σ = ln 2
2πmk h2
3 ln V − ln N + ln T + σ 2
+
,
(4.33)
5 . 2
Anhand von (4.33) ist zu erkennen, daß die Entropie f¨ ur sehr kleine Temperaturen gegen Unendlich divergiert. Dies widerspricht jedoch dem dritten Hauptsatz der Thermodynamik (siehe Unterabschn. 4.5.1). Die Ersetzung der Summe durch ein Integral (zur Berechnung des Phasenraumvolumens) ist offenbar in der N¨ ahe des Temperatur-Nullpunktes nicht zul¨ assig, wo der niedrigste Zustand mit p = 0 stark durchschl¨ agt. Der formal korrekte Weg u ¨ber den quantenstatistischen Formalismus (Abschn. 4.7) wird diese Widerspr¨ uche ausr¨aumen.
424
4. Statistische Physik und Thermodynamik
57. Ideales Gas II: Gibbs-Paradoxon. Gegeben sei ein Volumen V , das mit einem idealen Gas, bestehend aus N identischen Atomen, gef¨ ullt ist. Durch Einschieben einer Zwischenwand werde das Volumen in zwei Teilvolumina V1 und V2 geteilt. Da dies in reversibler Weise geschehen soll, muß gelten: S = S1 + S 2 ,
(4.34)
wobei S die Entropie des gesamten Volumens vor und S1 , S2 die Entropien der Teilvolumina nach dem Einschieben der Wand bezeichnen. Man zeige, daß (4.34) nur dann erf¨ ullt ist, wenn der quantenstatistisch begr¨ undete GibbsFaktor 1/N ! in der mikrokanonischen Zustandssumme ber¨ ucksichtigt wird. L¨ osung. Zun¨ achst stellen wir fest, daß die Teilchendichte in jedem Volumen konstant ist: N N1 N2 ρ= = = const . = V V1 V2 Unter Verwendung von (4.33), in der 1/N ! ber¨ ucksichtigt ist, folgt nun 3 Si = Ni k ln Vi − ln ρ − ln Vi + ln T + σ 2 3 = Ni k − ln ρ + ln T + σ 2 3 =⇒ S1 + S2 = N k − ln ρ + ln T + σ 2 3 = N k ln V − ln N + ln T + σ = S . 2 Zur Durchf¨ uhrung der entsprechenden Rechnung ohne 1/N ! ben¨otigen wir die zu (4.33) analoge Formel ohne 1/N !. Sie berechnet sich zu 3 Si = Ni k ln V + ln T + σ − 1 . 2 Hieraus folgt
3 S1 + S2 = N k ln V + ln T + σ − 1 = S . 2
Dieser Widerspruch ist der eigentliche Grund, weshalb Gibbs den Faktor 1/N ! bereits vor seiner quantenstatistischen Begr¨ undung eingef¨ uhrt hat.
4.3 Ensemble-Theorie II: Kanonisches und großkanonisches Ensemble Im vorherigen Abschnitt haben wir das Fundament der statistischen Physik etabliert, wo der makroskopische Zustand eines Gleichgewichtssystems mit
4.3 Ensemble-Theorie II: Kanonisches und großkanonisches Ensemble
425
konstanter Energie auf die Bestimmung des zugeh¨ origen mikrokanonischen Ensembles zur¨ uckgef¨ uhrt wurde. In diesem Abschnitt werden wir das mikrokanonische Ensemble heranziehen, um zwei weitere Ensemble-Typen abzuleiten, n¨ amlich das kanonische und das großkanonische Ensemble. Dabei wird sich als ein wesentliches Ergebnis herausstellen, daß alle drei Ensembles im thermodynamischen Limes ¨ aquivalente Beschreibungen von Gleichgewichtssystemen liefern. 4.3.1 Kanonisches Ensemble Im allgemeinen ist es praktisch kaum m¨ oglich, die Energie eines physikalischen Systems zu kontrollieren, da es sich nie vollst¨ andig isolieren l¨ aßt. Ein weitaus praktikableres Konzept ist die Vorgabe einer festen Temperatur. Diese Gr¨oße l¨ aßt sich nicht nur leicht messen (z.B. mit Hilfe eines Thermometers), sondern auch sehr genau kontrollieren, indem man n¨ amlich das System mit einem W¨ armebad in thermischen Kontakt bringt, welches die Temperatur regelt. In der statistischen Physik werden physikalische Systeme mit vorgegebener Temperatur durch das kanonische Ensemble beschrieben, dessen Beset¨ zungswahrscheinlichkeiten sich aus folgenden Uberlegungen ableiten lassen: Man betrachte ein abgeschlossenes System, bestehend aus zwei Subsystemen 1 und 2, die im thermischen Kontakt miteinander stehen. Das zweite System sei sehr viel gr¨ oßer als das erste, so daß die Temperatur beider Systeme praktisch durch System 2 vorgegeben wird (Abb. 4.3). Notwendige Voraussetzung hierf¨ ur ist offensichtlich, daß die Energie E des Gesamtsystems sehr viel gr¨oßer ist als die m¨ oglichen Energiewerte Er des kleinen Systems 1 Er E .
(4.35)
Das heißt System 2 muß in jedem Fall makroskopisch groß sein, w¨ ahrend System 1 dieser Einschr¨ ankung nicht unterliegt. Da nach Voraussetzung die Gesamtenergie konstant ist, Er + E2 = E , k¨onnen wir das Gesamtsystem wieder mit Hilfe des mikrokanonischen Ensembles beschreiben. Von den insgesamt Ω(E, x) Zust¨ anden gibt es offenbar
System 1 (T, Er )
System 2 (T, E − Er )
Abb. 4.3. Physikalisches System im Kontakt mit einem sehr viel gr¨ oßeren W¨ armebad, welches die Temperatur beider Systeme vorgibt
426
4. Statistische Physik und Thermodynamik
Ω2 (E −Er , x) Zust¨ande, bei denen das System 1 in einem bestimmten Mikrozustand mit der Energie Er ist. Da alle Mikrozust¨ande nach dem 2. statistischen Postulat gleichwahrscheinlich sind, ist die Wahrscheinlichkeit Pr (T, x), das kleine System 1 bei vorgegebener Temperatur T im Mikrozustand r vorzufinden, proportional zu Ω2 (E − Er , x): Pr (T, x) ∼ Ω2 (E − Er , x) . Wir entwickeln nun den Logarithmus von Ω2 (E − Er , x) um E, wobei wir wegen (4.35) eine rasche Konvergenz erwarten: ln Ω2 (E − Er , x) = ln Ω2 (E, x) +
∂ ln Ω2 (E − Er ) + . . . ∂E
Er . kT Hieraus finden wir die (normierte) Wahrscheinlichkeitsverteilung 1 1 Pr (T, x) = , e−βEr (x) , β = kT Z(T, x) ≈ const −
mit der kanonischen Zustandssumme e−βEr (x) . Z(T, x) = r
Wahrscheinlichkeit der Energie. Pr (T, x) ist die Wahrscheinlichkeit, daß ein System bei gegebener Temperatur T in einem bestimmten Mikrozustand r ist. Um hiervon ausgehend die Wahrscheinlichkeit W (Er ) zu bestimmen, irgend einen Mikrozustand zu einer bestimmten Energie Er zu finden, m¨ ussen wir die Energieentartung des Hamilton-Operators in Betracht ziehen. Da Pr (T, x) bei vorgegebener Temperatur nur von der Energie abh¨angt, kann W (Er ) mit Hilfe der Phasenraumdichte g(Er ) aus (4.16) geschrieben werden, die ja gerade die Entartung des Energieniveaus Er angibt: W (Er ) = g(Er )Pr (T, x) = Z(T, x) = g(Er )e−βEr .
g(Er ) −βEr e Z
r
Im Falle dicht liegender Energieniveaus werden diese Gleichungen zu ∞ g(E) −βE W (E)dE = e dE , Z(T, x) = dEg(E)e−βE . (4.36) Z(T, x) 0
Wir erkennen aus der rechten Gleichung von (4.36), daß die kanonische Zustandssumme Z gerade die Laplace-Transformierte der Phasenraumdichte g ist. Daher gilt 1 g(E) = 2πi
c+i∞
dβZ(β, x)eβE , Re(β) = c > 0 . c−i∞
4.3 Ensemble-Theorie II: Kanonisches und großkanonisches Ensemble
427
Hierbei ist nun β eine komplexe Variable, und es wird parallel zur imagin¨ aren Achse l¨ angs von c > 0 integriert. Charakteristische Energie. Die mittlere Energie E des kanonischen Ensembles berechnet sich zu ∂ ln Z E(T, x) = − . ∂β x Die zugeh¨ orige mittlere Abweichung ist 2 ∂E ∂ ln Z ∂E 2 2 = kT = − (∆E)2 = E 2 − E = ∂T x ∂β 2 ∂β x x = kT 2 Cx , wobei Cx = ∂E/∂T x die spezifische W¨ arme bei konstanten a ¨ußeren Para9 metern x bezeichnet. Wir haben somit (∆E)2 1 √ . (4.37) ∼O E N Damit ist gezeigt, daß praktisch alle Systeme im kanonischen Ensemble im Limes N → ∞ in einem Zustand der Energie E anzutreffen sind. Wir folgern hieraus, daß die Energieverteilung W (E) ein scharfes Maximum um den Mittelwert E besitzt, der sich aus folgender Maximumsbedingung ergibt: ∂W ∂S 1 ∂ ln g(E) . = β =⇒ = = 0 =⇒ ∂E ∂E T ∂E E=E
E=E
E=E
Hierbei wurde in der letzten Beziehung die Identit¨ at S = k ln g benutzt.10 Offensichtlich beschreiben mikrokanonisches und kanonisches Ensemble im thermodynamischen Limes dieselbe physikalische Situation, in der die Energie des betrachteten Systems einen scharfen Wert besitzt, obwohl im kanonischen Ensemble lediglich die Temperatur vorgegeben ist. F¨ ur kleine Systeme mit relativ wenigen Freiheitsgraden beschreiben mikrokanonisches und kanonisches Ensemble dagegen h¨ ochst unterschiedliche Situationen. In diesem Fall ist n¨ amlich die relative Schwankung (4.37) nicht mehr vernachl¨ assigbar klein, so daß das physikalische System im kanonischen Ensemble bei gegebener Temperatur starken Energiefluktuationen unterliegt.
9
10
Im kanonischen Ensemble werden u außeren Parameter x = ¨blicherweise die ¨ (V, N ) betrachtet. in diesem Fall ist Cx = CV die spezifische W¨ arme bei konstantem Volumen und konstanter Teilchenzahl. Man beachte, daß S die Entropie des kleinen Systems 1 (und nicht etwa die Gesamtentropie des kombinierten Systems 1+2) bedeutet.
428
4. Statistische Physik und Thermodynamik
Freie Energie. Unter Ber¨ ucksichtigung von −1 2 2 ∂ ln g(E) ∂E 1 ∂ 1 ∂ 1 ∂ S = = = 2 ∂E x kT ∂T x ∂T x kT k ∂E 2 x ∂E 1 =− 2 kT Cx liefert die Entwicklung von ln[ZW (E)] um den Maximumspunkt E ln[ZW (E)] = −βE + ln g(E) = −βE + so daß W (E) =
S (E − E)2 , − k 2kT 2 Cx
1 −β(E−T S) (E − E)2 e . exp − Z 2kT 2 Cx
. Hieraus folgt aufgrund der Normierungsbedingung dEW (E) = 1 f¨ ur die kanonische Zustandssumme 1 −kT ln Z(T, x) = (E − T S) − kT ln 2πkT 2 Cx . 2 Der letzte Term dieser Gleichung ist von der Ordnung O(ln N ) und deshalb gegen¨ uber den anderen Termen der Ordnung O(N ) im Limes N → ∞ vernachl¨ assigbar, so daß −kT ln Z(T, x) = (E − T S) . Insgesamt k¨ onnen wir festhalten: Satz 4.10: Kanonisches Ensemble Das kanonische Ensemble beschreibt den Gleichgewichtszustand eines Systems bei vorgegebener Temperatur T : 1 1 Pr (T, x) = e−βEr (x) , Z(T, x) = . e−βEr (x) , β = Z(T, x) kT r Aus ihm k¨ onnen alle Mittelwerte berechnet werden. Insbesondere gilt f¨ ur die thermodynamische Energie ∂ ln Z E(T, x) = Pr (T, x)Er (x) = − . ∂β x r Im thermodynamischen Limes sind die Energiefluktuationen im kanonischen Ensemble verschwindend gering. Die Verbindung zur Thermodynamik ist durch −kT ln Z(T, x) = F (T, x) = E − T S gegeben, wobei F die freie Energie bezeichnet. Der Ausdruck e−βE heißt Boltzmann-Faktor.
4.3 Ensemble-Theorie II: Kanonisches und großkanonisches Ensemble
429
Interpretiert man die in Satz 4.3 stehenden Zust¨ ande | ψr wieder als die zu H geh¨ orenden Energieeigenzust¨ ande zur Energie Er , dann lautet der kanonische Dichteoperator 1 e−βH e−βH ρ= , (4.38) | ψr ψr | = | ψr e−βEr ψr | = Z tr (e−βH ) Z r r wobei im Nenner die Beziehung ? = Z= ψr | e−βH |ψr = tr e−βH e−βEr = r
r
benutzt wurde. In der Energieeigenbasis ist die zugeh¨ orige Dichtematrix diagonal: e−βEn ρnm = ψn | ρ |ψm = −βEn δnm . e
(4.39)
n
4.3.2 Großkanonisches Ensemble Das kanonische Ensemble wurde eingef¨ uhrt, um physikalische Situationen beschreiben zu k¨ onnen, in denen die sehr restriktive Annahme einer konstanten Energie durch die experimentell leichter zu kontrollierende Vorgabe einer konstanten Temperatur ersetzt wird. Wir wollen nun dieses Szenario erweitern, indem wir neben Energieaustausch auch den Austausch von Teilchen zulassen, wobei die zugeh¨ origen intensiven Gr¨ oßen Temperatur und chemisches Potential von außen vorgegeben seien. Dieser Fall tritt insbesondere bei quantenfeldtheoretischen und chemischen Prozessen auf, in denen Teilchen erzeugt und vernichtet werden k¨ onnen. Die zugeh¨ orige statistische Beschreibung liefert das großkanonische Ensemble. Seine Besetzungswahrscheinlichkeiten lassen sich analog zum kanonischen Ensemble durch das Zusammenbringen des betrachteten Systems mit einem W¨ arme- und Teilchenreservoir berechnen. Betrachten wir hierzu wieder ein kleines System 1, das mit einem sehr viel gr¨ oßeren System 2 Energie und Teilchen austauschen kann (Abb. 4.4). Das
System 1 (T, Er , Ns )
System 2 (T, E − Er , N − Ns )
Abb. 4.4. Physikalisches System im Kontakt mit einem sehr viel gr¨ oßeren W¨ armeund Teilchenbad, welches die Temperatur und das chemische Potential beider Systeme vorgibt
430
4. Statistische Physik und Thermodynamik
große System reguliert also die Temperatur T und das chemische Potential µ des kleinen Systems. Trotz erlaubter Energie- und Teilchenschwankungen Er + E2 = E = const , Ns + N2 = N = const , nehmen wir an, daß immer gilt: Er E , N s N .
(4.40)
Wir interessieren uns f¨ ur die Frage: Wir groß ist die Wahrscheinlichkeit Pr,s (T, µ, x), das kleine System 1 im Gleichgewicht bei vorgegebener Temperatur T und vorgegebenem chemischen Potential µ im Mikrozustand (r, Ns ) zu finden?11 Zu ihrer Beantwortung gehen wir wieder vom 2. statistischen Postulat aus, nach dem alle Zust¨ande des isolierten Gesamtsystems gleichwahrscheinlich sind. Von diesen Ω(E, N ) Zust¨anden gibt es Ω2 (E − Er , N − Ns ) Zust¨ ande, f¨ ur die das System 1 in einem bestimmten Mikrozustand mit (Er , Ns ) ist. Deshalb ist Pr,s (T, µ, x) gegeben durch Pr,s (T, µ, x) ∼ Ω2 (E − Er , N − Ns ) . Unter Beachtung von (4.40) liefert die Entwicklung von ln Pr,s um den Punkt (E, N ) ln Ω2 (E − Er , N − Ns ) = ln Ω2 (E, N ) +
∂ ln Ω2 (E − Er ) ∂E
∂ ln Ω2 (N − Ns ) + . . . ∂N ∂ ln Ω2 ∂ ln Ω2 Er − Ns . ≈ const − ∂E ∂N +
Mit ∂Ω2 ∂ ln Ω2 , −βµ = ∂E ∂N folgt schließlich die (normierte) Wahrscheinlichkeitsverteilung β=
1 e−β(Er (Ns )−µNs ) Y (T, µ, x) 1 z Ns e−βEr (Ns ) , = Y (T, µ, x)
Pr,s (T, µ, x) =
wobei Y (T, µ, x) =
e−β(Er (Ns )−µNs )
r,s
die großkanonische Zustandssumme und z = eβµ die Fugazit¨ at ist. 11
Man beachte: In r sind alle Quantenzahlen bei festgehaltener Teilchenzahl Ns zusammengefaßt.
4.3 Ensemble-Theorie II: Kanonisches und großkanonisches Ensemble
431
Charakteristische Energie und Teilchenzahl. Man erh¨ alt die mittlere Energie E und die mittlere Teilchenzahl N aus ∂ ln Y 1 ∂ ln Y E(T, µ, x) = − , N (T, µ, x) = . ∂β β ∂µ z,x T,x F¨ ur die relative Schwankung der Teilchenzahl gilt 2 2 ∂ ln Y 1 kT ∂N N2 − N (∆N )2 = = = . 2 2 2 2 ∂µ2 ∂µ T,x N N N β2 N T,x
(4.41)
Zur weiteren Auswertung dieser Gleichung nehmen wir vereinfachend an, daß x den ¨ außeren Volumenparameter V darstellt (dies ist u ¨blicherweise der Fall) und benutzen vorausgreifend die thermodynamische Relation (siehe Unterabschn. 4.5.2) V S dP − dT . N N Hieraus folgt 2 ∂µ ∂µ N ∂P V ∂P =v , v= =V . =⇒ − ∂v T ∂v T V ∂V T,N N ∂N T,V dµ =
Somit wird (4.41) zu (∆N )2 N
2
kT = − 2 κT , κT = V
∂V ∂P
, T,N
wobei κT die isotherme Kompressibilit¨ √ at bezeichnet. Hieraus erkennt man, ur große Teildaß die Teilchendichte wie O 1/ N fluktuiert und somit f¨ chenzahlen vernachl¨ assigbar ist. Eine entsprechende Rechnung f¨ ur die Energiefluktuationen ergibt (x = V ) ∂E ∂E 2 2 (∆E) = − = kT ∂β V,µ ∂T V,µ
∂E ∂N ∂E 2 . (4.42) = kT + ∂T V,N ∂N T,V ∂T V,µ Unter Ausnutzung der Maxwell-Relation (siehe die letzte Zeile von (4.59) in Unterabschn. 4.5.2) ∂N ∂2J ∂S ∂2J =− = =− ∂T V,µ ∂T ∂µ ∂µ∂T ∂µ T,V k¨onnen wir (4.42) weiter vereinfachen zu
432
4. Statistische Physik und Thermodynamik
(∆E)2 = kT 2 CV + kT 2
∂E ∂N
= (∆E)2kan + kT = (∆E)2kan +
∂E ∂N
∂E ∂N 2
T,V
2
T,V
∂S ∂E ∂N ∂µ
T,V
∂E ∂µ
T,V
T,V
(∆N )2 . T,V
Die Energiefluktuationen im großkanonischen Ensemble sind offenbar gleich denen im kanonischen Ensemble plus einem Beitrag, der von den Teilchenfluktuationen herr¨ uhrt. Es sei darauf hingewiesen, daß es f¨ ur die Energie √ und Teilchenfluktuationen durchaus Abweichungen vom normalen O 1/ N Verhalten geben kann. Dies geschieht in der N¨ahe von Phasen¨ uberg¨angen, wo die Kompressibilit¨at κT stark anwachsen kann. κT ist dann von der Ordnung O(N ). Im thermodynamischen Limes besitzen unter normalen Umst¨anden praktisch alle Mitglieder des großkanonischen Ensembles dieselbe Energie E = E und Teilchenzahl N = N . Unter Ber¨ ucksichtigung der Ergebnisse des letzten Unterabschnitts k¨onnen wir deshalb festhalten, daß mikrokanonisches, kanonisches und großkanonisches Ensemble ¨aquivalente Beschreibungen makroskopischer Systeme sind. Großkanonisches Potential. Die großkanonische Zustandssumme l¨aßt sich auch in der Weise ∞ Y (T, z, x) = z N Z(T, N, x) (4.43) N =1
schreiben, wobei Z(T, N, x) die kanonische Zustandssumme des N -Teilchenzustands ist. Die obere Summationsgrenze wurde hierbei ins Unendliche verschoben, da nur Systeme zur Zustandssumme beitragen, deren Teilchenzahlen Ns signifikant kleiner sind als die Gesamtteilchenzahl von System+Teilchenreservoir. Nun ist aus (4.43) zu erkennen, daß die Wahrscheinlichkeit WE (N ), das betrachtete System in einem Zustand der Energie E und der Teilchenzahl N zu finden, gegeben ist durch 1 N 1 z Z(T, N, x) = e−β(E−T S−µN ) . Y Y Da diese Verteilung im thermodynamischen Limes aufgrund der verschwindenden Fluktuationen ein scharfes Maximum um den Mittelwert N besitzt, muß die großkanonische Zustandssumme trivialerweise ¨aquivalent zur kanonischen Gesamtheit mit N Teilchen sein. Es folgt also WE (N ) =
Y (T, z, x) = z N Z(T, N , x) =⇒ −kT ln Y = E − T S − µN .
4.3 Ensemble-Theorie II: Kanonisches und großkanonisches Ensemble
433
Satz 4.11: Großkanonisches Ensemble Das großkanonische Ensemble beschreibt den Gleichgewichtszustand eines Systems bei vorgegebener Temperatur T und vorgegebenem chemischen Potential µ: 1 e−β(Er (Ns )−µNs ) Y (T, µ, x) Y (T, µ, x) = e−β(Er (Ns )−µNs )
Pr,s (T, µ, x) =
r,s
=
∞
z N Z(T, N, x) , z = eβµ .
N =1
Aus ihm k¨ onnen alle Mittelwerte berechnet werden. Insbesondere gilt f¨ ur die thermodynamische Energie und die mittlere Teilchenzahl ∂ ln Y E(T, µ, x) = Pr,s (T, µ, x)Er (Ns , x) = − ∂β z,x r,s 1 ∂ ln Y Pr,s (T, µ, x)Ns = . N (T, µ, x) = β ∂µ T,x r,s Im thermodynamischen Limes sind die Energie- und Teilchenfluktuationen im großkanonischen Ensemble (außerhalb von Phasen¨ uberg¨ angen) verschwindend gering. Die Verbindung zur Thermodynamik ist durch −kT ln Y (T µ, x) = J(T, µ, x) = E − T S − µN gegeben, wobei J das großkanonische Potential bezeichnet. Die zu (4.38) und (4.39) korrespondierenden Beziehungen f¨ ur den großkanonischen Dichteoperator und die zugeh¨ orige Dichtematrix in der Energiebasis lauten ρ=
e−β(En −µN ) e−β(H−µN ) , ρnm = −β(E −µN ) δnm . −β(H−µN ) n e tr e n
4.3.3 Vergleich der Ensembles Nach den Er¨ orterungen dieses und des vorangegangenen Abschnittes l¨ aßt sich ein einfaches Prinzip erkennen, welches das mikrokanonische, das kanonische und das großkanonische Ensemble in Beziehung setzt. Alle drei Ensembles sind n¨ amlich u ¨ber Laplace-Transformationen miteinander verbunden: Die kanonische Zustandssumme Z ergibt sich aus der Summe u ¨ber die mikroka” nonischen Zustandssummen“ g(E) (Phasenraumdichte, Entartungsfunktion, siehe (4.16)), die jeweils mit einem Boltzmann-Faktor e−βE gewichtet werden:
434
4. Statistische Physik und Thermodynamik
Z(T, N, x) =
g(E)e−βE(N,x) .
E
Hierbei ist, anders als im mikrokanonischen Ensemble, nicht mehr die Energie E vorgegeben, sondern lediglich die Temperatur T und somit die mittlere Energie E. Die großkanonische Zustandssumme Y resultiert aus der Summe u ¨ber alle kanonischen Zustandssummen Z zu den gegebenen Gr¨oßen Temperatur T , Volumen V und Teilchenzahl N , jeweils gewichtet mit dem Faktor eβµN : eβµN Z(T, N, x) . (4.44) Y (T µ, x) = N
Hierbei kann das betrachtete System sowohl Energie als auch Teilchen mit seiner Umgebung austauschen, wobei seine Energie- und Teilchenmittelwerte E, N durch Vorgabe der Temperatur T und des chemischen Potentials µ fixiert sind. Hat man es mit einem System nichtwechselwirkender Teilchen zu tun, dann faktorisiert die kanonische Zustandssumme, so daß im Falle ununterscheidbarer Teilchen gilt: 1 N Z (T, 1, x) . Z(T, N, x) = (4.45) N! Setzt man diese Gleichung in (4.44) ein, dann ergibt sich 1 N Y (T, µ, x) = eβµ Z(T, 1, x) = exp eβµ Z(T, 1, x) . N! N
Alle Ensembles sind prinzipiell anwendbar, um die thermodynamischen Eigenschaften eines Systems zu untersuchen. Welches speziell gew¨ahlt wird, ist oft nur eine Sache der Anschauung bzw. Bequemlichkeit. Wie wir gesehen haben, sind die Fluktuationen der Energie und Teilchenzahl im Limes N → ∞ vernachl¨ assigbar, so daß die Mittelwerte von Observablen sehr scharf sind und ¨ deshalb alle drei Ensembles ¨aquivalente Beschreibungen liefern. Die Aquivalenz der Ensembles gilt nat¨ urlich nicht mehr f¨ ur mikroskopische Systeme mit wenigen Freiheitsgraden. Im kanonischen Ensemble ist z.B. die Wahrscheinlichkeitsverteilung eines einzelnen Teilchens proportional zum BoltzmannFaktor und somit sehr breit: (∆E)2 = O(1) . E Der kanonischen und großkanonischen Zustandssumme ist jeweils ein thermodynamisches Potential (freie Energie bzw. großkanonisches Potential) zugeordnet, so wie zur mikrokanonischen Zustandssumme die Entropie geh¨ort. In Abschn. 4.5 werden wir zeigen, daß jedes dieser Potentiale die vollst¨andige thermodynamische Information eines Gleichgewichtssystems enth¨alt. Wir k¨ onnen deshalb das am Ende des vorigen Abschnittes angegebene Schema (4.25) zur Bestimmung thermodynamischer Relationen um die entsprechenden Zusammenh¨ange f¨ ur das kanonische und großkanonische Ensemble in folgender Weise erweitern:
Anwendungen
435
⎧ ⎫ ⎧ ⎫ ⎨ Ω(E, N, x) → S(E, N, x) ⎬ ⎨ thermody- ⎬ H(N, x) → Er (N, x) → Z(T, N, x) → F (T, N, x) → namische . ⎩ ⎭ ⎩ ⎭ Y (T, µ, x) → J(T, µ, x) Relationen Wie die Berechnung der thermodynamischen Relationen konkret aussieht, werden wir in Abschn. 4.5 detailliert diskutieren. Zusammenfassung • Das kanonische Ensemble beschreibt ein Gleichgewichtssystem bei vorgegebener Temperatur T . Es setzt sich aus vielen gleichartigen (nicht unbedingt makroskopischen) Systemen mit verschiedenen Energien Er zusammen, die jeweils mit dem Boltzmann-Faktor e−Er /kT gewichtet werden. • Das großkanonische Ensemble beschreibt ein Gleichgewichtssystem bei vorgegebener Temperatur T und vorgegebenem chemischen Potential µ. Seine Mitglieder bestehen aus vielen gleichartigen (nicht unbedingt makroskopischen) Systemen mit verschiedenen Energien Er und verschiedenen Teilchenzahlen Ns , die jeweils mit dem Faktor e−(Er −µNs )/kT gewichtet werden. • Im thermodynamischen Limes sind die Energie- und Teilchenfluktuationen im kanonischen bzw. großkanonischen Ensemble verschwindend gering, so daß mikrokanonisches, kanonisches und großkanonisches Ensemble ¨ aquivalente Beschreibungen makroskopischer Systeme liefern. • Die kanonische Zustandssumme ist der freien Energie und die großkanonische Zustandssumme dem großkanonischen Potential zugeordnet. • Alle drei Ensembles sind u ¨ber Laplace-Transformationen miteinander verbunden.
Anwendungen 58. Ideales Gas III: Kanonisches und großkanonisches Ensemble. Anhand des idealen Gases ist zu zeigen, daß im thermodynamischen Limes (wo N = N und E = E) mikrokanonisches, kanonisches und großkanonisches Ensemble ¨ aquivalent sind. Hierzu sollte man • die kanonische und großkanonische Zustandssumme sowie die zugeh¨ origen Potentiale bestimmen, • unter Verwendung der Gleichungen (siehe (4.59), Unterabschn. 4.5.2) ∂F ∂J S(T, V, N ) = − , S(T, V, µ) = − (4.46) ∂T V,N ∂T µ,V
436
4. Statistische Physik und Thermodynamik
die entsprechenden Entropien berechnen und diese mit der mikrokanonischen Entropie (4.32) vergleichen. L¨ osung. Die kanonische Zustandssumme lautet 3N p2 i , Z(T, V, N ) = exp − 2mkT r i=1 wobei r = (x1 , . . . , x3N , p1 , . . . , p3N ) einen klassischen Mikrozustand des idealen Gases spezifiziert. Wir k¨onnen die Summe u ¨ber die Mikrozust¨ande in der Weise 1 dΓ −→ N !h3N r durch ein Integral u ¨ber den Phasenraum ersetzen, wobei die Ununterscheidbarkeit der Teilchen durch den Gibbs-Faktor 1/N ! ber¨ ucksichtigt ist. Somit folgt 3N p2 1 i dΓ exp − Z(T, V, N ) = 2mkT N !h3N i=1 ⎤ ⎡ ∞ 3N VN ⎣ p2 ⎦ = dp exp − N !h3N 2mkT N
=
V N!
wobei Z1 = Z(T, V, 1) = V
−∞
2πmkT h2
3N/2
2πmkT h2
=
Z1N , N!
(4.47)
3/2
die Ein-Teilchen-Zustandssumme ist. Hieraus und unter Ber¨ ucksichtigung der Stirlingschen Formel (4.28) ergibt sich die freie Energie zu
3/2 V 2πmkT F (T, V, N ) = −N kT ln − N kT . N h2 Benutzen wir nun die erste Gleichung aus (4.46), dann folgt
3/2 V 2πmkT 5 S(T, V, N ) = N k ln + Nk . 2 N h 2 Diese Gleichung ist identisch mit der aus (4.32) folgenden mikrokanonischen Entropie. Zur Berechnung der großkanonischen Zustandssumme und des großkanonischen Potentials nutzen wir das Resultat (4.47) und schreiben
Anwendungen
Y (T, V, µ) =
Nµ
e kT Z(T, V, N ) =
N
N 1 Z1 eµ/kT = exp Z1 eµ/kT N! N
3/2 2πmkT = exp V eµ/kT h2 =⇒ J(T, V, µ) = −kT V
2πmkT h2
437
(4.48)
3/2 eµ/kT .
Mit Hilfe der zweiten Gleichung aus (4.46) erhalten wir hieraus 3/2 5 2πmkT µ µ/kT . S(T, V, µ) = kV e − h2 2 kT Um diesen Ausdruck mit (4.32) vergleichen zu k¨ onnen, m¨ ussen wir µ eliminieren. Zu diesem Zweck rechnen wir: 3/2 ∂ ln Y 2πmkT N = kT =V eµ/kT 2 h ∂µ T
−3/2 µ N 2πmkT =⇒ = ln h2 V kT 5 3/2 V 2πmkT 5 =⇒ S(T, V, N ) = N k ln . + N h2 2 Diese Gleichung stimmt wiederum mit (4.32) u ¨berein. 59. Maxwellsche Geschwindigkeitsverteilung. Man berechne die Geschwindigkeitsverteilung f¨ ur ein Atom eines idealen Gases, das in einem Volumen V eingeschlossen ist. L¨ osung. Die anderen Atome im Gas k¨ onnen f¨ ur das eine betrachtete Atom als W¨ armebad angesehen werden, das die Temperatur dieses Atoms konstant h¨ alt. Somit ist hier das kanonische Ensemble zu bevorzugen. Nach (4.47) gilt f¨ ur die Ein-Teilchen-Zustandssumme 3/2 2πmkT V p2 3 Z(T, V, 1) = Z1 = 3 =V d p exp − . h 2mkT h2 Der mittlere Impuls berechnet sich zu V p2 . d3 pp exp − p= 3 h Z1 2mkT Wir erkennen hieraus, daß V p2 3 W (p)d p = 3 exp − d3 p h Z1 2mkT die Wahrscheinlichkeit ist, daß das betrachtete Atom einen Impuls im Intervall [p : p + d3 p] besitzt bzw. daß
438
4. Statistische Physik und Thermodynamik
V p2 4πp2 dp W (p)dp = 3 exp − 2mkT h Z1 die Wahrscheinlichkeit ist, daß das betrachtete Atom einen Impulsbetrag im Intervall [p : p + dp] hat. Setzen wir schließlich p = mv, dann folgt die (normierte) Maxwellsche Wahrscheinlichkeitsverteilung f¨ ur die Atomgeschwindigkeit: m 3/2 mv 2 2 W (v) = 4π . v exp − 2πkT 2kT
4.4 Entropie und Informationstheorie In diesem Abschnitt behandeln wir die Informationstheorie, wie sie von Shannon entwickelt wurde. Das Ziel dieser Theorie sind Vorhersagen, die auf unvollst¨ andiger Information basieren. Offensichtlich ist dies sehr ¨ahnlich dem Problem der statistischen Physik, wie sie in den vorherigen Abschnitten entwickelt wurde. Somit ist es nicht u ¨berraschend, daß die Methoden der Informationstheorie – richtig interpretiert – in der statistischen Physik angewandt werden k¨ onnen. Nachdem wir gezeigt haben, daß die Shannonsche Entropie ¨aquivalent zur statistischen Entropie ist, greifen wir noch einmal die drei in den letzten beiden Abschnitten diskutierten Ensembles auf und erl¨autern, wie sich diese als L¨ osungen von Variationsproblemen der Shannonschen Entropie ergeben. 4.4.1 Informationstheorie und Shannon-Entropie Der Makrozustand eines Systems ist definiert u ¨ber einen Satz von Wahrscheinlichkeiten {P1 , P2 , . . .} = {P } von Mikrozust¨anden. Einem Satz von Ereignissen einen Satz von Wahrscheinlichkeiten zuzuweisen, kann also gewissermaßen als Information aufgefaßt werden. Herleitung der Shannon-Entropie. Shannon zeigte ganz allgemein, daß sich das Maß f¨ ur Information bzw. fehlender Information durch eine Entropiefunktion S({P }) beschreiben l¨aßt, die durch folgende Bedingungen eindeutig festgelegt ist: • S({P }) ist eine kontinuierliche, differenzierbare und eindeutige Funktion der (normierten) Wahrscheinlichkeiten {P }. • Im Falle N gleichwahrscheinlicher Ereignisse, Pi = 1/N , ist die Entropie eine monoton wachsende Funktion in Abh¨angigkeit von N . F¨ ur diesen Spezialfall f¨ uhren wir die Schreibweise 6 7 1 I(N ) = S Pi = N ein.
4.4 Entropie und Informationstheorie
439
• Die Unsicherheit in einem Satz von Wahrscheinlichkeiten bleibt unver¨ andert, wenn diese in Gruppen unterteilt werden. Sei etwa eine Unterteilung wie folgt: w1 =
n1
n2
Pi , w2 =
Pi , . . . , wk =
i=n1 +1
i=1
n k =N
Pi ,
i=nk−1 +1
dann gilt S({P }) = S({w}) +
k
wj S
j=1
{P } wj
.
Im zweiten Term ist der Faktor wj notwendig, da dies die Wahrscheinlichort. keit angibt, daß ein Ereignis tats¨ achlich zur Gruppe wj geh¨ Um die Form von S({P }) zu finden, betrachten wir zun¨ achst den Fall gleicher Wahrscheinlichkeiten, 1 1 , . . . , Pn·m = , n, m ∈ N , nm nm die in m gleich große Gruppen unterteilt sind: P1 =
w1 =
n i=1
Pi =
1 , . . . , wm = m
nm
Pi =
i=(m−1)n+1
1 . m
Die letzte der Shannonschen Bedingungen ergibt dann I(nm) = I(m) +
m 1 I(n) = I(m) + I(n) . m j=1
Da S({P }) kontinuierlich ist, k¨ onnen wir nach n ableiten. Mit p = nm gibt dies d d m I(p) = I(n) . dp dn Multiplikation beider Seiten mit n liefert p
d d I(p) = n I(n) = const . dp dn
Dieser Ausdruck muß konstant sein, da wir p ¨ andern, k¨ onnen ohne n zu variieren. Hieraus folgt I(n) = k ln n , k = const .
(4.49)
Nun betrachten wir den allgemeineren Fall gleicher Wahrscheinlichkeiten, die jedoch in unterschiedlich große Gruppen aufgeteilt sind: 1 αj Pi = , ωj = , αj = n , n, αj ∈ N . n n j
440
4. Statistische Physik und Thermodynamik
Shannons dritte Bedingung ergibt nun unter Ber¨ ucksichtigung von (4.49) αj I(n) = S({w}) + I(αj ) n j =⇒ S({w}) =
αj j
= −k
[I(n) − I(αj )] = −k
n α j
j
n
ln
α j
n
= −k
αj
j
n
[ln αj − ln n]
wj ln wj .
j
Mit der Ersetzung wi → Pi k¨onnen wir daher definieren: Definition: Shannon-Entropie Die Shannon-Entropie eines Systems mit den relativen Wahrscheinlichkeiten {P1 , P2 , . . .} ist S = −k Pi ln Pi , k > 0 , Pi = 1 . i
i
¨ Die Gr¨ oße − ln Pi wird Uberraschung (engl. surprise) genannt. Man beachte, daß f¨ ur Pi = 0 auch Pi ln Pi identisch Null ist; Ereignisse mit der Wahrscheinlichkeit Null tragen nicht zur Entropie bei. Die Konstante k in obiger Definition wird meist auf den Wert 1 oder 1/ ln 2 (Informationstheorie) gesetzt. Man erkennt leicht, daß die Shannon-Entropie gleich der statistischen Entropie ist, wenn k die Boltzmann-Konstante ist. Setzen wir n¨ amlich f¨ ur Pi die konstanten mikrokanonischen Wahrscheinlichkeiten 1/Ω ein, dann folgt 1 ln Ω = k ln Ω . (4.50) S=k Ω i Eigenschaften der Shannon-Entropie. Die Shannon-Entropie hat die folgenden Eigenschaften: • Die Entropie ist nicht negativ, weil k eine positive Konstante ist. • Falls eine der Wahrscheinlichkeiten Pi = 1 ist, und damit alle anderen notwendigerweise Null sind, dann ist S identisch Null. Dies entspricht einem Experiment mit eindeutigem Ausgang. • S ist f¨ ur einen Satz von gleichen Wahrscheinlichkeiten Pi = P maximal, denn es gilt mit dPi = 0 dS = −k
i
i
(ln Pi + 1)dPi = −k ln P
i
dPi − k
i
dPi = 0 .
4.4 Entropie und Informationstheorie
441
• F¨ ur unabh¨ angige Ereignisse ist S eine additive Gr¨ oße: Pi Pj ln(Pi Pj ) S12 = −k i,j
= −k
(Pi Pj ln Pi + Pi Pj ln Pj )
i,j
= S1
Pj + S 2
j
Pi = S 1 + S 2 .
i
• Falls {P } einem gemischten Zustand mit der Dichtematrix | i Pi i| ρ= i
entspricht, dann ist die Shannon-Entropie S(ρ) = −k Pi ln Pi = −ktr (ρ ln ρ) . i
Wir wollen nun die Aussage beweisen, daß die Shannon-Entropie einer Gleichgewichtsverteilung maximal ist. Hierzu betrachten wir neben dem Dichteoperator einer Gleichgewichtsverteilung {P }, ρ= | n Pn n| , n
origen Dichteoperator eine beliebige andere Verteilung {P } mit dem zugeh¨ ρ = | n Pn n | , n
wobei wir annehmen, daß die Basissysteme {| n } und {| n } denselben Hilbert-Raum aufspannen. Desweiteren f¨ uhren wir die Hilfsfunktion (Boltzmannsche H-Funktion) H = tr [ρ (ln ρ − ln ρ )] ein und formen diese durch Einf¨ ugen der Einsoperatoren | n n| in folgender Weise um: n
H =
n
| n n | und
Pn [ n | ln ρ |n − ln Pn n | n ]
n
=
Pn [ n | ln ρ |n n| n − ln Pn n | n n| n ]
n,n
=
Pn | n| n |2 (ln Pn − ln Pn )
n,n
=
n,n
Pn | n| n |2
ln
Pn Pn
.
(4.51)
442
4. Statistische Physik und Thermodynamik
Nun gilt ln x ≤ x − 1, so daß folgt: | n| n |2 (Pn − Pn ) = tr(ρ − ρ ) = 0 . H≤
(4.52)
n,n
Setzen wir jetzt in die Gleichgewichtsverteilung ρ die mikrokanonischen Wahrscheinlichkeiten Pn = 1/Ω ein, dann ergibt sich unter Ber¨ ucksichtigung von (4.50) H = − ln Ω Pn | n| n |2 − Pn ln Pn | n| n |2 =−
n
n
n
n
S S + ≤0 k k
=⇒ S ≥ S . Insgesamt folgt12 Satz 4.12: Shannonscher Entropiesatz Die Shannon-Entropie eines abgeschlossenen Systems im Gleichgewicht ist maximal: S = maximal . Dieser Satz stellt die Verbindung zwischen der Shannonschen Informationstheorie und der statistischen Physik her. Wie wir im n¨achsten Unterabschnitt zeigen werden, ergeben sich die in den letzten beiden Abschnitten diskutierten Ensembles auf nat¨ urliche Weise durch Maximieren der Shannon-Entropie unter Ber¨ ucksichtigung ad¨aquater Randbedingungen. 4.4.2 Variation der Entropie Bevor wir auf die mikrokanonischen, kanonischen und großkanonischen Ensembles zu sprechen kommen, betrachten wir zun¨achst ganz allgemein ein Gleichgewichtssystem, welches durch folgende Mittelwertbedingungen charakterisiert wird: (1) (2) Pi Ai = A(1) , Pi Ai = A(2) , . . . . i
i
Um den zugeh¨ origen Satz von Wahrscheinlichkeiten {P } zu finden, haben wir nach Satz 4.12 die station¨aren Punkte der Shannon-Entropie unter Ber¨ ucksichtigung obiger Bedingungen aufzusuchen. Zu diesem Zweck benutzen wir die Methode der Lagrange-Parameter und erhalten somit folgende Variationsbedingung: 12
In Anwendung 61 werden wir die Extremalit¨ atsbedingung (4.52) f¨ ur die kanonische und großkanonische Verteilung heranziehen. Dies liefert uns entsprechende Minimumsprinzipien der freien Energie und des großkanonischen Potentials.
4.4 Entropie und Informationstheorie
443
δF (P1 , P2 , . . .) = 0 , mit F (P1 , P2 , . . .) = −k
Pi ln Pi − β1
i
(1)
Pi A i
i
− β2
(2)
P i Ai
+ ... .
i
Hieraus folgt (1)
(2)
−k(ln Pi + 1) − β1 Ai − β2 Ai − . . . = 0 ⎞ ⎞ ⎛ ⎛ 1 (j) (j) βj Ai ⎠ , Φ = exp ⎝− βj Ai ⎠ , =⇒ Pi = exp ⎝− Φ j j i wobei im letzten Schritt die βj reskaliert wurden. Zu beachten ist, daß die gefundenen Pi tats¨ achlich zu einem Maximum f¨ uhren, denn es gilt 2 (δPi ) Ps , dann ist auch ln Pr > ln Ps und umgekehrt. Es folgt deshalb (Pr − Ps )(ln Pr − ln Ps ) ≥ 0 . Da jedoch Wrs immer positiv ist, muß jeder Term in der Summe von (4.57) positiv sein. Insgesamt erhalten wir dH ≤0. dt Dies ist das Boltzmannsche H-Theorem (vgl. (4.52)). Da die Funktion H mit der Entropie u ¨ber S = −kH verbunden ist, bedeutet dies auch, daß die Entropie immer zunimmt. Das Gleichheitszeichen gilt nur, falls Pr = Ps f¨ ur ¨ alle Zust¨ ande, f¨ ur die Uberg¨ ange m¨oglich sind, d.h. falls f¨ ur alle m¨oglichen Zust¨ ande gilt: Pr = const. Dies ist nat¨ urlich im Gleichgewicht der Fall und entspricht gerade dem 2. statistischen Postulat. Somit ist nochmals gezeigt, daß die Entropie im Gleichgewicht maximal ist. 61. Extremalit¨ atsbedingungen im kanonischen und großkanonischen Ensemble. Man zeige mit Hilfe der Boltzmannschen H-Funktion die Extremaleigenschaft der freien Energie F = E −T S und des großkanonischen Potentials J = E − T S − µN f¨ ur ein Gleichgewichtssystem im Austausch mit einem W¨ armebad bzw. mit einem W¨arme- und Teilchenbad.
4.5 Thermodynamik
449
L¨ osung. Setzt man in (4.51) die kanonische Verteilung Pn = e−βEn /Z ein, dann gilt Pn | n| n |2 (ln Z + βEn ) + S kH = −k n,n
= −k ln Z − kβtr(ρ H) + S = −k ln Z − kβE + S ≤ 0 . Hieraus folgt −kT ln Z = F = E − T S ≤ E − T S . Die freie Energie ist also bei einem Gleichgewichtssystem mit vorgegebener Temperatur minimal. Setzt man andererseits in (4.51) die großkanonische Verteilung Pn = e−β(En −µNn ) /Y ein, dann ist kH = −k Pn | n| n |2 (ln Y + βEn − βµNn ) + S n,n
= −k ln Y − kβtr(ρ H) + kβµtr(ρ N ) + S = −k ln Y − kβE + βµN + S ≤ 0 . Hieraus folgt −kT ln Y = J = E − T S − µN ≤ E − T S − µN . Das heißt das großkanonische Potential ist bei einem Gleichgewichtssystem mit vorgegebener Temperatur und vorgegebenem chemischen Potential minimal. Im Rahmen der Thermodynamik, Abschn. 4.5, werden wir diese Extremalit¨ atsbedingungen auf anderem Wege herleiten und genauer untersuchen.
4.5 Thermodynamik Die Thermodynamik besch¨ aftigt sich mit der makroskopischen Beschreibung von materiellen Systemen im Gleichgewicht. Sie wurde in der Mitte des 19. Jahrhunderts formuliert, also zu einer Zeit, als die mikroskopische Struktur von Materie noch nicht richtig erkannt wurde bzw. als es noch keinen mikroskopischen Zugang in Form von Ensemble-Theorien gab. Sie stellt somit eine rein ph¨ anomenologische Theorie dar, deren Grundgesetze sich allein auf experimentelle Erfahrung gr¨ unden und axiomatisch postuliert werden. Insbesondere wird die Existenz einer Entropiefunktion S mit der zugeh¨ origen Extremaleigenschaft vorausgesetzt, wobei sich ihre genaue Form im Rahmen der Thermodynamik nur indirekt durch das Experiment bestimmen l¨ aßt. Es wurde bereits des¨ ofteren erw¨ ahnt, daß zwischen der statistischen Physik und der Thermodynamik eine innige Verbindung besteht, weil die statistische Physik die mikroskopische Begr¨ undung f¨ ur die in der Thermodynamik rein makroskopisch definierten Begriffe und Gesetze liefert. Diese Verbindung manifestiert sich in der Boltzmann-Gleichung S = k ln Ω.
450
4. Statistische Physik und Thermodynamik
Dieser Abschnitt behandelt die Theorie der Thermodynamik. Es werden die thermodynamischen Haupts¨ atze vorgestellt und anschließend besprochen. Desweiteren diskutieren wir die thermodynamischen Potentiale, mit deren Hilfe sich Systeme durch die verschiedensten unabh¨angigen Zustandsvariablen ausdr¨ ucken lassen. Es werden thermische Koeffizienten zur Beschreibung von Zustands¨anderungen eingef¨ uhrt und Beziehungen zwischen ihnen hergeleitet. Ferner stellen wir mit Hilfe der thermodynamischen Potentiale Gleichgewichtsbedingungen f¨ ur offene Systeme in Form von einfachen Extremalit¨ atsbedingungen auf und setzen hiermit verbundene Stabilit¨atskriterien mit den thermischen Koeffizienten in Beziehung. Zum Schluß besch¨aftigen wir uns mit W¨ armekraftmaschinen und ziehen insbesondere die ersten beiden Haupts¨ atze heran, um Kriterien f¨ ur ihre Realisierbarkeit abzuleiten. Bevor wir beginnen, geben wir eine kurze Zusammenstellung einiger wichtiger thermodynamischer Begriffe, von denen manche auch schon im Zusammenhang mit der statistischen Physik benutzt wurden: • Jedes makroskopische System ist ein thermodynamisches System. Sein thermodynamischer Zustand wird durch einen Satz von thermodynamischen Zustandsgr¨ oßen beschrieben, also durch meßbare makroskopische Gr¨ oßen wie z.B. Temperatur T , Druck P usw., die einen wohldefinierten Wert besitzen. • Das thermodynamische Gleichgewicht eines Systems ist dadurch definiert, daß sein thermodynamischer Zustand zeitunabh¨angig ist. • Eine Zustandsgleichung ist ein funktionaler Zusammenhang zwischen den Zustandsgr¨ oßen des betrachteten Gleichgewichtssystems. Insbesondere nennt man P = P (T, V, N ) E = E(T, V, N )
thermische Zustandsgleichung kalorische Zustandsgleichung .
• Eine Zustands¨anderung eines Systems verl¨auft quasistatisch, wenn sich die a ¨ußeren Parameter des Systems so langsam a¨ndern, daß das System eine Folge von Gleichgewichtszust¨anden durchl¨auft. Man nennt dar¨ uber hinaus ¨ eine Zustands¨anderung reversibel, wenn die zeitliche Umkehr der Anderung der a ußeren Parameter eine Umkehr der Folge von durchlaufenen ¨ Zust¨ anden bewirkt. Andernfalls heißt die Zustands¨anderung irreversibel. Jede reversible Zustands¨anderung ist demnach auch quasistatisch; die Umkehrung dieser Aussage gilt dagegen i.a. nicht. • Folgende Arten von Zustands¨anderungen sind speziell definiert: Adiabatisch: Keine W¨arme¨anderung: ∆Q = 0 Isentrop:
Keine Entropie¨anderung: ∆S = 0
4.5 Thermodynamik
Isochor:
Kein Volumen¨ anderung:
451
∆V = 0
Isotherm: Keine Temperatur¨ anderung: ∆T = 0 Isobar:
Keine Druck¨ anderung:
∆P = 0 .
• Wird ein System durch eine intensive Zustandsgr¨ oße beschrieben, dann wissen wir aus der statistischen Physik, daß die zugeh¨ orige extensive Gr¨ oße nur als Mittelwert spezifiziert ist. Dieser Mittelwert ist jedoch im Falle makroskopischer Systeme so scharf, daß er faktisch ebenfalls eine Zustandsgr¨ oße des Systems darstellt. Dies werden wir im folgenden konsequent ber¨ ucksichtigen, indem wir keine Mittelwerte hinschreiben, sondern z.B. f¨ ur E und N die Symbole E bzw. N verwenden. In diesem Zusammenhang sei auch darauf hingewiesen, daß in vielen Lehrb¨ uchern der statistische Mittelwert der Energie, E, im Rahmen der Thermodynamik mit innerer Energie U bezeichnet wird. 4.5.1 Haupts¨ atze der Thermodynamik Die Thermodynamik basiert auf folgenden empirisch gefundenen Grundgesetzen: Haupts¨ atze der Thermodynamik 1. Hauptsatz F¨ ur jedes System ist die Energie E eine extensive Zustandsgr¨ oße, welche bei abgeschlossenen Systemen erhalten ist. Tauscht ein System Energie mit seiner Umgebung aus, dann gilt f¨ ur das totale Differential dE ˆ + dW ˆ . dE = dQ ˆ die dem System zugef¨ ˆ die dem Hierbei ist dQ uhrte W¨ armemenge und dW System zugef¨ uhrte mechanische Arbeit. 2. Hauptsatz 1. Teil: Es gibt eine extensive Zustandsgr¨ oße, die Entropie S, und eine intensive Gr¨ oße, die absolute Temperatur T , mit der folgenden Eigenschaft: F¨ ur ein nicht isoliertes System, welches in einem quasistatischen Prozeß die ˆ absorbiert, gilt W¨ armemenge dQ dS =
ˆ dQ T ˆ dQ
f¨ ur reversible Prozesse
f¨ ur irreversible Prozesse . T 2. Teil: Die Entropie eines abgeschlossenen Systems kann mit der Zeit nur gr¨ oßer werden und ist im Gleichgewicht maximal: ∆S ≥ 0. dS >
452
4. Statistische Physik und Thermodynamik
3. Hauptsatz (Nernstscher W¨ armesatz) Beim absoluten Temperatur-Nullpunkt T = 0 n¨ahert sich die Entropie eines T →0 Gleichgewichtssystems dem Entropie-Nullpunkt: S −→ 0. Zum 1. Hauptsatz. Hier werden offenbar zwei Arten der Energiezufuhr unˆ . Beispiele hierf¨ terschieden. Zum einen gibt es die mechanische Arbeit dW ur ¨ der Teilchenzahl. Zum sind etwa eine Volumen¨anderung oder die Anderung ˆ zugef¨ uhrt anderen kann dem System auch Energie in Form von W¨arme dQ werden, und zwar ohne, daß dabei Arbeit verrichtet werden muß. ˆ und dW ˆ ˆ ¨ F¨ ur die infinitesimalen Anderungen dQ wurde das Symbol d eingef¨ uhrt, da Q und W keine Zustandsgr¨oßen sind und somit keine wohldefinierten Werte in Gleichgewichtszust¨anden besitzen. Betrachten wir hierzu z.B. einen Kreisprozeß, bei dem ein System von einem bestimmten Zustand u uckkehrt. ¨ber verschiedene Zwischenzust¨ande in den Ausgangszustand zur¨ F¨ ur solche Prozesse muß die Gesamt¨anderung jeder Zustandsgr¨oße verschwinden. Dies bedeutet f¨ ur die Energie dE = 0 . F¨ ur die w¨ ahrend des Kreisprozesses zugef¨ uhrte W¨arme und Arbeit gilt dagegen i.a. (siehe Unterabschn. 4.5.5) ˆ ˆ = 0 . dQ = − dW ¨ Das heißt die Anderung der W¨arme und der mechanischen Arbeit h¨angt i.a. vom Austauschprozeß selbst ab und nicht, wie bei der Energie, lediglich vom Anfangs- und Endzustand des Systems. Anders ausgedr¨ uckt: Im Gegensatz ˆ und dW ˆ keine totalen Differentiale. zu dE sind dQ Zum 2. Hauptsatz. Bei einer quasistatischen Zustands¨anderung werden die a ¨ußeren Parameter eines Systems hinreichend langsam ver¨andert, so daß sich das System w¨ahrend des gesamten Prozesses im Gleichgewicht befindet. In diesem Fall k¨ onnen wir f¨ ur die am System geleistete Arbeit schreiben: ˆ =− dW Xi dxi , Xi = generalisierte Kraft . i
Unter Verwendung des 1. und 2. Hauptsatzes ergibt sich hieraus die Gibbssche Fundamentalform (vgl. (4.56)): Satz 4.14: Gibbssche Fundamentalform Bei einer quasistatischen Zustands¨anderung ist ˆ + dW ˆ ≤ T dS − dE = dQ Xi dxi . i
Das Gleichheitszeichen gilt f¨ ur reversible Prozesse.
4.5 Thermodynamik
453
L¨osen wir diese Gleichung f¨ ur reversible Prozesse nach dS auf, Xi dE + dxi , dS = T T i und bilden andererseits das totale Differential der Entropie, ∂S(E, x) ∂S(E, x) dS = dE + dxi , ∂xi ∂E i dann folgt durch Vergleich der letzten beiden Gleichungen 1 ∂S(E, x) ∂S(E, x) . = , Xi = T T ∂E ∂xi Diese Ausdr¨ ucke entsprechen gerade den Definitionen der Temperatur (4.21) und der generalisierten Kr¨ afte (4.23) in der statistischen Physik. Wir sehen ¨ hieran explizit die Aquivalenz zwischen den statistischen und thermodynamischen Begriffen Entropie“, Temperatur“ und generalisierte Kr¨ afte“. Ins” ” ” besondere kann deshalb auch hier der in Unterabschn. 4.2.3 stehende Satz 4.9 bzgl. der Gleichgewichtsbedingungen eines zweiteiligen abgeschlossenen Systems unver¨ andert u ¨bernommen werden. Die Temperaturskala wird in der Thermodynamik durch Festlegung einer bestimmten Temperatur definiert. Hierzu w¨ ahlt man konventionsgem¨ aß den Tripelpunkt von Wasser, wo alle drei Phasen Wasserdampf, Wasser und Eis im Gleichgewicht sind, und legt diesen auf Tt = 273.16 K (Kelvin) fest. 1 K ist demnach der 1/273.16-te Teil der Temperaturspanne zwischen T = 0 und T = Tt . Aus dieser Festlegung folgt f¨ ur die Boltzmann-Konstante der Wert k = 1.38054 · 10−23 J/K. Durch den 2. Hauptsatz, 2. Teil wird eine Zeitrichtung vorgegeben, denn ∆S ≥ 0 bedeutet ja dS/dt ≥ 0. Nun wissen wir aber, daß sich die Entropie mikroskopisch, d.h. unter Anwendung der Mechanik bzw. Quantenmechanik begr¨ unden l¨ aßt, also durch Theorien, die zeitumkehrinvariant sind. Da bis heute nicht endg¨ ultig gekl¨ art ist, wie sich die thermodynamische Zeitrichtung quantenmechanisch erkl¨ aren l¨ aßt, m¨ ussen wir ∆S ≥ 0 als reine Erfahrungstatsache hinnehmen. Man beachte in diesem Zusammenhang, daß wir auch in der Elektrodynamik und Quantenmechanik eine Festlegung der Zeitrichtung kennengelernt haben, n¨ amlich bei der Bevorzugung retardierter gegen¨ uber avancierter Potentiale (Unterabschn. 2.2.4) und bei der Bevorzugung auslaufender gegen¨ uber einlaufender Kugelwellen (Unterabschn. 3.10.1). Zum 3. Hauptsatz. Hierdurch sind nicht nur Entropiedifferenzen wie beim 2. Satz, sondern auch die Entropie selbst eindeutig definiert. Experimentelle Unterst¨ utzung dieses Satzes kommt aus der Messung von spezifischen W¨armen, die am Nullpunkt ebenfalls verschwinden sollten. Dies ist bisher f¨ ur alle untersuchten Systeme verifiziert worden.
454
4. Statistische Physik und Thermodynamik
4.5.2 Thermodynamische Potentiale Wie einleitend bereits erw¨ahnt wurde, beschreibt eine Zustandsgleichung den funktionalen Zusammenhang zwischen verschiedenen Zustandsgr¨oßen eines thermodynamischen Systems. Oftmals erweist es sich als g¨ unstig, bestimmte Gr¨ oßen gegen¨ uber anderen vorzuziehen, da diese dem Experiment leichter zug¨ anglich sind. Im allgemeinen geh¨ort zu jedem Satz extensiver Zustandsgr¨ oßen (S, x1 , x2 , . . .) ein konjugierter Satz von intensiven Gr¨oßen (T, X1 , X2 , . . .) so daß man die geeigneten Gr¨oßen aus beiden S¨atzen frei w¨ahlen kann, also z.B. (T, x1 , X2 , x3 , . . .). Wir bestimmen nun die Zustandsgleichungen f¨ ur die folgenden S¨atze von unabh¨angigen Zustandsgr¨oßen (die Verallgemeinerung auf andere Kombinationen ist unproblematisch): (S, V, N ) , (T, V, N ) , (S, P, N ) , (T, P, N ) , (T, V, µ) .
(4.58)
Ausgangspunkt hierf¨ ur ist die Gibbssche Fundamentalform (siehe Satz 4.14): dE = T dS + µdN − P dV , mit der Entropie S, dem Volumen V und der Teilchenzahl N als einzige unabh¨ angige Zustandsgr¨oßen. Aus ihr ergeben sich durch Legendre-Transformationen alle weiteren totalen Differentiale mit den entsprechenden, in (4.58) aufgef¨ uhrten unabh¨angigen Variablenpaaren: Definition: Thermodynamische Potentiale • Energie E (unabh¨angige Zustandsvariablen: S, V, N ): dE = T dS − P dV + µdN =⇒ E = E(S, V, N ) . • Freie Energie F (unabh¨angige Zustandsvariablen: T, V, N ): dF = d(E − T S) = −SdT − P dV + µdN =⇒ F = F (T, V, N ) = E − T S . • Enthalpie H (unabh¨angige Zustandsvariablen: S, P, N ): dH = d(E + P V ) = T dS + V dP + µdN =⇒ H = H(S, P, N ) = E + P V . • Freie Enthalpie G (unabh¨angige Zustandsvariablen: T, P, N ): dG = d(H − T S) = −SdT + V dP + µdN =⇒ G = G(T, P, N ) = E − T S + P V .
4.5 Thermodynamik
455
• Großkanonisches Potential J (unabh. Zustandsvariablen: T, V, µ): dJ = d(F − µN ) = −SdT − P dV − N dµ =⇒ J = J(T, V, µ) = E − T S − µN . Die Zustandsgr¨ oßen E, F , H, G, J heißen thermodynamische Potentiale, sofern sie als Funktion der jeweils angegebenen nat¨ urlichen Variablen auftreten. Um z.B. die freie Enthalpie zu erhalten, hat man die entsprechenden funktionalen Abh¨ angigkeiten E(T, P, N ), S(T, P, N ) und V (T, P, N ) in die Definitionsgleichung G = E − T S + P V einzusetzen. Thermodynamische Kr¨ afte. Schreibt man f¨ ur jedes der angegebenen Potentiale das vollst¨ andige Differential an, dann liefert der Vergleich mit den entsprechenden Definitionsgleichungen die zugeh¨ origen thermodynamischen Kr¨ afte. Sie lauten ⎫ ∂E ∂E ∂E ⎪ ⎪ = −P , =µ =T , ⎪ ⎪ ⎪ ∂S V,N ∂V S,N ∂N S,V ⎪ ⎪ ⎪ ⎪ ⎪ ∂F ∂F ∂F ⎪ ⎪ = −S , = −P , =µ ⎪ ⎪ ∂T V,N ∂V T,N ∂N T,V ⎪ ⎪ ⎪ ⎪ ⎬ ∂H ∂H ∂H =T , =V , =µ (4.59) ∂S P,N ∂P S,N ∂N S,P ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ∂G ∂G ∂G ⎪ ⎪ = −S , =V , =µ ⎪ ⎪ ∂T P,N ∂P T,N ∂N T,P ⎪ ⎪ ⎪ ⎪ ⎪ ∂J ∂J ∂J ⎪ ⎪ = −S , = −P , = −N . ⎪ ⎭ ∂T V,µ ∂V T,µ ∂µ T,V Maxwell-Relationen. Aus der Vertauschbarkeit der partiellen Ableitungen einer Funktion f (x, y), also ∂ 2 f /∂x∂y = ∂ 2 f /∂y∂x, ergeben sich aus jeder Zeile von (4.59) jeweils 3 Maxwell-Relationen. Wir begn¨ ugen uns hier mit der Angabe jeweils einer Maxwell-Relation aus den ersten vier Zeilen; sie entsprechen dem Fall konstanter Teilchenzahl N : ⎫ ∂T ∂P ⎪ ⎪ =− ⎪ ⎪ ∂S V,N ⎪ ∂V S,N ⎪ ⎪ ⎪ ⎪ ⎪ ∂S ∂P ⎪ ⎪ = ⎪ ∂V T,N ∂T V,N ⎬ (4.60) ⎪ ∂T ∂V ⎪ ⎪ = ⎪ ∂P S,N ∂S P,N ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ∂S ∂V ⎪ − = .⎪ ∂P T,N ∂T P,N ⎭
456
4. Statistische Physik und Thermodynamik
Gibbs-Duhem-Relationen. Zwischen dem chemischen Potential µ und der freien Enthalpie G besteht ein besonders einfacher Zusammenhang. Da die freie Enthalpie eine extensive Gr¨oße ist, gilt G(T, P, N ) = N g(T, P ) , wobei g eine intensive Gr¨oße darstellt. Unter Verwendung von (4.59) folgt hieraus die Gibbs-Duhem-Relation ∂G G µ= =⇒ G = µN . = g(T, P ) = ∂N T,P N Setzen wir dies z.B. in die freie Energie F und in das großkanonische Potential J ein, dann folgen als weitere Gibbs-Duhem-Beziehungen F = µN − P V , J = −P V .
(4.61)
Vollst¨ andige thermodynamische Information. Offensichtlich ergeben sich aus der Kenntnis eines thermodynamischen Potentials als Funktion seiner nat¨ urlichen Variablen alle anderen Potentiale (durch Legendre-Transformationen) und somit alle thermodynamischen Zustandsgr¨oßen. Insofern enth¨alt jedes einzelne thermodynamische Potential die vollst¨andige thermodynamische Information des betrachteten Systems. Als Beispiel betrachten wir die freie Enthalpie H = H(S, P, N ) und zeigen, wie man hieraus die kalorische Zustandsgleichung E = E(T, V, N ) erh¨alt. Grunds¨atzlich beginnt man mit den partiellen Ableitungen des Potentials: ∂H T = = T (S, P, N ) . ∂S P,N L¨ ost man diese Gleichung nach S auf, so ergibt sich S(T, P, N ). Weiterhin gilt ∂H V = = V (S, P, N ) = V [S(T, P, N ), P, N ] = V (T, P, N ) . ∂P S,N Diese Gleichung, nach P aufgel¨ost, ergibt P (T, V, N ). Setzt man nun S(T, P, N ) und P (T, V, N ) in H(S, P, N ) ein, dann folgt H(S, P, N ) = H{S[T, P (T, V, N ), N ], P (T, V, N ), N } = H(T, V, N ) und somit schließlich E = H(T, V, N ) − P (T, V, N )V = E(T, V, N ) . Man erh¨ alt u ¨brigens mit S(T, P, N ), P (T, V, N ) und E(T, V, N ) auch direkt die freie Energie als Funktion ihrer nat¨ urlichen Variablen: F = E(T, V, N ) − T S[T, P (T, V, N ), N ] = F (T, V, N ) .
4.5 Thermodynamik
457
4.5.3 Zustands¨ anderungen und thermische Koeffizienten Aus experimenteller Sicht erh¨ alt man Aufschluß u ange ¨ber die Zusammenh¨ zwischen den einzelnen makroskopischen Gr¨ oßen, indem man ihr Verhalten ¨ bei Anderung bestimmter Gr¨ oßen studiert. Zu diesem Zweck definiert man die folgenden thermischen Koeffizienten, weil diese dem Experiment in vielen F¨ allen einfach zug¨ anglich sind:13 1 ∂S 1 ∂V =− Ausdehnungskoeffizient: α = V ∂T P V ∂P T ∂P ∂S Druckkoeffizient: β = = ∂V T ∂T V ∂H ∂S = Isobare W¨ armekapazit¨ at: CP = T ∂T P ∂T P ∂S ∂E Isochore W¨ armekapazit¨ at: CV = T = . ∂T V ∂T V Die ersten beiden Relationen bestehen aus zweiten Ableitungen der thermodynamischen Potentiale und sind in den Maxwell-Relationen (4.60) enthalten. Die letzten beiden enthalten erste Ableitungen der Potentiale und ergeben sich aus den vollst¨ andigen Differentialen von dH bzw. dE, wie sie in der obigen Definition der thermodynamischen Potentiale angegeben sind. Dar¨ uber hinaus f¨ uhrt man noch folgende Kompressibilit¨ aten ein: 1 ∂V Isotherme Kompressibilit¨ at: κT = − V ∂P T 1 ∂V Adiabatische Kompressibilit¨ at: κS = − . V ∂P S Normalerweise sind nicht alle diese Gr¨ oßen im selben Maße einfach zu messen. Es ist deshalb instruktiv, Beziehungen zwischen ihnen herzuleiten. Tauscht man beim Druckkoeffizient festgehaltene und ver¨ anderliche Variable nach der Regel (A.4) aus, dann folgt als erste Relation α . (4.62) β= κT Eine weitere Gleichung ergibt sich aus S = S(T, V ) = S[T, V (T, P )]: ∂S ∂V ∂S ∂S T =T +T ∂T P ∂T V ∂V T ∂T P ∂V ∂S =⇒ CP − CV = T . ∂V T ∂T P Bei Verwendung der Regel (A.4) sowie der zweiten in (4.60) angegebenen Maxwell-Relation k¨ onnen wir dies umschreiben zu 13
Der u uckt. ¨berall konstant gehaltene Parameter N wird im folgenden unterdr¨
458
4. Statistische Physik und Thermodynamik
∂V ∂P = =− ∂V T ∂T P T V 2 ∂V ∂P α2 T V =⇒ CP − CV = −T = . ∂V T ∂T P κT
∂S ∂V
∂P ∂T
(4.63)
Aus V = V (S, P ) = V [T (S, P ), P ] ergibt sich eine dritte Beziehung in analoger Weise: ∂V ∂T ∂V ∂V = + ∂P S ∂T P ∂P S ∂P T ∂T 1 ∂V =⇒ κT − κS = . V ∂T P ∂P S Mit der dritten, in (4.60) angegebenen Maxwell-Relation sowie der Kettenregel (A.6) geht diese Gleichung u ¨ber in ∂T ∂T ∂V ∂V = = ∂P S ∂S P ∂T P ∂S P 2 ∂T 1 ∂V α2 T V =⇒ κT − κS = = . (4.64) V ∂T P ∂S P CP Die Kombination von (4.63) und (4.64) liefert schließlich die weiteren Beziehungen CP =
α2 T V α2 T V κS CP κT , CV = , = . κT − κS (κT − κS )κT CV κS
4.5.4 Gleichgewicht und Stabilit¨ at Wir wollen nun untersuchen, wie sich Gleichgewichtsbedingungen von nicht abgeschlossenen (offenen) Systemen formulieren lassen. Wir nehmen dabei an, daß diese Systeme im allgemeinsten Fall W¨arme und mechanische Energie in Form von Volumen V und Teilchen N mit ihrer Umgebung quasistatisch austauschen k¨ onnen. (Die Verallgemeinerung auf andere mechanische Energieformen ist unproblematisch.) Ausgangspunkt ist die aus dem 2. Hauptsatz, 1. Teil folgende Gibbssche Fundamentalform (siehe Satz 4.14) T dS ≥ dE − µdN + P dV .
(4.65)
Betrachten wir zun¨achst den Fall eines abgeschlossenen Systems, also dE = dV = dN = 0, dann folgt hieraus (dS)E,V,N ≥ 0 . Das heißt die Entropie eines abgeschlossenen Systems mit konstanter Energie, konstanter Teilchenzahl und konstantem Volumen wird niemals kleiner und besitzt im Gleichgewicht ein Maximum. Dies ist aber gerade der Inhalt des 2.
4.5 Thermodynamik
459
Hauptsatzes, 2. Teil. Der 2. Teil ergibt sich also als notwendige Folgerung aus dem 1. Teil. Nehmen wir nun an, das System werde von außen auf konstanter Entropie gehalten und sei ansonsten isoliert (dS = dN = dV = 0). Dann folgt aus (4.65) (dE)S,V,N ≤ 0 . Also: Die Energie eines Systems, das auf konstanter Entropie gehalten wird und ansonsten isoliert ist, wird niemals gr¨ oßer und besitzt im Gleichgewichtszustand ein Minimum. Als n¨ achstes betrachten wir den Fall, daß ein System von außen auf konstanter Temperatur gehalten wird und mechanisch isoliert ist (dT = dN = dV = 0). Dann k¨ onnen wir, wieder ausgehend von (4.65), schreiben: T dS ≥ dE − µdN + P dV ≥ d(E − T S) + T dS + SdT − µdN + P dV =⇒ 0 ≥ dF + SdT − µdN + P dV =⇒ (dF )T,V,N ≤ 0 . Die freie Energie eines Systems, das auf konstanter Temperatur gehalten wird und mechanisch isoliert ist, wird niemals gr¨ oßer und besitzt im Gleichgewicht ein Minimum. Auf die hier vorgef¨ uhrte Weise lassen sich leicht die entsprechenden Bedingungen f¨ ur offene Systeme mit anderen konstant gehaltenen Parametern herleiten. F¨ ur dS = dP = dN = 0 hat man T dS ≥ dE − µdN + P dV ≥ d(E + P V ) − V dP − µdN =⇒ 0 ≥ dH − V dP − µdN =⇒ (dH)S,P,N ≤ 0 . F¨ ur dT = dP = dN = 0 ergibt sich T dS ≥ dE − µdN + P dV ≥ d(E − T S + P V ) + T dS + SdT − V dP − µdN =⇒ 0 ≥ dG + SdT − V dP − µdN =⇒ (dG)T,P,N ≤ 0 , und f¨ ur dT = dµ = dV = 0 folgt schließlich T dS ≥ dE − µdN + P dV ≥ d(E − T S − µN ) + SdT + T dS + N dµ + P dV =⇒ 0 ≥ dJ + SdT + N dµ + P dV =⇒ (dJ)T,V,µ ≤ 0 .
460
4. Statistische Physik und Thermodynamik
Wir erkennen hieraus folgende einfache Gesetzm¨aßigkeit: Satz 4.15: Gleichgewichtsbedingungen und thermodynamische Potentiale Werden bei einem System die nat¨ urlichen Variablen eines bestimmten thermodynamischen Potentials konstant gehalten, dann wird dieses Potential oßer und besitzt im Gleichgewicht ein Minimum: niemals gr¨ E, V, N konstant =⇒ (dS)E,V,N ≥ 0 (abgeschl. System: Maximum) S, V, N konstant =⇒ (dE)S,V,N ≤ 0 T, V, N konstant =⇒ (dF )T,V,N ≤ 0 S, P, N konstant =⇒ (dH)S,P,N ≤ 0 T, P, N konstant =⇒ (dG)T,P,N ≤ 0 T, V, µ konstant =⇒ (dJ)T,V,µ ≤ 0 . Als Beispiel f¨ ur das Minimumsprinzip der freien Energie betrachte man ein Gas in einem Zylinder bei konstanter Temperatur, konstanter Teilchenzahl und konstantem Volumen. Im Zylinder sei ein frei beweglicher Kolben, der das Gesamtvolumen V in zwei Teile V1 und V2 aufteilt, in denen die Dr¨ ucke P1 und P2 herrschen. Gefragt ist nach der Gleichgewichtslage des Kolbens, wenn man ihn an irgend einer Stelle losl¨aßt. Die zugeh¨orige Gleichgewichtsbedingung lautet (dV2 = −dV1 ) ∂F ∂F (dF )T,V,N = dV1 + dV2 ∂V1 T,N ∂V2 T,N
∂F ∂F dV1 = 0 . = − ∂V1 T,N ∂V2 T,N Hieraus folgt erwartungsgem¨aß ∂F ∂F = ⇐⇒ P1 = P2 . ∂V1 T,N ∂V2 T,N Stabilit¨ at. Die in Satz 4.15 angegebenen Minimumsbedingungen der thermodynamischen Potentiale sind notwendig aber nicht hinreichend, um einen Gleichgewichtszustand zu determinieren. Betrachten wir z.B. die Energie E(S, V ), dann bedarf es f¨ ur stabiles Gleichgewicht bei einer kleinen Variation von S und V neben dE = 0 zus¨atzlich der Bedingung d2 E > 0 . F¨ uhren wir diese Variation aus, dann erhalten wir
4.5 Thermodynamik
461
∂E ∂E E(S + dS, V + dV ) = E(S, V ) + dS + dV ∂S V ∂V S 2 ∂ S ∂2S 2 + (dS) + 2 dSdV ∂S 2 V ∂S∂V 2 ∂ E 2 + ... (dV ) + ∂V 2 S 2 2 ∂ E ∂ E ∂2E 2 =⇒ dSdV + (dS) + 2 (dV )2 > 0 . 2 ∂V 2 S ∂S V ∂S∂V Damit nun eine beliebige quadratische Form ax2 + 2bxy + cy 2 positiv definit ist, muß gelten: a > 0, c > 0 und (ac − b2 ) > 0. Dies bedeutet in unserem Fall 2 ∂ E ∂T T = = > 0 =⇒ CV > 0 (4.66) 2 ∂S V ∂S V CV 2 ∂ E ∂P 1 (4.67) = − = > 0 =⇒ κS > 0 ∂V 2 S ∂V S V κS 2 2 2 2 2 ∂ E ∂ E ∂ E T ∂T − = − >0 ∂S 2 V ∂V 2 S ∂S∂V V C V κS ∂V S 2 T ∂T =⇒ > . V C V κS ∂V S In gleicher Weise f¨ uhrt z.B. die Stabilit¨ atsbedingung d2 F > 0 zu der Ungleichung 2 ∂P 1 ∂ F =− = > 0 =⇒ κT > 0 . (4.68) ∂V 2 T ∂V T V κT Die Bedingungen (4.66), (4.67) und (4.68) besagen, daß ein System nur dann im Gleichgewicht sein kann, wenn • die Temperatur steigt, falls es bei konstantem Volumen aufgeheizt wird (CV > 0), • das Volumen kleiner wird, falls es bei konstanter Entropie komprimiert wird (κS > 0), • das Volumen kleiner wird, falls es bei konstanter Temperatur komprimiert wird (κT > 0). Dies sind spezielle Beispiele des Le Chatelier-Prinzips, nach dem spontane ¨ Anderungen eines Gleichgewichtssystems zu Prozessen f¨ uhren, die bestrebt sind, das System zur¨ uck ins Gleichgewicht zu bringen. Aus CV , κT > 0 folgt wegen (4.63) auch CP > 0. Weiterhin folgt aus κT > 0 und (4.62), daß α und β das gleiche Vorzeichen haben; im Normalfall sind sie positiv. Eine Ausnahme ist z.B. Wasser am Gefrierpunkt.
462
4. Statistische Physik und Thermodynamik
4.5.5 W¨ armekraftmaschinen und Kreisprozesse Historisch gesehen begann die Entwicklung der Thermodynamik mit dem Studium von W¨armekraftmaschinen. Hierunter versteht man Maschinen, die W¨ arme in andere Energieformen umwandeln. Aufgrund ihrer immensen technologischen Bedeutung, ganz abgesehen von ihrer historischen Bedeutung im Zusammenhang mit der industriellen Revolution, wollen wir in diesem Unterabschnitt einige Eigenschaften von W¨armekraftmaschinen genauer untersuchen. Wir beschr¨anken uns dabei auf zyklisch arbeitende Maschinen, also auf solche, die nach Durchlaufen eines Zyklusses in ihren Ausgangszustand zur¨ uckkehren. Perpetuum mobile 1. und 2. Art. Man betrachte das in Abb. 4.5 skizzierte abgeschlossene System. Es besteht aus einem W¨armereservoir R mit
R, T
∆Q
M
∆W
S
Abb. 4.5. Schematische Darstellung einer W¨ armekraftmaschine M, die eine W¨ armemenge ∆Q in Arbeit ∆W umwandelt
konstanter Temperatur T , einer W¨armekraftmaschine M und einem Arbeitsspeicher S. Innerhalb eines Zyklusses entnimmt die Maschine dem Reservoir die W¨ armemenge ∆Q, wandelt sie in Arbeit ∆W um und f¨ uhrt diese dem Arbeitsspeicher zu. Da die Maschine nach einem Zyklus wieder in ihren Ausgangszustand zur¨ uckkehrt, gilt ∆EM = 0. Nach dem 1. Hauptsatz folgt hieraus ∆EM = ∆Q − ∆W = 0 =⇒ ∆Q = ∆W . Dies bedeutet, die Maschine ist sicherlich nicht in der Lage, mehr Arbeit abzugeben als sie in Form von W¨arme aufgenommen hat. Mit anderen Worten: Der erste Hauptsatz verbietet die Existenz eines Perpetuum mobiles 1. Art. Die Maschine ist allerdings auch nicht in der Lage, genau soviel Arbeit abzugeben, wie sie an W¨arme aufgenommen hat, weil dies im Widerspruch zum 2. Hauptsatz steht. Um dies zu sehen, ben¨otigen wir die Entropie¨anderungen von R, M und S nach einem Zyklus. Da dem Reservoir die W¨armemenge ∆Q entzogen wurde, gilt ∆W ∆Q =− . T T F¨ ur die Maschine ist ∆SR ≥ −
∆SM = 0 ,
4.5 Thermodynamik
463
weil sie nach dem Zyklus wieder in denselben Zustand zur¨ uckkehrt. Nehmen wir sinnvoller Weise an, daß der Arbeitsspeicher nur aus sehr wenigen Freiheitsgraden besteht, z.B. aus einer Feder mit nur einem Freiheitsgrad, dann ist seine Entropie¨ anderung gegen¨ uber derjenigen von R sicherlich vernachl¨assigbar, also ∆SS ≈ 0 . Nach dem 2. Hauptsatz muß die Entropie¨ anderung des abgeschlossenen Gesamtsystems gr¨oßer gleich Null sein, d.h. es muß gelten: ∆W ≥ 0 =⇒ ∆W ≤ 0 . T Wir folgern hieraus: Es gibt keine Maschine, dessen Wirkung einzig und allein darin besteht, eine W¨ armemenge ∆Q in die Arbeit ∆W = ∆Q umzuwandeln (Perpetuum mobile 2. Art). Diese Aussage ist die Kelvinsche Formulierung des 2. Hauptsatzes. Hierzu ¨ aquivalent ist die Clausiussche Formulierung des 2. Hauptsatzes: Es gibt keine Maschine, dessen Wirkung einzig und allein darin besteht, eine W¨ armemenge ∆Q einem k¨ alteren W¨ armereservoir zu entnehmen und einem w¨ armeren zuzuf¨ uhren. Man u ¨berzeugt sich leicht von der Richtigkeit dieser Aussage, indem man wieder die Energie- und Entropiebilanz f¨ ur das System R1 +M+R2 anschreibt. ∆SR + ∆SM + ∆SS ≥ −
W¨ armekraftmaschinen und Wirkungsgrad. Um eine funktionst¨ uchtige, d.h. eine mit dem 1. und 2. Hauptsatz im Einklang stehende W¨ armekraftmaschine bauen zu k¨ onnen, muß man daf¨ ur sorgen, daß die Gesamtentropie w¨ ahrend eines Zyklusses nicht abnimmt. Dies l¨ aßt sich erreichen, indem man das oben skizzierte System um ein weiteres W¨armereservoir erweitert, an das die Maschine einen Teil seiner aufgenommenen W¨ armemenge abgeben kann, so daß sich die Entropie dieses Reservoirs um den erforderlichen Betrag vergr¨ oßert. Ein solches System ist in Abb. 4.6 dargestellt. Aus dem 1. Hauptsatz ergibt sich jetzt ∆EM = ∆Q1 − ∆Q2 − ∆W = 0 =⇒ ∆Q2 = ∆Q1 − ∆W .
(4.69)
Die Entropiedifferenzen der einzelnen Systemkomponenten sind
S ∆W R1 , T1
∆Q1
M
∆Q2
R2 , T2
T1 > T2
Abb. 4.6. Schematische Darstellung einer realisierbaren W¨ armekraftmaschine M, die einen Teil ∆Q2 der aufgenommen W¨ armemenge ∆Q1 abgibt und den Rest in Arbeit ∆W umwandelt
464
4. Statistische Physik und Thermodynamik
∆Q1 ∆Q2 , ∆SR2 ≥ , ∆SM = 0 , ∆SS ≈ 0 . T1 T2 Der 2. Hauptsatz liefert die Bedingung 1 ∆W 1 ∆SR1 + ∆SR2 + ∆SM + ∆SS ≥ ∆Q1 − − ≥0. T2 T1 T2 ∆SR1 ≥ −
Hieraus folgt, daß die maximale (positive) Arbeit, die M abgeben kann, nach oben beschr¨ ankt ist durch T1 − T2 , T1 > T2 . ∆W ≤ ∆Q1 (4.70) T1 In der Praxis ist das W¨armereservoir R1 nicht unendlich groß, so daß die ihm entnommene W¨arme ∆Q1 dauernd ersetzt werden muß, z.B. durch Ver¨ Man definiert daher den Wirkungsgrad η einer brennung von Kohle oder Ol. W¨ armekraftmaschine durch erzeugte Arbeit ∆Q1 − ∆Q2 ∆W η= = . = aufgebrachte W¨arme ∆Q1 ∆Q1 F¨ ur realisierbare W¨armekraftmaschinen gilt somit T1 − T2 η ≤ ηideal = , T1 wobei der ideale Wirkungsgrad ηideal reversible Prozesse voraussetzt. In der Praxis erreichte Wirkungsgrade liegen etwa bei η = 30%. Man kann nat¨ urlich auch den Prozeß in Abb. 4.6 umdrehen, so daß die Maschine M unter Arbeitsaufwand ∆W die W¨armemenge ∆Q2 dem Reservoir R2 entnimmt und die W¨armemenge ∆Q1 dem Reservoir R1 zuf¨ uhrt (siehe Abb. 4.7). In diesem Fall drehen sich die Vorzeichen von ∆Q1 , ∆Q2 und ∆W um, so daß (4.70) betragsm¨aßig u ¨bergeht in T1 − T2 ∆W ≥ ∆Q1 , T1 > T2 T1 oder mit (4.69) ∆W ≥ ∆Q2
T1 − T2 T2
, T1 > T2 .
S ∆W R1 , T1
∆Q1
M
∆Q2
R2 , T2
T1 > T2
Abb. 4.7. Schematische Darstellung einer realisierbaren W¨ armekraftmaschine M, die unter Arbeitsaufwand ∆W eine W¨ armemenge ∆Q2 aufnimmt und in eine W¨ armemenge ∆Q1 > ∆Q2 umwandelt (W¨ armepumpe, K¨ uhlschrank)
4.5 Thermodynamik
465
Im Falle eines K¨ uhlschrankes ist der Nutzen die von R2 abgezogene W¨ arme armepumpe ist es die nach R1 transportierte ∆Q2 , und im Falle einer W¨ W¨ arme ∆Q1 . Man definiert daher f¨ ur den K¨ uhlschrank η=
T2 ∆Q2 ≤ ηideal = ∆W T1 − T2
und f¨ ur die W¨armepumpe η=
T1 ∆Q1 ≤ ηideal = . ∆W T1 − T2
Carnotscher Kreisprozeß. Carnot-Maschinen sind ideale W¨ armekraftmaschinen, die w¨ahrend eines Zyklusses nur reversible Prozesse durchlaufen, so daß ihr Wirkungsgrad gleich ihrem idealen Wirkungsgrad ist. Eine solche Maschine l¨aßt sich (zumindest theoretisch) in folgender Weise konstruieren: Sei ¨ x ein ¨ außerer Parameter der Maschine M, dann f¨ uhrt eine Anderung von x zu einer Arbeitsleistung von M. Die Ausgangsposition von M sei charakterisiert durch x = xa und T = T2 , wobei T2 die Temperatur des k¨ alteren W¨ armereservoirs R2 bezeichne. Die Maschine durchlaufe nun folgende Schritte in reversibler Weise: 1. Adiabatischer Schritt: x wird bei thermischer Isolierung von M langsam ver¨ andert, bis M die Temperatur T1 > T2 erreicht hat (xa → xb , T2 → T1 ). 2. Isothermischer Schritt: M wird mit dem w¨ armeren Reservoir R1 der Temandert, so peratur T1 in thermischen Kontakt gebracht. x wird weiter ge¨ daß M bei gleichbleibender Temperatur T1 die W¨ armemenge ∆Q1 von R1 absorbiert (xb → xc ). 3. Adiabatischer Schritt: M wird wieder thermisch isoliert. x wird so ge¨ andert, daß die Temperatur von M von T1 nach T2 zur¨ uckkehrt (xc → xd , T1 → T2 ). 4. Isothermischer Schritt: M wird nun mit dem k¨ alteren Reservoir R2 der Temperatur T2 in thermischen Kontakt gebracht. Der Parameter x wird ge¨andert, bis er seinen Ausgangswert xa erreicht hat, wobei M bei gleichbleibender Temperatur T2 die W¨ armemenge ∆Q2 an R2 abgibt (xd → xa ). Der Zyklus ist nun beendet, und die Maschine ist wieder in ihrem Ausgangszustand. F¨ ur die Entropie- und Energie¨ anderung der Maschine gilt ∆Q2 ∆Q1 ∆Q2 ∆Q1 +0− = 0 =⇒ = T2 T2 T1 T1 = ∆Q1 − ∆Q2 − ∆W = 0 =⇒ ∆W = ∆Q1 − ∆Q2 ,
∆SM = 0 + ∆EM wobei xb ∆W =
xc dxX +
xa
xd dxX +
xb
xa dxX +
xc
dxX =
xd
dxX
466
4. Statistische Physik und Thermodynamik
die vom System geleistete Arbeit ist. Die Entropie¨anderung des Gesamtsystems, bestehend aus den Reservoirs R1 und R2 , der Maschine M und dem Arbeitsspeicher S, ist (∆SS ≈ 0) ∆S = −
∆Q1 ∆Q2 + =0. T1 T2
Das heißt es handelt sich beim Carnotschen Kreisprozeß in der Tat um einen reversiblen Prozeß. Er kann deshalb auch in umgekehrter Richtung ablaufen und so f¨ ur einen K¨ uhlschrank oder eine W¨armepumpe verwendet werden. Betrachten wir als Beispiel eines Carnotschen Prozesses ein (nicht unbedingt ideales) Gas, das in einem Zylinder mit einem beweglichen Kolben eingeschlossen ist (Abb. 4.8). Hierbei ist das Volumen V der ver¨anderliche ¨außere Parameter. Die vier Carnot-Schritte lassen sich in einem P V -Diagramm in der in Abb. 4.9 gezeigten Weise darstellen. Die vom Gas w¨ahrend eines Zyklusses geleistete Arbeit ist dabei gerade die von den beiden Isothermen und Adiabaten eingeschlossene Fl¨ache.
Isolator
T1
Isolator
T2
Va → Vb Vb → Vc Vc → Vd Vd → Va Abb. 4.8. Carnotscher Kreisprozeß eines mit Gas gef¨ ullten Zylinders mit beweglichem Kolben
Zusammenfassung • Die Thermodynamik beschreibt das Verhalten makroskopischer Gleichgewichtssysteme von einem rein makroskopischen Standpunkt aus. Sie basiert auf den drei empirisch gefundenen Haupts¨ atzen der Thermodynamik. • Die thermodynamischen Potentiale sind als Funktion ihrer nat¨ urlichen Variablen Zustandsgleichungen, mit denen sich Gleichgewichtszust¨ ande offener Systeme durch einfache Minimumsprinzipien ausdr¨ ucken lassen. Ihre partiellen Ableitungen f¨ uhren zu den thermodynamischen Kr¨ aften und den Maxwell-Relationen.
Anwendungen
467
P
b ∆Q1 c T1
a ∆Q2
d
T2
V Abb. 4.9. Schematische Darstellung des Carnotschen Kreisprozesses f¨ ur ein Gas im P V -Diagramm. Die Raute wird durch zwei Isothermen (∆T = 0) und zwei Adiabaten ∆S = 0) begrenzt. Ihre Fl¨ ache ist gleich der vom Gas geleisteten Arbeit
• Jedes dieser Potentiale enth¨ alt die vollst¨ andige thermodynamische Information eines Systems. • Zustands¨ anderungen werden durch thermische Koeffizienten charakterisiert. Die mit den Minimumsbedingungen der thermodynamischen Potentiale verbundenen Stabilit¨ atskriterien schr¨ anken das Verhalten dieser Koeffizienten ein. • Die ersten beiden Haupts¨ atze der Thermodynamik verbieten die Existenz eines Perpetuum mobiles 1. und 2. Art. Realisierbare W¨ armekraftmaschinen sind nur in der Lage, einen Teil der ihnen zugef¨ uhrten W¨armemenge in Arbeit umzuwandeln. Die Restw¨ arme muß notwendigerweise abgef¨ uhrt werden, damit die Gesamtentropie nicht abnimmt. • Der Carnotsche Kreisprozeß beschreibt die Arbeitsweise von W¨ armekraftmaschinen, die alle Schritte eines Zyklusses in reversibler Weise ausf¨ uhren und deshalb ihren idealen Wirkungsgrad erreichen.
Anwendungen 62. Vollst¨ andige thermodynamische Information. Zu zeigen ist, daß die Zustandsgleichungen P = P (T, V ) , CV (T, V0 )
(4.71)
468
4. Statistische Physik und Thermodynamik
die vollst¨ andige thermodynamische Information enthalten, d.h., daß man aus diesen Gleichungen das thermodynamische Potential E(S, V ) erh¨alt. Man verifiziere diesen Sachverhalt anhand des idealen Gases, f¨ ur das TNk 3 , CV (T, V0 ) = CV = N k V 2 bekannt seien. N ist hier als Konstante aufzufassen. Wie groß ist die isobare W¨ armekapazit¨ at CP des idealen Gases? P (T, V ) =
L¨ osung. Leitet man die zweite, in (4.60) stehende Maxwell-Relation nach T bei konstantem V ab, dann erh¨alt man 2 ∂ P ∂CV =T . ∂T 2 V ∂V T Hieraus folgt zusammen mit (4.71) V CV (T, V ) = CV (T, V0 ) + T
dV
∂ 2 P (T, V ) . ∂T 2
(4.72)
V0
Mit Hilfe derselben Maxwell-Relation erh¨alt man auch ∂S ∂S CV ∂P dS = dT + dV = dV dT + ∂T V ∂V T T ∂T V ∂P − P dV . =⇒ dE = T dS − P dV = CV dT + T ∂T V Da die rechte Seite dieser Gleichung wegen (4.71) und (4.72) bekannt ist, erhalten wir hieraus die Funktionen S(T, V ) und E(T, V ) bis auf eine Konstante zu ∂P E(T, V ) = dT CV + dV T − P + const ∂T V CV ∂P S(T, V ) = dT + dV + const . ∂T V T Eliminiert man aus diesen Gleichungen T , so ergibt sich E(S, V ) bzw. S(E, V ). F¨ ur das ideale Gas ergeben die letzten beiden Gleichungen die Relationen 3 E(T, V ) = E(T ) = N kT 2 3 S(T, V ) = N k ln T + N k ln V + const . (4.73) 2 Man erh¨ alt hieraus (vgl. (4.29)) 5 3/2 2c1 E + c2 , c1 , c2 = const . S(E, V ) = N k ln V 3N k
Anwendungen
469
Die W¨armekapazit¨ at CP ergibt sich nun einfach aus S(T, P ) = S[T, V (T, P )] 3 ln T + ln(T kN ) − ln P + const = Nk 2 ∂S 5 =⇒ CP = T = Nk . ∂T P 2
(4.74)
63. Adiabatische Expansion des idealen Gases. a) Man zeige, daß bei der adiabatischen Expansion eines idealen Gases gilt: P V γ = const , γ =
CP . CV
b)Ein ideales Gas mit dem Volumen V1 und der Temperatur T1 werde adiabatisch auf das Volumen V2 expandiert. Wie groß ist die zugeh¨ orige Temperatur T2 ? L¨ osung. Zu a) Es gilt ∂V ∂T ∂V = . ∂P S ∂T S ∂P S
(4.75)
Aus (4.73) folgt das vollst¨ andige Differential ∂S ∂S CV Nk dS = dT + dV = dT + dV ∂T V ∂V T T V und somit V CV ∂V . =− ∂T S N kT Andererseits ergibt sich aus (4.74) das vollst¨ andige Differential ∂S Nk ∂S CP dS = dT − dP , dT + dP = ∂T P ∂P T T P so daß ∂T N kT = . ∂P S P CP Aus (4.75) folgt nun dV dP ∂V 1V =⇒ γ =− =⇒ P V γ = const . =− ∂P S γP V P
(4.76)
470
4. Statistische Physik und Thermodynamik
Zu b) Aus (4.76) folgt V2 V1
dV 3 =− V 2
T2
dT =⇒ ln T
V2 V1
3 = − ln 2
T2 T1
=⇒ T2 = T1
V2 V1
−2/3 .
T1
4.6 Klassische Maxwell-Boltzmann-Statistik Die statistische Physik umfaßt zwei verschiedene Beschreibungsarten von Viel-Teilchensystemen, n¨amlich den klassisch-statistischen und den quantenstatistischen Ansatz. Der klassisch-statische Zugang wird durch die klassische Maxwell-Boltzmann-Statistik vertreten, der quantenstatistische durch die Fermi-Dirac- und die Bose-Einstein-Statistik. Alle drei Statistiken unterscheiden sich im wesentlichen nur durch die Art und Weise, wie die Mikrozust¨ ande eines Systems abgez¨ahlt werden. Die klassische Maxwell-Boltzmann-Statistik setzt ihrem Namen entsprechend klassische Systeme voraus, bei denen sich die Teilchen auf wohldefinierten Bahnen im Phasenraum bewegen. Aus quantenmechanischer Sicht ist diese Annahme gleichbedeutend mit der unabh¨angigen Bewegung von Wellenpaketen (unterscheidbare Teilchen), so daß die N -Teilchen-Wellenfunktion einfach das tensorielle Produkt aus N Ein-Teilchen-Wellenfunktionen ist. Bei der Berechnung der entsprechenden Zustandssummen k¨onnen dabei sowohl die rein klassischen Energien der Hamilton-Funktion als auch die Energieeigenwerte des quantenmechanischen Hamilton-Operators verwendet werden; einige Beispiele wurden bereits in diversen Anwendungen diskutiert. Die Fermi-Dirac- und Bose-Einstein-Statistik tragen dagegen Quanteneffekten in ad¨ aquater Weise Rechnung. Insbesondere wird bei ihnen der fermionische bzw. bosonische Charakter identischer Teilchen mit den zugeh¨origen antisymmetrisierten bzw. symmetrisierten Wellenfunktionen ber¨ ucksichtigt, was sich nat¨ urlich auch auf die Abz¨ahlung von Mikrozust¨anden auswirkt. Mit diesen beiden Statistiken werden wir uns im n¨achsten Abschnitt besch¨aftigen. In diesem Abschnitt diskutieren wir zwei Systeme in der klassischen Boltzmann-Statistik etwas genauer, n¨amlich das N -Teilchen-Oszillatorsystem und das N -Teilchen-Dipolsystem, wobei wir jeweils sowohl von der zugeh¨ origen Hamilton-Funktion H ( echtes klassisches System“) als auch vom ” Hamilton-Operator H ausgehen. Zuvor wollen wir jedoch untersuchen, unter welchen Voraussetzungen die klassische Maxwell-Boltzmann-Statistik g¨ ultig ¨ ist, und das Aquipartitionstheorem f¨ ur echte klassische Systeme“ herleiten. ” 4.6.1 Klassischer Grenzfall In der klassischen Mechanik sind die Impulse und Koordinaten eines N Teilchensystems alle gleichzeitig spezifizierbar. Quantenmechanisch ist dies
4.6 Klassische Maxwell-Boltzmann-Statistik
471
aufgrund des Heisenbergschen Unbestimmtheitsprinzips nicht l¨ anger m¨ oglich. Somit ist die klassische N¨ aherung gut, falls gilt: ∆q∆p h .
(4.77)
Betrachten wir hierzu ein aus N identischen Teilchen bestehendes ideales Gas in einem Kasten. F¨ ur ein einzelnes Teilchen mit mittlerem Impulsbetrag p und mittlerem Abstand r zu den anderen Teilchen folgt aus (4.77) die Bedingung pr h bzw. unter Verwendung der mittleren De-Broglie-Wellenl¨ ange λ = h/p rλ. Weil λ als ein Maß f¨ ur die quantenmechanische Ausdehnung der Teilchen im Raum interpretiert werden kann, ist die klassische Beschreibung m¨ oglich, falls die Wellenfunktionen der einzelnen Teilchen sich nicht u berlappen; sie ¨ sind dann durch ihre Positionen unterscheidbar. Nehmen wir weiter an, daß jedes Teilchen im Mittel das Volumen r¯3 einnimmt. F¨ ur das ideale Gas gilt dann nach (4.30) p¯2 ¯ = 3 kT , p¯ ≈ (3mkT )1/2 , ≈E 2m 2 und die mittlere Wellenl¨ ange wird zu ¯≈ λ
h . (3mkT )1/2
Demnach gilt die klassische Maxwell-Boltzmann-Statistik, falls 1/3 V h r¯ ≈ . N (3mkT )1/2 Dies entspricht den folgenden F¨ allen: • N ist klein. • T is groß. • m ist nicht sehr klein. Auf der anderen Seite bedeutet r< ~λ , daß der Zustand des Gases im Kasten durch eine N -Teilchen-Wellenfunktion beschrieben wird, die sich nicht in einfachster Weise in Ein-Teilchen-Wellenfunktionen faktorisiert l¨ aßt. Wir werden diesen Fall der Quantenstatistik im n¨achsten Abschnitt diskutieren.
472
4. Statistische Physik und Thermodynamik
¨ 4.6.2 Virial- und Aquipartitionstheorem In diesem Unterabschnitt wollen wir zun¨achst einige allgemeine Aussagen u ¨ber Mittelwerte von klassischen Systemen machen. Hierzu betrachten wir ein dreidimensionales N -Teilchensystem mit konstanter Energie E, das durch die Hamilton-Funktion H(q, p) beschrieben wird. Sei xi irgend eine Komponente aus {q1 , . . . , q3N , p1 , . . . , p3N }, dann k¨onnen wir im mikrokanonischen Ensemble wie folgt rechnen: ∂H ∂H ∂H 1 δE ∂ dΓ xi . xi = dΓ xi = ∂xj Ω(E) ∂E ∂xj ∂xj Ω(E) H(q,p)≤E
E−δE≤H(q,p)≤E
Wegen ∂E/∂xj = 0 l¨aßt sich das Integral umformen zu ∂H ∂ dΓ xi = dΓ xi [H(q, p) − E] ∂xj ∂xj H(q,p)≤E
H(q,p)≤E
=
dΓ H(q,p)≤E
−δij
∂ {xi [H(q, p) − E]} ∂xj
dΓ [H(q, p) − E] .
(4.78)
H(q,p)≤E
Der vorletzte Term dieser Gleichung enth¨alt den Beitrag (x )
xi [H(q, p) − E]|(xjj )21 , wobei (xj )1 und (xj )2 die Extremwerte“ der Koordinate xj bezeichnen. ” Da ein Phasenraumpunkt (q1 , . . . , q3N , p1 , . . . , p3N ), der irgend eine extremale Koordinate besitzt, notwendigerweise auf der Energie-Hyperfl¨ache H(q, p) = E liegen muß, liefert der vorletzte Term von (4.78) keinen Beitrag. Es folgt somit insgesamt ∂H δij ∂ δij xi = dΓ [E − H(q, p)] = dΓ ∂xj g(E) ∂E g(E) H(q,p)≤E
δij ω(E) ω(E) = δij ∂ω(E) = δij = g(E) ∂E −1 ∂S = kδij = δij kT . ∂E
H(q,p)≤E
−1 ∂ ln ω(E) ∂E
¨ Satz 4.16: Virial- und Aquipartitionstheorem F¨ ur ein echtes klassisches dreidimensionales N -Teilchensystem mit der Hamilton-Funktion H(q, p) gelten folgende Ensemble-Mittelwerte:
4.6 Klassische Maxwell-Boltzmann-Statistik
xi
473
∂H = δij kT , xi ∈ {q1 , . . . , q3N , p1 , . . . , p3N } . ∂xj
Insbesondere gilt pi
∂H ∂H = pi q˙i = kT , qi = −qi p˙i = qi Fi = kT . ∂pi ∂qi
Hieraus folgt f¨ ur den Mittelwert der kinetischen Energie 1 1 3 pi q˙i = pq˙ = N kT 2 2 2 i=1 3N
T =
und f¨ ur das Virial der Kr¨ afte 3N
qi Fi = qF = −3N kT .
i=1
Die letzten beiden Beziehungen ergeben 1 3 T = − qF = N kT 2 2
(Virialtheorem) .
F¨ ur homogene Potentiale V (q) = α|q|d , F = −∇q V (q) gilt insbesondere T =
d 3 3d + 6 N kT V = N kT =⇒ E = 2 2 2d
¨ (Aquipartitionstheorem) .
¨ Die letzte Gleichung heißt Aquipartitionstheorem“, weil aus ihr zu erken” nen ist, daß die Energie E im Mittel gleichm¨aßig auf die Freiheitsgrade des Systems verteilt ist. Man beachte, daß das Virialtheorem – hier f¨ ur EnsembleMittelwerte gezeigt – in der Mechanik f¨ ur Zeitmittelwerte hergeleitet wurde (Unterabschn. 1.1.1, Satz 1.6). 4.6.3 Harmonischer Oszillator Wir betrachten nun ein Oszillatorsystem, das aus N eindimensionalen unterscheidbaren harmonischen Oszillatoren besteht, und berechnen die zugeh¨ origen thermodynamischen Relationen. I: Harmonischer Oszillator im mikrokanonischen Ensemble. Als Ausgangspunkt f¨ ur die Beschreibung im mikrokanonischen Ensemble w¨ ahlen wir ein Quantenoszillatorsystem mit der konstanten Teilchenzahl N und der konstanten Energie N E=h ¯ω M + . 2
474
4. Statistische Physik und Thermodynamik
Um die zugeh¨ orige mikrokanonische Zustandssumme Ω(E, N ) zu berechnen, ben¨ otigen wir die Zahl von M¨oglichkeiten, M Quanten auf N Oszillatoren zu verteilen. Das kombinatorische Resultat ist N (N + M − 1)! (N + M − 1)! Ω(E, N ) = = . M !N ! M !(N − 1)! Hieraus ergibt sich unter Ber¨ ucksichtigung von M = E/(¯ hω) − N/2 und der Stirlingschen Formel (4.28) die Entropie des Systems zu E N E N S(E, N ) = k + ln + ¯hω 2 ¯hω 2 N E E N − N k ln N , − ln −k − ¯hω 2 ¯hω 2 und es folgen die Relationen 1 k ∂S = = [ln(M + N ) − ln M ] T ∂E N ¯hω =⇒ M =
N −1
eβ¯hω
N N N ¯hω β¯hω =⇒ E(T, N ) = h ¯ω + coth = eβ¯hω − 1 2 2 2 β¯hω N kβ¯hω =⇒ S(T, N ) = −N k ln e −1 + 1 − e−β¯hω N kβ¯hω β¯hω . + = −N k ln 2 sinh 2 2 tanh β¯h2ω
(4.79)
(4.80)
Betrachten wir den klassischen Grenzfall β¯hω → 0 ⇐⇒ T → ∞, dann ergibt sich hieraus S(T, N ) = N k [1 − ln(β¯hω)] , E(T, N ) = N kT ,
(4.81)
¨ was im Einklang mit dem Aquipartitionstheorem mit d = 2 und N → N/3 steht. Bei niedrigen Temperaturen (T → 0) hat man dagegen N¯ hω . 2 II: Harmonischer Oszillator im kanonischen Ensemble. Als n¨achstes betrachten wir dasselbe Quantenoszillatorsystem im kanonischen Ensemble. Die kanonische Ein-Teilchen-Zustandssumme eines Oszillators mit der Energie 1 En = h ¯ω n + 2 E=
lautet
4.6 Klassische Maxwell-Boltzmann-Statistik
Z(T, 1) = Z1 (T ) =
∞
e−βEn = e−β¯hω/2
∞
e−β¯hω
n=0
n=0
1
= 2 sinh
β¯ hω 2
n
=
475
e−β¯hω/2 1 − e−β¯hω
.
(4.82)
F¨ ur die N -Teilchen-Zustandssumme und die freie Energie folgt hieraus (unterscheidbare Teilchen!) β¯ hω N Z(T, N ) = Z1 (T ) =⇒ F (T, N ) = N kT ln 2 sinh . 2 Hiermit finden wir f¨ ur die Entropie und Energie die Gleichungen ∂F ∂ ln Z S(T, N ) = − = k ln Z − kβ ∂T N ∂β N kβ¯ hω β¯ hω + = −N k ln 2 sinh 2 2 tanh β¯hω 2
E(T, N ) = F (T, N ) + T S(T, N ) =
N ¯hω , 2 tanh β¯h2ω
die beide mit den mikrokanonischen Ergebnissen (4.79) und (4.80) u ¨bereinstimmen. Zum Vergleich berechnen wir noch die entsprechenden Relationen f¨ ur ein klassisches Oszillatorsystem mit der Energie N 2 mω 2 2 pi + qi . E = H(q, p) = 2m 2 i=1 Hieraus ergibt sich f¨ ur die kanonische Zustandssumme 1 Z(T, N ) = N dΓ e−βH h N 1 A βmω 2 qi2 βp2i dpi exp − dqi exp − = N h i=1 2 2m = Z(T, 1)N , mit Z(T, 1) = Z1 (T ) =
1 h
βmω 2 q 2 kT βp2 dq exp − dp exp − = . 2 2m hω ¯
F¨ ur die freie Energie folgt kT . F (T, N ) = −N kT ln hω ¯ Entropie und Energie bestimmen sich zu (vgl. (4.81)) kT S(T, N ) = N k ln + 1 , E(T, N ) = N kT . hω ¯
476
4. Statistische Physik und Thermodynamik
III: Harmonischer Oszillator im großkanonischen Ensemble. Wie wir gesehen gaben, faktorisiert die kanonische Zustandssumme f¨ ur ein Oszillatorsystem aus N unterscheidbaren Teilchen in der Weise ⎧ ⎫ kT ⎪ ⎪ ⎪ ⎪ klassisch ⎨ ¯hω ⎬ N Z(T, N ) = φ(T ) , φ(T ) = (4.83) 1 ⎪ ⎪ ⎪ h¯ ω quantenmech. ⎪ ⎩ ⎭ 2 sinh 2kT Die großkanonische Zustandssumme lautet deshalb Y (T, µ) =
∞ N =0
[zφ(T )]N =
1 , z = eβµ , 1 − zφ(T )
wobei f¨ ur die Konvergenz dieser Reihe gelten muß: zφ(T ) < 1. Die Bestimmung der thermodynamischen Relationen erfolgt u ¨ber das großkanonische Potential: J(T, µ) = kT ln [1 − zφ(T )] . Hieraus findet man ∂J zφ(T ) N N (T, µ) = − = =⇒ z = ∂µ T 1 − zφ(T ) φ(T )(N + 1) zkT φ (T ) ∂J − N k ln z = −k ln[1 − zφ(T )] + S(T, µ) = − ∂T µ 1 − zφ(T ) E(T, µ) = J(T, µ) + T S(T, µ) + N kT ln z =
zkT 2 φ (T ) . 1 − zφ(T )
F¨ ur große N gilt 1 1 , 1 − zφ(T ) ≈ , ln z = − ln φ(T ) , N N so daß wir in diesem Fall schreiben k¨onnen: T φ (T ) φ (T ) S(T, N ) = N k + ln φ(T ) , E(T, N ) = N kT 2 . φ(T ) φ(T ) zφ(T ) ≈ 1 −
Substituieren wir nun φ(T ) durch (4.83), so ergeben sich die bekannten Resultate f¨ ur den klassischen, (4.81), bzw. quantenmechanischen Fall, (4.79) und (4.80). IV: Harmonischer Oszillator im kanonischen Dichteoperator-Formalismus. In der Energiebasis {| n }, mit 1 H | n = En | n , En = h , ¯ω n + 2 ist die kanonische Dichtematrix des Ein-Teilchenoszillators trivial: ? = n| e−βH |m e−βEm n| m e−βEn n| ρ |m = = = δnm . Z1 Z1 Z1
4.6 Klassische Maxwell-Boltzmann-Statistik
477
Die zugeh¨orige kanonische Ein-Teilchen-Zustandssumme berechnet sich zu ∞ ∞ = ? Z1 = tr e−βH = e−βEn = n| e−βEn |n = n=0
n=0
1 2 sinh
β¯ hω 2
und steht erwartungsgem¨ aß im Einklang mit (4.82). Um die St¨ arke des quantenmechanischen Dichteoperator-Formalismus zu demonstrieren, berechnen wir nun noch die Matrixelemente von ρ in der Ortsdarstellung. Hierzu ben¨ otigen wir die Energieeigenfunktionen des quantenmechanischen Oszillators in der Ortsdarstellung. Sie lauten (siehe Unterabschn. 3.3.5)
mω 1/4 H (x) mω n −x2 /2 √ . Ψn (q) = , x=q e n π¯h h ¯ 2 n! Zur Berechnung von q | ρ |q verwenden wir die Integraldarstellung der Hermite-Polynome, n 2 ∞ 2 2 2 d ex Hn (x) = (−1)n ex e−x = √ du(−2iu)n e−u +2ixu , dx π −∞
und schreiben q | ρ |q =
q | n Pn n| q
n
1 1 ψn (q )ψn∗ (q)e−β¯hω(n+ 2 ) = Z1 n 1 1 mω 1/2 − x2 +x2 1 2 = H (x)Hn (x )e−β¯hω(n+ 2 ) e n n! n Z1 π¯ h 2 n
=
∞ ∞ 2 2 1 mω 1/2 x2 +x2 e 2 du dve−u +2ixu e−v +2ix v Z1 π π¯ h −∞
−∞
∞ (−2uv)n −β¯hω(n+ 12 ) . × e n! n=0
Die Summe u uhrt werden und ergibt ¨ber n kann direkt ausgef¨ ∞ (−2uv)n −β¯hω(n+ 12 ) e = e−β¯hω/2 e−2uv exp(−β¯hω) . n! n=0
F¨ ur das gesamte Matrixelement folgt somit ∞ ∞ 1 mω 1/2 x2 +x2 −β¯hω/2 2 q | ρ |q = e e du dv Z1 π π¯ h −∞ −∞ hω) . (4.84) × exp −u2 + 2ixu − v 2 + 2ix v − 2uv exp(−β¯
Zur weiteren Auswertung dieser Gleichung machen wir von der Beziehung
478
4. Statistische Physik und Thermodynamik
∞
∞ dx1 · · ·
−∞
−∞
⎞ n n 1 dxn exp ⎝− ajk xj xk + i bk xk ⎠ 2 ⎛
j,k=1
k=1
(2π)n/2 1 = √ bj bk exp − A−1 2 jk det A Gebrauch, welche f¨ ur invertierbare symmetrische Matrizen A gilt. In unserem Fall ist 1 e−β¯hω A=2 , det A = 4 1 − e−2β¯hω , −β¯ hω e 1 so daß (4.84) u ¨bergeht in e−β¯hω/2 1 mω 1/2 q | ρ |q = 1/2 Z1 π¯h (1 − e−2β¯hω ) 2 x2 + x2 − 2xx e−β¯hω x + x2 − × exp 2 1 − e−2β¯hω 1/2 1 mω = Z1 2π¯h sinh(β¯hω) 2 xx x + x2 coth(β¯hω) + × exp − 2 sinh(β¯hω) 1/2 1 mω = Z1 2π¯h sinh(β¯hω) 6 mω β¯hω 2 (q + q ) tanh × exp − 4¯h 2 7 β¯ h ω 2 +(q − q ) coth . 2 Die Diagonalelemente dieser Dichtematrix liefern die mittlere Dichteverteilung eines quantenmechanischen Oszillators mit der Temperatur T : 1/2 mω mω β¯hω β¯hω q| ρ |q = q2 . exp − tanh tanh π¯h 2 ¯h 2 Dies ist eine Gauß-Verteilung. Im klassischen Grenzfall β¯hω 1 geht sie u ¨ber in die Verteilung 1/2 mω 2 mω 2 q 2 q| ρ |q ≈ , exp − 2πkT 2kT wie man sie auch mit Hilfe der klassischen Phasenraumdichte erh¨alt. Andererseits gilt im rein quantenmechanischen Grenzfall, also f¨ ur β¯hω 1 mω 1/2 2 mωq q| ρ |q ≈ . exp − π¯h ¯h Man beachte, daß dieser Ausdruck gerade der Wahrscheinlichkeitsdichte |Ψ0 (q)|2 eines Oszillators im Grundzustand entspricht.
4.6 Klassische Maxwell-Boltzmann-Statistik
479
4.6.4 Ideale Spinsysteme, Paramagnetismus In diesem Unterabschnitt besch¨ aftigen wir uns mit Systemen, die aus N lokalisierten magnetischen Dipolen der Ladung e und der Masse m bestehen (Festk¨ orperkristall) und einem ¨ außeren Magnetfeld ausgesetzt sind. Wie wir aus Unterabschn. 2.5.2 wissen, wirkt auf die Dipole ein Drehmoment, welches bestrebt ist, diese in Richtung des Feldes auszurichten. F¨ ur Temperaturen T > 0 kommt es jedoch nicht zu einer totalen Magnetisierung (minimale Energie, alle Dipole ausgerichtet), da die Dipole aufgrund der thermischen Bewegung versuchen, in einen Zustand maximaler Entropie zu gelangen. Offenbar sind die Grenzf¨ alle durch T → 0 mit verschwindender thermischer Bewegung und maximaler Magnetisierung und durch T → ∞ mit verschwindender Magnetisierung gegeben. Quantenmechanisch ist das magnetische Moment M ganz allgemein mit dem Drehimpuls J u ¨ber ge M= J (g = gyromagnetisches Verh¨ altnis) 2mc gekoppelt (vgl. Abschn. 3.6), wobei die m¨ oglichen Eigenwerte j, m von J bzw. J z gegeben sind durch14 3 1 J | j, m = h ¯ 2 j(j + 1) | j, m , j = 0, , 1, , . . . 2 2 J z | j, m = h ¯ m | j, m , m = −j, −j + 1, . . . , j − 1, j . Legen wir nun ein Magnetfeld B = Bez in z-Richtung an, dann ist die Energie eines magnetischen Dipols e¯ h , 2mc wobei µB das Bohrsche Magneton bezeichnet. Im folgenden beschr¨ anken wir uns zun¨ achst auf den einfachen Fall eines Spin-1/2-Systems mit g = 2 und j = 1/2, das wir mikrokanonisch behandeln. Dieses System zeigt das interessante Ph¨ anomen der negativen Temperatur. Im Anschluß gehen wir zu Systemen mit beliebigem j im kanonischen Ensemble u ¨ber und leiten das Curie-Gesetz her. = −M B = −gµB mB , µB =
I: Paramagnetismus (j = 1/2) im mikrokanonischen Ensemble. Gegeben sei ein System, bestehend aus N Spin-1/2-Dipolen, deren magnetische Momente entweder parallel oder antiparallel zum ¨ außeren, in z-Richtung verlaufenden Magnetfeld der St¨ arke B ausgerichtet sind (m = ±1/2). Bezeichnet N+ (N− ) die Zahl der Dipole mit der Energie +µB B (−µB B), dann gilt ⎧ N +n ⎪ ⎨ N+ = 2 N = N+ + N− , n = N+ − N− =⇒ ⎪ N −n ⎩N = . − 2 14
Die Unterscheidung zwischen der Masse m und der magnetischen Quantenzahl m bleibt dem Leser u ¨berlassen.
480
4. Statistische Physik und Thermodynamik
Die konstante Gesamtenergie des isolierten Systems l¨aßt sich somit schreiben als E = nµB B . Die Bestimmung der Zahl m¨oglicher Mikrozust¨ande zu dieser Energie ist ein einfaches kombinatorisches Problem: N Teilchen k¨onnen auf N ! verschiedene Arten arrangiert werden. Jedoch ergeben die N+ ! (N− !) Vertauschungen der N+ (N− ) Teilchen untereinander keine neuen Mikrozust¨ande. Die Gesamtzahl der m¨ oglichen Zust¨ande ist deshalb S(E, N ) N! = k N+ !N− ! = N ln N − N+ ln N+ − N− ln N− N+ N− + N− ln = − N+ ln N N N −n N −n N +n N +n ln + =− ln 2 2N 2 2N N +n n N −n n − , = N ln 2 − ln 1 + ln 1 − 2 N 2 N wobei die Stirling-Formel (4.28) benutzt wurde. Da die Teilchen lokalisiert und somit unterscheidbar sind, ist es nicht notwendig, den Gibbs-Faktor 1/N ! einzubeziehen. Offenbar ergibt sich das Maximum der Entropie bei einem gleichverteilten System mit n = 0, was der Anzahl m¨oglicher Besetzungszust¨ ande eines Systems aus N nichtwechselwirkenden Teilchen mit je zwei m¨ oglichen Zust¨ anden, also insgesamt 2N Zust¨anden, entspricht. Bezeichnet ∆E = 2µB B die Energiel¨ ucke des Systems, dann ergeben sich die Temperatur, die Energie und die spezifische W¨arme des Systems zu ∂S ∂S N− 1 1 k = ln = = T ∂E N,B µB B ∂n N,B ∆E N+ N− N− 1 N ∆E 1 , + = ∆E =⇒ , = exp = kT N N N+ 1 + exp − ∆E 1 + exp kT kT ⎫ ∆E ⎪ ⎪ =⇒ E(T, N, B) = −N µB B tanh ⎪ ⎬ 2kT 2 (4.85) ⎪ ∂E ∆E ∆E −2 ⎪ ⎪ =⇒ C(T, N, B) = .⎭ = Nk cosh ∂T N,B 2kT 2kT ln Ω(E, N ) =
Dabei sind N+ /N und N− /N die relativen Wahrscheinlichkeiten, einen zuf¨ allig ausgew¨ ahlten Dipol mit der Energie +µB B bzw. −µB B zu finden. Betrachten wir nun die Temperatur etwas n¨aher. Am Temperatur-Nullpunkt T = 0 sind alle Dipole im Zustand minimaler Energie −µB B, und wir finden S = 0, wie es f¨ ur ein total geordnetes System erwartet wird. F¨ uhrt man dem System Energie zu, so steigt die Entropie und n¨ahert sich ihrem
4.6 Klassische Maxwell-Boltzmann-Statistik
481
Maximum mit n = 0 und T = ∞, wie wir es f¨ ur maximale Unordnung erwarten. Nun ist es aber durchaus m¨ oglich, dem System noch mehr Energie zuzuf¨ uhren. Das obere Niveau wird dann st¨ arker besetzt sein als das untere, die Entropie f¨ allt, da wieder mehr Ordnung ins System kommt, und die Temperatur wird negativ. Bislang haben wir tats¨ achlich nur positive Temperaturen zugelassen; solche Systeme werden auch als normal bezeichnet. Dies ist notwendig, weil sonst die Zustandssummen nicht wohldefiniert sind, falls die Energie des Systems beliebig groß gew¨ ahlt werden kann (besonders evident im kanonischen Ensemble!). Diese Bedingung ist jedoch nicht mehr n¨ otig, wenn die Energie des Systems nach oben begrenzt ist. Mit solch einem Fall haben wir es hier zu tun. In der Region E > 0 und T < 0 ist das System anomal, da hier die Magnetisierung dem ¨ außeren Feld entgegengesetzt ist. Ein solcher Zustand, in dem mehr Teilchen im oberen System vorhanden sind, heißt Inversion. Bei Lasern erreicht man ihn durch sog. Pumpen. Purcell und Pound erreichten erstmals einen Zustand der Inversion der nuklearen Spins im Kristall LiF, indem sie nach Anlegen eines starken Magnetfeldes und gen¨ ugender Relaxationszeit das Feld schnell umschalteten. Die Spins sind dann nicht in der Lage, dem Feld sofort zu folgen, so daß ein Nicht-Gleichgewichtszustand entsteht, in dem die Energie h¨ oher ist als die sich schließlich einstellende Gleichgewichtsenergie. Nach ca. 10−5 Sekunden ist das System der nuklearen Spins im internen Gleichgewicht mit negativer Magnetisierung und negativer Temperatur, und erst nach ca. 5 Minuten stellt sich das Gleichgewicht zwischen den Spins und dem Gitter wieder bei positiver Energie ein. Es ist zu beachten, daß das Kristallgitter w¨ ahrend der gesamten Zeit bei positiver Temperatur verweilt; nur die Spins befinden sich im Zustand der Inversion. In Abb. 4.10 ist die Energie und die spezifische W¨ arme (4.85) unseres Dipolsystems dargestellt. Eine spezifische W¨ arme, die einen solch charakteristischen Peak zeigt, heißt Schottky-Effekt; er ist typisch f¨ ur Systeme mit einer Energiel¨ ucke.
0
-1 E N µB B
6
kT µB B
C Nk
0.5
0 6
kT µB B
Abb. 4.10. Energie (links) und spezifische W¨ arme (rechts) eines idealen Spinsystems mit j = 1/2 (siehe (4.85))
482
4. Statistische Physik und Thermodynamik
II: Paramagnetismus (j beliebig) im kanonischen Ensemble. F¨ ur den Spezialfall j = 1/2 berechnet sich die kanonische Zustandssumme des N -Dipolsystems wie folgt: ⎛ ⎞N Z(T, N, B) = exp(2βµB Bm)⎠ = Z1 (T, B)N , e−βEn = ⎝ m=± 12
n
mit Z1 (T, B) =
exp(2βµB Bm) = 2 cosh(βµB B) .
m=± 12
Hieraus lassen sich leicht die Ergebnisse aus dem mikrokanonischen Ensemble verifizieren. Wir betrachten nun stattdessen den allgemeinen Fall beliebiger j. Die Ein-Teilchen-Zustandssumme ist dann j j mx , x = βgµB Bj Z1 (T, B) = exp(βgµB mB) = exp j m=−j m=−j − exp(−x) exp (j+1)x j = exp xj − 1 ! (2j+1)x x exp 2j exp (2j+1)x − exp − 2j 2j ! = x x x exp 2j exp 2j − exp − 2j ! 1 sinh x 1 + 2j = . x sinh 2j Hieraus ergibt sich die mittlere Magnetisierung des Systems zu Mz (T, N, B) = N gµB m = wobei Bj (x) =
1 1+ 2j
N ∂ ln Z1 = N gµB jBj (x) , β ∂B
1 1 x coth x 1 + − coth 2j 2j 2j
die Brillouin-Funktion j-ter Ordnung definiert. In Abb. 4.11 ist der Verlauf dieser Funktion f¨ ur einige j zu sehen. F¨ ur große x, d.h. f¨ ur starke Magnetfelder oder niedrige Temperaturen, strebt Bj (x) f¨ ur alle j gegen ihr Maximum Eins. Dies entspricht dem Fall maximaler Magnetisierung, der sog. Saturation oder S¨ attigung. Im Grenzfall schwacher Felder oder hoher Temperaturen, x 1, k¨ onnen wir die Brillouin-Funktion in der Weise 1 x Bj (x) = 1+ + O(x3 ) 3 j entwickeln und erhalten somit
4.6 Klassische Maxwell-Boltzmann-Statistik
483
Bj (x) 1
j = 1/2
j=∞
x 10 Abb. 4.11. Brillouin-Funktionen f¨ ur j = 1/2, 1, 3/2, 5/2, 5, ∞ 0
N g 2 µ2B Bj(j + 1) . 3kT Hieraus folgt f¨ ur die magnetische Suszeptibilit¨ at das Curie-Gesetz Mz ≈
Mz N g 2 µ2B j(j + 1) Cj = , Cj = , B T 3k nach welchem die magnetische Suszeptibilit¨ at proportional zu 1/T ist. Dieses einfache Modell eines magnetisierbaren Festk¨ orperkristalls liegt in extrem ¨ guter Ubereinstimmung mit experimentellen Resultaten. F¨ ur den Fall nur zweier m¨ oglicher Einstellungen, j = 1/2, g = 2, gilt χm =
Mz = N µB B1/2 (x) = N µB tanh x . Somit ist f¨ ur x 1: Mz ≈ N µB und f¨ ur x 1: Mz ≈ N µB x. III: Paramagnetismus (j = 1/2) im kanonischen DichteoperatorFormalismus. Wir betrachten zun¨ achst wieder ein einzelnes Teilchen mit g = 2 und J = h ¯ /2·σ in einem ¨ außeren Magnetfeld B = Bez . Der zugeh¨ orige Hamilton-Operator lautet H = −µB Bσ z . Der darstellungsfreie kanonische Dichteoperator berechnet sich unter Ber¨ ucksichtigung von σ 2z = I und tr(σ z ) = 0 zu eβµB Bσz = exσz , x = βµB B ∞ ∞ ∞ xi σ iz x2i x2i−1 = =I + σz i! (2i)! (2i − 1)! i=0 i=0 i=1 = I cosh x + σ z sinh x =⇒ tr eβµB Bσz = 2 cosh x
484
4. Statistische Physik und Thermodynamik
=⇒ ρ =
1 eβµB Bσz = (I + σ z tanh x) . βµ Bσ B z tr (e ) 2
Hieraus erh¨ alt man f¨ ur den Erwartungswert des Spinoperators σ z = tr(ρσ z ) = tanh x und somit f¨ ur die Gesamtenergie des N -Teilchensystems E = −N µB Bσ z = −N µB B tanh(βµB B) , was mit der ersten Gleichung von (4.85) u ¨bereinstimmt. Man beachte, daß wir zur Berechnung von σ z keine spezielle Darstellung der σ-Matrizen w¨ahlen mußten (siehe Anwendung 64). Zusammenfassung • In der klassischen Maxwell-Boltzmann-Statistik wird die Quantennatur der Teilchen nicht ber¨ ucksichtigt. Diese N¨aherung ist gut, falls die Temperatur groß, die Zahl der Teilchen groß und die Masse der Teilchen im System nicht sehr klein ist. • F¨ ur echte klassische Systeme“, die durch klassische Hamilton” ¨ Funktionen beschrieben werden, gilt das Virial- und das Aquipartitionstheorem. • Anhand des eindimensionalen N -Teilchen-Oszillatorsystems lassen sich die verschiedenen Aspekte der klassischen Boltzmann-Statistik gut stu¨ dieren. Insbesondere zeigt sich hierbei, daß das Aquipartitionstheorem nicht gilt, wenn man den quantenmechanischen Hamilton-Operator verwendet. • Das ideale Spinsystem aus N nichtwechselwirkenden Dipolen ist ein Modell f¨ ur paramagnetische Systeme. Es zeigt das Ph¨anomen der negativen Temperatur, das z.B. in Lasern zur Anwendung kommt, und erkl¨art das Curie-Gesetz f¨ ur die Suszeptibilit¨at von Paramagneten.
Anwendungen 64. Kanonische Dichtematrix des Elektrons im magnetischen Feld in speziellen Darstellungen. Man berechne die kanonische Dichtematrix eines Elektrons (g = 2, j = 1/2) in einem magnetischen Feld B = Bez in zwei verschiedenen Darstellungen, in denen a) σ z und b) σ x diagonal ist.
Anwendungen
485
L¨ osung. Zu a) Die σ-Matrizen lauten in der Darstellung, wo σ z diagonal ist, 01 0 −i 1 0 σx = , σy = , σz = . 10 i 0 0 −1 Damit wird die kanonische Dichtematrix zu x 1 e 0 , x = βµB B , ρ= x e + e−x 0 e−x und es folgt σ z = tr(ρσ z ) =
ex − e−x = tanh(βµB B) . ex + e−x
¨ Zu b) Um σ x auf Diagonalform zu bringen, bedarf es der Ahnlichkeitstrans −1 formation σ x = U σ x U , mit 1 1 11 1 −1 U=√ , U −1 = √ . 2 −1 1 2 1 1 Damit ergibt sich f¨ ur σ x , σ z und ρ 0 1 1 0 U −1 = σ x = U 1 0 0 −1 0 −1 1 0 U −1 = σ z = U −1 0 0 −1 x 1 1 − tanh x e 0 −1 . U = ρ = U 1 0 e−x 2 − tanh x Mit diesen transformierten Matrizen berechnet sich der Erwartungswert von σ z zu σ z = tr(ρ σ z ) = tanh(βµB B) . Anhand dieses Beispiels zeigt sich noch einmal explizit, daß Erwartungswerte darstellungsunabh¨ angig sind. 65. Kanonische Dichtematrix des freien Teilchens in der Ortsdarstellung. Man berechne die kanonische Dichtematrix eines freien Teilchens in der Ortsdarstellung. L¨ osung. Der Hamilton-Operator eines freien Teilchens der Masse m lautet in der Ortsdarstellung H=−
¯2 2 h ∇ . 2m
Seine auf das Volumen V = L3 normierten Eigenfunktionen sind Ψn (x) =
h2 k 2 ¯ 2π ik·x e , E = , k= n , ni = 0, ±1, ±2, . . . . n 2m n L3/2 1
486
4. Statistische Physik und Thermodynamik
Somit gilt x| e−βH | x =
x| Ψn e−βEn Ψn | x
n
=
n
e−βEn Ψn (x)Ψn∗ (x )
β¯h2 2 1 k + ik(x − x ) exp − L3 2m k β¯h2 2 1 exp − + ik(x − x ) d3 k ≈ k 2m (2π)3 3/2 m m 2 . = (x − x ) exp − 2β¯ h2 2πβ¯h2
=
Dabei haben wir die Summe durch ein Integral ersetzt und durch quadratische Erg¨ anzung gel¨ ost. Mit 3/2 ? = m tr e−βH = d3 x x| e−βH |x = V 2πβ¯h2 ergibt sich
?
x| e−βH |x x| ρ |x = tr (e−βH )
=
1 m 2 . (x − x ) = exp − V 2β¯h2
Wie zu erwarten, sind die Matrixelemente symmetrisch unter Vertauschung von x und x . Ebenso ist anschaulich zu verstehen, daß die Diagonalelemente x| ρ |x unabh¨ angig von x sind, denn sie geben die Wahrscheinlichkeit an, das Teilchen in der N¨ahe von x zu finden. Desweiteren ist anzumerken, daß die Ausdehnung des Wellenpaketes eines Teilchens ein rein quantenmechanischer Effekt ist; im Grenzfall hoher Temperaturen wird diese Ausdehnung immer kleiner und geht schließlich gegen die δ-Funktion, also gegen die rein klassische L¨osung. Zum Schluß berechnen wir noch aus der Dichtematrix ρ die Energie: 3 m 3 ∂ ∂ ln tr e−βH = − ln V + ln = kT . H=− ∂β ∂β 2 2 2πβ¯h2
4.7 Quantenstatistik Nachdem wir im letzten Abschnitt die klassische Maxwell-Boltzmann-Statistik diskutiert haben, wenden wir uns in diesem Abschnitt der Quantenstatistik zu, in der die Quantennatur von Teilchen (Bose- bzw. Fermi-Charakter) ad¨ aquat ber¨ ucksichtigt wird. Wie in den vorangegangenen Abschnitten beschr¨ anken wir uns auch hier auf Systeme nichtwechselwirkender Teilchen, also auf ideale Systeme.
4.7 Quantenstatistik
487
Unter Bezugnahme auf Abschn. 3.9 beginnen wir unsere Diskussion mit der Rekapitulation einiger Eigenschaften von fermionischen und bosonischen Teilchensystemen und f¨ uhren den Besetzungszahlenformalismus ein. Mit seiner Hilfe lassen sich viele Zusammenh¨ ange innerhalb der Fermi-Dirac-, BoseEinstein- und auch Maxwell-Boltzmann-Statistik bequem darstellen. Im Anschluß betrachten wir das ideale Fermi-Gas und berechnen die zugeh¨ origen ur den klassischen Grenzfall hoher TemperatuZustandsgleichungen sowohl f¨ ren als auch f¨ ur den rein quantenmechanischen Fall sehr kleiner Temperaturen. Ein wichtiges Resultat wird sein, daß aufgrund des Pauli-Verbotes selbst bei T = 0 die Fermi-Teilchen angeregte Zust¨ ande besetzen, deren Energien unterhalb der Fermi-Energie liegen. Danach wenden wir uns dem idealen Bose-Gas zu und leiten die zum fermionischen Fall korrespondierenden Relationen ab. F¨ ur kleine Temperaturen, die unterhalb einer kritischen Temperatur liegen, begegnen wir hierbei dem Ph¨ anomen der Bose-EinsteinKondensation. 4.7.1 Allgemeiner Formalismus Betrachtet man ein aus N nichtwechselwirkenden Teilchen bestehendes Quantensystem, so zerf¨ allt der zugeh¨ orige Hamilton-Operator H in eine Summe u ¨ber die N Ein-Teilchenoperatoren H i : H=
N
Hi .
i=1
Sind die Eigenwertprobleme der Ein-Teilchenoperatoren gel¨ ost, H i | ki = Ei | ki , dann ergibt sich die Gesamtenergie des Systems zu E= Ei . i
Der Gesamtzustand des Systems l¨ aßt sich u ¨ber das tensorielle Produkt der normierten Ein-Teilchenzust¨ ande | ki konstruieren. Wie diese Konstruktion konkret aussieht, h¨ angt entscheidend vom Teilchencharakter ab. Fermi-Dirac-Statistik. Hat man es mit identischen Teilchen mit halbzahligen Spin (Fermionen) zu tun, dann wissen wir aus der quantenmechanischen Diskussion von N -Teilchensystemen, Abschn. 3.9, daß der Gesamtzustand | k1 , k2 , . . . , kn , A antisymmetrisch unter Vertauschung der Freiheitsgrade zweier Teilchen ist. Diese Antisymmetrie l¨ aßt sich durch folgende Konstruktion erreichen: 1 | k1 , k2 , . . . , kN , A = √ (P ) | kP1 | kP2 · · · | kPN N! P 1 (P ) | kP1 , kP2 , . . . , kPN , (4.86) = √ N! P
488
4. Statistische Physik und Thermodynamik
wobei P =
1 ... N P1 . . . PN
5
, (P ) =
+1 f¨ ur P gerade −1 f¨ ur P ungerade
√ eine Permutation von 1, . . . , N bezeichnet. Der Faktor 1/ N ! in (4.86) ist notwendig, da es N ! solcher Permutationen gibt. Man beachte, daß aufgrund des Pauli-Prinzips alle Quantenzahlen ki verschieden sind. F¨ ur Fermionzust¨ ande hat man somit die Normierungsrelation15 k1 , . . . , kN , A| k1 , . . . , kN , A > @ 1 (P ) (P ) kP , . . . , kP kP1 , . . . , kPN = 1 N N! P P = (P ) k1 , . . . , kN | kP1 , . . . , kPN P
=
k (P )δk1 kP1 · · · δkN . PN
(4.87)
P
Hierbei wurde ausgenutzt, daß die zweifache Summe u ¨ber alle Permutationen gleich N ! mal der einfachen Summe u ¨ber alle Permutationen ist. Bose-Einstein-Statistik. Im Falle identischer Teilchen mit ganzzahligem Spin (Bosonen) ist der Gesamtzustand symmetrisch unter Vertauschung der Freiheitsgrade zweier Teilchen und lautet 1 | k1 , . . . , kN , S = √ | kP1 , . . . , kPN . N !n1 ! · · · nN ! P Im Gegensatz zum fermionischen Fall gibt es hier keine Besetzungsbeschr¨ankungen der Quantenzahlen. Besitzen ni Teilchen die gleiche Quantenzahl, dann f¨ uhren die ni ! Permutationen der Quantenzahlen dieser Teilchen zu keinen neuen physikalischen Zust¨anden; dies wird durch den Normierungsfaktor ber¨ ucksichtigt. Die zu (4.87) korrespondierende Normierungsrelation lautet k1 , . . . , kN , S| k1 , . . . , kN , S 1 k δk1 kP1 · · · δkN . = PN n1 ! · · · nN !n1 ! · · · nN ! P
Maxwell-Boltzmann-Statistik. Gelten die N Teilchen als unterscheidbar, dann ist der Gesamtzustand gegeben durch | k1 , k2 , . . . , kN = | k1 | k2 · · · | kN , mit der Normierung k | k1 , . . . , kN = δk1 k1 · · · δkN , k1 , . . . , kN N 15
Wir nehmen an, daß es sich bei den ki um diskrete Quantenzahlen handelt (gebundene Zust¨ ande).
4.7 Quantenstatistik
489
wobei der Austausch zweier verschiedener Quantenzahlen einen neuen physikalischen Zustand bewirkt. Wie wir im folgenden genauer sehen werden, kann die Maxwell-Boltzmann-Statistik in vielen F¨ allen auch zur approximativen Beschreibung identischer Teilchen herangezogen werden, wie wir es in den vorangegangenen Abschnitten des¨ ofteren getan haben. In diesem Fall hat man die Ununterscheidbarkeit durch das ad hoc Hinzuf¨ ugen des Gibbsucksichtigen, wogegen sich dieser Faktor schen Korrekturfaktors 1/N ! zu ber¨ in den Fermi-Dirac- und Bose-Einstein-Statistik auf nat¨ urliche Weise durch Normierung der Zustandsvektoren ergibt. Besetzungszahlenformalismus. Zur Vereinfachung der nachfolgenden Diskussion bietet es sich an, die fermionischen und bosonischen Systemzustandskets durch die Besetzungszahlen der Ein-Teilchenzust¨ ande auszudr¨ ucken. Ordnet man die m¨ oglichen Quantenzahlen ki der Ein-Teilchenzust¨ ande in aufsteigender Reihenfolge an, dann legt der Satz von Besetzungs∞ zahlen {n0 , n1 , . . .}, mit nk = N , zusammen mit der Angabe des Teilchenk=0
charakters den N -Teilchenzustand eindeutig fest, und wir k¨ onnen schreiben: | n0 , n1 , . . . , S, A = | k1 , k2 , . . . , kN , S, A . Der linke Ausdruck bedeutet: n0 Teilchen befinden sich im niedrigsten EinTeilchenzustand | 0 , n1 Teilchen im n¨ achsth¨ oheren Ein-Teilchenzustand | 1 usw. Aufgrund dieser Identit¨ at gilt weiterhin ⎫ ∞ ⎪ H | n0 , n1 , . . . , S, A = E | n0 , n1 , . . . , S, A , E = nk Ek ⎪ ⎬ k=0 (4.88) ∞ ⎪ nk . ⎪ N | n0 , n1 , . . . , S, A = N | n0 , n1 , . . . , S, A , N = ⎭ k=0
Die letzte Beziehung kann als Definitionsgleichung f¨ ur den Teilchenoperator N angesehen werden, weil durch sie alle Matrixelemente von N in der | n0 , n1 , . . . , S, A -Basis bestimmt sind. In gleicher Weise k¨ onnen wir den Besetzungszahloperator nk definieren durch nk | n0 , n1 , . . . , S, A = nk | n0 , n1 , . . . , S, A , mit
5 nk =
0, 1
f¨ ur Fermionen
0, 1, 2, . . . f¨ ur Bosonen .
Die Normierungsrelation f¨ ur die Besetzungszahlenkets lautet n0 , n1 , . . . , S, A| n0 , n1 , . . . , S, A = δn0 n0 δn1 n1 · · · . Demnach sind zwei Zust¨ ande genau dann gleich, wenn alle ihre Besetzungszahlen u ur die Matrixelemente des ¨bereinstimmen. Aufgrund von (4.88) folgt f¨ kanonischen Dichteoperators in der | n0 , n1 , . . . , S, A -Basis
490
4. Statistische Physik und Thermodynamik
n0 , n1 , . . . , S, A| ρ |n0 , n1 , . . . , S, A = 1 ? = n0 , n1 , . . . , S, A| e−βH |n0 , n1 , . . . , S, A Z 1 nk Ek δn0 n0 δn1 n1 · · · , = exp −β Z k
mit Z=
exp −β
n0 ,n1 ,...
.
nk Ek
k
Die entsprechenden Relationen f¨ ur die großkanonische Dichtematrix lauten n0 , n1 , . . . , S, A| ρ |n0 , n1 , . . . , S, A > 1 @ n0 , n1 , . . . , S, A| e−β(H−µN ) |n0 , n1 , . . . , S, A = Y 1 = exp −β nk (Ek − µ) δn0 n0 δn1 n1 · · · , Y k
mit Y =
exp −β
n0 ,n1 ,...
nk (Ek − µ)
.
k
Das Symbol in der kanonischen Zustandssumme deutet an, daß in die Summe nur Besetzungszahlen eingehen, f¨ ur die gilt: nk = N . In der großkak
nonischen Zustandssumme gibt es dagegen keine solche Einschr¨ankung. Die Diagonalelemente der Dichtematrizen lassen sich offenbar interpretieren als die Wahrscheinlichkeit W , den Satz von Besetzungszahlen, {n0 , n1 , . . .}, im betrachteten N -Teilchensystem vorzufinden: W (n0 , n1 , . . .) = n0 , n1 , . . . , S, A| ρ |n0 , n1 , . . . , S, A . Da es in der großkanonischen Zustandssumme im Gegensatz zur kanonischen Zustandssumme keine Einschr¨ankung bzgl. der Summation gibt, l¨aßt sich die großkanonische Zustandssumme in folgender Weise weiter vereinfachen: Im bosonischen Fall hat man ∞ ! n0 ! n1 Y = e−β(E0 −µ) e−β(E1 −µ) ··· =
n0 ,n1 ,...=0 ∞ A k nk =0
e−β(Ek −µ)
! nk
=
A k
F¨ ur den fermionischen Fall ergibt sich
1 , z = eβµ . 1 − ze−βEk
4.7 Quantenstatistik 1
Y =
e−β(E0 −µ)
! n0
e−β(E1 −µ)
! n1
491
···
n0 ,n1 ,...=0
=
1 A
e−β(Ek −µ)
! nk
=
A
k nk =0
1 + ze−βEk
.
k
Der Vollst¨ andigkeit halber liefern wir noch die entsprechenden Ausdr¨ ucke f¨ ur die Maxwell-Boltzmann-Statistik im Besetzungszahlenformalismus. Offensichtlich bestimmen in diesem Fall die Besetzungszahlen {n0 , n1 , . . .} den Gesamtzustand | k1 , k2 , . . . , kN nicht eindeutig, da aus ihnen nicht hervorgeht, welches Teilchen sich in welchem Ein-Teilchenzustand befindet. Da jedoch alle, mit dem Satz {n0 , n1 , . . .} vertr¨ aglichen Zust¨ ande die gleiche Energie und somit die gleiche Wahrscheinlichkeit besitzen, m¨ ussen wir lediglich die Anzahl dieser Zust¨ ande bestimmen. Nun gibt es N ! verschiedene M¨ oglichkeiten, die N Teilchen durchzunumerieren. Befinden sich aber nk Teilchen im Zustand | k , dann f¨ uhren Permutationen dieser Teilchen selbst auf klassischem Niveau zu keinen neuen physikalischen Zust¨ anden. Jeder Satz {n0 , n1 , . . .} erh¨ alt also das Gewicht N !/(n0 !n1 ! · · ·), und wir k¨ onnen f¨ ur die kanonische Zustandssumme schreiben: 1 N! exp −β Z= nk Ek , N ! n ,n ,... n0 !n1 ! · · · 0
k
1
wobei der Gibbs-Faktor 1/N ! im Falle identischer Teilchen von Hand eingef¨ ugt wurde.16 F¨ ur die großkanonische Zustandssumme (wiederum identische Teilchen) finden wir ∞ ! n1 ! n0 1 e−β(E0 −µ) e−β(E1 −µ) ··· Y = n !n ! · · · n ,n ,...=0 0 1 0
1
∞ ! nk A 1 e−β(Ek −µ) = nk ! k nk =0 A = exp ze−βEk . k
16
Man beachte, daß diese Gleichung nat¨ urlich wieder auf (4.45) f¨ uhrt: Z =
1 N!
n0 ,n1 ,...
−βE0 n0 −βE1 n1 N! e e ··· n0 !n1 ! · · ·
1 −βEk = e N! k
N =
1 N Z1 . N!
492
4. Statistische Physik und Thermodynamik
Satz 4.17: Großkanonische Zustandssumme der Bose-Einstein-, Fermi-Dirac- und Maxwell-Boltzmann-Statistik Gegeben sei ein System aus N nichtwechselwirkenden identischen Teilchen. Bezeichnen Ek die m¨oglichen Energien der Ein-Teilchenzust¨ande, dann ist die großkanonische Zustandssumme je nach betrachteter Statistik gegeben durch (siehe (4.61)) PV 1 ln Y (T, V, µ) = = ln 1 + σze−βEk , kT σ k
mit
⎧ −1 Bose-Einstein-Statistik ⎪ ⎪ ⎨ σ = +1 Fermi-Dirac-Statistik ⎪ ⎪ ⎩ 0 Maxwell-Boltzmann-Statistik .
Der Fall σ = 0 ist hierbei als Grenzfall σ → 0 aufzufassen. F¨ ur die mittlere Energie und Teilchenzahl erh¨alt man hieraus ∂ ln Y Ek E(T, V, µ) = − = nk Ek = 1 βE k ∂β e +σ z,V k z k 1 ∂ ln Y ∂ ln Y N (T, V, µ) = =z = nk , β ∂µ ∂z T,V T,V k
wobei die mittleren Besetzungszahlen gegeben sind durch nk =
ze−βEk = 1 + σze−βEk
1 1 βEk ze
.
+σ
F¨ ur Fermionen gilt 0 ≤ nk ≤ 1, w¨ahrend die Besetzungszahlen der Bosonen keine obere Grenze haben. Bei Bosonen ist das chemische Potential wegen nk ≥ 0 stets kleiner als die kleinste Ein-Teilchenenergie E0 . Der Fall T → 0 muß f¨ ur Bosonen gesondert behandelt werden und f¨ uhrt auf die Bose-Einstein-Kondensation. Die großkanonische Zustandssumme lautet, ausgedr¨ uckt durch die Besetzungszahlen, 1 ln Y = − ln(1 − σnk ) . σ k
Unter Beachtung von 1 − σnk E − µN = nk (Ek − µ) = kT nk ln nk k
k
erh¨ alt man daraus f¨ ur die Entropie den Ausdruck 1 S = k ln Y + (E − µN ) T
4.7 Quantenstatistik
493
k 1 − σnk ln(1 − σnk ) − σnk ln =− σ nk k 1 = −k nk ln nk + (1 − σnk ) ln(1 − σnk ) . σ k
Demnach tragen unbesetzte Zust¨ ande nicht zur Entropie bei. Dies gilt auch f¨ ur Fermionzust¨ ande mit nk = 1. Dieses Verhalten spiegelt sich auch in der Unsch¨ arfe der Besetzungszahlen, (∆nk )2 = kT
∂nk = nk (1 − σnk ) , ∂µ
wider, welche f¨ ur nk = 0 und bei Fermionen auch f¨ ur nk = 1 verschwindet. Man beachte, daß die Fehlerbreiten f¨ ur√nk 1 (Bosonen) proportional zu nk sind, im Gegensatz zum klassischen nk -Verhalten. Zustandsgleichungen des idealen Quantengases. Wir k¨ onnen die in Satz 4.17 stehende Zustandssumme vereinfachen, indem wir die Summe u ¨ber die Ein-Teilchenzust¨ ande durch ein Integral ersetzen. Hierzu verfahren wir analog zur Diskussion des klassischen idealen Gases im mikrokanonischen Ensemble (Anwendung 56) und schreiben s V 4πgs V 2 d3 p = p −→ 3 dp = g( )d , h m=−s h3 k
mit der Energiedichte g( ) =
4πgs V 2 p ( ) h3
∂ ∂p
−1 ,
wobei die Summe u ¨ber etwaige Spinfreiheitsgrade durch den Entartungsfakucksichtigt ist. Beschr¨ anken wir uns auf die Spezialf¨ alle tor gs = (2s + 1) ber¨ nichtrelativistischer (NR) und ultrarelativistischer (UR) Teilchen, mit p2 , UR = cp , 2m dann lauten die zugeh¨ origen Energiedichten ⎧ √ 2πgs V (2m)3/2 ⎪ ⎪ ⎨ CNR , CNR = h3 g( ) = ⎪ V 4πg s ⎪ ⎩ CUR 2 , CUR = . c3 h3 F¨ uhren wir nun die Distributionsfunktion NR =
f ( , T, µ) =
1 1 β ze
+σ
ein, dann ergeben sich die großkanonische Zustandssumme sowie die Mittelwerte f¨ ur N und E aus folgenden Integralen:
494
4. Statistische Physik und Thermodynamik
1 d g( ) ln 1 + σze−β ln Y (T, V, µ) = σ N (T, V, µ) = dN = d f ( , T, µ)g( ) E(T, V, µ) = dN = d f ( , T, µ)g( )
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ .⎪
(4.89)
Wir werden diese gesondert in den Unterabschnitten 4.7.2 und 4.7.3 berechnen. Man kann jedoch auch ohne ihre explizite Auswertung einige n¨ utzliche Relationen herleiten. Dies wollen wir nun f¨ ur die o.g. energetischen Grenzf¨alle tun: Im nichtrelativistischen Grenzfall lautet die großkanonische Zustandssumme ∞ CNR ln Y = (4.90) d 1/2 ln 1 + σze−β . σ 0
Hieraus folgen die Erwartungswerte ∞ 3/2 ∞ 1/2 d d N = CNR . , E = CNR 1 β 1 β +σ +σ ze ze 0
0
Wegen P V = kT ln Y ergibt sich ⎛ ⎞ ∞ 3/2 !∞ d 2 CNR ⎠ kT ⎝ 3/2 ln 1 + σze−β + σβ PV = 1 β 3 σ 0 +σ ze 0
2 = E, 3 wobei partielle Integration benutzt wurde. Dies ist die gleiche Relation, wie wir sie bereits f¨ ur das ideale Boltzmann-Gas gefunden haben (siehe (4.30) und (4.31)). Die korrespondierenden Beziehungen f¨ ur den ultrarelativistischen Fall lauten ∞ CUR ln Y = d 2 ln 1 + σze−β σ 0
∞ N = CUR 0
2 d , E = CUR 1 β +σ ze
∞ 0
3 d , 1 β +σ ze
woraus in gleicher Weise wie im vorigen Fall folgt: PV =
1 E. 3
4.7 Quantenstatistik
495
Satz 4.18: Energie-Impuls-Relationen des idealen Quantengases Unabh¨angig von der betrachteten Statistik (Fermi-Dirac, Bose-Einstein, Maxwell-Boltzmann) gilt f¨ ur ein ideales Quantengas ⎧2 ⎪ ⎨ E nichtrelativistisch 3 PV = ⎪ ⎩ 1 E ultrarelativistisch . 3 Zustandsgleichungen im klassischen Grenzfall. F¨ ur den Fall, daß gilt z = eβµ 1 , k¨onnen wir weitere Relationen herleiten. Hierzu setzen wir x = β und entwickeln den in (4.90) stehenden Logarithmus bis zur 2. Ordnung um z = 0. Dies ergibt ∞ CNR σ 2 z 2 −2x 1/2 −x ln Y = σze dxx − e 2 σβ 3/2 0
∞ CNR σ2 z2 = σz − 5/2 dxx1/2 e−x σβ 3/2 2 0 √ π CNR σz z 1 − 5/2 = 2 β 3/2 2 3/2 2πmkT σz = gs V z 1 − 5/2 . 2 h 2
(4.91)
Der erste Term dieser Gleichung ist gerade die großkanonische Zustandssumme des idealen klassischen Gases und stimmt mit (4.48) aus Anwendung 58 u ucksichtigt wird. Die mittlere ¨berein, sofern dort der Entartungsfaktor gs ber¨ Teilchenzahl ergibt sich aus (4.91) zu 3/2 σz ! 2πmkT σz ∂ ln Y − , (4.92) = gs V z 1 − N =z ∂z h2 25/2 25/2 T,V so daß folgt: ln Y = N + gs V
2πmkT h2
3/2
σz 2 . 25/2
Da (4.91) ein Ausdruck 2. Ordnung ist, k¨ onnen wir in diese Gleichung den aus (4.92) in 1. Ordnung folgenden Ausdruck −3 2πmkT N2 z2 = 2 2 gs V h2 einsetzen. Damit erhalten wir schließlich den
496
4. Statistische Physik und Thermodynamik
Satz 4.19: Zustandsgleichung des idealen Quantengases im klassischen Grenzfall Im klassischen Grenzfall z 1 hat man in erster N¨aherung folgende Korrektur zur Zustandsgleichung des klassischen Gases:
3/2 3 3 3 σN h2 E = P V = kT ln Y = N kT 1 + + ... . 2 2 2 gs V 25/2 2πmkT Der Korrekturterm ist groß f¨ ur niedrige Temperaturen. Er impliziert im fermionischen Fall einen erh¨ohten Druck (bei konstanter Dichte) und somit eine effektive gegenseitige Abstoßung der Fermionen. Dagegen ist der Druck im bosonischen Fall reduziert, so daß sich die Bosonen gegenseitig effektiv anziehen. Um weitere Ergebnisse abzuleiten, ist es notwendig, die Integrale (4.89) explizit zu berechnen. Dies werden wir in den folgenden beiden Unterabschnitten f¨ ur das ideale Fermi- und Bose-Gas getrennt tun. 4.7.2 Ideales Fermi-Gas Ausgangspunkt unserer Diskussion ist die Fermi-Diracsche (FD-)Distributionsfunktion 1 fFD ( , T, µ) = 1 β +1 ze sowie die nichtrelativistische Energiedichte √ 2πgs V (2m)3/2 g( ) = CNR , CNR = , h3 die wir zur Berechnung der Integrale (4.89) heranziehen. In Abb. 4.12 ist der qualitative Verlauf der Verteilungsfunktion fFD f¨ ur verschiedene Temperaturen dargestellt. Am absoluten Temperatur-Nullpunkt ist fFD eine Stufenfunktion. Dort sind alle Ein-Teilchenzust¨ande unterhalb der Fermi-Energie fFD 1 T =0 T 0
T >0 0 µ Abb. 4.12. Fermi-Diracsche Distributionsfunktion f¨ ur verschiedene Temperaturen
4.7 Quantenstatistik
497
EF = µ besetzt, w¨ ahrend alle anderen Zust¨ ande mit > EF unbesetzt bleiben. Bei steigender Temperatur kommen immer mehr Fermionen in h¨ ohere angeregte Zust¨ ande, und die Kantenstruktur der Verteilung weicht zunehmend auf. Mit Hilfe der partiellen Integration und der Substitution x = β lassen sich die Integrale in (4.89) in folgende Ausdr¨ ucke u uhren: ¨berf¨ ⎫ ∞ 3/2 ⎪ ⎪ CNR 2 x dx gs V ⎪ ⎪ ln Y (T, V, µ) = 3/2 f (z) = ⎪ 5/2 1 3 ⎪ x 3 λ β ⎪ e + 1 ⎪ z ⎪ 0 ⎪ ⎪ ∞ 1/2 ⎪ ⎪ ⎪ CNR x dx gs V ⎪ ⎪ N (T, V, µ) = 3/2 f (z) = ⎬ 3/2 1 x 3 λ β ze + 1 (4.93) 0 ⎪ ∞ 3/2 ⎪ ⎪ CNR x dx 3 gs V ⎪ ⎪ f (z) ⎪ E(T, V, µ) = 5/2 = ⎪ 1 x 3 β 5/2 ⎪ 2 λ β + 1 e ⎪ z ⎪ ⎪ 0 ⎪ ⎪ f5/2 (z) ⎪ 3 ⎪ ⎪ , = N kT ⎭ 2 f3/2 (z) mit
λ=
h2 2πmkT
1/2
und den Fermi-Dirac-Funktionen ∞ ν−1 x dx 1 fν (z) = , zfν (z) = fν−1 (z) . 1 x Γ (ν) e + 1 z 0
Im allgemeinen ist man daran interessiert, die in (4.93) stehende Fugazit¨ at z mit Hilfe der Beziehung f¨ ur N zu eliminieren. Dies ist jedoch aufgrund der integralen Darstellung der Funktionen fν (z) nicht so ohne weiteres m¨ oglich. Man betrachtet daher gewisse Spezialf¨ alle, f¨ ur die eine Elimination von z durchf¨ uhrbar ist. Klassischer Grenzfall: T 0 ⇐⇒ z 1. Im Falle kleiner z lassen sich die Funktionen fν durch folgende Taylor-Reihe darstellen: fν (z) =
∞
(−1)n+1
n=1
zn . nν
(4.94)
Setzt man diese Reihe in die mittlere Gleichung von (4.93) ein und setzt z=
∞ l=1
dann folgt
al y l , y =
N λ3 , gs V
498
4. Statistische Physik und Thermodynamik
y =
al y l −
l
1 23/2
= a1 y + a2 −
l,l
a21 23/2
1
al al y l+l +
33/2
l,l ,l
2a1 a2 a31 y + a3 − 3/2 + 3/2 2 3 2
al al al y l+l +l + . . . y3 + . . . .
Hieraus ergeben sich die ersten Entwicklungskoeffizienten von z zu 1 1 − 3/2 . 4 3 Geht man nun mit dieser z-Reihe z.B. in die letzte Gleichung von (4.93), dann erh¨ alt man eine Virialentwicklung der Form l−1 ∞ 3 N λ3 E(T, V, N ) = N kT bl , gs V 2 a1 = 1 , a2 =
1
23/2
, a3 =
l=1
mit den ersten Koeffizienten 1 1 2 b1 = 1 , b2 = 5/2 , b3 = − 5/2 . 8 3 2 Ber¨ ucksichtigt man hierbei nur den ersten Term, so ergibt sich wieder die kalorische Zustandsgleichung (4.30) des idealen klassischen Gases, w¨ahrend die Ber¨ ucksichtigung der ersten beiden Terme wieder auf Satz 4.19 f¨ uhrt. Total entartetes Fermi-Gas: T = 0 ⇐⇒ z → ∞. Im Falle des total entarteten Fermi-Gases konvergiert die Reihenentwicklung (4.94) nicht. Wir k¨ onnen jedoch in diesem Fall ausnutzen, daß die Verteilungsfunktion stufenf¨ ormig ist: 5 1 f¨ ur ≤ µ0 1 fFD ( , 0, µ) = 1 /kT , µ0 = µ(T = 0) = EF . = +1 0 f¨ ur > µ0 ze Damit berechnen wir: EF √ 2 4πgs V (2m)3/2 3/2 3/2 EF . N = CNR d = CNR EF = 3 3h3 0
F¨ ur die Fermi-Energie bzw. f¨ ur das chemische Potential folgt hieraus 2/3 3N h2 EF = µ0 = . 2m 4πgs V Die Grundzustandsenergie ergibt sich zu EF 2 4πgs V (2m)3/2 5/2 5/2 E = CNR d 3/2 = CNR EF = EF . 5 5h3 0
4.7 Quantenstatistik
499
Satz 4.20: Total entartetes Fermi-Gas ur die mittlere Energie (NullpunktsBeim total entarteten Fermi-Gas gilt f¨ energie) 3 N EF . 5 Aufgrund des Paulischen Ausschließungsprinzips befinden sich nicht alle Teilchen im Grundzustand. Vielmehr sind alle Zust¨ ande bis zur FermiEnergie 2/3 3N h2 EF = 2m 4πgs V E(T = 0, V, N ) =
besetzt. Der Fall T = 0 ist insofern von praktischem Interesse, als daß f¨ ur viele quantenstatistische Systeme typische Anregungstemperaturen weit oberhalb der jeweiligen Systemtemperatur liegen, so daß solche Systeme gut durch ihre Eigenschaften am Temperatur-Nullpunkt beschrieben werden. Typische Werte f¨ ur Fermi-Temperaturen TF = EF /k sind: 0.3 K in fl¨ ussigem 3 He, 5 · 104 K 9 f¨ ur Leitungselektronen einfacher Metalle, 3 · 10 K in weißen Zwergen und 3 · 1012 K in Neutronensternen. Entartetes Fermi-Gas: 0 < T TF ⇐⇒ z 1. Auch im Falle des entarteten Fermi-Gases konvergiert die Reihenentwicklung (4.94) nicht. Wir wissen nun aber, daß die Verteilungsfunktion fFD nur schwach mit der Energie variiert, mit Ausnahme des engen Bereiches um ≈ µ. Mit anderen Worten: ∂fFD /∂ hat ein extrem scharfes Maximum um den Wert = µ, ∂fFD 1 , =− 4kT ∂ =µ und kommt einer δ-Funktion sehr nahe. Betrachten wir nun die Funktion F ( ) = d g( ) , 0
dann folgt unter Verwendung der partiellen Integration f¨ ur die mittlere Teilchenzahl ∞ ∞ N = d fFD ( )F ( ) = − d fFD ( )F ( ) . 0
0
Die Entwicklung von F ( ) um µ, 1 F ( ) = F (µ) + F (µ)( − µ) + F (µ)( − µ)2 + . . . , 2 liefert weiterhin
500
4. Statistische Physik und Thermodynamik
N = I0 F (µ) + I1 F (µ) + I2 F (µ) + . . . , mit ∞ I0 = −
d fFD ( )
∞ , I1 = −
0
1 I2 = − 2
d ( − µ)fFD ( )
0
∞
( ) . d ( − µ)2 fFD
0
Da nur niedrige Temperaturen betrachtet werden, k¨onnen die unteren Integrationsgrenzen von I0 , I1 und I2 nach −∞ verschoben werden. I0 ist dann Eins, und I1 verschwindet, da ( − µ)fFD ( ) eine ungerade Funktion in x = β( − µ) ist. Somit verbleibt 1 I2 = 2β 2
∞ dx −∞
x2 ex π2 = . (ex + 1)2 6β 2
Wir haben dann π2 N = F (µ) + 2 F (µ) + . . . = 6β
µ
π2 d g( ) + 2 g (µ) + . . . ≈ 6β
0
=⇒ g(µ)(EF − µ) ≈
π2 g (µ) . 6β 2
√ Mit g( ) = CNR finden wir schließlich EF2 π2 EF π2 1 − . ≈ E µ(T ) ≈ + − F 2 4 12β 2 12β 2 EF2 Hieraus ergibt sich f¨ ur die mittlere Energie ∞
µ d fFD ( )g( ) ≈
E =
0
0
π2 d g( ) d g( ) + 2 6β d =µ
EF µ π2 ≈ d g( ) + d g( ) + 2 g(EF ) 4β 0
EF
3 π2 ≈ N EF + (µ − EF )EF g(EF ) + 2 g(EF ) 5 4β
2 3 5π 2 kT π2 3 ≈ N EF + 2 g(EF ) = N EF 1 + . 5 6β 5 12 EF
EF d g( ) 0
4.7 Quantenstatistik
501
Satz 4.21: Entartetes Fermi-Gas F¨ ur T TF = EF /k hat man folgende Korrekturen zur Nullpunktsenergie:
2 3 5π 2 kT E(T, V, N ) = N EF 1 + + ... . 5 12 EF armekapazit¨ at ergibt sich hieraus zu Die W¨ N kπ 2 T ∂E CV (T, V, N ) = = ∂T V 2 TF und ist somit sehr viel kleiner als die klassische W¨ armekapazit¨ at CV = 3N k/2. F¨ ur die Entropie des entarteten Gases erh¨ alt man mit (4.61) und Satz 4.18 1 1 5 N kπ 2 T S = (E − F ) = . E − µN = T T 3 2 TF Im Gegensatz zur Entropie des klassischen Gases (siehe (4.32) in Anwendung ¨ 56) gilt hier in Ubereinstimmung mit dem 3. Hauptsatz: T → 0 =⇒ S → 0. Zum Schluß dieses Unterabschnittes merken wir noch an, daß sich die hier vorgef¨ uhrte Entwicklung von ∞ d fFD ( )g( ) 0
f¨ ur z 1 nach Sommerfeld verallgemeinern l¨ aßt und auf folgende Entwickauft: lungen der Funktionen fν (z) in ln z hinausl¨ 5π 2 8 5/2 −2 √ (ln z) f5/2 (z) = (ln z) + . . . 1+ 8 15 π π2 4 (ln z)−2 + . . . f3/2 (z) = √ (ln z)3/2 1 + 8 3 π 2 π 2 (ln z)−2 + . . . . f1/2 (z) = √ (ln z)1/2 1 − 24 π In den meisten F¨ allen ist es hierbei nicht n¨ otig, mehr als die ersten Terme zu betrachten, da das Verh¨ altnis zweier aufeinander folgender Terme von der Gr¨ oßenordnung (kT /µ)2 ist. 4.7.3 Ideales Bose-Gas Wir betrachten nun das ideale Bose-Gas und verfahren dabei analog zum vorherigen Unterabschnitt. Ausgangspunkt sind die in Satz 4.17 stehenden Summen f¨ ur ln Y , E und N bzw. die Integrale (4.89), mit der Bose-Einsteinschen (BE-)Distributionsfunktion
502
4. Statistische Physik und Thermodynamik
fBE ( , T, µ) =
1 1 β ze
−1
und der nichtrelativistischen Energiedichte √ 2πgs V (2m)3/2 g( ) = CNR , CNR = . h3 −1 Wegen nk = eβ(Ek −µ) − 1 ≥ 0 gilt f¨ ur das Bose-Gas bei allen Temperaturen E =0
0 µ ≤ Ek =⇒ µ≤0, 0 Nmax =
Wir wollen dieses Ph¨anomen der Bose-Einstein-Kondensation nun etwas genauer untersuchen. Nach (4.98) lautet die Bedingung f¨ ur das Einsetzen der Bose-Einstein-Kondensation bei konstanter Teilchenzahl und konstantem Volumen 2/3 N h2 T < Tc = . 2πmk gs V g3/2 (1) Im allgemeinen besteht das System f¨ ur T < Tc aus einem Gemisch beider Phasen, denn es gilt ⎧ 1 f¨ u r T ≥ Tc ⎪ ⎪ ⎨ N 3/2 = T ⎪ N ⎪ f¨ ur T < T c ⎩ Tc ⎧ 0 f¨ u r T ≥ Tc ⎪ ⎪ ⎨ N0 3/2 = T ⎪ N ⎪ f¨ ur T < T c . ⎩1− Tc Diese Verh¨ altnisse sind in Abb. 4.13 graphisch veranschaulicht. Druck erhalten wir aus der ersten Gleichung in (4.95) ⎧ N kT g5/2 (z) ⎪ ⎪ f¨ ur T ⎪ ⎪ V g3/2 (z) ⎪ ⎪ ⎪ ⎨ kT g (1) N kTc P (T, V, N ) = ln Y = N kTc 5/2 ≈ 0.5134 f¨ ur T ⎪ V V g V (1) ⎪ 3/2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ gs kT g (1) f¨ ur T 5/2 λ3
F¨ ur den
> Tc = Tc < Tc ,
4.7 Quantenstatistik
505
1 N0 N
N N
T T
c 0 1 Abb. 4.13. Zahlenvergleich zwischen bosonischen Grundzust¨ anden und angeregten Zust¨ anden in Abh¨ angigkeit von der Temperatur
wobei f¨ ur T ≥ Tc ausgenutzt wurde, daß gilt: N0 ≈ 0 =⇒
N λ3 = g3/2 (z) . gs V
(4.99)
Man erkennt, daß der Druck am kritischen Punkt nur etwa halb so groß ist wie der des klassischen Gases. Desweiteren ist der Druck unterhalb von Tc unabh¨ angig von N und V . Dies resultiert aus der Tatsache, daß Teilchen im Grundzustand nicht zum Druck beitragen. Als n¨ achstes berechnen wir unter Ber¨ ucksichtigung von gs V 3 ∂ ln Y = kT 3 g5/2 (z) E = kT 2 ∂T 2 λ z,V die spezifische W¨ arme 1 ∂E CV = . Nk N k ∂T N,V angig von T , und wir erhalten F¨ ur T < Tc ist z = 1 und unabh¨ 3 gs V T d CV 15 gs V = g5/2 (1) g5/2 (1) ∼ T 3/2 . = 3 Nk 2 N dT λ 4 N λ3 angig. In diesem Fall ergibt sich Dagegen ist z f¨ ur T ≥ Tc temperaturabh¨ unter Ausnutzung von (4.96) und (4.99) 3 gs V d T 15 gs V 3 gs V T dz CV = g5/2 (z) = g5/2 (z) + g (z) Nk 2 N dT λ3 4 N λ3 2 N λ3 5/2 dT 15 g5/2 (z) 3 T dz = + . 4 g3/2 (z) 2 z dT Die Ableitung dz/dT k¨ onnen wir in der Weise dz dz dg3/2 dT d dz 1 g1/2 (z) = g3/2 (z) = = dT dT dT dz dT z dT umformen, so daß insgesamt folgt:
N λ3 gs V
=−
3 g3/2 (z) 2T
506
4. Statistische Physik und Thermodynamik
15 g5/2 (z) 9 g3/2 (z) CV = − . Nk 4 g3/2 (z) 4 g1/2 (z) Hieraus ergibt sich der klassische Grenzfall (z → 0 , T Tc ) zu 3 15 9 = Nk . − CV = N k 4 4 2 Am kritischen Punkt (z → 1 , T = Tc ) divergiert g1/2 , so daß die spezifische arme dort durch W¨ 15 g5/2 (1) CV = N k = 1.925N k 4 g3/2 (1) gegeben und somit deutlich gr¨oßer ist als die des klassischen idealen Boltzmann-Gases (CV = 3N k/2). Man beachte, daß CV im Gegensatz zu dCV /dT am kritischen Punkt stetig ist. Zusammenfassung • Im Gegensatz zur klassischen Maxwell-Boltzmann-Statistik wird in der Quantenstatistik der fermionische bzw. bosonische Charakter von Teilchen ber¨ ucksichtigt. • Innerhalb der Quantenstatistik erweist sich der Besetzungszahlenformalismus f¨ ur Systeme nichtwechselwirkender Teilchen als sehr n¨ utzlich, in welchem der N -Teilchen-Quantenzustand durch die Besetzungszahlen aller m¨ oglichen Ein-Teilchenzust¨ande spezifiziert wird. Mit diesem Formalismus gewinnt man relativ einfache Formeln f¨ ur die großkanonische Zustandssumme, die mittlere Energie und die mittlere Teilchenzahl. Aus ihnen l¨ aßt sich f¨ ur gewisse Spezialf¨alle (T groß: klassischer Grenzfall und T klein: rein quantenmechanischer Grenzfall) die Fugazit¨at eliminieren. • Aufgrund des Paulischen Ausschließungsprinzips befinden sich selbst am absoluten Temperatur-Nullpunkt nicht alle Teilchen eines idealen Fermi-Gases im Grundzustand. Vielmehr sind alle EinTeilchenzust¨ ande mit Energien kleiner gleich der Fermi-Energie besetzt. • Beim idealen Bose-Gas tritt f¨ ur kleine Temperaturen die BoseEinstein-Kondensation auf. Dieses Ph¨anomen resultiert aus der Tatsache, daß angeregte Zust¨ande nur durch eine begrenzte Zahl von Teilchen besetzt werden k¨onnen, so daß alle weiteren Teilchen im thermodynamischen Limes notwendigerweise in den Grundzustand kondensieren.
Anwendungen
507
Anwendungen 66. Ideales Photonengas. Man berechne die freie Energie, Entropie und Energie sowie den Druck eines idealen Photonengases. L¨ osung. Photonen sind masselose Spin-1-Teilchen und werden deshalb durch ur sie gilt die ultrarelativistische die Bose-Einstein-Statistik beschrieben. F¨ Energie-Impuls-Relation = c|p| = h ¯ω , p = h ¯ k , ω = c|k| , wobei ω die Frequenz und k den Wellenvektor der Lichtteilchen bezeichnen. Aufgrund der Tatsache, daß Photonen durch Atome absorbiert und emittiert werden k¨ onnen, ist die Gesamtzahl der Photonen nicht erhalten, so daß gilt: µ = 0. Hieraus folgt sofort f¨ ur die freie Energie F = µN − P V = −P V . Andererseits gilt nach Satz 4.17 P V = kT ln Y = −kT ln 1 − eβEk , k
wobei u oglichen Wellenvektoren k summiert wird. Diese Summe ¨ber alle m¨ k¨onnen wir wieder mit Hilfe der ultrarelativistischen Energiedichte 4πgs V gUR ( ) = CUR 2 , CUR = 3 3 c h in das Integral ∞ ∞ 8πV −β = kT 3 3 d 2 ln 1 − e−β F = kT d g( ) ln 1 − e c h 0
0
umschreiben. Hierbei ist zu beachten, daß der Entartungsfaktor gs aufgrund der Transversalit¨ at des elektromagnetischen Feldes gleich Zwei (und nicht Drei wie bei anderen Spin-1-Teilchen) ist. Es folgt mit partieller Integration und der Substitution x = β ∞ (kT )4 V dxx3 4σ π2 k4 4 V T F (T, V ) = − 2 3 3 = − , σ = , ex − 1 3c 3π ¯ h c 60¯ h3 c2 0 π 4 /15
wobei σ ebenfalls Boltzmann-Konstante genannt wird. Aus der freien Energie erh¨ alt man die u oßen zu ¨brigen gesuchten Gr¨ ∂F 4σ 4 P (T, V ) = − = P (T ) = (Boltzmann-Gesetz) T ∂V T 3c ∂F 16σ V T3 S(T, V ) = − = ∂T V 3c 4σ V T 4 = 3P V . E(T, V ) = F + T S = c
508
4. Statistische Physik und Thermodynamik
67. Ideales Phononengas. Man berechne die spezifische W¨arme eines Festk¨ orpers in einem Modell, wo die Auslenkungen der Atome um ihre Gleichgewichtspositionen durch quantisierte harmonische Schwingungen gen¨ahert werden. L¨ osung. Das physikalische Ausgangsproblem besteht in der Beschreibung von N Atomen eines kristallinen Festk¨orpers. In der harmonischen N¨ aherung werden die Auslenkungen der Atome um ihre Gleichgewichtslagen durch eine Taylor-Reihenentwicklung der potentiellen Energie beschrieben, die nur bis zum quadratischen Term geht. Da der lineare Term in der Gleichgewichtslage verschwindet, besteht die klassische Hamilton-Funktion des Systems in dieser Genauigkeit nur aus einer konstanten Nullpunktsenergie, der kineti3N 3N 2 schen Energie T = m x˙ i und der potentiellen Energie V = Aij xi xj . 2 i=1
i,j=1
Solch eine Hamilton-Funktion kann nun aber immer auf Normalform gebracht werden (siehe Anwendung 7 in Abschn. 1.2), wobei die Normalkoordinaten den Normalschwingungen des Gitters entsprechen. Diese Normalkoordinaten der 3N ungekoppelten linearen harmonischen Oszillatoren lassen sich formal quantisieren. Die quantisierten Gitterschwingungen, sog. Phononen, k¨onnen somit als ein ideales ultrarelativistisches Bose-Gas mit der Energiedichte 12πV , =h ¯ω (gs = 3) c3 h3 betrachtet werden. Da Phononen in beliebiger Zahl erzeugt werden k¨onnen, ist ihr chemisches Potential Null, also z = 1. gUR ( ) = CUR 2 , CUR =
Einstein-Modell. Wir berechnen die spezifische W¨arme zun¨achst in der Einstein-N¨ aherung. Dort werden alle 3N Oszillatoren als unabh¨angig voneinander und mit der gleichen Frequenz ωE schwingend betrachtet. Diese Problemstellung haben wir bereits in Unterabschn. 4.6.3 diskutiert. Nach (4.79) ergibt sich deshalb die Energie des Systems zu E=
3N ¯hωE . 2 tanh β¯h2ωE
Hieraus folgt f¨ ur die spezifische W¨arme 2 eβ¯hωE ∂E 3N ¯h2 ωE x2 ex = = 3N k , CV = ∂T V kT 2 (eβ¯hωE − 1)2 (ex − 1)2 mit ¯ ωE h . kT F¨ ur hohe Temperaturen, x 1, erhalten wir sofort x=
CV = 3N k
(Gesetz von Dulong und Petit).
F¨ ur kleine Temperaturen, x 1, ergibt sich
Anwendungen
509
CV = 3N kx2 e−x . W¨ ahrend das Hochtemperaturverhalten experimentell gut best¨ atigt ist, findet man im Experiment f¨ ur kleine Temperaturen ein T 3 -Verhalten, welches das simple Einstein-Modell offenbar nicht erkl¨ aren kann. Debye-Modell. Das Debye-Modell ersetzt die Einstein-Frequenz ωE durch ein kontinuierliches Spektrum an Schwingungsmoden, die wir analog zum Photonenspektrum berechnen k¨ onnen. Die Anzahl der Moden im Frequenzintervall [ω : ω + dω] ist 12πV 2 ω dω . c3 Die maximale Frequenz (Debye-Frequenz) ωD bestimmt sich aus gUR (ω)dω =
ωD g(ω)dω = 3N 0
zu 3N c3 . 4πV Sie tr¨agt der Tatsache Rechnung, daß sich im Gitter keine Schwingungen ausbreiten k¨onnen, deren Wellenl¨ ange kleiner ist als die Gitterkonstante des Kristalls. Solch eine Einschr¨ ankung gab es beim Photonengas nicht. Nach Satz 4.17 lautet die mittlere Energie ¯ hωk E(T, V ) = , eβ¯hωk − 1 3 ωD =
k
die sich im Limes V → ∞ in folgendes Integral umschreiben l¨ aßt: ωD E(T, V ) = dωgUR (ω) 0
hω ¯ = 3N kT D(xD ) , xD = β¯ hωD . eβ¯hω − 1
Hierbei bezeichnet
⎧ x2 3xD ⎪ ⎪ xD + D + . . . f¨ ur xD 1 1− ⎨ 3 3 x 8 20 = D(xD ) = 3 dx x π4 xD e −1 ⎪ ⎪ ⎩ 3 + O e−xD f¨ ur xD 1 0 5xD
die Debye-Funktion. Unter Ber¨ ucksichtigung von ¯ ωD h ¯ ωD h TD = , TD = kT T k erhalten wir f¨ ur die Energie xD =
510
4. Statistische Physik und Thermodynamik
⎧ 2 ⎪ 1 TD 3 TD ⎪ ⎪ + + · · · f¨ u r T TD 1 − ⎨ 8 T 20 T E = 3N kT D(xD ) = 3N kT 3 ⎪ π4 T ⎪ ⎪ f¨ u r T TD + O e−TD /T ⎩ 5 TD und f¨ ur die spezifische W¨arme ⎧ 2 ⎪ ⎪ 3 − 3 TD ⎪ + ··· f¨ u r T TD ⎨ CV 20 T = ⎪ 12π 4 T 3 Nk ⎪ ⎪ + O(e−TD /T ) f¨ u r T TD . ⎩ 5 TD Das Debye-Modell ist also in der Lage, das T 3 -Tieftemperaturverhalten der spezifischen W¨ arme zu erkl¨aren.
A. Mathematischer Anhang
Dieses Kapitel rekapituliert einige grundlegende, in diesem Buch h¨ aufig benutzte mathematische Relationen aus den Bereichen der Analysis und der Vektoranalysis. Es wird hierbei auf mathematische Strenge verzichtet, um dem Leser das schnelle Nachschlagen zu erleichtern.
A.1 Vektoroperationen Vektoroperatoren. Die dreidimensionalen Vektoroperationen Gradient, Divergenz und Rotation sind in kartesischer Darstellung mit kanonischer, orthonormierter Basis {ex , ey , ez } definiert durch ∂ψ ∂ψ ∂ψ + ey + ez ∂x ∂y ∂z ∂Ax ∂Ay ∂Az Divergenz: ∇A = + + ∂x ∂y ∂z ∂Ay ∂Az ∂Az ∂Ax − + ey − Rotation: ∇ × A = ex ∂y ∂z ∂z ∂x ∂Ax ∂Ay + ez − , ∂x ∂y
Gradient:
∇ψ = ex
wobei A = Ax (x, y, z)ex + Ay (x, y, z)ey + Az (x, y, z)ez ein Vektorfeld und ψ = ψ(x, y, z) ein Skalarfeld bezeichnen. H¨ angen die kartesischen Koordinaten x, y, z von Zylinderkoordinaten in der Weise x = r cos ϕ , y = r sin ϕ , z = z ab (Abb. A.1 links), dann gilt ∂ sin ϕ ∂ ∂ − = cos ϕ ∂x ∂r r ∂ϕ ∂ ∂ cos ϕ ∂ = sin ϕ + ∂y ∂r r ∂ϕ ∂ ∂ = . ∂z ∂z
512
A. Mathematischer Anhang z
z
r
r z
θ y
ϕ
.
ϕ
y
.
x x Abb. A.1. Zusammenhang zwischen kartesischen und sph¨ arischen Koordinaten (links) bzw. zylindrischen Koordinaten (rechts)
Im Falle einer Abh¨angigkeit von sph¨arischen Koordinaten (Kugelkoordinaten), x = r cos ϕ sin θ , y = r sin ϕ sin θ , z = r cos θ , gilt (Abb. A.1 rechts) ∂ sin ϕ ∂ cos ϕ cos θ ∂ ∂ = cos ϕ sin θ − + ∂x ∂r r sin θ ∂ϕ r ∂θ ∂ ∂ cos ϕ ∂ sin ϕ cos θ ∂ = sin ϕ sin θ + + ∂y ∂r r sin θ ∂ϕ r ∂θ ∂ ∂ sin θ ∂ = cos θ − . ∂z ∂r r ∂θ Die entsprechenden Gleichungen f¨ ur Gradient, Divergenz und Rotation in anderen Basissystemen, wie z.B. der sph¨arischen Basis {er , eθ , eϕ } oder der Zylinderbasis {er , eϕ , ez }, werden in diesem Buch nicht verwendet und deshalb nicht diskutiert. H¨ aufig benutzte Formeln der Vektorrechnung und -analysis sind: A(B × C) A × (B × C) (A × B)(C × D) ∇ × ∇ψ ∇(∇ × A) ∇ × (∇ × A)
= = = = = =
B(C × A) = C(A × B) B(AC) − C(AB) (AC)(BD) − (AD)(BC) 0 0 ∇(∇A) − ∇2 A
∇(ψφ) = ψ∇φ + φ∇ψ ∇(ψA) = ψ∇A + A∇ψ ∇ × (ψA) = ψ∇ × A − A × ∇ψ ∇(A × B) = B(∇ × A) − A(∇ × B) ∇ × (A × B) = (B∇)A − B(∇A) − (A∇)B + A(∇B) ∇(AB) = (B∇)A + B × (∇ × A) + (A∇)B + A × (∇ × B).
A.2 Integrals¨ atze
513
A.2 Integrals¨ atze Gaußscher Satz. Gegeben sei ein Vektorfeld A(x) und ein Volumen V mit einer geschlossenen Oberfl¨ ache F , deren Normale dF = dF n in jedem Oberfl¨ achenpunkt senkrecht nach außen gerichtet ist. Dann gilt dV ∇A = dF A . V
F
Hieraus folgt insbesondere f¨ ur A = cψ bzw. A = c × B, c = const dV ∇ × B = dF × B . dV ∇ψ = dF ψ , V
F
V
F
Stokesscher Satz. Gegeben sei ein Vektorfeld A(x) und eine geschlossene Kurve C mit Umlaufsinn (Wegelement: dl), u are Fl¨ ache F ¨ber die eine regul¨ mit orientierter Fl¨ achennormalen dF = dF n gespannt ist. Dann gilt dF ∇ × A = dlA . F
C
Die Ersetzung von A durch cψ bzw. c × B f¨ uhrt zu dF × ∇ψ = dlψ , (dF × ∇) × B = dl × B . F
C
F
C
Die Orientierung der Fl¨ ache F ist hierbei so zu w¨ ahlen, daß der Umlaufsinn von C mit der Normalen n der im Oberfl¨ achenintegral gew¨ ahlten Seite von F eine Rechtsschraube bildet (Abb. A.2). n F
C Abb. A.2. Eine Kurve C mit Umlaufsinn und eine von C eingespannte bzw. u ¨ber C gest¨ ulpte Fl¨ ache F
1. Greensche Identit¨ at. Setzt man A = φ∇ψ, dann folgt aufgrund von ∇(φ∇ψ) = φ∇2 ψ + ∇φ∇ψ und des Gaußschen Satzes dV (φ∇2 ψ + ∇φ∇ψ) = dF φ∇ψ . (A.1) V
514
A. Mathematischer Anhang
2. Greensche Identit¨ at. Schreibt man (A.1) unter Vertauschung von φ und ψ noch einmal an und subtrahiert diese Gleichung von (A.1), dann folgt dV (φ∇2 ψ − ψ∇2 φ) = dF (φ∇ψ − ψ∇φ) . (A.2) V
F
A.3 Partielle Differentialquotienten Totale Differentiale. Im folgenden betrachten wir eine Funktion f (x, y) in den Variablen x und y, die mindestens zweimal differenzierbar ist, so daß gilt: ∂2f ∂2f = ∂x∂y ∂y∂x
(A.3)
(die Erweiterung auf mehr Variable ist unproblematisch). Das Differential df heißt totales Differential von f , falls gilt: ∂f ∂f df = f (x + dx, y + dy) − f (x, y) = dx + dy . ∂x y ∂y x Offensichtlich ist dieser Ausdruck ¨aquivalent zu der Wegunabh¨angigkeit von Linienintegralen u ¨ber df , (x2 ,y2 )
(x2 ,y2 )
df = (x1 , y1 ) C1
df
⇐⇒
df = 0 ,
(x1 , y1 ) C2
da bei der Summation der Differenzen df nur die Werte an den Endpunkten u ur einen beliebigen Ausdruck ¨brig bleiben. Wegen (A.3) folgt f¨ df = A(x, y)dx + B(x, y)dy die Vorw¨ artsrichtung der Aussage:
df ist vollst¨ andiges Differential ⇐⇒
∂A ∂y
= x
∂B ∂x
. y
Die r¨ uckw¨ artige Richtung l¨aßt sich mit Hilfe des Stokesschen Satzes folgendermaßen zeigen: ⎞ ⎛ 0 ⎠ , 0 df = dlV = dF ∇ × V = dF ⎝ ∂B ∂A − ∂x ∂y C C F F mit dl = dxex + dyey , V = Aex + Bey .
A.4 Vollst¨ andige Funktionensysteme, Fourier-Analyse
515
Umformung partieller Differentialquotienten. Aus der Gleichung ∂f ∂f dx + dy df = ∂y x ∂x y lassen sich eine Reihe von Beziehungen zwischen Differentialquotienten ableiten. H¨alt man z.B. die Variable y fest (dy = 0), dann folgt −1 ∂f ∂x = . ∂f y ∂x y Bei festgehaltenem f (df = 0) ergibt sich ∂f ∂x ∂f =− . ∂y x ∂x y ∂y f
(A.4)
Mit dieser Beziehung lassen sich festgehaltene und ver¨ anderte Variable gegeneinander austauschen. Geht man zu einer anderen Variablen u ¨ber, z.B. y → g(x, y), dann gilt wegen ∂g ∂f ∂f ∂g df = dx + dx + dy (A.5) ∂x g ∂g x ∂x y ∂y x f¨ ur dy = 0 ∂f ∂g ∂f ∂f = + . ∂x y ∂x g ∂g x ∂x y Diese Gleichung wird dazu benutzt, um die festgehaltene Variable neu zu w¨ ahlen. F¨ ur dx = 0 ergibt sich aus (A.5) die partielle Form der Kettenregel: ∂g ∂f ∂f = . (A.6) ∂y x ∂g x ∂y x Wegen (A.4) und (A.6) folgt weiterhin ∂f ∂g ∂x ∂g ∂y ∂f = ∂g x ∂f y ∂x g ∂g f ∂y f ∂f g ∂y ∂x = . ∂y f ∂x g Hiermit l¨ aßt sich das Paar (f, g) gegen (x, y) austauschen.
A.4 Vollst¨ andige Funktionensysteme, Fourier-Analyse Gegeben sei ein vollst¨ andiges, reelles oder komplexes diskretes Funktionensystem {gn (x), n = 0, 1, 2, . . .}, das im Sinne des Skalarproduktes
516
A. Mathematischer Anhang a+2L
dxgi (x)gj∗ (x)
gi , gj = a
im Intervall [a : a + 2L] orthonormiert ist, also gi , gj = δij . Desweiteren besitze eine Funktion f folgende Eigenschaften: • f und f sind in [a : a + 2L] st¨ uckweise stetig. • f besitzt eine endliche Zahl von endlichen Sprungstellen. • f ist periodisch: f (x) = f (x + 2L). Dann l¨ aßt sich f in der Weise f (x) =
a+2L
dxf (x)gn∗ (x)
an gn (x) , an = f, gn =
n
a
entwickeln. Fourier-Reihen. Die komplexen Funktionen inπ 1 gn (x) = √ exp x , n = 0, ±1, ±2 . . . L 2L bilden ein vollst¨andiges Orthonormalsystem im obigen Sinne. Hierf¨ ur lautet die Reihenentwicklung (Fourier-Reihe) einer Funktion f ∞ 1 inπ x , f (x) = √ an exp L 2L n=−∞ mit 1 an = √ 2L
inπ x . dxf (x) exp − L
a+2L
a
Insbesondere gilt f¨ ur die δ-Funktion δ(x − x ) =
∞ exp(ikn (x − x )) nπ , kn = . 2L L n=−∞
(A.7)
Fourier-Integrale. Weiten wir nun das Periodizit¨atsintervall auf Unendlich aus, L → ∞, dann geht (A.7) u ¨ber in ∗ ∞ ∞ exp(ik(x − x )) exp(ikx) exp(ikx ) √ δ(x − x ) = dk dk √ , = 2π 2π 2π −∞
−∞
bzw. wegen der Symmetrie in k und x ∗ ∞ exp(ikx) exp(ik x) √ δ(k − k ) = dx √ . 2π 2π −∞
A.5 Bessel-Funktionen, sph¨ arische Bessel-Funktionen
517
Offensichtlich bilden die Funktionen exp(ikx) g(k, x) = √ 2π ein vollst¨ andiges kontinuierliches Funktionensystem mit Normierung auf die δ-Funktion. F¨ ur eine beliebige Funktion f gilt daher die Fourier-Integralentwicklung ∞ ∞ ∞ f (x) = dx δ(x − x )f (x ) = dkg(k, x) dx f (x )g(k, x )∗ −∞
1 = √ 2π
∞
−∞
−∞
dka(k) exp(ikx) , −∞
mit 1 a(k) = √ 2π
∞ dxf (x) exp(−ikx) . −∞
Die Verallgemeinerung auf n Dimensionen lautet ⎞ ⎛ ⎞ ⎛ k1 x1 1 ⎜ .. ⎟ ⎜ .. ⎟ n f (x) = d ka(k) exp(ikx) , x = ⎝ . ⎠ , k = ⎝ . ⎠ (2π)n/2 xn kn 1 a(k) = dn xf (x) exp(−ikx) . (2π)n/2
A.5 Bessel-Funktionen, sph¨ arische Bessel-Funktionen Bessel-Funktionen. Die Besselsche Differentialgleichung lautet 2 d m2 1 d + 1 − f (x) = 0 , m ∈ R . + dx2 x dx x2 Ihre L¨ osungen sind die Bessel-Funktionen Jm und J−m , mit ∞ x 2i x m (−1)i Jm (x) = . 2 i!Γ (m + i + 1) 2 i=0 Ist m ganzzahlig, dann gilt ∞ x m (−1)i x 2i Jm (x) = , J−m (x) = (−1)m Jm (x) . 2 i!(m + i)! 2 i=0
518
A. Mathematischer Anhang
Sph¨ arische Bessel-Funktionen. Die sph¨arische Besselsche Differentialgleichung lautet 2 d l(l + 1) 2 d + 1 − f (x) = 0 , l = 0, 1, 2, . . . . + x2 dx2 x dx Ihre L¨ osungen sind die sph¨arischen Bessel-Funktionen jl , nl (letztere heißen (±) auch Neumann-Funktionen) und somit auch die Hankel-Funktionen hl : π 1/2 jl (x) = Jl+1/2 (x) 2x π 1/2 J−l−1/2 (x) nl (x) = (−1)l 2x (±) hl (x) = nl (x) ± ijl (x) . Ihre explizite Form lautet cos x sin x jl (x) = Rl (x) + Sl (x) x x cos x sin x nl (x) = Rl (x) − Sl (x) x x ±ix e (±) , hl (x) = [Rl (x) ± iSl (x)] x mit Rl (x) + iSl (x) =
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
(A.8)
l is−l (l + s)! −s x , Rl , Sl ∈ R . 2s s! (l − s)! s=0
Rl und Sl sind Polynome in 1/x vom Grade l mit reellen Koeffizienten und der Parit¨ at (−1)l bzw. −(−1)l . F¨ ur eine beliebige Linearkombination fl = ajl + bnl , a, b fest, gelten die Rekursionsformeln (2l + 1)fl (x) = x [fl+1 (x) + fl−1 (x)] l+1 d 1 d l+1 + fl = l+1 x fl fl−1 = dx x x dx d fl−1 d l−1 fl−1 = −xl−1 , fl = − + dx x dx xl−1 woraus folgt:
l 1 d l fl = x − f0 . x dx Aus (A.8) ergeben sich die ersten sph¨arischen Funktionen zu sin x sin x cos x , j1 (x) = 2 − x x x cos x cos x sin x n0 (x) = , n1 (x) = 2 + x x x j0 (x) =
(A.9)
A.6 Legendre-Funktionen, Legendre-Polynome, Kugelfl¨ achenfunktionen (±)
h0 (x) =
e±ix (±) , h1 (x) = x
i 1 ∓ 2 x x
519
e±ix . x
A.6 Legendre-Funktionen, Legendre-Polynome, Kugelfl¨ achenfunktionen Legendre-Funktionen. Die Legendresche Differentialgleichung lautet d2 d m2 f (x) = 0 , (1 − x2 ) 2 − 2x + l(l + 1) − dx 1 − x2 dx mit l = 0, 1, 2, . . ., m = 0, . . . , ±l. Ihre im Intervall [−1 : 1] beschr¨ ankten L¨ osungen sind die Legendre-Funktionen (1 − x2 )m/2 dl+m 2 (x − 1)l . (A.10) 2l l! dxl+m Pl,m ist das Produkt von (1 − x)m/2 mit einem Polynom vom Grade l − m und der Parit¨at (−1)l−m , das im Intervall [−1 : 1] l − m Nullstellen aufweist. Es gelten die Rekursionsformeln (P−1,... = 0) Pl,m (x) =
(2l + 1)xPl,m = (l + 1 − m)Pl+1,m + (l + m)Pl−1,m d (1 − x2 ) Pl,m = −lxPl,m + (l + m)Pl−1,m dx = (l + 1)xPl,m − (l + 1 − m)Pl+1,m
(A.11)
und die Orthogonalit¨ atsrelationen 1 dxPl,m (x)Pl ,m (x) = −1
2 (l + m)! δll . 2l + 1 (l − m)!
Legendre-Polynome. Im Falle m = 0 erh¨ alt man aus (A.10) die LegendrePolynome 1 dl 2 (x − 1)l . 2l l! dxl at (−1)l und besitzt im Intervall Pl ist ein Polynom vom Grade l, der Parit¨ [−1 : 1] l Nullstellen. Die Legendre-Polynome lassen sich gewinnen, indem man die Funktion (1 − 2xy + y 2 )−1/2 nach Potenzen von y entwickelt: Pl (x) = Pl,0 (x) =
1
1 − 2xy + y 2
=
∞
y l Pl (x) , |y| < 1 .
l=0
Die ersten 5 Legendre-Polynome lauten 1 P0 (x) = 1 , P1 (x) = x , P2 (x) = (3x2 − 1) 2 1 1 P3 (x) = (5x3 − 3x) , P4 (x) = (35x4 − 30x2 + 3) . 2 8
(A.12)
520
A. Mathematischer Anhang
Kugelfl¨ achenfunktionen. Die Kugelfl¨achenfunktionen Yl,m sind als die Eigenfunktionen der quantenmechanischen Drehimpulsoperatoren L2 und Lz definiert: L2 Yl,m = h ¯ 2 l(l + 1)Yl,m , l = 0, 1, 2, . . . Lz Yl,m = h ¯ mYl,m , m = 0, . . . , ±l . Ihre explizite Form lautet
(−1)l (2l + 1)! (l + m)! Yl,m (θ, ϕ) = l 2 l! 4π (2l)!(l − m)! ×eimϕ sin−m θ
dl−m sin2l θ . d(cos θ)l−m
Sie bilden ein vollst¨andiges orthonormales Funktionensystem auf dem Einheitskreis. Das heißt es gelten folgende Orthonormalit¨ats- und Vollst¨andigkeitsrelationen: 2π π ∗ ∗ Yl,m Yl ,m dΩ = dϕ dθ sin θYl,m (θ, ϕ)Yl ,m (θ, ϕ) = δll δmm 0 ∞ l
0
∗ Yl,m (θ, ϕ)Yl,m (θ , ϕ ) =
l=0 m=−l
δ(ϕ − ϕ )δ(cos θ − cos θ ) = δ(Ω − Ω ). sin θ
Weitere Eigenschaften sind: • Parit¨ at: Yl,m (π − θ, ϕ + π) = (−1)l Yl,m (θ, ϕ) . • Komplexe Konjugation: ∗ Yl,m (θ, ϕ) = (−1)m Yl,−m (θ, ϕ) .
• Zusammenhang mit den Legendre-Funktionen: 2l + 1 (l − m)! Pl,m (cos θ)eimϕ , m ≥ 0 . Yl,m (θ, ϕ) = 4π (l + m)! • Additionstheorem: Mit ⎛ ⎞ ⎛ ⎞ cos ϕ sin θ cos ϕ sin θ x = r ⎝ sin ϕ sin θ ⎠ , x = r ⎝ sin ϕ sin θ ⎠ cos θ cos θ und xx = rr cos α , cos α = sin θ sin θ cos(ϕ − ϕ ) + cos θ cos θ gilt
(A.13)
(A.14)
A.6 Legendre-Funktionen, Legendre-Polynome, Kugel߬ achenfunktionen
Pl (cos α) =
521
l 4π ∗ Yl,m (θ , ϕ )Yl,m (θ, ϕ) . 2l + 1 m=−l
Hieraus folgt unter Ber¨ ucksichtigung von (A.12) ∞
1 1 1 = = 2 |x − x | r l=0 r 1 − 2 rr cos α + rr =
∞ l l=0 m=−l
l r Pl (cos α) r
4π rl ∗ Y (θ , ϕ )Yl,m (θ, ϕ) . 2l + 1 rl+1 l,m
Die ersten Kugel߬ achenfunktionen lauten
3 iϕ 1 e sin θ , Y1,1 (θ, ϕ) = − Y0,0 (θ, ϕ) = √ 8π 4π
3 15 2iϕ 2 Y1,0 (θ, ϕ) = cos θ , Y2,2 (θ, ϕ) = e sin θ sin θ cos θ 4π 32π
5 15 iϕ Y2,1 (θ, ϕ) = − 3 cos2 θ − 1 . e , Y2,0 (θ, ϕ) = 16π 8π
(A.15)
B. Literaturverzeichnis
B.1 Allgemeine Lehrbu ¨ cher Zum Einstieg in die theoretische Physik empfehlen wir folgende B¨ ucher. Sie zeichnen sich durchweg durch klare und didaktisch hervorragende Darstellungen der behandelten Themen aus: [1] T. Fließbach: Lehrbuch zur Theoretischen Physik, Band 1–4, Spektrum Akademischer Verlag, 1999–2003. [2] R.J. Jelitto: Theoretische Physik, Band 1–6, Aula Verlag Wiesbaden, 1988–1995. [3] W. Nolting: Grundkurs Theoretische Physik, Band 1–6, Springer Verlag, 2001–2004. Desweiteren werden die folgenden Lehrb¨ ucher als komplement¨ are und weiterf¨ uhrende Lekt¨ ure empfohlen: [4] R.P. Feynman, R.B. Leighton, M. Sands: The Feynman Lectures on Physics, Band 1–3, Addison Wesley, 1971. [5] L.D. Landau, E.M. Lifschitz: Lehrbuch der Theoretischen Physik, Band 1–10, Verlag Harri Deutsch, 1986–1997. [6] A. Sommerfeld: Vorlesungen u ¨ber Theoretische Physik, Band 1–6, Verlag Harri Deutsch, 1988–2001. Ein sch¨ ones Buch ist auch [7] M.S. Longair: Theoretical Concepts in Physics, Cambridge University Press, 2004. Dieses Buch resultiert aus einer Vorlesung, die Longair in Cambridge f¨ ur Studenten kurz vor dem Abschluß ihres Studiums hielt. Longairs Ziel war es, das in den Spezialvorlesungen erlernte Wissen in einen breiteren Rahmen zu stellen und die zugrundeliegenden Prinzipien zu rekapitulieren. Der Autor versucht dies anhand von case studies, in denen jeweils bekannte Resultate in einem neuen Licht betrachtet werden.
524
B. Literaturverzeichnis
B.2 Mechanik Von den o.g. allgemeinen Lehrb¨ uchern haben uns auf dem Gebiet der Mechanik die jeweiligen B¨ande 2 der Nolting- und Jelitto-Reihe sowie das Werk von Landau und Lifschitz besonders gefallen. [8] H. Goldstein: Klassische Mechanik, Aula Verlag Wiesbaden, 1991. Eines der Standardwerke auf diesem Gebiet. [9] D. ter Haar: Elements of Hamiltonian Mechanics, Pergamon Press, 1971. Ein relativ kurzes aber daf¨ ur pr¨azises Buch, das sich vom Inhalt in etwa mit dem unseres 1. Kapitels deckt (keine Relativit¨ atstheorie). [10] F. Scheck: Mechanik, Springer Verlag, 2002. Ein sehr sch¨ ones und umfangreiches Buch, das neben dem hier abgedeckten Stoff eine sehr lesbare Einf¨ uhrung in die geometrischen Aspekte der Mechanik und in Stabilit¨ at und Chaos gibt. Wie Scheck es sagt: Die Mechanik ist ” keinesfalls ein abgeschlossenes und archiviertes Gebiet.“
B.3 Elektrodynamik Von den o.g. allgemeinen Lehrb¨ uchern hat uns auf dem Gebiet der Elektrodynamik das Buch von Fließbach besonders gefallen. [11] R. Becker, F. Sauter: Theorie der Elektrizit¨ at, Band 1, Teubner Verlag, 1997. Dieses Werk ist sicher einzigartig, denn es geht auf ein Buch von A. F¨opping aus dem Jahre 1894 zur¨ uck. Das Material deckt sich in etwa mit dem unseres 2. Kapitels; auch die Relativit¨atstheorie wird in diesem Band behandelt. Becker arbeitet konsequent im SI-System und stellt am Ende jedes Kapitels die entsprechenden Relationen im Gauß-System vor. [12] J.D. Jackson: Klassische Elektrodynamik, W. de Gruyter, 2002. Dies ist wohl immer noch das Standardwerk auf diesem Gebiet und sollte in keinem Physik-B¨ ucherschrank fehlen. [13] G. Lehner: Elektromagnetische Feldtheorie, Springer Verlag, 2003. Dieses Buch hat den Untertitel F¨ ur Ingenieure und Physiker und deckt nicht ganz den normalen Umfang der u ¨blichen Elektrodynamik-Vorlesung ab (kein relativistischer Formalismus). Die behandelten Gebiete (MaxwellGleichungen, insbesondere der statische und quasistation¨are Fall, elektromagnetische Wellen, sowie ein Kapitel zu numerischen Methoden) zeichnen sich allerdings durch hohe Lesbarkeit aus. Auch viele l¨angere Beispielrechnungen sind hier zu finden, deren Komplexit¨at – das Buch bringt es auf u ¨ber 600 Seiten – durch zahlreiche Abbildungen reduziert wird.
B.4 Quantenmechanik
525
[14] H. Mitter: Elektrodynamik, Spektrum Akademischer Verlag, 1990. Dieses relativ d¨ unne Buch deckt sich in etwa mit dem hier behandelten Stoff. Mitter gelingt es, die Elektrodynamik in extrem lesbarer Form zu pr¨ asentieren, so daß der Aufbau der Theorie sehr klar wird. [15] J.R. Oppenheimer: Lectures on Electrodynamics, Gordon and Breach Science Publishers, 1970. Dies sind die Aufzeichnungen der von Oppenheimer zwischen 1939 und 1947 in den USA gehaltenen Vorlesungen. Vom Aufbau ist es unserem Kapitel 2 sehr ¨ahnlich, da die Maxwell-Gleichungen ohne langes Fackeln“ an den ” Anfang des Buches gestellt werden. Dies erlaubt es Oppenheimer, sehr schnell auf tiefere Probleme der Elektrodynamik einzugehen (etwa die Selbstenergie des Elektrons). Im 2. Teil des Buches wird die Relativit¨ atstheorie eingef¨ uhrt und die Elektrodynamik in ihrem Rahmen erl¨ autert. [16] L.H. Ryder: Quantum Field Theory, Cambridge University Press, 1996. ¨ F¨ ur den Leser, der den Ubergang von den klassischen Theorien zu modernen Quantenfeldtheorien vollziehen m¨ ochte, empfehlen wir dieses Buch. Unsere Darstellung des Noether-Theorems folgt Ryder.
B.4 Quantenmechanik Von den o.g. allgemeinen Lehrb¨ uchern hat uns auf dem Gebiet der Quantenmechanik Band 5 der Nolting-Reihe besonders gefallen. [17] S. Gasiorowicz: Quantenphysik, Oldenbourg Verlag, 2001. Eine sehr sch¨ one Einf¨ uhrung in die Quantenmechanik. Der mathematische Apparat wird bewußt so einfach wie m¨ oglich gehalten, um dem Neuling den Einstieg zu erleichtern. Die quantenphysikalischen Prinzipien werden u ¨berwiegend im Rahmen der Wellenmechanik diskutiert, wobei an geeigneten Stellen auch auf die algebraische Struktur der Quantenmechanik eingegangen wird. [18] A. Messiah: Quantenmechanik, Band 1–2, W. de Gruyter, 1990–1991. Ein sowohl inhaltlich als auch quantitativ sehr umfangreiches Standardwerk. Der erste Band beginnt im ersten Teil nach einer ausf¨ uhrlichen ph¨ anomenologischen Motivation mit der Wellenmechanik. Im weiteren Verlauf wird dieser Teil zunehmend abstrakt, wobei der Leser in didaktisch geschickter Weise immer mehr zu den darstellungsfreien algebraischen Strukturen der Quantenphysik gef¨ uhrt wird. Im zweiten Teil werden viele konkrete Quantensysteme behandelt und ausf¨ uhrlich diskutiert. Die ersten beiden Teile des zweiten Bandes erg¨ anzen den ersten Band durch umfangreiche Diskussionen von Symmetrieprinzipien und N¨ aherungsverfahren. Der letzte Teil gibt eine
526
B. Literaturverzeichnis
Einf¨ uhrung in die relativistische Quantenmechanik. Insgesamt liefern die beiden B¨ ande (ca. 1000 Seiten) eine l¨ uckenlose Darstellung der Quantentheorie, deren mathematische Rahmen sich auf relativ hohem Niveau bewegt. [19] H. Rollnik: Quantentheorie, Band 1, Springer Verlag, 1995. Nach einer Motivation der Quantenmechanik ist der erste Teil dieses Buches der Wellenmechanik gewidmet, wobei Rollnik klar die allgemeinen Prinzipien herausarbeitet und in diesem Teil des Buches bereits Themen wie die Bornsche N¨ aherung und Eichtheorien abhandelt. Teil 2 beschreibt den axiomatischen Aufbau der Quantenmechanik, wobei Symmetrieprinzipien einen breiten Raum finden. Man findet hier auch einen Abschnitt zur Grundlagendiskussion der Quantenmechanik mit einer kleinen Literaturliste. [20] J.J. Sakurai: Modern Quantum Mechanics, Addison Wesley, 1993. Dieses Buch bietet in der Tat eine moderne Darstellung der Quantenmechanik. Sakurai erl¨ autert sehr klar die Symmetrieprinzipien, die das Fundament moderner Quantenfeldtheorien bilden. Sicherlich ein Buch f¨ ur den fortgeschrittenen Leser. [21] R. Shankar: Principles of Quantum Mechanics, Plenum Press, 1994. Didaktisch sehr ansprechendes Lehrbuch, von dem wir die Idee, ein einf¨ uhrendes Kapitel in die mathematischen Aspekte der Quantenmechanik in der Dirac-Schreibweise vorne anzustellen, geborgt haben. Man findet hier eine sch¨ one Einf¨ uhrung in die Pfadintegralmethode. [22] A. Sudbery: Quantum Mechanics and the Particles of Nature, Cambridge University Press, 1989. Dieses Buch hat den Untertitel An outline for mathematicians. Doch keine Angst, Sudberys Buch ist auch oder gerade f¨ ur Physiker sehr empfehlenswert. Die Prinzipien der Quantenmechanik werden didaktisch ¨außerst klar aus einem axiomatischen Aufbau heraus erl¨autert. Wo immer es geht verwendet Sudbery Symmetrien. So wird etwa zur Berechnung des Wasserstoffspektrums der Runge-Lenz-Vektor verwendet. Schließlich diskutiert Sudbery im Gegensatz zu fast allen anderen hier genannten B¨ uchern ausf¨ uhrlich die Quantenmetaphysik.
B.5 Statistische Physik und Thermodynamik Von den o.g. allgemeinen Lehrb¨ uchern haben uns auf dem Gebiet der statistischen Physik insbesondere die B¨ ucher von Fließbach und Nolting gefallen. Desweiteren profitierten wir von: [23] B.K. Agarwal, M. Eisner: Statistical Mechanics, John Wiley and Sons, 1988.
B.5 Statistische Physik und Thermodynamik
527
Auf nur 260 Seiten gelingt es den Autoren, die Konzepte der Gibbsschen statistischen Mechanik klar darzustellen. Die Thermodynamik erh¨ alt kein eigenes Kapitel sondern ist in den Text eingebettet. Gut hat uns die fr¨ uhe Einf¨ uhrung der Quantenstatistik gefallen. [24] D. ter Haar: Elements of Statistical Mechanics, Butterworth and Heineman, 1995. ¨ Außerst fundierte Einf¨ uhrung in die statistische Physik u ¨ber den Gibbsschen Ansatz mit einer ausf¨ uhrlichen Diskussion des Boltzmannschen HTheorems. [25] D. ter Haar, H. Wergeland: Elements of Thermodynamics, AddisonWesley, 1966. Ein Text, der die Prinzipien der Thermodynamik sehr lesbar darstellt. [26] K. Huang: Statistical Mechanics, John Wiley and Sons, 1987. Besteht aus 3 Teilen (Thermodynamik, statistische Physik, Spezielle Themen), wobei der letzte Teil u ¨ber unsere Themenauswahl hinausgeht. Ein Standardwerk, dessen Darstellung uns sehr geholfen hat. [27] J. Kestin, J.R. Dorfman: A Course in Statistical and Thermodynamics, Academic Press, 1971. Ein zum Einstieg in das Gebiet hervorragend geeignetes Lehrbuch. Enth¨ alt Thermodynamik und statistische Physik f¨ ur nichtwechselwirkende Systeme. Auch die notwendigen quantenmechanischen Herleitungen werden eingef¨ uhrt. [28] R. Kubo et al.: Statistical Mechanics, an Advanced Course with Problems and Solutions, North Holland Publishing Company, 1988. Jedes Kapitel besteht aus einer knapp gehaltenen Pr¨ asentation der wichtigsten Ergebnisse, gefolgt von einer riesigen Sammlung von Beispielen und gel¨ osten Aufgaben. Kaum ein Problem, daß hier nicht gerechnet wird. Offensichtlich f¨ ur Studenten gut zu gebrauchen! [29] R.K. Pathria: Statistical Mechanics, Butterworth and Heineman, 1996. Vom Umfang und Inhalt etwa dem Werk von Huang vergleichbar und ebenso gut lesbar. Sicherlich eines der B¨ ucher, das uns vom Aufbau und der Art der Darstellung am meisten gef¨ allt. [30] F. Reif: Statistische Physik und Theorie der W¨ arme, W. de Gruyter, 1987. Sehr ausf¨ uhrliche und didaktische Diskussion der Themen, die wir behandeln. Zum Einstieg in das Gebiet sehr geeignet. [31] H. R¨omer, Th. Filk: Statistische Mechanik, VCH Verlagsgesellschaft Weinheim, 1994.
528
B. Literaturverzeichnis
Klar und gut lesbare Darstellung, welche die Konzepte der statistischen Physik deutlich herausstellt; enth¨alt auch die Thermodynamik. Sehr klar wird hier die Boltzmann-Statistik als klassischer Grenzfall (¯ h → 0) der Quantenstatistik herausgearbeitet. [32] H.S. Robertson: Statistical Thermophysics, Prentice Hall, 1993. In diesem Buch wird die Shannonsche Informationsentropie als Ausgangspunkt der Gibbsschen Ensemble-Theorie gew¨ ahlt. Der Autor geht dezidiert auf vorhandene Kritik zu diesem Ansatz ein. Das Buch enth¨alt in klarer Schrift auch viele Beispiele, die nicht unbedingt zum Standard-Repertoire geh¨ oren.
Sachverzeichnis
Ableitung, eichkovariante 232 Abl¨ osearbeit 256 Abschirmfaktor 380 Abschirmung, elektrische 178 – magnetische 205 absolute Zeit 17 Absteigeoperator 291, 298 Actio=Reactio 7 adiabatische Kompressibilit¨ at 457 adiabatische Zustands¨ anderung 450 adjungierter Operator 245 Adjunktion 245 ¨ Aquipartitionstheorem 472 ¨ Ather 98 Aharanov-Bohm-Effekt 329 Allgemeine Relativit¨ atstheorie 8 Amp`ere 129 Amp`eresches Gesetz 123 anomaler Zeeman-Effekt 343 antihermitescher Operator 245 Antikommutator 263 Arbeit 8, 451 – virtuelle 30 Aufsteigeoperator 291, 298 Ausdehnungskoeffizient 457 Ausschließungsprinzip, Paulisches 369 Austauschprozeß 417 – irreversibler 451 – reversibler 419, 451 Auswahlregel 338, 360 avanciertes Potential 141 beschr¨ ankte Eichtransformation 136 Besetzungszahlenformalismus 489 Besetzungszahloperator 291, 489 Bessel-Funktion 223, 517 – sph¨ arische 314, 518 Besselsche Differentialgleichung 223, 517 – sph¨ arische 314, 518 Bewegung, effektive 77
Bildladung 182 Biot-Savartsches Gesetz 169 Bohm-Aharanov-Effekt 329 Bohrscher Radius 171, 321 Bohrsches Magneton 479 Boltzmann-Faktor 428 Boltzmann-Gesetz 507 Boltzmann-Gleichung 416 Boltzmann-Konstante 416, 507 Boltzmannsche H-Funktion 441, 447 Boltzmannsches H-Theorem 447 Bornsche Interpretation der Quantenmechanik 279 Bornsche N¨ aherung 379, 383 Bornsche Reihe 379 Bose-Einstein-Kondensation 504 Bose-Einstein-Statistik 368, 470, 488, 492 Bose-Gas 501 Boson 368, 389, 488 Brachystochrone 43 Bravektor 241 Brechungsgesetz 210 Brechungsindex 206 – verallgemeinerter 218 Breit-Wigner-Formel 385 Brewster-Winkel 214 Brillouin-Funktion 482 Carnotscher Kreisprozeß 465 chemisches Potential 419 Clausiussche Formulierung des 2. thermodyn. Hauptsatzes 463 Clebsch-Gordan-Koeffizient 304 Compton-Effekt 116 Cooper-Paar 329 Coopersche Theorie 329 Coriolis-Kraft 16 Coulomb 129 Coulomb-Eichung 134 Coulomb-Gesetz 169
530
Sachverzeichnis
Coulomb-Potential Coulomb-Streuung Curie-Gesetz 483
79, 134, 318 379
D’Alembert-Operator 146 D’Alembertsches Prinzip 31, 40 Darstellungswechsel 251 De-Broglie-Beziehung 274 Debye-Frequenz 509 Debye-Funktion 509 Debye-Modell 509 Deviationsmoment 68 Diamagnet 200 Dichteoperator 404, 405 Dielektrikum 199 Dielektrizit¨ atskonstante 129, 199 – verallgemeinerte 218 Differential, totales 514 Differentialquotient 515 differentieller Wirkungsquerschnitt 88, 91, 92, 379, 388 Dipolmoment, elektrisches 164, 173, 196 – magnetisches 174, 175, 196, 326 Dipoln¨ aherung 163, 358 Dirac-Bild 269 Dirichletsche Randbedingung 180 Dispersionsparameter 215 Dispersionsrelation 206, 215, 218 dispersives Medium 214 dissipatives Medium 215 Distributionsfunktion 493 – Bose-Einsteinsche 501 – Fermi-Diracsche 496 Drehachse, momentane 15 Drehimpuls 11, 21, 67 – der Rotationsbewegung 69 – quantenmechanischer 296, 299 Drehimpulserhaltung 11, 22, 37, 87 Drehmoment 11, 21, 67 – der Rotationsbewegung 69 Drehpunkt 65 Druck 419 Druckkoeffizient 457 dualer Feldst¨ arketensor 148 dualer Hilbert-Raum 241 Dulong-Petit-Gesetz 508 effektive Bewegung 77 effektives Potential 78, 386 Ehrenfest-Gleichung 275 Ehrenfestsches Theorem 268 Eichfunktion 136
Eichinvarianz 134, 136 – der Schr¨ odinger-Gleichung 327 eichkovariante Ableitung 232 Eichpotential 232 Eichprinzip 233 Eichtransformation 41, 134, 327 – beschr¨ ankte 136 – globale 231 – lokale 231 Eichung, transversale 134 Eigenfrequenz 48, 223 Eigenschwingung 48, 223 Eigenvektor 48, 70, 246 Eigenwert 48, 70, 246 Eigenwertproblem 48, 220, 246, 247 Eigenwertspektrum 220, 247 Eigenzeitdifferential 107 Eindringtiefe 218 Einsoperator 241 Einstein-Modell 508 Einsteinsche Summenkonvention 99 elektrische Abschirmung 178 elektrische Induktion 121, 196 elektrische Ladung 120, 121 elektrische Suszeptibilit¨ at 199 elektrische Verschiebung 196 elektrischer Fluß 121 elektrischer Strom 123 elektrisches Dipolmoment 164, 173, 196 elektrisches Feld 119 – makroskopisches 196 – statisches 168 elektrisches Monopolmoment 173 elektrisches Quadrupolmoment 173 elektromotorische Kraft 121 Elektrostatik 168 elektrostatische Feldenergie 170 Energie 22, 454 – der Rotationsbewegung 69 – freie 428, 448, 454 – innere 451 – kinetische 8, 68 – potentielle 9 – relativistische 109 Energie-Impuls-Tensor 227 Energieaustausch 417 Energiedichte 126 – zeitgemittelte 128 Energieerhaltung 10, 22, 37, 52, 87, 90 – relativistische 109 Energiesatz der Elektrodynamik 126, 152
Sachverzeichnis Energiestromdichte 126 – zeitgemittelte 128 Ensemble 399 – generalisiertes großkanonisches 445 – großkanonisches 409, 433, 445 – kanonisches 409, 428, 446 – mikrokanonisches 409, 413, 446 Ensemble-Mittel 401, 404 Ensemble-Theorie 399 Entartung 247 – im Wasserstoffatom 320 Enthalpie 454 – freie 454 Entropie 416 – Shannonsche 440 Entropiesatz 417, 444, 451 – Shannonscher 442 Erdbeschleunigung 85 Ergodenhypothese 400 Erwartungswert 262, 404 erweiterter Phasenraum 52 Erzeugende 55 ESE 129 Euler-Gleichung 71 Euler-Lagrange-Gleichung 39 Eulersche Winkel 71 extensive Gr¨ oße 416 Exzentrizit¨ at 81 Faradayscher K¨ afig 178 Faradaysches Induktionsgesetz 121 – verallgemeinertes 154 Federkonstante 24 Feinstrukturaufspaltung 343 Feinstrukturkonstante 318 Feldenergie, elektrostatische 170 Feldst¨ arketensor 148 – dualer 148 Fermi-Dirac-Statistik 368, 470, 487, 492 Fermi-Energie 499 Fermi-Gas 499, 501 Fermi-Temperatur 499 Fermion 368, 389, 487 Fermis goldene Regel 355 Fernzone 164 Ferroelektrikum 199 Ferromagnet 200 Fluß, elektrischer 121 – magnetischer 122, 328 Foucaultsches Pendel 17 Fourier-Integral 516 Fourier-Reihe 516
freie Energie 428, 448, 454 freie Enthalpie 454 Frequenz 209 Fresnelsche Formel 213, 214 Fugazit¨ at 430 Fundamentalform, Gibbssche
531
446, 452
Galilei-Invarianz 17 Galilei-Transformation 17 Gas, ideales 421, 424, 435 – quantenstatistisches 493 Gauß-System 129 Gaußscher Satz 513 Gaußsches Gesetz 121 gemischter Zustand 259, 403 generalisierte Geschwindigkeit 29 generalisierte großkanonische Zustandssumme 445 generalisierte Kraft 31, 418 generalisierte Zwangskraft 34 generalisierter Impuls 49 generalisiertes großkanonisches Ensemble 445 generalisiertes Potential 34 Geschwindigkeit 5 – generalisierte 29 – relativistische 104, 107 Gibbs-Duhem-Relation 456 Gibbs-Faktor 414, 424, 489 Gibbs-Paradoxon 424 Gibbssche Fundamentalform 446, 452 Gleichgewicht 30, 47, 419 – lokales 417 – stabiles 460 – statistisches 399 – thermodynamisches 450, 460 Gleichgewichtssystem 396 globale Eichtransformation 231 goldene Regel, Fermis 355 Gravitationskonstante 8, 84 Gravitationskraft 8, 84, 85 Green-Funktion 26, 138, 179, 378 – retardierte 140 Greensche Identit¨ at 513, 514 großkanonische Zustandssumme 430, 492 großkanonisches Ensemble 409, 433, 445 großkanonisches Potential 433, 448, 455 Gruppengeschwindigkeit 214, 215 gyromagnetisches Verh¨ altnis 331, 479
532
Sachverzeichnis
Hamilton-Dichte 227 Hamilton-Funktion 50 Hamilton-Gleichungen 50 Hamilton-Jacobi-Gleichung 60 Hamilton-Operator 259, 265 Hamiltonsches Prinzip 38, 40 Hankel-Funktion 315, 518 harmonische N¨ aherung 508 harmonischer Oszillator 24, 25 – Maxwell-Boltzmann-Statistik 410, 473, 474, 476 – quantenmechanischer 290, 322 Hauptachsensystem 70 Hauptachsentransformation 49, 70 Hauptquantenzahl 319 Haupts¨ atze der Thermodynamik 451 Haupttr¨ agheitsachse 70 Haupttr¨ agheitsmoment 70 Heisenberg-Bild 267 Heisenberg-Gleichung 267 Heisenbergsche Unsch¨ arferelation 263, 282 – f¨ ur Energie und Zeit 268 Heliumatom 347 Helizit¨ at 208, 356 Helmholtzscher Integralsatz 124 hermitescher Operator 245, 258 Hilbert-Raum 240, 257, 272, 369 – dualer 241 Hilbert-Vektor 240, 241 – uneigentlicher 242, 248 Hohlleiter 219 Hohlraumresonator 222 homogenes Potential 12 Homogenit¨ at der Raum-Zeit 35, 99 Hookesches Gesetz 24 Hyperfeinstrukturaufspaltung 345 Hysteresis 199, 200 ideale Messung 261 ideale W¨ armekraftmaschine 465 ideales Gas 421, 424, 435 – adiabatische Expansion 469 – quantenstatistisches 493 ideales Spinsystem 479, 481, 483 identische Teilchen 368 Impaktparameter 87 Impuls 5, 21, 67 – generalisierter 49 – quantenmechanischer 272, 273 – relativistischer 108 Impulsdarstellung 273, 274 Impulsdichte 127
Impulserhaltung 22, 37, 51 Impulssatz der Elektrodynamik 127, 152 Impulsunsch¨ arfe 285 Impulswellenfunktion 273 Induktion, elektrische 121, 196 – magnetische 123 Induktionsgesetz, Faradaysches 121, 154 ¨ induzierter Ubergang 349 Inertialsystem 6, 17 Influenzladung 182, 185 innere Energie 451 Integrabilit¨ atsbedingung, Maxwellsche 444 Integralsatz, Helmholtzscher 124 intensive Gr¨ oße 416 Interferenz, quantenmechanische 256, 403 Inversion 481 Ionisation 363 Ionisationsrate, totale 365 irreversible Zustands¨ anderung 450 irreversibler Austauschprozeß 451 isentrope Zustands¨ anderung 450 isobare W¨ armekapazit¨ at 457 isobare Zustands¨ anderung 451 isochore W¨ armekapazit¨ at 457 isochore Zustands¨ anderung 451 isotherme Kompressibilit¨ at 431, 457 isotherme Zustands¨ anderung 451 Isotropie des Raumes 36, 99 Jacobi-Identit¨ at Joule 9
53
kanonische Gleichungen 50 kanonische Konjugation 52, 263 kanonische Transformation 55 – infinitesimale 57 kanonische Zustandssumme 426 kanonisches Ensemble 409, 428, 446 Kapazit¨ at 191 Kausalit¨ atsprinzip 27, 105 Kelvin 416 Kelvinsche Formulierung des 2. thermodyn. Hauptsatzes 463 Keplersche Gesetze 82 Ketvektor 240 Kilogramm 5 kinetische Energie 8, 68 kinetische Theorie 396 klassischer Elektronradius 171
Sachverzeichnis Klein-Gordon-Gleichung 231 Kommutator 54, 245 Kommutatoralgebra 296 kommutierende Observable 249 kompatible Observable 262 Kompressibilit¨ at, adiabatische 457 – isotherme 431, 457 Konjugation 241 – kanonische 52, 263 konservative Kraft 9 Kontinuit¨ atsgleichung 121, 279, 332 – lorentzinvariante 147 – makroskopische 197 Kontravarianz 99 Koordinate, zyklische 51 Koordinatensystem 3 – beschleunigtes 16 – k¨ orperfestes 14, 66 – raumfestes 14, 66 – rotierendes 4, 14 Kopplungskonstante 232 Korrekturenergie 338 Korrespondenzprinzip 54, 99, 257, 259, 322 Kovarianz 99, 106 Kraft 6 – ¨ außere 20 – elektromotorische 121 – generalisierte 31, 418 – innere 20 – konservative 9 – relativistische 108 – thermodynamische 455 Kreisprozeß, Carnotscher 465 K¨ uhlschrank 465 Kugelfl¨ achenfunktion 300, 520 Kugelfunktion 315 Laborsystem 92, 388 Ladung 129 Ladung, elektrische 120, 121 – magnetische 131 Ladungsdichte 119, 124 – makroskopische 196 – oszillierende 164 – statische 168 Ladungserhaltung 120 L¨ ange 5 L¨ angenkontraktion 104 Lagrange-Dichte 226 – des elektromagnetischen Feldes Lagrange-Funktion 32 – lorentzinvariante 112
227
533
– relativistische 111 Lagrange-Gleichung 32, 33, 40, 226 Lagrange-Multiplikator 32, 34 Laguerresches Polynom 319 Lamb-Shift 343 Laplace-Gleichung 179 – in Kugelkoordinaten 184 Larmorsche Formel 160 Le Chatelier-Prinzip 461 Legendre-Funktion 184, 519 Legendre-Polynom 184, 519 Legendresche Differentialgleichung 184, 519 Leistung 8 Lenzsche Regel 121 Levi-Civita-Symbol 148 Li´enard-Wiechert-Potential 156 lichtelektrischer Effekt 363 Lichtkegel 105 Linearkraft 16 Liouville-Gleichung 407 lokale Eichtransformation 231 lokales Gleichgewicht 417 Lorentz-Boost 102 Lorentz-Eichung 135 Lorentz-Gruppe 101 Lorentz-Invarianz 106 Lorentz-Kontravarianz 99 Lorentz-Kovarianz 99, 106 Lorentz-Kraft 34, 120, 151 – makroskopische 197 Lorentz-Skalar 106 Lorentz-Tensor(feld) 145, 146 Lorentz-Transformation 101 magnetische Abschirmung 205 magnetische Induktion 123 magnetische Ladung 131 magnetische Quantenzahl 300 magnetische Suszeptibilit¨ at 199 magnetischer Fluß 122 – quantisierter 328 magnetischer Monopol 122, 130 magnetisches Dipolmoment 174, 175, 196, 326 magnetisches Feld 119 – makroskopisches 196 – statisches 168 magnetisches Monopolmoment 174 Magnetisierung 196 Magnetostatik 168 Makrozustand 398
534
Sachverzeichnis
Masse 5 – reduzierte 77, 311 – relativistische 108 – schwere 8 – tr¨ age 8 Massendefekt 110, 115 Massenpunkt 3 Massenschalenbedingung 110 Master-Gleichung 447 mathematisches Pendel 18, 45, 74 Maxwell-Boltzmann-Statistik 470, 491, 492 Maxwell-Gleichungen 119 – lorentzkovariante 148 – makroskopische 196 – statische 168 Maxwell-Relation 455 Maxwellsche Geschwindigkeitsverteilung 437 Maxwellsche Integrabilit¨ atsbedingung 444 Maxwellscher Spannungstensor 127, 151 Maxwellscher Verschiebestrom 123 mechanischer Energieaustausch 417 mechanischer Zustand 5 Meißner-Effekt 328 Messung, quantenmechanische 260, 405 – ideale 261 metastabiler Zustand 386 Meter 5 metrischer Tensor 100 mikrokanonische Zustandssumme 413, 415 mikrokanonisches Ensemble 409, 413, 446 Mikrozustand 398 – zug¨ anglicher 401 Minkowski-Raum 99 MKS(A)-System 5, 129 momentane Drehachse 15 momentane Winkelgeschwindigkeit 15 momentanes Ruhesystem 107, 114 monochromatische Welle 206 Monopol, magnetischer 122, 130 Monopolmoment, elektrisches 173 – magnetisches 174 Multipolentwicklung 172, 174, 189 N¨ aherung, harmonische 508 – quasistatische 123, 191 Nahzone 165
negative Temperatur 481 Nernstscher W¨ armesatz 452 Neumann-Funktion 518 von Neumann-Gleichung 408 Neumannsche Randbedingung 181 Newtonsche Axiome 6 Newtonsche Bewegungsgleichung 6, 7 – in beschleunigten Systemen 16 Noether-Strom 230 Noether-Theorem 229 normaler Zeeman-Effekt 326 Normalmode 47 Normerhaltung 265 Null-Energiezustand 393 Observable 248, 258 – kommutierende 249 – kompatible 262 – vollst¨ andiger Satz 262 Oerstedsches Gesetz 123 Ohmsches Gesetz 218 Oktupolmoment 173 Operator, linearer 244 – adjungierter 245 – antihermitescher 245 – hermitescher 245, 258 – unit¨ arer 246 optisches Theorem 383 Orbitalquantenzahl 300 Orthonormalit¨ atsrelation 3, 248 Ortsdarstellung 271, 272, 274 Ortsunsch¨ arfe 285 Ortswellenfunktion 271 Oszillator, harmonischer 24, 25 – Maxwell-Boltzmann-Statistik 410, 473, 474, 476 – quantenmechanischer 290, 322 Paraelektrikum 199 Paramagnet 200 Paramagnetismus 479, 482, 483 Parit¨ atsoperator 280 Partialwellenamplitude 384 Partialwellenzerlegung 383 Pauli-Matrizen 302 Paulisches Ausschließungsprinzip 369 Pendel, Foucaultsches 17 – mathematisches 18, 45, 74 – physikalisches 73 Periheldrehung 94 periodische St¨ orung 355 Permeabilit¨ atskonstante 129, 199 Perpetuum mobile 462
Sachverzeichnis Phasengeschwindigkeit 207 Phasenraum 51, 52, 398 – der Photonen 355 – erweiterter 52 Phasenraumdichte 414 Phasenraumtrajektorie 399 Phasenraumvolumen 414 Phasen¨ ubergang 503 Phononengas 508 photoelektrischer Effekt 256 Photon 116, 256, 355 Photonengas 507 physikalisches Pendel 73 Plancksches Wirkungsquantum 256 Poincar´e-Gruppe 101 Poisson-Gleichung 134 – statische 169 Poisson-Klammer 53 Poisson-Theorem 54 Polarisation 356 – elliptische 208 – lineare 208 – parallele 213 – senkrechte 212 – zirkulare 208 Polarisierung 196 Postulat der a priori zuf¨ alligen Phasen 411 Postulate der Quantenmechanik 257 – der statistischen Physik 400 Potential 9 – avanciertes 141 – chemisches 419 – effektives 78, 386 – generalisiertes 34 – großkanonisches 433, 448, 455 – homogenes 12 – retardiertes 140, 156 – rotationssymmetrisches 11 – thermodynamisches 454, 460 – zentralsymmetrisches 11 Potentialgleichung 133, 136 – lorentzkovariante 147 – statische 169 potentielle Energie 9 Poynting-Vektor 126 Poyntingsches Theorem 126 Projektionsoperator 241, 242, 253 Projektionspostulat 261 Punktladung 156, 158, 161, 167 Quadrupolmoment, elektrisches Quantelung 256
173
535
Quantenelektrodynamik 171, 343, 355 quantenmechanische Postulate 257 quantenmechanischer Zustand 257 Quantenzahl, magnetische 300 quasistatische N¨ aherung 123, 191 quasistatische Zustands¨ anderung 450 radiale Bewegungsgleichung 79 radiale Schr¨ odinger-Gleichung 313, 318 Radialimpuls 312 Radius, Bohrscher 171, 321 – klassischer (des Elektrons) 171 reduzierte Masse 77, 311 Reflexionsgesetz 210 Reflexionskoeffizient 284, 285 Reibungskoeffizient 24 reiner Zustand 259, 402 Relativbewegung 77, 89, 311 Relativimpuls 311 Relativit¨ atsprinzip 99 Relativit¨ atstheorie, Allgemeine 8 Relativkoordinate 77, 311 Relaxationszeit 400 Resonanzbreite 385 Resonanzenergie 384 Resonanzstreuung 384 retardierte Green-Funktion 140 retardierte Zeit 140, 157 retardiertes Potential 140, 156 reversible Zustands¨ anderung 450 reversibler Austauschprozeß 419, 451 Rosettenbahn 19 rotationssymmetrisches Potential 11 Ruhemasse 108 Ruhesystem, momentanes 107, 114 Runge-Lenz-Vektor 81 Rutherford-Streuung 96, 380 Sackur-Tetrode-Gleichung 423 S¨ attigung 482 Saturation 482 Scheinkraft 16 Schottky-Effekt 481 Schr¨ odinger-Bild 260, 264 Schr¨ odinger-Gleichung 259, 264, 278, 310 – radiale 313, 318 – zeitunabh¨ angige 265, 279, 310 schwere Masse 8 Schwerpunkt 20 – eines Wellenpaketes 282 Schwerpunktsatz 22, 37
536
Sachverzeichnis
Schwerpunktsbewegung 77, 89, 311 Schwerpunktsimpuls 311 Schwerpunktskoordinate 77, 311 Schwerpunktsystem 21, 91, 92, 388 Schwingung 24, 25, 45, 48, 73 Sekunde 5 Selbstenergieproblem 170 Selbstinduktivit¨ at 191 Shannonsche Entropie 440 Shannonscher Entropiesatz 442 SI-System 5 Singulett 389 Skalarpotential 133 – statisches 168 Skalentransformation 13 Slater-Determinante 371 Spannung 121 Spannungstensor, Maxwellscher 127, 151 spezifische W¨ arme 427 Spin 301, 307, 330 Spin-Bahn-Kopplung 305 Spin-Bahn-Wechselwirkung 342 Spin-Spin-Kopplung 306 Spin-Spin-Wechselwirkung 345 Spinor 301, 308 Spinsystem, ideales 479, 481, 483 ¨ spontaner Ubergang 349 stabiles Gleichgewicht 460 Stark-Effekt 339 station¨ are L¨ osung 266 statistische Postulate 400 statistisches Ensemble 399 statistisches Gleichgewicht 399 stehende Welle 222 Steinerscher Satz 70 Stern-Gerlach-Experiment 330 St¨ orung 335, 338, 353 – periodische 355 St¨ orungstheorie, zeitabh¨ angige 353 – zeitunabh¨ angige 338 Stokesscher Satz 513 Strahlungsleistung 161 Strahlungsverlust 162 Strahlungszone 164 Streuamplitude 377, 383 Streuphase 383 Streuphasenanalyse 383 Streuresonanz 386 Streuwinkel 88 Strom, elektrischer 123 – Noetherscher 230
Stromdichte 119, 124 – longitudinale 135 – makroskopische 196 – oszillierende 164 – statische 168 – transversale 135 Stromerhaltung 230, 284 Summenkonvention, Einsteinsche 99 Superpositionsprinzip 7, 124, 208, 240, 259 Suszeptibilit¨ at 199 Symmetrietransformation 35 Symmetrisierungsregel 368 Targetteilchen 86 TE-Welle 220, 223 Teilchen 3 – identische 368 – unterscheidbare 366 Teilchenoperator 489 Teilchenstromdichte 279, 377 Telegraphengleichung 218 TEM-Welle 220 Temperatur 418 – negative 481 Temperaturskala 453 Tensor, metrischer 100 Tensorprodukt 243 Tensorraum 243 Termschema 320 thermischer Austausch 417 thermodynamische Haupts¨ atze 451 thermodynamische Kraft 455 thermodynamischer Limes 396 thermodynamisches Gleichgewicht 450 thermodynamisches Potential 454, 460 Thermometer 425 Thomas-Pr¨ azession 342 TM-Welle 220, 223 totale Ionisationsrate 365 totaler Wirkungsquerschnitt 89, 383 totales Differential 514 Totalreflexion 211, 221 tr¨ age Masse 8 Tr¨ agheitsmoment 68 Tr¨ agheitssatz 6 Tr¨ agheitstensor 68 Translationskraft 16 Transmissionskoeffizient 284, 285 transversale Eichung 134 transversale Welle 207
Sachverzeichnis Triplett 389 Tunneleffekt 284 ¨ Ubergang, induzierter 349 – spontaner 349 ¨ Ubergangsamplitude 353 ¨ Ubergangsrate 355, 357 ¨ Ubergangswahrscheinlichkeit 351, 355 uneigentlicher Hilbert-Vektor 242 unit¨ arer Operator 246 Unsch¨ arferelation, Heisenbergsche 263, 282 – f¨ ur Energie und Zeit 268 unterscheidbare Teilchen 366 Variationsrechnung 38, 39 Vektorpotential 133 – statisches 168 Verr¨ uckung, virtuelle 29 Verschiebestrom, Maxwellscher 123 Verschiebung, elektrische 196 Vierergeschwindigkeit 107 Viererimpuls 108 Viererkraft 108 Vierervektor 99 – lichtartiger 105 – raumartiger 106 – zeitartiger 105 Virial 472 Virialsatz 12, 472 virtuelle Arbeit 30 virtuelle Verr¨ uckung 29 virtueller Zustand 393 Vollst¨ andigkeitsrelation 3, 242 W¨ arme 451 – spezifische 427 W¨ armeaustausch 417 W¨ armekapazit¨ at, isobare 457 – isochore 457 W¨ armekraftmaschine 463 – ideale 465 W¨ armepumpe 465 W¨ armesatz, Nernstscher 452 Wahrscheinlichkeit, statistische 401, 404 – quantenmechanische 258, 260, 276, 366, 370 Wahrscheinlichkeitsamplitude 353 Wahrscheinlichkeitsdichte, statistische 402 – quantenmechanische 261, 367 Wahrscheinlichkeitsstromdichte 279 Wasserstoffatom 318, 323, 326, 339
537
Watt 8 Wechselwirkungsbild 268, 351 Welle, elektromagnetische 206 – ebene 315 – quantenmechanische 256 – stehende 222 – transversale 207 Welle-Teilchen-Dualismus 256 – statistische Deutung des 257 Wellenfrequenz 209 Wellenfunktion, quantenmechanische 271, 273 Wellengleichung 129, 135 – homogene 138 – inhomogene 140 – makroskopische 206 Wellenl¨ ange 209 Wellenpaket 215, 216, 282 – Schwerpunkt 282 – Streuung 285, 376 Wellenvektor 209, 274 Winkelgeschwindigkeit, momentane 15 Wirkungsfunktional 37 Wirkungsgrad 463 – idealer 464 Wirkungsquantum, Plancksches 256 Wirkungsquerschnitt 88 – differentieller 88, 91, 92, 379, 388 – totaler 89, 383 Yukawa-Potential
380
Zeeman-Effekt, anomaler 343 – normaler 326 Zeit 5 – absolute 17 – retardierte 140, 157 zeitabh¨ angige St¨ orungstheorie 353 Zeitdilatation 103 Zeitentwicklungsoperator 264 Zeitordnungsoperator 265 zeitunabh¨ angige St¨ orungstheorie 338 Zentralkraft 11 zentralsymmetrisches Potential 11 Zentrifugalbarriere 78, 386 Zentrifugalkraft 16 Zentripetalkraft 18 Zustand, gemischter 259, 403 – mechanischer 5 – metastabiler 386 – quantenmechanischer 257 – reiner 259, 402
538
Sachverzeichnis
– thermodynamischer 450 – virtueller 393 Zustands¨ anderung 450 – adiabatische 450 – irreversible 450 – isentrope 450 – isobare 451 – isochore 451 – isotherme 451 – quasistatische 450 – reversible 450 Zustandsgleichung 450 – des idealen Quantengases – kalorische 450
493, 496
Druck: Saladruck, Berlin Verarbeitung: Stein+Lehmann, Berlin
– thermische 450 Zustandsreduktion 260, 261 Zustandssumme 444 – generalisierte großkanonische – großkanonische 430, 492 – kanonische 426 – mikrokanonische 413, 415 Zwangsbedingung 29 Zwangskraft 30 – generalisierte 34 Zwillingsparadoxon 113 zyklische Koordinate 51 Zykloide 44
445