Klaus Goeke Statistik und Thermodynamik
Klaus Goeke
Statistik und Thermodynamik Eine Einführung für Bachelor und Mas...
277 downloads
1304 Views
2MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Klaus Goeke Statistik und Thermodynamik
Klaus Goeke
Statistik und Thermodynamik Eine Einführung für Bachelor und Master STUDIUM
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
Prof. Dr. Klaus Goeke Studium der Physik in Tübingen und Freiburg, Promotion 1972 in Münster, Wissenschaftler 1971 – 1988 am Forschungszentrum Jülich, Habilitation 1977 in Bonn, 1985 Professor für Theoretische Physik in Bonn, 1988 Lehrstuhlinhaber für Kern- und Teilchenphysik an der Ruhr-Universität Bochum. Verschiedene Forschungsaufenthalte in USA, Kanada, Japan, Großbritannien, Italien, Polen, Südkorea, Südafrika, Indien, Frankreich etc. Mitglied in Verbundforschung und Sonderforschungsbereichen etc. Seit 2009 im Ruhestand. Forschungs- und Interessensgebiete: Quark-Gluon-Struktur des Nukleons, Lepton-Nukleon- und Hadron-Nukleon-Reaktionen, angeregte Nukleonenzustände; Astrophysik, Kosmologie
1. Auflage 2010 Alle Rechte vorbehalten © Vieweg +Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2010 Lektorat: Ulrich Sandten | Kerstin Hoffmann Vieweg+Teubner Verlag ist eine Marke von Springer Fachmedien. Springer Fachmedien ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.viewegteubner.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: KünkelLopka Medienentwicklung, Heidelberg Druck und buchbinderische Verarbeitung: MercedesDruck, Berlin Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier. Printed in Germany ISBN 978-3-8348-0942-1
Vorwort Dieses Buch basiert auf theoretischen Vorlesungen des Autors an der Ruhr-Universität Bochum, die Studentinnen und Studenten des Diplom-Studiengangs Physik im 6. Semester angeboten wurden. Um den modernen Anforderungen eines Bachelor- und Master-Studiengangs zu genügen, wurde der Stoff umgearbeitet und explizit in Teil I für Bachelor- und Teil II, basierend auf Teil I, für Master- bzw. Diplom-Studentinnen und -Studenten aufgebaut. Dabei wurde in Übereinstimmung mit den gegenwärtigen Curricula vorausgesetzt, dass die Grundzüge der Quantentheorie den Studierenden vertraut sind, so dass es möglich war, in Teil I zunächst einfache (mikrokanonische) statistische Methoden zu verwenden, aus denen die klassische Thermodynamik mit ihren vielen Anwendungen abgeleitet werden kann. Die Kenntnisse der Quantenmechanik wurden verwendet, makroskopische Systeme aus gewohnter mikroskopischer Perspektive zu betrachten. Dieses Vorgehen erleichtert das Verständnis sehr und schwierige Begriffe, wie z.B. die Entropie, werden leicht verständlich. Teil II konzentriert sich dann auf gehobenere Themen, wie die verschiedenen Ensembles und Quantenstatistik. Hier finden sich auch Beispiele aus Astrophysik und Kosmologie und modernen Entwicklungen der Bose-Einstein-Kondensation. Insgesamt entspricht der Umfang des Buches etwa dem, was in den heutigen Curricula im Bereich Theorie der Statistik und Thermodynamik bei einem Bachelor- bzw. Master- und DiplomStudiengang geboten und verlangt wird. Teil I ist auch für Nebenfächler in Physik geeignet. Im gesamten Buch werden alle Formeln im Detail abgeleitet unter Vermeidung überflüssiger abstrakter mathematischer Formulierung. Jedes Kapitel beginnt mit einer Betrachtung, die das Folgende motiviert und in den großen Zusammenhang einordnet, damit es dem Leser erleichtert wird, den physikalischen Argumenten und dem Formalismus zu folgen. Am Ende eines Kapitels findet sich eine knappe Zusammenfassung. Bei den Anwendungsbeispielen wurde mehr Wert auf das Prinzipielle als auf Aktualität gelegt. Ausnahmen sind moderne Forschungsgebiete wie die Mikrowellenhintergrundstrahlung des Universums und das Bose-Einstein-Kondensat mit den Experimenten zu ultrakalten Quantengasen. Ein Anhang mit wichtigen physikalischen Konstanten und häufig benötigten Umrechnungsfaktoren hilft bei konkreten Rechnungen. Ein detailliertes Inhaltsverzeichnis und ein umfangreicher Index erlauben eine schnelle Orientierung im gesamten Buch. Es gibt etliche gute Darstellungen der Statistik und der Thermodynamik. Nur einige verwenden den überaus hilfreichen und didaktischen Zugang über die Quantenmechanik. Hier sei auf die Bücher von Brenig [Bre92], Fließbach [Fli99], Nolting [Nol05, Nol07], Schulz [Sch05], Schwabl [Sch06] und insbesondere Reif [Rei87] hingewiesen. Neben dem Werk von Huang [Hua87] wurden bisweilen auch die Bücher in Refs.[Bec66, Bre89, Lan87, Man89, Pat72, Röm94, Sch08] zurate gezogen. Die Formeln der erwähnten Vorlesung wurden von stud. Junyi Wu nachgerechnet. Herr Jens Ossmann hat das Skriptum in LATEX gesetzt und Herr Stephan Meißner stellte für das Buch die Abbildungen her. Bei all diesen ehemaligen Mitarbeitern bedanke ich mich. Besonders bin ich meiner Frau Anne dankbar, ohne die dieses Werk nicht geschrieben worden wäre: Sie stand mir trotz ihres eigenen Lehr-Berufes während meines gesamten akademischen Lebens hilfreich und geduldig zur Seite. Die letzten zwei Jahre mussten sie und unsere beiden erwachsenen Kinder, Astrid und Jens, sich immer wieder anhören, dass dieses Buch ganz bestimmt innerhalb der nächsten vier Wochen fertig werde.
Inhaltsverzeichnis
I
Grundlagen der Statistik und Thermodynamik
1
Einleitung
2
Grundlagen der Statistischen Mechanik 2.1 Mikrozustand . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Ensemble und sein Makrozustand . . . . . . . . . . . . . . . . 2.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Ensemble-Mittel und Zeit-Mittel . . . . . . . . . . . . . 2.2.3 Zulässige Zustände . . . . . . . . . . . . . . . . . . . . 2.2.4 Gleichgewichtszustand . . . . . . . . . . . . . . . . . . 2.3 Mikrokanonisches Ensemble . . . . . . . . . . . . . . . . . . . 2.3.1 Mikrokanonische Zustandssumme . . . . . . . . . . . . 2.3.2 Mikrokanonische Zustandssumme des idealen Gases . . 2.4 Der erste Hauptsatz der Thermodynamik . . . . . . . . . . . . . 2.4.1 Definition: Wärme, Arbeit . . . . . . . . . . . . . . . . 2.4.2 Differentiale . . . . . . . . . . . . . . . . . . . . . . . 2.5 Quasistatische Prozesse, Generalisierte Kräfte . . . . . . . . . . 2.5.1 Quasistatische Prozesse . . . . . . . . . . . . . . . . . 2.5.2 Generalisierte Kräfte . . . . . . . . . . . . . . . . . . . 2.5.3 Druck des idealen Gases . . . . . . . . . . . . . . . . . 2.6 Entropie, Temperatur, der zweite und dritte Hauptsatz . . . . . . 2.6.1 Zulässige Zustände, Ω(E, x), Gleichgewicht . . . . . . . 2.6.2 Reversibilität, Irreversibilität . . . . . . . . . . . . . . . 2.6.3 Entropie, Temperatur . . . . . . . . . . . . . . . . . . . 2.6.4 Eigenschaften der Entropie und der Temperatur . . . . . 2.6.5 Entropie und Zustandsgleichung des idealen Gases . . . 2.6.6 Schärfe der Verteilung . . . . . . . . . . . . . . . . . . 2.6.7 Der zweite Hauptsatz, Entropiezunahme . . . . . . . . . 2.6.8 Der dritte Hauptsatz (Nernstsches Theorem) . . . . . . . 2.6.9 Positive und negative Temperaturen . . . . . . . . . . . 2.6.10 Wärmereservoir . . . . . . . . . . . . . . . . . . . . . . 2.7 Quasistatische Prozesse: Entropieänderung, generalisierte Kräfte ¯ = T dS . . . . . . . . . . . . . . . . . 2.7.1 Quasistatisch: dQ 2.7.2 Allgemeine Gleichgewichtsbedingungen . . . . . . . . 2.7.3 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . .
1 3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 5 7 7 7 8 9 10 10 12 15 16 17 19 19 20 22 23 23 24 26 30 31 31 33 34 34 35 36 36 38 39
VIII
2.8
Inhaltsverzeichnis
Mikrokanonisches Ensemble: Zusammenfassung . . . . . . . . . . . . . . . . . 42
3 Grundlagen der Thermodynamik 43 3.1 Postulate der klassischen Thermodynamik . . . . . . . . . . . . . . . . . . . . . 43 3.2 Makroskopische Größen und ihre Messung . . . . . . . . . . . . . . . . . . . . 45 3.2.1 Innere Energie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.2.2 Wärme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.2.3 Verallgemeinerte Kräfte . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.2.4 Temperatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.2.5 Spezifische Wärme, Wärmekapazität . . . . . . . . . . . . . . . . . . . 48 3.2.6 Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 ¯ 3.3 Der erste Hauptsatz, dQ-Gleichungen . . . . . . . . . . . . . . . . . . . . . . . 50 3.4 Der zweite Hauptsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 3.4.1 Die Sätze von Clausius und Kelvin . . . . . . . . . . . . . . . . . . . . . 54 3.4.2 Expansionsprozesse des idealen Gases . . . . . . . . . . . . . . . . . . . 56 3.5 Wärmekraftmaschinen, Kühlmaschinen . . . . . . . . . . . . . . . . . . . . . . 61 3.5.1 Wärmekraftmaschine . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.5.2 Carnot-Maschine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 3.5.3 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 3.5.4 Kühlmaschinen, Wärmepumpen . . . . . . . . . . . . . . . . . . . . . . 70 3.5.5 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 3.5.6 Kreisprozesse allgemein . . . . . . . . . . . . . . . . . . . . . . . . . . 74 3.6 Der zweite Hauptsatz, quasistatische Prozesse, TdS-Gleichungen . . . . . . . . . 75 3.6.1 TdS-Gleichungen: Definitionen, Eigenschaften . . . . . . . . . . . . . . 75 3.6.2 TdS-Gleichungen: Beweise . . . . . . . . . . . . . . . . . . . . . . . . 76 3.6.3 Eigenschaften von Wärmekapazitäten . . . . . . . . . . . . . . . . . . . 79 3.7 Freie Energie, Gibbssche Energie . . . . . . . . . . . . . . . . . . . . . . . . . . 81 3.7.1 Innere Energie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 3.7.2 Freie Energie (Helmholtzsche Freie Energie) . . . . . . . . . . . . . . . 82 3.7.3 Gibbssche Energie (Freie Enthalpie) . . . . . . . . . . . . . . . . . . . . 83 3.7.4 Stabilitätsbedingungen: Homogene Substanz . . . . . . . . . . . . . . . 85 3.8 Thermodynamische Potenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 3.8.1 Definitionen und Eigenschaften . . . . . . . . . . . . . . . . . . . . . . 89 3.8.2 Maxwell-Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 3.8.3 Berechnung der thermodynamischen Potenziale und Zustandsgleichungen 93 3.8.4 Berechnung von F(T, V) ausgehend von P(T, V) und CV (T, V0 ) . . . . . 94 3.8.5 Das van der Waals-Gas . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 3.9 Der dritte Hauptsatz der Thermodynamik . . . . . . . . . . . . . . . . . . . . . 99 3.9.1 Wärmekapazität, Expansionskoeffizient . . . . . . . . . . . . . . . . . . 99 3.9.2 Unerreichbarkeit von T = 0, adiabatisches Kühlen . . . . . . . . . . . . 101 3.10 Phasen und Phasenübergänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 3.10.1 Gleichgewichtsbedingungen . . . . . . . . . . . . . . . . . . . . . . . . 103 3.10.2 Phasengleichgewichtslinie, latente Wärme . . . . . . . . . . . . . . . . . 105 3.10.3 Phasenübergänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Inhaltsverzeichnis
3.11 Phasenübergang im van der Waals-Gas . . . . . . . . . . 3.11.1 Stabilität und Instabilität, kritischer Punkt . . . . 3.11.2 Maxwell-Konstruktion des Gleichgewichtsdrucks 3.11.3 Ordnung eines Phasenübergangs . . . . . . . . . 3.11.4 Berechnung der latenten Wärme . . . . . . . . . 3.12 Systeme mit mehreren Komponenten . . . . . . . . . . . 3.12.1 Generalisierte Potenziale, Gibbs-Duhem-Relation 3.12.2 Chemische Gleichgewichte . . . . . . . . . . . . 3.12.3 Massenwirkungsgesetz . . . . . . . . . . . . . .
IX
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
II Statistische Ensembles und Quantenstatistik 4
5
Das kanonische und großkanonische Ensemble 4.1 Das kanonische Ensemble . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Mikroskopisches Untersystem . . . . . . . . . . . . . . . . . . 4.1.2 Makroskopisches kleines Untersystem . . . . . . . . . . . . . . 4.1.3 Kanonische Verteilung bei gegebenem E¯ . . . . . . . . . . . . 4.2 Maxwellsche Geschwindigkeitsverteilung . . . . . . . . . . . . . . . . 4.2.1 Herleitung aus der kanonischen Verteilung . . . . . . . . . . . 4.2.2 Eigenschaften der Maxwellschen Geschwindigkeitsverteilung . 4.3 Gleichverteilungssatz (Äquipartitionstheorem) . . . . . . . . . . . . . . 4.4 Die kanonische Zustandssumme . . . . . . . . . . . . . . . . . . . . . 4.4.1 Mittlere Energie, Schwankungsquadrat . . . . . . . . . . . . . 4.4.2 Generalisierte Kräfte, Zustandsgleichungen . . . . . . . . . . . 4.4.3 Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.4 Freie Energie . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.5 Dritter Hauptsatz, Adiabatische Entmagnetisierung . . . . . . . 4.4.6 Kanonische Verteilung: Zusammenfassung . . . . . . . . . . . 4.4.7 Bezug zwischen mikrokanonischem und kanonischem Ensemble 4.5 Großkanonisches Ensemble . . . . . . . . . . . . . . . . . . . . . . . . 4.5.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.2 Mittelwerte, generalisierte Kräfte, Entropie . . . . . . . . . . . 4.5.3 Großkanonisches Potenzial Φ . . . . . . . . . . . . . . . . . . 4.5.4 Großkanonische Verteilung: Zusammenfassung . . . . . . . . . 4.6 Ensembles: Vergleich . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.1 Statistischer Operator und Entropie . . . . . . . . . . . . . . . 4.6.2 Extremalprinzipien . . . . . . . . . . . . . . . . . . . . . . . . 4.6.3 Vergleich der Wahrscheinlichkeitsverteilungen . . . . . . . . .
110 110 112 116 118 118 119 125 127
133 . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . .
135 136 137 141 141 142 142 144 146 151 152 154 155 156 158 160 161 165 165 167 168 169 170 171 174 177
Elementare Anwendungen der statistischen Mechanik 179 5.1 Das Ideale Gas als kanonisches Ensemble . . . . . . . . . . . . . . . . . . . . . 179 5.1.1 Kanonische Zustandssumme . . . . . . . . . . . . . . . . . . . . . . . . 179 5.1.2 Thermische Zustandsgleichung, mittlere Energie . . . . . . . . . . . . . 180
X
Inhaltsverzeichnis
5.2 5.3
5.4 5.5
5.1.3 Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.4 Gibbssches Paradoxon und Ununterscheidbarkeit von Teilchen 5.1.5 Relativistisches ideales Gas . . . . . . . . . . . . . . . . . . 5.1.6 Gemisch realer Gase . . . . . . . . . . . . . . . . . . . . . . Ideales Gas in großkanonischer Form . . . . . . . . . . . . . . . . . Spezifische Wärme eines Festkörpers (Einstein-Modell) . . . . . . . . 5.3.1 Der harmonische Oszillator . . . . . . . . . . . . . . . . . . 5.3.2 Einstein-Modell . . . . . . . . . . . . . . . . . . . . . . . . Paramagnetismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . Verdünnte Gase und Lösungen, Osmose . . . . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
181 182 184 186 186 188 189 190 191 193
6 Quantenstatistik idealer Gase 197 6.1 Identische Teilchen und Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . 198 6.1.1 (Anti)symmetrische Vielteilchenzustände . . . . . . . . . . . . . . . . . 198 6.1.2 Besetzungszahlen, Zustandssummen . . . . . . . . . . . . . . . . . . . . 199 6.2 Bose-Einstein- und Fermi-Dirac-Statistik . . . . . . . . . . . . . . . . . . . . . 200 6.2.1 Großkanonische Zustandssumme der Bose-Einstein- und Fermi-DiracStatistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 6.2.2 Bosonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 6.2.3 Fermionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 6.2.4 Photonen, Phononen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 6.2.5 Maxwell-Boltzmann-Statistik und klassischer Grenzfall der Bose-Einsteinund Fermi-Dirac-Statistik . . . . . . . . . . . . . . . . . . . . . . . . . 208 6.2.6 Druck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 7
Anwendungen der Quantenstatistik 7.1 Wärmestrahlung, Planck-Verteilung . . . . . . . . . . . . . . . . 7.1.1 Energiedichte . . . . . . . . . . . . . . . . . . . . . . . . 7.1.2 Strahlungsdichte . . . . . . . . . . . . . . . . . . . . . . 7.2 Kosmischer Mikrowellenhintergrund . . . . . . . . . . . . . . . . 7.2.1 Energiedichten des Universums . . . . . . . . . . . . . . 7.2.2 Expansion und Thermodynamik des Universums . . . . . 7.2.3 Ursprung des Mikrowellenhintergrundes, Saha-Gleichung 7.3 Nukleosynthese im frühen Universum . . . . . . . . . . . . . . . 7.3.1 Protonen und Neutronen, ”Freeze-out” . . . . . . . . . . . 7.3.2 Deuteron-Synthese . . . . . . . . . . . . . . . . . . . . . 7.3.3 Leichte Kerne und Baryonische Materie . . . . . . . . . . 7.4 Gitterschwingungen . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.1 Normalschwingungen . . . . . . . . . . . . . . . . . . . 7.4.2 Zustandssumme, spezifische Wärme . . . . . . . . . . . . 7.4.3 Debye-Approximation . . . . . . . . . . . . . . . . . . . 7.5 Bose-Einstein-Kondensation . . . . . . . . . . . . . . . . . . . . 7.5.1 Berechnung des chemischen Potenzials . . . . . . . . . . 7.5.2 Phasenübergang . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
213 213 214 217 219 219 220 222 226 227 229 230 232 232 233 235 238 239 241
Inhaltsverzeichnis
XI
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
245 247 252 253 256 259 260 260 267 269 270 275
8 Irreversible Prozesse, Transport, Fluktuationen 8.1 Mastergleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1.1 Abgeschlossene Systeme . . . . . . . . . . . . . . . . . . . . 8.1.2 Boltzmann-Gleichung und Transportphänomene . . . . . . . 8.1.3 Nichtgleichgewichts-System im Kontakt mit Wärmereservoir 8.2 Magnetische Resonanz . . . . . . . . . . . . . . . . . . . . . . . . . 8.2.1 Statisches Magnetfeld . . . . . . . . . . . . . . . . . . . . . 8.2.2 Statisches Magnetfeld und Wechselfeld . . . . . . . . . . . . 8.3 Dynamische Kernpolarisation . . . . . . . . . . . . . . . . . . . . . . 8.4 Brownsche Bewegung . . . . . . . . . . . . . . . . . . . . . . . . . 8.4.1 Langevin-Gleichung . . . . . . . . . . . . . . . . . . . . . . 8.4.2 Dissipation, Diffusion . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
279 279 279 282 285 289 289 291 293 295 295 298
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
303 303 303 306 308
7.6
7.7
7.8
9
7.5.3 Eigenschaften des kondensierten Bose-Gases . . . . . . . . 7.5.4 Experimente: Ultrakalte Quantengase . . . . . . . . . . . . Leitungselektronen im Festkörper: Spezifische Wärme, Fermidruck 7.6.1 Fermi-Verteilung, Fermikante . . . . . . . . . . . . . . . . 7.6.2 Die spezifische Wärme . . . . . . . . . . . . . . . . . . . . 7.6.3 Der Fermidruck . . . . . . . . . . . . . . . . . . . . . . . . Weiße Zwerge, Neutronensterne . . . . . . . . . . . . . . . . . . . 7.7.1 Stabilität der Weißen Zwerge . . . . . . . . . . . . . . . . . 7.7.2 Neutronensterne . . . . . . . . . . . . . . . . . . . . . . . Ferromagnetismus . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.8.1 Weiss’sche Molekularfeldnäherung . . . . . . . . . . . . . 7.8.2 Spontane Symmetriebrechung . . . . . . . . . . . . . . . .
Der zentrale Grenzwertsatz der Statistik 9.1 Das Random-Walk-Problem . . . . . 9.1.1 Gesetz großer Zahlen . . . . . 9.1.2 Normalverteilung . . . . . . . 9.2 Zentraler Grenzwertsatz . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Anhang
312
Literaturverzeichnis
313
Sachverzeichnis
315
Teil I Grundlagen der Statistik und Thermodynamik
1 Einleitung Gegenstand der Statistischen Mechanik und der Quantenstatistik sind makroskopische Systeme, d. h. Systeme mit ungefähr N = 1024 Teilchen und etwa gleich vielen Freiheitsgraden1 . Entscheidend ist, dass N sehr viel größer als eins ist, denn gesucht ist in der Praxis die Abhängigkeit der Eigenschaften des Systems von wenigen (Anzahl etwa gleich eins bis zehn) globalen bzw. makroskopischen Größen wie Temperatur, Druck, Volumen etc., was statistische Methoden erfordert. Im Prinzip wird ein solches Teilchensystem beschrieben durch die Newtonsche Gleichung: i j (ri ,r j ) mr¨i = ∑ K
i = 1, ..., N
j=i
bzw. durch die Schrödinger-Gleichung N h¯ 2 2 ∂ ∑ − 2m ∇i + ∑ V (ri ,r j ) Ψ(r1 , . . . ,rN ,t) = i¯h ∂t Ψ(r1, . . . ,rN ,t) i< j i=1 Zu lösen ist also ein System von Differentialgleichungen mit Anfangsbedingungen. ri (t0 ),r˙i (t0 )
i = 1, ..., N
oder eine Differentialgleichung mit Anfangsbedingungen ℜeΨ(r1 , . . . ,rN ,t0 ),
ℑmΨ(r1 , . . . ,rN ,t0 )
Zur Bestimmung dieser Anfangsbedingung sind also etwa 1024 mikroskopische Größen zu vermessen, was offensichtlich unmöglich ist. Eine direkte Lösung der Bewegungsgleichungen für 1024 mikroskopische Teilchen ist also • unmöglich, • aber auch: uninteressant. Ziel der Statistischen Mechanik ist die Reduktion von 1024 mikroskopischen Variablen auf etwa eins bis zehn makroskopische Variable. Bei dieser Reduktion um viele Größenordnungen ergeben sich qualitativ andere Phänomene, wie z. B. die Irreversibilität eines Prozesses: Wir wissen, dass die obigen Bewegungsgleichungen invariant unter Zeitumkehr sind, dennoch zeichnet die Irreversibilität eine Zeitrichtung aus. Dies rührt von der Tatsache her, dass wir es mit sehr vielen Teilchen zu tun haben und dadurch bereits Wahrscheinlichkeitsbegriffe eine Rolle spielen. Denn: Es gibt bei realen physikalischen Vorgängen Anfangsbedingungen, die mit extrem verschiedener Wahrscheinlichkeit vorkommen. Zum Beispiel ist in einem normalen mit Gas gefüllten Behälter die Wahrscheinlichkeit für eine Anfangsbedingung, bei der alle Moleküle sich in der linken Hälfte des Behälters befinden, extrem gering. Loschmidtsche bzw. Avogadrosche Zahl von etwa 6 × 1023 ist die Anzahl der Teilchen pro Mol. Ihr genauer Wert findet sich im Anhang.
1 Die
K. Goeke, Statistik und Thermodynamik, DOI 10.1007/ 978-3-8348-9748-0_1, © Vieweg+Teubner Verlag |Springer Fachmedien Wiesbaden GmbH 2010
4
1 Einleitung
Im Prinzip müssen wir immer Quantenstatistik treiben. In vielen Fällen sind aber auch klassische und semiklassische Verfahren gerechtfertigt, weshalb auch die klassische Thermodynamik historisch der Quantenstatistik vorausgehen konnte. Klassisches Vorgehen ist gerechtfertigt, wenn z. B. bei einem Gas die DeBroglie-Wellenlänge λB = h/(mv) der Teilchen viel kleiner als der mittlere Teilchenabstand ist. Das bedeutet (Beh.) 1 1 3mc2 kB T ρ 3 2π h¯ c
(1.1)
Beweis: Nach dem Gleichverteilungssatz2 haben wir 12 mv2 = 32 kB T . Daraus ergibt sich v, was wir in die DeBroglie-Wellenlänge einsetzen, um die thermische DeBroglie-Wellenlänge zu erhalten λth = √
h 3mkB T
(1.2)
1 Der mittlere Abstand der Teilchen ist gegeben durch die Dichte: d = 3 VN = ρ − 3 . Die Bedingung λth d ergibt direkt Gl. (1.1), q.e.d. Also wird der klassische Limes bei hohen Temperaturen, bei großen Massen der Teilchen oder bei kleinen Dichten erreicht. Man muss dabei aber aufpassen: In der klassischen Physik gibt es nicht den Begriff der identischen bzw. ununterscheidbaren Teilchen. Das bedeutet, dass Abzählverfahren bzgl. der Anzahl von möglichen Zuständen, die ein System einnehmen kann, bei rein klassischem Vorgehen falsch sein können. Dort müssen dann nach Gibbs Korrekturfaktoren eingeführt werden. Also selbst wenn Gl. (1.1) erfüllt ist, muss man solche Gibbsschen Faktoren ∼ 1/N! bei Größen (Entropie, Zustandssumme etc.), die von der Teilchenzahl abhängen, berücksichtigen. Wir werden das später im Einzelnen erläutern3 . Die klassische Thermodynamik beschreibt phänomenologisch das Verhalten der makroskopischen Größen. Sie beruht auf einigen Axiomen, die der Erfahrung entstammen und nicht weiter begründet werden. Die Statistische Mechanik kann ihrerseits die Thermodynamik ableiten, d.h. deren Axiome begründen. Auch die Statistische Mechanik benutzt gewisse Axiome, die aber von geringerer Anzahl und von fundamentalerer Natur sind als die der Thermodynamik. Wir werden in diesem Buch Statistische Mechanik betreiben und die Thermodynamik ableiten und begründen. Dabei gehen wir von der quantenhaften Natur der Teilchenzustände aus. Am Anfang können wir das tun, ohne direkt Quantenstatistik zu betreiben, wobei wir die Identität der Teilchen, sofern sie von Belang ist, durch Faktoren wie 1/N! oder Ähnliche berücksichtigen. Zu einem späteren Zeitpunkt betreiben wir dann Quantenstatistik und berücksichtigen sauber die Identität der Teilchen und ihren fermionischen bzw. bosonischen Charakter.
2 Siehe 3 Siehe
Kap. 4.3 Kap. 5.1.4
2 Grundlagen der Statistischen Mechanik 2.1 Mikrozustand Als Mikrozustand eines N-Teilchensystems bezeichnet man einen reinen quantenmechanischen N-Teilchenzustand (Vielteilchenzustand) |r >, der ein stationärer Eigenzustand des Hamiltonoperators H0 des Systems ist. Er kann z.B. aus einem Produkt von Einteilchenzuständen bestehen, bei denen jeder die Energie εν hat: Ψr (x1 ,x2 , ...,xN ) = [φν1 (x1 )...φνN (xN )]r
⇔
|r >
Bei diesem Bild nimmt man an, dass die Wechselwirkungsenergie der Teilchen untereinander vernachlässigbar ist. Damit ist seine Energie gegeben durch: Er = εν1 + εν2 . . . + ενN Es gibt i.a. sehr viele Mikrozustände eines Systems verschiedenster Energien, weil das System viele, oft sogar unendlich viele Einteilchenzustände besitzt.1 1. Beispiel: Unabhängige Teilchen (Gas) im Volumen (Kasten). Dort besteht der Mikrozustand aus einem Vielteilchenzustand, bei dem z.B. bei Fermionen die untersten EinteilchenNiveaus mit Teilchen gefüllt sind bis zur Fermikante. Das ist der Mikro-Grundzustand, aber auch jede andere Verteilung der N Teilchen auf die Einteilchenniveaus ergibt einen Mikrozustand, natürlich von höherer Energie. 2. Beispiel: Lineare Kette, bestehend aus Atomen mit einem ungepaarten Spin in z-Richtung. Hier gibt es jeweils nur 2 Spinorientierungen und wir können die Gesamtzahl der Mikrozustände angeben: 2N . Siehe Abb. (2.1). |r >= |sz1 , . . . , szN >
Abbildung 2.1: Mikrozustand einer linearen Kette, die aus nicht wechselwirkenden Spins S = 1/2 in zRichtung besteht. Gesamtzahl der Mikrozustände ist 2N . 1 In Kap. 6 über Quantenstatistik werden wir auch Mikrozustände identischer Teilchen kennen lernen, die explizit die Ei-
genschaft dieser Teilchen, Bosonen oder Fermionen zu sein, in ihrer Formulierung berücksichtigen. Solche Zustände sind dann keine reinen Produktzustände mehr, wie man an Gl. (6.2) oder (6.3) sehen kann. Für die hier dargestellten begrifflichen Zusammenhänge ist das jedoch nicht wichtig.
K. Goeke, Statistik und Thermodynamik, DOI 10.1007/ 978-3-8348-9748-0_2, © Vieweg+Teubner Verlag |Springer Fachmedien Wiesbaden GmbH 2010
6
2 Grundlagen der Statistischen Mechanik
Im Allgemeinen können wir den Mikrozustand des Systems nicht angeben, weil z.B. bei einem Kastenpotenzial von 1 cm Kantenlänge der Abstand benachbarter Einteilchenniveaus unabhängiger H-Atome von der Größenordnung ∼ 10−18 eV ist, was unterhalb jeder Messgenauigkeit ist. Ein solcher Zustand wäre aber auch uninteressant zu kennen, weil er sich fortlaufend ändert, denn die Atome wechselwirken immer ein wenig untereinander, kollidieren, und streuen dabei im Rahmen der Heisenbergschen Unschärferelationen in andere Einteilchenzustände. Das gilt auch, wenn das System abgeschlossen ist, was wir hier stillschweigend vorausgesetzt haben. Man stelle sich das formal so vor, dass der totale Hamiltonoperator eines abgeschlossenen Systems durch H = H0 + H gegeben ist. Das H0 beschreibt z. B. die erwähnten freien Teilchen in einem vorgegebenen Volumen, wobei die Wände des Volumens durch unendlich hohe statische Potenzialwälle gegeben sind, und das H beschreibt die restliche (residuelle) Wechselwirkung. Die Einteilchenzustände von H0 mit entsprechenden Besetzungszahlen dienen dazu, die Mikrozustände des Gesamtsystems zu definieren. Das ist nur sinnvoll, wenn H hinreichend klein ist, also H H0 . Auf der anderen Seite kann man nicht H = 0 annehmen, weil dann das System unzulässig idealisiert würde. Ein einmal eingenommener Mikrozustand bliebe für alle Zeiten erhalten, was der Erfahrung widerspricht. Die Annäherung eines makroskopischen Systems an einen Gleichgewichtszustand aus einem Nicht-Gleichgewichtszustand heraus wäre damit unmöglich. Das H ist von statistischer Natur und seine Matrixelemente fluktuieren in der Zeit. Man sieht all dieses genauer, wenn man einen Würfel von 1 cm Seitenlänge mit einem Gas aus nicht wechselwirkenden Teilchen der Masse m konkret durchrechnet. Ein Einteilchenzustand des so definierten H0 ergibt sich dann aus der Quantenmechanik zu ϕν1 ν2 ν3 (x, y, z) = Aν1 ν2 ν3 sin(k1 x) sin(k2 y) sin(k3 z) wobei ki =
π νi L
Für die Einteilchenenergie gilt dann: εν1 ν2 ν3 =
h¯ 2 2 (k + k22 + k32 ) 2m 1
(2.1)
Wie oben behauptet sind die Energieabstände benachbarter Einteilchenzustände sehr klein, da L im Gegensatz zur (vernachlässigten) Atomausdehnung eine makroskopische Größe ist. Wir erhalten dafür etwa bei einem Gas aus H-Atomen (mit Protonenmasse von etwa 1000 MeV) Δε =
h¯ 2 π 2 (¯hc)2 (200MeVfm)2 ∼ 10−18 eV ( ) ∼5 2 2 = 2m L L mc 1000MeV ∗ (1013 fm)2
Der Energieabstand benachbarter Zustände ist also weit unter jeder Messgenauigkeit. Das System wechselt auch seinen Mikrozustand bei beliebig kleiner Störung, so dass es keinen Sinn ergibt, von einem reinen quantenmechanischen Mikrozustand eines makroskopischen Systems zu sprechen.
2.2 Ensemble und sein Makrozustand
7
2.2 Ensemble und sein Makrozustand Wir werden jetzt das Ensemble und seinen Makrozustandes kennen lernen. Beides sind fundamentale und wichtige Begriffe der Statistischen Mechanik, die immer wieder verwendet werden.
2.2.1 Definition Wir betrachten dazu ein beliebiges makroskopisches System. Seine Mikrozustände seien bekannt und durchnummeriert mit |r = |1 , |2 , .... Wir stellen uns M solcher makroskopischer Systeme nebeneinander vor, alle diese Systeme sollen die gleichen Randbedingungen mit dem gleichen H0 haben, sie sollen die gleichen Mikrozustände haben und jedes sei in einem dieser Mikrozustände |r. Das M sei eine große Zahl, z.B. M ≈ 1010 . Die Gesamtheit dieser gedachten Systeme heißt Ensemble. Jetzt machen wir einen „Schnappschuss”, der gleichzeitig alle M Systeme, also das gesamte Ensemble abbildet. Wir zählen jetzt, wieviele der M Systeme sich im Mikrozustand |1 , |2 , ... |i , |k , ... befinden und nennen diese Zahlen M1 , M2 , ....Mi , Mk .... Wir definieren nun die normierten Besetzungszahlen durch Pi = Mi /M. Der Makrozustand des Ensembles ist jetzt definiert durch die Angabe von {Pn } = (P1 , P2 , P3 , . . . , PM ). Da die Pi die Wahrscheinlichkeiten angeben, bei einem „Griff” in das Ensemble den Mikrozustand |i zu erhalten, nennt man die Pi auch Besetzungswahrscheinlichkeiten. Wenn man H = 0 annähme, dann würde dieser Makrozustand des Ensembles für alle Zeiten gleich bleiben, weil jeder seiner Mikrozustände ein stationärer Eigenzustand zu H0 ist. Wegen der kleinen residuellen Wechselwirkung H = 0 ist das jedoch nicht der Fall. Wenn also ein Ensemble sich in einem definierten Makrozustand befindet gegeben durch {Pn } = (P1 , P2 , P3 , . . .), dann wird sich dieser Makrozustand mit der Zeit auch ändern, weil immer diese gewisse kleine Restwechselwirkung H = 0 vorhanden ist. Deshalb sind die Pr im Allgemeinen zeitabhängig.
2.2.2 Ensemble-Mittel und Zeit-Mittel In einem Ensemble ist der Mittelwert einer Observablen Fˆ gegeben durch F¯ = ∑ Pr Fr
mit
Fr =< r | Fˆ | r >
(2.2)
r
Wir formulieren das wichtige Postulat2 : 1. Betrachte ein Ensemble aus M identischen Systemen jeweils zur Zeit t = 0 in einem einzigen für alle Ensemblemitglieder gleichen Mikrozustand |r0 >. Das Ensemble wird nach einem hinreichend großen makroskopischem Zeitabschnitt ΔT vermessen. In dieser Zeit hat sich jedes Mitglied des Ensembles, ausgehend von |r0 >, geändert mit dem Resultat Pn = MMn . Ein Mittelwert dieses Ensembles wird als Ensemble-Mittel bezeichnet. 2. Betrachte ein einziges System im gleichen Mikrozustand |r0 > wie oben. Wir lassen das System unter der kleinen statistischen Wechselwirkung H evolvieren in der Zeit und vermessen es in M gleichen hinreichend großen makroskopischen Zeitschritten Δt . Nach jedem Zeitabschnitt ist es in einem anderen Mikrozustand |i >. Nach M Zeitschritten haben 2 Dieses
Postulat hängt eng zusammen mit der sogenannten Ergoden-Hypothese bzw. der Quasi-Ergoden-Hypothese.
8
2 Grundlagen der Statistischen Mechanik
wir M Mikrozustände, die in ihrer Gesamtheit wieder ein Ensemble bilden, das charakte risiert ist durch Pn = MMn . Ein Mittelwert dieses Ensembles wird als Zeit-Mittel bezeichnet. 3. Für diese beiden Ensembles postulieren wir:
Postulat:
n Mn M = M M
im Limes M → ∞
oder als Folge davon für die Mittelwerte Ensemble-Mittel = Zeit-Mittel
2.2.3 Zulässige Zustände Ein zulässiger Einteilchenzustand ist einer, der mit den äußeren Bedingungen von H0 verträglich ist (z.B Form und Größe eines Behältnisses). Äußere Parameter sind Parameter wie das Volumen (Größe und Gestalt), ein ggf. von außen einwirkendes magnetisches oder elektrisches Feld etc. Diese Parameter werden mit x1 , x2 , . . . oder y1 , y2 , . . . bezeichnet und abgekürzt z.B. durch x = (x1 , x2 , . . .). Ein zulässiger Mikrozustand (Vielteilchenzustand) |r > ist zusammengesetzt aus zulässigen Einteilchenzuständen. Er hat jeweils die Energie Er (y) und erfüllt mögliche Zusatzforderungen wie etwa, dass seine Energie einen gewissen Wert haben soll. Ein zulässiger Makrozustand ist aus zulässigen Mikrozuständen zusammengesetzt. Für zulässige Mikrozustände haben wir im Makrozustand die Besetzungszahlen Pr ≥ 0 und für unzulässige Pr = 0. Beispiel: Betrachte ein abgeschlossenes System, dessen Volumen durch eine Trennwand in eine linke und rechte Hälfte unterteilt ist. Es befinden sich alle Moleküle N in der linken Hälfte des Volumens, während die rechte Hälfte leer ist. Die Wand ist gleichsam ein äußerer Parameter, der bewirkt, dass nur solche Zustände des Systems zulässig sind, bei denen Einteilchenwellenfunktionen besetzt sind, die nur in der linken Hälfte des Volumens definiert und normiert sind. Wenn keine weiteren Angaben über das System vorliegen, dann ist jede Energie erlaubt und die entsprechenden N-Teilchen Mikrozustände sind zulässig und tragen alle zum Makrozustand bei. Beispiel: Betrachte ein abgeschossenes System A0 der Gesamtenergie E 0 , das aus zwei Untersystemen A1 und A2 besteht mit den Teilchenzahlen N1 und N2 . Die beiden Systeme sind durch eine feste Wand getrennt, die wärmeleitend ist, aber keine Teilchen durchlässt. Hier sind solche Mikrozustände von A0 zulässig, bei denen N1 Einteilchenwellenfunktionen des Systems A1 und N2 des Systems A2 mit Teilchen besetzt sind. Die Energien E1 und E2 der Untersysteme sind beliebig, solange ihre Summe gleich E 0 ist. Beispiel: Betrachte ein abgeschlossenes System A0 , das aus zwei Untersystemen A1 und A2 besteht, die durch eine wärmeundurchlässige feste Wand getrennt sind und die Energien E1 und E2 haben. Die Wand wirkt wie ein äußerer Parameter, der bewirkt, dass nur solche Mikrozustände von A0 zulässig sind, bei denen die Energien von A1 und von A2 jeweils die festen Werte E1 und E2 haben. Wenn über die Teilchenzahlen keine Aussage gemacht wird, dann sind diese in jedem Teilvolumen frei, solange die Energieforderungen erfüllt sind. Alle diese Mikrozustände sind zulässig und tragen zum Makrozustand bei.
2.2 Ensemble und sein Makrozustand
9
2.2.4 Gleichgewichtszustand
Betrachte einen Makrozustand {P1 , P2 , . . .} eines abgeschlossenen Systems mit der Energie E. Wie bereits diskutiert, geht man in der statistischen Mechanik immer davon aus, dass zwischen den Teilchen des Systems immer noch kleine residuelle Wechselwirkungen H vorliegen. Deshalb: Nach einer gewissen Zeit (Relaxationszeit τrelax ) geht das System bei konstanter Energie in den Gleichgewichtszustand über. Das ist eine grundlegende Erfahrung die an makroskopishen Größen wie Druck, Temperatur, Dichte oder Magnetisierung immer gemacht wird, die damit auch den Gleichgewichtszustand charakterisieren: Der Gleichgewichtszustand ist ein spezieller Makrozustand und dadurch definiert, dass er, wenn er einmal erreicht ist, sich in der Zeit nicht mehr ändert. Jede Ausgangssituation, in der das abgeschlossene System nicht im Gleichgewicht ist, zieht spontane durch H = 0 induzierte Prozesse nach sich, die das System dem Gleichgewicht zutreiben. Die Relaxationszeit ist eine wichtige charakteristische Zeit des betrachteten Systems, sie kann klein sein, Mikro- und Nanosekunden bei Schallwellen in harten Festkörpern, sie kann aber auch groß sein, z.B. Gigajahre bei der Formierung galaktischer Supercluster. Ein Beispiel ist ein Wärme- und Druck-isolierter Topf mit einem Gemisch aus Wasser und Eis. Die spontanen Prozesse bestehen in der Herstellung einer gleichen homogenen Temperatur im Topf und einem dieser Temperatur und dem herrschenden Druck entsprechenden Verhältnis der Mengen von Eis zu Wasser.
Postulat der gleichen ”a priori”-Wahrscheinlichkeiten: Ein Gleichgewichtszustand ist offensichtlich nur dann zeitunabhängig, wenn keiner seiner zulässigen Mikrozustände vor den anderen ausgezeichnet ist und eine Sonderrolle spielt. Deshalb ist das folgende Postulat plausibel: Im statistischen Ensemble, das ein abgeschlossenes System im Gleichgewicht repräsentiert, ist jeder zulässige Mikrozustand ri mit gleicher Wahrscheinlichkeit vorhanden: Abgeschlossenes System im Gleichgewicht:
Pr1 = Pr2 = . . . = const.
(2.3)
Dieses Postulat kann nicht direkt überprüft werden, weil die Konstruktion eines Ensembles rein theoretisch ist. Überprüft werden können aber die Konsequenzen dieses grundlegenden Postulats bei Messung makroskopischer Grössen realer physikalischer Systeme. Es hat sich bisher experimentell noch niemals ein Widerspruch zu der Annahme des Postulats ergeben.
Beispiel für Mikrozustände: 3 Elektronen-Spins im Magnetfeld Es gelten die bekannten Beziehungen E = −μmag · B und μmag = gμBs und g = 2. Wenn wir die Quantizierungsachse in Richtung des B-Feldes legen, gibt es die folgenden Mikrozustände (Eigenzustände von H0 ):
10
2 Grundlagen der Statistischen Mechanik
Mikrozustände
Totales magn. Moment
Totale Energie
| + ++ > | + +− > | + −+ > | − ++ > | + −− > | − +− > | − −+ > | − −− >
3μmag 1μmag 1μmag 1μmag −1μmag −1μmag −1μmag −3μmag
−3μmag B −μmag B −μmag B −μmag B μmag B μmag B μmag B 3μmag B
Nehmen wir an, die Energie des Makrosystems sei E = μmag B. Dann sind seine zulässigen Mikrozustände | + −− >, | − +− >, | − −+ > Im Gleichgewicht gilt dann: P+ - - = P- + - = P- - + = 13 und alle anderen Pr = 0. Ein anderes Beispiel ist ein abgeschlossener Kasten, gefüllt mit Gas. Ein Ungleichgwichtszustand ist einer, in dem z.B. nur die linke Hälfte des Kastens mit Molekülen gefüllt und die rechte leer ist. Ein solches System strebt unter Energieerhaltung dem Gleichgewichtszustand zu, in dem beide Hälften des Kastens gleichmäßig mit Molekülen gefüllt sind. Dieser Zustand ändert sich dann nicht mehr.
2.3 Mikrokanonisches Ensemble Je nach Verteilung der Werte von Pr im Makrozustand unterscheidet man verschiedene Arten von Ensembles, die sich durch ihre mathematische Struktur deutlich unterscheiden, aber am Ende wegen der großen Teilchenzahl von N ∼ 1024 nahezu wieder äquivalent sind. Das theoretisch einfachste, aber in der Praxis am wenigsten verwendete Ensemble, ist das mikrokanonische: Es ist dadurch definiert, dass es ein abgeschlossenes System gegebener Energie E und gegebener Teilchenzahl N im Gleichgewicht beschreibt. Da man die Energie eines makroskopischen Systems nur innerhalb gewisser Fehlergrenzen kennt3 , führt man ein makroskopisch schmales Energieband ein, in dem die Energie des Systems liegt. Also: Ein dazu gehöriger Mikrozustand | r > ist zulässig, wenn für seine Energie Er gilt: Er ∈ [E − δ E, E] und δ E/E makroskopisch klein ist, also z.B. δ E/E ≈ 10−5 oder 10−8 gegeben in etwa durch die Messgenauigkeit. Weil definitionsgemäß Gleichgewicht vorliegt, gilt P1 = P2 = ... = const für zulässige r, und sonst ist Pi = 0.
2.3.1 Mikrokanonische Zustandssumme Für die Beschreibung eines mikrokanonischen Systems ist die mikrokanonische Zustandssumme Ω die entscheidende Größe. Sie ist definiert durch die Anzahl der zulässigen Mikrozustände: 3 Um
die Energie exakt zu kennen, müsste man das System wegen der Energie-Zeit-Unschärferelation unendlich lange vermessen.
2.3 Mikrokanonisches Ensemble
Ω(E, x) = ∑ δr
11
mit δr = 1, wenn E − δ E ≤ Er (x) ≤ E, und δr = 0 sonst (2.4)
r
Hierbei sind x die äußeren Parameter, von denen die Energien Er (x) der Mikrozustände abhängen. Dann gilt für Mikrozustände die mikrokanonische Wahrscheinlichkeitsverteilung : zulässig: Pr =
1 Ω(E, x)
unzulässig: Pr = 0
(2.5)
Man definiert auch eine andere Größe Φ, bei der über alle Mikrozustände aufsummiert wird, deren Energie kleiner oder gleich E ist: Φ(E, x) = ∑ δr
mit δr = 1, wenn Er (x) ≤ E, und δr = 0 sonst
(2.6)
r
Wichtig ist die folgende Tatsache: Das Ω(E, x) hängt nicht von δ E ab, solange δ E ein kleines, aber makroskopisches Energieintervall ist, also etwa gilt: δ E/E ≈ 10−5 . Dieser Zusammenhang ist zunächst nicht einsichtig. Sie hat als Folge die wichtige Identität Ω(E,V, N) = Φ(E,V, N)
(2.7)
Diese Tatsache ist eine Konsequenz der großen Zahl N ∼ 1024 , die zur Folge hat, dass die Funktion Φ(E, x) extrem stark mit der Energie E ansteigt, also etwa wie beim idealen Gas (wie unten gezeigt wird) ∼ E N , so dass nur die direkte extrem kleine (mikroskopische) Umgebung unterhalb von E relevant zu Φ(E, x) beiträgt, was direkt zu Gl. (2.7) führt. Man sieht dies halbwegs illustriert an Abb. (2.2) und Abb. (2.3): Bei geringen Energien gibt es nicht so viele Möglichkeiten, Mikrozustände ungefähr gleicher Energie herzustellen. Bei hohen Energien gibt es sehr viele Möglichkeiten, die so Teilchen auf die Einteilchenzustände zu verteilen, dass etwa die gleiche Energie des Mikrozustandes herauskommt.
Abbildung 2.2: System mit geringer Energie und geringer Teilchenzahl. Insgesamt gibt es wenig zulässige Mikrozustände.
Deshalb muss auch δ E klein, aber makroskopisch gewählt werden, und damit groß gegen den Energieabstand benachbarter Mikrozustände von etwa 10−18 eV. Vergrößert man das Intervall δ E so werden immer weiter Zustände zu Ω(E, x) hinzuaddiert, aber der Zuwachs wird immer sehr viel geringer bzw. fällt sehr stark ab, was den Wert von Ω(E, x) nicht mehr relevant ändert4 . Man die Funktion Ω(E, x) extrem stark mit der Energie E ansteigt, ist die Bedingung für Zulässigkeit der Mikrozustände auch Er ∈ [E − δ E, E] und nicht Er ∈ [E − δ E, E + δ E].
4 Weil
12
2 Grundlagen der Statistischen Mechanik
Abbildung 2.3: System mit großer Energie und großer Teilchenzahl. Insgesamt gibt es viele zulässige Mikrozustände.
erhält bei δ E = E am Ende Φ(E, x). Wir werden diese Betrachtungen im nächsten Unterkapitel an einem konkreten und allgemein wichtigen Beispiel nachvollziehen, nämlich der mikrokanonischen Zustandssumme des idealen Gases. Mittlere Energie: Hieran kann man eine wichtige Untersuchung über die mittlere Energie E¯ durchführen5 : Es tragen nur Mikrozustände zur mittleren Energie bei, die extrem nahe und unterhalb der oberen Grenze E des Energieintervalls liegen. Weil Ω(E,V, N) extrem stark, nämlich wie E N , mit E ansteigt, sind praktisch nur Zustände mit Er = E für die Mittelwertbildung relevant. Das bedeutet: Für ein mikrokanonisches Ensemble gilt Mikrokanonisches Ensemble:
E¯ = E
(2.8)
2.3.2 Mikrokanonische Zustandssumme des idealen Gases Wir berechnen nun die mikrokanonische Zustandssumme Ω des idealen Gases. Die resultierenden Formeln sind für Ω und Φ ( Beh.): Zustandssumme ideales Gas:
Ω(E,V, N) = AN
mit
N 3N V E 2 N N
(2.9)
5
e2 m (2.10) 2π h¯ 2 Beweis: Ein ideales Gas ist dadurch charakterisiert, dass die Wechselwirkung der Atome untereinander und innere Anregungen der Atome vernachlässigt werden. Es ergibt sich damit der h¯ 2 2 ∇ + U( rμ )] mit U = ∞ außerhalb des Würfels Hamiltonoperator des Systems: H = ∑Nμ=1 [− 2m A=
5 Wir
werden diese Überlegung auch bei der kanonischen und großkanonischen Verteilung anstellen, was hilft, die Äquivalenz aller dieser Verteilungen zu verstehen. Siehe hierzu Kap. 4.6 .
2.3 Mikrokanonisches Ensemble
13
(L3 ) und U = 0 innerhalb. Jede Impulskomponente eines Teilchens hat einen quantisierten Wert: pk = πLh¯ nk , wobei nk gewisse natürliche Werte annimmt. Dann ergibt sich ein zulässiger Mikrozustand zu |r >= | n1 , n2 , n3 , ..., n3N−2 , n3N−1 , n3N >r
p1
pN
Die Energie dieses Mikrozustandes ist: Er (N,V ) =
3N 1 2 π 2 h¯ 2 2 (pμ )r = ∑ (n ) 2 k r μ=1 2m k=1 2mL N
∑
(2.11)
Sei nun Φ(E, N) die Zahl der Zustände mit N Teilchen und Er ≤ E, also gegeben nach Gl. (2.6) durch Summation über r in Gl. (2.11) mit der dortigen Energie-Nebenbedingung. Hierbei wird für jedes r die Summe über k eingeschränkt. Wenn wir für einen Moment diese Einschränkungen weglassen, dann sind die Summen über r und k gleichbedeutend damit, dass wir jedes einzelne nk frei von 1 bis ∞ laufen lassen und aufsummieren. Wir können dann zum Integral übergehen und erhalten Φ = ∑1 = r
∑
n1 =1,2,...
....
∑
n3N =1,2,....
Wir substituieren nun d pk =
1=
∞ 0
dn1 ...
∞ 0
1 dn3N = ( )3N 2
∞ −∞
dn1 ....
∞ −∞
dn3N
π h¯ L dnk
Φ(E,V, N) = (
L 3N ) 2π h¯
d p1 ...
d p3N
Die Berücksichtigung der Nebenbedingung Er ≤ E schränkt die Integration ein: 1 3N 2 ∑ pk ≤ E 2m k=1 Die Integrale in Φ mit dieser √ Nebenbedingung stellen das Volumen einer 3N-dimensionalen Impulskugel mit Radius R = 2mE dar6 . Für das Volumen einer 3N-dimensionalen Kugel gilt7 V3N-Kugel =
Volumen 3N-dim Kugel mit Radius R:
π
3N 2
· R3N ( 3N 2 )!
(2.12)
so dass wir für die Zustandssumme erhalten Φ(E,V, N) = ( 6 Man
L 3N π ) 2π h¯
3N 2
(2mE) ( 3N 2 )!
3N 2
sieht das sofort, wenn man sich klar macht, dass das Volumen einer 3-dimensionalen Kugel gegeben ist durch dx dy dz mit Nebenbedingung x2 + y2 + z2 ≤ R2 . 7 Statt ( 3N )! verwende besser Γ( 3N + 1), weil x! = Γ(x + 1) und xΓ(x) = Γ(x + 1) . Deshalb gilt für die 3-dimensionale 2 2 √ 3/2 3 3 Kugel Γ( 32 + 1) = 34 π =⇒ V3 = π3 √R = 4π 3 R .
4
π
14
2 Grundlagen der Statistischen Mechanik
Nähere nun mit Stirlingscher Formel (e = 2.718281...) n Stirlingsche Formel: n! = ( )n für große n e oder log(n!) = n log n − n für große n
(2.13)
so folgt mit V = L3 als Volumen des eingeschlossenen Gases em 3N N E 3N )2V ( )2 N 2π h¯ 2 Bisher wurde noch keine Identität der Teilchen berücksichtigt, da wir eine rein klassische Betrachtung angestellt haben. Da das System aber invariant unter Vertauschung zweier beliebiger Teilchen sei, gibt es N! Permutationen in jedem Mikrozustand, die diesen nicht ändern. Daher haben wir N! Zustände zu viel in unsere obigen Φ. Deshalb bringen wir als wichtige quantenmechanische Korrektur8 die folgende Änderung mit Hilfe des Gibbsschen Faktors an, siehe Gl. (6.42): 1 Φ Identität der Teilchen: Φ→ N! oder mit der Stirling-Formel e Φ → ( )N Φ N Es ergibt sich somit als Gesamtzahl Φ der Mikrozustände mit Er ≤ E die Gl. (2.9), die wir zu beweisen hatten. Jetzt sind wir auch in der Lage, im Fall des idealen Gases die obige Behauptung Gl. (2.7) zu beweisen, nach der Ω(E, N,V ) nicht von δ E abhängt bzw. Ω(E, x) = Φ(E, x) gilt: Wir haben laut Definition für die Zustandssumme: Ω(E, N,V ) = Φ(E, N,V ) − Φ(E − δ E, N,V ) (mit makroskopischem δEE ≈ 10−5 ). Wegen der starken Energieabhängkeit von Φ ∼ E N ist keine Taylorentwicklung nach δ E möglich, wie unten im Zusammenhang mit Gl. (2.15) gezeigt wird. Deshalb führen wir eine Abschätzung der folgenden Art durch: Φ(E, N,V ) = (
Φ(E) = const · E
3N 2
=
E
3N 2
3N
3N 2
(E − δ E)
·const · (E − δ E) 2
Φ(E−δ E)
δE ≈exp ( 3N 2 E )
Hierbei haben wir verwendet, dass δ E makroskopisch ist und wir wegen Exponenten eine Taylorentwicklung durchführen können:
8 Es
E E −δE
3N 2
=
1 1 − δEE
3N 2
δE E
≈ 10−5 unter dem
3N δE 2 δ E 3N 3N δ E ∼ 1+ ≈ [exp ( )] 2 ∼ exp ( ) E E 2 E
war die geniale Idee von Gibbs, Faktoren der Art N! einzuführen. Wenn man sich die Größe dieses Faktors einmal deutlich macht, bekommt man Respekt vor dem Mut, solches zu tun, bevor eine mikroskopische Theorie der Statistischen Mechanik völlig ausformuliert war. Eine Ableitung dieses Faktors bringen wir in Kap. 6.2.5.
2.4 Der erste Hauptsatz der Thermodynamik
15
Wenn wir jetzt N = 1024 einsetzen, so erhalten wir etwa ⇒ Φ(E) 1018 Φ(E − δ E) und damit für die Zustandssumme: Ω(E,V, N) = Φ(E,V, N) ∗ (1 − 10−18 ) = Φ(E,V, N) Damit erhalten wir die für die Statistische Mechanik wichtigen Formeln (2.9) und (2.7), die wir oben behauptet haben. q.e.d. Begrifflich wesentlich für die Statistik sind ganz allgemein die folgenden Abhängigkeiten der Zustandssumme von der Energie und dem Volumen: 3 • Ω ∝ E 2 N , für das ideale Gas. • Ω ∝ V N , für das ideale Gas. • Im Allgemeinen haben wir für nach oben unbeschränkte Systeme Ω ∝ E γ f und γ ist immer von der Ordnung Eins (mit γ = 32 für ideales Gas) und f ist die Anzahl der Freiheitsgrade, also im Allgemeinen etwa gleich 1024 . Ω ∝ Eγ f
(2.14)
Bemerkung über Taylor-Entwicklungen und stark veränderliche Funktionen. Betrachte 1 2 ∂2 f ∂f (x) + ... (2.15) (x) + h f (x + h) = f (x) + h ∂x 2 ∂ x2 Für eine extrem stark ansteigende Funktion, z.B. f (x) = xN mit sehr großem N, kann man keine Taylorentwicklung machen. Denn: f (x + dx) = f (x) + dx f (x) = xN + dxNxN−1 = xN (1 + N dx x ) 1 ist. Bei einem statistischen Beispiel mit Die Taylorentwicklung ist nur gültig, wenn N dx x N ≈ 1024 gilt jedoch N δEE ∼ 10−5 · 1024 ∼ 1019 1. Man hilft sich in solchen Fällen damit, dass man nicht f (x) entwickelt, sondern log f (x). Das ist sinnvoll, da der Logarithmus von f (x) eine monoton ansteigende Funktion ist, deren Maxima und Minima dadurch an den gleichen Stellen liegen wie die von f (x). Dann haben wir nämlich F(x) = log f (x) und F(x + dx) = (x) und das gibt bei f (x) = xN das Resultat F(x + dx) = N[log x + dx log f (x) + dx ff (x) x ], was bei x 1 eine vernünftige Taylor-Entwicklung ist.
2.4 Der erste Hauptsatz der Thermodynamik Betrachte ein System mit den Mikrozuständen |r > gegeben durch die Schrödingergleichung H0 (x)|r >= Er (x)|r > mit äußeren Bedingungen x = (x1 , x2 , x3 , ....) und dem zugehörigen Ensemble im Makrozustand {Pr , x}. Betrachte nun einen allgemeinen Prozess, der das System von {Pr , x}a zum Makrozustand {Pr , x}b führt. Hier muss man eine wichtige Unterscheidung einführen zwischen einer Zustandsgröße, die nur von einem gegebenen Makrozustand abhängt, und einer Prozessgröße, die vom Anfangs- und Endzustand des Prozesses und vom Prozess selbst abhängt.
16
2 Grundlagen der Statistischen Mechanik
2.4.1 Definition: Wärme, Arbeit Für die mittleren Energien gilt, dass sie Zustandsgrößen sind, weil sie jeweils nur von ihrem Makrozustand abhängen. Denn nach Gl. (2.2) folgt: (a) (b) E¯a = ∑ Pr Er (x(a) ) und E¯b = ∑ Pr Er (x(b) ) r
r
wobei die Energien der Bedingung von Gl. (2.4) genügen müssen. Auch die Differenz der mittleren Energien hängt nur von {Pr , x}a und {Pr , x}b ab, also nur vom Anfangs- und Endpunkt des Prozesses und nicht vom Prozess selbst:. ΔE¯ = E¯b − E¯a Unterscheide hierbei zwei idealisierte Fälle: • Energieübertrag bei unveränderten äußeren Bedingungen x = x(a) = x(b) . Dieser Prozess definiert die dem System zugeführte Wärme Q: äußere Bedingungen unverändert:
ΔE¯ = Q = ∑(ΔPr )Er (x) r
Hier bleiben die Energieniveaus Er (x) für alle r unverändert, und es ändern sich nur die (b) (a) Besetzungswahrscheinlichkeiten Pr mit ΔPr = Pr − Pr . • Energieübertrag bei thermischer Isolierung. Dieser definiert die dem System zugeführte Arbeit W : thermisch isoliert: ΔE¯ = W = ∑ Pr (ΔEr ) r
Hier bleiben die Besetzungswahrscheinlichkeiten Pr unverändert, und es ändern sich nur die Energienieveaus Er mit ΔEr = Er (x(b) ) − Er (x(a) ). Für allgemeine Prozesse, in denen sowohl die Wärme Q als auch die Arbeit W dem System zugeführt wird, gilt also der erste Hauptsatz der Thermodynamik: Der erste Hauptsatz der Thermodynamik:
ΔE¯ = W + Q
(2.16)
Für infinitesimale Prozesse erhalten wir ¯ + dW ¯ d E¯ = dQ
(2.17)
¯ und dW ¯ sind unvollständige. Die Bedeutung Hierbei ist d E¯ ein vollständiges Differential, und dQ dieser Differentiale wird in Kapitel 2.4.2 untersucht. Die dem System zugeführte Arbeit und die zugeführte Wärme sind definitionsgemäß positiv, vom System abgegebene Arbeit und abgegebene Wärme sind negativ. Es ist hilfreich, die folgenden Prozesse zu untersuchen und dabei Abb. (2.5) auf p.25 zu betrachten. Prozess a: Die Wand ist festgeklemmt in einer gegebenen Position und wärmeundurchlässig. In diesem Fall wechselwirken die Gase im linken und rechten Volumen nicht miteinander. Prozess b: Wenn die Trennwand wärmedurchlässig und unbeweglich ist, dann kann Energie (Wärme) von einer Seite zur anderen fließen und wir haben reine thermische Wechselwirkung.
2.4 Der erste Hauptsatz der Thermodynamik
17
Die Drücke auf beiden Seiten ändern sich, ohne dass mechanische Arbeit geleistet wird. Prozess c: Wenn die Trennwand wärmeundurchlässig aber beweglich ist, dann ändert sie ihre Position und damit ändern sich auch auf jeder Seite jeweils Druck und Volumen und ein Gas verrichtet Arbeit am anderen. Das ist ein Beispiel für reine mechanische Wechselwirkung. Prozess d: Wenn die Trennwand beweglich und wärmedurchlässig ist, dann haben wir gleichzeitig thermische und mechanische Wechselwirkung.
2.4.2 Differentiale ¯ + dW ¯ siehe Gl. (2.17). Die mittlere Energie E¯ Wir untersuchen den ersten Hauptsatz d E¯ = dQ ist eine Zustandsgröße. Sie hängt genau vom Zustand des Systems ab, der eindeutig definiert ist durch {Pr }a , xa . Eine Änderung der mittleren Energie ΔE¯ in einem bestimmten Prozess ist unabhängig vom Prozessverlauf. Wenn der Endzustand durch {Pr }b , xb gegeben ist, so ist ΔE¯ eindeutig definiert. Deshalb ist das Differential von E¯ ein vollständiges Differential. Das ist bei der Arbeit und der Wärme anders: Es gibt im Ensemble nach Ablauf des Prozesses keine Wärme W und keine Arbeit A als Zustandsgrößen. Wärme und Arbeit sind prozessabhängig und nur ¯ und dW ¯ als zugeführte Größen W und A definiert. Deshalb sind ihre Differentiale durch dQ gekennzeichnet, was deutlich macht, dass es sich um unvollständige Differentiale handelt. Zum Studium der Differentiale führen wir allgemein die Bezeichnung dF für ein vollständiges ¯ für ein unvollständiges Differential ein. Es sei F(x, y) eine bekannte Funktion Differential und dF der zwei Variablen x und y. Dann gilt für das vollständige Differential dF = F(x + dx, y + dy) − F(x, y) was man schreiben kann als dF = A(x, y)dx + B(x, y)dy wobei A und B berechnet werden können mit (übliche äquivalente Bezeichnungsweisen) A(x, y) = (
∂F ∂F ∂F )(x, y) = ( )y=const = ( )y ∂x ∂x ∂x
B(x, y) = (
∂F ∂F ∂F )(x, y) = ( )x=const = ( )x ∂y ∂y ∂y
(2.18)
Hat man zwei beliebige Punkte (x1 , y1 ) und (x2 , y2 ), so gilt ΔF = F(x2 , y2 ) − F(x1 , y1 ) = =
2 1
A(x, y)dx +
2
2
dF 1
B(x, y)dy 1
Da die linke Seite der Gleichung wegunabhängig ist, muss dies auch für die rechte Seite gelten. Betrachte jetzt den folgenden differentiellen Ausdruck gegeben mit zwei beliebigen Funktionen A und B :
18
2 Grundlagen der Statistischen Mechanik
¯ = A (x, y)dx + B (x, y)dy dG ¯ nichts mehr als eine Abkürzung für RHS. Das dG ¯ ist mit Sicherheit eine diffeHierbei ist dG rentiell kleine Größe, aber im Allgemeinen kein vollständiges Differential, es muss daher nicht unbedingt ein F existieren, aus dem man A und B nach Gl. (2.18) berechnen könnte. Das nennt ¯ schreiben und man dann ein unvollständiges Differential und deutet das dadurch an, dass wir dG nicht dG. Satz (ohne Beweis): gilt:
A(x, y)dx + B(x, y)dy ist ein vollständiges Differential genau dann, wenn
(
∂A ∂B )(x, y) = ( )(x, y) ∂y ∂x
oder (
∂A ∂B ) x = ( )y ∂y ∂x
Dann gibt es eine Funktion F(x, y) mit der Eigenschaft ∂F )y ∂x ∂F )x B(x, y) = ( ∂y
A(x, y) = (
und9 (
∂ 2F ∂ 2F )(x, y) = ( )(x, y) ∂ x∂ y ∂ y∂ x
(2.19)
¯ gibt es einen sogenannten Integrierender Faktor: Für viele unvollständige Differentiale dG integrierenden Faktor. Als solcher wird eine Funktion σ = σ (x, y) bezeichnet, die die Eigenschaft hat, aus dem unvollständigen Differential durch Division ein vollständiges zu machen, so dass also dF =
¯ dG σ (x, y)
9 Beispiel: Betrachte das Differential, das sich als unvollständiges erweisen wird: dG ¯ = αdx + β x dy oder äquivalent dG ¯ y β ∂ ∂ x ¯ kein vollständiges Differential sein = αdx + β xd(log y). Offenbar gilt ∂ y α = 0 und ∂ x (β y ) = y = 0, weshalb dG
kann. Nun kann man die Punkte (1, 1) und (2, 2) und ein Wegintegral dazwischen berechnen. Man kann die Punkte auf zwei einfache Arten verbinden: 1) Zuerst parallel zur x-Achse und dann parallel zur y-Achse. 2) Zuerst parallel zur y-Achse und dann parallel zur x-Achse. Im 1. Fall erhält man für
(2,2)
(1,1)
¯ = α(x2 − x1 ) + x2 β {log y2 − log y1 } = dG
α + 2β log 2 weil x2 = 2 ist, und im 2. Fall erhält man α(x2 − x1 ) + β x1 {log y2 − log y1 } = α + β log 2, weil x1 = 1 ¯ kein vollständiges Differential ist. Das Integral ist also nicht wegunabhängig, was der Tatsache entspricht, dass dG ist.
2.5 Quasistatische Prozesse, Generalisierte Kräfte
19
ein vollständiges Differential ist10 . Achtung: Der integrierende Faktor existiert nicht für jedes unvollständige Differential. ¯ und Faktum bzgl. erstem Hauptsatz: Das d E¯ ist ein vollständiges Differential, während dQ ¯ dW unvollständige Differentiale sind. In Sonderfällen können auch Wärmezufuhr bzw. Arbeitszufuhr jeweils vollständige Differentiale bilden: ¯ = 0 (adiabatisch), also reine Zufuhr von Arbeit: ⇒ dW ¯ = dW = d E¯ • Prozess mit dQ ¯ ¯ • Prozess mit dW = 0, also reine Zufuhr von Wärme : ⇒ dQ = dQ = d E¯
2.5 Quasistatische Prozesse, Generalisierte Kräfte Wir wissen, dass ein Gas in einem Gefäß einen Druck auf die Außenwände ausübt. Das bedeutet eine Krafteinwirkung auf die Außenwände. Oder ein Kolben wird gegen den Gasdruck in das Gefäß hineingepresst. Dieses Konzept der Kraft kann man für die Änderung eines jeden beliebigen äußeren Parameters (nicht nur eines mechanischen) formulieren und es führt zum Begriff der generalisierten Kraft. Man kann diese aber nur präzise definieren bei sog. quasistatischen Prozessen. Diese liefern auch dann die Möglichkeit, die generalisierten Kräfte und, wie wir sehen werden, auch andere Größen wie z.B. die Entropie zu messen. Insgesam stellen die quasistatischen Prozesse eine Verbindung zwischen den mikroskopischen Strukturen und den makroskopischen Observablen eines Systems dar und sind damit äußerst wichtig.
2.5.1 Quasistatische Prozesse Ein Prozess wird quasistatisch genannt, wenn er so langsam abläuft, dass das System in sehr guter Näherung eine Folge von Gleichgewichtszuständen durchläuft. Es sei τrelax die Relaxationszeit, die das System braucht, um nach einer bestimmten plötzlichen Störung wieder in den Gleichgewichtszustand zu gelangen. Offenbar hängt τrelax von der Art der Störung ab. Wir bezeichnen mit τexp die Zeit, in der wir am System ein Experiment durchführen, d.h. die äußeren Parameter ändern (Vergrößerung des Volumens, Änderung des Drucks etc.) oder auch Zufuhr von Wärme. Wir nehmen zunächst an, dass wir die Änderung dieser Parameter in vielen kleinen ruckartigen Schritten vornehmen. Nach diesen Störungen bewegt sich das System immer wieder nach τrelax in den Gleichgewichtszustand. Statt vieler kleiner ruckartiger Störungen können wir uns auch eine langsame kontinuierliche Veränderung dieser Parameter vorstellen. Wenn dann τrelax τexp gilt, dann bewegt sich das System beliebig langsam durch den Raum der Parameter und ist immer näherungsweise im Gleichgewicht. Solch einen Prozess bezeichnet man als quasistatisch. Ein Beispiel für einen quasistatischen Prozess finden wir in Abb. (2.12) auf p.40, wenn wir annehmen, dass die Wand langsam bewegt wird. Der äußere Parameter ist hier die Position des Kolbens. Wenn wir den Kolben um eine gegenüber den Dimensionen des Volumens kleine Strecke verrücken, lösen wir eine Schallwelle im Gas aus, die durch das Volumen läuft, dabei gedämpft wird, und nach der Zeit τrelax ist das System bei der neuen Kolbenposition im Gleichgewicht. 10 Beispiel:
¯ = αdx + β x dy und es ist sofort klar, dass σ (x, y) = x ein integieNimm das unvollständige Differential dG y
render Faktor ist: dF =
¯ dG σ (x,y)
=
¯ dG x
=
β α x dx + y
dy, woraus folgt F(x, y) = α log x + β log y.
20
2 Grundlagen der Statistischen Mechanik
Wenn wir es dann etwa nach der Zeit 10τrelax beobachten, finden wir es im Gleichgewicht vor. Wenn wir das mehrfach wiederholen, haben wir eine Folge von Gleichgewichtszuständen. Man kann sich leicht vorstellen, dass man langsam den Kolben kontinuierlich bewegt und dann immer wieder misst. Wenn der Meßvorgang dann so schnell ist, dass während dieser Zeit die Kolbenbewegung vernachlässigt werden kann, haben wir immer eine Folge von Gleichgewichtszuständen vor uns. Wichtig ist die folgende mikroskopische Überlegung: Die Änderung eines oder mehrerer äußerer Parameter xi (Größe oder Gestalt des Volumens, ein äußeres magnetisches oder elektrisches Feld etc.) bewirkt nur, dass sich die Einteilchenwellenfunktionen und damit die Mikrozustände und ihre Energien verändern, weil sie sich den neuen äußeren Umständen anpassen. Die langsame quasistatische Änderung der äußeren Parameter bewirkt aber keine Umbesetzung der Zustände, die Pr bleiben also unverändert, weil nach der quantenmechanischen zeitabhängigen Störungstheorie die Übergangswahrscheinlichkeit pro Zeit für r → r proportional zu x˙i2 ist und damit als ein Effekt 2. Ordnung bei hinreichend kleinem x˙i vernachlässigbar ist. Man geht weiterhin von einem Gleichgewichtszustand aus, bei dem nach dem gundlegenden Postulat von Gl. (2.3) alle zulässigen Pr gleich sind im Bereich Er ∈ [E − δ E, E] und außerhalb des Intervalls verschwinden. Durch langsame Änderung der xa ändert man nur die Energien Er , aber nicht Pr , die nach wie vor untereinander gleich und konstant bleiben. Es verschiebt sich daher nur das Intervall insgesamt durch die Energiezufuhr. Umgekehrt ist festzuhalten, dass bei langsamer Zufuhr von Wärme, z.B. durch eine mit geringem Strom durchflossene Drahtschleife im Volumen, die Mikrozustände und ihre Energien Er sich nicht ändern, weil die Randbedingungen geblieben sind. Es ändern sich nur die Wahrscheinlichkeiten Pr im Ensemble und es werden höhere Zustände bei Wärmezufuhr langsam stärker besetzt.
2.5.2 Generalisierte Kräfte Beliebiger quasistatischer Prozess: Bei einem beliebigen quasistatischen Prozess in einem mikrokanonischen System haben wir die folgende Gleichung für die Änderung der (mittleren) Energie11 dE = d E¯ = d(∑ Pr Er ) = ∑ dPr Er + ∑ Pr dEr r
r
(2.20)
r
und damit eine klare formale Aufteilung in Wärme und Arbeit ¯ + dW ¯ d E¯ = dQ Für quasistatische Änderung der äußeren Parameter sind die Ableitungen haben ∂ Er dxi dEr (x) = ∑ i ∂ xi 11 Wir
erinnern uns, dass im mikrokanonischen System E = E¯ gilt.
(2.21) ∂ Er ∂ xi
definiert und wir
2.5 Quasistatische Prozesse, Generalisierte Kräfte
21
und somit d E¯ = ∑ dPr Er (x) + ∑ r
i
∂ Er ∑ Pr ∂ xi r
(2.22)
dxi
Offenbar ist diese Gl. (2.21) nichts anderes als der erste Hauptsatz der Thermodynamik für quasistatische Prozesse. In Gl. (2.22) wird ein wichtiger Unterschied deutlich: Bei der Wärmezufuhr bzw. -abgabe wirken alle Zustände |r in unspezifischer Weise mit. Ihre Besetzungszahl Pr ändert sich, ohne dass wir z.Zt. dafür etwas Genaues angeben können. Bei der Arbeit, die am System verrichtet wird (oder vom System geleistet wird), wirken ebenfalls alle Zustände mit, aber in spezifischer Weise, die durch die Änderung der äußeren Freiheitsgrade gegeben ist, eben durch ∂∂Exir . Diese äußeren Freiheitsgrade sind makroskopisch und deshalb in ihrer Zahl von der Größenordnung Eins. Ist das System nicht zu kompliziert, können die Ableitungen berechnet werden. Adiabatischer quasistatischer Prozess: Zur Definition der generalisierten Kraft beschränken wir uns nun auf quasistatische adiabatische Änderungen, bei denen definitionsgemäß dem Sys¯ = 0), sondern nur ein oder mehrere äußere tem keine Wärme zugeführt oder abgeführt wird ( dQ Parameter geändert werden. Da der Prozess adiabatisch ist, gilt für die zugeführte Arbeit, dass ¯ = dW . Damit haben wir nach Gl. (2.22): sie ein vollständiges Differential darstellt, i.e. dW ¯ = ∑ ∑ Pr ¯ d E(x) = dW i
r
∂ Er ∂ ∂ ¯ dxi = ∑ dxi ∑ Pr Er (x) = ∑ dxi ∂ xi E(x) ∂ xi ∂ x i r i i
Die verallgemeinerten Kräfte werden nun betrachtet im Sinne von „Energie=Kraft*Weg”. Die verallgemeinerte Kraft X¯i wird somit definiert über die Arbeit, die am wärmeisolierten System bei Änderung des äußeren Parameters xi geleistet wird12 :
generalisierte Kraft (mikroskopische Definition):
∂ E¯ X¯i = − ∂ xi dQ=0 ¯
(2.23)
mit E¯ = ∑r Pr Er . Es ergibt sich für die differentiell am System (nicht vom System) geleistete Arbeit bei diesen quasistatischen Prozess dWqs = − ∑ X¯i dxi
(2.24)
i
In diesem Kapitel haben wir die mikroskopische Definition der verallgemeinerten Kräfte kennen gelernt, wir werden später noch eine makroskopische Definition mit Hilfe der Entropie kennen lernen. ¯ = 0) mit GlasBeispiel: Druck Es befinde sich Gas in einer thermisch isolierten Flasche (dQ kolben, dessen Position mit x gekennzeichnet ist. Der Kolben wird vom Gas quasistatisch aus der 12 Achtung:
Wir haben die Vorzeichenkonvention, dass Arbeit positiv ist, die dem System von außen zugeführt wird. Deshalb das Minuszeichen in der Gleichung (2.23).
22
2 Grundlagen der Statistischen Mechanik
Flasche gedrückt, wodurch das Gas Arbeit leistet: K dW = −Kdx = − Fdx F K = − dV = −PdV F Das Vorzeichen ergibt sich: dWqs ist die am System geleistete Arbeit. Wenn P > 0 und dV > 0, ist bei Ausdehnung PdV > 0 und somit dWqs < 0. Das System leistet Arbeit und könnte z.B. eine am Kolben befestigte Feder zusammendrücken. Weil nun bei dem adiabatischen Prozess d E¯ = dW gilt, ergibt sich dW d E¯ P¯ = − =− (2.25) dV dV Druck ist also die generalisierte Kraft bzgl. des Volumens als äußerer Koordinate.
2.5.3 Druck des idealen Gases In diesem Unterkapitel lösen wir mikroskopisch Gl. (2.25) für ein ideales Gas und berechnen den Druck über die mittlere Energie. Betrachte ein Volumen mit den Kantenlängen L1 , L2 und L3 . Ein Mikrozustand ist nun gegeben durch Impulsquantenzahlen |r = (n1 , n2 , . . . , n3N )r = (. . . , n3ν−3+1 , n3ν−3+2 , n3ν−3+3 , . . .)r Es gelte ν = 1, . . . , N und j = 1, 2, 3 und damit pν = (p3ν−2 , p3ν−1 , p3ν )
p3ν−3+ j =
mit
π h¯ n3ν−3+ j Lj
Daraus folgt für den Mikrozustand |r Er =
N
1
N
3
h¯ 2 π 2
∑ 2m (p2ν )r = ∑ ∑ 2mL2 (n3ν−3+ j )2r
ν=1
ν=1 j=1
(2.26)
j
Es gilt nun zur Berechnung des Drucks auf die Wand in 3-Richtung für die dem System zugeführte Arbeit: ¯ = ∑ Pr ∂ Er dL3 < 0 dW ∂ L3 r Greift man bei der Ableitung die L3 -Terme heraus, so ergibt sich durch Vergleich mit Gl. (2.26) 2 2 N π h 2 ¯ ¯ = ∑ Pr − dW ∑ 2mL2 (n3ν−3+3 )2r dL3 L3 ν=1 r 3 oder ¯ dW
=
=
h¯ 2 π 2 (n )2 ] dL3 2 3ν−3+3 r r ν=1 2mL3
mittlere kinetische Energie in 3-Richtung 1 3 der totalen mittleren Energie N
− L23 ∑ Pr [ ∑
2.6 Entropie, Temperatur, der zweite und dritte Hauptsatz
23
und damit ¯ = − 2 1 [∑ Pr Er ]dL3 = − 2 1 [∑ Pr Er ]L1 L2 dL3 dW L3 3 r L1 L2 L3 3 r 2 = − [∑ Pr Er ]dV < 0 3V r oder ¯ = − 2 EdV ¯ Ωi
24
2 Grundlagen der Statistischen Mechanik
Die Wahrscheinlichkeit P, nach Enfernen der Wand einen Zustand vorzufinden, der vor dem Entfernen der Wand zulässig war (also alle Moleküle in der linken Hälfte), ist unvorstellbar klein. Ωi P= 1 Ωf 24
Denn wird die Wand aus der Mitte des Gasvolumens entfernt, so wäre das P = ( 12 )N = ( 12 )10 ≈ 0. Selbst wenn wir die Wand bei 99.9999 % des Gasvolumens entfernen, erhalten wir immer 24 noch P = (0.999999)10 ≈ 0 ! Das bedeutet aber auch, dass die extrem kleine Abweichung vom Gleichgewicht zu 99.9999 % des vollen Volumens sofort einen extrem starken Abfall von Ω zur Folge hat, dessen Konsequenzen ganz entscheidend sind und im Folgenden diskutiert werden. Wenn man rechts und links von einer beweglichen Wand an der Position y ideale Gase unterschiedlichen Drucks und gleicher Temperatur betrachtet, siehe Abb. (2.5), so wird sich die Wand verschieben und es stellt sich nach einer gewissen Relaxationszeit ein Gleichgewichtszustand ein, der stationär ist. Jeder Mikrozustand bei jeder Stellung der beweglichen Wand ist auch ein Mikrozustand des Systems im Gleichgewicht, wenn man die Wand künstlich festhält. Der Gleichgewichtszustand ist jedoch dadurch charakterisiert, dass bei ihm Ω(y) maximal ist. Für ein makroskopisches System besitzt Ω(y) ein sehr scharfes und extrem ausgeprägtes Maximum an der Gleichgewichtsposition y, ˜ bei dem der Druck rechts und links von der Wand gleich ist. In diesem Zustand haben die Zustände der Anfangssituation (z.B. Gasmoleküle primär im linken Bereich) ein extrem kleines statistisches Gewicht. Das werden wir genauer in Kap. 2.6.3 und Kap. 2.6.6 und Gl. (2.41) sehen und ist in Abb. (2.6) dargestellt. Allgemein gilt, dass in einem abgeschlossenen System das Entfernen einer Zwangsbedingung, welcher Art sie auch immer sein möge, die Anzahl der zulässigen Mikrozustände vergrößert oder gleich lässt: Ω f ≥ Ωi
2.6.2 Reversibilität, Irreversibilität Bleibt in einem abgeschlossenen System die Anzahl der Zustände beim Wegnehmen einer Zwangsbedingung gleich, also Ωi = Ω f , dann spricht man von einer reversiblen Zustandsänderung. Ändert sich hingegen die Anzahl der Zustände, also Ω f > Ωi , dann spricht man von einer irreversiblen Zustandsänderung. Am Kasten gefüllt mit idealem Gas kann man das am besten demonstrieren, siehe Abb. (2.7). Spontan ablaufende Prozesse in einem abgeschlossenen System sind ausnahmslos irreversibel. Spontan bedeutet, dass das System aus irgendeinem Grund nicht im Gleichgewicht ist und ihm ohne Änderung der äußeren Bedingungen (z.B. ohne Wärme- oder
Abbildung 2.4: Entfernen einer Wand in einem endlichen Volumen gefüllt mit Gas. Ausbreiten des Gases in das größere Volumen.
2.6 Entropie, Temperatur, der zweite und dritte Hauptsatz
0
y0
y˜
25
0
y
y0
y˜
y
Abbildung 2.5: Endliches Volumen mit beweglicher Wand zwischen zwei Bereichen unterschiedlichen Drucks.
Ω(y)
0
y0
y˜
y
Abbildung 2.6: Schematisches Bild von Ω(y) mit Gleichgewichtsposition an y = 0.
Arbeitszufuhr) die Möglichkeit gegeben wird, den Gleichgewichtszustand zu erreichen, etwa dadurch, dasss in Abb. (2.5) die Klemmen, die die Trennwand in der linken Abbildung festhalten, gelöst werden. Wenn ein irreversibler spontaner Prozess (i → f ) abgelaufen ist, dann bedeutet das nicht, dass die ursprüngliche Situation i nicht wiederhergestellt werden kann. Das geht jedoch nur dann, wenn das System nicht mehr abgeschlossen gehalten wird. Z.B. in Abb. (2.5) kann die Trennwand gegen den Gasdruck nach links von y˜ bis zu y0 geschoben werden, wobei man allerdings Arbeit leisten muss. Dabei wird sich das Gas aufheizen, weil an ihm Arbeit geleistet wird und sich damit seine Energie erhöht. Wenn man nicht-adiabatische Wände annimmt, kann man das so jedoch steuern, dass die ursprüngliche Temperatur wieder erreicht wird, z.B. dadurch, dass man einen Wärmespeicher der richtigen Temperatur Ti an das Gasvolumen hält. Für das Gasvolumen haben wir jetzt wieder die Anfangsbedingungen der linken Seite von Abb. (2.5) hergestellt, was verdächtig nach Reversibilität aussieht. Für das Gesamtsystem jedoch, bestehend aus dem Gasvolumen, aus der die Trennwand nach links drückenden und sich damit verlängernden Feder, und aus dem Wärme aufnehmenden Speicher, haben wir einen irreversiblen Prozess durchgeführt, weil sich der Zustand der Feder und des Wärmespeichers verändert haben.
26
2 Grundlagen der Statistischen Mechanik
irreversibel
Ω f > Ωi
reversibel
Ωi
Ωi
Ω
Ω
Ωf
Ωf Ω f = Ωi
Abbildung 2.7: Irreversible und reversible Zustandsänderung beim Entfernen und Einschieben einer Wand in ein mit Gas gefülltes Volumen. Das System ist abgeschlossen.
2.6.3 Entropie, Temperatur Wir führen in diesem Kapitel den überaus wichtigen Begriff der Entropie ein und definieren die Temperatur. Betrachte dazu in Abb. (2.8) zwei Untersysteme eines abgeschlossenen Systems in rein thermischem Kontakt, es kann somit Wärme von einem Untersystem ins andere fließen, sonst ist keine Veränderung möglich, alle äußeren Parameter xa (wie z.B. Volumen) sind also konstant: Es soll gelten: Das Gesamtsystem ist abgeschlossen und hat die Energie E0 = EA + EB und der Wärmeaustausch ist quasistatisch. System A: Es befindet sich im Gleichgewicht und hat die Energie EA , die Anzahl der zulässigen Zustände im Energieintervall [EA − δ E, EA ] ist gegeben durch ΩA (EA ). System B: Es befindet sich im Gleichgewicht und hat die Energie EB , die Anzahl der zulässigen Zustände im Energieintervall [EB − δ E, EB ] ist gegeben durch ΩB (EB ) Unter diesen Voraussetzungen ist die Zahl der zulässigen Zustände des Gesamtsystems für das gegebene E0 nur eine Funktion der Energie EA des Systems A: Ω0 (E0 , EA ) = ΩA (EA ) · ΩB (EB ), wobei gilt EB = E0 − EA . Frage: Wie teilt sich nun die Gesamtenergie E0 auf die Energien der Untersysteme EA und EB auf, wenn das Gesamtsystem im Gleichgewichtszustand ist?
2.6 Entropie, Temperatur, der zweite und dritte Hauptsatz
A
27
B Q
Abbildung 2.8: Zwei Untersysteme A und B eines abgeschlossenen Gesamtsystems in rein thermischem Kontakt.
Betrachte nun das statistische Ensemble des abgeshlossenen Gesamtsystems. Die Wahrscheinlichkeit P0 (E0 , EA ), das kombinierte System in einer Konfiguration zu finden, in der A die Energie EA hat, ist gegeben ist durch die Anzahl von zulässigen Zuständen des Gesamtsystems unter der Nebenbedingung E0 = EA + EB . Also: P0 (EA ) = CΩ0 (E0 , EA ) = ΩA (EA ) · ΩB (EB ) ·C Hier ist C eine Normierungskonstante, damit die Summe über alle Wahrscheinlichkeiten P0 (EA ) auf Eins normiert ist. Es gilt C−1 = ∑ Ω0 (E0 , EA ) EA
Die Energie des Systems A, bei der das Gesamtsystem sich im Gleichgewicht befindet, bezeichnen wir mit EA . Sie ist gegeben durch das Maximum von P0 (EA ) und damit durch die Gleichung: ∂ P0 (EA ) = 0. ∂ EA EA =EA Betrachte ein normales System mit sehr vielen Freiheitsgraden, für das dann die folgenden statistischen Überlegungen gelten13 . Die Funktion P0 (EA ) ist an der Stelle EA extrem stark gepeakt, weil Ω0 (E0 , EA ) so stark gepeakt ist. Der Grund ist das rasche Anwachsen der Zustandssumme ΩA (EA ) und das rasche Abfallen von ΩB (E0 − EA ) mit wachsendem EA , siehe Abb. (2.9). Wegen dieses extrem scharfen Peaks von P0 bei EA betrachten wir zur Berechnung seines Maximums den Logarithmus von P0 (EA ): log P0 (EA ) = logC + log ΩA (EA ) + log ΩB (E0 − EA )
(2.28)
Im Gleichgewicht muss an der noch unbekannten Stelle EA die Ableitung nach EA verschwinden, wodurch dann EA bestimmt wird ∂ ∂ ∂ log P0 (EA ) = log ΩA (EA ) + log ΩB (E0 − EA ) =0 ∂ EA ∂ EA ∂ EA EA =EA EA =EA etwa Systeme mit Ω(E) ∼ E γ f mit f Freiheitsgraden. Normalerweise gilt f ∼ 1024 , γ ist erfahrungsgemäß als Materialkonstante immer von der Größenordnung Eins, z.B. ideales, z.B. einatomiges Gas hat γ = 32 .
13 Also
28
2 Grundlagen der Statistischen Mechanik
ΩA (EA )
0
ΩB (E0 − EA )
E˜ A
0
E0 EA
E˜ A
E0 E A
P0 (EA )
E˜ A
0
E0 E A
Abbildung 2.9: ΩA (EA ), ΩB (EB ), ΩB (E0 − EA ) und P0 (EA ) mit scharfem Peak an der Gleichgewichtsposition EA . Siehe Text für Details.
weil
∂ ∂ EA
logC = 0.
Weil ∂ /∂ EB = −∂ /∂ EA , folgt sofort für die Gleichgewichtsbedingung an der Stelle EA ∂ ∂ log ΩA (EA ) = log ΩB (EB ) ∂ EA ∂ EB Wir definieren βA (EA ) =
(2.29)
∂ log ΩA (EA ) ∂ EA
(2.30)
und analog für System B. Die folgende Gleichung (2.31) ist dann die Bestimmungsgleichung für EA , also diejenige Energie von A, bei der das Gesamtsystem bei festgehaltenen äußeren Parametern xa im Gleichgewicht ist: (2.31) βA (EA ) = βB (E0 − EA ) Diese Ausdrücke geben Anlaß, allgemein für ein beliebiges abgeschlossenes System im Gleichgewicht bei gegebener Energie E und gegebenen äußeren Parametern x die Entropie zu definieren, die eine Zustandsgröße ist: Entropie:
S(E, xa ) = kB log Ω(E, x).
(2.32)
2.6 Entropie, Temperatur, der zweite und dritte Hauptsatz
29
Die Temperatur T wird definiert durch die Gleichung
β=
1 kB T
(2.33)
oder Temperatur:
1 = T
∂ S(E, x) ∂E
= kB x
∂ log Ω(E, x) ∂E
(2.34) x
Hierbei wird eine dimensionierte Konstante kB eingeführt, die zusammen mit der Einheit für die Temperatur festgelegt wird. Generell nimmt man hierfür die Boltzmann-Konstante an, wodurch „Kelvin” definiert ist:
Boltzmann-Konstante: kB = 1.38 · 10−23 K−1 J = 8.617 · 10−5 K−1 eV
(2.35)
Die Bedingung maximaler Wahrscheinlichkeit von P0 (EA ) ist nach Gl. (2.28) die Bedingung maximaler Gesamtentropie:
S0 = SA + SB = Maximum
(2.36)
Das Gleichgewicht eines abgeschlossenen Systems ist dann offenbar gegeben durch die Forderung, dass die Entropie ein Maximum einnimmt. Die Gl. (2.31) schreibt sich äquivalent als
TA = TB
(2.37)
Dies ist die Bedingung für den Fall, dass keinerlei äußere Parameter xα geändert werden, also nur thermaler Kontakt zwischen A und B vorliegt. Gleichgewicht herrscht, wenn beide Teilsysteme gleiche Temperatur haben.
30
2 Grundlagen der Statistischen Mechanik
2.6.4 Eigenschaften der Entropie und der Temperatur Nach der oben dargestellten Ableitung von S und T stellen wir Folgendes fest: • Die Definition der Entropie und der Temperatur bezieht sich jeweils auf ein abgeschlossenes System im Gleichgewicht. Nur dort besteht der direkte Zusammenhang zwischen Pr und Ω. • Im Gleichgewicht ist die Entropie maximal. • Die Entropie ist eine (extensive) Zustandsgröße. Es gilt für die beiden Teilsysteme Ω = ΩA ΩB und damit S = kB log Ω = kB (log ΩA + log ΩB ). • Durch S = kB log Ω wird ein Zusammenhang zwischen der mikroskopischen Struktur des Systems, beschrieben durch Ω, und makroskopischen Meßgrößen, i.e. S und T , hergestellt. • Die Entropie ist ein Maß für die Unordnung des Systems und umgekehrt für den Informationsgehalt. Vollkommene Ordnung besteht darin, dass es nur einen Mikrozustand des Systems gibt, dann ist Ω = 1 und S = 0, und wir haben vollständige Information über das System. Je mehr Mikrozustände zulässig sind, also je größer Ω, umso kleiner das Gewicht jedes einzelnen, umso weniger Information über das System besitzt man, desto ungeordneter ist es also. Diese Tatsachen liegen an der Eigenschaft des Gleichgewichtszustandes, nämlich dass jeder Mikrozustand in diesem Ensemble gleichberechtigt vertreten ist. Wenn z.B. ein Volumen V zur Verfügung steht, die Teilchen sich jedoch nur in einem Teilvolumen aufhalten, ist die Entropie kleiner. Entsprechend ist der Informationsgehalt größer, denn man weiß, dass die Teilchen nicht irgenwo in V sondern sich nur im Teilvolumen befinden. • Zwischen der Aussage ”S=maximal im Gleichgewicht” und ”S ist nur im Gleichgewicht definiert” besteht kein Widerspruch. Damit beide Aussagen gültig sind, müssen Zustände mit ”S = maximal” zugelassen sein. Dies ist möglich, wenn man quasistatische Zustandsänderungen vornimmt, bei denen das System eine Folge von Gleichgewichtszuständen beliebig langsam durchläuft. • Die Temperatur gibt qualitativ die Energie pro Freiheitsgrad an. Man sieht dies, wenn man Ω(E) = cE γ f annimmt. Damit erhält man kB T = E/(γ f ) Die für die statistische Physik fundamentale Gleichung S = kB log Ω wurde 1877 von Boltzmann aufgestellt. Sie wurde in seinen Grabstein eingemeißelt14 . 14 Unter
Einwirkung von Gravitation bei tiefen Temperaturen verhält sich das System anders, als man es von einem üblichen Gas erwartet. Dort sammelt sich z.B. im Universum eine zunächst nach der Nukleosynthese nahezu gleichförmig verteilte Materie, formiert sich zu Galaxien, und am Ende kollabiert mehr oder weniger jede von ihnen zu einem Schwarzen Loch. Während dieser Vorgänge erhöht sich ständig die Entropie, und wenn dabei der noch Raum expandiert, wird das Geschehen noch komplizierter. Auch wenn das Verständnis dieser Vorgänge den Rahmen dieses Buches weit übersteigt, so ist doch eines offensichtlich: Einem Schwarzen Loch muss man Entropie zuordnen, wie es Hawking und Bekenstein getan haben. Die generelle Ansicht ist heute, dass der zweite Hauptsatz um diese Entropie modifiziert werden muss, also lautet ΔStotal = ΔStherm + ΔSBH > 0. Hierbei ist SBH = AkB c3 /8π h¯ , wobei A die Oberfläche des Schwarzen Lochs und G die Gravitationskonstante ist. Die Existenz von SBH zieht eine Temperatur nach sich, die gegeben ist durch T = h¯ T 3 /8πkB GMBH . Objekte endlicher Temperatur emittieren nach dem StefanBoltzmann-Gesetz Wärmestrahlung, die für Schwarze Löcher lautet I ( tot) = σ T 4 (16π 2 MBH c−4 ). Diese HawkingStrahlung beträgt z.B. für ein Schwarzes Loch von einer Sonnenmasse etwa ≈ 10−28 Watt. Unter der Annahme eines
2.6 Entropie, Temperatur, der zweite und dritte Hauptsatz
31
2.6.5 Entropie und Zustandsgleichung des idealen Gases Die Entropie des idealen Gases ergibt sich sofort aus der Zustandssumme (2.9), die gegeben ist durch V E 3N Ω(E,V, N) = AN ( )N ( ) 2 N N Daraus folgt die Entropie und ihre Abhängigkeit von E und V bei festem N: 3NkB (2.38) log E + NkB log V + kBC 2 wobei wir eine neue Konstante C eingeführt haben, die den nicht von E oder V abhängigen Rest der Formel aufsammelt. Wie erwartet hat log Ω im Gegensatz zu Ω eine gemäßigte Abhängigkeit von der Energie und vom Volumen, weshalb wir Taylorentwicklungen an log Ω vornehmen können 15 . Wir können sofort die Zustandsgleichung des idealen Gases berechnen. Wir kennen die Entropie (2.38) und von daher erhalten wir ∂S 1 3NkB = = T ∂E V 2E S(E,V ) = kB log Ω =
und damit die be kannte Formel 3 E = NkB T (2.39) 2 Diese Gleichung entspricht dem Gleichverteilungssatz (Äquipartitionstheorem) Gl. (4.22), der in diesem Fall besagt, dass jeder der drei Freiheitsgrade im Mittel pro Teilchen 12 kB T zur mittleren ¯ Energie beisteuert. Wir kennen auch den Druck Gl. (2.27), i.e. P = 23 VE , woraus sich dann wegen E¯ = E aus Gl. (2.8) die Zustandsgleichung Gl. (2.40) des idealen Gases ergibt: ideales Gas:
Zustandsgleichung ideales Gas:
PV = NkB T
(2.40)
2.6.6 Schärfe der Verteilung In diesem Kapitel zeigen wir explizit, dass die Wahrscheinlichkeit, ein abgeschlossenes System in seinem Gleichgewichtszustand zu finden, extrem stark gepeakt ist, also die obige Argumentatiion bzgl. der Schärfe der Verteilung P0 (EA ) und die Darstellung in Abb. (2.6) berechtigt sind. γ f γ f Benutze dazu Gl. (2.14), also ΩA (EA ) = cA EAA A und ΩB (EB ) = cB EBB B . Betrachte den Ausdruck log P0 (EA ) = log ΩA (EA ) + log ΩB (E0 − EA ) − log Ω0 (E0 , EA ) völlig leeren Universums, aus dem also weder Materie noch Mikrowellenhintergrundstrahlung vom Schwarzen Loch absorbiert werden können, zerstrahlt dieses mit einer Lebensdauer von τ ≈ (M/M )3 × 1067 Jahren, was für supermassive Schwarze Löcher in den Zentren der Galaxien außerordentlich lang ist. Für eine ganz kleines Schwarzes Loch jedoch von etwa 1000 kg Masse und einem Schwarzschild-Radius von ≈ 10−24 m beträgt das τ ≈ 1 ns und die Luminosität ist etwa L ≈ 200Lsun . Bei all diesen Betrachtungen sollte man nicht vergessen, dass die Beschreibung dieser Phänomene eine konsistente Vereinigung von Gravitationstheorie und Quantenstatistik erfordern, die noch nicht erfolgt ist. 15 Bemerkung: Da z.B. log E eine Potenzreihe ist und E eine dimensionierte Größe, gilt der Ausdruck log E nur insofern, als dass E durch eine beliebige makroskopische Energieeinheit dividiert wird. Wenn wir diese Einheit ändern dann ändern wir nur die Konstante C.
32
2 Grundlagen der Statistischen Mechanik
und führe eine Taylor-Entwicklung durch
∂ log P0 (EA ) log P0 (EA ) = log P0 (EA ) + (EA − EA ) ∂ EA EA 2 1 ∂ + (EA − EA )2 log P0 (EA ) + . . . 2 ∂ EA2 EA
oder weil an E = EA gilt
∂ ∂ EA
log P0 (E0 , EA )|E = 0, und deshalb folgt A
(EA − EA )2 log P0 (E0 ) = log P0 (EA ) − + ... 2Δ2 EA mit
∂2 γA fA γB fB 1 =− log P0 (EA ) = 2 + 2 2 2 Δ EA ∂ EA EA EB EA γ fA
Für diese Gleichung benötigen wir die Annahme ΩA (EA ) = cA EAA
und die Nebenrechnung: ∂2 1 = − 2 [log ΩA (EA ) + log ΩB (E0 − EA )] 2 Δ EA ∂ EA EA ∂2 =− [γ f log E + γ f log(E − E )] B B 0 A A A A 2 ∂ EA EA ∂ −1 −1 γA fA EA + γB fB (−1)(E0 − EA ) =− ∂ EA EA =
γA f A γB f B + 2 ˜ EA (E0 − EA )2
In guter Näherung ergibt sich also:
(EA − EA )2 P0 (EA ) = P0 (EA ) exp − 2Δ2 EA
Die Breite dieser Gaußförmigen Verteilung schätzen wir ab, wozu wir die vereinfachende Annahme machen, dass γA = γB und fA = fB . Damit erhalten wir zu: ΔEA = (
γA fA γB fB − 1 EA 2 ≈ √ + ) γA f A EA2 EB2
oder mit γA = 1 und fA = 1024 : ΔEA 1 ≤√ ≈ 10−12 γ f EA A A
(2.41)
Damit ist die Behauptung bewiesen, dass das Maximum der Entropie, durch welches das Gleichgewicht gegeben ist, extrem scharf ist. Der zentrale Grenzwertsatz der Statistik in Kap. 9.2 wird dieses Resultat noch in einen allgemeinen begrifflichen Zusammenhang stellen.
2.6 Entropie, Temperatur, der zweite und dritte Hauptsatz
33
2.6.7 Der zweite Hauptsatz, Entropiezunahme 2.6.7.1 Abgeschlossene Systeme Nach allem, was in Kap. 2.6.4 zusammengefasst ist, kann man feststellen, dass für spontane16 Prozesse eines abgeschlossenen Systems der zweite Hauptsatz der Thermodynamik gilt: Der zweite Hauptsatz der Thermodynamik:
ΔS ≥ 0
(2.42)
oder differentiell Zweiter Hauptsatz:
dS ≥ 0
(2.43)
Weil die Entropie eine Zustandsgröße ist, hängt die Entropieänderung ΔS = Sb − Sa = S(Eb , x(b) ) − S(Ea , x(b) ) bei einem Prozess a → b nur von den Gleichgewichtszuständen a und b ab, nicht aber von der Art des Prozesses. Deshalb sind ΔS und dS für beliebige Prozesse definiert, aber häufig schwierig zu berechnen. Wir werden in Kap.2.7.1 sehen, dass bei quasistatischen Prozessen eine direkte Vorschrift besteht, die Entropieänderung zu berechnen: ΔS =
b ¯ dQqs a
T
In diesem Fall durchläuft das System dann eine Folge von Gleichgewichtszuständen, so dass T = T (E, x) im Integranden definiert ist. Beispiel: Betrachte ein System mit zwei Untersystemen A und B. Diese hätten die Energien EA und EB . Es seien E˜A und E˜ B die Energien von A und B, wenn das Gesamtsystem im Gleichgewicht ist. Bringt man die Untersysteme in thermischen Kontakt, dann werden spontan Wärmemengen QA und QB ausgetausscht, wodurch das Gesamtsystem das Gleichgewicht erreicht. Wir haben ΔEA = E˜A − EA = QA und ΔEB = E˜ B − EB = QB und, mit E0 als konstanter Gesamtenergie des Systems, gilt E0 = EA + EB = E˜ A + E˜B ⇒ QA = −QB . Beispiel mit der Annahme QA > 0: Wärme wird dem System A zugeführt. Natürlich nimmt TA zu, wir sehen dies aber auch aus dem Formalismus: ΔSA + ΔSB ≥ 0 und damit ΔSA = ∂∂ ESA ΔEA und ΔSB = ∂∂ ESBB ΔEB ΩA ∂ log ΩB ⇒ ∂ log ∂ EA ΔEA + ∂ EB ΔEB ≥ 0 ⇒ der Voraussetzung QA ≥ 0:
A
1 1 TA QA + TB QB
≥ 0 ⇒ ( T1A − T1B )QA ≥ 0 und somit wird wegen
1 1 1 1 − ≥0⇒ ≥ ⇒ TA ≤ TB TA TB TA TB Dies Resultat ist offensichtlich sinnvoll: System A ist das kältere System, dem die Wärmemenge QA vom wärmeren System B zugeführt wird. 16 Spontane
Prozesse in einem abgeschlossenen System sind alle diejenigen Prozesse, die stattfinden, nachdem man auf irgendeine Weise das System aus dem Gleichgewicht gebracht hat.
34
2 Grundlagen der Statistischen Mechanik
2.6.7.2 Offene Systeme Nach Gl. (2.32) und den Betrachtungen in Kap.2.6.4 hängt die Entropie direkt mit dem Grad der Ordnung des Systems zusammen. Wenn wir z.B. Wasser betrachten, so ist es in der festen Phase (Eis) kristallin geordnet und seine Entropie pro Mol ist geringer als in der Flüssigphase oder der Dampfphase. Ähnlich ist es bei biologischen Strukturen, die sich aus einem ungeordneten Zellhaufen zu hochgeordneten Lebewesen entwickeln. Solche Vorgänge sind nur dadurch möglich, dass die betrachteten Systeme nicht abgeschlossen sind, sondern Energiezufuhr bzw. Energieabfuhr und damit auch Entropieänderung erlauben. Deshalb können lokal (Zellwachstum, Zellspezifizierung etc.) Entropieerniedrigungen stattfinden, die an einer anderen Stelle (nukleare Brennvorgänge in der Sonne) durch Entropieerhöhungen ausgeglichen werden.
2.6.8 Der dritte Hauptsatz (Nernstsches Theorem) Es gilt S(E) = kB log Ω(E) Jedes System geht für E → 0 in den quantenmechanischen Grundzustand |EGS über. Dort gilt Der dritte Hauptsatz
Ω(EGS ) = 1 ⇒ SGS = 0
(2.44)
Das Verhalten eines normalen Systems wird nach Gl. (2.14) beschrieben durch Ω(E) = c(E − EGS )γ f . Daraus folgt 1 γf ∂S = = kB log c(E − EGS )γ f = kB → ∞ {für E → EGS } T ∂E E − EGS Ein System im Grundzustand hat also die Temperatur null. Dies ist die Aussage des dritten Hauptsatzes der Thermodynamik, genannt auch „Nernstsches Theorem”. Wir werden in Kap. 3.9.2.1 zeigen, dass man dem Zustand mit T = 0 für ein makroskopisches System durch physikalische Prozesse zwar beliebig nahe kommen, aber ihn nie erreichen kann.
2.6.9 Positive und negative Temperaturen Wir haben β = 1/kB T = ∂ log Ω(E)/∂ E. Für normale Substanzen gilt Gl. (2.14): Ω(E) = cE γ f . Die Energie ist nach unten beschränkt, monoton steigend und nach oben unbeschränkt. Daraus folgt 1/kB T > 0 oder T >0 Es gibt jedoch Systeme, deren Energie nach unten und oben beschränkt sind. Bei diesen kann man formal auch negative Temperaturen definieren. Betrachte ein System freier Spins an Atomen, die fest im Gitter sitzen. All diese sollen sich in einem äußeren B-Feld befinden, und man betreibe nur eine Statistik der Spin-Freiheitsgrade. Die Wechselwirkungsenergie ist −μ · B. Dann gibt es einen einzigen energetisch minimalen Makrozustand |Emin , in dem alle Spins parallel zu dem äußeren B-Feld ausgerichtet sind, und es gibt einen einzigen Makrozustand mit maximaler Energie |Emax , wo alle Spins dem B-Feld entgegengesetzt ausgerichtet sind.
2.6 Entropie, Temperatur, der zweite und dritte Hauptsatz
35
L
Q
S Abbildung 2.10: Wärmefluss Q von einem kleinem System (S) zu einem großem System (L), das ein Wärmereservoir darstellt.
Es gilt Ω(Emin ) = Ω(Emax ) = 1. Im Zwischenbereich Emin < E < Emax gibt es mehrere und ggf. sehr viele Makrozustäde, in denen einige Spins in B-Richtung und andere in Gegen-BRichtung ausgerichtet sind. Das bedeutet, dass Ω(E) an einem E = E˜ ein Maximum hat, und damit S(E) = kB log Ω(E) ebenfalls. Dadurch hat S(E) für E < E˜ eine positive Steigung und die Temperatur ist T > 0, während für E > E˜ das S(E) eine negative Steigung besitzt und damit dort ˜ und die Temperatur T < 0 ist. Man kann zeigen, dass bei solchen Systemen β = 0 ist an E = E, ˜ und β = 0− bzw. T → −∞ bei E E. ˜ zwar β = 0+ bzw. T → +∞ bei E E,
2.6.10 Wärmereservoir Die thermale Wechselwirkung zwischen zwei Systemen ist besonders einfach, wenn eines sehr viel größer ist als das andere, und zwar so groß, dass Wärmemengen, die z.B. vom kleineren System an das größere abgegeben werden, die Temperatur des größeren Systems nicht ändern. Dann heißt das größere System Wärmereservoir oder Wärmebad, siehe Abb. (2.10). Es ergibt sich durch den Wärmefluss jedoch eine Entropieänderung des Wärmereservoirs. Man kann sie berechnen, z.B durch kleine Wärmezufuhr ΔQ ans größere (L) System. Dann gilt: 1 ΔSL = log ΩL (EL + ΔQ) − log ΩL (EL ) kB 1 ∂ 2 log ΩL ∂ log ΩL (E) 2 ΔQ + ) = ( (ΔQ) + ... 2 ∂E 2 ∂ E EL EL 1 ∂ βL (ΔQ)2 + ... = βL ΔQ + 2 ∂ E EL
=Null
Es gilt
∂ βL ∂E
= 0, weil sich definitionsgemäß im Wärmereservoir die Temperatur nicht ändert bei
36
2 Grundlagen der Statistischen Mechanik
L Zu- bzw. Abfuhr kleiner Wärmemengen. Daraus folgt: ⇒ ΔSL = kB β ΔQL = ΔQ TL . Oder differentiell für das Wärmebad (wir lassen Index L weg): ¯ dQ (2.45) Wärmereservoir dS = T Hierbei ist dS ein vollständiges Differential, weil Ω und damit S = kB log Ω nur vom Zustand ¯ ist ein unvollständiges Differential, weil es vom Prodes Wärmereservoirs abhängt. Aber dQ zess abhängt. Offenbar tritt hier die Temperatur T des Wärmereservoirs (die ja konstant ist) als integrierender Faktor auf. Wenn wir ein System im Gleichgewicht haben, dem keinerlei Wärme zugeführt wird, also ¯ = 0 ist, dann ändert sich nicht seine Temperatur und es reagiert wie ein Wärmereservoir. dQ Also gilt für ein solches Systeme
Gleichgewicht:
¯ =0 dS = 0 wenn dQ
(2.46)
2.7 Quasistatische Prozesse: Entropieänderung, generalisierte Kräfte ¯ = T dS 2.7.1 Quasistatisch: dQ Wir betrachten in diesem Kapitel quasistatische Prozesse, bei denen definitionsgemäß das System eine Folge von Gleichgewichtszuständen durchläuft, siehe Genaueres in Kap. 2.5.1. Wir wollen untersuchen, wie sich die Entropie des Systems bei einem solchen Prozess ändert, und ¯ = T dS geführt, die einen Zusammenhang zwischen Wärwerden zu der wichtigen Beziehung dQ mezufuhr bzw. -abfuhr und Änderung der Entropie herstellt. Das ist allgemein wichtig und wird auch einen Messprozess für die Entropie abgeben. Zur Ableitung dieser Beziehung betrachte ein mikrokanonisches System, definiert durch die Energie E = E¯ und durch äußere Zwangsbedingungen x = (x1 , ..., xn ), und studiere die generalisierten Kräfte. Es sei sei Ω = Ω(E, x) bekannt und damit auch S = S(E, x). Der Zustand des System werde quasistatisch geändert: E → E + dE
xα → xα + dxα
α = 1, 2, ..., n
woraus für die Entropie folgt bis einschließlich 1. Ordnung in dxα und dE (Mischterme sind von 2. Ordnung) dS = kB d log Ω = (
∂S ∂S )E dxα )x dE + ∑( ∂E ∂ xα α
(2.47)
Wir schreiben die einzelnen Terme geeignet um. Der erste Term auf der RHS ist gleich dE/T . Der zweite Term hängt mit der mechanischen Arbeit zusammen: Wir hatten bereits die mikroskopische Definition der generalisierten Kraft Gl. (2.23) kennen gelernt. Wir werden jetzt beweisen, dass dieselbe generalisierte Kraft auch äquivalent makroskopisch definiert werden kann und dann den zweiten Term ergibt. Die Behauptung ist: generalisierte Kraft (makroskop. Def):
X¯α = T
∂S ∂ xα
(2.48) E,x
2.7 Quasistatische Prozesse: Entropieänderung, generalisierte Kräfte
37
also als Ableitung der Entropie nach einem äußeren Parameter xα , wobei bei der Ableitung die Energie und die anderen äußeren Parameter festgehalten werden. Der Beweis verwendet nur die ¯ = 0 auch dS = 0 gilt, i.e. Gl. (2.46), Tatsache, dass bei einem System im Gleichgewicht mit dQ und es wird die Jacobi-Identität (3.47) verwendet mit der „Übersetzung” x → S, y → E, z → xα . Daraus folgt ∂S ∂E ∂ xα = −1 ∂ E xα ∂ xα S ∂ S E oder 1 T
∂E ∂ xα
oder X¯α = −
∂S =− ∂ xα S
∂E ∂ xα
=T S
E
∂S ∂ xα
(2.49) E
q.e.d. Dies verwenden wir und erhalten aus Gl. (2.47) dS =
1 1 dE + T T
∑ X¯α dxa α
¯ = − ∑ X¯α dxα aus Gl. (2.24) sofort und daraus mit dW dS =
1 ¯ ) (dE − dW T
oder ¯ dE = T dS + dW ¯ + dW ¯ ergibt für den quasistatischen Prozess dQ ¯ = Vergleich mit dem ersten Hauptsatz dE = dQ T dS oder den gesuchten Zusammenhang zwischen Wärme und Entropie: ¯ dQ quasistatisch: dS = (2.50) T Dies ist eine wichtige Formel für alle quasistatischen Prozesse. Zweck dieser Überlegungen ist: • Wir erhalten einen Messprozess für Entropie: Entropieänderung durch quasistatische Wärmezufuhr bei definierter Temperatur. ¯ = 0) die äußeren Parameter x = • Wenn bei einem thermisch isolierten System (d.h. dQ (x1 , ..., xn ) quasistatisch geändert werden, bleibt die Entropie konstant (dS = 0). Mit S = kB log Ω folgt, dass Ω = exp kSB unverändert ist, womit sich der Prozess als reversibel erweist. Wie wir schon bei der Ableitung von Gl. (2.49) verwendet haben, können wir jetzt auch einen etwas anderen mikroskopischen Ausdruck für die generalisierte Kraft Gl. (2.23) schreiben, weil ¯ = 0 äquivalent ist zu dS = 0, woraus wir erhalten bei einem quasistatischen Prozess dQ ∂ E¯ ¯ generalisierte Kraft: Xα = − (2.51) ∂ xα S
38
2 Grundlagen der Statistischen Mechanik
2.7.2 Allgemeine Gleichgewichtsbedingungen Zurück zum Gleichgewicht eines abgeschlossenen Systems und der Wechselwirkung zwischen zwei Untersystemen: Bisher hatten wir nur reinen Wärmeaustausch, jetzt betrachten wir den allgemeinen Fall, bei dem sich auch die äußeren Parameter der Untersysteme ändern, was zu weiteren Gleichgewichtsbedingungen führt: Die Entropie des Gesamtsystems ist gegeben durch S = kB log Ω. In den Bezeichnungen von Kap.(2.6.3) haben wir S(E0 , x0 ; EA , xA ) = SA (EA , xA ) + SB (EB , xB ) und ∂ SA ∂ SA dS(E0 , x0 ; EA , xA ) = dEA + ∑ dxAα ∂ E A xA ∂ xAα EA α ∂ SB ∂ SB + dEB + ∑ dxBα ∂ EB xB ∂ xBα EB α
Bei der Einstellung des Gleichgewichts strebt die Gesamtentropie zum Maximum: S = SA + SB →Maximum, also im Gleichgewicht dS = 0 . Wir haben dEA = −dEB und man kann immer die äußeren Parameter so wählen, dass dxAα = −dxBα . Damit erhalten wir ∂ SA ∂ SA ∂ SB ∂ SB dS = 0 = − dEA + ∑ − dxAα ∂ EA ∂ EB x ∂ xAα ∂ xBα E α Wir wissen von früher und wegen der Identifizierung von mikroskopischer und makroskopischer generalisierter Arbeit, i.e. Gl. (2.34) und Gl. (2.48): ∂S ∂S 1 1 und = = X¯α ∂E x T ∂ xα E T Dann muss also gelten als Bedingung für Gleichgewicht 1 ¯ 1 1 1 XAα − X¯Bα dS = 0 = − dEA + ∑ dxAα TA TB x TA TB α E
(2.52)
woraus folgt bei reinem Wärmeaustausch 1 1 = TA TB
(2.53)
und im Gleichgewicht bei reinem mechanischen Austausch (d.h. Änderung der äußeren Parameter) 1 ¯ 1 XAα = X¯Bα (2.54) TA TB und das führt dann zu den allgemeinen Gleichgewichtsbedingungen zwischen zwei Untersystemen eines abgeschlossenen Obersystems bei mechanischem (xα ) und gleichzeitigem Wärmeaus¯ : tausch (dQ) TA = TB und X¯Aα = X¯Bα (2.55)
2.7 Quasistatische Prozesse: Entropieänderung, generalisierte Kräfte
A
39
B Q
Abbildung 2.11: Abgeschlossenes System mit zwei Untersystemen A und B zwischen denen eine wärmedurchlässige und bewegliche Wand vorliegt.
2.7.3 Beispiele 2.7.3.1 Beispiel 1: Temperatur- und Druck-Ausgleich Betrachte ein abgeschlossenes System mit zwei Untersystemen A und B, zwischen denen eine wärmedurchlässige und bewegliche Wand angebracht sei, siehe Abb. (2.11). Gesucht sind die Gleichgewichtsbedingungen. Es gilt offenbar E0 = EA + EB und V0 = VA +VB und damit dEB = −dEA und dVB = −dVA : Daraus folgt dann für dS: ∂ SA ∂ SB ∂ SB ∂ SA dS = 0 = dEA + dVA − − ∂ EA VA ∂ EB VB ∂VA EA ∂VB EB Da diese Gleichung für alle Änderungen gelten soll, haben wir mit der Definition der Temperatur aus Gl. (2.34) und der Definition des Drucks als generalisierte Kraft bzgl. Volumenänderung ∂S ∂S 1 1 und (2.56) = = P ∂E V T ∂V E T die Gleichgewichtsbedingung: dS = 0 =
1 1 − TA TB
dEA +
PA PB − TA TB
dVA
Bei reinem Temperaturausgleich (dEA = 0, dVA = 0) gilt TA = TB und bei reinem Volumenausgleich (dEA = 0, dVA = 0) haben wir PA PA = TA TA und wenn Temperatur- und Volumenausgleich vorliegt (dEA = 0, dVA = 0) folgt TA = TB und PA = PB , was anschaulich verständlich ist.
40
2 Grundlagen der Statistischen Mechanik
A
B
Abbildung 2.12: Gasgefülltes Volumen A (mit adiabatischen Wänden) in Wechselwirkung mit einem äußeren mechanischen System (Feder B). Das Gesamtsystem ist abgeschlossen.
2.7.3.2 Beispiel 2: Druck und Federkraft Wir studieren ein besonders einfaches System, bei dem ein mit adiabatischen Wänden versehenes gasgefülltes Volumen A mit einem mechanischen System B wechselwirkt, das nur einen Freiheitsgrad hat, siehe Abb. (2.12). Betrachte also im Detail ein abgeschlossenes Gesamtsystem mit seinem Untersystem A, nämlich einem endlichen Volumen mit einem beweglichen Kolben. Der ist mit einer Feder verbunden und stellt das System B dar. Die Ruhestellung der Feder ist bei x = L. Wir nehmen an, dass EB (x) = 12 k(x − L)2 . Das System B hat nur einen Freiheitsgrad, also ist die Anzahl seiner möglichen Zustände ΩB (x) = 1. Die totale Energie ist konstant, weil wir das Gesamtsystem als abgeschlossen vorausgesetzt haben: E0 = EA (x) + EB (x). Für die totale Entropie gilt: S0 = kB log Ω0 = kB log ΩA + kB log ΩB = SA , denn kB log ΩB = 0. Die Frage ist, bei welcher Stellung des Kolbens (i.e. bei welchem x) das System im Gleichgewicht ist. Es gilt im Gleichgewicht: dSA (EA , x) = 0 ∂ SA ∂ SA dEA + dx = 0 ⇒ ∂ EA x ∂ x EA ∂ SA ∂ SA ∂ EA + =0 ⇒ ∂ EA x ∂ x S ∂ x EA
Dies ergibt mit
∂S ∂x
= T1 X¯ und wegen der Erhaltung der Gesamtenergie die Gleichung
1 ∂ EB 1 ) + X¯A = 0 (− TA ∂x TA und damit führt das zur Gleichgewichtsbedingung ∂ EB ¯ XA = ∂x S Das bedeutet: Die mittlere Kraft X¯A , die vom System A wegen der statistisch erfolgenden Stöße der Moleküle gegen den Kolben auf diesen ausgeübt wird, ist gleich der Kraft ∂∂ExB , die von der
2.7 Quasistatische Prozesse: Entropieänderung, generalisierte Kräfte
A
41
B Q N
Abbildung 2.13: Abgeschlossenes System mit zwei Untersystemen A und B, zwischen denen sich eine bewegliche Wand befindet, die Wärme und Teilchen durchlässt.
Feder auf den Kolben ausgeübt wird. Wenn wir quasistatisch dafür sorgen, dass ∂∂ExB < X¯A , dann dehnt sich das Gas im System A aus und presst die Feder des Systems B zusammen. Weil keine Wärmeübertragung stattfindet, ist diese Ausdehnung reversibel: Die bei der Expansion geleistete Arbeit wird in der Feder gespeichert und man kann sie später dem System A wieder zuführen. 2.7.3.3 Beispiel 3: Erster Hauptsatz mit chemischem Potenzial Weil es sich anbietet machen wir jetzt einen kleinen Vorgriff auf Prozesse, bei denen auch Teilchen ausgetauscht werden können: Sei X¯ die generalisierte Kraft bzgl. der mittleren Teilchenzahl, so nennt man diese (bis auf Vorzeichen) üblicherweise das chemische Potenzial μ: ∂ E¯ ∂S =− X¯ = T = −μ ∂ N E,x ∂N Betrachte ein System bestehend aus zwei Untersystemen, bei denen Wärmefluss, Druckausgleich und Teilchenfluss erlaubt sind, siehe Abb. (2.13). Wir haben hier wieder dS = dSA + dSB . Für jedes der beiden Systeme ergibt sich die Änderung der Entropie quasistatisch als dS =
1 (dE + PdV − μdN) T
und damit ergibt sich generell die Energieänderung als etwas allgemeinere Form des ersten Hauptsatzes bei quasistatischen Prozessen: dE = T dS − PdV + μdN
(2.57)
Analog zu Gl. (2.52) erhalten wir die Gleichgewichtsbedingung 1 μA μB 1 1 ¯ 1 ¯ dS = 0 = XA − XB − dEA + ∑ dxAα − − dNA (2.58) TA TB x,N TA α TB α E,N TA TB E,x α Allgemein gilt damit im Gleichgewicht bei Wärmefluss, Druckausgleich und Teilchenfluss: TA = TB
PA = PB
μA = μB
42
2 Grundlagen der Statistischen Mechanik
und wenn z.B. nur Druckausgleich und Teilchenfluss erlaubt ist PB μA μB PA = und = TA TB TA TB
2.8 Mikrokanonisches Ensemble: Zusammenfassung N
1. Wir haben einen Hamiltonoperator H0 = ∑ H0 (ri , x) mit den Teilchenkoordinaten ri und i=1
2. 3. 4.
5.
6. 7. 8. 9.
den äußeren Bedingungen charakterisiert durch die Parameter x = (x1 , x2 ...). Die stationären Einteilchenzustände des Hamiltonoperators sind gegeben durch H0 (ri , x)φν (ri , x) = εν (x)φν (ri , x) und φν (ri , x) = Aus den Einteilchenzuständen konstruiert man bei gegebenem x den stationären N-Teilchenzustand (Mikrozustand) |r, x > mit H0 (x)|r, x) >= Er (x)|r, x >. Aus einer großen Zahl M von Mikrozuständen |r > mit r = 1...M bildet man ein mikrokanonisches Ensemble (Makrozustand) {Pr } = (P1 , P2 , ...), welches ein abgeschlossenes System beschreibt. Dabei ist jeder Mikrozustand |r > besetzt mit der Besetzungszahl (Besetzungswarscheinlichkeit) Pr . Im Gleichgewicht wird das mikrokanonische Ensemble beschrieben durch: Pr1 = Pr2 = ... für die zulässigen Zustände |r >, definiert durch Er ∈ [E − δ E, E], und Pr = 0 sonst (unzulässig). Hierbei ist δ E klein, aber makroskopisch, also etwa δ E/E 10−5 . Es gilt E¯ = E. Man definiert die Zustandssumme Ω(E, x) = ∑r δr , wobei δr = 1 für alle zulässigen Zustände r ist und δr = 0 für alle unzulässigen. Man definiert die Entropie S(E, x) = kB log Ω(E, x). Im Gleichgewicht gilt, dass S(E, x) maximal ist und Ω = exp [S/kB ] und Pr = 1/Ω für die zulässigen Mikrozustände. Man definiert die Temperatur T=
∂ S(E, x) ∂E
−1 x
10. Man definiert für jeden äußeren Freiheitsgrad xα die verallgemeinerte Kraft ¯ ∂ S(E, x) ∂ E(x) identisch mit X¯α (E, x) = − X¯α (E, x) = T ∂ xα ∂ xα S,x E,x 11. Es gelten die drei Hauptsätze: ¯ + dW ¯ dE = dQ spontaner Prozess: dS ≥ 0
quasistatischer Prozess: dS =
¯ dQ T
lim S(T ) = 0
T →0
¯ und dW ¯ unvollständige Differentiale und dE ist ein vollständiges. Der Hierbei sind dQ dritte Hauptsatz wird bekanntlich auch Nernstsches Theorem genannt.
3 Grundlagen der Thermodynamik Bisher haben wir in diesem Text Statistische Mechanik des mikrokanonischen Ensembles betrieben, aus der wir dann die thermodynamischen Gesetze hergeleitet haben. Historisch gesehen war die Thermodynamik zeitlich vor der Statistischen Mechanik, weshalb sie keine mikroskopischen Größen (z.B. die Teilchenzahl N) kennt. Für das Verständnis der Thermodynamik sind die Kenntnisse der Statistischen Mechnik, die wir bisher betrachtet haben, extrem hilfreich, aber nicht notwendig: Thermodynamik als solche kann man ganz durch Postulate zwischen makroskopisch definierten Größen formulieren. Der Zusammenhang dieser Größen, die alle phänomenologisch definiert sind, ist Gegenstand dieses Kapitels1 .
3.1 Postulate der klassischen Thermodynamik Im Einzelnen ist die Thermodynamik vollständig durch die folgenden Postulate [Hua87] definiert, die uns mit den Kenntnissen der Statistischen Mechanik alle bekannt vorkommen: • Ein thermodynamisches System ist jedes makroskopische System. • Thermodynamische Zustandsgrößen sind die messbaren makroskopischen Größen eines Systems, wie der Druck P, das Volumen V , die Temperatur T , etc. Sie werden experimentell bestimmt. • Ein thermodynamischer Zustand wird durch einen Satz von Werten aller thermodynamischen Zustandsgrößen festgelegt, die für die Beschreibung des Systems notwendig sind. • Im Gleichgewicht sind die thermodynamischen Zustandsgrößen zeitlich konstant. • Unter einer Zustandsgleichung versteht man einen funktionalen Zusammenhang zwischen den Zustandsgrößen im Gleichgewicht, wie z.B.2 f (P, T,V ) = 0 Durch die Zustandsgleichung wird die Zahl der unabhängigen Parameter um eins reduziert. Die Funktion f wird als Bestandteil der Spezifikation des Systems angesehen. Es ist üblich, den Zustand eines solchen Systems durch einen Punkt im dreidimensionalen P,V, T -Raum zu kennzeichnen. Die Zustandsgleichung definiert dann eine Hyperfläche in diesem Raum. Jeder Punkt auf dieser Hyperfläche stellt einen Gleichgewichtszustand dar, weil die Zustandsgleichung nur im Gleichgewicht gilt. In der Thermodynamik versteht Zustandsgleichung des idealen Gases für 1 Mol schreibt sich dann nicht PV = NkB T sondern PV = RT , wobei R die Rydberg-Gaskonstante ist mit R = 8.31 × 107 erg mol−1 K−1 = 8.31 · 103 Joule kmol−1 K−1 . Genauer lautet die Zustandsgleichung des idealen Gases PV = nRT , wobei n die Anzahl der Mole ist. Es gilt: 1 Mol ist die Stoffmenge, die = 6.022 ∗ 1023 Teilchen enthält, also gleich der Loschmidtschen bzw. Avogadroschen Zahl. Thermodynamisch ist 1 Mol definiert als die Stoffmenge, die aus genauso viel Einzelteilchen besteht, wie 12 Gramm des KohlenstoffIsotops 12C enthalten. In diesem Buch werden wir fast immer mit n = 1 arbeiten. 2 Z.B. beim idealen Gas PV = RT . 1 Die
K. Goeke, Statistik und Thermodynamik, DOI 10.1007/ 978-3-8348-9748-0_3, © Vieweg+Teubner Verlag |Springer Fachmedien Wiesbaden GmbH 2010
44
3 Grundlagen der Thermodynamik
•
•
•
•
man, wenn nicht anders gesagt, unter einem Zustand automatisch einen Gleichgewichtszustand. Den Übergang von einem thermodynamischen Zustand in einen anderen bezeichnet man als thermodynamische Zustandsänderung. Wenn der Anfangszustad ein Gleichgewichtszustand ist, kann eine Zustandsänderung nur durch Änderung der äußeren Bedingungen, denen das System unterworfen ist, hervorgerufen werden. Die Zustandsänderung ist quasistatisch, wenn die äußeren Bedigungen sich so langsam ändern, dass das System immer näherungsweise im Gleichgewicht ist. Die Zustandsänderung ist reversibel, wenn einer zeitlichen Umkehr der Änderung der äußeren Parameter eine zeitliche Umkehr der Folge von Zuständen entspricht. Eine reversible Zustandsänderung ist quasistatisch. Meistens gilt auch das Umgekehrte3 . Das P,V -Diagramm eines Systems ist die Projektion der Zustandsfläche auf die P,V Ebene. Jeder Punkt stellt einen Gleichgewichtszustand dar. Eine reversible Zustandsänderung ist eine stetige Kurve im P,V -Diagramm. Reversible Zustandsänderungen bestimmter Typen ergeben Kurven mit besonderen Namen: Isothermen (Temperatur = konstant), Adiabate (keine Zufuhr oder Abfuhr von Wärme), Isentrope (Druck = konstant). Eine nichtreversible Zustandsänderung kann im P,V -Diagramm nicht dargestellt werden. ¯ die Der Begriff der Arbeit wird aus der Mechanik übernommen. Z.B. ist die Arbeit dA, vom System mit den Zustandsgrößen P,V, T bei einer infinitesimalen Zustandsänderung ¯ = PdV . Wir definieren unter Vergrößerung des Volumens um dV geleistet wird, gleich dA ¯ die Arbeit, die dem System von außen zugeführt wird, und dann ist bei Volumenmit dW ¯ = −PdV . vergrößerung dW ¯ Wärme dQ wird von einem homogenen endlichen System aufgenommen bzw. von außen ¯ > 0), wenn sich seine Temperatur erhöht, ohne dass das System dem System zugeführt (dQ Arbeit leistet. Man definiert Wärmekapazität C durch ¯ = CdT dQ
(3.1)
Die Wärmekapazität, oder auch spezifische Wärme genannt, hängt von der speziellen Natur des Systems ab und wird als Teil der Spezifikation des Systems vorgegeben. Für verschiedene Arten der Erwärmung (z.B. CV bei konstantem Volumen oder CP bei konstantem Druck) und auch für verschiedene Zustände des Systems, bei denen die Erwärmung vorgenommen wird (z.B. bei verschiedenen Temperaturen), nimmt C im Allgemeinen verschiedene Werte an. Also hängt die Wärmekapazität von der Art der Erwärmung ab und an welchem Zustand die Erwärmung vorgenommen wird. • Ein Wärmereservoir ist ein System, das so groß ist, dass jede Zufuhr oder Entnahme einer endlichen Wärmemenge seine Temperatur nicht ändert. • Ein System heißt thermisch isoliert, wenn keine Wärmeübertragung zwischen ihm und der Außenwelt stattfindet. Eine Zustandsänderung, die ein solches System erfährt, heißt adiabatisch. 3 Die
Umkehrung gilt in Einzelfällen nicht, d. h., es ist nicht jede quasistatische Zustandsänderung reversibel. Zum Beispiel ist eine quasistatische Volumenvergrößerung bei einem Gas, wobei keine Arbeit geleistet wird und so keine Arbeit in einer Feder gespeichert wird, also wenn sich das Volumen nach und nach infinitesimal ausdehnt, keine reversible Zustandsänderung.
3.2 Makroskopische Größen und ihre Messung
45
• Es gibt eine Zustandsgröße S, die Entropie, deren Differenz zwischen zwei Gleichgewichtszuständen A und B definiert ist als S(B) − S(A) =
B
=
dS A
rev
B A
¯ dQ T rev
(3.2)
wobei der Integrationsweg irgendein reversibler (quasistatischer) Weg zwischen A und B ist. • Es gibt extensive und intensive Zustandsgrößen. Man kann sie deutlich unterscheiden, wenn man das betrachtete System beliebig in zwei Untersysteme A und B zerteilt. Dann gilt für eine Zustandsgröße f : extensiv:
f = fA + fB
intensiv:
f = f A = fB
Extensive Größen4 sind z.B. Energie und die Entropie. Intensive Größen sind z.B. Temperatur und Druck. • Es gelten die drei thermodynamischen Hauptsätze: ¯ + dW ¯ dE = dQ ¯ dQ abgeschl: dS ≥ 0 quasistatisch: dS = T lim S(T ) = 0 T →0
(3.3) (3.4) (3.5)
¯ und dW ¯ unvollständige Differentiale. Hierbei ist dE ein vollständiges und dQ
3.2 Makroskopische Größen und ihre Messung In diesem Kapitel diskutieren wir qualitativ, wie die Energie, Temperatur, Entropie etc. durch makroskopische Messungen festgelegt werden können, die sich auf bekannte mechanische oder elektrische Größen stützen. Das Kapitel ist nicht praxisorientiert, sondern eher prinzipiell, um zu zeigen, dass die thermodynamischen Postulate in sich konsistent sind.
3.2.1 Innere Energie ¯ die vom SysBei einer beliebigen infinitesimalen thermodynamischen Zustandsänderung sei dQ ¯ tem aufgenommene Wärmemenge und dW die dem System zugeführte Arbeit. Der erste Hauptsatz der Thermodynamik Gl. (3.3) besagt, dass die Größe dE , definiert durch ¯ + dW ¯ dE = dQ 4 Aus
dem Blickwinkel der Statistischen Mechanik gesehen sind extensive Größen proportional zur Teilchenzahl N und intensive Größen sind dies nicht.
46
3 Grundlagen der Thermodynamik
P a b
Arbeit
el. Arbeit c
0
V
Abbildung 3.1: Schematische Darstellung der Messung der inneren Energie eines Systems durch zwei aufeinander folgende Prozesse, die dem System von außen kontrollierbar Energie zuführen: Mechanische Arbeit a → b und elektrische Arbeit c → b, die das System als Wärme aufnimmt.
gleich ist für alle Zustandsänderungen zwischen einem gegebenen Anfangs- und Endzustand, was bedeutet, dass dE ein vollständiges Differential ist. Damit wird unmittelbar eine Zustandsgröße E definiert, die in der klassischen Thermodynamik innere Energie5 genannt wird. Zur Messung der Änderung der inneren Energie betrachte z.B. ein Gas und zwei gegebene Zustände a und b, isoliere das System thermisch. Führe, falls nötig, einen geeigneten Zwischenzustand c ein, der so geartet ist, dass die Prozesse a → c und c → b jeweils kontrolliert und quasistatisch ablaufen, so dass die Energiezufuhr bzw. -abfuhr des Systems gemessen werden kann. Zum Beispiel siehe Abb. (3.1). Prozess a → c: Erhöhe das Volumen quasistatisch (z.B. durch quasistatisches Freilassen des Kolbens), messe bei jedem Wert von V den Druck, erhalte damit P(V ), integriere dann und berechne die mechanische Arbeit, die das System leistet. Weil P > 0 und dV > 0, ist das Integral PdV > 0. Weil das Gas bei der Expansion an einer am Kolben befestigten Feder Arbeit verrich tet6 , gilt beim Prozess a → c für die Arbeit ΔW = − ac PdV . Weil das System thermisch isoliert ist, gilt ΔQ = 0 und ΔEca = Ec − Ea = ΔW . Prozess c → b: Erhöhe den Druck quasistatisch z.B durch kontrollierte Heizung z.B. mit einer Stromwendel, die in das Gas eingeführt wurde7 , und durch die s Sekunden lang ein Strom I geschickt wird bei einer Spannung U. Hierbei soll der Kolben festgeklemmt sein und sich nicht bewegen können, weshalb für den Prozess c → b gilt ΔW = 0 und ΔEbc = Eb − Ec = ΔQ mit ΔQ = sIU. Prozess a → b : Für den Gesamtprozess gilt ΔE = Eb − Ea = ΔW + ΔQ, wobei ΔW und ΔQ und damit die gesamte Energiezufuhr ΔE messbar sind. ist mit der gleichen Größe E = E¯ eines mikrokanonischen Systems identisch. ¯ > 0, wenn am Gas von außen Arbeit verrichtet wird. Unsere Vorzeichenregelung ist so, dass dW 7 Dieser Prozess widerspricht nicht der thermischen Isolierung des Systems, weil in kontrollierter Weise die Wärme zugeführt wird. Wir hätten auch mechanisch die Wärme durch ein Schaufelrad einführen können, das dann im Gas Reibungswärme erzeugt. Bei einem thermisch nicht isolierten System kann Wärme durch die Wände des Systems ein- bzw. austreten, ohne dass man die Menge kontrollieren kann. 5 Sie
6 Achtung:
3.2 Makroskopische Größen und ihre Messung
47
Abbildung 3.2: System bestehend aus einem thermisch isolierten gasgefülltem Volumen mit beweglichem Kolben, der fest mit einer Feder verbunden ist. Das Gas leistet Arbeit an der Feder, wenn es den Kolben nach rechts drückt. Wärme wird nicht ausgetauscht.
3.2.2 Wärme Übertragene Wärme ΔQ kann auf mehrere Arten gemessen werden. Z. B: a) Durch Messung der Differenz der inneren Energien des Anfangs- und Endzustandes (siehe Kap. 3.2.1) und Messung mechanischer Arbeit, siehe Abb. (3.2): Für einen beliebigen Prozess gilt: ΔQ
=
ΔE
messbar siehe Kap.3.2.1
−
ΔW
messbar da mechanisch
b) Durch Messung der Mischungstemperatur: Bringe das System A, dessen Wärmezufuhr gemessen werden soll, in rein thermalen Kontakt mit einem bekannten Bezugssystem B, ohne dass irgendwelche externe Parameter verändert werden.
A
B
A
B Q
Abbildung 3.3: Zwei voneinander unabhängige Systeme verschiedener Temperaturen werden in Kontakt gebracht, wobei Wärmeaustausch möglich ist. Das Gesamtsystem ist abgeschlossen.
Dann gilt ΔW = 0 und damit auch ΔEA = ΔQA . Ferner gilt selbstverständlich ΔQA = −ΔQB . Vorgriff auf später: Wenn wir z.B. die Temperaturänderung vom System B messen und die spezifische Wärme des Systems entlang des entsprechenden Prozesses kennen (also z.B. bei festgehaltenem Volumen von B seine spezifische Wärme CV ), kann man sofort die übertragene Wärmemenge ΔQB bestimmen.
48
3 Grundlagen der Thermodynamik
3.2.3 Verallgemeinerte Kräfte Die äußeren Parameter eines Systems x = (x1 , x2 , ....) sind makroskopische Messgrößen wie z.B. Volumenkoordinaten, Gestalt des Gesamtvolumens, äußere Felder etc. Wenn der i-te Parameter quasistatisch geändert wird, wird am System die Arbeit ¯ = −X¯i dxi dW geleistet, wobei alle anderen äußeren Parameter unverändert bleiben. Wenn wir weiterhin voraus¯ = dW . Wir wissen, wie man setzen, dass das System thermisch isoliert ist, dann gilt dE = dW die resultierende Änderung der inneren Energie messen kann (siehe Kap.3.2.1), das bedeutet, ¯ messen kann, wodurch die generalisierte Kraft bestimmt ist dass man damit auch dW dE X¯i = − dxi Ist der äußere Parameter z.B. das Volumen V , dann ist die generalisierte Kraft der Druck P P=−
dE dV
(3.6)
3.2.4 Temperatur Die Messung der Temperatur-Differenz zweier Körper A und B geschieht mit Hilfe eines Probekörpers mit kleinem Volumen v, der mit idealem Gas gefüllt ist und dessen Zustandsgleichung wir kennen: pv = nRT , wobei n durch die Anzahl der Mole (natürlich n < 1) gegeben ist. Das Volumen v soll so klein sein, dass eine Temperaturänderung des Probekörpers bei Kontakt mit den Körpern A und B dort keine Temperaturänderung hervorruft. Dann lässt sich Temperaturmessung z.B. vom Körper A auf die Messung von Drücken zurückführen: Dazu bringt man den Probekörper in Kontakt mit dem Körper A, dessen Temperatur zu bestimmen ist. Nachdem der Probekörper die Temperatur TA angenommen hat (ohne dass sich die Temperatur des Körpers A geändert hat, weil er so groß ist, dass er für den Probekörper wie ein Wärmereservoir ist), bringt man ihn in Wärmekontakt mit dem Körper B, dessen Temperatur TB bekannt sein soll. Dadurch ergibt sich im Probekörper eine Druckänderung, die wir mit bekannten mechanischen Methoden direkt messen können. Mit Hilfe der Zustandsgleichung des idealen Gases für die Füllung des kleinen Probekörpers, i.e. pv = nRT , lässt sich aus der Druckänderung im Probekörper das Temperaturverhältnis bestimmen: pA TA = TB pB
3.2.5 Spezifische Wärme, Wärmekapazität Betrachte ein System mit der Zwangsbedingung y, das kann eine innere oder äußere sein, also ¯ zu, z.B. das Volumen oder auch die Temperatur. Füge diesem System eine Wärmemenge dQ wobei y festgehalten wird. Als Wärmekapazität definiert man dann (
¯ dQ )y=const = Cy dT
3.2 Makroskopische Größen und ihre Messung
49
Als spezifische Wärme bezeichnet man die Wärmekapazität pro Masse oder Stoffmenge, im Allgemeinen pro Mol.
Abbildung 3.4: Links: Erhitzung eines wärmeisolierten Systems bei festgehaltenem Kolben, also unter Erhaltung des Volumens. Rechts: Erhitzung bei freigelassenem Kolben, also festgehaltenem Druck (des Labors).
Beispiel: Erhitzen eines Gasbehälters. Man erhitze nach Abb. (3.4) ein mit Gas gefülltes und wärmeisoliertes Gefäß auf zwei verschiedene Arten, wobei jeweils die gleiche Wärme ΔQ zugeführt wird. Im Fall 1 (linkes Bild von Abb. (3.4) wird das Volumen konstant gehalten, weil der Kolben festgeklemmt ist. Dann dient die Wärmezufuhr direkt der Erhöhung der inneren Energie ¯ dEV = dQ weil hier keine Arbeit verrichtet wird. Im Fall 2 (konstanter Druck) gilt: ¯ + dW ¯ dEP = dQ ¯ − |dW ¯ |. Die zugeführte ¯ < 0, weil sich das Volumen ausdehnt, also dE p = dQ Hierbei ist dW Wärme erhöht also nicht nur die innere Energie und damit die Temperatur des Systems, sondern verrichtet auch noch die Arbeit gegen den Außendruck. Also gilt: dEP < dEV
oder dTP < dTV
und die Temperaturerhöhung ΔT ist bei konstantem Druck kleiner als bei konstantem Volumen. Also gilt ¯ ¯ dQ dQ dTP = < dTV = CP CV
50
3 Grundlagen der Thermodynamik
oder CP > CV Es ist also effektiver, eine Substanz bei konstanten Volumen zu erhitzen als bei konstantem Druck.
3.2.6 Entropie Definitionsgemäß bestimmt man die Entropieänderung ΔS zwischen zwei Zuständen a und b mit Hilfe eines reversiblen Prozess von a nach b. Dann ist gilt nach Gl. (3.2) b ¯ dQ
ΔS = Sb − Sa = (
a
T
)reversibel
(3.7)
¯ und T und rechne so das Integral aus. Ist nun Man messe nun während des Prozesses immer dQ speziell der reversible Weg so geartet, dass ein äußerer Parameter y dabei festgehalten wird, so ¯ = Cy (T )dT : ergibt sich mit dQ b Cy (T ) dT Sb − Sa = T a Sollte darüber hinaus gelten, dass Cy (T ) nicht von der Temperatur abhängt, dann gilt speziell: Sb − Sa = Cy log(
Tb ) Ta
¯ 3.3 Der erste Hauptsatz, dQ-Gleichungen Der erste Hauptsatz der Thermodynamik (3.3) lautet ¯ + dW ¯ dE = dQ ¯ und dW ¯ jeweils positiv sind, wenn die entsprewobei die Vorzeichenkonvention so ist, dass dQ chenden Energien dem System zugeführt werden. Im Rahmen der klassischen Thermodynamik ist der erste Hauptsatz ein Postulat. Er bedeutet, dass eine Funktion E existiert, deren Differential dE vollständig ist. In diesem Kapitel diskutieren wir diesen ersten Hauptsatz der Thermodyna¯ mik. Wir bringen ihn in die Form der dQ-Gleichungen, die in durchsichtiger Weise erlauben, die wichtigen Prozesse der Wärmezufuhr bzw. -abfuhr für ein System unter verschiedenen experimentellen Bedingungen zu beschreiben. Betrachte im Folgenden homogene Systeme (Gase, Flüssigkeiten, oft auch Festkörper), die als Zustandsgrößen nur P, T und V haben. Im Gleichgewicht gilt dann die Zustandsgleichung, wie z.B. die Zustandsgleichung (2.40) des idealen Gases PV = nRT : Zustandsgleichung:
f (P, T,V ) = 0
Wegen der Existenz der Zustandsgleichung kann man vielfach eine der Größen P, T und V durch die beiden anderen ausdrücken. Bei infinitesimalen Änderungen eines beliebigen homogenen
¯ 3.3 Der erste Hauptsatz, dQ-Gleichungen
51
¯ Systems geht das immer und es ergeben sich die genannten dQ-Gleichungen: Sie beschreiben die Wärmezufuhr für infinitesimale reversible Prozesse, in denen jeweils ein Paar der Zustands¯ größen P, T,V unabhängig ist. Die dQ-Gleichungen gehen aus von der Tatsache, dass dE ein ¯ = −PdV : vollständiges Differential ist, und beschränken sich auf mechanische Arbeit, i.e. dW ¯ = dE + PdV dQ ¯ Damit erhalten wir (Beh:) die dQ-Gleichungen: P,V unabh:
P, T unabh:
¯ = dQ
∂E ∂P
¯ = dQ
+P T
∂E ∂P
∂V ∂P
T,V unabh:
¯ = dQ
dP +
V
∂E ∂V
∂E ∂V
dP +
T
∂E ∂T
+ P dV
(3.8)
P
+P P
∂V ∂T
∂E + P dV + dT ∂T V T
dT
(3.9)
P
(3.10)
¯ ¯ = dE + PdV und formt Der Beweis der dQ-Gleichungen ist einfach. Man startet immer von dQ diesen Ausdruck je nach den unabhängigen Variablen um.
P,V :
¯ dQ
=
dE+ PdV ∂E ∂E ∂ P V dP + ∂V P dV + PdV ∂E ∂E dP + + P dV ∂P ∂V
= = P, T :
¯ dQ
= = =
V, T :
¯ dQ
=
V
P
dE + PdV ∂E ∂E ∂V ∂V dP + dT + P dP + P ∂P T T P dT ∂ T P ∂ ∂ P T ∂E ∂V ∂E ∂V + P + P dP + ∂P T ∂T P ∂ T P dT ∂ P T ∂E ∂E + P dV + ∂ T dT ∂V
¯ = −PdV weil dW
T
V
q.e.d.
In der Thermodynamik ist die spezifische Wärme C für einen bestimmten Prozess definiert durch ¯ ΔQ = CΔT , siehe Gl. (3.1). Aus den dQ−Gleichungen, in denen T als unabhängige Größe vorkommt und somit i.a. ΔT = 0 ist, kann man CP und CV direkt ablesen, wodurch die Gleichungen auch vereinfacht werden:
52
3 Grundlagen der Thermodynamik
∂E T,V unabh: + P dV ∂V T ∂E ∂V ¯ = CP dT + P, T unabh: dQ dP +P ∂P T ∂P T ¯ = CV dT + dQ
mit: CV = CP =
∂E ∂T
∂Q ∂T
+P P
=
V
∂V ∂T
∂E ∂T
(3.12)
= P
(3.11)
(3.13) V
∂H ∂P
(3.14) P
wobei im Vorgriff die Enthalpie des Systems H = E + PV verwendet wurde. ¯ Die dQ-Gleichungen sind mehr von begrifflichem Nutzen, weil die vorkommenden partiellen Ableitungen im Experiment oft unbekannt sind. Man kann aber vieles von ihnen lernen und sie dienen als Vorbereitung der T dS-Gleichungen, die zusätzlich zum ersten Hauptsatz auch noch den zweiten verwenden und damit praxisorientierter sind, siehe Kap. 3.6. Dennoch ergeben sich ¯ zwei nützliche Anwendungen der dQ-Gleichungen: Beispiel: CP ,CV des idealen Gases
Wir verwenden Gl. (3.13) mit ∂E CV = ∂T V
Wir kennen aber manchmal die Abhängigkeit der inneren Energie von der Temperatur: Nach Gl. (2.39) folgt z.B. für das ideale Gas von einem Mol 3 E = RT 2
(3.15)
Daraus folgt für ein Mol 3 CV = R 2 mit der Rydberg-Konstanten R. Ebenso erhielten wir aus Gl. (3.14) ∂E ∂V +P CP = ∂T P ∂T P ideales Gas:
(3.16)
Für ein ideales Gas gilt dann wegen der Zustandsgleichung Gl. (2.40) sofort V = RT /P und damit (∂V /∂ T )P = R/P, so dass gilt für ein Mol: ideales Gas: und CP = CV + R
5 CP = R 2
(3.17)
Cp 5 =γ = CV 3
(3.18)
3.4 Der zweite Hauptsatz
53
Beispiel: Freie adiabatische Expansion des idealen Gases Abb. (3.5) dargestellt.
Der Prozess ist schematisch in
Abbildung 3.5: Freie adiabatische Expansion des idealen Gases: In einem Behälter mit adiabatischen Seitenwänden ist das Gas durch eine Zwischenwand in der linken Hälfte gehalten. Die Zwischenwand wird (ohne Arbeitsleistung) entfernt und das Gas breitet sich aus.
Freie adiabatische Expansion eines Gases liegt vor, wenn wir ein thermisch isoliertes System haben, bei dem Gas von einem kleineren Volumen in ein größeres frei expandiert, d.h. ohne ¯ = 0 und dW ¯ = 0. Arbeit nach außen abzugeben bzw. von außen zu beziehen. Somit gilt: dQ Nach dem ersten Hauptsatz (3.3) gilt also dE = 0 und wegen Gl. (3.15) haben wir 3 dE = 0 = RdT 2 woraus folgt dT = 0
isotherm
Also: Bei freier adiabatischer Expansion eines idealen Gases bleibt die Temperatur konstant. Das ist auch leicht zu verstehen: Die kinetische Energie jedes einzelnen Moleküls ändert sich nicht durch die Volumenvergrößerung, das Molekül durchläuft nur längere Strecken bevor es an den Wänden (unter Erhaltung des Impulsquadrates und bei gleichem Beitrag zum Druck) reflektiert wird. Achtung: Diese Konstanz der Temperatur gilt nicht für reale Gase. Dort gibt es noch attraktive Wechselwirkung zwichen den einzelnen Molekülen mit einer bestimmten Abstandsabhängigkeit, und dann spielt es eine Rolle, was der mittlere Abstand zwischen zwei Molekülen ist, der sich bei Expansion natürlich vergrößert. Dann gilt bei freier adiabatischer Expansion, dass sich die Temperatur erniedrigt, weil das Gas gegen die intermolekularen Kräfte Arbeit verrichtet.
3.4 Der zweite Hauptsatz Der zweite Hauptsatz Gl. (3.4) ist im Rahmen der Thermodynamik ein Postulat. Er benötigt zur Formulierung die Entropie, die durch einen reversiblen Prozess Gl. (3.2) definiert wird. Im Folgenden benutzen wir immer, dass reversible Zustandsänderungen auch quasistatisch sind. Für eine reversible (quasistatische) Zustandsänderung gilt: ¯ rev dQ dS = (3.19) T Daraus folgt für einen reversiblen Prozess a → b, die bekannte Gleichung: b ¯ dQ Sb − Sa = a T rev
54
3 Grundlagen der Thermodynamik
Für einen irreversiblen Prozess haben wir nach dem zweiten Hauptsatz (3.4) eine Entropieerhöhung, auch wenn keine Wärme zugeführt wird, also z.B. bei freier Expansion eines Gases. Also gilt dabei differentiell ¯ dQ (3.20) beliebiger Prozess: dS ≥ T und damit gilt für einen beliebigen Prozess a → b : b ¯ dQ Sb − Sa ≥ (3.21) a T beliebig Aus Gl. (3.21) folgt der „Clausius-Satz über Kreisprozesse”, der eine spezielle, aber nützliche, Formulierungen des zweiten Hauptsatzes ist. Aus Gl. (3.20) folgen der ”Clausius-Satz über die Entropie” und der ”Kelvin-Satz über die Entropie”.
3.4.1 Die Sätze von Clausius und Kelvin 3.4.1.1 Satz von Clausius über Kreisprozesse Für einen reversiblen Kreisprozess gilt ΔS = 0. Für einen beliebigen Kreisprozess gilt ΔS ≥ 0, was mit Gl. (3.21) ergibt
Satz von Clausius über Kreisprozesse:
¯ dQ ≤0 T
(3.22)
Es wird hierbei vorausgesetzt, dass der Prozess so abläuft, dass die Temperatur immer definiert ist, also ein quasistatischer Prozess vorliegt. Das Gleichheitszeichen gilt für einen reversiblen Prozess. 3.4.1.2 Satz von Clausius über die Entropie Aus der Gl. (3.20) folgen zwei äquivalente Aussagen, eine von Clausius und eine von Kelvin, deren Formulierung im Einzelnen genau beachtet werden muss. Satz von Clausius: Es gibt keine thermodynamische Zustandsänderung, deren einzige Wirkung darin besteht, dass eine Wärmemenge Q einem kälteren Speicher R1 entzogen und einem wärmeren Speicher R2 zugeführt wird. Siehe Abb. (3.6). Beweis: Wenn nichts anderes geschieht, als dass die Wärmemenge Q fließt, dann gilt die folgende Bilanz:
nun gilt aber ⇒
ΔS ΔS1 = − TQ1 ΔS < 0
= und wenn
ΔS1 + ΔS2 ΔS2 = TQ2 T2 > T1
mit Q > 0 Widerspruch!
Natürlich ist eine reine Wärmeleitung von einem wärmeren zu einem kälteren Reservoir möglich. Der Prozess ist schematisch im Abb. (3.7) dargestellt, wobei vorausgesetzt wird, dass T2 > T1 .
3.4 Der zweite Hauptsatz
55
R2
T2
W =0
Verboten!
R1
Q
T1
Abbildung 3.6: Satz von Claudius über die Entropie, wobei vorausgesetzt ist:
R2
Q
T2 > T1 .
T2
W =0
R1
T1
Abbildung 3.7: Wärmeleitung aus einem wärmeren Reservoir R2 der Temperatur T2 in ein kälteres. Betrachtet wird der Wärmeübertrag pro Zeiteinheit.
Pro Sekunde fließt eine Wärmemenge Q vom Speicher R2 zum Speicher R1 . Die Änderung der Entropie pro Sekunde ist damit ΔS2 = −
Q T2
ΔS1 =
Q T1
Für das Gesamtsystem gilt somit pro Sekunde ΔS = ΔS1 + ΔS2 = Q(
1 1 − )>0 T1 T2
56
3 Grundlagen der Thermodynamik
Der Prozess der Wärmeleitung ist offenbar irreversibel, was niemanden erstaunt. Wie wir in Kap. 3.5.2 noch sehen werden, gibt es aber eine Methode, einem System Wärme reversibel zuzuführen, und zwar mit Hilfe einer Carnot-Maschine. 3.4.1.3 Satz von Kelvin über die Entropie Satz: Es gibt keine thermodynamische Zustandsänderung, deren einzige Wirkung darin besteht, dass eine Wärmemenge Q einem Wärmespeicher entzogen wird und vollständig in Arbeit umgesetzt wird, siehe Abb. (3.8). R2
T2
Q
W
Verboten!
R1
T1
Abbildung 3.8: Schematische Darstellung des Satzes von Kelvin über die Entropie. Voraussetzung: T2 > T1 .
Beweis: Aus dem Wärmespeicher mit der Temperatur T2 wird Wärme entzogen und in Arbeit umgesetzt. Das bedeutet Q ΔSArbeit = 0 und ΔS2 = − T2 Und daraus folgt mit ΔS = ΔS1 + ΔSArbeit + ΔS2 und ΔS1 = 0 ⇒
ΔS < 0
Widerspruch!
3.4.2 Expansionsprozesse des idealen Gases Im Folgenden werden verschiedene Arten der Expansion eines idealen Gases untersucht und miteinander verglichen. An diesem Beispiel kann man alle relevanten Prozesse sehr gut und illustrativ studieren. Wir gehen aus von den bekannten Gleichungen 3 E = RT PV = RT (3.23) 2 Die Zustandsgleichung des idealen Gases PV = RT ist zugleich die Gleichung für seine Isotherme. Sie ist in Abb. (3.10) dargestellt.
3.4 Der zweite Hauptsatz
57
3.4.2.1 Beispiel: Reversible isotherme Expansion des idealen Gases
Wärmespeicher mit Temperatur T Abbildung 3.9: Reversible, isotherme Expansion des idealen Gases: System aus Behälter mit idealem Gas, einem beweglichen Kolben, der mit einer Feder verbunden ist. Das System wird durch Kopplung an einen Wärmespeicher (angedeutet durch die Ellipse) auf gleicher Temperatur gehalten.
Der Prozess wird schematisch beschrieben in Abb. (3.9). Er ist als isotherm und reversibel vorausgesetzt, d. h., der Prozess ist nicht adiabatisch, im Gegenteil, die Wärmezufuhr wird so gestaltet, dass die Temperatur erhalten bleibt. Das geschieht durch Wärme, die einem Wärmespeicher entzogen wird, wodurch bei der Expansion das Gas durch Zusamendrücken der Feder Arbeit leistet, die dem System durch Expansion der Feder auch wieder zurückgegeben werden kann, wodurch die Reversibilität gegeben ist. P
Isotherme
0
V1
V2
V
Abbildung 3.10: Isotherme eines idealen Gases: PV = RT .
Zunächst gilt wegen der vorausgesetzten Reversibilität ΔSGas + ΔSSpeicher = 0
wobei
ΔSFeder = 0
Hierbei gilt ΔSFeder = 0, weil es sich nur um einen einzigen Freiheitsgrad handelt. Dann wissen
58
3 Grundlagen der Thermodynamik
wir von Gl. (2.39), dass 3 EGas = RT = const 2 und weil wir einen isothermen Prozess haben, folgt ΔEGas = 0. Nach dem ersten Hauptsatz ΔEGas = ΔQGas + ΔWGas haben wir damit ΔQGas + ΔWGas = 0 Daraus folgt mit der Zustandsgleichung des idealen Gases aus Gl. (3.23) ΔQGas = −ΔWGas =
V2 V1
PdV = RT
V2 dV V1
V
Somit ergibt sich die vom Gas aufgenommene Wärmemenge zu: ΔQGas = RT log
V2 V1
und für die Entropieänderung gilt: ΔSGas =
V2 ¯ dQ
V2
V1
V1
1 = T T
¯ = 1 (ΔQ)Gas = R log V2 dQ T V1
(3.24)
Es gilt ΔSGas +ΔSSpeicher = 0, weil der Prozess als reversibel vorausgesetzt wurde. Das entspricht der Tatsache, dass der Wärmespeicher die Wärmemenge ΔQGas an das Gas liefert und damit seine Entropieänderung selbstverständlich genauso groß wie die des Gases und nur ein anderes Vorzeichen hat: ΔQGas V2 ΔSSpeicher = − = −R log T V1 Wir kennen jetzt von allen drei Systemkomponenten die Entropieänderungen für die reversible isotherme Expansion des idealen Gases. Achtung: Obwohl in diesem Beispiel die Wärmemenge ΔQGas dem Wärmespeicher entzogen wurde und vollständig in Energie umgewandelt wurde, ist der zweite Hauptsatz in der Aussage von Kelvin nicht verletzt, da zusätzlich eine Zustandsänderung des Gases aufgetreten ist (V1 → V2 ) , es sich also bei der Umwandlung der Wärmemenge nicht um die einzige Änderung handelt. Es kann die in der Feder gespeicherte Energie verwendet werden, um den Prozess rückgängig zu machen und Wärme ΔQGas an den Wärmespeicher (Umgebung) zurückzugeben. 3.4.2.2 Beispiel: Freie adiabatische Expansion des idealen Gases Die Energiebilanz dieses Prozesses wurde bereits behandelt, siehe dazu Abb. (3.5): Die Energie bleibt beim idealen Gas erhalten. Weil diese nach Gl. (3.15) gegeben ist durch E = 32 RT , muss die Expansion wegen der thermischen Isolierung (Adiabasie, ΔSSpeicher = 0) isotherm sein, d.h. dT = 0. Interessant ist die Berechnung der Entropieänderung des Gases. Man kann hier die Entropieänderung nicht direkt berechnen, weil es sich bei freier Expansion nicht um einen quasistatischen
3.4 Der zweite Hauptsatz
59
Prozess handelt. Weil die Entropie jedoch eine Zustandsgröße ist, kann man einen quasistatischen und damit reversiblen Vergleichsprozess betrachten, der zum gleichen Endzustand (d.h. gleiche Temperatur und gleiches Volumen) führt. Hierzu eignet sich die oben besprochene reversible isotherme Expansion. Daher gilt für die Entropieänderung des Gases nach Gl. (3.24) ΔSGas = R log
V2 V1
Hier gibt es allerdings keine Entropieänderung des Wärmespeichers, da der Prozess adiabatisch, also thermisch isoliert verläuft, i.e. ΔSSpeicher = 0. Somit gilt für die Entropieänderung des Gesamtsystems ΔS = ΔSGas + ΔSSpeicher = ΔSGas > 0 Wenn man nur das ideale Gas betrachtet, so sind freie adiabatische Expansion und freie isotherme Expansion identische Prozesse. Bei einem nicht-idealen Gasen ist dies nicht mehr so, denn bei dessen freier adiabatischer Expansion ergibt sich eine Temperaturerniedrigung8 3.4.2.3 Beispiel: Reversible, adiabatische Expansion des idealen Gases Der Prozess ist schematisch in Abb. (3.11) dargestellt. Hier haben wir wieder wegen der Reversibilität eine Feder, die Arbeit aufnehmen bzw. leisten kann. Der Kolben ist beweglich, dadurch wird bei der Reflexion eines Moleküls ein Teil seines Impulses übertragen, wodurch ein Energieverlust der Gasmoleküle im Behälter entsteht.
Abbildung 3.11: Reversible adiabatische Expansion des idealen Gases: Das System besteht aus einem Gasbehälter mit beweglichem Kolben, der mit einer Feder verbunden ist. Das System ist mit adiabatischen Wänden ausgestattet und somit thermisch isoliert. Bei Expansion verrichtet das Gas Arbeit an der Feder, die bei Kompression wieder zurückgewonnen werden kann.
¯ Gas = 0 Da es sich hier um eine adiabatische Expansion handelt, gilt für das Gas im Behälter dQ ¯ ¯ und ebenso dQSpeicher = 0 und natürlich dQFeder = 0. Ferner ist diese Zustandsänderung reversibel und quasistatisch, so dass die Temperatur zwar nicht notwendig konstant, aber zu jedem Zeitpunkt definiert ist, und damit muss Gl. (3.4) zu jedem Zeitpunkt des Prozesses gelten, so¯ Speicher = T dSSpeicher . ¯ Gas = T dSGas und dQ wohl für das Gas als auch für den Speicher, also dQ 8 Siehe
hierzu Kap. 3.8.5, in dem sie ausgerechnet wird.
60
3 Grundlagen der Thermodynamik
Somit gilt infinitesimal dSGas = dSSpeicher = 0 und damit insgesamt ΔSGas = ΔSSpeicher = 0 Die Arbeit, die das System leistet, nimmt es also aus der inneren Energie des Gases: ΔE = ΔW Damit muss sich die Temperatur des Gases erniedrigen. Diese Temperaturänderung ΔT kann man auf verschiedene Arten berechnen: ¯ • Berechnung von ΔT thermodynamisch über die dQ-Gleichung (3.10) und Gl. (3.13) ∂E ∂E ¯ dQ = ∂V T + P dV + ∂ T V dT ¯ ∂E CV = dQ dT V = ∂ T V ∂E E = 32 NkB T ⇒ ∂V T = 0 ¯ ⇒ dQ = PdV +CV dT Es gilt nun aber die Zustandsgleichung des idealen Gases (2.40), also PV = RT und damit ¯ = RPdV +CV RdT RdQ RdT = PdV +V dP ¯ = (CV + R)PdV +CV V dP ⇒ RdQ ¯ = 0. Daher ergibt sich mit Der Prozess war als adiabatisch vorausgesetzt, deshalb gilt dQ Gl. (3.17): CV + R dV dP + =0 CV V P woraus wir die Definition entnehmen γ=
CV + R CP 5 = = CV CV 3
und damit γ
(3.25)
dV dP + =0 V P
Hieraus folgt 1 P und daraus die Adiabatengleichung für einen reversiblen adiabatischen Prozess des idealen Gases: d logV γ + d log P = 0
oder
Ideales Gas Adiabatengleichung: oder:
d logV γ = d log
PV γ = const TV
γ−1
= const
(3.26)
3.5 Wärmekraftmaschinen, Kühlmaschinen
61
Da für ein ideales Gas die Wärmekapazität nach Gl. (3.18) gegeben ist durch γ = 53 , folgt hieraus V1 T2 3 =0 log + log T1 2 V2 und damit T2 V1 2 = ( )3 T1 V2 Also erniedrigt sich die Temperatur des idealen Gases bei einer reversiblen adiabatischen Expansion. Das ist auch verständlich: Das System leistet Arbeit nach außen, die wegen der Adiabasie durch Abnahme der inneren Energie aufgebracht werden muss. • Die Berechnung von ΔT ist einfacher, wenn wir von der Statistischen Mechanik ausgehen: Die Berechnung von ΔT = T2 − T1 für einen reversiblen Prozess mit V1 → V2 erfolgt nach Gl. (2.32) bei fester Teilchenzahl N SGas ⇒ dSGas ⇒ ΔSGas
= NkB log VN + 32 NkB log NE + N log B 3 dE = NkB dV V + 2 NkB E V2 3 = NkB log V1 + 2 NkB log EE21
und unter Verwendung von E = 32 RT und ΔSGas = 0 wegen Reversibilität: log
E2 T1 3 3 V2 = − log = + log V1 2 E1 2 T2
und somit
V1 2 T2 = ( )3 T1 V2 was natürlich das gleiche Ergebnis wie bei der thermodynamischen Rechnung ist.
3.5 Wärmekraftmaschinen, Kühlmaschinen Nach dem zweiten Hauptsatz ist die vollständige Umwandlung von Wärme in Arbeit verboten ( Satz von Kelvin, Kap. 3.4.1.3), teilweise Umwandlung jedoch gestattet. Das nutzen die Wärmekraftmaschinen aus. Die vollständige Umwandlung von Arbeit in Wärme ist jedoch erlaubt. Das nutzen die Wärmepumpen und Kühlmaschinen aus. Dabei spielen jeweils Wärmereservoire eine Rolle, deren Temperatur sich nicht ändert. Maschinen sind dadurch charakterisiert, dass immer zyklische Zustandsänderungen betrachtet werden, d.h. bei denen nach einem Zyklus der Endzustand des Systems wieder gleich dem Ausgangszustand ist. Die Maschinen sind natürlich mit den Hauptsätzen verträglich, diese schränken jedoch den erreichbaren Wirkungsgrad ein.
3.5.1 Wärmekraftmaschine Eine Wärmekraftmaschine M, siehe Abb. (3.12), ist ein thermodynamisches System, das eine zyklische Zustandsänderung durchführt (d.h. Endzustand = Anfangszustand), wobei Folgendes getan wird:
62
3 Grundlagen der Thermodynamik
1. Die Maschine M nimmt Wärme Q2 aus dem Speicher R2 auf, der die Temperatur T2 besitzt, mit T2 > T1 : 2. Die Maschine M gibt Wärme Q1 an den Speicher R1 ab, der die Temperatur T1 besitzt, mit T1 < T2 . 3. Die Maschine M leistet Arbeit W nach außen. R2
Q2
Maschine
R1
T2
W
Q1
T1
Abbildung 3.12: Wärmekraftmaschine schematisch. Dem Reservoir R2 mit der Temperatur T2 wird die Wärmemenge Q2 entnommen und in der Maschine M zum Teil in nach außen abgegebene Arbeit W umgesetzt. Gleichzeitig wird von der Maschine M dem Reservoir R1 mit der Temperatur T1 die Wärmemenge Q1 zugeführt, wobei T1 < T2 gilt.
Üblicherweise liegen die folgenden Bedingungen vor: Das Reservoir R2 wird durch Heizung auf der Temperatur T2 > T1 gehalten. Das Reservoir R1 wird auf der Temperatur T1 gehalten, d.h., es wird gekühlt (normalerweise durch die Umgebung, also Außenluft, Erdreich, See oder Fluss). Eine wichtige Größe zur praktischen Beurteilung des Prozesses ist gegeben durch den Wirkungsgrad. Dieser wird allgemein definiert durch Nutzen Wirkungsgrad = (3.27) Aufwand oder speziell in dem Fall von Abb. (3.12) η=
W Von Maschine M geleistete Arbeit = Q2 Von Maschine M aufgenommene Wärme
(3.28)
Berechnung des Wirkungsgrades: Für einen zyklischen Prozess der Maschine M muss selbstverständlich der erste Hauptsatz gelten ΔE = ΔQ + ΔW = 0 mit ΔQ = Q2 − Q1 . Da ΔW definitionsgemäß die der Maschine zugeführte Arbeit ist, wir aber in diesem Kapitel mit W die von
3.5 Wärmekraftmaschinen, Kühlmaschinen
63
der Maschine geleistete (nach außen abgegebene) Arbeit bezeichnen, gilt ΔW = −W . Aus dem ersten Hauptsatz ergibt sich damit W = Q2 − Q1 Die Berechnung des Wirkungsgrades erfolgt jetzt mit Hilfe des zweiten Hauptsatzes und der Tatsache, dass R1 und R2 Wärmereservoire mit fester Temperatur sind. Wir betrachten das Gesamtsystem, bestehend aus R1 , R2 , M und einem Arbeitsspeicher (z.B. Feder) zur Aufnahme der Arbeit W , als abgeschlossen. Damit haben wir ΔS = ΔS1 + ΔS2 + ΔSM + ΔSF wobei der Arbeitsspeicher nur einen Freiheitsgrad hat und deshalb ΔSF = 0 gilt. Für die beiden Reservoire gilt Gl. (2.45), weiterhin haben wir für einen zyklischen Prozess der Maschine ΔSM = 0, weil die Entropie eine Zustandsgröße ist. Somit gilt ΔS = ΔS1 + ΔS2 = − und damit − oder
Q2 Q1 + ≥0 T2 T1
Q2 Q2 −W + ≥0 T2 T1
W 1 1 ≤ Q2 ( − ) T1 T1 T2
mit dem Ergebnis
1 1 T2 − T1 W ≤ T1 ( − ) = Q2 T1 T2 T2 Daraus folgt mit Gl. (3.28) für den Wirkungsgrad η≤
T2 − T1 T2
(3.29)
Der maximale Wirkungsgrad einer Wärmekraftmaschine ist gegeben für den Fall ΔS = 0. Für diesen Idealfall erhalten wir T2 − T1 Tmin = 1− (3.30) ηmax = T2 Tmax Bei einer solchen Maschine mit maximalem Wirkungsgrad, und nur bei dieser, laufen alle Prozesse reversibel ab. Es gilt ηmax < 1, eine Maschine mit η = 1 existiert nicht, weil es kein Reservoir mit T1 = 0 gibt.
3.5.2 Carnot-Maschine Wie wir gerade gesehen haben, wird der größte theoretisch mögliche Wirkungsgrad erreicht, wenn der Prozessablauf reversibel verläuft. Das findet in der Realität niemals statt und lässt sich nur in einem Gedankenexperiment vorstellen. Da sind dann beliebig viele reversible Kreisprozesse denkbar. Das Paradebeispiel für eine solche Ideal-Maschine mit optimalem Wirkungsgrad ηmax ist die Carnot-Maschine.
64
3 Grundlagen der Thermodynamik
3.5.2.1 Prinzip Der Prozess der Carnot-Maschine besteht aus vier reversiblen (quasistatischen) Schritten, die im (P,V )-Diagramm in Abb. (3.13) dargestellt sind und im Uhrzeigersinn von der Arbeitssubstanz der Maschine durchlaufen werden. Unter der Voraussetzung T1 < T2 haben wir: 1. Quasistatische isotherme Expansion von (a → b) bei der Temperatur T2 mit Wärmezufuhr Q2 aus dem Reservoir R2 . 2. Quasistatische adiabatische Expansion (b → c). 3. Quasistatische isotherme Kompression von (c → d) bei der Temperatur T1 mit Wärmeabgabe von Q1 an das Reservoir R1 . 4. Quasistatische adiabatische Kompression (d → a). Der Carnot-Prozess ist neben Abb. (3.13) am besten illustriert im (T, S)-Diagramm, wo er durch ein Rechteck dargestellt wird, dessen Seiten parallel zu den Koordinatenachsen liegen. Wählt man S als Abszisse und T als Ordinate, wird der Prozess im Uhrzeigersinn durchlaufen. Isotherme
P
Adiabate
a T2 b
d
T1
c
0
V
Abbildung 3.13: Carnot-Maschine schematisch. Alle Schritte sind reversibel und quasistatisch. Es gilt T2 > T1 . Für die isothermen Schritte ist jeweils Kontakt mit Wärmereservoiren nötig, verbunden mit entsprechender Wärmezufuhr bzw. -abgabe.
Die Berechnung des Wirkungsgrades ist einfach: Es handelt sich um einen reversiblen Prozess, deshalb ist die Entropieänderung des gesamten Prozesses der Maschine gleich null: ΔS = 0. Bei den adiabatischen Zustandsänderungen wird die Entropie des Systems nicht geändert, weil dort keine Wärme zu- oder abgeführt wird. Die isothermen Zustandsänderungen sind jedoch nur möglich durch Wärmeaufnahme bzw. Wärmeabgabe. Da diese jeweils quasistatisch verlaufen, ergibt sich die Berechnung des Wirkungsgrades wie folgt: ΔS =
Q2 Q1 − =0 T2 T1
⇒
Q2 Q1 = T2 T1
Weiterhin hat bei einem zyklischen Prozess die Maschine vorher und nachher die gleiche innere Energie, also muss gelten ΔE = Q2 − Q1 + ΔW = 0
3.5 Wärmekraftmaschinen, Kühlmaschinen
65
wobei ΔW die der Maschine M zugeführte Arbeit ist (erster Hauptsatz) oder, wenn wir wieder die von ihr geleistete Arbeit mit W = −ΔW bezeichnen, W = Q2 − Q1 Aus diesen Gleichungen ergibt sich sofort ηCarnot =
W Q2 − Q1 Q1 T2 − T1 T1 = = 1− = = 1− Q2 Q2 Q2 T2 T2
(3.31)
und damit mit Gl. (3.30) ηCarnot = 1 −
Tmin = ηmax Tmax
Damit ist das Wesentliche über den Carnot-Prozess dargestellt. Die abgeleiteten Gleichungen sind unabhängig von den Details der Maschine und gelten z.B. für jede Arbeitssubstanz. Jeder andere Kreisprozess, der irreversible Teile enthält oder bei dem der Wärmeaustausch mit der Umgebung nicht nur bei Tmax bzw. Tmin stattfindet, sondern bei unterschiedlichen Temperaturen, hat einen geringeren Wirkungsgrad. 3.5.2.2 Carnot-Maschine: Ideales Gas Für ein ideales Gas als Arbeitssubstanz der Maschine M kann man quantitativ die von der Maschine geleistete Arbeit und die abgegebenen bzw. aufgenommenen Wärmemengen berechnen. Für die Isothermen (a → b) und (c → d) gilt entsprechend: PV = RT. Und für die Adiabaten (b → c) und (d → a) gilt entsprechend: PV γ = const. Man kann explizit aufintegrieren, um die von der Maschine geleistete Arbeit zu berechnen: W=
b a
PdV +
c b
PdV +
d c
PdV +
a
PdV d
Es geht aber auch einfacher, wenn man die Wärmemengen betrachtet: Q2 > 0 fließt aus Speicher R2 in die Maschine, und Q1 < 0, also |Q1 | fließt aus der Maschine in den Speicher R1 und damit: a→b c→d
Q2 Q1
= =
b a
PdV = RT2 log VVba RT1 log VVdc
woraus folgt V
T1 log Vdc Q1 = Q2 T2 log Vb Va
Nun gilt außerdem γ−1
T2Vaγ−1 = T1Vd γ−1
T2Vb
= T1Vcγ−1
66
3 Grundlagen der Thermodynamik
Damit ergibt sich insgesamt Va Vd = Vb Vc
oder
Q1 T1 = Q2 T2
woraus folgt η = 1−
T1 Q1 = 1− Q2 T2
Damit ergibt sich wieder der Wirkungsgrad eines Carnot-Prozesses zu Carnot (T2 > T1 ):
ηCarnot = ηmax = 1 −
T1 T2
3.5.2.3 Carnot-Maschine: Maximaler Wirkungsgrad Die Wichtigkeit der Carnot-Maschine hängt mit dem folgenden Carnotschen Satz zusammen: Keine Maschine, die zwischen zwei vorgegebenen Temperaturen arbeitet, ist effektiver als die Carnot-Maschine. Der Wirkungsgrad der Carnot-Maschine ist der höchste, den eine Maschine erreichen kann. Die Carnot-Maschine ist die einzige Maschine, die Wärme in reversibler Weise übertragen kann. Jede andere Maschine hat einen geringeren Wirkungsgrad und ist daher nicht reversibel. Man kann einfach zeigen, dass es keine Maschine gibt, die einen größeren Wirkungsgrad hat als die Carnot-Maschine. Man betreibe eine Carnot-Maschine C und eine beliebige andere Maschine X zwischen zwei Wärmespeichern T1 und T2 mit T2 > T1 . Nach dem ersten Hauptsatz haben wir W = Q2 − Q1 W = Q2 − Q1 Wir nehmen nun an, dass mit natürlichen Zahlen N und N gilt: Q2 N = Q2 N
(3.32)
Man lasse die X-Maschine N -mal in Vorwärtsrichtung arbeiten und die C-Maschine N-mal in umgekehrter Richtung9 . Am Ende dieser Operation haben wir vom Gesamt-System geleistete Arbeit: Wtotal = N W − NW vom Gesamt-System an R2 abgegebene Wärme: (Q2 )total = N Q2 − NQ2 = 0
vom Gesamt-System an R1 abgegebene Wärme: (Q1 )total = N Q1 − NQ1 . Andererseits können wir auch schreiben Wtotal = (Q2 )total − (Q1 )total = − (Q1 )total 9 Nur
die Carnot-Maschine kann, weil sie reversibel arbeitet, mit unveränderten Parametern rückwärts laufen.
3.5 Wärmekraftmaschinen, Kühlmaschinen
67
Betrachte den Fall (Q1 )total ≤ 0, woraus folgt Wtotal ≥ 0. Hier erhalten wir einen Widerspruch zur Kelvinschen Aussage, weil (Q1 )total dem Speicher R1 entzogen und vollständig in Arbeit umgewandelt würde, ohne dass sonst etwas geschieht. Es muss also sein, dass (Q1 )total ≥ 0 und damit Wtotal ≤ 0, hier wird dann Arbeit dem System zugefügt und vollständig in Wärme umbewandelt, was erlaubt ist. Dann muss aber gelten N Q1 − NQ1 ≥ 0 oder
N Q − Q1 ≥ 0 N 1
oder wegen Gl. (3.32) Q2 Q − Q1 ≥ 0 oder Q2 Q1 − Q2 Q1 ≥ 0 Q2 1 und damit
Also ist
Q Q1 ≤ 1 Q2 Q2
Q1 1− Q2
Q ≥ 1 − 1 Q2
q.e.d.
Nach Gl. (3.31) ist damit gezeigt, dass der Wirkungsgrad der Maschine X kleiner oder gleich dem der Carnot-Maschine C ist, was zu beweisen war.
3.5.3 Anwendungen 3.5.3.1 Beispiel: Wärmeausgleich reversibel und irreversibel Betrachte zwei identische und zunächst getrennte Körper aus einem inkompressiblen Material (dV = 0) und der konstanten Wärmekapazität C. Sie sollen zu Beginn des Prozesses die Temperaturen T1 und T2 aufweisen. Das Gesamtsystem sei nach außen thermisch isoliert. Durch zwei verschiedene Prozesse soll Temperaturausgleich bewirkt werden: Fall a): Durch eine zwischen den beiden Körpern reversibel (d.h. bei konstanter Entropie des Gesamtsystems) arbeitende Wärmekraftmaschine soll (quasistatisch) dem wärmeren Körper Wärme entzogen und damit nach außen Arbeit geleistet werden, bis schließlich eine gemeinsame Temperatur TE beider Körper erreicht wird. Frage: Wie groß ist TE , der Entropiezuwachs und und wie groß ist die nach außen abgegebene Arbeit? Fall b): Der Temperaturausgleich soll durch reine Wärmeleitung zwischen den beiden Körpern erfolgen, wenn man diese miteinander in Kontakt bringt. Frage: Wie groß ist jetzt die Endtemperatur TE , die Änderung der Entropie des Gesamtsystems und die Energiebilanz? Antwort: Die Änderung der Gesamtentropie der beiden Körper beträgt bei noch unbekannter Endtemperatur TE bei quasistatischem Prozess: T TE E dT dT T2 (3.33) ΔS = C + = C log E ≥ 0 T T T1 T2 T1 T2 Die Arbeit, die dem Gesamtsystem zugeführt wird, ist bei gegebenem TE gegeben durch den ersten Hauptsatz. Wegen der thermischen Isolierung gilt ΔQ = 0 und deshalb 0 = ΔE − ΔW ,
68
3 Grundlagen der Thermodynamik
wobei ΔW die dem System zugeführte Arbeit ist. Diese ergibt sich durch Berechnung der inneren Energie bei der Temperatur TE : T TE E ΔW = ΔE = C dT + dT = C [2TE − T1 − T2 ] T1
T2
Fall a): Für eine reversibel arbeitende Wärmekraftmaschine gilt für das Gesamtsystem ΔS = 0 √ T2 und damit nach Gl. (3.33) log T1ET2 = 0 oder TE = T1 T2 . Man erhält für die Änderung der inneren Energie und damit für die von außen zugeführte Arbeit √ 1 T T − + T ) TE 2 Offenbar ist TE > TE und das ist konsistent, denn jetzt wird keine Arbeit nach außen abgegeben und die internen Ausgleichsprozesse können nur verwendet werden, die um Endtemperatur zu erhöhen. Die Entropieänderung ist hierbei ΔS = C log
(TE )2 T1 + T2 T2 = 2C log √ log E ≥ ΔS T1 T2 T1 T2 2 T1 T2
3.5.3.2 Beispiel: Verbrennungsmotor (Otto-Motor) Der Otto-Motor ist keine Carnot-Maschine und deshalb ist der Wirkungsgrad η < ηCarnot . Sein (P,V )-Diagrammm ist schematisch dargestellt in Abb. (3.14). Der Prozess hat die im Folgenden dargestellten Schritte, von denen einige irreversibel sind. 1. Weg (O → A): Gas-Luft-Gemisch wird angesogen. 2. Weg (A → B) : Kompression wird schnell10 durchgeführt und ist somit adiabatisch. Sie führt zu einer Temperaturerhöhung (reversibel adiabatisch). 3. Weg (B → C): Explosion des Gas-Luft-Gemisches: schnell! Daher Druckerhöhung ohne Volumenvergrößerung mit Temperaturerhöhung (irreversibel adiabatisch). 4. Weg (C → D): Heißes Gas unter hohem Druck bewegt Kolben nach außen. Ergibt schnelle Volumenvergrößerung und leistet mechanische Arbeit (reversibel adiabatisch). 5. Weg (D → A): Öffnen des Ventils, Auspuffgase werden an die Umgebung abgegeben, es findet eine plötzliche Druckerniedrigung statt (irreversibel). 6. Weg (A → O): Kolben drückt Restgas heraus, Vorbereitung zum Einsaugen. 10 Entscheidend
ist, dass der Prozess adiabatisch durchgeführt wird. Das geht bei einer aus Metall mit hoher Wärmeleitfähigkeit bestehenden Maschine nur, wenn der Prozess so schnell durchgeführt wird, dass kein merklicher Wärmeaustausch mit der Umgebung stattfinden kann.
3.5 Wärmekraftmaschinen, Kühlmaschinen
69
Isochore
P
Adiabate
C
D
B
A
O 0
V
Abbildung 3.14: Otto-Motor schematisch. Die Strecken A → B und C → D sind reversibel und adiabatisch, die Strecken B → C und D → A sind irreversibel ohne Volumenänderung. Die Explosion des Brennstoffs liefert die Energie und findet auf der Strecke B → C statt.
Der Wirkungsgrad des Otto-Motors berechnet sich wie folgt, wobei man berücksichtigen muss, dass sich Weg (A → O) und Weg (O → A) in der Bilanz aufheben. Die spezifische Wärmekapazität CV wird als konstant angenommen. Damit erhalten wir für die Wärmebilanz Weg (A → B) : ΔQAB = 0
weil adiabatisch
Weg (B → C) : ΔQBC = ΔEBC = CV (TC − TB ) > 0 Weg (C → D) : ΔQCD = 0
Wärmeaufnahme
weil adiabatisch
Weg (D → A) : ΔQDA = ΔEDA = CV (TA − TD ) < 0 Wärmeabgabe Hierbei bedeutet die Explosion im Motor eine Freisetzung von chemischer Energie, die für das Gas eine Wärmeaufnahme bedeutet, das Ausströmen des heißen Gases bedeutet Wärmeabgabe. Die geleistete Arbeit W ist die Differenz zwischen aufgenommener und abgegebener Wärme, weil keine andere Energiequelle in Frage kommt. Die Bilanz für die geleistete Arbeit W lautet nach dem ersten Hauptsatz bei einem Umlauf: W = ΔQBC + ΔQDA = CV (TC − TB + TA − TD ) Daraus ergibt sich für den Wirkungsgrad geleistete Arbeit Nutzen = Aufwand in Explosion aufgenommene Wärme W TD − TA ηOtto = = 1− ΔQBC TC − TB Mit Hilfe der Adiabatengleichung können wir das auf die Volumina umrechnen. Wir haben mit VA = VD = V2 und VB = VC = V1 : η=
γ−1
= TBV1
γ−1
= TCV1
TAV2 TDV2
γ−1 γ−1
70
3 Grundlagen der Thermodynamik
oder
γ−1
(TD − TA )V2 und daraus
V1 ηOtto = 1 − V2
γ−1
= (TC − TB )V1
γ−1
= 1−
TA TD = 1− TB TC
Zur Erinnerung: Wir haben etwa γ = CP /CV ≈ 1.4 bei Luft. In der Praxis haben wir etwa V1 /V2 ≈ 0.1, was ein ηOtto ≈ 0.6 ergibt, wobei etwa die Hälfte davon realistisch ist. Der Vergleich mit dem Carnot-Prozess ist wie folgt: Die höchste beim Umlauf erreichte Temperatur beim Otto-Motor ist Tmax = TC , die niedrigste ist Tmin = TA . Der Carnot-Prozess zwischen diesen beiden Temperaturen hat den Wirkungsgrad ηCarnot = 1 −
TA TA > ηOtto = 1 − TC TB
(3.34)
3.5.4 Kühlmaschinen, Wärmepumpen Kühlmaschinen und Wärmepumpen sind die inversen Prozesse zur Wärmekraftmaschine. Im Folgenden haben wir wieder T1 < T2 . 3.5.4.1 Kühlschrank Das Schema der Kühlmaschine ist in Abb. (3.15) dargestellt. Kühlmaschinen ziehen Wärme aus Reservoir R1 (T1 ) und geben sie an R2 (T2 ) ab. Dazu muss Arbeit W von außen in das System gebracht werden. Beispiel dafür ist ein Kühlschrank. • R1 = Inneres des Kühlschrankes • R2 = Umgebung des Kühlschrankes • W = Arbeit des Motors Der Wirkungsgrad ergibt sich definitionsgemäß zu, siehe Gl. (3.27): η=
Nutzen Aufwand
Das Ziel ist hierbei eine Kühlung, das heißt die optimale Art, Wärme Q1 dem Reservoir R1 zu entziehen bei geringstem Arbeitsaufwand. Deshalb gilt hier die Behauptung: ηKühlschrank = Beweis: ΔS1 =
Q1 T1 ≤ ηmax = W T2 − T1
−Q1 T1
ΔS2 =
=⇒
Q2 Q1 ≥ T2 T1
+Q2 T2
und nach dem zweiten Hauptsatz Q2 Q 1 − ≥0 T2 T1
=⇒
Q2 T2 ≥ Q1 T1
3.5 Wärmekraftmaschinen, Kühlmaschinen
R2
71
Q2
T2
Maschine
W
Q1
R1
T1
Abbildung 3.15: Kühlmaschine (Kühlschrank) schematisch. Die ins System eingebrachte Arbeit entzieht Wärme dem kälteren Speicher und führt sie dem wärmeren zu.
und dann nach dem ersten Hauptsatz: Q1 +W = Q2
=⇒
1+
W Q2 = Q1 Q1
und daher 1+
T2 W ≥ Q1 T1
=⇒
W T2 ≥ −1 Q1 T1
oder ηKühlschrank =
Q1 T1 ≤ ηmax = W T2 − T1
(3.35)
q.e.d. Da das Gleichheitszeichen für einen reversiblen Prozess gilt, entspricht dieser Vorgang auch dem maximalen Wirkungsgrad. Wenn wir einen typischen Kühlschrank betrachten, haben 270K wir: Kühlschrank ηmax = 300K−270K 9 verglichen zum realen Wert in der Praxis von etwa ηreal 3. 3.5.4.2 Wärmepumpe Bei der Wärmepumpe haben wir im Prinzip den gleichen Prozess wie beim Kühlschrank, hier ist nur das Ziel eine Heizung, das heißt möglichst viel Wärme Q2 dem Reservoir R2 zuzuführen bei minimaler zugeführter Arbeit W . Damit ergibt sich: • R1 = kalte Außenluft, oder kalter See, Fluss • R2 = Innere des Hauses • W = Arbeit des Motors
72
3 Grundlagen der Thermodynamik
Damit ergibt sich für den Wirkungsgrad Gl. (3.27) ηWärmepumpe = oder ηWärmepumpe =
Nutzen gepumpte Wärme = Aufwand zugeführte Arbeit
Q2 Q1 +W Q1 = = + 1 = ηKühlschrank + 1 W W W
und damit
T1 T2 +1 = (3.36) T2 − T1 T2 − T1 Hier haben wir typische Werte für die Wärmepumpe eines geheizten Hauses mit heißerem Brauch320K wasser (50o C) gegenüber einer Umgebungsluft von null Grad Celsius: ηmax = 320K−270K 6, wobei der realistische Wirkungsgrad bei ηreal 3 liegt. ηWärmepumpe ≤ ηmax =
3.5.5 Beispiele 3.5.5.1 Kohle-, Heizölkraftwerk Das Schema ist in Abb. (3.16) dargestellt. Hier ergibt sich theoretisch bei realistischen Tempe1 raturwerten eine Bilanz von: T2 = 1500K und T1 = 500K, woraus ein Wert von ηmax = T2T−T = 2 1000 1500 0.66 folgt, real gilt etwa ηKraftwerk = 0.3. Wasserdampf T2 = 1 500 K
Turbine
Welektrisch
kondensierter Dampf T1 = 500 K Abbildung 3.16: Kraftwerk, schematische Darstellung. Der Wasserdampf treibt eine Turbine, die Arbeit leistet, und er kühlt sich dabei ab.
3.5.5.2 Vergleich direktes/indirektes Heizen Direktes Heizen: Dies geschieht z.B. durch Zuführen von elektrischem Strom, siehe Abb. (3.17). Der Strom hält einen Kessel auf der Temperatur T2 . Dieser gibt pro Sekunde Wärme in
3.5 Wärmekraftmaschinen, Kühlmaschinen
73
das Haus ab, was dadurch auf der Temperatur T1 gehalten wird mit T1 < T2 . Wenn wir annehmen, dass die Arbeit des elektrischen Stroms ohne Verlust in Wärme umgesetzt werden kann, dann gilt Q = 1. Real ist der Wirkungsgrad Q = W . Damit ergibt sich also ein idealer Wirkungsgrad η = W etwa 0.4. Heizkessel T2 Q
W
Haus T1 Abbildung 3.17: Direktes Heizen durch elektrischen Strom, schematisch. Der Strom heizt einen Kessel auf die Temperatur T2 auf, der pro Sekunde so viel Wärme abgibt, dass das Haus auf der Temperatur T1 gehalten wird.
Indirektes Heizen: Wir betrachten einen Weg des indirekten Heizens, bei dem eine Wärmepumpe verwendet wird, siehe Abb. (3.18). Im oberen Prozess wird durch von außen zugeführte Arbeit (Verbrennen von Öl oder Kohle oder Zuführen von Strom) ein Heizkessel auf der Temperatur T2 gehalten. Beim Übertrag von Wärme an das Haus auf der Temperatur T1 wird Arbeit W geleistet, die im unteren Prozess dazu dient, eine Wärmepumpe zu betreiben, um Wärme aus dem kälteren Reservoir der Temperatur T0 (z.B. Außenluft) ins Haus zu pumpen. Mit realistischen Werten von η1 0.3 für den oberen Prozess und η2 3 für den unteren ergibt sich insgesamt ein realistischer Wirkungsgrad von η 1. Nach den obigen Betrachtungen ist deutlich, dass die direkte Heizung durch Umwandlung von elektrischer Energie in Wärme nicht optimal ist, weil man nur einen realistischen Wirkungsgrad von η ≈ 0.4 erreicht, während man durch Kombination mit einer Wärmepumpe η ≈ 1 bekommt. Auch die Ölzentralheizung stellt keine optimale Energienutzung dar. Man betreibe besser einen Dieselmotor mit dem Öl, dessen Abwärme das Haus z.T. heizt, und mit der geleisteten Arbeit betreibt man eine Wärmepumpe, die Wärme aus der Umgebung ins Haus pumpt. Mit realistischen Werten von ηMotor ≈ 0.3 und ηWärmepumpe ≈ 3 hätte man bereits einen guten realistischen Wirkungsgrad etwa von Eins, wobei die Heizwirkung der Abwärme noch nicht berücksichtigt ist.
74
3 Grundlagen der Thermodynamik
Heizkessel T2
Haus T1
W
außen T0 Abbildung 3.18: Wärmepumpe in einem indirekten Heizprozess. Die vom System geleistete Arbeit im oberen Prozess wird verwendet, um im unteren Prozess Wärme von der Außenwelt ins Haus zu pumpen.
3.5.6 Kreisprozesse allgemein Wie wir in den vorherigen Kapiteln studiert haben, kehrt die Arbeitssubstanz der Wärmekraftmaschine oder der Kühlmaschine nach einem Durchlauf wieder in den Anfangszustand zurück. Das gilt auch, wenn aus praktischen Gründen in der Dampfmaschine und im Verbrennungsmotor die Arbeitssubstanz periodisch ausgewechselt wird. Wir nehmen an, dass der Prozess quasistatisch verläuft, und somit können wir ihn durch eine geschlossene Kurve im (P,V )- und (T, S)Diagramm repräsentierenden11 . Man kann alle Prozesse in einfacher Weise charakterisieren, wie wir es am Beispiel eines im Uhrzeigersinn durchlaufenden Prozesses sehen: Die während eines Umlaufs nach außen abgegebene Arbeit ist durch das folgende geschlossene Linienintegral im (P,V )-Diagramm gegeben, welches gleich der durch den Kreisprozess eingeschlossenen Fläche 11 Es
dürfen also auch nicht-reversible Teilprozesse vorkommen, solange sie quasistatisch sind.
3.6 Der zweite Hauptsatz, quasistatische Prozesse, TdS-Gleichungen
F ist: W=
75
PdV = F
Die während des Prozesses bei einem Umlauf „netto” aufgenommene Wärme ist im (T, S)Diagramm gegeben durch Q=
T dS = F
Hierbei ist die von der Maschine „brutto” aufgenommene Wärme Q2 > 0 durch den Teil des Linienintegrals gegeben, der entlang des oberen Teils der Kurve verläuft (wachsende Abszisse) und damit gleich der Fläche zwischen Abszisse und diesem oberen Teils der Kurve ist. Die von der Maschine abgegebe Wärme |Q1 | ist gleich der Fläche zwischen Abszisse und dem unteren Teil der Kurve (abnehmende Abszisse). Es ist Q = Q2 − |Q1 |. Da die Maschine nach einem Umlauf wieder in den Ausgangszustand zurückkehrt, also insbesondere die innere Energie der Arbeitssubstanz unverändert ist, folgt aus dem Energiesatz Q=W Die ”netto” von der Maschine aufgenommene Wärmemenge ist gleich der nach außen geleisteten Arbeit W : Der Umlaufsinn12 und der Flächeninhalt im (P,V )- und (T, S)-Diagramm sind gleich. Der hier im Uhrzeigersinn () durchlaufene Prozess beschreibt eine Wärmekraftmaschine und es gilt Q = W > 0. Der Wirkungsgrad ist dann gleich η = W /Q2 . Für einen Umlauf gegen den Uhrzeigersinn () gilt Q = W < 0 und wir haben eine Kühlmaschine (η = |Q1 |/|W |) oder eine Wärmepumpe (η = |Q2 |/|W |).
3.6 Der zweite Hauptsatz, quasistatische Prozesse, TdS-Gleichungen 3.6.1 TdS-Gleichungen: Definitionen, Eigenschaften ¯ Wir hatten die dQ-Gleichungen beetrachtet, die im Wesentlichen den ersten Hauptsatz für quasistatische Prozesse darstellten und sich dabei formal auf den Wärmefluss konzentrierten. Jetzt ¯ betrachten wir die T dS-Gleichungen, die wie die dQ-Gleichungen sich auf quasistatische Prozesse beziehen, aber dann auch noch den zweiten Hauptsatz benutzen. Es wird somit mathematisch ausgenutzt, dass dS ein vollständiges Differential ist. Insgesamt sind die T dS-Gleichungen we¯ sentlich mehr auf die Praxis orientiert als die dQ-Gleichungen. Deshalb werden sie üblicherweise formuliert mit Hilfe von gewissen Koeffizienten, die praktische physikalische Bedeutung haben. Definitionen: 12 Hier
sind auf den Abszissen in beiden Fällen extensive und auf den Ordinaten intensive Größen aufgetragen. Häufig findet man (S, T )-Diagramme, die dann einen umgekehrten Umlaufsinn zur Folge haben.
76
3 Grundlagen der Thermodynamik
∂V thermischer Expansionskoeffizient ∂T P 1 ∂V isotherme Kompressibilität κT = − V ∂P T 1 ∂V adiabatische Kompressibilität κS = − V ∂P S
1 α =+ V
(3.37) (3.38) (3.39)
¯ Aus Umformungen der dQ-Gleichungen ergeben sich als Behauptung die T dSGleichungen für quasistatische Prozesse: unabh. Variable (T,V ):
T dS = CV dT +
α T dV κT
(3.40)
unabh. Variable (T, P):
T dS = CP dT − αTV dP
(3.41)
unabh. Variable (V, P):
T dS = CV
κT CP dP + dV α Vα
(3.42)
Wir führen den Beweis für T dS-Gl. (3.40) mit den unabhängigen Variablen (T,V ). Der Beweis für Gl. (3.41) mit den unabhängigen Variablen (T, P) verläuft nach gleichem Schema. Die Gl. (3.42) wird anschließend behandelt.
3.6.2 TdS-Gleichungen: Beweise Die Beweise benötigen Eigenschaften der Jacobi-Determinanten. Deshalb betrachten wir diese zunächst. 3.6.2.1 Jakobi-Determinanten Betrachte zwei Funktionen von zwei Variablen: f (u, v) and g(u, v). Die Jakobi-Determinante dazu ist definiert als ∂g ∂g ∂f ∂f ∂ ( f , g) = − (3.43) ∂ (u, v) ∂u v ∂v u ∂v u ∂u v Die Jakobi-Determinante erfüllt etliche Beziehungen: Sei u = u(x, y) und v = v(x, y), dann gilt die Kettenregel ∂ ( f , g) ∂ ( f , g) ∂ (u, v) = ∂ (x, y) ∂ (u, v) ∂ (x, y) Setzen wir g = v, dann erhalten wir aus Gl. (3.43) die einfachere Beziehung ∂f ∂ ( f , v) = ∂ (u, v) ∂u v
(3.44)
(3.45)
3.6 Der zweite Hauptsatz, quasistatische Prozesse, TdS-Gleichungen
77
Eine Determinante ändert ihr Vorzeichen bei Vertauschung zweier Spalten, also gilt ∂ ( f , g) ∂ ( f , g) =− ∂ (v, u) ∂ (u, v) Nimmt man die Kettenregel und setzt x = f und y = g, so ergibt sich aus Gl. (3.43) ∂ ( f , g) ∂ (u, v) =1 ∂ (u, v) ∂ ( f , g) Setzt man hier noch g = v, so ergibt sich aus Gl. (3.45)
∂f ∂u
= v
∂u ∂f
−1 (3.46) v
Am Ende erhalten wir aus Gl. (3.45) die Beziehung
∂f ∂u
= v
oder auch
∂ ( f , v) ∂ ( f , v) ∂ ( f , u) ∂v ∂ ( f , v) ∂ ( f , u) = =− =− ∂ (u, v) ∂ ( f , u) ∂ (u, v) ∂ ( f , u) ∂ (v, u) ∂u
∂f ∂u
v
∂u ∂v
f
∂v ∂f
f
∂f ∂v
= − u
∂f ∂v ∂u ∂v
u f
= −1 u
Diese Beziehung kann man auch bequemer schreiben nach Umbenennung f → x, u → y, v → z, wie man es oft in findet: ∂x ∂y ∂z = −1 (3.47) ∂y z ∂z x ∂x y −1 ∂x ∂y = ∂y z ∂x z Diese Formeln kann man sich leicht merken, weil drei zyklische Vertauschungen vorkommen. Damit haben wir die für uns wesentlichen Eigenschaften der Jacobi-Determinanten zusammengestellt. Der Vollständigkeit halber geben wir auch noch den folgenden Satz an: Seien x, y, z Größen, die eine Funktionalrelation f (x, y, z) = 0 erfüllen, und sei w eine Funktion von irgend zwei dieser Größen, dann gilt: ∂y ∂x ∂x = ∂y w ∂z w ∂z w 3.6.2.2 Beweis der TdS-Gleichungen ¯ Betrachte die dQ-Gleichung (3.11) mit den unabhängigen Variablen (T,V ): ∂E ¯ = CV dT + dQ + P dV ∂V T
78
3 Grundlagen der Thermodynamik
¯ = T dS gilt: Wir benutzen, dass für die quasistatische Prozesse dQ 1 ∂E CV dT + + P dV dS = T T ∂V T
(3.48)
Da nun aber dS wegen des zweiten Hauptsatzes ein totales Differential ist, ergibt sich nach Gl. (2.18,2.19) P ∂ CV 1 ∂E ∂ + = ∂V T T ∂ T V T ∂V T T Setzt man nun mit Gl. (3.13) CV = (∂ E/∂ T )V ein, so erhält man direkt ∂E ∂E 1 ∂ ∂ 1 ∂E 1 P 1 ∂P =− 2 + − + T ∂V T ∂ T V T ∂V T T ∂ T V ∂V T T 2 T ∂ T V und weil wegen der Eigenschaften des vollstdändigen Differentials Gl. (2.19) gilt, haben wir ∂ ∂ ∂ ∂ E= E. ∂V T ∂ T V ∂ T V ∂V T Es kürzen sich Terme weg und nach Multiplikation mit T 2 erhält man ∂P ∂E =T −P ∂V T ∂T V Einsetzen in die obige Gleichung (3.48) liefert die vorläufige Gleichung ∂P unabh. Var. (T,V ): T dS = CV dT + T dV ∂T V
(3.49)
¯ Bei unabhängigen Variablen (T, P) ist die analoge Gleichung ausgehend von der dQ-Gleichung (3.12): ∂V unabh. Var. (T, P): T dS = CP dT − T dP (3.50) ∂T P und mit Gl. (3.8) und unter Berücksichtigung von z.B. (∂ /∂V )P (1/T ) = −(∂ T /∂V )P /T 2 ∂T ∂T ∂P dV (3.51) unabh. Var. (V, P): T dS = CV dP + CV +T ∂P V ∂V P ∂T V Die Gl. (3.49,3.50,3.51) sind vorläufige Ergebnisse, die Terme auf der RHS müssen wir noch umformen, wozu wir bei (3.49) und (3.50) zeigen müssen, dass folgende Gleichungen gelten ∂P α = (3.52) ∂ T V κT ∂V = αV (3.53) ∂T P
3.6 Der zweite Hauptsatz, quasistatische Prozesse, TdS-Gleichungen
79
Die weitere Rechnung im Anschluss an Gl. (3.51) und wird später diskutiert. Der Beweis für Gl. (3.52) folgt sofort: Der Beweis für Gl. (3.52) wird mit Hilfe von Jakobi-Determinanten geführt: Wir nehmen f (P, T,V ) = 0 als Zustandsgleichung, verwenden Gl. (3.47), und setzen x = P, y = T , z = V . Damit gilt die häufig verwendete Gleichung: ∂V − ∂T −1 α ∂P = = P= (3.54) ∂ T ∂V ∂V ∂T V κT ∂V
P
∂P
∂P
T
T
Damit ist die erste T dS-Gleichung (3.40) bewiesen. Der Beweis für die zweite T dS-Gleichung (3.41) ist völlig analog. Die ditte T dS-Gleichung folgt direkt aus den Formeln für die spezifischen Wärmen, die wir jetzt diskutieren werden.
3.6.3 Eigenschaften von Wärmekapazitäten ¯ = Aus der Definition der Wärmekapazitäten erhalten wir sofort Ausdrücke, die die Relation dQ T dS ausnutzen: CV = CP =
∂Q ∂T ∂Q ∂T
=T
V
=T P
∂S ∂T ∂S ∂T
(3.55) V
(3.56) P
Man kann mit Hilfe der T dS-Gleichungen einen allgemeinen Ausdruck für CP − CV herleiten, der für beliebige quasistatische Prozesse gilt. Die Behauptung ist: CP −CV = TV
α2 κT
(3.57)
Diese Gleichung hat große praktische Konsequenzen. Wenn man Berechnungen der spezifischen Wärme durchführt, dann ist es vielfach angebracht, über die Zustandssumme zu gehen. Deshalb ist die Entropie eine wichtige Größe. Es ist dabei meistens am einfachsten, ein festes Volumen anzunehmen, in welchem man die Quantenzustände berechnet, dort berechnet man also CV . Im Labor arbeitet man aber meistens bei konstantem Druck, misst also CP : Für einen Vergleich von Theorie und Experiment muss man also einen gesicherten Zusammenhang zwischen S und CV und CP haben. Das wird in diesem Kapitel erfolgen. Die unten abgeleiteten Gleichungen werden auch alle verwendet, wenn wir den dritten Hauptsatz und die Unerreichbarkeit des Nullpunkts diskutieren. Beweis: Setze T dS-Gleichungen (3.49) und (3.50) gleich: CV dT + T
∂P ∂T
dV = CP dT − T V
∂V ∂T
dP P
80
3 Grundlagen der Thermodynamik
schreibe dT um: dT =
∂T ∂P
dP +
V
∂T ∂V
dV P
und setze ein: ∂T ∂P ∂T ∂V dV + (CP −CV ) dP = 0. (CP −CV ) −T −T ∂V P ∂T V ∂P V ∂T P Da P,V unabhängige Variablen sind, muss jede geschweifte Klammer gleich null sein. Beide Klammern führen zum gleichen Ergebnis, wie man mit Gl. (3.46) sofort sieht. Daraus folgt unter Verwendung der Relation (3.54) und der Definition (3.37) von α: CP −CV = T
∂P ∂T V ∂T ∂V P
= TV
α2 κT
q.e.d.
Jetzt sind wir auch in der Lage, die dritte T dS-Gl. (3.42) zu beweisen. Wir setzen Gl. (3.52) und Gl. (3.57) in Gl. (3.51) ein und wir erhalten sofort das gesuchte Resultat. Wenn die betrachteten Prozesse nicht nur quasistatisch, sondern auch adiabatisch sind, dann kann man CP und CV unabhängig voneinander durch α, κS , κT darstellen. Dies ergibt die folgenden Behauptungen für quasistatische adiabatische Prozesse: α2 κT − κS
(3.58)
κS κT
(3.59)
α 2 κS (κT − κS )κT
(3.60)
CP = TV
CV = CP oder CV = TV
Die Beweise sind einfach: Wegen der vorausgesetzten Adiabasie haben wir dS = 0 und damit spezielle Ausdrücke für CP ,CV , bei deren Ableitung berücksichtigt wird, dass die Entropie wegen dS = 0 festgehalten wird: ∂P dV = 0 T dS = CV dT + T ∂T V ∂P ∂V ⇒ CV = −T ∂T V ∂T S und ∂V dP T dS = CP dT − T ∂T P ∂V ∂P ⇒ CP = T ∂T P ∂T S
3.7 Freie Energie, Gibbssche Energie
81
daraus folgt
∂V ∂T
∂P ∂T
∂V ∂T
CP = − P S = − P ∂P ∂V ∂P CV ∂T
∂T
V
∂T
S
∂P ∂V
S
V
und mit Gl. (3.54) CP = CV
∂P ∂V
S
1 ∂P ∂V
= T
∂V ∂P ∂V ∂P
T =
κT κS
S
Zusammen mit CP − CV aus Gl. (3.57) erhalten wir nun (für quasistatische und adiabatische Prozesse) die Behauptungen Gl. (3.58),(3.59) und (3.60), was zu beweisen war. q.e.d.
3.7 Freie Energie, Gibbssche Energie Wir haben bisher im Wesentlichen abgeschlossene Systme betrachtet und Ausgleichsprozesse ihrer Untersysteme untersucht oder Arbeitszufuhr oder -abfuhr studiert. Die relevante Größe war die innere Energie zusammen mit dem ersten und dem zweiten Hauptsatz. In diesem Kapitel wollen wir Prozesse in offenen Systemen behandeln, bei denen Reaktionen unter Wechselwirkung mit einem Reservoir stattfinden. Die für uns relevanten Energien sind die Freie Energie (Kontakt mit einem Wärmereservoir) und die Gibbssche Energie (Kontakt mit einem Wärmeund Druckreservoir). Beide Fälle entsprechen wesentlich mehr der Realität in einem Labor.
3.7.1 Innere Energie Zum Verständnis des Folgenden eine kurze Wiederholung für ein abgeschlossenes System: Dort gilt für jeden spontanen Prozess: dS ≥ 0
dE = 0
¯ =0 dQ
Ferner gilt im Gleichgewicht: S = Maximum Wenn man die äußeren Parameter nicht ändert, gilt also ¯ =0 dW
E = const.
¯ =0 dQ
Ändert man hingegen die äußeren Parameter, so gilt für einen adiabatischen infinitesimalen Pro¯ . zess dE = dW Also: Die Arbeit, die das abgeschlossene System leistet, ist gleich der Abnahme der inneren Energie und die Arbeit, die dem System zugeführt wird, gleich der Zunahme der inneren Energie. Die innere Energie kann demnach als der bei konstanter Entropie verfügbare Arbeitsvorrat angesehen werden.
82
3 Grundlagen der Thermodynamik
3.7.2 Freie Energie (Helmholtzsche Freie Energie) Die Freie Energie F (oder auch Helmholtzsche freie Energie genannt) ist bei der Bestimmung des Gleichgewichtszustandes eines nicht abgeschlossenen Systems im Kontakt mit einem Wärmereservoir von Nutzen. Sie ist definiert als13 F = E −TS
Freie Energie
(3.61)
Die Freie Energie ist der isotherm verfügbare Arbeitsvorrat eines thermodynamischen Systems. Um dies zu erläutern, betrachte ein kleines System A im Wärmekontakt mit einem Wärmereservoir konstanter Temperatur T0 . Bei einem beliebigen Prozess in A kann also Wärme von A ins Reservoir bzw. Wärme aus dem Reservoir in das System A fließen. Ein quasistatischer Prozess läuft isotherm ab und das System A hat die Temperatur des Reservoirs. Siehe Abb. (3.19).
T0
B A Abbildung 3.19: Schematisches Bild zur Erläuterung der (Helmholtzschen) Freien Energie. Das kleine System A ist im Wärmekontakt mit dem großen System B, das die Temperatur T0 hat. Alle Prozesse laufen unter diesen Bedingungen ab.
Wir werden die folgenden Behauptungen beweisen: Bei einem mechanisch isolierten System, das auf konstanter Temperatur gehalten wird, wird die Freie Energie niemals größer. Der Gleichgewichtszustand ist derjenige Zustand, bei dem die Freie Energie ein Minimum hat. Um diese Aussagen zu beweisen, betrachte einen beliebigen (also auch irreversiblen) Prozess im System A. Bei diesem gilt für das Gesamtsystem: ΔS0 ≥ 0
mit
ΔS0 = ΔSA + ΔSB
Nimmt man an, dass A eine Wärmemenge QA an das Reservoir B bei einem Prozess abgibt, so 13 Hier
sind die Bezeichnungen in der Literatur nicht eindeutig, sobald man magnetische Systeme betrachtet. Dort ist der äußere Parameter und die ”Kanonische Freie statt V , wie wir es hier betrachten, ein angelegtes Magnetfeld H Dann definiert man noch die ”Helmholtzsche Freie Energie” als A(T, M) = Energie” ist gegeben durch F = F(T, H). +M · H, wobei M die Magnetisierung ist. Das Differential lautet dA = −SdT + H · d M. F(T, H)
3.7 Freie Energie, Gibbssche Energie
83
erhält man nach Gl. (2.45) Entropiezunahme14 im Wärmereservoir B ΔSB =
QA T0
Wenn A die Arbeit WA verrichtet, dann gilt für A nach dem ersten Hauptsatz ΔEA = −QA −WA ⇒
QA T0 ΔSA ΔEA +WA = − T0 T0 T0 Δ(T0 SA − EA ) −WA = ≥0 T0
ΔS0 = ΔSA +
oder ΔS0 =
−WA − ΔFA ≥0 T0
(3.62)
Dabei hat man definiert FA = EA − T0 SA
(3.63)
Aus FA und der bekannten Relation ΔS0 ≥ 0 erhält man WA ≤ −ΔFA
(3.64)
Für einen beliebigen Prozess im Kontakt mit einem Wärmereservoir (fester Temperatur) gilt also nach Gl. (3.64): • Die vom System A geleistete Arbeit WA ist kleiner oder gleich (−ΔFA ). • Bei einem reversiblen Prozess gilt WA = −ΔFA . • Wird in einem Prozess keine Arbeit geleistet, WA = 0, also z.B. bei einem mechanisch isolierten System, so ist ΔFA ≤ 0. Das heißt, dass bei einem spontanen Prozess die Freie Energie abnimmt oder gleich bleibt, aber keinesfalls wächst. • Folge: Das System A im Kontakt mit dem Wärmereservoir B der gegbenen Temperatur T0 ist genau dann im Gleichgewicht, wenn seine Freie Energie FA ein Minimum hat: Gleichgewicht bei festem T0 :
FA = Minimum
(3.65)
• Ist der Prozess quasistatisch, so ist die Temperatur des Systems A immer gleich T0 und das FA der Gl. (3.63) geht in die Definition der Freien Energie (3.61) über.
3.7.3 Gibbssche Energie (Freie Enthalpie) Die Gibbssche Energie (auch Freie Enthalpie genannt) ist wie die Freie Energie bei der Bestimmung des Gleichgewichts eines nicht abgeschlossenen Systems von Nutzen. Hier betrachten wir 14 Bei
einem Wärmereservoir gilt Gl. (2.45) für jegliche, auch irreversible, Wärmezufuhr.
84
3 Grundlagen der Thermodynamik
jedoch ein System im Kontakt mit einem Wärme- und Druckreservor. Die Gibbssche Energie ist definiert als G = E − T S + PV
(3.66)
Die Gibbssche Energie ist der verfügbare Arbeitsvorrat eines thermodynamischen Systems, das sich bei konstanter Temperatur und konstantem Druck befindet, was vielen Experimentierbedingungen im Labor entspricht. Es gelten die analogen Aussagen wie für die Freie Energie: Bei einem System, das bei konstanter Temperatur und unter konstantem Druck gehalten wird, wird die Gibbssche Enerie niemals größer. Folgerung: Der Gleichgewichtszustand ist derjenige Zustand, bei dem die Gibbssche Energie ein Minimum hat. Ein quasistatischer Prozess läuft isotherm und bei festem Druck des Reservoirs ab.
T0 , P0
B A Abbildung 3.20: Schematisches Bild zur Erläuterung der Gibbsschen Energie. Ein kleines Systems A befindet sich im Kontakt mit einem Reservoir der Temperatur T0 und des Drucks P0 und alle Prozesse finden unter diesen Bedingungen statt.
Zum Beweis dieser Aussagen betrachte ein kleines nicht abgeschlossenes System A. Es hat Kontakt zu einem Wärmereservoir B, das sich bei konstanter Temperatur T0 und konstantem Druck P0 befindet. Für jeden beliebigen Prozess in A gilt: ΔS0 ≥ 0
ΔS0 = ΔSA + ΔSB
Nimmt man an, dass A bei einem solchen Prozess eine Wärmemenge QA an B abgibt und eine Arbeit WA leistet, so erhält man QA ΔSB = T0 und nach dem ersten Hauptsatz für A ΔEA = −QA −WA oder
ΔEA = −QA − P0 ΔVA −WA∗
3.7 Freie Energie, Gibbssche Energie
85
Hierbei ist mit WA∗ jegliche vom System A geleistete Arbeit gemeint außer solcher, die durch eine Volumenänderung erzeugt wird. Z.B. kann WA∗ magnetische oder elektrische Arbeit sein, die von A erzeugt wird. Daraus folgt QA = −ΔEA − P0 ΔVA −WA∗ und somit T0 ΔSA QA T0 ΔSA −ΔEA − P0 ΔVA −WA∗ + = + T0 T0 T0 T0 ∗ −WA − ΔGA = ≥0 T0
ΔS0 =
⇒
Hier hat man definiert Mit T0 > 0 ergibt sich
GA = EA − T0 SA + P0VA
(3.67)
WA∗ ≤ −ΔGA
(3.68)
Für einen beliebigen Prozess im Kontakt mit einem Reservoir, das die Temperatur T0 und den Druck P0 hat gilt also: • Die vom System A geleistete nicht-mechanische Arbeit WA∗ ist kleiner oder gleich (−ΔGA ). • Bei einem reversiblen Prozess gilt ΔWA∗ = −ΔGA . • Hält man alle äußeren Parameter außer dem Volumen eines Systemes fest, d.h. ΔWA∗ = 0, so ist ΔGA ≤ 0. • Folge: Das Gleichgewicht von A, das im Kontakt mit einem Reservoir fester Temperatur T0 und festen Drucks P0 gehalten wird, ist genau dadurch bestimmt, dass GA ein Minimum annimmt. Gleichgewicht bei festem T0 und P0 :
GA = Minimum
(3.69)
• Für einen quasistatischen Prozess hat das System A immer die Temperatur und den Druck des Reservoirs. Für diesen Fall geht Gl. (3.67) in die Definition der Gibbsschen Energie (3.66) über.
3.7.4 Stabilitätsbedingungen: Homogene Substanz Wir betrachten nun Stabilitätsbedingungen einer homogenen Substanz und konzentrieren uns wieder auf ein System A im Kontakt mit einem Reservoir fester Temperatur T0 bzw. im Kontakt mit einem Reservoir fester Temperatur T0 und festen Drucks P0 . Wir wissen, dass im Gleichgewicht die Freie Energie FA bzw. die Gibbssche Energie GA ein Minimum haben müssen, d.h. dass dFA = 0 bzw. dGA = 0 sein muss. Aus der Tatsache, dass wir nicht nur ein Extremum vorliegen haben, sondern darüber hinaus ein Minimum, kann man Stabilitätsbedingungen für die spezifische Wärme bei konstantem Volumen, i.e. CV ≥ 0, und für die isotherme Kompressibilität, i.e. κT ≥ 0, ableiten, die alle homogenen Substanzen (also Flüssigkeiten, Gase, Festkörper in einer Phase) erfüllen müssen. Zum Schluss schlagen wir dann eine hochinteressante Brücke zur Statistischen Mechanik.
86
3 Grundlagen der Thermodynamik
3.7.4.1 Stabilität gegenüber Temperaturfluktuationen bei konstantem V Betrachte ein System in Kontakt mit einem Reservoir gegebener Temperatur T0 . Wir erwarten, dass das Minimum von FA bei der Temperatur T0 des Reservoirs liegt, werden das aber zunächst nicht voraussetzen, sondern formal beweisen. Wir tun dies, weil wir im Anschluss an diese Rechnung unter Verwendung dieser Formeln die erwähnte Bedingung CV ≥ 0 beweisen und das Prinzip von Chatelier diskutieren können. Angenommen, das Minimum von FA läge bei T˜ . Wir betrachten das System aber bei der Temperatur T , die sich nicht viel von T˜ unterscheiden soll. Dann können wir FA entwickeln unter der Voraussetzung, dass dV = 0, wobei im Folgenden alle Ableitungen an der Stelle T˜ zu nehmen sind: ∂ FA 2 ∂ 2 FA 1 + T − T˜ + ... FA (T ) = FA (T˜ ) + T − T˜ ∂T V 2 ∂T2 V und erhalten bei stabilem Minimum an T˜ : ∂ FA =0 ∂T V Wegen Gl. (3.63) folgt
∂ FA ∂T
= V
und
∂ EA ∂T
∂ 2 FA ∂T2
− T0 V
≥0
(3.70)
V
∂ SA ∂T
(3.71) V
Wir nehmen an, dass von T˜ nach T ein quasistatischer Prozess führt. Dann gilt allgemein T˜ dS = dE + PdV und bei dV = 0 haben wir T˜ dS = dE oder 1 ∂ EA ∂ SA = ∂ T V T˜ ∂ T V Einsetzen in Gl. (3.71) ergibt
∂ FA ∂T
V
T0 ∂ EA = 1− ∂ T V, T˜
(3.72)
und da bei T = T˜ laut Voraussetzung das Minimum vorliegt und somit die linke Seite der Gleichung verschwindet, bekommen wir aus der rechten Seite wie erwartet T˜ = T0 . Der Ausdruck (3.72) ist nun nützlich zur Berechnung der zweiten Ableitung: 2 2 ∂ FA ∂ EA T0 ∂ EA T0 ∂ 2 EA = + − ∂T2 V ∂ T 2 V T˜ 2 ∂ T V T˜ ∂T2 V oder
∂ 2 FA ∂T2
V
T0 = 1− T˜
∂ 2 EA ∂T2
T0 + 2 T˜ V
∂ EA ∂T
V
was wegen Gl. (3.70) für T˜ = T0 als Stabilitätsbedingung ergibt, dass CV (T0 ) ≥ 0 positiv ist:
∂ EA ∂T
≥ 0 oder CV (T0 ) ≥ 0 V
(3.73)
3.7 Freie Energie, Gibbssche Energie
87
Diese Bedingung entspricht dem Prinzip von Chatelier: Wenn ein System sich in einem stabilen Gleichgewichtszustand befindet, dann muss jede spontane Änderung seiner Parameter Prozesse in Gang bringen, die das System zum Gleichgewicht zurücktreiben. Man kann das illustrieren an folgendem Beispiel. Angenommen, durch irgendeine Fluktuation sei die Temperatur T des Systems A höher als T0 . Dann muss Wärme von A nach B fließen, wodurch sich die innere Energie EA um ΔEA erniedrigt. Nach Chateliers Prinzip muss sich jetzt die Temperatur von A um ΔT erniedrigen, weshalb dann beide negativ sind und gilt ΔEA /ΔT ≥ 0, was genau der Stabilitätsbedingung (3.73) entspricht. 3.7.4.2 Stabilität gegenüber Volumenfluktuationen bei konstantem T0 Betrachte wieder ein System in Kontakt mit einem Reservoir gegebener Temperatur T0 und gegebenen Drucks P0 . Betrachte jetzt Volumenfluktuationen. Wir werden sehen, dass wir die erwähnte Aussage über die isotherme Kompressibilität κT ≥ 0 leicht gewinnen können. Zur Beschreibung der Fluktuationen entwickeln wir GA um das Gleichgewichtsvolumen von A, was wir als V˜ an˜ von dem wir erwarten, dass er gleich P0 nehmen. Der entsprechende Gleichgewichtsdruck sei P, ist. Die folgenden Ableitungen sind alle an T0 und P˜ zu nehmen. 2 ∂ 2 GA ∂ GA 1 ˜ ˜ ˜ + V −V + ... GA (V ) = GA (V ) + V − V ∂V V˜ ,T0 2 ∂V 2 V˜ ,T0 Die Bedingung, dass GA (V˜ ) stationär ist, erfordert dass ∂ GA =0 ∂V V˜ ,T0 Mit Gl. (3.67) können wir das umschreiben zu ∂ SA ∂ GA ∂ EA = − T0 + P0 ∂V V˜ ,T0 ∂V V˜ ,T0 ∂V V˜ ,T0 ˜ und (V˜ , P) ˜ ein quasistatischer Prozess ablaufen könnte. Wir nehmen an, dass zwischen (V, P) ˜ , und erhalten Dann können wir mit den ersten Hauptsatz verwenden, i.e. T0 dS = dE + PdV ∂ EA ∂ SA = + P˜ T0 ∂V V˜ ,T0 ∂V V˜ ,T0 Kombination der letzten beiden Gleichungen ergibt ∂ GA = −P˜ + P0 ∂V V˜ ,T0 offenbar erhalten wir hier, dass Gleichgewicht bei Volumenfluktuation herrscht, wenn die LHS verschwindet und damit P˜ = P0 gilt, was zu erwarten war. Die Bedingung der Stabilität erfordert weiter 2 ∂ GA ≥0 ∂V 2 V˜ ,T0
88
was sofort ergibt
3 Grundlagen der Thermodynamik
∂ 2 GA ∂V 2
V˜ ,T0
=−
∂ P˜ ∂V
V˜ ,T0
≥0
was man auch bei einem beliebigem Gleichgewichtszustand allgemein durch die isotherme Kompressibilität κT von Gl. (3.38) ausdrücken kann, die damit positiv sein muss, was zu beweisen war: 1 ∂V κT = − ≥0 (3.74) V ∂P T 3.7.4.3 Brücke zur Statistischen Mechanik Auch wenn wir zurzeit ausschließlich klassische Thermodynamik treiben und unsere statistischen Kenntnisse nicht formal notwendig, aber zum Verständnis hilfreich sind, ist es nützlich, bei den Energien E, F und G und den entspechenden Situationen im Gleichgewicht eine Brücke zur Statistischen Mechanik zu schlagen. Dazu betrachten wir jeweils das kleine System A und nehmen an, dass dieses durch einen externen Parameter y gekennzeichnet sei, z.B. das Aussehen des Volumens oder ein externes Magnetfeld. Die unten abgeleiteten Gleichungen (3.75), (3.76) und (3.77) beschreiben systematisch die Gleichgewichtsstatistik eines abgeschlossenen Systems, eines Systems im Kontakt mit Wärmereservoir mit festem T0 , und eines Systems im Kontakt mit Reservoir mit festem T0 und P0 . Abgeschlossenes System Es bezeichne Ω(y) die Anzahl der zulässigen Mikrozustände, wenn sich y im Intervall [y − δ y, y] befindet. Die Entropie ist dann S(y) = kB log Ω(y). Wenn y frei beweglich ist, dann ist die Wahrscheinlichkeit P(y), das System im Intervall [y − δ y, y] zu finden, gleich S(y) (3.75) P(y) ∝ Ω(y) = exp kB Diese Gleichung zeigt explizit, dass das System einen Wert von y anstrebt, bei dem P(y) und damit auch S(y) maximal sind. System im Kontakt mit Reservoir mit festem T0 Wir betrachten die Situation WA = 0 und y sei wieder ein externer Parameter, der A beschreibt, z.B. der Druck bei unverändertem Volumen. Es seien SA (y) und EA (y) bekannt und wenn y von einem Wert y1 nach y wechselt, dann ändern SA und EA ihre Werte und wir haben ΔSA = SA (y) − SA (y1 ) und ΔEA = EA (y) − EA (y1 ) = Q. Die Entropie des Wärmereservoires B ändert sich, weil Q von B absorbiert wird. Deshalb gilt für das Gesamtsystem nach Gl. (3.62) wegen WA = 0: ΔS0 = −
ΔFA T0
In einer Gleichgewichtssituation ist die Wahrscheinlichkeit P(y), dass y im Bereich [y − δ y, y] liegt, proportional zur Zahl der zulässigen Zustände Ω0 des Gesamtsystems, also gilt S0 P(y) ∝ Ω0 (y) = exp kB
3.8 Thermodynamische Potenziale
89
Wir nehmen nun y1 als irgendeinen festen Wert an, um Gl. (3.62) anzuwenden, die für ΔS0 gilt: S0 (y) = S0 (y1 ) −
ΔFA FA (y) − FA (y1 ) = S0 (y1 ) − T0 T0
Wir können alle von y1 abhängigen Größen in einer Proportionalitätskonstante zusammenfassen, weil sich y1 nicht ändert. Somit erhalten wir das wichtige statistische Ergebnis FA (y) (3.76) P(y) ∝ exp − kB T0 Man sieht gleich, dass die wahrscheinlichste Situation diejenige ist, bei der FA (y) ein Minimum aufweist. Wenn E(y) eine Konstante ist, wie es bei einem abgeschlossenen System vorliegt, dann gilt (bei vorausgesetztem W = 0), dass FA = −T0 SA und Gl. (3.76) geht in Gl. (3.75) über, wie es auch sein sollte. System im Kontakt mit Reservoir mit festem T0 und festem P0 Gl. (3.76) können wir hier schreiben GA (y) P(y) ∝ exp − kB T0
Völlig analog zum Fall von
(3.77)
und auch hier sehen wir, dass die Gleichgewichtssituation gegeben ist durch das Minimum von GA .
3.8 Thermodynamische Potenziale 3.8.1 Definitionen und Eigenschaften Wir haben bereits die thermodynamische Zustandsgrößen (Energiearten) Innere Energie E, Freie Energie F und Gibbssche Energie G (siehe u.a. Kap.3.7) kennengelernt. Zusätzlich zu diesen führt man noch die Enthalpie H ein mit H = E + PV
(3.78)
Nun gelten folgende Aussagen, die wir im Zusammenhang mit den Maxwell-Relationen beweisen werden: Wir definieren thermodynamische Potenziale als die uns bekannten Energien E, F, H, G, wenn diese in Abhängigkeit von genau spezifizierten (unabhängigen) natürlichen Variablen formuliert werden: Thermodynamische Potenziale S,V :
E = E(S,V )
T,V :
F = F(T,V ) = [E − T S](T,V )
S, P :
H = H(S, P) = [E + PV ](S, P)
T, P :
G = G(T, P) = [E − T S + PV ](T, P)
(3.79)
90
3 Grundlagen der Thermodynamik
Die Potenziale hängen natürlich noch von der Teilchenzahl N ab15 . Wenn man davon einmal absieht, stammen die beiden anderen unabhängigen Variablen jeweils aus einer der zwei Klassen (S, T ) (innere Parameter) und (V, P) (äußere Parameter). In den natürlichen Variablen, und nur in diesen, haben die Differentiale der thermodynamischen Potenziale eine besonders einfache Struktur, die für sehr viele thermodynamischen Rechnungen äußerst hilfeich ist: S,V : T,V : S, P : T, P :
dE = T dS − PdV
(3.80)
dF = −SdT − PdV
(3.81)
dH = T dS +V dP
(3.82)
dG = −SdT +V dP
(3.83)
Wir definieren ebenfalls die folgenden wichtigen und in der Praxis häufig verwendeten Zustandsgleichungen: kalorische Zustandsgleichung
E = E(T,V )
(3.84)
thermische Zustandsgleichung
P = P(T,V )
(3.85)
In der Zustandsgleichung E = E(T,V ) ist E nicht in seinen natürlichen Variablen S,V definiert und der Druck ist keine Zustandsgröße. Beide Größen sind also keine thermodynamischen Potenziale, enthalten also (siehe unten) nicht die vollständige thermodynamische Information über das System. Die thermodynamischen Potenziale sind extensive Größen, wie man sofort nachprüfen kann, da E, S und V extensiv sind und T und P intensiv sind. Die thermodynamischen Potenziale haben die folgenden wichtigen Eigenschaften, die wir alle beweisen werden: • Wenn man ein thermodynamisches Potenzial kennt, dann kennt man die vollständige thermodynamische Information des Systems. • Folge: Aus einem thermodynamischen Potenzial kann man alle anderen thermodynamischen Potenziale bestimmen. • Folge: Aus jedem thermodynamischen Potenzial kann man auch S(E,V ) und Ω(E,V ) bestimmen. • Folge: Die kalorische Zustandsgleichung E = E(T,V ) und die thermische Zustandsgleichung P = P(T,V ) können aus jedem thermodynamischen Potenzial berechnet werden. Die Information in den Zustandsgleichungen ist allerdings nicht vollständig, d. h., die Kenntnis von E(T,V ) und P(T,V ) ersetzt nicht die Kenntnis eines der thermodynamischen Potenziale. • Aus der thermischen Zustandsgleichung P = P(T,V ) an allen Temperaturen und an allen Volumina und der Kenntnis der spezifischen Wärme CV (T,V0 ) an allen Temperaturen und einem einzigen beliebigem Volumen kann man die thermodynamischen Potenziale herleiten. Diese beiden Informationen beinhalten also die vollständige thermodynamische 15 Da
die Teilchenzahl sich in den folgenden Betrachtungen nicht ändert, wird sie bei den Variablen meistens weggelassen.
3.8 Thermodynamische Potenziale
91
Information. Das sind die wesentlichen Aussagen über thermodynamische Potenziale. Wir werden sie später durch Einführung von chemischen Potenzialen verallgemeinern auf Teilchenaustausch zwischen verschiedenen Phasen. Wir werden im Laufe dieses Kapitels alle obigen Aussagen beweisen.
3.8.2 Maxwell-Relationen Die obigen Aussagen sind äquivalent zu den Maxwell-Relationen, die im Folgenden hergeleitet werden. Sie gelten unter quasistatischen Bedingungen und reiner mechanischer Arbeit16 . Die Behauptungen sind: ∂P ∂T =− Maxwell Relation 1 (3.86) ∂V S ∂S V ∂T ∂V = Maxwell Relation 2 (3.87) ∂P S ∂S P ∂S ∂P = Maxwell Relation 3 (3.88) ∂V T ∂T V ∂V ∂S =− Maxwell Relation 4 (3.89) ∂P T ∂T P und die Relationen gelten nach Gl. (3.46) auch in der inversen Form. Also lautet z.B. die erste Maxwell-Relation (3.86) auch: ∂S ∂V =− etc. ∂T S ∂P V Beweise: Wir starten vom ersten Hauptsatz mit rein mechanischer Arbeit unter Annahme eines quasistatischen Prozesses: dE = T dS − PdV (3.90) wobei nur vollständige Differentiale vorkommen, was im Folgenden oft ausgenutzt wird. Benutzt wird auch d(T S) = SdT + T dS (3.91) d(PV ) = PdV +V dP Unabhängige Variablen S, V:
Es gilt E = E(S,V ) und damit: ∂E ∂E dE = dS + dV ∂S V ∂V S
oder nach Vergleich mit Gl. (3.90) T= 16 Generalisierungen
(3.92)
∂E ∂S
−P =
V
∂E ∂V
(3.93) S
zu nicht-mechanischer Arbeit, z.B. beim Magnetismus, gibt es natürlich, werden in diesem Buch aber weniger behandelt. Wer sich dafür interessiert, dem sei Schwabl [Sch06] empfohlen.
92
3 Grundlagen der Thermodynamik
Da dE nun aber ein vollständiges Differential ist, ergibt sich ∂ ∂E ∂E ∂ ∂ 2E ∂ 2E = = ⇒ ∂V ∂ S ∂ S∂V ∂V S ∂ S V ∂ S V ∂V S
q.e.d.
−P
T
Hieraus folgt die 1. Maxwell-Relation (3.86). Es gilt H = H(S, P), und damit
Unabhängige Variablen S, P:
dE = T dS − PdV = T dS − PdV − d(PV ) + d(PV ) = T dS − d(PV ) +V dP oder mit der Definition der Enthalpie (3.78) H = E + PV ⇒
d(E + PV ) = T dS +V dP
womit wir Gl. (3.82) bewiesen haben: dH = T dS +V dP Mit der Beziehung
∂H ∂H dS + dP ∂S P ∂P S ∂H ∂H T= V= ∂S P ∂P S
dH = ⇒
(3.94)
Weil die Enthalpie eine Zustandsgröße ist und daher dH ein vollständiges Differential ist, muss die Reihenfolge der Ableitungen gleichgültig sein, es muss also gelten ∂H ∂H ∂ ∂ = ∂P S ∂S P ∂S P ∂P S
T
oder
∂T ∂P
V
= S
∂V ∂S
q.e.d. P
was die 2. Maxwell-Relation (3.87) beweist. Unabhängige Variablen T, V:
Es gilt F = F(T,V ) und damit: F = E −TS
woraus direkt Gl. (3.81) folgt: dF = −SdT − PdV
3.8 Thermodynamische Potenziale
93
⇒
−S =
∂F ∂T
−P = V
∂F ∂V
(3.95) T
auch hier nutzen wir wieder aus, dass dF ein vollständiges Differential ist, also gilt ∂P ∂S = q.e.d. ∂V T ∂T V was die 3.Maxwell-Relation (3.88) ist. Unabhängige Variablen T, P:
Es gilt G = G(T,V ) und damit: G = E − T S + PV
woraus Gl. (3.83) folgt: ⇒ und daraus folgt
dG = −SdT +V dP ∂G ∂G −S = V= ∂T P ∂P T
∂S − ∂P
= T
∂V ∂T
(3.96)
q.e.d. P
womit wir die 4. und letzte Maxwell-Relation (3.89) bewiesen haben.
3.8.3 Berechnung der thermodynamischen Potenziale und Zustandsgleichungen Wir kennen aus Kap.3.8.1 die Behauptung: Wenn man ein thermodynamisches Potenzial kennt, also E(S,V ), F(T,V ), H(S, P) oder G(T, P), dann kennt man die vollständige thermodynamische Information. Folge: Aus einem thermodynamischen Potenzial kann man alle anderen berechnen. Folge: die kalorische Zustandsgleichung E = E(T,V ) kann berechnet werden Folge: die thermische Zustandsgleichung P = P(T,V ) kann berechnet werden. In diesem Unterkapitel bringen wir die Beweise dafür. Der Beweis funktioniert immer so, siehe Beginn der folgenden Tabelle, dass man z.B. von der Kenntnis von E = E(S,V ) ausgeht und aus dE die Temperatur und den Druck definiert, die damit auch von S,V abhängen, also T = T (S,V ) und P = P(S,V ). Dann können wir umformen und von T (S,V ) übergehen zu S(T,V ) und V (T, S). Diese so hergeleiteten Größen benutzen wir dann später als Bausteine für die thermodynamischen Potenziale. Durch Umformen erhält man aus E(S,V ) sofort S(E,V ) und Ω(E,V ), was damit ebenfalls die vollständige thermodynamische Information enthält. Im Einzelnen haben wir folgende Schemata: E(S,V dE = T dS − PdV ): 1.
⇒
T=
⇒
P=−
∂E
V ∂ S ∂E ∂V
S
→
T (S,V )
S(T,V ) V (T, S)
→
P(S,V ) V (S, P)
S(V, P)
94
3 Grundlagen der Thermodynamik
F(T,V ) : ∂F 2. ⇒ S = − ∂ T V ⇒ P = − ∂∂VF
T
H(S, P) : ∂H 3. ⇒ T = ∂ S P ⇒ V = ∂∂HP S
4.
⇒ ⇒
G(T,P) : S = − ∂∂ G T P V = ∂∂ GP
dF = −SdT − PdV →
S(T,V )
V (S, T )
T (S,V )
→
P(T,V ) V (T, P)
T (P,V )
dH = T dS +V dP →
S(T, P)
P(T, S)
T (S, P)
→
V (P, S)
P(S,V )
S(P,V )
dG = −SdT +V dP
T
→
S(T, P)
T (P, S)
P(S, T )
→
V (P, T ) P(T,V ) T (P,V )
Das in der obigen Tabelle angedeutete Schema der Berechnung der thermodynamischen Potenziale wird an folgendem Beispiel erläutert, bei dem man von E = E(S,V ) ausgeht und die anderen Potenziale in deren natürlichen Variablen berechnet: Man startet von E = E(S,V ) und formuliert nach folgendem Schema um: aus 1. (T,V ) :
E(S,V ) = E(S(T,V ),V ) = E(T,V ) =⇒ F(T,V ) = E(T,V ) − T S(T,V )
aus 1. (S, P) :
E(S,V ) = E(S,V (S, P)) = E(S, P) =⇒ H(S, P) = E(S, P) + PV (S, P)
Jetzt haben wir F(T,V ) und H(S, P) und können G(T, P) berechnen: aus 2. und 3.
(T, P) :
E(S,V ) = E(S(T, P),V (T, P)) = E(T, P)
=⇒ G(T, P) = E(T, P) − T S(T, P) + PV (T, P) So haben wir aus E = E(S,V ) alle anderen thermodynamischen Potenziale berechnet. Obendrein erhalten wir aus der Kenntnis von E(S,V ) auch S = S(E,V ) und daraus auch Ω(E,V ). Bei diesem Beispiel sind wir von E = E(S,V ) gestartet, wir hätten mit gleicher Logik auch von einem anderen thermodynamischen Potenzial aus starten können und alle anderen hergeleitet. Die Zustandsgleichungen bekommt man auch: Man erhält bereits in 2. direkt die thermische Zustandsgleichung P(T,V ). Die kalorische Zustandsgleichung bekommt man durch: E(T,V ) erhält man aus 1.: E(S,V ) = E(S(T,V ),V ) = E(T,V )
3.8.4 Berechnung von F(T, V) ausgehend von P(T, V) und CV (T, V0 ) Wir beweisen in diesem Unterkapitel die Behauptung, dass die thermische Zustandsgleichung zusammen mit der Kenntnis von CV (T,V0 ) die vollständige thermodynamische Information enthalten. Wir starten von der Kenntnis von P(T,V ) und CV (T,V0 ) und berechnen [Fli99] dann CV (T,V ), anschließend verschaffen wir uns S(T,V ) und E(T,V ) von da aus können wir F(T,V ) = E(T,V ) − T S(T,V ) schreiben. Damit haben wir ein thermodynamisches Potenzial, nämlich das der Freien Energie in den natürlichen Variablen.
3.8 Thermodynamische Potenziale
95
Aus dem Differential von S folgt dS =
∂S ∂T
dT + V
∂S ∂V
dV. T
Es folgt mit der Maxwell-Relation (3.88), i.e. (∂ S/∂V )T = (∂ P/∂ T )V , und der Gl. (3.55), i.e. CV = T (∂ S/∂ T )V , sofort : ∂P CV (T,V ) dT + dS = dV (3.97) T ∂T V Weil wir laut Voraussetzung P = P(T,V ) kennen, ist (∂ P/∂ T )V bekannt, und wir können diesen Ausdruck weiter verarbeiten. 3.8.4.1 Berechnung von CV (T,V ) aus CV (T,V0 ) Nun der Beweis, dass man CV (T,V ) für alle T und V berechnen kann, ausgehend von bekanntem CV (T,V0 ) an allen T und einem V0 und der thermischen Zustandsgleichung P = P(T,V ) an allen T und V : Wir gehen von Gl. (3.97) aus und verwenden, dass dS ein vollständiges Differential ist, also gilt ∂ CV ∂S ∂ LHS: = ∂V T ∂ T V ∂V T T 2 ∂ ∂ P ∂S RHS: = ∂ T V ∂V T ∂T2 V oder:
∂CV ∂V
=T
T
∂ 2P ∂T2
(3.98) V
Das können wir integrieren und erhalten CV (T,V ) = CV (T,V0 ) + T
V 2 ∂ P V0
∂T2
(T,V )dV
V
Wenn man also CV (T,V ) für ein Volumen V0 und dazu die thermische Zustandsgleichung P = P(T,V ) kennt, kann man CV (T,V ) für alle Volumina berechnen. 3.8.4.2 Berechnung von S(T,V ) Wir starten wiedervonGl. (3.97). Diese können wir umschreiben, denn wir kennen vollständig CV (T,V ) und ∂∂ TP (T,V ). Bei der Integration sind zwei verschiedene äquivalente Wege V möglich, siehe Abb. (3.21): T V ∂P CV (T ,V0 ) dT + (T,V )dV Weg 1 (3.99) S(T,V ) − S(T0 ,V0 ) = T ∂T V T0 V0
96
3 Grundlagen der Thermodynamik
V
V 2 V0 1
0
T0
T
T
Abbildung 3.21: Verschiedene äquivalente Integrationswege bei der Berechnung von S = S(T,V )
oder S(T,V ) − S(T0 ,V0 ) =
T CV (T ,V )
T
T0
dT +
V ∂P V0
∂T
(T0 ,V )dV
Weg 2
(3.100)
V
Damit ist S(T,V ) auch bekannt. 3.8.4.3 Berechnung von E(T,V ) Aus dem ersten Hauptsatz dE = T dS − PdV folgt: ∂S ∂S dE = T dT + T dV − PdV ∂T V ∂V T ∂S = ∂∂ TP , und verwenden Gl. und wir wenden die Maxwell-Gleichung (3.88) an, i.e. ∂V T V (3.55), i.e. CV = T ∂∂ TS : V
∂P − P dV dE = CV dT + T ∂T V
Diese Gleichung kennen wir bereits. Daraus folgt durch Integration (auch hier wieder zwei Wege möglich) T V ∂P CV (T,V0 )dT + − P (T,V )dV (3.101) E(T,V ) − E(T0 ,V0 ) = T ∂T V T0 V0 oder äquivalent E(T,V ) − E(T0 ,V0 ) =
T T0
CV (T ,V )dT +
V ∂P T
V0
∂T
V
− P (T0 ,V )dV
3.8 Thermodynamische Potenziale
97
Wir können jetzt die Freie Energie in ihren natürlichen Variablen hinschreiben, weil wir E(T,V ) und S(T,V ) bereits haben: F(T,V ) = E(T,V ) − T S(T,V ) Damit haben wir das Potenzial der Freien Energie F(T,V ) bestimmt und können daraus nach dem Schema von Kap. 3.8.3 alle anderen thermodynamischen Potenziale festlegen.
3.8.5 Das van der Waals-Gas E pot
0 r
Abbildung 3.22: Das van der Waals-Gas: Das Wechselwirkungspotential zweier Moleküle des Gases in Abhängigkeit vom Relativabstand.
Das van der Waals-Gas ist ein Modell für ein realistisches Gas, bei dem eine Atom-AtomWechselwirkung vorliegt, wie sie schematisch in Abb. (3.22) dargestellt ist. Es wird phänomenologisch beschrieben durch die thermische Zustandsgleichung, die zugleich die Gleichung für eine Isotherme ist: a (3.102) P + 2 (V − b) = RT a, b > 0 V oder P=
RT a − 2 V −b V
(3.103)
Im Folgenden sollen die Formeln der früheren Kapitel verwendet werden, um einige thermodynamische Potenziale aus der thermischen Zustandsgleichung zu berechnen. Wir wissen, dass noch Information von der spezifischen Wärme für eine vollständige Berechnung der thermodynamischen Potenziale nötig ist, die beim van der Waals-Gas aber allgemein nicht in einer einfachen analytischen Form zur Verfügung steht. Wir werden sehen, dass CV des van der WaalsGases nicht vom Volumen abhängt. Über seine Temperaturabhängigkeit CV (T ) kann man keine generelle Aussage machen, weil diese für jede Gassorte verschieden ist17 . 17 Wir
erinnern, dass wir hier nur die thermische Zustandsgleichung des van der Waals-Gas verwenden, die keine vollständige thermodynamische Information darstellt.
98
3 Grundlagen der Thermodynamik
Wir berechnen die innere Energie nach Gl. (3.101) und Gl. (3.103). Wir benötigen dafür ∂P a −P = 2 (3.104) T ∂T V V Es fehlt noch die Berechnung von CV : Wir hatten Gl. (3.98) und somit nach direkter Rechnung: 2 ∂ R ∂ P = T T =0 ∂T2 V ∂T V V −b
oder
∂CV ∂V
=0 T
Das CV des van der Waals-Gases hängt also nicht vom Volumen ab! Obwohl wir die Temperaturabhängigkeit CV (T ) von CV nicht kennen, schreiben wir dennoch die relevanten Formeln hin, machen dann aber die Zusatz-Annahme dass CV nicht nur unabhängig vom Volumen sondern auch von der Temperatur ist, also gilt CV = const. Damit ergibt sich nach Gl. (3.101) a + const (3.105) V Dies ist die kalorische Zustandsgleichung des van der Waals-Gases für konstantes CV . Man vergleiche mit idealem Gas: E(T,V ) = CV T , was man im Limes a → 0 erhält. Wir berechnen nun die Entropie: Mit dem Druck (3.103) erhalten wir nach Gl. (3.99) CV = const
⇒
E(T,V ) = CV T −
T CV (T )
S(T,V ) − S(T0 ,V0 ) =
T
T0
dT + R log(V − b)
und für CV = const ergibt sich S(T,V ) = CV log T + R log(V − b) + S0
(3.106)
Das ist die Entropie des van der Waals-Gases. Aus dieser können wir sofort die Adiabatengleichung herleiten, weil bei dieser S(T,V ) = const: R
T (V − b) CV = const.
(3.107)
Betrachte als Beispiel die freie adiabatische Expansion des van-der-Waals Gases, also (T1 ,V1 ) → (T2 ,V2 ), siehe Abb. (3.23). ¯ = 0, da adiabatisch, und dW ¯ = 0, da weder Arbeit aufgenommen noch geleistet wird. Es gilt dQ Also haben wir E(T1 ,V1 ) = E(T2 ,V2 ) und daraus folgt nach Gl. (3.105) CV T1 −
a a = CV T2 − V1 V2
und somit T2 − T1 =
a CV
1 1 − V2 V1
0 und V2 > V1 . Das (reale) van der Waals-Gas kühlt also unter freier adiabatischer Expansion ab, das ideale (limes a → 0) nicht! Das van der Waals-Gas muss bei der Expansion Arbeit gegen die inneren Anziehungskräfte verrichten, deshalb nimmt seine Temperatur ab, siehe anziehenden Teil des Atom-Atom-Potenzials in Abb. (3.22). Die Entropieänderung bei der freien adiabatischen Expansion ergibt sich mit Gl. (3.106) zu S2 − S1 = CV log
T2 V2 − b + R log T1 V1 − b
Das Gas erfährt eine Entropieerhöhung, was man allerdings der Formel nicht direkt ansieht. Die Gleichungen des idealen Gases ergeben sich ganz trivial für b = 0 und a = 0.
3.9 Der dritte Hauptsatz der Thermodynamik Dritter Hauptsatz: Die Entropie eines Systems am absoluten Nullpunkt ist eine universelle Konstante, die man als Null annehmen darf. T →0
=⇒
S→0
Diese Aussage ist sehr allgemein, weil sie sich auf jedes System bezieht und besagt, dass S = 0 ist für T = 0, ohne Rücksicht auf irgendwelche andere Parameter, von denen S abhängen könnte. Bisher war nur die Entropiedifferenz in Gl. (3.2) definiert. Durch den dritten Hauptsatz wird der Wert der Entropie für jeden Zustand eines jeden Systems eindeutig festgelegt.
3.9.1 Wärmekapazität, Expansionskoeffizient Beh: Die Wärmekapazität CR (T ) entlang eines beliebigen reversiblen Weges R verschwindet für T → 0. Experimentell ist diese Tatsache an vielen Materialien verifiziert worden. Das heißt lim CR (T ) = 0
(3.109)
T →0
Bew: Sei R ein beliebiger, reversibler Weg (entlang eines solchen Weges ist immer die Temperatur definiert), der den Nullpunkt mit einem Zustand a verbindet, so gilt: S(a) =
Ta ¯ dQrev 0
T
=
Ta CR (T ) 0
T
dT
100
3 Grundlagen der Thermodynamik
Mit Ta → 0 muss nach dem dritten Hauptsatz gelten S(Ta → 0) = 0, dies geht jedoch nur dann, wenn im obigen Integral CR (T → 0) → 0. Ist dies nicht erfüllt, divergiert das Integral. q.e.d. Beh: Am absoluten Nullpunkt verschwindet der thermische Expansionskoeffizient α, also. 1 ∂V α= →0 für T → 0 (3.110) V ∂T P Es gilt auch
∂V ∂T
→0
für T → 0
(3.111)
P
∂P →0 für T → 0 (3.112) ∂T V Bew: Betrachte zum Beweis von Gl. (3.110) einen reversiblen Weg mit konstantem Druck. Mit der 4. Maxwell-Gl. (3.89) gilt ∂S Vα = =− somit: ∂P T P T T ¯ ∂ dQ CP (T ) ∂ Vα = − =− dT ∂P T 0 T ∂P T 0 T
∂V ∂T
Bei einem reversiblen Weg mit konstantem Druck gilt also: T CP (T ) ∂ dT Vα = − ∂ P T T 0 Das kann direkt umgeschrieben werden, was weiter unten bewiesen wird: T 2 ∂V ∂ V ∂V dT = (T ) − (T = 0) Vα = − ∂T2 P ∂T P ∂T P 0 Offenbar geht dieses Integral gegen Null für T → 0, was unsere Behauptung beweist. Beweis für das Umschreiben: Es gilt die T dS-Gleichung (3.41)
(3.113)
T dS = CP dT − αTV dP Daraus folgt direkt, was wir schon in Gl. (3.56) hatten: CP ∂S = ∂T P T und weil dS ein vollständiges Differential ist, kann man mit Hilfe der Maxwell-Relation (3.89) umformen ∂ ∂ ∂ CP ∂S ∂S = = = ∂P T T ∂P T ∂T P ∂T P ∂P T 2 ∂ ∂V ∂ V = − =− ∂T P ∂T P ∂T2 P
3.9 Der dritte Hauptsatz der Thermodynamik
101
Damit haben wir das obige Umschreiben gerechtfertigt und somit insgesamt gezeigt, dass Gl. (3.111) gilt. Auf gleiche Weise kann man Gl. (3.112) zeigen, wobei man von der MaxwellRelation (3.88) ausgeht. q.e.d. Die Gl. (3.112) und (3.111) bedeuten, dass sowohl das Volumen bei konstantem Druck als auch der Druck bei konstantem Volumen mit Steigung null auf der Ordinate enden, wenn die Temperatur auf der Abszisse gegen null geht, siehe Abb. (3.24). V
0
T
Abbildung 3.24: Annäherung an T = 0: Das Volumen V (bei konstantem Druck) eines Systems strebt in Abhängigkeit von der Temperatur T mit der Steigung null in den Nullpunkt der Temperatur. Für den Druck P (bei konstantem Volumen) ergibt sich qualitativ die gleiche Kurve.
3.9.2 Unerreichbarkeit von T = 0, adiabatisches Kühlen 3.9.2.1 Satz von der Unerreichbarkeit des absoluten Nullpunkts Es gilt der Satz: Ein System kann nicht durch endliche Änderung der thermodynamischen Zustandsgrößen auf den absoluten Nullpunkt abgekühlt werden. Wir wissen bereits, dass nach Gl. (3.110) und Gl. (3.109) gilt CP (T ) → 0 und α = V1 ∂V ∂T P → 0 für T → 0. Behauptung: Beide Größen gehen so gegen Null, dass auch noch gilt Vα = endliche Konstante CP
für T → 0
(3.114)
Der Beweis folgt unten. Wir diskutieren zunächst die Konsequenzen: Betrachte die T dS-Gleichung (3.41), i.e. T dS = CP dT − αTV dP, und mache jetzt eine adiabatische Druckänderung (dS = 0). Dann erhalten wir für die Temperaturänderung dT =
αV T dP CP
(3.115)
Für T → 0 und unter der Annahme, dass V α/CP endlich ist, muss dP gegen unendlich gehen, damit dT endlich bleibt. Da das in der Realität nicht möglich ist, muss dT → 0 gehen, wenn wir
102
3 Grundlagen der Thermodynamik
uns dem Nullpunkt nähern: Durch eine endliche Anzahl von Schritten kommen wir dem Punkt T = 0 beliebig nahe, aber da die Schrittweite gegen Null geht, erreichen wir den Nullpunkt nie. Das bedeutet Unerreichbarkeit des absoluten Nullpunktes. Beweis, dass V α/CP endlich für T → 0: Es gibt den empirischen Befund: (3.116) CP (T ) = T σ a(P) + b(P)T + c(P)T 2 + ... Wobei σ > 0 eine experimentell bestimmte, positive Konstante ist: ∂CP = T σ (a + b T + c T 2 + ...) ∂P T mit z.B. a (P) = (∂ a/∂ P)T . Mit obiger Gl. (3.113) erhalten wir durch direktes Einsetzen T dT ∂CP (T ) b T σ a = −T Vα = − + + ... ∂P σ σ +1 0 T T und daraus bekommen wir nach Einsetzen von Gl. (3.116) für T → 0 a Vα = endliche Konstante =− T →0 CP aσ lim
für gegebenes P. Damit ist der Satz von der Unerreichbarkeit des absoluten Nullpunkts bewiesen. q.e.d. 3.9.2.2 Adiabatische Kühlung: Adiabatisches Kühlen ist ein Prozess, der explizit den dritten Hauptsatz der Thermodynamik verwendet, um tiefe Temperaturen zu erreichen. Die Entropie eines Systems hängt außer von der Temperatur T noch von anderen Parametern X ab, wie z.B. Volumen, Druck, äußerem Magnetfeld etc. Während eines reversiblen adiabatischen Prozesses ist die Entropie konstant, i.e. S(T, X) =const. Ändert man dabei den Parameter X, dann muss sich auch T ändern. Führt man die Änderung von X in der passenden Richtung durch, so erhält man eine Temperaturerniedrigung. Konkret kann man das an folgendem Beispiel eines Gases in einem Behälter betrachten, wobei man X = V wählt und V1 > V2 voraussetzt, siehe Abb. (3.25). Wir führen hintereinander zwei Prozesse durch: 1. Isotherme Kompression. Der Gasbehälter ist in thermalem Kontakt mit einem Wärmereservoir der Temperatur Ta und das Gas wird komprimiert, i.e. V1 → V2 . Es gilt ΔT = 0. Die Entropie erniedrigt sich, also ΔS < 0 2. Adiabatische reversible Expansion. Das Wärmereservoir wird vom Gasbehälter entfernt und das Gas somit thermisch isoliert. Es wird adiabatisch und reversibel expandiert (V2 → V1 ) und ΔS = 0, wodurch es sich abkühlt: Ta → Tb . Beim idealen Gas z.B. haben wir die γ−1 γ−1 Adiabatengleichung (3.26) TbV1 = TaV2 , nach der wir erhalten V2 2 Tb = ( )3 < 1 Ta V1
3.10 Phasen und Phasenübergänge
103
S X1 2
0
Tb
1 X2
Ta
T
Abbildung 3.25: Adiabatisches Kühlen: Hintereinanderausführung einer isothermen Kompression (1) und einer adiabatischen reversiblen Expansion (2) führt zu Temperaturerniedrigung. In diesem Beispiel bedeutet der Parameter X das Volumen V .
3. Die obigen zwei Prozesse werden wiederholt. Wegen des dritten Hauptsatzes der Thermodynamik gilt für T → 0 auch S → 0. Das heißt, beide Kurven enden im (0, 0)-Punkt, dem man beliebig nahe kommen kann, aber den man wegen des schrittweisen Prozesses niemals ganz erreichen kann. Abb. (3.25) zeigt diese Zusammenhänge.
3.10 Phasen und Phasenübergänge Betrachte ein System A bestehend aus zwei Phasen, z.B. Wasser und Wasserdampf18 , bei konstanter Temperatur T und konstantem Druck P, wobei beides durch Kontakt von A mit einem großen Reservoir gehalten werden soll. Dieses Reservoir ist üblicherweise das Labor oder sonst eine Umgebung mit festem T und P. Nach Kap. 3.7.3 ist unter diesen Bedingungen das Gibbssche Potenzial die relevante Größe zur Beschreibung thermodynamischer Vorgänge in A. Wir betrachten in diesem Kapitel den wichtigen Fall, bei dem sich die Phasen in A ineinander umwandeln können. Siehe zur Illustration Abb. (3.26).
3.10.1 Gleichgewichtsbedingungen System A: Wir kennen die Definition der Gibbsschen Energie G(T, P) = E − T S + PV . Das Gleichgewicht des Systems A ist gegeben nach Gl. (3.69) durch das Minimum seiner Gibbsschen Energie GA (T, P) bei gegebenem (T, P) des Reservoirs. Im Gleichgewicht haben wir also dGA = 0 gegenüber allen Variationen der äußeren Parameter außer der Variation von (T, P). Wir beschränken uns hierbei als einzige Freiheitsgrade auf die Teilchenzahlen und Volumina der beiden Phasen. Wir wissen, dass die Gibbssche Energie eine extensive Größe ist, weil E, S,V 18 Unter
Wasserdampf verstehen wir hier ein Gas aus Wassermolekülen. Das oft auftretende weiße Gemisch aus solchem Gas mit kondensierten Wassertröpfchen, gemeinhin Dampf genannt, ist nicht damit gemeint.
104
3 Grundlagen der Thermodynamik
Reservoir T, P Q
Phase 2 n2 , V2 Phase 1 n1 , V1 Abbildung 3.26: Zwei Phasen mit ni Molen und den Volumina Vi (i = 1, 2) bilden das kleine System A und sind über einen beweglichen und wärmedurchlässigen Kolben mit einem Reservoir der Temperatur T und dem Druck P gekoppelt, und alle Prozesse laufen bei dieser Temperatur und diesem Druck ab. Zwischen den beiden Phasen können Teilchen, Volumina und Wärme ausgetauscht werden.
extensiv sind und T, P intensiv. Weil sich die Phasen ineinander umwandeln können, müssen wir für jede Phase die Gibbssche Energie pro Mol betrachten. Sei nun die Gibbssche Energie pro Mol des Stoffs der Phase i = 1, 2 im System A gegeben durch gi , und sei ni die Anzahl der Mole von Phase i. Wir nehmen an, dass keine Stoffmenge verloren geht, also gilt: n1 + n2 = const. Für eine gegebene Temperatur T und Druck P haben wir somit GA (T, P) = n1 g1 (T, P) + n2 g2 (T, P) Wenn wir also eine Umwandlung der Phasen haben mit n1 → n1 + dn1 und n2 → n2 + dn2 , dann gilt dn2 = −dn1 , und dann ändert sich das Gibbssche Potenzial wie dGA = g1 dn1 + g2 dn2 = dn1 (g1 − g2 ) Es ergibt sich also als Gleichgewichtsbedingung dGA = 0 bei gegebenem (T, P) ausgedrückt in der Gibbsschen Energie pro Mol: Gleichgewichtsbedingung:
g1 (T, P) = g2 (T, P)
(3.117)
Hierbei ist gi (T, P) im Allgemeinen für jedes i eine jeweils verschiedene Funktionen von T und P. Das heißt, damit Gleichgewicht herrscht, d.h. ein stabiler zeitunabhängiger Zustand des aus den zwei Phasen bestehenden Systems A, muss das Wertepaar (T, P) gerade so sein, dass g1 (T, P) = g2 (T, P). Wenn dies nicht erfüllt ist, wandelt sich spontan eine Phase in die andere um, was wir sofort sehen können: Betrachte nämlich bei dem vorgegebenen Paar (T, P) die
3.10 Phasen und Phasenübergänge
105
Situation, wenn beide Phasen vorliegen und z.B. g1 (T, P) < g2 (T, P) gilt, also die Gleichgewichtsbedingung nicht erfüllt ist. Wir wissen, dass bei einem spontan ablaufenden Prozess die Gibbssche Energie abnehmen muss. Also können wir feststellen: Wenn bei gegebenem (T, P) (Versuchsbedingungen im Labor) gilt Wenn: g1 (T, P) < g2 (T, P)
dann: Minimum von GA (T, P) gegeben in Phase 1
Es wandelt sich spontan Phase 2 in Phase 1 um und am Ende dieses Prozesses gibt es nur noch Phase 1. Das Volumen V1 wird dann festgelegt durch die Forderung, dass GA (n2 = 0,V1 ,V2 = 0, T, P) = Minimum bei festem T und P. Wenn Gleichgewicht vorliegt, also Gl. (3.117) erfüllt ist, dann ist das System A bei jedem Verhältnis n1 /n2 im Gleichgewicht. Das ist so vorzustellen: Ist aufgrund irgendwelcher Anfangsbedingungen n1 und n2 gegeben, so bleibt das System in diesem Zustand. Die Volumina V1 und V2 sind festgelegt durch die Bedingung, dass GA (n1 , n2 ,V1 ,V2 , T, P) = Minimum. Durch Hinzufügen bzw. Entziehen von latenter Wärme (siehe unten) kann man den Zustand ändern und z.B. n1 erhöhen und n2 erniedrigen, wie wir später genauer studieren werden. Im neuen Verhältnis n1 /n2 ist das System nach wie vor im Gleichgewicht.
3.10.2 Phasengleichgewichtslinie, latente Wärme 3.10.2.1 Clausius-Clapeyron-Gleichung Phasengleichgewichtslinie g 1 = g2
P Phase 1 g 1 < g2
Phase 2 g 1 > g2
0
T
Abbildung 3.27: Phasen im (P, T )-Diagramm. Gezeichnet sind die Phasengleichgewichtslinie und Bereiche, in denen das System im Gleichgewicht sich nur in einer Phase befindet.
Für das Folgende definieren wir die Phasengleichgewichtslinie als die Ortslinie aller (T, P)Punkte, bei denen Gleichgewicht zwischen zwei Phasen herrscht, siehe Abb. (3.27). Je nachdem, wie wir mathematisch diese Kurve beschreiben, ist es sinnvoll, die folgenden Größen entlang der Phasengleichgewichtslinie zu definieren: Dampfdruck:
Pd (T ) = P(T )
(3.118)
106
3 Grundlagen der Thermodynamik
Übergangstemperatur:
TU (P) = T (P)
(3.119)
Für die Phasengleichgewichtslinie gilt die Behauptung, dass sie durch die Differentialgleichung von Clausius-Clapeyron gegeben ist: dP s2 − s1 (P, T ) (P, T ) = dT v2 − v1
(3.120)
Hier bedeuten si (T, P) die Entropie pro Mol und vi (T, P) das Volumen pro Mol, jeweils in der Phase i. Dann ist noch (dP/dT )(P, T ) die Ableitung der Phasengleichgewichtslinie im (P, T )Diagramm genommen an der Stelle (P, T ). Beweis: Auf der Phasengleichgewichtslinie gilt: g1 (T, P) = g2 (T, P). Dann muss bei infinitesimalen Änderungen 1. Ordnung entlang der Phasengleichgewichtslinie auch die folgende Gleichung gelten: g1 (T + dT, P + dP) = g2 (T + dT, P + dP) woraus sich ergibt g1 (T + dT, P + dP) − g1 (T, P) = g2 (T + dT, P + dP) − g2 (T, P) oder zusammengefasst dg1 (T, P) = dg2 (T, P) Mit dem Differential dg aus Gl. (3.83) folgt nun: dgi = −si dT + vi dP woraus wir erhalten −s1 dT + v1 dP = −s2 dT + v2 dP Hieraus folgt direkt Gl. (3.120) oder auch dP Δs (T, P) = (T, P) dT Δv
q.e.d.
Das bedeutet: An einem gegebenen Punkt (T, P) im Diagramm P = P(T ) ist die Ableitung dP/dT proportional zur Änderung der Entropie pro Mol geteilt durch die Änderung des Volumens pro Mol beim vollständigen Übergang19 von einer Phase zur anderen. Definiere in diesem Zusammenhang die Latente Wärme ΔL bzw. die Latente Wärme pro Mol Δl: Sie dient zur Phasenumwandlung bei gegebener Temperatur, nicht zur Temperaturerhöhung. Sie ist an einem Punkt (T, P) der Phasenübergangslinie definiert definiert als Δl = T Δs(T, P) = T [s2 (T, P) − s1 (T, P)]
(3.121)
Das bedeutet: Wenn man einen Punkt (T, P) der Phasengleichgewichtslinie hat, dann kann man dort Phase 1 in Phase 2 umwandeln durch kontrollierte Zufuhr von latenter Wärme Δl. Man kennt 19 In
der rechten Seite kürzt sich die betrachtete Stoffmenge heraus, man ist also nicht darauf angewiesen, Entropie pro Mol zu nehmen, man kann Zähler und Nenner mit einer anderen Anzahl Mole multiplizieren. Auf die Richtung des Phasenübergangs kommt es nicht an, denn man könnte Zähler wie Nenner von Gl. (3.120) mit (−1) multiplizieren, ohne dass sich eine Änderung ergäbe.
3.10 Phasen und Phasenübergänge
107
nun Δl und kann v2 − v1 messen, wodurch man s2 (T, P) − s1 (T, P) kennt und somit die Entropieänderung bestimmt hat. Nach der Clausius-Clapeyron-Gleichung (3.120) kennt man dann an dieser Stelle auch (dP/dT )(T, P) und kann damit den nächsten Punkt der Phasengleichgewichtslinie bestimmen. Mit der obigen Definition der latenten Wärme schreibt sich die Clausius-ClapeyronGleichung am Punkt (T, P) der Phasengleichgewichtslinie in der üblichen Form: Clausius-Clapeyron:
Δl dP = dT T Δv
(3.122)
Man erhält durch solche Konstruktion ein übliches Phasendiagramm mit drei Phasen, i. e. gasförmig, flüssig und fest, wie es in Abb. (3.28) dargestellt ist: Im Triple-Punkt A sind alle 3 Phasen im Gleichgewicht: g1 (T, P) = g2 (T, P) = g3 (T, P). Der Punkt C heißt kritischer Punkt, denn für Druck oder Temperatur jenseits des kritischen Punktes kann man zwischen der flüssigen und gasförmigen Phase nicht mehr unterscheiden. Wenn man sich also entlang der gasförmig-flüssig Phasengleichgewichtskurve von Punkt A nach Punkt C bewegt, dann wird der Unterschied zwischen den g(T, P) beiderseits der Kurve immer geringer und verschwindet am Punkt C. Für die Phasen gilt im Allgemeinen:
Mittlerer Abstand der Moleküle gasförmig: groß flüssig: klein fest: klein
Grad der Wechselwirkung klein groß groß
Ordnungsgrad des Systems ungeordnet ungeordnet geordnet
P
C
fest flüssig A gasförmig
0
T
Abbildung 3.28: (P, T )-Phasendiagram einer normalen Substanz mit fester, flüssiger und gasförmiger Phase. Der Tripelpunkt ist angedeutet durch A, der kritische Punkt durch C. Alle Kurvenabschnitte sind monoton steigend.
108
3 Grundlagen der Thermodynamik
3.10.2.2 Tripelpunkt, Definition Kelvin Der Tripelpunkt des Wassers ist eindeutig definiert als der Punkt definierten Drucks P und definierter Temperatur T , bei dem alle drei Phasen des Wassers miteinander im Gleichgewicht koexistieren. Experimentell ist der Punkt präzise zu identifizieren, weil dort T unverändert bleibt bei einer relativen Änderung der Stoffmengen in den drei Aggregatzuständen. Deshalb wird er zur Definition der Temperatureinheit Kelvin verwendet. Nach internationaler Übereinkunft gibt man der Temperatur des Tripelpunktes von Wasser den Wert Tripelpunkt:
T = 273.16 Kelvin
(3.123)
Celsius-Grade Θ sind dann definiert als Θ = T − 273.16. Nachdem die Temperatureinheit festgelegt ist, bestimmt man mit Hilfe der Zustandsgleichung PV = RT die Rydberg-Konstante R als (3.124) R = (8.3143 ± 0.0012) Joule Mol−1 Kelvin−1 Mit Hilfe der Loschmidtschen Zahl bzw. Avogadros Zahl N = (6.02252 ± 0.00028) · 1023 Moleküle pro Mol
(3.125)
erhält man dann die Boltzmannsche Konstante
oder
kB = (1.38054 ± 0.00018) · 10−16 erg Kelvin−1
(3.126)
kB = 1.3806568 × 10−23 Joule Kelvin−1
(3.127)
Der Druck beim Tripelpunkt von Wasser beträgt 6.09 Hectopascal.
3.10.3 Phasenübergänge 3.10.3.1 Phasenübergang flüssig → fest Wir betrachten jetzt einen Prozess, bei dem wir die Phasengleichgewichtslinie, die die feste von der flüssigen Phase trennt, von flüssig nach fest überschreiten. Hierfür gilt ΔS < 0, da das System von einem ungeordneten (flüssig) in einen geordneten (fest, Gitter) Zustand übergeht. Diese Entropieänderung wird vom Wärmereservoir (Laboratorium, Umgebung) aufgebracht. Dabei ist üblicherweise ΔV < 0, weil der Festkörper dichter gepackt ist. Damit haben wir dS/dV > 0, weil Zähler und Nenner < 0 sind. Mit der Maxwell-Relation (3.88) haben wir bei gegebenem (T, P) für s und v: dP ds (P, T ) = (P, T ) > 0 dv T dT V Also haben wir in dem (P, T )-Diagramm eine positive Steigung der Phasengleichgewichtslinie zwischen fest und flüssig. Ausnahme ist die Anomalie des Wassers: Dort haben wir beim Übergang Wasser → Eis eine Volumenvergrößerung ΔV > 0 und da ΔT < 0, folgt ΔP/ΔT < 0. Siehe Abb. (3.29). Wir wissen alle um die große biologische Bedeutung der Tatsache, dass Eis eine geringere Dichte als Wasser hat und deshalb auf dem Wasser schwimmt.
3.10 Phasen und Phasenübergänge
109
P
C flüssig fest A gasförmig
0
T
Abbildung 3.29: (P, T )-Phasendiagram von Wasser. Beim Phasenübergang fest-flüssig hat die Phasengleichgewichtslinie eine negative Steigung (Anomalie). Die anderen Kurvenabschnitte sind monoton steigend. Tripelpunkt und kritischer Punkt sind angegeben. Vergleiche mit vorheriger Abb. (3.28) einer normalen Substanz.
3.10.3.2 Phasenübergang flüssig → gasförmig Hier kann man nicht von vornherein wissen, wie sich die Entropie verhält, weil beide Zustände ungeordnet sind. Relevant ist der Dampfdruck, der in Gl. (3.118) definiert wurde als derjenige Druck Pd (T ) bei der Temperatur T , bei dem das Gas im Gleichgewicht mit seiner Flüssigkeit steht. Das bedeutet, dass der Punkt (T, Pd (T )) auf der Phasengleichgewichtslinie liegt, an der man das Gas auch Dampf nennt. (Beh:) Es gilt die Näherungsformel Δl (0) Pd (T ) = Pd exp − (3.128) RT (0)
wobei Pd eine experimentell zu bestimmende Konstante ist. Beweis unter folgenden Voraussetzungen: vflüssig /vgas 1, und Δl bzw. ΔL sind nur schwach von T abhängig, und es gelte auch die ideale Gasgleichung für ein Mol Dampf (Pvgas = RT ). Dann gilt der Beweis: Wir kennen die Clausius-Clapeyron-Gl. (3.122)
Und weil Δv = vgas − vfl¨ussig ≈ vgas
dPd (T ) Δl = dT T Δv gilt auch Pd (T )Δv = RT und daher
1 Δl Δl 1 dPd = = Pd dT Pd T Δv RT 2 Wenn wir jetzt annehmen, dass Δl nicht von der Temperatur abhängt, dann gilt sofort Δl + const RT womit Gl. (3.128) bewiesen wäre. q.e.d. Der Dampfdruck Pd (T ) nimmt also mit steigender Temperatur steil zu, wobei der Anstieg durch die latente Wärme bei der Verdampfung bestimmt ist. log(Pd ) = −
110
3 Grundlagen der Thermodynamik
Beispiel: Eis → Wasser Betrachte die Druckabhängigkeit des Schmelzpunktes Die Latente Wärme von Wasser bei T = 0◦ C bzw. 273 Kelvin beträgt ΔL = 335 · 107 erg/g. Eis hat ein Volumen pro Gramm von V1 = 1.09070cm3 /g. Wasser hat ein Volumen pro Gramm von V2 = 1.00013 cm3 /g. also: ΔV = V2 −V1 = −0.0906 cm3 /g und somit ΔL 335 × 107 erg/cm3 atm dP = = −135 dT T ΔV −273 × 0.0906 K K Also: Ein Anstieg im Druck um 135 Atmosphären erniedrigt den Schmelzpunkt um 1 Kelvin bzw. 400 Atmosphären erniedrigen um 3 K. (1 atm entspricht 10 m Wassersäule und ist gleich 1.0132 · 105 N/m2 oder etwa 105 N/m2 oder etwa 106 dyn/cm2 , 1erg = 1dyn · 1cm). Die Folgen: Wandern von Gletschern, das Eis schmilzt am Boden weg (d.h. Eis unter einem Druck von 400 atm ist bei −3◦ C noch Wasser). In der Natur gibt es verschieden dichte Eissorten, dort sinkt im Schnitt der Schmelzpunkt um 0.06 K pro 100 m auflastendem Eis. Das Eis friert wieder, wenn der Druck nachlässt. Beispiel: Wasser → Dampf Betrachte die Druckabhängigkeit des Siedepunktes. Die Latente Wärme beim Übergang Wasser zu Dampf bei 100◦ C beträgt ΔL = 2257 · 107 erg/g. V1 = 1.043cm3 /g, V2 = 1673cm3 /g (Volumenänderung, Achtung: von 1 cm3 zu 1.6 Litern) 2 ΔL 2257 · 107 erg/g dP 4 dyn/cm = = 3.6 · 10 dT T ΔV 373 · 1672cm3 /g K K
Also: Beim Druckunterschied zwischen Meereshöhe und Spitze des Mount Everest von −6.5 · 105 dyn/cm2 ergibt sich dann ein ΔT = −6.5 · 105 dyn/cm2 /3.6 · 104 = −18 K. Also nimmt der Siedepunkt von 100◦ C auf 82◦ C ab.
3.11 Phasenübergang im van der Waals-Gas Wir betrachten ein System mit der thermischen Zustandsgleichung P = P(T,V ) ähnlich der des van der Waals-Gases. Das ist generell eine gute Approximation für ein reales Gas. Wir benötigen aber nur die Struktur der Gleichung bzw. ihren qualitativen Verlauf, nicht jedoch ihre konkrete Gestalt. a P + 2 (v − b) = RT (3.129) v Die verschiedenen Isothermen im P − V -Diagramm sind beispielhaft gezeichnet in Abb. (3.29) mit T1 > T2 > T3 .
3.11.1 Stabilität und Instabilität, kritischer Punkt Betrachte Abb. (3.30). Hier ist T2 ausgezeichnet und man nennt sie kritische Temperatur Tc . Sie ist charakterisiert in folgender Weise: Für eine Temperatur T > Tc sind alle Isothermen monoton fallend und es gibt nur stabile Konfigurationen, charakterisiert durch Gl. (3.74), also durch
3.11 Phasenübergang im van der Waals-Gas
P
111
flüssig
T1 T2 T3
gasförmig 0
V
Abbildung 3.30: Das (P,V )-Phasendiagram eines realistischen Gases (z.B. van der Waals-Gas) bei drei charakteristischen Isothermen. Die Bedeutung dieser Isothermen ergibt sich aus dem Text. Es gilt T1 > T2 > T3 .
positive isotherme Kompressibilität κT : κT > 0
stabil:
bzw.
∂P ∂V
Tc gilt offenbar: Gas: großes ΔV , kleines ΔP =⇒ κT = −
1 V
Flüssigkeit: kleines ΔV , großes ΔP =⇒ κT = −
1 V
∂V ∂P
großer Betrag
(3.130)
T
∂V ∂P
kleiner Betrag
(3.131)
T
Dagegen haben die Isothermen bei Temperaturen T < Tc jeweils ein Maximum und ein Minimum, und deshalb treten in gewissen Bereichen von V instabile Phasen auf, die dann negative isotherme Kompressibilität κT zeigen: instabil:
κT < 0
bzw.
∂P ∂V
>0 T
Hier vergrößert sich der Druck, wenn wir das Volumen vergrößern. Die instabilen Bereiche sind unphysikalisch, können jedoch unter gezielten experimentellen Bedingungen teilweise abgetastet werden. Außerhalb der instabilen Beriche haben wir dann wieder die Beziehungen (3.130,3.131). Die kritische Isotherme ist formal dadurch bestimmt, dass auf ihr der kritische Punkt liegt. Dieser ist dadurch ausgezeichnet, dass an ihm die Zustandsgleichung (3.129) gilt und dazu:
∂P ∂V
T =Tc
=
∂ 2P ∂V 2
T =Tc
=0
(3.132)
112
3 Grundlagen der Thermodynamik
Offenbar wandern die beiden Extremalpunkte der Isothermen zusammen, wenn man sich von T < Tc ausgehend auf Tc zubewegt. Es gilt für das Volumen pro Mol Δv = vGas − vflüssig → 0
für
T → Tc
für
T → Tc
und für die Entropie pro Mol Δs = sGas − sflüssig → 0
Für T > Tc kann man also zwischen Gas und Flüssigkeit nicht mehr unterscheiden und der Phasenübergang ist von 2. Ordnung, siehe Kap.3.11.3. Die Werte von Pkrit und Tkrit sind durch Gl. (3.129) und Gl. (3.132) festgelegt. Sie hängen nur von den Gaskonstanten a und b ab: vkrit = 3b
kB Tkrit =
8a 27b
Pkrit =
a 27b2
Wie man zeigen kann [Sch06], geht am kritischen Punkt die isotherme Kompressibilität κT → ∞ und Dichtefluktuationen werden sehr groß. Bei Streuung von Licht an einer Substanz in diesem Zustand erhält man große Streuquerschnitte, die die Substanz nahezu undurchsichtig bzw. milchig erscheinen lassen, obwohl sie im Normalzustand durchsichtig sein kann. Dieses häufig beobachtete Phänomen nennt man kritische Opaleszenz.
3.11.2 Maxwell-Konstruktion des Gleichgewichtsdrucks Betrachte nun im Weiteren ein System unter ”normalen” Laborbedingungen, das heißt in Kontakt zu einem Wärmereservoir mit konstanter Temperatur und konstantem Druck. Wir betrachten eine Isotherme im (P,V )-Diagramm und reduzieren das Volumen V z.B. von großen Werten (Gas) zu kleinen (Flüssigkeit). Die Frage ergibt sich, wie das System bei diesem Phasenübergang für T < Tc die instabilen Bereiche durchläuft. Es wird sich herausstellen, dass bei Entzug von latenter Wärme bei der Temperatur T das System bei einem bestimmten Dampfdruck Pd (T ) einen Phasenübergang 1. Ordnung durchführt, bei dem sich das System im (P,V )-Diagramm auf einer waagerechten Linie von dem rechten stabilen Teil der Isotherme zum linken stabilen Teil fortbewegt. Nimmt das System latente Wärme auf, bewegt es sich isotherm nach rechts. Der Druck Pd (T ), bei dem dies geschieht, wird durch die sog. Maxwell-Konstruktion bestimmt, die in diesem Kapitel hergeleitet wird. Wie wir wissen, strebt die Gibbssche Energie pro Mol, g(T, P), bei jedem spontanen Prozess ein Minimum an: g(T, P) → Minimum Da T und P durch das Reservoir fest sind, bleibt als unabhängige Variable von g(T, P) nur das Volumen V übrig. Wir betrachten nun gleichzeitig das (P,V )-Diagramm in Abb. (3.31) und das (g, P)-Diagramm in Abb. (3.32). Betrachte nun eine Isotherme im (P,V )-Diagramm und die Linie bei gegebenem konstantem Druck Px . Die Frage ist, welches bei diesem Druck die stabile Phase ist. Also, welche Gibbssche Energie bei der Temperatur T ist größer; diejenige beim Druck Px und beim Volumen VA oder beim Druck Px und Volumen VB ? Der Punkt mit VD wird nicht betrachtet, da er instabil ist.
3.11 Phasenübergang im van der Waals-Gas
113
P
P2 Px P1
N
M A
B
D
K
J
O
0
V
Abbildung 3.31: (P,V )-Diagramm eines realistischen Gases. Eine herausgegriffene Isotherme bei der Temperatur T < Tc ist versehen mit charakteristischen Punkten zum Beweis der Maxwell-Konstruktion.
Die einzelnen Zweige haben reale physikalische Bedeutung. Nehmen wir an, wir würden Px bereits kennen, also den Gleichgewichtsdruck bei der Temperatur T . Dann ist der Bereich V < VA ein stabiler flüssiger Bereich, im Bereich VA < V < VJ ist die Flüssigkeit überhitzt. Umgekehrt haben wir bei V > VB ein stabiles Gas und bei VN < V < VB ein unterkühltes Gas. Der Bereich VJ < V < VN ist mechanisch instabil und das System wird auf diesem Ast in der Realität nicht gefunden. Wie wir sehen werden, berechne wir die Gibbssche Energie g pro Mol dadurch, dass wir entlang einer Isotherme fortschreiten und das Differential der Gibbsschen Energie aufintegrieren. Die Temperatur ist immer definiert, und wir betrachten entsprechend einen quasistatischen Prozess. Also gilt: Für dg in den natürlichen Koordinaten gilt entlang einer Isothermen [dT = 0] dg = −sdT + vdP = vdP wobei s, v jeweils Entropie und Volumen pro Mol sind. Startet man an einem beliebigen Punkt O (siehe (P,V )-Diagramm (3.31) und bewegt sich entlang der Isotherme nach links bis zum Punkt x, dann ergibt sich die Gibbssche Energie durch Integration entlang der Isotherme gx − g0 =
x 0
v(P )dP
Dies ist im (P,V )-Diagramm die Fläche zwischen Isotherme und Ordinate P im Bereich [O, x]. Überlegt man sich den Verlauf der Gibbsschen Energie pro Mol g in Abhängigkeit des Druckes bei diesem Durchlauf entlang einer Isotherme, so ergibt sich das folgende Verhalten in dem (g, P)-Diagramm Abb. (3.32). Offenbar wächst bei Integration von O nach N die Fläche im (P,V )- Diagramm an und wir erhalten die Kurve O − K − Y − N im (g, P)-Diagram, wobei wir noch nicht wissen, was der Punkt Y bedeutet. Durch Integration entlang N − D − J im (P,V )Diagramm reduzieren wir die Fläche und damit den Wert von g, gleichzeitig gehen wir zu geringerem Druck über, weil der Ast N − D − J instabil ist, weshalb wir im (g, P)-Diagramm den Ast N − J erhalten. Jetzt integrieren wir im (P,V )-Diagramm entlang J − A − M was der Kurve
114
3 Grundlagen der Thermodynamik
J − Y − M im (g, P)-Diagramm entspricht. Die Kurven K − Y − N und J − Y − M müssen sich schneiden, weil entlang K −Y − N das System in der Gasphase ist und deshalb ein großes Volumen einnimmt und der Wert v(P )dP größer ist als in der Flüssigkeitsphase entlang J −Y − M, und in der Tat ist v(P )dP genau das, was wir aufintegrieren. Weil sich diese beiden Äste schneiden, gibt es den Punkt Y , der genau dieser Schnittpunkt sein soll. Offenbar gilt an Y gerade, dass g(PY , T ) entlang der Gasphase K −Y − N gleich g(PY , T ) entlang der Flüssigphase J −Y − M ist.
g N M
Y
J gasförmig
flüssig
K O 0
P1
PY
P2
P
Abbildung 3.32: (g, P)-Phasendiagramm eines realistischen Gases. Die Punkte entsprechen denen der vorherigen Abb. (3.31). Ziel ist der Beweis der Maxwellschen Konstruktion des Phasenübergangs.
Also können wir schreiben: g(PY , T )flüssig = g(PY , T )gasförmig . Weiterhin kann man folgende Fälle unterscheiden, wobei gilt P1 = PK = PJ und P2 = PM = PN : 1. P1 ≤ Px ≤ PY bzw. PK ≤ Px ≤ PY Gasphase stabil. 2. PY ≤ Px ≤ P2 bzw. PY ≤ Px ≤ PM . Flüssigphase stabil 3. Px = PY Flüssig-Gas-Phase im Gleichgewicht, bei diesem Druck findet der Phasenübergang Gas → Flüssigkeit durch Entzug von latenter Wärme statt. Berechne nun PY : Der Punkt Y ist charakterisiert durch
g(PY , vA ) = g(PY , vB )
oder im (P, T )-Diagramm von Abb. (3.33)
3.11 Phasenübergang im van der Waals-Gas BNDJA
115
v(P )dP = 0
oder : Fläche(BND) = Fläche(DJA) Dieses ist die sog. Maxwellsche Konstruktion zur Bestimmung des Drucks, bei dem bei vorgegebener Temperatur T der betrachteten Isotherme die Flüssigkeits-Phase und die Gas-Phase miteinander im Gleichgewicht sind. Laut Konstruktion gilt Px = PY und damit definitionsgemäß gleich Pd (T ). Bei der gegebenen Temperatur T müssen die Flächen im P(V )-Diagramm (3.33) zwischen Schnittlinie (parallel zur Abszisse) und Isotherme gleich sein, dann kann man den Gleichgewichtsdruck (Dampfdruck) Pd (T ) auf der Ordinate ablesen. P
P2 Px = PY P1
0
N
M A J
B D K O
V
Abbildung 3.33: Phasenübergang gasförmig-flüssig. Maxwell-Konstruktion des Druckes des Phasenübergangs bei gegebener Temperatur eines realen Gases. Die Flächen zwischen waageechter Linie und Isotherme oberhalb und unterhalb der Linie müssen gleich sein, dann ist damit der Druck des Übergangs festgelegt.
Der Übergang gasförmig → flüssig findet bei konstanter Temperatur T und konstantem Druck Pd (T ) statt, beide vorgegeben durch das Reservoir bzw. durch die Umgebung. Dieser Druck wird wird Dampfdruck Pd (T ) bei der Temperatur T genannt. Er wird gesteuert durch die Zufuhr bzw. Abfuhr von latenter Wärme: In Abb. (3.34) sind die Phasen für einen solchen Übergang von flüssig (a) zu gasförmig (d) gezeichnet. Zunächst sei das System im rein flüssigen Zustand (a). Wenn dem System Wärme zugeführt wird, so wird die Flüssigkeit nach und nach in Gas überführt, bis wir den Zustand (d) erreicht haben, in dem das ganze System gasförmig ist. Während des ganzen Vorgangs bleiben P und T konstant, die zugeführte Wärme ist also latent. Man soll bei diesem Phasenübergang festhalten: Im Flüssigkeit-Gas-Gemisch existiert die Flüssigkeit im gleichen Zustand wie in (a) und das Gas im gleichen Zustand wie in (d), also wie jeweils in den reinen Phasen. Anmerkung: Dieser ganze Beweis hat nirgendwo explizit die Zustandsgleichung des van der Waals-Gases benutzt, es wurde nur vorausgesetzt, dass das Material sich qualitativ so ähnlich wie ein van der Waals-Gas verhält, siehe Abb. (3.30). Bei der Ableitung der Maxwellschen Kon-
116
3 Grundlagen der Thermodynamik
(a)
(b)
(c)
(d)
Abbildung 3.34: Phasenübergang von flüssig (a) nach gasförmig (d). Er findet bei gleichem Druck und gleicher Temperatur statt und wird gesteuert durch Zufuhr von latenter Wärme. Das Gesamtvolumen des Systems ändert sich gemäß dem relativen Anteil der beiden Phasen der Substanz, die beide verschiedene Dichte haben.
struktion ist es auch möglich, einen Integrationsweg zu verwenden, der nur durch Gebiete stabiler Isothermen geht.
3.11.3 Ordnung eines Phasenübergangs Betrachte einen Phasenübergang (Phasenumwandlung) an der Übergangstemperatur (Umwandlungstemperatur) TU mit dem zugehörigen Dampfdruck Pd (TU ). In jeder Phase gelten bei beliebigem T und P wegen dg = −sdT + vdP und dT = 0 die Gleichungen ∂g ∂g und =v −s = ∂T P ∂P T Für die Entropie pro Mol bei einem Phasenübergang von gasförmig (1) nach flüssig (2) ergibt sich damit bei TU und Pd (TU ): ∂ (g2 − g1 ) = −(s2 − s1 ) > 0 (3.133) ∂T P Für den Umwandlungsdruck Pd (TU ) hat die 1. Ableitung der Kurve (g2 − g1 )(T ) an TU eine Unstetigkeit, siehe Abb. (3.35). Daher nennt man diesen Phasenübergang einen Übergang 1. Ordnung. Zunächst kann man nur sagen, dass die RHS von Gl. (3.133) = 0 ist, aber bei einer van der Waals-ähnlichen Substanz kann man zeigen, dass in der Tat die RHS > 0 ist20 Für das Volumen pro Mol ergibt sich bei TU und Pd (TU ) analog ∂ (g2 − g1 ) = v2 − v 1 < 0 (3.134) ∂P T Für die Übergangstemperatur TU hat die 1. Ableitung der Kurve (g2 − g1 )(P) also eine Unstetigkeit an PD (TU ), siehe Abb. (3.36). 20 Die
Abb. (3.35) und (3.36) sind sehr schematisch, um die Unstetigkeit deutlich zu machen. Für eine realistische Substanz (mit κT > 0) haben die Kurven einen konkaven Verlauf und nicht, wie es gezeichnet wurde, einen konvexen.
3.11 Phasenübergang im van der Waals-Gas
117
P = Pd (TU )
g
g2
Phasenübergang
flüssig
gasförmig g1
0
TU
T
Abbildung 3.35: Phasenübergang 1. Ordnung: Betrachtet wird ein Phasenübergang bei der Übergangstemperatur TU und dem Phasenübergangsdruck P = Pd (TU ). Gezeichnet sind schematisch die Gibbsschen Potenziale für beide Phasen. Die 1. Ableitung der Kurve (g2 − g1 )(T ) hat eine Unstetigkeit an TU .
T = TU
g
g2
Phasenübergang gasförmig
flüssig g1
0
Pd (TU )
P
Abbildung 3.36: Phasenübergang 1. Ordnung: Betrachtet wird ein Phasenübergang bei der Übergangstemperatur TU und dem Phasenübergangsdruck P = Pd (TU ). Gezeichnet sind schematisch die Gibbsschen Potenziale für beide Phasen. Die 1. Ableitung der Kurve (g2 − g1 )(P) hat eine Unstetigkeit an Pd (TU ).
Es gibt Phasenübergänge, bei denen s2 − s1 = 0 und v2 − v1 = 0 sind. In einem solchen Fall sind die ersten Ableitungen in Gl. (3.134) und (3.133) stetig. Solch ein Übergang ist nicht von erster Ordnung und würde nicht von der Clausius-Clapeyron-Gleichung beschrieben werden. Die Isotherme entlang des Phasenübergangs würde keinen horizontalen Teil im P(V )-Diagramm haben. Ehrenfest definiert einen Phasenübergang n-ter Ordnung, wenn am Übergangspunkt (P, T ) gilt n n ∂ (g1 − g2 ) ∂ (g1 − g2 ) = 0 und = 0 ∂Tn ∂ Pn P T und alle niedrigeren Ableitung gleich null sind. Man sollte festhalten, dass in der Realität nicht alle Phasenübergänge glatt in das Ehrenfest-Schema passen.
118
3 Grundlagen der Thermodynamik
3.11.4 Berechnung der latenten Wärme Für die Berechnung der latenten Wärme für den Phasenübergang A → B betrachte Abb. (3.37). Die Behauptung ist, dass die latente Wärme gegeben ist durch die Fläche, die im Bereich zwischen vA und vB in dem Streifen zwischen den benachbarten Isothermen im (P,V )-Diagramm mit den Temperaturen T und T + δ T liegt. Betrachte im (P,V )-Diagramm die Druckdifferenz δ P(v) an dem Molvolumen v . Es ergibt sich für die zu berechnende latente Wärme des Phasenübergangs von A nach B das folgende Integral. Behauptung: 1 Δl = T Δs = δT
vB vA
1 ds = δT
vB vA
(δ P)dv
(3.135)
mit δ P = δ P(v) gegeben durch δ P(T ) = P(T + δ T ) − P(T ) am Molvolumen v. Beweis: Für die Entropieänderung pro Mol gilt: ∂s ∂s dT + dv ds = ∂T v ∂v T Betrachtet man nun eine Isotherme (dT = 0) und nutzt die Maxwellrelation (3.88) aus, i.e. (∂ S/∂V )T = (∂ P/∂ T )V , so erhält man: ∂P dv ds = ∂T v Geht man von Differentialen zu kleinen Differenzen über, so erhält man für ds ds =
1 (δ P(v)) dv δT
wobei δ T die Temperaturdifferenz zwischen zwei benachbarten Isothermen im (P,V )-Diagramm an der Stelle v ist. Damit ist Gl. (3.135) bewiesen. q.e.d. Das ΔT und δ P sind leicht messbare Größen, siehe Abb. (3.37. Offenbar ist die Fläche des Streifens zwischen vA und vB positiv und der Übergang fest → flüssig ist mit einer Entropieerhöhung verbunden, wie man auch erwartet.
3.12 Systeme mit mehreren Komponenten Es ist für dieses Kapitel nötig, zwei Begriffe zu klären: Ein homogenes System ist charakterisiert dadurch, dass es an allen Orten die gleichen spezifischen Eigenschaften hat. Es kann aus mehreren Teilchensorten bestehen, solange diese total durchmischt sind. Inhomogene Systeme haben im Allgemeinen an verschiedenen Orten verschiedene Eigenschaften. Sie können aus mehreren im Gleichgewicht21 stehenden Phasen bestehen, die örtlich getrennt sind (Eis auf Wasser schwimmend) oder aus verschiedenen örtlich getrennten Atom- oder Molekülsorten. Die einzelnen Phasen können in sich durchaus homogen sein, was wir hier voraussetzen wollen. Wir hatten bisher in Kap. 3.10 ein (nicht abgeschlossenes) inhomogenes System mit zwei Phasen im Kontakt mit einem Reservoir fester Temperatur und festen Drucks studiert. Für jede 21 In
diesem Kapitel betrachten wir nur zeitunabhängige oder quasistatische Situationen.
3.12 Systeme mit mehreren Komponenten
119
P
Pd (T )
B
A
δP
T + δT T
0
V
Abbildung 3.37: Latente Wärme: Messung und Berechnung. Hier ist δ T die Temperaturdifferenz zweier benachbarter Isothermen, und δ P ist die Druckdifferenz bei gegebenem Molvolumen. Die Fläche des Streifens zwischen den Isothermen muss ermittelt werden von (A) (Flüssigkeit) bis (B) (Gas).
dieser beiden Komponenten, z.B. Wasser und Wasserdampf, hatten wir die Anzahl der Mole ni (i = 1, 2) betrachtet, wobei die Phasen sich sich ineinander umwandeln konnten. Wir betrachten jetzt ein (nicht abgeschlossenes) homogenes Gemisch aus m chemisch verschiedenen Moleküloder Atomsorten, auch Komponenten genannt. Zunächst betrachten wir allgemeine Eigenschaften solcher Systeme, führen dazu das chemische Potenzial ein und definieren die Generalisierungen der bekannten thermodynamischen Potenziale. Dieser Formalismus erlaubt dann, allgemeine Skalierungseigenschaften zu untersuchen und Gleichgewichtszustände zu betrachten. Im weiteren Schritt werden dann chemische Reaktionen und Reaktionsgleichgewichte untersucht, was zu den berühmten Massenwirkungsgesetzen führt.
3.12.1 Generalisierte Potenziale, Gibbs-Duhem-Relation Wir betrachten im Folgenden ein abgeschlossenes System bzw. ein System, das einer quasistatischen Veränderung unterworfen ist und an einem speziellen und beliebigen Zeitpunkt untersucht wird. Das System möge m Komponenten besitzen. 3.12.1.1 Chemische Potenziale Bei einem solchen System hängen die Gesamtentropie und Gesamtenergie offensichtlich von der Anzahl der Teilchen Ni der i-ten Komponente ab (i = 1 . . . m ). Daraus ergeben sich generalisierte thermodynamische Potenziale und auch generalisierte Maxwell-Relationen. Betrachte z.B. die Entropie: S = S(E,V, N1 , . . . , Nm ) Bei einem allgemeinen quasistatischen physikalischen Prozess gilt: m ∂S ∂S ∂S dS = dE + dV + ∑ dNi ∂ E V,N ∂V E,N i=1 ∂ Ni E,V,N
120
3 Grundlagen der Thermodynamik
Hierbei bedeutet bei der Ableitung der Index N, dass alle Ni festgehalten werden. Beim letzten Audruck bedeutet das etwas anderes, nämlich dass bei der Ableitung nach Ni die Größen E, V und alle N j mit j = i festgehalten werden. Wir kennen zwei der vorkommenden Ableitungen aus Gl. (2.34, 2.56): ∂S ∂S 1 P = = ∂ E V,N T ∂V E,N T Nun definiert man das chemische Potenzial μ j für die Komponente j durch: μ j = −T
∂S ∂ Nj
(3.136) E,V,N
Das chemische Potenzial ist die verallgemeinerte Kraft bzgl. Teilchenzahlveränderung. Damit erhalten wir 1 P 1 m (3.137) dS = dE + dV − ∑ μ j dN j T T T j=1 Oder m
dE = T dS − PdV + ∑ μ j dN j
(3.138)
j=1
Beide Gleichungen sind Generalisierungen von T dS = dE + PdV . Wir erinnern uns, dass wir aus dem Ausdruck für dE alle thermodynamischen Potenziale hergeleitet haben, siehe z.B. Kap.3.8.3. Weil wir in den Teilchenzahlen eine neue Variable haben, ist es sinnvoll, ein weiteres Potenzial einzuführen, das sog. großkanonische Potenzial, das eine Generalisierung der freien Energie aus Kap.3.8.1 darstellt m
großkan. Potenzial:
Φ = Φ (T,V, {μ j }) = E − T S − ∑ μ j N j
(3.139)
j=1
Damit erhalten wir die folgende Tabelle, die eine Verallgemeinerung der Tabelle in Gl. (3.79) auf Systeme mit mehreren Komponenten zusammenfasst Thermodynamische Potenziale mit chem. Potenzial Zustandsfunktion Energie E Entropie S Freie Energie F = E − T S Enthalpie H = E + PV Gibbs G = E − T S + PV Φ = E − T S − ∑mj=1 μ j N j
Unabh. Var. S,V, {N j } E,V, {N j } T,V, {N j } S, P, {N j } T, P, {N j } T,V, {μ j }
(3.140)
Differentiale dE = T dS − PdV + ∑ j μ j dN j dS = T1 dE + TP dV − T1 ∑ j μ j dN j dF = −SdT − PdV + ∑ j μ j dN j dH = T dS +V dP + ∑ j μ j dN j dG = −SdT +V dP + ∑ j μ j dN j dΦ = −SdT − PdV − ∑ j N j dμ j
Die Gibbssche Energie wird auch Freie Enthalpie genannt. Ausdrücke für das chemische Poten-
3.12 Systeme mit mehreren Komponenten
121
zial unter verschiedenen äußeren Bedingungen sind neben Gl. (3.136) ( Beh:) ∂S μ = μ (E,V, N1 · · · Nm ) μi = −T ∂ Ni E,V,N j=i
μi = μi = μi =
∂E ∂ Ni ∂F ∂ Ni ∂G ∂ Ni
(3.141)
μ = μ (S,V, N1 · · · Nm )
(3.142)
μ = μ (T,V, N1 · · · Nm )
(3.143)
μ = μ (T, P, N1 · · · Nm )
(3.144)
S,V,N j=i
T,V,N j=i
T,P,N j=i
Beweis: Wir studieren die Differentiale der obigen Potenziale und leiten daraus diese Ausdrücke ab, wobei wir Gl. (3.91,3.92) verwenden. Aus Gl. (3.138) erhalten wir sofort Gl. (3.142). Weiterhin betrachte die Freie Energie F = F(T,V ): dE = T dS − PdV + ∑ μi dNi i
=T + SdT −SdT − PdV + ∑ μi dNi
dS i
d(T S)
d(E − T S) = dF = −SdT − PdV + ∑ μi dNi i
Ebenso erhält man für die Freie Enthalpie H = H(T,V ): d(E + PV ) = dH = −SdT + PdV + ∑ μi dNi i
und auf gleiche Weise für die Gibbssche Energie G = G(T, P): d(E − T S + PV ) = dG = −SdT +V dP + ∑ μi dNi
(3.145)
i
Die Beweise sind offenbar ähnlich denen, die wir früher in der Umgebung von Gl. (3.91,3.92) geführt haben. 3.12.1.2 Skalierungseigenschaft, Gibbs-Duhem-Relation In diesem Unterkapitel wollen wir zwei wichtige Relationen diskutieren und beweisen: Es gilt die Behauptung: G = ∑ μi Ni
Gibbs-Duhem-Relation:
(3.146)
i
oder äquivalent
E = T S − PV + ∑ μi Ni i
(3.147)
122
3 Grundlagen der Thermodynamik
Diese Relationen zeigen einen extrem einfachen Zusammenhang zwischen der Gibbsschen Energie G = G (T, P, N1 · · · Nm ) und den chemischen Potenzialen μi (T, P, N1 · · · Nm ) und den Teilchenzahlen der Komponenten eines Systems. Behauptung: Neben der Gibbs-Duhem-Relation (3.146) gilt auch die differentielle Relation: Diff. Gibbs-Duhem-Relation:
SdT −V dP + ∑ Ni dμi = 0
(3.148)
i
Diese Relation besagt, dass in einem homogenen und abgeschlossenen System die intensiven Größen T , P und μi nicht unabhängig voneinander variiert werden können, und gibt den Zusammenhang zwischen den Variationen dieser Größen an. Beweis: Die Energie E ist nur abhängig von den extensiven Größen S,V, N1 , . . . , Nm . Ändert man nun die Skalierung und arbeitet mit einem identischen System von veränderter Größe S → λ S V → λV
Ni → λ Ni
E → λE
so erhält man den offensichtlichen Zusammenhang E(λ S, λV, λ Ni ) = λ E(S,V, Ni )
(3.149)
Setzt man jetzt λ = 1 + γ und betrachtet den Fall γ 1. So erhält man durch eine Taylorentwicklung: ∂E ∂E ∂E γS + γV + ∑ γNi = (1 + γ)E E+ ∂ S V,N ∂V S,N ∂ Ni S,V,N i In 0-ter Ordnung in γ haben wir das triviale Resultat E = E. Fasst man nun die Terme von 1. Ordnung in γ zusammen, so ergibt sich mit Hilfe der Differentiale der thermodynamischen Potenziale (3.140) ∂E ∂E ∂E S+ V +∑ Ni (3.150) E= ∂ S V,N ∂V S,N ∂ Ni S,V,N i
T
μi
P
Damit22 kann man sofort die ”Gibbs-Duhem-Relation” hinschreiben: G = E − T S + PV = ∑ μi Ni
q.e.d.
i
Aus dem Energieausdruck (3.147) entnehmen wir dE = SdT + T dS −V dP − PdV + ∑(μi dNi + Ni dμi ) i
22 Den
Übergang von Gl. (3.149) zu Gl. (3.150) kann man sofort durch das Theorem für homogene Funktionen bekommen: Für eine homogene Funktionen, das heißt eine Funktion, für die gilt f (λ x) = λ α f (x) mit einer beliebigen reellen Größe α, gilt folgende Beziehung, wobei der obige Fall für α = 1 gilt: f (x) = α(x · ∇) f = α ∑ .
i
∂f xi ∂ xi
3.12 Systeme mit mehreren Komponenten
123
was man mit dem ersten Hauptsatz vergleichen kann dE = T dS − PdV + ∑ μi dNi i
und daraus folgt direkt die differentielle Gibbs-Duhem-Relation (3.148). q.e.d. Für die obige Ableitung hätte man auch S = S (E,V, N1 · · · Nm ) beginnen können, was ebenfalls nur von extensiven Größen abhängt, und wäre ebenfalls zu den Gibbs-Duhem-Relationen gekommen. Homogenes System mit einer Komponente Für ein solches System folgen aus der GibbsDuhem-Relation (3.146) einige wichtige Tatsachen. Behauptung: G(T, P, N) = μ(T, P)N
(3.151)
Dies bedeutet, dass das chemische Potenzial μ(T, P) nicht von der Teilchenzahl abhängt und gleich dem Gibbsschen Potenzial pro Teilchen ist. Das ist nicht zufällig: Die Gibbssche Energie ist ausgezeichnet unter allen thermodynamischen Potenzialen, weil sie nur von der Teilchenzahl als extensiver Größe abhängig ist und ihre natürlichen Variablen (T, P) intensive Größen sind. Bei allen anderen Potenzialen ist immer mindestens eine natürliche Variable extensiv. Weiterhin folgt aus der Gibbs-Duhem-Relation die Behauptung: Φ(T, P, μ) = −P(T, μ)V
(3.152)
Diese Gleichung werden wir im speziellen Fall des idealen Gases in Gl. (5.27) wieder treffen, hier wird sie jedoch allgemein bewiesen. Beweis: Betrachte Gl. (3.151). Aus G = E − T S + PV und E = T S − PV + μN folgt sofort G(T,V, N) = μN. Da Gl. (3.144) gilt haben wir ∂μ ∂ μN = μ +N μ= ∂N ∂ N T,P T,P Hieraus schließt man, daß
∂μ ∂N
=0 T,P
womit Gl. (3.151) bewiesen ist. Der Beweis für Gl. (3.152) folgt auf ähnliche Weise. Wir haben Φ = E − T S − μN oder nach Einsetzen von E aus der Gibbs-Duhem-Relation Gl. (3.147) sofort Φ = −PV . Nun kann man aus dem Differential dΦ aus der Tabelle Gl. (3.140) sofort hinschreiben ∂Φ P=− ∂V T,μ und daraus
P=
∂ PV ∂V
= P +V T,μ
∂P ∂V
T,μ
124
3 Grundlagen der Thermodynamik
woraus man sofort schließt, dass gilt:
∂P ∂V
=0 T,μ
Hiermit ist Gl. (3.152) bewiesen. q.e.d. Aus den obigen Zeilen ergibt sich für das chemische Potenzial ∂G 1 μ(T, P) = = G(T, P) ∂ N T,P N
(3.153)
Dieser Zusammenhang gilt nicht mehr, wenn mehrere Komponenten vorliegen: ∂G G μi = = ∂ Ni T,P,N N j sondern da haben wir nur die volle Gibbs-Duhem-Relationen Gl. (3.146,3.147). 3.12.1.3 Allgemeine Gleichgewichtsbedingung, abgeschlossenes System Bei einem offenen inhomogenen System im Kontakt mit einem Reservoir der Temperatur T und dem Druck P hatten wir nach Gl. (3.117) als Gleichgewichtsbedingung zwischen den beiden Phasen einer gleichen Substanz, dass die Gibbsschen Energien der Phasen pro Mol gleich sein sollten (Phasengleichgewichtskuve): g1 (T, P) = g2 (T, P). Für ein abgeschlossenes inhomogenes System kann man ebenfalls Bedingungen herleiten, dass beide Phasen miteinander im Gleichgewicht stehen. Es wird sich schnell herausstellen, dass da große Ähnlichkeiten vorliegen, die auf der Tatsache beruhen, dass das chemische Potenzial mit der Gibbsschen Energie pro Teilchen zusammenhängt. Für ein abgeschlossenes System mit zwei Phasen im Gleichgewicht, siehe Abb. (3.38), gilt S = Maximum oder für jeden spontanen Prozess dS = dS1 + dS2 = 0 Ferner gelten bei einer Phasenumwandlung die folgenden Beziehungen, die natürlich auch die Änderung der Teilchenzahl einer jeden Phase berücksichtigen, ohne dass chemische Reaktionen aufträten: dE = dE1 + dE2 = 0 dV = dV1 + dV2 = 0 dN = dN1 + dN2 = 0 Somit ergibt sich
∂S ∂S ∂S dS = dE1 + dE2 + . . . + dN2 ∂ E1 V,N ∂ E2 V,N ∂ N2 E,V
1 T1
1 T2
3.12 Systeme mit mehreren Komponenten
125
Phase 2 Q
V
N
Phase 1
Abbildung 3.38: Zwei Phasen bilden zusammen ein abgeschlossenes System mit Wärmeaustausch, Volumenaustausch und Teilchenaustausch untereinander.
oder dS =
1 1 − T1 T2
dE1 +
P1 P2 − T1 T2
dV1 −
μ1 μ2 − T1 T2
dN1
Da aber E1 ,V1 , N1 unabhängige Variablen sind, folgt hieraus als Gleichgewichtsbedingung für ein abgeschlossenes System T1 = T2 P1 = P2 μ1 = μ2 Dass im Gleichgewicht die Temperaturen und Drücke der beiden Phasen der Substanz gleich sein müssen, ist nicht erstaunlich. Dass aber auch die chemischen Potenziale gleich sein müssen ist weniger einsichtig. Das ist jedoch sinnvoll, wenn man bedenkt, dass das chemische Potenzial die generalisierte Kraft bzgl. Teilchenaustausch ist. Da jedoch jede Phase nur aus einer einzigen Molekülsorte besteht, folgt mit μ = G(T, P)/N von Gl. (3.151), dass mit T1 = T2 = T und P1 = P2 = P gilt Gi (T, P) μi = Ni und die Gleichgewichtsbedingung deshalb lautet G1 (T, P) G2 (T, P) = N1 N2 was gleich der Gleichgewichtsbedingung eines Systems ist, das im Kontakt mit einem Reservoir der Temperatur T und dem Druck P steht.
3.12.2 Chemische Gleichgewichte Ziel dieses Kapitels ist, Gleichgewichtsbedingungen zu studieren und das berühmte Massenwirkungsgesetz bei chemischen Reaktionen zu beweisen. Wir betrachten dazu ein homogenes Sys-
126
3 Grundlagen der Thermodynamik
tem mit m verschiedenen Sorten von Molekülen, die sich alle in der gleichen Phase befinden mögen, und zwar flüssig oder gasförmig. Die Anzahl der Moleküle der Sorte i sei gegeben durch Ni . Die chemischen Symbole der Moleküle seien mit Bi bezeichnet, also z.B. B(H2 O), B(H2 ), B(O2 ). Es seien chemische Reaktionen zwischen den Molekülsorten möglich, wobei natürlich die Erhaltung der Gesamtzahl einer Atomsorte gelten muss. Jede chemische Reaktion läuft etwa nach folgendem Schema ab 2H2 + O2 2H2 O Bei chemischem Gleichgewicht laufen beide Reaktionen ständig ab mit im Mittel gleicher Häufigkeit, so dass im Mittel zu jedem Zeitpunkt jeweils die gleiche Menge H2 , bzw. O2 oder H2 O vorliegt, diese Mengen also jeweils bis auf kurzzeitige Fluktuationen zeitunabhängig sind. Man führt stöchiometrische Koeffizienten bi ein, die die Reaktion charakterisieren, und man entscheidet sich für Vorzeichen in der Weise, dass das zusammengesetze Molekül mit positivem Vorzeichen erscheint. Man geht also aus von 2H2 + O2 → 2H2 O und schreibt dies 2H2 O − 2H2 − O2 = 0 wodurch man erhält b(H2 O) = 2
b(H2 ) = −2
b(O2 ) = −1
(3.154)
Offenbar kann man so eine allgemeine chemische Reaktion schreiben als m
∑ bi Bi = 0
(3.155)
i=1
Die Behauptung ist, dass jede chemische Reaktion nach Erreichen des Gleichgewichts im Reaktionsvolumen (Reagenzglas) bei vorgegebenen äußeren Bedingungen solche relativen Teilchenzahlen der einzelnen Komponenten hat, dass gilt m
Gleichgewichtsbedingung:
∑ bi μ i = 0
(3.156)
i=1
wobei μi die chemischen Potenziale unter den aktuellen Versuchsbedingungen sind. Wenn nach den Versuchsbedingungen E und V als unabhängige Variable vorliegen, dann ist μi = μi (E,V, N1 , ...Nm ), und es wird bestimmt durch Gl. (3.136), i.e. μ j = −T (∂ S/∂ N j )E,V,N , weil S = S(E,V, N1 , . . . , Nm ) gerade in diesen Variablen ein thermodynamisches Potenzial ist. In diesem so charakterisierten Gleichgewicht gilt dS = 0. Oder wenn T und V als unabhängige Variable vorliegen, dann gilt nach Gl. (3.65) dF = 0, und dann ist μi = μi (T,V, N1 , ...Nm ) und ist bestimmt durch Gl. (3.143), i.e. μi = (∂ F/∂ Ni )T,V,N , denn die natürlichen Koordinaten der freien Energie F sind gerade T und V , usw. Der Beweis für diese Tatsachen ist einfach und wird beispielhaft geführt für T und P als unabhängige Variable. Dann haben wir für μ die Gl. (3.144) und nach Gl. (3.145) wissen wir, dass dG = −SdT +V dP + ∑ μi dNi i
3.12 Systeme mit mehreren Komponenten
127
Laut Voraussetzung gilt dT = dP = 0 und damit haben wir die Gleichgewichtsbedingung dG = 0 erfüllt durch ∑ μi dNi = 0 i
Nun müssen die dNi proportional den bi sein, wir haben also dNi = λ bi und damit gilt dann mit Gl. (3.155) auch Gl. (3.156). q.e.d. In der Praxis geht man so vor, dass man experimentell oder mit statistischen Methoden die Entropie S bestimmt, daraus dann sich die μi beschafft und dann nach den Zahlen Ni sucht, bei denen ∑m i=1 bi μi = 0 erfüllt ist. Das bedeutet dann auch, dass ein klarer Zusammenhang besteht zwischen den thermodynamischen Variablen und der Anzahl der Moleküle Ni der einzelnen Komponenten.
3.12.3 Massenwirkungsgesetz 3.12.3.1 Homogene Systeme In diesem Kaptel werden wir das in der Chemie wichtige Massenwirkungsgesetz beweisen. Wir nehmen an, dass die Reaktion (3.155), i.e. ∑m i=1 bi Bi = 0, zwischen wechselwirkungsfreien Gasen bei der Temperatur T und im Volumen V abläuft. Unter diesen Bedingungen ist die Freie Energie die relevante thermodynamische Größe. Wir können in diesem idealisierten Fall konkret ausrechnen, wie sich die mittleren Zahlen Ni der verschiedenen Molekülsorten zueinander verhalten. Die Behauptung ist, dass im Gleichgewicht das Massenwirkungsgesetz gilt: m
Massenwirkungsgesetz:
∏ Nibi = KN (T,V )
(3.157)
i=1
mit der sog. Massenwirkungskonstante: ΔF0 KN (T,V ) = exp − kB T
(3.158)
Die Massenwirkungskonstante KN (T,V ) hängt nur über die ”Freie Standardenergie der Reaktion” ΔF0 von der Temperatur T und dem Volumen V ab23 , aber nicht von den Molekülzahlen Ni . Bei gegebenem KN (T,V ) hängen die Massenverhältnisse nur von den stöchiometrischen Koeffizienten bi ab. Die Gl. (3.157) ist das berühmte Massenwirkungsgesetz. Es ist eine explizite Relation zwischen den mittleren Molekülzahlen Ni im chemischen Gleichgewicht. Wir benötigen nur, wie unten dargestellt wird, die freie Energie des Systems F = F(T,V, N1 , . . . , Nm ), daraus kann dann μi nach Gl. (3.143) berechnet werden und Gl. (3.156) muss dann erfüllt werden, was dann zu Gl. (3.157) führt. 23 Statistisch
betrachtet hängen die Einteilcheneigenwerte vom Volumen ab und somit geht dieses in ΔF0 ein.
128
3 Grundlagen der Thermodynamik
Beweis: Wir werden in Kap. 5.1.6 mit statistischen Methoden beweisen, dass nach Gl. (5.19) die freie Energie eines Gemisches realer Gase sich schreibt als F(T,V ) = −kB T ∑ Ni [log ζi − log Ni + 1]
(3.159)
i
mit der Zustandssumme24 eines einzelnen Moleküls der Sorte i: i ε (r) ζi (T,V ) = ∑ exp − kB T r wobei die Summe über alle möglichen kinetischen und intrinsischen Energiezustände ε i (r) der Moleküle der Sorte i geht25 . Mit (d log(N!)/dN) = log(N) aus der Stirling-Formel können wir das chemische Potenzial nach Gl. (3.143) berechnen: ∂F ζi = −kB T log (3.160) μi = ∂ Ni T,V,N Ni Jetzt können wir Gl. (3.156) hinschreiben: ΔF0 + kB T ∑ bi log Ni = 0
(3.161)
i
wobei die Freie Standardenergie ΔF0 nur von T und V abhängt und die Terme zusammenfasst, die von den beteiligten Molekülen abhängen, i.e. bi und ζi , aber nicht von Ni : ΔF0 (T,V ) = −kB T ∑ bi log ζi i
Nach Umformung des Logarithmus erhalten wir
∑ bi log Ni = ∑ i
i
log Nibi
= log
∏
Nibi
i
und damit für die Gleichgewichtsbedingung das Massenwirkungsgesetz (3.157) mit der Massenwirkungskonstante (3.158): ΔF0 (T,V ) = ∏ ζibi KN (T,V ) = exp − kB T i Die Massenwirkungskonstante KN (T,V ) hängt nur über die ζi von der Temperatur T und dem Volumen V ab (über die Einteilcheneigenwerte), sie hängt nicht von den Molekülzahlen Ni ab, q.e.d. Wir haben jetzt das berühmte Massenwirkungsgesetz Gl. (3.157) bewiesen. Man sollte festhalten, dass KN (T,V ) definiert ist mit Hilfe der ζi für jede Molekülsorte. 24 Dies
ist ein Vorgriff auf die kanonische Zustandssumme und führt über die Thermodynamik hinaus. Es ist auf diese Weise aber möglich, das Massenwirkungsgesetz relativ einfach herzuleiten. 25 Der genauere Ausdruck (3.162) wird später benötigt und dann diskutiert.
3.12 Systeme mit mehreren Komponenten
129
Beispiel: Man kann das Massenwirkungsgesetz an der Reaktion 2H2 + O2 → 2H2 O illustrieren: Die Werte für die bi -Konstanten sind in Gl. (3.154) gegeben mit b(H2 O) = 2, b(H2 ) = −2 und b(O2 ) = −1, also lautet das Massenwirkungsgesetz für die mittleren Teilchenzahlen der beteiligten Gasmoleküle N(H2 )−2 N(O2 )−1 N(H2 O)2 =
N(H2 O)2 = KN (T,V ) N(H2 )2 N(O2 )
3.12.3.2 Massenwirkungsgesetze für ideale Gase Wenn die Moleküle hinreichend einfach strukturiert sind und man ihre intrinsischen Anregungsenergien ε int (r) (Rotation, Vibration) kennt, dann kann man ζi berechnen, da man ja bei gegebenem V den rein kinetischen Teil kennt, wenn die Gase hinreichend verdünnt sind und für die Translationsfreiheitsgrade rein klassische Methoden ausreichen: int p2 ε (r) 3 3 exp − ζi (T,V ) ∝ d r d p exp − (3.162) ∑ 2mkB T r kB T Selbst wenn die Anregungsenergien zu kompliziert sind, kann man oft die Information über das Anregungsspektrum aus dem Experiment nehmen und ζi berechnen. Man kann diesen Ausdruck auch verwenden, um KN (T,V ) und das ganze Massenwirkungsgesetz etwas zu vereinfachen. Offenbar kommt das Volumen im Integral nur durch die d 3 r-Integration zustande, also gilt ζi (T,V ) = V ζi (T ) was wir verwenden können, um das chemische Potenzial umzuschreiben. Wir haben dann nach Gl. (3.160) ζ μi = −kB T log i ni mit ni = Ni /V , was die Anzahl der Moleküle der Sorte i pro Volumen ist. Die fundamentale Gleichung (3.156), also die Summe über die chemischen Potenziale und stöchiometrischen Koeffizienten, i.e. ∑m i=1 bi μi = 0, kann jetzt geschrieben werden als m
m
i=1
i=1
∑ bi log ζi = ∑ bi log ni
oder m
∏ nbi i = Kn (T )
Ideales Gas, Massenwirkungsgesetz:
(3.163)
i=1
mit KN (T,V ) = V b Kn (T )
m
mit
b = ∑ bi
(3.164)
i=1
wobei das Kn (T ) nur von der Temperatur abhängt. Mit Hilfe der Konzentrationen ci = Ni /N kann man Gl. (3.163) umschreiben auf
130
3 Grundlagen der Thermodynamik
m
∏
Ideales Gas, Massenwirkungsgesetz:
cbi i
=
i=1
kB T P
b Kn (T )
(3.165)
Man kann das Massenwirkungsgesetz auch noch anders formulieren. Wenn wir den Partialdruck Pi des Gases i einführen, also den Druck, den das Gas i der idealen Gasgleichung im Volumen V hat, i.e. PiV = Ni kB T mit P = ∑i Pi , dann gilt nach einfacher Umrechnung Ideales Gas, Massenwirkungsgesetz:
∏ Pibi = (kB T )b Kn(T )
(3.166)
i
wobei die rechte Seite wiederum nur von der Temperatur abhängt. Hier haben wir die Reaktion
Beispiel: Synthese von Ammoniak
N2 + 3H2 2NH3 mit B1 = N2
B2 = H2
B3 = NH3
b1 = 1
b2 = 3
b3 = −2
und das Massenwirkungsgesetz ergibt c[N2 ]c[H2 ]3 ∝ P−2 c[NH3 ] Eine Druckerhöhung verschiebt das Gleichgewicht zugunsten von c[NH3 ] und verstärkt die Ammoniaksynthese. Beispiel: Ionenbildung Wir betrachten H3 O+ + OH − 2H2 O
⇒
b1 = 1
b2 = 1
b3 = −2
Hierbei fällt die Druckabhängigkeit heraus, weil b = 0. Wir haben also c[H3 O+ ]c[OH − ] = Kn (T ) c[H2 O]2 Man kann zeigen, dass bei Zimmertemperatur gilt c[H2 O] ≈ 1 und c[H3 O+ ] ≈ c[OH − ] ≈ 10−7 . 3.12.3.3 Massenwirkungkonstante, Prinzip von Chatelier Für das ideale Gas kann man den Ausdruck für die Temperaturabhängigkeit von KN (T,V ) stark vereinfachen. Das erlaubt dann eine Erläuterung des allgemeinen Prinzips von Chatelier. Zunächst zeigen wir, dass man die Gleichgewichtsbedingung (3.156) auch schreiben kann als ΔF =
3.12 Systeme mit mehreren Komponenten
131
0, was dem Faktum entspricht, dass bei festem T im Gleichgewicht die Freie Energie ein Minimum hat. Wir nehmen an, dass man die Freie Energie F = F (T,V, N1 , N2 , ..., Nm ) kennt. Wenn man von einer chemischen Reaktion bei gegebenem T und V ausgeht, wobei das (−bi ) einer in die Reaktion einlaufenden Molekülsorte übergeht in b j der Reaktionsprodukte, und berücksichtigt, dass das in Übereinstimmung mit Gl. (3.155), i.e. ∑i bi Bi = 0, vonstatten gehen muss, dann ist die entsprechende Änderung der Freien Energie gegeben durch ∂F bi = ∑ μi bi ΔF = ∑ ∂ Ni T,V,N i i wobei wir Gl. (3.143) benutzt haben. Dies bedeutet, dass die Gleichgewichtsbedingung (3.156) nichts anderes ist als die Aussage, dass im Gleichgewicht bei festem T die Freie Energie minimal ist und deshalb ihre Variation verschwindet. Daher kann man Gl. (3.161) auch schreiben als ΔF = 0 = ΔF0 + kB T ∑ bi log Ni
(3.167)
i
Mit dieser Gleichung kann man beim idealen Gas ΔF0 einfach berechnen: Wir haben mit Gl. (3.158) ∂ ΔF0 ∂ log KN =− = ∂T ∂ T V kB T V ∂ ∂ ΔF ΔF − bi log Ni = − − ∂ T V,N kB T ∑ ∂ T V,N kB T i Daraus folgt:
∂ log KN ∂T
= V
ΔF 1 − kB T 2 kB T
∂ ΔF ∂T
V,N
Wir können umformen, wobei wir berücksichtigen, dass nach Gl. (3.95) gilt ∂F S=− ∂ T V,N was dann führt zu
∂ ∂F ΔNi = ∂T ∂ Ni i ∂ ∂F ∂S −∑ ΔNi = ΔS ΔNi = ∑ ∂ Ni ∂T ∂ Ni i i
−
∂ ∂T
ΔF = − ∑
Damit erhalten wir mit F = E − T S: 1 ΔE ∂ log KN = (ΔF + T ΔS) = 2 2 ∂T k T k B BT V oder mit Gl. (3.164)
d ΔE log Kn (T ) = dT kB T 2
(3.168)
132
3 Grundlagen der Thermodynamik
Hier ist ΔE der Zuwachs an innerer Energie durch die chemischen Reaktionen. Da der ganze Prozess bei konstanten Volumen abläuft, ist ΔE auch die Wärme, die absorbiert oder produziert wird, wenn sich die Moleküle ineinander umwandeln. Da der Logarithmus eine monoton steigende Funktion ist, kann man Folgendes aussagen: Wenn ΔE > 0 wächst KN mit steigender Temperatur an. Wenn ΔE < 0, nimmt KN mit steigender Temperatur ab. Wir können dies einfach interpretieren, wenn wir uns an Gl. (3.158) erinnern: KN (T,V ) =
∏ ζibi i
und an die Tatsache, dass immer ζi > 0 gilt und die bei einer chemischen Reaktion produzierten Moleküle jeweils ein bi > 0 haben und die dabei verbrauchten Moleküle ein bi < 0. Wenn ΔE > 0, haben wir eine endotherme Reaktion, die also von außen Energie benötigt, um stattzufinden. Wenn wir also von einem gegebenen T ausgehen und dieses etwas vergrößern, T → T + ΔT , dann erhalten wir ein Anwachsen von KN , was bedeutet, dass die Rate solcher Reaktionen (von Molekülen mit negativem bi zu solchen mit positivem bi ) weiter anwächst, sich also das Gleichgewicht verschiebt zu mehr Molekülen mit positivem bi . Da diese Prozesse aber Energie benötigen, bedeutet das ein Absinken der Temperatur. Diese Vorgänge entsprechen dem Prinzip von Chatelier, wie wir es bereits in Kap.3.7.4.1 diskutiert haben.
Teil II Statistische Ensembles und Quantenstatistik
4 Das kanonische und großkanonische Ensemble In diesem Kaptel gehen wir zur Statistischen Mechanik zurück und studieren aus dieser Warte Wechselwirkungen zwischen einem betrachteten System und seiner Umgebung. Die entscheidende Frage ist immer: Wenn man ein kleines System a in Kontakt mit einem großen System A (Reservoir) bringt und das Gesamtsystem als abgeschlossen voraussetzt, auf welchen Zustand stellt sich das kleine System ein im Gleichgewicht mit dem großen? Da ein ständiger Energieaustausch zwischen a und A stattfindet, wird das kleine System a keinen festen Mikrozustand einnehmen, sondern seine Zustände werden einer Wahrscheinlichkeitsverteilung unterliegen und so einen Makrozustand bilden. Relevant sind am Ende das kanonische Ensemble (Austausch von Energie bei fester Temperatur) und das großkanonische Ensemble (Austausch von Energie und Teilchen bei fester Temperatur und gegebenem chemischen Potenzial). Beide Ensembles beschreiben reale physikalische Situationen. Zur obigen Betrachtung kommt ein außerordentlich wichtiger Punkt hinzu: Wir haben bisher das mikrokanonische Ensemble kennengelernt. Dieses beschrieb ein abgeschlossenes System der Energie E im Gleichgewicht. Obwohl also das mikrokanonische Ensemble und z.B. das kanonische Ensemble zwei gänzlich verschiedene Ausgangssituationen darstellen, kommen sie, wie wir mit gewissem Erstaunen sehen werden, für makroskopische Systeme zu völlig äquivalenten Aussagen über Mittelwerte von Observablen, sofern man die Temperatur des kanonischen Systems so wählt, dass seine mittlere Energie E¯ gleich der Energie E des mikrokanonischen ist, und die Teilchenzahlen gleich setzt. Das gilt nur für makroskopische Systeme, also mit N ∼ 1024 , und für alle Mittelwerte physikalischer Größen. In beiden Ensembles sind die vorkommenden Verteilungen so scharf um die Mittelwerte gepeakt, dass die Fluktuationen um die Mittelwerte vernachlässigt werden können. Aus beiden Ensembles ergibt sich also die gleiche Thermodynamik. Deshalb können wir uns bei der Behandlung eines konkreten physikalischen Problems je nach Zweckmäßigkeit für die eine oder andere Verteilung entscheiden. Dies gilt in gleichem Maße auch für die großkanonische Gesamtheit, wenn man deren Mittelwert der Teilchenzahl N¯ gleich der Teilchenzahl des kanonischen bzw. des mikrokanonischen Systems wählt und die entsprechenden Energien gleich setzt. In der Praxis ist meistens die mikrokanonische Verteilung die unbequemste, weil sie mathematisch schwieriger zu handhaben ist, wie wir sehen werden. Erinnerung: Das mikrokanonische Ensemble Das mikrokanonische Ensemble beschreibt ein abgeschlossenes System der Energie E und der Teilchenzahl N im Volumen V im Gleichgewicht. Wir haben zulässige Mikrozustände |n, deren Energien En (N,V ) in ein kleines makroskopisches Energieintervall bei E fallen. Entscheidend ist das Postulat gleicher a-priori-Wahrscheinlichkeit. Pn = const Pn = 0
für
E − δ E ≤ En ≤ E
sonst
K. Goeke, Statistik und Thermodynamik, DOI 10.1007/ 978-3-8348-9748-0_4, © Vieweg+Teubner Verlag |Springer Fachmedien Wiesbaden GmbH 2010
136
4 Das kanonische und großkanonische Ensemble
und für die Zustandssumme Gl. (2.4) Ω(E, N,V ) = ∑ δn
mit δn = 1 wenn E − δ E ≤ En ≤ E und δn = 0 sonst
n
woraus folgt 1 fuer E − δ E ≤ En ≤ E Ω(E, N,V ) Wir haben als äußere Parameter hier neben N nur V angegeben, von dem die Energien En abhängen, und deshalb gilt auch Pn = Pn (E, N,V ). Im Allgemeinen haben wir Ω(E, N, x) bzw. Pn = Pn (E, N, x), wobei x = (x1 , x2 , ...) alle äußeren Parameter charakterisiert. Wegen der mit der Energie E stark anwachsenden Funktion Ω(E, N,V ) sind für die Berechnung der mittleren Energie E¯ nur die Zustände in unmittelbarer Umgebung von E relevant mit dem Resultat, dass E¯ = E. Der Nachteil bei der Verwendung des mikrokanonischen Ensembles besteht in der Tatsache, dass immer Summen mit einer endlichen Anzahl von Summanden berechnet werden müssen. Es wird sich als sehr viel einfacher herausstellen, Summen mit einer unendlichen Anzahl von Summanden zu berechnen. Das geschieht bei der kanonischen und der großkanonischen Verteilung, weshalb diese in der Praxis technisch einfacher zu handhaben sind als die mikrokanonische Verteilung und deshalb so wichtig sind. Pn (E, N;V ) =
4.1 Das kanonische Ensemble T
A a
E
Abbildung 4.1: Kanonisches Ensemble: Es beschreibt die Wechselwirkung eines kleinen Systems a mit einem großen System (Reservoir) A der Temperatur T . Das Gesamtsystem, bestehend aus a + A ist abgeschlossen. Es kann Energie zwischen dem kleinen und großen System ausgetauscht werden. Die kanonische Verteilung gibt an, mit welcher Wahrscheinlichkeit Pn das System a bei einer Messung im Mikrozustand der Energie En gefunden wird.
Betrachte ein nicht abgeschlossenes kleines System a im Kontakt zu einem großen System (Wärmereservoir A) der Temperatur T , wie zum Beispiel ein einzelnes Quantensystem oder ein
4.1 Das kanonische Ensemble
137
kleines Makrosystem1 im Kontakt zu einem makroskopischen Festkörper oder einer makroskopischen Flüssigkeit. Siehe Abb. (4.1) zur Illustration. Also sind Beispiele: ein einzelnes Atom in einem Gas oder einer Flüssigkeit, eine Flasche Wein (Sekt, Bier) zum Kühlen in einem Fluss etc. Es sei Energieaustausch zwischen beiden Systemen möglich. Das Gesamtsystem A(0) , bestehend aus a + A, sei abgeschlossen und werde deshalb durch eine mikrokanonische Gesamtheit beschrieben. Es gilt für die Gesamtenergie E (0) von a + A E (0) = E a + E A und sie ist konstant.
4.1.1 Mikroskopisches Untersystem Das kleine System a bestehe zunächst aus einem einzigen mikroskopischen System und habe Mikrozustände, für die gilt Ha |En >= En |En > und daher wegen Energieerhaltung E (0) = En + E A Da Energieaustausch möglich ist, ist zunächst nicht klar, wie die Aufteilung der Gesamtenergie auf die beiden Systeme ist. Das Ensemble des Gesamtsystems A(0) = a + A bestehe aus den zulässigen Mikrozuständen |1 , |2 , ..., |M, die mit den Wahrscheinlichkeiten P1 , P2 , ..., PM besetzt sind, welche wir zunächst nicht kennen, aber jetzt berechnen wollen. Wir suchen also die Wahrscheinlichkeit Pn , bei einem Griff in das Ensemble einen Mikrozustand zu finden, der so geartet ist, dass das kleine System a sich im Zustand der Energie En befindet und das System A die Temperatur T hat. Diese Wahrscheinlichkeit Pn ist gleich der Wahrscheinlichkeit, bei einem Griff in das System A(0) und ”Herausholen” von a dieses im Zustand der Energie En anzufinden. Wir werden sehen, dass wir diese Pn bestimmen können. Sie definieren dann das kanonische Ensemble. Es gilt die Behauptung: Das große System A habe die Temperatur T und habe Wärmekontakt zum kleinen System a. Die Wahrscheinlichkeit Pn , bei einer Messung von a, dieses im MikroZustand |En > anzutreffen, ist gegeben durch die En kanonische Verteilung Pn = C exp − (4.1) kB T Hierbei ist Pn = Pn (T, N,V ) und C ist ein Normierungsfaktor, der sich ergibt durch
∑ Pn = 1 n
Allgemein haben wir Pn = Pn (T, N, x), wobei durch die mikroskopischen Energien En die Abhängigkeit von N und V bzw. allgemein von den äußeren Parametern x = (x1 , x2 , ...) vorliegt. 1 „Klein”
bedeutet hier wieder, dass sich extensive Observable wie Teilchenzahl, Volumen etc. in etwa verhalten wie Obs(a)/Obs(A) ≈ 10−5 oder noch kleiner, aber nicht ≈ 10−24 .
138
4 Das kanonische und großkanonische Ensemble
Beweis: Das System a sei mikroskopisch und befinde sich in einem definierten Quantenzustand der Energie En . Damit gilt Ωa (En ) = 1 Die Zahl der für A(0) zulässigen Zustände ist damit gegeben durch die Zahl der für A zulässigen Zustände im Energieintervall bei EA = E (0) − En . Nach dem fundamentalen statistischen Postulat ist damit die Wahrscheinlichkeit, a im Mikro-Zustand |En > zu finden, gegeben durch die Zahl der für A(0) zulässigen Zustande unter dieser Bedingung. Daraus folgt Pn = C ΩA (E (0) − En ) Weil aber a klein gegenüber A ist, gilt auch En E (0) . Damit kann man eine Taylorentwicklung2 von log ΩA um E (0) machen. ∂ log ΩA (E (0) − En ) = log ΩA (E (0) ) − En log ΩA (E) ∂E V E=E (0) Nun gilt ferner nach Gl. (2.34) 1 = kB T und daraus
oder
∂ log ΩA (E) ∂E V E=E (0)
En log ΩA (E (0) − En ) = log ΩA (E (0) ) − kB T
En Pn = C ΩA (E ) exp −
kB T
(0)
C
Damit ergibt sich als Resultat die kanonische Verteilung von Gl. (4.1). q.e.d. Ein typisches Beispiel: Die Gesamtheit der Atome eines Gases oder eines Festkörpers der Temperatur T bildet das Wärmereservoir, ein einzelnes herausgegriffenes Atom bildet das kleine System mit der kanonischen Verteilung. Die in Pn vorkommende Exponentialfunktion heißt ”Boltzmann-Faktor”. Zur Illustration siehe Abb. (4.2). Boltzmann-Faktor:
En = exp (−β En ) exp − kB T
(4.2)
Offenbar ist der Boltzmann-Faktor nicht ”scharf”, er sagt nur, dass das kleine System mit größerer Wahrscheinlichkeit in einem Zustand kleiner Energie En ist als in einem größerer Energie. Das ist klar, denn bei größerer Energie En muss dem Wärmereservoir A mehr Wärme entzogen werden und damit reduziert sich dessen Anzahl zulässiger Zustände und damit die Anzahl der für A(0) zulässigen Zustände. erinnern uns, dass man Ω(E) nicht in eine Taylor-Reihe entwickeln darf, aber log Ω(E), siehe Gl. (2.15) und nachfolgende Zeilen.
2 Wir
4.1 Das kanonische Ensemble
139
Pn
T1 T2 T3
εn
0
Abbildung 4.2: Kanonisches Ensemble: Die Wahrscheinlichkeit Pn , das kleine System a bei einer Messung im Mikrozustand der Energie εn zu finden, ist aufgetragen gegenüber εn . Betrachtet sind drei verschiedenen Temperaturen mit T1 < T2 < T3 des Wärmereservoirs.
Für die Grenzwerte ergibt sich das erwartete Verhalten: T →∞
=⇒
Pn = const
Denn: Wenn die Temperatur über alle Grenzen wächst, wird die Energie kB T so groß, dass die Energiedifferenzen des kleinen Systems irrelevant werden und dadurch alle Zustände des kleinen Systems gleich besetzt werden. Wir haben auch T →0
=⇒ Pn = 0
PGrundzustand = 1 sonst
Für extrem kleine Temperaturen bleibt nur Energie zur Besetzung des Grundzustandes für das kleine System übrig. Prinzip maximaler Entropie Wir haben bei der obigen Ableitung der kanonischen Wahrscheinlichkeitsverteilung des kleinen Systems a vorausgesetzt, dass das System A(0) = a + A abgeschlossen und im Gleichgewicht ist. Also ist seine Entropie maximal. Diesen Schluss kann man umkehren: Wenn das System a eine kanonische Verteilung hat, dann liegt für A(0) maximale Entropie vor. Das gilt insbesonders dann, wenn A und A(0) sich jeweils aus vielen kleinen Systemen a zusammensetzen. Z.B. gilt für ein O2 -Molekül in Luft die kanonische Verteilung immer dann, wenn die Luft sich im Gleichgewicht befindet und damit maximale Entropie hat. 4.1.1.1 Paramagnetismus, Spin = 1/2 Betrachte eine Substanz mit der Temperatur T bestehend aus identischen Atomen. Jedes Atom hat ein äußeres Elektron mit Spin S = 12 und magnetischem Moment μmag . Von außen sei ein
140
4 Das kanonische und großkanonische Ensemble
in z-Richtung angelegt. Dann haben wir mit g = 2 und dem Bohrschen Magneton Magnetfeld H μB = e¯h/2me c 1 1 |s, sz >= | , ± > 2 2
μm = gμBs
= −gμB sz H E = −μm · H
Für die beiden Energieniveaus gilt mit μ0 = gμB sz = − 12 sz =
1 2
μmag = −μ0
ε = μ0 H
μmag = μ0
ε = −μ0 H
0H P− 1 = C exp − μkT 2 0H P1 = C exp μkT 2
Somit ergibt sich das mittlere magnetische Moment eines jeden der Atome von μ¯ =
−μ0 P(− 12 ) + μ0 P( 12 ) P(− 12 ) + P( 12 )
= μ0
ey − e−y = μ0 tanh y ey + e−y
y=
μ0 H kB T
(4.3)
¯ 0 in Abb. (4.3) aufgetragen ist. wobei die Größe μ/μ μ¯ μ0
1,0
0,5
1,0
0,0
2,0
3,0
y
¯ 0 bei einem paramagnetischen System mit zwei Abbildung 4.3: Das mittlere magnetische Moment μ/μ Spinstellungen in Abhängigkeit von y = μ0 H/kB T .
Die Grenzfälle sind interessant und ergeben sich durch 1 + y − (1 − y) ey − e−y = =y y −y e +e 1 + y + (1 − y) ey ey − e−y = y =1 Für y 1 ergibt sich: y −y e +e e Für y 1 entwickelt:
Damit erhalten wir das Verhalten des mittleren magnetischen Momentes eines Atoms bei hohen und niedrigen Temperaturen: T →∞
oder
μ0 H 1 kB T
=⇒
μ¯ = μ0 y =
μ02 H 1 ∼ kB T T
(Curiesches Gesetz)
(4.4)
4.1 Das kanonische Ensemble
141
und T →0
oder
μ0 H 1 kB T
=⇒
μ¯ = μ0
(Sättigung)
4.1.2 Makroskopisches kleines Untersystem Der obige Beweis bezog sich auf ein mikroskopisches Untersystem mit einem definierten Quantenmikrozustand. Wenn das Untersystem klein, aber makroskopisch ist, dann muss man die Argumentation leicht modifizieren: Das System a bestehe aus Na gleichartigen einzelnen Teilchen mit den Quantenzahlen rν . Jedes einzelne Teilchen ist mit der Wahrscheinlichkeit exp (−εr /kB T ) im Quantenzustand r, denn es ist ja im Kontakt mit dem Reservoir. Da die Teilchen unabhängig voneinander sind, multiplizeren sich die Wahrscheinlichkeiten aller Teilchen. Die Wahrscheinlichkeit, das Untersystem also im Zustand r = (r1 , r2 , ..., rNa ) der Energie ε zu finden, ist deshalb gegeben durch Na 1 1 εr = exp − ε P(ε) = ∏ exp − kB T kB T r=1 mit ε=
Na
∑ εr
r=1
was wieder den Boltzmann-Faktor (4.2) ergibt.
4.1.3 Kanonische Verteilung bei gegebenem E¯ Wir hatten bisher die kanonische Verteilung studiert als Verteilung für ein mikroskopisches System (oder ein kleines makroskopisches System) der festen Teilchenzahl N im Kontakt mit einem Wärmereservoir der Temperatur T , mit dem Energieaustausch möglich ist. Eine andere Situation von physikalischem Interesse liegt vor, wenn ein makroskopisches System aus einer festen Anzahl N von Teilchen besteht und nur als einzige weitere Information die mittlere Energie E¯ des Systems bekannt ist. Behauptung: Das durch die mittlere Energie E¯ definierte System wird ebenfalls beschrieben durch eine kanonische Verteilung. Bei einer Messung wird es also mit der Wahrscheinlichkeit Pn im Mikrozustand der Energie En angetroffen, wobei für Pn gilt Pn = Ce−ζ En Dabei werden C und ζ festgelegt durch die Normierung der Pn und durch die Forderung, dass die vorgegebene mittlere Energie E¯ durch die Verteilung erfüllt wird. Bedingungen also:
∑ Pn = 1 n
∑ En Pn = E¯
(4.5)
n
Die Behauptung ist sehr verständlich: Nenne das System, dessen mittlere Energie festgelegt ist, System a, und nenne seine mittlere Energie E¯a . Wenn die mittlere Energie von a festgelegt ist,
142
4 Das kanonische und großkanonische Ensemble
dann ist es gleichbedeutend, als ob a in thermischem Kontakt mit einem Reservoir A ist, dessen Temperatur gleich einem gewissen TA ist. Durch dieses TA wird die mittlere Energie von a festgelegt, denn a bekommt durch den Kontakt automatisch eine kanonische Verteilung. Man muss also TA bzw. ein ζ = 1/kB TA gerade so wählen, dass sich für das System a das vorgegebene E¯ a ergibt.
4.2 Maxwellsche Geschwindigkeitsverteilung Die Maxwellsche Geschwindigkeitsverteilung beschreibt die Verteilung der Geschwindigkeiten der Teilchen eines idealen Gases bei einer gegebenen Temperatur T . Sie gilt näherungsweise für viele Phänomene in etlichen Gebieten der Physik und wird in diesem Kapitel aus der kanonischen Verteilung hergeleitet. Wir haben jedoch die kanonische Verteilung für ein Quantensystem bestimmt, während die Maxwellsche Geschwindigkeitsverteilung für ein klassisches System definiert ist. Der Zusammenhang zwischen beiden Beschreibungen3 ergibt sich jedoch in natürlicher Weise.
4.2.1 Herleitung aus der kanonischen Verteilung Betrachte ein ideales Gas in einem äußeren Potenzial. Gesucht sind für ein beliebiges herausgegriffenes Molekül die Wahrscheinlichkeit, es unter verschiedenen Nebenbedingungen in einem gewissen Phasenraumvolumen zu finden. Wir gehen von der kanonischen Verteilung aus, denn das herausgegriffene Molekül steht im Wärmekontakt mit dem gesamten Gas. Wir kennen die klassische Energie eines einzelnen Moleküls ε(p, q) =
p2 +U(q) 2m
Die Wahrscheinlichkeit, ein Teilchen in einem herausgegriffenen Volumen des Phasenraums d 3 qd 3 p um p, q zu finden, ist bestimmt durch den Boltzmann-Faktor dW (q, p) = ρ(q, p)d 3 qd 3 p ε(p, q) 3 3 d qd p = C exp − kB T 3 Genau
betrachtet wird der Zusammenhang hergestellt durch die folgende Formel, die den Grenzübergang von der ˆ q, Quantenmechanik zur klassischen Mechanik vollzieht: Betrachte einen Operator A( ˆ p) ˆ abhängig von Orts- und Impuls-Operatoren. Für diesen gilt
−−−→ ˆ q, TrA( ˆ p) ˆ h¯ → 0
d 3 qd 3 p (2π h¯ )3
A(q, p)
wobei die Spur definiert ist durch die Summe über ein vollständiges System |n: TrAˆ = ∑ n| Aˆ |n n
Für den Hamiltonoperator Hˆ wenden wir im Text diese Formel an.
4.2 Maxwellsche Geschwindigkeitsverteilung
143
Hier ist C eine Normierungskonstante proportional zur Dichte ρ(q, p), die dafür sorgt, dass die Wahrscheinlichkeit, das Teilchen irgendwo im Phasenraum zu finden, gleich eins ist. Somit ist die Wahrscheinlichkeit, ein herausgegriffenes Molekül mit beliebigem Impuls p im Volumen d 3 q um q zu finden, gegeben durch Aufsummation (Integration) aller Wahrscheinlichkeiten d 3 p 3 dW (q) = ρ(q, p)d p d 3 q =C
e
2
p − 2mk BT
U(q) 3 d q d p exp − kB T
3
Normierungskonstante
Hieraus ergibt sich unter anderem die Barometrische Höhenformel: Das obige W (q) ist proportional zur Dichte der Luft-Moleküle ρ(z) in der Höhe z über dem Erdboden. Bei gegebener Temperatur T der Atmosphäre und mit PV = NkB T haben wir P = VN kB T und somit
mgz P(z) = P0 exp − kB T
(4.6)
In dieser Gleichung ist aber nur die z-Abhängigkeit und diese auch nur bei nicht zu großer Variation der z-Werte korrekt. Die Temperaturabhängigkeit dieser Formel stimmt nicht im Detail. Die Atmosphäre hat an sich bereits eine z-abhängige Temperatur, während die kanonische Verteilung eine konstante Temperatur voraussetzt. Gl. (4.6) ist also nur eine grobe Näherung. Die Wahrscheinlichkeit, ein herausgegriffenes Molekül an einem beliebigen und gegebenem Ort q im Impulsvolumen d 3 p um p zu finden, ergibt sich zu 3 ρ(q, p)d q d 3 p dW (p) = U(q) 3 p2 = C exp − d q exp − d3 p kT 2mkT
Normierungskonstante
Die Umrechnung dieser Formeln auf die Geschwindigkeiten ergibt die Maxwellschen Geschwindigkeitsverteilungergibt sich dW (v) = f (v)d v = 3
m 2πkB T
3 2
mv2 exp − d3v 2kB T
(4.7)
Diese gibt die Wahrscheinlichkeit an, bei einem zufällig herausgegriffenen Molekül eines idealen Gases der Temperatur T die Geschwindigkeitv vorzufinden. Wegen dW (v) = dW (vx )dW (vy )dW (vz ) gilt auch 1 2 m mv2x exp − (4.8) dW (vx ) = dvx 2πkB T 2kB T
144
4 Das kanonische und großkanonische Ensemble
Der Normierungsfaktor in diesen Gleichungen ergibt sich wegen +∞ π −λ x2 e dx = λ −∞ zu
(4.9)
1 2πkB T 2 mv2x = dvx exp − 2kB T m
Durch Ableitung von Gl. (4.9) nach λ erhalten wir ein Integral, was wir noch mehrfach benötigen: +∞ 2 1 π x2 e−λ x dx = (4.10) 2 λ3 −∞ Aus Gl. (4.7) können wir mit d 3 v = 4πv2 dv die Verteilung des Betrages der Geschwindigkeit bekommen. Mit v = |v| erhalten wir für die Wahrscheinlichkeit, ein Molekül im Geschwindigkeitsintervall [v, v + dv] anzutreffen, die Gleichung Φ(v)dv = 4πv
2
m 2πkB T
3 2
mv2 dv exp − 2kB T
(4.11)
Man kann jetzt einige wichtige Eigenschaften berechnen, was wir im folgenden Kaptiel tun werden.
4.2.2 Eigenschaften der Maxwellschen Geschwindigkeitsverteilung Mittlere Geschwindigkeit Sie ist gegeben durch v¯x =
m 1 ∞ mv2 2 vx exp − x dvx = 0 2πkT 2kT
(4.12)
−∞
Die mittlere Geschwindigkeit verschwindet bei der Maxwellschen Geschwindigkeitsverteilung, was zu erwarten ist, gibt es doch für die Teilchen des Gases keinerlei Vorzugsrichtung. Mittlere quadratische Geschwindigkeit v2 = und daraus
Diese ist eine wichtige Größe und gegeben durch d 3 v v2 f (v) =
3kB T m
(4.13)
3kB T 2 v = m
oder auch für eine Komponente v2x =
kB T m
(4.14)
4.2 Maxwellsche Geschwindigkeitsverteilung
145
Nach Gl. (4.13) ist die mittlere quadratische Geschwindigkeit der Maxwellschen Geschwindigkeitsverteilung proportional zur Temperatur. Mit den obigen Formeln ergibt sich die mittlere kinetische Energie eines Moleküls der Masse m im idealen Gas der Temperatur T zu 3 1 ε¯ = mv2 = kB T 2 2 Diese Formel ist uns von Gl. (2.39) bekannt und entspricht dem Äquipartitionstheorem (siehe nächstes Kapitel). Wahrscheinlichste Geschwindigkeit Die wahrscheinlichste Geschwindigkeit v˜ ist gegeben durch das Maximum von Φ(v) von Gl. (4.11), also ∂ mv2 2 v exp − =0 ∂v 2kT v=v˜ woraus folgt
v˜ =
2kB T m
(4.15)
Weil die Verteilung Φ(v) um keine Frequenz herum symmetrisch ist, haben wir v˜
mit Energie En und Teilchenzahl Nn [Achtung: Wir haben En = En (Nn )] zu finden, ist 13 Die
Äquivalenz der kanonischen mit der mikrokanonischen Verteilung gilt nur bei der Berechnung von Mittelwerten Y von thermodynamischen Observablen Y . Vorsicht aber ist geboten bei der Berechnung von Schwankungsquadraten Δ2Y = (Y −Y )2 , dort gilt trivialerweise 2 Δ Y mikrokan Δ2Y kan .
166
4 Das kanonische und großkanonische Ensemble
gegeben durch:
1 (En − μNn ) Pn = C exp − kB T
(4.46)
Beweis: Mit Ωa (En , Nn ) = 1 ist die gesuchte Wahrscheinlichkeit gegeben durch: Pa (En , Nn ) = CΩA (E (0) − En , N (0) − Nn ) Die Taylorentwicklung des Logarithmus führt dann in erster Ordnung in En und Nn zu
log Pa (En , Nn ) = logC + log ΩA (E (0) , N (0) ) − En
∂ log ΩA ∂E
(0) N
− Nn
∂ log ΩA ∂N
(0) E
Mit den Definitionen der Temperatur T und des thermo-chemischen Potenzials μ 1 ∂ log ΩA (0) β= = kB T ∂E N ∂ log ΩA (0) μ = − kB T ∂N E folgt sofort Gl. (4.46).q.e.d. Dies ist dann die großkanonische Verteilung und es gilt ∑ Pn = 1. Die unabhängigen Variablen sind T,V und μ. Das chemische Potenzial μ spielt hierbei bzgl. der Teilchenzahl N die gleiche Rolle, wie sie die Temperatur T spielt bzgl. der Energie E. Bei mehreren Teilchensorten gilt entsprechend: μNn → ∑ μ j N jn . Mittelwerte: Bei gegebener großkanonischer Verteilung, d.h. bei gegebenem T und μ, können wir die Mittelwerte E¯ und N¯ der Energie bzw. der Teilchenzahl berechnen. Es gelten die Formeln ∑n En exp − kB1T (En − μNn ) E¯ = ∑n exp − kB1T (En − μNn ) und
∑n Nn exp − kB1T (En − μNn ) N¯ = ∑n exp − kB1T (En − μNn )
Von der Diskussion im Zusammenhang mit der kanonischen Verteilung, siehe Kap. 4.1.3, ist es offensichtlich, dass ein Ensemble, von dem nur die mittlere Energie E¯ und die mittlere Teilchenzahl N¯ bekannt ist, ebenfalls durch die großkanonische Verteilung beschrieben wird. Man wählt eben T und μ so, dass E¯ und N¯ reproduziert werden. Dann charakterisieren die Parameter T und μ bzw. β und μ nicht mehr ein Reservoir, sondern das System selbst. Großkanonische Zustandssumme: Es gilt für die großkanonische Zustandssumme ZG = ∑ e−β (En −μNn ) n
(4.47)
4.5 Großkanonisches Ensemble
167
wobei wir immer daran denken müssen, dass die Energien En von der Teilchenzahl abhängen, also zunächst über die Teilchenzahlen und dann über die dann vorliegenden Energien summiert werden muss. Also genau muss man statt Gl. (4.47) besser schreiben ZG = ∑
Großkanonische Zustandssumme
N
oder auch
(N)
∑ e−β (En
−μN)
(4.48)
n
ZG = ∑ zN ZN
(4.49)
N
mit der kanonischen Zustandssumme für N Teilchen (N)
ZN = ∑ e−β En
(4.50)
z = exp(β μ)
(4.51)
n
und der Fugazität
4.5.2 Mittelwerte, generalisierte Kräfte, Entropie Mittelwerte, generalisierte Kräfte: Mit Hilfe der Zustandssumme kann man sofort die Mittelwerte berechnen. Es gilt ∂ + μ N¯ (4.52) log ZG E¯ = − ∂β μ,x und
1 N¯ = β
∂ log ZG ∂μ
(4.53) β ,x
wobei x = (x1 , x2 , . . .) die äußeren Parameter sind. Für die am System durch Änderung der äußeren Parameter xα geleistete Arbeit gilt ¯ = ∑ dxα ∑ ∂ En exp (−β (En − μNn )) = − ∑ X¯α dxα dW α n ∂ xa α und wir erhalten die generalisierte Kraft bzgl. der äußeren Koordinate xα als 1 ∂ log ZG X¯α = β ∂ xα β ,μ
(4.54)
Entropie: Wir können analog zur kanonischen Verteilung die Entropie berechnen, siehe Kap. ¯ = T dS und den Energiesatz 4.4.3. Wir betrachten wieder einen quasistatischen Prozess mit dQ aus Gl. (3.138) mit chemischem Potenzial ¯ + dW ¯ + μdN d E¯ = dQ Damit ergibt sich die Entropie zu (Behauptung):
(4.55)
168
4 Das kanonische und großkanonische Ensemble
¯ S(T,V, μ) = kB (log ZG + β E¯ − μβ N) oder S = kB log ZG +
(4.56)
1 ¯ μ ¯ E− N T T
(4.57)
Beweis: Quasistatisch gilt ∂ log ZG ∂ log ZG ∂ log ZG d log ZG = ∑ dxα + dβ + dμ ∂ xα ∂β ∂μ α β ,μ x,μ x,β Nach den obigen Gleichungen (4.52),(4.53) und (4.54) können wir umformen ¯ − (E¯ − μ N) ¯ dβ + β Ndμ ¯ d log ZG = −β dW ¯ − d [(E¯ − μ N)β ¯ ] + β (d E¯ − Ndμ ¯ ¯ + β Ndμ ¯ = −β dW − μd N) ¯ = T dS Somit folgt mit Gl. (4.55) und dQ ¯ + β d E¯ − β μd N¯ = dQ ¯ = β T dS = ¯ − Nμβ ¯ ) = −β dW d(log ZG + Eβ
1 dS kB
(4.58)
Aus diesem dS schließen wir auf S, woraus man dann die gesuchte Beziehung (4.57) erhält. Hierbei taucht noch eine Integrationskonstante S0 auf, die aber aus gleichen Gründen wie bei der kanonischen Verteilung verschwindet und damit dem dritten Hauptsatz entspricht. q.e.d.
4.5.3 Großkanonisches Potenzial Φ Das großkanonische Potenzial hat als natürliche Koordinaten (T,V, μ) und wir haben es im Rahmen der klassischen Thermodynamik bereits in Gl. (3.139) kennen gelernt. Mit Hilfe der großkanonischen Zustandssume ist es nach Gl. (4.57) formuliert als Φ = E¯ − T S − μ N¯ = −kB T log ZG
(4.59)
Das Differential des großkanonischen Potenzials lautet (Beweis siehe unten bei Gl. (4.64)) ¯ − Ndμ ¯ dΦ = −SdT − PdV
(4.60)
und aus dem Ausdruck für dS in Gl. (4.58) bekommt man das Differential der mittleren Energie ¯ + μd N¯ d E¯ = T dS − PdV und daraus erhalten wir die Relationen
∂Φ ∂T ∂Φ ∂V ∂Φ ∂μ
= −S
(4.61)
= −P¯
(4.62)
= −N¯
(4.63)
V,μ
T,μ
V,T
4.5 Großkanonisches Ensemble
169
Aus der Thermodynamik sind diese Beziehungen klar, man kann sie auch explizit beweisen ausgehend von Gl. (4.59): ∂ 1 ∂ ZG ∂Φ =− kT log ZG = −k log ZG − kT ∂ T V,μ ∂ T V,μ ZG ∂ T V,μ 1 1 1 μ = −k log ZG − kT ( 2 ) ∑ (En + μNn ) exp − En + Nn kT ZG n kT kT μ 1 = −k log ZG − E¯ + N¯ = −S T T und weil die generalisierte Kraft nach Gl. (4.54) definiert ist als X¯α = (∂ log ZG /∂ xα )/β , gilt ∂ ∂Φ = −kT log ZG = −P¯ ∂V T,μ ∂V T ∂Φ ∂ 1 ∂ ZG =− kT log ZG = −kT ∂ μ T,V ∂ μ V,T ZG ∂ μ V,T 1 1 1 μ = −kT ( ) ∑ μNn exp − En + Nn = −N¯ kT ZG n kT kT Jetzt können wir auch aus der großkanonischen Verteilung das Differential dΦ berechnen, was oben bereits behauptet wurde: ∂Φ ∂Φ ∂Φ dΦ = dT + dV + dμ (4.64) ∂ T V,μ ∂V T,μ ∂ μ V,T Die mikroskopischen Rechnungen der obigen Zeilen ergeben für die partiellen Ableitungen je¯ was Gl. (4.60) beweist. weils −S bzw. −P¯ bzw. −N, Wir erinnern: Wir hatten im Kapitel über Thermodynamik allgemein für ein homogenes System gezeigt, dass die Gl. (4.62) sich reduziert auf die einfache Form von Gl. (3.152) ¯ μ)V Φ(T,V, μ) = −P(T, was für das ideale Gas in Gl. (5.23,5.27) explizit bewiesen werden wird.
4.5.4 Großkanonische Verteilung: Zusammenfassung Die großkanonische Zustandssumme mit unabhängigen Variablen T,V, μ ist definiert nach Gl. (4.48) als (N) ZG (T,V, μ) = ∑ ∑ exp −β (En − μN) N
n
Wenn wir die kanonische Zustandssumme zur Teilchenzahl N bezeichnen mit ZN , dann können wir auch schreiben ZG = ∑ ZN eβ μN (4.65) N
170
4 Das kanonische und großkanonische Ensemble
Die mittlere Energie ergibt sich als E¯ = −
∂ log ZG ∂β
μ,x
+ μ N¯
mit einem extrem geringen Schwankungsquadrat. Mit der am System durch Veränderung der äußeren Parameter xα geleisteten Arbeit ¯ = ∑ ∑ exp −β (En(N) − μN) dEn(N) = − ∑ Xα dxα dW N
α
n
ergibt sich die generalisierte Kraft zu 1 X¯α = β
∂ log ZG ∂ xα
β ,μ
Die Entropie S(T, N,V ) wird im quasistatischen Prozess definiert durch den Energiesatz ¯ + dW ¯ + μdN d E¯ = dQ und die Beziehung ¯ = T dS dQ was sich ergibt zu S=
1 ¯ ¯ (E + kB T log ZG − μ N) T
Das großkanonische Potenzial Φ(T,V, μ) hat die gleichen natürlichen Variablen wie die großkanonische Zustandssumme und ist gegeben durch Φ = −kB T log ZG = E¯ − T S − μ N¯ Die Differentiale der freien Energie und der mittleren Energie ergeben sich zu ¯ dF = −SdT − PdV − Ndμ d E¯ = T dS − PdV + μd wodurch alle Beziehungen der Thermodynamik erfüllt sind.
4.6 Ensembles: Vergleich In diesem Kapitel betrachten wir die mikrokanonische, kanonische und großkanonische Wahrscheinlichkeitsverteilung unter einheitlichen formalen Aspekten und diskutieren ihre gemeinsamen und unterschiedlichen Seiten. Der Begriff des statistischen Operators (auch Dichteoperator oder Dichtematrix genannt) ist dabei wesentlich.
4.6 Ensembles: Vergleich
171
4.6.1 Statistischer Operator und Entropie Betrachte ein Ensemble {Pσ } aus M Systemen in den zulässigen Mikrozuständen (|1 , |2 , ...). Diese spannen einen Hilbertraum auf, in dem sich alles Folgende abspielt. Wir definieren den statistischen Operator (Dichteoperator) durch die Summe über alle diese Mikrozustände: ρˆ =
M
∑ |σ σ |
(4.66)
σ =1
Wir halten fest, dass die Gesamtheit der Zustände |σ kein vollständiges Basis-System bildet. Denn: Mehrere von ihnen können gleich sein und sie können z.B. dadurch eingeschränkt sein, dass ihre Energien oder magnetischen Momente in einem gewissen Bereich liegen. Die Zustände |σ sind im Allgemeinen zeitabhängig, weil durch sie auch Zustände außerhalb des Gleichgewichts beschrieben werden. Sie genügen der Schrödinger-Gleichung Hˆ |σ (t) = i¯h(∂ /∂t) |σ (t), ˆ die von Neumann-Gleichung folgt woraus direkt für die Zeitabhängigkeit von ρ(t) i¯h
∂ ρˆ ˆ = H, ρˆ ∂t
(4.67)
ˆ ρˆ = 0 beschrieben. ˆ Offenbar wird das Gleichgewicht durch ∂ ρ/∂t = 0 und H, Die Lösung der von Neumann-Gleichung bestimmt die Besetzungswahrscheinlichkeiten Pn (t). Diese geben an, wie viele der im Ensemble versammelten M Mikrosysteme im Zustand |n sind, wie häufig |n also in der Summe über σ vorkommt. Hierbei bilden jetzt die |n ein vollständiges ˆ Basis-System, was üblicherweise durch die Eigenzustände von ρˆ oder von H gegeben ist, welche ˆ im Gleichgewicht wegen H, ρˆ = 0 identisch sind und die Energie-Basis von Hˆ darstellen. Das ergibt 1 M ˆ |n = n|σ (t) σ (t)|n Pn (t) = n| ρ(t) (4.68) M σ∑ =1 oder äquivalent
ρˆ = ∑ |n Pn (t) n|
(4.69)
n
Weil die Pn ≥ 0 sind, ist der statistische Operator positiv definit. Insgesamt gilt für ihn, wie man sofort sieht14 : ˆ =1 ρˆ positiv definit ρˆ = ρˆ † Sp [ρ] (4.70) Der Dichteoperator ρˆ bestimmt die Eigenschaften des statistischen Ensembles, denn er legt die Mittelwerte aller Operatoren fest: durch Gl. (2.2) 1 M σ | Fˆ |σ = Sp ρˆ Fˆ F¯ = ∑ M σ =1
(4.71)
Wir werden jetzt im Folgenden die verschiedenen Dichteoperatoren im Gleichgewicht vorstellen, ihre Eigenschaften beschreiben, aber die entsprechenden Beweise auf später verschieben und im Zusammenhang mit der Entropie diskutieren. Für Gleichgewichtsverteilungen wählt man ˆ und so werden wir es auch tun. üblicherweise die Energiedarstellung von H, Formalismus gilt sehr allgemein. Die Zustände |σ müssen normiert, aber nicht notwendig orthogonal sein. Die definierenden Eigenschaften für den statistischen Operator sind ganz allgemein nur die von Gl. (4.70), nämlich dass ˆ = 1 und sonst nichts, siehe [Sch05] und [Bre92]. er positiv definit ist und dass gilt ρˆ = ρˆ † und Sp [ρ]
14 Der
172
4 Das kanonische und großkanonische Ensemble
Mikrokanonische Verteilung: Den Dichteoperator ρˆ MK für die mikrokanonische Verteilung (im Gleichgewicht) kann man sofort hinschreiben. Nach Gl. (2.4) ist Ω(E, x) gleich der Anzahl der Zustände im Energieintervall En ∈ [E − δ E, E]. Diese wurden als zulässige Zustände bezeichnet: Ω(E, x) = ∑ δr
mit δr = 1 wenn E − δ E ≤ Er (x) ≤ E und δr = 0 sonst
(4.72)
r
Der entsprechende statistische Operator ist also mit den dort hergeleiteten Pn = 1/Ω(E, x) gleich ρˆ MK =
∑
n=zul
|n
1 n| Ω(E, x)
(4.73)
Man kann zeigen [Sch06], dass die in der Literatur oft angegebenen Formeln ρˆ MK =
1 δ (Hˆ − E) und Ω(E, x) = Sp δ (Hˆ − E) Ω(E, x)
(4.74)
im thermodynamischen Limes und im klassischen Limes, wo in beiden Fällen ein Kontinuum von Mikrozuständen vorliegt, mit Gl. (4.73) und Gl. (4.72) identisch sind und deshalb oft als Abkürzungen gewählt werden. Der thermodynamische Limes ist gegeben durch V → ∞ und N → ∞ mit der Nebenbedingung, dass N/V = const. Kanonische Verteilung: Der statistische Operator für die kanonische Verteilung (im Gleichgewicht) lautet Hˆ 1 ρˆ = exp − (4.75) Z kB T wobei wir wie bekannt
genommen haben. Damit gilt
En Z = ∑ exp − kB T n En 1 < n| ρˆ = ∑ |n > exp − Z n kB T
(4.76)
Damit gilt z.B. ˆ = Sp [ρ]
1 E 1 ˆ >= ∑ exp (− n ) = 1 < m|ρ|m Z∑ Z k BT m n
Weiterhin haben wir sofort für den Mittelwert des Operators Fˆ 1 En ) F¯ = Sp ρˆ Fˆ = ∑ Fn exp (− Z n kB T
(4.77)
4.6 Ensembles: Vergleich
173
Großkanonische Verteilung: Analog zur kanonischen Verteilung können wir die Ausdrücke für die großkanonische Verteilung (im Gleichgewicht) herleiten, indem wir ersetzen Hˆ → Hˆ − ˆ E¯ → E¯ − μ N, ¯ ρˆ → ρˆ G und Z → ZG . Damit erhalten wir μ N, 1 Hˆ − μ Nˆ exp − ρˆ G = ZG kB T
(4.78)
wobei ZG aus Gl. (4.48) genommen wurde. Wir haben als wichtige Behauptung für einen gegebenen statistischen Operator ρˆ die sog. Gibbssche Entropie-Formel:
oder äquivalent
ˆ S = −kB log ρˆ = −kB Sp [ρˆ log ρ]
(4.79)
S = −kB ∑ Pn log Pn
(4.80)
n
Beide Ausdrücke Gl. (4.79) und Gl. (4.80) sind äquivalent. Man sieht das sofort im Eigen-System ˆ denn nach Gl. (4.69) gilt n| log ρˆ |m = δnm log Pn und daraus folgt sofort: von ρ, ˆ = ∑ |n log Pn n| log(ρ)
(4.81)
n
wodurch wir Gl. (4.80) sofort erhalten. Beweis: Wir müssen aber die Gibbssche Entropieformel Gl. (4.79) noch beweisen. Wir tun dies zunächst für die mikrokanonische Verteilung. In der gewählten Diagonaldarstellung Gl. (4.73) von ρˆMK ist 1 log(ρˆ MK ) = ∑ |n log n| (4.82) Ω(E) n=zul und damit gilt
1 ' ( 1' ( n |m n|n log −kB Sp [ρˆ MK log(ρˆ MK )] = −kB ∑ ∑ m|n Ω Ω n,n =zul m was wegen der Orthogonalität der Zustände ergibt 1 1 = −kB log ∑ n|n = kB log Ω Ω Ω n=zul womit gezeigt wurde, dass die Gibbssche Entropieformel (4.79) mit dem statistischen Operator der mikrokanonischen Gesamtheit (4.73) in der Tat den korrekten Ausdruck für die mikrokanonische Entropie (2.32) liefert. Die analoge Rechnung führen wir jetzt für die kanonische Verteilung durch: 1 Hˆ Hˆ S = −kB Sp ρˆ log exp (− ) = kB Sp [ρˆ log Z] − kB Sp ρˆ log exp (− ) Z kB T kB T
174
4 Das kanonische und großkanonische Ensemble
Nun gilt für die einzelnen Terme 1 1 Hˆ Hˆ exp (− ) log Z = kB log ZSp exp (− ) = log Z kB Sp [ρˆ log Z] = kB Sp Z kB T Z kB T 1 Hˆ 1 ) = kB Sp ρˆ Hˆ = E¯ kB Sp ρˆ log exp (− kB T kB T T ¯ , für die kanonische Entropie durch einDaraus folgt der Ausdruck (4.34), i.e. S = kB log Z + E/T faches Einsetzen. Wir haben durch diese Rechnung gleichzeitig gezeigt, dass Gl. (4.76) stimmt, weil sie zusammen mit Gl. (4.79) den bekannten Ausdruck für die kanonische Entropie (4.34) liefert. Für die großkanonische Verteilung gilt Ähnliches:
und
SG = −kB log ρˆ G = −kB Sp [ρˆ G log ρˆ G ]
(4.83)
was bei expliziter Rechnung Gl. (4.56) für die großkanonische Entropie liefert. q.e.d.
4.6.2 Extremalprinzipien Man kann die Wahrscheinlichkeitsverteilungen in einem gemeinsamen Formalismus herleiten, der auf dem Prinzip maximaler Entropie bei vorgegebenen Mittelwerten basiert. Am Beispiel der kanonischen Verteilung sieht man das am besten. Wir werden zeigen, dass von allen Ensembles mit einer vorgegebenen mittleren Energie E¯ die kanonische Gesamtheit die maximale Entropie besitzt. Man kann auch eine andere Aussage machen: Wenn man nicht E¯ vorgibt, sondern die Temperatur T , so nimmt die Freie Energie des kanonischen Ensembles im Gleichgewicht ein Minimum an. Beide Verfahren werden wir diskutieren. 4.6.2.1 Das Prinzip maximaler Entropie bei vorgegebenen Mittelwerten Im Folgenden benutzen wir das Prinzip der maximalen Entropie als Variationsprinzip und binden sukzessive Nebenbedingungen ein. Die Entropie ist gegeben durch die Gibbssche Entropieformel Gl. (4.80). Die Nebenbedingungen bei der Variation von S = −kB ∑n Pn log Pn lauten:
∑ Pn = 1
Normierung: mikrokanonisch, kanonisch, großkanonisch
(4.84)
n
∑ En Pn = E¯
mittlere Energie: kanonisch, großkanonisch
(4.85)
mittlere Teilchenzahl: großkanonisch
(4.86)
n
∑ Nn Pn = N¯ n
Wir führen das Variationsverfahren am Beispiel der kanonischen Verteilung vor, bei dem wir die Normierung und die mittlere Energie mit Hilfe von Lagrangemultiplikatoren λ und ν einbinden. Damit erhalten wir als Variationsprinzip, dass die Pn gegeben sind durch das Minimum des Ausdrucks: A (P1 , P2 , · · · ) = ∑ Pn log Pn + λ ∑ Pn + ν ∑ En Pn (4.87) n
n
n
4.6 Ensembles: Vergleich
175
oder 0=
∂ ∂ Pk
∑ Pn log Pn + λ ∑ Pn + ν ∑ En Pn n
n
n
was ergibt 0 = log Pk + 1 + λ + νEk oder Pk = exp (−λ − 1) exp(−νEk )
(4.88)
Die Forderung der Normierung in Gl. (4.84) ergibt exp (−λ − 1) ∑ exp(−νEk ) = 1 k
und damit aus Gl. (4.88) sofort
exp (−νEk ) ∑i exp(−νEi ) Die Forderung der mittleren Energie in Gl. (4.85) ergibt Pk =
(4.89)
exp (−λ − 1) ∑ Ek exp(−νEk ) = E¯ k
woraus wir kombinieren
∑k Ek exp(−νEk ) = E¯ ∑k exp(−νEk )
Wir erhalten also Pn und E¯ als Funktion von ν. Bei vorgegebenem E¯ muss man ν = (kB T )−1 entsprechend dieser Vorgabe wählen. Damit haben wir die übliche kanonische Verteilung Gl. (4.89). Wir können also schreiben: Von allen Zuständen mit der mittleren Energie E¯ besitzt die kanonische Gesamtheit die größte Entropie. q.e.d. Die großkanonische Verteilung erhalten wir auf gleiche Weise, wobei wir die mittlere Teilchenzahl N¯ nach Gl. (4.86) mit einem weiteren Lagrangemultiplikator in Gl. (4.87) einkoppeln. Um die mikrokanonische Verteilung zu erhalten, läßt man in Gl. (4.87) die Bedingung für die mittlere Energie E¯ weg und setzt ν = 0, was dann nach Gl. (4.88) ergibt, dass Pk = exp (−λ − 1) = const. Für die (zulässigen) Zustände im Energieband [E − δ E, E] der mikrokanonischen Verteilung haben wir ∑ Pk = Ω(E) und damit das gesuchte Pk = 1/Ω(E). 4.6.2.2 Prinzip minimalen thermodynamischen Potenzials Wir haben im vorherigen Unterkapitel bewiesen, dass die drei Gleichgewichtsverteilungen sich durch Maximierung der Entropie bei vorgegebener Normierung, Energie oder Teilchenzahl herleiten lassen. Wir hatten auf der anderen Seite in Kap. 3.7.4.3 gelernt, dass der Gleichgewichtszustand eines Systems im Kontakt mit einem Wärme-Reservoir durch das Minimum der Freien Energie gegeben ist. Allgemein können wir sogar sagen Behauptung [Sch05]: Es hängt vom Ensemble ab, welche Größe beim Gang eines Systems ins Gleichgewicht ein Extremum annimmt. Bei einem mikrokanonischen Ensemble wird S maximal15 , bei einem kanonischen wird F minimal und bei einem großkanonischen erreicht Φ ein Minimum. 15 Oder
(−S) minimal.
176
4 Das kanonische und großkanonische Ensemble
Diese Aussagen stellen keinen Widerspruch zum Prinzip maximaler Entropie dar. Die Aussage ist nämlich, dass die Funktion A (P1 , P2 , · · · ) aus Gl. (4.87) nach Berechnung der LagrangeMultiplikatoren eben die Entropie bzw. die Freie Energie bzw. das großkanonische Potenzial sind. Machen wir uns das wieder an der kanonischen Verteilung klar. Nachdem wir gelernt haben, dass diese herrührt aus Maximierung der Entropie bei gegebener Normierung und gegebener mittleren Energie, können wir fragen, wie diese Verteilung dann bei gegebener Temperatur aussieht. Wir können das erreichen, indem wir den Parameter E¯ so lange ”mit der Hand” variieren, bis unser Ensemble das gesuchte T hat. Das ist, wie wir gleich sehen werden, äquivalent, die Freie Energie bei gegebenem T zu minimisieren. Wir haben also wieder Variationsverfahren, aber mit anderen Nebenbedingungen als im vorherigen Unterkapitel. Wir benötigen für einen Beweis zunächst einen allgemeinen Hilfssatz: Es sei ρˆ Gl der statistische Operator eines Gleichgewichtszustandes (ohne weitere Spezifizierung). Seine Eigenzustände spannen einen gewissen Hilbertraum auf. Das ρˆ sei der Dichteoperator eines quasistatisch erreichbaren Nichtgleichgewichtszustandes im gleichen Hilbertraum. Wenn wir mit |k die Eigenzustände des hermiteschen ρˆ bezeichnen und mit ρk dessen Diagonalelemente in dieser Basis, so gilt für die Entropie dieses Nichtgleichgewichtszustandes16 ˆ = −kB Sp [ρˆ log(ρ)] ˆ = kB Sp [ρˆ (log(ρˆ Gl ) − log(ρ) ˆ − log(ρˆ Gl ))] S[ρ] ρˆ Gl ˆ ˆ = kB ∑ ρk k| log(ρGl ) − log(ρk ) − log(ρGl ) |k = kB ∑ ρk k| log − log(ρˆ Gl ) |k ρk k k ρˆ Gl ˆ − kB Sp [ρˆ log(ρˆ Gl )] − 1 − log(ρˆ Gl ) |k = kB Sp [ρˆ Gl − ρ] ≤ kB ∑ ρk k| ρk k ˆ ≤ ρˆ − 1 verwendet haben, die für das positiv definite wobei wir die Operatorungleichung log(ρ) ˆ und hermitesche ρ gilt. Wir erhalten sie, wenn wir die bekannte Ungleichung log x ≤ x − 1 auf ˆ aus Gl. (4.81) anwenden. Jetzt folgt wegen Gl. (4.70) jedes Diagonalelement von log(ρ) ˆ = −kB Sp [ρˆ log(ρ)] ˆ ≤ kB Sp [ρˆ log(ρˆ Gl )] S[ρ]
(4.90)
Mit dieser Gleichung werden wir unsere Behauptung der minimalen thermodynamischen Potenziale beweisen. Für die mikrokanonische Verteilung ist der Beweis, dass sie im Gleichgewicht maximal ist, bereits am Ende von Kapitel 4.6.2.1 erbracht worden, weil sie grundsätzlich durch die Vorgabe der Energie E definiert ist. Für die kanonische Verteilung bei gegebenem T statt E¯ führen wir den Beweis jetzt. Es sei ρˆ Gl = exp −β Hˆ /Z der statistische Operator einer kanonischen Gleichgewichtsverteilung gegebener Temperatur, dessen Eigenzustände einen gewissen Hilbertraum aufspannen. Das ρˆ sei eine durch quasistatische Änderungen erreichbare kanonische Nichtgleichgewichtsverteilung im gleichen Hilbertraum. Dann gilt wegen Gl. (4.90) 1 ˆ ≤ −kB Sp ρˆ log S[ρ] exp −β Hˆ Z 16 Bei
den folgenden Formeln bis einschließlich Gl. (4.90) kommt es nur darauf an, dass zwei verschiedene im gleichen Hilbertraum definierte Dichteoperatoren verwendet werden. Es werden niemals Eigenschaften benötigt, die nur ein Gleichgewichtszustand ρˆ Gl besitzt. Das ρˆ Gl wurde nur in die Formeln gebracht, weil sich alles im Hilbertraum aufgespannt durch seine Eigenzustände abspielt.
4.6 Ensembles: Vergleich
177
1 ˆ = −kB Sp ρˆ log + ρˆ log exp −β H = kB Sp [ρˆ log Z] + kB β Sp ρˆ Hˆ Z und daraus folgt ¯ ρ] ˆ ≤ log Z + β E[ ˆ S[ρ] In dieser Gleichung stammt nur Z aus dem Gleichgewichtszustand. Wir können aber mit kB T multiplizieren und umformen: ˆ = F[ρ] ˆ −kB T log Z = F[ρˆ Gl ] ≤ (E¯ − T S) [ρ] Die LHS ist die Freie Energie des Gleichgewichtszustandes und die RHS die Freie Energie des ˆ Damit ist bewiesen, dass die Freie Energie des GleichgewichtsZustands mit der Dichtematrix ρ. zustands immer kleiner oder gleich der Freien Energie eines beliebigen Nichtgleichgewichtszustandes des Systems ist. q.e.d. Also: Ein kanonisches System bei fester Temperatur hat im Gleichgewicht minimale Freie Energie F(T,V, N). Dies ist auch die Aussage der Kap. 3.7.2 und 3.7.4.3. Der Beweis kann ohne große Mühe generalisiert werden auf ein großkanonisches System gegebener Temperatur und gegebenem chemischen Potenzial. Dort nimmt das großkanonische Potenzial Φ(T,V, μ) im Gleichgewicht sein Minimum an.
4.6.3 Vergleich der Wahrscheinlichkeitsverteilungen Das mikrokanonische, kanonische und großkanonische Ensemble sind bei einem makroskopischen System äquivalent, wenn die Mittelwerte der Energie und der Teilchenzahl entsprechend gewählt werden. Es entsprechen sich bei gleichem V • Mikrokanonisch: E = E0 , N = N0 • Kanonisch: E¯ = E0 , N = N0 • Großkanonisch: E¯ = E0 , N¯ = N0 Wir können diese Wahrscheinlichkeitsverteilungen in der folgenden Tabelle zusammenfassen: Eigenschaften der Ensembles Ensemble Physikal. Situation Dichtematrix Normierung unabh. Var. Therm. Pot. E P
mikrokanonisch
kanonisch Energieisoliert austausch ˆ ρˆ = Ω1 δ (Hˆ − E) ρˆ = Z1 exp(− kBHT ) ) * ˆ Ω = Sp δ (Hˆ − E) Z = Sp exp(− kBHT ) E,V, N S = kB logΩ 1 ∂S T = ∂E V ∂S P = T ∂V
E
T,V, N F = −k B T log Z E = − ∂∂β log Z V P = − ∂∂VF T
(4.91) groß-kanonisch Energie- und Teilchenaust. ˆ Nˆ ρˆ = Z1G exp(− H−μ kB T ) * ) ˆ Nˆ ZG = Sp exp(− H−μ kB T ) T,V, μ Φ= −kB T log ZG ∂ E = − ∂ β log ZG + μN V,μ P = − ∂∂VΦ T,μ
Bemerkungen: Die Ausdrücke für die mikrokanonische Dichtematrix und die entsprechende Normierung wurden in Gl. (4.74) erklärt. Natürlich sind je nach Gesamtheit gemittelte Größen
178
4 Das kanonische und großkanonische Ensemble
gemeint, also bei der großkanonischen Gesamtheit statt N besser N¯ etc. Bei mehreren Teilchensorten muss man analog zu den Formeln der Thermodynamik mehrerer Komponenten die folgenden Ersetzungen vornehmen: N → {Ni } und μ → {μi } und μN → ∑i μi Ni . Man geht in der Praxis auf folgende Weise vor, um die Größen in der Tabelle der Gl. (4.91) zu erhalten: Mikrokanonische Gesamtheit: Hier ist die wesentliche zu berechnende Größe die Entropie S = S(E,V, N). Deren partielle Ableitung nach E bei konstanten V, N führt zu T (E,V, N). Aus T (E,V, N) muss dann durch Umformen E(T,V, N) berechnet werden. Die partielle Ableitung von S nach V bei konstantem E, N ergibt den Druck P(E,V, N), in den dann E(T,V, N) eingesetzt werden muss, um P(T,V, N) zu erhalten. Kanonische Gesamtheit: Hier muss die Zustandssumme Z berechnet werden, aus der man sofort F erhält. Die partiellen Ableitungen von F nach T und V führen nach Gl. (4.38,4.39) zu S(T,V, N) und P(T,V, N). Daraus erhält man dann auch E(T,V, N) = F + T S. Großkanonische Gesamtheit: Hier muss die großkanonische Zustandssumme ZG berechnet werden, aus der man sofort Φ erhält. Die partiellen Ableitungen von Φ(T,V, μ) nach T,V und μ führen nach Gl. (4.63,4.61,4.62) zu S(T,V, μ), P(T,V, μ) und N(T,V, μ). Man löst N(T,V, μ) nach μ(T,V, N) auf und setzt dies in S(T,V, μ), P(T,V, μ) ein und erhält S(T,V, N), P(T,V, N) und damit auch die Energie E(T,V, N) = Φ + T S + μN. Thermodynamische Potenziale: Aus S, F und Φ können alle anderen thermodynamischen Potenziale hergeleitet werden. Diese haben dann nicht mehr so einfache Zusammenhänge mit S, Z oder ZG , weil sie andere natürliche Variablen haben, aber im Prinzip und in der Praxis kann man sie berechnen. Am Ende erhält man die Tabelle von Gl. (3.140). Selbst diese ist nicht ganz vollständig, es gibt noch drei weitere, aber nicht so wichtige Potenziale, wie in [Sch05] nachzulesen ist.
5 Elementare Anwendungen der statistischen Mechanik 5.1 Das Ideale Gas als kanonisches Ensemble In diesem Kapitel betrachten wir einige elementare Anwendungen der statistischen Mechanik. Wir befassen uns mit Systemen, bei denen sich die Wellenfunktionen der einzelnen Teilchen nicht überlappen. Das ist gleichbedeutend mit der Annahme, dass die thermische DeBroglieWellenlänge (bzw. die thermische Wellenlänge) viel kleiner ist als der mittlere Abstand der Teilchen, also eine klassische Behandlung im Prinzip erlaubt ist. Dennoch muss die Identität der Teilchen berücksichtigt werden. Deshalb ist ein wichtiger Punkt in diesem Kapitel das Gibbssche Paradoxon, was Gibbs dazu brachte, den berühmten Faktor 1/N! einzuführen1 . Um diese Gedankengänge hier nachzuvollziehen, muss die klassische Entropie berechnet werden, die ihrerseits im kanonischen Ensemble die Kenntnis des Logarithmus der Zustandssumme und der mittleren Energie erfordert. Diese Größen werden zunächst berechnet unter Mitnahme2 des Faktors 1/N!, bevor wir das Gibbssche Paradoxon nachvollziehen. Anschließend folgen einige einfache, aber wichtige Anwendungen.
5.1.1 Kanonische Zustandssumme Betrachte ein ideales monoatomares Gas aus N identischen Atomen der Masse m im Volumen V mit der Temperatur T = (kB β )−1 . Klassisch gilt für die totale Energie: E(r1 ,p1 , ...,rN ,pN ) =
N
p2
∑ 2mk +U(ri , ..., rN )
k=1
Im Prinzip enthält das U alle Zweiteilchen-Wechselwirkungen plus die Wirkung der Wände. Wenn das Gas jedoch hinreichend dünn ist, dann sind nur noch die Wände wirksam, die das Gas einschließen. Wir haben dann die klassische kanonische Zustandssumme: Z=
1 N!h3N
1 = N!h3N
exp [E(r1 ,p1 , ...,rN ,pN )] d 3 p1 ...d 3 pN d 3 r1 ...d 3 rN
p2 exp −β ∑ i i 2m
d 3 p1 ...d 3 pN
e−βU(r1 ,...,rN ) d 3 r1 ...d 3 rN
1 Man
mache sich den Mut des Josiah William Gibbs (1839-1903) klar, einen Faktor N! einzuführen, der viel größer ist als die Gesamtzahl aller Nukleonen im heute (und zu Zeiten von Gibbs) beobachtbaren Universum. 2 Damit im Text keine falschen Formeln stehen.
K. Goeke, Statistik und Thermodynamik, DOI 10.1007/ 978-3-8348-9748-0_5, © Vieweg+Teubner Verlag |Springer Fachmedien Wiesbaden GmbH 2010
180
5 Elementare Anwendungen der statistischen Mechanik
1 3N 1 1 3N 1 Hier haben wir den Faktor N! = N! eingeführt, um trotz klassischer Behandlung h 2π h¯ des Problems in gewisser Weise die Quantenmechanik und ihren Phasenraum zu simulieren, und am Ende nur korrekte Formeln zu haben: Eine genaue Rechnung an einfachen Systemen zeigt, dass ein einziger Quantenzustand ein Phasenraumvolumen von ΔqΔp = h = 2π h¯ einnimmt. Die 1 Identität der Teilchen ist, wie ausgeführt, berücksichtigt durch den Gibbsschen Faktor N! , den es noch zu erklären gilt. Wenn ein ideales Gas im Volumen V vorliegt, können wir das Integral über die Ortskoordinaten ausführen und erhalten N p2 VN 3 exp −β Z= d p N!h3N 2m oder nach Ausführung des Integrals 1 N Z= ζ N!
1 ζ= 3 h
mit
+
2πm β
3 V
Somit erhalten wir für die kanonische Zustandssumme des idealen Gases Z=
1 N!
V λ3
N (5.1)
mit der thermischen Wellenlänge3 λ=√
h 2πmkB T
(5.2)
Daraus folgt mit der Stirlingschen Formel
3 3 2πm log Z = N logV − 3N log λ − log N! = N logV − log β + log 2 − log N + 1 2 2 h
(5.3)
Aus diesem für das ideale Gas geltenden Ausdruck für Z kann man alle relevanten Größen berechnen, wie wir im Folgenden sehen werden.
5.1.2 Thermische Zustandsgleichung, mittlere Energie Der mittlere Druck des idealen Gases berechnet sich zu 1N 1 ∂ log Z ¯ = P= β ∂V β V T woraus sofort die thermische Zustandsgleichung folgt ¯ = NkB T PV 3 Der
Name der thermischen Wellenlänge rührt daher, dass sie sehr ähnlich der thermischen DeBroglie-Wellenlänge Gl. h (1.2) der Teilchen eines Gases bei der Temperatur T ist, dort gilt λdeB = √3mk . T B
5.1 Das Ideale Gas als kanonisches Ensemble
181
und die mittlere Energie zu E¯ = −
∂ log Z ∂β
= V
3N 3 = NkB T = N ε¯ = CV T 2β 2
mit ε¯ = 32 kB T als mittlere Energie pro Atom und CV = 32 NkB als Wärmekapazität. Die Energiefluktuationen ergeben sich zu Δ2 E = −
∂ E¯ ∂β
=− V
∂ E¯ ∂T
V
∂T = kB T 2 ∂β
∂ E¯ ∂T
(5.4) V
oder äquivalent Δ2 E = kB T 2CV , Die letzte Gleichung gilt ganz allgemein, weil wir in Gl. (5.4) keine Eigenschaft idealer Gase verwendet haben. Wir haben sie auch bereits in Gl. (4.28) kennengelernt. Im Spezialfall des idealen Gases wird: 3 Δ2 E = NkB2 T 2 2 woraus für das ideale Gas folgt:
Δ2 E 2 . = ¯ 3N E
Dies Gleichung bestätigt die ganz allgemeine Abhängigkeit der relativen Fluktuation eines makroskopischen Systems von der Teilchenzahl, wie wir sie bereits in Gl. (4.30) hergeleitet haben: 1 Δ2 E ∼√ ¯ E N Dies ist für makroskopische eine außerordentlich wichtige Beziehung, weil sich dadurch die √ Fluktuationen von Observablen wegen 10−24 ∼ 10−12 als vernachlässigbar herausstellen.
5.1.3 Entropie Der Ausdruck für die Entropie eines kanonischen Systems ist gegeben durch Gl. (4.34), i.e. ¯ und damit ergibt sich für das ideale Gas mit Gl. (5.3) : S = kB (log Z + β E), S = NkB (log
V 3 + log T + σ ) N 2
(5.5)
mit der von V, T, N unabhängigen Konstanten σ=
2πmkB 5 3 log( )+ 2 2 h 2
(5.6)
182
5 Elementare Anwendungen der statistischen Mechanik
5.1.4 Gibbssches Paradoxon und Ununterscheidbarkeit von Teilchen Die obigen Gleichungen (5.5,5.6) wurden unter Mitnahme des Gibbschen Faktors 1/N! zur Berücksichtigung der Identität der Gasteilchen berechnet. Gibbs illustrierte die Bedeutung dieses Faktors an der Mischungsentropie des idealen Gases, die er einmal ohne und einmal mit dem Faktor 1/N! berechnete. Führen wir die obigen Rechnung ohne den Faktor 1/N! durch, so erhalten wir für die Zustandssumme und die Entropie die (falschen!) Ausdrücke
und
Z = ζ N
(5.7)
3 S = NkB (logV + log T + σ ) 2
(5.8)
mit
3 3 2πmkB )+ log( 2 h2 2 Betrachte mit diesem (falschen) Ausdruck (5.8) für die Entropie die Mischungsentropie von zwei verschiedenen, idealen Gasen gleicher Temperatur und gleichen Drucks mit N1 ,V1 und N2 ,V2 , die zunächst getrennt sind und sich dann im gemeinsamen Volumen V = V1 +V2 vermischen, siehe Abb. (5.1). σ =
N1 , V1
N2 , V2
N = N1 +N2 V =V1 +V2
Abbildung 5.1: Mischungsentropie: Illustration zum Gibbsschen Paradoxon.
Vor der Mischung haben wir (ohne den Faktor 1/N!) für jedes Teilvolumen: 3 Si = Ni kB logVi + log T + σi 2 mit i = 1, 2 und nach der Mischung, weil jedes Gas das gesamte Volumen einnimmt: 3 S = (N1 + N2 )kB (logV + log T ) + N1 kB σ1 + N2 kB σ2 2 wobei die Konstanten σi von der jeweiligen Masse der Gasmoleküle abhängen. Daraus folgt für den Zuwachs der Entropie durch die Mischung: ΔS = S − S1 − S2 = kB N1 log
V V + kB N2 log >0 V1 V2
(5.9)
Dieser Ausdruck ist in Ordnung, wenn man zwei verschiedene Gase betrachtet. Er führt jedoch zum Paradoxon, wenn man sich dies für zwei gleiche Gase vorstellt. In diesem Fall ergibt Gl. (5.9) ebenfalls eine Entropieerhöhung, was nicht sein darf. In einer solchen Situation hinge bei
5.1 Das Ideale Gas als kanonisches Ensemble
183
einem einzigen Gas dessen Entropie von der Vorgeschichte ab, d. h., wie viele imaginäre Wände wir aus dem Gas gezogen oder in es hineingeschoben hätten. Gibbs löste, wie wir wissen, dies Problem auf empirische Weise. Er postulierte, dass die korrekte Zustandssumme eines Gases gegeben ist durch das Z der obigen Gl. (5.7) korrigiert mit dem Faktor 1/N!, was dann zu den korrekten Ausdrücken (5.3,5.5) führt. Die Gleichungen für die Mischungsentropie unter Verwendung von S und σ sind zu vergleichen mit den Gleichungen unter Verwendung von S und σ ohne Gibbs-sche Korrektur. Beh: Die Entropieänderung für verschiedene Gase ist in beiden Fällen gleich, aber für gleiche Gase bekommen wir nur bei S und σ das korrekte ΔS = 0. Beweis: Verwendet man S und σ , ergibt sich für zwei verschiedene Gase: S = N1 kB (log
V 3 V 3 + log T + σ1 ) + N2 kB (log + log T + σ2 ) N1 2 N2 2
oder V V + N2 kB log = ΔS V1 V2 Für identische Gase mit gemeinsamem σ1 = σ2 = σ erhalten wir: ΔS = S − S1 − S2 = N1 kB log
S = (N1 + N2 )kB (log
V1 +V2 3 + log T + σ ) N1 + N2 2
und da ja wegen gleichem P und T in den Teilvolumina und im Gesamtvolumen gilt V1 +V2 V1 V2 = = N1 + N2 N1 N2 haben wir sofort das gesuchte Ergebnis, dass nämlich bei der Mischung zweier identischer Gase die Mischungsentropie verschwindet. ΔS = S − S1 − S2 = N1 kB (log
V V V1 V2 − log ) + N2 kB (log − log ) = 0 N N1 N N2
q.e.d. Den Ausdruck für die Entropie des idealen Gases hatten wir bereits zu Beginn dieses Buches in Gl. (2.38) hergeleitet. Dort hatten wir den Gibbsschen Faktor 1/N! bereits eingeführt, um phänomenologisch die Identität der Teilchen zu berücksichtigen. Beim Gibbsschen Paradoxon haben wir einen sehr direkten Hinweis auf die Notwendigkeit des Gibbsschen Faktors und auf die begrenzte Gültigkeit der klassischen Physik. Denn: Eine mikroskopische Beschreibung der Thermodynamik kann nur auf der Basis der Quantenmechanik formuliert werden, weil nur dort die Ununterscheidbarkeit der Teilchen einen Sinn ergibt. Klassisch können wir Teilchen immer unterscheiden, indem wir sie bei Beibehaltung aller Eigenschaften z.B. mit einer Zahl versehen und daran dann unterscheiden können. In Kap. 6.2.5 werden wir den korrekten klassischen Grenzfall der Quantenstatistik vollführen und dann den Gibbsschen Faktor 1/N! als Resultat erhalten. Wir erinnern uns, dass wir auch schon bei den klassisch berechneten spezifischen Wärmen und der unbeschränkten Spaltbarkeit der klassischen Teilchen einen Widerspruch zur Natur entdeckt haben.
184
5 Elementare Anwendungen der statistischen Mechanik
5.1.5 Relativistisches ideales Gas 5.1.5.1 Nicht-relativistisch Wenn wir die bisherigen Übelegungen von Kap. 5.1 zusammenfassen, haben wir die Zustandssumme für das ideale Gas N 1 V (5.10) Z= N! λ 3 und die Entropie4
V 5 S = NkB log + Nλ 3 2
Für den mittleren Druck und die mittlere Energie haben wir erhalten 1 ∂ log Z NkB T P¯ = = β ∂V V T 3 ∂ log Z = NkB T E¯ = ∂β 2 V
(5.11)
(5.12)
(5.13)
Wir bekommen den einfachen Zusammenhang zwischen Druck und Energiedichte 2 E¯ P¯ = 3V
(5.14)
Die Freie Energie ergibt sich sofort zu F = −kB T log Z und mit Hilfe der Stirling-Formel als F(T,V, N) = −kB T [N logV − 3N log λ − N (log N − 1)]
(5.15)
und die thermische Zustandsgleichung ∂F 1 P¯ = − = NkB T ∂V T,N V oder, wie bekannt, PV = NkB T . 5.1.5.2 Relativistisch Betrachte ein relativistisches ideales Gas aus N Teilchen der Ruhemasse m = 0 in einem Volumen V . Wir berechnen die kanonische Zustandssumme, die innere Energie, die thermische Zustandsgleichung, die Freie Energie, die Enthalpie, die Entropie und die Wärmekapazitäten CP und CV : Die relativistische Einteilchenenergie eines Teilchens mit 3-Impuls p ist bekannt als c2p2 + m2 c4 . Im Fall m = 0 erhalten wir für ein Teilchen mit |p| = p Ekin (p) = cp 4 Auch
Sackur-Tetrode-Gleichung genannt.
5.1 Das Ideale Gas als kanonisches Ensemble
185
Daraus ergibt sich die Zustandssumme Z(T,V ) =
1 N!h3N
oder Z(T,V ) = daraus folgt sofort
VN N!h3N
d 3N qd 3N p exp [−β Ekin (p)]
4π
(5.16)
N d pp2 exp (−β cp)
N 8πV 1 Z(T,V ) = N! (β ch)3
(5.17)
Die mittlere (innerere) Energie ergibt sich ∂ = 3NkB T log Z E¯ = − ∂β V was dem Äquipartitionstheorem entspricht. Für den mittleren Druck erhalten wir 1 ∂ N P¯ = log Z = kB T β ∂V V T und damit 1 E¯ (5.18) P¯ = 3V Wir werden diesen Zusammenhang zwischen Druck und Energiedichte beim Photonengas wiederfinden. Der Faktor 13 unterscheidet den relativistischen vom nichtrelativistischen Fall des idea¯ len Gases, bei dem wir in Gl. (5.14) P = 23 VE hatten. Wir berechnen die Freie Energie F(T,V, N) = −kB T log ZN zu 8πV T − log N + 1 F(T,V, N) = −kB T N log + 3 log k B (ch)3 und überprüfen den Druck
∂F N = kB T P¯ = − ∂V T,N V
und berechnen die Enthalpie ¯ = 4NkB T H = E¯ + PV und die Entropie S(T,V, N) = und die Wärmekapazitäten
∂F 1 ¯ (E − F) = − T ∂ T V,N
∂H = 4NkB ∂ T P,N ∂ E¯ CV = = 3NkB ∂ T V,N CP =
186
5 Elementare Anwendungen der statistischen Mechanik
5.1.6 Gemisch realer Gase Wir betrachten ein Gas aus N wechselwirkungsfreien Molekülen in einem Volumen V . Das Gas sei ein Gemisch aus m Molekülsorten. Wir wollen mit dem vorhandenen Formalismus die Freie Energie und noch weitere Eigenschaften des Gemisches berechnen, wobei wir Gl. (3.159) aus dem Kap. 3.12.3 über das Massenwirkungsgesetz beweisen. Für ein herausgegriffenes Molekül k seien die möglichen Zustände mit sk bezeichnet und ihre Energien mit εk (sk ). Die Gesamtenergie des Gases kann geschrieben werden als E = ε1 (s1 ) + ε2 (s2 ) + · · · Damit ergibt sich die Zustandssumme (bei unterscheidbar angenommenen Teilchen) als Z =
∑
s1 ,s2 ,···
exp [−β (ε1 (s1 ) + ε2 (s2 ) + · · · )]
oder
Z =
∑e
∑e
−β ε1 (s1 )
s1
−β ε2 (s2 )
···
s2
Wenn die Molekülsorte i mit Ni Teilchen vertreten ist, dann gibt es in diesem Produkt Ni gleiche Faktoren, wobei jeder lautet ζi = ∑ e−β εi (si ) si
Wenn man nun durch Gibbssche Faktoren berücksichtigt, dass die Teilchen einer Molekülsorte ununterscheidbar sind, so erhalten wir Z=
ζ1N1 ζ2N2 ζ Nm ··· m N1 ! N2 ! Nm !
Für die Freie Energie bekommen wir nach Verwendung der Stirlingschen Formel sofort Gl. (3.159), die wir in Kap. 3.12.3 verwendet haben: F = −kB T log Z = −kB T
m
∑ Ni [log ζi − log Ni + 1]
(5.19)
i=1
Offenbar setzt sich die Freie Energie F additiv aus den Freien Energien Fi der m einzelnen Molekülsorten zusammen, also F = ∑ Fi . Wegen E = − ∂∂β log Z gilt diese Additivität auch für die mittlere Energie und gleichermaßen auch für den Druck, also P = ∑ Pi , wobei Pi der Partialdruck der Komponente i des Gases ist. Da T = E − T S gilt die Additivität auch für die Entropie.
5.2 Ideales Gas in großkanonischer Form Bisher haben wir quantenstatistisch das ideale Gas als kanonische Gesamtheit untersucht. Wir wissen jedoch, dass man äquivalent dazu das System auch als großkanonische Gesamtheit beschreiben kann, wobei, wenn man von Fluktuationen absieht, die gleichen Resultate herauskommen müssen. Wir führen das jetzt hier am Beispiel des idealen Gases vor. Hier merken wir auch, dass die großkanonische Rechnung technisch einfacher als die kanonische ist.
5.2 Ideales Gas in großkanonischer Form
187
Wir bezeichnen in diesem Kapitel die kanonische Zustandssumme Gl. (5.10) des aus N Teilchen bestehenden idealen Gases mit ZN . Wir haben dann die entsprechende großkanonische Zustandssumme N ∞ ∞ ∞ 1 β μN V N 1 βμ V ZG = ∑ eβ μN ZN = ∑ e e = ∑ λ3 λ3 N=0 N=0 N! N=0 N! was wir zusammenfassen können zu
zV ZG = exp λ3 wobei die Fugazität
(5.20)
z = eβ μ
(5.21) √ definiert wurde und λ die thermische Wellenlänge λ = 2π h¯ / 2πmkB T von Gl. (5.2) ist. Man kann jetzt das großkanonische Potenzial einfach berechnen Φ = −kB T log ZG = −kB T
zV λ3
(5.22)
Aus den partiellen Ableitungen erhält man die thermodynamischen Beziehungen: Für die mittlere Teilchenzahl erhalten wir ∂Φ V zV N¯ = − = kB T 3 β eβ μ = 3 ∂ μ T,V λ λ wodurch wir bekommen Φ = −kB T N¯ und den mittleren Druck ¯ BT ∂ zV ∂Φ Φ Nk =− P¯ = − −kB T 3 = − = ∂V T,μ ∂V T,μ λ V V
(5.23)
mit der thermischen Zustandsgleichung ¯ = Nk ¯ BT PV Das chemische Potenzial erhalten wir aus der Fugazität z = eβ μ sofort, nämlich μ = z=
N¯ 3 Vλ
1 β
log z, und
folgt aus der Teilchenzahl, also μ = −kB T log(
V ) Nλ 3
(5.24)
und weil beim klassischen idealen Gas die Bedingung Gl. (1.1) erfüllt ist, ist der Logarithmus wesentlich größer als Eins und wir erhalten die Ungleichung μ −kB T
oder
− μ kB T
(5.25)
188
5 Elementare Anwendungen der statistischen Mechanik
die wir bei den kosmologischen Betrachtungen von Kap. 7.2 und 7.3 noch verwenden werden. Für die Entropie ergibt sich ∂Φ S=− ∂ T V,μ was bei festgehaltenem μ und V bedeutet: ∂ 5 V μ V S= (kB Teβ μ V λ −3 ) = kB z 3 + kB T (− 2 z) 3 ∂ T V,μ 2 λ kT λ oder
S = kB N¯
V 5 + log ¯ 3 2 Nλ
(5.26)
Dies ist sowohl der Ausdruck des kanonischen Ensembles als auch des mikrokanonischen Ensembles des idealen Gases, wenn man N¯ gleich dem N der äquivalenten kanonischen bzw. mikrokanonischen Verteilung setzt. Für die innere Energie erhalten wir durch direktes Einsetzen und Berücksichtigen, dass gilt 5 E¯ = Φ + T S + μN = NkB T (−1 + ) 2 den bekannten Audruck
3 E¯ = NkB T 2
Offenbar erhalten wir am Ende die gleichen Formeln wie bei der kanonischen und mikrokanonischen Verteilung des idealen Gases. Die Gl. (5.23) kann man umschreiben zu Φ = −PV
(5.27)
Das großkanonische Potenzial ist also direkt mit dem Druck und dem Volumen verbunden. Diese Gleichung gilt viel allgemeiner als nur für das ideale Gas, sondern, wie wir im Zusammenhang mit der Gibbs-Duhem-Relation in Gl. (3.152) bewiesen haben, für jedes homogene System, also auch für wechselwirkende Gase und Flüssigkeiten.
5.3 Spezifische Wärme eines Festkörpers (Einstein-Modell) Das Einsteinsche Modell des Festkörpers geht davon aus, dass jedes Gitter-Molekül in einem 3dimensionalen harmonischen Oszillator schwingt, der von der Wechselwirkung mit den anderen Molekülen aufgebaut wird. Die Gesamtheit aller dieser Oszillatoren bildet ein Wärmereservoir der Temperatur T . Wir wollen die grundlegenden Eigenschaften dieses Systems berechnen und diskutieren. Dazu studieren wir zunächst die Zustandssumme eines einzelnen harmonischen Oszillators im Kontakt mit einem Wärmebad. Anschließend berechnen wir dann die Wärmekapazität des Gesamtsystems, was eine für jeden Festkörper charakteristische Größe ist.
5.3 Spezifische Wärme eines Festkörpers (Einstein-Modell)
189
5.3.1 Der harmonische Oszillator In diesem Kapitel berechnen wir die kanonische Zustandssumme des eindimensionalen harmonischen Oszillators. Wir gehen also davon aus, dass der Oszillator mit einem Wärmebad der Temperatur T im Kontakt steht. Das ist ein wichtiges Beispiel. Wir benötigen diese Formeln in vielen Zusammenhängen, z.B. im nächsten Unterkapitel bei der Berechnung der spezifischen Wärme eines Festkörpers im Einstein-Modell. Wir haben für die Hamiltonfunktion des harmonischen Oszillators: p2 1 + mω 2 q2 H(q, p) = 2m 2 Klassische Rechnung: Eine klassische Betrachtung mit Äquipartitionstheorem sowohl für die kinetische als auch die potentielle Energie ergibt 1 2 1 p = kB T 2m 2
1 1 mω 2 q2 = kB T 2 2
damit erhalten wir für die mittlere Energie 1 1 ε¯ = ( + )kB T = kB T 2 2 Quantenmechanische Rechnung: Mit der Energie der Niveaus
Wir leiten einen Ausdruck für die Zustandssumme Z her.
1 εn = h¯ ω(n + ) 2 erhalten wir sofort für die kanonische Zustandssumme eines einzelnen harmonischen Oszillators ∞ 1 ζ = ∑ exp −β h¯ ω(n + ) 2 n=0 = e− 2 β h¯ ω · ∑ xν 1
mit
ν
x = e−β h¯ ω .
Wir können das umformen mit der bekannten Formel ∞
1
∑ xk = 1 − x
für
x und ihre Energien seien εm = −gμB mH. Die kanonische Verteilung lautet: εm gμB mH Pm = C exp(− ) = C exp( ) kT kT Das mittlere magnetische Moment ergibt sich zu μ¯ = 5 Siehe
Kap. 4.1.1.1
1 ∂ log Z β ∂H
192
5 Elementare Anwendungen der statistischen Mechanik
Die Rechnung zeigt unter Verwendung von η = β gμB H für die Zustandssumme Z: Z = ∑ exp(β gμ0 mH) = m
+j
∑
eηm = e−η j (1 + eη + ... + e2 jη )
m=− j
= e−η j (1 + eη + e2η + ...) − e−η j (e(2 j+1)η + e(2 j+2)η + ...) = e−η j (1 + eη + e2η + ...) − e−η j e(2 j+1)η (1 + eη + e2η + ...) Daraus ergibt sich mit Gl. (5.28) die Formel 1
Z=
1
e−η( j+ 2 ) − eη( j+ 2 ) e−η j − eη( j+1) = 1 1 1 − eη e− 2 η − e 2 η
mit dem Resultat6 Z=
sinh
j + 12 η
sinh 12 η
(5.33)
Aus Gl. (5.33) folgt durch Differentiation nach H bzw η das mittlere magnetische Moment μ¯ z = gμB jB j (η) mit der Brillouin-Funktion BJ (η) =
1 1 1 1 1 η (J + ) coth (J + )η − coth J 2 2 2 2
(5.34)
(5.35)
Grenzfälle: a) Mit T → ∞, erhalten wir η 1, wegen η = gμB H/kB T . Dies ergibt zunächst B j (η) →
j+1 η 3
(5.36)
was damit linear in H ist. Wenn wir die Magnetisierung definieren als M¯ z = μ¯ z N/V , ergibt sich diese aus Gl. (5.34) zu M¯ z = χH mit χ als magnetischer Suszeptibilität. Man erhält auch sofort das Curie-Gesetz: N g2 μB2 j( j + 1) M¯ = Curie-Gesetz: χ= (5.37) H V 3kB T b) Mit T → 0, also η 1 erhalten wir B j (η) = 1 und damit aus Gl. (5.34) M¯ z = NgμB j, damit ist Sättigung erreicht. Einen Spezialfall stellen Spin-Systeme mit j = s = 1/2 dar. Setzen wir in der Brioullin-Fkt. (5.35) j = 1/2 ein, so ergibt sich η B 1 (η) = 2 coth(η) − coth( ) 2 2 Rechnung ist gültig für eη < 1. Für eη > 1 muss man das Ausklammern so durchführen, dass eine Reihe in Potenzen von e−η entsteht, die dann [bis auf ein Vorzeichen sowohl im Zähler als auch im Nenner] das gleiche Resultat wie Gl. (5.33) ergibt.
6 Die
5.5 Verdünnte Gase und Lösungen, Osmose
193
was umgeformt werden kann zu cosh2 ( η2 ) + sinh2 ( η2 ) cosh( η2 ) η − = tanh( ) B 1 (η) = 2 2 sinh( η2 ) cosh( η2 ) sinh( η2 )
(5.38)
Wir kennen dieses Resultat von der direkten und vergleichsweise einfachen Berechnung des s = 1/2-Systems in Gl. (4.3).
5.5 Verdünnte Gase und Lösungen, Osmose Wir sind jetzt in der Lage, einen biologisch wichtigen Vorgang zu verstehen, nämlich die Osmose, die es z.B. Bäumen ermöglicht, Wasser gegen die Schwerkraft nach oben in die Baumkrone zu ziehen. In einem Lösungsmittel (z.B. Wasser) seien NS Teilchen einer anderen Substanz (z.B. Salz) gelöst. Dieses Gesamtsystem bezeichnet man als Lösung. Wir betrachten die Situation, in der die Lösung vom Lösungsmittel durch eine semipermeable Wand (dünnporiger Filter, Tonwand, Gummi, Zellwand) getrennt ist, die für das Lösungsmittel durchlässig ist, für den gelösten Stoff aber nicht. Diese Halbdurchlässigkeit ergibt sich in vielen Fällen einfach durch den Größenunterschied der Moleküle des Lösungsmittels und des gelösten Stoffs. Manchmal spielen auch die chemischen Bindungsverhältnisse zwischen gelöstem Stoff und den Porenwänden der Membran eine Rolle. Wir werden sehen, dass dann ein Druckunterschied auf beiden Seiten dieser Membrane auftritt, der osmotischer Druck PS genannt wird. Befindet sich die Anordnung im Schwerefeld der Erde, wird durch diesen Druck der Flüssigkeitsspiegel der Lösung auf der einen Seite der Wand höher sein als der des reinen Lösungsmittels auf der anderen. Siehe Abb. (5.2). Die Behauptung ist, dass der osmotische Druck PS bestimmt wird durch die van’t Hoffsche Gleichung NS kB T PS = (5.39) VS Schreibt man diese Gleichung um, so ergibt sich PSVS = NS kB T , was die ideale Gasgleichung ist. Dieses sagt aus, dass der osmotische Druck gleich dem Gasdruck ist, den dieselbe Molzahl des gelösten Stoffs bei gleicher Temperatur in dem Volumen VS , das die Lösung einnimmt, hervorrufen würde. Die Gl. (5.39) heißt auch das van’t Hoffsche Gesetz. Der Beweis des van’t Hoffschen Gesetzes führt uns allgemein in die Thermodynamik verdünnter Gase und Lösungen ein. Wir betrachten dazu ein großkanonisches System mit chemischem Potenzial μ. Die Zustandssumme hat die Form ZG (T,V, μ) = ∑ Z(T,V, N)eNμ/kB T N
wobei z = eμ/kB T die Fugazität des Systems ist. Das Z(T,V, N) ist die Zustandssumme der kanonischen Verteilung von N Teilchen im Volumen V . Die ersten Summanden ergeben ZG (T,V, μ) = 1 + Z(T,V, 1)z + Z(T,V, 2)z2 + · · · Wir werden unten sehen, das bei hinreichend verdünnten Systemen die Fugazität z 1 ist und deshalb als Entwicklungsparameter geeignet ist. Nach Gl. (6.41) können wir bis zur 2. Ordnung
194
5 Elementare Anwendungen der statistischen Mechanik
Abbildung 5.2: Osmose: Auf der linken Seite befindet sich reines Lösungsmittel, auf der rechten die Lösung, also Lösungsmittel und gelöster Stoff. Beide Bereiche sind durch eine semipermeable Membran getrennt, die nur die Moleküle des Lösungsmittels in beiden Richtungen durchlässt. Auf der rechten Seite (im Volmen VS ) besteht ein höherer Druck PS , der im Schwerefeld den Flüssigkeitsspiegel ansteigen lässt.
schreiben
1 (5.40) log ZG = Z(1)z + [Z(2) − Z(1)2 ]z2 2 Auch wenn hier Z in ZG nur bis zur Teilchenzahl N = 2 vorkommt, wird dieses Resultat ausreichen, um bei hinreichender Verdünnung Systeme mit N 1 zu beschreiben. Für ein ideales einatomiges Gas kennen wir von Gl. (5.10) Z(T,V, 1) =
V λ3
(5.41)
wobei λ die thermische Wellenlänge von Gl. (5.2) ist. Da wir diese Gleichung nur für N = 1 verwenden, also für ein einziges Teilchen im sonst leeren Volumen, sind bei uns alle Voraussetzungen für ein ideales Gas mehr als erfüllt und wir dürfen Gl. (5.41) benutzen. Mit Gl. (4.59,4.63), i.e. Φ = −kB log ZG und N = −∂ Φ/∂ μ, erhalten wir aus Gl. (5.40) unter Berücksichtigung, dass nur z von μ abhängt, V N = 3z λ Man sieht, dass z ∝ N/V ist. Bei hinreichend geringer Dichte und hinreichend hoher Temperatur gilt also z 1, wie oben behauptet wurde. Bei verdünnten Lösungen haben wir zwei chemische Potenziale, und zwar μLM für das Lösungsmittel und μS für die gelöste Substanz. Bei hinreichend geringer Konzentration der Lösung haben wir zS 1 und können ZG (T,V, μLM , μS ) nach zS entwickeln. Wir erhalten (0)
(1)
ZG = ZG (T,V, μLM ) + ZG (T,V, μLM )zS + · · · Wenn wir für b a die Formel log(a + b) = log[a(1 + b/a)] = log a + log(1 + b/a) und dann Gl. (6.41) in linearer Ordnung verwenden, können wir schreiben (0)
log ZG = log ZG +V ζ (T, μLM )zS (1)
(0)
wobei wir V ζ = ZG /ZG eingeführt haben. Wir verwenden nun die Gibbs-Duhem-Relation in der Form von Gl. (3.152), i.e. log ZG = −Φ/kB T = PV /kB T für das Lösungsmittel und eine
5.5 Verdünnte Gase und Lösungen, Osmose
195
analoge für die gelöste Substanz. Damit können wir schreiben P (T, μLM , μS ) = P(0) (T, μLM ) + ζ (T, μLM )kB T zS + · · ·
(5.42)
Hiermit erhalten wir die thermische und kalorische Zustandsgleichung mit Gl. (3.147), i.e. dP = − VS dT + VN dμ, woraus folgt (∂ P/∂ μ)T = VN und damit ∂P = ζ (T, μLM )zS = nS ∂ μS T,μLM mit nS = NS /VS . Nach Einsetzen in Gl. (5.42) erhalten wir P (T, μLM , μS ) = P(0) (T, μLM ) + nS kB T
(5.43)
wodurch mit PS = nS kB T das van’t Hoffsche Gesetz (5.39) bewiesen ist. q.e.d. Man mag sich zunächst wundern, warum der gelöste Stoff der idealen Gas-Gleichung genügt, obwohl er z.B. in einer Flüssigkeit eng mit den Molekülen des Lösungsmittels in Berührung kommt. Man berücksichtige aber, dass auch in einem realen Gas die Moleküle sich nicht frei bewegen können, sondern bei üblichem Luftdruck nach etwa 10−5 cm mit einem anderen Molekül zusammenstoßen. Dabei tauschen die Moleküle im Allgemeinen nur Impuls aus und ändern ihre Richtung. Für den Druck ist aber die Kollision mit den Wänden des Gefäßes entscheidend, d. h., wie viele Kollisionen pro Zeit stattfinden und mit welchem Impuls. Das führt zu P ∝ N/V und P ∝ T und damit zur idealen Gasgleichung. Der Druck hängt in guter Näherung nicht von der freien Weglänge ab. Wir können die gleiche Argumentation für die Moleküle der in einer Lösung gelösten Substanz wiederholen, was der Grund für das van’t Hoffsche Gesetz ist. Auf beiden Seiten der semipermeablen Wand muss im Gleichgewicht derselbe Druck für das Lösungsmittel vorliegen, weil dessen chemischen Potenziale auf beiden Seiten gleich sein müssen, andernfalls würde das Lösungsmittel durch die Membran strömen, was keiner Gleichgewichtssituation entspricht. Weil auf der Seite des gelösten Stoffes auch noch der Druck PS hinzukommt, muss der Flüssigkeitsspiegel auf dieser Seite im Schwerefeld der Erde höher liegen als auf der Seite des reinen Lösungsmittels, wie in Abb. (5.2) dargestellt. Wenn die Dichte ρ des Lösungsmittels und der Lösung etwa gleich ist, gilt für die Steighöhe h der Lösung die Gleichung PS = ρgh. Beispiel: Um einen osmotischen Druck von 1 Atmosphäre bei null Grad Celsius auszuüben, muss die Konzentration 1 Mol gelöster Substanz in 22.4 Liter Lösung betragen.
6 Quantenstatistik idealer Gase Bisher haben wir die Statistik klassischer Teilchen betrachtet und ihre die Identität durch einfache Gibbs-Faktoren 1/N! berücksichtigt. Das war möglich, weil wir annahmen, dass die thermische DeBroglie-Wellenlänge wesentlich kleiner war als der mittlere Abstand der Teilchen, oder in anderen Worten, dass die Wellenfunktionen der Teilchen sich nicht überlappten. Diese Annahmen wollen wir jetzt fallen lassen und erlauben, dass die Wellenfunktionen sich überlappen, also mit der Gesamtwellenfunktion eines Vielteilchensystems zu rechnen ist. Auf diese Weise werden wir vollständig die Quanten-Natur von Fermionen, Bosonen, Phononen und Photonen berücksichtigen. Wir gehen dabei von Teilchen aus, die keinerlei Wechselwirkung untereinander haben und nur durch Gefäßwände eingeschlossen werden. Ein solches System heißt ideales Quanten-Gas. Den klassischen Grenzfall werden wir ebenfalls betrachten und dann die bekannten Formeln wieder erhalten. Wir hatten bereits in Gl. (1.1) die Bedingung für die Gültigkeit klassischer Verfahren hergeleitet, nämlich wenn die DeBroglie-Wellenlänge λdeB der Teilchen eines Gases viel kleiner als der mittlere Teilchenabstand R¯ ist. Das ist gegeben, wenn gilt R¯ =
1/3 2π h¯ c V λdeB = N 3mc2 kB T
(6.1)
In solchen Fällen kann man klassische Näherungen machen und z.B. für große m und T sind diese dann erfüllt. Bei der Zustandssumme und Entropie und sonstigen extensiven Größen muss man dann die Identität der Teilchen mit Gibbsschen Faktoren berücksichtigen. Ist Gl. (6.1) nicht erfüllt, muss man Quantenstatistik betreiben. Zwei realistische Beispiele erläutern dies. Beispiel: Helium-Gas bei Raumtemperatur Mittlerer Druck P = 760mmHg = 106 dyn/cm2 1 Temperatur T = 300K, kB T = 4 · 10−14 erg = 40 eV −24 Molekülmasse m = 7 · 10 g = 4000MeV, und h¯ c = 200MeVfm Damit: N/V = P/kB T = 2.5 · 1019 Moleküle/cm3 , mittlerer Teilchenabstand R¯ = 34 · 10−8 cm, thermische DeBroglie-Wellenlänge λdeB = 0.7 · 10−8 cm. Daraus folgt λdeB R¯ also ist die Näherung des klassischen Gases erfüllt. Die Identität der Teilchen wird durch Gibbssche Faktoren berücksichtigt. Beispiel: Leitungselektronen in Metall Wenn wir die Leitungselektronen im Metall klassisch behandeln und Zimmertemperatur für sie annehmen, erhalten wir folgende Rechnung. Ein typischer Wert für die Teilchendichte ist N/V ≈ 5 · 1022 cm−3 . Wir erhalten somit ein R¯ 2 · 10−8 cm. Weiterhin gilt
K. Goeke, Statistik und Thermodynamik, DOI 10.1007/ 978-3-8348-9748-0_6, © Vieweg+Teubner Verlag |Springer Fachmedien Wiesbaden GmbH 2010
198
6 Quantenstatistik idealer Gase
me = 10−27 g m(He)/7000 √ Daraus folgt λdeB 0.7 · 10−8 7000 cm = 5.8 · 10−7 cm und somit λdeB R¯ Offenbar ist hier die klassische Behandlung unzulänglich und Quantenstatistik nötig. Das wird zu völlig anderer Behandlung der Leitungselektronen führen, wie es in den folgenden Kapiteln gezeigt wird, insbesondere in Kap. 7.6.
6.1 Identische Teilchen und Statistik 6.1.1 (Anti)symmetrische Vielteilchenzustände Wir betrachten N Teilchen, Qi sind die Ortskoordinaten, i = 1...N. Mögliche Quantenzustände der einzelnen Teilchen sind |si . Mögliche quantenmechanische Gesamtzustände des Vielteilchensystems [Coh77] sind damit: Ψs1 ...sN (Q1 ...QN ). Bose-Einstein-Statistik (BE) Bosonen sind Teilchen, deren Vielteilchen-Wellenfunktion symmetrisch ist unter Permutation der Teilchenkoordinaten Ψs1 ...sN (Q1 ...Qi ...Q f ...QN ) = +Ψs1 ...sN (Q1 ...Q f ...Qi ...QN ) In der Natur werden identische Teilchen mit ganzzahligem Spin (S = 0, 1, 2...) durch solche Wellenfunktionen beschrieben. Bei Systemen, in denen die Teilchen nur mit einem äußeren Einteilchenpotential wechselwirken, hat dann die Wellenfunktion eine besonders einfache Struktur: 1 ˆ s1 (Q1 )...ϕsN (QN ) Pϕ Ψs1 ...sN (Q1 ...Qi ...Q f ...QN ) = (6.2) N! ∑ P Das Pˆ ist der Permutationsoperator wirkend auf die Qi . Es können mehrere der sk gleich sein. Die Bose-Einstein-Statistik beschreibt ein System bestehend aus solchen Vielteilchenzuständen (6.2). Fermi-Dirac-Statistik (FD) Fermionen sind Teilchen, deren Vielteilchen-Wellenfunktion antisymmetrisch ist unter Permutation der Teilchenkoordinaten Ψs1 ...sN (Q1 ...Qi ...Q f ...QN ) = −Ψs1 ...sN (Q1 ...Q f ...Qi ...QN ) In der Natur werden identische Teilchen mit halbzahligem Spin S = 12 , 32 , ... durch solche Wellenfunktionen beschrieben. Wechselwirken die Teilchen nur mit einem äußeren Einteilchenpotential, dann hat auch diese Wellenfunktion eine besonders einfache Struktur (Slater-Determinante) 1 ˆ s1 (Q1 )...ϕsN (QN ) Ψs1 ...sN (Q1 ...QN ) = (−1)P Pϕ (6.3) N! ∑ P
6.1 Identische Teilchen und Statistik
199
Hier bedeutet (−)P = sign(P) das Signum der Permutation. Dies ist die mathematische Formulierung für das Paulische Ausschließungsprinzip (Pauliprinzip), was besagt, dass nicht zwei identische Teilchen den gleichen Einteilchenzustand besetzen dürfen. Man sieht das sofort, denn eine Determinante mit zwei gleichen Zeilen oder zwei gleichen Spalten verschwindet. D. h., es müssen alle sk und Qk jeweils für sich verschieden sein. Die Fermi-Dirac-Statistik beschreibt ein System von identischen Fermionen. Die Mikrozustände sind also alle anti-symmetrisch und damit Slaterdeterminanten (6.3).
6.1.2 Besetzungszahlen, Zustandssummen Im Weiteren berechnet man die Zustandssummen in den verschiedenen Statistiken. Dazu einige Vorbemerkungen und Notationen: |εr , |εs Einteilchenniveaus εr Einteilchenenergie des Niveaus |εr nr Besetzungszahl des Einteilchenniveaus |εr |{ni } Gesamtquantenzustand (Vielteilchenzustand, i.e. Mikrozustand) mit Besetzungen der Einteilchenzustände |εr mit nr Teilchen (r = 1, 2, 3, ...). Aus Gl. (6.2) und Gl. (6.3) folgt, dass die erlaubten Besetzungszahlen bei der BE-Statistik nr = 0, 1, 2, 3, ... sind und bei der FD-Statistik nr = 0, 1 betragen. Vernachlässigt man die Wechselwirkung zwischen den Teilchen (ideales Gas), wie wir es hier und im Folgenden tun, so ergibt sich für jeden Mikrozustand unabhängig von der jeweiligen Statistik E = ∑ nr ε r
N = ∑ nr
r
(6.4)
r
Wir zeigen jetzt die Berechnung der kanonischen Zustandssummen am Beispiel von zwei Teilchen in zwei Zuständen |ε0 = 0 > und |ε1 = ε >. Wir werden sehen, dass die verschiedenen Statistiken große Unterschiede in den Zustandssummen nach sich ziehen. Die kanonische Zustandssumme lautet allgemein Z(T,V, N) =
N
∑ exp
{ni }
−β ∑ nr εr
mit
r
Die explizite Rechnung ergibt: • Fermi-Dirac-Statistik: 1 Zustand, siehe Abb. (6.1): Z = e−β ε • Bose-Einstein-Statistik: 3 Zustände, siehe Abb. (6.2): Z = e−β ε + e−β 2ε + 1
∑ nr = N r
200
6 Quantenstatistik idealer Gase
A A Abbildung 6.1: Fermi-Dirac Statistik: Zwei identische Teilchen A in zwei Zuständen. Aufgrund des PauliPrinzips ist jeder Einteilchenzustand nur einfach besetzt.
A
A A
A
A A
Abbildung 6.2: Bose-Einstein-Statistik: Zwei identische Teilchen A in zwei Zuständen. Jeder Einteilchenzustand kann beliebig häufig besetzt werden, hier also maximal zweifach.
• Maxwell-Boltzmann-Statistik: 4 Zustände, siehe Abb. (6.3) unter Einschluss des Gibbsschen Faktors: Z = 2e−β ε + e−β 2ε + 1 /2! Es ist offensichtlich, dass die verschiedenen Statistiken zu massiv verschiedenen Zustandssummen führen. Das wird jeweils völlig verschiedenes thermodynamisches Verhalten zur Folge haben. Ebenso ist auch die Grundzustandsenergie abhängig davon, welcher Statistik die Teilchen gehorchen. Z.B. haben fünf Bosonen im Grundzustand die Energie E0 = 5ε0 . Dagegen haben fünf Fermionen die Grundzustandsenergie E0 = ε0 + ε1 + ε2 + ε3 + ε4 .
6.2 Bose-Einstein- und Fermi-Dirac-Statistik In diesem Kapitel berechnen wir für die Bose-Einstein-Statistik (BE) und die Fermi-DiracStatistik (FD) jeweils die großkanonische Zustandssume, das großkanonische Potenzial und die mittleren Besetzungszahlen der Einteilchenzustände. Damit sind die wesentlichen statistischen Größen berechnet. Wir wählen die großkanonische Verteilung, weil sie technisch einfacher zu handhaben ist als die kanonische oder gar die mikrokanonische. Wir wissen natürlich, dass bei großen Teilchenzahlen alle Verteilungen äquivalent sind.
A
B
B
A
A B A B
Abbildung 6.3: Maxwell-Boltzmann-Statistik: Zwei nicht-identische Teilchen A und B in zwei Zuständen. Jeder Einteilchenzustand kann beliebig häufig besetzt werden.
6.2 Bose-Einstein- und Fermi-Dirac-Statistik
201
6.2.1 Großkanonische Zustandssumme der Bose-Einstein- und Fermi-Dirac-Statistik Die großkanonische Zustandssumme ist nach Gl. (4.48) definiert als ZG = ∑
∑ e−β (E({ni })−μN)
∑
mit jeweils
{ni }
N
nr = N
r∈{ni }
was mit {ni } = (n1 , n2 , ...) und E ({ni }) = ∑r nr εr ergibt , ZG (T,V, μ) =
∞
∑ ∑ exp
−β
N=0 {ni }
∑
nr (εr − μ)
mit jeweils
r∈{ni }
∑
nr = N
∑
nr = N
(6.5)
r∈{ni }
oder ∞
∑ ∑ ∏ exp {−β nr (εr − μ)}
ZG (T,V, μ) =
mit jeweils
N=0 {ni } r
r∈{ni }
Um von diesen abstrakten Ausdrücken zu praktikablen Formeln zu gelangen, ist es wichtig, dass man sich die Identität zweier Summierungsvorschriften klarmacht. Zunächst ist die Summe über die Konfigurationen {ni } auf solche beschränkt, die die Nebenbedingung N = ∑r∈{ni } nr erfüllen, aber da z.B. in Gl. (6.5) anschließend über alle N summiert wird, bedeutet das, dass die Summe über die Konfigurationen {ni } unbeschränkt ist. Das heißt, es kommen für jeden Zustand |εk alle möglichen Besetzungszahlen nk vor, die in den 0-tupeln, 1-tupeln, 2-tupeln {ni } auftreten1 . Deshalb gilt ∞
∑ ∑ ···
mit N =
N=0 {ni }
∑
∑
⇐⇒
nr
r∈{ni }
···
(6.6)
alle {ni }
Wie wir unten sehen werden, kann man dies weiter vereinfachen zu
∑
···
alle {ni }
wodurch wir erhalten ZG (T,V, μ) =
∞
∑
m1 =0
⇐⇒
∞
∞
∑ ∑
m1 =0 m2 =0
exp {−β m1 (ε1 − μ)}
∞
∑
m2 =0
···
(6.7)
exp {−β m2 (ε2 − μ)} ....
oder als Endresultat die einfache Formel für die großkanonische Zustandssumme sowohl der Bose-Einstein- als auch der Fermi-Dirac-Statistik ZG = ∏ r
∞
∑ exp {−β m (εr − μ)}
(6.8)
m=0
gilt dies ganz allgemein und wird durch die {ni } festgelegt. Wir wir oben sahen, haben wir dann bei Bosonen nk = 0, 1, 2, ... und bei Fermionen nk = 0, 1.
1 Zurzeit
202
6 Quantenstatistik idealer Gase
Den Schritt (Behauptung) von Gl. (6.6) zu Gl. (6.7) erklärt man am besten am Beispiel von Bosonen. Beweis: Wir kürzen ab ar = −β (εr − μ). Dann gilt die Behauptung LHS =
∑
exp
alle {ni }
∑ nr ar
=! =
r
∞
∑
m1 =0
exp {m1 a1 }
∞
∑
m2 =0
exp {m2 a2 } = RHS
(6.9)
Für diesen Fall gibt es die folgenden möglichen Besetzungszahlen {ni }, wobei z.B. (2, 3) bedeutet, dass n3 = 2 Teilchen im Zustand |a3 sitzen: (0, 0) (1, 0) {ni } = (2, 0) (3, 0) .. .
(0, 1) (1, 1) (2, 1) (3, 1) .. .
(0, 2) (1, 2) (2, 2) (3, 2) .. .
(0, 3) (1, 3) (2, 3) (3, 3) .. .
··· ··· ··· ··· ···
Hieraus konstruieren wir die Summe auf der LHS von Gl. (6.9) wie folgt, wobei wir uns auf zwei Einteilchenzustände |ε1 und |ε2 beschränken. Die Generalisierung ist dann trivial: LHS = exp (0a1 + 0a2 ) + exp (0a1 + 1a2 ) + exp (0a1 + 2a2 ) + · · · + exp (1a1 + 0a2 ) + exp (1a1 + 1a2 ) + exp (1a1 + 2a2 ) + · · · + exp (2a1 + 0a2 ) + exp (2a1 + 1a2 ) + exp (2a1 + 2a2 ) + · · · + exp (3a1 + 0a2 ) + exp (3a1 + 1a2 ) + exp (3a1 + 2a2 ) + · · · + was umgeformt werden kann zu LHS = exp(0a1 ) exp (0a2 ) + exp (0a1 ) exp (1a2 ) + exp (0a1 ) exp (2a2 ) + · · · + exp (1a1 ) exp(0a2 ) + exp (1a1 ) exp(1a2 ) + exp (1a1 ) exp(2a2 ) + · · · + exp (2a1 ) exp(0a2 ) + exp (2a1 ) exp(1a2 ) + exp (2a1 ) exp(2a2 ) + · · · + exp (3a1 ) exp(0a2 ) + exp (3a1 ) exp(1a2 ) + exp (3a1 ) exp(2a2 ) + · · · + Dies ist offensichtlich gleich der RHS von Gl. (6.9). q.e.d
6.2.2 Bosonen Für Bosonen gilt Gl. (6.8) für jedes m unbeschränkt: m = 0, 1, 2, ... und wir haben mit Gl. (5.28) sofort ∞
∞
m=0
m=0
1
∑ exp {−β m (ε − μ)} = ∑ exp {−β (ε − μ)}m = 1 − exp {−β (ε − μ)}
und damit erhalten wir die Zustandssumme ZGB (T,V, μ) = ∏ r
1 1 − exp {−β (εr − μ)}
(6.10)
6.2 Bose-Einstein- und Fermi-Dirac-Statistik
203
und ihren Logarithmus log ZGB = − ∑ log [1 − exp {−β (εr − μ)}]
(6.11)
r
Das großkanonische Potenzial (4.59) berechnet sich zu ΦB (T,V, μ) = −kB T log ZGB = kB T ∑ log [1 − exp {−β (εr − μ)}]
(6.12)
r
Damit erhalten wir sofort die mittlere Teilchenzahl des Systems nach Gl. (4.63) als B ∂Φ ¯ = nB (εr ) N=− ∂ μ β ,V ∑ r mit der Bose-Verteilungsfunktion Bose-Einstein:
nB (ε) =
1 exp {β (ε − μ)} − 1
(6.13)
Es ist leicht zu zeigen, dass für ε = εr dieses nB (εr ) gleich der mittleren Besetzugszahl n¯ Br des Einteilchenzustands |εr ist. Dazu berechnen wir den Mittelwert n¯ Br = −
1 ∂ log ZGB β ∂ εr
(6.14)
was dann mit Gl. (6.11) für die mittlere Besetzungszahl eines Bose-Einstein-Systems (BoseEinstein-Verteilung) ergibt Bose-Einstein Verteilung:
n¯ Br = nB (εr ) =
1 exp {β (εr − μ)} − 1
(6.15)
Damit ist auch klar, wie bei gegebener Temperatur (i.e. β ) das chemische Potenzial bestimmt wird, nämlich durch die plausible Forderung, dass sich die mittleren Besetzungszahlen zu N aufaddieren: (6.16) ∑ n¯Br = N r
Interessant ist eine generelle Eigenschaft des chemischen Potenzials μ eines Boson-Gases. Behauptung: Betrachte ein System, bei dem ε0 die Energie des Grundzustandes sein soll. Für das chemische Potenzial gilt dann (6.17) μ < ε0 Beweis: Betrachte den Grenzwert von n¯r bei εr → μ bei festem endlichen T . Falls μ ≥ ε0 , würde gelten 1 1 1 n¯ r = β (ε −μ) = →∞ r e − 1 1 + β (εr − μ) − 1 β (εr − μ) Dies ist aber verboten, weil dann ein einzelnes isoliertes Niveau mit einer divergierenden Besetzungszahl besetzt würde, obwohl die Besetzungszahl ≤ N sein muss. Daher muss gelten μ < ε0 .
204
6 Quantenstatistik idealer Gase
Das heißt aber auch, dass der Hamiltonoperator eines bosonischen Systems ein Spektrum haben muss, das nach unten beschränkt ist. q.e.d Damit erhält man Abb. (6.4). Dort wird die mittlere Besetzungszahl für jedes T bei festem μ bestimmt. Als Energien der Mikrozustände werden die eines linearen harmonischen Oszillators angenommen. Weil nach Gl. (6.17) das μ < h¯ ω/2 sein muss, ist der entsprechende Teil der Abbildung unphysikalisch und nur aus didaktischen Gründen eingezeichnet. Da sieht man, dass für größer werdende Temperatur die Besetzung und damit N immer größer werden. Die Temperatur ist angegeben in Einheiten von h¯ ω/kB . nB
T3 T2 T1
μ
ε
0
Abbildung 6.4: Bose-Einstein-Statistik: Mittlere Besetzungszahl nB der Mikrozustände bei festem chemischen Potenzial μ < 0 und für verschiedene Temperaturen T1 < T2 < T3 . Für jede Temperatur wurde jeweils die Teilchenzahl N berechnet mit dem Resultat N1 < N2 < N3 . Der Energiebereich μ < ε < 0 < h¯ ω/2 ist unphysikalisch, da für das Energiespektrum der lineare harmonische Oszillator gewählt wurde.
Man kann eine analoge Abbildung zeichnen, bei der die Teilchenzahl N festgehalten wird und bei jedem T das μ neu bestimmt wird. Dies ist in Abb. (6.5) getan worden. Für die Berechnung bosonischer Eigenschaften benötigt man häufig die Riemannsche ZetaFunktion. Sie ist definiert durch die Integralform 1 Γ(x)
∞ 0
yx−1 dy = ζ (x) exp(y) − 1
(6.18)
mit dem expliziten Ausdruck ζ (x) =
∞
1
∑ nx
(6.19)
n=1
Einige typische Werte sind: ζ (1) = ∞, ζ (3/2) = 2.612, ζ (2) = π 2 /6, ζ (5/2) = 1.342, ζ (3) = 1.202, ζ (4) = π 4 /90, ζ (5) = 1.037, ζ (6) = π 6 /945.
6.2 Bose-Einstein- und Fermi-Dirac-Statistik
205
nB
T3 T2
T1
μ3
μ2
μ1 0
ε
Abbildung 6.5: Bose-Einstein-Statistik: Mittlere Besetzungszahl nB der Mikrozustände bei fester Teilchenzahl N und für verschiedene Temperaturen T1 < T2 < T3 . Für jede Temperatur wurde jeweils das chemische Potenzial μ berechnet (senkrechte gestrichelte Kurven) mit dem Resultat μ3 < μ2 < μ1 . Für das Energiespektrum wurde der lineare harmonische Oszillator gewählt.
6.2.3 Fermionen Für Fermionen haben wir in Gl. (6.8) nur m = 0 und m = 1, was die Summen vereinfacht ZGF (T,V, μ) = ∏ [1 + exp {−β (εr − μ)}]
(6.20)
r
und
log ZGF (T,V, μ) = ∑ log [1 + exp {−β (εr − μ)}] r
Das großkanonische Potenzial (4.59) berechnet sich zu ΦF (T,V, μ) = −kB T log ZGF = −kB T ∑ log [1 + exp {−β (εr − μ)}]
(6.21)
r
Damit erhalten wir sofort die mittlere Teilchenzahl des Systems nach Gl. (4.63) als F ∂Φ N¯ = − = nF (εr ) ∂ μ β ,V ∑ r mit der Fermi-Verteilungsfunktion Fermi-Dirac:
nF (ε) =
1 exp {β (ε − μ)} + 1
(6.22)
Auch hier ist leicht zu zeigen, dass für ε = εr dieses nF (εr ) gleich der mittleren Besetzungszahl des Einteilchenzustands |εr ist. Dazu berechnen wir wie bei den Bosonen den Mittelwert nach Gl. (4.58), i.e. n¯ Fr = − β1 ∂∂εr log ZGF , der dann für die mittlere Besetzungszahl eines Fermi-DiracSystems (Fermi-Dirac-Verteilung) ergibt
206
6 Quantenstatistik idealer Gase
Fermi-Dirac-Verteilung:
n¯ Fr = nF (εr ) =
1 exp {β (εr − μ)} + 1
(6.23)
Damit ist auch klar, wie bei gegebener Temperatur (i.e. β ) das chemische Potenzial μ bestimmt wird, nämlich durch die plausible Forderung, dass sich die mittleren Besetzungszahlen zu N aufaddieren: ∑ n¯Fr = N r
Grafisch stellt sich das in Abb. (6.6) dar. Üblicherweise bezeichnet man die Energie ε, bei der n(ε) auf die Hälfte abgefallen ist, als Fermi-Energie εF . Man sieht hier, dass für den Fall T → 0 alle Niveaus mit Energien unterhalb von εF besetzt sind und oberhalb von εF unbesetzt. Der Abfall läßt sich durch eine einfache Faustregel beschreiben: Im Bereich [μ − 2.2kB T, μ + 2.2kB T ] fällt nF (εr ) von 90% zu 10% ab.
(6.24)
Die Niveaus lassen sich nicht einfach zusammendrücken, weil sie die quantenmechanischen Lösungen eines Einteilchenproblems sind. Da die Besetzung mehr oder weniger fest liegt, haben wir die Ursache für den Fermidruck, den wir in Kap. 7.6 noch diskutieren werden. nF T1
1,0
T2 T3 0,5
μ
0,0
ε
Abbildung 6.6: Fermi-Dirac-Statistik: Mittlere Besetzungszahl der Einteilchenzustände für verschiedene Temperaturen T 1 < T 2 < T 3 bei festem μ.
Bei Fermionen treten häufig Integrale der folgenden Art auf 1 Γ(x)
∞ 0
yx−1 dy = 1 − 21−x ζ (x) exp(y) + 1
(6.25)
wobei ζ (x) die in Gl. (6.19) definierte Riemannsche Zeta-Funktion ist. Man erhält diese Formel durch Einsetzen von 1 2 1 = − ex + 1 ex − 1 e2x − 1 in Gl. (6.18).
6.2 Bose-Einstein- und Fermi-Dirac-Statistik
207
6.2.4 Photonen, Phononen 6.2.4.1 Photonen-Gas Die Photonen-Statistik beschreibt das Photonengas der Strahlung eines schwarzen Körpers. Dieses ist charakterisiert durch eine starke Wechselwirkung mit den Wänden, mit denen das Photonengas im Gleichgewicht steht. Experimentell kann das dadurch realisiert werden, dass man in irgendeinem Material einen Hohlraum herstellt, ihn vollständig evakuiert und dann das Material auf eine vorgegebene Temperatur T erhitzt. Die Atome der Hohlraumwände werden dauernd elektromagnetische Strahlung (Photonen) emittieren und absorbieren, so dass im Gleichgewicht eine gewisse Menge elektromagnetischer Strahlung im Hohlraum sein wird und sonst nichts. Wenn dieser hinreichend groß ist, sind die thermodynamischen Eigenschaften der Strahlung von der Natur der Wände unabhängig und wir haben dann in dem Hohlraum reine Hohlraumstrahlung, auch Schwarzkörper- oder Wärmestrahlung genannt. Die Anzahl der Photonen in der Wärmestrahlung ist nicht festgelegt. Ein Atom der Wand absorbiert z.B. ein Photon hoher Energie und emittiert darauf zwei Photonen niedrigerer Energie etc. In jedem Ein-Photon-Zustand |εr = h¯ ωr > können deshalb beliebig viele Photonen sein. Die Photonen haben Spin S = 1 und ihre Wechselwirkung untereinander ist vernachlässigbar. Da das Photonengas mit den Wänden einer gegebenen Temperatur T ausschließlich im Wärmekontakt steht, wird es nach den Untersuchungen von Kap. 4.6.2.2 durch eine kanonische Gesamtheit von Bosonen beschrieben. Formal geschieht das durch Verwendung der Bose-Einstein-Statistik mit verschwindendem chemischen Potenzial: Photonen-Gas: μ = 0 (6.26) Durch μ = 0 sind sämtliche Gleichungen der Photonen-Statistik bereits festgelegt. Für die Zustandssumme erhalten wir nach Gl. (6.10) 1 1 − exp {−β h¯ ωr }
(6.27)
log Z Photon = − ∑ log(1 − e−β h¯ ωr )
(6.28)
Z Photon (T,V ) = ∏ r
Photonen-Gas:
r
und
1 ∂ 1 ∂ e−β h¯ ωs log Z = log(1 − e−β h¯ ωs ) = β ∂ h¯ ωs β ∂ h¯ ωs 1 − e−β h¯ ωs Daraus folgt dann die Photonen-Verteilung =− n¯ Photon s
Photonen-Verteilung:
n¯ s =
1 eβ h¯ ωs
−1
(6.29)
In der Praxis sind in den meisten Fällen die Zustände |r gegeben durch |r = |k, λ > mit λ = 1, 2 als Polarisation der Photonen. Offenbar wird bei wachsender Temperatur die Besetzung aller EinPhoton-Zustände größer und die Kurven skalieren im Wesentlichen nur, siehe Abb. (6.7). Bei den normalen Boson-Verteilungen liegt die Normierung fest und das μ hat man so zu wählen, dass ∑r n¯ r = N, was bedeutet, dass dann bei wachsenden Temperaturen sich die niedrigen Zustände entleeren und sich die höheren auffüllen.
208
6 Quantenstatistik idealer Gase
nPh
T3 T2 T1
ε
0
Abbildung 6.7: Photon-Statistik: Mittlere Besetzungszahl für Ein-Photon-Zustände in Abhängigkeit von der Temperatur mit T1 < T2 < T3 .
6.2.4.2 Phononen-Gas Bei Schwingungsanregungen (Phononen) eines Festkörpers haben wir ebenfalls eine Statistik, bei der zwar die εs bekannt sind als Eigenmoden des Systems, aber die Anzahl der Phononen nicht festliegt. Jedes Phonon steht im Wärmekontakt mit allen anderen Phononen des Festkörpers, wobei diese ein Wärmereservoir einer gewissen Temperatur bilden. Deshalb werden Phononen durch eine kanonische Gesamtheit beschrieben und, weil sie ganzzahligen Spin haben, gelten für sie die Formeln der Bose-Einstein-Statistik mit μ = 0, was einem kanonischen Ensemble entspricht. . Daher gilt für Phononen μ =0
(6.30)
1 1 − exp {−β εr }
(6.31)
Phononen-Gas: und Z Phonon (T,V ) = ∏ r
und Phononen-Verteilung:
n¯ s =
1 eβ εs − 1
(6.32)
6.2.5 Maxwell-Boltzmann-Statistik und klassischer Grenzfall der Bose-Einstein- und Fermi-Dirac-Statistik Für das Verständnis ist es sehr hilfreich, den Übergang von der Quantenstatistik zur klassischen Statistik zu vollziehen. Dazu betrachten wir die Grenzfälle hoher Temperaturen, großer Volumina bei gegebener Teilchenzahl und kleiner Teilchenzahl bei gegebenem Volumen. Zunächst leiten wir jedoch im Formalismus dieses Kapitels die Zustandssumme der klassischen MaxwellBoltzmann-Statistik noch einmal her. Dazu schreiben wir nach Gl. (4.25) für die Zustandssumme
6.2 Bose-Einstein- und Fermi-Dirac-Statistik
209
eines klassischen Teilchens im Gas ζ = ∑ exp (−β εs ) s
und bei N unterscheidbaren Teilchen für das Gesamtsystem N ZMB = ζ N = ∑ exp (−β εs )
(6.33)
s
Somit erhalten wir
log ZMB = N log ∑ exp (−β εs )
(6.34)
s
und weiter für die mittlere Besetzungszahl n¯ r = −
1 ∂ log ZMB exp(−β εr ) =N β ∂ ε¯r ∑s exp (−β εs )
(6.35)
Wir wollen jetzt die analogen Ergebnisse aus der Quantenstatistik herleiten. Diese wird zusammengefasst durch 1 (6.36) n¯ r = exp [β (εr − μ)] ± 1 wobei das Plus-Zeichen für die Fermi-Dirac- und das Minus-Zeichen für die Bose-EinsteinStatistik steht. Wenn wir mit fester Teilchenzahl N arbeiten, dann gilt
∑ n¯r = N
(6.37)
r
und der Logarithmus der Zustandssumme ist gegeben durch log Z = −β μ ± ∑ log (1 ± exp [−β (εs − μ)])
(6.38)
s
Der Übergang zum klassischen Grenzfall kann auf folgende Weise vollzogen werden: Bei gegebenem V und kleiner werdendem N muss in der Summe Gl. (6.37) jeder Term (6.36) hinreichend klein sein. Das geht nur, wenn exp [β (εr − μ)] 1 ist für alle r. Genauso verhält es sich bei festem N und sich vergrößerndem V . Dann gibt es immer mehr Zustände, die besetzt werden können, und dann muss wegen der Normierung (6.37) ebenfalls n¯ r immer kleiner werden, was ebenfalls auf exp [β (εr − μ)] 1 hinausläuft. Das Gleiche trifft für wachsende Temperaturen zu, hierbei nimmt β zu, und auch hier gibt es eine Grenztemperatur, hinter der exp [β (εr − μ)] 1. Sowohl für die Bose-Einstein- als auch für die Fermi-Dirac-Statistik heißt das im klassischen Grenzfall n¯ r = exp [−β (εr − μ)] 1 (6.39) Wegen der Normierung in Gl. (6.37) können wir μ festlegen: exp [β μ] = N
−1 exp [−β ε ] s ∑ s
(6.40)
210
6 Quantenstatistik idealer Gase
und damit
exp [−β εr ] ∑s exp [−β εs ] was mit Gl. (6.35) identisch ist. Offenbar geht die mittlere Besetzungszahl der Bose-Einstein- und der Fermi-Dirad-Statistik im klassischen Limes in die der Maxwell-Boltzmann-Statistik über, was ein wichtiges, aber auch zu erwartendes Ergebnis ist. Die gleichen Überlegungen stellen wir nun für die Zustandssumme an. Hier gehen wir von Gl. (6.38) aus und berücksichtigen, dass wir im klassischen Grenzfall (6.39) die Exponentialfunktion in Gl. (6.39) entwickeln und nach dem ersten Glied abbrechen können. Benutzen wir noch die Entwicklung x2 x3 log(x + 1) = x − + ± · · · (6.41) 2 3 und brechen nach dem linearen Glied in x ab, so können wir schreiben n¯r = N
log Z = −β μN ± ∑ (± exp [β (εs − μ)]) = −β μN + N s
Wir nehmen den Logarithmus von Gl. (6.40) und erhalten β μ = log N − log ∑ exp [−β εs ] s
woraus folgt
log Z = −N log N + N + N log ∑ exp [−β εs ] s
Man stellt sofort fest, dass dies nicht gleich log ZMB aus Gl. (6.34) ist. Der Vergleich ergibt mit Hilfe der Stirlingschen Formel log Z = log ZMB − (N log N − N) = log ZMB − log N! und damit das wichtige Resultat klassischer Grenzfall:
Z=
ZMB N!
(6.42)
Hier haben wir nun aus der Quantenstatistik sowohl für ein Bose-Einstein- als auch für ein FermiDirac-System im korrekten klassischen Grenzfall den Gibbsschen Faktor 1/N! hergeleitet, der uns und Gibbs vor dem Gibbsschen Paradoxon errettet hat.
6.2.6 Druck Für alle Statistiken idealer Gase kann man einen einfachen Zusammenhang zwischen dem Ausdruck für die Gesamtenergie E, dem Volumen V und dem Druck P herleiten, wenn εr eine Potenz des Impulses p = |p| der Teilchen ist. Wenn wir die Einteilchenenergien mit ε p bezeichnen, dann gilt die Behauptung: Wenn ε p = Apm
6.2 Bose-Einstein- und Fermi-Dirac-Statistik
211
mit irgendeiner Konstante A, dann gilt für den Druck P=
mE 3V
(6.43)
Beweis: Für nicht miteinander wechselwirkende Teichen haben wir E = ∑ ε p n¯ p p
Bei der Berechnung des Drucks (verallgemeinerte Kraft bzgl. Volumenänderung) gehen wir von einer quasistatischen Veränderung aus, wobei die Besetzungszahlen n¯ p des Ensembles unverändert bleiben und die Ableitung nur auf die ε p wirken. Nun werden die Teilchen im Einteilchenzustand der Energie ε p beschrieben durch Randbedingungn der Art sin(kx x) = 0 für x = L und 1 1 somit gilt px = kx mit kx = nx πLx−1 oder allgemein kx ∝ V − 3 . Da p = ∑ piei folgt p ∝ V − 3 und damit m ε p = Apm = BV − 3 Die Ableitung liefert dann P=−
∂ ∂E =− ∂V ∂V
m
∑ BV − 3 n p = 3 ∑ BV − 3 −1 n p m
p
oder P=
m
p
mE 3V
q.e.d. Also gilt für ein Gas aus Photonen oder aus ultra-relativistischen freien Teilchen P=
1E 3V
εp ∝ p
(6.44)
2E für ε p ∝ p2 3V
(6.45)
für
oder für unrelativistische freie Teilchen P=
Beide Fälle haben wir bereits früher diskutiert, siehe Gl. (5.14) und Gl. (5.18).
7 Anwendungen der Quantenstatistik 7.1 Wärmestrahlung, Planck-Verteilung Wir betrachten elektromagnetische Strahlung (System von freien Photonen) in einem Volumen mit Wänden der Temperatur T . Das Gas befinde sich im thermischen Gleichgewicht mit der Materie der Wände. Das definiert die Wärmestrahlung, oder auch Schwarzkörperstrahlung oder Hohlraumstrahlung eines schwarzen Körpers. Die grundlegenden statistischen Formeln dieses Photonen-Gases finden sich in Kap. 6.2.4.1. Die Photonen in dem Hohlraum werden beschrieben durch ebene Wellen |k, λ > mit zwei Polarisationsrichtungen λ = 1 und λ = 2: ) * Eλ = ε (1) E0 exp i k ·r − ωt λ ) * Bλ = ε (2) B0 exp i k ·r − ωt λ √ (1) (1) wobei B0 = μεE0 und ελ ,ελ ,k für jedes λ ein orthogonales Dreibein bilden. Ferner ist z.B. ελ(1) (1) =1 linear unabhängig von ελ =2 und wir haben Bλ = 1 k × Eλ k
Es gilt die Dispersionsbeziehung ω(k) = kc Wir wollen Verteilungsfunktionen berechnen, wie etwa die Anzahl der Photonen in einem Volumen d 3 k um den Wellenvektor k oder die Energie pro Orts-Volumen im Frequenzbereich [ω, ω + dω]. Dies geschieht mit Hilfe der Photonen-Verteilung und wird zu den Planckschen Strahlungsgesetzen führen. Wir müssen die Zustände in einem gegebenen hinreichend großen Orts-Volumen beliebiger Gestalt mit den Besetzungszahlen der Photonstatistik nr multiplizieren. Das Abzählverfahren darf nicht vom aktuellen Aussehen des Orts-Volumens abhängen, solange dieses wesentlich größer ist als die Wellenlänge des Photons. Deshalb unterteilen wir das große Orts-Volumen in hinreichend viele kleine Volumina gleicher quaderförmiger Gestalt und wir wählen periodische Randbedingungen an den Rändern der kleinen Volumina aus. Durch diese Wahl von periodischen Randbedingungen schieben wir praktisch die Wände des großen Orts-Volumens ins Unendliche und sie können keinen Einfluss mehr auf das Wellenfeld haben. Betrachte eines dieser kleinen Teilvolumina V = Lx Ly Lz , in dem das elektromagnetische Feld als periodisch angenommen wird, z.B. E(x, y, z) = E(x + Lx , y, z), E(x, y, z) = E(x, y + Ly , z) und E(x, y, z) = E(x, y, z + Lz ). Also sind die Randbedingungen der Wellenzahl an den Wänden von V gegeben durch Wellenzahl z.B. in x-Richtung gegeben durch:
K. Goeke, Statistik und Thermodynamik, DOI 10.1007/ 978-3-8348-9748-0_7, © Vieweg+Teubner Verlag |Springer Fachmedien Wiesbaden GmbH 2010
214
7 Anwendungen der Quantenstatistik
kx (x + Lx ) = kx x + 2πnx oder kx =
2π nx Lx
ky =
2π ny Ly
kz =
2π nz Lz
Wir brauchen im Folgenden immer wieder die folgende Tatsache (Behauptung): Die Anzahl ρ(k)d 3 k der Zustände |k > mit dem Wellenvektor k im Impuls-Volumen d 3 k um k ist bei gegebenem Orts-Volumen V und für gegebene Polarisation λ gleich ρ(k)d 3 k =
V (2π)
3
d3k =
V 3
(2π h¯ )
d3 p
(7.1)
Beweis: Für ein gegebenes k ist die Anzahl der Zustände |k > zwischen kx und kx + dkx gleich dnx = (Lx /2π)dkx . Also ist Ly Lx Ly Lz Lz Lx 3 dkx dky dkz = ρ(k)d k = dnx dny dnz = dkx dky dkz 2π 2π 2π (2π)3 was mit p = h¯k sofort Gl. (7.1) ergibt. q.e.d.
7.1.1 Energiedichte Aus der Gl. (7.1) kann man sofort weitere Dichten herleiten: Im Photongas ist jeder der Zustände |k, λ > durch n¯ kλ Photonen im Mittel besetzt. Wie wir wissen, gibt es pro Photon zwei Polarisationsrichtungen und wir nehmen im Folgenden an, dass sie durch das Gleichgewicht mit den Wänden identisch besetzt sind. Also ist die mittlere Anzahl von Photonen einer gegebenen Polarisation λ im Bereich d 3 k um k herum pro Orts-Volumen (bzw. im Einheitsvolumen) nach Gl. (6.29) und Gl. (7.1) gegeben durch fλ (k)d 3 k =
1 1 d3k eβ h¯ ω − 1 (2π)3
mit
ω = kc
(7.2)
Die mittlere Anzahl von Photonen einer gegebenen Polarisation λ im Energiebereich [ω, ω + dω] im Einheits-Orts-Volumen ist gegeben wegen ω = kc durch gλ (ω)dω = f λ (k)4πk2 dk =
4π
1 3 eβ h¯ ω
(2πc)
−1
ω 2 dω
(7.3)
Da laut Voraussetzung beide Polarisationsrichtungen λ gleich besetzt sind, geben wir im Folgenden immer die Summe über beide Polarisationsrichtungen an, was einen Faktor 2 zur Folge hat. Damit ergibt sich die mittlere Energie im Einheits-Orts-Volumen von Photonen einer beliebigen Polarisationsrichtung im Energiebereich [ω, ω + dω] wegen u(ω) ¯ = 2¯hωgλ (ω) zu Planck: Energiedichte: u(ω)dω ¯ =
ω3 h¯ dω π 2 c3 eβ h¯ ω − 1
(7.4)
7.1 Wärmestrahlung, Planck-Verteilung
215
Das ist die Formulierung des Planckschen Strahlungsgesetzes bzgl. der Energiedichte. Die andere Formulierung bezieht sich auf Strahlung, die aus einem Schwarzen Körper ausgesendet wird, siehe unten Gl. (7.20). Man schreibt Gl. (7.4) vielfach um in Abhängigkeit von η=
h¯ ω kB T
Dies ergibt für die Energiedichte summiert über beide Polarisationsrichtungen u(ω, ¯ T )dω =
h¯ π 2 c3
kB T h¯
4
η3 dη −1
(7.5)
eη
Hieraus folgt u(ω, ¯ T)
π 2 c3 h¯ 2 η3 = η 3 3 e −1 kB T
(7.6)
und die entsprechende Grafik findet sich in Abb. (7.1) u( ¯ ω, T )
0
2 ηmax 4
6
8
η
Abbildung 7.1: Plancksches Strahlungsgesetz: Energiedichte (i. e. mittlere Energie pro Orts-Volumen und 3 ¯ T ), sondern nur proportional zu u(ω, ¯ T ). Frequenzintervall). Aufgetragen ist eηη−1 . Das ist nicht direkt u(ω, Siehe die linke Seite von Gl. (7.6).
Diese Kurve hat ein ausgeprägtes Maximum bei ηmax 2.8 mit einem Wert von 1.42, also h¯ ωmax 2.8kB T
(7.7)
Die überwiegende Anzahl von Photonen hat also eine Energie, die gleich 2.8kB T ist. Wenn man die Kurve weiter untersucht, stellt man fest: Eines von 500 Photonen hat eine Energie E > 10kB T , eines von 3 Millionen hat E > 20kB T und eines in 30 × 109 hat E > 30kB T . Die mittlere Energie der Photonen ist etwas größer, weil die Verteilung unsymmetrisch ist. Man erhält: h¯ ωmean 3kB T
(7.8)
216
7 Anwendungen der Quantenstatistik
Aus Gl. (7.7) folgt das Wiensche Verschiebungsgesetz: Wenn an der Temperatur T1 das Maximum der Energiedichte bei der Frequenz ω˜ 1 vorliegt, dann liegt es bei der Temperatur T2 an der Fre˜ BT = quenz ω˜ 2 vor und die Temperaturen und Frequenzen verhalten sich so, dass ηmax = h¯ ω/k 2.8 eingehalten wird, also wie ω˜ 1 ω˜ 2 = T1 T2
Wiensches Verschiebungsgesetz:
(7.9)
Die Maxima von u¯ haben unterschiedliche Werte und unterscheiden sich durch die 3. Potenz der Temperatur, aber die Position in der Frequenz ω ist durch das Wiensche Verschiebungsgesetz festgelegt. Wichtig ist auch die totale Orts-Energiedichte der Wärmestrahlung eines Schwarzen Körpers nach Integration über alle Frequenzen, summiert über beide Polarisationsrichtungen: u(tot) (T ) =
∞ 0
u(ω, ¯ T )dω
die sich nach der Integralformel der Riemannschen Zeta-Funktion (6.18) berechnet zu ∞ 0
η3 π4 dη = −1 15
(7.10)
eη
und damit u(tot) (T ) =
Totale Energiedichte
π 2 (kB T )4 = αT 4 15 (¯hc)3
(7.11)
wobei die Konstante α gegeben ist durch1 α=
π 2 (kB )4 = 7.565 ∗ 10−16 JouleMeter−3 Kelvin−4 15 (¯hc)3
(7.12)
Die grundlegenden Eigenschaften eines Photonengases (Schwarzkörperstrahlung bei T ) sind leicht zu berechnen: Wir hatten in Gl. (7.2) log Z = − ∑ log 1 − e−β εr r
oder Gl. (7.2) eingesetzt log Z = −4π
∞ 0
2V log 1 − e−β h¯ ck k2 dk 3 (2π)
(Die 2 vor dem Volumen kommt von der Summe über beide Polarisationsrichtungen). Es gilt die Integralformel: ∞ 0 1 Das
η3 1 π4 1 dη = − log 1 − e−λ x x2 dx = − 3 3λ eη − 1 3λ 3 15
α hängt mit der in Gl. (7.22,7.23) und im Anhang angegebenen Strahlungskonstante σ = αc/4 zusammen.
7.1 Wärmestrahlung, Planck-Verteilung
217
nach der wir für die Freie Energie erhalten 1 F = −kB T log Z = − αV T 4 3 und für die Entropie
∂F S=− ∂T
und für die Wärmekapazität
CV = T
∂S ∂T
V
(7.13)
4 = αV T 3 3
(7.14)
= 4αV T 3
(7.15)
V
und für die innere Energie bzw. die kalorische Zustandsgleichung E = F + T S = αV T 4
(7.16)
woraus man auch die Wärmekapazität Gl. (7.15) durch Ableitung nach T hätte erhalten können. Für den Druck des Photonengases bzw. seine thermische Zustandsgleichung bekommen wir 1 ∂F = αT 4 (7.17) P=− ∂V T 3 Der Strahlungsdruck eines Photonengases der Temperatur T ist somit nach Gl. (7.11) gleich 1/3 der mittleren totalen Energiedichte (Energie pro Volumen) Strahlungsdruck:
1 P(T ) = u(tot) (T ) 3
(7.18)
Diesen Zusammenhang zwischen Druck und mittlerer Energie hatten wir bereits beim relativistischen Gas mit masselosen Teilchen, siehe Gl. (5.18), und bei allgemeinen Überlegungen zum Druck, siehe Gl. (6.43). Zum Nachweis der inneren Konsistenz des Formalismus können wir das chemische Potenzial berechnen, das wir zu null angenommen haben. Wir erhalten es durch Anwendung der GibbsDuhem-Relation Gl. (3.147) und Einsetzen der oben hergeleiteten Formeln: 1 4 1 1 1− + αV T 4 = 0 (7.19) μ = (E − T S + PV ) = N N 3 3
7.1.2 Strahlungsdichte Man kann jetzt auch eine andere Version der Planckschen Energieformel herleiten, die die Strahlung beschreibt, die aus einem kleinen Loch im Schwarzen Körper abgegeben wird. Das Loch muss klein gegen die Dimensionen des Schwarzen Körpers sein, damit die Abstrahlung nicht das Gleichgewicht der Strahlung mit den Wänden im Inneren des Schwarzen Körpers stört. Siehe für das Folgende Abb. (7.2). In dem Zeitintervall dt treffen (dA c dt cos ϑ )· fλ (k)d 3 k Photonen einer gegebenen Polarisation λ mit Impuls in d 3 k um k auf die Fläche dA aus der Richtung cos ϑ und aus dieser Richtung zeigt
218
7 Anwendungen der Quantenstatistik
ϑ
k
x dA
c dt
Abbildung 7.2: Photonen, die auf ein Loch der Fläche dA in der Wand treffen und von dort entkommen. Experimentelle Anordnung, die Plancksche Verteilung zu messen.
die Richtung des Wellenvektors k nach außen zum Beobachter. Da jedes Photon die Energie h¯ ω hat, ist die Energie pro Zeit und Fläche festgelegt, die den Schwarzen Körper in ϑ -Richtung verlässt. Wir haben Frequenzen um ω und die Polarisationsrichtung λ . Damit erhalten wir die abgestrahlte Energie pro Zeit und Fläche im Frequenzbereich [ω, ω + δ ω]: I(k, λ )dΩdω = h¯ ωc cos ϑ fλ (k)d 3 k Das ergibt mit k =
ω c
und d 3 k = k2 dkdΩ sofort h¯ ω 3 I(k, λ )dΩdω = 2 fλ (k) cos ϑ dΩdω c
Die gesamte Energie, die pro Fläche und Zeit in den Frequenzbereich um ω gestrahlt wird, ist gegeben durch Iλ (ω)dω = 2
P(k, λ )dΩdω
und wegen 2 dφ cos ϑ sin ϑ dϑ = 2 · 2π · 12 bekommen wir dann Iλ (ω)dω =
(¯hω)3 π fλ (k)dω c2
Wir verwenden Gl. (7.2) und summieren über die zwei Polarisationen. Das ergibt das Plancksche Strahlungsgesetz, das die gesamte Energie I(ω) beschreibt, die aus dem Schwarzen Körper pro Fläche und Zeit in den Frequenzbereich [ω, ω + δ ω] gestrahlt wird: Planck: Strahlungsgesetz:
I(ω)dω =
h¯ ω 3 dω 4π 2 c2 eβ h¯ ω − 1
(7.20)
Die totale pro Fläche und Zeit ausgestrahlte Energie erhalten wir durch Integration über alle Frequenzen, wo wieder das Integral (7.10) eingeht. Dies ergibt das Stefan-Boltzmann-Gesetz.
7.2 Kosmischer Mikrowellenhintergrund
Stefan-Boltzmann-Gesetz: mit der Strahlungskonstante Strahlungskonstante:
219
I (tot) = σ T 4
σ=
π 2 kB4 60 c2 h¯ 3
(7.21)
(7.22)
Der Zusammenhang mit der in Gl. (7.12) definierten Konstante α ist gegeben durch α = 4σ /c. Der Wert von σ ist (siehe Anhang) σ = 5.67051 × 10−5 erg s−1 cm−2 K−4
(7.23)
7.2 Kosmischer Mikrowellenhintergrund 7.2.1 Energiedichten des Universums Seit der Entdeckung von Penzias und Wilson 1964 (Nobelpreis 1972) [Pen65] und den Resultaten der Boomerang- und Maxima- und insbesondere der COBE-Mission [B+ 92] (1992, Nobelpreis John C. Mather und G. Smoot, 2007) wissen wir, dass der Kosmos homogen und isotrop von einer elektromagnetischen Wärmestrahlung der Temperatur T0 = 2.728 ± 0.001 Kelvin Diese Wärmestrahlung trifft aus allen Richtungen auf die Erde und hat alle Eidurchflutet genschaften einer Schwarzkörperstrahlung, wie sie im Kapitel 7.1 berechnet wurden. Ihr Peak liegt etwa bei Emax = 2.8kB T0 → λ 2 mm (Mikrowellen) ist2 .
und die mittlere Energie der Photonen bei Emean 3kB T0 = 6.8 ∗ 10−4 eV
(7.24)
Deshalb heißt die Strahlung ”Mikrowellen-Hintergrund Strahlung” oder ”Cosmic Microwave Background” (CMB). Einsetzen der Zahlen in Gl. (7.11) ergibt für die heutige Energiedichte (Energie pro Volumen, aufintegriert über alle Frequenzen) gemessen in Joule J und Kubikmeter m3 u(tot) (T = 2.728 K) = εγ = 4.17 ∗ 10−14 Jm−3 (7.25) was etwa 14 MeV pro m3 entspricht. Es ist für das Verständnis der Entwicklung und Struktur unseres Kosmos wichtig, die Strahlungsdichte εγ mit den Energiedichten der anderen Komponenten des Universums zu vergleichen. Beobachtungen im Rahmen der WMAP-Mission [NAS09] ergeben für das heutige Universum die Werte3 von Tabelle (7.1). 2 Die
homogene und isotrope Komponente der Mikrowellenhintergrundstrahlung ist die bei Weitem größte. Seit einigen Jahren werden kleine Fluktuationen diskutiert, bei denen die Isotropie auf der Größenordnung ΔT /T 10−3 gestört ist. Obwohl diese hochinteressant sind und Auskunft über Frühphasen des Universums geben, werden sie in dem vorliegenden Kapitel nicht diskutiert, weil sie den Rahmen dieses Buches überschreiten. 3 Das heutige Universum liegt vor zu der Zeit t = 13.6 ∗ 109 Jahre bzw. t 1017 sec nach dem Urknall. 0 0
220
7 Anwendungen der Quantenstatistik Tabelle 7.1: Energiedichten im heutigen Universum
Photonen Sternenlicht Neutrinos Baryonische Materie Dunkle Materie Dunkle Energie total
εγ (t0 ) εSterne (t0 ) εν (t0 ) εBM (t0 ) εDM (t0 ) εDE (t0 ) εc (t0 )
= 4.17 ∗ 10−14 Jm−3 0.4 ∗ 10−14 Jm−3 2.8 ∗ 10−14 Jm−3 4.1 ∗ 10−11 Jm−3 20 ∗ 10−11 Jm−3 64 ∗ 10−11 Jm−3 89 ∗ 10−11 Jm−3
5 × 10−3 % 5 × 10−4 % 3 × 10−3 % 4.6% 23% 72% 100%
Man sieht, dass heute die Energiedichte der Strahlung nur ein kleiner Bruchteil der Energiedichte der Baryonischen Materie, der Dunklen Materie und der Dunklen Energie darstellt.4 Wir unterscheiden zwischen Baryonischer Materie, d.h. Atomen, Atomkernen, Protonen, Neutronen, Elektronen, Neutrinos, also den normalen Bausteinen der Atome, und Dunkler Materie, deren Beitrag zur Energiedichte man kennt, deren Struktur aber noch nicht aufgeklärt ist.5 Bei der Dunklen Energie6 handelt es sich um eine Komponente, die eine beschleunigte Expansion nach sich zieht, im Gegensatz zur Expansion, die von Licht und Materie getrieben wird und deren Expansionsgeschwindigkeit mit wachsender Zeit abnehmen muss. Die gegenwärtigen Beobachtungen sind mit der Annahme einer zeitunabhängigen kosmologischen Konstante Λ als Ursache der Dunklen Energie verträglich.
7.2.2 Expansion und Thermodynamik des Universums Die Entdeckung der Mikrowellenhintergrundstrahlung hat entscheidend dazu beigetragen, das heute akzeptierte Bild des Urknalls (Big Bang) zu etablieren, weil das Bild eines expandierenden und sich dabei abkühlenden Universums in natürlicher Weise das Vorhandensein dieser Wärmestrahlung erklärt. Dazu müssen wir uns zunächst Grundzüge der Expansion klarmachen. Eine fundamentale Annahme bei der Expansion ist die Homogenität des Raumes, die zur Folge hat, dass Abstände bei der Expansion sich verhalten wie r(t) = a(t)r0 Hier ist a(t) der Skalenparameter des Universums. Er hängt nicht vom Ort (wegen der Homogenität), sondern nur von der Zeit t ab, die seit dem Urknall vergangen ist. Üblicherweise wird 4 Zu
frühen Zeiten des Universums war das anders. Bis zum Alter von etwa 50000 Jahren war das Universum von der Strahlung dominiert. 5 Teilchen der Dunklen Materie müssen neutral sein, andernfalls verhielten sie sich wie baryonische Teilchen. Es gibt etliche Vermutungen bzgl. ihrer physikalischen Identität, von denen keine bisher (2010) experimentell bewiesen wurde. Am aussichtsreichsten wird die Annahme angesehen, dass es sich um das leichteste superymmetrische Teilchen handelt. Im frühen Universum wurden viele Teilchen gebildet, die aber meistens instabil waren und rasch zerfielen. Nach dieser Vorstellung blieben am Schluss übrig die Elektronen, die Neutrinos, die up- und down-Quarks (die sich zu Nukleonen verbanden) und die erwähnten neutralen leichten supersymmetrischen Teilchen. Der neue LHCBeschleuniger im CERN (Genf) wird hier vielleicht Klarheit bringen. 6 Die physikalische Natur der Dunklen Energie ist zurzeit (2010) unbekannt und etlichen hochinteressanten und intellektuell herausfordernden Spekulationen ausgesetzt.
7.2 Kosmischer Mikrowellenhintergrund
221
normiert a(t0 ) = 1, was bedeutet, dass zum Zeitpunkt t0 , also heute, die beiden betrachteten Punkte den Abstand r0 haben. Offenbar expandiert ein Volumen V ∝ a(t)3 . Deshalb gilt für die Verteilung der Anzahl der Photonen pro Volumen in Gl. (7.2), dass diese proportional a(t)−3 ist. Nun erhält man aus den Friedmann-Gleichungen [Ryd03], die die Expansion des Universums beschreiben, dass Photonen als masselose Teilchen ihre Wellenlänge proportional zu a(t) verändern (ohne Beweis): λ (t1 ) a(t1 ) = (7.26) λ (t2 ) a(t2 ) Dadurch folgt für die totale Energiedichte (7.11), dass diese sich proportional zu a(t)−4 verändert: εγ (t) ∝ a(t)−4 Dass die Energiedichte der Strahlung gegenüber der Photonendichte einen weiteren Faktor 1/a(t) enthält, liegt an der Tatsache, dass nicht nur der Raum expandiert, sondern, wie in Gl. (7.26) dargestellt, auch die Wellenlängen der Photonen7 . Damit ergibt sich ein wichtiger Zusammenhang zwischen a(t) und der Temperatur T (t) der Strahlung, den man leicht aus thermodynamischen Betrachtungen herleiten kann. Behauptung: 1 T (t) ∝ (7.27) a(t) Beweis: Betrachte ein Volumen des Universums, das mit a(t)3 expandiert. Das Volumen sei mit Wärmestrahlung gefüllt, die nach Gl. (7.11) eine Energiedichte εγ = α T 4 besitzt. Da die Photonen sowohl Energie als auch Impuls haben, hat das Photonengas einen Druck, der nach Gl. (7.18) gegeben ist durch P = 13 εγ . Die Photonen innerhalb unseres Volumens müssen den Gesetzen der Thermodynamik gehorchen und insbesondere dem ersten Hauptsatz: ¯ − PdV dE = dQ ¯ die Wärme ist, die in das Gas oder aus dem Gas fließt, dE ist die Änderung der inneren wobei dQ ¯ = 0, weil das Energie und dV ist die Änderung des betrachteten Volumens V . Wir haben dQ Universum homogen ist, daher überall die gleiche Temperatur hat und deshalb kein Wärmefluss auftreten kann. Die Zeitableitung in einem homogenen expandierenden Universum ergibt somit dV dE = −P(t) dt dt Wegen E = εγ V =αT 4V und P = 13 αT 4 kann diese Gleichung umgeschrieben werden zu dT dV dV 1 α 4T 3 V + T 4 = − αT 4 dt dt 3 dt
⇒
1 dT 1 dV =− T dt 3V dt
Da aber V ∝ a(t)3 ist, folgt d d log T = − log a dt dt 7 Die
Photonen leisten wegen ihres Drucks Arbeit PdV gegen das Gravitationsfeld. Diese wird, falls das Universum einmal schrumpfen sollte, wieder zurückgewonnen.
222
7 Anwendungen der Quantenstatistik
und damit die Behauptung Gl. (7.27), q.e.d.. Diese Gl. (7.27) hat eine wichtige Konsequenz. Wenn wir das Plancksche Strahlungsgesetz betrachten (7.4), so stellen wir fest, daß eine einmal gegebene Wärmestrahlung ihre charakteristische Eigenschaft als Schwarzkörperstrahlung bei der Expansion des Universums behält: Die Frequenz ω ändert sich ∝ a(t) und die Temperatur ebenfalls ∝ a(t), so dass eβ h¯ ω − 1 temperaturunabhängig ist. Gleichzeitig entwickelt sich ω 3 dω ∝ a(t)−4 . Insgesamt haben wir also eine gleichbleibende funktionale Form der Energieverteilung, deren Amplitude ω 3 ∝ a(t)−3 ist. Dieses bedeutet, dass die heute beobachtete Mikrowellenhintergrundstrahlung auch zu früheren Zeiten des Universums eine Wärmestrahlung war, allerdings mit einer höheren Temperatur und einer größeren Amplitude. Genauere Untersuchungen, die wir unten diskutieren, zeigen, dass seit der Entstehung der Mikrowellenstrahlung die Temperatur etwa um einen Faktor 1000 gefallen und der Skalenfaktor um den gleichen Faktor gewachsen ist. Was wir heute als Mikrowelle sehen, war damals im Bereich des nahen Infraroten mit einer Temperatur von etwa 3500 Kelvin.
7.2.3 Ursprung des Mikrowellenhintergrundes, Saha-Gleichung Die Beobachtung und Erklärung der Mikrowellenstrahlung war historisch außerordentlich wichtig, weil sie der Theorie des Urknalls (Big Bang) zum Durchbruch verhalf.8 Zu ihre Verständnis benötigen wir jedoch noch eine wichtige Zahl, nämlich das Verhältnis von Photonenzahl nγ zur Baryonenzahl nBM in einem gegebenen Volumen, was wir zunächst berechnen wollen. Das nγ erhalten wir aus Gl. (7.3) nach Summe über beide Polarisationen ∞ ω2 N¯ 1 = 2 3 dω = V π c 0 exp h¯ ω − 1 kB T
kB T h¯ c
3
1 π2
∞ 0
y2 dy exp(y) − 1
Nun gilt die Integralformel (6.18) für die Riemannsche Zeta-Funktion. Wenn wir den Wert des benötigten ζ (3) aus den letzten Zeilen von Kap. 6.2.2 entnehmen, erhalten wir nγ =
kB T 3 N¯ = 0.244 V h¯ c
(7.28)
Man kann diese Zahl auch auf einfache Weise abschätzen als nγ εγ /Emean , siehe Gl. (7.25) und Gl. (7.24). Man erhält damit nγ = 0.22(kB T /¯hc)3 , was erstaunlich gut mit Gl. (7.28) übereinstimmt. Setzt man die heutige Temperatur ein, erhalten wir nγ = 3.8 ∗ 108 m−3
(7.29)
was bedeutet, dass zurzeit im Mittel fast 400 Photonen pro cm3 vorliegen. Auch wenn nach der Tabelle (7.1) die Energiedichte der Baryonischen Materie um einen Faktor 1000 größer ist als die Strahlungsdichte der Mikrowellenhintergrundstrahlung, so gibt es doch im Universum pro Volumen wesentlich mehr Photonen nγ als Baryonen nBM . Der Grund ist, dass ein Mikrowellenphoton eine geringe Energie von wenigen eV hat, siehe Gl. (7.24), während ein 8 Die
Konkurrenztheorie basierte auf den Vorstellungen eines „Steady-State-Universums”, dessen Hauptvertreter der britische Astrophysiker Fred Hoyle war. Ihr gelang es nicht, die Wärmestrahlung in überzeugender Weise zu erklären.
7.2 Kosmischer Mikrowellenhintergrund
223
Baryon eine große Ruheenergie besitzt, z.B. das Neutron 939 MeV/c2 . Zur Berechnung muss man berücksichtigen, dass sowohl nγ (nicht εγ !) als auch nBM bei der Expansion sich jeweils wie a(t)−3 verhalten, weshalb das Verhältnis nγ /nBM zeitunabhängig ist. Aus dem Studium der Nukleosynthese (siehe Kapitel 7.3 und Refs. [Lid08, Ryd03]) etwa eine Minute nach dem Urknall ergibt sich für die heutige mittlere Anzahl der Baryonen nBM 0.22m−3
(7.30)
und damit ηB/γ =
nBM 5.8 ∗ 10−10 nγ
(7.31)
Mit diesem Verhältnis sind wir nun in der Lage, den Ursprung der Mikrowellenstrahlung zu klären. Dazu benötigen wir eine einzige Zahl, die aus jedem Physiklabor bekannt ist, nämlich die Bindungsenergie des Grundzustandes des Wasserstoffatoms bzw. seine Ionisationsenergie: Q = 13.6 eV. Solange das Universum jung war und die Temperatur hoch genug, gab es genug Photonen, die hinreichend viel Energie besaßen, ein Proton, das im Begriff war, ein Elektron an sich zu binden, sofort zu ionisieren und so die Bindung zu verhindern. Die entsprechende Reaktion war γ + H p + e− . Betrachten wir genauer eine solche Situation und nehmen als Beispiel ein Universum, dessen Skalenparameter a = 10−6 und dessen Temperatur dann T = 2.7·106 Kelvin war. Wasserstoffatome konnten zu dieser Zeit nicht existieren, weil die typische Energie eines Photons in der Wärmestrahlung weit über der Ionisationsenergie der H-Atome lag. Das Universum zu dieser Zeit war also erfüllt von einem Plasma aus Photonen, Elektronen und Nukleonen. Die Photonen wechselwirkten dabei im Wesentlichen mit Elektronen über Thomson Streuung9 . Das Universum war also undurchsichtig für Photonen, die nur eine endliche freie Weglänge hatten. Photonen und Elektronen waren miteinander im Gleichgewicht und das hatte für die Photonen die Folge, dass sie die Charakteristik einer Wärmestrahlung annahmen. Mit wachsender Expansion und Abkühlung des Universums nahm die Temperatur dieser Wärmestrahlung ab und es sank die Anzahl der Photonen in der Planck-Verteilung, die in der Lage waren, die Bindung eines Wasserstoffatoms zu verhindern. Dies fand etwa 480000 Jahre nach dem Urknall statt (ohne Beweis) [Ryd03]. Am Ende einer Periode von etwa 30000 Jahren waren alle freien Elektronen verschwunden und hatten sich mit den freien Protonen zu Wasserstoff-Atomen gebunden10 . Die freien Photonen fanden jetzt nur noch neutrale H-Atome vor, mit denen sie nicht wechselwirkten. Das Universum veränderte sich innerhalb der 30000 Jahre in einer ganz fundamentalen Eigenschaft: Es wurde durchsichtig für Licht. Dieser hier dargestellte Prozess heißt Entkopplung oder auch Rekombination. Nur weil dies so stattgefunden hat, sind wir in der Lage, über unsere Milchstraße hinauszusehen, weit entfernte Galaxien zu beobachten und eine so grundlegende Eigenschaft wie die Expansion festzustellen. Die nach der Entkopplung freien Photonen hatten [wegen der engen Wechselwirkung mit den Elektronen vor der Entkopplung] das Spektrum einer 9 Photonen
wechseln grundsätzlich nur mit geladenen Teilchen. Im Niederenergielimes haben wir die ThompsonStreuung. Deren Streuquerschnitt hängt von der Masse m der streuenden Ladung ab und ist proportional zu m−2 , was die Streuung der Photonen mit Protonen stark unterdrückt. 10 Bei einem Elektroneneinfang werden Photonen erzeugt. Verglichen jedoch zur Gesamtzahl der Photonen (siehe Gl. (7.31), war dies eine verschwindend kleine Anzahl im hochenergetischen Schwanz der Planck-Verteilung, so dass die Photonen als Ganzes ihre Eigenschaften als Wärmestrahlung nicht verloren.
224
7 Anwendungen der Quantenstatistik
Wärmestrahlung, und sie behielten es bei dem sich expandierenden und abkühlenden Universum bis heute, wo ihre Temperatur auf etwa 3 Kelvin zurückgegangen ist. Mit den hier erworbenen Kenntnissen können wir den Zeitpunkt und die Temperatur der Entkopplung abschätzen: Die mittlere Energie eines Photons in einer Schwarzkörperverteilung der Temperatur T ist Emean ∼ = 3kB T . Wenn man diese Energie gleich der Bindungsenergie des HAtoms setzt und berücksichtigt, dass kB = 8.617385 × 10−5 eV K−1 ist, so ergibt sich für die Entkopplungstemperatur zunächst T ∼ = 50000 Kelvin. = 13.6 eV/3kB ∼ Diese Abschätzung ist jedoch viel zu grob, weil sie ignoriert, dass die Planck-Verteilung einen hochenergetischen Schwanz hat und wegen des großen Verhältnisses nγ /nBM ≈ 1010 von Gl. (7.31) nur vergleichbar wenige Photonen ausreichen, die Ionisation durchzuführen11 . Bei einer korrekten Rechnung erwarten wir also, dass die Entkopplungstemperatur sowohl von der Bindungsenergie (bzw. Ionisationsenergie) Q als auch von dem Verhältnis nγ /nBM abhängen wird. Zur Berechnung des Ionisationsgrades X im frühen Universum betrachten wir die Teilchenzahldichte n j der Teilchensorte j mit der Masse m j im Gleichgewicht mit einer Wärmestrahlung der Temperatur T . Für diese gilt bei nichtrelativistischen Teilchen die Behauptung nj = gj
m j kB T 2π h¯ 2
3/2
μj m j c2 exp exp − kB T kB T
(7.32)
wobei g j der statistische Faktor ist. Dieser gibt an, wie viele verschiedene Teilchensorten miteinander entartet sind. Für die Reaktion γ + H p + e− haben wir gγ = 2 wegen der beiden Polarisationen, g p = ge = 2 wegen des Spins S = 1/2 und gH = 4, weil ein H mit Drehimpuls J = 0 und drei H mit Drehimpuls J = 1 bei der Reaktion erzeugt werden können. Der Beweis von Gl. (7.32) geht wie folgt: Nach Gl. (6.23) haben wir als mittlere Besetzungszahl eines Teilchenzustandes mit dem Impuls p n(p) = exp
p2 mc2 −μ + + 2mkB T kB T kB T
−1 +1
(7.33)
Für die in Frage kommenden Temperaturen von weniger als 105 K bzw. weniger als 10 eV gilt mc2 /kB T 1 und weiter bei dem verdünnten klassischen Gas nach Gl. (5.25) −μ/kB T 1, weshalb wir die Eins in der eckigen Klammer in Gl. (7.33) weglassen können, was die Rechnung vereinfacht. Wir können nämlich jetzt mit Gl. (7.1) sofort die totale Teilchendichte n ausrechnen: n=
1 2π h¯
3
4π p2 n(p)d p
oder nach Ausführung des Gaußschen Integrals n=
mkB T 2π h¯ 2
3/2
mc2 exp − kB T
μ exp T kB
(7.34)
womit wir Gl. (7.32) bewiesen hätten, q.e.d. 11 Siehe
Text im Zusammenhang mit Gl. (7.7), in dem die Energiespreizung der Planck-Verteilung dargelegt wird.
7.2 Kosmischer Mikrowellenhintergrund
225
Von dieser Gleichung für H,p und e− können wir eine Beziehung zwischen den Teilchenzahldichten ableiten (m p + me − mH )c2 μ p + μe − μH gH mH 3/2 kB T −3/2 nH = exp exp − n p ne g p g e m p me kB T kB T 2π h¯ 2 (7.35) Wir können vereinfachen: Da mH 2000me , können wir mH /m p = 1 setzen. Weiterhin ist die Bindungsenergie Q = (m p + me − mH )c2 = 13.6 eV und die statistischen Faktoren kürzen sich zu Eins. Weil wir Gleichgewicht betrachten, stellen wir fest, dass μ p + μe − μH = 0 gilt12 . Die resultierende Gleichung13 ist die Saha-Gleichung nH = n p ne
me kB T 2π h¯ 2
−3/2
exp
Q kB T
(7.36)
Wir müssen jetzt in diese Saha-Gleichung unsere Kenntnis von ηBM/γ einführen und dann die Entkopplungstemperatur extrahieren. Dazu definieren wir den Ionisationsgrad des baryonischen Inhalts des Universums np np ne = = X= n p + nH nBM nBM wobei wir Ladungsneutralität [i.e. n p = ne ] vorausgesetzt haben und weiterhin vereinfacht haben, dass das Universum nur aus Protonen und H-Atomen besteht, wir also die 25% Helium ignoriert haben. Mit 1−X np nH = X erhalten wir me kB T −3/2 1−X Q = np (7.37) exp X kB T 2π h¯ 2 Wir eliminieren von dieser Gleichung n p . Dazu betrachten wir ηB/γ = nBM /nγ und weil X der Bruchteil des Wasserstoffs ist, der ionisiert ist, also in Form von Protonen vorliegt, können wir schreiben np nBM = ηB/γ = nγ Xnγ Wir kennen nγ von Gl. (7.28), woraus wir erhalten n p = 0.244XηB/γ
kB T h¯ c
3
Wenn wir dieses n p in Gl. (7.37) einsetzen und den Zeitpunkt der Entkopplung durch X = 1/2 kennzeichnen, wenn also die Hälfte der Protonen sich mit den Elektronen zu Wasserstoff verbunden hat, dann bekommen wir eine Bedingung für die Entkopplungstemperatur Tdec : Q kB Tdec 3/2 exp 1 = 1.92ηB/γ (7.38) me c2 kB Tdec Gl. (7.35) entspricht Gl. (3.156), wobei be = b p = −bH = −bγ = 1 und μγ = 0. beachte, dass die Saha-Gleichung nichts anderes ist als das Massenwirkungsgesetz Gl. (3.163) im astrophysikalischen Kontext.
12 Die
13 Man
226
7 Anwendungen der Quantenstatistik
Mit ηBM/γ 5.9 × 10−10 kann man diese Gleichung auflösen und Tdec erhalten. Das geht allerdings nur numerisch. Da nur die Exponentialfunktion eine starke Abhängigkeit von Tdec zeigt, ist das Resultat nicht sehr empfindlich von ηBM/γ abhängig. Man erhält einen Wert, der stark von der oben abgeschätzen Temperatur von etwa 50000 Kelvin abweicht: kB Tdec = 0.323eV =∼ = 3700K
(7.39)
Der Vergleich mit der heutigen Temperatur von etwa 3 Kelvin erlaubt den Schluss, dass die Entkopplung, also das Umschlagen eines für Licht undurchsichtigen zu einem durchsichtigen Universum stattfand, als der Skalenparameter a(t) ∼ = 10−3 war, wenn man den heutigen auf a(t0 ) = 1 normiert. Die Entkopplung fand nach den neuesten Messungen etwa 480000 Jahre nach dem Urknall [NAS09] statt und dauerte etwa 30000 Jahre. Seit dieser Zeit schwirren die Photonen dieser Wärmestrahlung durch unser Universum und kühlen mit wachsender Expansion des Kosmos ab, so dass sie heute die niedrige Temperatur einer Mikrowellenstrahlung haben. Die Photonen, die wir heute mit Hilfe von Satelliten messen, sind also mehr oder weniger ungehindert (13600000 − 480) × 103 Jahre auf uns zugelaufen, kommen also aus einer Kugelschale mit einem Radius von etwa c × 13.6 × 109 Jahren, also 13.6 × 109 Lichtjahren. Aufgrund der Tatsache, dass in dieser Zeit der Kosmos expandiert ist, liegt der wahre Abstand der Quellen der Mikrowellenhintergrundstrahlung noch weiter von uns entfernt, und zwar bei etwa 8.5 Megaparsec, dem sog. ”Surface of last Scattering”. Da ist nichts Besonderes an dieser Oberfläche, außer dass einige ihrer Photonen gerade jetzt die Erde treffen. Jeder Punkt des Universums hat Photonen dieser Art emittiert und Beobachter in verschiedenen Teilen des Universums sehen Photonen, die von anderen Oberflächen stammen, die jeweils um die Position des Beobachters zentriert sind und den gleichen Radius von 8.5 Megaparsec haben.
7.3 Nukleosynthese im frühen Universum Das am häufigsten vorkommende Element im Universum ist Wasserstoff. Es stellt nahezu 75% der Masse aller Baryonischen (d.h. sichtbaren) Materie. Das zweitwichtigste ist 4 He, das etwa zu 25% vorkommt. Die anderen leichten und schweren Elemente sind sehr selten und stellen insgesamt weniger als 2%. Es ist allgemeine Ansicht und auch einfach zu erklären, dass 4 He, Deuterium (D) und andere leichte Elemente nicht durch Sternenbrennen erzeugt wurden. Die einzige akzeptable Erklärung ihres Vorkommens im Universum ist, dass sie in sehr frühen Stadien der Entwicklung des Kosmos synthetisiert wurden. Nach den Überlegungen unseres Kap. 7.2.3 über den Ursprung des Mikrowellenhintergunds ist es klar, dass das Helium nicht erzeugt werden konnte, bevor die Temperatur des Universums unter die 4 He-Bindungsenergie von ∼ 28MeV gefallen war, weil sonst Photonen seine Bindung verhindert hätten. Diese Bindung der Protonen und Neutronen zu leichten Kernen nennt man Big-Bang-Nukleosynthese oder primordiale Nukleosynthese, um sie von der Nukleosynthese in Sternen oder Supernovae zu unterscheiden. Sie begann, als das Universum etwa 1 sec alt war und dauerte wenige Minuten. Die entsprechenden physikalischen Vorgänge sind mit statistischen und kernphysikalischen Methoden gut verstanden und stellen somit eine ausgezeichnete Sonde dar, das frühe Universum zu untersuchen. Insbesondere kann man als eine wichtige Größe die Baryonenzahldichte nBM aus solchen Überlegungen extrahieren.
7.3 Nukleosynthese im frühen Universum
227
Natürlich kann man 4 He durch Kollision von zwei Protonen und zwei Neutronen bilden: p + p + n + n → 4 He + γ. Allerdings müssen dann alle die Nukleonen zur gleichen Zeit an einem Ort sein, wozu die Wahrscheinlichkeit bei den in Frage kommenden Dichten zu gering ist, um dem Prozess Bedeutung zu verleihen. Deshalb wurde 4 He in mehreren hintereinander ablaufenden Einzelreaktionen gebildet, wobei der erste Schritt in der Synthese des Deuterons D bestand: p + n D + γ. Erst danach14 fanden alle weiteren Prozesse statt, die zum 4 He und auch noch zu einigen Spurenelementen führten. Wir werden deshalb zunächst das Zahlenverhältnis der Neutronen- zu Protonendichte berechnen, dann die Deuteron-Fusion und Entstehung von 4 He untersuchen und am Schluss mit Hilfe der Beobachtung die Baryonenzahldichte nBM extrahieren. Zu Beginn der Prozesse der Nukleosynthese bestand das Universum aus Protonen und Neutronen, die zur Klasse der Baryonen gehören und sich zu ganz frühen Zeiten aus Quarks gebildet hatten, und Elektronen, Photonen und Elektron-Neutrinos, wobei die Anzahl der Photonen und Neutrinos etwa das 1010 -Fache der Anzahl der Baryonen war. Das Universum war während dieser Zeit dominiert von der Strahlung und die Expansion war nahezu ausschließlich durch diese bestimmt. Aus theoretischen Überlegungen (Friedmann-Gleichungen) kann man berechnen [Ryd03], dass der Skalenparameter die einfache Zeitabhängigkeit a(t) ∝ t 1/2 hatte und die Temperatur der Strahlung sich verhielt wie (ohne Beweis) t −1/2 T (t) ≈ 1010 Kelvin (7.40) 1 sec oder äquivalent t −1/2 MeV (7.41) kB T (t) ≈ 1 1 sec woraus für die mittlere Photon-Energie folgt t −1/2 MeV (7.42) Emean ≈ 3 1 sec Für das Folgende ist wichtig, zwischen den bei Kernreaktionen vorkommenden elementaren Wechselwirkungen zu unterscheiden. Die Starke Wechselwirkung wirkt im gegenwärtigen Zusammenhang nur zwischen Protonen, Neutronen und Atomkernen und kommt bei allen Kernreaktionen vor. Emittiert oder absorbiert der Prozess aufgrund der Quantenzahlen noch ein Photon, wirkt einschränkend auch die Elektromagnetische Wechselwirkung, die um viele Größenordnungen schwächer ist als die Starke Wechselwirkung. Kommt im Prozess ein Neutrino vor, haben wir es neben der Starken auch mit der Schwachen Wechselwirkung zu tun, die ihrerseits viele Größenordnungen schwächer als die Elektromagnetische ist. Also gilt für die Kopplungsstärken g(strong) g(elmag) g(weak) und entsprechend verhalten sich die Reaktionsquerschnitte: σ (strong) σ (strong ∗ elmag) σ (strong ∗ weak) σ (strong ∗ elmag ∗ weak).
7.3.1 Protonen und Neutronen, ”Freeze-out” Die Bausteine der Big-Bang-Nukleosynthese sind Protonen und Neutronen. In diesem Kapitel berechnen wir das Verhältnis der Teilchenanzahldichten nn /np , was für die Deuteron-Fusion von 14 Man
spricht auch vom Deuteron-Flaschenhals.
228
7 Anwendungen der Quantenstatistik
essenzieller Bedeutung ist. Das Neutron hat eine größere Masse als das Proton. Es gilt Qn = (mn − m p )c2 = 1.29 MeV
(7.43)
Das freie Neutron zerfällt mit der Zerfallszeit τn = 890 sec mit dem Zerfallsgesetz für die Anzahl von Neutronen nn (t) in einem Volumen t nn (t) = nn (0) exp − (7.44) τn und der Zerfallsprozess ist
n → p + e− + ν¯ e
(7.45)
Gäbe es nur diesen Prozess, dann hätten Neutronen keinerlei Bedeutung für die Entwicklung des Universums, denn sie wären nach einer Stunde alle verschwunden. Aber sie werden mit Protonen in Atomkernen gebunden und bei stabilen Kernen zerfallen sie nicht wegen des Pauliprinzips. Dieser Proton-Neutron-Bindungsprozess begann im Universum etwa zur Zeit t = 1 sec . Um ihn zu studieren, betrachten wir den Kosmos zu einem früheren Zeitpunkt, nämlich t = 0.1 sec. Dort hatten wir Temperaturen von T ≈ 3 × 1010 K und die mittlere Energie eines Photons war Eγ ≈ 10 MeV und somit viel größer als Elektronen- und Positronenmasse. Deshalb konnten Positronen durch γ + γ → e− + e+ erzeugt werden. Dadurch waren Prozesse möglich der Art n + νe p + e−
n + e+ p + ν¯ e
(7.46)
durch die die Protonen mit den Neutronen im Gleichgewicht waren. Nach Gl. (7.34) waren die Anzahldichten gegeben durch 3/2 (mn − m p )c2 mn nn Qn = exp − exp − (7.47) np mp kB T kB T wobei wir die chemischen Potenziale wegen der Gleichgewichtsbedingung μn = μ p weggelassen haben. Hierbei entpricht Qn = 1.29 MeV einer Temperatur von T = 1.5 × 1010 K. Die Temperaturabhängigkeit von nn /n p ist wichtig für die Beschreibung der Deuteron-Fusion, die Gl. (7.47) ist jedoch nur gültig (ohne Beweis) bis zu der sog. ”freeze-out”-Temperatur Tfreeze = 9 × 109 K oder kB Tfreeze = 0.84 MeV. Der Grund liegt darin, dass Prozesse in Gl. (7.46) über die Neutrinos die Schwache Wechselwirkung erfordern, deren Wirkungsquerschnitt (ohne Beweis) ∝ T 2 ist, also mit expandierendem Universum abnimmt. Das liegt an der Tatsache, dass der Wirkungsquerschnitt vom Relativimpuls abhängt und damit von der mittleren Geschwindigkeit der Reaktionspartner, die über den Gleichverteilungssatz mit der Temperatur zusammenhängt. Weil obendrein durch die Expansion die Neutrinos und die Nukleonen ausgedünnt werden, ergibt sich die Situation, die man ”Entkopplung der Neutrinos von der Materie” nennt, was bedeutet, dass für T < Tfreeze die Neutrinos für eine Wechselwirkung mit den Protonen und Neutronen nicht mehr zur Verfügung stehen. Sobald also T < Tfreeze , ändert sich das nn /n p -Verhältnis nicht mehr, wenn man zunächst vom viel länger dauernden Neutronenzerfall absieht. Der Zeitpunkt ist etwa tfreeze ≈ 1.4 sec. Wir haben damit für T < Tfreeze etwa 5 Protonen auf 1 Neutron: nn Qn 1.29MeV ∼ = exp − ≈ 0.2 (7.48) = exp − np kB Tfreeze 0.84MeV
7.3 Nukleosynthese im frühen Universum
229
Diese Zahl erklärt bereits qualitativ, warum im Universum der Großteil der Baryonen in Form von Protonen vorliegt. Der Grund ist nicht der Zerfall der Neutronen, sondern primär ihre größere Masse im Gleichgewicht mit den Protonen und die Entkopplung der Neutrinos von der Materie. Das nn /n p -Verhältnis ist extrem wichtig: Alle weiteren Kernprozesse laufen nämlich ab, nachdem durch Fusion eines Neutrons mit einem Proton das Deuteron entstanden ist. Der weitaus wichtigste Prozess dazu erfordert starke und elektromagnetische Wechselwirkung: n+ p D+γ
(7.49)
Alle anderen Prozesse, wie p + p D + e+ + νe oder n + n D + e− + ν¯ e , erfordern die Schwache Wechselwirkung und sind deshalb unterdrückt. Wir werden weiter unten sehen, dass auch die Deuteronen weiteren Kernprozessen unterworfen sind. Am Ende dieser Kette jedoch steht im Wesentlichen 4 He, in dem sich alle Neutronen sammeln. Der Rest der Baryonischen Materie besteht weit überwiegend in freien Protonen. In diesem unten noch zu präzisierenden Bild können wir den Massenbruchteil Y4 ausrechnen, den 4 He in der Baryonischen Materie ausmacht. Mit einem nn /n p = 1/5 können wir dazu eine representative Gruppe von 2 Neutronen und 10 Protonen betrachten. Die 2 Neutronen binden sich mit 2 Protonen zu 1 Kern 4 He und die übrigen 8 Protonen bleiben frei. Hierfür haben wir ein Y4 = 4/12 = 1/3. Da in der Realität auch noch andere Atomkerne gebildet werden, ist dieses Y4 das maximal Mögliche. Wir haben also als Massen-Anteil des primordialen 4 He an der gesamten baryonischen Massendichte Y4 =
2f ≤ 0.33 1+ f
mit
f=
nn np
(7.50)
7.3.2 Deuteron-Synthese Wir betrachten jetzt eine Zeit von t = 2 sec, also nach dem „freeze-out”. Dort gilt nn /n p ≈ 0.2. Die Big-Bang-Nukleosynthese läuft in mehreren Schritten ab, wobei der erste und wichtigtste die Synthese des Deuterons nach Gl. (7.49) ist. Die dabei freigesetzte Energie ist die Bindungsenergie des Deuterons BD = (mn + m p − mD ) c2 = 2.22 MeV (7.51) Der folgende statistische Formalismus ist eine komplette Kopie dessen, was wir bereits bei der Bildung von H-Atomen in Kap. 7.2.3 kennengelernt haben, wo die der Deuteron-Fusion n + p D + γ entsprechende Rektion p + e− H + γ war. Im gegenwärtigen Fall ist die Energieskala MeV und nicht eV, also um einen Faktor 106 höher. Wir können sofort das Analogon zu Gl. (7.35) formulieren:
3/2
−3/2
(m p + mn − mD )c2 μ p + μn − μD exp − kB T kB T (7.52) Wegen des Gleichgewichts gilt μ p + μn − μD = 0 und für die statistischen Faktoren haben wir g p = gn = 2 wegen des Spins S = 1/2 und gD = 3, weil der Drehimpuls des Deuterons J = 1 ist15 . nD gD = n p nn g p gn
15 Ein
mD m p mn
kB T 2π h¯ 2
exp
Neutron-Proton-System mit J = 0 ist nicht gebunden.
230
7 Anwendungen der Quantenstatistik
Mit Gl. (7.51) und mit der guten Approximation m p = mn = mD /2 erhalten wir das Analogon zur Saha-Gleichung (7.36) nD mn kB T −3/2 BD =6 exp n p nn kB T 2π h¯ 2
(7.53)
Wir definieren als Tnuc diejenige Temperatur, an der nD /nn = 1, also die Hälfte der freien Neutronen fusioniert haben. Da alle weiteren Prozesse sehr schnell ablaufen, ist diese Temperatur charakteristisch für die gesamte Big-Bang-Nukleosynthese. Dieses Tnuc wollen wir jetzt berechnen und es dabei in Bezug zu einer kosmologisch extrem wichtigen Größe setzen, nämlich zu ηB/γ . Wir wissen, dass vor dem Beginn der Deuteronsynthese nach Gl. (7.48) etwa 80% der Baryonen aus freien Protonen bestand. Wir können also mit Gl. (7.28) schreiben kB T 3 n p ≈ 0.8nBM = 0.8ηB/γ nγ = 0.8ηB/γ 0.244 h¯ c Wenn wir dies in Gl. (7.53) einsetzen, erhalten wir nD = 6.5ηB/γ nn
kB T mn c2
3/2 exp
BD kB T
(7.54)
Man erhält Tnuc , indem man in dieser Gleichung die LHS gleich Eins setzt und für ηB/γ = 5.8 × 10−10 nimmt. Dies ergibt auf numerische Weise kB Tnuc ≈ 0.066 MeV bzw. Tnuc = 7.5 × 108 K. Diese für die gesamte Nukleosynthese charakteristische Temperatur wird erreicht, wenn seit dem Big Bang etwa tnuc ≈ 200 sec verstrichen sind. Eine kleine Korrektur ist notwendig: 200 sec sind gegenüber der Lebensdauer eines freien Neutrons nicht vernachlässigbar. Bis Tnuc hat das nn /n p -Verhältnis nach Gl. (7.44) etwas abgenommen: 0.8 nn exp(−200/890) ≈ ≈ 0.15 f= ≈ np 5 + [1 − exp(−200/890)] 5.2 Dadurch stehen weniger Neutronen zur Bildung von 4 He zur Verfügung, so dass wir statt Gl. (7.50) den durch die Beobachtung bestätigten Wert erhalten: Y4 =
2f ≈ 0.27 1− f
(7.55)
7.3.3 Leichte Kerne und Baryonische Materie Wenn einmal das Deuteron entstanden ist, sind viele weitere relativ schnelle Kernreaktionen möglich, die sukzessive die schwereren der leichten Kerne synthetisieren.16 Sobald 3 He und 3 H formiert sind, finden weitere Reaktionen statt, die alle zu 4 He führen.17 Keine dieser Reaktionen 16 Wir
haben dort D + p 3 He + γ, D + n 3 H + γ, D + D 4 He + γ, D + D 3 H + p oder D + D 3 He + n. sind 3 H + p 4 He + γ, 3 He + n 4 He + γ, 3 H + D 4 He + n, 3 He + D 4 He + p.
17 Beispiele
7.3 Nukleosynthese im frühen Universum
231
benötigt Neutrinos, die nach ihrer Abkopplung von der Materie ja auch nicht mehr zur Verfügung stehen. Also: Sobald die Nukleosynthese beginnt, also Deuteronen gebildet werden, werden diese und 3 He und 3 H am Ende zu 4 He fusioniert. Die Details dieser gekoppelten Reaktionen können nur numerisch berechnet werden. Es werden keine schwereren Kerne mit A = 5 gebildet, weil keiner von ihnen stabil ist. Ganz geringe Spuren von 7 Li werden noch erzeugt durch He-Fusion. Die am Ende resultierenden Mengenverhältnisse von D, 3 He und 4 He hängen wegen Gl. (7.54) ab vom Wert nB/γ , weil D der Eingangskanal ist. Damit, weil nγ gut bekannt ist, hängen sie von der Dichte der Baryonischen Materie nBM ab, einer außerordentlich wichtigen Zahl. Die Abhängigkeit von nBM ist für 4 He relativ schwach, wie die Rechnungen ergeben, für D jedoch sehr stark. Dieses ist plausibel, weil D nur überleben kann, wenn die Kernreaktionen, die zu He führen, nicht zu schnell ablaufen und dabei alle D’s verbrauchen. Mit wachsender Baryonendichte sind Kollisionen zwischen zwei Deuteronen jedoch häufiger und weniger von ihnen können der Fusion zum He entkommen. Angesichts dieser Situation kann man einen wichtigen Umkehrschluss ziehen: Wenn es uns möglich ist, den Gehalt von D im Universum zu messen, so können wir nach den obigen Rechnungen die Baryonenzahldichte nBM bestimmen! Im Falle des Deuterons ist das durch Beobachtung der Lyman-α Linien des Wasserstoffs und des Deuteriums im Licht von Quasaren in der Tat möglich18 . Da das Licht vor einigen Milliarden Jahren ausgeschickt wurde, muss der extrahierte Wert auf die heutige Zeit umgerechnet werden, was aber keine Probleme bereitet. Am Ende bekommen wir den Wert, wie er in der Tabelle (7.1) angegeben ist: nBM (t0 = ηB/γ nγ = (0.23 ± 0.01) m−3
(7.56)
was einer Energiedichte entspricht von εBM (t0 ) = (m p )c2 nBM = (210 ± 10) MeV m−3
(7.57)
In der Kosmologie ist es üblich, den Wert von εBM durch die sog. kritische Eergiedichte εc zu teilen, die man durch Messung der Expansion des Universums (Hubble-Parameter) halbwegs kennt. Das Resultat ist ΩBM (t0 ) =
εBM (t0 ) (210 ± 10) MeV m−3 ≈ 0.04 ± 0.005 = εc (t0 ) (5580 ± 110) MeV m−3
(7.58)
Nun nimmt man aus fundamentalen Überlegungen und neuen Beobachtungen [NAS09] an, dass das Universum keinen gekrümmten, sondern einen flachen Raum darstellt und deshalb gilt Ωγ (t0 ) + Ων (t0 ) + ΩBM (t0 ) + ΩDM (t0 ) + ΩDE (t0 ) = 1.00
(7.59)
wobei die Beobachtungen der RHS nur einen Fehler von 2% zeigen. Man sieht aus diesen Zahlen, dass die Baryonische Materie, also die im Universum beobachtbare Materie in Sternen, Nebeln, Galaxien, interstellaren und intergalaktischen Gas- und Molekülwolken etc. nur etwa 4% zur Energiedichte des Univerums beiträgt. Das bedeutet auch, dass Dunkle Materie nicht aus Baryonen bestehen kann. Photonen und Neutrinos haben heute einen vernachlässigbaren Beitrag. Unser Universum und seine Expansion sind heute primär bestimmt durch Dunkle Materie und vor allem Dunkle Energie. Dichte von 3 He zeigt auch eine starke Abhängigkeit von ηBM , seine Häufigkeit ist jedoch nicht so gut messbar wie die von D.
18 Die
232
7 Anwendungen der Quantenstatistik
7.4 Gitterschwingungen Die elementaren Freiheitsgrade eines Gitters bestehen in den Schwingungen der einzelnen Moleküle um ihre individuelle Gleichgewichtslage. Diese sind alle voneinander entkoppelt, d. h., ein Moleküle weiß nicht, wie das benachbarte schwingt. In der Realität sind diese jedoch mit einer Wechselwirkungsenergie EWW gekoppelt. Bei niedrigen Energien haben wir deshalb effektive Freiheitsgrade, die in einer kollektiven Schwingung aller Moleküle gleichzeitig bestehen. Diese effektiven Freiheitsgrade (Quasiteilchen) sind i.A. verschieden von elementaren Freiheitsgraden (man erinnere sich z.B. an mechanische Normalschwingungen der linearen Kette). Wenn wir den Hamiltonoperator des Systems in den Normalschwingungen formulieren, so haben wir eine Summe nicht-wechselwirkender harmonischer Schwingungen (Phononen, Plasmonen), bei denen jedes Phonon durch eine Überlagerung der elementaren Schwingungen zustande kommt. In dieser Theorie unabhängiger Quasiteilchen können wir Statistik treiben und alle Methoden anwenden, die wir bisher gelernt haben. Wenn wir wechselwirkende Schwingungen als Freiheitsgrade nähmen, könnten wir nicht mehr unsere statistischen Methoden anwenden. Wir können aufteilen: Wenn die Temperaturen so hoch sind, dass kB T EWW , dann haben wir näherungsweise ein System voneinander unabhängig schwingender Teilchen, und es gelten die klassischen Methoden. Bei ganz hohen Temperaturen haben wir nur noch ein Gas oder eine Flüssigkeit und das System ist ungeordnet. Wenn niedrige Temperaturen vorliegen, also kB T EWW , dann koppeln wir die freien Moden zu kollektiven Normalschwingungen um und haben in diesen Moden eine geordnete Bewegung. Dazwischen gibt es einen Phasenübergang, den wir hier nicht weiter betrachten wollen. Nach der Theorie kleiner mechanischer Schwingungen der klassischen Mechanik [Fli96] kann man die Berechnung der Normalschwingungen durchführen.
7.4.1 Normalschwingungen Die Lagrangefunktion des Systems lautet L=
1 Tik (q)q˙i q˙k −U(q) 2∑ i,l
dabei sind q = (q1 , q2 , ..., qN ) die elementaren Freiheitsgrade, die Schwingungen der einzelnen Moleküle um ihre jeweilige Gleichgewichtslage beschreiben. Wenn wir die Gleichgewichtskoordinaten mit q0 bezeichnen, also q = q0 + η dann können wir die Lagrangefunktion für die Bewegungen in den Koordinaten ηk (t) hinschreiben 1 1 L = ∑ Tik η˙ i η˙ k − ∑ Vik ηi ηk . 2 i,k 2 i,k Dabei stellen Vik = wichtspunkt dar.
∂ 2V ∂ qi ∂ qk
0
die zweiten Ableitungen der potentiellen Energie am Gleichge-
7.4 Gitterschwingungen
233
Die Bewegungsgleichung ergibt sich: d ∂L ∂L − =0 ∂ ηm dt ∂ η˙ m und sie ist gelöst durch:
∑ Tmnη¨ n +Vmn ηn = 0 n
Die kollektiven, effektiven Moden werden bestimmt durch die Forderung, dass in diesen Moden alle Atome im Festkörper im Gleichtakt mit der Frequenz ω schwingen, was zu den Eigenmoden des Systems führt (eff. Freiheitsgrade), also ηm (t) = am e−iωt und damit folgt nach Einsetzen in die allgemeine Bewegungsgleichung die explizite Bewegungsgleichung
∑
Vmn − ωr2 Tmn anr = 0.
n
Die Normalfrequenzen ωr sind gegeben durch die Lösungen des charakteristischen Polynoms: det Vmn − ω 2 Tmn = 0 Daraus erhalten wir Eigenwerte ωr2 , und zugehörige Eigenvektoren anr , n = 1, ..., 3N und r = 1, ..., 3N. Wir koppeln die elementaren Moden zu Normalkoordinaten ξr um: ηn = ∑ anr ξr r
und in diesen Moden schreibt sich die Hamiltonfunktion als eine Überlagerung unabhängig schwingender Oszillatoren H=
1 ˙2 ξr + ωr2 ξr2 ∑ 2 r
also voneinander unabhängiger Freiheitsgrade. Die Anzahl dieser Moden ist durch die Teilchenzahl N des Festkörpers gegeben. Eine jede Schwingungsmode kann nr -fach besetzt sein und diese Besetzung unterliegt keiner Beschränkung.
7.4.2 Zustandssumme, spezifische Wärme Die totale Energie des Festkörpers schreibt sich 1 E = En1 n2 ... = V0 + ∑(nr + )¯hωr 2 r = −Nϑ + ∑(nr h¯ ωr ) r
234
7 Anwendungen der Quantenstatistik
mit der für das Folgende unerheblichen Konstante Nϑ , die der niedrigst möglichen Energie einschließlich aller nullpunktsenergien des Festkörpers entspricht. Das ϑ ist die Bindungsenergie pro Teilchen des Festkörpers: 1 −Nϑ = V0 + ∑ h¯ ωr r 2 Der Zustand des Systems ist vollständig beschrieben durch Angabe der Besetzungszahlen nr , wobei diese keinerlei Beschränkung unterliegen. Wir müssen also Phonon-Statistik von Kap. 6.2.4.2 betreiben. Für die Zustandssumme erhalten wir somit nach Gl. (6.31) Z = eβ Nϑ
1 1 ··· −β h ω ¯ ¯ ω2 1 1 − e−β h 1−e
Damit erhalten wir als wichtige Größe log Z = β Nϑ − ∑ log(1 − e−β h¯ ωr )
(7.60)
r
Als Anzahl der Moden im Energiebereich [ω, ω + dω] definiert man σ (ω)dω. Das ist eine unbekannte Funktion, die sehr stark von dem betrachteten Material abhängt und deren Berechnung nur numerisch erfolgt und schwierig ist. Wir werden später mit der Debye-Approximation eine einfache Näherung verwenden. Nun können wir in Gl. (7.60) von der Summe zum Integral übergehen. log Z = β Nϑ −
∞ 0
log(1 − e−β h¯ ω )σ (ω)dω
(7.61)
und erhalten für die Energie ∂ E¯ = − log Z = −Nϑ + ∂β
∞ 0
h¯ ω σ (ω)dω −1
eβ h¯ ω
und wir können die spezifische Wärme berechnen ¯ ∂ E¯ 2 ∂E = −kB β CV = ∂T V ∂β V
(7.62)
(7.63)
und erhalten als allgemeinen Ausdruck CV = kB
∞ 0
eβ h¯ ω (β h¯ ω)2 σ (ω)dω (eβ h¯ ω − 1)2
(7.64)
Unabhängig von der aktuellen Gestalt von σ (ω) kann man allgemeine Aussgen im Grenzfall hoher Temperaturen machen. Wir werden unten sehen, dass es eine maximale Frequenz ωmax gibt, für die gilt, dass σ (ω) = 0 für ω > ωmax . Wenn wir eine hinreichend hohe Temperatur betrachten, bei der kB T h¯ ωmax , dann können wir im ganzen Integrationsbereich von Gl. (7.64) die Exponentialfunktion entwickeln und nach dem linearen Glied abbrechen. Damit erhalten wir CV = kB
∞ 0
σ (ω)dω
(7.65)
7.4 Gitterschwingungen
235
Weil das Integral in diesem Ausdruck aber gerade gleich der Teilchenzahl 3N ist, also ∞ 0
σ (ω)dω = 3N
(7.66)
erhalten wir das Dulong-Petitsche Gesetz, womit das vorliegende Modell eine wichtige Randbedingung erfüllt: CV = 3NkB (7.67)
7.4.3 Debye-Approximation σ (ω ) echte Kurve
DebyeNäherung
0
ωD
ω
Abbildung 7.3: Debye-Modell des Festkörpers: Aufgezeichnet ist eine typische realistische Mode-Dichte σ (ω) (hier von Kupfer) und die schematische Debye-Approximation mit maximaler Frequenz ωD gegeben durch den Gitterabstand. Die maximale Frequenz der realistischen Mode-Dichte liegt bei 4.5 × 1013 Radian sec−1 .
Die oben berechneten Moden entsprechen Schallwellen oder stehenden Wellen des Festkörpers. Jede hat eine gewisse Wellenlänge, die durch eine (zunächst unbekannte) Dispersionsrelation gegeben ist, also ω = ω(k) und k = 2π/λ . Die Debye-Approximation besteht darin, dass man für große Wellenlängen (λ a mit a gleich mittlerer Abstand der Gitteratome) annimmt, der Festkörper reagiere wie ein elastisches Kontinuum. Für kleine Wellenlängen dagegen ist die Wellenlänge beschränkt durch den Gitterabstand (λ ≈ a). Daher gibt es eine obere Grenzfrequenz ωD , siehe Abb. (7.4). In der Tat zeigen Festkörper auch keine Gitterschwingungen mit kleineren Wellenlängen. Wenn man ernst macht mit der Vorstellung eines elastischen Kontinuums, dann kann man die Schallwellen auch approximieren durch (0) ψα (r,t) = ψα ei(k·r−ωt) mit ω = cs |k|
Dabei ist cs die als konstant angenommene Schallgeschwindigkeit, wobei wir zwischen der longitudinalen (α = 1, parallel zum Wellenvektork) und den zwei transversalen (α = 2, 3, senkrecht
236
7 Anwendungen der Quantenstatistik
Abbildung 7.4: Schwingungen eines Festkörpers schematisch. Aufgetragen ist für einen speziellen kollektiven Schwingungszustand die Amplitude der elementaren Freiheitsgrade gegenüber ihrem Abstand. Oben: Normale übliche Schwingung mit großer Wellenlänge. Unten: Wellenlänge ist beschränkt durch die Gitterkonstante.
zu k) Schwingungen der Einfachheit halber nicht unterscheiden wollen. Mit Gl. (7.1) erhalten wir dann 3V σD (ω)dω = 4πk2 dk für ω < ωD (2π)3 Hierbei erhält man den Faktor 3 aus den drei erwähnten Polarisationsrichtungen. Umgeformt gibt dies 3V für ω < ωD (7.68) σD (ω) = 2 3 ω 2 2π cs und σD (ω) = 0
fuer ω > ωD
Die Bestimmung von ωD folgt nach Gl. (7.66): ωD 0
σD (ω)dω = 3N
Wenn wir völlig freie, unabhängige ebene Wellen annehmen, die nur der Dispersion unterliegen, dann können wir weiter rechnen 3V 2π 3 c3s
ωD 0
ω 2 dω = 3N
woraus die Debye-Frequenz folgt Debye-Frequenz:
ωD = cs (6π 2
N 1 )3 V
(7.69)
7.4 Gitterschwingungen
237
Die Debye-Grenzfrequenz ist also abhängig von der Schallgeschwindigkeit cs und der Dichte ρ = N/V . 1
Typische Zahlenwerte sind cs ≈ 5km/s und damit λD = ωD /cs ≈ a ≈ (V /N) 3 ≈ 10−8 cm oder ωD ≈ 1014 s−1 . Die Frequenzen ω < ωD der Gittershwingungen liegen also im infraroten Bereich und darunter. Die Berechnung von CV kann nun durchgeführt werden: ωD
eβ h¯ ω (β h¯ ω)2 σD (ω)dω (eβ h¯ ω − 1)2 0 ΘD ) CV = 3NkB fD ( T CV = k
mit fD (x) =
3 x3
x 0
ey y4 dy (ey − 1)2
(7.70)
Wobei die Debye-Temperatur ΘD gegeben ist durch Gl. (7.69) und kB ΘD = h¯ ωD Grenzfall: T ΘD : Wir haben das Integral in Gl. (7.70) zu betrachten bei x 1. Weil 0 ≤ y ≤ x, können wir die Exponentialfunktionen entwickeln und die führenden Terme mitnehmen. Das ergibt f(
ΘD 3 )→ 3 T x
x 0
y2 dy = 1
und wir haben für CV den korrekten klassischen Limes nach dem Dulong-Petite Gesetz. Grenzfall: T ΘD : Bei kleinen Temperaturen gilt exp(−β h¯ ω) 1 und es sind die Zustände höherer Frequenzen wenig angeregt. Der Integrand ist nur für kleine Werte von ω merklich von null verschieden. Daher kann man das Integral (7.70) von ω = 0 bis ω = ωD durch das Integral von ω = 0 bis ω = ∞ approximieren: ΘD )≈ fD ( T
T ΘD
3
Θ →∞ T
0
ey y4 dy (ey − 1)2
Wir betrachten also das Integral (7.70) für x → ∞. Mit Hilfe partieller Integration können wir schreiben ∞ ∞ −1 4 ∞ ey −1 4 y dy = − y 4y3 dy y 2 y y e −1 0 (e − 1) 0 e −1 0 Das Integral auf der RHS kennen wir von Gl. (7.10) und wir erhalten fD (
ΘD 4π 4 )= T 5
T ΘD
3
238
7 Anwendungen der Quantenstatistik
Dadurch erhalten wir die folgende charakteristische Temperaturabhängigkeit ∼ T 3 der spezifischen Wärme der Gitterschwingungen bei kleinen Temperaturen: Debye-T3 -Gesetz:
CV =
12 NkB 5
CV =
2π 2 V kB 5
kB T ΘD
3 (7.71)
oder umgeformt nach Gl. (7.69) zu Debye-T3 -Gesetz:
kB T cs h¯
3 (7.72)
Die Temperaturabhängigkeit ist bei kleinen Temperaturen also sehr verschieden vom EinsteinModell. In der Praxis hat sich das Debye-Modell bewährt und ist dem Einstein-Modell vorzuziehen. Siehe Tabelle mit experimentellen Werten [Kit56], bei denen ΘD aus der Messung der spezifischen Wärme mit dem Wert aus der Messung elastischer Konstanten verglichen wird. Es ist eine gute Übereinstimmung festzustellen, die die Gültigkeit des Debye-Modells unterstützt. Festkörper
ΘD von spezifischer Wärme
ΘD von elastischen Koeffizienten
NaCl KCl Ag Zn
308K 230K 225K 308K
320K 246K 216K 305K
Wir verweisen aber darauf, dass ggf. eine vollständige Berechnung der spezifischen Wärme noch die der Leitungselektronen Gl. (7.100) aus Kap. 7.6 erfordert. Damit bekommen wir insgesamt für Leiter CV CV = αT 3 + γT bzw. (7.73) = αT 2 + γ T Wenn man experimentelle Werte von CV /T gegen T 2 aufträgt, erhält man für viele Leiter bei niedrigen Temperaturen eine Gerade, aus deren Steigung und Schnittpunkt mit der Ordinate man die Materialkonstanten α und γ ablesen kann.
7.5 Bose-Einstein-Kondensation Im Jahre 1924 schickte der indische Physiker Satyenda Nath Bose an Albert Einstein ein Manuskript, in dem er die Plancksche Formel für die Schwarzkörperstrahlung ableitete, wobei er die Photonen als ein Gas identischer Teilchen behandelte. Einstein generalisierte Boses Theorie zu einem idealen Gas identischer Atome oder Moleküle, für die die Teilchenzahl eine erhaltene Größe darstellt. Er sagte voraus, dass bei hinreichend kleinen Temperaturen die Teilchen sich vornehmlich im niedrigsten Quantenzustand ansammeln und dort eingeschlossen sein würden. Wir wissen heute, dass dieses Phänomen, Bose-Einstein-Kondensation (BEC) genannt, beschrieben wird durch die Quantenstatistik eines bosonischen Vielteilchensystems. Die BEC
7.5 Bose-Einstein-Kondensation
239
tritt bereits für ein ideales Gas im freien Raum auf und ist dadurch charakterisiert, dass bei Unterschreiten einer kritischen Phasenraumdichte ein makroskopischer Anteil des Ensembles den Grundzustand besetzt. Anschaulich setzt BEC ein, wenn der mittlere Abstand der Teilchen kleiner als ihre DeBroglie-Wellenlänge bzw. ihre thermische Wellenlänge wird. Im Jahre 1995 wurde ein solches Kondensat experimentell hergestellt. Obwohl die Teilchenzahl im Experiment endlich war und die Atome auch noch eine residuelle Wechselwirkung zeigten, konnten die wesentlichen Teile der Theorie verifiziert werden. Im Folgenden diskutieren wir die Theorie des idealen bosonischen Quantengases mit fester Teilchenzahl und behandeln den Formalismus der zum Bose-Einstein-Kondensat bei kleinen Temperaturen führt19 . Anschließend diskutieren wir die relevanten Experimente und die entsprechenden heutigen Fragestellungen. Der gesamte Formalismus geht aus von den folgenden Formeln für ein nichtrelativistisches und wechselwirkungsfreies Bosonengas εp =
p2 2m
1 eβ (ε p −μ) − 1
n¯ p =
Für die mittlere Energie und Teilchenzahl haben wir unter Verwendung eines großkanonischen Ensembles N = N(T,V, μ) = ∑ n¯ p E(T,V, μ) = ∑ ε p n¯ p p
p
7.5.1 Berechnung des chemischen Potenzials Wir wissen nach Gl. (6.17), dass für das chemische Potenzial gilt μ ≤0
(7.74)
Man kann aber noch weitere Eigenschaften von μ zeigen, die auf das Bose-Einstein-Kondensat führen. Behauptung: Das chemische Potenzial μ verschwindet im Bereich von T = 0 bis zu einer kritischen endlichen Temperatur Tc und fällt dann monoton mit steigender Temperatur zu negativen Werten ab, siehe Abb. (7.5). Beweis: Die Normierung ist gegeben durch die Teilchenzahl N = ∑ n¯ p = ∑ p
p
1 x−1 p −1
mit x p = e−β (ε p −μ)
∞ ∞ xp =∑ = ∑ ∑ x p · xnp = ∑ ∑ xnp 1 − xp p p n=0 p n=1
oder
∞
N = ∑ ∑ eβ μn e−β ε p n p n=1
19 Wir
folgen hier den üblichen Darstellungen von Landau [Lan87], Huang [Hua87], Schwabl [Sch06] und insbesondere der ausführlichen Ausarbeitung von Fließbach [Fli99].
240
7 Anwendungen der Quantenstatistik
μ
0 Tc
T
Abbildung 7.5: Bose-Einstein-Kondensation: Das Verhalten des thermochemischen Potenzials μ in Abhängigkeit von der Temperatur T in der Nähe der Phasenübergangstemperatur Tc . Für T ≤ Tc ist μ = 0. Für T → ∞ strebt μ → −∞.
Anstatt die Summe zu betrachten, geht man mit Gl. (7.1) zum Integral über20 V
∑ . . . = (2π h¯ )3
d3 p . . .
(7.75)
p
mit dem Resultat N=
∞ V eβ μn ∑ 3 (2π h¯ ) n=1
2
d 3 pe
p n − 2mk T B
(7.76)
Wir haben für n = 1 den bekannten Fall 1 (2π h¯ )3
2
p − 2mk BT
d3 p e
=
1 λ3
mit der thermischen Wellenlänge von Gl. (5.2) λ = λ (T ) = √
2π h¯ 2πmkB T
(7.77)
Für n > 1 machen wir die Substitution p2 n = p2 und d 3 p = n−3/2 d 3 p , woraus folgt21 : 1 (2π h¯ )3
2
p − 2mk n BT
d3 p e
=
1 3
λ 3n 2
werden später sehen, dass dieser Übergang nicht unproblematisch ist, weil der Zustand bei dem Impuls p = 0 nicht richtig berücksichtigt wird. Zunächst ignorieren wir dieses Problem und werden es bei gegebenem Zeitpunkt entsprechend korrigieren. 21 An dieser Stelle geht die Drei-Dimensionalität des Raumes ein durch d 3 p = n−3/2 d 3 p . Hätten wir einen zweidimensionalen Raum, dann wäre d 2 p = n−1 d 2 p . Wir werden später sehen, dass sich in diesem Fall kein BoseEinstein-Kondensat ausbildet. 20 Wir
7.5 Bose-Einstein-Kondensation
241
womit wir erhalten N(T,V, μ) =
V ∞ − 3 β μn ∑ n 2e λ 3 n=1
(7.78)
Wähle nun μ so, dass N(T,V, μ) gleich der vorgegebenen Teilchenzahl N ist, dann ist μ festgelegt. V /N ∞ − 3 β μn (7.79) 1= ∑ n 2e λ (T )3 n=1 Grenzwertbetrachtung: Für T → ∞ erhalten wir für den Faktor vor der Summe die Abschätzung V V 1 = 3 Nλ N
√
2πmkB T 2π h¯
3 →∞
Damit die linke Seite der obigen Gleichung (7.79) trotzdem gleich Eins ist, muss dieser anwachsende Grenzwert durch die abfallende Exponentialfunktion kompensiert werden. Das heißt, für μ muss gelten (weil β und n endlich sind) Für T → ∞
=⇒
μ → −∞
Für T → 0 erhalten wir für den Faktor V V 1 = 3 Nλ N
√
2πmkB T 2π h¯
3 →0
Damit weiterhin die linke Seite von Gl. (7.79) bei wachsendem β gleich Eins ist, muss diesmal für μ gelten: μ ≥0 Da aber nach Gl. (7.74) der Fall μ > 0 ausgeschlossen ist, ergibt sich damit Für T → 0
=⇒ μ = 0
Das war zu beweisen. q.e.d. Das Verhalten von μ, wie es Abb. (7.5) darstellt, ist also geklärt.
7.5.2 Phasenübergang Betrachte nun den Übergang von großen T zu kleinen T . Hierbei gibt es eine kritische Temperatur Tc , an der und unterhalb derer das μ = 0 ist. Die Frage ist, ob dieses Tc endlich oder null ist. Für Tc mit λ (Tc ) = λc und Gl. (7.79) und μ = 0 gilt: 1=
V /N ∞ − 3 ∑ n 2, λc3 n=1
oder anders geschrieben haben wir an T = Tc : λc3
N 3 = ζ( ) V 2
(7.80)
242
7 Anwendungen der Quantenstatistik
Dabei benutzt man die Riemansche Zeta-Funktion ζ (x) von Gl. (6.19). Für x = 1 divergiert die Zeta-Funktion. Ansonsten ist sie immer von der Größenordnung Eins, was man an denen am Ende von Kap. 6.2.2 angegebenen Werten sieht. Aus der Definition von λ in Gl. (7.77) und dem Ausdruck (7.80) erhält man die kritische Temperatur (Übergangstemperatur) Tc zu 2π h¯ 2 kB Tc = 2 ζ ( 32 ) 3 m
2 N 3 V
mit
3 ζ ( ) ≈ 2.612 2
(7.81)
Hieraus ergibt sich eine Interpretation der kritischen Temperatur22 : Offenbar ist nach Gl. (7.80) 1 λc ∼ (V /N) 3 ∼ d, was der mittlere Abstand der Teilchen ist. Gleichzeitig ist die thermische Wellenlänge immer etwa gleich der DeBroglie-Wellenlänge der Teilchen im Gas23 . Also ist die kritische Temperatur Tc dadurch ausgezeichnet, dass der mittlere Abstand der Teilchen des BoseGases etwa gleich der DeBroglie-Wellenlänge der Teilchen ist. Das ist ein exemplarischer Fall, bei dem Quantenstatistik notwendig ist. Aus Gl. (7.81) kann man sofort entnehmen, dass die kritische Temperatur mit zunehmender Teilchendichte des Systems wächst. Jetzt ergibt sich aber ein innerer Widerspruch des gegenwärtigen Formalismus. Für alle T < Tc gelten zwei Tatsachen gleichzeitig: Einmal haben wir μ = 0. Für diesen Fall gilt natürlich die Gl. (7.79) und damit: V /N ∞ − 3 (7.82) 1= ∑n 2 λ (T )3 n=1 Weiterhin gilt mit Gl. (7.77) für T < Tc auch λ (T ) > λ (Tc ). Das soll alles durch die Gleichung (7.82) beschrieben werden. Diese Gleichung ist für T = Tc erfüllt, dann kann sie für T < Tc wegen λ (T ) > λ (Tc ) nicht mehr erfüllt sein. Das liegt daran, dass μ für alle T < Tc , also in einem endlichen Intervall, verschwindet. Damit ergibt sich zunächst, dass ein normales Bose-Gas nicht unterhalb der Temperatur Tc vorliegen kann. Das kann nicht die ganze Wahrheit sein, denn es müssen sich auch für T < Tc die Teilchen über die vorhandenen Niveaus verteilen. Der Grund für dieses Problem liegt in der unzulänglichen Behandlung des niedrigsten Niveaus bei ε p = 0 bzw. p = 0 im Übergang von der Summe zum Integral in Gl. (7.75), wie wir jetzt sehen werden. Bei T → 0 müssen die Teilchen mehr und mehr den Grundzustand des Systems besetzen. Durch den Volumenfaktor p2 d p wird das jedoch unterbunden: Wie wir oben gesehen haben, gilt für die niedrigen Temperaturen T < Tc immer μ = 0 und dann n¯ p =
1 eβ (ε p −μ) − 1
1 2m 1 = = 2 kB T 1 + β (ε p − μ) − 1 β (ε p − μ) p
was in der Integration n¯ p d 3 p ∝ n¯ p p2 d p proportional wird zu d p = Δp. Eine infinitesimale Umgebung von p = 0 liefert damit einen infinitesimalen Beitrag zur Teilchenzahl. So kann also niemals eine endliche Besetzung des Niveaus bei ε p = 0 beschrieben werden, obwohl diese real 2
p Übergangstemperatur ist endlich. Für einen zwei-dimensionalen Raum und ε p = 2m stünde ζ (1) im Nenner der Gleichung Gl. (7.81) von Tc . Es divergiert jedoch ζ (1) und damit wird dann Tc = 0. Im zwei-dimensionalen Fall gibt es also keine Bose-Einstein-Kondensation. 2π 1/2 23 Vergleiche mit der DeBroglie-Wellenlänge: λ ∼ 1.4. deBr /λtherm = 3 22 Diese
7.5 Bose-Einstein-Kondensation
243
vorliegen muss. Wir müssen also so vorgehen, dass wir den Beitrag des niedrigsten Niveaus zur mittleren Teilchenzahl explizit zählen, weil er im Integral nicht vorkommt. Also schreiben wir N = ∑ n¯ p = n¯0 + p
V (2π h¯ )3
oder für T < Tc :
N = N0 +
d 3 pn¯ p
V ∞ − 3 β μn ∑ n 2e . λ 3 n=1
(7.83)
Dies gilt nur für T < Tc . Für T > Tc gelten nach wie vor die obigen Formeln (7.78) und die Bedingung λ (T ) < λ (Tc ). Jetzt spielt der Grundzustand keine Sonderrolle mehr und kann bei der großen Zahl der vielen anderen Niveaus weggelassen werden, wie es automatisch beim Übergang zum Integral geschieht. Um den Formalismus zu vereinfachen, studieren wir ein unendlich ausgedehntes System mit unendlicher Teilchenzahl. Um dies in realistischer Weise zu tun, betrachten wir den thermodynamischen Limes, bei dem V → ∞ und N → ∞, aber mit der Nebenbedingung, dass V /N = const bei diesen Grenzprozessen: thermodyn. Limes:
N→∞
V →∞
mit
V = const. N
(7.84)
In diesem Limes ist die Energie des untersten Niveaus gleich null, ε0 = 0, und das chemische Potenzial ist nach wie vor für T < Tc ebenfalls gleich null. Wir können jetzt die Besetzung des niedrigsten Niveaus ausrechnen: Nach Gl. (7.83) haben wir N = N0 +
V ∞ −3 V 3 ∑ n 2 = N0 + λ 3 ζ ( 2 ), λ 3 n=1
für T < Tc
für den zweiten Term können wir schreiben mit Gl. (7.80) 3/2 3/2 T T λc3 V V 3 3 3 V ) = ) = ) = N ζ ( ζ ( ζ ( . λ3 2 λ 3 λc3 2 Tc λc3 2 Tc Damit liegt die Temperaturabhängigkeit von N0 (T ) fest: 3/2 N0 (T ) T für T < Tc = 1− N Tc N0 (T ) 1 = Ordnung( ) ∼ 0 N N
(7.85)
(7.86)
für T > Tc
Wenn man sich also dem Tc von oben her nähert, dann führt man einen Phasenübergang durch und besetzt bei T = Tc schlagartig das unterste Niveau mit einer makroskopisch großen Teilchenzahl. Diese ist ein großer Bruchteil der gesamten Teilchenzahl. Je näher man sich T = 0 nähert, umso mehr Teilchen sammeln sich im niedrigsten Niveau, bis nahezu alle Teilchen dort zu finden sind. Der Verlauf ist in Abb. (7.6) zu sehen. Bei und unterhalb der kritischen Temperatur haben wir eine einzige makroskopisch große symmetrisierte Wellenfunktion für eine makroskopische Anzahl von Teilchen. Dieser Zustand wird
244
7 Anwendungen der Quantenstatistik
n¯ p n¯ 0
εp
0
Abbildung 7.6: Bose-Einstein-Kondensation: Die Besetzungszahl der Niveaus ist schematisch aufgezeichnet. Für T < Tc haben wir eine Füllung des tiefsten Niveaus mit einer makroskopisch großen Teilchenzahl, die der Gesamtteilchenzahl vergleichbar ist. Die höheren Niveaus sind nach dem üblichen Schema schwach gefüllt.
als Bose-Einstein-Kondensat bezeichnet. Der Effekt wurde 1924 von Bose und Einstein vorausgesagt. Die Bezeichnung Kondensat rührt daher, dass die kondensierten Teilchen anschließend nicht mehr ein Gas bilden und deshalb nicht zum Druck beitragen, wie im folgenden Unterkapitel bewiesen wird. Der Effekt beruht auf der Tatsache, dass bei der kritischen Temperatur die DeBroglie-Wellenlänge etwa gleich dem mittleren Abstand der Teilchen des Gases wird. Bei flüssigem He4 mit einem N/V = 2 · 1022 cm−3 erhält man ein Tc = 3.13K. In der Praxis müssen jedoch wesentlich tiefere Temperaturen erzeugt werden, um ein Bose-Einstein-Kondensat zu bekommen, siehe Kapitel (7.5.4). N0 (T ) N
1,0
0,5
0,0
Tc
T
Abbildung 7.7: Bose-Einstein-Kondensation: Relative Besetzung N0 (T )/N des niedrigsten Niveaus in Abhängigkeit von der Temperatur T des kondensierenden Systems.
7.5 Bose-Einstein-Kondensation
245
7.5.3 Eigenschaften des kondensierten Bose-Gases In diesem Kapitel berechnen wir die Energie und die spezifische Wärme (Wärmekapazität) des idealen Bose-Gases in der Nähe der kritischen Temperatur. Analog zur Berechnung der Teilchenzahl (7.78) erhalten wir E = ∑ ε p n¯ p =
∞ V eβ μn ∑ 3 (2π h¯ ) n=1
Dies kann man einfach umformen zu E=
∞ V (−1) ∂ eβ μn ∑ 3 (2π h¯ ) n=1 β ∂n
d3 p
p2 n p2 − 2mk BT e 2m
2
p n − 2mk T
d 3 pe
B
Wie in Gl. (7.76) können wir feststellen, dass das Integral einschließlich des Vorfaktors 1/(2π h¯ )3 gleich ist zu 1/(λ 3 n3/2 ). Die Ableitung nach n ergibt dann −(3/2)/(λ 3 n5/2 ) und so erhalten wir E(T,V, μ) =
3kB TV 2λ 3
∞
exp(β μn) n5/2 n=1
∑
(7.87)
Dies gilt auch für T < Tc , denn der Zusatzterm N0 ε0 vom niedrigsten Niveau verschwindet24 im Fall V → ∞ wegen ε0 = 0. Um dieses Resultat interpretieren zu können, schreiben wir es für die beiden Temperaturbereiche um. Für T < Tc erhalten wir mit Gl. (7.85) und mit μ = 0 sofort aus Gl. (7.87) 3/2 3ζ ( 52 ) 3kB TV ∞ 1 T E= für T < Tc ∑ n5/2 = 2ζ ( 3 ) NkB T Tc 2λ 3 n=1 2 3/2 Diese Gleichung erlaubt die Interpretation, dass die N TTc nichtkondensierten Teilchen je-
weils einen Beitrag der Größenordnung ∼ kB T zur Energie liefern [die ζ -Funktionen sind von der Größenordnung Eins], die kondensierten Teilchen jedoch zur Energie nicht beitragen. Für T > Tc gelten für die Energie die Gl. (7.87) und für die Normierung (Teilchenzahl) die Gl. (7.82), wodurch wir erhalten 3kB TV E = N 2λ 3 N
∞
exp(β μn) n5/2 n=1
∑
1=
1 V ∞ − 3 β μn ∑ n 2e λ (T )3 N n=1
für T > Tc
(7.88)
Man muss jetzt zur Beendigung der Rechnung aus der 2. Gl. das μ extrahieren und in die 1. Gl. einsetzen. Das ist im Allgemeinen nur numerisch möglich. Einen qualitativen Eindruck erhalten wir aber, wenn wir dieses näherungsweise machen, indem wir die Reihen über n nach dem Glied mit n = 2 abbrechen25 . Das ergibt: 3NkB T ζ (3/2) Tc 3/2 1 λ3 3NkB T für T > Tc E= 1 − 5/2 1 − 5/2 = 2 2 T 2 V /N 2 hier muss man zuerst den thermodynamischen Limes bilden, der ε0 = 0 zur Folge hat, und anschließend den Limes T → 0 durchführen. Die Limites vertauschen nicht. 25 Da exp(β μ) = z die Fugazität ist, sehen wir, dass die Reihen in Gl. (7.88) Potenzreihen in z entsprechen. Für verdünnte Systeme haben wir das Abbrechen in Kap. 5.5 bereits diskutiert. In der Tat ist im gegenwärtigen Fall z 1, wenn wir hinreichend nahe an Tc sind, dieses klein ist, und μ → 0 geht. 24 Achtung,
246
7 Anwendungen der Quantenstatistik
Daraus berechnen wir die spezifische Wärme pro Teilchen. Für T < Tc erhalten wir 15 ζ (5/2) T 3/2 für T < Tc CV (T ) = kB 4 ζ (3/2) Tc und für T > Tc folgt
3 ζ (3/2) Tc 3/2 CV (T ) = kB 1 + 7/2 2 T 2
für T > Tc
Weil wir genähert haben, sind beide Ausdrücke an T = Tc nicht gleich, sondern unterscheiden sich um etwa 10%. Die Funktion CV (T ) wächst zwischen T = 0 und T = Tc von null auf 1.93kB . Bei hohen Temperaturen hat CV den klassischen Wert 1.5kB . Bei Temperaturerniedrigung steigt CV (T ) an und erreicht am kritischen Punkt den Wert 1.85kB , wenn man die obigen Näherungsformeln verwendet. Eine korrekte Rechnung ergibt für beide Grenzwerte T → Tc den Wert 1.93kB . Wir erhalten also für die spezifische Wärme pro Teilchen am kritischen Punkt: CV (Tc ) =
15 ζ (5/2) kB 4 ζ (3/2)
Die Kurve CV (T ) ist stetig, hat jedoch an T = Tc einen Knick. Siehe Abb. (7.8). Cv
3 2 kB
0
Tc
T
Abbildung 7.8: Bose-Einstein-Kondensation: Spezifische Wärme pro Teilchen CV in Abhängigkeit von der Temperatur in der Nähe des Phasenübergangs. An T = Tc ist CV = 1.93kB .
Den Druck kann man leicht berechnen, wir wissen von Gl. (6.43): P=
2E 3V
für ε p ∝ p2
Dadurch erhalten wir hier
2 E(T,V, N) 3 V Das bedeutet: Die kondensierten Teilchen tragen weder zur Energie noch zum Druck bei, weil bei ihnen ε0 = 0 ist und somit ihr Beitrag zu E und P verschwindet.. P(T,V, N) =
7.5 Bose-Einstein-Kondensation
247
7.5.4 Experimente: Ultrakalte Quantengase In diesem Kapitel wollen wir die Entdeckung, Untersuchung und Weiterentwicklung des BoseEinstein-Kondensats (BEC) diskutieren. Entdeckt wurde es in den USA 1995 von den Amerikanern Eric A. Cornell (Nat. Inst. of Standards and Technology) und Carl E. Wieman (University of Colorado at Boulder) und dem Deutschen Wolfgang Ketterle (MIT), und sie erhielten dafür 2001 den Nobelpreis, siehe Refs.[A+ 95] und [D+ 95]. Dies war der vorläufige Höhepunkt einer jahrelangen Entwicklung verbesserter Kühlmethoden bis hinunter zum Nano-Kelvin-Bereich. Seit dieser Zeit hat sich das Feld explosiv entwickelt und ist heute eines der vielversprechendsten Gebiete, das sich über Vortizes, Solitonen bis hin zu Atomlasern und Atomen in Lichtgittern mit Fermion-Boson-Übergängen erstreckt. Die Ähnlichkeit der BEC mit anderen makroskopischen Quantenphänomenen in der kondensierten Materie (Suprafluidität, Supraleitung etc.) und die Zuversicht, zu deren Verständnis beizutragen, hat noch weiter das Interesse verstärkt. Im Prinzip ist es klar, wie ein BEC hergestellt wird: Man nehme ein atomares Gas und kühle es bis unter die kritische Temperatur Tc , siehe Gl. (7.81). Wenn es hinreichend dicht ist, überlappen sich die Wellenpakete der einzelnen Teilchen und die Kondensation tritt ein. Allerdings wird auf diesem Wege in den meisten Fällen das Gas seine Phase ändern und in eine Flüssigkeit oder in einen Festkörper übergehen, die aufgrund der dann vorliegenden Wechselwirkung zwischen den Atomen kein Kondensat mehr zeigen. Für Dichten von etwa 1014 Teilchen/cm3 , bei denen die derzeit untersuchten Natrium-, Rubidium-, Lithium- und Wasserstoff-Ensemble noch gasförmig sind, sind Temperaturen von weniger als 1μK notwendig. Ein solch verdünntes Gas zeigt wenige inelastische Dreikörper-Stöße. Damit werden die Prozesse vermieden, bei denen die Moleküle aneinander haften und den erwähnten Phasenübergang in die Flüssigkeit durchführen. Auf der anderen Seite benötigt man elastische Zweikörperstöße, um eine thermische Equilibrierung des Gases zu erreichen, wie wir gleich noch sehen werden. Man kann es in der Tat so einrichten, dass beim Abkühlen die BEC stattfindet, bevor der Phasenübergang zur Flüssigkeit stattfindet. Beim Einsetzen der Kondensation ist das Ensemble keineswegs so kalt, dass lediglich wenige der untersten Energiezustände bevölkert wären, sondern es sind üblicherweise noch viele Hundert höhere Energieniveaus besetzt. Für merkliche Kondensation sind dann in der Tat Temperaturen von μK bzw. nK gefordert, also viel geringer als die kritische Temperatur Tc . Die Geschichte der Herstellung des BEC ist somit eng verknüpft mit der Entwicklung moderner Kühlungstechniken. Die Experimente verwenden zunächst Laserkühlung, die erlaubt, Temperaturen bis hinunter zu etwa 100 μK zu erhalten. Weitere Kühlung erreicht man, indem man die Atome in eine magnetische Falle bringt. Eine solche hat keine materiellen Wände, an denen die Atome haften würden, sondern besteht aus einem geeignet geformten Magnetfeld (etwa 1000-fach stärker als das Erdmagnetfeld), dessen Betrag in alle Raumrichtungen quadratisch zunimmt und so einen Potenzialtopf bildet. Je nach Spinstellung der Atome werden diese wegen ihres magnetischen parallel) und entschwinden daMomentes von den Wänden des Topfes angezogen (μmag und H antiparallel) und mit aus dem zu untersuchenden Gas, oder sie werden abgestoßen (μmag und H damit im Topf festgehalten. Das Letzte ist nicht ganz einfach, denn die Geometrie der Magnetfelder ist so geartet, dass sich am Boden des Potenzialtopfes ein Loch befindet, durch das die Atome entkommen können. Es wurden jedoch raffinierte Techniken entwickelt, dieses Loch zu schließen. Nachdem die Atome in der Falle gefangen sind, verwendet man evaporative Kühlung, um die gesuchten tiefen Temperaturen zu erreichen. Bei diesem Verfahren werden die Wände des
248
7 Anwendungen der Quantenstatistik
Potenzials sukzessive erniedrigt, so dass die schnelleren Atome die Atomwolke verlassen können und damit Energie nach draußen dissipieren. Zwar ist der Teilchenverlust insgesamt hoch (mehr als 90%), dafür können weit tiefere Temperaturen bei gleichzeitig hohen Dichten erzielt werden, so dass die Phasenraumdichte um mehrere Größenordnungen steigt. Die in der Falle verbliebenen Atome thermalisieren durch die erwähnten elastische Zweierstöße und reduzieren damit die Temperatur des Gases. Auf diese Weise werden Temperaturen von 2μK bis 500nK bei einer Dichte von 1013 bis 1014 Atomen pro cm3 erreicht, was zur Kondensation führt. Derzeit werden Alkali-Kondensate mit bis zu 107 Atomen auf diese Art erzeugt, die je nach Fallengeometrie Abmessungen im Bereich von etwa 100 μm haben. Der komplette Kühlvorgang dauerte je nach Apparatur einige Sekunden bis einige Minuten. Das Kondensat wird nachgewiesen durch plötzliches Abschalten der Magnetfalle, wodurch die Atomwolke durch die Schwerkraft nach unten fällt. Dabei expandiert die Atomwolke aufgrund der Impulsverteilung seiner Atome. Währenddessen wird resonantes Laserlicht eingestrahlt, das teilweise von der Atomwolke absorbiert wird und dessen Intensitätsverteilung nach Durchgang durch die Wolke mit einer CCD-Kamera vermessen wird. Aus der somit erhaltenen Kenntnis der Ortsverteilung wird die Impulsverteilung der Atomwolke ermittelt und damit deren Temperatur. Wenn man die Wände des Potenzials der Magnetfalle sukzessive erniedrigt und damit die Temperatur der Atomwolke systemtisch verringert, bildet sich in der Mitte der Atomwolke ein Peak heraus, dessen Höhe und Breite die Anzahl der im niedrigsten Zustand des Systems angesiedelten Atome angibt. Dieser Peak zeichnet sich deutlich vom Rest der Atomwolke ab, weil er eine vergleichsweise geringe Dispersion aufweist. Dies wird erklärt durch die Tatsache, dass sich die Atome im Idalfall alle im p = 0 Zustand befinden, was Kondensation bedeutet. In der Praxis halten sich die Atome des Peaks im Zustand niedrigster Energie auf, der am Grund der Falle liegt und mit den Ausmaßen der Falle und der Heisenberg’schen Unschärferelation verträglich ist. Das Vorhandensein dieses Peaks und sein Wachsen bei Erniedrigung der Temperatur gibt damit die Existenz des Bose-Einstein Kondensats an. Das gesamte Bose-Einstein-Kondensat wird durch eine makroskopische Wellenfunktion beschrieben. Dass das so ist, kann man durch Interferenzexperimente nachweisen. Dazu erzeugt man im magnetischen Potenzialtopf künstlich ”Löcher”, indem man an einer oder zwei Stellen mit genau kalibrierter HF-Strahlung einstrahlt, die die Spins der getroffenen Atome umklappen lässt, so dass sie die Wände der Falle als anziehendes Potenzial empfinden. Durch diese Löcher ”tropft” dann der Schwerkraft folgend das Kondensat heraus. In einer anderen Anordnung trennt man das Kondensat durch den Laser in zwei Unterkondensate, die man dann nach Abschalten der Magnetfalle frei fallen lässt. Weil beide ”Tropfen” aus dem gleichen Kondensat stammen, erwartet man eine langreichweitige räumliche Kohärenz, die zu Interferenzerscheinungen führen sollte. Diese wurden in der Tat beobachtet (Abstand der Interferenzstreifen etwa 15μm), auch in Abhängigkeit vom Abstand der Tropfen, und bestätigten das Bild einer einzigen makroskopischen Wellenfunktion für die vielen kondensierten Atome. Es sind heute Techniken in der Entwicklung, die Entkopplung des BEC aus der Magnetfalle nicht tropfenweise, sondern kontinuierlich durchzuführen, um so einen Strahl kohärenter Atome zu konstruieren, der das Analogon zu einem Laserstrahl kohärenter Photonen darstellt. Es wird auch an Methoden gearbeitet, das BEC kontinuierlich zu füllen. Gelingt dies, so hätte man in der Tat einen Materie-Laser. Die jüngsten Entwicklungen bei BEC werden u.a. dadurch geprägt, dass es möglich ist, die inneren Freiheitsgrade (elektronische Anregungen) und die äußeren Freiheitsgrade (Schwerpunkts-
7.5 Bose-Einstein-Kondensation
249
bewegungen der Atome) gezielt durch äußere Felder zu beeinflussen und dabei die Kondensatwellenfunktion zu verändern. Bei Ausdehnungen des BEC bis zu einigen Hundert μm ist es möglich, mit einem auf wenige μm fokussierten Laserstrahl lediglich lokal auf die quantenmechanische Kondensatwellenfunktion einzuwirken − eine in dieser Form seltene Option in der Physik. Dadurch ist es z.B. möglich, Dichtewellen im Kondensat anzuregen oder einen fokussierten Laserstrahl als ”Rührstab” durch das Kondensat zu bewegen. Damit ergibt sich die erstmalige Präparation von vielfach besetzten, räumlich makroskopischen Quantenzuständen der Materie. Von besonderem Interesse ist dabei das Studium sog. Vortizes (engl. für Wirbel) [Sen01]. Rührt man eine normale Flüssigkeit, so ergibt sich das Geschwindigkeitsfeld eines starren Körpers oder man erhält eine um ein Zentrum orientierte differentielle Rotation. Bei dem BEC erhält man mit wachsender Rührgeschwindigkeit viele (bis zu etwa 100) einzelne und getrennte Vortizes, die sich regelmmäßig über das BEC verteilen und additiv den gesamten übermittelten Drehimpuls tragen. Ein Vortex ist dabei eine lokale kollektive Anregung des Kondensats, die einen fest definierten quantisierten Drehimpuls in Bezug zu seiner Vortex-Achse hat. Das Geschwindigkeitsfeld in einem Vortex ist dem Gradienten der Phase der Wellenfunktion proportional und hat die gleiche Geometrie wie das rotationsfreie Magnetfeld außerhalb eines stromdurchflossenen Leiters. Das Geschwindigkeitsfeld hat − wie bei einem klassischen Wasserstrudel − innen die höchsten Werte und nimmt nach außen hin ab, weshalb die Wellenfunktion an der Stelle der Achse verschwinden muss. Ihre Phase ändet sich bei einem eimaligen Umlauf um die Achse um eine Vielfaches von 2π, entsprechend ist die Zirkulation des Vortex quantisiert. Dies hat Konsequenzen für die Dynamik und Stabilität der Vortizes. Um sie zu zerstören, muss der Drehimuls aller Atome von h¯ auf null geändert werden. Es ist daher nicht möglich, einen Vortex-Zustand kontinuierlich in den Grundzustand des Systems zu deformieren. Vielmehr geht man davon aus, dass Vortizes nur am Rand der Kondensate verschwinden können, wo die Wechselwirkung mit den Atomen der das Kondensat umgebenden thermischen Wolke hinreichend stark ist, um Drehimpuls aufzunehmen und die topologischen Eigenschaften der Vortizes zu zerstören. Das besondere Interesse an diesen Wirbeln liegt auch darin, dass sie über lange Zeit direkte Signaturen der Suprafluidität des Systems sind. Diese ist eng verwandt mit der BEC, ist aber nicht mit ihr identisch. Nach Abschalten des rotierenden Lasers lebt der Vortex-Zustand noch mehrere Sekunden (!), eine Zeit, die lang ist gegen alle sonstigen Zeitkonstanten des Systems und vergleichbar ist mit der Lebensdauer der Kondensate selbst. Dies wird allgemein als eine klare Signatur der Suprafluidität des Systems angesehen. Der Unterschied und die gegenseitige Abhängigkeit dieser beiden Phänomene ist eines der heutigen Forschungsprojekte. Vortizes haben einen Durchmesser von weniger als einem μm. Öffnet man jedoch die Magnetfalle, in der das BEC gespeichert ist, und lässt es expandieren, so skaliert auch der Durchmesser des Vortex und so werden direkte optische Abbildungen der Vortex-Strukturen möglich. Als zweite Klasse fundamentaler kollektiver Anregungen können Solitonen im BEC erzeugt und beobachtet werden [Sen01]. Solitonen sind als lokalisierte Wellen, die formstabil ohne Dispersion durch ein Medium propagieren, aus vielen Bereichen der Physik bekannt. Die Stabilität der Form rührt von der Kompensation der Dispersion durch eine nichtlineare Wechselwirkung her. Im Falle von BEC wird dies durch die nichtlineare Schrödinger-Gleichung, die im Zusammenhang mit BEC als Gross-Pitaevskii-Gleichung bezeichnet wird, beschrieben. Die Solitonen können selbst in diesem stark verdünnten gasförmigen Medium propagieren. Sie sind jedoch im Gegensatz zu Vortizes nicht topologisch stabil, d. h., sie können kontinuierlich in den Grundzu-
250
7 Anwendungen der Quantenstatistik
stand des Systems übergehen. Ihre Geschwindigkeit muss geringer sein als die Schallgeschwindigkeit und wird auch so beobachtet. Zu ihrer Erzeugung wird ein weit gegenüber der atomaren Resonanzfrequenz verstimmter Laserstrahl homogen und scharf begrenzt kurzzeitig auf eine Hälfte der Kondensatwellenfunktion eingestrahlt. Die Abmessungen des Solitons betragen nur wenige μm. Zur Detektion wird daher, wie auch in den Vortexmessungen, das einschließende magnetische Fallenpotential abgeschaltet. Die anschließende Expansion des Kondensats läßt die Strukturen dann besser sichtbar werden. In aktuellen Messungen geht man der Frage nach, wie zwei oder mehrere Solitonen miteinander wechselwirken. Aus der nichtlinearen Optik ist bekannt, dass Solitonen ungestört durcheinander hindurchpropagieren können. Dies wird zurzeit am BEC untersucht. Das Studium des BEC bringt auch Neues für komplett andere Systeme zu Tage [Blo05]. Gewisse elektrisch leitende Festkörper können zu Isolatoren werden, wenn man den Abstand zwischen ihren Atomen allmählich vergrößert (Mott-Übergänge). Der Effekt beruht letztlich darauf, dass die Leitungselektronen ihre freie Beweglichkeit verlieren und bei den einzelnen Atomen hängen bleiben. Es ist heute gelungen, bei einem BEC einen ähnlichen Phasenübergang zu erzeugen, nicht bei den Elektronen, sondern bei den kompletten Atomen [K+ 05][Wol02]. Hierbei werden sogenannte Dipol-Fallen verwendet, die auf der Wechselwirkung zwischen dem induzierten Dipolmoment in einem Atom und einem äußeren elektrischen Feld bestehen. Solch ein Feld kann z.B. das elektrische Feld eines Laserstrahls sein, das ein oszillierendes Dipolmoment in dem Atom erzeugt und gleichzeitig mit diesem wechselwirkt und somit ein Fallenpotential Vdip (r) erzeugt: Vdip (r) = −d · E(r) ∝ α(ωL )|E(r)|2 wobei α(ωL ) die Polarisierbarkeit des Atoms bezeichnet und I(r) ∝ |E(r)|2 die Intensität des Laser-Feldes mit E(r) seiner elektrischen Feldamplitude an der Positionr. Ein periodisches Potenzial kann hergestellt werden durch zwei gegenläufige Laserstrahlen gleicher Frequenz ωL . Sie bilden eine stehende Welle mit der Periode λL /2 und das entstehende Potenzial lautet V (x) = V0 sin2 (kL x) mit kL = 2π/λL . Dieses Potenzial stellt eine eindimensionales Raster dar, in dem die Atome gefangen sind. Bringt man senkrecht zum ersten Laserpaar ein zweites an, wird ein zweidimensionales Fallen-Raster gebildet. Bei drei gekreuzten Paaren von Laserstrahlen haben wir ein dreidimensionales Raster. Diese Raster nennt man optische Gitter [Blo08]. Dessen Knoten bilden eine perfekt kubische Struktur, und zwar ein Potenzialgebirge mit den Knoten als Tälern. Die Atome des BEC ändern durch das optische Gitter die Struktur ihrer Wellenfunktion, die kleine Maxima an dessen Knoten erhält. Die freie Beweglichkeit der Atome des Kondensats und die Phasenkohärenz bleiben zunächst davon unberührt, weil freies Tunneln zwischen den Knoten immer noch möglich ist. Das ändert sich jedoch, wenn die Lichtintensität gesteigert wird und die Potenzialwände wachsen. Ab einem bestimmten Punkt ist es für die Atome günstiger, nicht mehr zu tunneln, sondern den kohärenten Zustand aufzugeben und Plätze am Grund eines jeden Tals einzunehmen in einer genau festgelegten Anzahl. Dieses Analogon des MottIsolators ist gegenüber äußeren Störungen sehr stabil. Schwächt man die Laserintensität wieder ab, durchläuft das System den Phasenübergang in der anderen Richtung und bildet wieder ein BEC. In der Tat handelt es sich um einen echten Phasenübergang. Entweder kombinieren sich die Atome beim Abschalten der Laser zu Materiewellen eines BEC mit all seinen Eigenschaften, oder, wenn die Potenzialtöpfe zu tief waren, ergibt sich keine Kohärenz und die Materiewellen
7.5 Bose-Einstein-Kondensation
251
sind ungeordnet und zeigen z.B. keinerlei Interferenzerscheinungen. Das ist wie beim Phasenübergang Gas-Wasser, da wird das Gas bei Temperaturerniedrigung auch nicht langsam dichter, sondern der Übergang erfolgt schlagartig. Die Beschreibung dieses Phänomens ist nicht mehr mit der einfachen Theorie für BEC wechselwirkungsfreier Gase zu beschreiben. Es müssen von vorneherein die Wechselwirkungen zwischen den Atomen berücksichtigt werden. Damit wird eine Brücke zu stark korrelierten Systemen geschlagen, die Supraflüssigkeit, Supraleitung oder Hochtemperatur-Supraleitung zeigen. Die Verwendung von Bosonen statt Fermionen in diesen Experimenten zur Physik des MottIsolators schränkt allerdings die Analogie zum Festkörper stark ein. Deshalb besteht ein großes Interesse daran, mit ultrakalten fermionischen Quantengasen zu experimentieren. Diese Experimente sind jedoch wesentlich aufwändiger als diejenigen mit Bosonen, da das Pauli-Prinzip bei sehr niedrigen Temperaturen die für die Kühlung wichtigen Stöße zwischen zwei identischen Fermionen unterdrückt. Ein System einzelner Fermionen kann daher kein ultrakaltes Kondensat ähnlich einem BEC bilden. Fermionen können jedoch in einen makroskopischen Quantenzustand, nämlich in ein Suprafluid, kondensieren, wenn sie Paare bilden und diese zusammengesetzten Objekte ganzzahligen Spin und damit bosonischen Charakter haben. Die BardeenCooper-Schrieffer-Theorie (BCS) beschreibt z.B. den reibungslosen Transport von Elektronen in Supraleitern mit Hilfe von Cooper-Paaren, die aus zwei im Impulsraum korrelierten zum Spin null gekoppelten frei im Leitungsband sich bewegenden Elektronen bestehen. Ein entscheidender Parameter in diesen Experimenten ist die Stärke der Wechselwirkung zwischen den zwei Fermionen, da diese Größe die Bindungsenergie und die Ausdehnung des Cooper-Paares bestimmt, und somit auch die makroskopischen Eigenschaften des kondensierten Quantensystems. In einem ultrakalten Gas lässt sich die Paarwechselwirkung mit Hilfe eines Magnetfeldes verändern, falls eine sog. Feshbach-Resonanz26 vorliegt. Unterhalb dieser Resonanz befindet sich das System in einem Regime mit starker Binddung, in dem sich fermionische Atome zu bosonischen Melekülen zusammenschließen, die schließlich in einem Molekül-BEC kondensieren können. Weit oberhalb der Feshbach-Resonanz führt die schwache Cooper-Paarung zu einem BCS-ähnlichen System. Die Frage besteht nun, worin eine eindeutige Signatur für das reibungslose Fließen in einem makroskopischen Quantenzustand besteht. Ein Anwort liegt in den oben bereits erwähnten Vortizes [Z+ 05, Gri]. Eine Supraflüssigkeit kann nicht wie eine klassische Flüssigkeit rotieren, sondern ordnet sich wie bei einem BEC in einem System von Vortizes an, die jeder für sich einen Teil des gesamten Drehimpulses des Systems trägt. Da sich die Vortizes 26 Feshbach-Resonanz:
Im Schwerpunktsystem zweier kollidierender Atome bestimmt das gemeinsame Molekülpotential die Relativbewegung (Born-Oppenheimer-Näherung, Mean-Field-Potenzial). Aufgrund der geringen Temperatur läuft ein stoßendes Atompaar praktisch mit Dissoziationsenergie aufeinander zu, bis der abstoßende Anteil des Molekülpotentials es bei kleinen Abständen reflektiert. Die Möglichkeit einer Änderung des Mean-Field-Potenzials ergibt sich, falls in der Nähe der Dissozitionsenergie ein gebundener Zustand eines weiteren Molekülpotentials mit einem anderen magnetischen Moment vorliegt. Das stoßende Atompaar kann nun eine Weile im gebundenen anderen Molekülzustand verbringen. Dabei ändert sich die Wechselwirkungsenergie und ihr Vorzeichen je nach relativer Lage des gebundenen Zustands im Vergleich zum Mean-Field-Potenzial. Das unterschiedliche magnetische Moment erlaubt es nun, die Molekülpotentiale mit Hilfe eines extern angelegten Magnetfeldes relativ zueinander zu verschieben. Damit kommt es zu einer Feshbach-Resonanz mit einer drastischen Änderung der Wechselwirkung, wenn der gebundene Zustand die Dissoziationsenergie kreuzt. Durch eine Variation des Magnetfeldes über die Feshbach-Resonanz wird es somit möglich, ein Atompaar adiabatisch in ein gebundenes Melekül zu überführen und in umgekehrter Variationsrichtung des Magnetfeldes auch wieder zurück. Dies erlaubt einen kontinuierlichen Übergang eines Systems wechselwirkender Atome in ein System von Molekülen.
252
7 Anwendungen der Quantenstatistik
gegenseitig abstoßen, kristallisieren sie im thermischen Gleichgewicht in ein hexagonales Gitter, das sog. Abrikosov-Gitter, was in Supraleitern und auch in rotierenden BECs beobachtet wird. In den aktuellen Experimenten an Gasen aus Lithium und Kalium wird zunächst ein VortexGitter im molekularen BEC-Regime erzeugt. In diesem Fall sind die Fermionen-Paare in ihrer Ausdehnung klein verglichen mit den typischen Abständen zwischen den Teilchen, und dicht gebundene bosonische Meleküle entstehen. In dem Regime nahe der Feshbach-Resonanz auf der BCS-Seite ist die Größe eines Paares vergleichbar mit dem typischen Abstand zwischen den Teilchen. In diesem Zustand können sich die Fermionen nicht zu voneinander isolierten Molekülen zusammenschließen − dennoch werden aber ähnliche Wirbelmuster beobachtet. Es haben sich also Paare gebildet ähnlich den Cooper-Paaren und es liegt somit ein der Suprafluidität bzw. Supraleitung ähnlicher Zustand vor. Den beschriebenen Übergang von örtlich korrelierten Paaren (Moleküle) zu solchen, die im Impulsraum korreliert sind (Cooper-Paare), nennt man ”BEC-BCS crossover”. Auch für die Molekülphysik bringt das BEC neue Erkenntnisse: Wenn sich in chemischen Reaktionen Moleküle bilden oder umgekehrt molekulare Bindungen gelöst werden, ist dies normalerweise durch komplexe Prozesse bestimmt, die sich einer direkten Beobachtung weitgehend entziehen. Manche dieser Prozesse benötigen Energie (endotherme Reaktionen) und andere setzen Energie frei (exotherme Reaktionen). Diese Energien sind viel kleiner als die Gesamtenergie der Coulomb-Wechselwirkung in einem Molekül. Dadurch ist ein chemischer Prozess mit einer Vielzahl kleiner Zahlen verknüpft, die eine Reaktion kompliziert machen. Die großen Fortschritte bei der Erforschung ultrakalter atomarer und molekularer Gase ermöglichen es nun, elementare chemische Reaktionen vollständig kontrolliert zu realisieren, so dass sich dabei alle beteiligten Teilchen in einem genau definierten Quantenzustand befinden. Es ist zum Beispiel gelungen [K+ 10], eine sogenannte Austauschreaktion in einem Quantengas direkt zu beobachten und auch energetisch zu steuern. Dazu wurden die ultrakalten Atome und Feshbach-Moleküle (CäsiumAtome und -Molküle) in einem optischen Gitter festgehalten. Durch Beschuss mit geeigneten Laserstrahlen wurde dafür gesorgt, dass alle beteiligten Teilchen in ihrem Grundzustand waren. In diesem Zustand besitzen sie die niedrigst mögliche Vibrations- und Rotationsenergie und sind deshalb besonders stabil. Durch Variation des äußeren Magnetfeldes konnte die molekulare Reaktion von endotherm zu exotherm variiert werden und lief dabei vollständig kontrolliert ab.
7.6 Leitungselektronen im Festkörper: Spezifische Wärme, Fermidruck In diesem Kapitel betrachten wir wechselwirkungsfreie Fermionen mit fester Teilchenzahl als relevantes Beispel für ein ideales Quantengas von Fermionen. Das konkrete erste Ziel dieses Kapitels ist die Berechnung der spezifischen Wärme der Leitungselektronen im Festkörper27 . Das zweite Ziel dieses Kapitels ist das Verständnis und die Berechnung des Fermidrucks oder des Entartungsdrucks, eines extrem wichtigen Phänomens, das allgemein für die Stabilität von 27 Gemeint
ist der Beitrag, den die Elektronen zur spezifischen Wärme des Festkörpers liefern. Ein anderer Beitrag kommt von den Gitterschwingungen, beschrieben (in primitiver Form) durch das Einstein-Modell, Kap. 5.3.2, bzw. in realistischerer Form durch das Debye-Modell, Kap. 7.4.3.
7.6 Leitungselektronen im Festkörper: Spezifische Wärme, Fermidruck
253
Materie verantwortlich ist, wie z.B. Festkörper, Weiße Zwerge, Neutronensterne, etc. Die wichtigen Behauptungen dieses Kapitels sind: • Die spezifische Wärme der Elektronen ist linear in der Tempertur T : CV =
π2 kB T kB N 2 εF
Diese Temperaturabhängigkeit ist offenbar verschieden von der Temperaturabhängigkeit ∼ T 3 der schwingenden Gitterbausteine eines Festkörpers. • Der Druck des Fermigases verschwindet nicht bei T → 0, sondern erreicht den Grenzwert (Fermidruck) von 2N PFermi = εF 5V Dieser endliche Fermidruck ist der Grund z.B. für die Stabilität von Festkörpern, von Weißen Zwergen und von Neutronensternen. • Die Fermi-Energie εF ist gegeben durch die Dichte des Fermigases 2 h¯ 2 N 3 εF = (3π ) 2m V 2 23
Die folgenden Rechnungen werden diese Tatsachen beweisen unter der Annahme, dass die Temperatur des Systems hinreichend klein ist im Verhältnis zur Fermi-Energie: kB T εF
(7.89)
7.6.1 Fermi-Verteilung, Fermikante Für freie nicht-relativistische Teilchen im Zustand |p, s = ±1/2 > gilt nach Gl. (6.23) für die Energie und mittlere Besetzungszahl: εp =
p2 2m
np =
1 eβ (ε p −μ) + 1
Für die mittlere Energie und die mittlere Teilchenzahl des Elektronengases ergibt sich in einem großkanonischen Formalismus E(T,V, μ) = ∑ ε p n p s,p
N(T,V, μ) = ∑ n p s,p
Man geht von den Summen zu Integralen über. Dafür ist es bequemer, die Dichte der Zustände in Abhängigkeit nicht vom Impuls, sondern von der Energie zu verwenden. Damit erhalten wir mit Gl. (7.1) ρ(k)d 3 k = ρ(ε)dε oder mit ε = p2 /2m ρ(ε)dε =
3 √ V (2m) 2 εdε 3 2 4π h¯
(7.90)
254
7 Anwendungen der Quantenstatistik
Für die weitere Rechnung ändern wir etwas die Bezeichnung und führen die Fermi-Funktion von Gl. (6.22) ein 1 F (ε) = β (ε−μ) e +1 Wir benötigen die folgenden Eigenschaften der Fermifunktion F(ε) ∼ 1
für
εμ
F(ε) ∼ 0
für
εμ
Weiterhin ist nach Gl. (6.24) nur in dem Bereich [μ − 2.2kB T, μ + 2.2kB T ] das F(ε) merklich von Eins und null verschieden. Wir haben dabei vorausgesetzt, dass kB T μ oder β μ 1. Für T = 0 ist F(ε) = θ (ε − μ). Für T = 0 wird das chemische Potenzial auch Fermi-Energie εF genannt. Wir werden im Folgenden allgemein mit der Energiedichte ρ(ε) rechnen, und nur am Ende spezifizieren wir auf das freie Fermion-Gas. Damit erhalten wir E(T,V, μ) = 2
εF(ε)ρ(ε)dε = 2
∞ 0
ε ρ(ε)dε eβ (ε−μ) + 1
Der Faktor 2 ergibt sich hier aus den zwei Spinzuständen eines Elektrons. Das chemische Potenzial μ wird festgelegt durch die Teilchenzahlerhaltung: N(T,V, μ) = 2
F(ε)ρ(ε)dε = 2
∞ 0
1 ρ(ε)dε eβ (ε−μ) + 1
Vorgehen Das Problem ist, dass μ = μ(T,V, N) ist und wir seine Temperaturabhängigkeit berücksichtigen müssen, wenn wir die spezifische Wärme berechnen wollen. Wir gehen auf folgende Weise vor: 1. Eliminiere μ aus N = N(T,V, μ) und erhalte μ = μ(T,V, N). 2. Setze μ(T,V, N) in E = E(T,V, μ) ein. Damit N). erhält man E= E(T,V, ∂E und P = − ∂V . 3. Berechne bei konstantem N dann CV = ∂∂ ET V
T
4. Nachdem nun CV = CV (T,V0 ) und P = P(T,V ) bekannt sind, kennt man nach Kap. 3.8.4 auch die anderen thermodynamischen Potenziale.
Berechnung der Integrale Die obigen Integrale sind alle von der Form ∞
Integral= 0
F(ε)φ (ε)dε
wobei F(ε) die Fermi-Verteilungsfunktion ist und φ (ε) eine sanft variierende Funktion ist, z.B. √ 3 also ρ(ε) ∼ ε oder auch ∼ ε 2 . Wie oben dargelegt ist die Fermi-Funktion F(ε) im Wesentlichen gleich Eins für ε ∈ [0, μ − 2kB T ] und dann null für ε ∈ [μ + 2kB T, ∞], und nur in einem kleinen Bereich von μ − 2kB T → μ + 2kB T fällt sie von Eins auf null ab. Das bedeutet, dass die Ableitung F (ε) = dF/dε nur in einem kleinen Bereich um μ ungleich null ist, wo sie dann groß und negativ wird. Siehe zur Illustration Abb. (7.9). Man nutzt dieses aus, um das Integral mit Hilfe der partiellen Integratiion umzuschreiben.
7.6 Leitungselektronen im Festkörper: Spezifische Wärme, Fermidruck
255
F(ε ) 1,0
0,5
0,0
μ
ε
μ
ε
F (ε )
0
Abbildung 7.9: Die Fermi-Verteilung F(ε) und ihre Ableitung F (ε) in Abhängigkeit von ε.
Dafür führen wir ein ψ(ε) =
ε 0
φ (ε )dε
und integrieren partiell
∞ 0
F(ε)φ (ε)dε = [F(ε)ψ(ε)]∞ 0 −
∞ 0
F (ε)ψ(ε)dε
Aber da F(ε = ∞) = 0 und ψ(ε = 0) = 0 ist, haben wir ∞ 0
F(ε)φ (ε)dε = −
∞ 0
F (ε)ψ(ε)dε
(7.91)
Wegen der Gestalt von F (ε) trägt zu dem Integral nur der relativ kleine Bereich um ε = μ bei. In diesem kleinen Bereich können wir aber eine sich langsam verändernde Funktion ψ(ε) nach Taylor entwickeln und die Taylor-Reihe abbrechen. Die folgende Methode benutzt diese Näherung. Offenbar gilt ∞ 1 dm ψ (ε − μ)m ψ(ε) = ∑ m ε=μ m=0 m! dε
256
7 Anwendungen der Quantenstatistik
Damit erhalten wir aus Gl. (7.91) ∞ 0
∞ 1 dm F(ε)φ (ε)dε = − ∑ ψ F (ε) (ε − μ)m dε m m! dε ε=μ 0 m=0 ∞
Nun gilt aber ∞ 0
F (ε) (ε − μ)m dε = −
∞ 0
β eβ (ε−μ) (ε − μ)m dε = −β −m (eβ (ε−μ) + 1)2
∞ −β μ
ex xm dx (ex + 1)2
wobei x = β (ε − μ) substituiert wurde. Da man sich leicht überzeugen kann, dass der Integrand ein scharfes Maximum an x = 0 bzw. ε = μ hat, und weil wegen kB T εF gilt, dass −β μ −1, können wir in guter Näherung die untere Grenze −β μ durch −∞ ersetzen. Damit kann man schreiben ∞ F (ε) (ε − μ)m dε = −(kB T )m Im 0
mit Im =
∞ −∞
ex (ex + 1)2
xm dx
Es ist festzuhalten, dass Folgendes gilt: 1 ex = x . (ex + 1)2 (e + 1)(e−x + 1) Daran sieht man, dass dieser Teil des Integranden symmetrisch ist. Deshalb gilt mit Hilfe von Integraltafeln π2 I0 = 1 I2 = Im = 0 für m = ungerade 3 Damit können wir schreiben ∞ (kB T )2 d 2 F(ε)φ (ε)dε = ψ(μ) + I2 ψ + ..... 2 dε 2 ε=μ 0 und wir erhalten mit der Definition von ψ als Integral von φ : ∞ 0
F(ε)φ (ε)dε = ψ(ε) =
μ 0
π 2 (kB T )2 d φ φ (ε )dε + + ..... 3 2 dε ε=μ
(7.92)
Der erste Term ist das Resultat, das man ohne aufgeweichte Fermikante hätte, also für den Grenzfall T → 0. Der zweite Term ist eine Korrektur, die klein ist, weil wir in Gl. (7.89) vorausgesetzt haben, dass kB T εF . Die Korrektur ist umso kleiner ist, je kleiner die Temperatur ist.
7.6.2 Die spezifische Wärme Energie: Zur Berechnung der spezifischen Wärme wenden wir den Formalismus auf die Energie an und setzen zu diesem Zweck φ (ε) = ερ(ε). Wir erhalten mit Gl. (7.92) μ π2 2 d ε ρ(ε )dε + (kB T ) + ..... (7.93) (ερ(ε)) E =2 3 dε 0 ε=μ
7.6 Leitungselektronen im Festkörper: Spezifische Wärme, Fermidruck
257
Im gegenwärtigen Fall haben wir kB T μ und deshalb ist es für den Zusatzterm ∼ T 2 eine plausibele gute Näherung, statt μ(T ) eher μ(T = 0) = εF zu verwenden. Weiterhin können wir den Mittelwertsatz der Integralrechnung verwenden und schreiben 2
μ 0
ε ρ(ε )dε = 2
εF 0
ε ρ(ε )dε + 2
μ εF
ε ρ(ε )dε = E0 + 2εF ρ(εF )(μ − εF ),
wobei das erste Integral gerade gleich der mittleren Energie bei T = 0 ist. Wir können in Gl. (7.93) den Differentialquotienten von ερ explizit schreiben und erhalten E = E0 + 2εF ρ(εF )(μ − εF ) +
π2 (kB T )2 ρ(εF ) + εF ρ (εF ) 3
(7.94)
Wir werden diese Gleichung unten verwenden. Chemisches Potenzial μ: Wir müssen immer noch ausrechnen, wie groß μ −εF ist, denn darin steckt die Temperaturabhängigkeit, die wir zur Berechnung der spezifischen Wärme ja benötigen. Dies bekommen wir aus der Normierung auf die korrekte Teilchenzahl. Wir starten wieder von Gl. (7.92), jetzt aber mit φ (ε) = ρ(ε), und erhalten N(T,V, μ) = 2
∞
1
0
eβ (ε−μ) + 1
ρ(ε)dε = 2
F(ε)ρ(ε)dε = 2
μ 0
π2 2 d ρ ρ(ε)dε + (kB T ) 3 dε ε=μ
Hier können wir die Ableitung wieder wegen dem kleinen T an εF = μ(T = 0) statt an μ(T ) ausrechnen und wir können verwenden 2
μ 0
ρ(ε)dε = 2
εF 0
ρ(ε)dε + 2
Damit erhalten wir 2ρ(εF )(μ − εF ) +
μ εF
ρ(ε)dε = N + 2ρ(εF )(μ − εF )
d π2 (kB T )2 ρ =0 3 dε ε=εF
oder μ − εF = −
π2 ρ (εF ) (kB T )2 6 ρ(εF )
Mit Gl. (7.90) gilt ρ (ε)/ρ(ε) = 1/(2εF ) und damit μ(T ) = εF = εF
π2 1− 12
kB T εF
2
Also gilt μ(T = 0) = εF und μ → −∞ für T → ∞.
für kB T εF
258
7 Anwendungen der Quantenstatistik
Spezifische Wärme:
Es folgt mit Gl. (7.94)
E = E0 − 2εF
π2 π2 (kB T )2 ρ (εF ) + (kB T )2 ρ(εF ) + εF ρ (εF ) 6 3
oder, weil sich die Ableitungen von ρ wegheben, π2 (kB T )2 ρ(εF ) 3
E = E0 + wobei die Zustands-Dichte ρ normiert ist auf N(T,V, μ) = 2
∞ 0
1 ρ(ε)dε eβ (ε−μ) + 1
woraus der Beitrag der Elektronen zur spezifischen Wärme des Festkörpers folgt mit ∂E 2π 2 2 = k ρ(εF )T, CV = ∂T V 3 B
(7.95)
Wir finden also eine lineare Temperaturabhängigkeit der spezifischen Wärme der Elektronen, im Gegensatz zur Abhängigkeit ∼ T 3 der Gitterschwingungen. Die Fermi-Energie: Wir wollen jetzt die Fermi-Energie εF berechnen. Wir erhalten sie aus der Tatsache, dass εF = μ für T = 0 ist. Berücksichtigen wir durch einen Faktor 2 die Spins, so haben wir für die Teilchenzahl N=
2V (2π h¯ )3
|p|≤pF
d3 p =
woraus folgt pF =
1
3π 2 2
2V 4π 3 p (2π h¯ )3 3 F
1 N 3 h¯ V
(7.96)
und daraus erhalten wir die Fermi-Energie 2 p2F ¯2 N 3 2 23 h εF = = (3π ) 2m 2m V Das ergibt mit Gl. (7.90) 3 ρ(ε) = N 4εF
ε εF
(7.97)
(7.98)
und
3 N 4εF und wir können den Beitrag der Leitungselektronen zur Energie des Festkörpers schreiben als: ρ(εF ) =
E = E0 +
N π2 (kB T )2 4 εF
mit
3 E0 = NεF 5
(7.99)
7.6 Leitungselektronen im Festkörper: Spezifische Wärme, Fermidruck
259
oder nach Gl. (7.95) die Endformel für die spezifische Wärme CV =
π2 kB T kB N 2 εF
(7.100)
Experimentelle Überprüfung Ein typisches Zahlen-Beispiel für εF und kB T und die Näherung kB T εF ist Kupfer: Dort haben wir N/V ∼ 8(nm)−3 und mit Gl. (7.97) folgt 2 h¯ 2 c2 N 3 εF = (3π ) 2mc2 V 2 23
und h¯ c = 200 MeVfm und für das Elektron m = 0.5MeV erhalten wir εF ∼ 7eV ∼ 8 × 104 K
(7.101)
verglichen zur Zimmertemperatur von ∼ 330 K. Also ist in einem solchen Fall die Näherung kB T εF gerechtfertigt. Spezifische Wärme Für die spezifische Wärme erhalten wir C = CGitter +CLeitungselektronen Nach dem Debye-Modell Gl. (7.72) können wir schreiben CGitter ∼ T 3 so dass insgesamt realistisch gilt CV = αT 3 + γT
oder
CV = αT 2 + γ T
(7.102)
Bei Zimmertemperaturen dominieren bei CV die Gitterschwingungen. Beim Übergang zu kleinen Temperaturen wird der Beitrag ∝ T 3 schneller kleiner als der ∝ T , und es ist klar, dass bei Niedertemperaturexperimenten die elektronische Wärmekapazität gemessen werden kann. Nach der rechten Gl. (7.102) haben wir bei wenigen Kelvin eine Gerade, die α und γ zu bestimmen gestattet. Diese Zusammenhänge sind experimentell gut belegt.
7.6.3 Der Fermidruck Wichtig ist der Druck des entarteten Fermi-Gases. Er ergibt sich einfach nach Gl. (6.45) und Gl. (7.99) zu 2 2 π 2 NkB T kB T P= E= E0 + (7.103) 3V 3V 6 V εF Der einfache Zusammenhang (6.45) zwischen P und E ist bekannt aus Grundüberlegungen der Quantenstatistik idealer Gase in Kap. 6.2.6. Die Argumentation von dort können wir hier wiederholen, weil nur die Einteilchenenergien vom Volumen abhängen.
260
7 Anwendungen der Quantenstatistik
Im Gegensatz zum idealen klassischen Gas oder zum idealen Quanten-Bose-Gas geht der Druck des Fermi-Gases nach Gl. (7.103) für T → 0 nicht gegen null sondern gegen den endlichen Wert PFermi =
2N εF 5V
(7.104)
mit εF von Gl. (7.97). Dieser Fermidruck ist der Grund für die relative Inkompressibilität gewöhnlicher, fester oder flüssiger Materie. Zwar ist die interne Struktur dieser Materie sehr verschieden von einem idealen Fermi-Gas aus Elektronen. Die entscheidenden Voraussetzungen sind jedoch die Unschärferelation und das Pauli-Prinzip. Qualitativ kann man die obige komplizierte Rechnung in der Tat darauf zurückführen: In einem Festkörper vom Volumen V steht einem Elektron das Volumen v = V /N zur Verfügung. Wegen der Unschärferelation (ΔxΔp) ∼ h¯ 2 −2/3 v . Um alist sein Impuls von der Größenordnung p ∼ h¯ v−1/3 und seine Energie ε p ∼ 2m so z.B. das Volumen eines Festkörpers zu halbieren oder die Dichte zu verdoppeln, muss eine Energie pro Elektron aufgebracht werden, die um den Faktor 22/3 1.6 größer ist als z.B. die in Gl. (7.101) angegebene Energie von 7eV, was unter normalen, auch explosiven experimentellen Bedingungen unmöglich ist. Es ist also sehr schwierig, kondensierte Materie merklich zu komprimieren. Der Fermidruck der Elektronen kompensiert z.B. den Gravitationsdruck der He-Kerne bei den Weißen Zwergen und verhilft diesen so zu einer stabilen Konfiguration (siehe Kap. 7.7.1). Bei den Neutronensternen ist es der Fermidruck der Neutronen, der deren eigenen Gravitationsdruck kompensiert (siehe Kap. 7.7.2). Wenn der Stern sehr massiv ist, reicht der Fermidruck auch nicht mehr aus, den Gravitationsdruck zu kompensieren, und statt eines Neutronensternes bildet sich ein Schwarzes Loch. Die Stabilität der Sonne stammt vom Druck der im Zentrum durch Kernfusion erzeugten Eergie her, die nach außen strömt und dadurch den Gravitationsdruck kompensiert. Fermidruck spielt hier keine Rolle.
7.7 Weiße Zwerge, Neutronensterne 7.7.1 Stabilität der Weißen Zwerge Weiße Zwerge28 bilden das Endstadium von nicht zu schweren Sternen der Hauptreihe. Man kennt die Klassifizierung von Sternen im Hertzsprung-Russell-Diagramm Abb. (7.10). Man kennt auch die qualitativen Daten Weißer Zwerge: • Zusammensetzung: Helium, Kohlenstoff, Sauerstoff im Wesentlichen. • Zentrale Dichte 107 g/cm3 107 ρ • Masse 1033 g M = 2 × 1030 kg • Zentrale Temperatur 107 K T 1 Der Weiße Zwerg liegt als Plasma vor. Wir wissen: 300K 40 eV, 107 K 1000 eV. Masse des −30 Elektrons me 10 kg 0.5MeV. Masse der Sonne M 2 · 1030 kg. Da die atomare Bindungsenergie etwa eines Helium-Atoms aber nur etwa EBindung 2 · 13 eV 1000 eV beträgt, 28 Wir
folgen in diesem Kapitel dem Modell von Huang [Hua87].
Helligkeit
7.7 Weiße Zwerge, Neutronensterne
261
Ha u
ptre
weiß
ihe
e Zw
iesen rote R
erge
Farbe Abbildung 7.10: Das Hertzsprung-Russel-Diagramm, sehr schematisch. Die Sterne der Hauptreihe entwickeln sich bei hinreichend kleiner Masse von der Hauptreihe zu Weißen Zwergen als ihrem Endstadium, wobei sie das Zwischenstadium der Roten Riesen passieren. Die Sonne benötigt etwa 10 × 109 Jahre für die Entwicklung zum Weißen Zwerg.
liegen freie He-Ionen und freie Elektronen vor. Im stabilen Falle wird sich dann ein Gleichgewicht zwischen dem Gravitationsdruck der schweren He-Kerne und dem Fermidruck der leichten Elektronen einstellen. Für C und O gelten ähnliche Überlegungen. Für die weitere Rechnung ist es wichtig, die Fermi-Temperatur der Elektronen zu kennen. Wir schätzen sie auf folgende Weise ab: Aus der Dichte 107 g/cm3 folgt bei einer Proton-Masse von 1.6 × 10−27 kg eine Anzahl von Protonen von etwa 1033 pro cm3 und daraus etwa 1033 Elektronen/cm3 . Nach Gl. (7.97) haben wir mit Ne als Anzahl der Elektronen des Weißen Zwerges h¯ 2 2 h¯ 2 Ne 2/3 εF = (7.105) 3π 2 kF = 2m 2me V mit h¯ c 200 MeV · fm und me c2 0.5 MeV folgt εF = kB TF 20 MeV und somit TF 1011 K 107 K Die Fermi-Temperatur ist also viel größer als die Temperatur des Weißen Zwerges. Da die Breite der Fermikante nach Gl. (6.24) proportional zu 4.4T ist, kann man wegen T TF die Aufweichung der Fermi-Funktion vernachlässigen und sie durch eine Θ-Funktion ersetzen. Wir haben für diese Abschätzung einige empirische Daten verwendet. Für das Folgende sind sie nicht relevant, dort benötigen wir nur Eigenschaften des entarteten Elektronengases und die Masse der Sonne M .
262
7 Anwendungen der Quantenstatistik
7.7.1.1 Berechnung des Druckes des Elektronengases Wir haben εF 20MeV me c2 daher müssen wir also bei den Niveaus an der Fermikante relativistisch rechnen, denn offenbar ist die Fermi-Energie der Elektronen viel größer als deren Ruheenergie. An der Fermikante gibt es viele Niveaus und diese sind jeweils von zwei Elektronen besetzt mit der Energie (7.106) ε p = (pc)2 + (me c2 )2 Das pF von Gl. (7.96) ist unverändert, aber das εF ist jetzt gegeben durch Gl. (7.106). Wir berechnen jetzt die Energie E des Weißen Zwerges, um dann mit P = ∂ E/∂V den Druck des Elektronengases zu bekommen, der dann durch die Gravitationsanziehung der Nukleonen kompensiert wird. Wir erhalten für E (Faktor 2 wegen Spin): (pc)2 + (me c2 )2 E = 2· ∑ p 8M . Verschiedene sukzessive thermonukleare Fusionsprozesse produzieren im Zentrum des Sterns Energie, die durch Strahlung und Konvektion nach draußen strebt und für einige Zeit30 den Gravitationskollaps verhindert. Am Ende bildet sich im Zentrum des Sterns eine relatic kleine Region aus, die etwa die Masse unserer Sonne hat und im Wesentlichen aus 56 Fe Atomkernen besteht. Da Fusionsprozesse bei diesen Kernen keine Energie mehr liefern, kollabiert dieser zentrale Bereich in einer Supernova-Explosion31 , wobei sich die Protonen mit der Reaktion e− + p → n + νe in Neutronen umwandeln. Die Neutronen sind zwar etwa 1 MeV, also etwa 2 Elektronenmassen, schwerer als die Protonen, doch wird wegen des Wegfalls der elektronischen Fermi-Energie bei der Reaktion Energie frei, die im Wesentlichen den Neutrinos mitgegeben wird. Bei dieser Explosion wird der größte Teil der Materie des Sterns als schnell expandierende Wolke in den Weltraum abgegeben und der Neutronen- stern bleibt als sog. ”Remnant” von etwa einer Sonnenmasse im Zentrum zurück. Es besteht mehr oder weniger Einigkeit unter den Experten, dass ein Neutronenstern nach seiner Entstehung eine Temperatur von einigen 1012 Kelvin hat, dann aber über einen Zeitraum von etwa 1000 Jahren auf etwa 106 Kelvin abkühlt. Dieser Endzustand wird viel diskutiert und die Vorschläge für seine Struktur reichen von einer entarteten Neutronenflüssgkeit bis zu einem Gemisch aus mehreren Phasen wie Atomkernen, Neutronen, Protonen und Elektronen, Mesonen, Pion- oder Kaonkondensaten, Strangeletts etc. Das einfachste und mit Sicherheit nur grob qualitative Modell für diesen Zustand besteht in einem entarteten Neutronengas, das gleichzeitig für gravitative Anziehung als auch für Fermidruck sorgt und so ein stabiles System bildet. Mit Hilfe von Beobachtungsdaten von Pulsaren (rotierenden und strahlenden Neutronensternen mit bis zu 500 Rotationen pro Sekunde) und des oben entwickelten Formalismus für den Weißen Zwerg kann man einige Eigenschaften grob abschätzen, was wir im Folgenden tun werden. Die Radien von Neutronensternen betragen etwa 10 − 15 km, ihre Massen ähneln der Sonnenmasse, also etwa 2 × 1030 kg, und ihre Temperatur ist etwa 106 Kelvin, woraus sich etwa eine Dichte von etwa 1038 Neutronen pro cm3 ergibt. Hiermit kann man nach Gl. (7.105) ein εF 30 MeV abschätzen, was einer Temperatur von TF 1012 Kelvin entspricht, also wesentlich größer ist als die Temperatur des (abgekühlten) Neutronensterns von 106 Kelvin. Rechnet man relativistisch, so verwenden wir εF = cpF und erhalten mit Gl. (7.96) ein εF 600 oder T 1013 K. Deshalb können wir in beiden Fällen wie beim Weißen Zwerg die Aufweichung der Fermikante vernachlässigen. Man kann also den obigen Formalismus verwenden, wobei man jedoch die Elektronenmasse me durch die Nukleonenmasse mN ersetzen muss. Obwohl für die Berechnung eines Neutronensterns allgemeine Relativitätstheorie verwendet werden muss, begnügen wir uns hier der Einfachheit halber mit den obigen nichtrelativistischen Formeln, was 30 Diese
Zeit der thermonuklearen Brennvorgänge hängt stark von der Masse des Sterns ab. Für einen Stern zehnfacher Sonnenmasse beträgt sie etwa zehn Millionen Jahre. 31 Typ-II-Supernova.
268
7 Anwendungen der Quantenstatistik
die Güte unserer Abschätzungen erheblich einschränkt. Diese Näherung wird unterstützt durch das xF , das nichtrelativistisch 0.06 beträgt und relativistisch 0.6. Weil in unserem Modell die Materie des Neutronensterns ausschließlich aus Neutronen besteht, die gleichzeitig Quellen der Gravitation als auch des Fermidrucks sind, modifiziert sich die Gl. (7.109) zu M = NmN , wobei N die Anzahl der Nukleonen des Neutronenstern ist. Damit erhalten wir Gl. (7.111), aber leicht modifiziert: 9π M R M¯ NS = , (7.124) und R¯ NS = 4 mN h¯ /mN c Wir folgen weiter dem Formalismus und definieren ein KNS , das gleich dem K von Gl(7.112) ist, aber me ersetzt durch mN : mN c2 mN c 3 KNS = (7.125) 12π 2 h¯ Für den Druck greifen wir auf die nichtrelativistische Form (7.113) zurück: P∼ =
5/3
M¯ m4N c5 5 4 x = KNS NS 3 F 2 5 R¯ 5NS 15π h¯
(7.126)
und erhalten analog zu Gl. (7.117) die Gleichgewichtsbedingung für Neutronensterne 4 KNS 1/3 M¯ NS R¯ NS = 5 KNS mit nach Gl(7.116) KNS
4mN 2 mN c 4 α G = 4π 9π h¯
(7.127)
(7.128)
Offenbar nimmt auch beim Neutronenstern der Radius mit zunehmender Masse ab. Das ist nicht verwunderlich, ist doch der Mechanismus der Stabilität völlig analog zum Weißen Zwerg. Man kann jetzt verstehen, warum der Radius eines Neutronensterns so viel kleiner ist als der eines Weißen Zwerges. Wir bilden hierzu das Verhältnis KNS K R¯NS ≈ R¯ KKNS
(7.129)
Nach Einsetzen der Ausdrücke erhalten wir für das Verhältnis (7.129) in physikalischen Einheiten: RNeutronstern me A 2 (7.130) RWeißer Zwerg mN Z W Z Setzt man für den Weißen Zwerg A = 2Z, erhält man wegen mN 2000me für das Verhältnis der beiden Radien in dieser Gleichung den Wert 1/500. Verglichen zu einem Weißen Zwerg von etwa 7500km Radius erhalten wir hier für einen Neutronenstern einen Radius von 15km, was den Beobachtungen an Pulsaren entspricht. Wir haben am Anfang der Rechnung einige Daten des Neutronensterns verwendet, aber nur, um zu zeigen, dass man die Aufweichung der Fermikante nicht berücksichtigen muss. Dann
7.8 Ferromagnetismus
269
haben wir denn Formalismus des Fermidrucks verwendet und dieses ermutigende Resultat erhalten. Auch wenn das Modell eines Neutronensterns bestehend nur aus einem Neutronengas generell nicht als realistisch angesehen wird, so kann man doch verstehen, warum die Radien der Neutronensterne etwa einen Faktor 500 kleiner sind als die der Weißen Zwerge. Qualitativ kann man auch noch eine Chandrasekhar-Grenze für Neutronensterne verstehen, weil die Ausdrücke (7.121,7.122) nur elementare Größen und die Nukleonenmasse, nicht aber die Elektronenmasse enthalten. Das Szenario der Neutonensterne gilt für Sterne, die zu Beginn ihrer Entwicklung eine Masse haben mit 8M < M < 20M . Für schwerere Sterne reicht im Neutronenstern der Fermidruck der Neutronen nicht mehr aus, den Gravitationskollaps zu verhindern. Das System kollabiert dann nach allgemeiner Ansicht zu einem Schwarzen Loch. Leichtere Sterne werden zu Weißen Zwergen.
7.8 Ferromagnetismus Bisher haben wir ideale Quantengase betrachtet. In diesem Kapitel wollen wir ein wechselwirkendes System betrachten und als Beispiel die Ausbildung des Ferromagnetismus untersuchen, der von der Struktur her ganz anders als der Paramagnetismus ist. Dies wird uns auf das wichtige Phänomen der spontanen Symmetriebrechung führen. Also: Wir betrachten einen Festkörper bestehend aus N identischen Atomen, die sich in einem regulären Gitter befinden. Jedes Atom habe einen von den Elektronen hervorgebrachten Spin S und ein magnetisches Moment μmag = gμ0S. Ziel dieses Kaptiels ist die Berechnung des mittleren magnetischen Momentes des Festkörpers M¯ und die Diskussion seiner Eigenschaften unter verschiedenen Bedingungen. Jeder Spin wechselt im Prinzip mit jedem anderen und man fragt sich, wie wir ein solches System mit statistischen Methoden behandeln können, die letztlich alle auf freien Teilchen bzw. freien Quasiteilchen (Phononen) basieren. Die Antwort liegt in der unten erläuterten Molekularfeldnäherung, die in anderen Zusammenhängen enge Beziehungen hat zu Mean-Field-Methoden, zum Hartree- oder Hartree-Fock-Verfahren oder zu Dichtematrix-Formalismen. Die Methode besteht darin, die Wechselwirkung eines einzelnen Atoms mit allen anderen durch ein geeignetes mittleres Feld zu ersetzen, das für alle Atome gleich ist und in dem sich die Teilchen frei bewegen. 0 ist ein Teil der Wechselwirkung gegeben durch den Bei Anwesenheit eines äußeren Feldes B Hamiltonoperator N
H0 = −gμ0 ∑ S j · B0
(7.131)
j=1
Darüber hinaus wechselwirkt jedes Atom mit seinen Nachbarn. Diese Wechselwirkung ist nicht die magnetische Dipol-Dipol-Wechselwirkung, sondern die sogenannte Austauschwechselwirkung, die stärker ist als die Dipol-Dipol-Wechselwirkung. Sie berücksichtigt, dass anti-parallele Spinstellungen wegen des Pauliprinzips einen geringen Abstand der Elektronen benachbarter Atome erlauben, während parallele Spinstellungen einen größeren Abstand nach sich ziehen. Weil unterschiedliche räumliche Trennung auch unterschiedliche elektrische Wechselwirkung zur Folge hat, haben wir neben H0 von Gl. (7.131) noch eine weitere Wechselwirkung zwischen
270
7 Anwendungen der Quantenstatistik
Atom i und Atom k von der Struktur Hik = −2JSi · Sk
(7.132)
Da die elektrische Wechselwirkung mit dem Abstand zwischen den Atomen abfällt, gilt diese in guter Näherung nur zwischen den nächsten Nachbarn. Um die Rechnung zu vereinfachen, betrachten wir das von außen angelegte B-Feld in z-Richtung und bei der Spin-SpinWechselwirkung ebenfalls nur die z-Richtung (Ising-Modell): Hik = −2JSiz Skz Dies ist eine rein rechnerische Vereinfachung, die Physik ist ohne diese die gleiche. Damit erhalten wir als Wechselwirkungs-Hamiltonoperator den Ausdruck N n 1 H = (7.133) −2J ∑ ∑ S jz Skz 2 j=1 k=1 wobei von n nächsten Nachbarn und der Gesamtteilchenzahl N ausgegangen wurde. Der Gesamthamiltonoperator für alle Atome des Festkörpers ist nun H = H0 + H Ziel ist es nun, das mittlere magnetische Moment M¯ als Funktion der Temperatur und des angelegten Feldes auszurechnen. Der Hamiltonoperator sieht zwar einfach aus, seine exakte Lösung ist jedoch kompliziert. Wir berechnen seine Lösung daher in der Molekularfeldnäherung von Weiss.
7.8.1 Weiss’sche Molekularfeldnäherung Wir betrachten ein willkürlich herausgegriffenes Atom j. Seine Wechselwirkungen sind beschrieben durch den Hamiltonoperator n
H j = −gμ0 B0 S jz − 2JS jz ∑ Skz
(7.134)
k=1
Als Näherung ersetzen wir den Operator der Wechselwirkung des Atoms mit seinen Nachbarn (2. Term RHS) durch die gemittelte Wechselwirkung des Atoms mit seinen Nachbarn. D. h., wir definieren für jedes Atom ein mittleres Feld Bm durch n
2J ∑ Skz = gμ0 Bm
(7.135)
k=1
Hierbei ist der Ausdruck auf der RHS so formuliert, dass das Bm in der Tat die Dimension eines B-Feldes hat und so auch eine Art mittleres B-Feld darstellen kann (oder auch genannt molekulares Feld oder internes Feld). Es soll im Folgenden selbstkonsistent berechnet werden. In dieser Näherung schreibt sich der Hamiltonoperator (7.134) für das j-te Atom H j = −gμ0 [B0 + Bm ]S jz .
7.8 Ferromagnetismus
271
Der Effekt der benachbarten Atome wird hier also näherungsweise beschrieben durch ein modifiziertes äußeres Feld B0 → B0 + Bm . Wir haben jetzt formal das einfachere Problem des Paramagnetismus vor uns. Die Energieniveaus des zentralen j-Atoms sind Em = −gμ0 [B0 + Bm ]ms
mit ms = −S, ...., +S
Hiervon kann man sofort die mittlere z-Komponente des Spins des j-Atoms ausrechnen. Nach Gl. (5.34) haben wir wegen μz = gμ0 Sz S jz = SBS (η)
(7.136)
mit
1 (7.137) kB T und BS (η) ist die Brillouin-Funktion (5.35) für den Spin S. Die selbstkonsistente Bestimmung von Bm beruht nun in folgender Überlegung: Das herausgegriffene Atom ist ganz beliebig, jedes seiner Nachbaratome hätte ebenfalls als dieses ”zentrale” Atom dienen können. Also erhalten wir durch Kombination von Gl. (7.135) und Gl. (7.136) die Gleichung η = β gμ0 [B0 + Bm ]
β=
2JnSBS (η) = gμ0 Bm
(7.138)
Weil nun η seinerseits laut Definition (7.137) von Bm abhängt, können wir von hier eine Selbstkonsistenzbedingung ableiten: Wenn wir nämlich nach Gl. (7.137) Bm durch η ausdrücken, Bm =
η − B0 β gμ0
und diese Gleichung in Gl. (7.138) einsetzen, so erhalten wir die implizite Selbstkonsistenzgleichung:
gμ0 B0 kB T η− BS (η) = 2nJS kB T
(7.139)
was η bestimmt und damit über Gl. (7.137) das gesuchte Bm . Wenn wir also die Selbstkonsistenzgleichung (7.139) lösen, dann können wir den mittleren Spin angeben. Die Lösung kann man grafisch einfach bekommen, indem man die Kurve y = BS (η) zeichnet und im gleichen Graphen gμ0 B0 kB T ¯ wo sich beide Kurven schneidie gerade Linie y = 2nJS η − kB T einzeichnet. Die Punkte η, ¯ den, bilden jeweils die Lösung. Sobald die η-Werte und die zugehörigen Bm -Werte gefunden sind, kann man das mittlere magnetische Moment bzw. die Magnetisierung des Festkörpers berechnen: N ¯ ) = gμ0 ∑ Skz = N gμ0 SBS (η) ¯ (7.140) M(T V k=1 V 7.8.1.1 Fall ohne äußeres Feld B0 : Spontane Symmetriebrechung ¯ Betrachte nun in der Selbstkonsistenz-Gl. (7.139) den Fall mit B0 = 0. Suche also ein η = η: ¯ = BS (η)
kB T η¯ 2nJS
(7.141)
272
7 Anwendungen der Quantenstatistik
Dann ist immer wegen BS (0) = 0 das η¯ = 0 eine Lösung, bei der das mittlere molekulare Feld Bm verschwindet nach Gl. (7.138). Aber für geeignete Steigung der Geraden in Gl. (7.141) gibt es noch einen zweiten Schnittpunkt mit η¯ = 0, bei dem dann Bm = 0 ist, und dann gibt es auch ein von null verschiedendes mittleres magnetisches Moment (7.140), siehe Abb. (7.12). y y=
kB T 2nJS η
y = BS (η )
η¯
0
η
Abbildung 7.12: Grafische Illustration zur Lösung von Gl. (7.141) mit zwei Schnittpunkten an η = 0 und η = 0.
Dieses spontane Auftreten einer Magnetisierung in Abwesenheit eines externen magnetischen Feldes ist die charakteristische Eigenschaft des Ferromagnetismus. Offenbar schneiden sich die Kurven nicht immer zweimal, sondern dieses hängt von der Steigung der Geraden (7.141) ab, und damit von der Temperatur des Materials. Es liegen zwei Schnittpunkte vor, wenn die Steigung kB T η, oder von y = BS (η) an η = 0 größer ist als die der geraden Linie y = 2nJS
∂ BS (η) ∂η
η=0
>
kB T 2nJS
Dies können wir direkt auswerten, weil für kleine η nach Gl. (5.36) die Funktion BS (η) bekannt ist 1 BS (η) = (S + 1)η 3
für η 1
wodurch wir als Bedingung für Ferromagnetismus erhalten: 1 kB T (S + 1) > 3 2nJS oder
(7.142)
7.8 Ferromagnetismus
273
Bedg. für Ferromagnetismus:
T < Tc
mit
2 kB Tc = nJS(S + 1) (7.143) 3 Also: Wir haben Ferromagnetismus unterhalb der kritischen Curie-Temperatur, in diese gehen das Wechselwirkungsintegral J und die Anzahl der nächsten Nachbarn n ein. Wir haben also eine Magnetisierung des Materials, ohne dass ein von außen angelegtes Magnetfeld diese bewirkt, deshalb bezeichnet man diese Magnetisierung als spontan. Curie-Temperatur:
Die Frage stellt sich, welche der beiden Lösungen η¯ = 0 oder η¯ = 0 das System annimmt. Für T > Tc gibt es nur die mit η¯ = 0. Für T < Tc kann man das entscheiden, wenn man die Freie Energie berechnet, die bei festem T im Gleichgewicht ein Minimum annehmen muss. Man kann zeigen [Sch06], dass sie in dem Fall für η¯ = 0 niedriger ist als für η¯ = 0, das System also für T < Tc den spontan gebrochenen Zustand vorzieht. Man kann auch den Sättigungsfall aus unseren Gleichungen extrahieren, bei dem spontan alle magnetischen Momente parallel den Limes T → 0, bei dem die gerade Linie sind: Betrachte gμ0 B0 kB T von Gl. (7.139) i.e. y = 2nJS η − kB T immer flacher wird, der Schnittpunkt η¯ entsprechend η¯ → ∞, weil BS (η) endlich bleibt. Weil aber gleichzeitig für η → 0 auch BS (η) → 1, folgt wegen (7.140) für die Magnetisierung T →0
=⇒
¯ ) → N gμ0 S, M(T V
was Sättigung bedeutet. Für alle Werte zwischen T = 0 und T = Tc kann man die resultierende ¯ )/M(T ¯ Magnetisierung berechnen und erhält für M(T = 0) eine Kurve, die an T /Tc = 0 mit Steigung null startet und dann abfällt und bei T /Tc = 1 senkrecht auf die Abszisse stößt. Für ¯ ) = 0. Siehe zur Illustration Abb. (7.13). T > Tc verschwindet dann die Magnetisierung, i.e. M(T M¯ M¯ 0
0
Tc
T
Abbildung 7.13: Spontane Magnetisierung M eines Ferromagneten in Abhängigkeit von der Temperatur T . Kurven dieser Art sind experimentell bestätigt.
274
7 Anwendungen der Quantenstatistik
7.8.1.2 Fall mit kleinem, von außen angelegtem Feld B0 : Curie-Temperatur Wir können jetzt auch untersuchen, wie sich das System verhält, wenn von außen ein kleines Magnetfeld B0 angelegt wird, wobei wir uns knapp oberhalb der Curie-Temperatur bewegen wollen. Dann sind wir in einem Bereich, wo η klein ist und wir die lineare Approximation (7.142) von BS (η) anwenden können. Damit bekommen wir die Selbstkonsistenzbedingung (7.139) in modifizierter linearer Form als 1 kB T gμ0 B0 (S + 1)η = η− (7.144) 3 2nJS kB T Die Lösung η¯ von Gl. (7.144) kann man an Abb. (7.14) ablesen und ist gegeben durch η¯ =
gμ0 B0 kB (T − Tc )
wobei Tc die kritische Temperatur (Curie-Temperatur) von Gl. (7.143) ist. y y=
kB T 2nJS
η − gkμB0TB0
y = BS (η )
0 μ0 B0 − g2nJS
g μ0 B0 kB T
η¯
η
Abbildung 7.14: Grafische Illustration zur Lösung von Gl. (7.144) mit einem Schnittpunkt an η = 0.
Setzt man dies in die Formel (7.140) für die Magnetisierung (i.e. das mittlere magnetische Moment pro Volumen) ein und verwendet nach Gl. (5.36) die lineare Näherung für BS (η), so erhält man für die Magnetisierung Ng2 μ02 S(S + 1) 1 M¯ = Ngμ0 S(S + 1)η¯ = B0 3 3kB (T − Tc )
(7.145)
so dass wir für die magnetische Suszeptibilität von N Atomen im Volumen V bekommen: Ferromagnetismus: Curie-Weiss-Gesetz
χ(T ) =
¯ ) N g2 μ02 S(S + 1) M(T = B0 V 3kB (T − Tc ) (7.146)
Dies ist das Curie-Weiss-Gesetz. Offenbar wird χ unendlich, wenn T → Tc . Die Tatsache, dass am kritischen Punkt die magnetische Suszeptibilität singulär wird, bedeutet, dass nach Gl. (7.145)
7.8 Ferromagnetismus
275
ein beliebig schwaches äußeres Feld B0 eine merkliche endliche Änderung der Magnetisierung hervorruft. Das Curie-Weiss-Gesetz des Ferromagnetismus unterscheidet sich vom Curie-Gesetz (5.37) des Paramagnetismus durch die Anwesenheit der kritischen Temperatur in der Formel, also durch T → T − Tc . Erinnerung: Paramagnetismus: Curie-Gesetz
χ(T ) =
¯ ) N g2 μ02 S(S + 1) M(T = B0 V 3kB T
(7.147)
Experimentell ist das Curie-Weiss-Gesetz in brauchbarer Weise bestätigt. Allerdings ist die kritische Temperatur Tc , die experimentell im Curie-Weiss-Gesetz vorkommt, nicht identisch mit der kritischen Temperatur, bei der im Experiment der Ferromagnetismus einsetzt. Das ist nur in dem hier vorliegenden einfachen Modell der Fall. Ein weiterer Nachteil des Modells besteht darin, dass experimentell die spezifische Wärme ein etwas anderes Verhalten an der kritischen Temperatur zeigt als das vorliegende Modell.
7.8.2 Spontane Symmetriebrechung 7.8.2.1 Weiss’sche Bezirke Wir haben bisher mit der z-Richtung gearbeitet, um die technischen Schritte zu erleichtern. Für ¯ einen T < Tc stellt im dreidimensionalen Fall jede Richtung der spontanen Magnetisierung32 M ¯ identisch ist. Alle diese Zustände haben möglichen Gleichgewichtszustand dar, wobei immer |M| ¯ = 0. Die M ¯ ordnen sich zu Gruppen eine niedrigere Freie Energie als der Zustand mit η = M gleicher Richtung und bilden die bekannten Weiss’schen Bezirke (siehe unten). Legt man nun ein schwaches äußeres Magnetfeld an, so ist der Gleichgewichtszustand derjenige, bei dem die Magnetisierung parallel zum äußeren Magnetfeld ist. Auch im Dreidimensionalen ruft ein beliebig schwaches Feld eine endliche Änderung der Magnetisierung hervor. Das ist allerdings nur in unserem Modell so, ein realer Ferromagnet setzt einer Richtungsänderung der Magnetisierung einen Widerstand entgegen, so dass die Suszeptibilität endlich ist. Aber auch bei endlicher Suszeptibilität wird eine spontane Magnetisierung erreicht. Man nehme als Beispiel für einen Ferromagneten Eisen mit einer Übergangstemperatur von Tc = 1041K. Kühlt man Eisen unter diese Temperatur bei verschwindendem äußeren Magnetfeld ab, so bilden sich die erwähnten Weiss’sche Bezirke heraus, also endlich ausgedehnte Berei¯ deren Betrag che des Eisenmaterials jeweils mit einer endlichen spontanen Magnetisierung M, in Bezirken gleich ist. In jedem einzelnen Weiss’schen Bezirk ist die Orientierung der spontanen Magnetisierung zufällig. Dies ist ein berühmter Fall der spontanen Symmetriebrechung: Der Hamiltonoperator der Spin-Spin-Wechselwirkung ist als Skalarprodukt der Spin-Vektoren seinerseits ein Skalar und somit rotationsinvariant. Dennoch bildet sich in jedem einzelnen Weiss’schen Bezirk eine Vorzugsrichtung aus. Das ist zunächst ein Widerspruch, weil man erwartet, dass Eigenzustände des Hamiltonoperators die Symmetrien des Hamiltonoperators reflektieren, hier also keine Vorzugsrichtung existieren dürfte. Bei unendlichen Systemen ist es jedoch möglich, dass der Grundzustand nicht die Symmetrien des Hamiltonoperators besitzt, was man dann „spontane 32 Die
spontane Magnetisierung ist im 3-dimensionalen Raum auch ein 3-dimensionaler Vektor.
276
7 Anwendungen der Quantenstatistik
Symmetriebrechung” nennt. Dennoch ist die Symmetrie in einem gewissen Sinne erhalten: Mittelt man über viele Weiss’sche Bezirke, so erhält man eine verschwindende Magnetisierung, weil ja deren Orientierung in den einzelnen Bezirken zufällig ist. Legt man ein äußeres Magnetfeld an, so ordnen sich die Magnetisierungen der einzelnen Bezirke parallel zueinander mit einer von null verschiedenen resultierenden Gesamtmagnetisierung. 7.8.2.2 Spontane Symmetriebrechung und Nullmoden Man kann allgemein zeigen, dass eine spontane Symmetriebrechung begleitet ist von kollektiven Bewegungen von verschwindender Energie, sogenannten nullmoden, genannt auch GoldstoneModen. In der Abb. (7.15) sind die zugehörigen Moden zum Ferromagnetismus dargestellt: Spinwellen. Es kostet viel Energie, einen einzigen Spin umzuklappen, während dabei alle anderen stehen bleiben. Es kostet aber wenig Energie, alle Spins in ihrer Richtung kollektiv zu bewegen, und somit Spinwellen unterschiedlicher Wellenlänge zu erzeugen. Siehe auch Abb. (7.4). Offenbar wird die Anregungsenergie dieser Spinwellen mit wachsender Wellenlänge immer kleiner. Diese Spinwellen haben eine charakteristische Dispersionsrelation ω(k) mit ω(k = 0) = 0 bzw. unendlicher Wellenlänge bei verschwindender Energie. Siehe Abb. (7.15).
Abbildung 7.15: Schematische Darstellung von Spinwellen: Es kostet viel Energie, einen einzelnen Spin umzuklappen (oberste Grafik). Es kostet im wesentlichen keine Energie, alle Spins im Takt parallel zueinander schwingen zu lassen (mittlere Grafik, nullmode). Die Energie der Schwingung in der unteren Grafik hängt von der Wellenlänge ab.
Eine solche spontane Symmetriebrechung ist kein exotisches Phänomen. Ein wichtiges weiteres Beispiel liegt bei Systemen vor, die aus Quarks aufgebaut sind und mit der QuantenChromodynamik beschrieben werden. Dort haben wir die spontane Brechung der sog. chiralen Symmetrie. Die entsprechende nullmode ist eine Schwingung des Vakuums mit verschwindender Anregungsenergie. Schwingungen des Vakuums sind Mesonen und so erwartet man ein masseloses Goldstone-Meson, das Pi-Meson, dessen Quantenzahlen mit der gebrochenen Symmetrie
7.8 Ferromagnetismus
277
zusammenhängen. Nun ist in der Natur (und in der Quanten-Chromodynamik) die chirale Symmetrie nur näherungsweise erfüllt und deshalb auch nicht vollständig gebrochen. Daher haben die Pionen nicht Masse null, sondern eine geringe Masse (mπ = 139 MeV), die klein ist gegenüber den anderen Schwingungen des Vakuums, den Nicht-null-Moden, wie z.B. Rho-Mesonen (mρ = 775 MeV) oder Omega-Mesonen (mω = 782) MeV. Eine weitere Konsequenz dieser spontanen Brechung der chiralen Symmetrie besteht darin, dass die Quarks dadurch eine sog. ”dynamische Masse” bekommen, die etwa 350 MeV beträgt. Mit diesem Wert kann man verstehen, warum die normalen Mesonen, bestehend aus Quark-Antiquark-Paaren, eine Masse von etwa 700 MeV haben und z.B. das Proton, das aus zwei up- und einem down-Quark aufgebaut ist, eine Masse von 938 MeV besitzt, was etwa gleich 3 × 350 MeV abzüglich von etwas Bindungsenergie ist. Man muss sich aber klarmachen, dass im Gegensatz zu dieser Konstituenten-Masse von etwa 350 MeV die ursprüngliche Masse (QCD-Masse oder Current-Masse) eines einzelnen33 up- oder down-Quarks etwa 5 MeV bzw. 10 MeV beträgt. Das ist diejenige Masse, die nach dem Standard-Modell der Hochenergiephysik aus der Kopplung des Quarks an das berühmte Higgs-Feld herrührt, dessen Teilchen, das Higgs-Teilchen, seit Jahren von den Elementarteilchenphysikern postuliert und gesucht wird. An den obigen Zahlen und z.B. der Masse eines Protons sieht man, dass der Effekt der spontanen Symmetriebrechung absolut entscheidend z.B. für die Masse des Protons ist, das aus zwei up- und einem down-Konstituenten-Quark aufgebaut ist. Ohne diesen Effekt wäre dessen Masse etwa 5 + 5 + 10 = 20 MeV. Die Frage ist, woher die Energie stammt, die in der Konstituentenmasse steckt. Diese Frage hat die Theoretiker lange beschäftigt und die heute allgemein akzeptierte Antwort ist: aus der Wechselwirkungsenergie der zwischen den Quarks ausgetauschten Gluonen. Diese Gluonen werden zwischen den Quarks ausgetauscht und erzeugen dadurch die extrem starke Quark-Quark-Wechselwirkung34 . Die Masse eines Nukleons ist also nichts anderes als die Wechselwirkungsenergie, die mit E = mc2 zur Masse geworden ist. Erstaunliches Fazit: Die sichtbare Masse einer Galaxie besteht aus Baryonischer Materie. Deren Masse stammt im Wesentlichen von den Nukleonen und nach dem oben gesagten nicht von der QCD-Masse der Quarks (erzeugt durch Kopplung an das Higgs-Feld), sondern von der Wechselwirkungsenergie der in den Nukleonen eingeschlossenen Gluonen, die ihrerseits masselos sind. Bei der Dunklen Materie ist das vermutlich anders, deren Teilchen sind nicht der Starken Wechselwirkung unterworfen, wechselwirken also nicht mit Gluonen und bekommen ihre Masse nur durch Kopplung an das berühmte Higgs-Feld. Wenn man die Zahlen aus Tabelle (7.1) nimmt, so stammt also 17% der Masse des Universums aus dem Gluonenfeld, das spontan gebrochene chirale Symmetrie zeigt.
33 Quarks
können nicht einzeln auftreten, aber man kann ihre Masse aus Experimenten mit Hilfe der Quanten Chromodynamik (QCD) extrahieren. 34 Man kann mit numerischen Lösungstechniken aus der Quanten-Chromodynamik (QCD) ausrechnen, dass zwischen zwei ”freien” Quarks im Abstand von 1 fm eine Kraft von 150000 Newton, i.e. 15 Tonnen, wirkt!
8 Irreversible Prozesse, Transport, Fluktuationen Bisher haben wir uns in diesem Buch im wesentlichen mit Systemen im Gleichgewicht beschäftigt und nur sehr allgemeine Aussagen getroffen, was bei der Entwicklung zum Gleichgewicht passiert, z.B. ΔS > 0. In diesem Kapitel betrachten wir Systeme, die sich nicht notwendig im Gleichgewicht befinden, und werden einige grundlegende Eigenschaften von ihnen ableiten. Wir werden untersuchen, wie das Gleichgewicht erreicht wird und wie schnell das geschieht. Wir werden generell wichtige Transportphänomene diskutieren, ebenso Dissipation und Fluktuation. Obwohl alle diese Themen zunächst unkorreliert erscheinen, werden wir sehen, dass sie doch formal und physikalisch eng zusammenhängen. All dies führt uns auch zum Begriff des dynamischen Gleichgewichts, also einer stationären Situation, die nur durch stetige Zufuhr von Energie (z.B. Strahlung) aufrechterhalten wird.
8.1 Mastergleichung 8.1.1 Abgeschlossene Systeme 8.1.1.1 Übergänge Betrachte ein abgeschlossenes System A, beschrieben durch den hermiteschen Hamiltonoperator H (0) , der bestehen soll aus einem Hamiltonoperator H des ”ungestörten” Systems und einer kleinen vorhandenen inneren Störung, also H (0) = H + Hi wobei Hi , | s >, ... von H bekannt seien mit den Energien Er , Es ... und es gäbe insgesamt N Eigenzustände. Ein Beispiel für diese Konstellation ist ein verdünntes Gas in einem Behälter und eine kleine Wechselwirkung zwischen den Atomen des Gases. Wäre Hi = 0, dann würde das System stationär in einem seiner Mikro-Eigenzustände bleiben1 . Die Existenz von Hi = 0 hat nun Übergänge zwischen den Zuständen | r > und | s > zur Folge. Wenn Hi sehr klein ist, also gilt |< s | Hi | r >| |Ei − Er |, weiterhin eine nahezu gleichmäßige Zustandsverteilung vorliegt2 und wenn man nicht zu kleine Zeitabschnitte betrachtet, dann ist die relevante Größe die Übergangswahrscheinlichkeit pro Zeit: Wrs = Übergangswahrscheinlichkeit pro Zeit für | r >→| s > mit, nach den Regeln der quantenmechanischen zeitabhängigen Störungstheorie: 1 Siehe
Kap. 2.1 und Kap. 2.2.4 für eine eingehende Diskussion. z.B. kein Häufungspunkt in Abhängigkeit von der Energie, wo die aufeinanderfolgenden Energieniveaus sich beliebig nahekommen.
2 Also
K. Goeke, Statistik und Thermodynamik, DOI 10.1007/ 978-3-8348-9748-0_8, © Vieweg+Teubner Verlag |Springer Fachmedien Wiesbaden GmbH 2010
280
8 Irreversible Prozesse, Transport, Fluktuationen
Wrs =
2π |r |Hi | r|2 δ (Er − Es )
(8.1)
Aufgrund der Hermitezität von Hi gilt Wrs ∝ < s | Hi | r >< r | Hi | s > und daraus folgt: Wrs = Wsr
(8.2)
Es sei nun Pr (t) die Wahrscheinlichkeit, das System A zur Zeit t im Zustand | r > anzutreffen. Für Pr (t) (r = 1, ..., N) gelten die folgenden Bilanzen: a) Pr (t) nimmt zu, weil andere Zustände | s > in | r > zerfallen. b) Pr (t) nimmt ab, weil | r > in andere Zustände | s > zerfällt. Die beiden Prozesse laufen gleichzeitig ab zwischen allen N Zuständen, also gilt die Mastergleichung für r = 1, ..., N Mastergleichung:
dPr (t) = ∑ PsWsr − ∑ PrWrs = ∑ Wsr (Ps − Pr ) dt s s s
(8.3)
Die Mastergleichung ist ein System von N Gleichungen für N Unbekannte Pr mit r = 1..N. Die Wrs sind als bekannt vorausgesetzt. Alle Terme in der Mastergleichung sind reell und die Mastergleichung ist eine Gleichung von erster Ordnung in der Zeit. Das bedeutet: Die Mastergleichung ist nicht invariant gegenüber der Zeitumkehr (t → −t). Also ist sie eine Gleichung, die den irreversiblen Teil eines Prozesses beschreibt. Das steht im Gegensatz zur Quantenmechanik, deren Schrödinger-Gleichung zeitumkehrinvariant ist. Der Grund ist klar: Mastergleichung
⇒
Pr = |ar |2
Schrödinger-Gleichung
⇒
ar
(Wahrscheinlichkeit, reell)
(Wahrscheinlichkeitsamplitude, komplex)
Die Mastergleichung basiert also auf Approximationen, bei denen Information über die Phasen von ar verloren geht. 8.1.1.2 Gleichgewicht Wir hatten für eine mikrokanonische Gesamtheit das Statistische Postulat Gl. (2.3) gefordert, was besagt, dass bei einem System im Gleichgewicht alle zulässigen Zustände mit gleicher Wahrscheinlichkeit besetzt sind. Also Pr = Ps . Diese Behauptung ist konsistent mit der Mastergleichung (8.3), denn mit dieser Voraussetzung haben wir im Gleichgewicht wegen Gl. (8.2)
∑ PsWrs − PrWrs = 0 s
weil Wrs = Wsr und Pr = Ps
8.1 Mastergleichung
281
Aus diesem Ausdruck folgt sofort mit der Mastergleichung (8.3), dass dPr (t) =0 (8.4) dt Wenn also einmal Gleichgewicht vorliegt, dann ändert sich Pr nicht mehr. Die der Gl. (8.4) zugrunde liegende Gl. (8.2) nennt man auch das Prinzip des detaillierten Gleichgewichts, was bedeutet, dass jeder einzelne Übergang von dem inversen Übergang gleicher Stärke begleitet ist. 8.1.1.3 H-Theorem und Entropie Man kann die Irreversibilität noch genauer studieren und mit den bisher statistisch erarbeiten Konzepten in Verbindung bringen, wenn wir das H-Theorem ableiten und diskutieren. Dazu definieren wir H(t) = ∑ Pr log (Pr ) (8.5) r
und berechnen die zeitliche Ableitung von H(t) unter Verwendung der Mastergleichung (8.3). Wir erhalten dH = ∑ P˙r log Pr + P˙r dt r 1 1 ˙ ˙ ˙ ˙ Pr log Pr + Pr + Ps log Ps + Ps = 2 ∑ 2 ∑ r s Ps Ps 1 1 log = − ∑ Wrs (Pr − Ps ) [log Pr − log Ps ] = ∑ Wrs Pr 1 − 2 r,s 2 r,s Pr Pr Es gilt nun Wrs Pr ≥ 0, weil beide Terme Wahrscheinlichkeiten (> 0) sind, und dann folgt sofort wegen (1 − x) log x ≤ 0 das H-Theorem dH ≤0 (8.6) dt Durch dieses H-Theorem wird eine Zeitrichtung ausgezeichnet, was der Tatsache entspricht, dass die Mastergleichung, die wir für die Ableitung des H-Theorems verwendet haben, nicht invariant unter Zeitumkehr ist. Das legt sofort einen Zusammenhang mit der Entropie nahe. Wenn wir die Definition von H in Gl. (8.5) mit Gl. (4.80) für die Entropie S vergleichen, so erhalten wir H-Theorem:
S = −kB ∑ Pr log (Pr ) = −kB H
(8.7)
r
Damit erweist sich das H-Theorem als eine andere Formulierung des zweiten Hauptsatzes. Sofort können wir einige bereits bekannte Eigenschaften ableiten: Als Gleichgewichtszustand ist der Makrozustand definiert, in dem sich die makroskopischen Größen nicht mehr ändern. Das betrifft insbesondere die Entropie und damit gilt für das Gleichgewicht Gleichgewicht:
dH =0 dt
282
8 Irreversible Prozesse, Transport, Fluktuationen
Wenn kein Gleichgewicht vorliegt, dann nimmt H immer ab und daher entspricht sein Gleichgewichtswert einem Minimum. Das heißt für ein (laut Voraussetzung) abgeschlossenes System: Gleichgewicht:
S = −kB H = maximal
Das ist ist uns längst bekannt. Aus der Master-Gl. (8.3) und aus Gl. (8.2) folgt auch im Gleichgewicht die Konstanz der Besetzungszahlen, wie wir sie auch oben diskutiert haben: Pr = Ps für alle r, s mit Er = Es Die Bedingung Pr = Ps folgt nur für Er = Es , weil nur dann der Koeffizient Wrs = 0. Im abgeschlossenen System können nur Zustände gleicher Energie bei Übergängen erreicht werden und für alle anderen Zustände gilt Pr = 0. Im Gleichgewicht sind also alle Mikrozustände | r >, zwischen denen Übergänge stattfinden können, gleichwahrscheinlich. Das ist das bekannte grundlegende Postulat Gl. (2.3) eines mikrokanonischen Ensembles, das definitionsgemäß ein abgeschlossenes System beschreibt.
8.1.2 Boltzmann-Gleichung und Transportphänomene Wenden wir die Mastergleichung auf ein klassisches verdünntes Gas an und formuliert sie entsprechend, so wird sie zur Boltzmann-Gleichung. Wie mit der Mastergleichung können auch mit der Boltzmann-Gleichung Nichtgleichgewichtsprozesse und Transportprozesse beschrieben werden.3 Betrachte N Teilchen und es sei f (r,v,t) die Wahrscheinlichkeitsverteilung für ein beliebiges herausgegriffenes Teilchen. Mit der Normierung von f auf die Gesamtteilchenzahl N ist f (r,v,t)d 3 rd 3 v die Anzahl der Teilchen zur Zeit t im Phasenraumvolumen d 3 rd 3 v umr,v. Weil es nur um Kollisionen geht, spielt das f (r,v,t) hier auch die Rolle, die oben Wrs zukam. Die der Mastergleichung entsprechende Gleichung ist die Boltzmann-Gleichung: F ∂ ∂ ∂ f (r,v,t) = (8.8) + + Boltzmann-Gleichung: v · ∂r m ∂v ∂t
dσ (Ω) f (r,v ,t) f (r,v1 ,t) − f (r,v,t) f (r,v1 ,t) dΩ Die linke Seite der Boltzmann-Gleichung beschreibt die Veränderung in f (r,v,t) aufgrund der Bewegung der Teilchen und der auf sie wirkenden Kraft F. Die rechte Seite ist der sog. Stoßterm und seine Berücksichtigung in der Gleichung beschreibt die Veränderung von f (r,v,t) aufgrund von Stößen zwischen jeweils zwei Teilchen. Diese Teilchen haben vor dem Stoß die Geschwindigkeitenv undv1 , kollidieren dann mit dem Streuwinkel Ω und haben nach der Kollision die Geschwindigkeitenv und v1 . Der differentielle Wirkungsquerschnitt ist gegeben durch dσ (Ω)/dΩ und der totale durch σ . Die Boltzmann-Gleichung mit und ohne Stoßterm kann man auf eine Vielzahl von Systemen anwenden. Wir wollen das hier im Einzelnen nicht tun, sondern nur die Resultate [Fli99] aufführen. =
3 Im
d 3 v1
dΩ |v −v1 |
vorliegenden Text werden die Boltzmann-Gleichung und die daraus folgenden Transportphänomene nur summarisch behandelt. Ausführlichere Darstellungen finden sich z. B. bei Brenig [Bre89], Fließbach [Fli99] oder Schwabl [Sch06].
8.1 Mastergleichung
283
Maxwell-Verteilung Im kräftefreien Fall F = 0 und unter der Annahme, dass f = f (v,t), also ortsunabhängig ist, verschwindet der Stoßterm der Boltzmann-Gleichung und deren Lösung reduziert sich auf die Maxwellsche Geschwindigkeitsverteilung. Deren Eigenschaften wurden bereits in Kap. 4.2 diskutiert. Stoß von Gasteilchen, Stoßzeit Berücksichtigt bei einem verdünnten Gas die Stöße der Gasteilchen, so kann man aus der Boltzmann-Gleichung als wichtige Größe die mittlere freie Weglänge ableiten, d.i. die Strecke, die ein Teilchen im Mittel zwischen zwei Stößen frei fliegt. Man erhält 1 Mittlere freie Weglänge: λ = √ (8.9) 2nσ woraus mit der Teilchendichte n = N/V und dem mittleren Betrag der Geschwindigkeit v der Teilchen folgt. 1 λ Mittlere Stoßzeit: τ = = √ (8.10) v 2nσ v Hierbei ist der Streuquerschnitt σ gegeben durch σ = (dNstr /dt)/I, also die Anzahl der pro Zeit gestreuten Teilchen geteilt durch die einlaufende Stromdichte I, d.i. die einfallende Teilchenzahl pro Zeit und Fläche. Im einfachsten Fall ist σ = πd 2 mit d gleich Durchmesser der Stoßpartner. Abschätzungen [Fli99] der Werte für Luft bei Zimmertemperatur und einem Druck von P = 1 bar ergeben: n 3 · 1025 m−3 , v¯ 440ms−2 , λ 100 nm, τ 2 · 10−10 sec. Elektrische Leitfähigkeit Wir betrachten ein Gas von Teilchen, die die Ladung q tragen. Die mittlere Stoßzeit sei τ. Wenn wir die mittlere Dichte der Ladungsträger mit n bezeichnen und deren mittlere Geschwindigkeit mit v und den totalen Wirkungsquerschnitt (Streuquerschnitt) zwischen zwei Ladungsträgern mit σ , dann ergibt sich für die mittlere Stoßzeit τ zwischen Teilchen des Gases die Abschätzung von Gl. (8.10). Es sei von außen ein elektrisches Feld E angelegt. Wenn man eine Gruppe von Teilchen betrachtet, die alle eine ähnliche Anfangsbedingung haben, so erzeugt das elektriche Feld eine gemeinsame Driftgeschwindigkeit vDrift τqE/m. Wenn man jetzt noch die Leitfähigkeit durch j = qnvDrift = σel E definiert, dann erhält man für die elektrische Leitfähigkeit nq2 τ (8.11) σel m Reibungskonstante Wegen der dauernden Stöße der Teilchen untereinander ist die Folge ei nicht eine konstante Beschleunigung, wie bei freien Teilchen, sondern ner konstanten Kraft K eine konstante Driftgeschwindigkeit. Diese kann durch einen Reibungsterm in der Newtonschen Bewegungsgleichung für ein einzelnes Teilchen beschrieben werden: d − αv m v = K dt
(8.12)
wobei α als Reibungskonstante definiert ist. Im asymptotischen Fall t → ∞ haben wir die einfache identifizieLösung der Bewegungsgleichung v (∞) = τ K/m. Wenn wir v (∞) mit vDrift = τ K/m
284
8 Irreversible Prozesse, Transport, Fluktuationen
ren, so erhalten wir α = m/τ und somit α=
Reibungskonstante:
mv λ
(8.13)
Diffusion Eine anfangs inhomogene Dichteverteilung der Gasteilchen wird durch Diffusion nach hinreichend langer Zeit homogen. Der Vorgang basiert auf der Fluktutation der Geschwindigkeiten der Gasteilchen, die zufällig nach allen Seiten verteilt sind. Wenn wir der Einfachheit halber annehmen, dass die Dichte des Gases nur von der z-Koordinate abhängt, dann wird die Diffusionskonstante über den Strom jz und den Dichtegradienten ∂ n/∂ z definiert, und zwar: jz = −D
∂n ∂z
(8.14)
Die Diffusionskonstante ist gegeben durch: D
Diffusionskonstante:
λv 3
(8.15)
Man kann auch eine Diffusionsgleichung ableiten, die die Orts- und Zeitentwicklung der zu Anfang inhomogenen Dichteverteilung der Teilchen beschreibt. Wenn wir Inhomogenität nur in z-Richtung annehmen, also n = n(z,t), erhält man die Diffusionsgleichung ∂ 2n ∂n =D 2 ∂t ∂z Die Lösung dieser Diffusionsgleichung ist gegeben durch z2 N exp − n(z,t) = √ 4Dt 4πDt
(8.16)
(8.17)
mit der Normierung n(z,t)dz = N. Ein Maß für die Verbreiterung einer anfangs lokalisierten Verteilung ist die quadratische Abweichung Δ2 z = (z − z¯)2 = z2 =
1 N
z2 n(z,t)dz = 2Dt
(8.18)
Wir werden die Diffusionskonstante D bei der Brownschen Bewegung wiederfinden. Wichtig ist die Tatsache, dass Δ2 z linear mit der Zeit anwächst. Viskosität Die Viskosität eines Gases oder einer Flüssigkeit wird dadurch gemessen, daß man eine Fläche parallel zu einer gleich großen in x-Richtung durch das Medium zieht. Um dann einen Geschwindigkeitsgradienten ∂ ux /∂ z senkrecht zu den Flächen aufrechtzuerhalten, ist eine Kraft K pro Fläche F nötig, durch die die Viskosität η oder Zähigkeit definiert wird: K ∂ ux = −η F ∂z
(8.19)
8.1 Mastergleichung
285
Die Rechnung [Fli99] ergibt nλ vm (8.20) 3 Wenn wir die Maxwellsche Geschwindigkeitsverteilung im Gas voraussetzen, ergibt sich √ m 8kB T = const · T η √ πm 3 2σ η
Man kann durch rein hydrodynamische Überlegungen zeigen (ohne Beweis), dass die Reibungskraft mit der Viskosität verknüpft ist nach dem Stokes-Gesetz: Wenn ein Teilchen mit makroskopischem Radius r0 mit der Geschwindigkeit v durch eine Flüssigkeit der Viskosität η gezogen wird, dann ist es einer Reibungskraft −αv unterworfen, wobei Stokes-Gesetz: α = 6πηr0
(8.21)
Wärmeleitung Ein Dichtegradient in einem Gas führt zu einem Teilchenstrom, und ein Geschwindigkeitsgradient ergibt einen Impulsstrom. Genauso bewirkt ein Temperaturgradient einen Wärmestrom. Die Wärmestromdichte JQ hat nur eine z-Komponente, wenn der Temperaturgradient nur in diese Richtung wirkt. Dann ist die Wärmeleitfähigkeit κ mit Hilfe der Wärmekapazität CWärme pro Teilchen definiert als nλ vCWärme (8.22) κ 3 Ein Vergleich Gl. (8.20) zeigt CWärme η (8.23) κ= m Wir können auch eine Wärmeleitungsgleichung analog zur Diffusionsgleichung ableiten. Wir erhalten nach einem Blick auf Gl. (8.16) für die Temperaturverteilung T (z,t) κ ∂T ∂ 2T = ∂t nCWärme ∂ z2
(8.24)
8.1.3 Nichtgleichgewichts-System im Kontakt mit Wärmereservoir 8.1.3.1 Übergänge, Ungleichgewicht Das Gesamtsystems A(0) = A + A bestehe aus einem kleinen System A im Kontakt mit einem Wärmereservoir A der Temperatur T = 1/(kB β ). Siehe Abb. (8.1). Sein Hamiltonoperator sei H (0) = H + H+ A
A
Hi
Interaction
Hier beschreibt Hi die Wechselwirkung zwischen A und A . Wenn also Hi = 0, dann haben wir H | r >= Er | r >
H | r >= Er | r >
286
8 Irreversible Prozesse, Transport, Fluktuationen
A
A A(0) Abbildung 8.1: Ein kleines System A im Wärmekontakt mit dem Wärmereservoir A . Das Gesamtsystem A(0) ist abgeschlossen.
Das Hi induziert Übergänge in dem kombinierten System A(0) und führt am Ende zum Gleichgewicht zwischen beiden Systemen. Wir nehmen wieder an, dass Hi sehr klein ist, so dass bei Übergängen wieder Energieerhaltung zwischen den Eigenzuständen von H und H gilt. Weil das System A ein Wärmereservoir gegebener Temperatur ist, genügt es einer kanonischen Verteilung. Damit können wir Pr und Ps des Systems A berechnen, wie wir im Folgenden sehen werden: Es sei definiert: Pr = Wahrscheinlichkeit, dass das System A sich im Zustand | r > befindet. Pr = Wahrscheinlichkeit, dass das System A sich im Zustand | r > befindet Die Wahrscheinlichkeit, A(0) im Zustand | r, s > zu finden, ist:
(0)
Prr = Pr Pr
Das System A(0) = A + A wird als abgeschlossen und im Gleichgewicht vorausgesetzt. Wir betrachten die Übergangswahrscheinlichkeit pro Zeit W (0) (rr → ss ) für A(0) , wobei wir Energieerhaltung voraussetzen, also Er + Er = Es + Es . Die W (0) sind die elementaren Übergangswahrscheinlichkeiten für A(0) . Wir werden sofort die uns primär interessierenden Übergangswahrscheinlichkeiten für das System A allein berechnen, die dann von den Energien der beteiligten Zustände in A und A abhängen werden. Nach den Regeln der quantenmechanischen zeitabhängigen Störungstheorie gilt Energieerhaltung: Wenn Er + Er = Es + Es ⇒ W (0) (rr → ss ) = 0 Es gilt auch wieder die Symmetriebedingung W (0) (rr → ss ) = W (0) (ss → rr ) aus gleichen Gründen des detaillierten Gleichgewichts wie in Kap. 8.1.1.2.
(8.25)
8.1 Mastergleichung
287
System A im Gleichgewicht: Wir beschreiben zunächst die Situation, wenn das System A im Gleichgewicht ist und im Kontakt mit dem System A steht, das seinerseits durch eine kanonische Verteilung mit β = (kB T )−1 beschrieben wird. Für das System A hat das die Konsequenz, dass es ebenfalls durch eine kanonische Verteilung beschrieben wird, die die gleiche Temperatur wie A hat: Also gilt für A die Behauptung Pr = Ce−β Er
(8.26)
mit folgendem Beweis: Wir wissen, dass Pr = CΩA (Er )ΩA (E (0) − Er ). Man geht zum Logarithmus von Pr über und macht eine Taylor-Entwicklung von log ΩA (E (0) − Er ) bis zur ersten Ordnung in E (0) − Er . Die höheren Ordnungen lassen wir weg, weil das System A klein gegenüber dem Wärmereservoir A ist. Weil A sich im definierten Quantenzustand |r befindet, gilt ΩA (Er ) = 1. Damit haben wir für A sofort Pr ∼ exp (−β Er ), q.e.d. System A im Nicht-Gleichgewicht: Wir nehmen nun an, dass wir A zwar im Kontakt mit A steht, aber nicht im Gleichgewicht ist. Dann müssen die Pr von A durch die Mastergleichung ausgerechnet werden, was i.a. nur bei einem konkreten System und numerisch möglich ist. Wir können aber allgemeine Aussagen über die Wrs machen. Dazu nehmen wir an, dass A so groß ist, dass es immer im inneren Gleichgewicht bleibt, unabhängig davon, was A macht. Dann hat A eine feste Temperatur bzw. eine feste innere Energie und damit hat A eine feste kanonische Verteilung während des ganzen Prozesses. Jetzt fragen wir, was unter diesen Voraussetzungen die Übergangswahrscheinlichkeit pro Zeit für den Übergang r → s des Systems A ist. Zunächst gilt wegen des vorausgesetzten NichtGleichgewichts für das System A: Wrs = Wsr
wegen Nicht-Gleichgewicht von A
Wir können jetzt unter Ausnutzung der Tatsache, dass Energieerhaltung gilt, und aufgrund der kanonischen Verteilung Gl. (8.26) der Pr hinschreiben: Wrs = ∑ Pr W (0) (rr → ss ) r s
oder wegen kanonischer Verteilung von A :
Wrs = C ∑ e−β Er W (0) (rr → ss ) r s
und auf gleiche Weise
Wsr = C ∑ e−β Es W (0) (ss → rr ). r s
Wir formulieren jetzt Wsr um, damit wir es mit Wrs in Beziehung setzen können. Dazu verwenden wir die Energieerhaltung Er + Er = Es + Es
⇔ Es = Er + Er − Es
(8.27)
288
8 Irreversible Prozesse, Transport, Fluktuationen
weil A(0) abgeschlossen ist und Hi als hinreichend klein angenommen wurde. Wir wissen auch, dass mit Gl. (8.25) gilt W (0) (rr → ss ) = W (0) (ss → rr ) und damit
Wsr = C ∑ e−β Er e−β Er +β Es W (0) (rr → ss )
(8.28)
r s
und somit
Wsr = e−β (Er −Es )Wrs
Ohne Kontakt zum Wärmereservoir A hätten wir wegen Gl. (8.2) für A die Verhältnisse Wsr /Wrs = 1 und Er = Es : Jetzt haben wir die Verhältnisse: Wsr e−β Er = −β E s Wrs e
(8.29)
und es ist Er = Es erlaubt. Im Normalfall haben wir β > 0. Wenn dann etwa Es > Er gilt, dann ist auch Wsr > Wrs . In A sind also Übergänge in Zustände mit niedrigerer Energie wahrscheinlicher als in die mit höherer Energie. Das ist verständlich, wenn man Abb. (8.2) betrachtet. A
A
A
s
A
s s
r
s r
r
r
Abbildung 8.2: Illustration der Übergänge im System A, das im Kontakt mit dem Wärmereservoir A steht. Die waagerechten Linien deuten die Energieniveaus r und s von A und r und s von A an. Die Pfeile geben die Übergänge an. Da A als Wärmereservoir immer im Gleichgewicht ist, befindet es sich mit größerer Wahrscheinlichkeit im niedrigeren Niveau r (dickere Linie) als im höheren s . Als Folge kommen die Übergänge der linken Hälfte der Abbildung häufiger vor als die der rechten Hälfte. Daraus folgt im System A sofort Wsr > Wrs . Die Übergänge tendieren also dazu, die Gleichgewichtsverteilung in A herzustellen, bei der der niedrigere Zustand r stärker populiert ist als der höhere s.
Gleichgewicht: Man kann zeigen, dass der obige Formalismus im Falle des Gleichgewichts konsistent mit dem statistischen Postulat konstanter Besetzungswahrscheinlichkeiten ist: Führe dazu ein: Wsr e−β Er und wegen = −β E wrs = e−β Es Wsr s Wrs e ⇒
wrs = wsr = e−β Es Wsr = e−β Er Wrs
8.2 Magnetische Resonanz
289
⇒ Wsr = eβ Es wsr
Wrs = eβ Er wrs
Nun gilt natürlich für A die Mastergleichung dPr = ∑ PsWsr − ∑ PrWrs dt s s = ∑ wsr Ps eβ Es − Pr eβ Er
(8.30) (8.31)
s
Wenn nun im System A Gleichgewicht vorliegt und es im Kontakt mit A ist, dessen Temperatur durch β gegeben ist, dann gilt wegen Gl. (8.26) Pr = Ce−β Er woraus folgt
Ps = Ce−β Es
dPr = C ∑ wsr e−β Es +β Es − e−β Er +β Er = 0 dt s
Damit haben wir also wegen der Energieerhaltung Gl. (8.27) Gleichgewicht:
dPr =0 dt
was konsistent ist mit dem Postulat zeitlich konstanter Besetzungswahrscheinlichkeiten im Gleichgewicht.
8.2 Magnetische Resonanz In diesem Kapitel wenden wir die Begriffe des vorherigen Abschnitts 8.1.3 im Detail auf einen wichtigen Effekt an, nämlich die magnetische Resonanz. Betrachte dazu einen Festkörper mit N untereinander nicht wechselwirkenden Atomkernen oder auch mit N untereinander nicht wechselwirkenden Elektronen, jeder bzw. jedes mit Spin 12 und entsprechendem magnetischen Mo unterment μmag . Diese bilden dass System A. Das System sei einem äußeren Magnetfeld H worfen, das wir zunächst statisch annehmen und dann später durch ein Wechselfeld ergänzen bzw. ersetzen. Das äußere Magnetfeld erlaubt, über den Zeeman-Effekt gezielt die Niveaus des Systems A zu präparieren bzw. zu verändern und somit Prozesse im Detail zu studieren. Am Ende werden wir herausfinden, wie man die Spins von Atomkernen durch Einstrahlung eines magnetischen Wechselfeldes polarisieren kann, ein Effekt, der für die gesamte Hochenergie- und Hadronenphysik von immenser Bedeutung ist. Dort führt man Elektronen- und Myonenstreuung an polarisierten Protonen durch, um zu studieren, wie sich der Spin des Nukleons von J = 1/2 aus den Spins und Bahndrehimpulsen der Quarks und Gluonen zusammensetzt. Dies ist ein Gebiet an vorderster Forschungsfront.
8.2.1 Statisches Magnetfeld Wir betrachten im Folgenden einen Festkörper und seine Atome auf den Gitterplätzen. Setzen in z-Richtung aus, dann haben wir bei jedem wir dieses System einem äußeren Magnetfeld H
290
8 Irreversible Prozesse, Transport, Fluktuationen
Atomkern4 mit Spin = 1/2 den Hamiltonoperator HA mit zwei Energieeinstellungen, die durch das magnetische Moment des Kerns μN μP gegeben sind: ε1 = −μN H
Besetzung: n1
(8.32)
ε2 = +μN H
Besetzung: n2
(8.33)
mit n1 + n 2 = N
(8.34)
n1 − n 2 = n
(8.35)
ε2 = μ H W21
W12
ε1 = −μ H Abbildung 8.3: Illustration der möglichen Übergänge im Atomkern (System A), der einem konstanten Magnetfeld H ausgesetzt ist und im Kontakt mit dem gesamten Festkörper (Wärmereservoir A ) steht. Die Pfeile geben die Übergänge mit den Übergangswahrscheinlichkeiten an.
Der Festkörper wirkt als Wärmebad A der Temperatur T = (kB β )−1 , das durch Wärme-Kontakt mit dem Atomkern (System A) dort Übergänge induziert. Dann gilt für jeden einzelnen Atomkern nach Gl. (8.29) e−β ε1 W21 = −β ε = eβ (ε2 −ε1 ) W12 e 2
(8.36)
Nun gilt β (ε2 − ε1 ) = 2β μN H. Wir zeigen unten, dass man die Gl. (8.36) linearisieren darf. Damit erhalten wir für die Atomkerne W21 = W12 (1 + 2β μN H)
(8.37)
und mit n = n1 − n2 n1 = e−β (ε1 −ε2 ) = e2β μN H ≈ 1 n2
⇒
nN
Dies entspricht bei nicht zu kleinen Temperaturen einer Gleichgewichtsverteilung, wenn die Magnetfelder im Labor nicht viel größer als 104 gauss sind. Wir zeigen jetzt, dass man Gl. (8.36) linearisieren darf, und zwar für Kern- als auch für atomare Übergänge der Elektronen. Dabei berücksichtigen wir, dass die Nukleonenmasse und Elektronenmasse sich verhalten wie MN 2000me und deshalb gilt wegen des anomalen magnetischen 4 Wir
diskutieren die Statistik der Spins der Atomkerne. Die Betrachtungen gelten völlig analog für die Elektronen.
8.2 Magnetische Resonanz
291
Moments des Protons μe 700μN . Wir betrachten gewöhnliche Felder im Labor: Labor-Magnetfelder: H ≈ 104 gauss. Atomkerne: μN μProton = 2.79e¯h/2mP c = 2.79 × 5.050785 · 10−24 erg/gauss. Elektronen: μe = μB = e¯h/2me c = 9.248477 × 10−21 erg/gauss. Zimmertemperatur: kB T = 300 × 1.3 × 10−16 erg. Damit ergibt sich Atomkerne:
μN H 14 × 10−24 × 104 ≈ 10−6 1 ≈ kB T 300 × 1.3 × 10−16
Elektronen:
μe H ≈ 10−3 1 kB T
8.2.2 Statisches Magnetfeld und Wechselfeld sei unser Festkörper noch einem elektromagnetischen WechZusätzlich zum statischenFeld H selfeld A(r,t) = A0ε cos k ·r − ωt der Frequenz ω mit ε ·k = 0 unterworfen. Wir wählen h¯ ω ≈ ε2 − ε1 = 2μN H, so dass durch dieses Feld Kern-Übergänge induziert werden. Es folgt daher für die Übergangswahrscheinlichkeit pro Zeit V21 nach der quantenmechanischen zeitabhängigen Störungstheorie (Goldene Regel) V21 = μN2
2 π < 2 | A0ε · pˆ exp(ik ·r) | 1 > [δ (ε2 − ε1 − h¯ ω) + δ (ε2 − ε1 + h¯ ω)] 2¯h
Damit ergibt sich für die Übergänge ε1 ↔ ε2 der Kerne V12 = V21 = V Die Mastergleichung (8.3) für die mittleren Besetzungszahlen lautet nun: dn1 = n2 (W21 +V ) − n1 (W12 +V ) dt dn2 = n1 (W12 +V ) − n2 (W21 +V ) dt
(8.38) (8.39)
oder für den Unterschied der Population n = n1 − n2 der Kern-Niveaus d n = −2n1 (W12 +V ) + 2n2 (W21 +V ) dt
(8.40)
Setze nun nach Gl. (8.37) W21 = W (1 + 2β μN H) und mit n N und
N−n 2
und
W12 = W
= n2 zur Vereinfachung 4β μN HW n2 = 4β μN HW
N −n ≈ 2β μN HW N 2
(8.41)
292
8 Irreversible Prozesse, Transport, Fluktuationen
So erhalten wir aus Gl. (8.40) dn (8.42) = −2(W +V )n + 2β μN HW N dt Fall: Gleichgewicht, kein Wechselfeld Wegen des angenommenen Gleichgewichts und V = 0 ändern sich die Besetzungszahlen nicht und wir haben dn/dt = 0. Dann folgt sofort aus Gl. (8.42) für die Differenz n0 der mittleren Besetzungszahlen im ungestörten Gleichgewicht n0 = Nβ μN H
(8.43)
Dieses Resultat ist sinnvoll, denn im Gleichgewicht mit dem Festkörper und ohne äußere Einstrahlung haben wir natürlich eine kanonische Verteilung des Kernspins über die zwei Niveaus, also e−β ε1 1 ≈ N (1 + β μN H) −β ε −β ε 1 2 2 e +e −β ε e 2 1 ≈ N (1 − β μN H) n2 = N −β ε −β ε 1 2 2 e +e
n1 = N
weil β ε1/2 = ±μN H/kB T 1, und daher gilt (n1 − n2 )Gleichgewicht = n0 = Nβ μN H
(8.44)
wie oben in Gl. (8.43) ebenfalls gezeigt wurde. Fall: Einstellung des Gleichgewichts, kein Wechselfeld Mit Gl. (8.44) erhalten wir aus Gl. (8.42) dn = −2W (n − n0 ) − 2V n dt Für V = 0 und beliebiger Anfangsverteilung n(ti ) erfolgt für t ≥ ti das Einstellen des Gleichgewichts nach dn = −2W dt n − n0 und damit n(t) = n0 + (n(ti ) − n0 ) e−2W (t−ti ) Also: Das Gleichgewicht für das Kernspin-System in thermischem Kontakt mit dem Wärmereservoir wird in exponentieller Weise erreicht unabhängig von n(ti ). Mit Einführung der Relaxationszeit schreiben wir n(t) = n0 + (n(ti ) − n0 ) e−t/τ
τ=
1 = Relaxationszeit 2W
(8.45)
Je stärker die Übergangswahrscheinlichkeit W , d.h. die Wechselwirkung des Kernspins mit dem Gitter, umso kürzer die Relaxationszeit.
8.3 Dynamische Kernpolarisation
293
Fall: Einstellung des Gleichgewichts bei Einstrahlung, aber schwache Wechselwirkung mit dem Wärmereservoir Jetzt erhalten wir mit W V aus Gl. (8.42) sofort dn = −2V n dt
⇒
n(t) = n(ti )e−2V (t−ti )
(8.46)
Hier relaxiert das System der Kernspins mit τ = 1/2V zum Wert n(t → ∞) = 0, unabhängig von n(ti ). Das Endresultat nach hinreichend langer und hinreichend starker Einstrahlung ist also eine Gleichverteilung der Besetzungszahlen, i.e. n1 − n2 = 0 bzw. n1 = n2 . Diesen Zustand der identischen Besetzung bei äußerer Einstrahlung bezeichnet man als Sättigung. Achtung: Beim Paramagnetismus, wo keinerlei äußere Einstrahlung vorliegt, hatten wir mit Sättigung den Zustand bezeichnet, bei dem das obere Niveau vollständig besetzt war und das untere leer. Elektronen: Wir haben in diesem Kapitel 8.2 die Wechselwirkung der Kernspins mit dem und dem eingestrahlten Feld A(r,t) betrachtet. Der Formalismus gilt identisch äußeren Feld H auch für die Statistik der Elektronen der atomaren Hülle. Der einzige Unterschied besteht darin, dass man μN durch das (wesentlich größere) μe ersetzen muss.
8.3 Dynamische Kernpolarisation Der folgende Effekt der dynamischen Kernpolaristion ist ein wichtiger Nichtgleichgewichtseffekt, den man verwendet, wenn man z.B. Protonen polarisieren will, um dann Elektronenstreuung an diesen durchzuführen. Das wird an großen Beschleunigern getan, um die Verteilung des Dreh-impulses innerhalb des Protons und sein Zustandekommen aus den Spins der Quarks und Gluonen zu bestimmen. Man macht sich dabei zunutze, dass die Protonen in Wasserstoffatomen gebunden sind und eine Hyperfein-Wechselwirkung mit den Elektronen haben. Da die Elektronen ein 700-fach größeres magnetisches Moment als die Protonen besitzen, ist deren Wechselwirkung mit dem Wärmereservoir des Festkörpers, in den die Wasserstoffatome eingebunden sind, merklich größer, was bei geschickter Einstrahlung eines Hochfrequenzfeldes eine wesentlich größere Polarisation der Protonen zur Folge hat, wie gleich gezeigt wird. Das gesamte System ist ausgesetzt, das in z-Richtung zeigt. Also: Anwendung einem statischen äußeren Magnetfeld H des in Kap. 8.2 Gezeigten auf ein System bestehend aus: Atomkerne: Elektronen:
Spin I = 1/2 Spin S = 1/2
μN μe
E1 = −μN H E2 = +μN H ε1 = −μe H ε2 = +μe H
Die Wechselwirkung Kern-Elektron ist die Hyperfein-Wechselwirkung, hervorgerufen durch das stationäre Magnetfeld, das das Elektron am Kernort erzeugt. Wenn man mit I den Kernspin bezeichnet und mit S den Elektronenspin, dann ist der Wechselwirkungsoperator: H = aI · S
mit Iz + Sz = Konstante der Bewegung
Weil H rotationssymmetrisch ist und wir die z-Achse als Quantisierungsachse nehmen, gilt
294
8 Irreversible Prozesse, Transport, Fluktuationen
Erhaltung des Gesamtdrehimpulses entlang der z-Achse, die gleich der Richtung des äußeren H-Feldes genommen wird. Die Folge dieser Erhaltung ist, dass bei einem Übergang (Spin-Flip) des Kerns das Elektron den umgekehrten Spin-Flip durchführen muss. Kern: E2 → E1
⇒
Elektron: ε1 → ε2
und umgekehrt. Die Übergänge der Protonen und Elektronen sind also gekoppelt. Damit sind die Atomkerne über die Elektronen an den Festkörper (Wärmereservoir) gekoppelt. Im Gleichgewicht folgen also sowohl die Kerne als auch die Elektronen der kanonischen Verteilung mit einer Temperatur des Festkörpers. Wir wollen im Folgenden zeigen, dass man diese wechselseitigen Kopplungen ausnutzen kann, die Spins der Atomkerne so zu polarisieren, als hätten sie ein magnetisches Moment des Elektrons, was etwa 700 Mal größer ist als das des Atomkerns. Seien im Folgenden mit N1 und N2 die mittleren Besetzungszahlen der Kernniveaus mit Energien E1 und E2 bezeichnet und mit n1 und n2 die mittleren Besetzungszahlen der Elektronenniveaus mit Energien ε1 und ε2 . Dann haben wir für die Kerne im thermischen Gleichgewicht mit dem Wärmereservoir des Festkörpers der Temperatur T = (kB β )−1 e−β E2 eβ μN H N2 = −β E = −β μ H = e2β μN H N 1 N1 e e
(8.47)
n2 e−β ε2 eβ μe H = −β ε = −β μ H = e2β μe H e n1 e 1 e
(8.48)
und analog für die Elektronen
Die Polarisation der Kerne, d.h. die unterschiedliche Besetzung der beiden Spin-Zustände, durch das äußere Magnetfeld ist mit ihrem kleinen magnetischen Moment wesentlich geringer als das der Elektronen. Wir definieren die Polarisationen für die Kerne und Elektronen: ξN =
N1 − N2 N1 + N2
ξe =
n1 − n2 n1 + n2
Nun gilt | μe |≈ 700 | μN |. Daraus folgt ξN ξe 1 Weil das Kern-Elektron-System im thermischen Kontakt mit dem Wärmebad steht, gilt analog zu Gl. (8.29): W (E1 , ε2 → E2 , ε1 ) e−β (ε1 +E2 ) = = e−2β (μN −μe )H W (E2 , ε1 → E1 , ε2 ) e−β (ε2 +E1 ) Im Gleichgewicht gilt: N1 n2W (E1 , ε2 → E2 , ε1 ) = N2 n1W (E2 , ε1 → E1 , ε2 )
detailliertes Gleichgewicht, ”detailed balance”
8.4 Brownsche Bewegung
295
Daraus folgt wegen | μe |≈ 700 | μN |, dass das folgende Verhältnis der Besetzungszahlen nur von μe bestimmt wird: n2 N1 W (E2 , ε1 → E1 , ε2 ) = = e2β (μN −μe )H ≈ e−2β μe H n1 N2 W (E1 , ε2 → E2 , ε1 ) Nehmen wir an, dass ein äußeres Magnetfeld mit einer Frequenz eingestrahlt wird, die den elektronischen Niveaus entspricht: h¯ ω ≈ ε2 − ε1 = 2μe H, und nehmen wir an, dass es stark genug ist und lang genug wirkt, um das elektronische System zu sättigen, i.e. n1 ≈ n2 . Dann gilt (Energie wird aus dem Feld gezogen): N1 ≈ e−2β μe H N2 D. h., die Atomkerne sind polarisiert, als ob sie selbst mit einem μe /μN ≈ 700-fachen magnetischen Moment ausgerüstet seien! Dies ist das Resultat einer stationären NichtgleichgewichtsSituation, die durch die Einstrahlung des Wechselfeldes aufrechterhalten wird. Dabei ist das Gesamtsystem Kern-Elektron im Gleichgewicht mit dem Gitter. Der Effekt ist im Prinzip ganz einfach: Wenn wir n1 /n2 künstlich ändern, wie hier durch die Einstrahlung, adjustiert sich N1 /N2 , so dass die Bedingung des detaillierten Gleichgewichts erfüllt ist. Die hier beschriebene große Polarisation der Kernspins nennt man Overhauser-Effekt.
8.4 Brownsche Bewegung Wir betrachten ein kleines, aber makroskopisches Teilchen in einer Flüssigkeit der Temperatur T schwimmend: Dieses Teilchen unter dem Mikroskop beobachtet, führt erratische Bewegungen aus, die man Brownsche Bewegung nennt. Sie tritt auf, weil sich die Moleküle der Flüssigkeit alle bewegen (Maxwell-Verteilung) und mit dem Teilchen kollidieren. Es findet ein permanenter Energieaustausch statt zwischen dem makroskopischen Teilchen, beschrieben durch seinen Schwerpunkt x(t) und dessen Geschwindigkeit v(t), und den vielen Freiheitsgraden der Flüssigkeit, also sämtlichen Positionen und Impulsen der benachbarten Flüssigkeitsmoleküle. Deshalb sind bei der Beschreibung des Systems Begriffe wie Dissipation und Reibung von Bedeutung. Die Flüssigkeitsmoleküle insgesamt üben eine zeitlich fluktuierende Kraft auf das Brownsche Teilchen aus, die in diesem Kapitel statistisch behandelt werden wird. Das Phänomen der Brownschen Bewegung und seine Erklärung durch Einstein und Smoluchowski war zu Beginn des 20. Jh. von Bedeutung, weil durch sein Verständnis die atomistische Theorie der Materie und ihre statistische Beschreibung allgemein an Zustimmung gewann. Am Ende dieses Kapitels erhalten wir als Resultat die wichtige Disspiations-Fluktuations-Relation von Einstein. Sie ergibt eine Möglichkeit, die Boltzmann-Konstante kB zu messen.
8.4.1 Langevin-Gleichung Wir beschränken uns der Einfachheit halber auf ein eindimensionales System. Die Bewegung des Brownschen Teilchens kann näherungsweise durch die Newtonsche Bewegungsgleichung
296
8 Irreversible Prozesse, Transport, Fluktuationen
seines Schwerpunkts x(t) beschrieben werden, auf den neben der oben erwähnten zeitlich fluktuierenden Kraft F(t), hervorgerufen durch die Kollision der Moleküle der Flüssigkeit mit dem Brownschen Teilchen, noch eine zeitlich schwach veränderliche äußere Kraft f (t) wie etwa die Gravitationskraft oder eine elektromagnetische Kraft wirken möge. Wir haben also für die Bewegung des Schwerpunkts: x = x(t)
⇒
m
dv = f (t) + F(t) dt
(8.49)
Um Statistik zu treiben, betrachten wir ein Ensemble vieler identischer Systeme, jedes mit einer anderen fluktuierenden Kraft F(t), etwa der Art, wie in Abb. (8.4) dargestellt. Da keine Richtung ausgezeichnet ist, setzen wir voraus, dass F(t) ebenso oft positiv wie negativ ist. F(t)
0 t
τ∗ Abbildung 8.4: Beispiel einer zeitlich fluktuierenden Kraft, die von den Molekülen der Flüssigkeit auf das schwimmende Brownsche Teilchen ausgeübt wird. Eine typische Größe ist der mittlere zeitliche Abstand τ ∗ zwischen zwei Maxima oder Minima.
Hierbei ist der mittlere Abstand τ ∗ zwischen zwei aufeinander folgenden Maxima oder Minima eine Größe, die charakteristisch ist für die fluktuierende Kraft. Dieses τ ∗ ist sehr klein auf einer makroskopischen Skala. Es sollte in einer typischen Flüssigkeit bei Zimmertemperatur etwa gleich sein dem folgenden Verhältnis τ∗ =
mittlerer intermolekularer Abstand ≈ 10−13 sec mittlere molekulare Geschwindigkeit
Die Geschwindigkeit des makroskopischen Brownschen Teilchens ist gegeben durch v(t) = v(t) + v (t). Hierbei ist v(t) im Wesentlichen (aber nicht vollständig, siehe unten) durch f (t) gegeben. Der fluktuierende Teil der Geschwindigkeit v (t) fluktuiert schnell, aber nicht so schnell wie die fluktuierende F(t), weil das Brownsche Teilchen eine „große” Masse hat und somit träge ist. Für eine makroskopische Messung ist v(t) relevant. Um v(t) zu bestimmen, integrieren wir die Bewegungsgleichung (8.49) über ein Zeitintervall τ, das auf der makroskopischen Skala klein ist, und zwar so klein, dass die äußere Kraft f (t) als konstant betrachtet werden kann. Gleichzeitig
8.4 Brownsche Bewegung
297
soll τ wesentlich größer als die mikroskopische Skala sein, also die charakteristische Fluktuationszeit. Es soll also gelten τ τ ∗ . Damit erhalten wir m [v(t + τ) − v(t)] = f (t)τ +
t+τ
t
F(t )dt
=0
wobei wir vorausgesetzt haben, dass F(t) im Zeitintervall τ so häufig das Vorzeichen wechselt, dass das Integral darüber verschwindet. Weiter nehmen wir an, dass f (t) sich so langsam ändert, dass wir es im gesamten Zeitintervall τ als konstant ansehen können. Somit bekommen wir m [v(t + τ) − v(t)] + m v (t + τ) − v (t) = f (t)τ Wir führen jetzt eine Ensemblemittelung durch und nehmen an, dass sich dabei der fluktuierende Anteil v (t) herausmittelt. Damit erhalten wir eine zunächst plausibel aussehende Gleichung m
dv =f dt
Diese Gleichung kann aber nicht ganz richtig sein: Man betrachte die Situation, in der durch irgendwelche Anfangsbedingungen das Teilchen zur Zeit t ein endliches v hat5 . Dann wirken immer in einer Flüssigkeit Reibungskräfte, die dafür sorgen, dass nach einer gewissen Zeit das v gleich null wird, also v(t ¯ → ∞) = 0. Diese Reibungskräfte müssen in F(t) enthalten sein, es muss also F(t) ein F(t) enthalten, was langsam veränderlich ist, welches die Reibungskräfte darstellt und dafür sorgt, dass eben v(t ¯ → ∞) = 0 wird. Dieses F(t) muss von der Geschwindigkeit des Brownschen Teilchens abhängen, und wenn wir es nach v entwickeln, muss in erster Näherung gelten: F(t) = F(t) + F (t)
(8.50)
F(t) = −αv(t)
(8.51)
Der Ausdruck ist sinnvoll, denn die Reibungskraft bremst das Teilchen, wirkt also der Geschwindigkeit entgegen, und ein Teilchen ohne Anfangsgeschwindigkeit bleibt in Ruhe, wie es auch die Gleichung ergibt: F = 0 für v = 0. Die Größe α ist die relevante Reibungskonstante. Daraus folgt dv = f (t) + F(t) dt oder mit fluktuierendem Teil der als Langevin-Gleichung bekannte Ausdruck m
Langevin-Gleichung:
m
dv = f (t) − αv + F (t) dt
(8.52)
Hier haben wir αv ≈ αv gesetzt, weil der fluktuierende Anteil von v wegen der großen Masse des Brownschen Teilchens kleiner ist als der fluktuierende Anteil F (t) von F. 5 Man
denke an die Einwirkung einer elektromagnetischen Kraft, die dem als geladen angenommenen Teilchen eine Geschwindigkeit v verleiht und plötzlich abgeschaltet wird.
298
8 Irreversible Prozesse, Transport, Fluktuationen
Die Langevin-Gleichung unterscheidet sich von der Newtonschen Bewegungsgleichung (8.49) dadurch, dass F(t) explizit zerlegt ist in eine Reibungskraft −αv, die langsam varierend ist, und einen ausschließlich fluktuierenden Anteil F (t), der komplett zufällig ist. Bei jedem x(t) und v(t) gilt deshalb: t+τ t
F (t )dt = 0
(8.53)
Die Langevin-Gleichung (8.52) ist eine Differentialgleichung, die bei bekannter Reibungskonstante α die Zeitentwicklung von x(t) und v(t) bestimmt, wenn die Anfangsbedingungen x(t0 ) und v(t0 ) bekannt sind. Der Reibungsterm −αv sorgt dafür, dass Energie aus dem Translationskanal in die vielen Energiezustände des Wärmereservoirs (Molekularbewegung der Füssigkeit) dispergiert. Dies ist ein irreversibler Vorgang, weil aus einem Freiheitsgrad Energie in viele Freiheitsgrade übertragen wird. Wegen Gl. (8.53) ergibt in der Langevin-Gl. (8.52) eine Mittelung über die Zeit die schon bekannte Reibungsgleichung (8.12).
8.4.2 Dissipation, Diffusion Betrachte thermisches Gleichgewicht und verschwindende äußere Kraft zum Zeitpunkt t = 0, dann gilt x(0) =< x(0) >= 0, und auch x2 (0) =< x2 (0) >= 0. Nach einer gewissen Zeit t gilt ohne äußere Kraft immer noch x(t) =< x(0) >= 0, aber im Allgemeinen ist x2 (t) =< x2 (t) >= 0. Wie immer identifizieren wir eine Mittelung über eine Vielzahl realer Trajektorien, angedeutet durch x2 (t), mit einer Ensemblemittelung, angedeutet durch < x2 (t) >. Im Folgenden wollen wir < x2 (t) > berechnen und die wichtige Dissipations-Fluktuations-Relation von Einstein (kurz: Einstein-Relation) herleiten. Dazu berechnen wir: m
dv = −αv + F (t) dt
Mit xx¨ = folgt
m
| ·x
d (xx) ˙ − x˙2 dt
d (xx) ˙ − x˙2 = −αxx˙ + xF (t) dt
(8.54)
Führe nun die Ensemblemittelung durch6 . Daraus folgt dann m
d < xx˙ >= < x˙2 > −α < xx˙ > − < xF
m > dt kB T
(8.55)
<x>=0
zeigen kurz, dass für eine beliebige Größe Y (t) immer gilt dtd < Y >=< dtd Y >, denn bei M Ensemblemitgliedern haben wir d 1 M (k) d dY (k) 1 d Y < Y >= = ∑ dt =< dt Y > dt dt M ∑ M k k .
6 Wir
8.4 Brownsche Bewegung
299
Der letzte Term auf der RHS wird wegen der großen Masse und der langsameren Bewegung des Brownschen Teilchens als separabel angenommen. Der ganze Term verschwindet damit. Denn, wie bei der Definition von < F > angenommen, verschwindet der Mittelwert von < F > nach Gl. (8.53) unabhängig von x(t) und v(t). Weiterhin gilt das Äquipartitionstheorem, hier also < mx˙2 >= kB T . Daraus folgt dann aus Gl. (8.55) α kB T mit γ = . α m denn die Differentialgleichung (8.55) wird erfüllt von: d kB T < xx˙ >= −γCe−γt = −γ < xx˙ > − dt α < xx˙ >= Ce−γt +
Die Integrationskonstante C können wir festlegen. Nehmen wir an, an t = 0 sei x = 0 für alle Ensemblemitglieder. Dann muss dort < xx˙ >= 0 sein. Die Integrationskonstanten sind so gewählt worden, dass an t = 0 auch < x2 >= 0. Also erhalten wir: C+
kB T =0 α
und daraus < xx˙ >=
kB T 1d < x2 >= 1 − e−γt 2 dt α
oder 2kB T < x (t) >= α 2
1 −γt t − 1−e γ
Um den physikalischen Gehalt zu verstehen, diskutieren wir zwei Grenzfälle: Grenzfall t 1/γ
t
1 m = γ α
⇒ < x2 >=
2kB T α
1 1 t− 1 − 1 + γt − γ 2t γ 2
woraus wir eine Dispersion ∝ t 2 , also quadratisch in der Zeit erhalten kB T 2 t (8.56) m D. h., das Teilchen verhält sich für ein kleines Zeitintervall wie ein freies thermisches Teilchen mit der Geschwindigkeit vth : 1 2 1 mvth = kB T 2 2 denn kB T 2 kB T kB T ⇒ x= t ⇒ x2 = t vth = m m m < x2 (t) >=
300
8 Irreversible Prozesse, Transport, Fluktuationen
Grenzfall
t 1/γ
1 2kB T 1 m 2kB T = ⇒ < x2 >= t (8.57) t− ≈ γ α α γ α Jetzt ist die Dispersion für ein großes Zeitintervall ∝ t, also linear in der Zeit. Das ist ein Resultat, was dem Random-Walk-Problem entspricht, wie wir im nächsten Kapitel zeigen werden. Wir hatten schon einmal Dispersion studiert im Zusammenhang mit der Boltzmann-Gleichung. Dort hatten wir Gl. (8.18) für die Dispersion hergeleitet. Vergleichen wir dies mit der obigen Gl. (8.57) so erhalten wir für die Diffusionskonstante t
kB T < x2 >= 2Dt (8.58) α Triviale Umformung ergibt die Dissipations-Fluktuations-Relation von Einstein: D=
Einstein-Relation:
αD = kB T
(8.59)
Die Einstein-Relation kann man folgendermaßen verstehen: Sowohl die Reibung (allgemeiner Dissipation) als auch die Diffusion (allgemeiner Fluktuation) haben ihren Ursprung in den Stößen zwischen den Teilchen. Daher gibt es den Zusammenhang zwischen α und D. Das Produkt aus beiden hängt nur noch von der Temperatur ab, d.h. von der mittleren Geschwindigkeit der Moleküle. Generell gesehen hat diese Aussage eine große Bedeutung: Die gleichen zufälligen Kräfte, die bei einer Gleichgewichtssituation die erratische Bewegung eines Teilchens bei der Brownschen Bewegung erzeugen, ziehen auch Reibungskräfte nach sich, wenn das Teilchen durch die Flüssigkeit gezogen wird. Hier werden also die reversiblen Fluktuationen im Gleichgewicht in Bezug gesetzt zu irreversibler Dissipation von Bewegungsenergie in Reibungswärme, was zwei grundsätzlich verschiedene Gebiete der Statistik und Thermodynamik miteinander verbindet. Es gibt interessante Anwendungsbeispiele der Einstein-Relation, die zur Messung von D und auch von kB führen. Betrachte ein Teilchen mit der Ladung q in einer viskosen Flüssigkeit ausgesetzt einem elektrischen Feld E in z-Richtung. Die Langevin-Gleichung (8.52) lautet dv = qE − αv + F (t) dt Nehmen wir die Mittelwerte auf beiden Seiten und betrachten wir die stationäre Situation, definiert durch dv/dt = 0, so erhalten wir m
qE − αv = 0 Wenn wir die Mobilität definieren durch μmob = v/E , so erhalten wir v q = (8.60) E α Die Mobilität und der Diffusionskoeffizient D sind also beide mit dem Reibungskoeffizienten α verknüpft. Wir erhalten damit einen alternativen Ausdruck für die Einstein-Relation μmob =
Einstein-Relation:
q μmob = D kB T
(8.61)
8.4 Brownsche Bewegung
301
Die Diffusionskonstante D ist also proportional zur Mobilität μmob des Teilchens. Durch Messung von μmob erhalten wir also ein Verfahren, das D zu bestimmen. Wenn wir umgekehrt in der gleichen Flüssigkeit das D durch Messung von < x2 > nach Gl. (8.15) bestimmt haben, dann haben wir nach Gl. (8.61) auch kB gemessen. Ähnliche Überlegungen gehen vom Stokes-Gesetz Gl. (8.21) aus. Bei der Brownschen Bewegung einer kleinen Kugel vom Radius r0 in einer Flüssigkeit mit Viskosität η ist die Reibungskonstante α gegeben durch α = 6πr0 η und somit ist die Diffusionskonstante gleich D = kB T /6πr0 η und das mittlere Auslenkungsquadrat gleich < x2 >=
kB T t 3πr0 η
Wenn wir η gemessen haben und < x2 > bestimmen, dann haben wir kB festgelegt. Umgekehrt, wenn wir das kB kennen, haben wir eine Methode zur Messung der Viskosität η.
9 Der zentrale Grenzwertsatz der Statistik In diesem Buch wurde an mehreren Stellen ein Formalismus eingeführt, der explizit mit dem Gesetz der großen Zahl zusammenhing, wobei meistens die Zahl der Teilchen N 1024 oder die ebenso große Zahl der Freiheitsgrade relevant war. Beispiele sind die Gleichheit von mittlerer und innerer Energie bei einem abgeschlossenen System in Kap. 2.3.1, die Schärfe der Verteilung in Kap. 2.6.6 oder die Äquivalenz des mikrokanonischen und kanonischen Ensembles in Kap. 4.4.7. Alle diese Fakten hängen begrifflich und mathematisch eng mit dem zentralen Grenzwertsatz der Statistik zusammen, den wir in diesem Kapitel beweisen und diskutieren wollen. Um in die Argumentationsweise einzuführen, betrachten wir zunächst das Random-Walk-Problem, das ein eindimensionales und einfaches Beispiel des zentralen Grenzwertsatzes darstellt und das Gesetz großer Zahlen erläutert. In einem zweiten Schritt wird dann der zentrale Grenzwertsatz formuliert und bewiesen.
9.1 Das Random-Walk-Problem Wir betrachten folgendes eindimensionale sog. Random-Walk-Problem: Beginnend an der Stelle x = 0 führen wir Schritte aus mit folgenden Eigenschaften: Jeder Schritt ist von gleicher Länge l. Jeder Schritt ist unabhängig vom vorhergehenden. p = bezeichnet die Wahrscheinlichkeit für einen Schritt nach rechts. q = 1 − p bezeichnet die Wahrscheinlichkeit für einen Schritt nach links. Gesucht ist am Ende die Wahrscheinlichkeit PN (m), nach N Schritten an der Position x = ml angekommen zu sein, wobei man von x = 0 gestartet ist. Wir werden erhalten: N+m N−m N! PN (m) = N+m N−m p 2 (1 − p) 2 ! ! 2 2
(9.1)
Daraus werden wir die folgenden gemittelten Größen berechnen x = N(p − q)l 2
Δ2 x = (x − x) = 4N pql 2
(9.2) (9.3)
9.1.1 Gesetz großer Zahlen Berechne zum Beweis zunächst die Anzahl AN (n p ) der Möglichkeiten, in denen N Objekte (oder Schritte) untergebracht werden können in N = n p + nq Plätzen. Bei diesen Schritten sollen n p ununterscheidbar und vom Typ 1 sein (Schritte nach rechts) und nq ebenfalls ununterscheidbar aber vom Typ 2 (Schritte nach links). Diese Anzahl ist gegeben durch
K. Goeke, Statistik und Thermodynamik, DOI 10.1007/ 978-3-8348-9748-0_9, © Vieweg+Teubner Verlag |Springer Fachmedien Wiesbaden GmbH 2010
304
9 Der zentrale Grenzwertsatz der Statistik
AN (n p ) =
N! n p !nq !
(9.4)
Die Begründung für diese Formel ist die Folgende: Im Prinzip sind alle Objekte (Schritte) unterscheidbar und dann gibt es N! verschiedene Möglichkeiten, die N Objekte auf die N Plätze zu verteilen. Da aber die Wirkung z.B. der n p Objekte (Schritte nach rechts) gleich ist, sind diese Objekte ununterscheidbar und alle n p ! Permutationen dieser Objekte führen zur gleichen Situation. Das Gleiche gilt für die nq Objekte (Schritte nach links). Wenn wir also die Zahl aller Möglichkeiten N! durch die Zahl der irrelevanten Permutationen teilen, also AN (n p ) = N!/(n p !nq !) bilden, haben wir die gesuchte Zahl AN (n p ). Wenn wir die Wahrscheinlichkeit p betrachten, einen Schritt nach rechts zu machen, und die Wahrscheinlichkeit q = 1 − p für einen Schritt nach links, so können wir sofort aus Gl. (9.4) die Wahrscheinlichkeit angeben, n p Schritte nach rechts (in einer Gesamtzahl von N Schritten) zu haben: N! (9.5) WN (n p ) = pn p qnq n p !nq ! Offenbar ist die Gesamtwahrscheinlichkeit, irgendeinen Schritt nach rechts zu machen, gleich eins, was vernünftig ist: ∑Nnp =0 WN (n p ) = (p + q)N = 1. Wir benutzen dabei die binomische Formel. Ausgehend von Gl. (9.5) erhalten wir durch direkte Rechnung physikalisch brauchbare Ausdrücke: N
N! pn p qN−n p n p n !(N − n )! p p n p =0 N ∂ n p N−n p N! p p = ∑ q ∂p n p =0 n p !(N − n p )!
np =
∑
=p
∂ N N! pn p qN−n p ∂ p n∑ n !(N − n )! p p p =0
=p
∂ (p + q)N = pN (p + q)N−1 = pN
∂p =1
Daraus folgt n p = pN Genauso berechnen wir
nq = qN
n2p
∂ ∂ = p p (p + q)N ∂p ∂p = p N(p + q)N−1 + pN(N − 1)(p + q)N−2 = p [N + pN(N − 1)] = pN [1 + pN − p] = (N p)2 + p(1 − p)N = (N p)2 + pqN
(9.6)
9.1 Das Random-Walk-Problem
305
Daraus erhalten wir n2p = n p 2 + pqN und damit ergibt sich Δ2 n p = n2p − n p 2 = pqN
(9.7)
Man kann Gl. (9.5) und die obigen Formeln einfach umrechnen auf die Entfernung vom Ursprung, was die eigentlich interessierende Größe ist. Dazu führen wir ein m = n p − nq , was ergibt n p = (N + m)/2 und nq = (N − m)/2. Damit folgt für die Wahrscheinlichkeit, nach N Schritten die Entfernung ml vom Ursprung erreicht zu haben: N+m N−m N! PN (m) = N+m N−m p 2 (1 − p) 2 ! 2 ! 2
(9.8)
Damit haben wir: m= m2 =
N
∑ mPN (m)
(9.9)
∑ m2 PN (m)
(9.10)
m=0 N m=0
Aus Gl. (9.6) folgt m = n p − nq = N(p − q)
x = Nl(p − q)
(9.11)
und nach Gl. (9.7) erhalten wir Δm = m − m = 2(n p − n p ) (Δm)2 = (m − m)2 = 4 n2p − 2n p n p + n p 2 Δ2 m = (Δm)2 = 4 n2p − n p 2 = 4pqN
(9.12) (9.13) (9.14)
Damit sind wir weitgehend am Ziel: Wenn jeder Schritt eine Länge l hat und die Zeit für einen Schritt Δt ist, also damit die Zeit des Weges t = NΔt und der Abstand vom Startpunkt x = ml ist, erhalten wir das wichtige Faktum, dass sowohl x als auch (x − x)2 linear in der Zeit t sich entwickeln: x = N(p − q)l Δ2 x = (x − x)2 = 4N pql 2
∝N
∝t ∝N
(9.15) ∝t
(9.16)
Dies erinnert für p = q = an die Brownsche Bewegung eines Teilchens, bei der die Fluktuation ebenfalls ∝ t war, siehe Gl. (8.58). Wir können noch einen weiteren wichtigen Schluss aus diesen Gleichungen ziehen: Die relative Breite der Verteilung WN (n p ) bzw. analog PN (m) ist gegeben durch das Gesetz der großen Zahl im Fall N → ∞, also: √ Δ2 n p N pq q 1 1 √ = O( √ ) = (9.17) = np Np p N N 1 2
306
9 Der zentrale Grenzwertsatz der Statistik
oder
+ √ √ 1 Δ2 m 4N pq 4pq 1 √ = O( √ ) = = m N(p − q) p−q N N
(9.18)
√ Die Abweichung vom Mittelwert im Random Walk ist von der Größenordnung O(1/ N) und damit für sehr viele Schritte N am Ende sehr gering. Wir kennen so etwas von der Diskussion der Schärfe der Verteilung in Kap. 2.6.6. Beispiel: Abweichung vom Gleichgewicht im Gasvolumen Wir betrachten ein Volumen gefüllt gleichmäßig mit Gas und einer Teilchenzahl von N 1024 . Das Volumn sei in zwei gleiche Bereiche unterteilt, also p = q = 12 . Im Mittel haben wir dann n p = nq = N/2. Bei einer Messung können wir aber Abweichungen der√aktuellen Teilchenzahl vom Mittelwert feststellen, die dann 12 sind. Die ist eine extrem kleine relative von der Größenordnung Δ2 n p = N pq 0.5 ∗ 10 −12 Schwankung von der Größenordnung Δ2 n p /n p 10 .
9.1.2 Normalverteilung Für eine große Anzahl von Schritten N wird die Kurve WN (n p ) immer stärker gepeakt um ihr Maximum an np , von dem wir natürlich erwarten, dass np = n p . Ein einfacher analytischer Näherungsausdruck ist durch die Gauß-Verteilung gegeben. Um diesen zu finden, entwickeln wir log (WN (n p )) um das zunächst unbekannte np und betrachten dabei n p als kontinuierliche Variable. Mit η = n p − np erhalten wir 1 1 n p )) + B1 η + B2 η 2 + B3 η 3 log (WN (n p )) = log (WN ( 2 6 mit Bk = d k log (WN (n p )) /dnkp an der Stelle np . Zur Berechnung der Ableitungen gehen wir von Gl. (9.5) aus und verwenden die Stirling-Formel, wobei wir n p 1 annehmen: log [WN (n p )] = log [N!] − log [n p !] − log [(N − n p )!] + n p log [p] + (N − n p ) log [q] Wir nehmn WN (n p ) als kontinuierliche Funktion von n p an und benutzen (n + 1)! d log[n!] log [(n + 1)!] − log [n!] = = log = log [n + 1] dn 1 n! und damit folgt für die erste Ableitung mit n p 1 B1 =
d log (WN (n p )) = − log[n p ] + log[N − n p ] + log[p] − log[q] dn p
Um das Maximum von WN (n p ) zu finden, setzen wir B1 = 0 und erhalten log
N − np p =0 np q
(9.19)
9.1 Das Random-Walk-Problem
307
oder (N − np )p = np q, so dass mit p + q = 1 gilt, wie erwartet: np = N p = n p
(9.20)
Die Gauß-Verteilung ist als am Mittelwert gepeakt. Die zweite Ableitung erhalten wir mit Gl. (9.19) d 2 log (WN (n p )) 1 1 B2 = =− − dn2p np N − np Wenn wir dies am Maximum np beetrachten, erhaltn wir B2 = −
1 1 1 − =− Np N −Np N
oder, wegen p + q = 1: B2 = −
1 1 + p q
1 1 =− 2 N pq Δ np
(9.21)
Offenbar ist B2 < 0 und damit zeigt WN (n p ) in der Tat ein Maximum an n p = np = n p . Wir nehmen im Folgenden das η als so klein an, dass wir Terme mit höheren als zweiten Ableitungen vernachlässigen können. Damit erhalten wir 1 1 2 2 log [WN (n p ] = log [WN ( = log WN ( B2 η B2 η n p ] + log exp n p ) exp 2 2 und damit
WN (n p ) WN ( n p ) exp −
1 (n − np )2 2N pq
B1 = 0, B3 klein
(9.22)
np) Weil WN (n p ) eine auf eins normierte Wahrscheinlichkeitsverteilung ist, können wir wir WN ( durch die Normierung bestimmen:
∑ WN (n p ) np
N 0
WN (x)dx
+∞ −∞
WN (x)dx
wobei [−∞, +∞] als Integrationsintervall genommen werden darf, weil nach Gl. (9.22) für N 1 an den ursprünglichen Integrationsgrenzen 0 und N und jenseits davon der Integrand nahezu verschwindet. Somit erhalten wir 1 (n p − N p)2 −2 WN (n p ) = (2πN pq) exp − (9.23) 2N pq oder
2 − 12 exp − WN (n p ) = 2π Δ n p
(n p − n p )2 2 (Δ2 n p ) mit Δ2 = N pq
(9.24)
Damit ist die Wahrscheinlichkeitsverteilung für die Abweichung vom Startplatz mit n p = 12 (N + m) bei großen N gegeben durch
308
9 Der zentrale Grenzwertsatz der Statistik
PN (m) = WN
N +m 2
− 12
= (2πN pq)
[m − N(p − q)]2 exp − 8N pq
(9.25)
Wir können dies umrechnen in die Wahrscheinlichkeit, nach N Schritten das System im Intervall [x, x + dx] vorzufinden. Diese ist (bei großen N) gegeben durch die Gauß-Verteilung, die in diesem Zusammenhang Normalverteilung genannt wird: P(x)dx = P0 exp(−
(x − x)2 )dx 2σ 2
x = l(p − q)N
σ =l
4N pq
(9.26)
−1 2πσ und Δ2 x = σ 2 . √ Die Größe σ = Δ2 x heißt Standardabweichung und gibt die Breite der Verteilung an. Zur Illustration dieser Größe ist es hilfreich, durch Wahl des Integrationsintervalls [x − kσ , x + kσ ] die Wahrscheinlichkeit auszurechnen, einen x-Wert in einem Bereich von k = 1, 2, 3, ... Standardabweichungen um x herum zu finden. Man erhält für k = 1, 2, 3, ∞ die Werte 0.683, 0.954, 0.997 und 1.000. Dies bedeutet, dass ein Ereignis außerhalb von drei Standardabweichungen sehr unwahrscheinlich ist. In Gl. (9.26) gibt es für den Fall p = q = 1/2 bzw. x = 0 einen direkten Bezug zum Brownschen Teilchen. Dessen Fluktuation ist linear in der Zeit, vgl. Gl. (8.58), was beim Random Walk einer Linearität in N entspricht, wenn man jeden Schritt mit einem festen Zeitintervall verbindet. Es entsprechen sich also 4Dt und 8N pq. All dies hängt eng mit der Diffusion allgemein zusammen, die durch Gl. (8.17) beschrieben wird. Dort haben wir ebenfalls mit Gl. (8.18) Δ2 x = 2Dt. Diese Zusammenhänge kann man experimentell nachprüfen, und in der Tat, die Beobachtungen bestätigen dies. Durch Messung von D,t, p und q kann man offenbar auch die Loschmidtsche (Avogadrosche) Zahl bestimmen. mit P0 =
√
9.2 Zentraler Grenzwertsatz Der zentrale Grenzwertsatz ist eine weitgehende Verallgemeinerung des Random-Walk-Problems. Er lautet: Gegeben seien voneinander unabhängige Zufallsgrößen y1 , y2 , ..., yN , die durch Wahrscheinlichkeisverteilungen w1 (y1 ), w2 (y2 ), ..., wN (yN ) charakterisiert sind. Die Mittelwerte yi und die Schwankungsquadrate Δ2 yi sollen existieren. Dann ist die Wahrscheinlichkeitsverteilung für die Summe Y = ∑i yi eine Normalverteilung P(Y ) = √
(Y −Y )2 exp − 2Δ2Y 2πΔ2Y 1
(9.27)
und es gilt auch, dass die Breite der Verteilung mit wachsendem N stark abnimmt: √ Δ2 Y Y
=
von der Ordnung
1 O( √ ) N
9.2 Zentraler Grenzwertsatz
309
Zur Erläuterung schließen wir direkt an den Random Walk an. Dieser besteht aus N Schritten yi auf der x-Achse, die zu x = y1 + y2 + ... + yN führen. Es gilt für jeden Einzelschritt (der Länge l = Eins), dass yi = +1 mit der Wahrscheinlichkeit p und yi = −1 mit der Wahrscheinlichkeit q = 1 − p. Die Wahrscheinlichkeitsdichte hierfür ist unabhängig von i und lautet wRW (y) = pδ (y − 1) + qδ (y + 1). Wir verallgemeinern und lassen variable Schrittlängen yi zu mit jeweils gegebener Wahrscheinlichkeitsverteilung. Also wi (yi )dyi ist die Wahrscheinlichkeit, dass der i-te Schritt eine Länge zwischen yi und yi + dyi hat. Wenn man sich vom Random-Walk-Problem löst, dann bezeichnet man die Schrittlänge als Zufallsvariable1 . Wir setzen voraus, dass die Wahrscheinlichkeitsverteilungen auf eins normiert sind und einen endlichen Mittelwert haben +∞ −∞
wi (yi )dyi = 1
yi =
+∞ −∞
wi (yi )yi dyi
(9.28)
und auch eine endliche Schwankung: Δ2 yi =
+∞ −∞
wi (yi ) (yi − yi )2 dyi = y2i − yi 2
(9.29)
Wir setzen ferner voraus, dass die wi voneinander unabhängig sind. Damit gilt, dass ∏i wi (yi )dyi gleich der Wahrscheinlichkeit ist, dass die Zufallszahlen yi in den Bereichen [yi , yi + dyi ] liegen. Damit können wir den Mittelwert Y berechnen, wofür wir wegen der Normierung der wi erhalten Y=
N
N
N
j=1
i=1
∏ wi (yi )dyi ∑ y j = ∑ yi = Ny i=1
(9.30)
was auch ein mittleres y definiert. Die Schwankung ergibt sich 2 Δ 2Y =
∏ wi (yi )dyi ∑(y j − y j ) i
oder ΔY= 2
∏ wi (yi )dyi ∑(y j − y j ) i
(9.31)
j
j
2
+ ∑ (y j − y j )(yk − yk )
(9.32)
k= j
Nach der Integration verschwindet der Term mit k = j auf der rechten Seite und wir erhalten N
Δ2Y = ∑ Δ2 yi = NΔ2 y
(9.33)
i=1
was auch ein mittleres Δ2 y definiert. Wichtig ist wieder die relative Schwankung. Für den Random Walk mit seinem speziellen wRW (y) hatten wir diese bereits in Gl. (9.17) ausgerechnet. Jetzt bekommen wir nach Gl. (9.30,9.33) die Generalisierung für beliebige w(y): √ 1 Δ2 Y NΔ2 y Δ2 y 1 ∑ Δ2 yi √ = O( √ ) = (9.34) Ny y Y ∑ yi N N der Tat kann man z.B. in einem atomaren Gas mit wi (yi ) die Wahrscheinlichkeit betrachten, dass das i-te Atom sich in einem Anregungszustand der Energie yi = εi befindet. Siehe Beispiel nach Gl. (9.34).
1 In
310
9 Der zentrale Grenzwertsatz der Statistik
Dies ist wieder ein Ausdruck, der dem Gesetz der √ großen Zahl entspricht: Die relative Schwankung des Gesamtsystems ist proportional zu 1/ N und wird mit wachsendem N beliebig klein. Beispiel: Energie von Atomen Wir betrachten die N = 1024 Atome eines Gases der Temperatur T . Dieses bildet ein kanonisches Ensemble und das i-te Atom hat mit der Wahrscheinlichkeit √ wi (εi ) ∝ exp (−εi /kB T ) die Energie εi . Man kann leicht ausrechnen, dass sowohl ε als auch Δ2 ε von der Größenordnung kB T sind. Die Energie eines einzelnen Atoms ist also relativ unbestimmt √ und von der Größenordnung eins, i.e. Δ2 ε/ε = O(1). Die Gesamtenergie des Gases dagegen ist scharf definiert und ihre relative Schwankung ist nach Gl. (9.34) von der Größenordnung O(10−12 ). Das Gesetz der großen Zahl besagt hier etwas, was wir bereits in Kap. 4.4.7 kennen gelernt haben, nämlich dass ein kanonisches und ein mikrokanonisches Ensemble gleicher mittlerer Energien äquivalent sind. Beispiel: Genauigkeit von Uhren Das schwingungsfähige Element [Fli99] einer Uhr (die Unruh oder der Quarzkristall) habe eine Periode t mit einer Ungenauigkeit von 1%. Für die einzelnen Schwingungen seien die Wahrscheinlichkeitsverteilungen wi (ti ) unbekannt, sie sol len aber alle diese Genauigkeit haben, also Δ2 ti /t = 0.01. Nach N Schwingungen √ zeigt die 2 Uhr die Zeit√T = ∑ ti an.√Die relative Ungenauigkeit beträgt nach Gl. (9.34) dann Δ T /T = 4 2 ( Δ ti /t)/ N = 0.01/ N. Da ein Quarzkristall mindestens 10 Mal so schnell schwingt wie die Unruh einer mechanischen Uhr, ist eine Quarzuhr wesentlich genauer als eine mechanische, auch wenn jede einzelne Schwingung in beiden Systemen die gleiche Ungenauigkeit zeigt. Wir sind jetzt in der Lage, den zentralen Grenzwertsatz zu beweisen. Wir betrachten dazu zunächst den Fall einer einzigen Verteilung für alle Zufallsvariablen und wir nehmen wieder an, dass für jede Zufallsvariable der Mittelwert und die Schwankung existieren, siehe Gl. (9.28,9.29). Die Wahrscheinlichkeit für einen bestimmten Y -Wert ist gegeben durch P(Y ) =
dy1 w(y1 ) · · ·
dyN w(yN )δ Y − ∑ yi i
Wegen δ (Y − ∑i yi ) dY = 1 gilt P(Y )dY = 1, wie es sein soll. Zur Berechnung verwenden wir die Darstellung der δ -Distribution δ (z) = Einsetzen ergibt direkt P(Y ) = mit W (k) =
1 2π
1 2π
+∞ −∞
dk exp(−ikz)
dk [W (k)]N exp(−ikY )
dyw(y) exp(iky) = 1 + iky −
k2 2 y ±··· 2
(9.35)
(9.36)
9.2 Zentraler Grenzwertsatz
311
wobei wir die Integration nach einer Entwicklung von W (k) nach Potenzen von k durchgeführt haben. Damit erhalten wir k2 log [W (k)]N = N log 1 + iky − y2 ± · · · 2 Den Logarithmus entwickeln wir nach Gl. (6.41), i.e.log(1 + z) = z − z2 /2 ± · · · , und bekommen 1 log [W (k)]N = N iky − k2 Δ2 y ± · · · 2 Wir ignorieren Terme dritter und höherer Ordnung in k und exponentieren mit dem Resultat NΔ2 y 2 [W (k)]N = exp iNky − k 2 Wir benutzen Y = Ny und Δ2Y = NΔ2 y aus Gl. (9.30,9.33) und führen das Integral von Gl. (9.35) aus: k 1 dk exp −i(Y −Y )k − Δ2Y P(Y ) 2π 2 mit dem Endergebnis für P(Y ) nach quadratischer Ergänzung oder aus einer Integraltafel, wie es in Gl. (9.27) behauptet wurde. Wir haben den Beweis geführt für den Fall einer einzigen Wahrscheinlichkeitsverteilung für alle Zufallsvariablen. Offenbar ist das Resultat eine Normalverteilung (Gauß-Verteilung), obwohl das einzelne w(y) seinerseits nicht Gauß-förmig zu sein braucht. Wir erhalten zusammenfassend die wichtigen Eigenschaften der Normalverteilung, was der zentrale Grenzwertsatz der Statistik aussagt: Y = Ny √ Δ2 Y = N Δ2 y Schwankungsbreite √ 1 Δ2 Y Δ2 y 1 √ = O( √ ) = relative Schwankung y Y N N Mittelwert
(9.37) (9.38) (9.39)
Dieser Beweis des zentralen Grenzwertsatzes lässt sich leicht generalisieren auf den Fall verschiedener Wahrscheinlichkeitsverteilungen wi (yi ).
Anhang: Physikalische Konstanten, Umrechnungsfaktoren Wichtige Konstanten Größe Plancksches Wirkungsquantum
Darstellung h¯
Vakuum-Lichtgeschwindigkeit Atomare Masseneinheit Elektron: Ruhemasse Elektron: Ruheenergie Elektron: Compton-Wellenlänge Proton: Ruhemasse Proton: Ruheenergie Massenverhältnis Proton-Elektron Feinstrukturkonstante Bohrsches Magneton Boltzmann-Konstante
h¯ c c 1 amu me me c2 h¯ /me c mp m p c2 m p /me α = e20 /¯hc μB = e0 h¯ /2me c kB
Gaskonstante
R
Loschmidtsche (Avogadro) Zahl Normaldruck (Atmosphärendruck) Strahlungskonstante
L P0 σ = π 2 kB4 /60c2 h¯ 3
Gravitationskonstante
G
Sonnenmasse
M
Zahlenwert 1.054572 × 10−27 erg s =1.054572 × 10−34 J s 6.582122 × 10−16 eV s 197.32MeV fm 2.997925 × 1010 cm s−1 1.660540 × 10−24 g =⇒ 931.5MeV 9.109389 × 10−28 g = 5.485799 × 10−4 amu 0.510999MeV 3.861593 × 10−11 cm 1.672623 × 10−24 g 938.27MeV 1836.15 1/137.035989 9.274015 × 10−21 erg Gauss−1 1.380658 × 10−16 erg K−1 1.380658 × 10−23 J K−1 8.314510 × 107 erg mol−1 K−1 8.314510 × 103 J kmol−1 K−1 6.0221367 × 1023 mol−1 1.01325 × 106 dyn cm−2 = 1.01325 × 105 Pa 5.67051 × 10−5 erg s−1 cm−2 K−4 5.67051 × 10−8 W m−2 K−4 6.67259 × 10−8 dyn cm2 g−2 6.67259 × 10−11 N m2 kg−2 1.9891 × 1033 g
Umrechnungsfaktoren Größe 1 eV 1 eV 1N 1J 1K 1 bar 1 Torr 1 atm 1 Watt
Umrechnung 1.60219 × 10−19 J =⇒ 11605K =⇒ 2.4180 × 1014 Hz =⇒ 1.2399 × 10−4 cm 1 kg m s−2 = 105 dyn = 105 g cm s−2 = 0.10197kp 1 N m = 107 erg = 107 cm dyn =⇒ 0.86171 × 10−4 eV 106 dyn cm−2 = 105 N m−2 = 105 Pa 1.33 × 10−3 bar 1 kp cm−2 = 0.980655 bar 1 J s−1 = 10−7 erg s−1
K. Goeke, Statistik und Thermodynamik, DOI 10.1007/ 978-3-8348-9748-0, © Vieweg+Teubner Verlag |Springer Fachmedien Wiesbaden GmbH 2010
Literaturverzeichnis [A+ 95] A NDERSON , M. H. et al.: Observation of Bose-Einstein Condensation in a Dilute Atomic Vapor. Science 269 (1995) 198, 1995. [B+ 92] B OGGESS , N. W. et al.: The COBE-Mission: Its Design and Performance Two Years after the Launch. Astrophysical Journal 397 (2) (1992) 420, 1992. [Bec66] B ECKER , R: Theorie der Wärme. Springer Verlag, Berlin, 1966. [Blo05] B LOCH , I.: Ultracold Quantum Gases in Optical Lattices. Nature Physics, Vol.1, October 2005, p.23, 2005. [Blo08] B LOCH , I., DALIBARD , J., Z WERGER , W.: Many Body Physics with Ultracold Gases. Rev. Mod. Phys. 80 (2008) 885, 2008. [Bre89] B RENIG , W.: Statistical Theory of Heat (Non-Equilibrium). Springer Verlag, Berlin, 1. Auflage, 1989. [Bre92] B RENIG , W.: Statistische Theorie der Wärme. Springer Verlag, Berlin, 3. Auflage, 1992. [Coh77] C OHEN -TANNOUDJI , C., D IU , B., L ALOË , F.: Quantum Mechanics, Vol. II. John-Wiley, New York, 3. Auflage, 1977. [D+ 95] DAVIS , K. B. et al.: Bose-Einstein Condensation in a Gas of Sodium Atoms. Phys.Rev. Lett. 75 (1995) 3969, 1995. [Fli96]
F LIESSBACH , T.: Mechanik. Spektrum Akademischer Verlag, Heidelberg, 2. Auflage, 1996.
[Fli99]
F LIESSBACH , T.: Statistische Physik. Spektrum Akademischer Verlag, Heidelberg, 3. Auflage, 1999.
[Gri]
G RIMM , E.: Revolution in der ultrakalten Quantenwelt. Phys. Blätter, August 2005, p.20.
[Hua87] H UANG , K.: Statistical Mechanics. Wiley & Sons, New York, 2. Auflage, 1987. [K+ 05] KÖHL , M. et al.: Superfluid to Mott Insulator transition in one, two and three dimensions. Journ. Low Temp. Phys. 138 (2005) 635, 2005. [K+ 10] K NOOP, S. et al.: Magnetically Controlled Exchange Process in an Ultracold Atom-Dimer Mixture. Phys. Rev. Lett, 104, (2010), 053201, 2010. [Kit56] K ITTEL , C: Introduction to Solid State Physics. John Wiley and Sons, New York, 2. Auflage, 1956. [Lan87] L ANDAU , L. D., L IFSCHITZ , E. M.: Lehrbuch der Theoretischen Physik, Band V, Statistische Physik. Akademie Verlag, Berlin, 7. Auflage, 1987. [Lid08] L IDDLE , A.: Einführung in die Kosmologie. Wiley-VCH, Berlin, 2 Auflage, 2008. [Man89] M ANDL , F.: Statistical Physics. John Wiley & Sons, New York, 2. Auflage, 1989. [NAS09] NASA, WMAP: Wilkinson http://map.gsfc.nasa.gov, 2009.
Microwave
Anisotropy
Probe:
Seven
year
release.
[Nol05] N OLTING , W.: Grundkurs Theoretische Physik 4: Spezielle Relativitätstheorie, Thermodynamik. Springer-Verlag, Berlin, 6. Auflage, 2005.
K. Goeke, Statistik und Thermodynamik, DOI 10.1007/ 978-3-8348-9748-0, © Vieweg+Teubner Verlag |Springer Fachmedien Wiesbaden GmbH 2010
314
Literaturverzeichnis
[Nol07] N OLTING , W.: Grundkurs Theoretische Physik 6: Statistische Physik. Springer-Verlg, Berlin, 6. Auflage, 2007. [Pat72] PATHRIA , R.K.: Statistical Mechanics. Pergamon Press, Oxford, 1. Auflage, 1972. [Pen65] P ENZIAS , A.A., W ILSON , R.W.: A Measurement of Excess Antenna Temperature at 4080 Mc/s. Astroph. Journal. 142 (1965) 419, 1965. [Rei87] R EIF, F.: Statistische Physik und Theorie der Wärme. de Gruyter-Verlag, Berlin, 2. Auflage, 1987. [Röm94] RÖMER , H., F ILK , T H .: Statistische Mechanik. Wiley-VCH, New York, 1. Auflage, 1994. [Ryd03] RYDEN , B.: Introduction to Cosmology. Addison Wesley, New York, 1 Auflage, 2003. [Sch05] S CHULZ , H.: Statistische Physik. Harri Deutsch Verlag, Frankfurt, 1. Auflage, 2005. [Sch06] S CHWABL , F.: Statistische Mechanik. Springer-Verlag, Berlin, 3. Auflage, 2006. [Sch08] S CHECK , F.: Statistische Theorie der Wärme. Springer Verlag, Berlin, 1. Auflage, 2008. [Sen01] S ENGSTOCK , K., E RTMER , W., L EWENSTEIN , M.: Physik mit Bose-Einstein Kondensaten. Phys. Blätter, März 2001, p.33, 2001. [Wol02] W OLSCHIN , G.: Wie ein Quantensee erstarrt. Spektrum der Wissenschaft, 2002, Vol.5, p.12, 2002. [Z+ 05] Z WIERLEIN , M. W. et al.: Vortices and Superfluidity in a strongly interacting Fermi Gas. Nature 435 (2005) 1047, 2005.
Sachverzeichnis Äquipartitionstheorem, siehe Gleichverteilungssatz äußere Parameter, 8, 21 Abwärme, 73 adiabatische Entmagnetisierung, 158 adiabatische Kühlung, 102 Arbeit, 16, 17, 21 Avogadrosche Zahl, 108 Baryonenzahldichte, 226 BEC, siehe Bose-Einstein-Kondensation BEC-BCS-crossover, 252 Besetzungswahrscheinlichkeit, 7, 16, 171 Besetzungszahl, 7, 8, 16, 20, 159 Bose-Einstein-Statistik, 199 Fermi-Dirac-Statistik, 199 mittlere Bosonen, 203 Fermionen, 205 Beta, 29 Boltzmann -Faktor, 138, 141 Entropie, 28 Konstante, 29, 108 Boltzmann-Gleichung, 282 Bose-Einstein-Kondensation, 238 Besetzungszahl N0 (T ), 243 chemisches Potenzial, 239 Grenzfälle, 239 DeBroglie-Wellenlänge, 242 Druck des Kondensats, 246 Energie des Kondensats, 245 Experimente, siehe ultrakalte Quantengase Kondensat, 244 kritische Temperatur, 241, 242 Riemannsche Zeta-Funktion, 242 spezifische Wärme, 246 thermische Wellenlänge, 240, 242 Bose-Einstein-Statistik, 198
Besetzungszahl, 199 Bose-Einstein-Kondensation, siehe Einstein-Kondensation chemisches Potenzial, 203 großkanonisches Potenzial, 203 mittlere Besetzungszahl, 203 mittlere Teilchenzahl, 203 Phononen, siehe Phononen-Statistik Photonen, siehe Photonen-Statistik Verteilungsfunktion, 203 Zustandssumme, 199, 202 Brownsche Bewegung, 295, 308 fluktuierende Kraft, 296
Bose-
Carnotmaschine, 63 ideales Gas, 65 maximaler Wirkungsgrad, 66 Chandrasekhar-Grenzmasse, 266 Chatelier, Prinzip, 87, 132 chemisches Potenzial, 41, 120 Ableitung aus thermodynamischen Potenzialen, 121 Gibbssches Potenzial pro Teilchen, 123 Gleichgewichtsbedingung, 125 Phononen, 208 Photonen, 207 Clausius-Clapeyron-Gl., 106, 107 COBE-Mission, 219 DeBroglie-Wellenlänge, 4, 179, 180 Debye-Modell, siehe Gitterschwingungen Differential, 17–19 integrierender Faktor, 18 thermodynamische Potenziale, 90 unvollständiges, 16, 17 vollständiges, 16, 17, 75, 91 Diffusion, 284 Diffusionsgleichung, 284 Diffusionskonstante, 284, 300 quadratische Verbreiterung, 284
K. Goeke, Statistik und Thermodynamik, DOI 10.1007/ 978-3-8348-9748-0, © Vieweg+Teubner Verlag |Springer Fachmedien Wiesbaden GmbH 2010
316
Dissipations-Fluktuations-Relation, 300 Duhem-Gibbs-Relation, siehe Gibbs-DuhemRelation dynamische Kernpolarisation, 293 Einstein-Relation, 300 Einsteintemperatur, siehe Wärmekapazität Einteilchenzustand, 5, 6, 42 zulässiger, 8 elektrische Leitfähigkeit, 283 Energie dunkle, 219 Ensemble, 7 Äquivalenz der Ensembles, 135, 162, 164 Ensemblemittel, 7 großkanonisches, 165, 178 kanonisches, 178 mikrokanonisches, 10, 135, 178 Mittelwert, 7 Schärfe der Verteilung, 135 Vergleich der Ensembles, 170 Zeitmittel, 8 Zusammenfassung der Ensembles, 170 entartetes Fermigas, siehe Leitungselektronen Enthalpie, 52, 89 Entropie, 26, 30 Additivität, 30 Eigenschaften, 30 Gibbssche Formel, 173 großkanonische, 167 Information, 30 kanonische, 156 Maß für Unordnung, 30 maximale, 29, 139, 174 Messprozess, 37 mikrokanonische, 28 quasistatischer Prozess, 33, 37 Satz von Clausius, 54 Satz von Kelvin, 56 Unordnung, 34 Explosion, 68 Extremalprinzipien, 174, 175, 177 Fermi-Dirac-Statistik, 199 Besetzungszahl, 199 chemisches Potenzial, 206 großkanonisches Potenzial, 205 mittlere Besetzungszahl, 205
Sachverzeichnis
mittlere Teilchenzahl, 205 Verteilungsfunktion, 205 Zustandssumme, 199, 205 Fermidruck, 206, 253 Inkompressibilität der Materie, 260 Leitungselektronen, siehe Leitungselektronen Neutronenstern, 268 Weißer Zwerg, 263 Fermifunktion, 205, 254 Breite, 254 Ferromagnetismus, 269 Austauschwechselwirkung, 269 Curie-Temperatur, 273, 274 Curie-Weiss-Gesetz, 274 Dipol-Dipol-Wechselwirkung, 269 kritische Temperatur, 275 magnetische Suszeptibilität, 274, 275 Magnetisierung, 271, 274 mittleres magnetisches Moment, 271, 274 Molekularfeldnäherung, 270 Sättigung, 273 Selbstkonsistenzbedingung, 271, 274 Spinwellen, 276 spontane Magnetisierung, 273 spontane Symmetriebrechung, 275 Weiss’sche Bezirke, 275 Fluktuationen Brownsche Bewegung, siehe Brownsche Bewegung homogenes System bei festem T , 87 bei festem V , 86 Freie Energie, 82 Abnahme ΔF ≤ 0, 82 festes T , 82 Minimum bei gegebenem T , 83, 175 Freie Enthalpie, siehe Gibbssche Energie Fugazität, 167, 187 generalisierte Kraft, 19, 21, 42 Druck, 22 großkanonisch, 167 kanonisch, 155 makroskopisch, 37 mikroskopisch, 21 Gesetz der großen Zahl, 303, 305, 310 Gibbs-Duhem-Relation, 121, 122
Sachverzeichnis
differentielle, 122, 123 homogene Funktion, 122 Skalierung, 122 Gibbssche Energie, 83, 103 Abnahme ΔGA ≤ 0, 85 festes T und P, 84 Minimum bei Gleichgewicht, 85 Gibbsscher Faktor, 4, 14, 179, 183, 197 Maxwell-Boltzmann-Statistik, 210 Gibbssches Paradoxon, 182 Gitterschwingungen, 232 Debye-T 3 -Gesetz, 238 Debye-Approximation, 235 Debye-Frequenz, 236 Debye-Temperatur, 237, 238 Dulong-Petitsches Gesetz, 235 Modendichte σ (ω), 234 Normalschwingungen, 232 Phononen, 232 spezifische Wärme, 234, 238 Wärmekapazität, 234, 238 Zustandssumme, 234 Gleichgewicht, 9, 10, 19, 20 Bedingungen, 38, 39, 41 bei Federkraft, 41 chemisches, 125 detailliertes, 281 maximales Ω(y), 24 maximales S(y), 29, 30 minimales F(y), 83 minimales G(y), 85 Phasen bei festem T und P, 104 Phasen im abgeschlossenen System, 124, 125 Postulat gleicher Pr , 20, 280, 282, 289 Gleichungen T dS, 75 ¯ 51 Gleichungen: dQ, Gleichverteilungssatz, 146 ideales Gas, 31 mittlere kinetische Energie, 148 quadratische Terme in Hamiltonfunktion, 148 Virialtheorem, 149 großkanonische Zustandssumme, 167, 201 Dichteoperator, 170, 173 Entropie, 167, 173 Fugazität, 187 generalisierte Kraft, 167 großkanonisches Potenzial, 177
317
ideales Gas, 186 chemisches Potenzial, 187 Entropie, 188 großkanonisches Potenzial, 187 mittlere Teilchenzahl, 187 mittlerer Druck, 187 Zustandsgleichung, 187 ideales Quantengas, 201 mittlere Energie, 167 mittlere Teilchenzahl, 167 statistischer Operator, 170, 173 großkanonisches Ensemble, 135, 165 chemisches Potenzial μ, 166 großkanonische Verteilung maximale Entropie, 174 großkanonisches Potenzial, 168 Differential, 169 Entropie, 168 ideales Gas, 187 mittlere Teilchenzahl, 168 mittlerer Druck, 168, 188 Mittelwerte, 166 Temperatur, 166 Wahrscheinlichkeitsverteilung, 165 H-Theorem, 281 Entropie, 281 zweiter Hauptsatz, 281 harmonischer Oszillator, siehe kanonische Zustandssumme Hauptsatz der Thermodynamik dritter, 34, 42, 45, 99, 158 erster, 16, 21, 41, 42, 45, 63, 221 zweiter, 33, 42, 45, 53, 63 H-Theorem, 281 Heizen, 72 direktes, 73 indirektes, 73 Helmholtzsche freie Energie, siehe Freie Energie Hertzsprung-Russell-Diagramm, 260 Hohlraumstrahlung, siehe Wärmestrahlung ideales Gas, 12 Adiabatengleichung, 60 chemisches Potenzial, 187 Druck, 22 Energiefluktuation, 181 Entropie, 31, 181, 188
318
freie adiabatische Expansion, 53, 58 Gemisch Freie Energie, 186 großkanonische Zustandssumme, 186 kanonische Zustandssumme, 180 CV , 181 mikrokanonische Zustandssumme, 12, 31 Mikrozustand, 22 mittlere Energie, 22, 181 mittlerer Druck, 180, 187 nichtrelativistisch, 184 relativistisch, 184 reversible adiabatische Expansion, 59 reversible isotherme Expansion, 57 spezifische Wärmen, 52 Zustandsgleichung, 31, 43, 180, 187 ideales Quantengas, 197 Bosonen, siehe Bose-Einstein-Statistik Druck, 210, 211 Fermionen, siehe Fermi-Dirac-Statistik Phononen, siehe Phononen-Statistik Photonen, siehe Photonen-Statistik Zustandssumme, 201 identische Teilchen, 4, 179 Bosonen, 198 Fermionen, 198 ganzzahliger Spin, 198 halbzahliger Spin, 198 Inkompressibilität der Materie, siehe Leitungselektronen, Fermidruck Jacobi-Determinante, 76 Kettenregel, 76 zyklische Vertauschung, 77 Jacobi-Identität, 37, 77 Kühlmaschine, 70, 75 Wirkungsgrad, 70 kanonische Verteilung, 287 bei gegebenem T , 176 kanonische Zustandssumme, 151 Dichteoperator, 170, 172 Mittelwert, 171 Entropie, 156, 173 Freie Energie, 156, 177 Differential, 157 generalisierte Kraft, 155 harmonischer Oszillator, 189
Sachverzeichnis
Grenzfälle, 190 ideales Gas, 180 CV , 181 Energiefluktuation, 181 Entropie, 181 mittlere Energie, 181 mittlerer Druck, 180 nicht-relativistisch, 184 relativistisch, 184 Zustandsgleichung, 180 mittlere Energie, 152 relatives Schwankungsquadrat, 154, 181 Schwankungsquadrat, 153 mittlerer Druck, 155 natürliche Variablen, 152 statistischer Operator, 170, 172 Zustandsgleichung, 155 kanonisches Ensemble, 135, 137 Äquipartitionstheorem, siehe Gleichverteilungssatz Bezug zum mikrokanonischen Ensemble, 161 Boltzmann-Faktor, 138, 141 Gleichverteilungssatz, siehe Gleichverteilungssatz kanonische Verteilung ¯ 141 bei gegebenem E, bei gegebenem T , 141 maximale Entropie, 174 makroskopisches Untersystem, 141 Maxwellsche Geschwindigkeitsverteilung, 143 mikroskopisches Untersystem, 137 Paramagnetismus, 139, 192 Wärmereservoir, 138 Wahrscheinlichkeitsverteilung, 137, 138 Zustandssumme, siehe kanonische Zustandssumme Kelvin, 29, 108 klassische Näherung, 4 Gültigkeit, 197, 209 Gibbsscher Faktor, 210 Maxwell-Boltzmann-Statistik, 209 klassisches thermodynamisches System Adiabate, 44 adiabatischer Prozess, 44 Arbeit, 44, 81, 84
Sachverzeichnis
Entropie, 45, 50 extensive Zustandsgrößen, 45 generalisierte Kraft, 48 Gleichgewicht, 43 Hauptsätze, 45 innere Energie, 46, 47, 81 intensive Zustandsgrößen, 45 Isentrope, 44 Isotherme, 44 Postulate, 43 reversibler Prozess, 45 spezifische Wärme, 44, 49 Temperatur, 48 Wärme, 44 Wärmekapazität, 44, 48 Wärmespeicher, 44 Zustandsänderung, 44 Zustandsgleichung, 43 Zustandsgrößen, 43 Kompressibilität adiabatische, 76 isotherme, 76 Positivität, 88 reales Gas, 111 Kreisprozess, 74 Satz von Clausius, 54 kritische Opaleszenz, 112 Langevin-Gleichung, 297 latente Wärme, 106 Leitungselektronen, 252 chemisches Potenzial, 257 Energie, 256 Fermi-Energie, 253, 258 Fermidruck, 253, 259, 260 Fermifunktion, 254 Breite, 254 spezifische Wärme, 253, 258, 259 im Gitter, 259 limes T →0 ∂P → 0, 100 ∂ T V ∂V → 0, 100 ∂T P
thermischer Expansionskoeffizient, 100 Unerreichbarkeit von T = 0, 101, 103 Wärmekapazität reversibler Weg, 99 Loschmidtsche Zahl, 108
319
magnetische Resonanz, 289 Makrozustand, 7–9, 15, 135 Massenwirkungsgesetz, 125, 127 chemisches Gleichgewicht, 126 Freie Standardenergie, 127 ideales Gas, 129, 130 Freie Energie, 186 Massenwirkungskonstante, 130 Massenwirkungskonstante, 127, 128 Partialdruck, 130 Mastergleichung, 280 Materie baryonische, 219, 226 dunkle, 219 Maxwell-Boltzmann-Statistik, 208 Gibbsscher Faktor, 210 Grenzfall der Quantenstatistik, 209 mittlere Besetzungszahl, 209, 210 Zustandssumme, 200, 209, 210 Maxwell-Relationen, 91 inverse Form, 91 Maxwellsche Geschwindigkeitsverteilung, 143, 283 mittlere Geschwindigkeit, 144 mittlere quadratische Geschwindigkeit, 145 wahrscheinlichste Geschwindigkeit, 145 Messung Entropie, 50 generalisierte Kraft, 48 innere Energie, 46 Temperatur, 48 Wärme, 47 mikrokanonische Zustandssumme, 11, 14, 27, 42, 172 Abhängigkeit von E, 15 Abhängigkeit von V , 15 Dichteperator, 170, 172 Entropie, 155, 173 ideales Gas, 12 mittlere Energie, 12 statistischer Operator, 170, 172 mikrokanonisches Ensemble, 10, 20, 42 Besetzungszahl, 42 Bezug zum kanonischen Ensemble, 161 Entropie, 28, 42 Gleichgewicht, 9, 42, 280 maximale Entropie, 174
320
mittlere Energie, 20 Temperatur, 29 Wahrscheinlichkeitsverteilung, 11 Zustandssumme, siehe mikrokanonische Zustandssumme Mikrowellenhintergrundstrahlung, 219 andere Energiedichten, 219 Energiedichte, 219 Entkopplung, 226 Expansion des Universums, 220 T (t) ∝ 1/a(t), 221 Energiedichte ∝ a(t)−4 , 221, 222 Photonendichte, 221 Skalenparameter, 221 Fluktuationen, 219 mittlere Baryonenzahl, 223 mittlere Energie, 219 mittlere Photonenzahl, 222 Saha-Gleichung, 225 Temperatur, 219 Temperaturabhängigkeit, 226 Ursprung, 223 Wellenlänge, 219 Mikrozustand, 5–9, 11, 20, 42, 135 anti-symmetrisch, 198 Bosonen, 198 Fermionen, 198 Slater-Determinante, 198 symmetrisch, 198 zulässiger, 8–10, 23 Zwangsbedingung, 23 Mischungsentropie, 182, 183 mittlere Energie, 16 kanonische, 152 relatives Schwankungsquadrat, 154 Schwankungsquadrat, 153 mikrokanonische, 12, 20 mittlere freie Weglänge, 283 mittlere Stoßzeit, 283 Mol, 43 Nernstsches Theorem, siehe Hauptsatz der Thermodynamik, dritter Neutronenstern, 267 Fermidruck, 269 Masse, 267 Radius, 267, 268 Temperatur, 267
Sachverzeichnis
Neutronenzerfall, 228 Normalverteilung, 308 Osmose, 193 Overhauser-Effekt, 295 Paramagnetismus, 139, 192 adiabatische Entmagnetisierung, 158, 159 Besetzungszahl, 159 Brillouin-Funktion, 192 Curie-Gesetz, 141, 192 Grenzfälle, 140 magnetische Suszeptibilität, 192 mittleres magnetisches Moment, 140, 192 Sättigung, 141, 192 Pauliprinzip, 199, 269 Phasenübergang, 103 Übergangstemperatur, 105 Anomalie des Wassers, 108 Clausius-Clapeyron-Gl., 106, 107 Dampfdruck, 105 fest → flüssig, 109 flüssig → fest, 108 flüssig → gasförmig, 109 Dampfdruckformel, 109 Gleichgewichtsbedingung, 104 kritischer Punkt, 107, 109 latente Wärme, 105, 106 Phasengleichgewichtslinie, 105, 106 Tripelpunkt, 108, 109 Kelvin, 108 van der Waals-Gas, siehe Phasenübergang im realen Gas Wasser ↔ Dampf Siedepunkt, 110 Wasser ↔ Eis Schmelzpunkt, 110 Phasenübergang im realen Gas, 110 Gibbssche Energie, 113 instabile Phasen, 111 Isotherme, 110 isotherme Kompressibilität, 111 kritische Opaleszenz, 112 kritische Temperatur, 110 kritischer Punkt, 112 latente Wärme, 115 Berechnung, 118 Messung, 118
Sachverzeichnis
Maxwell-Konstruktion, 112, 115 Ordnung des Übergangs, 116 Phononen-Statistik, 208 chemisches Potenzial, 208 mittlere Besetzungszahl, 208 Zustandssumme, 208 Photonen-Statistik, 207 chemisches Potenzial, 207 Druck, 211, 217 Entropie, 217 Freie Energie, 217 innere Energie, 217 kalorische Zustandsgleichung, 217 mittlere Besetzungszahl, 207 thermische Zustandsgleichung, 217 Verteilung, 207 Wärmekapazität, 217 Zustandssumme, 207 Plancksches Strahlungsgesetz, siehe Wärmestrahlung Postulate der gleichen ”a priori”-Wahrscheinlichkeiten, 9 der Thermodynamik, 43 Gleichgewicht, Pr , 9, 20, 280, 289 Zeit-Esemble-Mittel, 8 Prozess, 15, 16 adiabatischer, 21 Entropie, 33 irreversibel, 24, 25, 280, 281 quasistatisch, 19–21, 51, 75, 79, 91 Entropie, 37 reversibel, 24, 41, 64, 99 reversible Wärmeübertragung, 66 spontan, 9, 24, 33 zyklisch, 61 Prozessgröße, 15 Random-Walk-Problem, 303, 309 Gauß-Verteilung, 308 Normalverteilung, 308 Standardabweichung, 308 Reibungskonstante, 283, 285, 297, 298 Relaxationszeit, 9, 19, 292 residuelle Wechselwirkung, 6, 7, 9 Riemannsche Zeta-Funktion, 204, 242 Rydberg-Konstante, 43, 108
321
Sackur-Tetrode-Gleichung, 184 Saha-Gleichung, 225 Schwarzkörperstrahlung, siehe Wärmestrahlung Slater-Determinante, siehe Mikrozustand spezifische Wärme, siehe Wärmekapazität spontane Symmetriebrechung, 276 chirale Symmetrie, 276 Feromagnetismus, 275 Goldstone-Moden, 276 nullmoden, 276 stöchiometrische Koeffizienten, 126, 129 statistischer Operator Extremalprinzip, 174, 175, 177 Sternenbrennen, 226 Stirlingsche Formel, 14 Stokes-Gestz, 285 Strahlung des Schwarzen Körpers, siehe Wärmestrahlung Strahlungskonstante, 219 System abgeschlossenes, 6, 9, 10 Bosonen, siehe Bose-Einstein-Statistik Fermionen, siehe Fermi-Dirac-Statistik homogenes, 85, 118 Stabilitätsbedingungen, 85 inhomogenes, 118 makroskopisches, 3, 7, 43 mehrere chem. Komponenten, 119 nicht-abgeschlossenes, 25, 82, 83 Phononen, siehe Phononen-Statistik Photonen, siehe Photonen-Statistik thermodynamisches, 43 Taylorentwicklung, 14, 32 Temperatur, 26, 29, 42 Beta, 29 Energie pro Freiheitsgrad, 30 negative, 34 thermische Wellenlänge, 179, 180, 239, 240 thermischer Expansionskoeffizient, 76 im limes T → 0, 100 thermodynamische Information, 90 vollständige, 90, 91, 93 thermodynamischer Limes, 172, 243 thermodynamisches Potenzial, 89 Bestimmung, 90 Bestimmung der Zustandsgleichung, 93 Bestimmung der Zustandsgleichungen, 90
322
Bestimmung des Potenzials, 93 Bestimmung von S und Ω, 90 chemisches Potenzial, siehe chemisches Potenzial der Energie, 89 der Enthalpie, 89 der Freien Energie, 89 der Gibbssche Energie, 89 der Gibbsschen Energie, 103 Differentiale, 90, 121 generalisiert auf mehrere Komponenten, 120 großkanonisches Potenzial, 120 Druck, 123 mehrere chemische Komponenten, 119 mit chemischem Potenzial, 120 natürliche Variablen, 89 Tripelpunkt, 108 Ubergangswahrscheinlichkeit, 20, 279, 287 Uhr, 310 ultrakalte Quantengase, 247 Analogon zu Mott-Isolatoren, 250 Bose-Einstein-Kondensat, siehe BoseEinstein-Kondensat evaporative Kühlung, 247 Feshbach-Resonanz, 251 Herstellung des BEC, 247 Interferenzen, 248, 251 Kondensatwellenfunktion, 249 Magnetfalle, 247 Materie-Laser, 248 optische Gitter, 250 Peak in der Atomwolke, 248 Solitonen, 249 Suprafluid, 251 Vortizes, 249 van der Waals-Gas, 97 Adiabatengleichung, 98 Entropie, 98 freie adiabatische Expansion, 99 Wärmekapazität, 98 Zustandsgleichung, 97 van’t Hoffsches Gesetz, 193, 195 Variable makroskopisch, 3 mikroskopisch, 3 natürlich, 89
Sachverzeichnis
unabhängig, 92 zufällige, 308 Vielteilchenzustand, siehe Mikrozustand Viskosität, 285 von Neumann-Gleichung, 171 Wärme, 16, 21 Wärmeübertragung, 67 irreversibel, 66 reversibel, 66, 67 Wärmekapazität, 79 CP −CV , 79 Festkörper Einstein-Modell, 190 Einsteintemperatur, 191 im limes T → 0, 99 Zusammenhang mit adiabatischer Kompressibilität, 81 isothermer Kompressibilität, 79 Temperatur, 79 thermischem Expansionskoeffizienten, 79 Volumen, 79 Wärmekapazität CP Gleichungen T dS, 76 ideales Gas, 52 Wärmekapazität CV Gleichungen T dS, 76 ideales Gas, 52, 150 mehratomiges Molekül, 150 Positivität, 86 Schwankungsquadrat der Energie, 153 van der Waals-Gas, 98 zweiatomiges Molekül, 150 Wärmekraftmaschine, 61, 75 Carnotmaschine, siehe Carnotmaschine Otto-Motor, 68 Wirkungsgrad, 62 Wärmeleitung, 54, 67, 285 Wärmeleitfähigkeit κ, 285 Wärmeleitungsgleichung, 285 Wärmepumpe, 70, 73, 75 Wirkungsgrad, 72 Wärmereservoir, 35, 61, 136 Entropieänderung, 36 Wärmestrahlung, 213 Dispersionsgleichung, 213 Energiedichte, 214 Maximum, 215
323
mittlere Energie, 215 totale, 218 mittlere Besetzung, 214 Photonen-Statistik, siehe Photonen-Statistik Plancksches Strahlungsgesetz, 214, 217, 218 Polarisation, 213 Stefan-Boltzmann-Gesetz, 218 Strahlungsdruck, 217 Strahlungskonstante, 219 Wiens Verschiebungsgesetz, 216 Zustandsdichte, 214 Wahrscheinlichkeitsverteilung, 24, 27, 171 abgeschlossenes System, 88 großkanonisches Ensemble, 165, 166 kanonisches Ensemble, 137 Maximum, 29 mikrokanonisches Ensemble, 11 scharfer Peak, 27, 28, 31, 32 System mit festem T , 88 System mit festem T und P, 89 Zufallsvariable, 308, 311 Weißer Zwerg, 260 Chandrasekhar-Grenzmasse, 266 Daten, 260 Fermi-Energie, 262 Fermi-Temperatur, 261 Fermidruck, 263
Gravitationsselbstenergie, 264 Masse, 265 Radius, 265 WMAP-Mission, 219 zeitabhängige Störungstheorie, 279, 286 Zeitumkehrinvarianz, 3, 280 zentraler Grenzwertsatz, 308, 311 Zeta-Funktion, 204 Zufallsvariable, 308 Zustandsgleichung, 90 Bestimmung aus thermodynamischem Potenzial, 90 ideales Gas, 31 kalorisch, 90 thermisch, 90, 217 van der Waals-Gas, 97 Zustandsgleichung,kalorisch, 217 Zustandsgröße, 15 Zustandssumme großkanonisch, siehe großkanonische Zustandssumme ideales Quantengas, 201 identische Teilchen, 199, 200 kanonisch, siehe kanonische Zustandssumme mikrokanonisch, siehe mikrokanonische Zustandssumme Schärfe der Verteilung, 31, 32