Springer-Lehrbuch
Harald Ibach
Hans Lüth
Festkörperphysik EinfuÈhrung in die Grundlagen Siebte Auflage mit 277 Abbildungen, 18 Tafeln und 104 UÈbungen
12
Professor Dr. Harald Ibach Institut für Bio- und Nanosysteme Forschungszentrum Jülich GmbH, 52425 Jülich und Rheinisch-Westfälische Technische Hochschule 52062 Aachen, Deutschland E-mail:
[email protected] Professor Dr. Dr. h.c. Hans Lüth Institut für Bio- und Nanosysteme Forschungszentrum Jülich GmbH, 52425 Jülich und Rheinisch-Westfälische Technische Hochschule 52062 Aachen, Deutschland E-mail:
[email protected] ISBN 978-3-540-85794-5 DOI 10.1007/978-3-540-85795-2
e-ISBN 978-3-540-85795-2
Springer-Lehrbuch ISSN 0937-7433 Bibliografische Information Der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Springer-Verlag Berlin Heidelberg 1981, 1988, 1990, 1995, 1999, 2002, 2009 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Satz: K + V Fotosatz GmbH, Beerfelden Einbandgestaltung: WMXDesign GmbH, Heidelberg Gedruckt auf säurefreiem Papier 987654321 springer.com
Vorwort zur siebten Auflage
Mit der sechsten Auflage hat sich unsere „Festkörperphysik“ weiter als Standardwerk weltweit etabliert. Dies zeigt sich u. a. daran, dass neben den Übersetzungen ins Englische, Japanische und Polnische nun auch eine koreanische Fassung vorliegt. Es war deshalb wiederum an der Zeit, das Buch an neue Entwicklungen in Forschung und Lehre anzupassen. Wir haben uns dabei vor allem durch die Tatsache leiten lassen, dass immer weitere Bereiche der Festkörperforschung und ihrer Anwendungen durch Nanostrukturen und nanostrukturierte Materialien bestimmt werden. Ein treibendes Moment hierbei ist vor allem die Entwicklung der Mikroelektronik hin zu einer Nanoelektronik, in der charakteristische Bauelementstrukturen in den 10 nm-Bereich hinunterskaliert werden. Auf dieser Größenskala treten vermehrt dimensionsbedingte Quanteneffekte auf. Die Nanoelektronik wird so zur Quantenelektronik. Dementsprechend haben wir neben einer neuen Tafel über Verfahren zur Nanostrukturierung einen Abschnitt über Quantentransport in Nanostrukturen aufgenommen. Hier werden die wichtigsten Quanteneffekte beschrieben, die uns beim elektronischen Transport in nanoskalierten Festkörpern begegnen. Mit immer kleineren Dimensionen wächst die Bedeutung von Grenzflächen. Dies wird besonders augenfällig bei den magnetischen Eigenschaften von Dünnschichtsystemen mit ihrem Wechselspiel verschiedener magnetischer Anisotropien. Einen besonderen Akzent setzt der von Albert Fert und Peter Grünberg (Nobelpreis 2007) entdeckte Riesenmagnetowiderstand. Ihm und dem Magnetismus in Dünnschichtsystemen ist eine neue Tafel gewidmet. Zum Verständnis dieser neuen Entwicklungen war auch die Einfügung eines Abschnitts über magnetokristalline Anisotropie erforderlich. Um das Buch nicht zu umfangreich werden zu lassen, haben wir eine Tafel über Oberflächenmagnetismus entfallen lassen. Die Tafel über magnetostatische Spinwellen haben wir hingegen belassen, einerseits wegen ihres pädagogischen Wertes und andererseits, weil Peter Grünberg in seinem Nobelvortrag darauf hingewiesen hat, wie sehr ihm seinerzeit die Herausstellung seines Experimentes in einem Lehrbuch Ermutigung war. Natürlich wurden auch Inkonsistenzen und Druckfehler beseitigt, auf die uns Kollegen und Studenten dankenswerterweise aufmerksam gemacht haben. Jülich und Aachen, im Oktober 2008
H. Ibach · H. Lüth
Vorwort zur fünften und sechsten Auflage
Nachdem die „Einführung in die Festkörperphysik“ mittlerweile auch in den Sprachen Englisch, Japanisch und Polnisch als Lehrbuch an vielen Universitäten benutzt wird, war es an der Zeit, den Text einmal gründlich zu überarbeiten und durch neue Abschnitte an zeitnahe Forschungsthemen anzupassen. Hierbei haben wir uns von dem Gedanken leiten lassen, dass in der festkörperphysikalischen Ausbildung die Bezüge zur Materialwissenschaft und zur Anwendung in den letzten Jahren stärker betont werden. Dementsprechend betonen wir in der neuen Auflage die Abweichungen vom periodischen Festkörper stärker: So werden jetzt z. B. Phasendiagramme von Legierungen, Grundzüge der Defektphysik und verschiedene Aspekte amorpher Festkörper behandelt. Wegen der hohen Bedeutung mechanisch verspannter Systeme für Bauelemente ist eine Ausbildung in den Grundlagen der Elastizitätstheorie (wieder) notwendig geworden, der wir deshalb einen Abschnitt gewidmet haben. Der neue Abschnitt über das Anregungsspektrum des Supraleiters soll den Leser an die moderne Forschung auf dem Gebiet der Supraleiter/Normalleitergrenzflächen und an Anwendungen im Bereich der Supraleiterelektronik heranführen. Ähnliches gilt für die Ergänzung über Metall/Halbleiter-Schottky-Kontakte und für den neuen Abschnitt über wichtige Halbleiterbauelemente. Hier werden Grundlagen erarbeitet, welche die Verständnislücke zwischen klassischer Festkörperphysik und moderner Mikroelektronik, einem der wichtigsten Anwendungsfelder der Festkörperphysik, schließen sollen. Bei allen Ergänzungen haben wir versucht, dem bisherigen Geist des Werkes treu zu bleiben, und wir haben deshalb die Phänomene in den allgemeinen Zusammenhang eines atomistisch begründeten festkörperphysikalischen Verständnisses gebracht. Die sechste Auflage ist gegenüber der fünften nur wenig verändert. Neben Druckfehlerkorrekturen wurde die Darstellung in den Kapiteln 3, 9 und 10 in einigen Punkten neu gestaltet. Für zahlreiche Anregungen bedanken wir uns bei Dipl.-Phys. Klaus Dahmen, Dr. Arno Förster, Dr. Margret Giesen, Dr. Michel Marso, Dr. Angela Rizzi und Dr. Thomas Schäpers. Dank gilt auch den Herren Dr. H. J. Kölsch und C.-D. Bachem vom Springer-Verlag für die sehr effiziente und erfreuliche Zusammenarbeit. Jülich, im Juli 1999 und Oktober 2001
H. Ibach · H. Lüth
Vorwort zur vierten Auflage
Die vorliegende Einführung in die Festkörperphysik hat sich an vielen deutschsprachigen Universitäten und mittlerweile in der englischsprachigen Ausgabe auch an amerikanischen Hochschulen mit Erfolg als Lehrbuch durchgesetzt. Die englische Ausgabe enthielt zum ersten Mal Übungsaufgaben zu den einzelnen Kapiteln, was sich als überaus nützlich für den Gebrauch des Buches im Rahmen der Vorlesung erwies. Für die vorliegende 4. deutsche Auflage haben wir die Übungsaufgaben überarbeitet. Sie sollen den Stoff vertiefen; in einzelnen Fällen führen sie aber auch über den Stoff des Buches hinaus, um zu weiteren Studien anzuregen. Neben Fehlerkorrekturen und kleineren Verbesserungen der Darstellung wurden im Vergleich zur dritten Auflage einige Kapitel überarbeitet oder ergänzt. So wurde Tafel V über Photoemissionsspektroskopie durch eine Darstellung der winkelaufgelösten Photoemission (ARUPS) und deren Bedeutung für die Untersuchung elektronischer Bandstrukturen ergänzt. Abschnitt 10.10 über „Hochtemperatur“-Supraleiter wurde neu geschrieben, weil dieser hochaktuelle Forschungszweig sich rasch weiterentwickelt und seit der Herausgabe der dritten Auflage des Lehrbuches wesentliche neue wissenschaftliche Ergebnisse vorliegen, die manches in einem anderen Licht erscheinen lassen. Für die Neufassung des Abschnittes 10.10 waren uns Diskussionen mit Fachkollegen, die in der Supraleitungsforschung selbst arbeiten, hilfreich. Besonders danken wir Prof. C. Calandra von der Universität Modena und Dr. R. Wördenweber aus dem Institut für Schicht- und Ionentechnik des Forschungszentrums Jülich. An der Überarbeitung der Übungsaufgaben waren die Herren Dr. W. Daum, Dr. A. Förster, A. Leuther und Ch. Ohler beteiligt. Ihnen sei an dieser Stelle gedankt. Wir danken Frau Dr. Margret Giesen für die kritische Durchsicht des Manuskripts und zahlreiche Verbesserungsvorschläge. Jülich und Aachen, Juli 1995
H. Ibach · H. Lüth
Vorwort zur zweiten Auflage
Die erste Auflage unseres Lehrbuches hat bei Fachkollegen und Studenten eine überaus positive Resonanz gefunden. Insbesondere wurde die gleichrangige Behandlung theoretischer und experimenteller Aspekte der Festkörperphysik sowie die neuartige Darstellung wichtiger Experimente und aktueller Forschungsgebiete in der Form von Experimenttafeln gelobt. Neben spezifischer Kritik wurde vor allem der Wunsch nach Vervollständigung geäußert und das Fehlen der wichtigen Gebiete des Magnetismus und der Supraleitung bemängelt. Letztere Kritik wog um so schwerer, als es sich bei diesen beiden Gebieten um besonders aktuelle und wichtige Forschungsgebiete in der gegenwärtigen Festkörperphysik handelt. Die zweite Auflage wurde deshalb durch je ein Kapitel über Magnetismus und Supraleitung ergänzt. Wir haben uns bemüht, einfache Grundmodelle für die Vielteilchenwechselwirkung vorzustellen und zu diskutieren. Im Kapitel über Magnetismus wird die magnetische Kopplung sowohl lokalisierter Elektronen als auch delokalisierter Elektronen besprochen, und der Leser wird bis an moderne Dünnschichtexperimente herangeführt. In der Supraleitung wird vor allem die klassische Supraleitung im Rahmen einer einfachen Darstellung der BCS-Theorie behandelt. Den neuen Hochtemperatur-Supraleitern wird ebenfalls ein Abschnitt gewidmet. Allerdings ist die Entwicklung hier noch so im Fluss, dass wir uns auf eine Darlegung experimenteller Ergebnisse und einiger Grundgedanken beschränken mussten. Selbst hierbei ist zu erwarten, dass bis zur Veröffentlichung des Buches neue wichtige Resultate aus Experiment und Theorie vorliegen, auf die noch nicht eingegangen werden konnte. Das Kapitel über Halbleiter wurde gegenüber der ersten Auflage wesentlich erweitert und vor allem durch die Themen Halbleiter-Heterostrukturen, Übergitter, Epitaxie und Quanten-HallEffekt ergänzt. Durch die umfangreichen Erweiterungen hat sich der Charakter des Buches dahingehend geändert, dass Gebiete aktueller Forschung eine deutlich stärkere Betonung erfahren haben. Darüber hinaus haben wir die Gelegenheit benutzt, Druckfehler und Unschönheiten der ersten Auflage zu beseitigen. Für die vielen Anregungen von Kollegen, die wir hierzu in den vergangenen Jahren erhielten, bedanken wir uns herzlich. Dank gilt insbesondere den Kollegen A. Stahl und W. Zinn, die durch einige Ratschläge und Bereitstellung von experimentellem Material zu den beiden neuen Kapiteln Supraleitung und Magnetismus beigetragen haben. Für
Vorwort zur zweiten Auflage
IX
die kritische Durchsicht von Teilen des Manuskriptes und der Druckfahnen bedanken wir uns bei Frau Dr. Angela Rizzi und den Herren W. Daum, Ch. Stuhlmann und M. Wuttig. Die Zeichnungen haben Frau U. Marx-Birmans und Herr H. Mattke mit dankenswerter Geduld angefertigt. Das Manuskript schrieben die Sekretärinnen Frau D. Krüger, M. Jürss-Nysten und G. Offermann. Den Herren Dr. H. Lotsch und C.-D. Bachem vom Springer-Verlag danken wir für die erfreuliche Zusammenarbeit. Jülich, im September 1988
H. Ibach · H. Lüth
Vorwort zur ersten Auflage
Ein neues Buch neben vielen vorhandenen, ausgezeichneten Lehrbüchern bedarf wohl der Rechtfertigung. Wir meinen, sie ist in der Entwicklung der Festkörperphysik als Wissensgebiet und Unterrichtsfach begründet. Die Festkörperphysik hat sich in den letzten Jahrzehnten zu einer eigenständigen Disziplin innerhalb der Physik entwickelt und ein nicht unerheblicher Teil der aktuellen physikalischen Forschung ist auf sie konzentriert. Gleichzeitig hat sich die Festkörperphysik ausgedehnt auf Bereiche, die vormals den Ingenieurwissenschaften, der Chemie oder empirischen Wissensgebieten vorbehalten waren. Als Folge dieser Entwicklung vermag heute weder der einzelne Dozent das Gesamtgebiet zu überschauen und in seiner Entwicklung zu verfolgen, noch ist die Festkörperphysik als solche dem Studenten vermittelbar. Wir haben geglaubt, dass in dieser Situation ein Lehrbuch, welches sich radikal auf wesentliche Elemente der Festkörperphysik beschränkt, nützlich sein könnte. Aufbauend auf dieser Grundlage können dann Spezialvorlesungen angeboten werden, die sich an den jeweiligen Forschungsschwerpunkten der einzelnen Hochschulen ausrichten. Ein weiterer Gesichtspunkt für die Gestaltung dieses Buches war die Beobachtung, dass Festkörperphysik aus technischen Gründen kaum als klassische ExperimentalphysikVorlesung mit Demonstrationsexperimenten gelesen werden kann. Aus diesem Grunde und wegen der Eigentümlichkeit der Festkörperphysik, eine starke Verbindung von Theorie und Experiment herzustellen, ist eine strenge Trennung zwischen experimenteller und theoretischer Festkörperphysik unseres Erachtens nicht zweckmäßig. Das vorliegende Buch basiert auf dem Stoff einer Vorlesung, die ein Semester vierstündig bzw. zwei Semester zweistündig gehalten wurde. Im Zentrum der Darstellung steht der periodische Festkörper in der Einteilchen-Näherung. Von daher ist es verständlich, dass so wichtige Gebiete wie z. B. die Supraleitung nicht behandelt werden konnten. Das Buch versucht zwischen Experimentalphysik und theoretischer Physik eine Mittellinie einzuhalten. Dort wo theoretische Betrachtungen ohne allzu großen Aufwand möglich und hilfreich sind, haben wir uns nicht gescheut, stärkere Anforderungen an das Abstraktionsvermögen zu stellen. Wir haben ferner versucht, Begriffsbildungen, Modelle und Bezeichnungen, deren Kenntnis für das Verständnis gegenwärtiger Originalliteratur der theoretischen Festkörperphysik unumgänglich ist, mit in dieses Buch aufzunehmen. Wir haben uns andererseits bemüht, dort wo ein klassisches Bild möglich und vertretbar ist, in diesem Bilde zu arbeiten.
Vorwort zur ersten Auflage
XI
In der Reihenfolge der Darstellung folgt das Buch dem Schema: chemische Bindung, Struktur, Gittereigenschaften, elektronische Eigenschaften. Wir glauben, dass diese Reihenfolge aus didaktischen Gründen zweckmäßig ist, weil sie es ermöglicht, besonders schwierige festkörperphysikalische Begriffsbildungen zu einem späteren Zeitpunkt einzuführen, wenn wichtige Fundamente bereits an einfacheren Modellen bzw. Beispielen erarbeitet worden sind. Die verhältnismäßig straffe und auf das Wesentliche konzentrierte Darstellung wird ergänzt durch Experimenttafeln, in denen jeweils einige ausgewählte Experimente der Festkörperphysik dargestellt sind. Hier hat der Leser Gelegenheit, sein bisher erarbeitetes Wissen zu überprüfen bzw. Anregungen für sein weiteres Selbststudium zu empfangen. Die Auswahl des Stoffes in den Kapiteln und in den Experimenttafeln erfolgte in dem Bemühen der Konzentration und andererseits im Hinblick darauf, das zu erfassen, was didaktisch gut darstellbar und zu verstehen ist. Dass Auswahl und Auswahlkriterien nicht frei von subjektiven Einflüssen sind und andere Autoren die Akzente anders gesetzt hätten, ist wohl unvermeidbar. Das Buch wäre nicht entstanden ohne Unterstützung durch Kollegen und Mitarbeiter. Auch ist viel Gedankengut unserer akademischen Lehrer G. Heiland und G. Leibfried eingeflossen. Für die Experimenttafeln haben insbesondere die Kollegen U. Bonse, G. Comsa, W. Hartmann, B. Lengeler, H. Raether, W. Richter, W. Sander, H. H. Stiller Bild- und Literaturmaterial ausgewählt und zur Verfügung gestellt. Für die kritische Durchsicht einzelner Abschnitte danken wir den Kollegen G. Comsa und W. Sander sowie Herrn R. Matz. Weiterer Dank gilt Frau M. Mattern für ihre intensive Mitarbeit bei der Korrektur der letzten Manuskriptfassung. Das Manuskript haben die Sekretärinnen Frau H. Dohmen, I. Kratzenberg, D. Krüger und G. Offermann geschrieben. Besonderer Dank gilt Frau U. Marx, die alle Zeichnungen anfertigte und unseren vielfältigen Änderungswünschen große Geduld entgegenbrachte. Dem Springer-Verlag, insbesondere den Herren Dr. H. Lotsch und R. Michels, danken wir für die ausgezeichnete Zusammenarbeit. Jülich, Aachen im November 1980
H. Ibach · H. Lüth
Inhaltsverzeichnis
1. Die chemische Bindung in Festkörpern . . . . . . . . . . . 1.1 Das Periodensystem . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Kovalente Bindung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Die Ionenbindung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Metallische Bindung . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Die Wasserstoffbrückenbindung . . . . . . . . . . . . . . . . . . . 1.6 Die Van der Waals-Bindung . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 1 4 9 13 14 15 17
2. Die Struktur von Festkörpern . . . . . . . . . . . . . . . . . . . 2.1 Translationsgitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Punktsymmetrien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Die 32 Kristallklassen (Punktgruppen) . . . . . . . . . . . . . 2.4 Die Bedeutung der Symmetrie . . . . . . . . . . . . . . . . . . . 2.5 Einfache Kristallstrukturen . . . . . . . . . . . . . . . . . . . . . . 2.6 Phasendiagramme von Legierungen . . . . . . . . . . . . . . . . 2.7 Defekte in Festkörpern . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 22 25 27 28 31 36 46 49
3. Die Beugung an periodischen Strukturen . . . . . . . . . 3.1 Die allgemeine Beugungstheorie . . . . . . . . . . . . . . . . . . 3.2 Periodische Strukturen und reziprokes Gitter . . . . . . . . . 3.3 Die Streubedingung bei periodischen Strukturen . . . . . . 3.4 Die Braggsche Deutung der Beugungsbedingung . . . . . 3.5 Die Brillouinschen Zonen . . . . . . . . . . . . . . . . . . . . . . . 3.6 Der Strukturfaktor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7 Methoden der Strukturanalyse . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel I: Beugungsexperimente mit verschiedenen Teilchen . . . Tafel II: Röntgeninterferometer und Röntgentopographie . . . .
51 51 57 58 60 63 64 67 70 72 77
4. 4.1 4.2 4.3 4.4
81 82 83 85
Dynamik von Atomen in Kristallen . . . . . . . . . . . . . . Das Potential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Bewegungsgleichungen . . . . . . . . . . . . . . . . . . . . . . Die lineare zweiatomige Kette . . . . . . . . . . . . . . . . . . . Streuung an zeitlich veränderlichen Strukturen – Phononenspektroskopie . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Elastisches Verhalten von Kristallen . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel III: Raman-Spektroskopie . . . . . . . . . . . . . . . . . . . . . . .
89 92 103 105
XIV
Inhaltsverzeichnis
5. Thermische Eigenschaften . . . . . . . . . . . . . . . . . . . . . 5.1 Die Zustandsdichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Thermische Energie eines harmonischen Oszillators . . . 5.3 Spezifische Wärme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Anharmonische Effekte . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Thermische Ausdehnung . . . . . . . . . . . . . . . . . . . . . . . 5.6 Wärmeleitung durch Phononen . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel IV: Experimente bei tiefen Temperaturen . . . . . . . . . . .
111 112 115 116 119 120 123 129 130
6. 6.1 6.2 6.3 6.4 6.5
135 136 140 142 145
„Freie“ Elektronen im Festkörper . . . . . . . . . . . . . . . Das freie Elektronengas im Potentialkasten . . . . . . . . . Das Fermi-Gas bei T = 0 K . . . . . . . . . . . . . . . . . . . . . . Fermi-Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Spezifische Wärme der Metallelektronen . . . . . . . . . . . Elektrostatische Abschirmung in einem Fermi-Gas – Mott-Übergang . . . . . . . . . . . . . 6.6 Glühemission aus Metallen . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
149 152 156
7. Elektronische Bänder in Festkörpern . . . . . . . . . . . . 7.1 Allgemeine Symmetrieeigenschaften . . . . . . . . . . . . . . 7.2 Näherung des quasifreien Elektrons . . . . . . . . . . . . . . . 7.3 Näherung vom „stark gebundenen“ Elektron her . . . . . 7.4 Beispiele von Bandstrukturen . . . . . . . . . . . . . . . . . . . . 7.5 Zustandsdichten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.6 Zustandsdichte nichtkristalliner Festkörper . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel V: Photoemissionsspektroskopie . . . . . . . . . . . . . . . . . .
159 160 163 168 173 177 179 183 185
8. 8.1 8.2 8.3 8.4 8.5
189 190 195 198 200
Magnetismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dia- und Paramagnetismus . . . . . . . . . . . . . . . . . . . . . . Austauschwechselwirkung . . . . . . . . . . . . . . . . . . . . . . Austauschwechselwirkung zwischen freien Elektronen . Das Bandmodell für den Ferromagnetismus . . . . . . . . . Das Temperaturverhalten eines Ferromagneten im Bandmodell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.6 Ferromagnetische Kopplung bei lokalisierten Elektronen 8.7 Antiferromagnetismus . . . . . . . . . . . . . . . . . . . . . . . . . 8.8 Spinwellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.9 Kristallanisotropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel VI: Magnetostatische Spinwellen . . . . . . . . . . . . . . . . . Tafel VII: Magnetismus in Schichtsystemen und GMR-Effekt 9. 9.1
204 208 210 214 218 225 226 230
Bewegung von Ladungsträgern und Transportphänomene . . . . . . . . . . . . . . . . . . . . . 235 Bewegung von Ladungsträgern in Bändern – die effektive Masse . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
Inhaltsverzeichnis
XV
9.2 Ströme in Bändern und Defektelektronen . . . . . . . . . . . 9.3 Streuung von Elektronen in Bändern . . . . . . . . . . . . . . . 9.4 Boltzmann-Gleichung und Relaxationszeit . . . . . . . . . . 9.5 Die elektrische Leitfähigkeit von Metallen . . . . . . . . . . 9.6 Thermoelektrische Effekte . . . . . . . . . . . . . . . . . . . . . . . 9.7 Das Wiedemann-Franz-Gesetz . . . . . . . . . . . . . . . . . . . . 9.8 Elektrische Leitfähigkeit durch lokalisierte Elektronen . 9.9 Quantentransport in Nanostrukturen . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel VIII: Quantenoszillationen und die Topologie von Fermi-Flächen . . . . . . . . . . . . . . . . . . . . . . . .
239 241 245 250 256 260 261 264 280
10. Supraleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1 Einige Grundphänomene der Supraleitung . . . . . . . . . . . 10.2 Phänomenologische Beschreibung durch London-Gleichungen . . . . . . . . . . . . . . . . . . . . . . 10.3 Instabilität des „Fermi-Sees“ und Cooper-Paare . . . . . . 10.4 Der BCS-Grundzustand . . . . . . . . . . . . . . . . . . . . . . . . . 10.5 Das Anregungsspektrum des Supraleiters . . . . . . . . . . . 10.6 Konsequenzen der BCS-Theorie und Vergleich mit experimentellen Befunden . . . . . . . . . . . . . . . . . . . . 10.7 Suprastrom und kritischer Strom . . . . . . . . . . . . . . . . . . 10.8 Kohärenz des BCS-Grundzustandes und Meissner-Ochsenfeld-Effekt . . . . . . . . . . . . . . . . . . 10.9 Quantisierung des magnetischen Flusses . . . . . . . . . . . . 10.10 Supraleiter 2. Art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.11 Neuartige „Hochtemperatur“-Supraleiter . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel IX: Einelektronen-Tunneln an Supraleitern . . . . . . . . . . Tafel X: Cooper-Paar-Tunneln – Josephson-Effekte . . . . . . . .
287 287
322 327 331 338 347 349 356
11. Dielektrische Eigenschaften der Materie . . . . . . . . . . 11.1 Die dielektrische Funktion . . . . . . . . . . . . . . . . . . . . . . 11.2 Absorption elektromagnetischer Strahlung . . . . . . . . . . . 11.3 Die dielektrische Funktion für harmonische Oszillatoren 11.4 Longitudinale und transversale Eigenschwingungen . . . 11.5 Oberflächenwellen eines Dielektrikums . . . . . . . . . . . . . 11.6 Das Reflexionsvermögen des dielektrischen Halbraums . 11.7 Das lokale Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.8 Polarisationskatastrophe und Ferroelektrika . . . . . . . . . . 11.9 Das freie Elektronengas . . . . . . . . . . . . . . . . . . . . . . . . 11.10 Interband-Übergänge . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.11 Exzitonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.12 Dielektrische Energieverluste von Elektronen . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel XI: Spektroskopie mit Photonen und Elektronen . . . . . . Tafel XII: Infrarot-Spektroskopie . . . . . . . . . . . . . . . . . . . . . . Tafel XIII: Die Methode der frustrierten Totalreflexion . . . . .
361 361 364 367 370 372 374 375 378 379 382 389 390 394 397 399 401
282
292 295 300 309 314 318
XVI
Inhaltsverzeichnis
12. 12.1 12.2 12.3 12.4 12.5 12.6
Halbleiter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Daten einiger wichtiger Halbleiter . . . . . . . . . . . . . . . . Ladungsträgerdichte im intrinsischen Halbleiter . . . . . . Dotierung von Halbleitern . . . . . . . . . . . . . . . . . . . . . . Ladungsträgerdichte in dotierten Halbleitern . . . . . . . . Leitfähigkeit von Halbleitern . . . . . . . . . . . . . . . . . . . . Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt . . . . . . . . . 12.7 Halbleiterheterostrukturen und Übergitter . . . . . . . . . . . 12.8 Wichtige Halbleiterbauelemente . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel XIV: Hall-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel XV: Zyklotron-Resonanz bei Halbleitern . . . . . . . . . . . Tafel XVI: Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt . . . . . . . . . . . . . . . . . . . Tafel XVII: Halbleiterepitaxie . . . . . . . . . . . . . . . . . . . . . . . . Tafel XVIII: Präparation von Nanostrukturen . . . . . . . . . . . .
403 404 408 412 416 421 427 443 456 471 473 475 477 483 488
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493 Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 505 Periodensystem der Elemente (Vordere Einbandrückseite) Konstanten und Äquivalentwerte (Hintere Einbandrückseite)
1. Die chemische Bindung in Festkörpern
Festkörperphysik ist die Physik des festen Aggregatzustandes einer großen Zahl chemisch gebundener Atome. Die Betonung liegt dabei auf der großen Zahl der beteiligten Atome. Typische Volumen von „Festkörpern“ liegen im Bereich von cm3. Die Zahl beteiligter Atome ist deshalb von der Größenordnung 1023. Es erscheint hoffnungslos, mit einer solchen Zahl von Atomen auf das quantitative Verständnis ausgerichtete Wissenschaft betreiben zu wollen. Jedoch gerade die große Zahl beteiligter Atome ermöglicht in vielen Fällen die quantitative Beschreibung durch neue, festkörpertypische Modelle. Voraussetzung ist allerdings, dass sich die beteiligten Atome nicht willkürlich aus dem gesamten Periodensystem rekrutieren, sondern dass der Festkörper sich aus einer begrenzten Anzahl von Elementen in bestimmter Ordnung aufbaut. Schaustücke der Festkörperphysik in diesem Sinne sind die Elementkristalle, d. h. dreidimensional periodische Anordnungen von Atomen einer Sorte, oder auch die Verbindungen von zwei Elementen. Wenn wir also den Festkörper mit seinen besonderen Eigenschaften verstehen wollen, müssen wir uns ein Basisverständnis zunächst im Hinblick auf zwei Fragestellungen verschaffen: Die erste ist die Frage nach den Kräften, die die Atome im Festkörper zusammenhalten, also die Frage nach der chemischen Bindung. Die zweite ist die Frage nach der strukturellen Ordnung. Die Erarbeitung dieses Basiswissens ist der Gegenstand der ersten beiden Kapitel. Beide Kapitel können dazu nur eine kurze Einführung geben. Für genauere Darstellungen sei auf Lehrbücher der Quantenchemie und Kristallographie verwiesen.
1.1 Das Periodensystem Zur Einführung in das Verständnis der chemischen Bindung wollen wir uns kurz noch einmal den Aufbau des Periodensystems der Elemente vor Augen führen. Die Elektronenterme eines Atoms werden klassifiziert nach den Einelektronenzuständen des radial-symmetrischen Potentials. Es gibt demnach 1 s, 2 s, 2 p, 3 s, 3 p, 3 d, 4 s, 4 p, 4 d, 4 f . . . Zustände, wobei die Zahl der Hauptquantenzahl n und die Buchstaben s, p, d, f den Werten der Bahndrehimpulsquantenzahl entsprechen (l = 0, 1, 2, 3 . . .). Dieser Klassifizierung entspricht die Vorstellung,
2
1 Die chemische Bindung in Festkörpern
Tabelle 1.1. Aufbau des Periodensystems durch Füllung der Schalen mit Elektronen. Zu den Elementen sind jeweils die äußeren Elektronenniveaus angegeben, die gerade aufgefüllt werden. Die maximale Besetzung der Niveaus ist in Klammern angegeben 1s 2s 2p 3s 3p
(2) (2) (6) (2) (6)
H, He Li, Be B ? Ne Na, Mg Al ? Ar
4s 3d 4p 5s 4d
(2) (10) (6) (2) (10)
K, Ca Übergangsmetalle Sc ? Zn Ga ? Kr Rb, Sr Übergangsmetalle Y ? Cd
5p 6s 4f 5d 6p
(6) (2) (14) (10) (6)
In ? Xe Cs, Ba Seltene Erden Ce ? Lu Übergangsmetalle La ? Hg Tl ? Rn
dass für ein jeweils betrachtetes Elektron die Wirkung der übrigen Elektronen durch eine kontinuierliche, feste Ladungsverteilung mit abschirmender Wirkung auf das Kernpotential beschrieben werden kann. Zusätzlich zur Hauptquantenzahl n und zur Bahndrehimpulsquantenzahl l gibt es noch die magnetische Quantenzahl m, die (2 l+1) Werte annehmen kann. Nach dem Pauli-Prinzip ist jeder Elektronenzustand mit zwei Elektronen entgegengesetzten Spins besetzbar. Dadurch ergibt sich mit steigender Kernladungszahl der in Tabelle 1.1 dargestellte Aufbau des Periodensystems. Wie wir aus der Tabelle entnehmen, werden nach den 3 p-Zuständen nicht, wie man nach den Energieniveaus des Wasserstoffatoms annehmen könnte, die 3 d-Zustände aufgefüllt, sondern zunächst die 4 s-Zustände. Mit der nachfolgenden Auffüllung der 3 d-Zustände entsteht die erste Serie der Übergangsmetalle (3 d-Metalle). Entsprechend gibt es 4 dund 5 d-Übergangsmetalle. Der gleiche Effekt bei den f-Zuständen führt zu den sogenannten seltenen Erden. Der Grund für diese Anomalie liegt darin, dass s-Zustände eine nichtverschwindende Aufenthaltswahrscheinlichkeit am Ort des Kernes haben, wodurch sich die abschirmende Wirkung der übrigen Elektronen weniger bemerkbar macht und deshalb die Energie der s-Terme niedriger liegt. Bringt man in einem Gedankenexperiment mehrere Atome allmählich näher zusammen, so entsteht durch die Wechselwirkung der Atome untereinander eine Aufspaltung der Terme. Ist eine große Zahl von Atomen beteiligt wie im festen Körper, so liegen die Elektronenterme auf der Energieskala quasikontinuierlich verteilt, und man spricht deshalb von Bändern (Abb. 1.1). Die Größe der Aufspaltung hängt vom Überlapp der betreffenden Wellenfunktionen ab. Sie ist also klein für tiefliegende Energieniveaus, die ihren Schalencharakter auch im festen Körper behalten. Bei den höchsten noch besetzten Elektronentermen ist dagegen die Aufspaltung so groß, dass s- und p- und ggf. auch d-Zustände ein gemeinsames Band bilden. Die Elektronen in diesem Band sind für die chemische Bindung verantwortlich, weshalb man auch vom Valenzband spricht. Ursache für die Bindung ist letztlich die durch die Aufspaltung ermöglichte Absenkung der Elektronenenergie, welche trotz erhöhter Repulsion der Kerne (bis zum Gleichgewichtsabstand) zu einer Verminderung der Gesamtenergie führt. Von wesentlicher Bedeutung für die Art der Bindung ist es, ob im Gleichgewichtsabstand der Überlapp von Wellenfunktionen im wesentlichen nur zwischen benachbarten Atomen stattfindet oder
1.1 Das Periodensystem
3
Abb. 1.1. Aufspaltung der Energieniveaus bei Annäherung einer großen Zahl gleicher Atome der ersten Reihe des Periodensystems aneinander (schematisch). Der Abstand r0 soll etwa den Gleichgewichtsabstand in einer chemischen Bindung charakterisieren. Durch die Überlappung der 2 s- und 2 p-Bänder wird auch das Element Be mit zwei sElektronen zum Metall. Tiefliegende Atomniveaus spalten wenig auf und behalten deshalb weitgehend ihren atomaren Charakter
ob die Ausdehnung der Wellenfunktionen so groß ist, dass zugleich viele Atome mit erfaßt werden. Im ersten Fall sind für die Stärke des Überlapps und damit für die Bindungsstärke nicht nur die Abstände der Atome voneinander, sondern auch die Bindungswinkel von Bedeutung. Man spricht in diesem Sinne von gerichteter Bindung. Sie wird auch als kovalente Bindung bezeichnet. Die kovalente Bindung wird zwar in ihrer reinsten Form zwischen einigen Elementen gleicher „Valenz“, d. h. gleicher Elektronenkonfiguration realisiert, doch ist gleiche Elektronenkonfiguration weder notwendige noch hinreichende Voraussetzung für kovalente Bindung. Wichtig ist lediglich die relative Ausdehnung der Wellenfunktionen im Vergleich zum interatomaren Abstand. Ist die Ausdehnung der Wellenfunktion groß im Vergleich zum Abstand zwischen nächsten Nachbarn, so spielt die Position der nächsten Nachbarn eine geringere Rolle bei der Erzielung eines möglichst großen Überlapps mit vielen Atomen. Die Packungsdichte ist dann also wichtiger als die relative Lage der nächsten Nachbarn. In diesem Sinne spricht man hier auch von einer ungerichteten Bindung. Der Fall großer Ausdehnung der Wellenfunktion im Verhältnis zu den atomaren Abständen ist charakteristisch für die metallische Bindung. Eine ebenfalls ungerichtete Bindung, jedoch mit extrem geringem Überlapp der Wellenfunktion, ist die Ionenbindung. Sie entsteht, wenn ein Elektronentransfer von einer Atomsorte auf eine andere energetisch genügend günstig ist. Ionenbindung setzt also die Verschiedenheit der beteiligten Atome notwendig voraus. In den folgenden Abschnitten wollen wir die verschiedenen Bindungstypen etwas detaillierter kennenlernen.
4
1 Die chemische Bindung in Festkörpern
1.2 Kovalente Bindung Wir hatten die kovalente Bindung im Festkörper als eine Bindung charakterisiert, bei der die Wechselwirkung zwischen den nächsten Nachbarn dominiert. Deshalb können wesentliche Eigenschaften dieser Festkörperbindung aus der Quantenchemie der Moleküle übernommen werden. Zur Erläuterung wollen wir das einfachste Modell für die Bindung, das zweiatomige Molekül mit einem Bindungselektron, diskutieren. Der Hamiltonoperator H für dieses Molekül enthält die kinetische Energie des Elektrons und die Coulomb-Wechselwirkung zwischen allen Partnern (Abb. 1.2 a)
H
h2 D 2m
Z e2 4 p e0 rA
Z 0 e2 ZZ 0 e2 : 4 p e0 rB 4 p e0 R
1:1
Das richtige Molekülorbital für das Elektron wMo würde die Schrödinger-Gleichung
H wMo E wMo
1:2
lösen. Allerdings muss man schon in diesem einfachen Fall auf Näherungslösungen zurückgreifen. Mit einer solchen Näherungslösung w berechnet sich der Erwartungswert der Energie für den Grundzustand
Abb. 1.2 a–c. Einfachstes Modell der kovalenten Bindung (das H+2 Molekül). (a) Definition der Symbole in (1.1). (b) Bindende und antibindende Kombination von Atomorbitalen. Die bindende Kombination führt zu einer Anhäufung der Elektronendichte zwischen den Kernen, was zu einer Absenkung der Coulomb-Energie führt. (c) Aufspaltung der Atomniveaus in bindenden und antibindenden Zustand. Die größte Bindungsenergie wird gewonnen, wenn gerade der bindende Zustand voll, d. h. mit zwei Elektronen, besetzt ist und der antibindende leer ist („Elektronenpaarbindung“)
1.2 Kovalente Bindung
5
w H wdr : E w w dr 0
1:3
Ein Ansatz für die Näherungslösung w ist die Linearkombination von Zuständen der beiden getrennten Einzelatome w cA wA cB wB :
1:4
Wellenfunktionen und Koeffizienten sind hier reell. Man kann zeigen, dass die Energie E ' mit einer solchen Versuchsfunktion stets über dem wahren Wert E liegt (s. Übung 1.8). Die besten Werte für die Koeffizienten cA und cB sind diejenigen, die zu einem minimalen Wert von E ' führen. Mit Hilfe der Abkürzungen S wA wB dr
Uberlappungsintegral
1:5 a HAA wA H wA dr ;
1:5 b
HAB wA H wB dr ;
1:5 c
folgt für das zu minimierende E ' E0
c2A HAA c2B HBB 2 cA cB HAB : c2A c2B 2 cA cB S
1:6
Für das Minimum von E ' bezüglich cA und cB wird verlangt @ E0 @ E0 0; @ cA @ cB
1:7
d. h., es folgen die Säkulargleichungen cA
HAA
E0 cB
HAB
cA
HAB
E0 S cB
HBB
E0 S 0 ;
1:8 a
E0 0 ;
1:8 b
deren Lösungen durch das Verschwinden der Determinante bestimmt sind:
HAA
E0
HBB
E0
HAB
E0 S2 0
1:9
Nehmen wir der Einfachheit halber gleiche Kerne (z. B. H2+) an, d. h. HAA = HBB, dann ergeben sich durch Molekülbildung aus dem einen atomaren Eigenwert HAA = HBB der freien Einzelatome zwei neue Molekularorbitale mit den Energien HAA HAB :
1:10 1S Hierbei ist wegen (1.5 a) S = 0 für unendlich weit voneinander entfernte Kerne, während beim Zusammenfallen beider Zentren S = 1 wird. Aus (1.10) folgt, dass aus dem räumlichen Überlapp der Wellenfunktionen wA und wB eine Aufspaltung des Energieniveaus 0 E . E
6
1 Die chemische Bindung in Festkörpern
HAA bzw. HBB in ein etwas höher und in ein etwas tiefer liegendes Niveau des Moleküls resultiert (Abb. 1.2 c). Das zum energetisch höher liegenden Energieniveau gehörende Molekülorbital nennt man antibindend, das andere bindend. Im Molekül findet das Elektron auf dem energetisch etwas niedriger liegenden bindenden Orbital Platz, was insgesamt zu einer Absenkung der Energie bei der Bindung führt. Diese Absenkung ist also die Bindungsenergie der kovalenten Bindung. Weiter erkennt man, dass nur unvollständig besetzte, also mit weniger als zwei Elektronen besetzte Orbitale von Einzelatomen kovalente Bindungen eingehen können: Da das bindende Molekülorbital nur zwei Elektronen (Pauli-Prinzip erlaubt zwei Spineinstellungen) aufnehmen kann, würde sonst das energetisch höher liegende antibindende Orbital besetzt, was die Energieabsenkung wieder kompensieren würde (vgl. dazu auch Übung 1.7). Bei zweiatomigen Molekülen, wie hier betrachtet, gehört zum bindenden Molekülorbital die additive Überlagerung von wA und wB d. h. wMo = wA+wB [in (1.4) ist cA = cB für Moleküle mit gleichen Kernen]. Dies führt, wie in Abb. 1.2 b gezeigt, zu einer Anhebung der Ladungsdichte zwischen den Kernen. Dadurch wird die Coulomb-Repulsion der Kerne gemindert. Die antibindende Kombination wMo =wA–wB führt dagegen zu einer Absenkung der Ladungsdichte. Man sieht, dass kovalente Bindung mit einer Anhäufung von elektronischer Ladung zwischen den das Molekül oder den Festkörper bildenden Atomen verknüpft ist. Der dafür verantwortliche räumliche Überlapp der Wellenfunktion bestimmt die Stärke der energetischen Absenkung der bindenden Molekül- oder Kristallatom-Orbitale und damit die Bindungsenergie. Wie Abb. 1.3 zeigt, gibt es bei gegebenen Atomorbitalen (s, p, d etc.) für den Überlapp günstige und ungünstige Orientierungen. Hieraus erklärt sich der stark gerichtete Charakter der kovalenten Bindung, der insbesondere bei den kovalent gebundenen Kristallen Diamant (C), Si, Ge mit ihrer tetraedrischen Nahordnung (Abb. 1.4) gegeben ist. Diese kovalente tetraedrische Bindung sei am Beispiel des Diamanten etwas näher betrachtet: Aufgrund seiner Elektronenkonfiguration 1 s 2, 2 s 2, 2 p 2 wäre C nur in der Lage, zwei kovalente Bindungen (2 nur mit einem Elektron besetzte p-Orbitale) einzuge-
Abb. 1.3 a, b. Anschauliche Darstellung des räumlichen Überlappens zwischen je einer s- und einer p-Wasserstoffwellenfunktion. Die räumliche Ausdehnung der Orbitale ist dargestellt in Form von Flächen gleicher Wellenamplitude. (a) Sich gegenseitig kompensierender Überlapp zwischen s und pz. (b) Nichtverschwindender Überlapp zwischen s und py
1.2 Kovalente Bindung
7
Abb. 1.4. Die tetraedrische Konfiguration nächster Nachbarn in den Kristallstrukturen von C, Si, Ge und -Sn. Sie ist eine Folge der dadurch ermöglichten periodischen Anordnung im dreidimensionalen Raum und der Ausbildung von sp 3-Hybrid-Orbitalen aus den Wellenfunktionen s, px , py und pz. Die Abbildung zeigt die Orbitale für Diamant (C). Für Si, Ge und -Sn besitzen die Orbitale zusätzliche Knoten
hen. Offenbar tritt beim Einbau in einen Kristall aber eine stärkere Energieabsenkung insgesamt ein, wenn der Überlapp von vier Bindungsorbitalen ermöglicht wird. Im Einelektronenbild stellt man sich dies vereinfacht so vor, dass aus dem 2 s-Orbital ein Elektron in das leere 2 p-Orbital angeregt wird. Die nun jeweils nur mit einem Elektron besetzten drei 2 p- und das 2 s-Orbital können vier Bindungen eingehen. Maximaler Überlapp zu den nächsten Nachbarn wird erreicht, wenn man aus den vier Wellenfunktionen 2 s, 2 px, 2 py, 2 pz vier neue Linearkombinationen bildet. Diese neuen Molekularorbitale nennt man sp 3-Hybride und den Vorgang auch „Rehybridisierung“ (s. Übung 1.9). Der dadurch ermöglichte Überlapp zu den nächsten Nachbarn in den tetraedrischen Richtungen führt zu einer Energieabsenkung, die die notwendige Anregung des 2 s-Elektrons in das 2 p-Orbital überkompensiert. Fügt man nun Kohlenstoffatome zur Diamant-Struktur zusammen, bei der jedes Atom gerade von vier weiteren in tetraedrischer Konfiguration umgeben ist (Abb. 2.12), kann sich im sp 3-Hybrid jedes Kohlenstoffatom mit seinen Nachbarn die verfügbaren Elektronen so teilen, dass gerade nur die bindenden Terme besetzt sind. Dadurch entsteht ein vollgefülltes Valenzband, welches vom nächsten darüberliegenden leeren (antibindenden) Band durch eine Lücke getrennt ist. Energie kann nur noch in Form großer Quanten zugeführt werden, die es gestatten, die Bandlücke zu überspringen. Deshalb sind solche kovalent gebundenen Festkörper bei genügend tiefen Temperaturen Nichtleiter. Ist die Bandlücke nicht zu groß, kann die thermische Anregung von Elektronen zu einer messbaren Leitfähigkeit führen. Man spricht dann von Halbleitern. Eine genauere Definition wird in Kap. 9 und 12 gegeben. Statt eines räumlichen sp 3-Hybridorbitals kann Kohlenstoff auch das flächenhafte sp2-Hybridorbital aus einer 2 s- und zwei 2 pFunktionen bilden (s. Übung 1.10). Diese Orbitale bilden dann einen ebenen 120 ° Stern. Zusätzlich existiert noch ein mit einem
8
1 Die chemische Bindung in Festkörpern
Elektron gefülltes pz-Orbital senkrecht zur Ebene des Sterns. Der Überlapp dieser pz-Orbitale von benachbarten C-Atomen führt zu einer zusätzlichen Bindung, der sogenannten p-Bindung. Diese Art der Bindung wird innerhalb der Schichten der Graphitstruktur des Kohlenstoffs realisiert. Die Bindung zwischen den kovalent gebundenen Schichten der Graphitstruktur ist vom Van der Waals Typ (Abschn. 1.6) und deshalb vergleichsweise schwach. Eine interessante räumliche Struktur unter Verwendung von sp 2Orbitalen stellen die Fullerene dar, deren prominentester Vertreter das C60 ist (Abb. 1.5). Die räumliche Struktur der Fullerene entsteht durch die Fünfecke, von denen aus topologischen Gründen immer 12 erforderlich sind, um eine geschlossene Form zu bilden. Der C60-Cluster weist neben den 12 Fünfecken auch 20 Sechsecke auf. Größere Moleküle lassen sich durch Einfügen weiterer Sechsecke bilden. Aus C60-Clustern lassen sich u. a. durch Beifügen von anderen Atomen, z. B. Alkali- oder Erdalkaliatomen, auch dreidimensionale Kristallstrukturen herstellen.
Abb. 1.5. Die Struktur von C60
Eine vollständige Absättigung der kovalenten Bindung wird bei den Elementen der 4. Gruppe C, Si, Ge und a-Sn in der den dreidimensionalen Raum erfüllenden, tetraedrischen Konfiguration ermöglicht. Die Elemente der 5. Gruppe P, As, Sb benötigen dazu nur eine Dreierkoordination. Sie bilden Schichtstrukturen. Entsprechend bilden die Elemente der 6. Gruppe Te und Se Kettenstrukturen mit Zweierkoordination. Kovalent gebundene Festkörper lassen sich natürlich auch aus verschiedenen Elementen herstellen. Als Beispiel betrachten wir Bornitrid. Die Elemente haben dabei die Elektronenkonfiguration: B (2 s 2, 2 p 1); N (2 s 2, 2 p 3). Aus diesen Elementen lässt sich ebenfalls das Diamantgitter mit tetraedrischer Koordination aufbauen. Dabei ist jedes Boratom von 4 Stickstoffatomen umgeben und umgekehrt. Zur gemeinsamen Bindung steuert das Stickstoffatom 5 Elektronen und das Boratom 3 Elektronen bei. Insgesamt ergibt sich also dieselbe Elektronenzahl pro Atom wie beim Kohlenstoffgitter. Wegen der Verschiedenheit der Elemente hat die Verbindung aber einen Ionencharakter. Darüber soll im folgenden Abschnitt gesprochen werden.
1.3 Die Ionenbindung
9
Typische Bindungsenergien für rein kovalent gebundene Kristalle sind beispielsweise: C (Diamant): 7,3 eV pro Atom (712 kJ/Mol); Si: 4,64 eV pro Atom (448 kJ/Mol); Ge: 3,87 eV pro Atom (374 kJ/Mol).
1.3 Die Ionenbindung Zur Erklärung der Ionenbindung werden zweckmäßigerweise die Ionisierungsenergie und die Elektronenaffinität von Atomen betrachtet. Die Ionisierungsenergie I ist dabei definiert als diejenige Energie, die aufgewendet werden muss, um ein Elektron von einem neutralen Atom zu entfernen. Die Elektronenaffinität A ist die Energie, die gewonnen wird, wenn man einem neutralen Atom ein zusätzliches Elektron hinzufügt. Die Ionenbindung bildet sich immer dann aus, wenn man Elemente mit vergleichsweise niedriger Ionisierungsenergie mit Elementen hoher Elektronenaffinität kombiniert. Als Beispiel betrachten wir die Elemente Natrium-Chlor. Die Ionisierungsenergie von Natrium beträgt 5,14 eV, die Elektronenaffinität von Chlor 3,71 eV. Beim Transfer von einem Elektron von einem Natriumatom auf ein Chloratom muss also die Energie von 1,43 eV aufgewandt werden. Die elektrostatische Anziehung zwischen den beiden dabei entstandenen Ionen führt mit zunehmender Annäherung zu einem größer werdenden Energiegewinn, wobei der minimale Abstand durch die Summe der Ionenradien gegeben ist. Insgesamt lässt sich auf diese Weise eine Energie von 4,51 eV gewinnen, wodurch eine positive Energiebilanz von 3,08 eV verbleibt. Aus Natrium und Chlor kann also ein zweiatomiges Molekül mit starkem Ionencharakter gebildet werden. Auch räumliche Strukturen lassen sich auf diese Weise aufbauen, indem jedes Chloratom von Natriumatomen umgeben ist und umgekehrt. Die sich ergebende Struktur ist durch optimale Raumausnutzung bei gegebenen Ionenradien und durch die Bedingung bestimmt, dass die Coulomb-
Abb. 1.6. Die beiden typischen Strukturen für Ionenbindung in Festkörpern. (a) NaCl-Struktur, (b) CsCl-Struktur
10
1 Die chemische Bindung in Festkörpern
Anziehung ungleichnamiger Ladungen stärker sein muss als die Coulomb-Abstoßung von Ionen gleicher Ladung. Die für die ZweiIonenbindung typischen Strukturen, die Natriumchlorid- und die Cäsiumchloridstruktur, sind in Abb. 1.6 abgebildet. Die Ionenradien bestimmen den minimalen Abstand deshalb, weil eine stärkere Annäherung zu einem starken Überlapp der ionischen Elektronenhüllen führen würde. Bei aufgefüllten Elektronenschalen führt dies (s. Abschn. 1.2) wegen des Pauli-Prinzips zur Auffüllung energetisch höher liegender antibindender Orbitale, was zu einem starken Ansteigen der Energie und damit zur Abstoßung führt. Während sich dieser abstoßende Anteil des Gesamtpotentials analog zur kovalenten Bindung nur aus quantenmechanischen Rechnungen ergibt, lässt sich der anziehende Coulomb-Anteil der Energie in einer Ionenbindung einfach durch die Summe über Coulomb-Potentiale angeben: Für das Potential zwischen zwei Ionen i und j mit dem Abstand rij schreibt man uij
e2 B ; 4 p e0 rij rijn
1:11
hierbei ist der zweite, die Abstoßung der Elektronenhüllen beschreibende Anteil ein heuristischer Ansatz, der zwei freie Parameter n und B enthält. Diese Parameter müssten natürlich durch eine exakte quantenmechanische Behandlung des Problems geliefert werden. Sie können aber auch, wie häufig getan, durch Anpassung an experimentelle Messgrößen (Ionenabstand, Kompressibilität usw.) gewonnen werden; n liegt dabei in vielen Fällen zwischen 6 und 10. Den typischen Verlauf eines solchen Potentials zeigt Abb. 1.7. Das Potential aller Ionen j am Ort des Ions i ergibt sich durch Summation:
Abb. 1.7. Energie als Funktion des Abstandes zweier Ionen
1.3 Die Ionenbindung
ui
X
uij :
11
1:12
i6j
Mit r als Abstand nächster Nachbarn schreibt man rij r pij ;
1:13
wobei pij spezifisch für die betreffende Struktur ist. Besteht der Kristall aus N Ionenpaaren, so ergibt sich die gesamte potentielle Energie zu e2 X 1 B X 1 :
1:14 n U N ui N 4 p e0 r i6j pij r i6j pnij Hierbei nennt man die für eine spezielle Struktur charakteristische Größe X 1
1:15 A pij i6j Madelung-Konstante. Für die Natriumchloridstruktur ist A = 1,748, für die Cäsiumchloridstruktur 1,763. Typische Bindungsenergien sind: für NaCl: 7,95 eV pro Molekül (764 kJ/Mol), für NaI: 7,10 eV pro Molekül (683 kJ/Mol) und für KBr: 6,92 eV pro Molekül (663 kJ/Mol). Eine Wanderung von Elektronen in Ionenkristallen ist ohne erhebliche Energiezufuhr (*10 eV) nicht möglich. Festkörper mit Ionenbindung sind deshalb Nichtleiter. Allerdings ermöglichen Fehlstellen bei höheren Temperaturen eine Wanderung von Ionen und damit eine Ionenleitfähigkeit. Ionenbindung und kovalente Bindung sind Grenzfälle, von denen nur der letztere im Falle der Verbindung von gleichen Atomen realisiert ist. Die Mehrzahl der Fälle stellt einen Mischtyp zwischen beiden Bindungsarten dar. Eine qualitative Abschätzung über den Ionencharakter einer Bindung ermöglicht die Skala der Elek-
Tabelle 1.2. Die Elektronegativitäten einiger Elemente. (Nach Pauling [1.1]) H 2,1 Li 1,0
Be 1,5
B 2,0
C 2,5
N 3,0
O 3,5
F 4,0
Na 0,9
Mg 1,2
Al 1,5
Si 1,8
P 2,1
S 2,5
Cl 3,0
K 0,8
Ca 1,0
Sc 1,3
Ge 1,8
As 2,0
Se 2,4
Br 2,8
Rb 0,8
Sr 1,0
Y 1,3
Sn 1,8
Sb 1,9
Te 2,1
J 2,5
12
1 Die chemische Bindung in Festkörpern
tronegativitäten. Diese Skala wurde zuerst von Pauling aus Betrachtungen über die Bindungsenergie entwickelt. Später hat Milikan eine aus den physikalischen Größen Ionisierungsenergie I und Elektronenaffinität A abgeleitete Definition der Elektronegativität eines Elementes gegeben X 0;184
I A :
1:16
Werden Ionisierungsenergie und Affinität in eV eingesetzt, so ergibt sich die Paulingsche Elektronegativitätsskala (Tabelle 1.2). Je größer die Ionisierungsenergie und die Elektronenaffinität eines Atoms sind, desto stärkere Tendenz zeigt es, in einer Verbindung Elektronen an sich zu ziehen. In einer Verbindung ist deshalb das Element mit der größeren Elektronegativität stets das Anion. Die Elektronegativitätsdifferenz ist ein Maß für den Ionencharakter der Bindung.
Abb. 1.8. Elektronendichten der Valenzelektronen in dem typischen Ionenkristall NaCl und in einem typischen kovalent gebundenen Kristall Si (nach Göttlicher [1.2] sowie Young u. Coppens [1.3]). Deutlich erkennt man die Konzentration der Ladung entlang der Bindungsrichtung zwischen den Si-Atomen, während bei der Ionenbindung die Elektronen im wesentlichen kugelsymmetrisch um die Ionen verteilt sind
1.4 Metallische Bindung
13
Den Unterschied zwischen Ionenbindung und kovalenter Bindung auch in der Elektronendichteverteilung verdeutlicht Abb. 1.8. Dort sind die Linien konstanter Elektronendichte gezeichnet. Sie wurden durch Röntgenbeugung ermittelt. Während bei Ionenbindung die Elektronen auf die Ionen konzentriert sind, ist bei kovalenter Bindung die Elektronendichte zwischen den Atomen angehäuft.
1.4 Metallische Bindung Als Extremfall einer durch Elektronenanhäufung zwischen den Kernen erzeugten Bindung lässt sich die Bindung bei Metallen auffassen. Im Gegensatz zur kovalenten Bindung sind hier aber die Wellenfunktionen sehr ausgedehnt im Vergleich zu den Bindungsabständen. In Abb. 1.9 sind als Beispiel die Radialanteile der 3 d und 4 s Wellenfunktionen von Nickel im Metallverband dargestellt. Die 4 s Wellenfunktion hat merkliche Werte noch beim halben Abstand zu den drittnächsten Nachbarn und entsprechend tragen viele Nachbarn zur Bindung bei. Dies führt zu einer starken Abschirmung der positiven Kernladung und zu einer Bindung, die eine gewisse Ähnlichkeit mit der kovalenten Bindung besitzt; jedoch sind die Bindungskräfte wegen der starken „Verschmierung“ der Valenzelektronen über den gesamten Kristall nicht gerichtet wie bei den kovalent-gebundenen Kristallen. Die Struktur von Metallen ist deshalb auch weitgehend durch die Bedingung optimaler Raumerfüllung bestimmt (s. Abschn. 2.5). Anders als die s-Elektronen sind die d-Elektronen der Übergangsmetalle lokalisiert. Der Überlapp ist entsprechend geringer.
Abb. 1.9. Die Amplitude der 3 dzz-Wellenfunktion und der 4 s-Wellenfunktion von Ni nach Walch u. Goddard [1.4]. Die halbe Entfernung zu den nächsten, übernächsten und drittnächsten Nachbarn (r1, r2 und r3) sind zum Vergleich mit eingetragen
14
1 Die chemische Bindung in Festkörpern
Die d-Elektronen stellen gewissermaßen ein kovalentes Gerüst in den Übergangsmetallen dar und leisten den größten Beitrag zur Bindungsenergie. Das aus s-, p- und evtl. d-Elektronen gebildete Valenzband der Metalle ist nicht vollständig besetzt (vgl. Tabelle 1.1). Infolge der quasi-kontinuierlichen Verteilung der Zustände auf der Energieskala bei einer großen Zahl von Atomen kann man den Elektronen Energie in infinitesimal kleinen Portionen zuführen, insbesondere also sie in einem angelegten elektrischen Feld beschleunigen. Kennzeichen der Metalle ist also eine hohe elektrische Leitfähigkeit, die mit einer hohen thermischen Leitfähigkeit gekoppelt ist. In diesem Sinne ist die metallische Bindung eine besondere Eigenart des Festkörpers, also des Zusammenschlusses von vielen Atomen. Wie ein Blick auf Tabelle 1.1 lehrt, kann bei den Metallen das partiell gefüllte Valenzband auf verschiedene Weise entstehen. Bei den Alkalimetallen (Li, Na, K, Rb, Cs) ist bereits der s-Zustand nur einfach besetzt. Bei den Erdalkalimetallen (Be, Mg, Ca, Sr, Ba) könnte man zunächst ein vollgefülltes Band, gebildet aus den s-Zuständen, erwarten. Wegen der Bandüberlappung mit den p-Bändern der gleichen Schale gibt es jedoch praktisch nur ein gemeinsames spBand. Einen Sonderfall bilden die Übergangsmetalle. Hier bilden die s- und p-Zustände wieder ein gemeinsames Band großer Breite. Wie besprochen, haben die d-Elektronen eine geringere räumliche Ausdehnung (s. Abb. 1.9). Durch den geringeren Überlapp mit den Nachbaratomen ist auch die energetische Aufspaltung geringer. Die große Ausdehnung der Wellenfunktion der Valenzelektronen in Metallen macht eine theoretische Berechnung der Bindungsenergie besonders schwierig. Andererseits sind die Valenzelektronen zwischen den Atomen weitgehend frei beweglich. Dadurch vereinfacht sich die Beschreibung der elektrischen Leitfähigkeit und der spezifischen Wärme der Elektronen. Dies wird insbesondere in Kap. 6 deutlich.
1.5 Die Wasserstoffbrückenbindung Von Wasserstoffbrückenbindung spricht man, wenn ein Wasserstoffatom an zwei Atome gebunden ist. Eine solche Bindung scheint nicht möglich, da Wasserstoff doch nur ein Valenzelektron hat. Man kann sich die Wasserstoffbrückenbindung jedoch folgendermaßen veranschaulichen: Beim Eingehen einer kovalenten Bindung mit einem stark elektronegativen Atom, wie z. B. Sauerstoff, kommt es zu einem weitgehenden Ladungstransfer des einzigen Wasserstoffelektrons an den Bindungspartner. Das verbleibende Proton kann eine anziehende Wirkung auf einen zweiten negativ geladenen Partner ausüben. Wegen der räumlich weit ausladenden Elektronenwolke des elektronegativen Partners und der verschwindend geringen Ausdehnung des daran gebundenen Wasserstoffs (Proton mit geringer
1.6 Die Van der Waals-Bindung
15
elektronischer Abschirmung) kann ein dritter Bindungspartner nicht mehr gebunden werden: Das bindende Wasserstoffatom tritt in Zweier-Koordination auf. Wasserstoffbrückenbindungen bilden sich also vorwiegend zwischen stark elektronegativen Atomen aus, sind aber nicht auf diese beschränkt. Sie können vom symmetrischen A–H– A und vom antisymmetrischen A–H . . . B Typ sein. Als Kriterium für das Auftreten einer H-Brückenbindung kann angesehen werden, wenn der beobachtete Abstand der Atome A und B kleiner ist, als wenn lediglich Van der Waals-Bindung (Abschn. 1.6) vorläge. Weitere Anzeichen für das Auftreten einer H-Brücke ergeben sich aus der Infrarotspektroskopie, wo die der Wasserstoffschwingung zugeordneten Banden eine starke Verschiebung, häufig auch Verbreiterung, zeigen. Insgesamt ist das Erscheinungsbild der Wasserstoffbrückenbindung sehr vielfältig und weniger eindeutig abgrenzbar als im Falle der übrigen Bindungstypen. Typische Bindungsenergien liegen in der Größenordnung von 0,1 eV pro Bindung. Indem die Wasserstoffbrückenbindung die Doppelhelix in der DNS miteinander verknüpft, spielt sie eine entscheidende Rolle beim Mechanismus der genetischen Reproduktion. Das bekannteste Beispiel aus dem Bereich der anorganischen Chemie ist das Wasser, insbesondere in der Form von Eis. Beim Eis ist jedes Sauerstoffatom tetraedrisch von weiteren Sauerstoffatomen umgeben, und die Verbindung wird durch H-Brücken hergestellt. Auch im flüssigen Wasser liegen noch Wasserstoffbrücken vor, woraus sich zum Beispiel die Ausdehnungsanomalie erklärt. Sie besteht darin, dass Wasser bei 4 °C seine größte Dichte hat. Der Grund ist, dass auch in flüssigem Wasser Komplexe von wasserstoffbrückengebundenen H2O-Molekülen existieren, die verglichen mit den nicht brückengebundenen H2O-Molekülen ein größeres Volumen einnehmen. Mit wachsender Temperatur schmelzen die brückengebundenen Aggregate, was zu einer Zunahme der Dichte führt. Oberhalb von 4 °C überwiegt dann wieder die gewöhnliche thermische Ausdehnung, d. h. man findet eine Abnahme der Dichte mit steigender Temperatur.
1.6 Die Van der Waals-Bindung Sie ist eine zusätzliche Bindung, die grundsätzlich immer auftritt. Sie wird aber nur bemerkt, wenn z. B. zwischen Atomen mit abgeschlossener Schale oder zwischen gesättigten Molekülen andere Bindungen nicht möglich sind. Die physikalische Ursache dieser Bindung sind Ladungsfluktuationen in den Atomen durch die Nullpunktunruhe. Die dabei entstehenden Dipolmomente bewirken eine zusätzliche anziehende Kraft. Die Van der Waals-Bindung ist für den festen Zustand von Molekülkristallen verantwortlich. Die Bindungsenergie ist abhängig von der Polarisierbarkeit der beteiligten Atome und von der Größenordnung 0,1 eV. Die typischen Bindungsradien der
16
1 Die chemische Bindung in Festkörpern
Atome für Van der Waals-Bindung sind deutlich größer als bei einer chemischen Bindung. Der Bindungsanteil im Potential der Van der Waals-Bindung hängt wie r –6 vom Abstand der Bindungspartner (Atome oder Moleküle) ab. Dies lässt sich sehr einfach durch die Art der Dipol-Wechselwirkung verstehen. Ein durch Ladungsfluktuation momentan entstandener Dipol p1 erzeugt am Ort seines Nachbarn im Abstand r ein elektrisches Feld E * p1/r 3, das über die Polarisierbarkeit des dort befindlichen Atoms oder Moleküls an diesem ein Dipolmoment p2 * p1/r 3 induziert. Weil das Potential dieses Dipols im Feld proportional zu E und p2 ist, folgt damit für den bindenden Anteil der Van der Waals-Wechselwirkung eine Abstandsabhängigkeit der Form * r –6 (s. Übung 1.11).
Übungen zu Kapitel 1
1.1 (a) Berechnen Sie die Madelung-Konstante A einer linearen Ionenkette! (b) Berechnen Sie näherungsweise die Madelung-Konstante des NaCl-Gitters (A = 1,7476) numerisch auf zwei Arten: In einer Würfelgeometrie, wobei 2 ma die Kantenlänge des Würfels und a der Abstand nächster Nachbarn ist, und in einer Kugelgeometrie mit ma als Kugelradius! In beiden Fällen soll das Aufion im Zentrum sitzen. Führen Sie die Berechnung für die Werte m = 97, 98 and 99 durch und vergleichen Sie die Ergebnisse! Was ist die Ursache für die Diskrepanz? 1.2 Bestimmen Sie den isothermen Kompressi @p onsmodul j V und die Bindungs@V T energie pro Ionenpaar für NaCl aus dem Ausdruck für die Bindungsenergie für N Ionenpaare: e2 B X 1 A n ! U
r N 4 p e0 r r i6j p nij Man benutze n = 9 und berechne B aus der Bedingung, dass U (r) am Gleichgewichtsabstand minimal ist. 1.3 Bekanntlich löst sich Kochsalz (NaCl) gut in Wasser, wobei die Na und Cl Atome als positive bzw. negative (solvatisierte) Ionen vorliegen. Man zeige, dass durch die große Dielektrizitätskonstante von Wasser und die damit vorliegende Abschirmung des Coulomb-Potentials die Bindungsenergie eines NaCl Kristalls in Wasser kleiner als die mittlere thermische Energie der freien Ionen
wird. Berechnen Sie den Gleichgewichtsabstand der Ionen in einem hypothetischen NaCl Kristall in Wasser und zeigen Sie, dass dieser Abstand größer ist als der van der Waals Durchmesser eines Wassermoleküls, wodurch die hier vorgenommene näherungsweise Betrachtung zur Löslichkeit von NaCl gerechtfertigt wird! 1.4 Diskutieren Sie die Ionizität von Alkalihalogeniden mit Hilfe von Tabelle 1.2! 1.5 Man betrachte die CsCl Struktur und nehme an, dass der Radius des Kations immer kleiner wird, während der Radius des Anions konstant bleibt. Wie ändert sich die Bindungsenergie? Zeigen Sie, dass für kleine Kationen die NaCl Struktur bevorzugt wird! Für noch kleinere Kationradien hat die ZnS Struktur die größte Bindungsenergie (Madelungkonstante A = 1,638). Geben Sie Beispiele an! 1.6 Berechnen Sie näherungsweise die Nullpunktsentropie von Eis! In der Struktur von Eis bilden die Sauerstoffatome ein Wurtzitgitter, das durch Wasserstoffbrückenbindung zwischen den nächstbenachbarten Sauerstoffatomen stabilisiert wird. Die Nullpunktsentropie entsteht aus den möglichen Verteilungen von je zwei Wasserstoffatomen pro Sauerstoffatom auf die vier Bindungen zu den jeweils nächsten Nachbarn. 1.7 Diskutieren Sie die Elektronenkonfiguration des Sauerstoffmoleküls! Warum entspricht die Bindungsstärke der einer chemischen Doppelbindung? Warum ist O2 paramagnetisch? Erklären Sie, warum O+2 ein stabiles Ion ist!
18
Übungen zu Kapitel 1
1.8 Man beweise, dass im Ritzschen Näherungsverfahren die mit Hilfe einer Näherungsfunktion w ermittelte Abschätzung für die Grundzustandsenergie
w; H w E
w; w immer größer als oder gleich dem exakten Eigenwert E0 ist! Man entwickle dazu die Näherungsfunktion nach den exakten Eigenfunktionen wi (zugehöriger exakter Eigenwert Ei ). 1.9 Das Kohlenstoffatom in der tetraedrischen Bindungskonfiguration des Diamants kann näherungsweise durch vier 2 sp 3-Wellenfunktionen wi („sp 3-Hybridorbitale“) dargestellt werden, die als Linearkombinationen aus den vier 2 s-, 2 px-, 2 py- und 2 pzWellenfunktionen yj des Wasserstoffatoms gebildet werden: X aij yj mit i; j 1; 2; 3; 4; wi
(b) Zeigen Sie, dass aus der Forderung nach Orthonormierung von wi folgt, dass X aij akj dik fur aij aji ! j
(c) Bestimmen Sie vier mögliche wi, die die Orthonormierungsbedingungen mit aij = ± 12 erfüllen! (d) Zeigen Sie, dass die Maxima von jwi j2 in den vier tetraedrischen Richtungen liegen, und zeichnen Sie diese durch Vektoren zu den Würfelecken in einem Würfel mit den Kanten parallel zu den x-, y-, z-Achsen! (e) Zeigen Sie, dass die Elektronendichte 4 X
jwi j2 kugelsymmetrisch ist!
i1
(f) Warum konzentriert sich die Ladungsverteilung im Diamantgitter dennoch auf die tetraedrischen Richtungen?
An die wi stellt man die Forderung, dass sie – genau wie die yj – orthonormiert sind, d. h. es gilt: R wi wk dr dik :
1.10 (a) Diskutieren Sie analog zur sp 3-Hybridisierung des Kohlenstoffs im Diamantgitter die Möglichkeit einer sp 2-Hybridisierung, bei der die Richtungen der drei gebildeten sp 2-Hybridorbitale in einer Ebene liegen! Fertigen Sie eine qualitative Zeichnung der drei sp 2-Orbitale und des verbleibenden pz-Orbitals an, und geben Sie die Elektronenbesetzung an! (b) Erklären Sie die chemische Bindung im Benzolmolekül C6H6 mit der sp 2-Hybridisierung der Kohlenstoffatome! Wie kommt es zu dem System der p-Bindungen parallel zum hexagonalen Ringgerüst der sechs Kohlenstoffatome? (c) Erklären Sie die stark anisotropen Eigenschaften des hexagonalen Schichtengitters des Graphits mit der sp2-Hybridisierung des Kohlenstoffs (anisotrope Stärke der chemischen Bindung, quasi-metallische Eigenschaften parallel zu den Kohlenstoffschichten)! Wie werden diese anisotropen Eigenschaften im Alltag genutzt?
(a) Zeichnen Sie Konturen von y
R const; h; u für den s- und einen p-Zustand in einem Polardiagramm!
1.11 Als einfaches quantenmechanisches Modell für die Van der Waals-Wechselwirkung be-
j
wobei die in Frage kommenden Funktionen yj in sphärischen Polarkoordinaten wie folgt aussehen: y1 y
2 s c e y2 y
2pz c e
R
1
R
R ;
R cos h ;
R
y3 y
2px c e R sin h cos u ; y4 y
2 py c e
R
R sin h sin u ;
mit R
Zr : 2a0
(Z Kernladungszahl – hier von Kohlenstoff, a0 Bohrscher Atomradius)
Übungen zu Kapitel 1
trachtet man zwei identische harmonische Oszillatoren im Abstand R. Jeder Oszillator besteht aus zwei Ladungen mit entgegengesetztem Vorzeichen, deren Abstand x1 bzw. x2 ist. Die Federkonstante der Oszillatoren sei f. (a) Stellen Sie den Hamiltonoperator H 0 für die zwei Oszillatoren ohne Berücksichtigung der elektrostatischen Wechselwirkung auf! (b) Bestimmen Sie die Wechselwirkung H 1 zwischen den vier Ladungen! (c) Unter der Annahme, dass jx1 j R; jx2 j R nähere man H 1 durch
H1
2 e2 x1 x2 ! R3
(d) Man zeige, dass die Transformation auf Normalkoordinaten 1 xs p
x1 x2 2 1 xa p
x1 x2 2
19
den Hamiltonoperator H = H 0+H 1 in einen symmetrischen und einen antisymmetrischen Teil separiert! (e) Man berechne die Eigenfrequenzen xs und xa der symmetrischen und antisymmetrischen Schwingungen als Taylor-Reihe in 2 e 2/f R 3 und breche nach dem zweiten Term ab! (f) Die Energie des Gesamtsystems zweier wechselwirkender Oszillatoren kann als U = – 12 h
xs xa ausgedrückt werden. Leiten Sie den Ausdruck für die Energie der isolierten Oszillatoren her und zeigen Sie, dass dieser durch die Wechselwirkung um einen Betrag c/R 6 erniedrigt wird! 1.12 Berechnen Sie die Abhängigkeit der Van der Waals-Bindung eines Moleküls vom Abstand d von einer Festkörperoberfläche! Wählen Sie zur Vereinfachung eine kubisch primitive Struktur. Zeigen Sie, dass das Ergebnis nicht von der Kristallstruktur abhängt!
2. Die Struktur von Festkörpern
Gehen Atome eine chemische Verbindung ein, so ergeben sich wohldefinierte Gleichgewichtsabstände, die durch das Minimum der Gesamtenergie charakterisiert sind. Bei einem Festkörper, gebildet aus gleichen Atomen, kann deshalb das Energieminimum nur dann erreicht werden, wenn von jedem Atom aus betrachtet die Umgebung gleich ist. Die Anordnung der Atome ist deshalb dreidimensional periodisch. Man bezeichnet diesen Zustand der Materie als kristallin. Entsprechendes gilt auch für Festkörper, die aus mehreren Elementen gebildet werden: Dort wiederholen sich bestimmte Baugruppen in periodischen Abständen. An die Periodizität knüpfen sich entscheidende festkörperphysikalische Eigenschaften und Untersuchungsmethoden. Im Hinblick auf die theoretische Beschreibung und das Verständnis ist die Periodizität eine außerordentliche Vereinfachung. Obgleich der reale Festkörper niemals exakt dreidimensional periodisch ist, benutzt man gerne den periodischen Festkörper als Modell für die Beschreibung und behandelt Abweichungen von der Periodizität als Störung. Dreidimensional periodische Anordnungen von Atomen, bzw. Baugruppen von Atomen, lassen sich auf sehr verschiedene Weise realisieren. Damit beschäftigen sich die Unterabschnitte 2.1–2.5. Im Gegensatz zum kristallinen Zustand steht der amorphe Zustand der Materie. Bei ihm ist die Fernordnung aufgehoben, die Nahordnung jedoch erhalten. Beispiele für diesen Zustand sind: Gläser, Keramiken, Gele, Polymere, rasch erstarrte Schmelzen und bei tiefen Temperaturen aufgedampfte Schichten. Der amorphe Zustand stellt ein wichtiges Gebiet der aktuellen Forschung dar. Das Verständnis amorpher Festkörper ist jedoch wegen der fehlenden Periodizität schwieriger. Aus dem Vergleich der Eigenschaften amorpher und kristalliner Festkörper hat man gelernt, dass wesentliche Elemente der Elektronenstruktur und damit auch der makroskopischen Eigenschaften von der Nahordnung bestimmt werden, also für kristalline und amorphe Festkörper ähnlich sind. Im Rahmen dieses Lehrbuches werden wir einige strukturelle und elektronische Eigenschaften amorpher Festkörper in den Abschnitten 3.1, 7.6 und 9.8 behandeln. Reale Festkörper sind häufig Mehrstoffsysteme. Man denke zum Beispiel an die teilweise schon aus der frühen Menschheitsgeschichte bekannten Legierungen wie Bronze (eine Legierung aus Kupfer und Zinn), Messing (Cu/Zn) oder Stahl (Fe/C). Die moderne Materialforschung hat diesen klassischen Legierungen eine Vielzahl
22
2. Die Struktur von Festkörpern
von Mehrkomponentensystemen an die Seite gestellt. Im Rahmen dieses Lehrbuches werden besonders Halbleiterlegierungen behandelt werden (Kap. 12). Typisch für Legierungen ist, dass sie in der Regel keine homogene Phase bilden: Sie bestehen vielmehr aus Mikrokristalliten unterschiedlicher Komposition, deren Zusammensetzung wiederum von der Temperatur und den globalen Konzentrationsverhältnissen der beteiligten Elemente abhängen. Die Phasendiagramme einfacher Legierungen werden in Abschnitt 2.6 behandelt.
2.1 Translationsgitter Zur Darstellung der reinen Translationsstruktur eines Kristalls wird die Lage einer jeden Baugruppe, die im einfachsten Falle nur durch ein Atom gegeben sein kann, durch einen Punkt angegeben. Aus der periodischen Anordnung der Baugruppen wird somit ein Gitter von Punkten, das Translationsgitter, im folgenden auch einfach Gitter genannt. Ein zweidimensionales Translationsgitter wird durch zwei Vektoren a und b aufgespannt. Jeden Punkt des Gitters kann man durch den Gittervektor rn n1 a n2 b
2:1
erreichen mit beliebigen ganzen Zahlen n1 und n2. Je nach den Längenverhältnissen der Vektoren a und b und der Größe des von ihnen eingeschlossenen Winkels c lassen sich Gitter verschiedenartiger Geometrie aufbauen. Das allgemeinste Gitter ohne weitere Symmetrie ergibt sich für a = b, c = 90 ° (Abb. 2.1). Eine ebene Kristallstruktur entstünde aus diesem „Parallelogrammgitter“, wenn man sich jeden Gitterpunkt mit einem Atom belegt denkt. In diesem Falle würde die von a und b aufgespannte Elementarzelle ein Atom enthalten. Solche Elementarzellen nennt man primitiv. Kristallgitter können aber auch mehr als 1 Atom in der Elementarzelle enthalten. In diesem Falle entsprechen die in Abb. 2.1 dargestellten Gitterpunkte solchen Punkten im Kristallgitter, von denen aus betrachtet die Umgebung jeweils identisch aussieht. Dieser Punkt kann, muss aber nicht, in das Zentrum eines Atoms gelegt werden. Weitere Gitter der Ebene mit höherer Symmetrie erhält man durch Wahl spezieller Werte für c, a und b. Das Rechteckgitter ergibt sich für c = 90 ° (Abb. 2.2). Für a = b wird daraus das quadrati-
Abb. 2.1. Das ebene Parallelogrammgitter
2.1 Translationsgitter
23
Abb. 2.2. Weitere Translationsgitter der Ebene: Quadratgitter, Rechteckgitter, zentriertes Rechteckgitter und hexagonales Gitter (c = 60 °, a = b )
sche Gitter. Man kann ferner eine Ebene regelmäßig mit Sechsecken überdecken. Die Einheitszelle wird dann durch a = b und c = 60 ° realisiert. Eine hexagonal dichteste Packung von Kugeln hat diese Einheitszelle. Die Bedingung a = b (c beliebig) führte ebenfalls auf einen neuen Gittertyp. Dieses Gitter wird jedoch besser als „zentriertes“ Rechteckgitter mit a j b, c = 90 ° beschrieben (Abb. 2.2). Man behält so den Vorteil eines rechtwinkligen Koordinatensystems. Allerdings ist in dieser Beschreibung das Gitter nicht mehr primitiv. Es ist leicht zu sehen, dass nur für das Rechteckgitter eine Zentrierung sinnvoll ist. Führt man Zentrierungen beim quadratischen Gitter, beim Parallelogrammgitter oder beim hexagonalen Gitter ein, so lässt sich das entstandene Gitter jeweils durch einen Satz kleinerer Basisvektoren beschreiben. Man hätte also lediglich eine zu große Elementarzelle gezeichnet. Tabelle 2.1. Die sieben verschiedenen Basisvektorsysteme bzw. Kristallsysteme. Die meisten Elemente kristallisieren mit kubischer oder hexagonaler Struktur. Aus diesem Grunde und wegen ihrer hohen Symmetrie sind das kubische und das hexagonale Achsensystem besonders wichtig Basisvektoren bzw. Kristallachsen
Winkel
Kristallsystem
a j b j c a j b j c a j b j c ab j c ab j c abc abc
j b j c j 90 c 90 b j 90 b c 90 b c 90 b 90 c 120 bc j 90 b c 90
triklin monoklin orthorhombisch tetragonal hexagonal rhomboedrisch kubisch
24
2. Die Struktur von Festkörpern
Abb. 2.3. Die 14 Translationsgitter des Raumes (Bravais-Gitter). Das hexagonale Gitter und die beiden zentrierten kubischen Gitter sind für die Festkörperphysik besonders wichtig
Die bisherigen Betrachtungen lassen sich auf den dreidimensionalen Raum erweitern. Anstelle der fünf verschiedenen Basisvektorsysteme in der Ebene treten die sieben verschiedenen Basisvektorsysteme des dreidimensionalen Raumes. Sie sind in Tabelle 2.1 aufgeführt. Die verschiedenen Basisvektorsysteme entsprechen den Kristallsystemen der Kristallographie. Wiederum kann man durch Hinzufügen von Zentrierungen aus den Basisvektorsystemen die möglichen Translationsgitter des Raumes aufbauen. Zusätzlich zur Flächenzentrierung gibt es im dreidimensionalen auch die Raumzentrierung (Abb. 2.3). Wie in der Ebene kann man sich davon
2.2 Punktsymmetrien
25
überzeugen, dass nur bestimmte Zentrierungen sinnvoll sind. So wäre z. B. ein tetragonal basiszentriertes Gitter einem primitiven Gitter mit kleinerer Zelle äquivalent.
2.2 Punktsymmetrien Jeder Punkt der eben besprochenen Translationsgitter symbolisiert ein Atom oder aber auch eine komplizierte Baugruppe, die ihrerseits bestimmte Symmetrieeigenschaften hat. Diese Symmetrien mit ihren Bezeichnungen sollen im folgenden vorgestellt werden. Spiegelung an einer Ebene Sie wird mathematisch ausgedrückt durch eine Koordinatentransformation. Zum Beispiel lässt sich die Spiegelung an einer yz-Ebene durch die Transformation y ' = y, z ' = z, x ' =–x darstellen. Das Vorhandensein einer Spiegelebene in einer Kristallstruktur wird durch das Symbol m angezeigt. Ein Molekül, welches zwei senkrecht zueinander stehende Spiegelebenen besitzt, ist z. B. das Wassermolekül (Abb. 2.7). Die eine Spiegelebene wird durch die Molekülebene selbst gebildet, die andere geht senkrecht dazu durch das Sauerstoffatom. Inversion Die Inversion wird durch die Koordinatentransformation y ' =–y, x ' =–x, z ' =–z beschrieben. Sie stellt also gewissermaßen eine Spiegelung an einem Punkt dar. Ihr Symbol ist 1¯. Ein Beispiel für ein Molekül mit Inversionssymmetrie ist das Zyklohexan (Abb. 2.4). Auch gleichnamige, zweiatomige Moleküle haben ein Inversionszentrum, natürlich auch Spiegelebenen.
Abb. 2.4. Das Zyklohexanmolekül (C6H12). Hauptsymmetrieelement ist die 3zählige Drehachse C3. Das Molekül hat ferner ein Inversionszentrum, drei Spiegelebenen und senkrecht zur Hauptachse drei 2zählige Drehachsen, die einen Winkel von jeweils 120° einschließen. Die Punktgruppe wird mit D3d bezeichnet (Tabelle 2.2)
26
2. Die Struktur von Festkörpern
Drehachsen Eine Drehachse ist dann gegeben, wenn durch Rotation um einen bestimmten Winkel Deckungsgleichheit hergestellt wird. Selbstverständlich ist diese Deckungsgleichheit stets nach Rotation um 360 ° hergestellt. Die Zahl der dazwischenliegenden Drehungen, die ebenfalls zur Deckung führen, wird als Zähligkeit bezeichnet. So gibt es z. B. 2-, 3-, 4- und 6zählige Drehachsen, für die jeweils Deckungsgleichheit nach den Drehungen um 180 °, 120 °, 90 ° und 60 ° hergestellt wird. Bei Molekülen sind auch 5zählige, 7zählige, usw. Drehachsen möglich. Kleine Festkörperteilchen („cluster“) können ebenfalls 5zählige Drehachsen aufweisen. Ein Beispiel ist das besonders stabile Ikosaeder mit 13 Atomen. Ikosaeder bilden sich auch beim raschen Abkühlen von Schmelzen. Dabei kann der Festkörper eine quasikristalline Struktur mit scharfen Röntgenbeugungsreflexen einnehmen, welche die lokale 5zählige Symmetrie widergeben [2.1]. Für streng periodisch aufgebaute Kristalle hingegen sind nur 2-, 3-, 4- und 6zählige Drehachsen möglich, da andere Drehachsen nicht mit der Translationssymmetrie kompatibel sind. Die Bezeichnung der Drehachsen erfolgt durch die Zahlen 2, 3, 4 und 6. Das in Abb. 2.4 gezeigte Zyklohexan hat z. B. eine 3zählige Drehachse. Ein Molekül mit einer 6zähligen Drehachse ist das Benzol (C6H6), dessen Kohlenstoffskelett aus einem ebenen, gleichseitigen Sechseck besteht.
Drehinversionsachsen Drehung und gleichzeitige Inversion können zu einem neuen Symmetrieelement, den Drehinversionsachsen, kombiniert werden. Ihre Bezeichnungen sind 2¯, 3¯, 4¯ und 6¯. In Abb. 2.5 ist eine 3zählige Drehinversionsachse dargestellt. Man sieht daraus, dass die 3zählige Drehinversionsachse äquivalent einer 3zähligen Achse mit Inversion
Abb. 2.5. Darstellung einer 3zähligen Drehinversionsachse. Die Wirkung kann auch durch die Zusammensetzung anderer Symmetrieelemente beschrieben werden
2.3 Die 32 Kristallklassen (Punktgruppen)
27
ist. Die 6zählige Drehinversionsachse lässt sich auch darstellen durch eine 3zählige Drehachse und eine dazu senkrechte Spiegelebene.
2.3 Die 32 Kristallklassen (Punktgruppen) Die besprochenen Symmetrieelemente können in verschiedenartiger Weise miteinander kombiniert werden. Umgekehrt wird jeder Kristall durch eine bestimmte Kombination von Punktsymmetrieelementen beschrieben. Eine vollständige Beschreibung muss einer Reihe von Bedingungen genügen. So muss z. B. die Ausführung zweier Symmetrieoperationen nacheinander durch ein weiteres Symmetrieelement beschreibbar sein, A 6 B = C. Führt man 3 Symmetrieoperationen nacheinander aus, so muss das sogenannte assoziative Gesetz erfüllt sein, (A 6 B ) 6C = A 6 (B 6 C ). Ferner gibt es ein Einheitselement E, das z. B. der Nichtausführung einer Operation bzw. einer Drehung um 360 ° entsprechen kann, A 6 E = A. Weiter existiert das inverse Element, das in der Umkehrung der jeweiligen Operation besteht, A –1 6 A = E. Diese Eigenschaften definieren mathematisch eine Gruppe. Es gibt 32 verschiedene kristallographische Punktgruppen. Nimmt man die Translationen hinzu, so entstehen die 230 Raumgruppen. Wir bemerken, dass nicht notwendigerweise, wohl aber bei den Translationen A 6 B = B 6 A gilt (Abelsche Gruppen). Die Darstellung der 32 kristallographischen Punktgruppen erfolgt gewöhnlich in der sogenannten stereographischen Projektion. Diese Projektion wurde in der Kristallographie entwickelt, um die bei natürlich gewachsenen Kristallen vorkommenden Flächen in systematischer Weise zu erfassen. Es werden dabei die Durchstoßpunkte der Flächennormalen durch eine Kugel markiert und anschließend in die Ebene, die senkrecht auf der Achse höchster Zähligkeit steht, projiziert. Durchstoßpunkte von oberhalb werden durch einen Kreis, von unterhalb durch einen offenen Kreis oder ein Kreuz symbolisiert. Bei der systematischen Darstellung der Punktgruppen steht die Achse mit der höchsten Zähligkeit im Zentrum. Zwei stereographische Projektionen und Punktgruppen sind in Abb. 2.6 dargestellt. Die Bezeichnung der Punktgruppen kann auf drei verschiedene Arten erfolgen:
Abb. 2.6. Darstellung der Symmetrieelemente zweier Punktgruppen in der stereographischen Projektion. Die Symbole (), s, n bedeuten 2-, 3- und 4zählige Drehachsen. Die ausgezogenen Linien sind Spiegelebenen. Wenn der Kreis ausgezogen ist, stellt die Zeichenebene ebenfalls eine Spiegelebene dar
28
2. Die Struktur von Festkörpern
1. durch die Angabe eines Systems von erzeugenden Symmetrieoperationen 2. durch Angabe des internationalen Punktgruppensymbols 3. durch die Symbole nach Schönflies. Die Bezeichnung durch die erzeugenden Symmetrieelemente ist in der Kristallographie üblich, während die Symbole nach Schönflies sich in der Gruppentheorie und der Spektroskopie allgemein durchgesetzt haben. Sie sollen deshalb hier besprochen werden. Die Bezeichnung nach Schönflies erfolgt durch ein Hauptsymbol, welches die dem System zugeordneten Drehachsen (soweit vorhanden) charakterisiert und durch ein Zusatzsymbol, welches die Lage der Spiegelebenen angibt. Die Bedeutung der Symbole kann Tabelle 2.2 entnommen werden. Betrachten wir als Beispiel das Wassermolekül, so ist dort die Achse mit der höchsten Zähligkeit eine 2zählige Achse. Die Spiegelebenen liegen vertikal, d. h. parallel zur Hauptdrehachse. Entsprechend ist die Bezeichnung nach Schönflies C2v. Ein Würfel hat drei 4zählige Drehachsen und vier 3zählige Drehachsen sowie eine Spiegelebene senkrecht zur 4zähligen Drehachse. Entsprechend ist die Bezeichnung Oh.
2.4 Die Bedeutung der Symmetrie Die richtige Einordnung und Bezeichnung der Symmetrie erscheint dem Anfänger häufig unübersichtlich und verwirrend. Es ist deshalb nützlich, kurz auf die überragende Bedeutung der Symmetrien für die Beschreibung des Festkörpers einzugehen. Wir müssen hierzu auf die Quantenmechanik zurückgreifen. Wie wir gesehen haben, hat z. B. das Wassermolekül zwei Spiegelebenen. Diese zwei
Tabelle 2.2. Die Punktgruppensymbole nach Schönflies
Klassifizierung nach Drehachsen bzw. Hauptspiegelebenen
Symbol
Bedeutung
Cj Sj Dj
(j = 2, 3, 4, 6) j-zählige Drehachse j-zählige Drehinversionsachse j 2zählige Drehachsen ^ zu einer (j-zähligen) Hauptdrehachse Vier 3- und drei 2zählige Drehachsen wie im Tetraeder Vier 3- und drei 4zählige Drehachsen wie im Oktaeder ein Inversionszentrum eine Spiegelebene horizontal = senkrecht zur Drehachse vertikal = parallel zur Hauptdrehachse diagonal = parallel zur Hauptachse in der Winkelhalbierenden zwischen den 2zähligen Drehachsen
T O
Zusatzsymbol für Spiegelebenen
Ci Cs h v d
2.4 Die Bedeutung der Symmetrie
29
Spiegelebenen müssen sich auch in allen physikalischen Eigenschaften des Moleküls ausdrücken. Beschreibt man die elektronischen oder auch Schwingungseigenschaften des Moleküls durch einen Hamiltonoperator, so hat dieser die zweifache Spiegelsymmetrie, d. h. er bleibt bei entsprechenden Koordinatentransformationen invariant. Die Invarianz kann man auch noch auf andere Weise ausdrücken. Man ordnet der Spiegelung einen Operator r zu. Dieser, angewandt auf den Hamiltonoperator H , einen Eigenzustand W oder einen Ortsvektor R, soll gerade H , W und R in den gespiegelten Koordinaten beschreiben. Dargestellt werden solche Operatoren durch Matrizen. So lässt sich z. B. die Spiegelung der Koordinaten an der yz-Ebene durch die Matrixoperation 1 0 10 1 0 x x 1 0 0 @ 0 1 0 A@ y A @ y A
2:2 z z 0 0 1 darstellen. Diese Darstellung ist dreidimensional. Sie lässt sich offenbar auf drei eindimensionale Matrizen reduzieren
1x;
1y;
1z
x; y; z ; von denen jede nur auf eine Komponente wirkt. In diesem Fall heißt die dreidimensionale Darstellung „reduzibel“, während die entsprechende eindimensionale „irreduzibel“ heißt, da sie nicht weiter vereinfacht werden kann. Es ist leicht zu sehen, dass auch die irreduzible Darstellung einer Drehung um 180 ° (2zählige Drehachse) eindimensional ist, da sie bei geeigneter Lage der Koordinaten durch Umkehrung eines Vorzeichens ausgedrückt werden kann. Bei einer 3-, 4- und 6zähligen Drehachse sind dagegen außer bei der Drehung um 360 ° stets zwei Koordinaten betroffen. Die irreduzible Darstellung ist dann zweidimensional. Hat der Hamiltonoperator eine bestimmte Symmetrie, z. B. die Spiegelsymmetrie, so ist es gleichgültig, ob die Spiegeloperation vor oder nach dem Hamiltonoperator H steht, d. h. die Operatoren sind vertauschbar. Wie in der Quantenmechanik gezeigt wird, haben solche Operatoren ein gemeinsames System von Eigenzuständen. Die möglichen Eigenzustände zu H können also nach den Eigenwerten, die sie bezüglich der Symmetrieoperatoren haben, klassifiziert werden. Da im Falle der Spiegelung und einer 2zähligen Drehachse C2 stets r 2 = 1 und (C2)2 = 1 gilt, so können die Eigenwerte nur ± 1 sein: r W W
C2 W W ;
rW
C2 W
W
W :
2:3
Die Eigenzustände von H können sich also symmetrisch oder antisymmetrisch zu diesen Operatoren verhalten. Man sagt auch, die Zustände haben gerade oder ungerade „Parität“. Ein Beispiel für Zustände gerader und ungerader Parität hatten wir bei der Diskussion der chemischen Bindung zwischen H-Atomen kennengelernt (Ab-
30
2. Die Struktur von Festkörpern
schn. 1.2). Der bindende Zustand war eine symmetrische Kombination der Atomfunktionen, also ein Zustand gerader Parität. Wie in diesem Beispiel gehören die Eigenzustände W+ und W– jeweils zu verschiedenen Eigenwerten von H . Die entsprechenden Terme sind also nicht entartet. Wir lernen daraus, dass z. B. das Wassermolekül nur nichtentartete Terme haben kann (von zufälligem Zusammenfallen von Termen oder Eigenschwingungen wird dabei abgesehen). Wir wollen das Gesagte zur Illustration noch auf die Eigenschwingungen des Wassermoleküls anwenden. Die Bewegungen der Atome können sich dann symmetrisch oder antisymmetrisch zu den beiden Spiegelebenen des Moleküls verhalten. Für Atome, die auf einer Spiegelebene liegen, müssen für die bezüglich dieser Spiegelebene antisymmetrische Eigenschwingung die Bewegungsrichtungen senkrecht zur Spiegelebene sein, da ja nur dann die Spiegelung die Bewegungsrichtung gerade umkehrt. Entsprechend muss eine symmetrische Bewegung in der Ebene liegen. Eine der beiden Spiegelebenen des H2O-Moleküls ist die Molekülebene selbst (Abb. 2.7). Die zu dieser Ebene antisymmetrischen Bewegungsformen sind zwei Molekülrotationen und die Translation senkrecht zur Ebene. Die 6 symmetrischen Bewegungsformen mit Bewegungsrichtungen in der Molekülebene sind die zwei Translationen, eine Rotation um eine Achse senkrecht zur Ebene und die drei Eigenschwingungen (Abb. 2.7). Von diesen wiederum sind zwei symmetrisch und eine antisymmetrisch bezüglich der Spiegelebene senkrecht zur Molekülebene. Auch für kompliziertere Moleküle als das Wassermolekül lässt sich eine Klassifikation der Eigenschwingungen bzw. Elektronenzustände durchführen. Allerdings sind die Verhältnisse etwas schwieriger bei Operatoren, die zweidimensionale irreduzible Darstellungen
Abb. 2.7. Die beiden symmetrischen und die antisymmetrische Schwingungsform des Wassermoleküls. Zusammen mit den drei Rotationen und drei Translationen ergeben sich neun Bewegungsformen entsprechend den neun Freiheitsgraden
2.5 Einfache Kristallstrukturen
31
haben wie z. B. C3. Ist C3 mit H vertauschbar, so ist mit Zustand W auch C3 W ein Eigenzustand zu H . Jetzt gibt es zwei Möglichkeiten: 1) C3 W ist bis auf einen Zahlenfaktor, der bei geeigneter Normierung 1 gemacht werden kann, identisch mit W. Dann ist W also total symmetrisch bezüglich C3, und die Operation C3 kann eindimensional, nämlich durch eine Zahl, dargestellt werden. Der Zustand W ist dann – jedenfalls bezüglich der Operation C3 – nicht entartet. 2) C3 W erzeugt einen neuen, linear unabhängigen Zustand W ', der aber wegen der Vertauschbarkeit von C3 mit H auch Eigenzustand zu H mit gleichem Eigenwert E sein muss. Die Terme sind damit entartet. Da die Drehung C3 immer zwei Koordinaten betrifft, ist die irreduzible Darstellung eine zweidimensionale Matrix. Jeder Eigenzustand zu C3 lässt sich dann als Linearkombination von zwei Funktionen aufbauen, die orthonormiert gewählt werden können. Die Energieterme sind also zweifach entartet. Solche entarteten Terme gibt es bei allen Punktgruppen, die eine mehr als 2zählige Drehachse enthalten. Die in der Festkörperphysik besonders wichtigen Strukturen, die Diamantstruktur und die kubisch flächen- oder raumzentrierte Struktur, gehören zu den Punktgruppen Td bzw. Oh, d. h. sie weisen eine tetraedrische bzw. oktaedrische Symmetrie auf (Abb. 2.8, 2.10, 2.12). Die Darstellung einer solchen Symmetrie betrifft drei Koordinaten. Die Punktgruppen Td und Oh haben also dreidimensionale irreduzible Darstellungen. Entsprechend gibt es Zustände mit dreifacher Entartung. Wir werden solche Zustände in Gestalt der Eigenschwingungen dieser Gitter (Abschn. 4.5) und bei den Elektronenzuständen (Abschn. 7.4) kennenlernen. Neben den symmetriebedingten Entartungen gibt es natürlich auch solche, die durch eine spezielle Gestalt von H verursacht werden. Die Entartung bezüglich der Bahndrehimpulsquantenzahl l beim Wasserstoffatom ist bekanntlich eine Folge des 1/r-Potentials, während die Entartung bezüglich der magnetischen Quantenzahl m eine Symmetrieentartung ist. Die Kristallsymmetrie bestimmt auch die Zahl der unabhängigen Komponenten von makroskopischen Materialtensoren. Wir merken uns für später, dass Tensoren zweiter Stufe wie z. B. thermische Ausdehnung und Suszeptibilität in kubischen Kristallen eine und in hexagonalen Kristallen zwei unabhängige Komponenten haben.
2.5 Einfache Kristallstrukturen Die kubisch flächenzentrierte Struktur Die einfachsten Kristallstrukturen entstehen, wenn man sich die Punkte eines Translationsgitters mit Atomen belegt denkt. Aus
32
2. Die Struktur von Festkörpern
dem kubisch flächenzentrierten Gitter wird dann die kubisch flächenzentrierte Struktur. In ihm ist jedes Atom von 12 nächsten Nachbarn umgeben. Diese Zahl der nächsten Nachbarn in einer bestimmten Struktur wird auch als Koordinationszahl bezeichnet. Die Koordinationszahl 12 entspricht einer dichtest möglichen Packung von Kugeln. Die Zahl der nächsten Nachbarn einer solchen Kugelpackung in einer Ebene beträgt 6. Hinzu kommen je 3 nächste Nachbarn der Ebene darüber und darunter. Bezeichnet man die Gitterkonstante der flächenzentrierten Struktur mit a, so beträgt der Abstand der nächsten Nachbarn, wie aus Abb. 2.8 ersichtlich, p 1/2 a 2. Die dichtest gepackten Ebenen sind ebenfalls in Abb. 2.8 gezeigt. Sie liegen senkrecht zur Raumdiagonalen des Würfels. Schreitet man in Richtung der Raumdiagonalen fort, so trifft man auf eine identische Ebene erst wieder, nachdem zwei weitere verschiedene dicht gepackte Lagen durchschritten sind. Diese Packungsfolge wird durch Abb. 2.9 deutlicher. Eine dicht gepackte Ebene hat zwei Sorten von Lücken (in der Ebene A sichtbar). Die 2. Ebene entsteht durch Plazierung weiterer Kugeln über der einen Lückensorte, die 3. Ebene durch Plazierung über der zweiten Lückensorte. Die kubisch flächenzentrierte Struktur entsteht also durch dicht gepackte Ebenen in der Stapelfolge ABC, ABC. . .. Jede dieser Ebenen hat hexagonale Symmetrie. Gestapelt übereinander jedoch, reduziert sich die Symmetrie auf eine 3zählige Drehachse (Abb. 2.9). Die kubisch flächenzentrierte Struktur hat also drei 4zählige Drehachsen, vier 3zählige Drehachsen sowie je eine Spiegelebene senkrecht zu den 4zähligen Drehachsen und gehört deshalb zur Punktgruppe Oh. Die kubisch flächenzentrierte Struktur wird abgekürzt als fcc (face centered cubic) Struktur bezeichnet. In der fcc Struktur kristallisieren z. B. die Metalle Cu, Ag, Au, Ni, Pd, Pt und Al. Diese Metalle sind trotz vergleichsweise hohen Schmelzpunktes ziemlich weich. Ursache dafür ist die Möglichkeit des Abgleitens der dichtest gepackten Ebenen aneinander. Dieses Abgleiten erfolgt bei der plastischen Verformung allerdings nicht für eine ganze Kristallebene auf einmal, sondern an sogenannten Versetzungen (Abschn. 2.7).
Abb. 2.8 a, b. Die kubisch-flächenzentrierte Struktur mit einbeschriebener primitiver, rhomboedrischer Zelle (a). Die dichtest gepackten Ebenen sind durch strichpunktierte Linien angedeutet (b). Die Zahl der nächsten Nachbarn (= Koordinationszahl) ist 12
2.5 Einfache Kristallstrukturen
33
Abb. 2.9. Die dicht gepackten Ebenen des kubisch flächenzentrierten Gitters in der Stapelfolge ABC ABC . . .
Die hexagonal dichte Kugelpackung Die hexagonal dichte Kugelpackung (abgekürzt: hcp für hexagonal close packed) entsteht aus Ebenen dichter Kugelpackungen in der Packungsfolge AB, AB. . .. Im Gegensatz zur kubisch flächenzentrierten Struktur enthält die kleinstmögliche Elementarzelle zwei Atome. Die Hauptdrehachse ist deshalb auch nur 3zählig statt 6zählig. Wie aus Betrachtung der Lagen A und B (ohne Lage C) in Abb. 2.9 ersichtlich wird, existieren senkrecht zur 3zähligen Drehachse drei 2zählige Drehachsen. Ferner ist die hexagonal dicht gepackte Schicht auch Spiegelebene. Die hexagonal dicht Kugelpackung gehört deshalb zur Punktgruppe D3h. Wie bei der kubisch flächenzentrierten Struktur ist die Koordinationszahl 12. Wichtige Metalle, die in der hexagonal dichten Packung kristallisieren, sind Zn, Cd, Be, Mg, Re, Ru und Os. Die kubisch raumzentrierte Struktur Die kubisch raumzentrierte Struktur ist in Abb. 2.10 dargestellt. Hier beträgt die Koordinationszahl nur noch 8. Für ungerichtete Bindungen ist das raumzentrierte Gitter (bcc für body centered cu-
Abb. 2.10. Die kubisch raumzentrierte Struktur mit der Koordinationszahl 8
34
2. Die Struktur von Festkörpern
bic) also scheinbar weniger bevorzugt. Trotzdem kristallisieren alle Alkali-Metalle, ferner Ba, V, Nb, Ta, W und Mo in dieser Struktur und von Cr und Fe existieren raumzentrierte Phasen. Dieses scheint zunächst schwer verständlich. Man muss jedoch beachten, dass in der raumzentrierten Struktur die sechs übernächsten Nachbarn nur wenig weiter entfernt sind als die nächsten Nachbarn. Je nach räumlicher Ausdehnung und Art der an der Bindung beteiligten Wellenfunktionen kann somit die effektive Koordination in der bcc Struktur höher als in der fcc Struktur sein. In Abb. 2.11 ist die Elektronen-Aufenthaltswahrscheinlichkeit als Funktion des Abstandes vom Atomkern für Lithium aufgetragen. Gleichfalls angegeben sind der halbe Abstand zu den nächsten Nachbarn r1, den übernächsten Nachbarn r2 und den drittnächsten Nachbarn r3 für die tatsächlich eingenommene bcc Struktur und eine hypothetische fcc Struktur mit gleichem Abstand zu den nächsten Nachbarn. Es ist leicht erkennbar, dass unter Berücksichtigung der übernächsten Nachbarn in der bcc Struktur ein besserer Überlapp der Wellenfunktionen und damit erhöhte chemische Bindung erzielt wird. Dies gilt um so mehr, als für die kubische Struktur die p-Orbitale entlang der Kubuskanten orientiert sind und dementsprechend die p-Funktionen zur Bindung mit den übernächsten Nachbarn beitragen. Das Bild ändert sich, sobald d-Elektronen an der Bindung beteiligt werden. Die d-Orbitale sind sowohl entlang der Kubuskanten als auch entlang der Flächendiagonalen orientiert. Da d-Orbitale im Verhältnis stärker an den Atomen lokalisiert sind (s. Abb. 1.9), können sie nur zur Bindung beitragen, insoweit sie in Richtung auf die nächsten Nachbarn orientiert sind. Die fcc Struktur ermöglicht diese Bindung. Daraus erklärt sich, dass Metalle mit hohem Anteil von d-Elektronen häufig in der fcc Struktur kristallisieren.
Abb. 2.11. Absolutquadrat des Radialanteils der Wellenfunktion für Lithium als Funktion des Abstandes vom Kern. Bei der raumzentrierten Struktur fallen sowohl die 8 nächsten Nachbarn als auch die 6 übernächsten in einen Bereich hoher Aufenthaltswahrscheinlichkeit. Deswegen kann für ungerichtete metallische Bindung die kubisch-raumzentrierte Struktur energetisch günstiger als die flächenzentrierte sein. Beispiele sind die Alkalimetalle Li, Na, K, Rb, Cs und Fr. Vergleichen Sie diese Auftragung auch mit Abb. 1.9, wo die Amplitude der Wellenfunktionen, nicht die Aufenthaltswahrscheinlichkeit, dargestellt wurde. Die Abnahme bei höheren Abständen erscheint dann geringer
2.5 Einfache Kristallstrukturen
35
Die Diamantstruktur Die Diamantstruktur ermöglicht eine dreidimensionale kovalente Bindung (vgl. Abschn. 1.2), bei der jedes Atom von vier nächsten Nachbarn in tetraedrischer Konfiguration umgeben ist (Abb. 2.12). Die Koordinationszahl beträgt also 4. In der Diamantstruktur kristallisieren Kohlenstoff, Silizium, Germanium und -Zinn. Die Diamantstruktur lässt sich darstellen durch zwei ineinandergestellte, kubisch flächenzentrierte Strukturen, die entlang der Raumdiagonalen verschoben sind. Die Verschiebung beträgt, ausgedrückt in den Komponenten des Basisvektors, (a/4, a/4, a/4), mit a der Gitterkonstanten. p Der Abstand zu den nächsten Nachbarn beträgt also a 3/4. Da der Abstand der dichtgepackten Ebenen in der flächenzentrierpkubisch ten Struktur entlang der Raumdiagonalen 3 a/3 ist, ist die Höhe gegenüber der Basis des Zentralatoms in einem Tetraeder 1/4 der Höhe des Tetraeders gemessen von der Basis bis zur Spitze.
Abb. 2.12. Die Diamantstruktur. Sie entsteht durch zwei ineinander gestellte kubisch-flächenzentrierte Strukturen, die entlang der Raumdiagonalen um 1/4 der Diagonalenlänge gegeneinander verschoben sind. Die Diamantstruktur ist typisch für die kovalent gebundenen Elemente der IV-Gruppe des Periodensystems (C, Si, Ge, -Sn), ferner für III-V-Verbindungen, wobei die Plätze (000) und (1/4 1/4 1/4) jeweils durch die beiden verschiedenen Atome besetzt sind (ZnS-Typ)
Die Zinkblendestruktur Die Zinkblendestruktur entsteht aus der Diamantstruktur, indem beide konstituierenden fcc Strukturen mit verschiedenen Atomsorten besetzt werden. In der Struktur vom ZnS-Typ kristallisieren die wichtigsten Verbindungen aus Elementen der III-ten und der V-ten Gruppe des Periodensystems, also z. B. GaAs, GaP, InSb etc. Ferner hat natürlich die Verbindung ZnS, von der ja die Struktur ihren Namen hat, die „Zinkblendestruktur“. Diese Namensgebung ist insofern nicht ganz glücklich, weil ausgerechnet die Verbindung ZnS auch in einer verwandten, hexagonalen Phase, der Wurtzitstruktur, existiert. Diese Struktur hat eine tetraedrische Konfiguration der nächsten Nachbarn wie im ZnS-Typ, jedoch ist die Packungsfolge der (111)-Ebenen nicht ABC ABC . . . sondern ABAB . . . , wodurch die hexagonale Struktur entsteht, wie wir bereits gesehen haben. Die Wurtzitstruktur wird auch von anderen Verbindungen der II-ten und VI-ten Gruppe des Periodensystems angenommen (ZnO, ZnSe, ZnTe, CdS, CdSe). Statt der geordneten Packungsfolgen ABAB . . .
36
2. Die Struktur von Festkörpern
bzw. ABC ABC . . . kann man auch Mischformen mit zufälliger Stapelung oder langen Perioden beobachten, so z. B. bei SiC (Polytypie). Ionenstrukturen Als typische Kristallstrukturen für die Ionenbindung hatten wir schon in Abschn. 1.3 die CsCl-Struktur und die NaCl-Struktur kennengelernt (Abb. 1.6). Die CsCl-Struktur leitet sich von der kubisch raumzentrierten (bcc) Struktur ab, indem man die raumzentrierte Position mit der anderen Ionensorte besetzt. Die NaClStruktur ergibt sich durch Ineinanderstellen von zwei kubisch flächenzentrierten Strukturen (Abb. 1.6). Die Koordinationszahl in der CsCl-Struktur ist 8, in der NaCl-Struktur nur 6. Wie wir schon in Abschn. 1.3 gesehen haben, ist der Madelung-Faktor und damit die ionische Energie bezogen auf den gleichen Ionenabstand in der CsCl-Struktur größer. Die Unterschiede sind verhältnismäßig gering. Es scheint aber trotzdem verwunderlich, dass die meisten Ionenkristalle im NaCl-Typ kristallisieren. Jedoch lässt sich diese Tatsache verstehen: In den meisten Fällen ist der Radius des Kations sehr viel kleiner als der des Anions. Beispiel:
rNa 0;98 A
rCl 1;81 A : Ein großes Kation ist dagegen das Cäsium
rCs 1;65 A : Mit kleiner werdendem Kation geraten in der CsCl-Struktur die Anionen in Kontakt. Dies geschieht bei einem Radienverhältnis r +/ r – = 0,732. Bei weiterer Verkleinerung des Kations könnte sich dann die Gitterkonstante nicht mehr reduzieren und die CoulombEnergie bliebe konstant. In diesem Fall ist der NaCl-Typ günstiger, bei dem Anionenkontakt erst bei r +/r– = 0,414 auftritt. Noch extremere Radienverhältnisse gestattet die ZnS-Struktur. Tatsächlich ist das Verhältnis der Ionenradien bei ZnS r+/r– = 0,40. Dies kann man als eine Erklärung dafür betrachten, dass ZnS nicht in der NaClStruktur kristallisiert. Bei dieser Betrachtung wird allerdings der starke kovalente Anteil der Bindung vernachlässigt.
2.6 Phasendiagramme von Legierungen Moderne Funktionswerkstoffe bestehen aus einer Vielzahl von Elementen in unterschiedlichen Phasen. Unter einer Phase verstehen wir einen Bereich homogener Konzentration und Struktur auf einer Längenskala, die groß gegen atomare Dimensionen ist. Unterschiedliche Phasen lassen sich schon bei einfachen binären Legie-
2.6 Phasendiagramme von Legierungen
37
rungen beobachten. Abb. 2.13 zeigt z. B. das Schliffbild einer Ag/ Cu-Legierung im Rasterelektronenmikroskop. Die kupferreiche fcc-Phase wird dunkel und die silberreiche fcc-Phase wird hell dargestellt.
Abb. 2.13. Rasterelektronenmikroskopische Aufnahme eines Anschliffs einer Ag/Cu Legierung mit 30% Ag- und 70% Cu-Atomen. Die dunklen Bereiche bestehen aus einer fcc-Phase mit ca. 95% Cu-Atomen und die hellen Bereiche aus einer fcc-Phase mit ca. 86% Ag-Atomen
Die verschiedenen Phasen eines realen Werkstoffs befinden sich insbesondere bei modernen Werkstoffen in der Regel nicht im thermodynamischen Gleichgewicht. Trotzdem bildet das Verhalten im Gleichgewicht die Grundlage des Verständnisses. Die Beschreibung des Gleichgewichtsverhaltens erfolgt anhand von Phasendiagrammen. In ihnen werden auf der Ordinate die Temperatur und auf der Abszisse die Atomkonzentration einer Komponente (zu Lasten einer zweiten) aufgetragen. Zu einer festen Temperatur und einer definierten Bruttozusammensetzung ergibt sich im Gleichgewicht ein bestimmter Zustand der Materie. Die Grenzen zwischen Bereichen unterschiedlicher Zustände, im einfachsten Fall zwischen festem und flüssigem Zustand, werden durch Linien markiert. Für zahlreiche wichtige Legierungssysteme sind diese Phasendiagramme durch detaillierte thermodynamische Messungen experimentell bestimmt worden [2.2]. Wir wollen im folgenden nur den einfachen Fall der Phasendiagramme binärer Substitutionslegierungen betrachten. Substitutionslegierungen bestehen aus zwei Sorten von Atomen A und B, die jeweils als reine Materialien in der gleichen Struktur kristallisieren. Wenn zusätzlich die Bindungsart ähnlich ist und die Gitterkonstante sich nicht sehr unterscheidet, werden bei dem zweikomponentigen System die Atome A und B auf den gleichen Kristallgitterplätzen sitzen. Selbst für diesen allereinfachsten Fall gibt es eine Reihe verschiedener möglicher Zustände: der flüssige Zustand mit beliebiger Durchmischung der beiden Komponenten, eine Mischung aus flüssiger Phase mit einer festen Phase, bei der die Atomsorte A an-
38
2. Die Struktur von Festkörpern
Si-Konzentration (Gewicht %) 5
10
20
30
40
70
50
90
1500
Abb. 2.14. Phasendiagramm für die im festen Zustand beliebig mischbare Legierung Ge/Si. In dem durch die Liquidus- und Soliduskurven umgrenzten Bereich gibt es eine Koexistenz einer Gereichen flüssigen Phase mit einer Si-reichen festen Phase
Temperatur (°C)
1412 °C
1300
+s 1100
s 940 °C
900
0
20
40
60
80
100
Si-Konzentration (Atom %) Abb. 2.14
gereichert ist, eine entsprechende Mischung, bei der die Atomsorte B angereichert ist, eine feste Phase mit Mikrokristalliten aus einer Areichen und einer B-reichen Phase oder eine kontinuierlich mischbare feste Phase. Das allereinfachste Phasendiagramm ergibt sich für die binären Legierungen, die im festen Zustand kontinuierlich mischbar sind. Ein Beispiel ist die Legierung SiGe. Das zugehörige Phasendiagramm ist in Abb. 2.14 dargestellt. In Abhängigkeit von der Temperatur und dem relativen Si-Gehalt kann die Legierung entweder als homogene Flüssigkeit (l für liquidus), als homogener Festkörper (s für solidus) oder als Zweiphasensystem mit festen und flüssigen Anteilen (l + s) vorliegen. Die Existenzbereiche der verschiedenen Phasen sind durch die sog. Liquidus- und Soliduskurven voneinander getrennt. Eine weitere Substitutionslegierung ist AgCu. Hier ist das Phasendiagramm schon sehr viel komplexer (Abb. 2.15). Der Grund ist, dass im Fall von AgCu die feste Phase nicht kontinuierlich mischbar ist. Cu ist in Ag nur bis zu einem bestimmten Prozentsatz löslich, der von der Temperatur abhängt (a-Phase, Abb. 2.15 links). Umgekehrt ist auch Ag in Cu nur bis zu einem von der Temperatur abhängigen Prozentsatz löslich (b-Phase, Abb. 2.15 rechts). In dem Zwischenbereich, in der sog. Mischungslücke, besteht der Festkörper aus mikrokristallinen Bereichen einer Ag-reichen aPhase und einer Cu-reichen b-Phase (vgl. dazu Abb. 2.13). Die Größe der Mikrokristallite ist in realen Systemen in der Regel kinetisch bedingt. Allerdings gibt es auch durchaus eine Gleichgewichtsgröße der Kristallite. Sie ist durch ein Minimum der Summe aus der Grenzflächenenergie zwischen den Mikrokristallen und der elastischen Verformungsenergie in den Mikrokristallen bestimmt. Die elastische
2.6 Phasendiagramme von Legierungen
39
Cu-Konzentration (Gewicht %) 20
10
30
60
40
80 1085 °C
962 °C
1000
liq.
Temperatur (°C)
β+liq. 800
α α+liq.
600
39.9%
β
779 °C
95.1%
13.5 %
Abb. 2.15. Phasendiagramm für die binäre Ag/Cu-Legierung. Das System ist im festen Zustand nicht beliebig mischbar, sondern es existiert eine breite Mischungslücke, in der eine Ag-reiche fccPhase (-Phase) neben einer Cu-reichen fcc-Phase (b-Phase) existiert (s. auch Abb. 2.13)
α+ β
400 200 0
0
20
40
60
80
100
Cu-Konzentration (Atom %) Abb. 2.15
Verformungsenergie ist eine Folge der unterschiedlichen natürlichen Gitterkonstanten der Mikrokristallite. Der Aufwand an Verformungsenergie wird um so geringer je kleiner die Verformungsvolumina, also die Kristallite sind. Gleichzeitig wächst aber die Größe der Grenzfläche zwischen den Kristalliten, so sich ein Minimum bei einer bestimmten Größenverteilung ergibt. Im weiteren Verlauf dieses Abschnitts wollen wir auf der Basis thermodynamischer Betrachtungen zu einem Verständnis der Ursache für die unterschiedlichen Phasendiagramme der beiden Substitutionslegierungen SiGe und AgCu gelangen. Wie wir oben gesehen haben, ist der entscheidende Unterschied zwischen beiden Systemen die Möglichkeit bzw. Unmöglichkeit einer kontinuierlichen Mischung. Unsere thermodynamische Betrachtung wird sich deshalb auf die mit einer Mischung verbundene freie Enthalpie konzentrieren. Bekanntlich ist die freie Enthalpie G eines Systems eine Linearkombination aus innerer Energie U, Entropie S und mechanischer (und anderer) Arbeit. Im einfachsten Fall eines homogenen, flüssigen oder gasförmigen Stoffes ist G GU
TS pV ;
2:4
wobei T die Temperatur, p der Druck und V das Volumen sind. Für einen festen Körper ist der Term für die mechanische Arbeit komplizierter. Neben der Arbeit gegen einen äußeren Gasdruck muss auch die mechanische Arbeit verknüpft mit den inneren Freiheitsgraden des Systems (siehe die Diskussion oben) berücksichtigt werden. Dieser Anteil ist sehr schwierig zu behandeln (siehe auch Abschn. 4.5). Glücklicherweise stellen Mischungsentropie und Mi-
40
2. Die Struktur von Festkörpern
schungsenergie die qualitativ wichtigsten Beiträge. Wir werden deshalb im folgenden nur diese beiden Beiträge betrachten und den Beitrag der mechanischen Arbeit oder sonstige Arbeitsbeiträge, z. B. elektrischer oder magnetischer Art, vernachlässigen. Ebenso vernachlässigen wir im ersten Schritt die thermischen Beiträge. Für die Berechnung der Mischungsenergie und Mischungsentropie müssen wir noch eine zusätzliche Näherung machen. Diese besteht darin, dass wir nur homogen gemischte Phasen zulassen, also örtliche und zeitliche Fluktuationen in den Konzentrationen ausschließen. Dies entspricht einer Molekularfeldnäherung (engl. mean field approximation), die uns noch öfter begegnen wird. In dem Zusammenhang hier heißt sie Bragg-Williams Näherung. Die mit einer Mischung verbundene Enthalpieänderung Gmix besteht also aus einer Änderung der inneren Energie Umix, die nichts anderes als die Lösungswärme darstellt, und einer Änderung der Entropie durch die Mischung Smix Gmix Umix
T Smix :
2:5
Wir berechnen zunächst die Änderung der inneren Energie unter der Annahme, dass sich die Bindungsenergien der beteiligten Atome als paarweise Wechselwirkung zwischen benachbarten Atomen schreiben lassen. Dieser einfache Ansatz entspricht in der Regel nicht der Realität, muss uns aber hier genügen. Wir bezeichnen VAA, VBB und VAB als die Bindungsenergien (positive Zahlenwerte) eines benachbarten AA-, BB- und AB-Atompaares und z als die Koordinationszahl (Anzahl der nächsten Nachbarn) der Struktur. Für die Diamantstruktur (Si, Ge) ist z = 4, für die fcc-Struktur (Ag, Cu) ist z = 12. Wir bezeichnen ferner mit NA und NB die Anzahl der Atome A und B und mit NAA, NBB und NAB die Anzahl der Bindungen zwischen zwei Atomen der Sorte A oder B und der Sorte A mit B. Die Energiedifferenz Umix durch Mischen ist damit Umix
NAA VAA NBB VBB NAB VAB 1
z NA VAA z NB VBB : 2
2:6
Die Summe der ersten drei Terme ist die Energie nach der Mischung und die Summe der letzten beiden Terme die Energie vor der Mischung. Der Faktor ½ tritt auf, weil zu jedem Atom z/2 Bindungen gehören. Bezüglich der Vorzeichen in (2.6) beachte man, dass die Definition von Bindungsenergie und innerer Energie ein umgekehrtes Vorzeichen implizieren: Eine höhere Bindungsenergie entspricht einer niedrigeren inneren Energie. Die Zahl der Atompaare NAA, NBB und NAB kann durch die Konzentrationen xA NA =N xB NB =N mit N NA NB
2:7
2.6 Phasendiagramme von Legierungen
41
ausgedrückt werden, und zwar gilt: NAA NA xA z=2 N x2A z=2 NBB NB xB z=2 N x2B z=2
2:8
NAB NA xB z=2 N xA xB z=2 : Damit wird aus der Mischungsenergie Umix Umix N z xA xB WAB
2:9
mit 1 WAB
VAA VBB 2
VAB :
2:10
Ist WAB < 0 so hat die Legierung eine höhere Bindungsenergie und die innere Energie der Legierung ist niedriger als die Summe der inneren Energien der Komponenten. Wegen xA+xB = 1 hat die Mischungsenergie in diesem Modell die Form einer Parabel. Umix N z xA
1
xA WAB :
2:11
Mit der Mischung zweier Komponenten ist stets eine Entropievergrößerung verbunden, weil eine Mischung mikroskopisch auf verschiedene Weise realisiert werden kann. Die verschiedenen mikroskopischen Zustände entstehen durch Vertauschung der Atome A mit denen von B. Die Zahl der Vertauschungsmöglichkeiten aller Atome N = NA+NB ist N!. Die Vertauschung von Atomen der Sorte A oder B jeweils untereinander ergibt keinen veränderten Zustand. Die Zahl der unterscheidbaren Zustände ist also N!/(NA! NB!). Die Mischungsentropie wird damit Smix k ln
N! N! k ln NA ! NB !
N xA !
N xB !
2:12
Unter Benutzung der Stirling-Formel ln N! N ln N erhält man Smix
N k xB ln xB
1
xB ln
1
xB :
N; N 1
2:13
Der Wert von Smix ist Null für xB = 0 und xB = 1 und positiv für alle Zwischenwerte. Die freie Enthalpie der Mischung ist Gmix Umix T Smix Nfz xB
1 xB WAB k T xB ln xB
1 xB ln
1 xB g : (2.14) Die Funktion hat einen Extremalwert bei xB = 0,5. Ob es sich dabei um ein Minimum oder ein Maximum handelt, hängt vom Verhältnis von WAB zu k T ab. Es ergibt sich
Abb. 2.16. Freie Enthalpie einer Mischung gemäß einem einfachen Modell (2.14). Die voll ausgezogene Kurve entspricht dem Grenzfall, bei dem gerade noch kein Zwischenmaximum in der freien Enthalpie auftritt. Wenn ein Zwischenmaximum auftritt, so ist das System in einem Konzentrationsbereich instabil gegen den Zerfall in eine NBarme und eine NB-reiche Phase, und zwar unabhängig davon, ob insgesamt gegenüber den unlegierten Komponenten freie Enthalpie gewonnen wird oder nicht (gepunktete und gestrichelte Linie)
2. Die Struktur von Festkörpern
Gmix/N k T
42
zWAB/k T= 3 zWAB/k T= 2.5 zWAB/k T= 0.5
ein Minimum fur z WAB =k T < 0; 5 ;
2:15
ein Maximum fur z WAB =k T > 0; 5 :
2:16
Beispiele für z WAB/k T = 0,5, 2,5 und 3 sind in Abb. 2.16 dargestellt. Für negative Werte von WAB ist die freie Enthalpie der Mischung in jedem Fall kleiner als die Summe der freien Enthalpie der ungemischten Systeme. Ein solches System ist in beliebigem Konzentrationsverhältnis mischbar. Das gleiche gilt für jedes System, wenn nur die Temperatur genügend hoch ist (2.14). Wenn die freie Enthalpie bei xB = 0,5 ein Maximum aufweist, ist das System instabil und zerfällt in zwei Phasen mit einer Konzentration x 0B < 1=2 und x 00B > 1=2 und zwar unabhängig davon ob die Mischungsenthalpie selber größer oder kleiner als null ist. Für den symmetrischen Fall in Abb. 2.16 ist leicht zu sehen, dass diese Instabilität nicht nur bei xB = 1/2 auftritt sondern für den ganzen Bereich zwischen den beiden Minima in der Kurve für die freie Enthalpie. Der allgemeinere Fall eines asymmetrischen Verlaufs der freien Enthalpie wird in Abb. 2.17 betrachtet. Wenn das System in zwei Phasen mit zwei verschiedenen Konzentrationen x 0B und x 00B mit den zugehörigen freien Enthalpien G 0 und G 00 zerfällt, so müssen diese beiden Phasen miteinander im Gleichgewicht stehen, d. h. die chemischen Potentiale der beiden Phasen müssen gleich sein. Die chemischen Potentiale der Phasen G 0 und G 00 bezüglich der Teilchensorte NB sind l 0B l 00B
@ G0 1 @ G0 @ NB N @ xB
@ G 00 1 @ G 00 : @ NB N @ xB
(2.17)
Freie Enthalpie G
2.6 Phasendiagramme von Legierungen
43
''
G(x )
G(x0) '
G(x )
'
0
xB
xB0
''
xB
1
Konzentration xB
Abb
Das System zerfällt also in zwei Phasen, für welche die Steigung der freien Enthalpie (Abb. 2.17) gleich ist. Unter der Mannigfaltigkeit aller Punktepaare auf der Kurve von G, welche die Bedingung der Steigungsgleichheit erfüllen, ist die freie Enthalpie des Gesamtsystems minimal für das Punktepaar x 0B und x 00B , durch das sich eine gemeinsame Gerade als Tangente legen lässt (Abb. 2.17). Durch diese Doppeltangentenkonstruktion sind die Konzentrationen x 0B und x 00B eindeutig festgelegt. Man kann nun durch einige geometrische Betrachtungen zeigen, dass der gesamte Konzentrationsbereich zwischen x 0B und x 00B instabil ist. Wir betrachten dazu eine beliebige Konzentration xB0 zwischen den Punkten x 0B und x 00B . Die Massenerhaltung bei der Phasentrennung verlangt, dass für die Atomzahlen N 0 und N 00 in den Phasen die Relation N 0 x 0B N 00 x 00B
N 0 N 00 xB0
2:18
gelten muss. Daraus folgt, dass sich die Atomzahlen wie die Achsenabschnitte auf der Doppeltangente verhalten müssen. N0 x 00B N 00 xB0
xB0 : x 0B
2:19
Ein entsprechendes Gesetz gilt für die Atomzahlen der Komponente A. Dieses einfache Gesetz zur Beschreibung der Verhältnisse der Atomzahlen erinnert an das Hebelgesetz in der Mechanik und wird deshalb als das Hebelgesetz der Zustandsdiagramme bezeichnet. Es gilt für jede Phasentrennung gleich welcher Ursache sie ist. Nach erfolgter Phasentrennung ist die freie Enthalpie des Systems G
x 0B ; x 00B G
x 0B N 0 =N G
x 00B N 00 =N :
Abb. 2.17. Freie Enthalpie einer Legierung mit einem Zwischenmaximum und zwei Minima unterschiedlicher Tiefe. In dem Konzentrationsbereich zwischen den Berührungspunkten der Doppeltangente bei x 0B und x 00B ist das System instabil und zerfällt in zwei Phasen mit den Konzentrationen x 0B und x 00B . Die freie Enthalpie des Zweiphasensystems wird dann gerade durch die Doppeltangente beschrieben
2:20
44
2. Die Struktur von Festkörpern
Durch Einsetzen von (2.19) und geeignete Umformung lässt sich dieser Wert als G
x 0B ; x 00B G
x 0B G
x 00B
G
x 0B
xB0 x 00B
x 0B x 0B
2:21
schreiben. Das ist aber gerade der Ordinatenwert der Doppeltangente am Punkt x0. Die Doppeltangente beschreibt also den Wert der freien Enthalpie nach der Phasentrennung. Da die Werte im gesamten Bereich zwischen x 0B und x 00B unter dem Wert für die freie Enthalpie vor der Phasentrennung liegt (Abb. 2.17), ist in diesem Bereich das System instabil gegenüber einer Phasentrennung. Angewandt auf binäre Legierungen spricht man von einer Mischungslücke. Eine solche liegt bei der Ag/Cu Legierung vor, wie man aus dem Phasendiagramm (Abb. 2.15) entnehmen kann. Kühlt man eine Schmelze von 40 Atom % Silber und 60 Atom% Kupfer ab, so wird zunächst die b-Phase mit ca. 95% Cu ausgeschieden. Die verbleibende Schmelze reichert sich mit Ag an bis am sog. eutektischen Punkt bei der Temperatur von 7798C und einer Cu-Konzentration von 39.9% sich die b-Phase (95,1% Cu) und die silberreiche -Phase (85,9% Ag) gemeinsam abscheiden. Bei weiterer Abkühlung des Systems müssten sich eigentlich die Konzentrationen in den beiden noch weiter verändern (Abb. 2.15). Wegen der geringen Diffusivität der Atome im festen Zustand lässt sich das aber nur durch sehr langsames Abkühlen erreichen. Die Konzentrationen in den dunklen und hellen Bereichen von Abb. 2.15 entsprechen in etwa den Gleichgewichtskonzentrationen der - und bPhase am eutektischen Punkt. Die thermodynamischen Betrachtungen lassen sich auch auf den Phasenübergang binärer Legierungen von flüssig nach fest anwenden. Wir betrachten dazu die freie Enthalpie eines beliebig mischbaren Systems im festen und flüssigen Zustand (Abb. 2.18). Das System ist beliebig mischbar, wenn die freie Enthalpie durch eine Kurve mit durchweg positiver Krümmung dargestellt werden kann. Zu einer Koexistenz von flüssiger und fester Phase kommt es dann, wenn die Minima der freien Enthalpie der flüssigen und der festen Phase gegeneinander verschoben sind. In Abb. 2.19 sind die Verhältnisse noch einmal so dargestellt, dass sie in etwa dem System Ge/Si entsprechen. Wir betrachten zunächst den Fall hoher Temperatur T > 1412 8C. Dort liegt die freie Enthalpie der Schmelze für jede Konzentration unter der des festen Zustandes. Dies liegt an dem entropischen Beitrag zur freien Enthalpie. Bei hohen Temperaturen ist die Entropie für die flüssige Phase höher als für die feste, weil eine Flüssigkeit viele Anregungsmöglichkeiten niedriger Quantenenergie aufweist: Vereinfacht gesprochen werden aus den Freiheitsgraden der transversalen Schallwellen im Festkörper Freiheitsgrade der Translation in der Schmelze. Bei einer Temperatur von 1412 8C werden die freien Enthalpien der beiden Phasen für die Konzentration xSi = 1 gerade gleich. Hier können also Schmelze und Festkörper ko-
2.6 Phasendiagramme von Legierungen
45
< 940 °C
0.5
feste Phase
Freie Enthalpie
Freie Enthalpie
940 °C
flüssige Phase
0.0
1150 °C
G fest xSi(flüssig)
xSi(fest)
1412 °C > 1412 °C
0
xB(flüssig)
xB(fest)
Konzentration xB
0
1
Konzentration xSi
1
Abb
Abb. 2.18. Freie Enthalpie des festen und flüssigen Zustands einer im festen Zustand beliebig mischbaren Legierung im Temperaturbereich zwischen der Liquidus- und Solidus-Kurve
Abb. 2.19. Freie Enthalpien für das System Ge/Si bei verschiedenen Temperaturen als Funktion der Si-Konzentration xSi (schematisch)
existieren. Mit anderen Worten: wir haben den Schmelzpunkt für reines Silizium erreicht. Bei noch tieferen Temperaturen, z. B. bei 1150 8C, hat man gemäß der Doppeltangentenkonstruktion eine Koexistenz einer Si-armen, flüssigen Phase mit einer Si-reicheren, festen Phase. Unterhalb von 940 8C schließlich gibt es nur noch eine feste Phase für jedes Mischungsverhältnis. Führt man den beschriebenen Abkühlungsprozess mit einer Schmelze von endlichem Volumen mit einem festen Mischungsverhältnis von z. B. 50 Atom% Ge und 50 Atom% Si durch, so werden sich zunächst bei einer Temperatur knapp unterhalb von ca. 1270 8C Kristalle mit einer Konzentration von ca. 80% Si abscheiden. In dem Temperaturbereich zwischen der Liquidus- und Soliduskurve sind die Gleichgewichtskonzentrationen von Si in der flüssigen und festen Phase jeweils durch den Abszissenwert der Liquidus- und Soliduskurve gegeben. Die Verhältnisse der Atomzahlen in den beiden Phasen richten sich nach dem Hebelgesetz (2.19). Mit sinkender Temperatur steigt der Anteil der festen Phase, deren Si-Konzentration sich dabei kontinuierlich verändert. Bei kontinuierlich mischbaren Systemen ist es also nicht möglich, aus der Schmelze einen Kristall mit homogener Konzentration zu ziehen, es sei denn man beschränkt sich darauf, nur einen sehr geringen Bruchteil der Schmelze zu kristallisieren. Die unterschiedliche Gleichgewichtskonzentration in der Schmelze und im Festkörper kann man sich aber zunutze machen, um Kristalle von Verunreinigungen zu befreien. Darauf beruht das technisch wichtige Verfahren des Zonenreinigens. Bei diesem Verfahren wird zunächst am Ende eines Kristallstabs eine Zone aufgeschmolzen. In dieser Schmelzzone sind die Verunreinigungskonzentrationen zunächst noch wie sie im Kristall waren. Dann zieht man die Schmelzzone langsam über den Kristallstab hinweg. Wenn
Abb. 2.19
46
2. Die Struktur von Festkörpern
die Liquidus- und Soliduskurven bezüglich einer Verunreinigung so wie in Abb. 2.14 beschaffen sind (für Si als Grundmaterial und Ge als Verunreinigung), hat der in der Abkühlzone neu entstehende Kristall eine geringere Konzentration an Verunreinigungen als (jeweils) in der Schmelzzone. Die Verunreinigungen werden also durch das Zonenschmelzen in dem Teil des Kristalls angereichert, welcher zum Schluss aufgeschmolzen wird. Durch vielfaches Wiederholen des Vorgangs kann man schließlich die Verunreinigungen weitgehend in ein Endstück des Kristalls schieben, das dann nicht verwertet wird.
2.7 Defekte in Festkörpern Mechanische und elektrische Eigenschaften von Festkörpern werden maßgeblich von Defekten in der periodischen Struktur bestimmt. In diesem Abschnitt geben wir einen kurzen Überblick über die verschiedenen Defekte. Einen speziellen Defekt haben wir im vorigen Abschnitt im Zusammenhang mit Legierungen kennengelernt. Bei einer verdünnten Substitutionslegierung sitzen Fremdatome auf den Plätzen der Majoritätsatome. Bei Halbleitern lässt sich mit Hilfe solcher Fremdatome, einer „Dotierung“, die elektrische Leitfähigkeit über viele Größenordnungen steuern. Die Dotierung von Halbleitern wird in Kap. 12 besprochen werden. Besteht der Defekt nur aus einem oder wenigen Atomen wie im Fall einer Dotierung, so spricht man von Punktdefekten. Punktdefekte müssen nicht notwendigerweise durch Fremdatome gebildet werden. So können Atome aus ihren regulären „Gitterplätze“ in die Räume zwischen die Atome auf „Zwischengitterplätze“ verschoben werden. Ein solcher Defekt wird Frenkel-Defekt genannt. Das Atom auf dem Zwischengitterplatz und die entstandene Lücke werden zusammen als Frenkel-Paar bezeichnet. Die Bildung eines FrenkelPaares kostet Energie, da das Atom auf dem Zwischengitterplatz schlechter gebunden ist. Trotzdem bilden sich bei höherer Temperatur im thermischen Gleichgewicht Frenkel-Paare, weil ihre Bildung mit einer Entropievermehrung verbunden ist. Sie ergibt sich daraus, dass Lücke und Zwischengitterplatz je für sich auf allen Atom- bzw. Lückenplätzen sitzen können. Eine bestimmte Anzahl von nl Lücken und von nzw Zwischengitterplätzen kann also mikroskopisch auf verschiedene Weise realisiert werden. Die Zahl der Möglichkeiten nl Lücken unterscheidbar auf N Atomplätze zu verteilen ist N!/[nl!(N–nl)!]. Ebenso ist die Zahl der Möglichkeiten nzw Zwischengitteratome auf N ' Zwischengitterplätze zu verteilen N'!/[nzw!(N'–nzw)!]. Bei einem Frenkel-Paar ist die Zahl der Zwischengitteratome nzw notwendigerweise gleich der Zahl der Lücken nl. Mit n = nzw = nl erhält man für die Entropie S (vgl. (2.12)).
2.7 Defekte in Festkörpern
S k ln
47
N! N 0! k ln n!
N n! n!
N 0 n!
k N ln N N 0 ln N 0
N
0
n ln
N
0
2n ln n
N n ln
N n
(2.22)
n :
Im Gleichgewicht stellt sich der Zustand niedrigster freier Energie F = n D E – TS ein, mit D E der Energie für die Bildung eines Frenkel-Paares. Die zugehörige Gleichgewichtskonzentration hni erhält man durch Differenzieren der freien Energie nach n dF 0 D E k T ln
N 0 dn
hni2 hni
N
hni
:
2:23
Da die Konzentration von Defekten klein ist
hni N; N 0 , ist hni näherungsweise gegeben durch p DE=2 k T :
2:24 hni N N 0 e Die Konzentration steigt also exponentiell mit der Temperatur gemäß einem Arrhenius-Gesetz. Die Aktivierungsenergie ist gleich der halben Bildungsenergie eines Frenkel-Paares. Der Faktor 2 im Nenner des Exponenten entsteht dadurch, dass sowohl die Lücke als auch das Atom im Zwischengitter unabhängig voneinander im Kristall verteilt sind und man deshalb zwei unabhängige Beiträge zur Entropie erhält. Wandert das Atom von einem Gitterplatz zur Oberfläche („Schottky-Defekt“), so hat es dort weniger Plätze zur Verfügung. Im Limes makroskopischer Körper verschwindet die Zahl der Oberflächenplätze gegen die Zahl der Plätze im Volumen. Dann tragen nur die Lücken zur Entropie bei und im ArrheniusGesetz erscheint als Aktivierungsenergie die volle Bildungsenergie. Neben den Punktdefekten gibt es auch linienhafte Defekte, die Versetzungen. Ein einfaches Beispiel für eine Versetzung ist in Abb. 2.20 dargestellt. Die Linienhaftigkeit der Versetzung ergibt sich daraus, dass man sich den Kristall außerhalb der Darstellungsebene fortgesetzt denken muss. Versetzungen werden durch den Burgersvektor beschrieben. Richtung und Betrag des Burgersvektors ermittelt man aus der Betrachtung eines beliebigen geschlossenen Umlaufs um eine Versetzungslinie. Man vergleicht dazu die Positionen des Atoms, bei dem der Umlauf abgeschlossen wurde, für einen Kristall ohne und mit Versetzung (Abb. 2.20). Steht der Burgersvektor senkrecht auf der Versetzungslinie wie in Abb. 2.20, so wird die Versetzung als Stufenversetzung bezeichnet. Liegt der Burgersvektor dagegen in Richtung der Versetzungslinie, so nennt man die Versetzung eine Schraubenversetzung, weil man sich bei jedem Umlauf um die Versetzungslinie schraubenartig von einer Atomebene in die nächste bewegt. Zwischen den beiden Grenzformen Stufenversetzung und Schraubenversetzung gibt es beliebige Mischformen. Auch kann eine Versetzung entlang der Versetzungslinie kontinuierlich von einer Idealform in die andere übergehen. Bei einer gewöhnlichen Schrau-
48
2. Die Struktur von Festkörpern
b A
B
Abb. 2.20. Schnitt durch einen Kristall mit einer Stufenversetzung (schematisch). Die gestrichelte Linie stellt einen Umlauf um die Versetzung dar. Wäre die Versetzung nicht vorhanden, so wäre der Umlauf, der am Atom A beginnt, schon beim Atom B abgeschlossen. Der Burgersvektor b zeigt von Atom A nach Atom B. Nach Richtung und Betrag der gleiche Vektor ergibt sich für jeden anderen Umlauf der die Versetzung einschließt
ben- und Stufenversetzung ist der Betrag des Burgersvektors gleich dem Abstand atomarer Ebenen. Es gibt aber auch Versetzungen, wo die Länge des Burgersvektors nur ein Bruchteil eines Ebenenabstands beträgt. Eine solche Partialversetzung entsteht z. B., wenn man bei einem fcc Kristall die dicht gepackten Ebenen (Abb. 2.9) gegeneinander verschiebt und dabei einen Stapelfehler erzeugt. Versetzungen spielen eine große Rolle bei der plastischen Verformung von Kristallen. Man stelle sich vor, eine Scherkraft wirke parallel zu einer Atomebene. Eine Abgleitung der ganzen Ebene auf einmal ist nicht möglich, da dann alle Atombindungen zwischen den Ebenen gleichzeitig beansprucht würden. Statt dessen ist es energetisch günstiger, wenn an der Oberfläche eine Stufenversetzung gebildet wird, die anschließend durch den Kristall geschoben wird. Dann muss nicht mehr die ganze Ebene auf einmal abgleiten, sondern die Abgleitung erfolgt Atomreihe für Reihe, bis die Versetzung durch den Kristall gewandert ist. Der Kraftaufwand für die Versetzungswanderung ist viel geringer, da Bindungen nicht gebrochen, sondern nur verlagert werden müssen. Plastische Verformungen sind also mit der Erzeugung und Wanderung von Versetzungen verbunden. Bei idealen Kristallen, z. B. von Metallen, wandern Versetzungen häufig sehr leicht. Ist das gleiche Material dagegen polykristallin, so wird die Versetzungswanderung durch die Korngrenzen zwischen den einkristallinen Bereichen eingeschränkt und das Material setzt einer plastischen Verformung größeren Widerstand entgegen.
Übungen zu Kapitel 2
2.1 Der Phasenübergang vom Graphit zum Diamant verlangt hohen Druck und hohe Temperaturen, um das Gleichgewicht in Richtung Diamant zu schieben. Hohe Temperaturen sind auch erforderlich zur Überwindung der Aktivierungsbarriere. Schlagen Sie eine Methode vor, mit der man Diamant(-schichten) ohne die Anwendung hoher Drücke herstellen kann! 2.2 Unterhalb von 910 °C liegt Eisen in der bccStruktur (-Fe), zwischen 910 °C und 1390 °C in der fcc-Struktur (c-Fe) vor. Bestimmen Sie (unter Annahme kugelförmiger Atome) die Form und Größe der oktaedrischen Zwischengitterplätze in c-Fe ˚ ) (Oktae(a = 3,64 A) und -Fe (a = 2,87 A der = Achtflächner)! Fertigen Sie eine Skizze der Gitter und der Zwischengitterplätze an! Von welcher Phase würde man eine höhere Löslichkeit für Kohlenstoff erwarten? (Hinweis: Der kovalente Radius von Kohlenstoff ˚ ). beträgt 0,77 A Warum findet bei der Abkühlung einer Eisenschmelze, die etwas Kohlenstoff (£ 1%) enthält, eine Entmischung in ein mehr oder weniger geordnetes Gefüge aus einer -Fe-haltigen Phase (Ferrit) mit einer geringen Konzentration von Kohlenstoffatomen auf Zwischengitterplätzen sowie einer eisenkarbidhaltigen Phase (Zementit, Fe3C) statt? Warum verstärkt Zementit das Gefüge gegen plastische Deformationen (Stahlhärte)? (Hinweis: Fe3C ist wie viele Karbide sehr hart und spröde.) 2.3 Kupfer und Gold bilden eine kontinuierlich mischbare Legierung, bei der die Kupferund Goldatome stochastisch auf die Plätze einer fcc-Struktur verteilt sind. Für welche Konzentrationsverhältnisse erwarten Sie ge-
ordnete Legierungen und wie sehen sie aus? Zeichnen Sie die Einheitszelle dieser Legierungen und geben Sie die zugehörigen Bravais-Gitter an. Schlagen Sie Experimente vor, mit denen sich ermitteln lässt, ob die Legierungen geordnet sind oder nicht! 2.4 Zeichnen und beschreiben Sie die Symmetrieelemente aller Bravais-Gitter! 2.5 Zeichnen Sie die primitive Einheitszelle des kubisch-flächenzentrierten Gitters und bestimmen Sie die Länge der primitiven Gittervektoren a ', b ', c ' (in Einheiten der Gitterkonstanten a ) sowie die Winkel ', b ', c ' zwischen den primitiven Gittervektoren! (Hinweis: Stellen Sie die primitiven Gittervektoren als Linearkombination der Gittervektoren a, b, c des kubisch-flächenzentrierten Gitters dar und benutzen Sie elementare Vektorrechnung.) Was unterscheidet diese Einheitszelle von der des rhombischen Bravais-Gitters? 2.6 Bestimmen Sie das Verhältnis der Gitterkonstanten c und a für eine hexagonal-dichtgepackte Kristallstruktur und vergleichen Sie es mit den Werten c/a für folgende in dieser Struktur kristallisierende Elemente: He: 1,633, Mg: 1,623, Ti: 1,586, Zn: 1,861! Was könnte die Abweichungen vom idealen Wert erklären? 2.7 Welcher Bruchteil des Raumes wird durch die Atome (als feste Kugeln) in der kubischprimitiven, fcc-, hcp- und bcc-Kristallstruktur sowie im Diamantgitter ausgefüllt? 2.8 Man ermittle die Matrixdarstellung einer 2-, 3-, 4- und 6zähligen Drehung. Welche Darstellung ist reduzibel?
50
Übungen zu Kapitel 2
2.9 Man zeige, dass sich das rhomboedrische Translationsgitter in Abb. 2.3 auch durch ein hexagonales Gitter mit zwei Atomen auf der Raumdiagonalen auf den jeweiligen Höhen c/3 und 2 c/3 darstellen lässt. Anleitung: Man betrachte dazu die Projektion des rhomboedrischen Translationsgitters entlang der Raumdiagonalen in die Ebene senkrecht zu dieser Raumdiagonalen: Die Raumdiagonale des Rhomboeders ist parallel zur cAchse des hexagonalen Gitters! Wie hängt
das Verhältnis der a und c-Achse des zugeordneten hexagonalen Gitters mit dem Winkel b c und der Länge a b c des rhomboedrischen Gitters zusammen? 2.10 Man erläutere warum getempertes Kupferblech leicht plastisch verformbar ist und warum nach Hämmern des Materials das Kupferblech einer plastischen Verformung deutlich größeren Widerstand entgegensetzt.
3. Die Beugung an periodischen Strukturen
Eine direkte Abbildung atomarer Strukturen wird durch das hochauflösende Elektronenmikroskop, das Feldionenmikroskop und das Tunnelmikroskop ermöglicht. Trotzdem ist man zur Aufklärung unbekannter Strukturen oder zur genauen Vermessung von Strukturparametern auf Beugungsexperimente angewiesen. Ihr größerer Informationsgehalt beruht letztlich darauf, dass in Beugungsexperimenten von der Eigenschaft der Periodizität des Festkörpers optimal Gebrauch gemacht wird. Die direkte Abbildung atomarer Strukturen hat dagegen ihr Hauptanwendungsfeld bei der Untersuchung von Punktdefekten, Versetzungen und Stufen sowie Oberflächen und Grenzflächen, also bei Störungen der Periodizität. Zu Beugungsexperimenten können Röntgenlicht, Elektronen, Neutronen und Atome herangezogen werden. Die verschiedenen Strahlungsarten unterscheiden sich allerdings erheblich hinsichtlich der Stärke der elastischen und inelastischen Wechselwirkung mit dem Festkörper, wodurch ihre Anwendungsfelder verschieden werden. Atome mit geeigneter Materie-Wellenlänge für Beugungsexperimente dringen nicht in den Festkörper ein, sind also nur für Oberflächenuntersuchungen geeignet. Abgeschwächt gilt dies auch für Elektronen niedriger Energie. Unterschiedlich für die Strahlungsarten ist auch die räumliche Ausdehnung der Streuzentren. Neutronen werden z. B. an den Kernen gestreut, Röntgenlicht und Elektronen an der *104 mal größeren Elektronenhülle. Trotz dieser und anderer Verschiedenheiten, die im Abschn. 3.7 noch etwas eingehender diskutiert werden, lässt sich der wesentliche Aspekt der Beugung in einer für alle Strahlungsarten gemeinsamen Theorie behandeln. Selbstverständlich entfallen bei einer solchen Betrachtungsweise Unterschiede, die sich aus der Polarisation bzw. Spinpolarisation ergeben. Die nachfolgend beschriebene Beugungstheorie ist quasiklassisch, denn die Streuung selbst wird klassisch behandelt. Der quantenmechanische Aspekt liegt lediglich in der Beschreibung von Teilchen als Welle. Für eine genaue und strahlungsart-spezifische Darstellung sei auf [3.1–3.3] verwiesen.
3.1 Die allgemeine Beugungstheorie Wir wollen bei der mathematischen Beschreibung der Beugung die Voraussetzung der Einfachstreuung machen: Die einfallende Welle
52
3. Die Beugung an periodischen Strukturen
soll die streuende Materie an allen Orten r zur Emission von Kugelwellen anregen. Dabei wird eine feste Phasenbeziehung zwischen der Primärwelle und der jeweils emittierten Kugelwelle angenommen (kohärente Streuung). Die emittierten Kugelwellen werden kein zweites Mal gestreut. Diese Näherung heißt auch die „kinematische“ und entspricht der 1. Bornschen Näherung in der quantenmechanischen Streutheorie. Die Näherung gilt für Neutronen, Röntgenstreuung und mit Einschränkungen auch für die Streuung von Elektronen genügend hoher Energie. Bei Streuung an sehr guten Einkristallen können „nichtkinematische“ („dynamische“) Effekte auch mit Röntgenstrahlung beobachtet werden. Zur Herleitung der Streukinematik betrachten wir Abb. 3.1. Dabei sei Q der Ort der Strahlungsquelle, P der Ort eines der Streuzentren und B der Beobachtungsort. Als Beispiel für eine Quelle diene die Emission von Licht in Form einer Kugelwelle durch einen Elektronenübergang im Atom. In genügend großer Entfernung von der Quelle ist die Welle nahezu eine ebene Welle. Die Amplitude (bei Röntgenlicht genauer: Komponente des Feldstärkevektors) am Ort P zur Zeit t kann also beschrieben werden durch AP A0 ei k0
Rr
i x0 t
:
3:1
Denken wir uns die Welle zurückverfolgt zum Quellpunkt Q (R+ r = 0), so ist die Amplitude als Funktion der Zeit hier *exp (–i x0 t ), hat also zu jeder Zeit eine feste Phase. Einen solchen Ansatz kann man also nur für einen Emissionsprozess machen. In realen Strahlern emittieren viele Atome Photonen mit unkorrelierter Phase (Ausnahme Laser). Bei anderen Teilchen sind die Phasen ebenfalls unkorreliert. Wenn wir also mit einer Welle wie in (3.1) rechnen, müssen wir im Auge behalten, dass im Ergebnis die beobachtete Intensität durch Mittelung über viele einzelne Beugungsvorgänge entsteht. Die Phasenlage der Welle an den Orten P zu einer Zeit t (Momentaufnahme des Wellenbildes) ist durch den ortsabhängigen Faktor in (3.1) gegeben. Die Primärwelle rege nun die Materie zur Streuung an. Jeder Punkt der streuenden Materie P emittiert durch die Primärwelle ausgelöste Kugelwellen, deren Amplitude und
Abb. 3.1. Zur Herleitung der Streukinematik. Die Quelle Q sei genügend weit von der streuenden Materie entfernt, so dass die von ihr ausgesandten Kugelwellen am Ort der Streumaterie praktisch ebene Wellen sind. Das gleiche gilt für die Entfernung des Beobachtungsortes B von den Streuzentren
3.1 Die allgemeine Beugungstheorie
53
Phasenlage relativ zur anregenden Strahlung durch eine komplexe Streudichte R (r ) beschrieben wird. Das Zeitverhalten der Kugelwellen wird durch die Zeitabhängigkeit in (3.1) bestimmt (erzwungene Schwingung). Die Kugelwelle am Beobachtungspunkt B wird also beschrieben durch 0
ei k j R rj AB AP
r; t R
r 0 : jR rj
3:2
Für einen festen Ort P hat k die Richtung von R '– r. Wir können deshalb auch schreiben 0
AB AP
r; t R
r
ei k
R r : jR 0 rj
3:3
Für die großen Entfernungen vom Streuzentrum ist dann AB AB AP
r; t R
r
1 i k
R 0 e R0
3:4
r
mit gleicher Richtung von k für alle Orte P. Setzen wir (3.1) in (3.4) ein, so erhalten wir AB
A0 i
k0 Rk R 0 e e R0
i x0 t
R
r ei
k0
k r
:
3:5
Die gesamte Streuamplitude ergibt sich dann durch Integration über den streuenden Bereich AB
t / e i x0 t R
r ei
k0 k r dr :
3:6 Bei der Streuung an einer zeitlich unveränderlichen Struktur ist R (r) zeitunabhängig und die Zeitabhängigkeit von AB enthält nur die Frequenz x0. Im quantenmechanischen Bild entspricht dies der Energieerhaltung. Wir haben also elastische Streuung. Sie ist für die Strukturanalyse wichtig. Läßt man dagegen eine zeitabhängige Streudichte R (r, t) zu, so ergeben sich auch Streuwellen mit x j x0. Mit dieser, der inelastischen, Streuung werden wir uns in Abschn. 4.4 beschäftigen. In Beugungsexperimenten zur Strukturaufklärung beobachtet man nicht die Amplitude, sondern die Intensität der Streustrahlung
3:7 I
K / jAB j2 / j R
r e i Kr dr j2 : Wir haben dabei den Streuvektor K = k– k0 eingeführt. Wir sehen, dass die Intensität das Absolutquadrat der FourierTransformierten der Streudichte R (r) bezüglich des Streuvektors K ist. Daraus gewinnen wir eine wichtige Erkenntnis: Je kleiner die Strukturen sind, die durch Beugungsexperimente aufgelöst werden sollen, desto größer muss K, also auch der k-Vektor der verwendeten Welle, sein. Bei Strukturuntersuchungen von Festkörpern muss also die Wellenlänge in etwa der Gitterkonstanten entsprechen. Die Unmöglichkeit für solche Wellen, die Amplitude als Funktion von Ort und Zeit anstelle der Intensität zu messen, macht die wesentli-
54
3. Die Beugung an periodischen Strukturen
che Schwierigkeit der Strukturanalyse aus. Könnte man statt der Intensität die Amplitude beobachten, so könnte man von der Umkehrung der Fourier-Transformation Gebrauch machen und die örtliche Verteilung der Streudichte unmittelbar dem Beugungsbild entnehmen. Da man aber auf die Beobachtung der Intensitäten beschränkt ist, kann man wegen der verlorengegangenen Information über die Streuphasen die örtliche Verteilung der Streudichte aus den beobachteten Intensitäten nicht ohne weiteres berechnen. Zur Ermittlung einer Struktur ist man darauf angewiesen, für einen bestimmten Strukturvorschlag die Beugungsintensitäten zu berechnen, mit den experimentellen Ergebnissen zu vergleichen und die Strukturparameter so lange zu variieren, bis optimale Übereinstimmung mit den experimentellen Ergebnissen besteht. Eine gewisse Hilfe bei Strukturanalysen ist die sogenannte Patterson-Funktion. Sie ist die Fourier-Transformierte der Intensität. Um die Bedeutung dieser Patterson-Funktion zu verstehen, schreiben wir Gl. (3.7) für die Intensität noch etwas anders 0 I
K / R
r e i K r dr R
r 0 ei K r dr 0 :
3:8 Da die Integrale über den ganzen Raum zu nehmen sind, kann man im zweiten Integral die Variable r ' durch r '+ r ersetzen. Damit erhält man 0
3:9 I
K / ei K r dr 0 R
rR
r 0 r dr : Die Autokorrelationsfunktion der Streudichte P
r 0 R
r R
r 0 rdr
3:10
ist die Patterson-Funktion. Sie hat Maxima dort, wo r ' einem Vektor zwischen zwei Atomen in der Struktur entspricht. Besonders deutliche Maxima kann man für Vektoren erwarten, die von einem Atom mit großem Streuquerschnitt zu einem anderen Atom mit großem Streuquerschnitt zeigen. Mit Hilfe der Patterson-Funktion P (r ') lässt sich auch die Streuung an ungeordneten Systemen, also Flüssigkeiten und amorphen Festkörpern, behandeln. Wir zerlegen dazu die Streudichte R (r) in die Beiträge einzelner Atome. Der Einfachheit halber nehmen wir an, dass alle Atome von einer Sorte sein sollen. Die Streudichte um ein Atom i werde mit Rat (r–ri) bezeichnet X Rat
r ri :
3:11 R
r i
Mit dieser Zerlegung kann die Patterson-Funktion P (r ') in zwei Anteile aufgespalten werden: Ein Teil beschreibt die Korrelation eines Atoms mit sich selbst und der andere die Korrelation mit allen anderen Atomen
3.1 Die allgemeine Beugungstheorie
P
r 0
X
Rat
r
ri Rat
r
rj r 0 dr
Rat
r
ri Rat
r
ri r 0 dr
55
i; j
X i
X
Rat
r
X ri Rat
r
3:12
rj r 0 dr :
j6i
i
Die physikalische Aussage über die Struktur des Systems ist in dem zweiten Term von (3.12) enthalten. Wir wollen jetzt zusätzlich voraussetzen, dass die Atome nahezu punktförmige Streuer sind. Diese Annahme ist besonders gut für Neutronenstrahlung erfüllt (siehe auch Abschn. 3.7 und I.3). Das erste Integral liefert dann nur bei r0 0 einen Beitrag. Wir können das Integral also durch f 2 d0;r0 ersetzen mit d0;r0 dem Kronecker Symbol und f dem „Atomfaktor“, der die Stärke der Streuamplitude eines Atoms angibt. Die Summe über alle Atome i kann dann durch Multiplikation mit der Zahl der Atome N ersetzt werden. Das zweite Integral in (3.12) verschwindet für r0 0, da offensichtlich die Wahrscheinlichkeit, dass sich ein zweites Atom j am Orte eines anderen Atoms i befindet, Null sein muss. Wir wollen jetzt zusätzlich annehmen, dass das System ungeordnet, aber im Mittel homogen ist. Wegen der vorausgesetzten Unordnung ist von jedem Atom i aus betrachtet die umgebende Streudichte im Mittel gleich und sie* hängt nicht vom + Winkel ab. Der Mittelwert P der Summe R
r Rat
r rj hängt deshalb nur vom Abj6i
stand r von dem Atom ab, dessen Umgebung betrachtet wird. Damit erhält man für die Patterson-Funktion
3:13 P
r 0 Nf 2 d0;r0 N R
rR
r r0 dr : Es ist zweckmäßig eine Funktion g
r0 einzuführen, die unabhängig von Streuamplitude und Dichte ein Maß nur für die Paarkorrelation der Atome ist. Der Grenzwert von g
r0 für r0 ! 1 soll eins sein. Für große Entfernungen vom Aufatom hat die mittlere Streudichte den Wert lim R
r r0 Nf =V mit V dem Volumen. 0 r !1
Wir definieren deshalb g
r 0 durch
N 2 f g
r 0 R
r R
r r 0 dr :
3:14 V Nach Einsetzen von (3.14) und (3.13) in (3.9) erhält man für die Streuintensität I (K) N g
r e i K r d r :
3:15 I
K / S
K 1 V S (K) wird als Strukturfaktor bezeichnet. Die Paarkorrelationsfunktion g (r) lässt sich aus der Fourier-Transformation von S (K )–1 berechnen. Dabei ergibt sich allerdings noch eine technische Schwierigkeit. Der homogene Anteil von g (r ) für große r führt zu einer
Abb. 3.2. Paarkorrelationsfunktion für amorphes Silizium und flüssiges Eisen bei einer Temperatur von T = 1833 K [3.4, 3.5]. Die Abstände von nächsten, übernächsten und drittnächsten Nachbarn für kristallines Silizium sind als r1 (Si), r2 (Si) und r3 (Si) markiert, die entsprechenden Abstände von kristallinem Eisen (mit kubisch flächenzentrierter Struktur) als r1 (Fe) und r2 (Fe)
Paarkorrelationsfunktion g(r)
56
3. Die Beugung an periodischen Strukturen
6
r1(Si)
flüssiges Fe amorphes Si
5 4
r1(Fe)
3
r2(Fe) r2(Si) r3(Si)
2 1 0
2
4
6
8
10
°˚ ) Radius Radiusrr(A (A)
Vorwärtsstreuung bei K = 0. Dieser Anteil ist experimentell nicht vom Primärstrahl zu trennen. Deshalb ermittelt man aus den experimentellen Daten ohne Vorwärtsstreuung zunächst eine Funktion h (r) = g (r ) –1, die sich aus der Fourier-Transformation des Strukturfaktors ohne Vorwärtsstreuung ergibt (Übung 3.7). Abbildung 3.2 zeigt zwei Beispiele für die Paarkorrelationsfunktion g (r). Die gestrichelte und die durchgezogene Linie stellen g (r) für flüssiges Eisen und amorphes Silizium dar. Das erste Maximum entspricht dem Abstand nächster Nachbarn. Aus der Schärfe der Verteilung um diesen Abstand sehen wir, dass der Abstand der nächsten Nachbarn auch für strukturell ungeordnete Systeme gut definiert ist. Auch die mittleren Abstände weiterer Nachbarn sind noch gut erkennbar. Hier zeigt sich jedoch ein charakteristischer Unterschied zwischen dem amorphen und dem flüssigen Zustand. Im amorphen Zustand sind die Abstände übernächster Nachbarn noch praktisch gleich wie im kristallinen Zustand. Erst bei den drittnächsten Nachbarn macht sich die geringere Dichte des amorphen Zustandes bemerkbar. Bei Flüssigkeiten liegt das zweite Maximum bei etwa dem doppelten Abstand der nächsten Nachbarn, also bei einem wesentlich höheren Abstand als es z. B. dem Abstand übernächster Nachbarn in einer dichtesten Kugelpackung entspräche. Nur durch diesen größeren Abstand der zweitnächsten Nachbarn lässt sich ein flüssiger Zustand realisieren, wie sich leicht an einem Kugelmodell demonstrieren lässt (Übung 3.7).
3.2 Periodische Strukturen und reziprokes Gitter
57
3.2 Periodische Strukturen und reziprokes Gitter Für periodische Strukturen lässt sich R (r) in eine Fourier-Reihe entwickeln. Wir betrachten zunächst den eindimensionalen Fall, wobei sich R (x) mit einer Periode a wiederholen soll R
x R
x n a
n 0; 1; 2; ::: :
3:16
Dann lautet die entsprechende Entwicklung in eine Fourier-Reihe X R
x Rn ei
n 2 p=a x :
3:17 n
Es ist leicht zu sehen, dass die Verschiebung um einen beliebigen Gittervektor xm = ma wieder zum selben R (x) führt, die vorausgesetzte Translationsinvarianz also gegeben ist. Die entsprechende Erweiterung auf den dreidimensionalen Fall ist X R
r RG ei G r ;
3:18 G
wobei an den Vektor G bestimmte Bedingungen geknüpft werden müssen, damit die Translationsinvarianz von R bezüglich aller Gittervektoren rn n1 a1 n2 a2 n3 a3
3:19
gegeben ist. Es muss nämlich gelten G rn 2 p m
3:20
mit einer ganzen Zahl m für alle Werte von n1, n2, n3. Wir zerlegen auch G nach zunächst nicht festgelegten Basisvektoren gi, G h g1 k g2 l g3
3:21
mit ganzen Zahlen h, k, l. Die Bedingung (3.20) besagt dann z. B. für den Fall n2 = n3 = 0:
h g1 k g2 l g3 n1 a1 2 p m :
3:22
Das ist für beliebige n1 nur zu erfüllen, wenn g1 a1 2 p
und g2 a1 g3 a1 0
3:23
ist. Allgemein ausgedrückt muss also gelten gi aj 2 p dij :
3:24
Die damit definierte Basis g1, g2, g3 spannt das sogenannte reziproke Gitter auf. Das reziproke Gitter ist jedem Gitter eindeutig zugeordnet. Seine Gitterpunkte werden durch die Zahlen h, k, l bezeichnet. Die Konstruktionsvorschrift ergibt sich unmittelbar aus (3.24): Der Vektor des reziproken Gitters g1 steht senkrecht auf der von den Vektoren a2 und a3 aufgespannten Ebene und sein Betrag ist 2 p/[a1 cos 0. Dieser nach Heisenberg benannte Hamilton-Operator ist Ausgangspunkt vieler Modelltheorien zum Magnetismus, soweit er verstanden werden kann im Modell einer jeweils paarweisen Kopplung zwischen Elektronen. Dies ist aber gerade bei den typischen Ferromagneten, den 3 d-Übergangsmetallen Ni, Co und Fe, nicht der Fall. Wir benötigen also über den Heisenberg-Operator hinaus noch die Beschreibung einer kollektiven Austauschwechselwirkung. Wir werden sie am Beispiel des freien Elektronengases studieren.
8.3 Austauschwechselwirkung zwischen freien Elektronen Während die Austauschwechselwirkung bei der Elektronenpaarbindung negativ ist, erhält man für freie Elektronen eine positive Austauschwechselwirkung. Dies lässt sich durch die Betrachtung zweier freier Elektronen i und j und ihrer Paarwellenfunktion Wij zeigen. Für Elektronen mit gleichem Spin muss die Paarwellenfunktion in den Ortskoordinaten antisymmetrisch sein. Die Antisymmetrisierung ergibt 1 W ij p
ei ki ri ei kj rj ei ki rj ei kj ri 2V 1 i
ki ri kj rj
1 e i
ki kj
ri p e 2V
rj
:
8:29
Dann ist die Wahrscheinlichkeit, das Elektron i in einem Volumenelement dri und das Elektron j in einem Volumenelement drj zu finden, gleich |w|ij2 dri drj: 1 1 cos
ki kj
ri rj dri drj :
8:30 V2 An diesem Ausdruck sieht man schon alles Wesentliche: Die Wahrscheinlichkeit, zwei Elektronen mit gleichem Spin am gleichen Ort zu finden, verschwindet für beliebige ki, kj . Dadurch können für ein bestimmtes Aufelektron die übrigen Elektronen mit gleichem Spin das Coulomb-Potential der Ionenrümpfe lokal nicht mehr so gut abschirmen, was eine Absenkung der Energie für das Aufelektron zur Folge hat. Dieser Absenkungseffekt wird verstärkt, wenn ein möglichst hoher Prozentsatz aller Elektronen den gleichen Spin wie das Aufelektron hat. Im Endeffekt ergibt sich so ein Energiegewinn für eine Einelektronenenergie bei paralleler Spinstellung und eine Art kollektiver Austauschwechselwirkung mit positivem Vorzeichen. jW ij j2 dri drj
8.3 Austauschwechselwirkung zwischen freien Elektronen
199
Bevor wir diesen Gedanken im Hinblick auf eine modellmäßige Beschreibung des Ferromagnetismus weiter ausbauen, ist es ganz nützlich, die kombinierte Aufenthaltswahrscheinlichkeit (8.30) noch etwas weiter zu betrachten. Wir können aus (8.30) zu einer über die k-Abhängigkeit gemittelten Wahrscheinlichkeit gelangen, indem wir über die Fermi-Kugel integrieren. Wir führen dazu die Relativkoordinate zwischen den Elektronen i und j mit r = ri – rj ein. Wir nehmen weiter das Aufelektron bei r = 0 an und fragen nach der Wahrscheinlichkeit, dass ein zweites mit gleichem Spin im Abstand r im Volumenelement dr zu finden ist. Diese Wahrscheinlichkeit ist dann P
r"" dr n" dr1
cos
ki
kj r
8:31
mit n: der Elektronenkonzentration der gleichen Spinorientierung, welche halb so groß ist wie die Gesamtkonzentration n der Elektronen. Statt der Wahrscheinlichkeit können wir auch von einer für das Aufelektron wirksamen Elektronendichte sprechen, die wir wegen ihrer Herkunft von der Austauschwechselwirkung mit Rex (r) bezeichnen, en Rex
r 1 cos
ki kj r mit n" n=2 :
8:32 2 Führen wir nun die Mittelung über die Fermi-Kugel aus, so erhalten wir Rex
r
en 1 2 2
en6 6 61 2 4
cos
ki
kj r
3
1 1 i
k 2 dki dkj
e i 2 4p 3 kF 3
kj r
e
i
ki kj r
7 7 7 : 5
8:33 a 1
0 enB B Rex
r B1 2 @
1
dki e 4p 3 2 k 3 F
i ki r
C C dkj ei kj r C : A
Diese Integrale sind analog zu (3.40) lösbar ! en
sin kF r kF r cos kF r2 Rex
r 1 9 : 2
kF r6
8:33 b
8:34
Die Gesamtladungsdichte, die ein freies Elektron sieht, ist diese Summe aus der Ladungsdichte der Elektronen mit gleichem Spin und der homogenen Ladungsdichte e n/2 der Elektronen mit umgekehrtem Spin, für die der Ortsteil der Wellenfunktion symmetrisch, also unverändert bleibt, d. h.
200
8. Magnetismus
Abb. 8.4. Effektive Ladungsdichte, die ein Elektron in einem Elektronengas „sieht“. Durch Austauschwechselwirkung ist die Dichte von Elektronen gleicher Spinorientierung in der Nähe des Aufelektrons reduziert („Austauschloch“). Bewegt sich das Aufelektron, so muß es das Austauschloch mitschleppen, wodurch sich seine effektive Masse (s. Abschn. 9.1) erhöht. Außerdem aber bedeutet die Existenz des Austauschloches eine positive Austauschkopplung. Dadurch erhalten wir ein Modell für den Ferromagnetismus von Bandelektronen
Reff
r e n 1
9
sin kF r kF r cos kF r2 2
kF r6
! :
8:35
Diese Ladungsdichte ist in Abb. 8.4 aufgetragen. Die Elektronendichte ist um r = 0 reduziert als Folge der Austauschwechselwirkung. Dadurch entsteht ein „Austauschloch“, dessen Größe etwa durch den zweifachen reziproken Fermi-Vektor gegeben ist. Nach Ta˚ . Wir können die effektive belle 6.1 ist der Radius also etwa 1–2 A Ladungsdichte Reff (r) dazu benutzen, eine neue („renormierte“) Schrödinger-Gleichung für das freie Elektronengas aufzustellen und würden damit zur Hartree-Fock-Näherung gelangen. Wir bedenken aber, dass die Elektron-Elektron-Korrelation durch (8.35) nicht richtig wiedergegeben wird, da die Coulomb-Wechselwirkung eigentlich auch den Aufenthalt zweier Elektronen mit verschiedenem Spin am gleichen Ort verbietet. Auch ist die durch (8.30) ausgedrückte Korrelation von zwei Elektronen, die beliebig weit voneinander entfernt sind, ein unrealistisches Ergebnis des Ansatzes ebener Wellen.
8.4 Das Bandmodell für den Ferromagnetismus Wir wollen nun mit der qualitativ festgestellten Renormierung der Einelektronenterme durch die Korrelation von Elektronen mit gleichem Spin ein einfaches Bandmodell des Ferromagnetismus aufbauen. Das Modell geht auf Stoner und Wohlfarth zurück. Wir machen für die renormierten Einelektronenenergien den Ansatz E"
k E
k E#
k E
k
I n" =N ; I n# =N ;
(8.36)
8.4 Das Bandmodell für den Ferromagnetismus
201
E (k) sind die Energiewerte einer normalen Einelektronenbandstruktur, n: und n; die Anzahl der Elektronen mit entsprechendem Spin und N ist die Zahl der Atome. Der nach Stoner benannte Parameter I beschreibt die durch die Elektronenkorrelation bewirkte Energieabsenkung. Die Abhängigkeit vom Wellenzahlvektor sei in diesem Modell vernachlässigt. Wir führen jetzt den relativen Überschuss der Elektronen einer Spinsorte mit R
n"
n#
8:37
N
ein. Diese Größe ist bis auf den Faktor lB (N/ V) gleich der Magnetisierung M (8.3). Ferner ziehen wir von den Einelektronenenergien zwecks einer bequemen Schreibweise I (n:+n;)/2 N ab und erhalten statt (8.36) ) E"
k E~
k I R=2 mit E~
k E
k I
n" n# =2N : E#
k E~
k I R=2
8:38 Das Gleichungspaar (8.38) demonstriert eine k-unabhängige Aufspaltung der Energiebänder mit verschiedenem Spin. Die Unabhängigkeit der Austauschaufspaltung ist natürlich nur eine Näherung. Sie ist aber auch nach neueren Theorien etwa innerhalb eines Faktors zwei gegeben. Die Größe der Aufspaltung hängt von R, also von der relativen Besetzung der Subbänder ab. Die Besetzungswahrscheinlichkeit wird aber durch die Fermi-Statistik vorgegeben. So gelangen wir zu einer Selbstkonsistenzbedingung: R
1X f"
k N k 1X N
k
e
f#
k 1
1
k
E~
k I R=2 EF = T
1
e
k
E~
kI R=2 EF = T
1
:
8:39
Diese Gleichung hat unter bestimmten Bedingungen eine nicht verschwindende Lösung für R, d. h. es existiert ein magnetisches Moment ohne angelegtes Feld und damit Ferromagnetismus. Man kann ein Kriterium für das Auftreten von Ferromagnetismus angeben. Dazu entwickeln wir die rechte Seite der Gleichung nach kleinen R unter Beachtung, dass Dx Dx 2 Dx 3 000 0 f x f x f
xDx f
x
8:40 2 2 3! 2 ist, d. h. R
1 X @f
k IR N k @E~
k
1 1 X @ 3 f
k
I R3 : 3 ~ 24 N k @E
k
8:41
202
8. Magnetismus
Dabei ist die erste Ableitung der Fermi-Funktion kleiner als Null, während die dritte Ableitung größer als Null ist. Die Bedingung für Ferromagnetismus (R > 0) ist also I X @f
k 1 >0:
8:42 N k @E~
k Die Ableitung der Fermi-Funktion @f =@E~ hat offensichtlich (Abb. 6.6) ihren größten Wert bei T ? 0. Wenn die Bedingung (8.42) also überhaupt erfüllt wird, dann am leichtesten bei T = 0. Für den Fall T = 0 können wir aber den Wert der Summe über alle k-Werte einfach berechnen
1 X @f
k V @f dk N k @E~
k
2 p3 N @E~
V 1 1V D
EF :
8:43 dk d
E~ EF 3 N 2N
2 p Hierbei wurde berücksichtigt, dass bei T = 0 die Fermi-Funktion eine Stufenfunktion ist und deshalb die Ableitung @f =@E~ gleich der d-Funktion d
E~ EF ist. Der Faktor 1/2 rührt daher, dass gemäß (8.39) und (8.41) die Summe über k und also auch das Integral sich nur über die Elektronen einer Spinsorte erstreckt, während mit der üblichen Definition der Zustandsdichte die Zahl der Elektronen mit positivem und negativem Spin pro Volumen gemeint ist. Die Summe ist also gleich der halben Zustandsdichte für Elektronen am Fermi-Niveau, wenn diese nicht auf das Volumen, sondern auf die Zahl der Atome bezogen ist. Wir führen die Zustandsdichte pro Atom und Spinsorte ein durch V D~
EF D
EF
8:44 2N Die Bedingung, dass überhaupt Ferromagnetismus auftritt, bedeutet dann einfach ID~
EF > 1 :
8:45
Dies ist das sog. Stoner-Kriterium für das Auftreten von Ferromagnetismus. Unter der Voraussetzung, dass dieses Kriterium erfüllt ist, liefert (8.42) auch die Temperatur, bei der das magnetische Moment verschwindet (Curie-Temperatur), wenn man (8.42) als Gleichung statt als Ungleichung liest. Damit werden wir uns im nächsten Abschnitt befassen. Die Abb. 8.5 zeigt den Stoner-Parameter, die Zustandsdichte und das Produkt aus beiden nach einer theoretischen Behandlung durch Janak [8.2]. Die Theorie sagt richtig nur für die Elemente Fe, Co, Ni ferromagnetisches Verhalten voraus. Für die Elemente der 4 d-Reihe sind sowohl die Zustandsdichte als auch der Stoner-Parameter zu klein, um einen ferromagnetischen Zustand zu erreichen. Trotzdem kommt es zu einer nicht unerheblichen Verstärkung der magnetischen Suszeptibilität durch
8.4 Das Bandmodell für den Ferromagnetismus
203
Abb. 8.5. (a) Integral der Austauschkorrelation (Stoner-Parameter) I als Funktion der Ordnungszahl (nach Janak [8.2]). (b) Zustandsdichte pro Atom D~ (EF); (c) das Produkt aus Zustandsdichte D~ (EF) und Stoner-Parameter I. Die Elemente Fe, Co und Ni mit Werten von ID~ (EF > 1) zeigen Ferromagnetismus. Die Elemente Ca, Sc und Pd kommen einer ferromagnetischen Kopplung schon recht nahe
die positive Austauschwechselwirkung zwischen den Bandelektronen. Bei äußerem Magnetfeld B0 hat man in (8.39) zusätzlich zur Austauschaufspaltung um IR/2 eine Aufspaltung um lB B0. Aus (8.41) wird dann in erster Näherung für R bei T = 0 R D~
EF
I R 2lB B0 : Somit erhält man für die Magnetisierung M N N M lB R D~
EF I M 2l2B B0 V V N D~
EF B0 : M 2l2B V 1 I D~
EF
8:46
8:47
Der Zähler ist gerade die normale Pauli-Suszeptibilität von Bandelektronen (8.15), die aber nun durch den Nenner erheblich verstärkt ist. Bezeichnen wir die Pauli-Suszeptibilität mit v0, so erhält man
204
8. Magnetismus
v
v0 : I D~
EF
1
8:48
Janak [8.2] berechnete für den Faktor v/v0 Werte bis zu ca. 4,5 (Ca), 6,1 (Sc) oder 4,5 (Pd). Zusammen mit der an sich schon hohen Zustandsdichte ergeben sich also vergleichsweise große Werte für die Suszeptibilität dieser Elemente. Ein direkter Vergleich mit dem Experiment müsste allerdings den Magnetismus durch Bahnmomente mit berücksichtigen. In jedem Fall gilt aber, was schon vorher gesagt wurde, nämlich dass v1 ist.
8.5 Das Temperaturverhalten eines Ferromagneten im Bandmodell Wir wollen uns jetzt der Temperaturabhängigkeit der Sättigungsmagnetisierung eines Ferromagneten zuwenden. Dazu könnte man (8.39) unter Zuhilfenahme einer Einelektronen-Bandstrukturrechnung auswerten. Der damit verbundene mathematische Aufwand lohnt allerdings nicht: Die k-unabhängige und delokale Berücksichtigung der Austauschwechselwirkung liefert keine Aussagen von quantitativem Wert. Ein qualitatives Bild des Temperaturverhaltens lässt sich aber auch mit einer stark vereinfachten Zustandsdichte gewinnen, die die Rechnungen auf ein Minimum beschränkt. Werfen wir einen Blick auf die Zustandsdichte von Ni (Abb. 8.6 a) gemäß einer Bandstrukturrechnung von Callaway und Wang [8.3]: Der größte Beitrag zur Zustandsdichte am Fermi-Niveau wird von den d-Elektronen geliefert, einmal wegen ihrer großen Zahl (9,46 pro Atom, s. u.), zum anderen, weil das d-Band nur ca. 4 eV breit ist (im Gegensatz zum sBand). Hinzu kommt, dass die Austauschaufspaltung für s-Elektronen klein ist. Die unterschiedliche Besetzung der d-Bänder für Majoritätsspin und Minoritätsspin führt also zur Magnetisierung. Bei T = 0 ist diese bei Nickel einfach durch die Zahl der nichtbesetzten d-Zustände des Minoritätsbandes gegeben. Aus der gemessenen Magnetisierung bei T = 0 errechnet sich so die Zahl der d-Löcher zu 0,54 pro Atom für das Beispiel Nickel, also ein effektives magnetisches Moment von lBeff*0,54 lB pro Atom. Der Verlauf der Magnetisierung mit der Temperatur und der Curie-Punkt, an dem die Magnetisierung verschwindet, ergibt sich aus dem Zusammenspiel von Austauschaufspaltung, Fermi-Statistik und der Zustandsdichte in der Nähe des Fermi-Niveaus gemäß (8.39). Für eine qualitative Diskussion von (8.39) brauchen wir nicht den tatsächlichen Verlauf der Zustandsdichte zu verwenden, sondern es genügt, die scharfen Spitzen der Zustandsdichte an der oberen Kante des d-Bandes durch eine dFunktion in der Energie zu symbolisieren (Abb. 8.6 b). Wenn wir zusätzlich zur Austauschaufspaltung noch eine Feldaufspaltung wie in (8.46) mitnehmen, wäre unsere Modellzustandsdichte also
8.5 Das Temperaturverhalten eines Ferromagneten im Bandmodell
205
Abb. 8.6. (a) Errechnete Zustandsdichte von Nickel (nach Callaway und Wang [8.3]). Die Austauschaufspaltung beträgt nach diesen Rechnungen etwa 0,6 eV. In der Photoelektronenspektroskopie wurde ein Wert von ca. 0,3 eV bestimmt. Allerdings sind beide Werte nur bedingt vergleichbar, da ein photoemittiertes Elektron ein Loch hinterläßt, der Festkörper also in einem angeregten Zustand verbleibt. Der Abstand D zwischen der Oberkante des d-Bandes der Majoritätsspin-Elektronen und der Fermi-Energie heißt auch Stoner-Energielücke. Im Bild der Bandstruktur ist dies die minimale Energie für einen SpinUmklapp-Prozeß (die s-Elektronen werden in dieser Betrachtung nicht mit berücksichtigt). (b) Modellzustandsdichte zur Beschreibung des thermischen Verhaltens eines Ferromagneten
D~
E
lBeff d
E lB
EF
lB B0
IR=2d
E
EF lB B0 IR=2 :
8:49
Da die Zustände für Majoritätsspin und Minoritätsspin in diesem Modell gleiches Gewicht haben, liegt das Fermi-Niveau immer auf der Mitte zwischen beiden Termen, was wir durch den Ansatz bereits zum Ausdruck gebracht haben. Anstelle von (8.39) erhalten wir ! lBeff 1 1 R :
8:50 lB
l B IR=2=k T
l B IR=2=k T e B 0 1 e B 0 1 Für diese Gleichung suchen wir zunächst ferromagnetische Lösungen, also Lösungen mit R = 0 bei B0 = 0. Mit den Abkürzungen Tc = I lBeff /lB 4 k und R~ = lB /lBeff R wird aus (8.50) 1 1 R~Tc
8:51 tanh R~ 2R~ T =T ~ c T: 1 e2R Tc =T 1 e Grenzlösungen dieser Gleichung sind R~ = 1 für T = 0 und R~ = 0 für T = Tc. Tc ist also die schon eingeführte Curie-Temperatur, oberhalb der die spontane Magnetisierung verschwindet. Den Verlauf im ganzen Temperaturbereich zeigt Abb. 8.7. Da die Magnetisierung M pro-
206
8. Magnetismus
Abb. 8.7. Verlauf der Magnetisierung eines Ferromagneten unterhalb der Curie-Temperatur Tc. Experimentelle Werte für Nickel nach Weiss [8.4, 8.5]
portional zu R ist, sollte Abb. 8.7 den Temperaturverlauf der spontanen Magnetisierung eines Ferromagneten wiedergeben. Die Übereinstimmung mit dem experimentellen Verlauf ist auch ganz passabel (Abb. 8.7). Für die Grenzfälle T Tc und T*Tc lassen sich durch Entwicklung der rechten Seite von (8.51) Grenzverläufe angeben: R~ 1
2e p R~ 3 1
2Tc =T
T Tc
1=2
T Tc ; T Tc ; R~ 1 mit
8:52 tanh x x
1 3 x ... : 3
8:53
Beide Gleichungen werden vom Experiment jedoch nicht bestätigt. Der kritische Exponent in der Nähe des Curie-Punktes ist 1/3 (Abb. 8.8) und nicht 1/2. Der Verlauf bei tiefen Temperaturen wird auch durch (8.52) nicht korrekt wiedergegeben. Das liegt daran, dass es neben dem Umklappen eines Spins durch Umbesetzung in den Bändern im Ferromagneten noch andere elementare Anregungen mit kleinerer Quantenenergie gibt, die ebenfalls einen Spin umklappen (Abschn. 8.8). Oberhalb der Curie-Temperatur erhält man aus (8.50) eine Magnetisierung nur, wenn das B0-Feld ungleich Null ist. Wir können die Fermi-Funktion für kleine R und B0 entwickeln l Tc R~ B B0 R~ bzw: T kT
8:54
l R~ B
8:55
k
1 T
Tc
B0 :
8.5 Das Temperaturverhalten eines Ferromagneten im Bandmodell
207
Abb. 8.8. Verlauf der Magnetisierung in der Nähe des Curiepunktes. Experimentelle Werte für Nickel nach Weiss [8.4, 8.5]. Der kritische Exponent in der Nähe des Übergangs in die paramagnetische Phase oberhalb des Curie-Punktes beträgt 1/3 und nicht 1/2 wie unser einfaches Modell vorhersagt
Die paramagnetische Suszeptibilität oberhalb von Tc sollte also mit Annäherung an Tc entsprechend dem Gesetz v
C T
Tc
8:56
divergieren. Dies ist das sog. Curie-Weiss-Gesetz mit C der CurieWeiss-Konstanten. Das Curie-Weiss-Gesetz ist experimentell für T Tc erfüllt. Mit Annäherung an Tc ergeben sich aber Abweichungen, die besser durch eine Zunahme proportional mit (T–Tc)–4/3 beschrieben werden. Nach unserem Modell ist die Curie-WeissKonstante C mit der Sättigungsmagnetisierung bei T = 0 verknüpft. Dieser Zusammenhang würde aber zu kleine Werte für C liefern. Ferner könnten wir versuchen, die Verknüpfungen zwischen dem Stoner-Parameter I und der Curie-Temperatur Tc (im Modell hier: Tc = I lBeff /4 lB k ) zu benutzen, um Tc aus einem gemessenen Wert der Austauschaufspaltung abzuschätzen. Dieses Verfahren würde viel zu große Werte von Tc liefern. Das Versagen unseres einfachen Modells in diesem Punkt liegt jedoch nicht an der hier verwendeten einfachen Bandstruktur sondern ist darin begründet, dass unser Modell die Anregungszustände nicht korrekt behandelt. Das Curie-Weiss-Gesetz, ebenso wie die Abhängigkeit der spontanen Magnetisierung von der Temperatur, wird auch häufig in einer Molekularfeld-Näherung hergeleitet, bei der die Austauschwechselwirkung durch ein mittleres „inneres“ Feld ersetzt wird. Die hier gewählte Herleitung, die im Prinzip auf E. C. Stoner zurückgeht, ist der Molekularfeld-Näherung insoweit äquivalent, als sie örtliche Variationen der Spinverteilung nicht zulässt. Deutlicher als die Molekularfeld-Näherung beleuchtet unsere Betrachtung aber den Zusammenhang mit der Bandstruktur.
208
8. Magnetismus
8.6 Ferromagnetische Kopplung bei lokalisierten Elektronen Während das magnetische Verhalten von d-Übergangs-Metallen im Bandmodell beschrieben wird, ist das in Abschn. 8.2 entwickelte Bild der Austauschwechselwirkung zwischen lokalisierten Elektronen besonders für die seltenen Erden mit ihren partiell gefüllten fSchalen und für die vielen ionischen Verbindungen der d- und fÜbergangselemente geeigneter. Ausgangspunkt ist der in (8.28) für die Austauschwechselwirkung zwischen zwei Elektronen eingeführte Heisenbergsche Hamilton-Operator. Der folgenden modellmäßigen Behandlung des Ferromagnetismus wollen wir eine primitive Struktur von Atomen mit je einem ungepaarten Elektron mit Bahndrehimpuls Null zugrunde legen. Dieses Modell eines Spingitters zeigt die wesentlichen Konsequenzen der Austauschkopplung. Unter Berücksichtigung eines zusätzlichen äußeren Magnetfeldes B0 erhält man dann für den Hamilton-Operator X XX H J i d Si Si d g lB B0 Si :
8:57 i
i
d
Dabei läuft der Index i über alle Atome und der Index d jeweils über alle Nachbarn, mit denen Austauschwechselwirkung besteht. Leider ist der Heisenberg-Operator ein nicht-linearer Operator. Lösungen lassen sich deshalb nur in speziellen Fällen oder bei Einführung einer linearisierenden Näherung angeben. Eine solche Näherung ist die Molekularfeldnäherung, die jetzt besprochen werden soll. In der Molekularfeldnäherung ersetzt man das Operatorprodukt in (8.57) durch das Produkt des Spinoperators Si mit dem Erwartungswert des Spinoperators der Nachbarn h Si di. Der HamiltonOperator in der Molekularfeldnäherung lautet also ! X X H MF
8:58 Si J i d hSi d i g lB B0 : i
d
Die Austauschwechselwirkung erhält damit den Charakter eines inneren Feldes 1 X BMF J i d hSi d i :
8:59 g lB d Für homogene Systeme (ohne Oberfläche) ist h Si di für alle Atome gleich. Der Mittelwert h Si di hSi lässt sich durch die Magnetisierung ausdrücken N hSi
8:60 V mit N/V der Anzahl der Atome pro Volumen. Wir erhalten damit für das Molekularfeld BMF
M g lB
8.6 Ferromagnetische Kopplung bei lokalisierten Elektronen
BMF
V mJ M ; Ng2 l2B
209
8:61
wobei wir uns noch zusätzlich auf die Austauschkopplung zwischen den m nächsten Nachbarn beschränkt haben. Der HamiltonOperator in der Molekularfeldnäherung (8.58) ist jetzt mathematisch identisch mit dem Hamilton-Operator von N unabhängigen Spins in einem effektiven Magnetfeld Beff = BMF+B0. Seine Energieeigenwerte sind E 12 g lB Beff
8:62
für jeden Elektronenspin. Wir bezeichnen die Anzahl der Elektronen in den beiden Zuständen mit dem Spin parallel bzw. antiparallel zum B-Feld mit N : und N ;. Im thermischen Gleichgewicht ist dann N# e N"
k
g lB Beff = T
8:63
und damit die Magnetisierung
1 N" N# 1 N 1 g lB tanh g lB Beff =k T : M g lB 2 V 2 V 2
8:64
Diese Gleichung zusammen mit (8.61) hat Lösungen mit von Null verschiedener Magnetisierung auch ohne äußeres Magnetfeld, wenn J > 0 ist, also bei ferromagnetischer Kopplung der Elektronenspins. Mit den Abkürzungen Ms
N1 gl V 2 B
8:65
und
Tc 14 m J=k
8:66
erhalten wir ohne äußeres Magnetfeld B0 aus (8.61 und 8.64) Tc M :
8:67 M
T=Ms tanh T Ms Diese Gleichung ist äquivalent zu (8.51). Das bedeutet, dass der Temperaturverlauf der Magnetisierung im Bandmodell und im Modell lokalisierter Elektronen gleich ist. Für T ? 0 und T & Tc ergeben sich aber wiederum M
T Ms
1
2e
p M
T=Ms 3 1
2Tc =T
T Tc
;
T Tc
8:68
T Tc :
8:69
1=2 ;
Tc hängt nur von der Stärke der Austauschkopplung und der Zahl der nächsten Nachbarn ab. Der kritische Exponent in (8.69) hängt interessanterweise nicht von der Dimension ab. Ein ebenes Gitter hätte
210
8. Magnetismus
den gleichen kritischen Exponenten in der Molekularfeldnäherung. Allerdings wäre wegen der geringeren Zahl der nächsten Nachbarn Tc kleiner. Das führt zu einem interessanten Verhalten der Magnetisierung in der Nähe der Oberfläche eines Ferromagneten (Tafel VII). In der Molekularfeldnäherung verschwindet bei Tc sowohl die Magnetisierung als auch die lokale Ordnung der magnetischen Momente. In Wirklichkeit bleibt jedoch eine gewisse lokale Ordnung erhalten. Die Curie-Temperatur ist lediglich diejenige Temperatur, bei der die magnetische Ordnung auf einer großen Längenskala verschwindet. Für Temperaturen oberhalb von Tc können wir wiederum das Curie-Weiss-Gesetz für die Suszeptibilität herleiten. Mit einem äußeren Feld B0 erhalten wir aus (8.64) mit der Entwicklung (8.68) M
T
g2 l2B N 1 B0 : 4 V k T Tc
8:70
8.7 Antiferromagnetismus Bislang haben wir ferromagnetische Kopplung der Elektronenspins, also J > 0, vorausgesetzt. Eine Reihe von Verbindungen, z. B. die Oxide von Fe, Co und Ni, weisen eine antiferromagnetische Kopplung zwischen den d-Elektronen der Übergangsmetalle auf. Sie besitzen die Struktur von NaCl, d. h. die paramagnetischen dMetallionen und die O2–-Ionen bilden je für sich eine kubisch flächenzentrierte Struktur. Im Zustand einer antiferromagnetischen Ordnung der Metallionen bildet die magnetische Elementarzelle allerdings keine flächenzentrierte Struktur mehr, sondern es stellen sich komplizierte magnetische Überstrukturen ein. Wir betrachten im Rahmen der Molekularfeldnäherung das magnetische Verhalten eines Antiferromagneten mit einer einfachen magnetischen Überstruktur. Die Überstruktur soll so beschaffen sein, dass nächste Nachbarn jeweils einen antiparallelen Spin haben (Abb. 8.9). In einer modellmäßigen Behandlung mit antiferromagnetischer Kopplung (J < 0) können wir (8.60–8.64) jetzt für beide magnetischen Untergitter getrennt wiederverwenden. Wir beachten dabei, dass das Molekularfeld für das Untergitter mit positiver Spinorientierung vom Untergitter der negativen Spins erzeugt wird. Für den antiferromagnetischen Ordnungszustand erhält man dann das Gleichungspaar ! 1 N V M g lB tanh ;
8:71 mJ M V 2 2 k TN g lB ! 1 N V tanh
8:72 m J M ; M g lB V 2 2 k TN g lB
8.7 Antiferromagnetismus
211
Abb. 8.9. (a) Modellkristall mit antiferromagnetischer Orientierung des Spins nächster Nachbarn. (b) Eine ähnlich einfache Spinstruktur, aber mit einem tetragonalen Gitter, wird von den Verbindungen MnF2, FeF2 und CoF2 realisiert. In diesem Fall sind die Atome entlang der c-Achse die nächsten Nachbarn. Wenn die Übergangsmetallionen eine flächenzentrierte Struktur bilden, ist es topologisch nicht möglich, nur antiferromagnetische Orientierung zwischen nächsten Nachbarn zu haben. Entsprechend müssen sich komplexere magnetische Überstrukturen einstellen
wobei M +, M – die Magnetisierung der beiden Spinuntergitter und N + = N – die Anzahl der Metallionen in den jeweiligen Spinuntergittern ist. Im antiferromagnetischen Zustand ist M + = –M – und wir erhalten analog zu (8.67) ! 1 N V
8:73 m J M M g lB tanh V 2 2 k TN g lB und eine entsprechende Gleichung für M –. Die Magnetisierung der Untergitter verschwindet oberhalb einer kritischen Temperatur, die Néel-Temperatur genannt wird. Sie ist analog zum ferromagnetischen Fall TN
1 mJ : 4 k
8:74
Die Néel-Temperatur ist positiv, da jetzt J < 0 ist. Bei der Berechnung der Suszeptibilität müssen wir unterscheiden zwischen den Fällen paralleler und senkrechter Orientierung des äußeren Feldes relativ zur Ausrichtung der Spins, jedenfalls für Temperaturen kleiner als TN. Wir behandeln zunächst den Fall, dass das äußere Feld B0 parallel bzw. antiparallel zu den Spins orientiert ist. Das äußere Feld bewirkt eine geringfügige Abweichung in der Magnetisierung der beiden Spinuntergitter, die wir mit D M+ und D M – bezeichnen wollen. Anstatt (8.71 bzw. 8.72) erhalten wir dann mit zusätzlichem Feld B0 1 N 1 1 tanh g lB M DM g lB V 2 2 kT Vm J ;
8:75
M DM B 0 N g2 l2B
212
8. Magnetismus
1 N 1 1 tanh gl M DM g lB V 2 2 B kT Vm J 2 2
M DM B0 : N g lB
8:76
Wir berücksichtigen, dass M + = –M – und N + = N –:N/2 ist und erhalten durch Entwicklung von (8.75 und 8.76) für kleine DL ±, B0: ! 1 l2B g2 N TN B0 DM DM DM DM mit T cosh2
f 4 k T V
8:77 f
TN M
T T Ms
8:78
und
1 N Ms g lB V 2
8:79
der Sättigungsmagnetisierung eines Spinuntergitters. Für Temperaturen oberhalb der Néel-Temperatur verschwindet die Magnetisierung der Untergitter und f ist gleich Null. Es wird dann auch keine Richtung im Kristall mehr ausgezeichnet, und die Suszeptibilität ist isotrop v
T l0
g2 l2B N 1 : 4 V k T TN
8:80
Wir erhalten also eine Temperaturabhängigkeit ähnlich wie beim Curie-Weiss-Gesetz (8.70), nur dass die kritische Temperatur jetzt mit umgekehrten Vorzeichen erscheint. Bei der Néel-Temperatur selbst bleibt die Suszeptibilität endlich. Für Temperaturen genügend unterhalb der Néel-Temperatur ist M + (T) = M +s und wir erhalten vk
T l0
g2 l2B N 1 ; 2 4 V k T cosh
TN =T TN
8:81
was wir für tiefe Temperaturen weiter nähern können durch vk
T l0
g2 l2B N e V kT
2TN =T
T TN :
8:82
Dieser Ausdruck für die Suszeptibilität gilt jetzt nur noch wie die Gleichungen (8.75, 8.76) für die Orientierung des äußeren Feldes parallel zur Polarisation der Spinuntergitter. Für die Richtung senkrecht dazu bietet sich an, den Hamilton-Operator (8.58) als klassische Energiegleichung zu interpretieren. In einem äußeren Feld dreht jedes der Untergitter seine magnetischen Momente um den
8.7 Antiferromagnetismus
213
Winkel a in Richtung des Feldes B0. Die Energie eines Elementarmagneten im Feld B0 ist dann Er
1 2 g l B B0
sin 12 m J cos :
8:83
Die Größe des zweiten Terms ergibt sich aus der Überlegung, dass der Energieaufwand zum Umklappen eines Elementarmagneten m J ist (8.27). Die Gleichgewichtsbedingung @Er =@ 0
8:84
führt für kleine Winkel auf g lB B0 : mJ Mit der Magnetisierung
8:85
8:86 M M M 12 g lB N=V erhält man für die Suszeptibilität unterhalb TN den (näherungsweise) temperaturunabhängigen Wert v?
g2 l2B N g2 l2B N ; 2 m J V 2 mjJjV
8:87
der gleich dem Wert von v bei der Néel-Temperatur ist. Insgesamt ergibt sich damit das in Abb. 8.10 skizzierte Verhalten. Es sei darauf hingewiesen, dass der Unterschied zwischen v|| und v^ experimentell nur messbar ist, wenn eine magnetische Domäne vorliegt. Dies wird bei Gittern mit mehreren kristallografisch äquivalenten Richtungen für die mögliche magnetische Orientierung i.a. nicht der Fall sein. Weiterhin ist die charakteristische Temperatur in der Suszeptibilität (8.80) nur dann gleich der Néel-Temperatur, wenn nur die Austauschkopplung J1 zwischen den nächstbenachbarten Metallionen berücksichtigt wird. Beachtet man eine zusätzliche Kopplung J2 zwischen den übernächsten Nachbarn, so ist TN in
Abb. 8.10. Schematische Darstellung der magnetischen Suszeptibilität für einen Antiferromagneten. Unterhalb der Néel-Temperatur TN im antiferromagnetisch geordneten Zustand sind die Suszeptibilitäten für parallele und senkrechte Orientierung des Magnetfeldes relativ zur Spinachse verschieden
214
8. Magnetismus
(8.80) durch eine charakteristische Temperatur h j TN zu ersetzen. Für ein einfaches Gitter vom NaCl-Typ erhält man h TN
J1 J2 : J1 J2
8:88
h ist also größer als TN, wenn auch die Kopplung zwischen übernächsten Nachbarn antiferromagnetisch ist. h wird kleiner als TN, wenn die Kopplung zu den übernächsten Nachbarn ferromagnetisch ist. Beide Fälle kommen vor. Es sei noch darauf hingewiesen, dass in Gittern mit mehreren Arten von Übergangsmetallionen oder mit Übergangsmetallionen in verschiedenen Wertigkeitszuständen die magnetischen Momente derselben nicht gleich sind. Auch bei antiferromagnetischer Kopplung zwischen den Spins verbleibt dann eine Restmagnetisierung. Diese Art Magnetismus wird als Ferrimagnetismus bezeichnet, da sie zuerst bei Ferriten gefunden wurde.
8.8 Spinwellen Die Energie, die notwendig ist, um den Spin eines bestimmten Elektrons umzuklappen, ist gegeben durch die Austauschwechselwirkung. Dies gilt sowohl im Modell der lokalisierten Elektronen als auch im Bandmodell. Im Bandmodell bedeutet das Umklappen eines Spins einen Interbandübergang von einem Elektron in das zugehörige, um die Austauschaufspaltung verschobene Band. Die minimale Energie für das Umklappen eines Spins im Bandmodell ist der Abstand der Oberkante des Bandes der Majoritätsspins von der Fermi-Kante, die sog. Stoner-Lücke (D in Abb. 8.6). Wir werden jetzt einen anderen Anregungszustand kennenlernen, bei dem ebenfalls ein Spin umgeklappt wird, jedoch nur im Mittel über den ganzen Kristall, d. h. es handelt sich hier um eine kollektive Anregung aller Spins. Die dafür aufzuwendende Energie ist erheblich kleiner und kann sogar gegen Null gehen. Zur Herleitung dieser Anregungszustände können wir wieder von dem Spin-Hamilton-Operator (8.57) ausgehen, müssen nunmehr aber die Operatoreigenschaften der Spinoperatoren in (8.57) explizit verwenden. Die x-, y- und z-Komponenten der Spinoperatoren lassen sich durch die Pauli-Matrizen darstellen 1 1 0 1 0 1 1 0 i z x y S ; S ; S :
8:89 1 2 0 2 1 0 2 i 0 Statt der kartesischen Komponenten S x und S y ist es besser, die Spinumklappoperatoren 0 1 x y und
8:90 S S iS 0 0
8.8 Spinwellen
S Sx
i Sy
0 0 1 0
215
8:91
zu verwenden. Die Wirkung dieser Operatoren auf die Spinzustände 1 0 ji und jbi ist
8:92 0 1 S ji 0 ; S jbi ji ; S jbi 0 ; S ji jbi : +
8:93
–
S und S sind also Operatoren, die den Spin nach „+“ bzw. nach „–“ klappen und Null ergeben, wenn der Spin schon im Zustand „+“ bzw. „–“ ist. Die Operatoren S z „präparieren“ in gewohnter Weise den Eigenwert heraus Sz ji 12 ji ; Sz jbi
1 2 jbi
:
8:94
Mit diesem Rüstzeug versehen können wir uns daran machen, den Hamilton-Operator eines Spingitters auf die neuen Operatoren umzuschreiben. Man erhält aus (8.57) durch Einsetzen von (8.90, 8.91) ohne äußeres Feld und mit Austauschkopplung J nur zwischen nächsten Nachbarn XX H J Szi Szid 12
S
8:95 i Sid Si Sid : i
d
Wir wollen ferromagnetische Kopplung zwischen den Elektronenspins (J > 0) annehmen. Im Grundzustand sind dann alle Spins ausgerichtet. Ein solcher Zustand wird beschrieben durch das Produkt der Spinzustände aller Atome Q j0i jii :
8:96 i
Man sieht gleich, dass dieser Zustand ein Eigenzustand zum Hamilton-Operator (8.95) ist, denn die S +, S –-Anteile ergeben Null, und die S z-Komponenten lassen den Zustand jedes Atoms unverändert, mit den jeweiligen Eigenwerten von S z als Vorfaktoren PP H j0i 14 Jj0i 1 14 m J Nj0i :
8:97 i
d
Ein Zustand mit einem umgeklappten Spin am Atom j lässt sich durch Anwendung von Sj– auf den Grundzustand gewinnen Q j#j i Sj jin :
8:98 n
Dieser Zustand ist aber kein Eigenzustand zu H , da die Anwendung der Operatoren S +j S –j + d in H den umgeklappten Spin auf das Atom j+d verschöbe und mithin einen verschiedenen Zustand erzeugte. Ein Eigenzustand dagegen ist die Linearkombination
216
8. Magnetismus
Abb. 8.11. Schematische Darstellung einer Spinwelle
1 X i k rj jki p e j#j i : N j
8:99
Der Zustand stellt eine Spinwelle dar. Die Eigenwerte von S zi und (S xi )2+(S yi )2 sind Erhaltungsgrößen mit einem vom Aufatom i unabhängigen Erwartungswert. Dagegen verschwinden die Erwartungswerte von S xi und S yi . Der Spin präzediert also um die z-Achse mit einer Phasenverschiebung zwischen den Atomen, die durch den Wellenvektor k gegeben ist (Abb. 8.11). Wir wenden jetzt H auf den Spinwellen-Zustand an und erhalten " 1 X i k rj 1 1 H jki p e m J
N 2j#j i m Jj#j i 4 2 N j # 1 X J j# i j#j d i :
8:100 2 d jd Durch Verschieben des Index j in den letzten beiden Beiträgen lässt sich dieses Ergebnis auch so schreiben " # 1 1 X i k rd H jki mJ N J m J
e ei k rd 4 2 d 1 X i k rj e j#j i :
8:101 p N j Der Zustand | ki ist also Eigenzustand mit dem Eigenwert ! 1 X i k rd i k rd e e :
8:102 E E0 J m 2 d E0 ist die Energie im ferromagnetischen Grundzustand. Wie wir gleich sehen werden, hat dieses Ergebnis vor allem für kleine kWerte Bedeutung. Dort lässt sich (8.102) nähern durch P
8:103 E E0 12 J d
k rd 2 : Dies ist die charakteristische Dispersionsbeziehung für ferromagnetische Spinwellen. Für kleine k-Werte verschwindet demnach die zum Umklappen eines Spins notwendige Energie. In Abb. 8.12 a ist die Dispersionsbeziehung für Spinwellen zusammen mit dem Spektrum von Einelektronenanregungen, die ebenfalls einen Spin umklappen, dargestellt. Für diese sog. Stoner-Anregungen muss die Energie m J aufgewandt werden, wenn k = 0 ist. Für k j 0 ergibt
8.8 Spinwellen
217
Abb. 8.12. (a) Dispersionsbeziehung der Spinwellen und Spektrum der Einelektronenanregung mit Spinumklappung in einem Modellferromagneten. (b) Modellmäßige Einelektronen-Bandstruktur mit Austauschaufspaltung I = m J und Stoner-Lücke D
sich infolge der Dispersion der Einelektronenzustände (Abb. 8.12 b) ein Spektrum von Möglichkeiten. Im Bereich der Einelektronenanregungen können Spinwellen in Elektronenanregungen zerfallen. Dies verkürzt die Lebensdauer eines Spinwellenzustandes und beeinflusst auch die Dispersion. Spinwellen lassen sich sowohl thermisch als auch durch Energie- und Impulsaustausch mit Neutronen anregen. Die Neutronenstreuung erlaubt deshalb die experimentelle Bestimmung der Dispersionskurven von Spinwellen. Das Ergebnis für Nickel ist in Abb. 8.13 dargestellt. Die thermische Anregung von Spinwellen hat Einfluss auf den Verlauf der Magnetisierung bei tiefen Temperaturen. Wir erinnern uns, dass die Anregung einer Spinwelle im Mittel einen Spin um-
Abb. 8.13. Experimentelle Werte für die Dispersion von Spinwellen an Nickel in [111]-Richtung nach Mook und Paul [8.6]. Die Messungen erfolgten bei T = 295 K. Die gestrichelte Linie zeigt eine Abhängigkeit der Quantenenergie proportional zu k 2. Abweichungen davon ergeben sich infolge der Austauschwechselwirkung auch zwischen entfernteren Nachbarn und bei Eintritt in den Bereich der Einelektronenanregungen. Die verkürzte Lebensdauer der Spinwellen führt dann zu einer Lebensdauerverbreiterung der Spektren (schraffierter Bereich )
218
8. Magnetismus
klappt, also das magnetische Moment reduziert. Die Magnetisierung eines Spingitters wäre demnach 1 1X g lB M Ms n
k ;
8:104 2 V k wenn n (k) die Zahl der angeregten Spinwellen mit einem Wellenvektor k ist. Wenn wir vernachlässigen, dass der Heisenberg-Operator eigentlich nichtlinear ist und so tun, als ob die Spinwellen superponierbar wären, so wären die Energieterme wie bei einem harmonischen Oszillator P
8:105 E
k n
k 12 J d
k rd 2 und die Besetzungsstatistik wie bei einem harmonischen Oszillator. Die Temperaturabhängigkeit der Magnetisierung bei tiefen Temperaturen lässt sich analog zu Abschn. 5.3 leicht berechnen und man erhält M
T
M
0
T 3=2 :
8:106 3/2
Dies ist das Blochsche T Gesetz, welches an die Stelle einer exponentiellen Abhängigkeit (8.52) tritt, die sich für einen Ferromagneten ohne Spinwellenanregung ergäbe. Die Spinwellenanregung ist auch in der spez. Wärme sichtbar, wo sie zu einem T 3/2-Term neben dem T 3-Term durch Phononanregung führt.
8.9 Kristallanisotropie Makroskopische Auswirkungen In den bisherigen Betrachtungen zum Magnetismus konnte die kristalline Struktur des Festkörpers vernachlässigt werden. Sie spielt jedoch eine entscheidende Rolle für die augenfälligsten Manifestationen des Magnetismus. Zum Beispiel basiert die stabile Orientierung der Magnetisierung in einem Permanentmagneten fast ausschließlich auf der Kristallanisotropie. Auch eröffnet erst die Kristallanisotropie die Möglichkeit, binäre Information in magnetischen Strukturen zu speichern, indem sie die Magnetisierung parallel oder antiparallel zu einer durch die Kristallstruktur vorgegebenen Richtung festhält. Verursacht wird die magnetokristalline Anisotropie durch die Spin-Bahn-Kopplung. Die Orientierung der Bahnmomente richtet sich nach der Kristallstruktur und wegen der Spin-Bahn-Kopplung hängt die Gesamtenenergie des Systems von der Orientierung des Spins relativ zu den Kristallachsen ab. Die Orientierung mit der niedrigsten Energie wird als leichte Orientierung bezeichnet, die entsprechende Achse als leichte Achse. Für Cobalt in der hcp Struktur ist dies die c-Achse. Ohne externes Feld liegt die Magnetisierung deshalb entlang der c-Achse. Ein makroskopischer Kristall besteht aus Domänen der beiden mögli-
8.9 Kristallanisotropie
219
Abb. 8.14. Schematische Darstellung der mittleren Magnetisierung M(H) eines Ferromagneten mit einer einzigen leichten Achse (hcp Cobalt). Die gestrichelte Linie zeigt die anfängliche Magnetisierung angefangen bei der Magnetisierung Null. Die ausgezogene Linie zeigt den Magnetisierungszyklus, wenn das äußere Feld H parallel zur leichten Achse liegt. Es ergibt sich eine ausgeprägte Hysterese. Die strichpunktierte Linie zeigt den Magnetisierungszyklus, wenn H senkrecht zur leichten Achse liegt. Es gibt dann keine ausgeprägte Hysterese
chen Orientierungen entlang dieser Achse. Erwärmt man einen Cobaltkristall über die Curie-Temperatur und lässt ihn langsam abkühlen, sind Anzahl und Größe beider Domänen in etwa gleich, so dass die mittlere Magnetisierung und das Magnetfeld im Außenraum weitgehend verschwinden. In einem äußeren Magnetfeld, das entlang der c-Achse orientiert ist, steigt die gemittelte Magnetisierung durch Verschiebung der Domänenwände schnell an (Abb. 8.14) und sättigt sich bei vergleichsweise kleinen Feldern, da in diesem Fall das äußere Feld nicht gegen die magnetokristalline Anisotropie anarbeiten muss (gestrichelte Linie in Abb. 8.14). Nur eine einzige Domäne überlebt schließlich. Diese bleibt auch überwiegend erhalten, wenn das äußere Feld entfernt wird. Die verbleibende Magnetisierung Mr heißt Remanenz. Die Magnetisierung wird zum Verschwinden gebracht durch ein Feld in umgekehrter Richtung der Stärke –Hc. Hc wird als Koerzitivfeldstärke bezeichnet. Mit steigendem Feld in negativer Richtung wird Sättigung in umgekehrter Polarität erreicht. Durch Reduktion des äußeren Feldes und schließlich seine Umpolung wird die komplette Magnetisierungskurve durchlaufen (ausgezogene Linie in Abb. 8.14). Für eine Magnetisierung senkrecht zur c-Achse als Antwort auf ein entsprechendes äußeres Feld muss die Magnetisierung in den Domänen aus der leichten Richtung herausgedreht werden (rechte Skizze in Abb. 8.14). Da dies Energie kostet, steigt die Magnetisierung nur langsam an und eine Sättigung wird erst bei sehr hohen Feldern erreicht. Auch gibt es in diesem Fall keine Remanenz. Die Magnetisierung fällt auf Null zurück sobald das externe Feld abgeschaltet wird. Die Größe der Remanenz hängt davon ab wie leicht sich Domänenwände verschieben lassen. Perfekte Kristalle sowie bestimmte Legierungen wie l-Metall und Permalloy oder Ferrite haben eine kleine oder gar keine Remanenz. Solche Materialien werden für
220
8. Magnetismus
Transformatorkerne verwendet, damit die Energieverluste beim Ummagnetisieren klein sind. Für die Datenspeicherung bevorzugt man hingegen Werkstoffe, deren Remanenz in der Nähe der Sättigung liegt. Hohe Remanenz wird erzeugt, indem man die Lage von Domänenwänden durch Defekte fixiert.
Anisotropie kubischer und hexagonaler Kristalle Die magnetische Anisotropie ist spezifisch für die Kristallstruktur. Zur quantitativen Beschreibung der Anisotropie enwickelt man die Änderung der Energie pro Volumen u nach Potenzen der Kosinusse der betrachteten Richtung j mit den Achsen i, i cos
j; i :
8:107
Typischerweise beschränkt man sich auf die niedrigsten und zweitniedrigsten nichtverschwindenden Potenzen. Nur die geraden Potenzen treten auf, denn die Energie muss invariant gegen die Zeitumkehr sein. Eine Zeitumkehr entspricht einer Inversion der Spinrichtung (d. h. der Magnetisierung), also einer Ersetzung von i durch i. Für einen kubischen Kristall wäre die entsprechende Entwicklung formal ucub u2
21 22 23 u4
41 42 43 :
8:108
Wegen der Identität X 2i 1
8:109
i
ist der erste Term konstant und kann deshalb wegfallen. Der zweite Term kann unter Benutzung von (8.109) umgeschrieben werden zu ucub
2u4
21 22 21 23 22 23 :
8:110
An dieser Form sieht man, das es nicht erforderlich war, in (8.108) gemischte Terme des Typs 12 zu berücksichtigen. Mit der Entwicklung bis zur vierten Ordnung in (8.110) ist das Verhältnis der Energien für eine Magnetisierung entlang der Raum- und Flächendiagonalen fixiert auf 4/3. Um Abweichungen von diesem Verhältnis zuzulassen, muss man Terme sechster Ordung einführen. Die einfachste Möglichkeit dafür ist ucub K1
21 22 21 23 22 23 K2 21 22 23 :
8:111
K1 und K2 sind die Anisotropiekonstanten für kubische Kristalle. Für Eisen bei 300K ist K1 = 4,2 ´ 104 Jm–3 und K2 = 1,5 ´ 104 Jm–3. Die leichten Richtungen sind deshalb die h100i Richtungen, die harten Richtungen die h111i Richtungen. Die Differenz zwischen den harten und leichten Richtungen beträgt 1,5 ´ 104 Jm–3. Für Nickel sind die Konstanten K1 und K2 negativ (K1 = –5,7 ´ 103 Jm–3, K2 = –2,3 ´ 103 Jm–3), was h111i zu leichten Richtungen macht.
8.9 Kristallanisotropie
221
Für hexagonale Kristalle (Beispiel hcp Cobalt) verschwindet der Term zweiter Ordnung nicht. Bezeichnet man die hexagonale Achse mit dem Index 3, dann ist die Entwicklung bis zur vierten Ordnung formal uhex u2k 23 u2?
21 22 u4 43 :
8:112
Wegen der hexagonalen Symmetrie gibt es keinen Term vierter Ordnung in 1 und 2. Der zweite Term ist wegen (8.109) gleich u2?
1 23 und kann deshalb mit dem ersten zusammengefasst werden. Die Anisotropie kann deshalb durch einen einzigen Winkel, den Winkel h mit der c-Achse ausgedrückt werden uhex u2 23 u4 43
K2 cos2 h
K4 cos4 h ;
8:113
mit K2 und K4 den Anisotropiekonstanten. Die negativen Vorzeichen sind eingeführt, um in Übereinstimmung mit der gebräuchlichen Notation zu sein. Für Cobalt ist K2 = 4,1 ´ 105 Jm–3 und K4 = 1,0 ´ 105 Jm–3. Die c-Achse ist deshalb die leichte Achse. Die Rotation der Magnetisierung von der leichten in die harte Richtung kostet mit 5 ´ 105 Jm–3, 33mal mehr Energie als bei Eisen. Der Grund ist, dass für hexagonale Kristalle der Term zweiter Ordnung nicht verschwindet.
Domänenwände Wie schon in Abb. 8.14 dargestellt, besteht ein Ferromagnet aus Domänen, innerhalb derer die Magnetisierung entlang einer leichten Achse liegt. Der Übergangsbereich von einer Orientierung der Magnetisierung in eine andere wird als Domänenwand bezeichnet. Je nach Orientierung der Magnetisierung innerhalb der Wand unterscheidet man verschiedene Wandarten. Abb. 8.15 zeigt im rechten und linken Bereich Domänen, in denen sich die Magnetisierung um 1808 unterscheidet. In Abb. 8.15 a erfolgt der Übergang von einer Domäne in die andere durch eine Rotation um eine Achse senkrecht zur Domänenwand. Eine solche Wand heißt BlochWand (hier eine 1808-Bloch-Wand). Eine andere Möglichkeit besteht darin, im Übergangsbereich die Magnetisierung planar zur Magnetisierung in den Domänen zu drehen, so wie im oberen Bereich von Abb. 8.15 b gezeigt. Eine solche Wand heißt Néel-Wand (hier 1808 Néel-Wand). In einer Néel-Wand hat man eine nichtverschwindende Divergenz der Magnetisierung rM, während in einer Bloch-Wand rM 0 ist. Eine nichtverschwindende Divergenz erzeugt ein Magnetfeld und die Wechselwirkungsenergie dieses Magnetfeldes mit der Magnetisierung trägt zur Wandenergie bei. Dadurch ist die Bloch-Wand im Volumen eines Materials energetisch günstiger als die Néel-Wand. Die Situation ändert sich, wenn eine Bloch-Wand auf eine Oberfläche trifft. Dann kann die Néel-Wand energetisch günstiger sein, da bei einer Bloch-Wand eine Divergenz an der Oberfläche auftritt
222
8. Magnetismus
Abb. 8.15. (a) 1808-Bloch-Wand: innerhalb der Wand rotiert die Magnetisierung um eine Achse senkrecht zur Wand. Zur Minimierung der Depolarisationsenergie wandelt sich eine BlochWand an der Oberfläche in eine NéelWand (b) um, bei der die Rotation der Magnetisierung in der Ebene erfolgt, die durch die Polarisation im Volumen der Domänen und die Normale zur Wandrichtung aufgespannt wird
(Abb. 8.15 a), die Depolarisationsenergie kostet. An der Oberfläche gehen deshalb häufig Bloch-Wände in Néel-Wände über (Abb. 8.15 b). Die Stärke einer Domänenwand ergibt sich aus dem Wechselspiel zwischen Anisotropie und ferromagnetischer Austauschkopplung. Die Austauschenergie wird minimiert, wenn der Drehwinkel der Magnetisierung von einer Atomlage zur nächsten möglichst klein, die Wandstärke also möglichst groß ist. Die Anisotropieenergie wird minimiert, wenn der Bereich, in dem die Magnetisierung nicht entlang der leichten Achse liegt, möglichst klein, die Wandstärke also möglichst klein ist. Wir berechnen jetzt die Rotation der Magnetisierung in einer 1808 Bloch-Wand in einem einfachen Modell. Damit man sich auf die Kopplung der Spins zwischen benachbarten Atomebenen beschränken kann, betrachten wir eine tetragonal primitive Struktur mit der c-Achse als leichte Achse. Da die Wandstärke groß gegen die Abstände atomarer Ebenen ist, ändert sich die Magnetisierung von Ebene zu Ebene nur wenig. In diesem Fall kann man den Heisenberg-Operator (8.57) klassisch interpretieren. Aus den Spinoperatoren werden dann gewöhnliche Vektoren und aus dem Operatorprodukt ein Skalarprodukt. Da alle Spins innerhalb der Atomebenen n parallel zur Wandebene gleich orientiert sind, genügt zur Beschreibung eine Größe, der Winkel yn des Spins mit der c-Achse (vgl. Abb. 8.14). Beim Durchtritt durch die Wand ändert sich dieser Winkel y von 0 nach p. In dieser Notation lautet die klassische Heisenberg-Gleichung X X cos
yn1 yn KS2 cos2 yn ;
8:114 H JS2 n
n
mit S, dem skalaren Wert des Spinoperators und K der Anisotropiekonstanten. Die Terme in (8.114) entsprechen der Energie einer Elementarzelle. Wegen der Kleinheit der Winkeländerungen von einer Atomebenene zur nächsten können wir H schreiben als X 1 1 2X KS H JS2
yn1 yn 2 cos 2yn const :
8:115 2 2 n n Die Blochwand ist im Gleichgewicht, wenn für alle Ebenen n @H=@yn 0 ist,
8.9 Kristallanisotropie
@H=@yn / J
2yn
yn1
yn 1 K sin 2yn 0 :
223
8:116
Wir können yn als eine kontinuierliche Variable y(n) betrachten. Der Term in Klammern wird dann gleich der negativen zweiten Ableitung von y nach n, @2y K sin 2y : @n2 J
8:117
Dies ist die sog. Sine-Gordon-Gleichung. Zu ihrer Lösung multipliziert man zunächst mit @y=@n ( ) ( !2 ) @y @ 2 y K @ 1 @y K cos 2y 0 ; sin 2y @n @n2 J @n 2 @n J
8:118 wodurch sich die lösbare Differentialgleichung erster Ordnung !2 @y K
8:119 cos 2y const @n J ergibt. Die Konstante wird dadurch festgelegt, dass innerhalb der Domänen @y=@n 0 sein muss. Daraus folgt !2 @y K 2K 2 sin y :
1 cos 2y
8:120 @n J J Durch radizieren und integrieren ergibt sich n
y r Z r J dy J ln
tan
y=2 ; n
y 2K sin y 2K
8:121
bzw.
p y 2 tan 1
exp
n 2K=J :
8:122
In Experimenten mißt man üblicherweise die Komponenten der Magnetisierung parallel oder senkrecht zur Wand. Diese Komponenten sind p p Mk / cos y cosf2 tan 1
exp
n 2K=J g tanh
n 2K=J ;
8:123 p p M? / sin y sinf2 tan 1
exp
n 2K=J g 1= cosh
n 2K=J : Der Verlauf von Mk und M? als Funktion von n ist in Abb. 8.16 gezeigt, zusammen mit der üblichen Definition der Wandstärke p w
8J=K :
8:124
224
8. Magnetismus
Abb. 8.16. Verlauf der Magnetisierung in einer Blochwand. Die ausgezogene Linie zeigt die Komponente parallel zur Magnetisierung innerhalb der Domänen, die gestrichelte Linie die Komponente senkrecht dazu (8.123). Gleichfalls eingezeichnet ist die konventionelle Definition der Wandstärke w
Der mathematische Formalismus lässt sich ohne Änderung auf Néel-Wände übertragen. Der Winkel y ist dann die Rotation um die Achse senkrecht zur Magnetisierung in den Domänen und parallel zur Néel-Wand (Abb. 8.15 b). 908-Wände erhält man, indem man das Argument des Kosinus 2yn in (8.115) durch 4yn ersetzt. Generell beschreibt der oben ausgeführte Formalismus Übergänge zwischen Phasen, die sich durch einen skalaren Parameter darstellen lassen. Das bekannteste Beispiel ist das sog. Frenkel-Kontorova Modell für Wände zwischen Strukturdomänen.
Übungen zu Kapitel 8
8.1 Man berechne die diamagnetische Suszeptibilität des Wasserstoffatoms unter Benutzung von (8.12) und der Wellenfunktion für den Grundzustand w
a3o p 1=2 e r=ao , mit dem Bohrschen Radius ao 4p h2 e0 =
me2 0;529 Å. 8.2 Man berechne die Entropie von N Spins in einem magnetischen Feld gemäß den Prinzipien der statistischen Thermodynamik. Beschreiben Sie den Prozess der adiabatischen Entmagnetisierung und diskutieren Sie diese Methode zur Kühlung eines paramagnetischen Salzes (vgl. Tafel IV)! Wieviel Wärme kann man den Schwingungen eines Kristalls durch adiabatische Entmagnetisierung des Spinsystems entziehen? 8.3 Unter Verwendung von Gleichung (8.111) berechne man die Anisotropieenergiedichte u für Eisen und Nickel in den [001], [011] und [111] Richtungen bei 300 K und skizziere den Verlauf als Funktion des Winkels gegen die [001]-Achse in der [011] Zone. Für Eisen und Nickel sind die Anisotropiekonstanten
K1(Fe) = 4,2 ´ 104 Jm–3, K2(Fe) = 1,5 ´ 104 Jm–3, K1(Ni) = –5,7 ´ 103 Jm–3, K2(Ni) = –2,3 ´ 103 Jm–3. Was sind jeweils die leichten und schweren Achsen und wieviele gibt es davon? 8.4 a) Unter Vernachlässigung der Depolarisationsenergie berechne man den Verlauf der Magnetisierung in einer 908 Néel-Wand. Vergleichen Sie die Dicke der Wand mit der einer 1808 Néel-Wand und erläutern Sie das Ergebnis! b) Man berechne die Depolarisationsenergie in einer Néel-Wand! Hängt das Ergebnis von der Wanddicke ab? Welchen Einfluss hat demnach die Depolarisationsenergie auf die Wanddicke? 8.5 Warum ist die senkrechte Magnetisierung der Eisendoppellagen in Abb. VII.1 abwechselnd in den Kristall hinein und hinaus gerichtet?
Tafel VI
Tafel VI Magnetostatische Spinwellen
Ohne äußeres Magnetfeld verschwindet die Quantenenergie für Spinwellen in einem Ferromagneten für kleine k, weil sich die Spinorientierung von Atom zu Atom mit zunehmender Wellenlänge immer weniger unterscheidet, und deshalb die Austauschkopplung einen immer geringeren Energiebeitrag liefert. Die Austauschkopplung wird dann schließlich vergleichbar mit der Energie magnetischer Dipole in einem äußeren Feld, d. h. die Dispersion von Spinwellen wird abhängig vom Magnetfeld. Wir wollen im folgenden solche Spinwellen mit kleinem k-Wert in einem äußeren Feld betrachten. Der k-Wert soll klein gegen einen reziproken Gittervektor aber andererseits auch groß gegen x/c sein, wenn x die Spinwellenfrequenz ist. Dies erlaubt es, die explizite Wechselwirkung mit dem elektromagnetischen Lichtfeld zu vernachlässigen (Abschn. 11.4) und anzunehmen, dass r H 0
VI:1
und erhalten aus (VI.3) unter Verwendung von mx, my M bzw. hx, hy H0 das Gleichungspaar. hx mx j im
VI:5 i m j my hy mit
und ferner natürlich r
H M 0
die lokale Magnetisierung M (r, t) ersetzen. Die Magnetisierung ist im wesentlichen die Sättigungsmagnetisierung Ms des Ferromagneten, welche durch das äußere Feld H0 entlang der z-Achse orientiert sein soll, mit kleinen orts- und zeitabhängigen Abweichungen mx, my in den x- und yKomponenten. Wir machen also den Ansatz 0 1 mx
re ixt M
r; t @ my
re ixt A ; Ms 0 1
hx mx e ixt
VI:4 B
r; t l0 @
hy my e ixt A
H0 Ms
VI:2
ist. Spinwellen dieser Art heißen magnetostatische Spinwellen. Sie können mit Hilfe der klassischen Bewegungsgleichung behandelt werden, die die zeitliche Änderung des Drehimpulses eines Elektrons mit dem Drehmoment verknüpft. Bezeichnen wir das magnetische Dipolmoment des Elektrons mit pi, so ist dpi gl c
pi B mit c B :
VI:3 dt h Für das folgende ist es zweckmäßig, statt der Dipolmomente einzelner Elektronen eine orts- und zeitabhängige Magnetisierung M (r, t) einzuführen, die man sich durch eine (lokale) Mittelung über die Dipolmomente pro Volumeneinheit herstellen kann. In (VI.3) kann man dann pi durch
j l0 c2 Ms B0 =
c2 B20 m l0 xcMs =
c2 B20
x2 ; x2 ; B0 l0 H0 :
Wegen (VI.1) lässt sich der zweikomponentige Vektor h als Gradient eines Potentials schreiben h ru ;
VI:6
wobei wir für u einen Wellensatz für die y-Richtung versuchen, d. h. u w
xei ky y :
VI:7
Die Anwendung von (VI.2) führt uns dann auf r
h m Du r m 0 ;
VI:8
woraus man unter Verwendung von (VI.5) und (VI.7) eine Art Wellengleichung für das Potential herleitet
@2
1 j @x2
ky2
u0:
227
Tafel VI
Tafel VI Magnetostatische Spinwellen
VI:9
Eine Lösung dieser Gleichung ist offensichtlich gegeben, wenn j = –1 ist. Diese Bedingung ergibt die Frequenz für Spinwellen q x c B20 l0 Ms B0 :
VI:10 Die Frequenz ist unabhängig von k, wenn die Austauschkopplung ganz vernachlässigt wird, wie es hier der Fall war. Interessant ist es, Lösungen zu speziellen Geometrien der Probe zu suchen. Der Ansatz (VI.7) lässt sich auch für den Fall einer Platte im B-Feld oder noch einfacher für einen Halbraum x < 0 verwenden. Dann ergibt (VI.9) auch Lösungen mit j j –1, wenn w00
x ky2 w
x
VI:11
ist, also w (x) die Form w
x A ejky jx
VI:12
hat. Die Lösung ist offenbar an der Oberfläche des Halbraumes lokalisiert, also eine Oberflächen-Spinwelle. Die Bedingung der Stetigkeit der Normalkomponente von B liefert die Eigenfrequenz dieser Schwingung hx mx jx0 ;
1 jjky j
m ky
VI:13 jky j :
VI:14
Wir können die beiden Fälle ky jky j, also zwei verschiedene Laufrichtungen der Welle unterscheiden: Fall 1: ky jky j
Abb. VI.1. Momentaufnahme der Magnetisierung in einer Damon-Eshbach-Spinwelle an den beiden Oberflächen einer (dicken) Platte. Das äußere Magnetfeld B0 zeigt in Richtung des Betrachters. Die Laufrichtung der Damon-Eshbach-Wellen ist dann im Sinne eines Rechtsumlaufes. Bei kleiner werdender Plattenstärke d bzw. größerer Wellenlänge koppeln die Wellen der beiden Oberflächen, und man erhält eine Kopplungsdispersion x = x (ky d)
Fall 2: ky jky j
mj2; m
j 2 ;
VI:15 1 x1 c
2 l0 Ms B0 ; x2 c
12 l0 Ms B0 :
VI:16 Offensichtlich liefert nur der zweite Fall eine positive Frequenz. Wir haben also den eigenartigen Fall, dass eine Welle in einer Laufrichtung existiert, nicht aber in der Gegenrichtung. Eine besonders interessante Demonstration der Aufhebung der Zeitumkehrinvarianz durch ein Magnetfeld! Entsprechende Oberflächenwellen ergeben
sich auch, wenn die Probe die Form einer dünnen Platte mit dem B0-Feld in der Plattenebene hat, wobei die Oberflächenwellen auf beiden Oberflächen in entgegengesetzter Richtung laufen (Abb. VI.1). Durch die Kopplung zwischen beiden Oberflächen wird die Frequenz abhängig vom ky-Wert, wenn ky d91 ist. Diese magnetischen Oberflächenwellen heißen nach ihren Entdeckern auch „Damon-Eshbach-Wellen“ [VI.1]. Sie wurden zuerst in der Absorption von Mikrowellen nachgewiesen [VI.2]. Eine sehr schöne Demonstration der Unidirektionalität der Damon-Eshbach-Wellen und zugleich des Wellenzahlerhaltungssatzes bei der Streuung, einschließlich der Vorzeichen (4.28), gelingt mit Hilfe des Raman-Effektes (Tafel III). Die Ankopplung des Lichtes erfolgt dabei über den (schwachen) magneto-optischen Effekt. Ab-
Tafel VI Magnetostatische Spinwellen
Tafel VI
228
Abb. VI.2. Experimenteller Aufbau zum Nachweis der Raman-Streuung an Spinwellen [VI.2]. Der mehrfache Durchgang des Lichtes durch das Fabry-Pérot-Spektrometer reduziert den Untergrund, so daß auch sehr schwache inelastische Signale beobachtet werden können
bildung VI.2 zeigt einen experimentellen Aufbau nach Grünberg und Zinn [VI.3]. Die Probe wird von einem Laser beleuchtet und der Raman-Effekt in Rückstreuung beobachtet. Die Frequenz von Damon-Eshbach-Wellen liegt im GHz-Bereich. Man benötigt also Spektrometer mit großer Auflösung, wie sie z. B. von einem Fabry-PérotInterferometer erreicht wird. Zur Reduzierung des Untergrundes, verursacht durch die elastisch diffuse Streuung an der Probe, wird das Interferometer mehrfach (zweifach in Abb. VI.2) durchlaufen. Ein Frequenzspektrum erhält man durch Bewegung der Fabry-Pérot-Spiegel gegeneinander. Abbildung VI.3 zeigt Raman-Spektren für zwei unterschiedliche Stellungen der EuO-Probe relativ zum Lichtstrahl. Die Oberflächenspinwelle kann nur in der durch qk bezeichneten Richtung laufen. In der oben gezeichneten Streugeometrie ist also
k0
kk qk :
Dazu gehört der Energiesatz (4.28) x0
x x
qk :
Die zugehörige Ramanlinie ist zu kleineren x verschoben. Wir erhalten also die „Stokes“-Linie M S2, während die Anti-Stokes-Linie für die Oberflächenwelle nicht existiert. Für die unten gezeichnete Streugeometrie gilt
Abb. VI.3. Raman-Spektrum von EuO [VI.2]. Je nach Orientierung der Probe beobachtet man die Damon-Eshbach-Spinwelle M2 als Stokes-Linie (oben ) oder als Anti-Stokes-Linie (unten), während die Volumenspinwellen M1 in beiden Geometrien mit gleicher Intensität erscheinen, allerdings überraschenderweise mit höherer Intensität in der Anti-Stokes-Linie [VI.3]
k0
kk
qk
und damit auch x0
x
x
qk :
Entsprechend sieht man nur die Anti-Stokes-Linie MAS 2 für die Oberflächenwelle. Die Volumenwelle ist sowohl als Stokes- wie als Anti-StokesLinie sichtbar, bemerkenswerterweise aber mit höherer Intensität in der Anti-Stokes-Linie: Die Zahl der beitragenden Volumenwellen gleicher Frequenz ist für beide Streugeometrien nicht gleich.
229
Literatur VI.1 R. W. Damon, J. R. Eshbach: J. Phys. Chem. Solids 19, 308 (1961) VI.2 P. Grünberg, W. Zinn: IFF Bulletin 22 (KFA, Jülich 1983), p. 3 VI.3 R. E. Camley, P. Grünberg, C. M. Mayer: Phys. Rev. B 26, 2609 (1982)
Tafel VI
Literatur
Tafel VII
Tafel VII Magnetismus in Schichtsystemen und GMR-Effekt
Magnetische Anisotropie in Dünnschichtsystemen Magnetische Dünnschichtsysteme haben große Bedeutung für die Technik der Datenverarbeitung und Sensorik. Aber auch dem Grundlagenforscher bieten sie eine faszinierende Spielwiese, auf der es erstaunliche Effekte zu entdecken gibt. Die Vielgestaltigkeit magnetischer Phänomene in Dünnschichtsystemen beruht in erster Linie auf der großen Zahl verschiedener, miteinander konkurrierender Anisotropien. Eine erste Quelle der Anisotropie ist die spezifische Form. Betrachten wir z. B. einen homogen polarisierten Film. Liegt die Magnetisierung senkrecht zur Schicht, so erzeugt der Sprung in der Magnetisierung M an der Grenzfläche ein Depolarisationsfeld der Stärke Hd = –M (in S.I. Einheiten *). Ist die Magnetisierung hingegen parallel zur Schicht, so gibt es kein Depolarisationsfeld. Eine Drehung der Magnetisierung in die senkrechte Richtung führt zum Aufbau einer senkrechten Komponente der Magnetisierung und damit eines Depolarisationsfeldes. Dies bewirkt eine Änderung der magnetischen Energie. Sie kann aus der differentiellen Form der Energiedichte u du
l0 M? dH?
VII:1
berechnet werden. Mit dem Winkel h zwischen der Magnetisierung und der Filmsenkrechten erhält man nach Integration
* Das magnetische Depolarisationsfeld ist das Analogon zum elektrostatischen Depolarisationsfeld. Im elektrostatischen Fall entsteht durch den Sprung in der elektrischen Polarisation eine Flächenladung, die ein elektrisches Feld erzeugt (vgl. Kap. 11.7)
1 u l0 M 2 cos2 h :
VII:2 2 In Originalarbeiten auf dem Gebiet des Magnetismus werden in der Regel cgs-Einheiten benutzt. Im cgs-System nimmt (VII.2) die Form u 2pM 2 cos2 h an. Für Cobalt ist die Depolarisationsenergie 1,23 ´ 106 Jm–3 bei 300 K und damit um einen Faktor zwei größer als die magnetokristalline Anisotropie-Energie von 5,1 ´ 105 Jm–3. Ein Ni(100) Film hätte eine magnetokristalline Anisotropie-Energie von –2 ´ 103 Jm–3 zugunsten der h111i-Richtung. Die Depolarisationenergie ist 1,5 ´ 105 Jm–3. Die leichte Achse läge deshalb in beiden Fällen stets parallel zur Oberfläche, gäbe es nicht noch weitere Quellen der Anisotropie. Diese sind die elastische Verspannung in Dünnschichtsystemen und die Oberflächen- bzw. Grenzflächenanisotropie. Elastische Verspannungen brechen häufig die Symmetrie, indem z. B. eine kubische Struktur zu einer tetragonalen Struktur verzerrt wird. Durch die Symmetriebrechung wird die quantitative Beschreibung der magnetokristallinen Anisotropie etwas komplex und soll hier nicht behandelt werden (für Details siehe [VII.1]). Die grenzflächenspezifische Anisotropie beruht auf der veränderten Austauschwechselwirkung und der veränderten Spin-Bahnkopplung an Grenzflächen. Die mit der Grenzflächenanisotropie verbundene Energie ist proportional zur Fläche des Films, nicht proportional zum Volumen. Betrachtet man die Energie pro Volumen, so ist der Grenzflächenanteil umgekehrt proportional zur Schichtdicke d. Für das einfache Beispiel eines Films mit kubischer Kristallstruktur mit der (100)-Fläche parallel zur Schichtebene ist die Energiedichte bei Rotation der Magnetisierung in einer [010] Zone
231
Tafel VII
Austausch-Anisotropie (exchange bias)
Abb. VII.1. Epitaktische Mono- und Doppellagen von Eisenfilmen auf W(110). Die Orientierung der Magnetisierung wechselt zwischen parallel und senkrecht zur Oberfläche [VII.2]
(
1 l M2 u 2 0
Ko Kg d
K1 cos2 h sin2 h :
)
Austausch-Anisotropie (exchange bias)
cos2 h
VII:3
Dabei ist h der Winkel mit der [100] Richtung senkrecht zur Filmebene und Ko and Kg sind Konstanten, welche die Oberflächen- bzw. Grenzflächenanisotropie beschreiben. Positive Werte der Konstanten bewirken, dass die bevorzugte Orientierung bei kleinen Schichtdicken d senkrecht zur Filmebene liegt. Oberhalb einer kritischen Dicke dc überwiegt die Formanisotropie und die Magnetisierung dreht in die Filmebene: dc 2
Ko Kg =l0 M 2 :
VII:4
Dies ist ein häufig auftretender Fall. Die in der Regel gegebene elastische Verzerrung epitaktisch aufgewachsener Filme und die dadurch hervorgerufene Anisotropie kann auch das Umgekehrte bewirken, die Drehung in die Filmsenkrechte bei größeren Dicken. Ein Beispiel ist die Drehung der Magnetisierung in Eisenfilmen auf W(110) beim Übergang von einer zu zwei Monolagen Dicke. Auf einer gestuften Fe(110) Oberfläche, bei der das Wachstum der Eisenschicht von den Stufenkanten her erfolgt, führt dies bei einer mittleren Bedeckung von 1,5 Monolagen zu einer abwechselnd vertikalen und parallelen Orientierung der Magnetisierung (Abb. VII.1). Da die Magnetisierung M von der Temperatur abhängt, ist auch die Energiebilanz, z. B. in (VII.3) temperaturabhängig. Auch als Funktion der Temperatur kann sich deshalb eine Drehung der Richtung der Magnetisierung ergeben.
Im Jahr 1956 entdeckten Meiklejohn and Bean, dass die magnetische Hysteresekurve von Cobaltnanopartikeln, die mit einer Cobaltoxidschicht überzogen waren, nach Abkühlung in einem Magnetfeld bei 77 K auf der H-Achse verschoben war [VII.3]. Das Phänomen wurde der Austauschkopplung an der Grenzschicht zwischen dem antiferromagnetischen Cobaltoxid und dem ferromagnetischen Cobalt zugeschrieben und als Austausch-Anisotropie bezeichnet. In der englischen Literatur ist heute der Ausdruck exchange bias gebräuchlich. Der Effekt wird hier am Beispiel einer ferromagnetischen Eisenschicht auf einem antiferromagnetischen NiO-Substrat erläutert. Durch Abkühlen in einem starken Magnetfeld unter die Curie-Temperatur der Eisenschicht wird zunächst ein eindomäniger Zustand der Eisenschicht erzeugt. Bei weiterer Abkühlung unter die Néel-Temperatur des NiO-Substrats entsteht eine geordnete antiferromagnetische Phase im NiO (Bild oben rechts in Abb. VII.2). Wegen der Austauschkopplung an der Grenzschicht zwischen Ferro- und Antiferromagnet bedarf es jetzt eines höheren Magnetfeldes in umgekehrter Richtung, um die Magnetisierung in der Eisenschicht umzudrehen: die Hysteresekurve ist dadurch nach links verschoben (ausgezogene Linie in Abb. VII.2). Oberhalb der Néel-Temperatur sind die Spins in NiO ungeordnet und die Magnetisierungskurve der Eisenschicht ist symmetrisch um den Punkt H = 0 (gestrichelte Linie in Abb. VII.2). Die Austauschanisotropie ermöglicht es, die Hysteresekurve auf der Magnetfeldachse hin und
Tafel VII Magnetismus in Schichtsystemen und GMR-Effekt
Tafel VII
232
Abb. VII.2. Magnetisierung eines ferromagnetischen Eisenfilms, der über die Austauschkopplung an der Grenze zu einem antiferromagnetischen NiO-Substrat an die geordnete (ausgezogene Linie) oder die ungeordnete (gestrichelte Linie) antiferromagnetische Phase ankoppelt. Durch die Austauschkopplung ist die Hysteresekurve nach links verschoben, wenn der antiferromagnetische Zustand geordnet ist
her zu schieben. Betrachten wir zum Beispiel das Vierschichtensystem in Abb. VII.3. Das System besteht aus einer austauschgekoppelten ferromagnetischen Schicht (AKFM) auf einem antiferromagnetischen Substrat (AF), einer nichtmagnetischen Schicht (NM) und einer zweiten ferromagnetischen Schicht (FM). Bei kleinen Feldern ist die Magnetisierung der AKFM-Schicht fixiert durch die Austauschkopplung und es wird die punktierte Hysteresekurve durchlaufen. In dieser Konfiguration stellt das System einen binären Speicher dar. Ersetzt man die ferromagnetische Deckschicht durch eine Schicht aus weichmagnetischem Material wie. z. B. Permalloy (NiFe) oder l-Metall, so ergibt sich der strichpunktierte Verlauf der Magnetisierung. Für positive und negative Felder ist also die Magnetisierung beidseits der nichtmagnetischen Schicht (NM) gleichbzw. entgegengesetzt gerichtet. Im Zusammenhang mit dem jetzt zu besprechenden Magnetowiderstandseffekt ergibt sich so ein Sensor für Magnetfelder.
Abb. VII.3. Verlauf der Magnetisierung eines Vierschichtensystems bestehend aus einer austauschgekoppelten ferromagnetischen Schicht (AKFM) auf einem antiferromagnetischen Substrat (AF), einer nichtmagnetischen Schicht (NM) und einer zweiten ferromagnetischen Schicht (FM). Für große Felder wird die ausgezogene Hysterese durchlaufen, für kleine Felder die punktierte. Der strichpunktierte Verlauf ergibt sich, wenn die FM-Deckschicht aus einem weichmagnetischen Material besteht
Der Riesenmagnetowiderstandseffekt (GMR-Effekt) Der Riesenmagnetowiderstand (englisch: Giant Magneto-Resistance, GMR) wurde im Jahre 1988 von zwei Gruppen unabhängig voneinander entdeckt. Die Entdeckung wurde 2007 mit der Verleihung des Nobelpreises an Albert Fert und Peter Grünberg gewürdigt. Beide Gruppen fanden, dass der elektrische Widerstand eines Schichtsystems bestehend aus ferromagnetischen und nichtmagnetische Schichten davon abhängt, ob die Magnetisierung in benachbarten Schichten parallel (::) oder antiparallel (:;) ausgerichtet ist. Der Magnetowiderstand ist definiert als DR=R
R:;
R:: =R :
VII:5
Er betrug 1,5% für ein Dreischichtensystem [VII.4] und 50% für ein Vielschichtsystem bei tiefen Temperaturen [VII.5]. Das Dreischichtensystem von Binasch et al. [VII.4] besteht aus einem Fe-Cr-Fe-Sandwich (Abb. VII.4), welches auf einem GaAs(110)-Substrat epitaktisch gewachsen war. Die 12 nm dik-
ken Eisenfilme wachsen ebenfalls in (110)-Orientierung, so dass die leichte [100]-Achse und die harte [110]-Achse beide in der Schichtebene liegen. Die Dicke der Chromschicht betrug 1 nm. Ohne äußeres Feld ist die Magnetisierung der Eisenschichten durch die Kopplung über die antiferromagnetische Chromschicht antiparallel zueinander. In einem starken Magnetfeld parallel zur [100] Richtung und zur Schichtebene richten sich die Magnetisierungen parallel zueinander aus (Abb. VII.4 rechts bzw. links). Der parallel zur Schichtebene gemessene Widerstand ist in diesem Fall um 1,5% kleiner. Der Grund für den kleineren Widerstand ist, dass Elektronen aus einer der beiden Eisenschichten beim Durchtritt durch die Chromschicht in die andere Eisenschicht ihren Spin mitnehmen. Ist die Magnetisierungsrichtung der Eisenschichten gleich, findet z. B. ein Spin-up Elektron aus der ersten Schicht einen bezüglich k-Vektor und Energie gleichartigen Zustand in der zweiten Schicht. Es erfährt deshalb nur eine geringfügige Streuung an den Grenzflächen. Bei antiparalleler Magnetisierung sind die Spin-up Zustände der zweiten Eisenschicht auf der Energieskala um die Austauschaufspaltung verschoben (Abb. 8.6). Das Elektron findet in der Regel in der zweiten Eisenschicht keinen passenden Zustand und wird deshalb an der Grenzfläche unter Verlust seiner Vorzugsrich-
Abb. VII.4. Magnetowiderstand in einem Dreischichtensystem nach Binasch et al. [VII.4]. Durch die Kopplung über die antiferromagnetische Chromschicht wird in Abwesenheit eines äußeren Feldes die Magnetisierung der Eisenschichten antiparallel zueinander gehalten. Durch ein äußeres Feld kann eine parallele Magnetisierung der Eisenschichten erzwungen werden. Der elektrische Widerstand ist in diesem Fall um 1,5% geringer
233
tung gestreut, was den elektrischen Widerstand erhöht (siehe auch Kap. 9). Das Schichtsystem in Abb. VII.4 ist noch nicht als Sensor für kleine Magnetfelder geeignet, da der Effekt der Widerstandsänderung bei H = 0 verschwindet. Ein empfindlicher Sensor entsteht durch Kombination mit der Austauschanisotropie. Abb. VII.5 zeigt eine technische Realisierung nach Paul et al. [VII.6]. Die Magnetisierung in der obersten Permalloyschicht ist leicht rotierbar. Darunter befindet sich die beidseitig durch Cobalt begrenzte Kupferschicht für den Magnetowiderstandseffekt. Die Cobaltschichten dienen der Erhöhung des Magnetowiderstands. Eine solche Anordnung wird auch als Spinventil bezeichnet. Die Richtung der Magnetisierung in der unteren NiFe-Schicht ist durch Austauschkopplung an die antiferromagnetische FeMn-Schicht gekoppelt. Abb. VII.5 zeigt die Magnetisierung der gesamten Anordnung (ausgezogene Linie) zusammen mit der Änderung des Widerstands (gestrichelte Linie). Durch die Austauschkopplung ist jetzt der Zusammenhang zwischem äußerem Feld und der Widerstandänderung linear mit sehr steiler Kennlinie. Bereits kleine Feldänderungen führen zu messbaren Widerstandsänderungen. Die Empfindlichkeit des Sensors und die Tatsache, dass er sehr klein gefertigt werden kann, machen
Tafel VII
Der Riesenmagnetowiderstandseffekt (GMR-Effekt)
Tafel VII Magnetismus in Schichtsystemen und GMR-Effekt
Tafel VII
234
Abb. VII.5. Magnetisierung (ausgezogene Linie) und Magnetowiderstand (gestrichelte Linie) eines Sensorsystems nach Paul et al. [VII. 6]). Das Magnetfeld ist in Oestedt angegeben (1 Oe für H ist 1000/4p Am–1)
ihn zum derzeit bevorzugten Sensor in magnetischen Festplattenspeichern.
Literatur VII.1 H. Ibach: Physics of Surfaces and Interfaces (Springer, Berlin Heidelberg New York 2006), p. 445 ff.
VII.2 H. J. Elmers, J. Haunschild, U. Gradmann: Phys. Rev. B 59, 3688 (1999) VII.3 W. H. Meiklejohn, C. P. Bean: Phys. Rev. 102, 1413 (1956) VII.4 G. Binasch, P. Grünberg, F. Saurenbach, W. Zinn: Phys. Rev. B 39, 4828 (1989) VII.5 M. N. Baibich, J. M. Broto, A. Fert, F. Nguyen van Dau, F. Petroff, P. Eitenne, G. Creuzet, A. Friederich, J. Chazelas: Phys. Rev. Lett. 61, 2475 (1988) VII. 6 A. Paul, M. Buchmeier, D. Bürgler, P. Grünberg: J. Appl. Phys. 97, 023910 (2005)
9. Bewegung von Ladungsträgern und Transportphänomene
Wichtige Phänomene, wie die elektrische Leitfähigkeit und die Wärmeleitfähigkeit durch Elektronen, beruhen auf der Bewegung von Ladungsträgern im Festkörper. Die Beschreibung dieser Effekte geht über das bisher Betrachtete hinaus, da wir es mit zeitabhängigen Problemen zu tun haben, bisher aber nur Lösungen der zeitunabhängigen Schrödinger-Gleichung bzw. Aussagen über das thermodynamische Gleichgewicht (Besetzung nach der Fermi-Statistik etc.) betrachtet wurden. Das vorliegende Kapitel beschäftigt sich mit der Fragestellung, wie sich Ladungsträger in Bandstrukturen verhalten, wenn wir z. B. ein äußeres elektrisches Feld anlegen und so das System aus dem thermodynamischen Gleichgewicht herauszwingen. Hierbei ist natürlich der einfachste Fall der des stationären Zustandes, wo die äußeren Einflüsse, z. B. elektrisches Feld oder Temperaturgradient, zeitunabhängig sind.
9.1 Bewegung von Ladungsträgern in Bändern – die effektive Masse Will man die Bewegung von Elektronen im Festkörper beschreiben, so ist man mit dem gleichen Problem konfrontiert, das sich ergibt, wenn die Bewegung eines mehr oder weniger lokalisierten freien Teilchens im Bild einer Wellentheorie dargestellt werden soll: Die Bewegung eines freien Elektrons mit festem Impuls p wird z. B. durch eine unendlich ausgedehnte ebene Welle beschrieben, hierbei bedeutet die Angabe eines scharfen Wellenzahlvektors k das Inkaufnehmen einer totalen Unschärfe im Raum: Die ebene Welle ist längs der gesamten x-Achse definiert. Ist infolge einer Ortsmessung eine Lokalisierung des Elektrons längs einer Strecke Dx gegeben, so bedeutet dies, dass der Impuls bzw. der Wellenvektor über einen bestimmten Bereich Dk unbestimmt ist. Lokalisierung bedeutet, dass der Zustand des Elektrons durch ein Wellenpaket, d. h. eine lineare Superposition von ebenen Wellen mit Wellenzahlen aus einem Bereich {k–Dk/2, k+Dk/2} beschrieben wird, d. h. kDk=2
w
x; t
a
keikx k Dk=2
x
kt
dk ;
9:1
236
9. Bewegung von Ladungsträgern und Transportphänomene
Abb. 9.1. Schematische Ortsdarstellung eines Wellenpaketes (Re {w}: durchgezogene Linie, jwj: gestrichelt), das die Bewegung eines räumlich lokalisierten, freien Elektrons beschreibt, für verschiedene Zeiten t = 0, t0, 2 t0 . . . . Das Zentrum des Wellenpaketes, d. h. im Teilchenbild das Elektron selbst, wandert mit der Gruppengeschwindigkeit v @x=@k, wobei sich die Halbwertsbreite von jwj mit der Zeit vergrößert. Die Wellenlänge der Oszillationen von Re {w} wird beim „Auseinanderlaufen“ des Paketes auf der „Vorderseite“ kleiner und sie wächst auf der „Rückseite“
wobei x (k) im allgemeinen über spezielle Dispersionsbeziehungen gegeben ist. Als Beispiel ist in Abb. 9.1 ein Wellenpaket in seiner Ortsdarstellung gezeichnet. Aus der Fourier-Darstellung (9.1) folgt in der Wellenmechanik die Unschärferelation Dp Dx hDk Dx h :
9:2
Die translatorische Bewegung eines solchen Wellenpaketes lässt sich durch die Angabe der sog. Gruppengeschwindigkeit v
@x ; @k
9:3
d. h. der Geschwindigkeit des Schwerpunktes des räumlich lokalisierten Wellenpaketes beschreiben (zu unterscheiden von der Phasengeschwindigkeit c = x/k einer ebenen Welle!). Hierbei ist zu beachten, dass infolge der Dispersion x = c (k) k, die innerhalb der Schrödingerschen Wellenmechanik schon für das freie Elektron gegeben ist, ein solches Wellenpaket mit der Zeit „auseinanderläuft“, d. h. seine Gestalt verändert. Dies ist in Abb. 9.1 dargestellt. Im Kristall werden Elektronen durch Bloch-Wellen beschrieben, die räumlich modulierte, unendlich ausgedehnte Wellen (Wellenzahlvektor k) darstellen. Ein lokalisiertes Kristallelektron wird also zweckmäßig auch durch die Superposition von Bloch-Wellen zu einem Wellenpaket beschrieben, d. h. die Lokalisierung in einem Raumbereich beinhaltet eine gewisse k-, bzw. Impulsunschärfe, die über die Unschärferelation mit der Ortsunschärfe in Beziehung steht. Die Geschwindigkeit v eines Kristallelektrons ist in dieser semiklassischen Darstellung als Gruppengeschwindigkeit des Wellenpaketes aus Bloch-Wellen gegeben: 1 v rk x
k rk E
k : h
9:4
9.1 Bewegung von Ladungsträgern in Bändern – die effektive Masse
237
Hierbei ist die Energie-Wellenvektorabhängigkeit E (k) desjenigen Bandes einzusetzen, aus dem das Elektron stammt. Diese Darstellung beinhaltet natürlich den Fall des freien Elektrons, wo E = h 2 k 2/2 m ist; dort folgt aus (9.4): v = k h/m = p/m. Folgende Korrespondenzbetrachtung führt uns nun zur semiklassischen Bewegungsgleichung eines Kristallelektrons: Ein Wellenpaket, das ein Kristallelektron mit mittlerem Wellenzahlvektor k beschreibt, erfährt während der Zeit dt in einem äußeren elektrischen Feld E einen Energiezuwachs eE v d t ;
dE
9:5
wobei v die Gruppengeschwindigkeit des Wellenpaketes (9.4) darstellt. Aus (9.4) und (9.5) folgt sofort: dE rk E
k dk hv dk ; h dk h k_
9:6 a
e E dt ;
9:6 b
eE :
9:6 c
Diese Bewegungsgleichung, die für freie Elektronen unmittelbar aus dem Korrespondenzprinzip folgt, besagt also, dass ein äußeres elektrisches Feld den Wellenzahlvektor k eines Kristallelektrons nach Maßgabe von (9.6 c) ändert. Es lässt sich allgemein durch Behandlung der zeitabhängigen Schrödinger-Gleichung im Kristall zeigen, dass (9.6 c) für Wellenpakete von Bloch-Zuständen gilt, wenn nur die betrachteten äußeren elektromagnetischen Felder nicht zu groß (gemessen an atomaren Feldern) sind und nicht zu stark räumlich und zeitlich variieren (gemessen an atomaren Abständen). Die Gln. (9.6) gestatten das Aufstellen einer semiklassischen Bewegungsgleichung für Kristallelektronen in äußeren Feldern, wobei der Einfluss der atomaren Kristallfelder nur noch phänomenologisch in Gestalt der Bandstruktur E (k) erscheint: Aus (9.4) und (9.6) folgt für die Änderung der Gruppengeschwindigkeitskomponente v i eines Kristallelektrons: v_ i
1 d 1 X @2E _
r rk Ei kj ; h dt j @ki @kj h
9:7 a
v_ i
1 X @2E
e E j : h2 j @ki @kj
9:7 b
Diese Bewegungsgleichung ist völlig analog der klassischen Bewegungsgleichung v_ m 1
e E einer punktförmigen Ladung (– e) im Feld E , man hat nur formal die skalare Masse m durch eine tensorielle sog. effektive Masse mij zu ersetzen. Hierbei ist
1 1 @ 2 E
k m ij h2 @ki @kj
9:8
238
9. Bewegung von Ladungsträgern und Transportphänomene
der inverse Massentensor gerade durch die Krümmung des E (k)Verlaufes gegeben. Da der Massentensor mij wie auch (mij)–1 symmetrisch sind, lassen sie sich auf Hauptachsen transformieren. Im einfachen Falle, dass die drei effektiven Massen im Hauptachsensystem gleich m sind, gilt h2 m d 2 E=dk2 :
9:9
Dieser Fall ist gegeben, wenn wir uns im Minimum oder Maximum eines „parabolischen“ Bandes befinden, wo die E (k )-Abhängigkeit in guter Näherung beschrieben werden kann durch h2
9:10
k2 ky2 kz2 : 2 m x In der Umgebung eines solchen kritischen Punktes ist die sog. effektive Massennäherung besonders nützlich, weil hier m eine Konstante darstellt. Außerhalb solcher kritischer Punkte wird wegen der Abweichung der E (k)-Fläche von der Parabelgestalt (9.10) m natürlich von k abhängen. In Abb. 9.2 sind zwei eindimensionale Bandverläufe E (k) mit starker (a) und schwacher Krümmung (b) an den Bandrändern dargestellt. Entsprechend ergeben sich kleine (a) und große (b) effektive Massen an den Bandrändern. Am Brillouin-Zonenrand (obere E
k E0
Abb. 9.2 a, b. Schematische Darstellung der effektiven Masse m
k für ein eindimensionales Bandschema E (k): (a) bei starken Bandkrümmungen, d. h. kleinen effektiven Massen; (b) bei schwachen Bandkrümmungen, d. h. großen effektiven Massen. Die gestrichelten Linien bezeichnen die Lage der Wendepunkte in E (k)
9.2 Ströme in Bändern und Defektelektronen
239
Bandkante), wo die Krümmung negativ ist, ist auch die effektive Masse negativ. Hier zeigt sich ganz klar, dass im effektiven Massenkonzept die Wirkung des periodischen Potentials summarisch in die Größe m hineingesteckt wurde. Es sei noch vermerkt, dass nach dem eben Ausgeführten alle Aussagen in Kap. 6 über das freie Elektronengas in Metallen erhalten bleiben, wenn man nur Elektronen in solchen Bereichen der Energiebänder betrachten muss, wo E (k) durch die Parabelnäherung (9.10) beschrieben werden kann. Man hat also in der Nähe solcher Bandextrema nur die Masse m des freien Elektrons durch die dort konstante effektive Masse m zu ersetzen.
9.2 Ströme in Bändern und Defektelektronen Wegen der in einem Band stark veränderlichen effektiven Masse – am oberen Bandrand bewegen sich Elektronen entgegengesetzt zu denen am unteren – stellt sich unmittelbar die Frage, wie tragen Elektronen mit verschiedenen k-Vektoren, also auf verschiedenen Zuständen im Band, zum elektrischen Strom bei? Ein Volumenelement dk bei k trägt zur Teilchenstromdichte jn djn v
k
dk 1 3 rk E
k dk 3 8p 8p h
9:11
bei, denn die Dichte der Zustände im k-Raum beträgt V/(2 p )3 bzw. 1/(2 p )3, falls man sie auf das Volumen V des Kristalls bezieht. Wir beachten dabei, dass spinentartete Zustände doppelt gezählt werden müssen. Damit tragen alle Elektronen eines voll besetzten Bandes zur elektrischen Stromdichte j wie folgt bei:
e rk E
k dk :
9:12 j 3 8p h 1: Brill: Z:
Da das Band voll besetzt ist, erstreckt sich das Integral über die gesamte erste Brillouin-Zone, d. h., neben jeder Geschwindigkeit v
k rk E
k=h trägt auch v
k zum Integral bei. Da das reziproke Gitter die Punktsymmetrie des Realgitters besitzt (Abschn. 3.2), gilt für Kristallstrukturen mit Inversionszentrum E
k E
k :
9:13
Bezeichnen wir die beiden möglichen Spinzustände eines Elektrons formal mit zwei Pfeilen (: bzw. ;), so lässt sich (9.13) auch auf allgemeine Kristallstrukturen ohne Inversionszentrum verallgemeinern zu E
k" E
k# :
9:14
240
9. Bewegung von Ladungsträgern und Transportphänomene
Der Beweis von (9.14) folgt aus der Zeitumkehrinvarianz der Schrödinger-Gleichung bei Berücksichtigung des Spins. Ohne Berücksichtigung des Spins, d. h. bei Annahme von Spinentartung, gilt also (9.13) allgemein und wir erhalten für die zu k gehörenden Elektronengeschwindigkeiten 1 1 rk E
k v
k : v
k r k E
k
9:15 h h Damit folgt allgemein aus (9.12) für die Stromdichte, die von einem vollen Band getragen wird: j (volles Band) 0 :
9:16
Stellen wir uns jetzt ein Band vor, das nur partiell mit Elektronen besetzt ist, dann wird ein äußeres elektrisches Feld E wegen der Bewegungsgleichung (9.6 c) Elektronen von den symmetrisch um k = 0 verteilten, besetzten Zuständen auf Zustände bewegen, die jetzt nicht mehr symmetrisch um k = 0 liegen. Die Verteilung der besetzten Zustände wird wegen der Auszeichnung einer Richtung durch E nicht mehr inversionssymmetrisch sein, und es folgt j (nicht volles Band) j 0:
9:17
Da jetzt statt über die gesamte Brillouin-Zone wie in (9.12) nur über die besetzten Zustände integriert wird, folgt unter Zuhilfenahme von (9.12) und (9.16):
e j 3 v
k dk 8p k besetzt
e e v
k dk v
k dk ;
9:18 3 8p 8p3 1: Brill: Z: k leer
e j 3 v
k dk : 8p k leer
Die Tatsache, dass bei einem partiell gefüllten Band nur über die besetzten Zustände integriert wird, äußert sich so, dass der Gesamtstrom der Elektronen in diesem Band formal durch einen Strom positiver Teilchen beschrieben werden kann, die den unbesetzten Zuständen (k leer) in diesem Band zugeordnet sind. Man nennt diese Quasiteilchen, für die analoge dynamische Gesetze wie im Abschn. 9.1 für Elektronen hergeleitet werden können, Defektelektronen oder Löcher. Auch bezüglich ihrer Dynamik in einem äußeren Feld zeigen Löcher das Verhalten positiver Teilchen: Ein Band sei fast ganz gefüllt, so dass nur der energetisch höchste Teil in der Nähe eines Maximums ungefüllte Zustände aufweist: im thermodynamischen Gleichgewicht werden natürlich Elektronen immer die energetisch niedrigsten Zustände einnehmen, Löcher sich somit an der Oberkante des Bandes befinden. In der Nähe des Maximums gelte für E (k) die parabolische Näherung
9.3 Streuung von Elektronen in Bändern
E
k E0
h2 k2 : 2jm^j
241
9:19
m^ soll anzeigen, dass es sich um die elektronische effektive Masse an der oberen Bandkante handelt, die dort negativ ist. Für die Beschleunigung, die ein Loch in diesen Zuständen unter dem Einfluss eines elektrischen Feldes erfährt, gilt, wenn man (9.6 c) benutzt: 1 _ e h k E :
9:20 jm^ j jm^j Hierbei ist gemäß (9.18) rk E und _k dem unbesetzten elektronischen Zustand zuzuordnen. Die Bewegungsgleichung (9.20) ist die eines positiv geladenen Teilchens mit positiver effektiver Masse jm^j, d. h., Löchern an der oberen Bandkante muss man eine positive effektive Masse zuordnen. Aus der Tatsache, dass ein vollbesetztes elektronisches Band keinen Strom führen kann, folgt sofort, dass ein Kristall, bei dem eine absolute Bandlücke zwischen dem höchsten besetzten und dem niedrigsten unbesetzten Band existiert, ein Isolator ist. Diese Aussage ist allerdings nur richtig für Temperaturen am absoluten Nullpunkt. Wegen der Endlichkeit der Fermi-Funktion E EF auch für die niedrigsten von Null verschiedenen Temperaturen T gibt es für Tj 0 K immer einige wenige thermisch angeregte Elektronen, die in dem niedrigsten fast unbesetzten Band (genannt Leitungsband) bei Anlegen eines elektrischen Feldes einen Strom führen. Desgleichen werden die durch die thermische Anregung erzeugten Löcher im höchsten besetzten Band, dem sog. Valenzband, einen Strom führen. Bei höheren Temperaturen wird der Strom also sowohl durch Elektronen als auch durch Löcher getragen. Dieses Verhalten ist charakteristisch für Halbleiter und Isolatoren, wobei der Unterschied zwischen Halbleiter und Isolator nur ein gradueller ist. Wie gut ein Material zum Beispiel bei Zimmertemperatur leitet, ist im wesentlichen von der energetischen Breite des verbotenen Bandes abhängig, über das die Elektronen thermisch angeregt werden müssen (Kap. 12). Ein Metall, das bei allen Temperaturen eine im wesentlichen konstante Anzahl freier Ladungsträger besitzt, liegt nach dem vorher Gesagten immer dann vor, wenn ein elektronisches Band nur zum Teil gefüllt ist. Die in diesem partiell gefüllten Band vorhandenen Elektronen sind jene, die wir im Rahmen des Potentialtopfmodells (Kap. 6) betrachtet haben. v_
1 d r rk E
k h dt
9.3 Streuung von Elektronen in Bändern In der bisherigen Betrachtung wurde eine wesentliche Tatsache außer acht gelassen, nämlich die, dass Elektronen, die sich unter dem Einfluss äußerer Felder im Kristall bewegen, Stöße erleiden, die
242
9. Bewegung von Ladungsträgern und Transportphänomene
auf ihre Bewegung hemmend wirken. Wäre dies nicht der Fall, so gäbe es keinen elektrischen Widerstand; ein Strom, der einmal durch ein vorübergehend angelegtes elektrisches Feld hervorgerufen würde, bliebe für immer bestehen wegen der Gültigkeit der semiklassischen Bewegungsgleichung (9.7 b bzw. 9.20). Dieses Phänomen wird als „Supraleitung“ bei vielen Materialien beobachtet (Kap. 10). Normalleiter haben dagegen einen endlichen, oft hohen elektrischen Widerstand. Was sind also die entscheidenden Stoßprozesse, die Elektronen erleiden, wenn sie durch äußere Felder beschleunigt werden? Drude (1900) [9.1] hatte noch angenommen, dass die Elektronen an die im Gitter periodisch angeordneten, positiven Rümpfe stoßen. Daraus müsste man auf eine mittlere freie Weglänge zwi˚ schließen. Dies schen zwei Stößen von der Größenordnung 1–5 A steht aber im krassen Widerspruch dazu, dass bei Zimmertemperatur für die meisten Metalle freie Weglängen gefunden werden, die um etwa zwei Größenordnungen höher liegen (Abschn. 9.5). Die Erklärung der Diskrepanz gelang erst, als man erkannte, dass ein exakt periodisches Gitter, bestehend aus positiven Rümpfen, keinen Anlass zur Elektronenstreuung gibt. Diese Tatsache folgt unmittelbar im Rahmen der Einelektronennäherung, weil durch das Gitter laufende Bloch-Wellen stationäre Lösungen der Schrödinger-Gleichung sind. Diese Lösungen beschreiben also wegen der Zeitunabhängigkeit von ww die ungestörte Ausbreitung von Elektronenwellen. Diese Aussagen gelten natürlich ebenso für Wellenpakete aus Bloch-Wellen, die lokalisierte Elektronen beschreiben. Abweichungen von dieser ungestörten Ausbreitung, d. h. Störungen der stationären Bloch-Zustände, können nur auf zweierlei Art zustande kommen: I) Im Rahmen der Einelektronennäherung, wo Wechselwirkungen der Elektronen untereinander vernachlässigt werden, sind Abweichungen von der strengen Periodizität des Gitters die Ursache für Elektronenstreuung, dies können sein: a) zeitlich und räumlich fest eingebaute Störstellen im Gitter (Lücken, Versetzungen, Fremdatome usw.), b) zeitlich veränderliche Abweichungen von der Periodizität, d. h. Gitterschwingungen. II) Die Einelektronennäherung vernachlässigt Wechselwirkungen zwischen den Elektronen. Elektron-Elektron-Stöße, die also im Konzept des nicht wechselwirkenden Fermi-Gases nicht enthalten sind, können sehr wohl zu einer Störung der stationären Bloch-Zustände führen. Wie wir sehen werden, ist dieser Effekt von weitaus geringerer Bedeutung als die unter I) angeführten Störungen der Gitterperiodizität. Die entscheidende Größe für die Beschreibung eines Elektronenstreuprozesses ist die Übergangswahrscheinlichkeit wk' k, mit der ein Elektron aus einem Bloch-Zustand wk (r) in einen Zustand wk' (r) übergeht durch die Wirkung einer der vorher beschriebenen
9.3 Streuung von Elektronen in Bändern
243
Störungen. Diese Übergangswahrscheinlichkeit ist nach der quantenmechanischen Störungsrechnung (die Störung des HamiltonOperators sei H 0 ):
wk0 k jhk0 jH 0 jkij2 j drwr0
rH 0 wk
rj2 ;
9:21 d. h., wegen der „Bloch-Gestalt“ von wk (r) gilt
0 0 0 hk jH jki druk0 e i k r H 0 uk ei k r :
9:22
Läßt sich das Störpotential H 0 als Ortsfunktion schreiben, so ist (9.22) zu vergleichen mit dem Fourier-Integral (3.6), das bei der Beugungstheorie an periodischen Strukturen die Beugungsamplitude beschrieb. Man muss nur
uk0 H 0 uk mit der streuenden Elektronendichte R (r) nach (3.6) vergleichen. Durch Vergleich mit den Rechnungen der Beugung an ortsfesten und sich bewegenden Streuzentren (Kap. 3 und Abschn. 4.4) können wir sofort folgern: Wenn H 0 (r) ein zeitlich unveränderliches Potential wie das einer raumfesten Störstelle ist, dann erwarten wir nur elastische Streuung der Bloch-Wellen mit Erhaltung der Energien. Ist H 0 (r, t) ein zeitlich veränderliches Potential, so wie wir es bei der Störung der Periodizität durch eine Gitterwelle (Phonon) haben, dann ist die Streuung inelastisch (Abschn. 4.4). Analog zu den Ergebnissen im Abschn. 4.4 gilt also bei der inelastischen Streuung von Leitungselektronen an Phononen der Energiesatz: E
k0
E
k hx
q :
9:23
Für Streuung an einem im Kristall angeregten Phonon der Wellenzahl q hat zu einem festen Zeitpunkt dies Störpotential H 0 natürlich eine Ortsabhängigkeit exp (i q·r ), d. h., die Streuwahrscheinlichkeit (9.21) enthält ein Matrixelement (9.22) der Gestalt:
0 hk0 jei q r jki druk0 uk ei
k k q r :
9:24 Da
uk0 uk gitterperiodisch ist und sich deshalb in eine FourierReihe nach reziproken Gittervektoren entwickeln lässt, ergibt sich genau wie im Abschn. 4.3, dass das Matrixelement in (9.24) von Null verschieden ist, wenn gilt: k0
kqG:
9:25
Bis auf den reziproken Gittervektor G ähnelt diese Beziehung einem Impulserhaltungssatz. Man beachte jedoch, dass k nichts anderes als der Wellenvektor eines Bloch-Zustandes, d. h. eine Quantenzahl, ist. Nur für das freie Elektron ist h k der wirkliche Impuls. Nimmt man jedoch die Energieerhaltung (9.23) mit der k-Erhaltung (9.25) zusammen, so lässt sich genau wie im Abschn. 4.3 einsehen, dass die Stöße von Elektronen in Bloch-Zuständen gut im Teilchenbild beschrieben werden können.
244
9. Bewegung von Ladungsträgern und Transportphänomene
Verlässt man die Einelektronennäherung und betrachtet ElektronElektron-Stöße, dann lässt sich in einer Vielteilchenbeschreibung auch zeigen, dass der Energieerhaltungssatz sowie der Wellenzahlerhaltungssatz (Quasiimpulssatz) gelten, d. h., für einen Zweierstoß (1) + (2) ? (3) + (4) von Elektronen muss gelten: E1 E2 E 3 E 4 ;
9:26
wo Ei = E (ki) die Einteilchenenergie eines Elektrons im nichtwechselwirkenden Fermi-Gas bezeichnet. Ferner muss für die entsprechenden k-Vektoren gelten: k1 k2 k3 k4 G :
9:27
Man würde naiverweise erwarten, dass bei einer Packungsdichte der Größenordnung eines Elektrons pro Elementarzelle und der Stärke der Coulomb-Abstoßung eine hohe Wahrscheinlichkeit für Stöße [beschrieben durch (9.26 u. 9.27)] besteht. Das Pauli-Ausschließungsprinzip verbietet jedoch in hohem Maße Stöße dieser Art: Nehmen wir an, ein Elektron besetze den Zustand E1 > EF , also einen angeregten Zustand knapp oberhalb der Fermi-Energie; das zweite, damit stoßende Elektron befinde sich energetisch innerhalb der Fermi-Kugel: E2 < EF . Damit ein Stoß nach E3 und E4 erfolgen kann, verlangt das Pauli-Prinzip, dass E3 und E4 nicht besetzt sind, d. h., für das Zustandekommen des Stoßes muss neben (9.26) gelten: E1 > EF ; E 2 < E F ; E3 > EF ; E 4 > E F :
9:28 a
Damit folgt aus dem Energiesatz (9.26): E1 E2 E3 E4 > 2EF
9:28 b
bzw.
E1
EF
E2
EF > 0 :
9:28 c
Wenn (E1–EF) < e1 (e1EF), d. h. E1 nur wenig oberhalb der FermiFläche liegt (Abb. 9.3), dann muss wegen (9.28 c) |E2 –EF| =|e2| < e1 sein, d. h., E2 darf nur wenig (*e1) unterhalb von EF liegen. Deshalb
Abb. 9.3. Veranschaulichung eines Elektronen-Zweierstoßes im k-Raum (EF ist die Fermi-Kugel): Zwei Elektronen (1) und (2) mit den Wellenvektoren k1 und k2 stoßen und ändern dabei ihre Wellenvektoren in k3 und k4. Energie und Wellenzahlvektoren bleiben erhalten; ferner können wegen des Pauli-Prinzips nur k3, k4-Vektoren nach dem Stoß erreicht werden, die zu unbesetzten Zuständen (E3 > EF , E4 > EF) gehören
9.4 Boltzmann-Gleichung und Relaxationszeit
245
stellt nur der Bruchteil *e1/EF aller Elektronen Stoßpartner für ein Elektron auf E1 dar. Wenn E1 und E2 in einer Schale ± e1 um EF liegen, müssen wegen (9.28 b, c) sowie wegen der k-Erhaltung (9.27) auch E3 und E4 in der Schale ± e1 um EF liegen. Die k-Erhaltung in der Form k1– k3 = k4– k2 bedeutet, dass in Abb. 9.3 die Verbindungsstrecken (1) – (3) und (2) – (4) gleich lang sind. Da als Endzustände also auch nur der Bruchteil *e1/EF aller besetzten Zustände infrage kommt, verringert die Gültigkeit des Pauli-Prinzips die Stoßwahrscheinlichkeit noch einmal um einen Faktor e1/EF. Die „Temperaturaufweichung“ der Fermi-Funktion ist von der Größenordnung k T, so dass der Zustand E1 in diesem Bereich oberhalb von EF liegt, d. h. e1*k T. In Abhängigkeit von der Temperatur T lässt sich also die Verringerung des Streuquerschnittes für Elektron-Elektron-Stöße durch das Pauli-Prinzip wie folgt abschätzen: !2 kT R/ R0 :
9:29 EF Hierbei ist R0 der Streuquerschnitt, der ohne Gültigkeit des PauliPrinzips für ein klassisches Gas von abgeschirmten Punktladungen gelten würde. Nehmen wir an, dass der Streuquerschnitt für Streuung eines Elektrons an einer im Gitter eingebauten Störstelle (z. B. geladener Rumpf eines Fremdatoms) von der Größenordnung dieses R0 ist – in beiden Fällen handelt es sich um abgeschirmte CoulombFelder –, so muss für die Elektron-Elektron-Streuung die Streuwahrscheinlichkeit bei der Temperatur von 1 K um einen Faktor *10–10 unter der für Elektron-Störstellenstreuung liegen (EF/k wurde zu etwa 105 K angenommen, Abschn. 6.2, Tabelle 6.1). Diese einfachen Überlegungen zeigen einmal von einer anderen Seite her, wie das Pauli-Prinzip dafür verantwortlich ist, dass wir trotz der hohen Elektronendichte im Festkörper in vielen Fällen die Elektronen als nicht miteinander wechselwirkend beschreiben können. Zum anderen folgt, dass wir im weiteren bei der Behandlung der elektrischen Leitfähigkeit von Festkörpern im wesentlichen nur noch Streuung der Elektronen an Störstellen und an Phononen berücksichtigen müssen. Im Kapitel „Supraleitung“ (10.3) werden wir die Diskussion der Elektron-Elektron-Streuung erneut aufnehmen.
9.4 Boltzmann-Gleichung und Relaxationszeit Transportphänomene, wie z. B. elektrischer Stromfluss im Festkörper, beinhalten zwei charakteristische, entgegengesetzt wirkende Mechanismen: treibender Einfluss von äußeren Feldern und hemmende Wirkung von Stößen der den Strom tragenden Ladungsträger an Phononen und Störstellen. Das Zusammenspiel beider Mechanis-
246
9. Bewegung von Ladungsträgern und Transportphänomene
men wird durch die sog. Boltzmann-Gleichung beschrieben. Mit Hilfe dieser Gleichung lässt sich ermitteln, wie sich die Verteilung der Ladungsträger im thermischen Gleichgewicht dadurch ändert, dass äußere Kräfte wirken und Stöße der Elektronen stattfinden. Im thermischen Gleichgewicht, d. h. bei homogenen Temperaturverhältnissen und ohne äußere Felder, ist diese Verteilungsfunktion nichts anderes als die im Abschn. 6.3 abgeleitete Fermi-Verteilung 1
f0 E
k e
k
E
k EF = T
1
:
9:30
Wir bezeichnen hier diese Gleichgewichtsverteilung, die natürlich wegen der im thermischen Gleichgewicht gegebenen Homogenität nicht vom Ort r abhängt, mit f0. Außerhalb des Gleichgewichts, wo wir nur noch lokales Gleichgewicht über Bereiche groß gegen die atomaren Dimensionen voraussetzen, kann die gesuchte Nichtgleichgewichtsverteilung f (r, k, t) auch von Ort und Zeit abhängen; r und k für ein Elektron ändern sich durch äußere Felder und Stöße. Zur Ableitung von f berücksichtigen wir zuerst einmal die Wirkung äußerer Felder, um dann Stöße im Nachhinein als Korrektur einzuführen. Wir betrachten, wie sich f im Laufe der Zeit von t–dt nach t ändert. Falls nur ein elektrisches Feld E anliegt, war zur Zeit t–dt die r und k Koordinate (e positiv): r
v
kdt
bzw:
k
eE dt=h
9:31
Ohne Stöße muss jedes Elektron von r– v dt und k+e E dt/h bei t–dt auch bei r, k zur Zeit t erscheinen, d. h. f
r; k; t f
r
v dt; k e E dt=h; t
dt :
9:32
Diese Beziehung muss ergänzt werden, weil zusätzlich zu den durch die Bewegungsgleichungen (9.31) beschriebenen Änderungen berücksichtigt werden muss, dass Elektronen innerhalb von dt durch Stöße nach r und k kommen können bzw. von dort weggestoßen werden können. Beschreiben wir die Änderung von f durch Stöße summarisch in Form von (@f =@t)St, so lautet die richtige Bilanzgleichung: @f f
r; k; t f
r v dt; k e E dt=h; t dt dt :
9:33 @t St Entwicklung bis zu linearen Gliedern in dt ergibt: @f e @f E rk f v rr f : @t h @t St
9:34
Dies ist die Boltzmann-Gleichung, die den Ausgangspunkt zur Behandlung von Transportproblemen im Festkörper darstellt. Man bezeichnet die Terme auf der linken Seite als Driftterme und den bisher nicht näher spezifizierten Term auf der rechten als Stoßterm. In diesem Term ist die gesamte Atomistik der im Abschn. 9.3 kurz angedeuteten Streumechanismen enthalten.
9.4 Boltzmann-Gleichung und Relaxationszeit
247
Mit den in Abschn. 9.3 allgemein betrachteten quantenmechanischen Übergangswahrscheinlichkeiten wk'k!jhk 'jH 'j kij2 vom Bloch-Zustand wk nach wk ' lässt sich der Stoßterm in voller Allgemeinheit sofort angeben:
@f
k V dk0 f1 f
kwkk0 f
k0 1 f
k0 wk0 k f
kg : @t St
2p3
9:35 Hierbei werden im ersten Summanden des Integranden alle Stöße von besetzten k '-Zuständen auf den unbesetzten Zustand k betrachtet, während im zweiten Summanden alle Stöße berücksichtigt werden, die ein Elektron von k weg auf irgendeinen anderen Zustand k ' befördern. Denkt man sich (9.35) in (9.34) eingesetzt, so sieht man, dass die Boltzmann-Gleichung in ihrer allgemeinsten Form eine komplizierte Integro-Differentialgleichung zur Bestimmung der Nichtgleichgewichtsverteilung f (r, k, t) darstellt. Bei sehr vielen Problemen macht man deshalb für den Stoßterm (9.35) einen plausiblen Ansatz, den sog. Relaxationszeitansatz: Hier wird summarisch angenommen, dass die zeitliche Rate, mit der sich f durch Stöße in die Gleichgewichtsverteilung f0 zurückbewegt, umso größer ist, je stärker die Abweichung von f von der Gleichgewichtsverteilung f0 ist, d. h. @f f
k f0
k :
9:36 @t St s
k Die sog. Relaxationszeit s (k) ist dabei nur noch von den Zustandspunkten im k-Raum abhängig, die im Bild lokalisierter Elektronen den Zentren der Wellenpakete entsprechen. Im Falle nichthomogener Verhältnisse muss in (9.36) die Relaxationszeit s (k, r) auch als abhängig vom Ort r angenommen werden. Die Verteilung f (r, k, t) ist dann jeweils in Volumenelementen dr definiert, die groß gegenüber atomaren Dimensionen, aber klein gegenüber Längen sind, längs derer sich die makroskopischen Größen wie Strom, Wärmestrom etc. merklich ändern. Die Annahme des Relaxationszeitansatzes beinhaltet, dass Stöße nichts anderes machen, als eine Nichtgleichgewichtsverteilung ins thermische Gleichgewicht zurückzutreiben. Die Bedeutung der sog. Relaxationszeit wird noch klarer, wenn wir den Fall betrachten, dass ein äußeres Feld abgeschaltet wird: Ein äußeres Feld sei also für eine stationäre Nichtgleichgewichtsverteilung fstat (k) verantwortlich, denken wir uns das äußere Feld abgeschaltet, dann gilt vom Augenblick t des Abschaltens an: @f @t
f
f0 s
:
9:37
Mit der Anfangsbedingung f (t = 0, k) = fstat hat die Boltzmann-Gleichung (9.37) die Lösung
248
f
9. Bewegung von Ladungsträgern und Transportphänomene
f0
fstat
f0 e
t=s
:
9:38
Die Abweichung der Verteilung f von der Gleichgewichtsverteilung f0 (k) klingt also exponentiell mit der Abklingzeit s (Relaxationszeit) ab. Die Relaxationszeit ist also die Zeitkonstante, mit der eine Nichtgleichgewichtsverteilung bei Abschalten der äußeren Störung durch Stöße ins Gleichgewicht relaxiert. Weiter gestattet die Boltzmann-Gleichung die näherungsweise Berechnung einer stationären Nichtgleichgewichtsverteilung, die sich unter dem Einfluss eines äußeren Feldes, z. B. des elektrischen Feldes E , einstellt. Aus (9.34) und (9.36) folgt für den stationären Zustand (d. h. @f =@t 0), wenn f nicht mehr vom Ort abhängt (d. h. rr f = 0): e E rk f f
k f0
k=s
k ;
9:39 h e
9:40 f
k f0
k s
k E rk f
k : h Diese Differentialgleichung für f (k) lässt sich näherungsweise durch ein Iterationsverfahren lösen, bei dem auf der rechten Seite im
r rk f -Term f im ersten Schritt durch die Gleichgewichtsverteilung f0 angenähert wird. Das ergäbe eine in E lineare Lösung für f, die, wiederum in (9.40) eingesetzt, zu einer in E quadratischen Lösung führen würde. Sukzessives Einsetzen der Lösungen führt dann zu einer Entwicklung der Nichtgleichgewichtsverteilung f (k) nach Potenzen des äußeren Feldes E . Ist man nur an Phänomenen interessiert, die linear vom äußeren Feld abhängen, wie z. B. dem Ohmschen Strom in einem Festkörper, so beschränkt man sich auf die Ermittlung der ersten Näherung, wo f linear von E abhängt, d. h., wo in rk f nur die Gleichgewichtsverteilung f0 berücksichtigt wird. So ergibt sich die sog. linearisierte Boltzmann-Gleichung zur Bestimmung der Nichtgleichgewichtsverteilung e
9:41 a f
k ' f0
k s
k E rk f0
k : h In der betrachteten Näherung für kleine elektrische Felder, d. h. geringer Abweichung vom thermischen Gleichgewicht (linearisiertes Problem), lässt sich (9.41 a) als Entwicklung von f0 (k) um den Punkt k wie folgt auffassen: e f
k ' f0 k s
k E :
9:41 b h Die sich unter dem Einfluss eines äußeren Feldes E und der Wirkung von Stößen (beschrieben durch s) einstellende stationäre Verteilung lässt sich somit als eine um e s E =h verschobene Gleichgewichts-Fermi-Verteilung darstellen, wie es in Abb. 9.4 gezeigt ist. Es ist interessant, sich die Wirkung elastischer sowie inelastischer Elektronenstreuung auf die Einstellung des Gleichgewichtes im k-Raum zu veranschaulichen: Der stationäre Zustand der Ver-
9.4 Boltzmann-Gleichung und Relaxationszeit
249
Abb. 9.4 a, b. Schematische Darstellung der Wirkung eines konstanten elektrischen Feldes Ex auf die Verteilung „quasifreier“ Elektronen im k-Raum. (a) Die FermiKugel der Gleichgewichtsverteilung [gestrichelt, zentriert um (0, 0, 0)] erscheint im stationären Zustand um dkx = – e sEx/ h verschoben (in durchgezogener Linie). (b) Die Änderung der Fermi-Verteilung f [ E (k)] gegenüber der Gleichgewichtsverteilung f0 (gestrichelte Linie) ist nur merklich in der Umgebung der Fermi-Energie bzw. des Fermi-Radius kF
Abb. 9.5 a, b. Schematische Darstellung von Elektronenstreuprozessen im k-Raum: Die Fermi-Fläche im thermodynamischen Gleichgewicht (E = 0) ist gestrichelt gezeichnet. Die durch das elektrische Feld Ex verschobene Fermi-Kugel bei stationärem Stromfluss ist in durchgezogener Linie dargestellt. (a) Bei Abschalten des Feldes relaxiert die verschobene Fermi-Kugel in die Gleichgewichtsverteilung dadurch, dass Elektronen von den besetzten Zuständen (*) in unbesetzte Zustände (*) gestreut werden. Da die Zustände A und B verschiedene Abstände vom Nullpunkt des k-Raumes haben, handelt es sich bei den das Gleichgewicht einstellenden Stößen um inelastische Stöße (z. B. an Phononen). (b) Bei nur elastischen Stößen (von Zustand A nach B ) würde sich die Fermi-Kugel „aufblähen“. Nach Abschalten des Feldes kann sich das Gleichgewicht (gestrichelte Fermi-Kugel) nur durch inelastische Stöße (B nach C ) einstellen
250
9. Bewegung von Ladungsträgern und Transportphänomene
teilung ist in Abb. 9.5 (durchgezogen) als verschobene Fermi-Kugel dargestellt. Denkt man sich das äußere Feld abgeschaltet, so relaxiert die verschobene Kugel in die Gleichgewichtsverteilung (gestrichelt) zurück. Nur inelastische Stöße (Abb. 9.5 a) können diese Wiedereinstellung des Gleichgewichtes bewirken. Gäbe es nur elastische Stöße, z. B. bei Störstellenstreuung, so würde sich niemals mehr das Gleichgewicht einstellen, die Fermi-Kugel würde sich unter der Wirkung nur elastischer Stöße aufblähen (Abb. 9.5 b).
9.5 Die elektrische Leitfähigkeit von Metallen Lange bevor eine genauere Theorie des Festkörpers vorlag, hatte Drude [9.1] um 1900 herum die metallische Leitfähigkeit durch die Annahme eines idealen Elektronengases im Festkörper beschrieben. Unter dem Einfluss eines äußeren Feldes E gilt hierbei für ein Elektron die klassische Bewegungsgleichung: m mv_ v D e E :
9:42 s Der hemmenden Wirkung von Stößen wurde durch den Reibungsterm m·v D/s Rechnung getragen, wo v D = v–v therm die sog. Driftgeschwindigkeit, d. h. die zusätzlich zur thermischen Geschwindigkeit v therm durch das Feld erzeugte Geschwindigkeit, bedeutet. Da bei Abschalten des Feldes in (9.42) v mit der Abklingzeit s exponentiell gegen die thermische Geschwindigkeit relaxiert, hat auch hier s die Bedeutung einer Relaxationszeit. Für den stationären Fall (v_ = 0) folgt es E vD
9:43 m und damit für die Stromdichte j in Feldrichtung: e2 sn E :
9:44 m Hierbei ist n die Volumendichte aller freien Elektronen und die Beweglichkeit l ist definiert als Faktor zwischen Driftgeschwindigkeit und äußerer Feldstärke. Im Drudeschen Modell ergibt sich damit für die elektrische Leitfähigkeit j
env D nel E
e2 ns
9:45 m und für die Beweglichkeit der Elektronen es l :
9:46 m Zu bemerken ist, dass in dieser einfachen Modellvorstellung alle freien Elektronen den Strom tragen. Diese Vorstellung steht im Widerspruch zu den Aussagen des Pauli-Prinzips, das für das Fermi-Gas der Elektronen verbietet, dass Elektronen weit unterhalb der Fer-
r j= E
9.5 Die elektrische Leitfähigkeit von Metallen
251
mi-Energie durch das Feld Energie aufnehmen können, da alle benachbarten, energetisch höheren Zustände besetzt sind. Um die materialspezifische elektrische Leitfähigkeit auf atomistische Größen der Bandstruktur zurückzuführen, müssen wir wiederum wie im Abschn. 9.2 den Strom betrachten, der von Elektronen getragen wird, die auf Zuständen im k-Raumelement dk sitzen. In (9.11 u. 9.12) für die Teilchen- bzw. elektrische Stromdichte war von vornherein angenommen worden, dass nur über besetzte Zustände des k-Raumes summiert, d. h. integriert wurde. Allgemein möchte man über alle Zustände der ersten Brillouin-Zone aufsummieren, ungeachtet der Tatsache, ob sie besetzt oder unbesetzt sind. Um nur die wirklich besetzten Zustände zu erfassen, muss deshalb noch die Besetzungswahrscheinlichkeit f (k) des Zustandes k berücksichtigt werden, um die Teilchenstromdichte jn analog zu (9.11) anzugeben:
1 v
kf
kdk :
9:47 jn 3 8p 1: Brill: Z:
Da wir uns auf lineare Effekte im äußeren Feld, d. h. Ohmsches Gesetz, beschränken, genügt es, f (k) in der linearisierten Form (9.41 a) einzusetzen. Für ein elektrisches Feld E x in x-Richtung folgt damit für die elektrische Stromdichte:
e dk v
kf
k ; j 8p3
e es
k @f0 Ex dk v
k f0
k :
9:48 @kx 8p3 h Für ein isotropes Medium und für kubische Gitter verschwinden die y- und z-Komponenten von j, wenn das elektrische Feld in x-Richtung weist. Mit anderen Worten: der i. allg. tensorielle Zusammenhang zwischen Stromdichte j und elektrischem Feld E wird ein skalarer. jy jz 0 :
9:49
Da über die gesamte Brillouin-Zone integriert wird und f0 (k) inversionssymmetrisch um k = 0 ist, fällt das Integral über v x f0 weg. Weiter gilt mit @f0 @f0 hv x ; @kx @E
e2 @f0 2 E : jx x dkv x
ks
k 8p3 @E Für die spezifische elektrische Leitfähigkeit folgt deshalb:
e2 @f0 r jx = E x : dkv 2x
ks
k 3 8p @E
9:50
9:51
9:52
Da die „Aufweichungszone“ der Fermi-Funktion von der Größenordnung 4 k T (Abschn. 6.3) ist und f0 (E) außerhalb fast Null oder
252
9. Bewegung von Ladungsträgern und Transportphänomene
eins ist mit einem Verlauf um EF , der inversionssymmetrisch um den Punkt (EF , f0 (EF) = 1/2) ist, gilt in guter Näherung @f0 @E
d
E
EF :
9:53
Diese Näherungsbeziehung ist anschaulich evident, die Ableitung soll hier nicht gezeigt werden. Mit Hilfe von (9.53) folgt aus (9.52) unmittelbar mit dk dfE dk? dfE r'
dE dE dfE ; jr rk Ej hv
k
9:54
EF ;
9:55
e2 v 2
k dfE dE x s
kd
E 3 8p h v
k
und wegen der Eigenschaft der d-Funktion:
2 e2 v x
k r' 3 s
kdfE : 8p h v
k
9:56
EEF
Im allgemeinen Fall variieren natürlich v (k) und s (k) noch auf der Fermi-Fläche. In (9.56) kann aber ein Mittelwert hv 2x
ks
k=v
kiEF über die Fermi-Fläche aus dem Integral herausgezogen werden. Im Falle einer „Fermi-Kugel“, d. h. für quasifreie Elektronen mit konstanter effektiver Masse m (siehe unten), ist dieser Mittelwert gleich dem Wert v
EF s
EF =3 selbst. Die elektrische Leitfähigkeit r eines Metalls lässt sich also zurückführen auf ein Flächenintegral über die Fermi-Fläche E (k) = EF im k-Raum und es treten nur noch Elektronengeschwindigkeiten v
EF und Relaxationszeiten s (EF) von Elektronen auf der Fermi-Fläche in der atomistischen Formel auf. Der Ausdruck (9.56) drückt also genau die Tatsache aus, dass infolge des PauliPrinzips nur Elektronen in der Nähe der Fermi-Energie für den Stromtransport in Metallen relevant sind. Anschaulich lässt sich dies auch aus Abb. 9.4 u. 9.5 schließen. Elektronen weit unterhalb der Fermi-Energie merken von der geringfügigen stationären Verschiebung der Fermi-Kugel im k-Raum um
es= h E x nichts. Für den einfachen Fall, dass das Leitungsband eines Metalles (Näherung: k T EF ) nur Elektronen in einem Energiebereich enthält, wo die Parabelnäherung mit einer konstanten effektiven Masse m gültig ist, lässt sich (9.56) weiter auswerten: Für Elektronen in einem exakt parabolischen Band (quasifreie Elektronen) gilt
9:57 a v
EF hkF =m und
dfE 2
4pkF2 : EF
9:57 b
9.5 Die elektrische Leitfähigkeit von Metallen
Ferner gilt wegen
253
k T EF :
2
4=3p kF3 ; d: h: kF3 3p2 n :
9:57 c 8p3 Damit folgt für die elektrische Leitfähigkeit r und für die Beweglichkeit l : n
r'
e2 s
EF n m
9:58 a
und es
EF :
9:58 b m Die Beziehungen gleichen formal den im Drude-Modell (9.45, 9.46) ermittelten, nur dass die dort nicht näher spezifizierte Relaxationszeit in Wirklichkeit die der Elektronen an der Fermi-Kante ist und dass statt der freien Elektronenmasse m die effektive Masse m eingeht. Die im Drude-Modell auftretende Gesamtelektronenkonzentration n der Elektronen im Leitungsband erscheint in den richtigen Formeln (9.58 a u. b) aufgrund der formalen Integration über den k-Raum (9.52) und nicht, wie man im Drude-Modell annimmt, weil alle Elektronen am Stromtransport teilnehmen. Die Ähnlichkeit der Formeln (9.58 a u. b) mit (9.45 u. 9.46) erklärt jedoch, warum für viele Zwekke das Drude-Modell zu befriedigenden Ergebnissen führt. Es sei noch vermerkt, dass für Halbleiter, wo eine stark temperaturabhängige Ladungsträgerkonzentration n im Leitungsband (Abschn. 9.2 und Kap. 12) den Strom trägt, eine Auswertung von Formel (9.52) natürlich zu komplizierten Mittelwerten über s (k) – statt zu (9.58 a u. b) – führt. Um die Temperaturabhängigkeit des metallischen Widerstands zu verstehen, ist nur eine Betrachtung der Temperaturabhängigkeit von s (EF) bzw. l erforderlich, denn für ein Metall ist die Elektronenkonzentration n temperaturunabhängig. Statt einer rigorosen quantenmechanischen Berechnung der Streuwahrscheinlichkeiten wk'k (Abschn. 9.3) soll im folgenden eine qualitative Diskussion der beiden Streumechanismen – Phononenstreuung und Störstellenstreuung – durchgeführt werden. Unter der Voraussetzung, dass beide Streumechanismen voneinander unabhängig sind, ergibt die Summe beider Streuwahrscheinlichkeiten die Gesamtstreuwahrscheinlichkeit. Die Streuwahrscheinlichkeit ist umgekehrt proportional zur mittleren freien Flugzeit sFZ eines Ladungsträgers und damit umgekehrt proportional zur Relaxationszeit; deshalb gilt l'
1 1 1 s sPh sSt
9:59
mit sPh der mittleren freien Flugzeit für Phononenstreuung bzw. sSt der Flugzeit für Störstellenstreuung. Diese Betrachtung liefert uns schon den wesentlichen Temperaturverlauf des spezifischen Widerstandes eines Metalls. Es gilt
254
9. Bewegung von Ladungsträgern und Transportphänomene
nämlich, dass die Zahl der Stöße pro Zeiteinheit proportional zum Streuquerschnitt R und der Geschwindigkeit v der Teilchen ist: 1/s!Rv. Für Metalle ist v einfach die Geschwindigkeit auf der Fermi-Fläche v
EF und damit also temperaturunabhängig. Für Störstellenstreuung ist der Wirkungsquerschnitt R ebenfalls temperaturunabhängig. Die Störstellenstreuung führt also zu einem temperaturunabhängigen Anteil des spezifischen Widerstandes RSt. Für Phononenstreuung kann man den Streuquerschnitt für die Streuung an einem Phonon als proportional zum mittleren Quadrat der Schwingungsamplitude hs2
qi des betreffenden Phonons (Wellenvektor: q, Frequenz: xq ) ansetzen (Kap. 5). Im klassischen Grenzfall höherer Temperaturen gilt nach dem Gleichverteilungssatz Mx2q hs2
qi k T ;
T H
9:60
wobei M die schwere Masse der Rümpfe darstellt. Damit folgt:
kT 1 hs2
qi : Mx2q sPh
9:61 a
Die Phononenfrequenzen xq enthalten im wesentlichen Information über die elastischen Eigenschaften des Materials. Eine grobe Abschätzung ergibt sich, wenn man xq durch die Debyesche Abschneidefrequenz xD = k H/ h (Abschn. 5.3) ersetzt. Mit H als Debye-Temperatur folgt dann: MH2 fur T H :
9:61 b T Für Temperaturen T < H hat man mit einer stark abnehmenden Phononanregung und wegen der abnehmenden Phononenergie bevorzugt mit Kleinwinkelstreuung zu rechnen. Mittels einer exakteren Theorie konnte Grüneisen [9.2] für T < H einen für alle Metalle universellen Ausdruck für den spezifischen Widerstand RPh (T)*1/rPh infolge von Phononenstreuung angeben
sPh
H=T
5
RPh
T A
T=H
0
ex
x5 dx ; 1
1 e x
9:62
der für tiefe Temperaturen wie T 5 mit der Temperatur geht. Wir können also nach (9.59) den spezifischen Widerstand R = 1/r *1/s eines Metalls als Summe eines temperaturunabhängigen sog. Restwiderstandes RSt (durch Störstellen) und eines für höhere Temperaturen in T linearen Anteils RPh (T) (durch Phononenstreuung) angeben: R RPh
T RSt :
9:63
Dieser zuerst experimentell gefundene Sachverhalt wird als Matthiesensche Regel bezeichnet. Diese Regel (9.63) gilt aber nur näherungsweise.
9.5 Die elektrische Leitfähigkeit von Metallen
255
Abb. 9.6. Elektrischer Widerstand R von Natrium bezogen auf den Wert R290 K bei Raumtemperatur in Abhängigkeit von der Temperatur T. Die Messpunkte (*, *, `) entstammen Messungen an drei verschiedenen Proben mit verschieden hoher Störstellenkonzentration. (Nach McDonald u. Mendelssohn [9.3])
Abbildung 9.6 zeigt den experimentell gemessenen elektrischen Widerstand von Na bei tiefen Temperaturen: Unterhalb von etwa 8 K ist der temperaturunabhängige Restwiderstand zu erkennen, der von den Störstellenkonzentrationen in den betreffenden Proben abhängt. Bei höheren Temperaturen erscheint der durch die Grüneisen-Formel (9.62) beschriebene Phononenanteil, der schließlich oberhalb von etwa 18 K in einen linearen Zusammenhang RPh*T einmündet. In Abb. 9.7 ist für nicht zu tiefe Temperaturen der additive Einfluss der Störstellenkonzentration (Ni-Verunreinigungen) auf den Widerstand von Kupfer dargestellt.
Abb. 9.7. Spezifischer Widerstand R von „reinem“ Kupfer und von KupferNickel-Legierungen verschiedener Zusammensetzung. (Nach Linde [9.4])
256
9. Bewegung von Ladungsträgern und Transportphänomene
Abb. 9.8. Universelle Auftragung des reduzierten Widerstandes (R/RH) über der auf die Debye-Temperatur H bezogenen Temperatur für verschiedene Metalle
Abbildung 9.8 zeigt, dass die universelle Grüneisen-Formel (9.62), bei der der Widerstand zweckmäßigerweise über einer reduzierten Temperatur T/H (bezogen auf Debye-Temperatur) aufgetragen wird, für eine Reihe von Metallen gut erfüllt ist. Außerdem ist der lineare Anstieg des Widerstandes R mit T für höhere Temperaturen gut zu erkennen. Der Vollständigkeit halber soll noch erwähnt werden, dass magnetische Störstellen infolge der Spinwechselwirkung zusätzlich einen ganz besonderen Streumechanismus in Metallen verursachen können, der bei kleinen Temperaturen (T < 20 K) statt eines konstanten Restwiderstandes ein Minimum in R (T) verursacht. Dieses Phänomen trägt den Namen Kondo-Effekt.
9.6 Thermoelektrische Effekte Bei der Berechnung der elektrischen Leitfähigkeit (9.56) mit Hilfe der Boltzmann-Gleichung (9.34) in der Relaxationszeit-Näherung (9.36) hatten wir der Einfachheit halber eine homogene Temperatur T über den Leiter (d. h. rr T = 0) vorausgesetzt. Lassen wir diese Voraussetzung fallen, so ändert sich die Verteilungsfunktion f (k) sowohl durch ein äußeres elektrisches Feld E wie auch durch den vorhandenen Temperaturgradienten rr T j 0; die Einstellung der Gleichgewichtsverteilung f0 (k) durch Stöße werde wieder durch den Relaxationszeit-Ansatz (9.36) beschrieben. Für den stationären Zustand E_ 0; @
r rr T=@t 0; @f =@t 0 folgt dann aus (9.34 u. 9.36) für die Nichtgleichgewichtsverteilung:
9.6 Thermoelektrische Effekte
257
e f
k f0
k s E rk f sv rr f :
9:64 h rr T und unter der Annahme kleiner Es gilt rr f k; T
r
@f =@Tr Störungen lässt sich (9.64) analog zu (9.41 a) linearisieren, d. h. es folgt: e @f0
9:65 f
k f0
k s E rk f0 s v rr T : @T h Um die in x-Richtung resultierende elektrische Stromdichte zu berechnen, setzen wir diesen Ausdruck (9.65) in die Beziehung für die Stromdichte (9.48) ein. Die beiden ersten Terme in (9.65), insbesondere der in E x lineare, ergeben analog zur Rechnung in Abschn. 9.5 (9.49–9.52) das Ohmsche Gesetz, so dass die Stromdichte sich schreiben lässt als
e @f0 @T jx r E x 3 dk s v 2x :
9:66 @T @x 8p Es ist ganz instruktiv, das Integral unter den Annahmen einer kugelförmigen Fermifläche und einer Abhängigkeit der Relaxationszeit nur von der Energie auszuwerten. Unter Verwendung der Definition der Zustandsdichte (7.41) erhält man:
1 @f0 @T E :
9:67 jx r x e dEs
Ev 2
ED
E @T @x 3 Da die Ableitung @f0 =@T nur in der Nähe der Fermi-Energie von Null verschieden ist, kann man s (E) und v 2 (E) als Mittelwert sF und v 2F aus dem Integral herausziehen. Das verbleibende Integral ist proportional zur Ableitung der Zustandsdichte nach der Energie D0
EF , wie man durch Entwicklung um E EF und Verwendung von (6.43–6.45) zeigen kann p2 2 @T ev F sF k 2 TD0
EF :
9:68 9 @x Bei der Ableitung von (9.66) wurde stillschweigend vorausgesetzt, dass die Fermi-Energie EF als konstant angenommen werden kann. Dies ist bei Metallen in guter Näherung der Fall (s. Kap. 6). Bei Halbleitern (s. Kap. 12) ist jedoch mit einem Temperaturgradienten @T=@x eine beträchtliche Abhängigkeit der Fermi-Energie EF (r) vom Ort gegeben. Durch die Ortsableitung der Verteilung f in (9.34) kommt deshalb i. allg. auch eine Ableitung der Fermi-Energie nach dem Ort @EF =@x ins Spiel und wir müssen (9.66) ganz allgemein schreiben: @T 0 12 jx r E x L xx ;
9:69 @x
jx r E x
wobei E 0 E e 1rr EF
r eine verallgemeinerte elektrische Feldstärke ist, die der ortsabhängigen Fermi-Energie Rechnung trägt. L 12 xx ist ein sog. Transportkoeffizient [Definition durch (9.66)], der
258
9. Bewegung von Ladungsträgern und Transportphänomene
dafür verantwortlich ist, dass mit einem Temperaturgradienten i. allg. ein elektrischer Stromfluss verknüpft ist. Neben der Berechnung des elektrischen Stromes gestattet die Boltzmann-Gleichung auch die Berechnung des Wärmestromes durch Elektronen, der in einem Festkörper bei Anliegen eines elektrischen Feldes E und bei gegebenem Temperaturgradienten rr T fließt. Die transportierte Wärmemenge dQ hängt über folgende thermodynamische Relation mit der Entropieänderung dS bzw. der Änderung der inneren Energie dU und der Teilchenzahl dn zusammen (EF: chemisches Potential, d. h. Fermi-Energie): dQ TdS dU
EF dn :
9:70
Mit jE als Energie- bzw. jn als Teilchenstromdichte folgt für die Wärmestromdichte: jQ jE
EF j n ;
9:71
–1
dk E (k) v (k) f (k, r) gilt. Analoges Einsetzen der wobei jE = (8 p3) linearisierten Nichtgleichgewichtsverteilung (9.65) führt auch hier zu einer linearen Beziehung zwischen jQ , E 0 (bzw. E ) und rr T wie in (9.69). Allgemein lassen sich also folgende Gleichungssysteme für den elektrischen und den Wärmestrom in Abhängigkeit von ihren Ursachen, verallgemeinerte Feldstärke E 0 und Temperaturgradienten rr T, angeben: j L
11
jQ L
E 0 L
21
12
E 0 L
rr T ;
22
rr T :
9:72 a
9:72 b
Für allgemeine nicht-kubische Kristalle sind die Transportkoeffizienten L ij natürlich Tensoren und ihre allgemeine Darstellung [z. B. (9.66) für L 12 xx ] führt zu interessanten Relationen dieser Koeffizienten untereinander, auf die hier nicht eingegangen wird. Wir wollen nur den durch (9.72 a u. b) ausgedrückten physikalischen Sachverhalt noch einmal zusammenfassen: Ein elektrisches Feld sowie ein Temperaturgradient rufen sowohl einen elektrischen Strom wie auch einen Wärmestrom hervor; insbesondere lässt sich auch durch einen Temperaturgradienten ein elektrisches Feld erzeugen. Eine Leiterschleife, bestehend aus zwei verschiedenen Metallen A und B, sei offen bzw. nur über ein sehr hochohmiges Voltmeter geschlossen (Abb. 9.9 a). Die beiden Lötstellen, wo die Metalle zusammenstoßen, befinden sich auf verschiedener Temperatur T1 j T2 j T0. Wegen j = 0 folgt aus (9.72 a) (wir setzen innerhalb eines Metalls E 0 E ):
E x
L
11
1
L
12
@T=@x K@T=@x :
9:73
K heißt absolute Thermokraft und ist eine materialspezifische Größe. Wir betrachten also ein eindimensionales Problem, wo x längs des Drahtes läuft. Die Umlaufspannung, die vom Voltmeter in Abb. 9.9 a gemessen wird, ist:
9.6 Thermoelektrische Effekte
259
Abb. 9.9. (a) Schematische Anordnung zur Messung des Seebeck-Effektes: Falls die Lötstellen zwischen den beiden Metallen A and B auf verschiedener Temperatur T1 j T2 j T0 sind, tritt an den Enden der Leiterschleife eine sog. Thermospannung auf. (b) Schematische Anordnung zur Messung des Peltier-Effektes: Stromfluss durch die auf homogener Temperatur sich befindende Leiterschleife führt zu einem Wärmetransport von der Lötstelle (1) zur Lötstelle (2) zwischen den Metallen A und B
1 U
2
0
E B dx E A dx E B dx
0
1
2
2
1
@T @T dx KA dx KB @x @x 2
1
T
2
KA
KB dT :
9:74
T1
Die sog. Thermospannung, die bei diesem thermoelektrischen Effekt (auch Seebeck-Effekt genannt) gemessen wird, hängt also von der Temperaturdifferenz T2–T1 sowie vom Unterschied der absoluten Thermokräfte KA und KB ab. Dieser Effekt wird beim Thermoelement (aufgebaut nach dem Schema der Abb. 9.9 a) zur Messung von Temperaturen benutzt. Es gibt auch den inversen Effekt, den sog. Peltier-Effekt, der sich aus (9.72 b) herleitet. In Abb. 9.9 b sei längs der Leiterschleife die Temperatur konstant, d. h. @T=@x 0, dann gilt: j Q L
21
E
und
j L
11
E
;
9:75
und somit j Q L
21
L
11
1 j Pj :
9:76
P heißt Peltier-Koeffizient. Legen wir wie in Abb. 9.9 b eine Batterie an die Leiterschleife, so wird die elektrische Stromdichte j nach (9.76) von einer Wärmestromdichte begleitet, und es fließt in A gerade PA j, während in B aber PB j transportiert wird. An der einen Lötstelle (1) muss also die Wärme (PA–PB) j zuströmen, die dann bei der Lötstelle (2) wieder abgeführt wird. Punkt (1) wird kälter, während Punkt (2) wärmer wird. Man benutzt diesen Peltier-Effekt zur einfachen und gut regelbaren Kühlung.
260
9. Bewegung von Ladungsträgern und Transportphänomene
9.7 Das Wiedemann-Franz-Gesetz Wie in Abschn. 9.6 angedeutet, lassen sich aus der expliziten Darstellung der Transportkoeffizienten L ij als Integrale über die linearisierte Nichtgleichgewichtsverteilung f (k, r) nach (9.65) Beziehungen zwischen diesen Koeffizienten herleiten. Insbesondere lässt sich eine Beziehung zwischen der elektrischen Leitfähigkeit r und dem Anteil der Wärmeleitfähigkeit kE, der durch Leitungselektronen (wie auch r ) getragen wird, herleiten. r ist im wesentlichen durch L 11 und kE durch L 22 gegeben. Unter Verwendung von (9.65, 9.71) erhält man die Wärmestromdichte @f0 @T 2 :
9:77 jQx dk
E EF v x
ks
k @T @x Für eine kugelförmige Fermi-Fläche und unter der Annahme, dass s nur von der Energie abhängt, können wir wie in den Gleichungen (9.66–9.68) das Integral auf die elektronische spezifische Wärme zurückführen und man erhält für die Wärmeleitfähigkeit kE: kE 13 v 2F s
EF cv :
9:78
Für das freie Elektronengas wird daraus (6.50) p2 s
EF n k 2 T=m :
9:79 3 Die elektrische Leitfähigkeit stellte sich nach (9.58 a) als r = e 2 s (EF) n/m dar, so dass der Quotient !2 p2 k kE =r T
9:80 3 e kE
linear von der Temperatur abhängt. Dieses Gesetz heißt Wiedemann-Franz-Gesetz und der Faktor p 2 k 2/3 e 2 Lorenz-Zahl L. Der theoretische Wert – nach (9.80) – für die Lorenz-Zahl ist L 2;45 10 8 W X K
2
:
9:81
Tabelle 9.1 zeigt einige experimentell ermittelte Werte der LorenzZahl bei 0 °C, die eine relativ gute Übereinstimmung mit dem Wert in (9.81) selbst für Übergangsmetalle zeigen. Bei tiefen Temperaturen (T H; H: Debye-Temperatur) nimmt der Wert für L i. allg. stark ab. Für Cu z. B. ist L bei 15 K um eine Größenordnung kleiner als in Tabelle 9.1 für 0 °C angegeben. Der Grund für die Abweichungen ist darin zu sehen, dass bei tiefen Temperaturen elektrische und thermische Relaxationszeiten nicht mehr übereinstimmen. Wir können uns diesen Unterschied beider Relaxationszeiten in einem einfachen Bild klarmachen: Ein elektrischer Strom entsteht durch Verschiebung der Fermi-Kugel um einen Betrag dk (Abb. 9.4), ein Wärmestrom dagegen dadurch, dass Elektronen mit
9.8 Elektrische Leitfähigkeit durch lokalisierte Elektronen
261
Tabelle 9.1. Experimentell ermittelte Werte für die Lorenz-Zahl L = kE /rS bei 0 °C. Die Werte stammen aus publizierten Daten für elektrische und Wärmeleitfähigkeit Metall
L (10–8 WX/K2)
Na Ag Au Cu Pb Pt
2,10 2,31 2,35 2,23 2,47 2,51
dem Wellenzahlvektor +kF im Mittel eine andere Temperatur als Elektronen mit –kF haben. Für die Relaxation eines elektrischen Stromes sind deshalb Streuprozesse mit Wellenzahlvektoren von der Größenordnung q = 2 kF erforderlich, für die Relaxation des Wärmestromes genügen dagegen q-Vektoren von der Größenordnung q & k T/hv F , die die Elektronen in der Nähe der Fermi-Kante von Zuständen höherer Energie in Zustände niedrigerer Energie bzw. umgekehrt bringen. Bei genügend hohen Temperaturen ist der Unterschied beider Streuprozesse nicht so wichtig. Bei tiefen Temperaturen aber stehen für Phononenstreuung vorzugsweise Phononen mit kleinen q zur Verfügung. Also wird bei tiefen Temperaturen die Wärmeleitfähigkeit im Verhältnis kleiner sein: die LorenzZahl L nimmt mit der Temperatur ab.
9.8 Elektrische Leitfähigkeit durch lokalisierte Elektronen In diesem Kapitel wurden bislang ausschließlich Transportphänomene betrachtet, die auf der Bewegung von delokalisierten Elektronen in Bändern beruhen. Die vollständige Delokalisation von Elektronen ist eine Folge der Translationsinvarianz kristalliner Festkörper. In Abschn. 7.6 war gezeigt worden, dass in amorphen Festkörpern Elektronen sowohl delokalisiert als auch lokalisiert sein können. Für amorphes Silizium und Germanium hatten wir begründet, warum insbesondere die Elektronen in den Ausläufern von Valenzund Leitungsband lokalisiert sind, während die Elektronen in Zuständen weiter entfernt von der Energielücke delokalisiert bleiben. In diesem Abschnitt diskutieren wir den möglichen Beitrag lokalisierter Elektronen zur elektrischen Leitfähigkeit. Wir betrachten dazu ein einfaches Modell einer Zustandsdichte mit lokalisierten Zuständen unterhalb einer „Beweglichkeitskante“ Eb und delokalisierten Zuständen darüber (Abb. 9.10). Die Zustände sind umso stärker lokalisiert und örtlich umso mehr voneinander entfernt, je niedriger die
262
9. Bewegung von Ladungsträgern und Transportphänomene Energie E
E
Abb. 9.10. Elektronische Zustände eines amorphen Festkörpers (schematisch). In der linken Hälfte ist die Zustandsdichte dargestellt und rechts die Energieterme im Ortsraum. Unterhalb von Eb sind die Zustände lokalisiert, oberhalb delokalisiert. Die Ausdehnung der Wellenfunktion einzelner Zustände nimmt mit Annäherung an die Beweglichkeitskante zu
E
Zustandsdichte D(E)
b
F
Ortskoordinate x
Energie ist. Die Leitfähigkeit in einem solchen System hängt von der Lage des Fermi-Niveaus relativ zur Beweglichkeitskante ab. Wenn das Fermi-Niveau oberhalb der Beweglichkeitskante liegt, dann ist die Leitfähigkeit so wie bei einem kristallinen Metall mit hoher Defektkonzentration. Liegt das Fermi-Niveau nur wenige k T unterhalb der Beweglichkeitskante, dann gibt es genügend viele Ladungsträger in den delokalisierten Zuständen oberhalb der Beweglichkeitskante und die Leitfähigkeit wird von diesen Elektronen dominiert. Die Leitfähigkeit ist dann proportional zur Besetzungswahrscheinlichkeit der Zustände oberhalb der Beweglichkeitskante also r r0 e
k
Eb EF = T
:
9:82
Liegt das Fermi-Niveau mehr als einige k T unterhalb der Beweglichkeitskante, dann wird die Leitfähigkeit von den lokalisierten Elektronen getragen. Die Elektronenbewegung beruht in diesem Fall auf dem Tunnelprozess, d. h. Elektronen tunneln von einem lokalisierten Zustand zu einem benachbarten Zustand. Häufig wird der Prozess auch als ein Hüpfen der Elektronen von einem Platz zum nächsten beschrieben (engl. hopping conduction). Voraussetzung für den Tunnelprozess eines lokalisierten Elektrons und damit für einen Beitrag zur elektrischen Leitfähigkeit ist, dass sich die Wellenfunktionen eines besetzten Zustandes und eines unbesetzten Zustandes überlappen. Die Amplitude lokalisierter Wellenfunktionen fällt in größerer Entfernung vom Zentrum exponentiell mit der Entfernung vom Zentrum. Die Wahrscheinlichkeit p für ein Hüpfbzw. Tunnelprozess eines Elektrons von einem Platz i zum nächsten Platz j im Abstand rij ist deshalb proportional zu p
rij / e
rij
:
9:83
Die Größe ist ein Parameter, der das Abklingen der Wellenfunktion beschreibt. Notwendigerweise muss die Energie des Ausgangs-
9.8 Elektrische Leitfähigkeit durch lokalisierte Elektronen
263
zustands Ei unterhalb des Fermi-Niveaus und die Energie des Endzustands Ej oberhalb des Fermi-Niveaus liegen. Es gilt also Ej > Ei. Die Sprungwahrscheinlichkeit ist deshalb auch proportional einem Boltzmann-Faktor, der die Differenz zwischen Ej und Ei berücksichtigt. Damit wird die Wahrscheinlichkeit für einen Sprung zwischen den Zuständen i und j p
rij ; Ej ; Ei / e
rij
e
k
Ej Ei = T
:
9:84
Die Leitfähigkeit ist proportional zur Summe über alle möglichen Sprungwahrscheinlichkeiten p (rij, Ej, Ei). Wir betrachten die möglichen Sprünge zu einem festen Zustand j mit definierter Endenergie Ej aus einem Kontinuum von Anfangszuständen Ei, die innerhalb einer Kugel vom Radius rij < R um den Zustand j herum liegen. Ein Sprung ist nur möglich, wenn innerhalb der Kugel mit dem Radius R wenigstens ein Zustand mit der Energie Ei < Ej liegt. Zur Vereinfachung der Rechnung wird jetzt zusätzlich angenommen, dass die Zustandsdichte in dem Energiebereich um die Fermi-Energie konstant ist. Diese Bedingung ist tatsächlich nicht gut erfüllt (Abb. 9.10). Die Bedingung für die Existenz eines Anfangszustands, aus dem heraus ein Sprung erfolgen kann, ist damit 4p 3 R D
EF
Ej Ei > 1 : 3 Alle Sprünge mit E < Emax Ej
9:85
3 4pR3 D
EF
9:86
sind also erlaubt. Die gesamte Sprungrate und damit die Leitfähigkeit ist proportional zu r/e
R
E
max
e
k
Ej E= T
dE / e
R
e
k
3=
4pR3 D
EF T
:
9:87
1
Diese Funktion verschwindet für große R, da dann der Tunnelprozess beliebig unwahrscheinlich wird. Sie verschwindet auch für R ? 0, da es dann keine Energieterme in der Umgebung gibt. Zwischendurch hat die Funktion ein Maximum und zwar dort, wo der Wert des Exponenten minimal wird: ! d 3 0:
9:88 R dR 4pR3 D
EF k T Das Minimum liegt bei einem Radius Rm
9 4pD
EF k T
!1=4 :
9:89
264
9. Bewegung von Ladungsträgern und Transportphänomene -6
Abb. 9.11. Abhängigkeit der Leitfähigkeit von amorphem Silizium von der Temperatur (offene Kreise, nach [9.7]). Die experimentellen Daten werden einigermaßen durch das Mottsche Gesetz mit einen Exponenten von 1/4 wiedergegeben. Ein Exponent von 1/2 würde eine noch bessere Anpassung an die experimentellen Werte ermöglichen
-1
-1
ln(σ (Ω cm ))
-8 -10 -12 -14
experimentelle Daten
-16
1/4
σ=σ0exp(-(T0/T) )
-18 50
100
150
200
250
300
Temperatur (K)
Für T = 300 K, eine Zustandsdichte von 5·105 cm–3 und ein von 107 cm–1 ergibt sich z. B. eine optimale Sprungweite von 5·10–6 cm. Setzt man diesen Wert für Rm in (9.87) ein, erhält man für die Leitfähigkeit folgende Abhängigkeit von der Temperatur: r/e
T0 =T1=4
mit
T0
43 : 9pD
EF k
9:90
Diese Temperaturabhängigkeit der Leitfähigkeit lokalisierter Elektronen wurde zuerst von Mott hergeleitet [9.6]. Experimentelle Werte für die Leitfähigkeit von amorphem Si werden durch (9.90) recht annehmbar beschrieben (Abb. 9.11). Eine noch bessere Anpassung an die experimentellen Daten ergibt sich allerdings, wenn als Wert des Exponenten etwa 1/2 statt 1/4 angenommen wird. Der wesentliche Grund dafür ist, dass die Zustandsdichte für amorphes Si im Bereich des Fermi-Niveaus nicht konstant ist, sondern mit der Energie ansteigt (Abb. 9.10, 7.15).
9.9 Quantentransport in Nanostrukturen In den vorangegangenen Abschnitten haben wir den Elektronentransport beim Stromfluss in makroskopisch ausgedehnten Festkörpern betrachtet. Der Wellencharakter des Elektrons bei der Propagation durch den Kristall trat abgesehen von der Beschreibung der Streuprozesse nicht in Erscheinung. Er geht auf dem Weg von einem elektrischen Kontakt zum anderen verloren, weil inelastische Streuprozesse die Phasen der Elektronenwellen statistisch verändern. Dies wird anders, wenn man elektronischen Transport in mesoskopischen Strukturen oder Nanostrukturen, insbesondere bei tiefen Temperaturen betrachtet. Nanostrukturen lassen sich heute mit
9.9 Quantentransport in Nanostrukturen
265
lithographischen Methoden (Tafel XVIII) herstellen; sie begegnen uns überdies in Halbleiterbauelementen. In Metall- und Halbleiterproben mit typischen Dimensionen zwischen fünf und einigen hundert Nanometern beobachtet man Quantenkorrekturen zum elektrischen Leitwert, die auf Phasenbeziehungen zwischen den propagierenden Elektronenwellen zurückzuführen sind. Die Beobachtbarkeit solcher Effekte hängt stark von den Dimensionen des betrachteten Leiters ab. Es ist entscheidend, wie viele Streuprozesse, elastisch wie inelastisch, im betrachteten leitenden Volumen stattfinden. Hierbei sind verschiedene, einem propagierenden Elektron zuzuordnende charakteristische Längen im Vergleich zu den Leiterdimensionen zu betrachten. Die elastische freie Weglänge le beschreibt den mittleren freien Abstand zwischen zwei elastischen Streuprozessen, bei denen das Elektron seine kinetische Energie nicht ändert. Die Phase der Elektronenwelle kann dabei zwar um einen festen, wohldefinierten Betrag verschoben werden, unterliegt jedoch nicht statistischen Schwankungen, sodass feste Phasenbeziehungen zwischen verschiedenen Teilwellen erhalten bleiben. Solche elastischen Streuprozesse ereignen sich an Störungen des Gitters wie Fremdatomen, Versetzungen und Oberflächen (Abschn. 9.3). Da nur Elektronen in der Nähe der Fermi-Kante zum Stromtransport beitragen, ergibt sich die elastische freie Weglänge zu le v F se ;
9:91
wo se die mittlere freiepFlugzeit zwischen zwei elastischen Streu prozessen und v F h 2pn=m die Fermi-Geschwindigkeit ist (Abschn. 6.2). In zweidimensionalen Elektronengasen mit metallischem Charakter und extrem hohen Elektronenbeweglichkeiten in Halbleiterheterostrukturen (Abschn. 6.2) kann le bei tiefen Temperaturen Werte bis zu 10 lm erreichen. Die Streuung von Elektronen an Phononen oder die ElektronElektron-Streuung sind inelastisch, also mit Energieübertrag verknüpft. Das Elektron trifft auf ein sich in der Zeit änderndes Streuzentrum. Die Phase der elektronischen Wellenfunktion ändert sich deshalb beim Streuprozess in statistischer Weise. Inelastische Streuung ist deshalb phasenbrechend. Diesen Streuprozessen ist die inelastische freie Weglänge lin als charakteristische Größe zugeordnet. Hiervon zu unterscheiden ist die Phasenkohärenzlänge lU, die angibt, welche Distanz ein Elektron zurücklegen kann, ohne seine Phase statistisch geändert zu haben. Wenn Spin-Flip (Spin-Umklapp) Prozesse bei der Streuung vernachlässigt werden können, ist lU gleich der inelastischen freien Weglänge lin. Spin-Flip Streuung ändert ebenfalls die Phase in statistisch schwankender Weise, sie kann jedoch elastisch sein. Deshalb können lU und lin verschieden sein. Bei tiefen Temperaturen, wo inelastische Phononstreuung gegenüber Streuung an Störstellen eine geringere Rolle spielt, gibt es meist viele elastische, phasenerhaltende Streuprozesse, bevor die
266
9. Bewegung von Ladungsträgern und Transportphänomene
Phase gebrochen wird. Hier gilt also lU le. Das Transportregime mit nur elastischer, phasenerhaltender Streuung nennt man diffusiv. Eine weitere wesentliche Länge ist die Wellenlänge der Elektronen, die den Stromtransport tragen, also die Fermi-Wellenlänge kF = 2p/kF. Sie ist durch die Fermi-Energie EF bzw. die FermiWellenzahl kF gegeben (Abschn. 6.2). Bei Metallen mit ihrer hohen Elektronenkonzentration liegt kF unterhalb eines Nanometers, während in quasimetallischen zweidimensionalen Elektronengasen (2DEG) in einer Halbleiterheterostruktur (Abschn. 12.7) Werte zwischen 50 und 100 nm erreicht werden. Wie in der Lichtwellenoptik tritt der Wellencharakter der Elektronen erst in Erscheinung, wenn die Strukturgrößen der Leiterbahnen im Bereich von kF liegen. Eindimensionaler Transport Stellen wir uns einen quasi-eindimensionalen Draht mit einem Durchmesser von der Größenordnung der Fermi-Wellenlänge kF und einer Länge Lz le vor, dann sind die Dimensionen der leitenden Struktur kleiner als alle freien Weglängen le, lin und lU. Der Elektronentransport durch diesen Draht wird als ballistisch bezeichnet, da ein Elektron auf seinem Weg von einem Kontakt zum anderen keinen Streuprozess erleidet (Abb. 9.12 a). Man könnte denken, dass der Draht in diesem Fall keinen Widerstand aufweist. Das ist aber nicht so!
Abb. 9.12. Elektronentransport zwischen zwei Kontakten längs eines Nanodrahtes. (a) Ballistischer Transport, bei dem innerhalb des Transportkanals (eingegrenzt durch schraffierte Bereiche) kein Streuprozess stattfindet. (b) Diffusiver Transport, bei dem im Leitungskanal nur elastische Streuprozesse an Störstellen erfolgen, die eine feste Phasenbeziehung vor und hinter dem Kanal gewährleisten. (c) Zustandspunkte in der reziproken kxky-Ebene eines ballistischen eindimensionalen Leitungskanals, die im Realraum dem Querschnitt des Kanals zugeordnet ist. Die Punkte bezeichnen erlaubte k-Vektoren; ihr lateraler Abstand ist durch die Breiten Lx und Ly des als rechteckig angenommenen Leiters bestimmt. Die durchgezogene Linie stellt den Fermi-Kreis für das zweidimensionale Problem dar. Die Anzahl von eindimensionalen (1D) Subbändern, die am ballistischen 1D-Transport teilnehmen, ist durch die Anzahl der Punkte im Fermi-Kreis gegeben
9.9 Quantentransport in Nanostrukturen
267
Um den Widerstand zu ermitteln, berechnen wir zuerst, wie viele elektronische Zustände in den Draht hineinpassen, also den Strom tragen können. Entlang des Drahtes in z-Richtung sind die Eigenzustände Blochwellen, unterliegen also allenfalls den üblichen periodischen Randbedingungen. Die Berandung in der xyEbene hingegen setzt die feste Randbedingung, dass die Wellenfunktion am Rand Null sein muss. Zur Berechnung der Zahl der Zustände betrachten wir einen Fermi-Kreis in der kx,ky-Ebene des reziproken Raumes. Wegen der festen Randbedingungen, ist nur ein Viertelsektor (kx > 0, ky > 0) des Fermi-Kreises relevant (Abschn. 6.1). Die Zustandspunkte auf den kx- und ky-Achsen sind ausgeschlossen, da sie zu verschwindenden Wellenfunktionen führen (Abschn. 6.1). Mittels Abb. 9.12 c lässt sich die Anzahl der erlaubten Zustände N als das Verhältnis des Fermi-Kreissektors zur Fläche p2/LxLy eines Zustandes (mit Spinentartung) ermitteln: ( ) Lx Ly 1 2 1 p 1p 1p p pk N 2 kF kF p 4 F 2 Lx 2 Ly 4 Lx Ly kF2 kF 1 Lx Ly
Lx Ly :
9:92 4p 2p 4 Der Produktterm mit LxLy entspricht der Fläche des Kreissegments in Abb. 9.12c, während die anderen Terme aus dem Ausschluss der achsennahen Bereiche bei der Zählung resultieren. Für kleine Drahtquerschnitte (Lx, LyLz) wird die Zahl der Zustände N eine diskrete Funktion von Lx und Ly. Bei einem minimalen Durchmesser passt schließlich nur noch ein Zustand der kxky-Ebene in den Draht hinein, nämlich dann, wenn der Punkt kx = p/Lx, ky =p/Ly gerade noch in den Fermikreis passt, der Punkt kx = 2p/Lx, ky =p/Ly bzw. kx = p/Lx, ky =2p/Ly jedoch nicht. Für den Fall Lx = Ly heißt das, dass p p p 2 p 5 < Lx;y <
9:93 KF kF
sein muss. Da das Elektron bezüglich der z-Richtung eine BlochWelle bleibt, haben wir es mit einem eindimensionalen Band zu tun. Sind mehrere Werte von kx, ky möglich, so gehört zu jedem Wertepaar ein eindimensionales Band. Diese Bänder werden Subbänder genannt. Für den Fall freier Elektronen stellt sich die Energie im Subband dar als h2 kz2 ;
9:94 3m wo ei die aus der kx,ky-Quantisierung folgenden diskreten Energieniveaus sind und der zweite Term die kinetische Energie resultierend aus der freien Bewegung längs z beschreibt. Die Energien der Subbänder sind also eine Abfolge von Parabeln, die jeweils einen Transportkanal beschreiben (Abb. 9.13 a). Ei ei
kx ; ky
268
9. Bewegung von Ladungsträgern und Transportphänomene
E
Abb. 9.13. Eindimensionaler ballistischer Transport: (a) Energiezustände E als Funktion des Wellenvektors kz in Richtung des eindimensionalen Leiters. Die verschiedenen Parabeln (Subbänder) resultieren aus der Quantisierung in x,y-Richtung senkrecht zum Leiter. (b) Schema des eindimensionalen Leiters, der durch zwei Kontakte links und rechts begrenzt wird, in denen thermodynamisches Gleichgewicht angenommen wird. (c) Darstellung im Bänderschema: Die metallischen Kontakte links und rechts sind durch eine Besetzung der elektronischen Zustände bis zu den jeweiligen chemischen Potentialen (Fermi-Niveaus) lL und lR beschrieben. Für den ballistischen Stromtransport im Draht sind nur die Zustände relevant, die energetisch zwischen lL und lR liegen. Die Differenz von lL und lR ist durch die elektrische Spannung zwischen den Kontakten gegeben
Wir rechnen jetzt den Strom aus, der durch ein einzelnes Subband zwischen zwei Kontakten (links und rechts, Abb. 9.13 b) getragen wird. Die Kontakte stellen Elektronenreservoire dar, die jeweils in sich im thermodynamischen Gleichgewicht sind und deren Elektronen die unterschiedlichen chemischen Potentiale lL und lR besitzen. Der Potentialunterschied ist durch die elektrische Spannung U gegeben. lL
lR eU :
9:95
Nur die Zustände zwischen lL und lR können Elektronen von links nach rechts tragen (Abb. 9.13). Der Strom in einem Subband i ist dann (vgl. 9.47) ZlL Ii e
1
Di
Ev i
EdE :
9:96
lR
Hierbei ist v i
E
1 @Ei h @kz
9:97
die Gruppengeschwindigkeit der Elektronen im i-ten Subband
1 (Abb. 9.13a) und Di die eindimensionale Zustandsdichte des Subbandes i. Letztere ist gemäß Abschn. 6.1 oder (7.41)
9.9 Quantentransport in Nanostrukturen
D
1
E
1 : p@E=@kz
269
9:98
Durch Einsetzen von (9.97) und (9.98) in (9.96) folgt mit (9.95) 2e2 U:
9:99 h Jeder Leitfähigkeitskanal oder jedes Subband besitzt unter der Voraussetzung von Spinentartung bei ballistischem Transport also den gleichen und deshalb universellen Leitwert
Ii
2e2 7;74809 10 5 X 1 1=
129064 X :
9:100 h Bei Aufhebung der Spinentartung, z. B. durch ein starkes Magnetfeld (Quanten-Hall-Effekt, Tafel XVI) hat dieses sogenannte Leitfähigkeitsquantum den halben Wert e2/h. Passen mehrere Transportkanäle oder Subbänder in den ballistischen Draht, dann trägt jeder Kanal mit dem Wert (9.100) zum Gesamtleitwert bei. Die experimentelle Beobachtung der Quantisierung des Leitwertes ist in 1D-Strukturen möglich. Die Bedingung (9.93) bedeutet, dass bei metallischen Proben mit kF 1Å–1 (Tabelle 6.1) der Drahtdurchmesser von der Größe eines Atoms sein muss. In speziellen Halbleiterstrukturen lassen sich metallische Elektronengase auch mit deutlich kleinerem Fermi-Vektor herstellen (Abschn. 12.7). Entsprechend größer können die Strukturen sein, in denen sich ballistischer Quantentransport realisieren lässt. Die Beobachtung erfordert dann aber auch tiefe Temperaturen [9.8]. Metallischer Quantentransport ist schon bei Zimmertemperatur beobachtbar. Dabei ist es nicht unbedingt notwendig, die erforderlichen atomaren Strukturen explizit herzustellen. Der Effekt kann auch beim Brechen eines Metallkontaktes in einem konventionellen mechanischen Relais beobachtet werden [9.9]. In Abb. 9.14 ist die gemessene Zeitabhängigkeit des Leitwertes beim Brechen eines AuCo-Kontaktes in einem solchen Relais aufgetragen. Die beobachteten Stufen sind auf atomare 1D-Leitfähigkeitskanäle (N = 6–0) zurückzuführen, die sich G0
Abb. 9.14. Leitwertsprünge in einem konventionellen Relais mit AuCo-Kontakten, gemessen bei Zimmertemperatur (nach Hansen et al. [9.9])
270
9. Bewegung von Ladungsträgern und Transportphänomene
kurz vor dem endgültigen Bruch des Kontaktes in Form von Atomketten ausbilden und dann sukzessive auseinanderreißen. Aharonov-Bohm und Altshuler-Aronov-Spivak Oszillationen Der Wellencharakter von Elektronen tritt am deutlichsten bei Interferenzen in Erscheinung, so wie sie uns in der Elektronenbeugung an Kristalloberflächen oder beim Durchgang eines Elektrons durch einen Doppelspalt begegnen. Ein zur Doppelspaltbeugung analoges Experiment kann an Nanostrukturen durchgeführt werden, in denen der Transport phasenerhaltend über zwei räumlich getrennte Transportkanäle geschieht, die anschließend wieder zusammengeführt werden (Abb. 9.15). Die einfachste Anordnung ist eine Ringstruktur aus einem metallischen Leiter oder ein lithographisch präpariertes Ringmuster in einem metallisch leitendem, zweidimensionalen Elektronengas (2DEG) einer Halbleiter-Heterostruktur (Abschn. 12.7). Ein Elektron, das aus dem linken Kontakt in die Ringstruktur eintritt, hat die Möglichkeit, über einen der Wege (1) oder (2) zum Kontakt rechts zu gelangen. Wird längs der beiden Wege die Phase erhalten, dann erwarten wir hinter dem Ring elektronische Interferenzen, wenn die Phase der Elektronenwelle auf dem Weg (1) gegenüber der auf Weg (2) verschoben wird. Die Interferenz würde dann in einem periodisch sich mit der Phase änderndem Strom am rechten Kontakt messbar sein. Der Effekt wird nach seinen Entdeckern Aharonov-Bohm-Effekt [9.10] genannt. Damit Interferenzen auftreten, müssen die Elektronen eine feste, wohldefinierte Wellenlänge haben, d. h. sie müssen in einem einzigen Transportkanal oder Subband des 1D-Drahtes propagieren. Dies verlangt Drahtdicken in der Größenordnung der Fermi-Wellenlänge kF . Weiterhin muss der Transport zwischen den Kontakten phasenerhaltend sein. Deshalb muss die Strecke L zwischen den Kontakten einen ballistischen Transport mit L le, lU, lin ermöglichen oder es wird zumindest diffusiver Transport verlangt, bei dem die Länge L deutlich kleiner ist als die inelastische freie Weglänge lin und die Phasenkohärenzlänge lU
Abb. 9.15. Aharonov-Bohm-Effekt: Der elektronische Transport zwischen zwei Kontakten, links und rechts erfolgt über einen leitenden Ring mit den möglichen Wegen (1) und (2). Der Transport ist entweder ballistisch oder diffusiv, d. h. phasenerhaltend mit nur elastischer Streuung (schematisch durch punktförmige Streuzentren angedeutet).
9.9 Quantentransport in Nanostrukturen
le < L < lin ; ly ;
271
9:101
sodass die Phase längs der Wege (1) und (2) erhalten bleibt (diffusiver Quantentransportbereich). Die Bedingung (9.101), aber erst recht ein ballistischer Transport verlangen genügend kleine Dimensionen der Struktur und tiefe Temperaturen bei der Messung, um durch Herabsetzung der Phononstreuung ein genügende große inelastische freie Weglänge lin zu erhalten. Wie können die Phasen der Elektronenwellen auf den beiden Wegen (1) und (2) gegeneinander verschoben werden? Wir beschreiben im einfachsten Fall des ballistischen Transports die Elektronenpropagation durch ebene Wellen der Form exp (ik·r) = exp (ip·r)/ h und erinnern uns, dass im Hamilton-Operator für ein freies Elektron im Magnetfeld der Impuls p durch den sog. kinetischen Impuls p–eA ersetzt werden muss, mit A als dem Vektorpotential des Magnetfeldes. Dadurch schreibt sich die Elektronenwelle im Magnetfeld als ! e W
r / exp i A r exp
i
k r xt :
9:102 h Das Magnetfeld bewirkt über das Vektorpotential A eine Phasenverschiebung. Bewegt sich das Elektron eine infinitesimale Strecke ds weiter, dann beläuft sich die Phasenverschiebung auf e du A ds :
9:103 h Für endliche Strecken müssen diese Verschiebungen du aufintegriert werden. Bei der in Abb. 9.15 a gezeigten Anordnung mit einem Magnetfeld, das durch den Ring durchgreift, ergibt sich für die Wellenfunktion an einem Ort r hinter dem Ring durch Superposition der Teillösungen über Weg (1) und (2): ! ! Z Z ie ie W
r W 1 exp A ds W 2 exp A ds :
9:104 h h 1
2
Hierbei sind W 1 und W 2 die Wellenfunktionen für verschwindendes Vektorpotential; sie werden sich trotz gleicher Weglängen jedoch um einen feste Phase unterscheiden, weil auf den beiden Wegen verschiedene raumfeste Störstellenmuster vorliegen können, die entsprechend verschiedene elastische Streuprozesse verursachen. Wege (1) und (2) werden bezüglich des Magnetfelds B, bzw. des Vektorpotentials A in entgegengesetzter Richtung durchlaufen; damit ergibt sich unter Benutzung des Stokesschen Satzes für die Gesamtphasenänderung Z Z I ZZ ZZ A ds A ds A ds df rot A df B UB : 1
2
Ring
(9.105)
272
9. Bewegung von Ladungsträgern und Transportphänomene
UB ist der magnetische Fluss durch die Ringschleife. Ausklammern des zweiten Terms in (9.104) ergibt damit ! ! ! Z ie ie UB W 2 W
r / exp
9:106 A ds W 1 exp h h 2
und unter Berücksichtigung des festen Phasenunterschieds d zwischen Weg (1) und Weg (2) W
r / e h UB eid ie
9:107
Der bei einer anliegenden Spannung zwischen den Kontakten gemessene Strom ist proportional zu |W|2, d. h. es folgt für den Strom I als Funktion des magnetischen Flusses UB I / je h UB eid j2 22 cos
2pUB =U0 ie
d
9:108
worin U0 das für einzelne Elektronen definierte Flussquantum h/e ist (im Unterschied zu Cooper-Paaren in der Supraleitung, wo y0 = h/2e ist, Abschn. 10.9). Der Wert von h/e beträgt U0 h=e 4; 1357 10
15
Vs :
9:109
Der Strom zwischen den beiden Kontakten ändert sich also bei Variation des magnetischen Flusses U durch den Ring periodisch mit einer Oszillationsperiode eines Flussquants U0 . Dieser Effekt wurde vielfach an ringförmigen metallischen und Halbleiter-2DEGStrukturen beobachtet. In Abb. 9.16 ist die klassische Messung von Webb et al. [9.11] an einem Goldring mit etwa 0,8 lm Durchmesser dargestellt. Neben der Originalmesskurve des oszillierenden Widerstandes ist auch das daraus errechnete Fourier-Spektrum gezeigt, das eine her-
Abb. 9.16. Aharonov-Bohm-Oszillationen gemessen an einem nanoskaligen Goldring: (a) Originalmesskurve des Magnetowiderstandes als Funktion des magnetischen Feldes, das den Ring durchdringt. Die Oszillationsperiode ist DB U0 =FR mit FR der Ringfläche. (b) Fourier-Transformierte der Messkurve in (a). Neben der Hauptbande bei etwa 130 T–1 werden mit geringerer Intensität bei etwa 260 T–1 Altshuler-Aronov-Spivak-Oszillationen mit der doppelten Frequenz gefunden (nach Webb et al. [9.11])
9.9 Quantentransport in Nanostrukturen
273
ausgehobene Bande bei der Frequenz 1/DB von etwa 130 T–1 aufweist. Jedoch wird auch eine schwächere Bande bei der doppelten Frequenz von etwa 260 T–1 beobachtet. Diese ist darauf zurückzuführen, dass die in den Ring eintretenden Partialwellen bei genügend großer Phasenkohärenzlänge lU den Ring einmal im Uhrzeigersinn und zum anderen im Gegenuhrzeigersinn durchlaufen können und dann am Eintrittspunkt in den Ring miteinander konstruktiv interferieren. Dies führt zu einer erhöhten Rückstreuung des Elektrons in den Einleitungskanal. Diese sogenannten Altshuler-Aronov-Spivak-Oszillationen sind robuster in ihrem Erscheinungsbild als die Aharonov-Bohm-Oszillationen, denn beide interferierenden Teilwellen durchlaufen das gleiche Störstellenmuster in entgegengesetzter Richtung und sind in ihrer relativen Phase deshalb besser bestimmt (d = 0 in 9.108). Weiterhin muss in der Superpositionswellenfunktion W(r) (9.104) dem Rechnung getragen werden, dass der Ring von beiden Teilwellen in entgegengesetzter Richtung ganz durchlaufen wird. Für einen Ort am Eingang zum Ring gilt also ! ! I I ie ie W
r W 1 exp ds A W 1 exp ds A : h h
9:110 Mit (9.105) folgt daraus " ! ie UB exp W
r / W 1 exp h
ie UB h
!#
9:111
bzw. für die Aufenthaltswahrscheinlichkeit des Elektrons am Ringeingang jWj2 2jW 1 j2
1 cos
4pUB =U0 :
9:112
Die Oszillationsperiode für den rückgestreuten und damit auch die des durch den Ring transmittierten Stroms ist jetzt U0 /2, also die Hälfte der Aharonov-Bohm-Periode (9.107). Damit ist die in Abb. 9.15b bei der doppelten Frequenz auftretende Fourier-Bande erklärt. Altshuler-Aronov-Spivak-Oszillationen werden auch in Halbleiter-Nanosäulen aus InAs beobachtet, wenn man bei tiefen Temperaturen in einem Magnetfeld B parallel zur Nanosäule einen Strom durch die Säule schickt [9.12]. InAs hat die spezielle Eigenschaft, dass an seiner Oberfläche immer ein zweidimensionales Elektronengas (2DEG) mit quasi-metallischen Eigenschaften existiert, ähnlich wie in Halbleiterheterostrukturen (Abschn. 12.7). Bei lithographisch präparierten InAs-Nanosäulen mit Kontakten oben und unten (Abb. 9.17) hat der stromtragende Bereich also eine Zylindertopologie. Der Strom fließt weitgehend in diesem Zylinder und Elektronen können neben ihrem direkten kürzesten Weg zwischen den Kontakten auch Wege nehmen, die einmal um die Säule her-
274
9. Bewegung von Ladungsträgern und Transportphänomene
Magnetfeld B (T)
Abb. 9.17. Altshuler-Aronov-Spivak-Oszillationen in InAs-Nanosäulen, die mittels Elektronenstrahl-Lithographie (Tafel XVIII) präpariert wurden. (a) Rasterelektronenmikroskopisches Bild einer InAs-Nanosäule mit (111)-Wachstumsrichtung. Der obere Teil der Säule besteht aus Photolack, herrührend von der Präparation. (b) Schema des stromtragenden zylinderförmigen Leitungskanals des zweidimensionalen Elektronengases (2DEG) mit Magnetfeld B; darüber Schema des elektronischen Bandverlaufs innerhalb der Säule, EF Fermi-Energie, EL Leitungsbandkante, EV Valenzbandkante. (c) Oszillationen des zwischen oberem und unterem Kontakt gemessenen Magnetowiderstands. (d) Fourier-Transformierte des Magnetowiderstands. Die Hauptbande entspricht einer Oszillationsfrequenz von 2F/U0 = 2eF/h mit F der Basisfläche der Säule (nach Wensorra et al. [9.12])
umführen und somit einen magnetischen Fluss umschließen. Für diese Wege existieren dann ähnlich wie in den betrachteten Ringstrukturen beide Umlaufrichtungen, im Uhrzeigersinn und entgegengesetzt. Die Elektronenwellen interferieren am Ende der Säule gemäß (9.112). Die entsprechenden Stromoszillationen mit der Periode U0/2 werden als kleine Korrekturen tatsächlich im Leitwert beobachtet (Abb. 9.17). Schwache Lokalisierung Bei den bisher betrachteten Elektroneninterferenz-Phänomenen mussten die Dimensionen der Strukturen, d. h. die entscheidenden Wegstrecken kleiner als die Phasenkohärenzlänge lU sein. Interferenzeffekte sind jedoch auch schon beobachtbar in Proben mit Dimensionen L > lU. Der Effekt der schwachen Lokalisierung ist bei
9.9 Quantentransport in Nanostrukturen
275
Abb. 9.18. Schematische Darstellung des phasenerhaltenden diffusiven Elektronentransports, bei dem elastische Streuprozesse die Phase der Elektronenwelle jeweils wohldefiniert verändern. (a) Mögliche Trajektorien zwischen verschiedenen Streuzentren von Punkt P nach Q. Die Trajektorie 3a beschreibt eine geschlossene Schleife am Punkt O, die von der Elektronenwelle sowohl im Uhrzeigersinn als auch im Gegenuhrzeigersinn durchlaufen werden kann. (b) Detail des geschlossenen Umlaufs 3a: Ein magnetischer Fluss U durch die Schleife verschiebt die Phasen der rechts und links herumlaufenden Elektronenwellen gegeneinander
genügend tiefen Temperaturen als Quantenkorrektur zum Widerstand bei ausgedehnten Proben zu beobachten, wenn die Phasenkohärenzlänge lU (durch inelastische Phononenstreuung) größer ist als die elastische freie Weglänge le (durch Störstellenstreuung). Bei diesem Effekt handelt es sich um Interferenzen zwischen Elektronenwellen, die infolge phasenerhaltender elastischer Mehrfachstreuung an Störstellen geschlossene Bahnen durchlaufen (Abb. 9.18). Genauso wie bei Altshuler-Aronov-Spivak-Interferenzen kann eine Elektronenwelle eine solche geschlossene Bahn im Uhrzeigersinn und entgegengesetzt durchlaufen. Dadurch kommt es am Ausgangspunkt der geschlossenen Bahn zu konstruktiver Interferenz, also einer erhöhten Aufenthaltswahrscheinlichkeit für das Elektron. Dies bedeutet, dass das Elektron verglichen mit dem gedachten Fall der Nicht-Interferenz stärker rückwärts gestreut wird. Eine Erhöhung des Widerstandes ist die Folge. Zu dieser Erhöhung trägt eine Vielzahl gleichartiger Prozesse, jedoch mit statistisch variierenden geschlossenen Bahnen bei. Wir haben es also mit einer statistischen, mittleren Erhöhung des Widerstandes im Vergleich zum klassischen Wert ohne Quanteninterferenzen zu tun. Dieser durch „schwache Lokalisierung“ erhöhte Widerstandswert lässt sich ausschalten, indem man die Bedingung für konstruktive Interferenz am Ausgangspunkt eines geschlossenen Weges des Elektrons stört. Dies geschieht wie bei den Experimenten zu Altshuler-Aronov-Spivak-Oszillationen durch Anlegen eines Magnetfeldes. Dieses verschiebt die Phasen der Elektronenwellen, die im Uhrzeigersinn und entgegengesetzt längs des geschlossenen Weges propagieren, gegeneinander. Die konstruktive Interferenz bei allen geschlossenen Wegen bricht zusammen und der elektrische Widerstand sinkt mit wachsender Magnetfeldstärke auf den klassischen Wert.
276
9. Bewegung von Ladungsträgern und Transportphänomene
Abb. 9.19. Magnetowiderstand DR/R eines Lithium-Drahtes (21 nm dick, 55 nm breit) gemessen bei 0,13 K als Funktion eines senkrecht dazu orientierten Magnetfeldes H (nach Dolan et al. [9.13]). Anmerkung: Ein Magnetfeld von 1 Oe entspricht 1000/4p Am–1 und damit einem B-Feld von 10–3 Vs/m2
Dies wird in der Tat beobachtet, wie die Widerstandsmessung an einem langen Li-Draht mit Querschnittdimensionen im Nanometerbereich in Abb. 9.19 zeigt. Mittlerweile ist der Effekt für eine Vielzahl metallischer und halbleitender Systeme gezeigt. Der Effekt der schwachen Lokalisierung ist natürlich stark temperaturabhängig. Bei höheren Temperaturen nimmt wegen stärkerer Phononstreuung die Phasenkohärenzlänge lU ab. Längs der geschlossenen Umläufe verliert das Elektron seine feste Phase und konstruktive Interferenz ist nicht mehr möglich. In nanostrukturierten Proben mit wenig Defekten, wo ballistischer Transport vorherrscht, sind nur wenige geschlossene Elektronenpfade möglich. Elastische Streuung geschieht meist an den Berandungen. Damit wird der Effekt der schwachen Lokalisierung unterdrückt und wegen des Einflusses der Berandung dimensions- und strukturabhängig. Universelle Leitfähigkeitsfluktuationen In den bisher beschriebenen Magnetotransportmessungen, vom Aharonov-Bohm-Effekt bis zur schwachen Lokalisation, treten bei genauerer Analyse der Messdaten irreguläre Fluktuationen des Leitwertes auf, die beim ersten Hinsehen den Eindruck von Rauschen erwecken. Diese Fluktuationen als Funktion des B-Feldes sind jedoch reproduzierbar für eine spezielle Probe, solange sie bei tiefer Temperatur gehalten wurde. Je tiefer die Temperatur umso stärker ist die Amplitude der Fluktuationen. Erhöht man die Temperatur langsam, so bleiben die Fluktuationen als Funktion des Magnetfeldes B in ihrer Struktur erhalten, nehmen jedoch wegen erhöhter inelastischer Streuung in ihrer Amplitude ab (Abb. 9.20). An verschiedenen Proben desselben Materials werden nach gleichen Präparationsschritten verschiedene Fluktuationsmuster gemessen. Diese Fluktuationsmuster sind also ein „Fingerabdruck“ der
9.9 Quantentransport in Nanostrukturen
277
Magnetfeld B (T)
speziellen Probe. Sie rühren her von der jeweils besonderen Störstellenkonfiguration, die der Probe zueigen ist. Die theoretische Beschreibung dieser sogenannten universellen Leitfähigkeitsfluktuationen basiert wiederum auf dem diffusiven Transport von Elektronen, deren Wellenfunktionen eine Phasenverschiebung bei der Streuung an räumlich festen Störungen im Leiter erfahren. Wir denken uns den Leiter der Länge L in Abschnitte der Phasenkohärenzlänge lU zerlegt, in denen jeweils diffusiver, aber phasenerhaltender Transport stattfindet (Abb. 9.21). In einem solchen Abschnitt finden elastische Streuprozesse mit fester Phasenänderung statt. Unter allen möglichen quasiklassischen Trajektorien gibt es viele, die nach einigen Streuprozessen wieder zum gleichen Ort führen. Bei einem anliegenden Magnetfeld B sind die entsprechenden Wegschleifen einem magnetischen Fluss ausgesetzt, d. h., bei Variation von B werden die Phasen der Wellenfunktionen wie beim Aharonov-Bohm-Effekt gegeneinander verschoben und die Transmission dieses Bereiches ändert sich. Im Gegensatz zu einer wohldefinierten Ringstruktur erzeugen die räumlich stark variierenden umschlossenen Raumbereiche dieser Trajektorien unterschiedliche Aharonov-Bohm-Perioden. Die Überlagerung all dieser verschiedenen Phasenverschiebungen führt zu stark variierenden Änderungen des Leitwertes, die durch das im jeweiligen Raumbereich wohldefinierte Störstellenmuster vorgegeben sind. Aufeinander folgende Bereiche der Länge lU im Leiter der Länge L unterscheiden sich in ihrer Störstellenkonfiguration.
Abb. 9.20. Universelle Leitfähigkeitsfluktuationen, gemessen in Zweipunktanordnung an einem in der Molekularstrahlepitaxie (Tafel XVII) durch selbstorganisiertes Wachstum (Tafel XVIII) hergestellten InN-Whisker (Nanosäule mit 67 nm Durchmesser, Kontaktabstand 410 nm). (a) Magnetowiderstand als Funktion eines Magnetfeldes senkrecht zur Nanosäule, gemessen bei den Temperaturen 0,8 und 5 K. Ein typischer Kontaktwiderstand von etwa 300 X ist im gemessenen Widerstand enthalten. (b) Auf das Leitfähigkeitsquantum e2/h normierte Leitfähigkeitsfluktuationen bei 0,8 K, berechnet aus der Messkurve in (a) (nach Blömers et al. [9.14])
278
9. Bewegung von Ladungsträgern und Transportphänomene
Abb. 9.21. Schematische Darstellung universeller Leitfähigkeitsfluktuationen in einem langen Draht, dessen Länge L um ein Mehrfaches die Phasenkohärenzlänge lU überschreitet. (a) In Drahtbereichen der Länge lU ist der Transport phasenkohärent. (b) Durch elastische Streuung (Streuzentren als Punkte eingezeichnet) können geschlossene Schleifen entstehen. In diesen Schleifen werden durch die magnetischen Flüsse U1, U2, U3 jeweils die Phasen der linksund rechtsherum laufenden Elektronenwellen gegeneinander verschoben
Die Fluktuationen in diesen Bereichen als Funktion des Magnetfeldes B sind deshalb nicht miteinander korreliert. Die Addition der Fluktuation einzelner Bereiche zur am makroskopischen Leiter gemessenen Gesamtfluktuation ist deshalb wie bei der Addition von stochastischem Rauschen proportional zur Wurzel aus der Anzahl N der hintereinander geschalteten Bereiche der Länge lU r p h L :
9:113 DR / N / 2 e lU Der Gesamtwiderstand R hingegen ist proportional zur Anzahl N. Damit ergibt sich für die Abhängigkeit der Leitfähigkeitsfluktuationen von der Länge L die Relation !3=2 DR lU 3=2 / :
9:114 jDGj 2 / N L R Sehr gut bestätigt wird die Längenabhängigkeit der universellen Leitfähigkeitsfluktuationen (9.114) für eine in Serie angeordnete Reihe von Leiterschleifen (Proben mit N = 1, 3, 10 und 30 Ringen) aus Silber (Abb. 9.22). Die Leiterbahn, die auch die Ringschleifen untereinander verbindet, hat eine Breite von 75 nm und eine Schichtdicke von 20 nm. Während die in den Ringen durch ein Magnetfeld erzeugte oszillatorische Widerstandsänderung durch Altshuler-Aronov-Spivak-Oszillationen der Frequenz h/2e unabhängig von der Anzahl der Ringe ist, nimmt die Amplitude der Leitfähigkeitsfluktuationen mit der Ringanzahl, d. h. der Länge des Drahtes, gemäß (9.114) ab.
9.9 Quantentransport in Nanostrukturen
279
Abb. 9.22. Mittlere Amplitudenhöhe (RMS) der universellen Leitfähigkeitsfluktuationen DGRMS (gestrichelte Linie) und der Altshuler-Aronov-Spivak(AAS)Oszillationen (durchgezogene Linie), gemessen an Ag-Drahtproben mit jeweils einer in Serie angeordneten Reihe von Leiterschleifen (siehe Einschub). Die verschiedenen Proben enthalten jeweils N = 1, 3, 10, 30 Ringe. Drahtdimensionen: Dicke = 20 nm, Breite = 75 nm. Die Messungen wurden in Magnetfeldern zwischen 0,2 und 0,3 T bei einer Temperatur von 0,32 K durchgeführt (nach Umbach et al. [9.15]).
Abschließend sei betont, dass die hier betrachteten Leitfähigkeitsfluktuationen ein beträchtliches Problem für die Reproduzierbarkeit der Bauelementeigenschaften von nanoskalierten Quantenbauelementen bei tiefen Temperaturen darstellen können.
Übungen zu Kapitel 9
9.1 Der Unterschied zwischen Relaxationszeit und freier Flugzeit soll am Beispiel der elektrischen Leitung in einem klassischen Gas diskutiert werden. Dazu sei angenommen, dass die geladenen Teilchen zur Zeit t = 0 sich mit einer Geschwindigkeit v 0 x in xRichtung bewegen. Nach Abschalten des elektrischen Stromes sollen die Teilchen nach einer Zeit sc elastisch gestreut werden mit einer richtungsabhängigen Streuwahrscheinlichkeit p (H), wobei H der Winkel um die xAchse ist. Zeigen Sie, dass die durchschnittliche Geschwindigkeit der Teilchen in x-Richsc tung mit einer Relaxationszeit s = 1 hcos Hi abnimmt mit hcos Hi, dem über die Verteilung p (H) gemittelten Wert von cos H! Vergleichen Sie die freie Flugzeit sc und die Relaxationszeit! Unter welcher Bedingung sind sie gleich? Im Festkörper werden Elektronen an Defekten gestreut. Diskutieren Sie verschiedene Arten von Defekten im Hinblick auf das zu erwartende Verhältnis s und sc! 9.2 Zeigen Sie, dass unter Benutzung der stationären Boltzmann-Gleichung die Beweglichkeit geladener Teilchen in einem klassischen Gas gegeben ist durch l
ehv 2 s
ki mhv 2 i
!
9.3 Man berechne die Feldabhängigkeit der elektrischen Leitfähigkeit r(E ) unter Benutzung der zweiten Iteration der Boltzmann-Gleichung! Im zweiten Iterationsschritt verwende man wie im ersten, dass die Verteilung f0 feldunabhängig ist. Diskutieren Sie interessante technische Anwendungen von Materialien,
die eine starke Feldabhängigkeit der Leitfähigkeit aufweisen! 9.4 Man betrachte einen metallischen Halbraum mit zwei Punktkontakten. Parallel zur Oberfläche und senkrecht zur Verbindungslinie sei ein Magnetfeld B angelegt. Über einen Punktkontakt werden Elektronen in das Metall injiziert, die mit Hilfe des zweiten Punktkontaktes nachgewiesen werden. Zeichnen Sie die Elektronenbahnen für den Fall ballistischen Transports! – Für welche Werte von B erwarten Sie ein maximales Signal am zweiten Punktkontakt? – Berechnen Sie das Signal als Funktion von B! 9.5 Man betrachte ein semiklassisches Modell der Zyklotronresonanz, in dem die Bewegung eines quasi-freien Teilchens durch eine effektive Masse m und eine Relaxationszeit s beschrieben wird. (a) Berechnen Sie die Zyklotronfrequenz xc! (b) Stellen Sie die Differentialgleichung für die Bewegung eines Elektrons in einem statischen Magnetfeld B = (0, 0, B) und einem elektrischen Hochfrequenzfeld E = (A ei x t, A ei (x t+p/2), 0) auf! Streuprozesse sollen durch einen Reibungsterm mv/s berücksichtigt werden. (c) Berechnen Sie die Leitfähigkeit aus r = jx /E x! Der Realteil von r beschreibt die Dämpfung des elektrischen Feldes. (d) Zeichnen Sie Re {r} als Funktion von x/ xc für Werte von xc s = 0,2, 1, 3 und diskutieren Sie die erhaltenen Kurven! (e) Wie lassen sich Elektronen- und Löcherresonanz voneinander unterscheiden?
Übungen zu Kapitel 9
(f) In einem Klystron werde Hochfrequenzstrahlung mit einer Frequenz von 24 GHz erzeugt. Das Absorptionsmaximum wird bei B = 8,6 ´ 10–2 T beobachtet. Man bestimme die effektive Masse der Ladungsträger! Über welchen Bereich der Relaxationszeit und der Mobilität l kann man eine Resonanz beobachten? 9.6 (a) Man berechne gemäß Abschn. 7.5 die elektronische Zustandsdichte D
1
E für ein elektronisches Subband eines eindimensionalen Leiters. Man zeichne die Zustandsdichte als Funktion der Elektronenenergie E für eine Folge von Subbändern, wie sie im leitenden Draht existieren. (b) Welche elektronischen Streuprozesse sind beim Transport möglich, wenn nur ein Subband besetzt ist? Was ändert sich, wenn ein zweites Subband mitbesetzt wird, das Fermi-Niveau also zwei Subbänder schneidet (Zeichnung)? 9.7 Man betrachte ballistischen Elektronentransport durch ein zweidimensionales Oberflächen-Elektronengas (2DEG) längs einer Nanosäule (Abb. 9.17 b) in einem Magnetfeld B parallel zur Säule. Elektronentrajektorien können die Kontakte oben und unten an der Säule direkt verbinden oder Umläufe um die Säule im 2DEG ohne Streuprozesse beinhalten. Letztere Bewegung lässt sich in eine Propagation längs der Säule (parallel z) und eine Kreisbewegung senkrecht zur Säule (parallel x, y) zerlegen. (a) Man ermittle den Hamilton-Operator H für die Bewegung eines Elektrons zwischen den beiden Kontakten im Magnetfeld B, indem man das Magnetfeld durch sein Vektorpotential A im kinetischen Impuls p–eA berücksichtigt. Zweckmäßigerweise wähle man eine Darstellung in Zylinderkoordinaten (Einheitsvektoren eu,
281
ez), in denen sich das Vektorpotential als A 12 Breu darstellt (Beweis?). Weiter benutze man die Darstellung des Drehimpulses Lz mr2 u_ für die Kreisbewegung um die Säule herum, mit r als fest vorgegebenem Säulenradius. (b) Mittels des Produktansatzes W
r; uv
z für die Wellenfunktion, der die Bewegung um die Säule und in z-Richtung längs der Säule entkoppelt, zeige man, dass die Eigenlösungen der SchrödingerGleichung sich darstellen als !2 h2 kz2 h2 U ; El l 2m 2mr2 U0
(c) (d)
(e)
(f)
mit kz dem Wellenzahlvektor für die Bewegung in z-Richtung längs der Säule, l der Drehimpulsquantenzahl zum Drehimpuls Lz, U dem magnetischen Fluss durch den Säulenquerschnitt und U0 h=e dem magnetischen Flussquant. Man zeichne und diskutiere die Energieeigenwerte El als Funktion des magnetischen Flusses U. Unter Benutzung des Modells des eindimensionalen Transports über 1D-Subbänder diskutiere man, dass der Transport längs der Säule über Subbänder, gebildet aus Drehimpuls-Eigenzuständen jli, erfolgt und im Magnetowiderstand Oszillationen mit der Periode U0 als Funktion des Flusses U auftreten. Worin unterscheiden sich die hier betrachteten Oszillationen mit der Periode U0 von Aharonov-Bohm(AB)- oder Altshuler-Aronov-Spivak(AAS)-Oszillationen im Magnetowiderstand? Welche durch Elektroneninterferenz verursachten Magneto-Oszillationen können zusätzlich zu den hier betrachteten Oszillationen noch als Überlagerung auftreten?
Tafel VIII
Tafel VIII Quantenoszillationen und die Topologie von Fermi-Flächen
Die Fermi-Fläche eines Metalls ist eine Fläche im k-Raum, die durch die Bedingung E (k) = EF festgelegt wird. Elektronen auf Fermi-Flächen sind besonders wichtig, weil nur sie Energie in infinitesimal kleinen Portionen aufnehmen können. Sie bestimmen deshalb alle Transportgrößen wie z. B. die elektrische Leitfähigkeit (Abschn. 9.5), die ja durch ein Integral über die Fermi-Fläche bestimmt ist. Fermi-Flächen lassen sich bei bekannter Bandstruktur aus der Bedingung E (k) = EF berechnen. Doch kennt man auch experimentelle Methoden, die eine sehr genaue direkte Vermessung der Fermi-Flächen erlauben. Diese Methoden beruhen auf der Beobachtung von Quantenoszillationen bei Anlegen eines Magnetfeldes. Ursache und Erscheinungsbild der Quantenoszillationen sind nicht ganz leicht zu verstehen und wir müssen zur Erklärung etwas weiter ausholen. Freie Elektronen im Magnetfeld erfahren eine zusätzliche Kraft, die sog. Lorentz-Kraft. Sie steht senkrecht auf den Richtungen des Magnetfeldes und der Bahngeschwindigkeit und gibt Anlass zu einer zeitlichen Änderung des Impulses nach mv_ e
v B :
Dabei haben wir mit [r rk E (k)]^ die Komponente des Gradienten senkrecht zum B-Feld eingeführt. Diese Komponente können wir auch als dE/dk^ schreiben mit k^ dem k-Vektor senkrecht zum BFeld und der Konturlinie auf der Energiefläche, auf welcher das Elektron läuft (Abb. VIII.1). An Hand von Abb. VIII.1 sehen wir auch, dass das Umlaufintegral nichts anderes als die Ableitung der Querschnittsfläche S nach der Energie ist dk? dS dk :
VIII:4 dE dE Die Umlaufzeit h2 dS
VIII:5 eB dE ist damit verknüpft mit der Energieabhängigkeit der von der Elektronenbahn im k-Raum eingeschlossenen Fläche. Im allgemeinen sind diese Umlaufzeiten für die verschiedenen Elektronen im k-Raum verschieden. Für das freie Elektronengas allerdings sind sie alle gleich. Wie man T
VIII:1
Für Festkörperelektronen konnten wir nach (9.4) mv hk und v h 1rk E
k setzen. Aus der zeitlichen Änderung des Impulses wird damit die zeitliche Änderung des Wellenzahlvektors dk e r rk E
k B : dt h2
VIII:2
Die Elektronen laufen also im k-Raum tangential zu den Flächen konstanter Energien um das Magnetfeld herum. Wir wollen die Umlaufzeit berechnen. h2 1 dk
VIII:3 T dt e B r rk E
k? :
Abb. VIII.1. Umlaufbahn eines Elektrons um die Fermi-Fläche im Magnetfeld. Die Umlaufzeit ist proportional der Ableitung der Querschnittsfläche nach der Energie
sich leicht überzeugen kann, gilt dann wegen S = pk 2 dS m
VIII:6 2p 2 dE h bzw. 2pm T :
VIII:7 eB Dabei ist m die effektive Masse (siehe Abschn. 9.1). Für ein Magnetfeld von 1 T (104 G) erhalten wir z. B. so als Umlaufzeit T = 3,6·10–11 s. Diese Umlaufzeit im k-Raum ist auch die Umlaufzeit im Ortsraum und wir hätten für freie Elektronen das Resultat auch direkt klassisch aus der Gleichheit von Zentrifugalkraft und Lorentz-Kraft (e v B = m v xc, s. a. Tafel XV) herleiten können. Die Elektronenbahn ist dann eine Kreisbahn. Die Umlauffrequenz xc = 2 p/T wird auch Zyklotronfrequenz genannt. Gemäß unserer Herleitung bewegen sich Elektronen unter dem Einfluss eines Magnetfeldes im k-Raum auf kontinuierlichen Bahnen. Wie ist das in Übereinstimmung mit diskreten k-Vektoren zu bringen, die wir bisher angesetzt hatten? Diskrete k-Werte und die Möglichkeit, Energien nach kWerten zu klassifizieren, sind eine Folge der Translationsinvarianz. Die Schrödinger-Gleichung mit Magnetfeld ist aber senkrecht zur Richtung des Magnetfeldes nicht mehr translationsinvariant! Das ergibt sich daraus, dass wir in der Schrödinger-Gleichung mit Magnetfeld p durch p+e A, mit B = rot A, zu ersetzen haben. Die kVektoren senkrecht zur Magnetfeldachse (kx , ky) sind dann also keine Quantenzahlen mehr und damit bricht unser ganzes schönes Bändermodell erst einmal zusammen. Glücklicherweise können wir doch eine Aussage über die Energieterme machen, wenn die Magnetfelder nicht zu groß sind. Nach dem Korrespondenzprinzip muss im Grenzfall großer Quantenzahlen n die durch das Magnetfeld verursachte Aufspaltung benachbarter Terme En+1–En 2ph
VIII:8 hxc T sein, mit T der Umlaufzeit um die Querschnittsfläche bzw. xc der Umlauffrequenz [VIII.1]. Die En1
En
283
Abschätzung der Umlaufzeit von 3,6·10–11 s erlaubt uns dann, den Abstand der Energieniveaus mit 1,1·10–4 eV bei einem Magnetfeld von 1 T abzuschätzen. Die Existenz dieser Terme lässt sich durch Absorption elektromagnetischer Strahlung nachweisen, wobei Übergänge natürlich nur zwischen besetzten Termen unterhalb des FermiNiveaus und unbesetzten oberhalb des Fermi-Niveaus erfolgen können („Zyklotron-Resonanz “, vgl. Tafel XV). Die Interpretation der ZyklotronResonanz bei Metallen ist allerdings schwierig, da die Umlaufzeit T ja i. allg. von der Lage der Querschnittsfläche S abhängt, um die das Elektron im k-Raum läuft. Wir fragen uns nun, wie denn eigentlich mit Magnetfeld der k-Raum gequantelt ist, wenn kx, ky keine guten Quantenzahlen mehr sind? Setzen wir (VIII.5) in (VIII.8) ein und ersetzen wir den Differentialquotienten dS/dE entsprechend der Energiequantelung durch den Differenzquotienten (Sn+1–Sn)/(En+1–En), so erhalten wir eB :
VIII:9 h Im Magnetfeld sind also die Flächen, um die das Elektron im k-Raum läuft, gequantelt. Die Zustände auf den Umlaufbahnen sind dagegen entartet. Interessanterweise ist (für große Quantenzahlen) die Differenz der Flächen Sn+1–Sn konstant und unabhängig von kz. Die Elektronen sitzen also auf Röhren, den sog. Landau-Röhren (Abb. VIII.2). Die erlaubten Zustände im k-Raum „kondensieren“ gewissermaßen auf diese Röhren, sobald ein Magnetfeld, und sei es noch so klein, eingeschaltet wird. Wir überlegen uns leicht, dass die Distanz der Röhren voneinander allerdings für übliche Magnetfelder sehr klein ist. Die Zahl der Zustände insgesamt wird bei der „Kondensation“ natürlich nicht geändert. Auf jeder Röhre müssen zu jedem erlaubten kz-Wert also die Zustände sitzen, die sonst zwischen den Röhren waren. Soweit haben wir ein konstantes Magnetfeld betrachtet. Was geschieht, wenn wir B langsam steigern? Gleichung (VIII.9) sagt uns, dass sich die Landau-Röhren aufblähen. Dadurch treten sie entlang einer Kontaktkontur (Abb. VIII.2) nacheinander aus der Fermi-Fläche E (k) = EF aus. Wenn das Fermi-Niveau gerade zwischen zwei Landau-Röhren entlang der Kontaktkontur ist, liegen die höchSn1
Sn 2p
Tafel VIII
Tafel VIII Quantenoszillationen und die Topologie von Fermi-Flächen
Tafel VIII Quantenoszillationen und die Topologie von Fermi-Flächen
Tafel VIII
284
Abb. VIII.2. Die erlaubten Zustände von Elektronen im Magnetfeld liegen auf den sog. Landau-Röhren. Diese sind durch zwei Eigenschaften charakterisiert: 1) Der Umlauf (eines Elektrons) senkrecht zu B erfolgt auf einer Fläche konstanter Energie. 2) Die zwischen aufeinanderfolgenden Röhren eingeschlossene Fläche ist konstant. Nur wenn das Magnetfeld entlang einer Hauptsymmetrieachse läuft, ist die Röhrenachse parallel zum B-Feld. Um die Vorstellung hier nicht zu sehr zu strapazieren, zeichnen wir nur die Landau-Röhren mit kreisförmigem Querschnitt für den Fall des freien Elektronengases sowie eine Fermi-Kugel, die die Besetzungsgrenze ohne Magnetfeld angibt. Mit Magnetfeld liegen die besetzten Zustände auf den Flächen der Landau-Röhren innerhalb der Kugel
netischen Suszeptibilität bezeichnet. Als Beispiel für eine solche Messung zeigen wir Messungen an Gold. In Gold sind (in Analogie zu Cu, vgl. Abb. 7.12) die d-Zustände besetzt und das Fermi-Niveau fällt in den Bereich des sp-Bandes. Die Fermi-Fläche hat also näherungsweise Kugelgestalt. Allerdings ist sie so ausgedehnt, dass sie entlang der [111]Richtung Kontakt mit der Zonengrenze hat. Dadurch entsteht eine Aufstülpung der Fläche und die Fermi-Fläche geht direkt in die Fermi-Fläche der angrenzenden Zonen über (Abb. VIII.3). Für ein Magnetfeld entlang der [111]-Richtung gibt es damit zwei geschlossene Umlaufbahnen, entlang derer sich bei steigendem Magnetfeld die Landau-Röhren von der Fermi-Fläche ablösen. Dies sind die sog. Halsbahn und die Bauchbahn. Ihre Querschnittsflächen bestimmen die Periode der de Haas-van Alphen-Oszillationen. Abbildung VIII.4 a zeigt ein Originalspektrum für diesen Fall. Das Verhältnis der Querschnittsflächen ist direkt aus dem Vergleich der Perioden abzulesen (1 : 29). Nach Gl. (VIII.9) berechnen wir fer-
sten besetzten Zustände unterhalb des Fermi-Niveaus. Die mittlere Energie ist also niedriger als in dem Moment, wo die Landau-Röhre gerade die Fermi-Fläche entlang der Kontur verlässt. Dadurch oszilliert die mittlere Energie. Diese periodischen Quantenoszillationen machen sich im Prinzip in allen Festkörpereigenschaften bemerkbar und sind tatsächlich auch bei vielen nachgewiesen worden. Die Periode dieser Oszillation in B ist nach (VIII.9) DB
2pe 2 B : hSF
VIII:10
Mit der Periode DB mißt man also direkt die Querschnittsflächen der Fermi-Flächen. Darauf beruht die große Bedeutung der Quantenoszillationen für die Erforschung der Topologie der Fermi-Flächen. Besondere praktische Bedeutung hat dabei vor allem der sog. de Haas-van Alphen-Effekt [VIII.2] erlangt, der die periodische Oszillation der mag-
Abb. VIII.3. Die Fermi-Flächen der Edelmetalle Cu, Ag, Au haben Kontakt zur Zonengrenze beim Punkt L. Dadurch gibt es z. B. senkrecht zur [111]-Richtung zwei Umlaufbahnen mit extremalem Querschnitt. Senkrecht zur [110]- bzw. [100]Richtung gibt es auch geschlossene Umlaufbahnen, die zwischen den Fermi-Kugeln benachbarte Brillouin-Zonen umlaufen und dabei leere Zustände einschließen („Lochbahnen“). Ferner gibt es offene Bahnen, bei denen die Elektronen durch das ausgedehnte Zonenschema laufen. Für solche offenen Bahnen gibt es keine Umlaufzeit und die Überlegungen, die auf der Geschlossenheit der Bahnen beruhen, finden keine Anwendung
285
Tafel VIII
Literatur
Abb. VIII.4 a, b. Original-Schreiberkurven, die die Oszillationen in der magnetischen Suszeptibilität von Gold bei Variation des Feldes (a) bzw. bei Variation der Richtung des Mag-
netfeldes (b) zeigen (nach Lengeler [VIII.3]). Die Quantenoszillationen lassen sich natürlich nur bei genügend scharfer Fermi-Verteilung
k T < hxc beobachten
ner aus den Daten die Querschnittsflächen zu 1,5·1015 cm–2 bzw. 4,3·1016 cm–2. Mit diesen Angaben lässt sich ein Abbild der Fermi-Fläche wie Abb. VIII.3 bereits weitgehend konstruieren. Variiert man den Winkel der Magnetfeldachse bei konstantem Feld, so beobachtet man ebenfalls Oszillationen, weil nunmehr die LandauRöhren durch die Drehung die Fermi-Fläche entlang der Kontaktkontur einmal berühren, einmal nicht (Abb. VIII.4 b). Die Oszillationen verschwinden aber für Winkel, wo die Umlaufbahnen nicht geschlossen sind. Geschlossene Bahnen
mit definierter Umlaufzeit waren die Voraussetzung für die Herleitung der Relationen (VIII.3– VIII.10).
Literatur VIII.1 L. Onsager: Philos. Mag. 43, 1006 (1952) VIII.2 W. J. de Haas, P. M. van Alphen: Leiden Comm. 208 d, 212 a (1930) VIII.3 B. Lengeler: Springer Tracts Mod. Phys. Vol. 82 (Springer, Berlin Heidelberg 1978), p. 1
10. Supraleitung
In Kap. 9 wurden die Grundzüge des Phänomens der elektrischen Leitfähigkeit in Metallen vorgestellt und erklärt. Der endliche Widerstand der Materialien rührt im wesentlichen von Abweichungen des Realkristalls von der Gitterperiodizität her: Phononen und Störstellen. Eine unendlich hohe elektrische Leitfähigkeit ist im Rahmen einer solchen Beschreibung undenkbar, denn (1) ist aus Gründen des 2. Hauptsatzes der Thermodynamik ein Kristall ohne ein gewisses Maß an Unordnung nicht vorstellbar, (2) müsste bei Ausfallen der Phonon- und Störstellenstreuung zumindest ElektronElektron-Streuung als Widerstandsursache (s. Abschn. 9.3) in Erscheinung treten. Im Jahre 1911 entdeckte jedoch Onnes [10.1], dass der elektrische Widerstand von Quecksilber beim Abkühlen unter 4,2 K unmessbar kleine Werte annimmt. Dieses Phänomen, das in der Folgezeit an vielen weiteren Materialien beim Abkühlen unter eine gewisse kritische Temperatur Tc gefunden wurde, trägt den Namen „Supraleitung“. Eine atomistische Erklärung, die nach dem in Kap. 9 Gesagten nicht mehr im Rahmen einer Einelektronennäherung erfolgen kann, ließ dann fast ein halbes Jahrhundert auf sich warten. Erst kurz vor 1960 gelang Bardeen, Cooper und Schrieffer [10.2] der entscheidende Durchbruch mit einer nach ihnen benannten Theorie (BCS-Theorie). Nach einer kurzen Schilderung der Grundphänomene der Supraleitung soll in diesem Kapitel etwas vereinfacht gezeigt werden, wie wesentliche Eigenschaften der Supraleitung sich im Rahmen dieser BCS-Theorie verstehen lassen.
10.1 Einige Grundphänomene der Supraleitung Die namengebende Grundeigenschaft der Supraleitung wurde von Onnes [10.1] an Quecksilber entdeckt. Abbildung 10.1 zeigt die historische Messkurve: Beim Abkühlen unter etwa 4,2 K bricht der elektrische Widerstand der Quecksilberprobe zusammen. Er musste zu damaliger Zeit als unterhalb von 10–5 X angenommen werden. Es ist prinzipiell unmöglich, experimentell die Aussage zu überprüfen, ob der Widerstand Null ist; deshalb ist man natürlich auch heute nach Anwendung verfeinerter Messtechniken nur in der Lage, eine obere Grenze für den elektrischen Widerstand anzugeben. Die beste experimentelle Methode, die auch schon von Onnes neben Strom-Spannungsmessungen angewendet wurde, um kleinste
288
10. Supraleitung
Abb. 10.1. Originalmesskurve, mit der zum erstenmal 1911 das Phänomen der Supraleitung an Hg entdeckt wurde. Bei Abkühlung unter 4,2 K fällt der elektrische Widerstand unter die Messbarkeitsgrenze (damals *10–5 X). (Nach Onnes [10.1])
Widerstände zu messen, besteht darin, das Abklingen eines Stromes in einem geschlossenen supraleitenden Kreis zu messen: Mittels eines Magneten wird ein magnetischer Fluss durch eine Leiterschleife erzeugt, und dann wird der Ring unter die kritische Temperatur Tc abgekühlt, so dass er supraleitend wird. Wegziehen des Magneten ändert den Fluss durch den Ring und ein Ringstrom wird induziert. Wäre der Ring mit einem endlichen Widerstand R behaftet, so würde der Suprastrom gemäß I
t I0 exp
Rt=L
10:1
abklingen; L ist die Selbstinduktion der Schleife. Mit solchen und ähnlichen Versuchsanordnungen kann heute gezeigt werden, dass der Widerstand eines Metalls, das in den supraleitenden Zustand eintritt, mindestens um 14 Zehnerpotenzen abnimmt. Supraleitung ist nicht auf einige wenige chemische Elemente beschränkt; die Darstellung des Periodensystems in Abb. 10.2 zeigt, dass diese Eigenschaft bei vielen Elementen bekannt ist. Sowohl Nichtübergangsmetalle wie Be und Al als auch Übergangsmetalle wie Nb, Mo und Zn zeigen den Effekt. Halbleiter wie Si, Ge, Se und Te nehmen bei hohen Drücken eine metallische Phase an und werden dann bei tiefen Temperaturen auch supraleitend. Supraleitung kann also von der Kristallstruktur abhängen. Dies zeigt auch der Fall des Bi, wo mehrere Modifikationen Supraleitung von verschiedenen Sprungtemperaturen ab zeigen, während eine andere Modifikation bis zu 10–2 K hinab den Effekt nicht zeigt. Auch der kristalline Aufbau ist keine notwendige Voraussetzung. Gerade „amorphe“ und polykristalline supraleitende Proben, die durch abschrekkende Kondensation auf gekühlten Substraten hergestellt werden, spielen in der aktuellen Forschung eine große Rolle. Hinzu kommt, dass eine große Anzahl von Legierungen Supraleitung zeigt, wobei z. B. Nb3Al0,75Ge0,25 eine relativ hohe Übergangstemperatur von 20,7 K besitzt. Am faszinierendsten erscheinen zur Zeit oxidische
10.1 Einige Grundphänomene der Supraleitung
289
Abb. 10.2. Überblick über das Periodensystem der Elemente. Bis jetzt bekannte Supraleiter sind mit Angabe der Sprungtemperatur Tc (in K) getönt dargestellt. Dunkle Tönung bedeutet, dass das entsprechende Element nur in einer Hochdruckphase supraleitend ist
Supraleiter, bestehend z. B. aus den Komponenten Ba-Y-Cu-O, die extrem hohe Sprungtemperaturen im Bereich von 100 K haben (Abschn. 10.10). Es fällt weiter auf, dass bei ferromagnetischen Materialien wie Fe, Co, Ni (Abb. 10.2) keine Supraleitung gefunden wurde. Der starke Ferromagnetismus wird heute dafür als Ursache angesehen und wir werden in Abschn. 10.6 sehen, dass starke Magnetfelder zerstörend auf die Supraleitung wirken. Es sei noch einmal betont, dass im allgemeinen der Übergang eines Metalls von seinem normalleitenden Zustand in den eines Supraleiters nichts mit einer kristallografischen Strukturänderung zu tun hat; auch geht keine ferromagnetische, ferrimagnetische oder antiferromagnetische Umordnung damit einher. Dies lässt sich z. B. durch Streuexperimente mit Röntgenstrahlen, Elektronen und Neutronen (Tafel I) beweisen. Andererseits findet beim Übergang vom Normalzustand in den Supraleitungszustand eine thermodynamische Zustandsänderung, eine Phasenänderung, statt, die sich auch in anderen physikalischen Größen klar zeigt. Die Abhängigkeit der spezifischen Wärme von der Temperatur z. B. ändert sich sprunghaft bei der Übergangstemperatur Tc. Abbildung 10.3 zeigt dies für das Beispiel des Al mit einer Übergangstemperatur von 1,19 K. Die spezifische Wärme cn eines normalleitenden Metalls setzt sich aus einem gitterdynamischen Anteil cng und einem elektronischen Anteil cne zusammen. Nach (6.51) gilt cn cne cng cT bT 3 :
10:2
Im normalleitenden Zustand (n) ergibt sich deshalb bei tiefen Temperaturen ein stetiger Verlauf von cn ähnlich wie in Abb. 6.8. Beim Übergang in den supraleitenden Zustand (bei Tc ) nimmt die spezifische Wärme sprunghaft zu, um dann bei sehr niedrigen Temperaturen unter den Wert der Normalphase abzusinken. Üblicherweise
290
10. Supraleitung
Abb. 10.3. Spezifische Wärme von normalleitendem (cn) und supraleitendem (cs) Aluminium. Unterhalb der Sprungtemperatur Tc ist die normalleitende Phase durch Anlegen eines schwachen Magnetfeldes von 300 G erzeugt worden. (Nach Phillips [10.3])
nimmt man an, dass beim Übergang in den supraleitenden Zustand der gitterdynamische Anteil cng unverändert bleibt. Eine genauere Analyse zeigt dann, dass der elektronische Anteil cne * T im Supraleiter durch einen Anteil zu ersetzen ist, der weit unterhalb der kritischen Temperatur exponentiell abklingt: cse exp
A=k T :
10:3
Eine weitere, markante Besonderheit zeigt sich in den magnetischen Eigenschaften eines Supraleiters. Das magnetische Verhalten eines Materials, das in den supraleitenden Zustand eintritt, lässt sich nicht allein aus den Maxwell-Gleichungen mit der zusätzlichen Forderung eines verschwindenden elektrischen Widerstandes (R ? 0) erklären: Dazu ist in Abb. 10.4 a schematisch angedeutet, wie sich ein idealer Leiter, bei dem nur R = 0 unterhalb einer kritischen Sprungtemperatur Tc gefordert wird, verhalten würde, wenn er in einem äußeren Magnetfeld Ba abgekühlt wird, d. h. wenn er im Magnetfeld seinen Widerstand verliert. Für einen gedachten, geschlossenen Umlauf (Fläche F ) im Material muss gelten
_ F: i R U< rot E df B
10:4 F
Verschwindender Widerstand bedeutet dann, dass der magnetische Fluss B·F durch den geschlossenen Umlauf sich nicht ändern darf, dass also das Magnetfeld im Inneren des Materials sowohl beim Abkühlen als auch beim Abschalten des äußeren Feldes Ba bestehen bleibt. Beim Abschalten von Ba im gekühlten Zustand geschieht dies deshalb, weil durch den Abschaltvorgang im Inneren des Materials Dauerströme induziert werden, die das Magnetfeld im Inneren aufrechterhalten. Würde ein solcher Leiter im feldfreien Raum (Ba = 0) unter Tc abgekühlt und dann das äußere Feld Ba angeschaltet, so müsste wegen R = 0 das Innere des Materials feldfrei bleiben – wiederum durch die Wirkung von abschirmenden, in-
10.1 Einige Grundphänomene der Supraleitung
291 Abb. 10.4. Magnetisches Verhalten eines idealen Leiters (A) und eines Supraleiters (B). (a) Beim idealen Leiter hängt der Endzustand (d) oder (g) davon ab, ob die Probe zuerst unter Tc abgekühlt und dann das Magnetfeld Ba eingeschaltet wurde oder ob umgekehrt im Ba-Feld abgekühlt wurde: (a ? b )-Probe verliert Widerstand durch Abkühlen bei abgeschaltetem Magnetfeld. (c) Anlegen des Ba-Feldes an widerstandslose Probe. (d) Ba-Feld abgeschaltet. (e ? f)-Probe verliert Widerstand im Magnetfeld. (g) Magnetfeld Ba abgeschaltet. (b) Beim Supraleiter ergeben sich gleiche Endzustände (d) und (g) unabhängig von der Reihenfolge zwischen Anlegen des Magnetfeldes Ba und Abkühlen der Probe: (a ? b)-Probe verliert Widerstand bei abgeschaltetem Magnetfeld. (c) Anlegen des Ba-Feldes an supraleitende Probe. (d) Ba-Feld abgeschaltet. (e ? f)-Probe wird supraleitend im angelegten Magnetfeld Ba . (g) Magnetfeld Ba abgeschaltet
duzierten Dauerströmen. Nach Abschalten von Ba im gekühlten Zustand bleibt das Innere des Materials nun feldfrei. Ein idealer Leiter im Sinne von (10.4) könnte also für Ba = 0 und T < Tc zwei verschiedene Zustände, mit und ohne Feld im Inneren, einnehmen, je nachdem wie der Weg war, auf dem dieser Zustand erreicht wurde. Wäre ein Supraleiter nur ein „idealer Leiter“, so wäre also der supraleitende Zustand kein Zustand im Sinne der Thermodynamik. Tatsächlich gilt für den Supraleiter nicht nur B_ = 0 sondern auch B = 0 unabhängig vom Weg, auf dem der Zustand erreicht wurde. Ein Supraleiter verhält sich, wie in Abb. 10.4 b angedeutet ist. Dieser Effekt, der eine vom verschwindenden Widerstand (R = 0) unabhängige Eigenschaft des Supraleiters darstellt, heißt nach ihren Entdeckern „Meissner-Ochsenfeld-Effekt“ [10.4]. Der magnetische Zustand eines Supraleiters kann wegen des Meissner-Ochsenfeld-Effektes als idealer Diamagnetismus beschrieben werden, bei dem permanente Oberflächenströme im Inneren eine Magnetisierung M = –Ha aufrechterhalten, die dem außen anliegenden Magnetfeld Ha genau entgegengesetzt ist. Wenn an einem Supraleiter bei einer Temperatur T < Tc ein äußeres Magnetfeld angeschaltet wird, so wird ein gewisser Energieanteil verbraucht, um diese Supraströme zu induzieren, die das Innere der Probe magnetisch feldfrei halten. Steigert man die Magnetfeldstärke Ha, so wird es von einer kritischen Feldstärke Hc an energetisch günstiger für das Material, in die normalleitende Phase überzugehen, bei der das Magnetfeld dann in das Material eindringt. Dieser Übergang ist zwar mit einer Erhöhung der freien Energie (siehe spezifische Wärme in Abb. 10.3) verbunden, aber eine zu
292
10. Supraleitung
Abb. 10.5. Qualitative Darstellung des Phasendiagramms eines Supraleiters. Die Phasengrenze zwischen supraleitendem und normalleitendem Zustand ist durch die kritische Magnetfeldstärke Hc (T) gegeben
starke Erhöhung des Feldes Ha würde zu einem noch höheren Energieaufwand bei der Induktion der Abschirmströme führen. Es existiert also eine obere kritische magnetische Feldstärke Hc, die wiederum von der Temperatur abhängt, über die hinaus die supraleitende Phase nicht mehr existiert. Qualitativ stellt sich also das Phasendiagramm eines Supraleiters in Abhängigkeit von der Temperatur T und äußerem Magnetfeld wie in Abb. 10.5 dar.
10.2 Phänomenologische Beschreibung durch London-Gleichungen Eine rein phänomenologische Beschreibung der Supraleitung, d. h. insbesondere der in Abschn. 10.1 geschilderten Erscheinungen, zwingt zu einer Abänderung der bekannten Materialgleichungen der Elektrodynamik. Diese Beschreibung, die keine atomistische Erklärung der Supraleitung darstellt, wurde zum erstenmal von London und London [10.5] vorgeschlagen. Die Eigenschaft eines Supraleiters, einen verschwindenden spezifischen Widerstand R = 0 zu haben, wird im Rahmen der klassischen Bewegungsgleichung von Elektronen in einem äußeren Feld E (9.42) durch Weglassen des „Reibungsterms“ m mD/s erzielt, so dass für supraleitende Elektronen gilt mv_
eE :
10:5
Für die Stromdichte js = –e ns v der supraleitenden Elektronen (Dichte ns) folgt damit die sog. 1. Londonsche Gleichung 2
ns e E :
10:6 j_s m Damit folgt aus der Maxwellschen Gleichung rot E = – B_ die Beziehung @ m rot j B 0:
10:7 s @t ns e2
10.2 Phänomenologische Beschreibung durch London-Gleichungen
293
Diese Gleichung beschreibt zwar das Verhalten eines idealen Leiters
R 0, aber noch nicht den im Meissner-Ochsenfeld-Effekt gefundenen idealen Diamagnetismus eines Supraleiters, d. h. das „Hinausdrücken“ eines Magnetfeldes. Aus (10.7) folgt nämlich lediglich wie aus (10.4), dass der magnetische Fluss durch eine Leiterschleife konstant bleibt. Integration von (10.7) liefert eine Integrationskonstante. Setzt man diese gleich Null, dann folgt die zweite Londonsche Gleichung, mit deren Hilfe der Meissner-Ochsenfeld-Effekt richtig beschrieben wird. ns e2 B: m
rot js
10:8
Es sei noch einmal betont, dass (10.8) unter zwei Voraussetzungen abgeleitet wurde: (1) R verschwindet und (2) Integrationskonstante von (10.7) verschwindet. Zur Beschreibung eines Supraleiters im Magnetfeld haben wir nun mit der Abkürzung m
10:9 kL ns e2 folgendes Gleichungssystem zur Verfügung: 1) Die beiden London-Gleichungen
E
kL j_s ;
B
10:10 a
kL rot js ;
10:10 b
und 2) zusätzlich die Maxwell-Gleichung rot H js
bzw:
rot B l0 js :
10:11
(10.10) ersetzt für den Supraleiter das Ohmsche Gesetz des Normalleiters. Aus der Kombination von (10.11) mit (10.10) folgen l0 B
10:12 a rot rot B l0 rot js kL 1 l0 rot rot js rot B j ; bzw:
10:12 b kL s kL l0 B0;
10:13 a DB kL l0 j 0:
10:13 b D js kL s Für das zweidimensionale Problem eines halbunendlichen Supraleiters in einem im Vakuum homogenen Magnetfeld B = (Bx, 0, 0), wie in Abb. 10.6 dargestellt, gilt dann @ 2 Bx @z2
l0 Bx 0 ; kL
10:14 a
294
10. Supraleitung
Abb. 10.6. Halbunendlicher Supraleiter (z > 0) in einem Magnetfeld, das im Vakuum (z < 0) homogen ist
@ 2 js y @z2
l0 js y 0 : kL
Wegen (10.11) hat js die Darstellung (0, js y , 0). Die Lösungen dieser Gleichungen p Bx B0x exp l0 =kL z B0x exp
z=KL ; p js y j 0s y exp l0 =kL z j 0s y exp
z=KL
10:14 b
10:15 a
10:15 b
zeigen, dass einmal das Magnetfeld in den Supraleiter eindringt, ins Innere hinein jedoch über die sog. London-Eindringtiefe p KL m= l0 ns e2
10:16 exponentiell abklingt. Zum anderen klingen auch die supraleitenden Ströme, die das Innere des Supraleiters gegen das äußere Magnetfeld abschirmen, in den Supraleiter hinein exponentiell ab. Für eine größenordnungsmäßige Abschätzung der Londonschen Eindringtiefe setzt man für m die Elektronen-Elementarmasse und für ns die Atomdichte, d. h. jedes Atom liefert dann ein supraleitendes Elektron. Für Sn z. B. wird damit KL = 260 Å. Es ist ein wesentliches Element der atomistischen Theorie der Supraleitung, dass nicht einzelne Elektronen, sondern Elektronenpaare, sog. Cooper-Paare, den Stromtransport tragen. Dem könnte man in den Londonschen Gleichungen Rechnung tragen, indem man statt auf ns auf ns/2, die halbe Elektronendichte, bezieht. Da die London-Gleichungen insbesondere den Meissner-Ochsenfeld-Effekt gut beschreiben, sollte eine atomistische Theorie der Supraleitung in der Lage sein, u. a. eine Gleichung des Typs (10.10 b) zu liefern; dies und eine Erklärung des verschwindenden Widerstandes bei genügend kleinen Temperaturen (T < Tc) ist das zentrale Anliegen der schon erwähnten BCS-Theorie. Da es sich bei der Supraleitung offenbar um ein weitverbreitetes Phänomen handelt, muss auch die Theorie genügend allgemein sein; sie darf also nicht an spezielle Eigenschaften eines Metalls geknüpft sein. In den beiden folgenden Abschnitten werden wesentliche Grundzüge der atomistischen Theorie der Supraleitung in einer etwas vereinfachten Darstellung behandelt.
10.3 Instabilität des „Fermi-Sees“ und Cooper-Paare
295
10.3 Instabilität des „Fermi-Sees“ und Cooper-Paare Aus den besprochenen, grundlegenden Experimenten zum Phänomen der Supraleitung folgt, dass es sich um eine neue Phase des Elektronengases im Metall handeln muss, der die ungewöhnliche Eigenschaft „unendlich hoher“ Leitfähigkeit zukommt. Wesentlich zum Verständnis dieser neuen Phase trug bei, dass Cooper [10.6] 1956 erkannte, dass der in Abschn. 6.2 beschriebene Grundzustand (T = 0 K) eines Elektronengases zusammenbricht, wenn eine auch noch so schwache attraktive Wechselwirkung zwischen je zwei Elektronen zugelassen wird. Als eine solche Wechselwirkung war schon von Fröhlich [10.7] die Wechselwirkung über Phononen diskutiert worden. Auf seinem Weg durch den Festkörper hinterlässt ein Elektron aufgrund seiner negativen Ladung eine Deformationsspur der Ionenrümpfe. Diese Spur mit einer Anhäufung positiver Ladung der Ionenrümpfe wirkt auf ein zweites Elektron attraktiv, so dass über die Gitterdeformation eine schwache Anziehung zwischen je zwei Elektronen zustande kommt (Abb. 10.7 a). Die hierdurch gegebene attraktive Elektron-Elektron-Wechselwirkung ist wegen der langsameren Bewegung der Ionen gegenüber der Coulomb-Abstoßung zwischen den Elektronen retardiert; im Moment des Vorbeifliegens eines Elektrons erhalten die Ionen einen Kraftstoß, der erst nach
Abb. 10.7 a, b. Schematische Veranschaulichung der phononinduzierten ElektronElektron-Wechselwirkung, die zur Bildung von Cooper-Paaren führt. (a) Ein durch das Kristallgitter fliegendes Elektron (e–) hinterlässt eine Deformationsspur, die sich (stark übertrieben) als Verdichtung der positiv geladenen Rümpfe, d. h. also der Netzebenen beschreiben lässt. Dies bedeutet, dass hinter dem Elektron ein Gebiet mit erhöhter positiver Ladung (im Vergleich zum sonst neutralen Kristall) auftritt, das anziehend auf ein zweites Elektron wirkt. (b) Qualitative Entwicklung der Auslenkung der Rümpfe, die hinter dem 1. Elektron die Gitterdeformation bilden. Gegenüber der hohen Elektronengeschwindigkeit v F (*108 cm/s) folgt das Gitter nur sehr langsam, es erreicht seine maximale Deformation bei einer Entfernung v F 2 p/xD hinter dem Elektron, die gegeben ist durch die typische Phononenfrequenz xD (Debye-Frequenz). Die Kopplung der beiden Elektronen im Cooper-Paar geschieht also über Entfernungen von mehr als 1000 Å, über die die Coulomb-Abstoßung weitgehend abgeschirmt ist
296
10. Supraleitung
dem Passieren des Elektrons zu einer Bewegung der Ionen und damit zu einer Polarisation des Gitters führt (Abb. 10.7 b). Die Gitterdeformation erreicht ihr Maximum bei einer Entfernung vom Aufelektron, die durch die Elektronengeschwindigkeit (Fermi-Geschwindigkeit v F*108 cm/s) und die Phonon-Schwingungsdauer (2p/xD*10–13 s) abgeschätzt werden kann. Die beiden über die Gitterdeformation korrelierten Elektronen haben so einen größenordnungsmäßigen Abstand von 1000 Å. Dies entspricht natürlich der geometrischen Ausdehnung eines Cooper-Paares, die in Abschn. 10.7 auf andere Weise abgeschätzt wird. Die enorm hohe Reichweite der über Gitterdeformation vermittelten Elektronenkorrelation erklärt weiter, warum die Coulomb-Abstoßung keine merkliche Rolle mehr spielt; sie wird über Entfernungen von einigen Ångström abgeschirmt. Quantenmechanisch lässt sich die Gitterdeformation als die Überlagerung der Phononen verstehen, die das Elektron durch seine Wechselwirkung mit dem Gitter ständig emittiert und absorbiert. Damit der Energiesatz nicht verletzt wird, dürfen die die Gitterdeformation konstituierenden Phononen nur während einer durch die Unschärferelation bestimmten Zeitspanne s = 2p/x existieren, um danach wieder von Elektronen „eingefangen“ zu werden. Man spricht deshalb auch von „virtuellen“ Phononen. Der Grundzustand des nicht wechselwirkenden Fermi-Gases der Elektronen im Potentialtopf (Kap. 6) ist dadurch gegeben, dass alle Einelektronenzustände mit Wellenvektor k bis zur Fermi-Kante E 0F (T = 0 K) = h 2 k 2F/2 m aufgefüllt sind und alle Zustände mit E > E 0F unbesetzt sind. Wir machen jetzt ein Gedankenexperiment und fügen diesem System zwei Elektronen [k1, E (k1)] und [k2, E (k2)] auf Zuständen gerade oberhalb von E 0F hinzu. Zwischen diesen beiden Elektronen soll die beschriebene schwache attraktive Wechselwirkung vermöge Phononenaustausch „eingeschaltet“ sein. Alle anderen Elektronen im Fermi-See sollen weiterhin als nicht wechselwirkend angenommen werden; sie sollen wegen des Ausschließungsprinzips eine weitere Besetzung der Zustände mit
Abb. 10.8. Veranschaulichung von Elektron-Paarstößen (im reziproken Raum der Wellenzahlen), bei denen k1 k2 k01 k02 K konstant bleibt. Zwei Kugelschalen mit Fermi-Radius kF und Dicke Dk beschreiben die Paare von Wellenvektoren k1 und k2. Alle Paare, für die k1+k2 = K gilt, enden im schattierten Volumen (rotationssymmetrisch um K ). Die Zahl dieser Paare k1, k2 ist proportional zu diesem Volumen im k-Raum. Ein Maximum ergibt sich für K = 0
10.3 Instabilität des „Fermi-Sees“ und Cooper-Paare
297
jkj < kF verhindern. Beim Phononenaustausch wechseln die beiden Elektronen beständig ihre Wellenzahlvektoren, wobei der Erhaltungssatz k1 k2 k01 k02 K
10:17
gelten muss. Wegen der Beschränkung der Wechselwirkung im kRaum auf eine Schale der Energiebreite h xD (mit xD = Debye-Frequenz) oberhalb von E 0F sind alle möglichen k-Zustände durch die schattierte Fläche in Abb. 10.8 gegeben. Diese Fläche und damit die Anzahl der die Energie absenkenden Phononenaustauschprozesse – d. h. die Stärke der anziehenden Wechselwirkung – wird maximal für K = 0. Es genügt also, im weiteren nur den Fall k1 = –k2= k, d. h. Elektronenpaare mit entgegengesetztem Wellenzahlvektor, zu betrachten. Die zugehörige Zweiteilchen-Wellenfunktion w (r1, r2) muss der Schrödinger-Gleichung h2
D1 D2 w
r1 ; r2 V
r1 ; r2 w
r1 ; r2 2m Ew
r1 ; r2
e 2EF0 w
r1 ; r2 :
10:18
gehorchen. e ist die Energie des Elektronenpaares, bezogen auf den wechselwirkungsfreien Zustand
V 0, bei dem jedes der beiden Elektronen an der Fermi-Kante eine Energie E 0F = h 2 k 2F/2 m besitzen würde. Die Zweiteilchenwellenfunktion setzt sich in diesem Fall aus zwei ebenen Wellen zusammen: 1 i k1 r1 1 i k2 r2 1 p e p e 3 ei k
r1 r2 :
10:19 3 3 L L L Die allgemeinste Darstellung der Zweiteilchenfunktion für den Fall nichtverschwindender Wechselwirkung (V j 0) lässt sich als Entwicklung darstellen: 1X g
kei k
r1 r2 :
10:20 w
r1 r2 3 L k Sie hängt nur noch von der Relativkoordinate r = r1– r2 ab. Hierbei läuft die Summe nur über solche Paare k = k1 = – k2, die wegen der Beschränkung der Wechselwirkung auf das Gebiet h xD (Abb. 10.9) der Bedingung h2 k2 < EF0 hxD
10:21 a 2m gehorchen. In Abb. 10.9 ist anders als in der hier benutzten Einschränkung (10.21 a) die Wechselwirkung in einer Schale 2 h xD symmetrisch um EF herum angenommen, so wie es in der Vielteilchenbeschreibung des BCS-Grundzustandes (Abschn. 10.4) erforderlich ist. jg
kj2 ist die Wahrscheinlichkeit, ein Elektron im Zustand k und das andere in –k, – d. h. das Elektronenpaar in (k, –k) – zu finden. Wegen des Pauli-Prinzips und wegen der Bedingung (10.21 a) gilt EF0
2m
EF0 hxD =h2 :
10:21 b
Einsetzen von (10.20) in (10.18), Multiplikation mit exp (–i k '·r ) und Integration über das Normierungsvolumen ergibt h2 k2 1X g
k 3 g
k0 Vkk0
e 2EF0 g
k :
10:22 m L k0 Hierbei beschreibt das Wechselwirkungsmatrixelement 0 Vkk0 V
re i
k k r dr
10:23
Stöße des Elektronenpaares von
k; k nach
k0 ; k0 und umgekehrt. Im einfachsten Modell wird dieses Matrixelement Vkk0 als unabhängig von k und attraktiv angenommen, also Vkk0 < 0: 8 2 2 < h k h2 k02 0 < EF0 hxD : V
V > 0 f u r E < ; 0 0 F Vkk0 2m 2m : 0 sonst: (10.24) Damit folgt aus (10.22) 2 2 h k 0 e 2EF g
k A ; wo
10:25 a m V0 X A 3 g
k0
10:25 b L k0 unabhängig von k ist. Nach Summation von (10.25 a) über k folgt durch Vergleich mit (10.25 b) aus Konsistenzgründen V0 X 1 :
10:26 1 3 L k e h2 k2 =m 2EF0 Wir nennen n = h 2 k 2/2 m–E 0F und ersetzen die Summe über die Paarzustände k durch ein Integral über den k-Raum (L –3 åk )
10.3 Instabilität des „Fermi-Sees“ und Cooper-Paare
299
dk/4 p 3); hierbei berücksichtigen wir, dass nur über eine Energieschale der Dicke h xD E 0F integriert wird, in der die Zustandsdichte des freien Elektronengases (6.11)
2m3=2 0
EF n1=2 D
EF0
10:27 2p2 h3 als fast konstant [& D (E0F)] angenommen werden kann. Da wir über Paarzustände (k, –k) integrieren, muss die halbe Zustandsdichte Z (E0F) = D (E0F)/2 an der Fermi-Kante genommen werden, d. h. aus (10.26) folgt
D
EF0 n
h
xD
1
V0 Z
EF0
1 2n
0
e
10:28
dn
und nach Integration 1 e 2 hxD 1 V0 Z
EF0 ln e 2 2hxD e : 1 exp2=V0 Z
EF0
bzw:
10:29 a
10:29 b
Für den Fall schwacher Wechselwirkung V0 Z
EF0 1 folgt so e
2hxD e
2=V0 Z
EF0
:
10:30
Es existiert also ein gebundener Zweielektronenzustand, dessen Energie gegenüber dem voll besetzten Fermi-See (T = 0) um e = E–2 E 0F < 0 abgesenkt ist. Der Grundzustand des in Abschn. 6.2 behandelten nicht-wechselwirkenden freien Elektronengases wird also instabil bei „Einschalten“ einer noch so kleinen attraktiven Wechselwirkung zwischen den Elektronen. Es sei noch einmal darauf hingewiesen, dass die Energieabsenkung e (10.30) aus einem Gedankenexperiment resultiert, bei dem der Fermi-See für Zustände mit h 2 k 2/2 m < E 0F als fixiert angenommen wurde und nur die Wirkung der Attraktion auf zwei zusätzliche Elektronen in Gegenwart des Fermi-Sees betrachtet wurde. In Wirklichkeit wird die Instabilität dazu führen, dass sich eine hohe Dichte solcher Elektronenpaare, sog. Cooper-Paare (k, –k), bildet und das System einem neuen Grundzustand niedrigerer Energie zustrebt. Dieser neue Grundzustand ist identisch mit der supraleitenden Phase, wie sich zeigen wird. Für die vorangehende Betrachtung war wesentlich, dass für beide Elektronen in bezug auf die Zustände in der Fermi-Kugel das Pauli-Prinzip gilt. Da der Ansatz für die Zweiteilchenwellenfunktion (10.19) in den Ortskoordinaten (r1, r2) symmetrisch gegenüber einer Vertauschung der Elektronen 1 und 2 war, die Gesamtwellenfunktion einschließlich der Spins aber antisymmetrisch sein muss (allgemeinste Formulierung des Pauli-Prinzips), ist der in (10.19) nicht dargestellte Spinanteil antisymmetrisch. Das Cooper-Paar besteht also aus zwei Elektronen mit entgegengesetztem Wellenvek-
300
10. Supraleitung
tor und entgegengesetztem Spin
k "; k #. Die Pfeile bezeichnen dabei die entgegengesetzten Spineinstellungen. Man spricht in diesem Zusammenhang auch oft von Singulett-Paaren. Es sei darauf hingewiesen, dass die Annahme komplizierterer Elektron-ElektronKopplungen auch zu spinparalleler Paarbildung, sog. Tripletts, führen könnte. Solche Modelle werden diskutiert. Experimentelle Belege für die Existenz stehen jedoch aus. Triplett-Paare sind jedoch in flüssigem 3He gefunden worden. Bei tiefen Temperaturen verhält sich dieses System wie ein entartetes Fermi-Gas.
10.4 Der BCS-Grundzustand In Abschn. 10.3 haben wir gesehen, dass durch die schwache attraktive Wechselwirkung, die aus der Elektron-Phonon-Wechselwirkung resultiert, eine Paarung zu „Cooper-Paaren“ erfolgt. Die Energieabsenkung, die der Fermi-See durch Bildung eines einzigen Paares erfährt, wurde in (10.29) ausgerechnet. Ein solches CooperPaar muss man sich vorstellen als ein Elektronenpaar, in dem die beiden Elektronen andauernd Zustände
k "; k #,
k0"; k0#, usw. mit entgegengesetztem k-Vektor und Spin besetzen. Das Matrixelement Vkk0 (10.23) vermittelt diese Art der Wechselwirkung, beschreibt also Paarstöße von
k "; k # nach
k0"; k0#, die zu der Energieabsenkung bei Bildung eines Cooper-Paares führen (Abb. 10.10). Infolge der Energieabsenkung werden sich immer mehr Cooper-Paare bilden. Da jedoch eine Anregung über E 0F hinaus erforderlich ist, ist mit der Paarung auch eine Zunahme an kinetischer Energie verbunden. Der neue Grundzustand des FermiSees, der sich bei der Paarbildung einstellt, wird demnach durch ein kompliziertes Wechselspiel zwischen den Elektronen erreicht. Die Gesamtenergieabsenkung ergibt sich nicht durch einfache Summation von Beiträgen (10.29) einzelner Cooper-Paare. Der Effekt jedes einzelnen Cooper-Paares hängt von den schon vorhande-
Abb. 10.10. Veranschaulichung eines Stoßes eines Elektronenpaares mit den Wellenvektoren (k, –k) nach (k', –k')
10.4 Der BCS-Grundzustand
301
nen ab. Es muss also für die Gesamtheit aller möglichen Paarbildungen das Minimum der Gesamtenergie (Grenzfall T = 0 K) des Systems unter Berücksichtigung des kinetischen Einelektronenanteils und der durch die „Paarstöße“, d. h. die Elektron-PhononWechselwirkung, vermittelten Energieabsenkung aufgesucht werden. Der kinetische Anteil lässt sich sofort angeben: Es sei wk die Wahrscheinlichkeit, dass der Paarzustand
k "; k # besetzt ist, und wie in Abschn. 10.3 seien alle Einteilchenenergien nk auf das Fermi-Niveau bezogen, d. h. nk = E (k)–E 0F = (h2 k2/2 m)–E 0F. Dann gilt für den kinetischen Anteil Ekin X Ekin 2 wk nk :
10:31 k
Die totale Energieabsenkung, die durch Paarstöße
k "; k # !
k0"; k0# zustande kommt, errechnen wir am einfachsten über einen Hamilton-Operator H , der explizit der Tatsache Rechnung trägt, dass bei „Vernichtung“ eines Paares
k "; k # und „gleichzeitiger Erzeugung“ eines Paares
k0"; k0#, d. h. einer Streuung von
k "; k # nach
k0"; k0#, eine Energieabsenkung um Vkk0 eintritt (Abschn. 10.3). Da ein Paarzustand k entweder besetzt oder unbesetzt sein kann, wählen wir eine Darstellung durch zwei zueinander orthogonale Zustände j1ik und j0ik: j1ik ist der Zustand, bei dem
k "; k # besetzt ist, j0ik der Zustand der Nichtbesetzung. Der allgemeinste Zustand des Paares
k "; k # ist also gegeben durch jwk i uk j0ik v k j1ik :
10:32
Dies ist eine andere Darstellung der Cooper-Paar-Wellenfunktion (10.19). wk = v 2k ist hierbei die Wahrscheinlichkeit, dass der Paarzustand besetzt ist und 1–wk = u 2k die Nichtbesetzungswahrscheinlichkeit. Die Wahrscheinlichkeitsamplituden v k und uk werden als reell angenommen. Wie in ausführlicheren theoretischen Darstellungen gezeigt wird, ist diese Einschränkung unwesentlich. In der Darstellung (10.32) ergibt sich näherungsweise für den Grundzustand des Vielteilchensystems aller Cooper-Paare der Gesamtzustandsvektor als Produkt der Zustandsvektoren der einzelnen Paare Y jyBCS i '
uk j0ik v k j1ik :
10:33 k
Die Näherung besteht darin, dass der Vielteilchenzustand durch nichtwechselwirkende Paare beschrieben wird, Wechselwirkungen zwischen den Paaren im Zustandsvektor also vernachlässigt werden. Das „Erzeugen“ oder „Vernichten“ eines Cooper-Paares k in der zweidimensionalen Darstellung 1 0 j1ik ; j0ik
10:34 0 k 1 k lässt sich durch die Pauli-Matrizen
302
1
rk
10. Supraleitung
0 1 1 0
k
;
2
rk
0 i
i 0
k
10:35
wie folgt darstellen: Der Operator
1
2
1 r k 2
rk i rk
10:36 a
verwandelt den Zustand der Nichtbesetzung j0ik in den der Besetzung j1ik , während
1
rk 12
rk
2
i rk
10:36 b
den Zustand j1ik in j0ik überführt; d. h. aus den Darstellungen (10.34–10.36) folgen die Eigenschaften r k j1ik 0 ; rk j1ik j0ik ;
r k j0ik j1ik ;
10:37 a
rk j0ik 0 :
10:37 b
Die Matrizen r +k und r–k sind formal identisch mit den in Abschn. 8.7 eingeführten Spinoperatoren. Ihre physikalische Interpretation als „Erzeuger“ und „Vernichter“ von Cooper-Paaren ist jedoch völlig verschieden von der in Abschn. 8.7, wo das Umklappen eines Spins beschrieben wurde. Bei Streuung von
k "; k # nach
k0"; k0# tritt nun eine Energieabsenkung um Vkk0 auf. Dieses Wechselwirkungsmatrixelement Vkk0 wird im einfachen BCS-Modell der Supraleitung wie in Abschn. 10.3 als unabhängig von k, k ', d. h. als konstant, angenommen. Die Wechselwirkung soll nur in einer Kugelschale der Dicke 2 h xD symmetrisch um E 0F herum, d. h. in [E 0F –h xD, E 0F +h xD] existieren. Bezogen auf das Normierungsvolumen L 3 des Kristalls setzen wir die Wechselwirkung gleich V0 /L 3. Der Streuprozess wird in der zweidimensionalen Darstellung als Vernichtung von k und Erzeugung von k ' beschrieben. Damit ergibt sich für den Operator, der die entsprechende Energieabsenkung beschreibt, ein Term –(V0 /L 3) r +k ' r –k. Die gesamte Energieabsenkung, die aus Paarstößen k ? k ' und k ' ? k resultiert, ergibt sich somit in Operatorschreibweise durch Summation über alle Stöße X1 1 V0 X H 3 V0 r r0:
10:38
r 0 rk rk rk0 k L3 kk0 k k L 2 kk0 Wegen der Beschränkung von V0 auf die Kugelschale ±h xD um E 0F herum erfaßt die Summe über k, k ' auch nur Paarzustände aus dieser Schale. In der Summe sind Stöße in beiden Richtungen berücksichtigt; durch Indexvertauschung folgt die rechte Seite von (10.38). Die durch Stöße bewirkte Energieabsenkung folgt störungstheoretisch als Erwartungswert des Operators H (10.38) im Zustand jyBCS i (10.33) des Vielteilchensystems
10.4 Der BCS-Grundzustand
303
hyBCS jH jyBCS i " # Y X V0 Y
up h0j v p h1j r
uq j0iq v q j1iq : k rk0 L3 p 0 q kk (10.39) Beim Ausrechnen von (10.39) beachte man, dass ein Operator r +k oder r–k nur auf Zustände j1ik und j0ik wirkt. Die Rechenvorschriften sind in (10.37) gegeben. Weiter folgen aus (10.34) die Orthonormalitätsrelationen k h1j1ik
1;
k h0j0ik
1;
k h1j0ik
0:
10:40
Damit ergibt sich hyBCS jH jyBCS i
V0 X v k uk0 uk v k0 : L3 kk0
10:41
Die Gesamtenergie des Systems der Cooper-Paare stellt sich damit nach (10.31 und 10.41) dar als X V0 X WBCS 2 v 2k nk v k uk v k0 uk0 :
10:42 L3 kk0 k Der sich bei T = 0 K einstellende BCS-Grundzustand des Systems der Cooper-Paare ist durch das Minimum W 0BCS der Energiedichte WBCS gegeben. Durch Minimieren von (10.42) nach den Wahrscheinlichkeitsamplituden uk und v k ergeben sich die Energie des Grundzustandes W 0BCS und die im Grundzustand vorliegenden Besetzungs- bzw. Nichtbesetzungswahrscheinlichkeiten wk = v 2k bzw. (1–wk ) = u 2k. Die Rechnung lässt sich wegen der Verknüpfung von v k und uk einfach durchführen, wenn man setzt p
10:43 a v k wk cos hk ; p uk 1 wk sin hk ; d: h:
10:43 b u2k v 2k cos2 hk sin2 hk 1
10:43 c
und nach hk minimalisiert. Damit schreibt sich die zu minimierende Größe X V0 X WBCS 2nk cos2 hk cos hk sin hk0 cos hk0 sin hk L3 kk0 k X 1 V0 X 2nk cos2 hk sin 2hk sin 2hk0 : 4 L3 kk0 k
10:44
Die Bedingung für das Minimum von WBCS lautet dann @WBCS @hk
2nk sin 2hk
V0 X cos 2hk sin 2hk0 0 ; L3 k0
bzw:
10:45 a
304
10. Supraleitung
nk tan 2hk
1 V0 X sin 2hk0 : 2 L3 k0
Man setzt V0 X V0 X uk0 v k0 3 sin hk0 cos hk0 ; D 3 L k0 L k0 q Ek n2k D2
10:45 b
10:46
10:47
und erhält über trigonometrische Beziehungen sin 2hk tan 2hk D=nk ; cos 2hk 2uk v k sin 2hk D=Ek ; v 2k
u2k
nk =Ek :
10:48
10:49
10:50
Damit ergibt sich für die Besetzungswahrscheinlichkeit wk = v 2k eines Paarzustandes
k "; k # im BCS-Grundzustand bei T = 0 K 0 1 1 nk 1B nk C A : 1 @1 q
10:51 wk v 2k Ek 2 2 2 2 nk D Die Funktion ist in Abb. 10.11 abgebildet. Sie hat bei T = 0 K (!) einen ähnlichen Verlauf wie die Fermi-Funktion bei einer endlichen Temperatur; eine genauere Analyse zeigt, wie die Fermi-Verteilung bei der endlichen Sprungtemperatur Tc. Man beachte, dass diese Darstellung von v 2k über Einteilchenzustände, d. h. mit scharfen Quantenzahlen k von Einteilchenzuständen, geschieht. Diese Darstellung ist dem Vielteilchenproblem nicht unbedingt angemessen, z. B. erkennt man in dieser Darstellung nicht die Energielücke, die sich im Anregungsspektrum des Supraleiters ergibt (siehe unten). Auf der anderen Seite erkennt man am Verlauf von v 2k, dass die Cooper-Paare, die zur Energieerniedrigung des Grundzustandes beitragen, aus Einteilchenwellenfunktionen eines k-Bereiches aufgebaut
Abb. 10.11. Darstellung der BCS-Besetzungswahrscheinlichkeit v 2k für CooperPaare in der Umgebung der Fermi-Energie E 0F. In der Darstellung der Energien als nk = E (k)–E 0F dient die Fermi-Energie als Referenzpunkt. Zum Vergleich ist auch die Fermi-Dirac-Verteilungsfunktion für normalleitende Elektronen bei einer Temperatur Tc (kritische Temperatur) gestrichelt eingezeichnet. Der Bezug wird über die BCS-Beziehung zwischen D (0) und Tc (10.67) hergestellt
10.4 Der BCS-Grundzustand
305
sind, der einer Energieschale von ±D um die Fermi-Energiefläche herum entspricht. Die Energie des supraleitenden BCS-Grundzustandes W 0BCS ergibt sich, indem man in WBCS – (10.42 bzw. 10.44) – die aus der Minimierung folgenden Beziehungen (10.48–10.51) einsetzt, d. h. es folgt X D2 0 WBCS nk
1 nk =Ek L3 :
10:52 a V0 k Die Kondensationsenergie der supraleitenden Phase ergibt sich, indem man von W 0BCS die Energie der normalleitenden Phase, d. h. 0 die P des Fermi-Sees ohne attraktive Wechselwirkung Wn abzieht. Die Rechnung lässt sich z. B. durchführen, jkj 2D, während für Energien unterhalb 2D der Supraleiter total reflektiert, da es keine Anregungsmöglichkeiten gibt. Bei jeder von T = 0 verschiedenen Temperatur besteht eine endliche Wahrscheinlichkeit dafür, einige Elektronen im Normalzustand zu finden. Mit zunehmender Temperatur werden immer mehr Cooper-Paare aufbrechen, d. h. eine Temperaturerhöhung hat zerstörende Wirkung auf die supraleitende Phase. Die kritische Temperatur Tc (Sprungpunkt) ist gerade so definiert, dass dort der Supraleiter in den normalleitenden Zustand übergeht, also keine Cooper-Paare mehr existieren. Damit muss aber auch die Lücke D bzw. 2D sich geschlossen haben, denn der normalleitende Zustand hat ein kontinuierliches Anregungsspektrum (Kap. 6). Die Lückenenergie D muss deshalb eine Funktion der Temperatur mit D (T) = 0 für T = Tc sein. Die Lücke D bzw. 2D eines Supraleiters lässt sich also nicht mit dem näherungsweise konstanten verbotenen Band eines Halbleiters
Abb. 10.15. Infrarot-Reflexion verschiedener Materialien, gemessen als Intensität I vielfach reflektierter Mikrowellenstrahlung. Die Intensitäten IS und IN resultieren aus Messungen, bei denen die Materialien supraleitend bzw. normalleitend waren. Die dargestellten Messkurven beschreiben also den Unterschied der Infrarot-Reflexion zwischen supraleitendem und normalleitendem Zustand. (Nach Richards und Tinkham [10.11])
316
10. Supraleitung
(Kap. 12) vergleichen. Im Rahmen der BCS-Theorie lässt sich die Temperaturabhängigkeit von D berechnen. Bei endlicher Temperatur regelt sich die Besetzung der angeregten Einelektronenzustände Ek = (n2k+D2)1/2 (10.58) gemäß der Fermi-Statistik f (Ek,T) (Abschn. 6.3). In der Bestimmungsgleichung für D (10.61) wird dieser Tatsache Rechnung getragen, indem die Nichtbesetzung entsprechender Paarzustände eingeht. Statt (10.61) gilt deshalb 1 V0 Z
EF0
h
xD
0
dn p 1 2 n D2
q 2f
n2 D2 EF0 ; T :
10:77
Der doppelte Wert der Fermi-Funktion tritt auf, weil entweder der Zustand bei k oder der bei –k besetzt werden kann. Weil f (Ek > E 0F , T ? 0) für T ? 0 verschwindet, enthält die allgemeinere Formel (10.77) den Grenzfall (10.61). Die zu (10.61–10.63) analoge Integration von (10.77) ergibt die Lückenenergie D als Funktion der Temperatur T. In einer normierten Auftragung D (T)/D (T = 0) gegen T/Tc ergibt dies eine universelle Kurve für alle Supraleiter. Diese Kurve ist in Abb. 10.16 zusammen mit Messdaten für die drei Supraleiter In, Sn und Pb gezeigt. Abweichungen vom theoretischen Verlauf sind vor allem darauf zurückzuführen, dass die in der BCS-Theorie gemachte Annahme eines konstanten Wechselwirkungsmatrixelementes V0/L 3 zu einfach ist. Da Phononen die Ursache für die Kopplung sind, wird sich in Vkk' auch die Phononenstruktur des speziellen Materials zeigen. Verbesserungen der BCS-Theorie in diese Richtung erlauben heute eine sehr gute Beschreibung einfacherer Supraleiter. Aus (10.77) lässt sich auch eine Bestimmungsgleichung für die kritische Sprungtemperatur Tc herleiten, man braucht nur D gleich Null zu setzen. Damit ergibt sich
Abb. 10.16. Temperaturabhängigkeit der Lückenenergie D (T) bezogen auf den Wert D (0) bei T = 0 für In, Sn und Pb. Experimentell aus Tunnelexperimenten (Tafel IX) bestimmte Werte sind verglichen mit der errechneten Vorhersage der BCS-Theorie (gestrichelt ). (Nach Giaever und Megerle [10.12])
10.6 Konsequenzen der BCS-Theorie
1 V0 Z
EF0
h
xD
0
dn n tanh : n 2 k Tc
317
10:78
Eine numerische Behandlung des Integrals (10.78) ergibt 1 V0 Z
EF0 ln k Tc 1;14hxD e
1;14hxD k Tc 1=V0 Z
EF0
10:79 a
oder
:
10:79 b
Diese Formel für die Sprungtemperatur Tc ist bis auf konstante Faktoren identisch mit der für die Lückenenergie D (0) bei T = 0 K (10.63). Ein Vergleich von (10.79 b) mit (10.63) liefert die im Rahmen der BCS-Theorie gültige Beziehung zwischen der Lückenenergie D (0) und der Sprungtemperatur D
0=k Tc 2=1;14 1;764 :
10:80
k Tc entspricht also etwa der halben Lückenenergie bei T = 0 K. Wie gut diese Beziehung für einige Supraleiter erfüllt ist, geht aus Tabelle 10.1 hervor. Weiter gestattet die experimentelle Bestimmung von Tc bzw. D (0) die Berechnung der sog. Kopplungskonstanten Z (E0F) V0 nach (10.79 b bzw. 10.63). Nach Tabelle 10.1 liegen die Werte für übliche Supraleiter zwischen 0,18 und 0,4. Nach (10.63 u. 10.79 b) sind sowohl die Lückenenergie D (0) als auch die Sprungtemperatur Tc proportional zur Phonon-Abschneidefrequenz xD (Debye-Frequenz). Nach Abschn. 4.3 und 5.3 variieren bei gleichen interatomaren Rückstellkräften die Phononfrequenzen, insbesondere also auch xD mit der Atommasse M wie M –1/2. Für zwei verschiedene Isotope des gleichen Materials sind die elektronischen Eigenschaften, d. h. also auch die chemischen Bindungskräfte, gleich. Wegen der unterschiedlichen Atommasse sollte dann jedoch sowohl Tc als auch D (0) proportional zu M –1/2 sein. Man nennt diese Aussage „Isotopeneffekt“. Abbildung 10.17 zeigt experimentelle Ergebnisse für Sn [10.13], die von verschiedenen Autoren stammen. Tabelle 10.1. Debye-Temperatur hD, Sprungtemperatur Tc, Supraleitungs-Kopplungskonstante Z (E0F) V0 und Lückenenergie D bezogen auf Sprungtemperatur Tc für einige Supraleiter Metall
hD [K]
Tc [K]
Z (E0F) V0
D (0)/k Tc
Zn Cd Hg Al In Tl Sn Pb
235 164 70 375 109 100 195 96
0,9 0,56 4,16 1,2 3,4 2,4 3,75 7,22
0,18 0,18 0,35 0,18 0,29 0,27 0,25 0,39
1,6 1,6 2,3 1,7 1,8 1,8 1,75 2,15
318
10. Supraleitung
Abb. 10.17. Isotopeneffekt für Zinn (Sn). Es sind Ergebnisse mehrerer Autoren zusammengestellt [10.13]: Maxwell (*); Lock, Pippard, Shoenberg (n); Serin, Reynolds und Lohman (~)
Die Übereinstimmung zwischen der erwarteten M –1/2 Abhängigkeit und dem Experiment ist für diesen Fall des Sn sehr gut. Man findet jedoch insbesondere bei Übergangsmetallen erhebliche Abweichungen des Massenexponenten von 0,5 z. B.: 0,33 für Mo oder 0,2 für Os. Diese Abweichungen sind nicht erstaunlich, wenn man an die stark vereinfachenden Annahmen für das Wechselwirkungsmatrixelement V0 (10.24 bzw. 10.38) denkt. Im Rahmen der einfachen BCS-Theorie ist die Debye-Frequenz xD die einzige Größe, die noch Aussagen über das spezielle Phonon-Spektrum enthält. Andererseits beweist das Auftreten des Isotopeneffektes den wesentlichen Einfluss der Phononen auf das Zustandekommen der attraktiven Elektronenwechselwirkung, wie sie in der BCS-Theorie zur Erklärung der Supraleitung herangezogen wird.
10.7 Suprastrom und kritischer Strom Das Hauptziel einer Theorie der Supraleitung besteht natürlich darin, die beiden Fundamentaleigenschaften der supraleitenden Phase, das Verschwinden des elektrischen Widerstandes für T < Tc und den idealen Diamagnetismus, der sich im Meissner-Ochsenfeld-Effekt zeigt, zu erklären. Wie folgt also aus der Existenz von Cooper-Paaren bzw. aus den Eigenschaften des BCS-Grundzustandes, dass Streuprozesse nicht zu einem endlichen Widerstand führen? Betrachten wir dazu, welchen Einfluss Stromfluss auf den BCSGrundzustand, insbesondere auf die Existenz der Lücke 2D im Anregungsspektrum hat. Nach Abschn. 9.5 lässt sich eine Stromdichte j durch eine Erhöhung des Impulses oder des k-Vektors der den Strom tragenden Ladungsträger beschreiben: Sei wiederum ns die Dichte der einzelnen Elektronen, die in Form von Cooper-Paaren die Suprastromdichte js tragen, dann gilt
10.7 Suprastrom und kritischer Strom
js
ns e v
319
10:81
und
m v hk :
10:82
Jedes einzelne Elektron in einem Cooper-Paar erfährt damit bei Stromfluss eine Änderung seines k-Vektors um 1 K 2
m j : ns e h s
10:83
Dem Cooper-Paar als Ganzem kommt also ein zusätzlicher Impuls P = h K zu, so dass das Paar (k:, –k;) bei Stromfluss durch
k1"; k2#
k 12 K "; k 12 K #
10:84
beschrieben werden muss. Die Wellenfunktion eines Cooper-Paares (10.20) schreibt sich bei Stromfluss ohne Berücksichtigung des Spin somit als 1X g
kei k1 r1 i k2 r2 w
r1 ; r2 3 L k 1X 3 g
kei K
r1 r2 =2 ei k
r1 r2 :
10:85 L k Mit R = (r1+r2)/2 als Schwerpunktskoordinate und r = r1– r2 als Relativkoordinate des Cooper-Paares folgt für die Wellenfunktion bei Stromfluss (K j 0): 1X g
kei kr ei KR w
K 0; r1 r2 :
10:86 w
r1 ; r2 ei KR 3 L k Stromfluss ändert die Cooper-Paar-Wellenfunktionen also nur um einen Phasenfaktor, der sich in der messbaren Wahrscheinlichkeitsdichte nicht mehr bemerkbar macht jw
K j 0; rj2 jw
K 0; rj2 :
10:87
Da die attraktive Wechselwirkung V (r1–r2) nur vom Relativabstand der beiden das Cooper-Paar konstituierenden Elektronen abhängt, folgt mit (10.86) für das Wechselwirkungsmatrixelement (10.23) bei Stromfluss Vk k0
K j 0 drw
K j 0; r V
rw
K j 0; r drw
K 0; r V
rw
K 0; r V 0
K 0 : kk
(10.88) Wegen der Invarianz von Vk k ' gegenüber Stromfluss kann in der BCS-Grundzustandsenergie (10.42) ein und derselbe Wechselwirkungsparameter V0 /L 3 für den stromlosen wie für den stromführenden Zustand genommen werden. Wegen (10.84) bedeutet deshalb Stromfluss im Rahmen der BCS-Theorie nur eine Verschiebung des k-Koordinatensystems um K/2 (10.83). Alle Gleichungen von (10.42) ab bleiben im verscho-
320
10. Supraleitung
benen reziproken Raum gleich; insbesondere ergibt sich bei Stromfluss die gleiche Lückenenergie D (10.60 bzw. 10.63), da für ihre Berechnung die Integration (10.61) über das gleiche Gebiet des kRaums wie im stromlosen Fall – nur in einem verschobenen Koordinatensystem – durchgeführt werden muss. Dementsprechend ist der Endwert für D (10.62) auch unabhängig von k. Ist also in einem Supraleiter ein Suprastrom angeregt (z. B. durch einen sich ändernden magnetischen Fluss), so existiert die Lücke im Anregungsspektrum weiter. Eine Änderung des Zustandes, zumindest durch inelastische Elektronenstreuung (z. B. Phononen, Abschn. 9.3–9.5) kann nur durch Anregung über die Lücke 2D hinaus, d. h. durch Aufbrechen mindestens eines Cooper-Paares zustande kommen. Was inelastische Elektronenstöße angeht, so sind diese als Ursache für Ladungsträgerrelaxation, d. h. Stromabnahme, also solange ausgeschlossen, wie der Gesamtimpuls der Cooper-Paare P nicht mit einer Energiezunahme verknüpft ist, die Anregungen über 2D hinaus ermöglicht. Elastische Stöße ändern jedoch auch die Richtung der Elektronengeschwindigkeit, d. h. also den Strom. In Abschn. 10.9 werden wir jedoch sehen, dass aus den Eigenschaften des BCS-Grundzustandes folgt, dass sich in einer Leiterschleife, die einen Suprastrom führt, der magnetische Fluss nur in festen „Quantensprüngen“ ändern kann. Ein elastischer Stoß müsste also, damit er wirksam zur Stromrelaxation beitragen kann, eine Stromänderung gerade entsprechend einem solchen „Flussquant“ zur Folge haben. Für das Eintreten eines solchen Falles ist die Wahrscheinlichkeit verschwindend gering. Ein Strom-tragender Supraleiter befindet sich also in einem stabilen Zustand. Wird durch den Stromfluss selbst, d. h. durch die Zunahme des Schwerpunktimpulses P der Cooper-Paare die Energie 2D erreicht, dann brechen Cooper-Paare auf und die Supraleitung bricht zusammen. Bezogen auf ein Elektron eines Cooper-Paares beträgt die Energie, die mit der Zunahme des Wellenzahlvektors k um K/2 (10.83) verbunden ist, E
k K=22 h2 h2 k2 h2 k K=2 K 2 h2 : 2m 2m 8m m
10:89
Wir betrachten die Energie eines einzelnen Elektrons, weil beim Aufbrechen das zweite Elektron des Cooper-Paares sich nicht kohärent verhält. In linearer Näherung ist wegen jKj kF die Zunahme der Energie pro Teilchen bei Stromfluss gegenüber dem stromlosen Zustand somit dE
1 h2 kF K : 2 m
10:90
Hierbei wurde vorausgesetzt, dass wir entsprechend dem Vorhergesagten nur Elektronen in der Nähe der Fermi-Energie, d. h. mit k & kF betrachten müssen. Damit die Supraleitung zusammenbricht, muss die von einem Cooper-Paar aufgenommene Energie
10.7 Suprastrom und kritischer Strom
321
2 dE die Lückenenergie 2D, die zum Aufbrechen erforderlich ist, übersteigen; d. h. nach (10.83 u. 10.90) muss gelten 2 dE
h2 kF K 2hkF js 2D : e ns m
10:91
Daraus lässt sich eine kritische obere Stromdichte jc für die Existenz der supraleitenden Phase abschätzen jc
e ns D : hkF
10:92
Für Sn ergibt sich experimentell im Grenzfall kleiner Temperaturen T ? 0 K eine kritische Stromdichte jc = 2·107 A/cm2, von der ab die Supraleitung zusammenbricht. Aus den Werten von Tabelle 10.1 und einer Geschwindigkeit der Elektronen an der FermiKante v F = h kF/m von 6,9·107 cm/s ergibt sich für die Konzentration ns der die Supraleitung tragenden Elektronen etwa 8·1021 cm–3. Über die Maxwell-Gleichung rot H j bzw: rot H df H ds j df
10:93 a
10:93 b
ist ein Magnetfeld längs eines geschlossenen Umlaufes eindeutig mit der diesen Umlauf durchdringenden elektrischen Stromdichte verknüpft. Diese Verknüpfung sollte auch für den Suprastrom durch einen langen Draht und das magnetische Feld an der Oberfläche gelten. Denken wir uns den Umlauf unmittelbar auf der Oberfläche des Drahtes (Radius r ), so folgt für die Magnetfeldstärke H an der Oberfläche des Drahtes aus (10.93) 2p r H j df :
10:94 Der Suprastrom in einem „dicken, langen“ Draht ist nun nach Abschn. 10.2 nur auf eine Oberflächenzone der typischen Dicke 100 bis 1000 Å verteilt (Londonsche Eindringtiefe KL). Beschreiben wir die exponentiell ins Innere des Drahtes hinein abklingende Stromdichte durch eine Gleichung der Form j = j 0 exp (–z /KL ), so ergibt sich aus (10.94) 2p r H 2p r KL j 0 :
10:95
Der kritischen Stromdichte jc, (10.92), an der Oberfläche des Supraleiters entspricht also ein oberes kritisches Magnetfeld Hc an der Oberfläche, oberhalb dessen die Supraleitung zusammenbricht: Hc KL jc KL
e ns D : h kF
10:96
Damit haben wir, basierend auf Aussagen der BCS-Theorie, auch die Existenz einer kritischen Magnetfeldstärke erkannt, oberhalb derer Supraleitung nicht möglich ist.
322
10. Supraleitung
Es sei noch bemerkt, dass (10.96) für die kritische Magnetfeldstärke auch dadurch hergeleitet werden kann, dass man die Kondensationsenergiedichte für die supraleitende Phase (10.53) der magnetischen Felddichte beim kritischen Feld Hc Bc gleichsetzt. Übersteigt die magnetische Feldenergie die Kondensationsenergie für die supraleitende Phase, so brechen Cooper-Paare auf. Da nach Abschn. 10.6, insbesondere nach (10.77), die Lückenenergie D eine temperaturabhängige Größe D (T) ist, die bei der kritischen Temperatur Tc auf Null zusammenschrumpft, muss dasselbe nach (10.92) bzw. nach (10.96) auch für die kritische Stromdichte jc (T) und für die kritische Magnetfeldstärke Hc (T) gelten. Der in Abb. 10.5 gezeigte qualitative Verlauf von Hc (T) lässt sich also zurückführen auf die Temperaturabhängigkeit der Lückenenergie D (T) (Abb. 10.16).
10.8 Kohärenz des BCS-Grundzustandes und Meissner-Ochsenfeld-Effekt Nach der erfolgreichen Beschreibung eines Zustandes mit verschwindendem elektrischen Widerstand ist unser weiteres Ziel, den Meissner-Ochsenfeld-Effekt, d. h. den idealen Diamagnetismus, bzw. die Verdrängung eines Magnetfeldes aus dem Supraleiter im Rahmen der mikroskopischen BCS-Theorie zu verstehen. Nach Abschn. 10.2 genügt es dazu in erster Näherung, aus den Eigenschaften von Cooper-Paaren bzw. dem Verhalten des BCS-Grundzustandes in Gegenwart eines Magnetfeldes die 2. Londonsche Gleichung (10.10 b) herzuleiten. Diese Gleichung beschreibt ja als Materialgleichung zusammen mit den Maxwell-Gleichungen das Verhalten eines Supraleiters im Magnetfeld. Wir betrachten also etwas näher die Struktur von Cooper-Paaren und die Wellenfunktion des Grundzustandes. Im Rahmen der BCSNäherung stellt sich die Wellenfunktion des BCS-Grundzustandes als ein Produkt aus gleichartigen Zweiteilchen-Wellenfunktionen von Cooper-Paaren w
r1 r2 ; "# dar. Nach (10.20) können diese Paar-Wellenfunktionen durch Einteilchenwellenfunktionen dargestellt werden, die zu jeweils entgegengesetztem Wellenzahlvektor k und Spin
"# gehören. Aus welchem k bzw. Energiebereich von Einteilchenzuständen diese Wellenfunktionen aufgebaut sind, erkennt man am Verlauf der Besetzungswahrscheinlichkeit wk für den Paarzustand (k:, –k;) (Abb. 10.11): Nur in einem ungefähren Bereich von ±D um die Fermikante E 0F herum ist im Supraleiter eine Modifikation der Einteilchen-Besetzung gegenüber der eines Normalleiters festzustellen. Aus diesem Bereich stammen also die Einteilchenwellenfunktionen, die die Cooper-Paare konstituieren. Aus der Energieunschärfe 2D lässt sich damit der Bereich der Impulsunschärfe d p für Elektronen in einem Cooper-Paar angeben:
10.8 Kohärenz des BCS-Grundzustandes und Meissner-Ochsenfeld-Effekt
2 p pF ' dp : 2D d 2m m
323
10:97
Nach der Unschärferelation entspricht dieser Impulsverteilung eine räumliche „Ausdehnung“ der Cooper-Paar-Wellenfunktion von nCP dx
h hpF h2 kF : dp m2D m2D
10:98
h 2 kF folgt somit Wegen kF = 2 m E 0F/ nCP
EF0 : kF D
10:99
Da E 0F /D typischerweise in der Größenordnung 103 bis 104 ist und kF etwa 108 cm–1 beträgt, ist die Cooper-Paar-Wellenfunktion über Raumbereiche der Größenordnung von typisch 103 bis 104 Å ausgedehnt. Diese Ausdehnung eines Cooper-Paares hatten wir auch schon größenordnungsmäßig aus der räumlich-zeitlichen Verteilung der mit dem Cooper-Paar verbundenen Gitterdeformation abgeschätzt (Abb. 10.7). Räumliche Änderungen des supraleitenden Zustandes beanspruchen also mindestens einen Raumbereich von 103 bis 104 Å. Bezeichnet man mit nkoh die Kohärenzlänge, also die Entfernung, über die sich an der Grenze zwischen einem Normalund einem Supraleiter die Dichte der Cooper-Paare von Null auf ihren Maximalwert einstellt, so gilt immer nkoh > nCP. Nehmen wir wegen E 0F/D&104 an, dass von etwa 1023 Elektronen pro cm–3 etwa 1019 cm–3 in Cooper-Paaren gepaart sind, so folgt daraus, dass innerhalb eines Volumens von etwa 10–12 cm3, das von einem Cooper-Paar eingenommen wird, noch etwa 106 bis 107 weitere Cooper-Paare ihr Zentrum, d. h. ihren Schwerpunkt, haben. Die Paare sind also nicht als unabhängig voneinander anzusehen, sie sind räumlich „miteinander verankert“. Man ist geneigt, diese hohe Kohärenz des Vielteilchenzustandes mit der Photonenkohärenz in einem Laser-Strahl zu vergleichen. In dieser hohen Kohärenz des BCS-Grundzustandes ist seine hohe Stabilität begründet. Wegen des „gleichgeschalteten“ Verhaltens so vieler einzelner CooperPaare kann man erwarten, dass im supraleitenden Zustand quantenmechanische Effekte im makroskopischen Bereich beobachtbar werden. Dies werden wir bei der Behandlung des Einflusses von Magnetfeldern sehen (Abschn. 10.9, 10.10). Die Tatsache, dass bei einem Cooper-Paar zwei Elektronen mit entgegengesetztem Spin gepaart sind, der Gesamtspin eines Cooper-Paares also verschwindet, hat zur Folge, dass die Statistik von Cooper-Paaren sich näherungsweise wie die von Bosonen (Teilchen mit ganzzahligem Spin) darstellt, d. h. für Cooper-Paare gilt näherungsweise kein Pauli-Prinzip: Cooper-Paare befinden sich alle im gleichen BCS-Grundzustand, d. h. die zeitabhängige Darstellung ihrer Wellenfunktion enthält im Exponenten ein und dieselbe Energie, die des BCS-Grundzustandes. Man sollte jedoch Cooper-Paare
324
10. Supraleitung
wegen der hohen Kohärenz des Grundzustandes nur sehr bedingt als ein nichtwechselwirkendes Bose-Gas auffassen. Angemessener ist die Bezeichnung des BCS-Grundzustandes als ein „Kondensat“ von Cooper-Paaren. Im folgenden wollen wir die Stromdichte js des von Cooper-Paaren getragenen Stromes dieses Kondensats in Gegenwart eines Magnetfeldes B = rot A ausrechnen. Dazu gehen wir von der Zweiteilchenwellenfunktion eines Cooper-Paares (10.86) aus und bilden die Vielteilchenwellenfunktion im Rahmen der Näherung nichtwechselwirkender Cooper-Paare als Produkt der Zweiteilchenwellenfunktionen w (r1, r2) (10.86). Die exakte Vielteilchenwellenfunktion lässt sich immer als Entwicklung nach solchen Produktwellenfunktionen darstellen. Wegen (10.86) lässt sich im Falle des Stromflusses die Wellenfunktion eines einzigen Cooper-Paares leicht auf die ohne Stromfluss (K = 0) zurückführen: w
r1 ; r2 eiKR w
K 0; r1
r2 :
10:100
h K ist hierbei der mit Stromfluss verbundene Zusatzimpuls des Cooper-Paares und R die Schwerpunktskoordinate des Paares. Die Wellenfunktion ohne Stromfluss w (K = 0, r1–r2) hängt nur noch von der „internen“ Relativkoordinate r = r1– r2 beider das Cooper-Paar konstituierenden Elektronen, nicht mehr von der Lage des Paares als Ganzes ab. Die genäherte Grundzustandswellenfunktion des Cooper-Paar-Kondensats schreibt sich in der Ortsdarstellung also UBCS ' A eiK R1 eiK R2 . . . eiK Rm . . . U
K 0; . . . rm . . . :
10:101
Alle Cooper-Paare, die mit ihren Schwerpunkten bei R1, R2, . . . Rm . . . liegen, haben durch den Stromfluss dieselbe Änderung ihres Schwerpunktswellenvektors um K erfahren. U (K = 0, . . . rm . . .) = U (0) ist das Produkt der Wellenfunktionen w (K = 0, rm) der einzelnen Cooper-Paare ohne Stromfluss, die nur noch von der internen Relativkoordinate rm (m zählt die Paare) abhängen. A ist ein sog. Antisymmetrisierungsoperator, der wie in der Slater-Determinanten-Darstellung die gesamte Funktion antisymmetrisiert, d. h. jeweils Ausdrücke des Typs (10.101) mit verschiedenem Vorzeichen aufsummiert, so dass UBCS gegen Vertauschung von Einteilchenzuständen antisymmetrisch wird. In der Darstellung (10.33) der Grundzustandswellenfunktion ist die Wirkung von A in den Eigenschaften der zweidimensionalen Zustandsvektoren j0i und j1i bzw. der Spinmatrizen explizit enthalten. A hat in (10.101) im wesentlichen summierende Wirkung und kann für die folgenden Überlegungen unterschlagen werden. Wir wählen also statt (10.101) die vereinfachende Darstellung UBCS ' eiK
R1 R2 ...Rm ... U
0
10:102
für die Wellenfunktion des Cooper-Paar-Kondensats. Hier nun ist die spezifische Eigenart des supraleitenden Grundzustandes UBCS, im Vergleich zu einem normalen Fermi-Gas zu berücksichtigen.
10.8 Kohärenz des BCS-Grundzustandes und Meissner-Ochsenfeld-Effekt
325
Wegen der hohen Kohärenz dieses Vielteilchenzustandes (106 bis 107 Cooper-Paarwellenfunktionen überlappen) können wir die Wellenfunktion des Cooper-Paar-Kondensats (10.102) als „in sich ~ starr“ auffassen und ihr insgesamt eine Schwerpunktskoordinate R, nämlich die der einzelnen Cooper-Paare bei Rm zuordnen: X X 1 X ~ R 2m Rm 2m Rm ;
10:103 NCP m m m wo NCP die Anzahl der Cooper-Paare ist. Diese Näherung ist auch deshalb möglich, weil im supraleitenden Zustand wegen der Existenz der Lücke D im Anregungsspektrum Streuprozesse einzelner Elektronen an Phononen und Störstellen weit unterhalb der kritischen Temperatur Tc ausgeschlossen sind. Der Anteil U (0) in (10.102) enthält hierbei noch die internen Relativkoordinaten rm der einzelnen Cooper-Paare (durchnummeriert mit m), die den Abstand der sie konstituierenden Einzelelektronen angeben. Im Rahmen der Näherung eines starren Kondensats der Cooper-Paare wird diese Ortsabhängigkeit von (10.102) vernachlässigt. Damit können natürlich solche Effekte nicht beschrieben werden, bei denen sich die Cooper-Paar-Wellenfunktion zu stark, d.h. innerhalb der Kohärenzlänge nkoh (³ 104 Å) stark ändert. Für relativ homogene Verhältnisse, wie wir sie in „einfachen“ Supraleitern (sog. Supraleitern 1. Art, Abschn. 10.9) antreffen, besteht die wesentliche Ortsabhängigkeit von UBCS (10.102) dann nur noch in der Abhängigkeit der Phase von der Schwerpunkts~ (10.103) des gesamten Kondensats der Cooper-Paare. koordinate R Aus (10.102) und (10.103) folgt die Darstellung ~
~ ~
UBCS ' eiNCP KR U
0 eiKR U
0
10:104 ~ = NCPK für die Wellenfunktion des Cooper-Paar-Kondensats, wo K der an das gesamte Kondensat durch Stromfluss übertragene Wellenzahlvektor (Quasi-Impuls) darstellt. In der hier beschriebenen Modellvorstellung fassen wir nun das in sich kohärente, „starre“ Cooper-Paar-Kondensat als ein „Hyperteilchen“ der Masse NCPm mit der Ladung 2eNCP auf und wenden die Einteilchen-Formel für den quantenmechanischen Stromdichteoperator zur Berechnung des Stromes an: j
p
p
2eNCP U U :
UBCS UBCS BCS BCS 4mNCP
p
10:105
Hierbei wirkt der Impulsoperator auf das gesamte Cooper-Paar~ und Gesamtladung Kondensat mit Schwerpunktskoordinate R 2NCPe:
p hi r
~ R
2eNCP A :
10:106
Da wir weiter das Cooper-Paar-Kondensat als ein „Hyperteilchen“ bestehend aus allen Cooper-Paaren auffassen, fordern wir die Normierung
326
10. Supraleitung
jU
0j2 dV 1
10:106 a
d. h. jU
0j2 1=L3 ;
10:106 b
3
wobei L das Volumen der betrachteten supraleitenden Probe ist. Damit folgt aus (10.104, 10.105, 10.106): 2eNCP h js UBCS rR 2eNCP A UBCS 4mNCP i h UBCS
10:107 a rR 2eNCP A UBCS ; i i e h 2 ~ 4eNCP AjU
0j2 2hKjU
0j :
10:107 b js 2m ~ selbst nicht mehr ortsabhängig ist, gilt rot K ~ = 0 und nach Weil K Anwendung des rot-Operators auf (10.107 b) folgt 2e2
10:108 NCP jU
0j2 rot A : m Wegen der Normierungsbedingung (10.106 b) folgt mit B = rot A und NCP/L3 als Dichte der Cooper-Paare sowie ns = 2NCP/L3 als Dichte der supraleitenden Elektronen rot js
rot js
ns e2 B; m
10:109
was nach (10.8) genau der 2. Londonschen Gleichung entspricht. Damit ist nach Abschn. 10.2 im Rahmen der Näherung räumlich nicht zu stark veränderlicher Cooper-Paar-Dichten der MeissnerOchsenfeld-Effekt abgeleitet. Man erkennt weiter, dass die London-Gleichung eben auch nur unter dieser Voraussetzung gilt. Für räumlich stark variierende, d. h. über Dimensionen der Ausdehnung eines Cooper-Paares (Kohärenzlänge) veränderliche, Cooper-PaarDichten wurden schon vor Entstehen der BCS-Theorie nichtlokale phänomenologische Erweiterungen der Londonschen Theorie angegeben [10.14]. Experimentell zeigt sich der Meissner-Ochsenfeld-Effekt besonders anschaulich bei Messungen des mittleren magnetischen Innenfeldes in einem Supraleiter. Abbildung 10.18 zeigt die gemessene durchdringende Flussdichte B als Funktion des außen anliegenden Magnetfeldes Ha für Ta. Das äußere Magnetfeld Ha wurde über eine lange Spule erzeugt, innerhalb derer sich die Ta-Probe umgeben von einem kleineren Solenoid befindet. Dieses Solenoid dient zur Bestimmung der die Probe durchdringenden magnetischen Flussdichte B. Man erkennt die Existenz einer kritischen magnetischen Feldstärke Hc (10.96), oberhalb der keine Supraleitung vorliegt. Die im Material erzeugte Flussdichte B wächst hier proportional zum außen anliegenden Feld Ha. Unterhalb von Hc, d. h. in
327
Induzierte Flussdichte B (willkürl. Einheiten)
10.9 Quantisierung des magnetischen Flusses
der supraleitenden Phase, ist gemäß dem Meissner-Ochsenfeld-Effekt die magnetische Flussdichte aus der Ta-Probe „herausgedrängt“. Das geringe Hintergrundsignal (Steigung h ) ist auf eine Magnetisierung der Wicklung des Messsolenoids zurückzuführen.
10.9 Quantisierung des magnetischen Flusses Wir wollen weiter den Einfluss eines äußeren Magnetfeldes B = rot A auf einen Supraleiter betrachten. Dies soll wie in Abschn. 10.8 im Rahmen der Näherung nicht zu stark räumlich variierender Cooper-Paar-Dichte geschehen (Supraleiter 1. Art). Die Wellenfunktion bei Vorliegen einer Suprastromdichte js soll also die Gestalt (10.104) haben, wobei die Ortsabhängigkeit nur in der ~R ~ NCP K R ~ und nicht in der Amplitude enthalPhase u K ten sein soll. Damit folgt nach (10.106 u. 10.107) für die Suprastromdichte 2 e ns e hns A K :
10:110 js m 2m Betrachten wir einen geschlossenen Weg innerhalb eines supraleitenden Ringes, der von einem äußeren Magnetfeld durchdrungen wird (Abb. 10.19), so folgt für das Umlaufintegral über die Suprastromdichte nach (10.110) ns e2 ehns 1 ~ ds : A ds rR~ u
R js ds
10:111 m 2m NCP Die Vielteilchen-Wellenfunktion der Cooper-Paare ist nun in den Koordinaten der einzelnen Paare eindeutig längs des gesamten Ringes
Abb. 10.18. Induzierte magnetische Flussdichte B durch eine Ta-Probe, gemessen bei 3,7 K als Funktion eines äußeren Magnetfeldes Ha. Die Probe befindet sich in einer großen Spule, durch die Ha erzeugt wird. B wird über eine kleine Messspule (angeschlossen an ballistisches Galvanometer) gemessen, die die Ta-Probe unmittelbar umschließt. Das geringfügige Hintergrundsignal h rührt von einem in den Drahtwindungen der Messspule induzierten Fluss her. (Nach Rose-Innes [10.15])
328
10. Supraleitung
Abb. 10.19. Supraleitender Ring (punktiert), der von einer magnetischen Flussdichte B durchsetzt ist. Gestrichelt sind die Zonen angedeutet, in denen SupraDauerströme fließen. Ein gedachter Umlauf im Innern des Rings (durchgezogen) berührt im wesentlichen stromloses Gebiet
definiert, d. h. für einen stationären Zustand darf sich die Phase nach einem geschlossenen Umlauf nur um ganzzahlige Vielfache von 2p geändert haben. Es muss also gelten ~ ds 2 p N : rR~ u
R
10:112 Damit folgt aus (10.111)
m h : js ds B df N 2 ns e 2e
10:113
Die zweite Londonsche Gleichung (10.10 b, 10.109) ergibt sich hieraus als Spezialfall für einen Umlauf in einem einfach zusammenhängenden Gebiet, durch das beim Supraleiter ja kein magnetischer Fluss dringen kann (N = 0). Der Ausdruck auf der linken Seite von (10.113) heißt Fluxoid; dieses Fluxoid kann also nur in ganzzahligen Vielfachen von h/2 e auftreten. Üblicherweise würde man erwarten, dass mittels eines geeigneten Magnetfeldes jeder beliebige Suprastrom in einem geschlossenen Kreis „angeworfen“ werden kann. Bedingung (10.113) jedoch schreibt vor, dass Stromdichte und magnetischer Fluss durch den Ring einer „Quantenbedingung“ gehorchen müssen. Beachten wir, dass der Suprastrom nur innerhalb einer dünnen Schale mit der Londonschen Eindringtiefe von einigen hundert Ångström fließt, der geschlossene Umlauf in (10.113) somit in einem Bereich liegt, wo im wesentlichen js verschwindet (Abb. 10.19), so vereinfacht sich (10.113) zu
h B df N :
10:114 2e Diese Bedingung besagt, dass ein geschlossener Suprastromkreis nur magnetische Flüsse umschließen kann, die sich als ein ganzzahliges Vielfaches eines sog. Flussquants y0
h 2;0679 10 7 G cm2 2;0679 10 2e
15
Vs
10:115
10.9 Quantisierung des magnetischen Flusses
329
darstellen lassen. Man beachte, dass das Flussquant für CooperPaare halb so groß wie das für Einzelelektronen ist (Abschn. 9.9). Um sich eine anschauliche Vorstellung von der Größe von y0 zu machen, stelle man sich einen winzigen Zylinder mit einem Durchmesser von etwa 1/10 mm vor. Das Flussquant y0 durchdringt diesen Zylinder, wenn das Magnetfeld im Innern eine Stärke von etwa 1% des Erdfeldes hat. Beziehung (10.113 bzw. 10.114) lässt sich formal auch herleiten, wenn man dem makroskopischen, ringförmigen Suprastrom die Bohr-Sommerfeldsche Quantisierungsbedingung auferlegt. Nehmen wir Teilchen der Ladung q und der Dichte n an, die die Stromdichte tragen, so gilt für den Impuls eines Teilchens p mv qA : Wegen j = n q v folgt daraus m p j qA : nq
10:116
10:117
Die Quantisierungsbedingung verlangt, dass das geschlossene Wegintegral über p ein Vielfaches des Planckschen-Wirkungsquantums h ist m j ds q A ds Nh ;
10:118 a p ds nq
m j ds B df Nh=q :
10:118 b n q2 Bei dieser Ableitung haben wir den stromführenden Kreis wie ein Riesenmolekül behandelt, Quantenbedingungen also für ein makroskopisches System gefordert. Dies zeigt wiederum von einer anderen Seite her, wie aufgrund der hohen Kohärenz der Cooper-Paare die supraleitende Phase durch eine makroskopische VielteilchenWellenfunktion beschrieben werden muss. Typisch quantenmechanisch mikroskopische Eigenschaften setzen sich bei einem Supraleiter in makroskopisch beobachtbare Quantenphänomene fort. In einem nicht-supraleitenden Ring dürfte für einen Ringstrom die Quantenbedingung (10.118) nicht angewendet werden, da es für einzelne Elektronen außerhalb einer Cooper-Paarbindung keine den Ring umschließende Wellenfunktion gibt. Stoßprozesse zerstören hier die Kohärenz über große Entfernungen. Durch Vergleich von (10.118 b) mit (10.113) stellen wir fest, dass aus der BCS-Herleitung der Flussquantisierung eine Aussage über die Ladung der den Suprastrom tragenden Teilchen folgt, nämlich dass die Teilchen gerade die doppelte Elektronenladung (q = 2 e, Cooper-Paare) tragen. Der experimentelle Nachweis der Flussquantisierung und insbesondere die Messung des Flussquants (10.115) bedeutet also eine der wichtigsten Bestätigungen der BCS-Theorie. Diese Experimente wurden etwa gleichzeitig und mit gleichem Ergebnis von Doll und Näbauer [10.16] und von Deaver und Fairbank [10.17] durchge-
Abb. 10.20. Experimentelle Ergebnisse zur Flussquantisierung in einem Pb-Zylinder. Der Fluss durch den kleinen PbZylinder, der auf einem Quarzstab aufgedampft ist (Einschub) wird über Schwingungen oder Anordnung im Messfeld BM bestimmt. (Nach Doll und Näbauer [10.16])
Resonanz-Amplitude/Messfeld MM (mm/Gauss)
330
10. Supraleitung
Einfrier-Magnetfeld Be (Gauss)
führt. Doll und Näbauer verwendeten winzige Bleizylinder, die durch Aufdampfen auf Quarzröhrchen eines Durchmessers von etwa 10 lm hergestellt waren. Bei diesem Durchmesser entspricht ein Flussquant einer magnetischen Flussdichte im Innern des Pb-Zylinders von etwa 0,25 G. Im Bleizylinder wurde nun ein Supra-Dauerstrom durch Abkühlen (unter Tc) in einem „Einfrier“-Magnetfeld Be und nachfolgendes Abschalten von Be erzeugt (Abb. 10.20, Einschub). Der Bleizylinder wirkt damit in einem Messfeld BM als magnetischer Dipol, auf den ein Drehmoment ausgeübt wird. Dieses ließe sich im Prinzip statisch über die Auslenkung eines Lichtzeigers nachweisen und der magnetische Fluss durch den Zylinder wäre damit bestimmt. Wegen der Kleinheit des Effektes benutzten Doll und Näbauer jedoch eine dynamische Methode, bei der Torsionsschwingungen des Systems angeregt wurden. Die Resonanzamplitude ist dann proportional zum erregenden magnetischen Moment des Bleizylinders. Abbildung 10.20 zeigt eine Auftragung der Resonanzamplitude bezogen auf die Messfeldstärke BM (proportional zum Fluss durch Zylinder) in Abhängigkeit vom „Einfrierfeld“ Be. Ohne Flussquantisierung wäre die gestrichelt gezeichnete Proportionalität zu erwarten. Die Messpunkte zeigen klar, dass nur Flussquanten bestimmter Größe y0 N im Bleizylinder „eingefroren“ werden können. Das experimentell bestimmte y0 entspricht dem in (10.115) auf der Basis von Cooper-Paaren errechneten Wert. Damit wurde einwandfrei gezeigt, dass Elektronenpaare und nicht Einzelelektronen den Suprastrom tragen.
10.10 Supraleiter 2. Art
331
10.10 Supraleiter 2. Art Das Verhalten von Supraleitern im Magnetfeld war dadurch bestimmt, dass ein äußeres Magnetfeld B 0 exponentiell mit der Londonschen Eindringtiefe KL (10.16) ins Innere eines supraleitenden Halbraumes hinein abklingt (Abb. 10.21 a). In der Abklingzone fließt der Suprastrom, der das Innere des Supraleiters feldfrei hält (Abschn. 10.2). Die Supraleitung bricht zusammen, wenn das äußere Magnetfeld B 0 einen kritischen Wert Bc = l0 lGc (10.96) übersteigt, bei dem die magnetische Feldenergiedichte 12 Hc Bc die Kondensationsenergiedichte für Cooper-Paare (10.53) übersteigt. Von da ab werden Cooper-Paare aufgebrochen, und der Zustand der Normalleitung stellt sich ein. Betrachten wir statt eines supraleitenden Halbraumes (Abb. 10.21 a) eine supraleitende Schicht der Dicke d (Abb. 10.21 b), so kann bei genügend geringer Schichtdicke das Magnetfeld nicht mehr voll abklingen; im Inneren der Schicht (z = 0) bleibt ein beträchtliches Feld erhalten bzw. die abschirmende Wirkung der supraleitenden Ströme in dieser Abklingschicht kann nicht voll aufgebaut werden. Mathematisch ergibt sich dieser Sachverhalt, wenn wir die Differentialgleichungen (10.14) für die Schichtgeometrie lösen. Die allgemeine Lösung setzt sich aus den beiden Teillösungen auf beiden Rändern B1
z B1 e
z=KL
;
B2
z B2 ez=KL
10:119
zusammen. Aus der Randbedingung B1 ed=2KL B2 e
d=2KL
B0
10:120
und aus der Symmetrie des Problems (B1 = B2 = B ) folgt dann B B0 =2 cosh
d=2KL :
10:121
Damit ergibt sich die Magnetfeldstärke in der supraleitenden Schicht (Abb. 10.21 b) zu B
z B0 cosh
z=KL = cosh
d=2KL :
10:122
Abb. 10.21. Abklingen eines Magnetfeldes beim Eindringen: (a) in einen supraleitenden Halbraum (z > 0); (b) in eine supraleitende Schicht der Dicke d. An den Oberflächen liegen jeweils die Feldstärken B 0 an, KL ist die Londonsche Eindringtiefe, die für den Halbraum die exponentielle Abklinglänge darstellt
332
10. Supraleitung
Die Variation des magnetischen Feldes über der Schicht wird bei kleiner Schichtdicke nicht mehr sehr signifikant; das Feld durchdringt die supraleitende Schicht fast vollständig. Dies ist Ausdruck dafür, dass die Magnetfeld-abschirmende Wirkung der supraleitenden Ströme in der Schicht nicht voll aufgebaut werden kann. Wenn in dieser Situation das kritische magnetische Feld Bc (10.96) an der Oberfläche der Schicht anläge, so würde die damit gegebene magnetische Feldenergie nicht ausreichen, um im gesamten Raumbereich Cooper-Paare aufzubrechen und die Supraleitung zu zerstören. Dementsprechend muss für eine genügend dünne supraleitende Schicht das kritische Magnetfeld Bc höher liegen als für einen Halbraum. Das kritische Feld wird mit abnehmender Schichtdicke immer weiter zunehmen. Es kann für Dicken d KL um mehr als einen Faktor 10 über dem Feld liegen, das man für einen supraleitenden Halbraum im thermodynamischen Gleichgewicht hat. Mit abnehmender Schichtdicke wird also die Reaktion des Supraleiters auf ein angelegtes Magnetfeld immer kleiner. Die unmittelbare Konsequenz dieser Ergebnisse wäre, dass bei Anlegen eines überkritischen Magnetfeldes (> Bc) an einen massiven Supraleiter dieser in kleine zum Magnetfeld parallele Bereiche aus abwechselnd supraleitender und normalleitender Phase zerfiele. Wenn die supraleitenden Bereiche dünn genug wären, könnten sie ein wesentlich höheres Magnetfeld aushalten, ohne dabei instabil zu werden. Dass dies bei den üblichen Supraleitern (Supraleiter 1. Art) nicht geschieht, hängt damit zusammen, dass die Schaffung von Grenzflächen zwischen normal- und supraleitender Phase hier Energie kostet. Die Verhältnisse an einer solchen Grenzschicht sind in Abb. 10.22 qualitativ dargestellt. Der normalleitende Zustand gehe bei z = 0 in den supraleitenden Zustand über. Es liege parallel zur Grenzschicht (^ z ) das kritische Magnetfeld Bc an, das über die Londonsche Abklinglänge KL (10.16) exponentiell in den Supraleiter hinein abfalle. Im Supraleiter steige die Dichte der Cooper-Paare nc = ns /2 innerhalb der Kohärenzlänge nkoh von Null auf ihren thermodynamischen Gleichgewichtswert nc (T). nkoh ist dabei größer als KL angenommen; die Kohärenzlänge muss immer die räumliche Ausdehnung eines Cooper-Paares nCP (10.99) übersteigen, da die CooperPaardichte sich niemals auf einer kleineren Distanz als der eines Cooper-Paares ändern kann. In der Randzone um z = 0 sind nun zwei Energiedichtebeträge zu vergleichen, nämlich die mit der Verdrängung des Magnetfeldes verknüpfte Energiedichte E˜B (z) und die durch die Kondensation der Cooper-Paare (10.53) freiwerdende Energiedichte E˜Kon (z). Im Normalleiter verschwinden beide Beiträge; tief im Innern des Supraleiters kompensieren sich beide, d. h. für z ? ? gilt bei außen anliegendem kritischen Feld Bc E~B
1
1 2 E~Kon BV: 2l0 c
10:123
Innerhalb der Grenzschicht jedoch (Abb. 10.22 b) bleibt wegen der verschiedenen charakteristischen Abklinglängen KL und nkoh ein endlicher Differenzbetrag übrig
10.10 Supraleiter 2. Art
333
Abb. 10.22 a, b. Örtliche Variationen wichtiger Supraleitungsparameter nahe der Grenzfläche zwischen einem normalleitenden Bereich (schraffiert) und einem Supraleiter (z > 0). (a) Parallel zur Grenzschicht liege im normalleitenden Bereich das kritische Magnetfeld Bc an; im Supraleiter klingt B (z) (durchgezogene Kurve) exponentiell mit der Londonschen Abklinglänge KL ab. Der Anstieg der Dichte der Cooper-Paare nc ist durch die Kohärenzlänge nkoh bestimmt. (b) Räumliche Variation der Energiedichte E˜B, die mit der Verdrängung des Magnetfeldes zusammenhängt und der mit der Cooper-Paar-Kondensation verknüpften Energiedichte E˜Kon (durchgezogene Kurve). Der Differenzbetrag (gestrichelte Kurve) bestimmt die Grenzflächenenergie zwischen normalund supraleitender Phase
~ E~Kon E~B 1 B2c
1 DE
z 2l0
e
z=nkoh
1
e
z=KL
:
10:124
Integration über die gesamte Randschicht ergibt den Grenzflächenenergiebetrag (pro Flächeneinheit) cn/s, der zur Schaffung einer solchen Grenzschicht zwischen normal- und supraleitender Phase aufgewandt werden muss 1
cn=s 0
~ DE
zdz
nkoh
KL
1 2 B : 2l0 c
10:125
Für den hier betrachteten Fall nkoh > KL ist der Verlust an Kondensationsenergie größer als der Gewinn an Verdrängungsenergie. Pro Flächeneinheit muss dem System zur Erzeugung der Grenzfläche eine Grenzflächenenergiedichte cn/s (10.125) zugeführt werden. So wie man es für einen „normalen“ Supraleiter (Supraleiter 1. Art) erwartet, kostet die Entstehung von abwechselnd normalleitenden und supraleitenden Bezirken Energie, sie wird vermieden. Ganz anders verhält sich ein Supraleiter, bei dem das Magnetfeld tiefer eindringen kann als die Distanz, auf der der supraleitende Zustand „anschwingt“, d. h. bei dem nkoh < KL gilt. Bei einem solchen Supraleiter 2. Art wird beim Aufbau von Grenzflächen zwischen normal- und supraleitenden Bezirken Energie gewonnen, es stellt sich für gewisse äußere Magnetfelder ein sog. „gemischter
334
10. Supraleitung
Zustand“ (mixed state) ein, bei dem abwechselnd normalleitende und supraleitende Bezirke aneinander grenzen. Die beiden wichtigen Längen, die für das Vorliegen eines Supraleiters 2. Art entscheidend sind, sind die Abklinglänge des Magnetfeldes KL (10.16) und die Kohärenzlänge nkoh (größer als Ausdehnung nCP (10.99) eines Cooper-Paares), die das „Anschwingen“ des supraleitenden Zustandes bestimmt. Beide Längen hängen nach (10.16 u. 10.99) verschieden von den für die Supraleitung entscheidenden Parametern ns (Dichte der supraleitenden Elektronen) und D (Lükkenenergie) ab. Sowohl ns als auch D sind unter anderem durch die Stärke der Elektron-Phonon-Wechselwirkung bestimmt. Diese Wechselwirkung bestimmt auch die mittlere freie Weglänge K (EF) für Elektron-Phonon-Streuung im betreffenden Material. Es ist also einsichtig, dass die Suche nach Supraleitern 2. Art mit einer Variation der freien Weglänge für Elektron-Phonon-Stöße einhergeht. Hierbei hat sich gezeigt, dass eine Verringerung der freien Weglänge die Tendenz nkoh < KL zur Folge hat. Diese Aussage wird durch die Ginzburg-Landau-Theorie [10.14] für Supraleiter 2. Art gewonnen. Eine Verkleinerung der freien Weglänge ist leicht dadurch zu erhalten, dass man dem betrachteten Supraleiter eine gewisse Menge Fremdmetall zulegiert. Supraleiter 2. Art sind, wie die Erfahrung zeigt, im allgemeinen metallische Legierungen mit relativ kurzer freier Weglänge für Elektron-Phonon-Stöße. Blei-WismutLegierungen z. B. bleiben in Magnetfeldern bis zu etwa 20 kG noch supraleitend, in Feldern also, die um mehr als 20mal größer sind als das kritische Feld von reinem Blei. Der Unterschied zwischen Supraleitern 1. und 2. Art wird besonders deutlich in den Magnetisierungskurven M (B) sichtbar (Abb. 10.23). In einem Supraleiter 1. Art (nkoh > KL) wird in der supraleitenden Phase das Magnetfeld B = l0 l H = l0 (H+M) vollständig aus dem Innern verdrängt (B = 0). Die supraleitenden Ringströme in der äußeren „Hülle“ bauen eine Magnetisierung M auf, die dem äußeren Feld entgegengesetzt gleich ist (M = – H). Bis zur kritischen Feldstärke Bc = l0 lGc wächst also die Magnetisierung des Materials proportional zum Außenfeld und bricht dann beim Übergang in den normalleitenden Zustand ab (Abb. 10.23 a). Beim Supraleiter 2. Art – es sei eine lange stabförmige Probe in Abb. 10.23 b betrachtet – wird der Gewinn an Verdrängungsenergie beim Eindringen des Feldes größer als der Verlust an Kondensationsenergie durch die dabei auftretende örtliche Variation der Cooper-Paardichte. Dieses Eindringen geschieht von einem unteren kritischen Feld Bc 1 ab; die Magnetisierung M sinkt mit wachsendem Magnetfeld monoton, bis sie bei einem oberen kritischen Feld Bc 2 völlig verschwindet. Das äußere Feld ist hier voll eingedrungen und hat die Supraleitung zerstört. Ein analoges Verhalten zeigt sich bei der Messung der den Supraleiter 2. Art durchdringenden Flussdichte B (mittleres inneres Magnetfeld). Anders als in Abb. 10.18 bei einem Supraleiter 1. Art ist der Übergang von verschwindendem Innenfeld (< Hc) zum linear anwachsenden Feld (> Hc) nicht scharf. Das Innenfeld beginnt sich
10.10 Supraleiter 2. Art
335
Abb. 10.23. Magnetisierungskurven für einen Supraleiter 1. Art (a) und einen Supraleiter 2. Art (b). Beim Supraleiter 1. Art gibt es nur ein kritisches Magnetfeld Bc, während beim Supraleiter 2. Art ein unteres und ein oberes kritisches Feld Bc 1 und Bc 2 existieren
schon bei einer unteren kritischen Feldstärke Hc 1 (< Hc) langsam aufzubauen, um dann bei einer oberen Grenze Hc 2 (> Hc) den linearen Verlauf wie in Abb. 10.18 anzunehmen. Wie im Falle des Supraleiters 1. Art, wo die kritischen Magnetfelder Hc bzw. Bc Funktionen der Temperatur sind (Abb. 10.5), hängen auch die unteren und oberen kritischen Feldstärken Bc 1 (T) bzw. Bc 2 (T) von der Temperatur ab. Es ergeben sich auf diese Weise für einen Supraleiter 2. Art drei thermodynamisch stabile Phasen, die übliche supraleitende („Meissner-Phase“) unterhalb Bc 1 (T), die normalleitende oberhalb von Bc 2 (T) und die Zwischenphase des gemischten Zustandes, auch Shubnikov-Phase genannt, zwischen den kritischen Zustandskurven Bc 1 (T) und Bc 2 (T). Ein experimentelles Beispiel ist in Abb. 10.24 dargestellt. Reines In als Supraleiter 1. Art hat nur eine supraleitende und eine normalleitende Phase unter- bzw. oberhalb von Bc (T). Einlegierung von 4% Bi erzeugt einen Supraleiter 2. Art, dessen obere und untere kritische Magnetfeldkurven Bc 1 (T) und Bc 2 (T) die Phasengebiete der Meissner-, der Shubnikov- und der normalleitenden Phase voneinander abtrennen. Während die Meissner-Phase eine homogene Phase wie bei einem Supraleiter 1. Art darstellt, enthält die Shubnikov-Phase abwechselnd supraleitende und normalleitende Gebiete. Magnetischer Fluss dringt in den Supraleiter 2. Art ein, aber die supraleitenden Gebiete mit lokal verdrängtem Magnetfeld sind von abschirmenden
336
10. Supraleitung
Abb. 10.24. Temperaturabhängigkeit der kritischen Magnetfelder einer IndiumWismut-Legierung (In+4 at.% Bi). (Nach Kinsel et al. [10.18])
Supraströmen umgeben. Diese Ströme müssen natürlich geschlossene Stromlinien haben, weil sie nur dann stationär sein können. In der Shubnikov-Phase liegt also eine stationäre, räumlich variierende Verteilung von magnetischer Feldstärke und Suprastromdichte vor. Wie aus den Überlegungen in Abschn. 10.9 folgt, kann ein geschlossener Suprastromkreis nur magnetische Flüsse umschließen, die sich als ganzzahliges Vielfaches eines sog. Flussquants y0 = h/2 e ^2´10–7 G cm2 darstellen. Man könnte also erwarten, dass in der Shubnikov-Phase die supraleitenden Bezirke gerade aus Supra-Ringströmen bestehen, die ein einziges Flussquant y0 umschließen. Höhere und niedrigere Dichte an supraleitenden Elektronen in dieser Phase würde sich dann in einer Variation der Dichte dieser einzelnen sog. Flussschläuche widerspiegeln. Wie eine Lösung der Ginzburg-Landau-Theorie [10.14] zeigt, ist dies tatsächlich der Fall. Die qualitative Darstellung in Abb. 10.25 zeigt, dass jedes Flussquant aus einem System von Ringströmen besteht, die den magnetischen Fluss durch den Schlauch erzeugen. Mit wachsendem Außenfeld Ba wird der Abstand der Flussschläuche (Flusswirbel) kleiner. Da zwischen den einzelnen Flussschläuchen zumindest für kleine Abstände eine abstoßende Wechselwirkung existiert, ist es offensichtlich, dass der Zustand niedrigster Enthalpie sich für eine regelmäßige Anordnung der Flusswirbel in einem zweidimensionalen hexagonalen Gitter ergibt. Diese Verteilung wird tatsächlich experimentell gefunden [10.19]. Mittels elastischer Neutronenstreuung konnte das mikroskopische Magnetfeld an dem Typ 2-Supraleiter Niob in der Shubnikov-Phase gemessen werden. Die Feldverteilung (Abb. 10.26) zeigt klar das Vorliegen einer hexagonalen Anordnung von Flussschläuchen. Die bisherigen Betrachtungen zur Shubnikov-Phase setzen die freie Verschiebbarkeit der Flussschläuche voraus. Dies ist jedoch in der Realität nur als Grenzfall denkbar. Störungen im Gitteraufbau, Versetzungen, Korngrenzen, Ausscheidungen u. ä. beschränken die freie Verschiebbarkeit. Wegen aller möglichen Wechselwirkungen
10.10 Supraleiter 2. Art
337
Abb. 10.25. Schematische Darstellung der Shubnikov-Phase eines Supraleiters 2. Art. Sog. Flussschläuche, angeordnet in einem zweidimensionalen Translationsgitter, lassen das Magnetfeld „durchdringen“. Ein solcher Flussschlauch ist von Supraringströmen umgeben, die jeweils ein magnetisches Flussquant einschließen
Abb. 10.26 a, b. Ergebnisse eines Neutronen-Beugungsexperimentes am zweidimensionalen Gitter der Flussschläuche des Typ 2-Supraleiters Niob in der Shubnikov-Phase (4,2 K). Die detaillierte Auswertung des Beugungsbildes ergibt die hier dargestellte Verteilung des mikroskopischen Magnetfeldes in der Umgebung der Flusswirbel. (a) Makroskopische Feldstärke B = 0,056 T. (b) B = 0,220 T. In (a) beträgt der nächste Nachbarabstand im hexagonalen Flussliniengitter 206 nm, das maximale Feld im Flusslinienzentrum ist 0,227 T. Die entsprechenden Werte für (b) sind 104 nm bzw. 0,255 T (das obere kritische Feld Bc 2 beträgt hier 0,314 T). (Nach Schelten et al. [10.19])
mit solchen Störstellen existieren energetisch bevorzugte Plätze, die zu einem räumlichen „pinning“ der Flusswirbel führen. Deformationen der Magnetisierungskurven (Abb. 10.23) und HystereseEffekte, die von der Vorbehandlung des Materials (Tempern usw.) abhängen, sind die Folge. Auf der anderen Seite bietet das „Festlegen“ oder „pinnen“ von Flusswirbeln durch Kristallstörungen in der Shubnikov-Phase technische Vorteile. Falls ein Supraleiter 2. Art in der Shubnikov-Phase einen Transportstrom führt, so wirkt auf die Flussschläuche senkrecht zur Stromdichte und senkrecht zum Magnetfeld die LorentzKraft. Das dadurch verursachte Wandern der Flussschläuche bedingt Verluste, d. h. Umwandlung von elektrischer in Wärmeenergie. Diese Energie kann nur dem Belastungsstrom entnommen werden, indem eine elektrische Spannung an der Probe auftritt; ein elektrischer Widerstand erscheint. Dieser Effekt wird durch das
338
10. Supraleitung
„pinnen“ der Flussschläuche herabgesetzt. Beim Supraleiter 2. Art sind also nicht wie im Supraleiter 1. Art kritischer Strom und kritisches Magnetfeld an der Oberfläche des Leiters auf einfache Art (10.93) miteinander verknüpft. Die stark inhomogene Struktur der Shubnikov-Phase eines solchen Leiters verlagert Magnetfeld und stromführende Bereiche in das Innere des Materials. Kritischer Strom und kritisches Magnetfeld hängen nun in komplizierter Weise und zwar verschieden von einer Reihe von Materialparametern, wie Kohärenzlänge, freie Weglänge, Grad der Kristallstörung u. ä., ab. Schließlich sei betont, dass technisch wichtige Anwendungen der Supraleitung vor allem auf der Möglichkeit beruhen, mittels verlustfreier starker Supra-Ringströme sehr hohe Magnetfelder zu erzeugen. Ist das Magnetfeld erst einmal aufgebaut, so ist zu seiner Aufrechterhaltung im Prinzip keine elektrische Leistung mehr erforderlich. Eine Bedingung für die Funktion eines solchen Hochleistungs-Supraleitungsmagneten ist natürlich an die Existenz von Materialien mit genügend hohen kritischen Magnetfeldern Bc 2 (T) geknüpft. Dies ist nur im Falle von Supraleitern 2. Art gegeben. Es werden zur Zeit z. B. Nb-Ti-Legierungen als Wicklungsmaterial verwendet, die bei T^0 ein kritisches Feld von etwa 130 kG haben. Noch höhere Felder können mit Nb3Sn erzeugt werden. Das maximale kritische Feld (T = 0) liegt hier über 200 kG. Während des Betriebs muss die Wicklung des Magneten natürlich unterhalb der kritischen Temperatur Tc, d. h. im allgemeinen auf der Temperatur des flüssigen Heliums (4,2 K), gehalten werden.
10.11 Neuartige „Hochtemperatur“-Supraleiter Großtechnische Anwendungen der Supraleitung, insbesondere ihre Nutzung beim Transport hoher elektrischer Leistung über große Entfernung, wurden bisher durch die Notwendigkeit verhindert, das Material zur Erreichung des supraleitenden Zustandes unter die kritische Temperatur Tc abzukühlen. Wegen der im allgemeinen sehr niedrig liegenden Tc-Werte bedeutete dies Abkühlung auf 4,2 K, die Temperatur des flüssigen Heliums. Technisch interessante Lösungen lassen sich jedoch erst vorstellen, wenn eine Kühlung nur auf etwa 70 K, die Temperatur flüssigen Stickstoffs, erfolgen muss. Seit also Supraleitung untersucht wird, besteht ein Hauptziel darin, Supraleiter mit möglichst hoher Sprungtemperatur Tc, sogar möglichst nahe bei Zimmertemperatur, zu finden. Basierend auf den allgemeinen Ansätzen und Schlussfolgerungen der BCS-Theorie bieten sich hierbei insbesondere zwei Möglichkeiten: i) Eine besonders starke Elektron-Phonon-Wechselwirkung V0 , eventuell zusammenhängend mit einer Tendenz zu Gitterinstabilitäten, könnte über eine Beziehung des Typs (10.79) zu einer
10.11 Neuartige „Hochtemperatur“-Supraleiter
339
hohen Sprungtemperatur führen. Günstig würde sich hierbei noch eine besonders große elektronische Zustandsdichte Z (E0F) am Fermi-Niveau auswirken (10.79). ii) Eine neuartige Vielelektron-Wechselwirkung, nicht unbedingt vermittelt über Phononen, könnte eine „Kondensation“ des Fermi-Sees zu Cooper-Paaren ermöglichen. Geschähe diese Wechselwirkung über (Quasi-) Teilchen (z. B. Elektronen selbst) mit wesentlich geringerer Masse als der der Gitterbausteine (Phonon), so könnte man ebenfalls aufgrund von (10.79) zumindest qualitativ über ein stark angewachsenes xD eine wesentlich höhere Übergangstemperatur Tc erwarten. Ein entscheidender Durchbruch in der Supraleitungsforschung geschah um 1986, als Bednorz und Müller [10.20] entdeckten, dass metallische, sauerstoffarme Kupferoxidverbindungen des Ba-La-Cu-OMischsystems Sprungtemperaturen um 30 K herum zeigen. Die erste Originalmessung des Widerstandes an dem bei Zimmertemperatur quasi-metallischen, polykristallinen Oxid Ba0,75La4,25Cu5O5 (3–y ) (y > 0, unbekannt) ist in Abb. 10.27 dargestellt. Abhängig von der transportierten Stromdichte wird ein signifikantes Abknicken des spezifischen Widerstandes zwischen 20 K und 30 K gefunden. Der Abbruch des Widerstandes ist nicht scharf, wie für normale Supraleiter verlangt (Abb. 10.1). Eine Interpretation der Ergebnisse durch das Vorhandensein einer Mischung aus verschiedenen supraleitenden und normalleitenden Phasen ist jedoch möglich. Mit dieser Arbeit haben Bednorz und Müller das Tor zur Erforschung einer neuen Materialklasse aufgestoßen und möglicherweise zur Ent-
Abb. 10.27. Temperaturabhängigkeit des spezifischen elektrischen Widerstandes einer polykristallinen Oxidkeramik des Typs Ba0,75La4,25Cu5O5 (3–y ), gemessen bei verschiedenen Stromdichten. (Nach Bednorz und Müller [10.20])
340
10. Supraleitung
Abb. 10.28. Spezifischer Widerstand gesinterter YBa2Cu3O7–x-Proben mit variierender Sauerstoffverarmung x = 0 . . . 0,3. Der Sauerstoffgehalt wurde durch Anlassen im Sauerstoffstrom bei verschiedenen Temperaturen und anschließendes Abschrecken in flüssigem Stickstoff eingestellt. (Nach Cooper et al. [10.22])
deckung eines neuen Mechanismus der Supraleitung (Nobelpreis 1987). Bald darauf gelang es Chu und Mitarbeitern, an Keramiken des Systems Ba1–xYx CuO3–y Sprungtemperaturen um 90 K zu erreichen [10.21]. Mit der Entwicklung verbesserter Präparationsmethoden für Einkristalle und Schichten sowie nach Anwendung besserer Analysemethoden stellte sich eine YBa2Cu3O7–x, manchmal YBCO genannte, Legierung als die interessanteste Materialkomponente heraus. Das Y-Atom kann durch andere Seltene Erden wie Eu, Gd u. ä. substituiert werden. Hierdurch ergibt sich eine ganze Klasse von nach der Stöchiometrie benannten 123 Materialien mit kritischen Temperaturen von bis zu 95 K. Typische Ergebnisse von Messungen des temperaturabhängigen elektrischen Widerstandes und des magnetischen Verhaltens, wie sie von zahlreichen Gruppen weltweit an diesen Materialien gefunden werden, sind in Abb. 10.28 und 10.29 dargestellt. Für eine Sauerstoffverarmung von x = 0 bis 0,1 fällt der spezifische elektrische Widerstand bei etwa 90 K zu unmessbar kleinen Werten, während er zu höheren
Abb. 10.29. Magnetisierung als Funktion der Temperatur, gemessen an einer durch Sputtern hergestellten YBCOSchicht. Die Probe wurde ohne äußeres Magnetfeld abgekühlt (ZFC). Die dann angelegten Magnetfelder (B jjc-Achse) variierten zwischen 1 mT und 10 mT. (Nach Wördenweber [10.23])
10.11 Neuartige „Hochtemperatur“-Supraleiter
341
Temperaturen wie bei einem Metall ansteigt (Abb. 10.28). Mit weiter wachsender Sauerstoffverarmung x verschiebt sich der Sprungpunkt zu niedrigeren Temperaturen, während im Bereich der Normalleitung der Widerstand weiter zunimmt. In Abb. 10.29 sind temperaturabhängige Messungen der Magnetisierung an einem durch Ionenzerstäubung hergestellten YBCO-Film dargestellt. Die Messungen wurden mittels eines Vibrationsmagnetometers durchgeführt, bei dem die Probe in einem durch Spulen erzeugten äußeren Magnetfeld Ba schwingt und die von der Probenmagnetisierung M abhängige Schwingungsfrequenz gemessen wird. Die Ergebnisse wurden erzielt, indem die Probe ohne äußeres Feld abgekühlt wurde (ZFC: Zero Field Cooled). Für idealen Diamagnetismus müsste wegen B = l0 M+Ba die Magnetisierung l0 M unterhalb des Sprungpunktes den Wert des äußeren Feldes erreichen. Wie aus Abb. 10.29 zu ersehen ist, werden für kleinere Temperaturen T Tc , d. h. unterhalb von 10 K, aber l0 M-Werte erreicht, die um das etwa Tausendfache über dem Wert des äußeren Feldes Ba (angegeben an den Messkurven) liegen. Dies liegt am Entmagnetisierungsfaktor, der für den Fall dünner Schichten stark von dem einer langen Probe abweicht. Außerdem würde man im Idealfall einen abrupten Übergang von l0 M bei der Sprungtemperatur Tc erwarten. Der „schleppende“ Übergang für T < Tc wird zum Teil auf Inhomogenitäten in der Probe zurückgeführt. Des weiteren wird das „Festhaken“ von Flussfäden an Kristallstörungen und eine thermische Aktivierung der Flussfadenbewegung dafür verantwortlich gemacht. Ergebnisse wie in Abb. 10.29 sind typisch für keramische, sog. Hochtemperatursupraleiter des YBCO-Typs. Eine weitere Klasse von Supraleitern, die noch höhere Sprungtemperaturen aufweisen, wurde 1988 mit den Bi- und Tl-haltigen Materialien entdeckt. Ihre typische Stöchiometrie ist Bi2Sr2Ca2Cu3O10 [10.24] und Tl2Ba2Ca2Cu3O10 [10.25]. In Tabelle 10.2 sind die Hauptklassen keramischer Supraleiter mit Sprungtemperaturen oberhalb von 90 K zusammengestellt [10.26]. Für die Bi- und Tl-haltigen Materialien haben sich Bezeichnungen wie 2212, 2223 u. ä. nach ihrer Stöchiometrie eingebürgert. Obwohl die Kristallstruktur der YBCO und der (Bi, Tl)-Keramiken im Detail verschieden ist, weisen beide Materialklassen einen charakteristischen Schichtaufbau auf, der für den Mechanismus der Supraleitung wichtig ist (Abb. 10.30). Dieser Schichtaufbau offenbart sich sehr klar in hochaufgelösten elektronenmikroskopischen Aufnahmen der Materialien. Abbildung 10.31 zeigt Ergebnisse der Untersuchung einer Bi2Sr2CaCu2O8+x-Schicht mittels hochauflösender TransmissionsElektronenMikroskopie (TEM). Nach Abb. 10.30 a sind die YBCO-Materialien axiale Kristalle mit abwechselnd CuO2-Ebenen [Cu(2), O(2)] und Sauerstoffatomen in pyramidenartiger sowie rechteckig-planarer Koordination entlang der c-Achse. Diese rechteckigplanaren Strukturelemente bilden Sauerstoff-Ketten längs der b-Achse des Kristalls. Entscheidend für die Supraleitung sind die Sauerstofflücken, die immer innerhalb dieser Ketten auftreten. Bei den
342
10. Supraleitung
Tabelle 10.2. Wichtige Familien von Hochtemperatur-Supraleitern. Entsprechend ihrer Stöchiometrie haben sich Kurzbezeichnungen wie Tl-2212 u. ä. eingebürgert. (Nach Hott et al. [10.26]) Formel
Kurzbezeichnung
SEBa2Cu3O7 SE ,,Seltene Erden`` Y; Eu; Gd; . . . Bi2Sr2Can–1CunO2 n+4 (+Pb-Dotierung)
„SE BCO“ oder „123“ „BSCCO“ oder „Bi-22 (n–1) n“
Tl2Ba2Can–1CunO2 n+4
„TBCCO“ oder „Tl-22 (n–1) n“
Tl2A2Can–1CunO2 n+3 (A = Sr, Ba)
„Tl-12 (n–1) n“
HgBa2Can–1CunO2 n+2
„Hg-12 (n–1) n “
Bisher maximal erreichtes Tc/K 92 (YBCO)
90 122 90 110 127 119 90 122 122 110 96 128 135
(Bi-2212) (Bi-2223) (Bi-2234) (Tl-2212) (Tl-2223) (Tl-2234) (Tl-1212) (Tl-1223) (Tl-1234) (Tl-1245) (Hg-1201) (Hg-1212) (Hg-1223)
(Bi, Tl)-Keramiken liegt ein ähnlicher Schichtaufbau entlang der cAchse vor, jedoch in einer wesentlich größeren Elementarzelle (Abb. 10.30 b). Deutlich sind hier zwei Bereiche der Elementarzelle zu erkennen, bei denen die Cu-Atome zentriert (oben) oder an den Ecken der Cu-O-Ebenen (unten) liegen. Beide Teile der Zelle sind
Abb. 10.30 a, b. Kristallstruktur der YBCO und (Bi, Tl)-Supraleiterkeramiken. (a) Einheitszelle eines YBa2Cu3O7Kristalls; die rechteckig-planare und pyramidenartige Koordination der O-Atome entlang der c-Achse ist eingezeichnet. Weiter sind spezielle Lagen von O- und Cu-Atomen in den CuO2-Ebenen durch eingeklammerte Zahlen gekennzeichnet. (b) Einheitszelle der Bi2Sr2Ca2Cu3O10bzw. Tl2Ba2Ca2Cu3O10-Keramiken (2223 Phasen)
10.11 Neuartige „Hochtemperatur“-Supraleiter
343
Abb. 10.31. Hochaufgelöstes elektronenmikroskopisches (TEM)-Bild einer Bi2Sr2CaCu2O8+x-Schicht in Transmission. Bei Durchstrahlung senkrecht zur cAchse des Kristalls zeigt sich der Schichtaufbau des Supraleiters. Helle und dunkle Punkte zeigen die Lage von Atomreihen an. (Nach Kabius [10.27])
durch zwei Bi-O- bzw. Tl-O-Ebenen voneinander getrennt. Verschiedene Bi- oder Tl-Keramiken (Tabelle 10.2) unterscheiden sich durch die Anzahl der „eingeschobenen“ CuO2-Ebenen. Dies wiederum beeinflusst entscheidend die Sprungtemperatur für die Supraleitung. Entsprechend dem hoch anisotropen Kristallaufbau sind bei den keramischen Supraleitern alle elektronischen Eigenschaften, insbesondere auch die Supraleitung stark anisotrop. Temperaturabhängige Widerstandskurven für YBCO-Schichten (Abb. 10.32) zeigen starke Unterschiede im spezifischen Widerstand Rc und Rab, gemessen entlang der c-Achse und senkrecht dazu, d. h. parallel zu den ab-Ebenen. Der Widerstand Rc zeigt bei etwa 150 K ein flaches Minimum, dessen Ausprägung wahrscheinlich mit dem Grad des Sauerstoffmangels zusammenhängt. Weiterhin zeigen die keramischen Hochtemperatursupraleiter sehr interessante Eigenschaften bezüglich ihrer kritischen Magnetfelder. Alle bisher bekannten Materialien sind Typ II-Supraleiter (Abschn. 10.10), die eine Shubnikov-Phase zwischen einem unte-
Abb. 10.32. Spezifischer Widerstand von YBCO-Schichten als Funktion der Temperatur, gemessen parallel zur cAchse (Rc, linke Ordinate) und in der a–b-Ebene (Rab, rechte Ordinate). (Nach Hagen et al. [10.28])
344
10. Supraleitung
ren kritischen Feld Bc 1 bzw. Hc 1 und einem oberen kritischen Feld Bc 2 bzw. Hc 2 aufweisen. Obwohl das untere Feld Bc 1 unterhalb von 10 mT liegt, übersteigt das obere kritische Feld Bc 2 (senkrecht zur c-Achse) von YBa2Cu3O7–x mit einer abgeschätzten Höhe von 340 T das aller bisher bekannten Supraleiter. Hierbei tritt weiterhin die hohe Anisotropie der keramischen Supraleiter in Erscheinung. Für äußere magnetische Felder parallel zur kristallographischen cAchse werden Bc 2-Werte abgeschätzt, die um etwa einen Faktor 5– 7 unterhalb der Werte für eine Feldorientierung senkrecht zur cAchse liegen. Die kritischen Magnetfeldstärken erlauben eine Abschätzung der Kohärenzlänge nc in c-Richtung von etwa 3–5 Å, während in der Basisebene ein Wert von nab von etwa 20–30 Å gefunden wird. An YBCO-Schichten, die mit guter kristalliner Qualität orientiert auf einem entsprechenden Substratmaterial aufgewachsen sind, werden ohne Magnetfeld bei 77 K kritische Stromdichten von 106–107 A/cm2 gemessen. Eine eindeutige theoretische Erklärung des Supraleitungsmechanismus in diesen keramischen Materialien ist bisher nicht möglich. Jedoch gibt es eine Reihe von Befunden, die mittlerweile zu der Hoffnung Anlass geben, bald eine geschlossene theoretische Beschreibung zu finden. Aus der Beobachtung der Flussquantisierung (Abschn. 10.9) weiß man, dass Cooper-Paare ähnlich wie in BCSSupraleitern die Supraleitung tragen. Für die meisten Hochtemperatursupraleiter werden diese Cooper-Paare nicht aus zwei Elektronen, sondern aus zwei Defektelektronen oder Löchern gebildet. Ähnlich wie bei Halbleitern (Abschn. 9.2, 12.2) wirkt ein in einer chemischen Bindung fehlendes Elektron bzw. ein in einem fast voll besetzten Band leerer elektronischer Zustand, im Leitungsprozess wie ein positiver Ladungsträger, ein sog. Defektelektron oder Loch. Man spricht von Löcherleitung oder p-Leitung. Die positive Ladung der Cooper-Paare, d. h. die p-Typ-Supraleitung wird aus dem Vorzeichen der Hall-Konstanten (Tafel XIV) geschlossen. In Entsprechung zu den hohen kritischen Übergangstemperaturen Tc werden mit verschiedenen experimentellen Methoden, u. a. der Tunnelspektroskopie (Tafel IX), Lückenenergien D zwischen 20 und 30 meV gefunden. Der charakteristische Quotient D (0)/kTc (10.67) erreicht so Werte zwischen 3 und 4, vergleichsweise hoch zum BCS-Wert von 1,764. Für die Entwicklung einer geschlossenen Theorie der Hochtemperatursupraleitung wird sicherlich auch die Abhängigkeit der Sprungtemperatur Tc vom Sauerstoffmangel x in der Stöchiometrie YBa2Cu3O7–x , wie sie sich in Abb. 10.28 andeutet, von Bedeutung sein. Mit wachsendem Sauerstoffverlust x in der Bindung nimmt die Sprungtemperatur stufenartig von 90 K auf etwa 30 K ab (Abb. 10.33). Oberhalb von x^0,7 verlieren die YBCO-Keramiken ihre Supraleitfähigkeit und zeigen isolierendes, antiferromagnetisches Verhalten. Diese Beobachtungen und eine Reihe theoretischer Untersuchungen [10.29, 10.30] legen folgende Schlussfolgerungen nahe, die für ein Verständnis wichtig sind: Sauerstoffatome
10.11 Neuartige „Hochtemperatur“-Supraleiter
345
Abb. 10.33. Experimentell bestimmtes Phasendiagramm der YBa2Cu3O7–x-Keramik, d. h. Abhängigkeit der Sprungtemperatur Tc von der Sauerstoffverarmung x. Im Bereich SC liegt Supraleitung vor, während AF eine antiferromagnetische Phase bezeichnet. (Nach Zaanen et al. [10.29])
mit ihrer hohen Elektronegativität dienen im YBCO-Gitter als Elektronenakzeptoren. Die Y- und Ba-Metallionen geben in der chemischen Bindung jeweils zwei Elektronen an die CuO2-Ebenen ab. Die Sauerstoffatome „schlucken“ diese Elektronen. Geringer Sauerstoffmangel, d. h. kleineres x, bewirkt, dass mehr Sauerstoff als Elektronenakzeptor zur Verfügung steht. Mehr Löcher als Partner für Defektelektronen-Cooper-Paare in den CuO2-Ebenen werden geliefert. Hieraus ergibt sich eine allgemeine Vorstellung, die auch auf die Tl- und Bi-Supraleiter übertragen wird: CuO2-Schichten sind verantwortlich für einen quasi-zweidimensionalen Ladungstransport über Löcher oder Defektelektronen, die sich zu Cooper-Paaren paaren. Dazwischen liegen Schichten bestehend aus Alkalimetall- bzw. Seltenen Erdionen und Sauerstoff oder Halogenen, die als Ladungsträgerreservoire dienen. Diese Schichten können Elektronen von den CuO2-Ebenen aufnehmen und so CooperPaare aus Löchern in den sog. Leitungsebenen erzeugen. Mittlerweile wurde auch Hochtemperatursupraleitung mit elektronischen Cooper-Paaren, herkömmliche n-Typ-Supraleitung, in Nd2CuO4- und Nd2–xCexCuO4-Materialien entdeckt [10.31]. Obwohl eine allgemeine, übergreifende theoretische Beschreibung für die Supraleitung der keramischen Kupferoxidmaterialien bisher nicht existiert, sind hochinteressante technische Anwendungen bereits im Stadium der Erprobung. So ist es bereits gelungen, mittels „Hochtemperatur“ SQUIDs (Tafel X) bei Messtemperaturen von 77 K im Detektorsystem Herz- und Gehirnströme von Menschen aufzuzeichnen und für medizinische Diagnostik anwendbar zu machen [10.32]. Seit 1991 gibt es eine weitere Neuigkeit auf dem Gebiet der Supraleiter: Die erst um 1985 entdeckten Fullerene (Abschn. 1.2) zeigen unter gewissen Bedingungen auch Supraleitung mit Sprungtemperaturen oberhalb von 15 K [10.33]. Einzelne Fulleren-Moleküle bestehen aus 60 Kohlenstoffatomen (C60), die einen geschlossenen Ball mit einem Durchmesser von 7,1 Å zwischen den C-Kernen formen (Abb. 1.5). Die C-Atome bilden dabei eine leicht gewölbte Struktur mit 20 Hexagons und 12 Pentagons, ähnlich wie in Graphit, Benzol und anderen organischen Molekülen. Wie schon
346
10. Supraleitung
Abb. 10.34. Temperaturabhängigkeit der magnetischen Suszeptibilität von Rb3C60. Die Messung wurde in einem äußeren Magnetfeld von 10 Oe durchgeführt. ZFC: ohne Magnetfeld abgekühlt; FC: im Magnetfeld abgekühlt. (Nach Politis et al. [10.34])
ausgeführt, liegt der Kohlenstoff in einer sp 2-Hybridisierung vor, bei der die nicht im sp 2-Hybrid beteiligten pz-Orbitale besetzte pund unbesetzte p-Orbitale bilden, die über die gesamte Kugeloberfläche delokalisiert sind. Schon bei Raumtemperatur kristallisieren die C60-Moleküle in einem flächenzentrierten kubischen Gitter mit einer Gitterkonstanten von 14,16 Å. Bei dieser Kristallisation wechselwirken die äußeren Valenzelektronen der C60-Moleküle, d. h. die p- und p-Orbitale, am stärksten miteinander. Es bilden sich ein relativ schmales vollbesetztes p- und ein leeres p*Band aus. Beide elektronischen Bänder sind etwa 1,5 eV voneinander entfernt, so dass der C60-Kristall halbleitend ist. Setzt man eine kristalline C60-Schicht Kaliumdampf aus, so wird die Schicht metallisch. Kaliumatome werden in Zwischenräume zwischen den C60-Kugeln eingebaut. Eine maximale Leitfähigkeit von etwa 500 S/cm wird bei einer Stöchiometrie von K3C60 erreicht, während eine „volle Dotierung“ K6C60 wieder zum Verschwinden der Leitfähigkeit führt. Der optimale metallische Charakter von K3C60 wird darauf zurückgeführt, dass die ursprünglich leeren p*-Zustände in C60 dreifach entartet sind und somit maximal 6 Elektronen pro Molekül aufnehmen können. Die eingebauten drei K-Atome pro C60-Molekül geben ähnlich wie in einem Alkalisalz ihr Valenzelektron in das C60-Molekül und füllen das elektronische p-Band zur Hälfte. Ein metallisches Leitungsband ist entstanden. Das metallische Material K3C60 zeigt nun Supraleitung mit einer Sprungtemperatur Tc = 19,3 K. Noch höhere kritische Temperaturen wurden bei ähnlichen Fulleren-Kristallen gefunden: Rb3C60 (Tc^28 K), RbCs2C60 (Tc^33 K) und Rb2,7Tl2,2C60 (Tc^48 K). Wegen der hohen Reaktivität mit atmosphärischem Sauerstoff wurden bisher meist magnetische Messungen an den Materialien durchgeführt. In Abb. 10.34 ist die gemessene Temperaturabhängigkeit der magnetischen Suszeptibilität von Rb3C60 dargestellt [10.34]. Wie in Abb. 10.29 wurde die Probe ohne äußeres Magnetfeld abgekühlt (ZFC). Ähnlich wie bei den keramischen Hochtemperatursupraleitern wird ein gradueller Einsatz des diamagnetischen Verhaltens unterhalb von Tc beobachtet.
Übungen zu Kapitel 10
10.1 Supraleitung ist ein thermodynamischer Zustand, der bei konstantem Druck durch zwei Zustandsvariablen, Temperatur T und magnetisches Feld H oder B, beschrieben wird. (a) Aus der Darstellung der Gibbsschen Freien Energie dG = –SdT–MdB (S: Entropie, M: Magnetisierung) leite man die folgende Beziehung dHc Sn Ss dT l0
Ms Mn für die Temperaturabhängigkeit des kritischen magnetischen Feldes Hc (T) her! Man benutze die Stetigkeit von G (T) an der Phasengrenze zwischen normal (n) und supraleitendem (s) Zustand (l0 magnetische Permeabilität). (b) Man benutze die Tatsache, dass der supraleitende Zustand perfekten Diamagnetismus (B = 0), der Normalzustand jedoch vernachlässigbaren Diamagnetismus (M%0) zeigt, und leite ab, dass sich die Entropie an der Phasengrenze um Sn
Ss
V dHc Hc dT l0
ändert. Aus dieser Beziehung leite man weiter einen Ausdruck für die latente Wärme des Phasenüberganges von Supraleitung zu Normalleitung im magnetischen Feld ab! 10.2 Diskutieren Sie das Hochfrequenzverhalten eines Supraleiters mit Hilfe einer komplexen Leitfähigkeit rª (x) = r1–ir2 (Abschn. 11.1); rª beschreibt zeitabhängige Transportphänomene!
(a) Zeigen Sie mittels der London-Gleichungen, dass ein Supraleiter für endliche Frequenzen x eine rein imaginäre Leitfähigkeit bei Temperaturen T Tc zeigt! Was ist der physikalische Grund? Welche Konsequenzen ergeben sich für Schaltkreise mit supraleitenden Bauelementen? (b) Leiten Sie die Frequenzabhängigkeit der imaginären Leitfähigkeit r2 (x) eines Supraleiters ab und schätzen Sie r2 bei einer Frequenz von 10 GHz für ein Material mit ns = 1020 cm–3 supraleitenden Elektronen ab. 10.3 Diskutieren Sie die Temperaturabhängigkeit der spezifischen Wärmeleitfähigkeit für ein Material, das vom Normalzustand in den supraleitenden Zustand übergeht! Man betrachte sowohl das „freie“ Elektronengas beim Übergang in den BCS-Grundzustand als auch das Phononensystem. 10.4 Der BCS-Grundzustand eines stark vereinfachten Supraleiters bestehe aus nur zwei Cooper-Paaren (Abschn. 10.4): jyBCS i
uk j0ik v k j1ik
uk0 j0ik0 v k0 j1ik0 : Berechnen Sie den Energiegewinn hyBCS jH jyBCS i mittels des Hamilton-Operators H , in dem Streuprozesse k ! k ' mittels Spin-Matrizen beschrieben werden! Vergleichen Sie das Ergebnis mit dem allgemeinen Ausdruck (10.41) für viele CooperPaare! 10.5 Es gibt eine enge Analogie zwischen der BCS-Theorie und der Theorie des Ferromagnetismus.
348
Übungen zu Kapitel 10
(a) Man zeige, dass die Energie WBCS (10.42) des BCS-Grundzustandes als Erwartungswert hyBCS jH BCS jyBCS i eines BCS-Hamilton-Operators H BCS abgeleitet werden kann, mit X H BCS2 nk r
3 k k
V0 X
1
1
2
2
r r rk0 rk0 4L3 kk0 k k
und
1
rk
3
rk
0 1 1 0 1 0
0 1
k
;
2
rk
0 i
i 0
k
;
k
als Pauli-Spinmatrizen in x, y, z- bzw. 1, 2, 3-Richtung! (b) Der Hamilton-Operator H BCS gleicht formal dem Heisenberg-Hamilton-Operator (8.57) für wechselwirkende Spins in einem äußeren Magnetfeld. Man konstruiere in Analogie zur Theorie des Ferromagnetismus (Abschn. 8.6) den linearisierten Hamilton-Operator X rk Hk ; H BCS k
bei dem das Modell-Feld Hk eine Komponente parallel zur z-Richtung (3) und ein verallgemeinertes „Mittleres Feld“ (Mittel über Nachbarspins) in der x, yEbene (2,3) besitzt! Zeigen Sie, dass sich der Formalismus der BCS-Theorie ergibt, wenn man die „Mittlere Feld“Komponente mit der Lückenenergie D
des Supraleiters identifiziert und 2Hk in (10.48, 10.49) dem Winkel zwischen effektivem Feld Hk und der z (3)-Richtung entspricht! (c) Leiten Sie unter Zuhilfenahme der „Mittleren Feld“-Näherung (Abschn. 8.6) für die Temperaturabhängigkeit der Magnetisierung eine SelbstkonsistenzBeziehung für die Temperaturabhängigkeit der Supraleiter-Lückenenergie D (T) ab! 10.6 Berechnen Sie die beim Übergang in den supraleitenden Zustand auftretende Energieabsenkung mit (W0BCS–W 0n) (10.53) mit W0n als Energie des normalleitenden Zustandes! Hinweis: Man benutze die Darstellung (10.52 a) für die Energie W 0BCS des BCSGrundzustandes und schreibe dieP auftreten den Summen als Integrale (L –3 ) dk/ 4 p 3) um. Für die Integrationsgrenzen ist zu beachten: u2k 0 fur E < EF0
hxD ;
v 2k 0 fur E > EF0 hxD : Weiter gilt D xD EF0 , und die Zustandsdichte Z (E) in der Nähe der FermiKante wird als konstant angenommen. Man benutze ferner folgende Darstellung der Lückenenergie-Gleichung V0 D 3 Z
EF0 L
h
xD
hxD
D de p ; e2 D2
die aus (10.46 u. 10.49) folgt.
Tafel IX
Tafel IX Einelektronen-Tunneln an Supraleitern
In der Supraleitungsforschung spielen Tunnelexperimente eine wichtige Rolle. Einmal sind sie ein bedeutendes Hilfsmittel zur Bestimmung der Lücke D bzw. 2D im Anregungsspektrum eines Supraleiters, zum anderen liefern inelastische Beiträge zum Tunnelstrom Information über charakteristische Anregungen in der isolierenden Barriere selbst. Tunneln ist ein allgemeines quantenmechanisches Phänomen: Ein atomares Teilchen, z. B. ein Elektron (Masse m ) durchläuft eine Potentialbarriere (Höhe V^ 0, Breite d, Abb. IX.1), obwohl klassisch seine kinetische Energie E nicht ausreichend groß wäre, die Barriere zu überwinden (E < V^ 0). Wellenmechanisch jedoch besteht eine endliche Wahrscheinlichkeit, ein Teilchen im Bereich c hinter der Barriere zu finden, wenn es im Bereich a gegen diese Barriere anläuft (Abb. IX.1). Eine quantitative Beschreibung des Phänomens ergibt sich aus der Lösung der Schrödinger-Gleichung d 2 w 2m 2 Ew 0 dx2 h
IX:1 a
Abb. IX.1. Wellenmechanische Beschreibung des Tunnelpro^0 und der Breizesses durch eine Potentialbarriere der Höhe V te d. Es läuft in Bereich a eine Welle der Amplitude B1 ein, von der ein Teil reflektiert wird (Amplitude A1); ein anderer Teil der Welle (Amplitude B2) dringt in den Bereich b der Potentialbarriere ein und wird dort am anderen Ende zum Teil wieder reflektiert (Amplitude A2) und zum Teil als Tunnelstrom durchgelassen
im Raumbereich a und c sowie d 2 w 2m 2
E V^0 w 0
IX:1 b dx2 h im Raumbereich b. In Bereich a läuft eine Welle ein, die teilweise an der Barriere reflektiert wird, ähnliches gilt für Bereich b. Damit ergeben sich in den verschiedenen Bereichen folgende Lösungen der Schrödinger-Gleichungen (IX.1) wa A1 ei kx B1 e
i kx
mit 1 p 2mE ; h 0 wb A2 ei k x B2 e
IX:2 a
k
mit 1 h wc e k0
i k0 x
q 2m
E V^0 ; i kx
:
IX:2 b
IX:2 c
Die Wellenamplituden sind auf den Bereich c normiert, da dies der interessante Bereich ist. An den Grenzen der Potentialbarriere x = 0 und x = d müssen die Wellenfunktionen (IX.2) und deren Ableitungen stetig ineinander übergehen, weil der Strom insgesamt erhalten bleiben muss. Damit folgen die Bedingungen 1 k0 1 k0 A1 A2 B2 ; 1 1
IX:3 a k k 2 2 1 k0 1 k0 A2 B2 1 1 B1
IX:3 b k k 2 2 für x = 0 und analog für x = d
Tafel IX
350
1 k e 1 2 k0 1 k B2 1 0 e 2 k
A2
Tafel IX Einelektronen-Tunneln an Supraleitern
i
kk0 d
;
IX:4 a
i
k k0 d
:
IX:4 b
Im Hinblick auf ein Tunneln von a nach c interessiert vor allem das Verhältnis der Wellenamplituden in a und c. Durch Einsetzen von A2 und B2 aus (IX.4) in (IX.3) ergibt sich die Amplitude der einlaufenden Welle in a (bezogen auf Bereich c ) zu 1 k0 k 0 1 1 e i
kk d B1 0 k 4 k 0 1 k k 0 1 0 e i
k k d : 1
IX:5 k 4 k Für den bei einem Tunnelexperiment interessierenden Fall E < V^ 0 setzen wir in (IX.2 b) k ' = i j, so dass gilt q 1 0 k ij
IX:6 2m
V^0 E : h Damit folgt für die Aufenthaltswahrscheinlichkeitsdichte des einlaufenden Teilchens in Bereich a bezogen auf die in Bereich c 1 1 k j 2 1 k j 2 B1 B1 cosh 2jd : 2 8 j k 8 j k
IX:7 Die Aufenthaltswahrscheinlichkeit des Teilchens im Bereich a nimmt also annähernd exponentiell (für große jd ) zu mit der im Bereich c vorhandenen. Umgekehrt folgt, dass bei gegebener Intensität der einlaufenden Welle B1 B1 die durch die Barriere hindurchlaufende Welle eine Intensität hat, die annähernd exponentiell mit der Dicke d und der Höhe der Barriere V^0 abklingt wie q 2 d 2m
V^0 E :
IX:8 wc wc exp h Elektronen sind also in der Lage, eine Isolatorschicht zwischen zwei Leitern zu durchtunneln, wenn diese Schicht nur eine genügend geringe Dicke d hat. Der Tunnelstrom durch eine solche Schicht hängt exponentiell von der energetischen Höhe V^0 der Barriere und der kinetischen Ener-
Abb. IX.2 a–e. Schematische Darstellung der Tunnelprozesse von einzelnen Elektronen durch eine isolierende Schicht (Barriere) der Dicke d. Für die normalleitenden Metalle ist jeweils das besetzte Leitungsband mit Fermi-Energie EF schattiert gezeichnet. Supraleiter sind jeweils durch ihren BCS-Grundzustand (einfache Linie auf der Energieachse E ) und die Zustandsdichte der Einteilchenzustände (E > EF+D) charakterisiert. (a) Tunneln einzelner Elektronen zwischen zwei normalleitenden Metallen über eine isolierende Schicht, über die eine äußere Spannung U anliegt. (b) Schematische I–U-Kennlinie für Einelektronen-Tunneln zwischen zwei Normalleitern. (c) Tunnelkontakt zwischen Supraleiter (links) und Normalleiter (rechts) im thermischen Gleichgewicht (U = 0). Ein Cooper-Paar ist im BCS-Grundzustand schematisch angedeutet. (d) Aufbrechen eines Cooper-Paares und elastisches Tunneln eines Einzelelektrons vom Supraleiter in den Normalleiter bei Anliegen einer äußeren Spannung U = D/e. (e) Schematische I–U-Kennlinie für elastisches Tunneln von Einzelelektronen zwischen Supra- und Normalleiter
gie der Teilchen E, d. h. von der anliegenden Spannung am Tunnelübergang ab (IX.8). In realistischen Tunnelexperimenten handelt es sich um zwei elektrische Leiter (z. B. Metalle), die durch eine Isolatorschicht (typisch eine Metalloxidschicht einer Dicke 10–100 Å) voneinander getrennt sind; eine Spannung U zwischen den beiden leitenden Metallen verursacht den Tunnelstrom I (U) , der über große Spannungsbereiche
exponentiell von U abhängt (IX.8). Tunnelexperimente lassen sich sehr gut im Bild des Potentialtopfes (Abb. 6.13) für Metalle (normalleitender Zustand) bzw. bei Supraleitern im Bild der elektronischen Zustandsdichte des Anregungsspektrums eines Supraleiters (Abb. 10.11) diskutieren. Legt man an zwei normalleitende Metalle, die durch eine isolierende Barriere der Dicke d getrennt sind, eine Spannung U, so werden die Fermi-Niveaus um den Betrag e U gegeneinander verschoben. Besetzte elektronische Zustände im negativ vorgespannten Metall stehen leeren Zuständen des anderen Metalls auf gleicher Energie gegenüber, und es kann ein Tunnelstrom über die Barriere fließen (Abb. IX.2 a). Dieser Stromtransport ist weitgehend „elastisch“, da die Elektronen keine Veränderung ihrer Energie beim Übergang erfahren. Für kleine U ist die exponentielle Spannungsabhängigkeit I (U) fast linear (Abb. IX.2 b). Ist das negativ vorgespannte Metall im supraleitenden Zustand (Abb. IX.2 d), so existiert eine Lücke D im Anregungsspektrum zwischen dem BCS-Vielteilchengrundzustand (besetzt mit Cooper-Paaren) und dem Kontinuum der Einteilchenzustände. Bei U = 0 stehen sich nur vollbesetzte Zustände gegenüber, elastisches Tunneln ist nicht möglich (Abb. IX.2 c), da das Aufbrechen eines Cooper-Paares mit einer Energieänderung verbunden ist. Für kleine Spannungen U < D/e ist damit kein Stromfluss möglich. Die Situation ändert sich, wenn die Vorspannung den Wert D/e erreicht, wo das Fermi-Niveau im normalleitenden Metall um D unterhalb des BCS-Grundzustandsniveaus liegt (Abb. IX.2 d). Jetzt wird das Aufbrechen eines Cooper-Paares bei gleichzeitigem Fließen eines Tunnelstromes möglich. Ein Elektron des Cooper-Paares wird in das Kontinuum der Einelektronenzustände im Supraleiter angeregt, während das andere die entsprechende Energie gewinnt, indem es in einen entsprechend tiefer liegenden leeren Zustand des normalleitenden Metalls hinübertunnelt. Von dieser Schwelle an nimmt der Tunnelstrom sprunghaft zu, um dann quasi-linear mit U weiter anzuwachsen (Abb. IX.2 e). Für U > D/e werden immer mehr solcher Aufbrechprozesse von Cooper-Paaren mit kombiniertem Tunneln möglich. Die Messung der Kennlinie I (U) wie in Abb. IX.2 e gibt unmittelbar die Lückenenergie D
351
Tafel IX
Tafel IX Einelektronen-Tunneln an Supraleitern
Abb. IX.3 a–d. Schematische Darstellung der Tunnelprozesse von Einzelelektronen zwischen zwei verschiedenen Supraleitern (D1>D2) , die durch eine Tunnelbarriere der Dicke d getrennt sind. Die Supraleiter sind durch ihre BCS-Grundzustände (einfache Linie auf der Energieachse) und durch die Zustandsdichte der Einteilchenzustände (E > EF+Di) charakterisiert. (a) Tunnelanordnung im thermischen Gleichgewicht (U = 0). (b) Es liegt die äußere Spannung U = (D1–D2)/e an, so dass bei endlicher Temperatur (0 < T < Tc) Einzelelektronen tunneln können. Cooper-Paare können noch nicht aufbrechen. (c) Es liegt die äußere Spannung U = (D1+D2)/e an, so dass im rechten Supraleiter Cooper-Paare aufbrechen können und Tunneln von Einzelelektronen nach links erfolgen kann, unter gleichzeitiger Anregung von Einzelelektronen über die Lücke D2. (d) Schematische I–U-Kennlinien für elastisches Tunneln von Einzelelektronen zwischen zwei Supraleitern. Bei verschwindender Temperatur (T& 0) existieren nur Prozesse des Typs (c) mit einem Einsatz bei (D1+D2)/e, während bei endlichen Temperaturen (0 < T < Tc) zusätzliche Prozesse des Typs (b) möglich sind (gestrichelte Kennlinie)
des Anregungsspektrums des Supraleiters. Ähnlich lässt sich „elastisches“ Tunneln zwischen zwei Supraleitern diskutieren, die durch eine Isolatorschicht getrennt sind (Abb. IX.3). Für kleine Spannungen U (z. B. U = 0 in Abb. IX.3) stehen sich bei gleicher elektronischer Energie E nur entweder leere oder besetzte Zustände (T^0) gegenüber; ein Tunnelstrom kann nicht fließen. Erreicht die Vorspannung U bei T ^ 0 den Wert (D1+D2)/e, so können Cooper-Paare in einem der beiden Supraleiter aufbrechen und Einelektronenzustände in beiden Supraleitern besetzen unter Überwindung der Tunnelbarriere (Abb. IX.3 c); der Tunnelstrom setzt sprunghaft ein (Abb. IX.3 d). Befindet sich der Tunnelübergang bei endlicher Temperatur T, jedoch unterhalb der Sprungpunkte Tc bei-
Tafel IX
352
Tafel IX Einelektronen-Tunneln an Supraleitern
der Supraleiter, so sind die Einelektronenzustände zu einem gewissen Teil besetzt, und oberhalb einer Vorspannung U = (D1–D2) /e kann ein „elastischer“ Tunnelstrom normalleitender Elektronen fließen (Abb. IX.3 b). Die Tunnelcharakteristik I (U) zeigt bei U = (D1–D2)/e ein Maximum (Abb. IX.3 d), weil sich dann die Singularitätspunkte der Einelektronenzustandsdichte auf gleichem Energieniveau gegenüberstehen. Mit wachsender Vorspannung U verschieben sich diese Punkte gegeneinander, der „elastische“ Tunnelstrom nimmt wieder ab bis zur Schwelle (D1+D2)/e. Aus der Messung der Tunnelcharakteristik zwischen zwei Supraleitern bei T j 0 lassen sich gemäß Abb. IX.3 d also die Lückenenergien D1 und D2 bestimmen. Eine einfache Überlegung schließlich zeigt, dass die Tunnelcharakteristiken (Abb. IX.3 d und IX.2 e) symmetrisch um U = 0 sind. Wegen der Wichtigkeit solcher Tunnelexperimente zur Bestimmung der Lückenenergie D sei an dieser Stelle etwas über die experimentelle Realisierung gesagt. Tunnelübergänge werden im allgemeinen durch kreuzweises Aufdampfen zweier Metallfilme erzeugt. Ein erster Aluminiumfilm wird durch eine Maske als Streifen auf eine isolierende Unterlage (Quarz etc.) aufgedampft (Druck < 10–4 Pa). Dann wird die Tunnelbarriere durch oberflächliche Oxidation dieses Films hergestellt. Dazu wird Sauerstoff in die Aufdampfkammer eingelassen (103–104 Pa) oder die Oxidation wird durch eine Glimmentladung bei etwa 10–100 Pa Sauerstoffatmosphäre durchgeführt. Durch eine zweite Maske wird ein zweites Metall als Streifen aufgedampft, diesmal senkrecht zum ersten Metallstreifen orientiert. Typische Widerstände einer solchen Tunnelanordnung liegen im Bereich von 100–1000 X. Die eigentliche Tunnelbarriere zwischen den beiden senkrecht zueinander liegenden Metallstreifen hat eine Fläche von etwa 0,1 bis 0,2 mm2. Nach Fertigstellung dieser „Sandwich“-Anordnung in einem Aufdampfpumpstand wird das kontaktierte „Tunnelpaket“ in einem Kryostaten ähnlich wie in Abb. IV.1 eingebaut und bei tiefen Temperaturen (T < 4 K) die Strom-Spannungscharakteristik I (U) gemessen. Für das Studium neuer oxidischer Supraleiter (Abschn. 9.10) reichen natürlich Temperaturen im Bereich 20–70 K aus. Um die für die Lückenenergien charakteristischen
Schwellen der I (U) Kennlinie (Abb. IX.2 e, IX.3 d) mit höherer Präzision zu ermitteln, empfiehlt sich die Messung der ersten Ableitung dI/ dU oder dU/dI. Dazu kann eine Schaltung wie in Abb. IX.4 a verwendet werden. Der Tunneldiode (TD) wird über eine Gleichspannungsquelle die Vorspannung U aufgeprägt, die über einen Gleichspannungsverstärker auf der x-Achse eines Schreibers registriert wird. Der Gleichspannung U wird eine kleine Wechselspannung v cos x t überlagert (Oszillator x ) und über einen „LockIn“-Verstärker wird die durch den Tunnelkontakt fließende Stromkomponente mit der Frequenz x detektiert und auf der y-Achse des Schreibers registriert. Weil der Gesamtstrom (Überlagerung von Gleich (dc)- und Wechsel (ac)-Komponente) sich darstellt als I
U v cos xt I
U
dI v cos xt dU
1 d2 I 2 v
1 cos 2xt . . . ; 2 dU 2
IX:9
ist das bei der Frequenz x detektierte Signal der Ableitung dI/dU proportional. Im Experiment werden Frequenzen im kHz-Bereich bei Spannungsamplituden von 20 bis 50 lV (bestimmt energetische Auflösung) verwendet. Abbildung IX.5 zeigt als typisches Beispiel die um U = 0 symmetrische Tunnelcharakteristik dI/ dU einer Hg/Al2O3/Al-Tunneldiode, aufgenommen bei 1,21 K [XI.1]. Das abschreckend kondensierte Al liegt in feinkristalliner Form vor, wobei seine Übergangstemperatur Tc je nach Grad der Kristallstörung zwischen etwa 2,5 und 1,8 K liegt (für kompaktes Al ist Tc = 1,18 K). Auf das oxidierte Al, d. h. auf die Al2O3-Isolatorschicht wurde Hg abschreckend kondensiert. Je nach Grad der Kristallstörungen schwankt seine Sprungtemperatur zwischen etwa 4 und 4,15 K. In Abb. IX.5 sind also beide Partner in der Tunneldiode supraleitend. Man sieht qualitativ, dass die Messkurve für U > 0 die 1. Ableitung einer I (U)-Kurve des Typs wie in Abb. IX.3 d (T j 0) darstellt. Die in Abb. IX.5 mit a und b markierten Abstände liefern also unmittelbar die Informationen 2 (DHg+DAl)/e bzw. 2 (DHg–DAl)/e über die Lückenenergien der beiden Supraleiter.
353
Tafel IX
Tafel IX Einelektronen-Tunneln an Supraleitern Abb. IX.4 a, b. Blockschaltbilder zur Messung von Tunnel-Kennlinien. (a) Messanordnung zur Aufnahme der dI/ dU-Kurven (Gap-Kurven) in Abhängigkeit von der Tunnelspannung U im Bereich kleiner Energien e U. Der Tunnelstrom I ist proportional zu der über RV abfallenden Spannung. TD bezeichnet die Tunneldiode. (b) Brückenschaltung zur Aufnahme der dU/dI- und der d 2 U/ dI 2-Kurven in Abhängigkeit von der Tunnelspannung U im Energiebereich e U > D. Die Anordnung eignet sich insbesondere zur Messung kleiner inelastischer Zusatzbeiträge vor dem Hintergrund eines stärkeren elastischen Tunnelstromes. Rd bezeichnet die Widerstandsdekade für den Brückenabgleich, TD die Tunneldiode. (Nach Roll [IX.1])
Neben dem bisher beschriebenen elastischen Tunneln, das zur Bestimmung von Lückenenergien besonders wichtig ist, gibt es sog. inelastische Prozesse, die in höherer Ordnung den Tunnelstrom im Spannungsbereich U > D/e beeinflussen (Abb. IX.6). In der Isolatorbarriere eines Tunnelüberganges gibt es vielfältige Möglichkeiten für das tunnelnde Elektron, Anregungen zu erzeugen. Neben Erzeugung von Gitterschwingungen können Schwingungen eingelagerter Atome oder Fremdstoffmoleküle angeregt werden. Sei h x0 die Anregungsenergie eines solchen eingelagerten Moleküls, so existiert neben dem elastischen „Tunnelpfad“ (1) in Abb. IX.6 a auch der inelastische „Pfad“ (2) für ein Elektron, das nach Aufbrechen eines Cooper-Paares von Supraleiter I nach Normalleiter II hinübergelangt. Dieses inelastische Tunneln (2) unter Anregung einer Molekülschwingung h x0 wird möglich, wenn die angelegte Spannung U den Wert ( hx0 D)/e überschreitet. Die Tunnelcharakteri-
Abb. IX.5. Typische Ableitung dI/dU einer Tunnelcharakteristik für elastisches Einelektronentunneln zwischen zwei Supraleitern (Gap-Kurve), gemessen mit einer Anordnung nach Abb. IX.4 a. Die Messung geschah an einer Hg/Al2O3/AlTunneldiode bei einer Messtemperatur von 1,21 K nach Tempern auf 150 K. Die Pfeile a und b markieren die Abstände 2 (DHg+DAl)/e bzw. 2 (DHg–DAl) /e auf der Spannungsachse. (Nach Roll [IX.1])
Tafel IX Einelektronen-Tunneln an Supraleitern
Tafel IX
354
stik I (U) zeigt von diesem Spannungswert ab eine geringfügige Zunahme ihrer Steigung (Abb. IX.6 b). In der ersten Ableitung dI/dU tritt ein Sprung auf (Abb. IX.6 c), der jedoch erst in der zweiten Ableitung (Abb. IX.6 d) deutlich als scharfe Bande messbar wird. Die experimentelle Erforschung solcher inelastischer Prozesse geschieht also durch Messung der zweiten Ableitung d 2I/dU 2 oder d 2 U/dI 2 der Tunnelcharakteristik oberhalb der Lückenschwelle D/e. Da sich im interessanten Spannungsbereich der elastische Untergrund gegenüber den inelastischen Beiträgen nur wenig ändert, kann die Messempfindlichkeit gesteigert werden, indem die Tunneldiode in den Mittelzweig einer Wheatstone-Brücke geschaltet wird, die die Grundspannung unterdrückt (Abb. IX.4 b). Die Messung der zweiten Ableitung d 2 U/dI 2 erfolgt gemäß (IX.9) durch Überlagerung einer kleinen Wechselspannung (Frequenz x ) und Detektion auf der doppelten Frequenz 2x mittels „Lock-In“-Technik (Abb. IX.4 b). Abbildung IX.7 zeigt ein inelastisches Tunnelspektrum, das an einer Al/Al2O3/PbTunneldiode aufgenommen wurde, bei der nach
Abb. IX.6 a–d. Schematische Darstellung eines inelastischen Tunnelprozesses zwischen einem Supraleiter I und einem Normalleiter II. (a) Darstellung im Bänderschema; der Supraleiter ist gekennzeichnet durch seinen BCS-Grundzustand (fette Linie) und durch die Einteilchenzustandsdichte (E >EF+D), während für den Normalleiter das besetzte Leitungsband (E < EF) schattiert dargestellt ist. Neben dem elastischen Prozess (1) sind inelastische Prozesse (2) möglich, wenn die Tunnelspannung U den Wert D+ h x0 überschreitet. h x0 ist die Quantenenergie einer charakteristischen Anregung in der Barriere (Molekülschwingung, Phononen usw.). (b) Schematische I–U-Kennlinie für Einelektronen-Tunneln zwischen einem Supraleiter und einem Normalleiter. Bei der Tunnelspannung D/e brechen Cooper-Paare auf und elastische Tunnelprozesse setzen ein, bei ( hxD+D)/e setzen inelastische Prozesse ein. (c) Schematische Darstellung der 1. Ableitung dI/dU der I–U-Kennlinie aus (b). (d) Schematische Darstellung der 2. Ableitung d 2 I/dU 2 der I–U-Kennlinie aus (b)
Abb. IX.7. Inelastisches Tunnelspektrum (2. Ableitung d 2 U/ dI 2) gemessen bei einer Temperatur von 2 K an einem Al/ Oxid/Pb-Tunnelkontakt, bei dem die Al2O3-Schicht vor der Deposition des Pb mit Ameisensäure (HCOOH) aus der Dampfphase „dotiert“ wurde. Der Vergleich mit InfrarotSchwingungsbanden zeigt, dass bei der Adsorption von HCOOH ein Formiat-Ion HCOO– gebildet wird, dessen Schwingungen das Tunnelspektrum erklären. Charakteristisch sind die symmetrische (s) und asymmetrische (a) Streckschwingung der COO–-Gruppe. (Nach Klein et al. [IX.2])
der Oxidation des Al, d. h. auf die Al2O3-Isolatorschicht-Ameisensäure (HCOOH) adsorbiert wurde [XI.2]. Danach wurde die Deckelektrode aus Pb aufgedampft. In der gemessenen d 2 U/dI 2-Kurve werden scharfe Banden beobachtet, die auf inelastische Streuung der tunnelnden Elektronen an Anregungen in oder nahe der Al2O3-Barriere hervorgerufen werden. Neben einer durch Phononenanregung verursachten Bande bei etwa 35 meV werden Schwingungsbanden gefunden, die durch dissoziativ adsorbierte Ameisensäure erklärt werden müssen. Ein Vergleich mit den von unzersetzter Ameisensäure (HCOOH) und mit den von Na-Formiat (HCOONa) her bekannten Infrarot-Banden zeigt deutlich, dass die aus der Dampfphase aufgelassene Ameisensäure auf dem Al2O3 zersetzt wird und als Formiat adsorbiert. Experimente dieser Art werden manchmal zum Studium von Adsorptionsprozessen eingesetzt. Hierbei werden die Tunnelbarrieren jeweils
355
aus dem Material (Isolator) erzeugt, dessen Adsorptionseigenschaften studiert werden sollen. Es sei betont, dass in diesem Zusammenhang die Eigenschaft der Supraleitung von mindestens einer der beiden Tunnelelektroden nur die Rolle spielt, dass der Supraleiter in der Nähe der Lücke (e 0 D) eine starke Singularität in der Zustandsdichte liefert. Dies ermöglicht eine hohe energetische Auflösung (*2 meV) der Schwingungsspektren adsorbierter oder eingelagerter Moleküle.
Literatur IX.1 U. Roll: Diplomarbeit. RWTH Aachen (1976) IX.2 J. Klein, A. Léger, M. Belin, D. Defourneau, M. J. L. Sangster: Phys. Rev. B 7, 2336 (1973)
Tafel IX
Literatur
Tafel X
Tafel X Cooper-Paar-Tunneln – Josephson-Effekte
In Tafel IX wurden Tunnelexperimente an Supraleitern vorgestellt, bei denen jeweils einzelne Elektronen durch die Tunnelbarriere hindurchtunneln. Josephson zeigte 1962 zum erstenmal theoretisch, dass auch Cooper-Paare tunneln [X.1]. Bei diesen sog. Josephson-Effekten tritt die für Cooper-Paare, bzw. den BCS-Grundzustand, charakteristische hohe Kohärenz deutlich zu Tage. Die Experimente werden an sehr dünnen Tunnel˚ ) durchgeführt, die zwei Subarrieren (d < 30 A praleiter aneinander koppeln. Hierbei muss die Kopplung genügend schwach sein, d. h. es darf die Aufenthaltswahrscheinlichkeit eines CooperPaares in der Barriere nur sehr gering sein. Experimentell wird dies z. B. in Tunnel-,Sandwich‘Anordnung erreicht, wo eine dünne Oxidbarriere ˚ ) oder auch eine dünne normalleitende (10–20 A Schicht zwei supraleitende Metallfilme trennt (Abb. X.1 a). Auch Mikrobrücken (Abb. X.1 b), d. h. sehr dünne Verbindungen zwischen zwei supraleitenden Materialien, werden verwendet. Eine
Abb. X.1 a, b. Mögliche Ausführungsformen zur Herstellung einer schwachen Kopplung zwischen zwei Supraleitern. (a) Tunnelkontakt, bei dem zwei senkrecht zueinander orientierte supraleitende Streifen durch eine dünne Oxidbarriere (10– ˚ ) oder durch eine dünne normalleitende Metallschicht 20 A ˚ ) voneinander getrennt sind. (b) Mikrobrücke, bei (100–100 A der beispielsweise über lithographische Prozesse und Ätzschritte ein dünner Steg von etwa 1 lm zwischen zwei supraleitenden Schichten herausgearbeitet wird
weitere einfache Realisierung einer solchen Mikrobrücke besteht in einem Punktkontakt, bei dem eine Spitze eines Supraleiters gegen eine Fläche des anderen gedrückt wird. In der Grundschaltung zur Beobachtung der Josephson-Effekte in Abb. X.2 wird eine äußere Spannung Uext über einen äußeren Widerstand R an den „Tunnelkontakt“ S 1/S 2 gelegt. Es kann sowohl der Strom I durch den Kontakt wie auch die über der Tunnelbarriere abfallende Spannung U gemessen werden. Wegen des starken Einflusses von Magnetfeldern auf die hoch kohärenten Cooper-Paar-Zustände (Abschn. 10.7, 10.8) müssen unkontrollierte Magnetfelder im Bereich der Tunnelbarriere stark abgeschirmt werden. Schon das Erdmagnetfeld macht die Beobachtung von Josephson-Effekten unmöglich. In einer Anordnung wie in Abb. X.2 könnten ohne magnetische Abschirmung nur die in Tafel IX diskutierten Einteilchen-Tunneleffekte (Abb. IX.3) beobachtet werden. Für die theoretische Beschreibung der an einem Josephson-Kontakt sich abspielenden Effekte nehmen wir ein vereinfachtes Modell wie in Abb. X.2 a an. Zwei Supraleiter 1 und 2 aus ein und demselben Material seien über eine dünne
Abb. X.2 a, b. Schematische Darstellung einer Anordnung zur Messung des Josephson-Tunneleffektes an einem Kontakt bestehend aus zwei Supraleitern 1 und 2 mit isolierender Barriere (a). Die Schaltung (b) erlaubt die Messung des Tunnelstromes I und der Spannung U, die direkt über der Tunneldiode abfällt (Tunnel-Diodenspannung)
357
Zur Vereinfachung betrachten wir in (X.1) gleiche Supraleiter. Im Sinne einer störungstheoretischen Behandlung nehmen wir an, dass U1 näherungsweise eine Eigenlösung zu H 1 ist. Wir ersetzen also H 1 durch die Energie des supraleitenden Zustandes. Eine Spannung U über der Diode verschiebt die Energien in beiden Supraleitern um q U gegeneinander (q = –2 e). Wenn der Nullpunkt der Energieskala symmetrisch zwischen die beiden Supraleiter in die Barriere gelegt wird, reduziert sich (X.1) auf qU U1 TU2 ; 2 qU ih U_ 2 U2 TU1 : 2
ih U_ 1 Abb. X.3. Strom-Spannungs-Charakteristik einer Pb/PbOx/PbJosephson-Tunneldiode, gemessen in einer Anordnung wie in Abb. X.2. Der aufgeprägte Cooper-Paar-Tunnelstrom ICP steigt mit wachsender externer Spannung Uext bei verschwindender Diodenspannung U bis zu einem Maximalwert I max CP an, um dann in die Einteilchencharakteristik mit endlichem Spannungsabfall über der Diode überzukippen. (Nach Langenberg et al. [X.2])
Tunnelbarriere miteinander verbunden. Die Temperatur sei so niedrig, dass wir nur die Elektronen in ihrem gemeinsamen supraleitenden (BCS)Grundzustand betrachten müssen. In beiden Supraleitern beschreiben dann die Vielteilchenwellenfunktionen U1 und U2 die entsprechenden Cooper-Paar-Zustände. Seien H 1 und H 2 die GesamtHamilton-Operatoren (Energien) der jeweils getrennten Supraleiter, so gilt für das über die Barriere gekoppelte System: @U1 H 1 U1 TU2 ;
X:1 a @t @U2 H 2 U2 TU1 : ih
X:1 b @t Hierbei drückt T die für den Tunnelübergang charakteristische Kopplungskonstante aus. Durch T U2 bzw. T U1 werden die Energiebeiträge in den einzelnen Supraleitern beschrieben, die dadurch zustande kommen, dass die Vielteilchenwellenfunktionen U2 bzw. U1 im jeweils anderen Supraleiter nicht völlig verschwinden (Tunneln des BCS-Zustandes bzw. der Cooper-Paare). Für eine total undurchlässige Barriere (T = 0) ergeben (X.1) zwei ungekoppelte, zeitabhängige Vielteilchen-Schrödinger-Gleichungen für die getrennten Supraleiter. ih
X:2 a
X:2 b
Weil jUj2 = ns/2 = nc die Dichte der Cooper-Paare ist (ns: Dichte der Einzelelektroden), lassen sich die Zustandsfunktionen U1 und U2 (Abschn. 10.8) darstellen als p
X:3 a U1 nc1 ei u1 ; Uz
p i u2 nc2 e ;
X:3 b
wobei u1 und u2 die Phasen der VielteilchenBCS-Wellenfunktionen in den beiden Supraleitern sind. Einsetzen von (X.3) in (X.2 a) ergibt nach Auftrennen und Gleichsetzen von Real- und Imaginärteil die Beziehungen h qU n_ c1 sin u1 nc1 cos u1 hu_ 1 2 2 p T nc1 nc2 cos u2 ;
X:4 a h qU nc1 sin u1 hu_ 1 n_ c1 cos u1 2 2 p T nc1 nc2 sin u2 :
X:4 b Analoge Gleichungen folgen durch Einsetzen von (X.3) in (X.2 b). Multiplikation von (X.4 a und X.4 b) mit cos u1 und sin u1 bzw. mit sin u1 und cos u1 und anschließender Subtraktion beider Gleichungen voneinander liefert zusammen mit den beiden analogen Gleichungen aus (X.2 b) 2 p n_ c1 T nc1 nc2 sin
u2 h
u1 ;
X:5 a
Tafel X
Tafel X Cooper-Paar-Tunneln – Josephson-Effekte
Tafel X
358
n_ c2
2 p T nc1 nc2 sin
u2 h
u1 ;
Tafel X Cooper-Paar-Tunneln – Josephson-Effekte
X:5 b
bzw. r nc2 cos
u2 nc1 r 1 nc1 cos
u2 u_ 2 T nc2 h 1 u_ 1 T h
u1
qU ; 2h
X:6 a
u1
qU : 2h
X:6 b
Für eine symmetrische Anordnung aus zwei gleichen Supraleitern wie in Abb. X.2 ergibt sich einfach mit nc 1 = nc 2 = nc n_ c1
2T=hnc sin
u2 h
u_ 2
u_ 1
qU :
u1
n_ c2 ;
X:7 a
X:7 b
Diese Gleichungen haben auch bei verschwindender Spannung (U = 0) über der Tunnelbarriere als Lösung einen Stromfluss (n_ c j 0) zur Folge. Experimentell heißt das, unmittelbar nach Schließen des Kontaktes in Abb. X.2 b setzt ein Tunnelstrom von Cooper-Paaren ein, dessen Richtung von sin
u2 u1 (X.7 a), d. h. von der Phasendifferenz der BCS-Vielteilchenzustände in den Supraleitern abhängt. Hierbei fällt keine Spannung U über der Diode ab, obwohl im äußeren Stromkreis die externe Spannung Uext anliegt. Im Kreis wird als Strom der Tunnelstrom ICP gemessen. Durch den Strom entsteht eine Ladungsasymmetrie, die den Strom verhindern würde, wenn nicht die überfließenden Ladungen durch die äußere Batterie auf der einen Seite ersetzt und auf der anderen Seite abgeführt würden. Dadurch bleibt der Tunnelstrom stationär (nc1 = nc2 = nc). Aufgetragen über der Tunneldioden-Spannung U (Abb. X.2 b) hat dieser Josephson-Gleichstrom ICP zunächst nur einen Wert bei U = 0 (Abb. X.3). Mit der äußeren Spannung Uext wächst ICP an bis max zu einem Maximalwert I max CP . Unterhalb von I CP wird er durch Zulieferung über den äußeren Stromkreis eingestellt. Wird dieser maximale Josephson-Strom I max CP bei weiterem Vergrößern von Uext überschritten, so wird der Zustand instabil und es tritt eine Spannung U j 0 an der Tunneldiode auf. Der Strom I stellt sich dann auf den Wert I (R) ein, der aufgrund von Uext , U und dem äußeren Widerstand R aus der Tunnelcharakteristik für Einteilchen-Tunneln zwischen
zwei Supraleitern folgt (Abb. IX.3). Dieser Strom I rührt nicht mehr von tunnelnden Cooper-Paaren her, er resultiert aus tunnelnden Einzelelektronen, die beim Aufbrechen von Cooper-Paaren entstehen. Im Falle einer Mikrobrücke ergibt sich bei Überschreiten von I max CP nicht die in Abb. X.3 dargestellte Tunnelcharakteristik, sondern die I–UKennlinie zeigt dann quasi-ohmsches Verhalten mit einem endlichen Strom auch bei kleinen Spannungen U > 0. Der Maximalstrom I max CP ist nach (X.7 a) so lange stabil, wie sich die Phasenverschiebung (u2 u1 ) zeitlich nicht ändert. Nach (X.7 b) ist dies gegeben, solange keine Spannung U über der Diode abfällt. Beim Zusammenbrechen des Stromes I max CP , d. h. dem Aufbau einer Spannung U, beginnt die Phasenverschiebung zwischen den beiden Zuständen der Supraleiter mit der Zeit t anzuwachsen. Integration von (X.7 b) ergibt mit q = –2 e 1 u1 2eUt Duinit :
X:8 h Dies eingesetzt in (X.7 a) liefert einen Wechselstrom I& CP in der Tunneldiode, der dem Gleichstrom resultierend aus Einelektronen-Tunneln überlagert ist
u2
1 ICP n_ c1 2Tnc sin
xCP t Duinit ; h mit
X:9 a
1 xCP 2eU :
X:9 b h Bei einem typischen Spannungsabfall von etwa 1 mV über der Tunneldiode ergibt (X.9 b) eine Kreisfrequenz xCP für diesen Josephson-Wechselstrom von etwa 3´1012 s–1, d. h. Schwingungen im Bereich von Infrarotlicht-Frequenzen. Josephson-Tunneln von Cooper-Paaren im Zusammenhang mit Magnetfeldern ermöglicht Experimente, die die hohe Kohärenz des supraleitenden Zustands ähnlich wie bei der Interferenz von kohärentem Licht zeigen. Die experimentelle Realisierung der Experimente beruht darauf, dass ein hochkohärenter Suprastrom auf zwei Wege aufgeteilt wird (Abb. X.4), die Josephson-Tunneldioden (a und b ) enthalten. Vereinigung der beiden Stromwege dahinter führt zu einem geschlosse-
359
Y
DujYX
Y 2e ru ds A ds : h X
Abb. X.4. Schema zweier parallel geschalteter Cooper-PaarTunnelbarrieren a und b, durch die die Supraleiter I und II schwach aneinander gekoppelt sind. Die Phasendifferenz zwischen den Gesamt-Cooper-Paar-Wellenfunktionen in I und II, d. h. über dem Ring, kann durch den den Ring durchdringenden magnetischen Fluss (Flussdichte B ) gesteuert werden. Die im Suprastrom (I nach II) gemessenen Oszillationen (Interferenzen) können zur Messung schwacher Magnetfelder benutzt werden (Superconducting Quantum Interferometer Device, SQUID)
nen Umlauf im Suprastromkreis, der nur durch die Tunnelbarriere a und b getrennt ist. An diesen Stellen erfährt gemäß (X.8) die Gesamtwellenfunktion des supraleitenden Zustandes im Bereich I einen Phasensprung gegenüber der im Bereich II. Ohne ein die supraleitende Schleife in Abb. X.4 durchdringendes Magnetfeld (B = 0) seien diese Phasensprünge da bzw. db, d. h. nach (X.7 a bzw. X.9 a) sind die Ströme über die Tunnelbarrieren a und b darstellbar als Ia I0 sin da ;
X:10 a
Ib I0 sin db :
X:10 b
Bei eingeschaltetem Magnetfeld B hingegen bestimmt dieses, bzw. sein Vektorpotential A, auch die Phasendifferenz in den beiden Supraleitern. Dies sieht man leicht, wenn man in der Gleichung für den Suprastrom (10.97) eine Linienintegration längs eines Weges zwischen zwei Punkten X und Y durchführt, der tief im Innern des Supraleiters liegt, d. h. wo js = 0 ist. In diesem Fall gilt für die durch ein magnetisches Vektorpotential A erzeugte Phasendifferenz (Abschn. 9.9):
X:11
X
Damit ergeben sich die Gesamtphasenänderungen der supraleitenden Zustandsfunktion von I nach II auf den beiden Wegen über a bzw. b zu
2e II DujI da A ds ;
X:12 a h a
2e DujIII db A ds :
X:12 b h b
Wegen der Eindeutigkeit der Zustandsfunktion an einem Punkt müssen die beiden Phasensprünge identisch sein und Subtraktion ergibt
2e 2e A ds B df :
X:13 db da h h Hierbei ergeben die in verschiedenem Sinn durchlaufenen Linienintegrale in (X.12) ein Integral über einen geschlossenen Umlauf und schließlich den magnetischen Fluss B·df durch den Ring. Die gesamte Phasendifferenz über dem Ring kann also durch den magnetischen Fluss gesteuert werden. Die Situation ist ähnlich der, dass zwei kohärente Lichtstrahlen (über Wege a und b ) zur Interferenz gebracht werden und ihre relative Phase zueinander durch Verändern der Wegdifferenz gesteuert wird. Das zu erwartende Interferenzphänomen der Supraströme wird offensichtlich, wenn wir den Gesamtstrom I betrachten, der sich aus der Summe der Ströme Ia und Ib unter Berücksichtigung des Magnetfeldes ergibt. Mit der aus (X.13) folgenden willkürlichen Definition von d0 (abhängig von der Natur der Tunnelbarrieren und der anliegenden Spannung) durch
e B df ;
X:14 a da d0 h
e db d0 B df
X:14 b h folgt für den Gesamtstrom
Tafel X
Tafel X Cooper-Paar-Tunneln – Josephson-Effekte
Tafel X Cooper-Paar-Tunneln – Josephson-Effekte
Tafel X
360
Abb. X.5. Auftragung des Cooper-Paar-Tunnelstromes durch eine Parallelschaltung von zwei Josephson-Tunnelbarrieren gegen die den Ring durchdringende Magnetflussdichte B (Schaltung nach Abb. X.4). (Nach Jaklevic et al. [X.3])
e I I0 sin d0 B df h
e B df ; sin d0 h
e I 2I0 sin d0 cos B df : h
X:15
Der Suprastrom durch die Parallelschaltung zweier Josephson-Tunnelbarrieren variiert also mit dem durch die supraleitende Schleife dringenden magnetischen Fluss wie der Cosinus des Flusses (X.15). Maxima des Stromes werden erreicht für
ph h N ; N 1; 2; 3 . . . ; (X.16) B df N e 2e
d. h. jeweils wenn ein magnetisches Flussquant (10.101) umschlossen wird. Abbildung X.5 zeigt den experimentell ermittelten Strom durch ein Paar von Josephson-Kontakten in Abhängigkeit vom Magnetfeld zwischen den beiden Kontakten. Die Oszillationen zeigen jeweils ein Flussquant an, sie resultieren aus dem Cosinus-Interferenzterm in (X.15). Anwendungen der hier diskutierten JosephsonEffekte sind naheliegend. Die beiden stabilen Zustände eines Josephson-Kontaktes (ICP j 0 bei U = 0) und Einelektron-Tunnelstrom bei U j 0, Abb. X.3) erlauben den Aufbau von binären Schaltelementen in der Mikroelektronik, z. B. in Rechnerspeichern. Diese Bauelemente sind extrem schnell, müssen jedoch gekühlt werden. Die Möglichkeit der Interferenz zweier Cooper-PaarTunnelströme in zwei parallel geschalteten Josephson-Kontakten (Abb. X.4) hat zum Bau von extrem empfindlichen Magnetometern, sog. SQUID’s (Superconducting Quantum Interferometer Devices), geführt. Selbst Magnetfelder, die mit Hirnströmen verbunden sind, können nachgewiesen werden.
Literatur X.1 B. D. Josephson: Phys. Lett. 1, 251 (1962) X.2 D. N. Langenberg, D. J. Scalapino, B. N. Taylor: Proc. IEEE 54, 560 (1966) X.3 R. C. Jaklevic, J. Lambe, J. E. Mercereau, A. H. Silver: Phys. Rev. 140, A 1628 (1965)
11. Dielektrische Eigenschaften der Materie
Zur Beschreibung der Wechselwirkung elektromagnetischer Strahlung mit dem Festkörper kann man sich, je nach den Erfordernissen, eines mikroskopischen oder makroskopischen Bildes bedienen. Im mikroskopischen Bild würde man z. B. von der Absorption eines Photons durch Erzeugung eines Phonons oder eines ElektronLoch-Paares sprechen. Makroskopisch ist dagegen das Bild der Maxwellschen Theorie, in der der Festkörper durch Materialkonstanten beschrieben wird. Die Verknüpfung beider Beschreibungsweisen wird in diesem Kapitel hergestellt, wobei die Darstellung auf lineare Phänomene beschränkt ist.
11.1 Die dielektrische Funktion Eine spezielle Art der Wechselwirkung eines elektrischen Feldes mit dem Festkörper besteht darin, dass das Feld „quasi-freie“ elektrische Ladungen zum Fließen bringt. Der einfachste Fall eines solchen Transportvorganges, d. h. das Fließen eines Ohmschen Stromes im Metall, wurde in Kap. 9 behandelt. Phänomenologisch führt die Beschreibung auf die Angabe einer materialspezifischen elektrischen Leitfähigkeit r. Eine andere Art der Wechselwirkung des Festkörpers mit elektromagnetischen Feldern besteht darin, dass lokalisierte Ladungen (z. B. stärker gebundene Valenzelektronen im Feld der positiven Kernladung) Dipolmomente ausbilden können. Dem trägt schon die klassische Schreibweise der makroskopischen Maxwell-Gleichungen Rechnung, indem zwei Terme als Ursache von rot H auftreten: rot E
B_ ;
rot H j D_ :
11:1 a
11:1 b
Im Rahmen der Gültigkeit des Ohmschen Gesetzes (Kap. 9) gilt hierbei für Materialien, in denen quasifreie Ladungsträger, d. h. Elektronen oder Löcher, in partiell gefüllten Bändern auftreten: j rE :
11:2
Alle in (11.1) auftretenden Feldgrößen sind i. a. zeitabhängige Größen. Eine Zerlegung nach Frequenzen wird durch die Fourier-Darstellung gewonnen, d. h. für die elektrische Feldstärke E und die dielektrische Verschiebung D gilt:
362
E
t
11. Dielektrische Eigenschaften der Materie 1
E
xe
i xt
D
xe
i xt
dx ;
11:3
1 1
D
t
dx :
11:4
1
Da E (t) und D (t) reelle Funktionen sind, ist
E
x E
x
bzw:
D
x D
x :
11:5
Die Fourier-Koeffizienten D (x) und E (x) sind durch eine frequenzabhängige Dielektrizitätskonstante e0 e (x) verknüpft. Genau wie r ist e (x) im allgemeinen Fall ein Tensor zweiter Stufe, der für isotrope Medien und kubische Kristalle einfach als Skalar darstellbar ist, d. h. D
x e0 e
x E
x :
11:6
In ähnlicher Weise wie wir die Eigenschaften des Festkörpers, die mit r zusammenhängen, als Leitfähigkeitsphänomene bezeichnen, wollen wir die Eigenschaften, die durch die Angabe der Dielektrizitätskonstanten e beschrieben werden, als dielektrische Eigenschaften bezeichnen. Das vorliegende Kapitel behandelt also im wesentlichen atomistische Vorgänge, die die spektrale Abhängigkeit e (x) bestimmen. Formal lassen sich in Wechselfeldern die einen auf die anderen Eigenschaften umschreiben, denn für harmonische Felder (11.3, 11.4) wird aus (11.1 b) rot H
x r E
x
i x e0 e
x E
x :
11:7
Wir können eine frequenzabhängige, verallgemeinerte Leitfähigkeit ~r r
i x e0 e
11:8
definieren, die die dielektrischen Effekte noch mitberücksichtigt. Andererseits lässt sich auch (11.7) auffassen als rot H
x
i e0~e
xx E
x
i x D
x ;
11:9
wobei dann die verallgemeinerte Dielektrizitätskonstante [vgl. (11.9) mit (11.7)] ~e
x e
x i r=e0 x
11:10
Leitfähigkeitsphänomene über den r-Term mitberücksichtigt. Dies wird z. B. explizit im Abschn. 11.9 für das freie Elektronengas im Metall durchgeführt. Der wechselseitigen Austauschbarkeit einer Beschreibung des dielektrischen Verhaltens durch (11.8) oder (11.10) liegt der physikalische Sachverhalt zugrunde, dass sich der Unterschied in der Bewegung von freien und gebundenen Ladungsträgern in Wechselfeldern (x j 0 verwischt. In beiden Fällen ha-
11.1 Die dielektrische Funktion
363
ben wir es mit periodischen Bewegungen zu tun. In einem Gleichfeld (x = 0) ist das Verhalten von freien und gebundenen Ladungsträgern natürlich verschieden, und hier tritt der wesentliche Unterschied von r und e zutage. Wenn wir neben der Zeitabhängigkeit auch noch eine Ortsabhängigkeit von E und D zulassen, so tritt an die Stelle der Fourier-Zerlegung (11.3) bzw. (11.4) eine Zerlegung nach ebenen Wellen. Die dielektrische Funktion e hängt dann von x und dem Wellenzahlvektor k ab. Wir wollen in diesem Kapitel stets nur solche Ortsabhängigkeiten von E und D zulassen, bei denen die Veränderungen von Elementarzelle zu Elementarzelle klein sind. Diese Näherung gilt für die Wechselwirkung mit Licht bis weit in das Ultraviolette hinein, aber natürlich nicht für Röntgenlicht. In der Fourier-Zerlegung treten dann nur lange Wellen auf, d. h. Wellen, für die k G ist. Eine Abhängigkeit der dielektrischen Funktion vom Wellenzahlvektor k braucht dann nicht berücksichtigt zu werden. Die Schreibweise von (11.6) entspricht dem S.I. Maßsystem mit e0 als der Dielektrizitätskonstanten des Vakuums. e (x) ist dann eine i. a. komplexe Funktion ohne Dimension. Sie ist im ganzen Intervall –? < x < ? definiert. Wegen (11.5, 11.6) ist allerdings auch e
x e
x :
11:11 Anstelle der dielektrischen Verschiebung kann man auch die Polarisation P betrachten und eine dielektrische Suszeptibilität v
x e
x
1
11:12
einführen. Die komplexe Funktion v (x) ist analytisch und hat ihre Pole alle in der negativ-imaginären Halbebene (siehe Übung 11.1). Wählt man den in Abb. 11.1 gezeichneten Integrationsweg, so verschwindet das Integral v
x0 dx0 0 :
11:13 x0 x Für sehr große x geht v (x) gegen Null, da die Polarisation dem Feld nicht mehr zu folgen vermag. Zieht man deshalb in der komplexen Ebene den Halbkreis auseinander, so verbleiben nur der
Abb. 11.1. Integrationswege in der komplexen x-Ebene
364
11. Dielektrische Eigenschaften der Materie
Beitrag auf der reellen Achse und das Integral um die Polstelle und man erhält
v
x0 dx0 0 :
11:14 i p v
x P x0 x Hierbei bedeutet P den Hauptwert des Integrals. Zerlegt man e (x) in Real- und Imaginärteil e
x e1
x i e2
x ; so wird aus (11.14) das Gleichungspaar 1
1 e2
x0 dx0 ; e1
x 1 P p x0 x
11:15
11:16
1
e2
x
1 P p
1
1
e1
x0 1 0 dx : x0 x
11:17
Dies sind die sog. Kramers-Kronig-Relationen, die Real- und Imaginärteil der dielektrischen Funktion miteinander verknüpfen. Sie lassen sich verwenden, um aus einer (genauen) Messung des Real- oder Imaginärteils von e (x) in einem weiten Spektralbereich den jeweils anderen Teil der dielektrischen Funktion zu berechnen. Restwerte der Integrale für sehr hohe und sehr niedrige Frequenzen lassen sich meist durch Näherungslösungen für e (x) abschätzen.
11.2 Absorption elektromagnetischer Strahlung Wir wollen die Absorption elektromagnetischer Wellen beim Durchgang durch eine dielektrische Schicht betrachten. Auf diese Weise stellen wir eine Beziehung zwischen den dielektrischen Eigenschaften und einem typischen Absorptionsexperiment her. Die elektromagnetische Welle in einem Dielektrikum werde beschrieben durch ein elektrisches Feld
E E0 e
~ i x
t nx=c
mit der komplexen Brechzahl p ~ n
x n ij e
x ; n2
j2 e1 ;
2 n j e2 :
11:18
11:19
11:20
11:21
Die Vorzeichen des Exponenten in der Fourier-Zerlegung (11.3) und in der Zerlegung von e (x) und ñ (x) sind hier so gewählt, dass e2 und j positive Vorzeichen haben und die Welle beim Fortschreiten in +xRichtung abklingt. Hätten wir die Fourier-Zerlegung mit positiven
11.2 Absorption elektromagnetischer Strahlung
365
Abb. 11.2. Strahlengang beim Durchgang durch eine planparallele Platte
Exponenten eingeführt, so hätte die Brechzahl nach ñ = n–i j mit j > 0 zerlegt werden müssen. Beide Darstellungen sind üblich. Beim Durchgang durch eine planparallele Platte (Abb. 11.2) wird an jeder Grenzschicht ein Teil der elektromagnetischen Welle reflektiert und transmittiert. Für den hier interessierenden Spezialfall senkrechter Inzidenz sind die Transmissions- bzw. Reflexionskoeffizienten für die Amplitude von E : n~ 1 2 2n~ : ; T2 ; R2 n~ 1 n~ 1 n~ 1 Damit wird die Feldstärke im transmittierten Strahl
T1
E
E 0 T1 T2 ei
~nx=cd
1 R22 e2i
~nx=cd . . . ;
E
E 0 T1 T2
ei
~nx=cd : R22 e2i
~nx=cd
1
11:22
(11.23)
Wir diskutieren zwei Grenzfälle. Der erste soll darin bestehen, dass n nur wenig von 1 verschieden ist, wir es also mit einem optisch dünnen Medium zu tun haben: n~ 1 D ;
jDj 1 :
11:24
Dann ist in linearer Näherung T1 T2 * 1 und R 22 * 0, und wir erhalten
E E 0 ei
~nx=cd
11:25
und für die transmittierte Intensität
E E / I I0 e
2jx=cd
11:26
Wegen jDj 1 ist 2 j*e2 I I0 e
e2 x=cd
:
11:27
Für optisch dichte Medien kann (11.23) genähert werden für den Fall der Durchstrahlung einer genügend dünnen Schicht:
366
11. Dielektrische Eigenschaften der Materie
Abb. 11.3. Infrarot-Absorptionsspektrum für 1,2-trans-Dichlorethen [11.1]. Bei nicht zu starker Absorption entsprechen die Absorptionskurven dem spektralen Verlauf von x·e2 (x) an den Eigenresonanzen des Moleküls
nx ~ d 1 : c
11:28
Nach Einsetzen von (11.28) in (11.23) erhält man nach einiger Zwischenrechnung in linearer Näherung e2 x d... :
11:29 I I0 1 c Die Größe xe2
x
11:30 c wird auch Absorptionskonstante genannt. Sie bestimmt den spektralen Verlauf der absorbierten Intensität und enthält als frequenzabhängigen Faktor im wesentlichen den Imaginärteil von e (x). Abbildung 11.3 zeigt ein typisches Absorptionsspektrum für Dichlorethen [11.1]. Die Absorptionsmaxima entsprechen Maxima in e2 (x) bei den Frequenzen der Eigenschwingungen von Dichlorethen. In den folgenden Kapiteln sollen nun die spektralen Eigenschaften der dielektrischen Funktion mit den atomistischen Eigenschaften des Systems verknüpft werden. Die Gln. (11.27) bzw. (11.29) stellen eine besonders einfache Verknüpfung von Experiment und dielektrischen Eigenschaften des Systems dar. Im Prinzip ist natürlich auch die spektrale Abhängigkeit des Reflexionsvermögens eines Festkörpers durch e (x) bestimmt. Die mathematischen Zusammenhänge sind hier aber komplizierter, da in das Reflexionsvermögen e1 und e2 eingehen. Eine Berechnung von e1 und e2 aus dem Reflexionsvermögen ist deshalb nicht möglich, es sei denn, man kennt den Verlauf im ganzen Spektralbereich und kann die Kramers-Kronig-Relationen (11.16 und 11.17) verwenden. K
x
11.3 Die dielektrische Funktion für harmonische Oszillatoren
367
11.3 Die dielektrische Funktion für harmonische Oszillatoren Wir wollen die dielektrischen Eigenschaften von einem harmonischen Oszillator studieren, bei dem die Auslenkung u aus der Gleichgewichtslage zu einem Dipolmoment p eu
11:31
führt. Man bezeichnet e als die effektive Ionenladung, die nicht notwendigerweise gleich der Ladung ist, die das statische Dipolmoment des Oszillators ausmacht. Ein solches Dipolmoment tritt z. B. auf, wenn man die aus positiven und negativen Ionen gebildeten Untergitter eines Ionenkristalls (z. B. CsCl, s. Abb. 1.6) gegeneinander verschiebt, also beim transversal und longitudinal optischen Phonon bei q = 0. Ein anderes Beispiel sind Eigenschwingungen von Molekülen, soweit sie ein Dipolmoment haben. Die Bewegungsgleichung für den Oszillator mit äußerem Feld E lautet dann u cu_
x20 u
e E : l
11:32
Außerdem gilt für die Polarisation P : N N e u e0 E :
11:33 V V Dabei ist l die reduzierte Masse, N/V die Anzahldichte, die elektronische Polarisierbarkeit und c eine Dämpfungskonstante, die die endliche Lebensdauer der Eigenschwingung beschreiben soll. Streng genommen muss an Stelle des äußeren Feldes E das lokale Feld E loc genommen werden. Dies ist vom äußeren Feld deshalb verschieden, weil die vom Feld erzeugten Dipole ihrerseits einen Feldbeitrag liefern, der zu einer Verstärkung des äußeren Feldes führt (s. Abschn. 11.7). Dies ist besonders bei dichten Medien, also Festkörpern und Flüssigkeiten nicht zu vernachlässigen. Allerdings wird der prinzipielle spektrale Verlauf von e (x) hiervon nicht berührt, weshalb wir die Feldverstärkung zunächst außer acht lassen wollen. Gehen wir in (11.32, 11.33) zur Fourier-Darstellung über, so erhalten wir P
u
x
x20 P
x
x2
i c x
e E
x ; l
N N e u
x e0 E
x : V V
11:34
11:35
Dabei ist die elektronische Polarisierbarkeit im Bereich der Eigenschwingungen des Gitters frequenzunabhängig. Aus (11.34, 11.35) ergibt sich für e (x)
368
11. Dielektrische Eigenschaften der Materie
e
x 1
N 2 V x0
N e2 V e0 l : x2 i c x
11:36
Führen wir die statische Dielektrizitätskonstante est = e (x = 0) und den hochfrequenten Grenzwert e? ein, so erhält man für e (x) die Form e
x e1
x20
est e1 : x20 x2 i c x
11:37
Die Dämpfungskonstante c ist positiv. Andernfalls hätte die Dämpfungskraft in (11.32) das gleiche Vorzeichen wie die Bewegungsrichtung, was zu einem zeitlichen Anstieg der Amplitude führen würde. Durch das Vorzeichen von c ist dafür gesorgt, dass e (x) keine Pole in der positiv imaginären Halbebene aufweist, wovon wir bei der Herleitung der Kramers-Kronig-Relationen schon Gebrauch gemacht hatten (siehe Übung 11.1). Es sei nochmals erwähnt, dass alle Aussagen über Vorzeichen von den gewählten Vorzeichen in der Fourier-Darstellung (11.3) abhängen! Für die weitere Diskussion zerlegen wir e (x) nach Real- und Imaginärteil e1
x e1 e2
x
est
x20
est
x20
e1 x20
x20
x2
x2 2 c2 x2
e1 x20 cx x2 2 c2 x2
;
11:38
:
11:39
ε(ω) !
Der Verlauf von e1 und e2 ist in Abb. 11.4 dargestellt. e2 hat die Form einer gedämpften Resonanzkurve mit der Halbwertsbreite c. Für den praktisch bedeutsamen Fall kleiner Dämpfung c x0 kann noch eine bequeme Näherungsformel für e (x) angegeben werden. Mathematisch gilt die Identität
ε2(ω) γ
ε1(ω)
εst 0
Abb. 11.4. Spektraler Verlauf von e1 (x) und e2 (x) für einen Dipoloszillator
ε∞ ω0
Frequenz ω
ωL
!
11.3 Die dielektrische Funktion für harmonische Oszillatoren
lim
c!0
1 z
ic
P
1 i p d
z : z
369
11:40
Wir wenden dies auf die beiden Pole x = x0 und x = –x0 in (11.37) an und erhalten e
x e1
x20
est e1 p i x0
est e1 d
x x0 2 2 2 x0 x
d
xx0 :
11:41
Man kann sich überzeugen, dass auch diese spezielle Form von e (x) die Kramers-Kronig-Relationen erfüllt, wenn e? = 1 ist und damit die Funktion e (x)–1 für x ? ? verschwindet. Mit dieser Näherung lässt sich die über den Bereich einer Absorptionsbande (s. Abb. 11.3) integrierte Absorption leicht ausrechnen. Für optisch dünne Medien (E loc E ) gilt:
I0 x2 dx d K
xdx pd 0
est e1 :
11:42 ln I
x c Wegen (11.36) ist dies gleich 1
K
xdx 1
N p e2 : v e0 c l
11:43
Für die Anwendung in der Spektroskopie muss berücksichtigt werden, dass in der Regel die Oszillatoren nicht parallel zum E -Feld ausgerichtet sind, sondern im Mittel nur ein Drittel. Integriert man ferner nur über positive Frequenzen, so erhält man 1
1 N p f 2 e2
11:44 K
xdx 6 V e0 c l 0
mit f 2 e 2 = e 2. Der Faktor f gibt das Verhältnis der Oszillatorladung zur Elementarladung e an. In der Spektroskopie wird anstelle der Frequenz häufig die Wellenzahl 1/k benutzt. Dann wird aus (11.43)
1 1 1 N f 2 e2
11:45 K d k k 12e0 c2 V l Dies ist die quantitative Formulierung des Beerschen Gesetzes. Die integrierte Absorption ist also proportional der Anzahldichte der Oszillatoren.
370
11. Dielektrische Eigenschaften der Materie
11.4 Longitudinale und transversale Eigenschwingungen In diesem Abschnitt wollen wir die longitudinalen und transversalen Eigenschwingungen der Polarisation in einem Dielektrikum mit einer Resonanzstelle bei x0, jedoch ohne Dämpfung betrachten. Anstelle der Polarisation P können wir bei einem System von Oszillatoren natürlich auch die Auslenkung u betrachten. Wenn die Laufrichtungen der Wellen mit der positiven x-Richtung angesetzt werden, so stellt Px Px0 e
11:46
i
xt qx
eine longitudinale Welle dar und Py Py0 e
11:47
i
xt qx
eine transversale Welle. Die longitudinale Welle erfüllt also die Bedingungen j 0; rot PL 0 div PL
11:48
während für die transversalen Wellen j 0 div PT 0 rot PT
11:49
gilt. Wir können (11.48 u. 11.49) auch als verallgemeinerte Definition von Longitudinal- und Transversalwellen auffassen. Wir wollen zunächst die longitudinalen Wellen näher betrachten. In einem Dielektrikum ohne Ladungsträger oder anderweitige Raumladung R muss die Divergenz der dielektrischen Verschiebung verschwinden: div D R 0 e0 e
x div E e
x
div P : e
x 1
11:50
Daraus folgt wegen (11.48), dass eine longitudinale Welle als Eigenlösung für die Frequenz existiert, für die e
xL 0
11:51
ist. Ferner ist
EL
1 PL : e0
11:52
Der Feld- und der Polarisationsvektor sind also gerade um 180 ° phasenverschoben. Solche Longitudinalwellen können nicht mit der transversalen Lichtwelle wechselwirken, wohl aber mit Elektronen (s. Abschn. 11.12). Die Eigenlösungen für transversale Wellen müssen im Zusammenhang mit dem vollständigen Satz der Maxwellschen Gleichungen gefunden werden, da sie mit elektromagnetischen Wellen (rot E j 0 ) koppeln
11.4 Longitudinale und transversale Eigenschwingungen
rot E
l0 H_ ;
l 1 ;
rot H D_ :
371
11:53
11:54
Mit einem Wellenansatz gemäß (11.47) erhalten wir nach Ersetzen von E und D durch P mittels der Dielektrizitätskonstanten q Py0 x
xe0 l0 e
x
1Hz0 0 ;
e
x Py0 q Hz0 0 : e
x 1
11:55
11:56
Das Gleichungssystem hat Eigenlösungen für solche Frequenzen x, für die die Determinante verschwindet: x2
1 2 2 cq : e
x
11:57
Diese Eigenlösungen stellen eine Kopplung von elektromagnetischen und mechanischen Wellen dar. Sie tragen die Bezeichnung Polaritonen. Der Verlauf der Polariton-Dispersionsbeziehung (11.57) hängt von der Gestalt von e (x) ab. Wir wollen die Dispersionsbeziehung für den Fall der Ionenstrukturen bzw. für ein System harmonischer Oszillatoren mit der Eigenfrequenz x0 näher diskutieren. Wir setzen also in (11.57) den Ausdruck für e (x) nach (11.37) ohne Dämpfung ein. Es ergeben sich die in Abb. 11.5 gezeichneten Lösungen, die alle transversalen Charakter haben. Für große q strebt der untere Zweig gegen den Grenzwert x0, d. h. die Eigenfrequenz des harmonischen Oszillators entspricht der Frequenz der transversalen Welle für große q und wird deshalb im folgenden xT genannt. Wegen des großen Wertes der Lichtgeschwindigkeit wird allerdings der Wert xT schon in guter Näherung für solche q-Werte erreicht, die immer noch sehr klein (10–4 G) gegen einen reziproken
Abb. 11.5. Dispersionskurven für ein Phonon-Polariton. Der gezeichnete Bereich der q-Werte ist klein gegenüber einem reziproken Gittervektor. Die Gitterdispersion kann deshalb vernachlässigt werden
372
11. Dielektrische Eigenschaften der Materie
Gittervektor G sind (Abb. 11.5). Wäre die Lichtgeschwindigkeit unendlich, so ergäbe sich nur xT als Lösung. Die Dispersion entsteht also durch die verzögernde Wirkung der endlichen Signalgeschwindigkeit elektromagnetischer Wellen. Die Lösung xT = x0 heißt deshalb auch die „unretardierte“ Lösung. Zwischen xT und xL hat (11.57) keine Lösung, aber ein zweiter Zweig existiert für x = xL. Die in Abb. 11.5 gezeigten Phonon-Polaritonen sind Eigenlösungen des Dielektrikums. Sie lassen sich durch Raman-Streuung beobachten (Tafel III). Die korrekte Interpretation eines Absorptionsexperimentes setzt dagegen die Berücksichtigung der Maxwellschen Gleichungen im Innen- und Außenraum und der Grenzbedingungen voraus. Die Grenzbedingungen haben zur Folge, dass sich auch andersartige Polaritonen (siehe auch Abschn. 11.5 und Tafel XIII) als die bisher betrachteten ergeben. Das Problem der Absorption einer dünnen Schicht wurde bereits ohne explizite Berechnung der Eigenlösungen in Abschn. 11.2 gelöst. Dort wurde gezeigt, dass die Absorption einer dünnen Schicht im wesentlichen durch den Verlauf von e2 (x) bestimmt ist. Das Maximum der Absorption liegt dann also bei der Frequenz xT der transversal optischen Phononen. Wir hatten gesehen, dass für nicht zu kleine q-Werte die Frequenz der transversalen Welle gleich der Resonanzfrequenz x0 ist, während die Frequenz der longitudinalen Welle durch die Nullstelle von e1 (x) gegeben ist. Unter Benutzung von (11.37) (c x0) erhalten wir daraus eine wichtige Beziehung x2L est x2T e1
(Lyddane-Sachs-Teller-Relation) ;
11:58
die die Aufspaltung der Frequenz zwischen longitudinaler und transversaler Welle angibt. Die physikalische Ursache für die Verschiebung der longitudinalen Frequenz zu höheren Werten ist die Verstärkung der wirksamen Federkonstante durch das die Longitudinalwellen begleitende Feld (11.52). Ein Kristall, der zwar optische Phononendispersionszweige besitzt (mehr als ein Atom pro Elementarzelle), jedoch wegen des Fehlens einer dynamischen effektiven Ionenladung nicht infrarot-aktiv ist, muss also bei q = 0 eine Entartung der Frequenzen xL und xT aufweisen. Dies ist z. B. für Silizium der Fall (Abb. 4.4).
11.5 Oberflächenwellen eines Dielektrikums Im letzten Abschnitt hatten wir Eigenschwingungen mit Wellencharakter in einem unendlich ausgedehnten Gitter kennengelernt. Wir wollen als Modell für einen endlichen Festkörper den dielektrischen Halbraum betrachten, dessen Begrenzungsfläche die x, yEbene sei. Zusätzlich zu den Volumenwellen gibt es dann spezielle Eigenschwingungen, die bezüglich der x, y-Koordinate Wellencha-
11.5 Oberflächenwellen eines Dielektrikums
373
Abb. 11.6. Feldlinienbild einer Oberflächenwelle an der ebenen Oberfläche eines Dielektrikums
rakter haben, jedoch senkrecht zur Grenzfläche exponentiell abklingen. Wir wollen zur Vereinfachung nur die unretardierten Lösungen suchen, die man formal durch c ? ? erhält. Dann ist also stets rot E 0 :
11:59
Da wir nicht wieder die schon bekannten longitudinalen Volumenlösungen erhalten wollen, setzen wir abweichend von (11.48) auch div E 0 ;
z j 0:
fur
11:60
Die beiden Bedingungen (11.59 u. 11.60) sind erfüllt, wenn sich E als Gradient eines Potentials u schreiben lässt, für das die LaplaceGleichung gilt Du 0 ;
fur
z j 0:
11:61
Offenbar wird die Laplace-Gleichung im Außen- und Innenraum durch Oberflächenwellen der Form u u0 e
qjzj i
qx xt
e
11:62
erfüllt. Das zugehörige Feldlinienbild ist in Abb. 11.6 gezeichnet. Im Innern des Dielektrikums (z < 0) ist das Feld mit einer Polarisation verknüpft. Für die Existenz der Lösung muss (11.62) zusätzlich noch die Randbedingung der Stetigkeit der Normalkomponente der dielektrischen Verschiebung erfüllen. @u @u Dz e0 e
x e0
11:63 @z z 5 0 @z z = 0 : Daraus folgt, dass e
x
1
11:64
sein muss. Die Frequenz der Oberflächenwelle liegt also unterhalb der longitudinalen Frequenz xL (Abb. 11.4). Für den harmonischen Oszillator und für Ionengitter ergibt sich est 1 1=2 xS xT :
11:65 e1 1
374
11. Dielektrische Eigenschaften der Materie
Abb. 11.7. Infrarot-Absorptionsspektrum eines dünnen NaCl-Films und von kleinen NaCl-Würfeln von 10 lm Kantenlänge nach Martin [11.3]. Die dünne Schicht absorbiert bei xT = 175 cm–1 (vgl. (11.30, 11.41)). Die zusätzliche Absorption bei 220 cm–1 wird durch ZweiPhononen-Prozesse verursacht. Das Maximum der Absorption bei kleinen Teilchen ist deutlich zu höheren Frequenzen verschoben
Auch für andere Geometrien als den Halbraum (kleine Kugeln, Ellipsoide, dünne Schichten) lassen sich Oberflächenwellen berechnen. Ihre Frequenz liegt immer zwischen xT und xL. Bei Teilchen, deren Abmessungen klein gegen die Wellenlänge sind, macht sich die Existenz von Oberflächenwellen durch eine Lichtabsorption bemerkbar (Abb. 11.7). Die hier berechnete Oberflächenwelle der Ebene ist eine nichtstrahlende Lösung an der Grenzfläche, koppelt also im Fall des dielektrischen Halbraums nicht mit dem Lichtfeld. Eine genaue Diskussion unter Berücksichtigung der Retardierung zeigt, dass die Oberflächenwellen nur für q-Werte rechts der Lichtgeraden existieren. Eine Beobachtung der Oberflächenwelle ermöglicht die Methode der „frustrierten“ Totalreflexion (Tafel XIII). Auch geladene Teilchen (Elektronen) wechselwirken mit den Oberflächenwellen des Dielektrikums (s. Abschn. 11.12).
11.6 Das Reflexionsvermögen des dielektrischen Halbraums Während die Absorption bei Durchstrahlung einer genügend dünnen Schicht nur vom Imaginärteil von e (x) bestimmt wird, gehen in das Reflexionsvermögen sowohl Real- als auch Imaginärteil ein. Der Intensitätsreflexionskoeffizient ist – vgl. auch (11.22) – R
n
12 j2
n 12 j2
:
11:66
Wir wollen den Verlauf des Reflexionskoeffizienten mit der Frequenz für das Ionengitter diskutieren und betrachten dazu zur Vereinfachung zunächst den Fall kleiner Dämpfung. Dann ist für x < xT e (x) reell, und das Reflexionsvermögen steigt mit Annäherung an den Wert xT an bis auf den Grenzwert R = 1 (Abb. 11.8).
11.7 Das lokale Feld
375
Abb. 11.8. Reflexionsvermögen im ungedämpften Fall (theoretisch). Die gestrichelte Linie gibt den experimentell ermittelten Verlauf für einen realen Ionenkristall (InAs) an. (Nach Haas u. Henri [11.4])
Zwischen xT und xL ist e1 reell aber negativ. Deswegen ist der Realteil n der komplexen Brechzahl Null (vgl. (11.19)). Das Reflexionsvermögen bleibt also 1. Oberhalb von xL wird eL > 0. Das Reflexionsvermögen fällt deshalb ab und erreicht bei e1 = +1 den Wert Null. Bei höheren Frequenzen steigt es wieder auf den Grenzwert 2 1/2 2 (e1/2 ? –1) /(e? +1) . Im Bereich, wo e1 < 0 ist, kann die Welle also von außen nicht in das Dielektrikum eindringen. Diese Aussage wird etwas entschärft im Falle endlicher Dämpfung. Trotzdem bleibt das Reflexionsvermögen zwischen xT und xL hoch. Der gemessene Verlauf für das InAs-Gitter in Abb. 11.8 zeigt dieses Verhalten. Bei Vielfachreflexion an Oberflächen bleibt schließlich nur der Bereich zwischen xT und xL übrig. Daher rührt die Bezeichnung „Reststrahlen“, die zur Bezeichnung des Frequenzbandes im Bereich der Phononabsorption auch in der englischsprachigen Literatur verwendet wird.
11.7 Das lokale Feld Nur für einen einzelnen Dipol ist das am Ort des Dipols wirksame Feld gleich dem von außen angelegten. Für viele Dipol-Oszillatoren liefern die von den Nachbar-Dipolen ihrerseits erzeugten Felder einen Zusatzbeitrag, der nur im Grenzfall großer Verdünnung, also gerade nicht bei Festkörpern, vernachlässigt werden kann. Wählen wir das Feld entlang der z-Achse, so ist das lokal wirksame Feld
376
11. Dielektrische Eigenschaften der Materie
E loc E
1 X 3z2i ri2 pi : 4p e0 i ri5
11:67
Die Summe ist dabei über alle Nachbar-Dipole zu erstrecken. Ist pi das Dipolmoment pro Elementarzelle in einem Ionenkristall, so summiert i alle Nachbarzellen. Die Summe in (11.67) ist nur scheinbar kompliziert. Für eine kugelförmige Gestalt und homogene Polarisierung ist nämlich (Aufpunkt im Kugelmittelpunkt) X
pi
i
X x2 X y2 X z2 1 X r2 x2i i i i i p p p p : 5 5 5 5 3 ri5 r r r r i i i i i i i i
11:68
Die Summe in (11.67) verschwindet also in diesem Falle und das lokale Feld im Kugelmittelpunkt ist gleich dem äußeren. Leider entspricht dieser einfache Fall nicht den typisch experimentellen Bedingungen; denn für die Absorption elektromagnetischer Wellen ist die Voraussetzung homogener Polarisation nur für Kugeln mit einem Durchmesser klein gegen die Lichtwellenlänge gegeben. Aber auch bei der Beschreibung transversaler und longitudinaler Wellen ist die Kugelbetrachtung nützlich. Wir können uns nämlich aus dem Festkörper eine Kugel ausgeschnitten denken, innerhalb der die Polarisation näherungsweise homogen ist und die trotzdem noch viele Elementarzellen umfaßt. Voraussetzung ist dann lediglich, dass die Wellenlänge groß gegen die Elementarzelle ist, was für den Bereich der Wechselwirkung mit Licht zutrifft. Innerhalb der gedachten Kugel verschwindet der Beitrag zum lokalen Feld. Außerhalb der Kugel sind die Abstände zum Zentrum schon so groß, dass man mit einer kontinuierlichen Verteilung der Dipole, also mit einer makroskopischen Polarisation P, rechnen kann. Das von dieser Polarisation ausgehende Feld wird durch das Feld der Polarisationsladungen an der Oberfläche der Kugel beschrieben, deren Flächenladungsdichte gleich der Normalkomponente von P ist. RP
11:69
Pn
Die Ladung in einem Breitenring (Abb. 11.9) ist dann dq
P cos h 2p a sin h a d h
11:70
und deren Feldbeitrag im Zentrum der Kugel dE
1 dq cos h : 4p e0 a2
Das gesamte Zusatzfeld
11:71
E P wird damit
p P 1 EP cos2 h sin h dh P 2 e0 3 e0 0
und das lokale Feld
11:72
11.7 Das lokale Feld
377
Abb. 11.9. Polarisation und lokales Feld
E loc E
1 P: 3 e0
11:73
Dieses lokale Feld ist für Ionenkristalle in die Bewegungsgleichung (11.32 u. 11.33) einzusetzen. Anstelle von (11.34 u. 11.35) erhält man damit nach einer Umformung 0 1 1 N 2 e B 2 1 3 e0 V C e 1 2 C E
x u
xB x i c x x ; 0 @ A N 1 N l l 1 1 V 3 3V
11:74 N N e e0 V E
x : u
x
11:75 P
x V 1N 1N 1 1 3V 3V Die sich hieraus berechnende dielektrische Funktion e (x) hat die gleiche Gestalt wie in (11.37), nur die Verknüpfung der makroskopischen Größen xT, est und e? mit den mikroskopischen Eigenschaften des Systems x0, e ist eine andere. Betrachten wir als Beispiel den hochfrequenten Grenzfall (x xT ), so ist offenbar wegen u (x) ? 0 N V e1 1 1N 1 3V oder
11:76
378
11. Dielektrische Eigenschaften der Materie
e1 1 1 N : e1 2 3 V
11:77
Diese nach Clausius-Mossotti benannte Formel verknüpft also die Dielektrizitätskonstante e? mit der elektronischen Polarisierbarkeit.
11.8 Polarisationskatastrophe und Ferroelektrika Durch die Wirkung des lokalen Feldes vermindert sich die transversale Eigenfrequenz des Gitters – s. (11.74) – 1 N 2 e 1 3 e0 V :
11:78 x2T x20 1N l 1 3V Für genügend große effektive Ionenladung e, hohe elektronische Polarisierbarkeit bzw. relativ schwache Kopplung zu den nächsten Nachbarn (kleines x0) kann die transversale Frequenz sogar Null werden. Das mit einer Bewegung eines Ions im Gitter erzeugte lokale Feld ist dann so stark, dass die Kräfte zu den nächsten Nachbarn kleiner sind als die durch das lokale Feld hervorgerufenen Kräfte. Diese treiben das Ion weiter, bis es eine neue Gleichgewichtslage findet. Die dabei auftretenden Kräfte sind in der von uns betrachteten harmonischen Näherung nicht erfaßt. Der neue Zustand des Festkörpers ist durch Zerfallen in Kristallbereiche mit permanenter Polarisation gekennzeichnet. Dieser Effekt wird als Polarisationskatastrophe bezeichnet und der dann eintretende neue Zustand in Analogie zum ferromagnetischen Zustand als der „ferroelektrische“ (obgleich er mit Eisen nichts zu tun hat). Ferroelektrische Stoffe sind die Perowskite (z. B. BaTiO3, SrTiO3) und Hydrogenphosphate oder Arsenate (z. B. KH2PO4). Der ferroelektrische Zustand kann als ein „eingefrorenes“ Transversalphonon aufgefaßt werden. Dieses Einfrieren setzt allerdings voraus, dass die thermische Bewegung des Gitters klein ist. Mit zunehmender Temperatur werden die thermischen Fluktuationen immer größer. Dadurch wird das am Ort eines Ions wirksame Feld immer mehr verkleinert, bis schließlich oberhalb einer kritischen Temperatur Tc die rechte Seite von (11.78) positiv wird. Mit zunehmendem Abstand von der kritischen Temperatur steigt die transversale Frequenz x2T / T
Tc :
11:79
Aufgrund der Lyddane-Sachs-Teller-Relation (11.58) gilt in diesem Bereich für die statische Dielektrizitätskonstante näherungsweise est 1 / T
Tc :
11:80
11.9 Das freie Elektronengas
379
Abb. 11.10. Temperaturverlauf der permanenten Polarisation P, der reziproken statischen Dielektrizitätskonstante e –1 st und des Quadrats der transversalen Fre2 quenz x T für ein Ferroelektrikum (schematisch)
Allerdings bleibt in der Praxis die Dielektrizitätskonstante bei Annäherung an Tc endlich. Eine schematische Darstellung dieser Zusammenhänge ist in Abb. 11.10 gegeben. Wegen ihrer hohen Dielektrizitätskonstanten oberhalb des Curiepunktes haben ferroelektrische Materialien, insbesondere ferroelektrische Keramiken eine große technische Bedeutung als Dielektrika in Kondensatoren. Unterhalb des Curiepunktes haben ferroelektrische Keramiken eine große piezoelektrische Konstante (Übung 5.3). Entsprechende Keramiken mit geeignetem Curiepunkt werden als piezoelektrische Aktuatoren eingesetzt.
11.9 Das freie Elektronengas Das dielektrische Verhalten von Metallen, aber auch von Halbleitern mit höherer Elektronenkonzentration, für Frequenzen um den Bereich des sichtbaren Lichtes wird von den kollektiven Anregungen der freien Ladungsträger maßgeblich bestimmt. Die dielektrische Funktion lässt sich ähnlich wie beim Ionenkristall aus einer Bewegungsgleichung herleiten. Bezeichnen wir mit u eine homogene Verschiebung des gesamten Elektronengases gegen die Ionenrümpfe, so gilt als Bewegungsgleichung n m u c u_
neE ;
11:81
wobei n die Elektronenkonzentration und m die Elektronenmasse ist. Im Gegensatz zu (11.32) enthält (11.81) keine mechanische Rückstellkraft. Die Dämpfungskonstante c ist jetzt mit der Leitfähigkeit r verknüpft, denn für einen stationären Fluss (u 0) gilt j
e n u_
n2 e2 E c
also r j= E
n2 e2 : c
11:82
Aus (11.81) wird damit n m u
n2 e2 u_ r
neE :
11:83
380
11. Dielektrische Eigenschaften der Materie
Nach Übergang zur Fourier-Transformierten folgt daraus n2 e2 2 x u
x n e E
x : nmx i r
x
11:84
Dabei muss auch die Leitfähigkeit als eine Funktion der Frequenz betrachtet werden. Ersetzen wir die Verschiebung u (x) durch die Polarisation P
x
e n u
x ;
11:85
so folgt für die dielektrische Funktion e
x 1
x2p x2p e0 2 x x i r
x
11:86
mit x2p
n e2 : m e0
11:87
Bei schwacher Dämpfung ist xp gerade die Frequenz, wo e (x) = 0 wird. Sie bezeichnet also die Frequenz einer longitudinalen Eigenschwingung des freien Elektronengases. Diese Eigenschwingungen werden Plasmonen genannt. Eine transversale Eigenschwingung gibt es wegen der fehlenden Rückstellkraft nicht, d. h. xT ist gleich Null. Typische Werte für die Plasmon-Energien liegen zwischen 3 und 20 eV. Sie lassen sich aus der Elektronendichte (und einer angenommenen effektiven Masse der Elektronen, Abschn. 9.1) berechnen. Allerdings haben solche Berechnungen nicht viel Wert. In sehr vielen Metallen sind die longitudinalen Eigenschwingungen durch Interbandanregungen (Abschn. 11.10) so stark gedämpft, dass die Plasmonen als Anregung gar nicht mehr definierbar sind. Dort wo sie sich beobachten lassen, ist der Nulldurchgang von e1 (x) durch Interbandübergänge gegenüber dem freien Elektronen-
Abb. 11.11. Reflexionsvermögen im Modell des freien Elektronengases ( h xp = 15,2 eV, r = 3,6 ·105 X–1 cm–1) und für Aluminium (gestrichelte Linie )
11.9 Das freie Elektronengas
381
Abb. 11.12. Reflexion R und Durchlässigkeit D als Funktion der Wellenlänge für eine Sn-dotierte In2O3-Schicht. Die Schichtdicke beträgt 0,3 lm, und die Elektronenkonzentration ist 1,3 ·1021cm–3. kp gibt die Lage der Plasmawellenlänge an. (Nach Frank et al. [11.5])
gasmodell stark verschoben. Immerhin erlaubt der funktionale Verlauf von e (x), so wie er sich aus dem Modell des freien Elektronengases ergibt, eine wichtige universelle Eigenschaft der Metalle qualitativ zu verstehen, nämlich das große Reflexionsvermögen. In Abb. 11.11 ist das Reflexionsvermögen für hxp = 15,2 eV und r = r (x = 0) = 3,6´105 (X cm)–1 aufgetragen. Diese Werte gelten für Aluminium, für das das Modell des freien Elektronengases noch am ehesten zutrifft. Zum Vergleich ist die gemessene Reflexionskurve eingetragen. Der Einbruch bei 1,5 eV wird durch einen Interbandübergang verursacht. Er ist auch die Ursache für eine stärkere Dämpfung, wodurch das Reflexionsvermögen im Bereich des sichtbaren Lichtes und bei höheren Frequenzen nur etwa 90% erreicht. Eine interessante Anwendungsmöglichkeit der Modellvorstellungen des freien Elektronengases ergibt sich bei Halbleitern (s. a. Tafel III). Hier lässt sich die Konzentration freier Elektronen durch Zusätze (s. Kap. 12) in weiten Grenzen einstellen. Dadurch lässt sich die Plasmakante des Reflexionsvermögens variieren. In Abb. 11.12 ist das Reflexionsvermögen für eine dünne In2O3Schicht mit Sn-Zusatz aufgetragen. Eine solche Schicht lässt das sichtbare Licht nahezu ungehindert durch, bietet aber eine wirksame Sperre für infrarote Strahlung. Solche Beschichtungen werden in Na-Dampflampen und für Wärmeschutzfenster eingesetzt [11.5]. Die Beschreibung des Reflexionsvermögens durch das Modell des freien Elektronengases ist hier sehr gut, wenn man die 1 in (11.86) durch das tatsächliche e? im Sichtbaren ersetzt. Der Grund ist, dass In2O3 im Sichtbaren (ohne freie Ladungsträger) keine Absorption aufweist. Die Interbandübergänge beginnen erst bei *2,8 eV. Es sei darauf hingewiesen, dass bei Halbleitern neben den Plasmaschwingungen freier Elektronen auch Plasmaschwingungen der Valenzelektronen existieren. Die Anregungsenergie liegt wie bei vielen Metallen zwischen 10 und 20 eV.
382
11. Dielektrische Eigenschaften der Materie
11.10 Interband-Übergänge Die im Abschn. 11.9 behandelte kollektive Anregung des freien Elektronengases wurde in einer klassischen Weise behandelt. Dies ist auch in dem einfachen Modell des freien Elektronengases nur möglich, solange man sich nicht für die sog. räumliche Dispersion, d. h. die k-Abhängigkeit von e (x, k), interessiert. Andernfalls treten die Anregungen von Elektronen innerhalb eines nicht vollständig aufgefüllten Bandes hinzu. Man spricht auch von IntrabandÜbergängen, die das e (x, k) des freien Elektronengases bedingen. Bei genügend hohen x können Übergänge zwischen Zuständen verschiedener Bänder stattfinden. In diesem Fall spricht man von Interband-Übergängen. Entsprechend der diskreten Natur der erlaubten und verbotenen Energiebänder muss man eine energetisch diskrete Struktur dieser Anregungsprozesse und des daraus resultierenden e (x)-Verlaufes erwarten. Im Rahmen der Näherung des stark gebundenen Elektrons (Abschn. 7.3) sind diese InterbandÜbergänge nichts anderes als Anregungen zwischen besetzten und unbesetzten Energietermen der Kristallatome, wobei infolge der interatomaren Wechselwirkung die diskreten Energieniveaus des Einzelatoms zu Bändern aufgespalten sind. Eine adäquate Beschreibung der daraus resultierenden Funktion e (x) ergibt sich also durch Summation über alle möglichen Einzelanregungen. Eine Einzelanregung wäre beispielsweise ein Übergang aus einem besetzten 1 s- in ein unbesetztes 2 p-Energieniveau eines Na-Atoms. Die Modifikation durch die Kristallstruktur drückt sich dann aus in der Aufspaltung der 1 s- und 2 p-Niveaus. Der Zusammenhang zwischen der makroskopischen dielektrischen Funktion e (x) und dem Elektronen-Anregungsspektrum soll jetzt anhand einer quantenmechanischen Rechnung näher verdeutlicht werden. Wie in diesem ganzen Kapitel wollen wir auch hier die Wellenlänge des anregenden Lichtes als groß gegen die atomaren Dimensionen (Gitterkonstante) betrachten. Dann kann in der Schrödinger-Gleichung die Ortsabhängigkeit des elektromagnetischen Feldes vernachlässigt werden. Leider ist auch dann eine direkte störungstheoretische Behandlung der Absorption nicht möglich, da ja der „Störung“, nämlich der elektromagnetischen Welle, Energie entzogen wird. Außerhalb der eigentlichen Absorption ist es dagegen erlaubt, die Eigenschaften des quantenmechanischen Systems im Feld störungstheoretisch zu ermitteln. Wir nehmen dazu an, dass das elektrische Feld die Form
E x E 0x ex cos xt
11:88
habe. Mit einer solchen Störung ist die zeitabhängige SchrödingerGleichung für ein Einelektronenproblem
11.10 Interband-Übergänge
h2 D V
r 2m
1 e E 0x x
eixt e 2
ixt
383
_ t : w
r; t ihw
r;
11:89
Es seien w0 i (r, t) = exp [(–i/h) Ei t ] ui (r) die ungestörten Lösungen, nach denen wir entwickeln können durch den Ansatz X ai
te
i=hEi t ui
r
11:90 w
r; t i
mit zeitabhängigen Koeffizienten ai (t). Wir können jetzt leicht die Zeitableitung von w (r, t) bilden und in (11.89) zusammen mit dem Ansatz (11.90) einsetzen. Wir bilden ferner noch mit einem beliebigen Zustand e
i=hEj t uj
r ein Matrixelement aus der ganzen Schrödinger-Gleichung und erhalten unter Benutzung der Orthonormalität der Lösungen des ungestörten Problems P i h a_j
t 12 e E 0x i h jj jiiai
t
eixt e ixt ei
Ej Ei t=h ;
11:91
x
mit hjj jii uj
rxui
r dr :
x
Wir nehmen an, dass zum Zeitpunkt t = 0 ein bestimmter Zustand i eingenommen war, so dass ai (t = 0) = 1 ist, alle anderen Koeffizienten dagegen Null sind. Dann ist
t i aj
t e E 0x h jj jii
eixt e ixt ei
Ej Ei t=h dt 2h 0 i
xji xt e e 1 ei
xji xt 1 ; E 0x h jj jii 2h xji x xji x
x
x
11:92
wobei wir xji = (Ej –Ei) /h eingeführt haben. Mit diesem Ausdruck für die zeitabhängigen Entwicklungskoeffizienten können wir den Erwartungswert des Dipolmomentes in dem gestörten Zustand w (r, t) berechnen, unter Vernachlässigung von quadratischen Termen in den Koeffizienten aj (t) he i dr w
r; te x w
r; t X aj
txij e ixji t aj
txij eixji t exii e
x
j
exii
e E 0x =h
X j
mit
jxij j2
xij ui
rxuj
r dr :
2xji
cos xt x20
x2ji
cos xji t ;
11:93
Der erste Term in dieser Gleichung beschreibt einen feldunabhängigen Anteil des Dipolmomentes, der bei inversionssymmetrischen Systemen verschwindet. Der zweite Term ist linear im Feld und enthält
384
11. Dielektrische Eigenschaften der Materie
einen Anteil, der im Takte des anregenden Feldes schwingt. Er beschreibt also die Polarisierbarkeit des Mediums. Ein weiterer Anteil linear im Feld schwingt mit „atomarer“ Frequenz und tritt deshalb bei einer makroskopischen Messung, die über atomare Frequenzen mittelt, nicht in Erscheinung. Gleichung (11.93) gibt uns also den Realteil der Polarisierbarkeit bzw. e1 (x) –1 für alle Frequenzen, mit Ausnahme der Polstellen selbst, wo die Störungsrechnung auch für beliebig kleine Felder zusammenbricht (vgl. 11.92). Es ist jedoch erlaubt, nunmehr von den analytischen Eigenschaften der komplexen Dielektrizitätskonstanten Gebrauch zu machen und die zugehörigen Imaginärteile, welche die Absorption beschreiben, nach der Kramers-Kronig-Relation (11.17) zu ermitteln. Ziehen wir z. B. die Gleichung (11.41) heran, die bezüglich der Pole dieselbe Struktur wie (11.93) aufweist, so können wir e2 (x) direkt angeben. e2
x
p e2 X jxij j2 fd
hx e0 V ij
Ej
Ei
d
hx
Ej
Ei g :
11:94
Die Summe über i ist dabei die Summe über alle Anfangszustände des Systems im Volumen V und die Summe über j die Summe über alle Endzustände. Aus (11.94) lässt sich für ein Ensemble von Oszillatoren, die sich in Zuständen mit der Quantenzahl n befinden, der n-unabhängige Wert von e2 (x) in Übereinstimmung mit dem klassischen Wert (11.41) herleiten. Dazu muss man lediglich die Werte für die Matrixelemente eines harmonischen Oszillators jxn;n1 j2
n 1 h=2mx0 bzw. jxn;n 1 j2 nh=2mx0 einsetzen (s. Übung 11.7). Wir merken an, dass anstelle des Matrixelementes der Ortskoordinate xij häufig das Matrixelement des Impulsoperators pij = imxxij verwendet wird. Dieser wäre auch direkt in unserer Herleitung erschienen, wenn wir anstelle des elektrischen Feldes E das dazugehörige Vektorpotential A˙ = – E verwendet hätten und den Operator h=i@=@x in der Ortsdarstellung) in der Schrödinger-Gleix
chung durch x +Ax ersetzt hätten. Der Ausdruck für e2 (x) gilt für jedes quantenmechanische System. Speziell für den periodischen Festkörper können wir das Matrixelement des Impulsoperators in (11.94) noch weiter auswerten. Dann können wir nämlich die Zustände (vgl. Abschn. 7.1) durch Bloch-Wellen beschreiben. Zustände werden dann durch die Angabe des Bandes und des k-Vektors charakterisiert. Für die Indizierung der Bänder wollen wir die Indizes i, j beibehalten. Die Blochzustände in der Ortsdarstellung lauten damit
p
p
1 hrji; ki i p uki
rei ki r ; V 1 hrj j; kj i p ukj
rei kj r : V
(11.95)
11.10 Interband-Übergänge
385
Bei der Berechnung des Matrixelements als Integral über den ganzen Raum können wir dann wie im Abschn. 3.6 die Integration aufspalten in ein Integral über die Zelle und eine Summation über alle Zellen 1 X i
kj ki rn hi; ki j j j; kj i hi; ki j j j; kj iZelle e :
11:96 N n
p
p
Wie schon in Kap. 3 diskutiert, liefert die Summe nur Beiträge für kj = ki. Dies ist eine spezielle Form des Wellenzahl- oder Quasiimpulserhaltungssatzes, der uns schon mehrfach als Folge der Gitterperiodizität begegnet ist. Er gilt, wenn man den Wellenzahlvektor des Lichts kL als klein betrachten kann, d. h. aber für Licht bis weit in den ultravioletten Bereich (vgl. Abschn. 4.4). Optische Übergänge, dargestellt im k-Raum, sind also „senkrechte Übergänge“ (Abb. 11.13). Mit dem Quasiimpulssatz können wir e2 (x) weiter auswerten. Die Summation über alle Zustände wird nun als Summation über alle k und alle Bänder ausgeführt p e2 1 X e2
x jhi; kj j j; kij2 d
Ej Ei hx :
11:97 2 2 e0 m x V ijk
p
Ersetzen wir wieder die Summe über k durch ein Integral, so wird daraus
1X 1 ) dk ;
11:98 V k
2p3
p e2 1 X jhi; kj j j; kij2 d
Ej
k Ei
k hx dk : e2
x 3 2 2 e0 m x
2p ij (11.99)
p
Die d-Funktion macht aus dem Raumintegral im k-Raum ein Flächenintegral über eine Fläche konstanter Energiedifferenz Ej (k)–Ei ( k) = h x (vgl. (7.41))
p e2 1 X e2
x jhi; kj j j; kij2 e0 m2 x2
2p3 ij
p
hxEj Ei
dfx jgradk Ej
k
Ei
kj
:
11:100
Der Imaginärteil der dielektrischen Funktion – soweit er von Interband-Übergängen bestimmt ist – setzt sich also aus zwei „Anteilen“ zusammen, einem Matrixelementeffekt und einer „kombinierten Zustandsdichte“
Abb. 11.13. Schematische Darstellung direkter (d) und indirekter (i) Übergänge in einem Bänderschema E (k), das aus zwei atomaren Niveaus E1 und E2 des freien Atoms hervorgegangen ist. E1 (k) sei ein besetztes und E2 (k) ein unbesetztes Band. Die mit ausgezogener Linie gezeichneten Übergänge gehören zu Punkten hoher kombinierter Zustandsdichte. Die Energien der bei den indirekten Übergängen beteiligten Phononen sind vernachlässigt
386
11. Dielektrische Eigenschaften der Materie
Zij
hx
1 3
2p
hxEj Ei
dfx jgradk Ej
k
Ei
kj
:
11:101
Diese Unterteilung ist dann sinnvoll, wenn, wie häufig angenommen, hi; kj j j; ki keine signifikante k-Abhängigkeit zeigt. Die kombinierte Zustandsdichte ist hoch für Energien h x, bei denen die Differenz aus den Energieflächen bei ein- und demselben kWert flach verläuft. An diesen Punkten liegen also, wie auch im Abschn. 5.1 für Phonon-Dispersionszweige und im Abschn. 7.5 für elektronische Bänder gezeigt wurde, sog. kritische Punkte oder Van Hove-Singularitäten. Diese kritischen Punkte verursachen die markanten Strukturen im Verlauf von e2(x) und damit im optischen Absorptionsspektrum. Als Beispiel ist in Abb. 11.14 das aus experimentellen Daten ermittelte e2 (x)-Spektrum für Ge gezeigt. Ähnlich wie bei elektronischen Übergängen am freien Atom unterscheiden wir zwischen erlaubten und verbotenen Übergängen. Erlaubt ist ein Übergang, wenn das Matrixelement (11.96) nicht verschwindet. Nehmen wir z. B. an, dass bei einem Halbleiter das Minimum des Leitungsbandes und das Maximum des Valenzbandes im k-Raum übereinander liegen, dann gilt für die Energie im Leitungsband EL und im Valenzband EV die Entwicklung
p
EL Eg
h2 2 k ; 2 mL
Ev
h2 2 k ; 2 mV
11:102
wobei mV die effektive Masse der Defektelektronen bzw. die negative elektronische effektive Masse im Valenzband ist. Es ergibt sich für die kombinierte Zustandsdichte Ej
Abb. 11.14. Experimentell ermitteltes Spektrum der dielektrischen Funktion e2 (x) für Germanium. C, X und L bezeichnen Punkte der Brillouin-Zone, denen die entsprechenden kritischen Punkte der kombinierten Zustandsdichte zugeordnet werden. Ein großer Beitrag stammt auch von Übergängen entlang der K-Richtung (entspricht [111]). (Vergl. dazu Abb. 7.13). (Nach Phillips [11.6])
E i EL
EV Eg
h2
mL 2
1
1 mV k2
11:103
11.10 Interband-Übergänge
387
und analog zur Berechnung der Zustandsdichte eines freien Elektronengases (Abschn. 6.1) ein Term, der proportional zu (hx Eg 1/2 ist. Dieser Term bestimmt den Verlauf von e2 (x) in der Nähe der Bandkante Eg für den Fall eines erlaubten Überganges. Verschwindet bei einem verbotenen Übergang das Matrixelement an der Bandkante, so lässt sich in der Nähe das Matrixelement nach (hx Eg ) entwickeln; Abbruch nach dem linearen Glied führt also für verbotene Übergänge wegen der wurzelförmigen Abhängigkeit der kombinierten Zustandsdichte zu einer charakteristischen Abhängigkeit e2 (x) * (hx Eg )3/2. Wie Abb. 11.15 zeigt, muss man im allgemeinen jedoch auch k-Abhängigkeiten des Matrixelementes berücksichtigen, so dass die Diskussion mit der kombinierten Zustandsdichte nur einen qualitativen Anhaltspunkt liefern kann. Bislang haben wir die Elektron-Phonon-Wechselwirkung außer acht gelassen. In besserer Näherung kann jedoch das Phonon-System des Kristalls bei einem optischen Übergang nicht als entkoppelt betrachtet werden. Die Matrixelemente (11.96) enthalten dann statt der reinen elektronischen Wellenfunktionen hEi ; ki j die Gesamtwellenfunktion hEi ; ki ; xq ; qj des gekoppelten Elektron-Phonon-Systems, und die Störung muss neben dem Lichtfeld A (x) auch die Wechselwirkung mit dem Phononensystem berücksichtigen. Im Teilchenbild veranschaulicht, haben wir es also mit einer 3-Teilchen-Wechselwirkung zwischen Photon, Elektron und Phonon zu tun. Übergänge dieser Art liefern wesentlich geringere Beiträge als die bisher betrachteten „Zwei-Teilchenstöße“. Sie verlangen auch wieder Erhaltung der Wellenzahl k und Energieerhaltung: Ej
Ei hx hxq ;
11:104
kj
ki kL q :
11:105
Abb. 11.15. Produkt aus Photonenenergie h x und Absorptionskonstante über der Photonenenergie für InSb. Die experimentell ermittelten Punkte (nach Gobeli u. Fan [11.7]) sind verglichen mit Rechnungen für einen direkten erlaubten bzw. verbotenen Übergang. Die beste Beschreibung ergibt sich, wenn bei einem erlaubten Übergang das Matrixelement korrigiert wird (k-Abhängigkeit) und Nicht-Parabolizität des Leitungsbandes berücksichtigt wird. (Nach Johnson [11.8])
388
11. Dielektrische Eigenschaften der Materie
Abb. 11.16. Experimentell bestimmtes Spektrum von e1 (x) (– – –) und e2 (x) (——) von Silber. (Nach Ehrenreich und Philipp [11.9])
Abb. 11.17. Mathematische Zerlegung des experimentell bestimmten e1 (x)Spektrums von Ag aus Abb. 11.16 in einen Anteil e (f) 1 , der auf das freie Elektronengas zurückzuführen ist, und einen Anteil e (d) 1 , der von Interband-Übergängen aus d-Zuständen herrührt
Die Energieerhaltung (11.104) bedeutet nur eine geringfügige Modifikation gegenüber direkten Übergängen, da für Phononen h xq typischerweise um etwa zwei Größenordnungen kleiner ist als die elektronischen Übergangsenergien (Ej–Ei) an kritischen Punkten. Da jedoch Phononen q-Vektoren aus der gesamten Brillouin-Zone beisteuern können, sind indirekte Übergänge wegen (11.105) zwischen beliebigen Anfangs- und Endzuständen der Brillouin-Zone möglich. In Abb. 11.13 sind solche indirekten Übergänge (bezeichnet mit (i)) ohne Berücksichtigung der vernachlässigbar kleinen Phononenenergien h xq eingezeichnet. Markant können solche Übergänge – natürlich nur bei nicht überlagerten direkten Übergängen – zum e2 (x)-Spektrum beitragen, wenn sie zwischen kritischen Punkten des Valenz- bzw. Leitungsbandes stattfinden. Bei Ge handelt es sich beim Einsatz der Interband-Absorption um eine sog. „indirekte Bandkante“, da das Minimum des Leitungsbandes bei L (Abb. 7.13) und das Maximum des Valenzbandes bei C liegt. Allerdings liegt der erste direkte Übergang C25' ? C2 ' bei Ge energetisch nur wenig höher. Dass Interband-Übergänge auch bei Metallen einen wesentlichen Beitrag zu den optischen Spektren liefern, zeigt das Beispiel des Silbers in Abb. 11.16 u. 11.17. Ähnlich wie im Falle des Kupfers liegen bei Silber die energetisch relativ scharfen d-Bänder unterhalb des Fermi-Niveaus. Übergänge aus diesen d-Bändern in Bereiche hoher Zustandsdichte oberhalb des Fermi-Niveaus sind verantwortlich für die Strukturen in Abb. 11.16, die dem Beitrag des freien Elektronengases e f1 (x) (Abb. 11.17) überlagert sind. Auf diese Übergänge ist die charakteristische Farbe einiger „Edelmetalle“ (Ag, Cu, Au) zurückzuführen. Man beachte ferner, dass durch den überlagerten Interband-Übergang der Nulldurchgang von e1 (x) und damit die „Plasmafrequenz“ stark verschoben wird.
11.11 Exzitonen
389
11.11 Exzitonen Bei tiefen Temperaturen findet man an Halbleitern beim Einsatz der optischen Absorption in der Nähe der Bandkantenenergie Eg nur in Ausnahmefällen einen Verlauf von e2 (x), wie er in Abb. 11.14 dargestellt ist. Häufig beobachtet man einen scharf strukturierten Einsatz der optischen Absorption, so wie in Abb. 11.18 für GaAs gezeigt. Diese Strukturen beruhen auf der Anregung sog. Exzitonen. Exzitonen sind Elektron-Loch-Paare, die sich durch die anziehende Coulomb-Wechselwirkung zwischen einem Elektron, das aus einem Valenzbandzustand angeregt wurde, und dem im Valenzband zurückbleibenden Loch bilden können. Die einfachste mathematische Beschreibung eines solchen exzitonischen Zustandes wird durch das sog. Wasserstoffmodell geliefert, in dem sich die möglichen Energiezustände En, K des aneinandergebundenen Elektron-Loch-Paares im wesentlichen durch die Bohrschen Eigenzustände ergeben: le4 1 h2 K 2
11:106 En;K Eg 32p2 h2 e2 e2 n2 2
m m : 0
L
V
Eg tritt als Summand auf, weil der Energienullpunkt üblicherweise an die Valenzbandoberkante gelegt wird. Im Gegensatz zu den Eigenwerten des Wasserstoffatoms muss in (11.106) statt der Elektronenmasse natürlich die reduzierte effektive Masse l * der effektiven Massen von Elektronen (mL) und Löchern (mV) auftreten. Ferner muss die Dielektrizitätskonstante e0 des Vakuums durch die Dielektrizitätskonstante e des Halbleitermaterials modifiziert werden, um der Abschirmung durch die Umgebung Rechnung zu tragen. Da ein solches Elektron-Loch-Paar sich quasi-frei im Kristall
Abb. 11.18. Absorptionskonstante von GaAs gemessen bei 21 K (durchgezogene Kurve ) in der Nähe der Bandlükkenenergie Eg. Der gestrichelte geschätzte Verlauf ergäbe sich ohne das Vorhandensein von Exzitonenanregungen. (Nach Sturge [11.10])
390
11. Dielektrische Eigenschaften der Materie
bewegen kann, muss in der Gesamtenergie dieses Zweiteilchensystems auch die kinetische Energie des Schwerpunktes – dritter Term in (11.106) – auftreten, wobei K der der Schwerpunktsbewegung beider Teilchen entsprechende Wellenvektor ist. Man beachte, dass es sich in (11.106) um Zweiteilchen-Energieniveaus handelt, die nicht ohne weiteres in ein Bänderschema eingezeichnet werden dürfen, in dem ja Einteilchenenergien aufgetragen sind. Jedoch können bei der Anregung eines Elektrons die Energieterme En, K , die knapp unterhalb der Bandkante einsetzen, erreicht werden, ehe die Anregung ins Leitungsband, d. h. die Ionisierung des Exzitons (Abtrennung von Elektron und Loch), stattfindet. Da e bei Halbleitern von der Größenordnung 10 ist, ist das Exzitonenspektrum für K = 0 ein stark komprimiertes Wasserstoffspektrum, dessen Bindungsenergien unterhalb von 0,1 eV liegen. Die räumliche Ausdehnung der Elektronen- und Lochwellenfunktion dieses Exzitons ist aus demselben Grunde weitaus größer als beim Wasserstoffatom (etwa 10 Bohr-Radien). Dies rechtfertigt im nachhinein die Anwendung des einfachen Wasserstoffmodells mit einer makroskopischen Dielektrizitätskonstanten. Im Germanium berechnet man für den niedrigsten direkten Übergang bei C und K = 0 eine exzitonische Bindungsenergie EEX von EEX
le4 32p2 h2 e2 e20
0;0017 eV
11:107
und einen Bohrschen Exzitonenradius von 47´10–8 cm. Der experimentelle Wert für die Bindungsenergie ist –0,0025 eV. In einem optischen Absorptionsexperiment können natürlich nur exzitonische Zustände, mit K % 0 (11.107), angeregt werden, da, wie schon oben angeführt, Lichtquanten nur einen vernachlässigbar kleinen Wellenzahlvektor übertragen können. Wegen des geringen Energieabstandes der Exzitonenzustände von der Bandkante Eg nach (11.107) müssen Messungen, die den exzitonischen Charakter der optischen Absorption zeigen sollen, bei tiefen Temperaturen geschehen. Die hier besprochenen, sog. schwach-gebundenen Exzitonen werden auch als Mott-Wannier-Exzitonen bezeichnet. Der Vollständigkeit halber sei erwähnt, dass in Molekül-, Edelgas- und Ionenkristallen sog. Frenkel-Exzitonen beobachtet werden. Ihre Bindungsenergie liegt im Bereich von 1 eV und im Gegensatz zu den Mott-Wannier-Exzitonen ist die Wellenfunktion des ElektronLoch-Paares an einem Atom bzw. Molekül lokalisiert.
11.12 Dielektrische Energieverluste von Elektronen Zur Untersuchung dielektrischer Eigenschaften hat sich neben optischen Methoden die inelastische Streuung von Elektronen etabliert. Beim Durchgang durch Materie erleiden Elektronen charakteristi-
11.12 Dielektrische Energieverluste von Elektronen
391
sche Energieverluste. Sie können durch Stöße und Resonanzanregungen mit den einzelnen Atomen zustande kommen. Dieser Anteil ist beim Festkörper jedoch klein gegenüber den sog. dielektrischen Energieverlusten. Ihre Beschreibung kann in einem quasiklassischen Modell erfolgen. Sie entstehen nämlich durch die Dämpfung des elektrischen Feldes, welches das Elektron begleitet. Von einem festen Punkt im Festkörper aus betrachtet ist das Feld eines vorbeifliegenden Elektrons zeitabhängig und enthält deshalb in der Fourier-Analyse ein breites Frequenzspektrum. Die einzelnen FourierKomponenten erfahren im Dielektrikum eine Dämpfung und der Energieverlust pro Volumen ist mit E und D aus (11.3 u. 11.4) 8 9 81 9 1
< = > > < x2 i p x > = r I
x / x Im :
11:111 > x2 e > > :x2 x2 i p 0 x> ; p r Machen wir wieder für den Fall schwacher Dämpfung von der Darstellung durch eine d-Funktion Gebrauch nach (11.41), so erhalten wir p I
x /
d
x 2
xp
d
x xp ;
11:112
392
11. Dielektrische Eigenschaften der Materie
Abb. 11.19. Energieverlustspektrum von 25 keV-Elektronen nach Durchtritt durch eine 500 Å-dicke Aluminiumschicht (nach Geiger u. Wittmaack [11.12]). Der Volumenplasmonverlust ist mit h xp bezeichnet, h x± bezeichnet die Oberflächenplasmonverluste an den beiden (mit einer Oxidschicht bedeckten) Grenzflächen der Folie. Für eine nähere Beschreibung der experimentellen Anordnung s. Tafel XI
d. h. einen Pol bei der Frequenz der longitudinalen Plasmawelle. Wir hatten schon gesehen, dass für Aluminium die Beschreibung als freies Elektronengas besonders gut zutrifft. Deshalb sind die Plasmaverluste in diesem Fall besonders schön ausgeprägt (s. Abb. 11.19). Aber auch bei vielen anderen Materialien hat die Verlustfunktion ein deutliches Maximum, welches dann in Gedanken an das Modell des freien Elektronengases als „Plasmonverlust“ bezeichnet wird. Man kann leicht einsehen, dass eine maximale Wechselwirkung zwischen Elektron und Plasmawelle dann gegeben ist, wenn die Geschwindigkeit des Elektrons mit der Phasengeschwindigkeit der longitudinalen Wellen übereinstimmt. Wie ein Wellenreiter gibt dann das Elektron kontinuierlich Energie ab. Eine quantitative Betrachtung der Resonanzbedingung x=k v el
11:113
führt zum Ergebnis, dass für h xp = 15 eV und eine Elektronen-Primärenergie von 20 keV k*2,7·10–2 Å–1 ist, also klein gegen die Abmessungen der Brillouin-Zone. Das ist auch die Rechtfertigung für die Vernachlässigung der k-Abhängigkeit in e (x). Durch eine Messung der Energieverluste ist es also möglich „optische“ Daten von Festkörpern zu ermitteln. Diese Methode der Energieverlustspektroskopie hat den Vorteil, dass ein breiter Spektralbereich zugänglich ist (vgl. Tafel XI). Elektrische Felder im Festkörper werden nicht nur von Elektronen im Festkörper, sondern auch von Elektronen außerhalb des Festkörpers in der Nähe der Oberfläche desselben erzeugt. Der Abschirmfaktor für das Feld ist dann allerdings nicht 1/e (x), sondern 1/(e (x)+1). Entsprechend wird die Verlustfunktion 1 I
x / x Im :
11:114 e
x 1 Die Verluste werden als Oberflächenverluste bezeichnet. Die Polstelle der Verlustfunktion im Falle schwacher Dämpfung liegt jetzt bei e1 (x) = –1. Dies war aber gerade die Existenzbedingung für
11.12 Dielektrische Energieverluste von Elektronen
393
Abb. 11.20. Energieverluste von 7,5 eVElektronen nach Reflexion an einem Zinkoxidkristall [11.13]. Die Anregungen sind Oberflächenphononen, wie wir sie in Abschn. 11.5 kennengelernt haben. Man kann zeigen, dass die q-Werte der mit Elektronen angeregten Phononen zwar klein gegen die Ausdehnung der Brillouin-Zone, aber groß gegen die q-Werte von Licht sind. Polariton-Dispersion (Abb. 11.5) wird deshalb nicht beobachtet (vgl. auch Tafel XIII)
eine Oberflächenwelle des Dielektrikums. Außerhalb des Mediums regen Elektronen also die in Abb. 11.6 dargestellten Oberflächenwellen (Phononen und Plasmonen) an. Auch solche Verluste lassen sich beobachten. In Abb. 11.19 sind z. B. Oberflächenplasmonen für den Fall einer dünnen (Oxid-bedeckten) Schicht sichtbar. In Abb. 11.20 ist das Verlustspektrum durch Anregung von Oberflächenphononen dargestellt. Das Elektron kann auch Energie aufnehmen, wenn die Temperatur ausreicht, den ersten angeregten Zustand des Phonons mit ausreichender Wahrscheinlichkeit zu besetzen. Der Wellenzahlvektor der angeregten Oberflächenphononen ist bei Anregung durch Elektronen viel größer als bei der Anregung durch Licht (Tafel XIII), allerdings immer noch klein gegen einen reziproken Gittervektor. Das ergibt sich hier aus der Bedingung, dass für optimale Anregung die Phasengeschwindigkeit der Oberflächenwelle x/q gleich der Komponente der Elektronengeschwindigkeit parallel zur Oberfläche v jj sein sollte. Für 5 eV-Elektronen und 45 °-Einfallswinkel errechnet sich z. B. qjj & 1·10–2 Å–1.
Übungen zu Kapitel 11
11.1 Das Kausalitätsprinzip verlangt, dass die elektrische Polarisation eines Mediums zur Zeit t nur von elektrischen Feldern E (t') der Zeit t ' £ t stammen kann. Man zeige, dass dieses Kausalitätsprinzip zur Folge hat, dass die Suszeptibilität v (x) nur Pole in der negativ imaginären Halbebene haben kann. Zum Beweis zeige man durch geeignete Wahl des Integrationsweges, dass P (t): 0 für t ' ³ t ist, wenn v (x) keine Pole in der positiven Halbebene hat. Man beachte, dass als Folge der Trägheit jedes physikalischen Systems v (x) gegen Null geht, wenn x gegen ? strebt. Bei der Betrachtung sei die Fourierdarstellung
E
t
1
E
xe
ixt
11.2 Man zeige, dass die speziellen Formen (11.38) und (11.39) für den Real- und Imaginärteil der dielektrischen Funktion die Kramers-Kronig-Relationen erfüllen. Für die Integration zerlege man x2
u
x; z; t ei
qk x
A x
x1
B x
x2
:
11.3 Berechnen Sie den Realteil von e (x) unter der Annahme, dass die Absorption durch eine Summe von d-Funktionen pX fi
d
x xi d
x xi 2 i dargestellt werden kann!
xt
A e
qk jz d=2j
B eqk jzd=2j :
vorausgesetzt. Wählt man die Fourierdarstellung mit positivem Vorzeichen im Exponenten, so liegen die Pole von v (x) in der positiven imaginären Halbebene.
1 x1
x
11.5 Man berechne die dielektrischen Eigenschwingungen x (qk) einer Schicht der Dicke d, die auf beiden Seiten von Vakuum begrenzt wird! Für das Potential wähle man den Ansatz
dx
1
x
11.4 Berechnen Sie das Reflexionsvermögen bei senkrechtem Einfall für ein freies Elektronengas unter der Annahme starker und schwacher (frequenzunabhängiger) Dämpfung! Wiederholen Sie die Rechnung unter der Annahme einer zusätzlichen Absorptionslinie im Frequenzbereich x xp , d. h. unterhalb der Plasmafrequenz!
Man zeige, dass dieses Potential die Laplace-Gleichung erfüllt! Warum ist das erforderlich? Man beachte, dass E k und D^ für jzj= d/2 stetig sind. Dies führt auf ein Gleichungssystem, das nur eine Lösung für den Fall hat, dass die Determinante verschwindet. Aus dieser Bedingung leite man x (qk ) her! Erklären Sie, warum die Eigenfrequenz gegen Null geht, wenn qk d 1 ist! Diskutieren Sie auch die anderen Grenzfälle! Zeichnen Sie die Äquipotentiallinien für die zwei Lösungszweige für die Fälle qk d1, qk d&1 und qk d 1! 11.6 Der Realteil der Polarisierbarkeit eines Elektronensystems kann geschrieben werden als
x
e2 X fij ; m e0 V i; j x2ij x2
Übungen zu Kapitel 11
wobei xij = (Ei –Ej)/h die Absorptionsfrequenzen und fij die Oszillatorstärken sind (11.93). Im Limes x ? ? können alle Elektronen als frei betrachtet werden. Durch Vergleich mit der Polarisierbarkeit
x eines freien Elektronengases zeige man, dass åj fij = 1 ist! Dies ist der sog. f-Summensatz. Er lässt sich allgemein aus der Vertauschungsregel für Orts- und Impulsoperator [x, p ] = i h beweisen. 11.7 Man berechne e2 (x) für ein Ensemble harmonischer Oszillatoren der Dichte N/V unter Benutzung der Gl. (11.94) p e2 X e2
x jxij j2 e0 V ij fd
hx
Ej Ei d
hx
Ej Ei g ! Man benutze die Operatordarstellung 1=2 h
a a x 2mx0
395
11.9 Man betrachte die dielektrische Funktion e1
x 1
e2 X fij 2 e0 V ij xij x2
und versuche die statische Dielektrizitätskonstante für einen Isolator mit einer Energielücke Eg abzuschätzen! Man nehme dazu an, dass die ganze Oszillatorstärke bei h x = Eg liegt. Abgesehen von einem Faktor von der Größenordnung eins ist das Ergebnis äquivalent dem sog. Penn-Modell, bei dem eine sphärische „Brillouin-Zone“ angenommen wird. Berechnen Sie e1 für Silizium (Eg = 3,4 eV) und Germanium (Eg = 0,85 eV)! Warum ist das Ergebnis für e1 aus diesem Modell höher als der experimentelle Wert? Warum muss man den Wert der direkten Energielücke verwenden? 11.10 Durch komplexe Integration zeige man
e kTF r e 1 y
r e 2 2 e iq r dq ! 2 r 2p q kTF
mit den Erzeugungs- und Vernichtungsoperatoren a + und a. Diese wirken auf einen Zustand mit der Besetzungszahl n gemäß: p a jni n 1jn 1i ; p ajni njn 1i :
Dies ist die Fourierdarstellung eines abgeschirmten Coulomb-Potentials, mit kTF dem Thomas-Fermi-Wellenvektor. Man kann eine dielektrische Funktion im qRaum einführen über das durch ein externes Potential yext (q) induzierte, abgeschirmte Potential y (q):
Man zeige, dass das Ergebnis für e2 (x) unabhängig vom anfänglichen Besetzungszustand des harmonischen Oszillators ist! Warum muss das so sein? Vergleichen Sie das Resultat mit dem klassischen Ergebnis!
y
q
11.8 Man diskutiere e2 (x) für ein Zweiniveausystem mit den Besetzungswahrscheinlichkeiten P0 und P1 für den Grundzustand und angeregten Zustand! Was ist das Ergebnis für P1 > P0? Warum benötigt man mindestens drei Energieniveaus für einen Laser? Welche Bedingungen müssen bei einem Laser für die spontanen Übergänge zwischen den Energieniveaus erfüllt sein?
e 1 1 y
q : 2 2 2 2p q kTF e
q ext
Berechnen Sie e (q)! 11.11 Die Plasmafrequenz einer homogenen Verteilung von positiven Ionen der Masse M ist X2p
ne2 ; Me0
wobei e die Ladung der Ionen und n die Dichte ist. Die rücktreibende Kraft für Plasmawellen (Ladungsdichtewellen) ist gegeben durch das bei Ladungsdichtewellen auftretende elektrische Feld. Dieses sei
396
Übungen zu Kapitel 11
durch die dielektrische Funktion eines freien Elektronengases e (q) abgeschirmt. Berechnen Sie X (q) unter Verwendung der Lösung von Übung 11.10 für e (q) (BohmStaver-Modell)! Diskutieren und zeichnen Sie den Verlauf von X (q)! Welche Bedeutung hat X (q) für q ? 0? Man berechne die Geschwindigkeit longitudinaler Schallwellen für Na, K und Al und vergleiche mit experimentellen Werten! 11.12 Berechnen Sie die Energieverlustfunktion für Elektronenstreuung im Volumen (–Im {1/e}) und an der Oberfläche (–Im {1/(e+1)}) für ein freies Elektronengas und ein Ensemble von harmonischen Oszillatoren der Frequenz x0! Interpretieren Sie das Ergebnis im Zusammenhang mit Abschn. 11.5!
11.13 Als einfaches Modell für einen infrarotaktiven Kristall betrachte man eine zweiatomige lineare Kette aus Atomen mit zwei verschiedenen Massen und entgegengesetzter Ladung. Die Abstände der beiden Atome und die Federkonstanten seien gleich. Elektrostatische Wechselwirkungen zwischen den Ionen sollen vernachlässigt werden. Berechnen Sie die Schwingungsamplitude unter der Wirkung eines elektrischen Feldes E = E 0 e –ixt! Warum ist es erlaubt, die Berechnung auf den Bereich der Brillouin-Zone um q&0 zu beschränken? (a) Man berechne die frequenzabhängige Polarisation P (x) und die dielektrische Funktion e (x) mit und ohne Dämpfung! (b) Leiten Sie die Lyddane-Sachs-TellerRelation für diesen Fall her!
Tafel XI
Tafel XI Spektroskopie mit Photonen und Elektronen
Die weitaus meisten Informationen über den Festkörper hat man aus spektroskopischen Methoden erhalten. Dabei ist die Spektroskopie mit Photonen von besonderer Bedeutung. In Abb. XI.1 werden Intensität und Spektralbereich verschiedener Lichtquellen miteinander verglichen. Aufgetragen ist der typischerweise zur Verfügung stehende Photonenfluss pro eV Spektralbreite. Bei einem solchen Vergleich müssen allerdings die sehr verschiedenen Eigenschaften der Strahlungsquellen berücksichtigt werden. Bei der Kurve für den Schwarzkörperstrahler wurde angenommen, dass Winkelauflösung bezüglich der Einfallsrichtung der Strahlung nicht erforderlich ist bzw. genügend große Proben zur Verfügung stehen. Die Synchrotronstrahlung ist extrem gerichtet. In Abb. XI.1 ist der Photonenfluss für den Speicherring „Doris“ angegeben, der eine nutzbare Winkelapertur von ca. 1 mrad ´ 1 mrad hat. Bei kleineren Maschinen ist die nutzbare Winkelapertur größer. Dann kann die Verwendung der Synchrotronstrahlung auch im fernen Infrarot vorteilhaft sein. Im UV-Bereich haben die Monochromatoren je nach Auslegung und Spektralbereich eine stark schwankende und insgesamt nicht sehr gute Effizienz. Dies soll durch die schraffierte Kurve angedeutet werden. Manche Experimente können auch mit Festfrequenzquellen, Gasentladungslampen und charakteristischer Röntgenstrahlung betrieben werden. Als Beispiel ist in Abb. XI.1 der Photonenfluss der He I-Linie einer Gasentladungslampe aufgeführt. Diese Linie wird bei Photoemissionsexperimenten häufig eingesetzt (vgl. Tafel V). Die Lichtausbeuten sind dann der Synchrotronquelle vergleichbar. Die sehr intensitätsstarken Farbstofflaser stehen leider nur für den Bereich 1–3,6 eV zur Verfügung. Beim Vergleich von Farbstofflasern mit anderen Lichtquellen muss beachtet werden, dass ihre relative Linienbreite (abge-
Abb. XI.1. Typischer Photonenfluss pro eV am Probenort bei verschiedenen Lichtquellen. Dabei wurde eine Probenoberfläche von etwa 1 cm2 zugrunde gelegt. Bei einem Vergleich muss die sehr unterschiedliche Charakteristik der Strahlungsarten beachtet werden. Die Abbildung dient deshalb nur zur qualitativen Orientierung. Synchrotronstrahlung und Laserstrahlung sind sehr stark gerichtet. Sie sind bei Experimenten, in denen hohe Winkelauflösung verlangt wird, besonders vorteilhaft. Bei gewöhnlichen Absorptionsuntersuchungen, die weder Winkelauflösung noch große Auflösung in der Quantenenergie verlangen, kann auch die Verwendung des schwarzen Strahlers günstig sein
Tafel XI Spektroskopie mit Photonen und Elektronen
Tafel XI
398
Abb. XI.2. Elektronenspektrometer für die Transmissionsspektroskopie. (Nach Raether [XI.4])
ments ist in Abb. XI.2 angegeben. Die Energieauflösung ist hier durch die thermische Breite der Kathodenemission (* 0,5 eV) begrenzt, doch sind auch Anordnungen mit Vormonochromatisierung und Gesamtauflösung bis 2 meV realisiert worden [XI.3]. Um die Probe durchstrahlen zu können, muss sie als dünne Folie vorliegen und die Elektronenenergie muss genügend hoch liegen (20–100 keV). Abbildung XI.3 zeigt einen Vergleich des Frequenzverlaufs von e2 (x), wie er aus der Kramers-Kronig-Analyse der Verlustfunktion (Abschn. 11.1) bzw. der lichtoptischen Reflexion erhalten wurde.
Abb. XI.3. Vergleich von e2 (x) für Gold aus Elektronenspektroskopie (ausgezogene Linie) und aus Messungen des optischen Reflexionsvermögens. (Nach Daniels et al. [XI.5])
stimmt) nur etwa 10–6 eV beträgt. Nutzt man diese Energieauflösung nicht, geht der Vorteil hohen Photonenflusses pro eV zum großen Teil verloren (Daten aus [XI.1, XI.2]). Wie in Abschn. 11.12 beschrieben, lassen sich Informationen über das Absorptionsverhalten auch durch Elektronen-Energieverlustspektroskopie gewinnen. Das Schema eines solchen Experi-
Literatur XI.1 C. Kunz: In Photoemission in Solids II, herausgegeben von L. Ley, M. Cardona, Topics Appl. Phys., Vol. 27 (Springer, Berlin Heidelberg 1979) S. 299 ff. XI.2 F. P. Schäfer (Hrsg.): Dye Lasers, 2nd edn. Topics Appl. Phys., Vol. 1 (Springer, Berlin Heidelberg 1973) XI.3 H. Boersch, J. Geiger, W. Stickel: Z. Phys. 212, 130 (1968) XI.4 M. Raether: In Springer Tracts Mod. Phys., Vol. 38 (Springer, Berlin Heidelberg 1965) S. 84 XI.5 J. Daniels, C. v. Festenberg, M. Raether, K. Zeppenfeld: In Springer Tracts Mod. Phys., Vol. 54 (Springer, Berlin Heidelberg 1970) S. 77
Tafel XII
Tafel XII Infrarot-Spektroskopie
Für die Spektroskopie im Infrarot (IR)-Spektralbereich hat sich eine besondere experimentelle Technik herausgebildet. Wegen der weitgehenden Undurchlässigkeit von Glas und Quarz für größere Wellenlängen (k > 4 lm) werden optische Strahlengänge bevorzugt mit Spiegeln aufgebaut. Bis ins mittlere IR (10 lm < k < 100 lm) können in Monochromatoren als dispersive Elemente Prismen aus Alkalihalogeniden (NaF, KCl, KJ usw.) verwendet werden. Ansonsten wird mit metallisch beschichteten Reflexionsgittern gearbeitet. Als Strahlungsquellen dienen bis ins mittlere IR Stäbe aus Siliziumkarbid („Globar“) oder aus Zirkon- und Yttriumoxid („Nernststift“), die elektrisch auf Gelbglut beheizt werden. Im fernen IR (k > 200 lm), wo Quarz wieder durchlässig wird, finden Hg-Hochdrucklampen Anwendung. Auch die Synchrotronstrahlung ist – je nach Maschinenauslegung – etwa ab 50 lm vorteilhaft. Als Detektoren werden Thermoelemente, tiefgekühlte Halbleiter-Photowiderstände und pneumatische Detektoren („Golay-Zelle“: thermische Ausdehnung eines Gasvolumens) verwendet. Das Maximum der thermischen Strahlung bei Zimmertemperatur liegt ungefähr bei k = 10 lm. Abb. XII.1. Schema eines GitterDoppelstrahl-IR-Spektrometers. Der Referenzstrahl (– – –) durchläuft hinter dem sich drehenden Sektorspiegel (Chopper) den gleichen Strahlengang wie der Messstrahl (——) durch die Probe, deren Absorption gemessen werden soll. Für Reflexionsmessungen muss mittels Spiegel der Messstrahl an der Probe zur Reflexion gebracht werden. Wegen der atmosphärischen Wasserdampfabsorption durch Molekülschwingungen muss der gesamte Strahlengang mit getrockneter Luft gespült werden
Diese Hintergrundstrahlung würde jede Messung mit Gleichlicht stören. In IR-Spektrometern (Abb. XII.1) wird deshalb der Strahlengang periodisch unterbrochen („gechoppert“) und das so modulierte elektrische Signal am Empfänger mit einem schmalbandigen und/oder phasenempfindlichen Verstärker („Lock-In“-Verstärker) auf der betreffenden Modulationsfrequenz nachgewiesen. Häufig werden Zweistrahl-Spektrometer verwendet, bei denen ein Referenzstrahl mit dem Messstrahl, der durch die Probe geht, verglichen wird. In Abb. XII.1 werden beide Strahlen über einen Sektorspiegel, der abwechselnd den Referenzstrahl durchlässt und über einen Spiegelsektor den Messstrahl reflektiert, phasenverschoben auf den Detektor gebracht. Die den Intensitäten entsprechenden, zueinander phasenverschobenen elektrischen Signale werden elektronisch getrennt und verglichen. Da im IR nur relativ intensitätsschwache Strahlungsquellen zur Verfügung stehen, hat sich neben der konventionellen Spektroskopie, wo unmittelbar eine Intensitätsverteilung I (x) gemessen wird, die Fourier-Spektroskopie durchgesetzt. Ihr Vorteil beruht darauf, dass während der
Tafel XII Infrarot-Spektroskopie
Tafel XII
400
Vom Empfänger wird also in Abhängigkeit von x im Zeitmittel die Intensität dI
x; x /
jE 1 E 2 j2 dx ;
(XII.2) dI
x; x / I0 T
x I0 T
x cos 2xx=cdx
Abb. XII.2. Schema eines Fourier-Spektrometers nach dem Michelson-Prinzip
Messzeit das gesamte Spektrum – und nicht nur jeweils ein durch die Auflösung begrenzter Bereich innerhalb von Dx – datenmäßig erfaßt und verarbeitet wird. Häufig werden, wie in Abb. XII.2 angedeutet, Michelson-Anordnungen verwendet, um das Messlicht in seine FourierKomponenten zu zerlegen. Hierbei kann ein Spiegel des Michelson-Interferometers mit hoher Präzision parallel um einen Maximalbetrag x0 verschoben werden. Beim Durchstrahlen der Probe soll deren Transmission T (x), d. h. bei wellenlängenunabhängiger Intensität I0 von der Quelle her, dI T
xI0 dx
XII:1
gemessen werden. In Abhängigkeit von der Spiegelverschiebung x sind die elektrischen Feldstärken der beiden miteinander interferierenden monochromap E tischen Lichtbündel I T
x sin xt und 1 0 p E 2 I0 T
x sin
xt 2xx=c.
gemessen. Da die Lichtfrequenzen gleichzeitig verarbeitet werden, empfängt der Detektor bei Beleuchtung mit einem weißen Spektrum I0 in Abhängigkeit von der Spiegelverschiebung x : 1
I
x dI I0
T
xdx 0
1
T
x cos
2xx=cdx :
I0
XII:3
0
Der erste Term ergibt eine Konstante I (?) und der zweite stellt die Fourier-Transformierte der Transmission T (x) dar. Die Messung besteht also darin, den einen Spiegel um x (bis maximal x0) zu verschieben und I (x) zu messen. Die Fourier-Transformation von I (x)–I (?), die auf Computern durchgeführt wird, ergibt dann unmittelbar das Transmissionsspektrum T (x) der Probe. Die Fourier-Transformation wird nur exakt für unendlich große Verschiebungen x. Die Ungenauigkeit, d. h. schließlich die Auflösung Dx dieser Spektroskopie, ist also gegeben durch die maximale Spiegelverschiebung x0 (Dx / c % x –1 0 ).
Bei der Absorption elektromagnetischer Wellen durch einen (kristallinen) Festkörper gilt Wellenzahlerhaltung, d. h. eine Lichtwelle der Frequenz x kann nur durch solche Festkörperanregungen absorbiert werden, die einen Wellenzahlvektor q = x/c haben. Die in Abschn. 11.5 besprochenen Oberflächenwellen existieren z. B. nur für q > x/c. Sie lassen sich also in einem gewöhnlichen Absorptionsexperiment nicht nachweisen, wohl aber mit Hilfe der „frustrierten Totalreflexion“. Abbildung XIII.1 zeigt eine experimentelle Anordnung nach MarAbb. XIII.3. Dispersion von Oberflächenpolaritonen von GaP. xL und xT sind die Frequenzen des longitudinalen bzw. transversalen optischen Phonons, xs die Frequenz des Oberflächenphonons
Abb. XIII.1. Experimentelle Anordnung zur Beobachtung der frustrierten Totalreflexion
Abb. XIII.2. Reflektierte Intensität in der Anordnung nach Abb. XIII.1 als Funktion der Frequenz bei einer GaP-Probe. Der Variationsparameter ist der Einfallswinkel a. Er bestimmt – zusammen mit der Frequenz – die Parallelkomponente des Wellenzahlvektors qk. Die Minima entstehen durch Ankopplung an Oberflächenpolaritonen. Zur optimalen Beobachtung muss die Stärke der Kopplung durch Variation des Luftspaltes d an den Wert von qk angepaßt werden
schall u. Fischer [XIII.1]. Licht wird an der inneren Grenzfläche eines Prismas (hier aus Si) total reflektiert. Parallel zur Oberfläche ist jetzt der Wellenzahlvektor qk = (x/c) n sin (mit n = 3,42). Bei sehr kleinem Luftspalt d kann das exponentiell abklingende Feld im Außenraum des Prismas zur Anregung von Oberflächenwellen in einem GaP-Kristall verwendet werden. Diese Anregung zeigt sich dann als Einbruch der im Prisma reflektierten Intensität (Abb. XIII.2). Je nach dem gewählten Winkel , also je nach qk, treten die Minima bei verschiedenen Frequenzen auf. So kann man die vollständige Dispersionskurve eines Oberflächenpolaritons ausmessen (Abb. XIII.3). Der theoretische Verlauf der Dispersionskurve lässt sich nach den Überlegungen in Abschn. 11.5 bei vollständiger Berücksichtigung der Maxwell-Gleichungen (retardierte Lösungen) ermitteln.
Literatur XIII.1 N. Marschall, B. Fischer: Phys. Rev. Lett. 28, 811 (1972)
Tafel XIII
Tafel XIII Die Methode der frustrierten Totalreflexion
12. Halbleiter
Im Abschn. 9.2 hatten wir gelernt, dass nur ein partiell gefülltes elektronisches Band zum elektrischen Strom beitragen kann. Vollständig gefüllte Bänder leisten ebensowenig einen Beitrag zur elektrischen Leitfähigkeit wie vollständig leere und ein Material, das nur vollständig gefüllte und vollständig leere Bänder aufweist, ist demnach ein Isolator. Ist der Abstand zwischen der Oberkante des höchsten gefüllten Bandes (Valenzband) und der Unterkante des niedrigsten leeren Bandes (Leitungsband) nicht zu groß (z. B. * 1 eV), so macht sich bei nicht zu niedrigen Temperaturen die Aufweichung der Fermi-Verteilung bemerkbar: Ein kleiner Bruchteil der Zustände in der Nähe der Oberkante des Valenzbandes bleibt unbesetzt und die entsprechenden Elektronen befinden sich im Leitungsband. Sowohl diese Elektronen als auch die im Valenzband entstandenen Löcher können elektrischen Strom tragen. In diesem Fall spricht man von einem Halbleiter. In Abb. 12.1 sind die Unterschiede zwischen Metall, Halbleiter und Isolator noch einmal schematisch dargestellt. Die Besonderheit halbleitender Materialien gegenüber Metallen liegt darin, dass die elektrische Leitfähigkeit durch geringfügige Materialzusätze um viele Größenordnungen variiert werden kann. Auch lässt sich durch solche Zusätze der Elektronen- oder Löchercharakter der Leitfähigkeit bestimmen. Auf dieser Besonderheit basiert die gesamte Festkörperelektronik. Wegen ihrer Wichtigkeit wollen wir deshalb den Halbleitern ein besonderes Kapitel widmen.
Abb. 12.1. Termschema für Metall, Halbleiter und Isolator. Metalle haben auch bei T = 0 K ein teilweise besetztes Band (schraffiert). Bei Halbleitern bzw. Isolatoren liegt das Fermi-Niveau zwischen dem besetzten Valenzband und dem unbesetzten Leitungsband
404
12. Halbleiter
12.1 Daten einiger wichtiger Halbleiter Die Ausbildung der Bandstruktur der typischen Elementhalbleiter Diamant (C), Si und Ge hatten wir uns schon im Abschn. 7.3 veranschaulicht: Durch Mischung der s- und p-Wellenfunktionen ergibt sich ein tetraedrisches Bindungsorbital (sp3), das im Bereich des Gleichgewichts-Bindungsabstandes zu einer Aufspaltung in ein bindendes und ein antibindendes Orbital führt. Die bindenden Orbitale bilden das Valenzband, die antibindenden das Leitungsband (Abb. 7.9). Die Aufteilung der insgesamt vier s- und p-Elektronen auf bindende und antibindende Orbitale führt zur vollständigen Auffüllung des Valenzbandes bei vollständig leerem Leitungsband. Das Ergebnis ist also ein Isolator wie Diamant bzw. bei kleinerer Energielücke zwischen Valenz- und Leitungsband ein Halbleiter wie Silizium oder Germanium (Tabelle 12.1). Aus der Darstellung in Abb. 7.9 lässt sich sofort ein wichtiger Sachverhalt für die Energielücke zwischen Valenz- und Leitungsband ablesen: Die Größe der Energielücke muss eine Temperaturabhängigkeit zeigen. Mit wachsender Temperatur vergrößert sich wegen der thermischen Ausdehnung der Gitterabstand. Dann muss sich auch die Aufspaltung zwischen bindenden und antibindenden Zuständen verringern, also die Bandlücke verkleinern. Bei genauerer Betrachtung muss allerdings neben diesem Effekt auch der Einfluss der Gitterschwingungen auf Eg berücksichtigt werden. Insgesamt ergibt sich bei Zimmertemperatur eine lineare Abhängigkeit der Bandlücke von der Temperatur und bei sehr niedrigen Temperaturen eine quadratische Abhängigkeit. Während in der Darstellung der Abb. 7.9 die wichtigen Halbleiter Si und Ge ein qualitativ ähnliches Bild liefern, sind in der E (k)-Darstellung, d. h. im reziproken Raum, die elektronischen Bänder aufgrund der verschiedenen atomaren Eigenschaften (3 s, 3 p- bzw. 4 s, 4 p-Wellenfunktionen) durchaus verschieden. Die Unterschiede lassen sich aus Abb. 12.2 erkennen. Die Kurven entstammen Rechnungen, die an experimentelle Größen wie Bandabstand, Lage der kritischen Punkte und effektive Masse (Bandkrümmung) angepaßt wurden. Aus diesen E (k)-Darstellungen längs Richtungen hoher Symmetrie im k-Raum folgt, dass beide Halbleiter sog. indirekte Halbleiter sind: Der minimale Abstand (Bandlücke Eg) zwischen Leitungs- und Valenzband ist für Zustände mit verschiedenen k-Vek-
Tabelle 12.1. Energiebreite der Lücke (verbotenes Band) zwischen Valenz- und Leitungsband bei Germanium und Silizium
Si Ge
Eg (T = 0 K) [eV]
Eg (T = 300 K) [eV]
1,17 0,75
1,12 0,67
12.1 Daten einiger wichtiger Halbleiter
405
Abb. 12.2. Die Bandstrukturen von Silizium und Germanium. Für Ge ist auch die Spin-Bahnaufspaltung berücksichtigt. (Nach Chelikowsky u. Cohen [12.1]). Beide Halbleiter sind sog. indirekte Halbleiter, d. h., das Maximum des Valenzbandes und das Minimum des Leitungsbandes liegen an verschiedenen Stellen der Brillouin-Zone. Das Minimum des Leitungsbandes liegt bei Silizium auf der C X=[100]-Richtung und bei Germanium auf der C L = [111]Richtung. Man beachte die Ähnlichkeit der Bandverläufe für Ge mit denen aus Abb. 7.13, die aus andersartigen Rechnungen stammen
toren gegeben (C, d. h. k = (0, 0, 0), im Valenzband und k auf [111] bei Ge bzw. k auf [100] bei Si im Leitungsband). Leitungselektronen im Leitungsband, die sich auf den energetisch niedrigsten Zuständen befinden, haben also bei Si k-Vektoren auf den [100]-Richtungen und bei Ge solche auf den [111]-Richtungen. Diese Bereiche des k-Raumes, in denen sich also Leitungselektronen bei Si und Ge befinden, sind in Abb. XV.2 dargestellt. Die Flächen konstanter Energie in diesem Bereich sind Ellipsoide um die [111] bzw. [100]-Richtung, falls man E (k) nur bis
406
12. Halbleiter
zur parabolischen Näherung, d. h. bis zu quadratischen Gliedern in k betrachtet. In der Hauptachsendarstellung (große Hauptachsen sind [100] bei Si und [111] bei Ge) sind die Energieflächen der Leitungselektronen also ! kx2 ky2 kz2 2
12:1 E
k h const : 2mt 2ml Hierbei heißen m t und m l die „transversale“ bzw. „longitudinale“ effektive Masse. Der Nullpunkt der Energieskala ist in das Minimum des Leitungsbandes gelegt worden. Tabelle 12.2. Verhältnisse der transversalen
mt und longitudinalen
ml effektiven Masse zur Masse m des freien Elektrons für Silizium und Germanium
Si Ge
mt =m
ml =m
0,19 0,082
0,92 1,57
Bezogen auf die Elementarmasse m des Elektrons folgen aus Messungen der Zyklotronresonanz die Werte in Tabelle 12.2. Ein detailliertes Studium (s. Tafel XV „Zyklotronresonanz“) der Eigenschaften von Löchern in Si und Ge zeigt, dass die Struktur des Valenzbandmaximums in der Nähe von C (k = 0) komplizierter ist, als aus Abb. 12.2 zu ersehen ist: Neben den auch in Abb. 12.2 zu erkennenden zwei Valenzbändern mit verschieden starker Krümmung bei C existiert ein weiteres Valenzband, das von den beiden anderen nur um einen kleinen Betrag D = 0,29 eV bei Ge bzw. D = 0,044 eV bei Si abgespalten ist. Diese Aufspaltung zweier Bänder rührt her von der Spin-Bahn-Wechselwirkung, die in den Rechnungen für Si in Abb. 12.2 a nicht berücksichtigt ist. Es ergibt sich also für Si und Ge in der Nähe von C der in Abb. 12.3 qualitativ dargestellte Verlauf der Valenzbänder. In „parabolischer“ Näherung
Abb. 12.3. Bandstruktur von Silizium bzw. Germanium in der Nähe der Oberkante des Valenzbandes unter Berücksichtigung der Spin-Bahnaufspaltung D (qualitativ)
12.1 Daten einiger wichtiger Halbleiter
407
lassen sich drei verschiedene effektive Massen von Löchern bei C angeben, die zum Ladungstransport beitragen. Entsprechend den verschiedenen Bandkrümmungen spricht man von schweren und leichten Defektelektronen mit den Massen mSD bzw. mLD. Die Defektelektronen (Löcher) des abgespaltenen Bandes werden oft als „split-off“-Löcher mit der Masse mSOD bezeichnet. Da offenbar die Ausbildung des sp3-Hybrids in der chemischen Bindung von Si und Ge wesentlich für die halbleitenden Eigenschaften ist, liegt es nahe, halbleitende Eigenschaften auch bei anderen Materialien mit tetraedrischer Kristallstruktur, d. h. mit sp3-Hybridisierung, zu vermuten. Aufgrund dieser Überlegung kommt man dann folgerichtig zu einer anderen wichtigen Klasse von Halbleitern, den III–V-Halbleitern, die als Verbindungshalbleiter aus Elementen der III. und der V. Gruppe des Periodensystems aufgebaut sind. Vertreter sind InSb, InAs, InP, GaP, GaAs, GaSb und AlSb. Bei diesen Verbindungskristallen liegt eine gemischt ionogen-kovalente Bindung vor (vgl. Kap. 1). Die Mischbindung kann man sich vorstellen als Überlagerung zweier Grenzstrukturen, der ionischen, bei der durch Elektronenübertritt vom Ga zum As eine Ionenstruktur Ga+ As– entsteht, und der kovalenten, bei der infolge Elektronenverschiebung vom As zum Ga sowohl Ga als auch As nun vier Elektronen in der äußeren Schale haben und somit genau wie Si und Ge einen sp3-Hybrid ausbilden können. Letztere kovalente Struktur ist offenbar stärker in der Mischbindung vertreten, denn sonst läge kein tetraedrisch gebundener Kristall mit ZnS-Struktur vor. Im Gegensatz zu den Elementhalbleitern haben die wichtigsten Vertreter der III–V-Halbleiter eine sog. direkte Bandlücke, d. h. Va-
Abb. 12.4. Bandstruktur von GaAs als eines typischen III–V-Halbleiters. (Nach Chelikowsky u. Cohen [12.1])
408
12. Halbleiter
Tabelle 12.3. Bandlücke Eg, effektive Masse m und Spin-Bahnaufspaltung D für einige III–V Halbleiter: m Masse des freien Elektrons, m n effektive Masse der Elektronen, m LD effektive Masse der leichten Löcher, mSD der schweren Löcher, mSOD der „split-off“-Löcher. Die Werte hängen etwas von der Meßmethode ab
GaAs GaSb InSb InAs InP
Eg (0 K) [eV]
Eg (300 K) [eV]
1,52 0,81 0,24 0,43 1,42
1,43 0,7 0,18 0,35 1,35
m n/m
mLD /m
mSD /m
mSOD /m
D [eV]
0,07 0,047 0,015 0,026 0,073
0,08 0,05 0,02 0,025 0,12
0,5 0,3 0,4 0,4 0,6
0,15 0,14 0,11 0,14 0,12
0,34 0,8 0,8 0,4 0,11
lenzbandmaximum und Leitungsbandminimum liegen beide bei C (Abb. 12.4). Ebenso wie bei den tetraedrischen Elementhalbleitern gibt es auch hier drei verschiedene Valenzbänder mit einer qualitativ ähnlichen Gestalt bei C (Abb. 12.3). Wichtige Daten einiger III–VHalbleiter mit direkter Bandlücke sind in Tabelle 12.3 zusammengestellt. Der Vollständigkeit halber sei erwähnt, dass GaP und AlSb eine indirekte Bandlücke (ähnlich Si und Ge) von 2,32 eV bzw. 1,65 eV bei T = 0 K haben. Ähnliche Überlegungen wie im Fall der III–V-Verbindungen führen auch zu einem Verständnis der sog. II–VI-Halbleiter, zu denen z. B. ZnO (3,2 eV), ZnS (3,6 eV), CdS (2,42 eV), CdSe (1,74 eV) und CdTe (1,45 eV) gehören. In Klammern sind jeweils die direkten Bandlücken Eg bei 300 K angegeben. Auch hier liegt eine gemischt ionogen-kovalente Bindung vor, jedoch mit mehr ionischem Anteil als bei den III–V-Halbleitern. Die Kristallstruktur ist entweder die der III–V-Halbleiter (ZnS) oder die des Wurtzits (Abschn. 2.5). In beiden Fällen liegt eine tetraedrische Nahordnung vor, die auf die sp3-Hybridisierung der Bindungspartner zurückzuführen ist.
12.2 Ladungsträgerdichte im intrinsischen Halbleiter Gemäß der Definition der Beweglichkeit im Abschn. 9.5 lässt sich die elektrische Leitfähigkeit r eines Halbleiters, in dem Elektronen und Löcher den Stromtransport tragen, schreiben als r jej
nln plp :
12:2
Hierbei sind ln und lp die Beweglichkeiten der Elektronen bzw. Löcher und n bzw. p die entsprechenden Volumenkonzentrationen der Ladungsträger. Die Schreibweise in (12.2) trägt bereits der Tatsache Rechnung, dass man in erster Näherung eine k- bzw. Energieabhängigkeit der Größen ln und lp vernachlässigt, weil man im allgemeinen nur Ladungsträger betrachten muss, die sich im para-
12.2 Ladungsträgerdichte im intrinsischen Halbleiter
409
bolischen Teil der Bänder befinden, wo die effektive Massennäherung (d. h. m n und m p konstant) gilt. Wegen des verschiedenen Vorzeichens der Driftgeschwindigkeit v und der elektrischen Ladung e von Löchern und Elektronen tragen beide Ladungsträgersorten gleichsinnig zu r bei. Im Gegensatz zur metallischen Leitfähigkeit bewirkt die bei Halbleitern vorhandene Bandlücke Eg, die zur Erzeugung „freier“ Ladungsträger thermisch „übersprungen“ werden muss, eine starke Abhängigkeit der Ladungsträgerkonzentration n und p von der Temperatur T. Als intrinsisch bezeichnet man einen Halbleiter, bei dem „freie“ Elektronen und Löcher nur durch elektronische Anregungen aus dem Valenzband ins Leitungsband zustande kommen. (In Abschn. 12.3 werden zusätzlich Anregungen aus Störstellen betrachtet.) Wie in jedem Festkörper muss natürlich auch im Halbleiter die Besetzung der Energieniveaus der Fermi-Statistik f (E, T) (Abschn. 6.3) gehorchen, d. h. 1
n DL
Ef
E; TdE ;
12:3 a EL
und für Löcher E
V
p
DV
E1
f
E; TdE :
12:3 b
1
Eigentlich sollten die Integrale bis zur oberen bzw. unteren Kante der Bänder laufen. Da jedoch die Fermi-Funktion f (E, T) genügend stark abfällt, können die Integrale bis ins Unendliche durchgeführt werden. DL (E) und DV (E) sind die Zustandsdichten im Leitungsbzw. Valenzband, für die im Bereich der parabolischen Näherung (m konstant) gilt [vgl. (6.11)]:
2mn3=2 p E EL ;
E > EL ;
12:4 a 2p2 h3
2mp3=2 p EV E ;
E < EV : DV
E
12:4 b 2p2 h3 Die Dichte im Bereich des verbotenen Bandes EV < E < EL ist natürlich gleich Null. Da im intrinsischen Halbleiter alle „freien“ Elektronen im Leitungsband aus Zuständen im Valenzband stammen, muss die Konzentration der Löcher p gleich der Zahl der Elektronen n sein. Es ergeben sich also Verhältnisse wie in Abb. 12.5. Wenn die effektiven Massen m n und m p und damit die Zustandsdichten DL und DV gleich sind, muss das Fermi-Niveau EF in der Mitte des verbotenen Bandes liegen. Für voneinander verschiedene DL und DV verschiebt sich EF geringfügig zu der einen oder anderen Bandkante hin, damit die Besetzungsintegrale (12.3) gleich werden.
DL
E
410
12. Halbleiter
Abb. 12.5. (a) Fermi-Funktion f (E). Zustandsdichte D (E) und Elektronen- (n) bzw. Löcherkonzentration (p) in Leitungs- und Valenzband für den Fall, dass die Zustandsdichten in Leitungsund Valenzband gleich sind (schematisch). (b) Die gleiche Figur für den Fall ungleicher Zustandsdichten in Leitungs- und Valenzband. Wieder muss die Zahl der Löcher gleich der Zahl der Elektronen sein. Deswegen liegt jetzt das Fermi-Niveau nicht mehr in der Mitte zwischen Leitungs- und Valenzband und seine Lage ist temperaturabhängig
Da die „Aufweichungszone“ der Fermi-Funktion (*2 k T ) bei üblichen Temperaturen klein ist gegen den Bandabstand (*1 eV), lässt sich innerhalb der Bänder (E > EL bzw. E < EV ) die FermiFunktion f (E, T) durch die Boltzmann-Besetzungswahrscheinlichkeit annähern; d. h., für das Leitungsband gilt: ! 1 E EF ! exp 1 fur E EF 2 k T : kT E EF 1 exp kT (12.5) Damit folgt für die Elektronenkonzentration n im Leitungsband nach (12.3 a) und (12.4 a) 1
2mn3=2 EF =k T p E=k T E EL e e dE :
12:6 n 2p2 h3 EL
Mittels der Substitution XL = (E–EL)/k T ergibt sich die Darstellung: !1
2mn3=2 E L EF 1=2 3=2 k n
T exp XL e XL dXL :
12:7 kT 2p2 h3 0
Über eine analoge Rechnung für das Valenzband folgen schließlich die Darstellungen: ! ! !3=2 2 p mnk T EL E F E E L F L Neff ; exp exp n2 h2 kT kT
12:8 a
12.2 Ladungsträgerdichte im intrinsischen Halbleiter
2 p mpk T p2 h2
!3=2
EV
exp
kT
EF
! V Neff exp
EV
kT
EF
411
! :
12:8 b
Man sieht, dass geringe Konzentrationen freier Ladungsträger im Halbleiter näherungsweise die Beschreibung mit der BoltzmannStatistik [Näherung der Fermi-Statistik für
E EF 2 k T ] zulassen. Vergleicht man Abb. 12.5 mit den Darstellungen des Potentialtopfmodells in Kap. 6, so lässt sich das Leitungsband formal als ein Potentialtopf auffassen, bei dem das Fermi-Niveau EF weit (k T ) unterhalb des Potentialtopfbodens EL liegt. Die Schreibweise der Gln. (12.8 a u. b) mit Hilfe der sog. effekV tiven Zustandsdichten N Leff bzw. N eff lässt weiter die formale Interpretation zu, dass man sich das gesamte Leitungsband bzw. Valenzband durch ein einziges Energieniveau EL bzw. EV (BandkanV ten) mit der Zustandsdichte N Leff bzw. N eff (temperaturabhängig!) charakterisiert denkt, dessen Besetzungsdichte n bzw. p mittels Boltzmann-Faktoren (Energie jeweils von EF gezählt) geregelt wird. Diese Näherung, die häufig für Halbleiter Gültigkeit hat, nennt man die Näherung der Nichtentartung. Durch hohe Konzentration von Störstellen (Abschn. 12.3) kann man auch in Halbleitern sehr hohe Ladungsträgerdichten erzeugen. Dann bricht diese Näherung zusammen und man spricht von entarteten Halbleitern. Aus (12.8 a, b) lässt sich folgende allgemeingültige Beziehung ableiten (Eg = EL–EV): np
k
E = T L V Neff e g Neff
kT
4
2 p h2
!3
mnmp3=2 e
k
Eg = T
:
12:9
Diese Gleichung besagt, dass für einen speziellen Halbleiter, der vollständig charakterisiert ist durch seine absolute Bandlücke Eg und die effektiven Massen m n und m p im Leitungs- und Valenzband, Elektronen- und Löcherkonzentration sich in Abhängigkeit von der Temperatur nach Art eines „Massenwirkungsgesetzes“ einstellen. Nehmen wir weiter an, dass wir es mit einem intrinsischen Halbleiter (n = p) zu tun haben, dann hängt die sog. intrinsische Ladungsträgerkonzentration ni wie folgt von der Temperatur ab: q L NV e ni pi Neff eff
k
Eg =2 T
2
!3=2
kT 2 p h
2
mnmp3=4 e
Eg =2
kT :
12:10 Für die wichtigen Materialien Ge, Si und GaAs sind die Werte für ni und Eg in Tabelle 12.4 zusammengestellt.
412
12. Halbleiter
Tabelle 12.4. Bandlücke Eg und Eigenleitungskonzentration ni für Germanium, Silizium und Galliumarsenid bei 300 K
Ge Si GaAs
Eg [eV]
ni [cm–3]
0,67 1,1 1,43
2,4´1013 1,5´1010 5´107
Nach (12.8 a u. b) stellt sich bei gegebener Temperatur das Fermi-Niveau in einem intrinsischen Halbleiter so ein, dass Ladungsneutralität gegeben ist, d. h. L n p Neff e
e
k
2EF = T
EF
k
k
EL = T EF = T
e
V Neff e
k
EV = T
V Neff
E E =k T e V L ; L Neff
e
k
EF = T
;
12:11
12:12
EL EV k T E L EV 3 V L ln
Neff k T ln
mp=mn : =Neff 2 2 2 4
12:13
Falls effektive Zustandsdichten bzw. effektive Massen, d. h. also auch Bandkrümmungen von Leitungs- und Valenzband, gleich wären, läge im intrinsischen Halbleiter das Fermi-Niveau genau mitten im verbotenen Band, und dies für alle Temperaturen. Sind die effektiven Zustandsdichten in Leitungsband und Valenzband verschieden, so liegt die Fermi-Funktion asymmetrisch zu den Bandkanten EL und EV (Abb. 12.5) und das Fermi-Niveau zeigt eine schwache Temperaturabhängigkeit gemäß (12.13).
12.3 Dotierung von Halbleitern Die intrinsische Ladungsträgerkonzentration ni von 1,5´1010 cm–3 (bei 300 K) für Si reicht bei weitem nicht aus, um die in der Praxis erforderlichen Stromdichten in Halbleiterbauelementen zu erzeugen. Über Größenordnungen höhere Konzentrationen als ni lassen sich durch Dotieren, d. h. Einbau von elektrisch aktiven Störstellen, in einem Halbleiter erzeugen. Die meisten Halbleiter lassen sich als Einkristalle überhaupt nicht so rein züchten, dass man intrinsische Leitfähigkeit bei Raumtemperatur beobachten könnte. Unbeabsichtigte Dotierung erzeugt bei den reinsten, heute käuflichen GaAs-Einkristallen z. B. Ladungsträgerdichten im Bereich von 1016 cm–3 (bei 300 K) im Vergleich zur entsprechenden intrinsischen Konzentration von ni = 5´107 cm–3. Elektrisch aktive Störstellen in einem Halbleiter erhöhen entweder die Konzentration „freier“ Elektronen oder „freier“ Löcher, in-
12.3 Dotierung von Halbleitern
413
dem sie Elektronen an das Leitungsband abgeben oder aus dem Valenzband aufnehmen. Man nennt diese Störstellen dann Donatoren bzw. Akzeptoren. Ein Donator in einem Si-Gitter entsteht z. B., wenn man in ein Si-Gitter statt eines IV-wertigen Si-Atoms ein fünfwertiges Atom wie P bzw. As oder Sb einbaut. Bei diesen Fremdatomen liegt statt der 3 s 2 3 p 2-Si-Konfiguration eine s 2 p 3Konfiguration in der äußeren Schale vor. Um die tetraedrische Bindungsstruktur eines sp 3-Hybrids im Gitter anzunehmen, sind beim fünfwertigen Atom nur die Elektronen s 2 p 2 erforderlich; ein überschüssiges Elektron der p-Schale findet „keinen Platz“ in der kovalenten sp 3-Hybridbindung. Man kann sich dieses Elektron als schwach gebunden an den positiv geladenen Donator-Rumpf, der – tetraedrisch gebunden – ein Si-Atom im Gitter vertritt, vorstellen (Abb. 12.6 a). Näherungsweise lässt sich eine solche fünfwertige Donatorstörstelle im Si-Gitter als ein einwertiger, positiver Rumpf vorstellen, an den ein Elektron gebunden ist, das abgetrennt werden kann und sich dann „frei“ im Gitter bewegen kann; d. h., bei Ionisation wird dieses Elektron aus einem Störstellenniveau ins Leitungsband angeregt. Die Donatorstörstelle lässt sich also als wasserstoffartiges Zentrum beschreiben, bei dem die Coulomb-Anziehung zwischen Kern und Valenzelektron durch das Vorhandensein der Si-Elektronen in der Umgebung abgeschirmt wird. Um die Anregungs- und Ionisationsenergie des überschüssigen Phosphor-Elektrons abzuschätzen, kann man die Abschirmung durch das umgebende Si in grober Näherung durch Einsetzen der Dielektrizitätskonstante des Si (eSi = 11,7) in die Energieterme des
Abb. 12.6 a, b. Schematische Darstellung der Wirkung eines Donators (a) bzw. eines Akzeptors (b) in einem Silizium-Gitter. Das fünfwertige Phosphor-Atom wird anstelle eines Silizium-Atoms im Gitter eingebaut. Das fünfte Elektron des Phosphor-Atoms wird zur Bindung nicht benötigt und ist nur schwach an das Phosphor-Atom gebunden. Die Bindungsenergie lässt sich abschätzen, wenn man das System als ein in ein Dielektrikum eingebettetes Wasserstoff-Modell behandelt. Der Fall des Akzeptors (b) lässt sich analog beschreiben: Das dreiwertige Bor nimmt ein zusätzliches Elektron aus dem Silizium-Gitter auf. Dadurch entsteht ein Loch im Valenzband, das um das negativ geladene Fremdatom kreist. Gitterabstand und Ausdehnung des Störzentrums sind nicht maßstabgetreu. In Wirklichkeit ist der Durchmesser des 1. Bohrschen Radius der „Störstellenbahn“ etwa zehnmal so groß wie der Gitterabstand
414
12. Halbleiter
Wasserstoffatoms berücksichtigen. Die Energieterme des Wasserstoff-Leuchtelektrons EnH
me e4
1 2
4 p e0 h n2 2
12:14
ergeben mit n = 1 eine Ionisierungsenergie von 13,6 eV. Für das PDonatorzentrum muss die Masse me des freien Elektrons durch die effektive Masse m n = 0,3 me eines Si-Leitungselektrons und die Dielektrizitätskonstante e0 des Vakuums durch e0·eSi ersetzt werden. Damit folgt für die Ionisierungsenergie des Donators Ed ein Wert von *30 meV. Das Energieniveau ED des Donatorelektrons im gebundenen Zustand sollte also etwa 30 meV unter der Leitungsbandkante EL liegen. Einen noch kleineren Wert erhält man für Germanium. Dort ist eGe = 15,8 und m n *0,12 me. Es ergibt sich hier die Abschätzung (EL–ED)&6 meV. Die Situation ist im Bänderschema der Abb. 12.7 dargestellt. Eingezeichnet ist nur der Grundzustand des Donators. Zwischen diesem Grundzustand und der Leitungsbandkante existieren noch angeregte Zustände [n > 1 in (12.14)], die, immer dichter liegend, in das Kontinuum des Leitungsbandes übergehen. Die Situation ist sehr ähnlich der des H-Atoms, wo dem Leitungsbandkontinuum die ungebundenen Zustände oberhalb des Vakuumniveaus entsprechen. Die energetische Lage dieser angeregten Zustände lässt sich z. B. aus optischen Spektren erschließen. Abbildung 12.8 zeigt ein Absorptionsspektrum des Sb-Donators in Ge. Die Banden unterhalb von 9,6 meV entsprechen Anregungen aus dem Grundzustand in höhere, angeregte Zustände. Das Spektrum ist komplizierter, als aus dem beschriebenen Wasserstoffmodell folgen würde, da durch die Kristallumgebung teilweise Entartungen von Wasserstofftermen aufgehoben werden. Oberhalb von 9,6 meV geht die Anregung in das Kontinuum des Leitungsbandes. Wie aus dem experimentellen Beispiel der Abb. 12.8 zu entnehmen ist, gestattet die einfache Beschreibung eines Donatorzentrums durch das H-Atommodell die Abschätzung der Größenordnung der Ionisierungsenergie Ed. Im Rahmen dieses Modells müss-
Abb. 12.7. Qualitative Lage der Grundzustandsniveaus von Donatoren und Akzeptoren in bezug auf die Unterkante des Leitungsbandes EL bzw. die Oberkante des Valenzbandes EV. Ed und Ea sind die Ionisierungsenergien der Donatoren bzw. Akzeptoren
12.3 Dotierung von Halbleitern
415
Abb. 12.8. Optisches Absorptionsspektrum eines Sb-Donators in Germanium, gemessen bei T = 9 K. (Nach Reuszer u. Fischer [12.2])
ten alle Donatorstörstellen P, As, Sb usw. in ein und demselben Halbleitermaterial die gleiche Ionisierungsenergie Ed ergeben. Die experimentell ermittelten Werte Ed in Tabelle 12.5 zeigen jedoch, dass Abweichungen von Donator zu Donator gefunden werden. Es verwundert nicht, dass die summarische Beschreibung der abschirmenden Wirkung der Halbleiterelektronen durch eine Dielektrizitätskonstante zu einfach ist, um die Feinheiten der Atomistik zu verstehen. Dass die Beschreibung durch eine makroskopische Dielektrizitätskonstante dennoch so gut an die wirklichen Werte für Ed heranführt, liegt daran, dass durch die Abschirmung die Wellenfunktion des gebundenen Valenzelektrons des Donators über sehr viele Gitterkonstanten „verschmiert“ wird. Einsetzen der Halbleiterdielektrizitätskonstanten eHL in die Formel für den Bohrschen Radius r e0 eHL
h2 p mne2
12:15
bläht diesen um eHL (*12 für Si) im Vergleich zum (Wasserstoff) Bohr-Radius auf. Das gebundene Valenzelektron der Donatorstörstelle ist also über größenordnungsmäßig 103 Gitteratome „verschmiert“. Tabelle 12.5. Energetischer Abstand Ed einiger Donatorenniveaus vom Leitungsband für Silizium und Germanium
Si Ge
P [meV]
As [meV]
Sb [meV]
45 13
54 14
43 10
416
12. Halbleiter
Tabelle 12.6. Energetischer Abstand Ea einiger Akzeptorenniveaus vom Valenzband für Silizium und Germanium
Si Ge
B [meV]
Al [meV]
Ga [meV]
In [meV]
45 11
67 11
74 11
153 12
Baut man in das Gitter eines IV-wertigen Elementhalbleiters (Si, Ge) ein dreiwertiges Fremdatom (B, Al, Ga, In) ein, so kann der für die tetraedrische Bindung verantwortliche sp 3-Hybrid leicht ein Elektron aus dem Valenzband unter Zurücklassung eines Defektelektrons aufnehmen (Abb. 12.6). Solche Störstellen heißen Akzeptoren. Ein Akzeptor ist bei sehr tiefen Temperaturen neutral. Er wird ionisiert, indem bei genügender Energiezufuhr ein Elektron energetisch aus dem Valenzband in das sog. Akzeptorenniveau angehoben wird. Akzeptoren haben also den Ladungscharakter „von neutral nach negativ“, während Donatoren von neutral nach positiv ionisiert werden. Das in der Nähe eines ionisierten Akzeptors entstandene Defektelektron befindet sich im abgeschirmten CoulombFeld der ortsfesten, negativen Störstelle und die Abtrennenergie, die zur Erzeugung eines „freien“ Loches im Valenzband aufgewendet werden muss, kann wie beim Donator mit Hilfe des Wasserstoffmodells abgeschätzt werden. Die Verhältnisse bei Donatoren und Akzeptoren entsprechen sich bis auf das Vorzeichen der Ladung grundsätzlich. Tabelle 12.6 zeigt, dass die Ionisierungsenergien Ea für Akzeptoren in der Realität ähnlich denen für Donatoren sind. Mit Donatoren dotierte Halbleiter heißen n- und mit Akzeptoren dotierte Materialien p-Halbleiter. Die niedrigsten Verunreinigungskonzentrationen, die man heute bei Halbleitereinkristallen erreichen kann, liegen in der Größenordnung von 1012 cm–3. Ge mit einer intrinsischen Ladungsträgerkonzentration ni von 2,4´1013 cm–3 (bei 300 K) ist also als bei Zimmertemperatur intrinsisches Material erhältlich, während Si (ni = 1,5´1010 cm–3 bei 300 K) bei Zimmertemperatur nicht intrinsische Leitfähigkeit zeigt. Neben den hier besprochenen, elektrisch aktiven Störstellen kann ein Halbleiter natürlich noch eine Vielzahl von Fremdatomen und Defekten besitzen, die nicht so leicht ionisiert werden können und sich deshalb in der elektrischen Leitfähigkeit nicht zeigen.
12.4 Ladungsträgerdichte in dotierten Halbleitern Im dotierten Halbleiter kann ein Elektron im Leitungsband entweder aus dem Valenzband oder aus einer ionisierten Donatorstörstelle stammen. Entsprechend kann ein Loch im Valenzband zu einem Elektron in einer negativ geladenen (ionisierten) Akzeptorstörstelle
12.4 Ladungsträgerdichte in dotierten Halbleitern
417
Abb. 12.9. Erklärung der in n- und p-Halbleitern üblichen Bezeichnungen für Ladungsträger- und Störstellenkonzentrationen: n und p sind die Konzentrationen von „freien“ Elektronen und Löchern. Die Gesamtkonzentration ND und NA von Donatoren und Akzeptoren setzt sich zusammen aus den Dichten von neutralen N 0D bzw. N 0A und ionisierten Donatoren N +D bzw. Akzeptoren N –A . Elektronen im Leitungsband (n) und Löcher im Valenzband (p) rühren entweder von Band-Band-Anregungen oder aus Störstellen her
oder zu einem Elektron im Leitungsband gehören. Für einen nichtentarteten Halbleiter muss trotzdem die Besetzung im Leitungsbzw. Valenzband nach der Boltzmann-Näherung (12.8 a u. b) geregelt sein. Es gilt deshalb auch für den dotierten Halbleiter das sog. „Massenwirkungsgesetz“ L V n p Neff Neff e
k
Eg = T
;
12:9
in dem die Lage des Fermi-Niveaus EF nicht mehr auftritt. Im Vergleich zum intrinsischen Halbleiter regelt sich die Lage von EF nach einer nun etwas komplizierteren „Neutralitätsbedingung“, die auch der Ladung in den Störstellen Rechnung trägt: Die im folgenden verwendeten Bezeichnungen sind in Abb. 12.9 schematisch dargestellt. Die Dichte aller vorhandenen Donatoren ND bzw. aller Akzeptoren NA setzt sich zusammen aus der Dichte N 0D bzw. N 0A der Donatoren bzw. Akzeptoren, die neutral sind, und der Dichte – N +D der ionisierten Donatoren (dann positiv geladen) bzw. N A der ionisierten Akzeptoren (negativ geladen). Im homogenen Halbleiter – muss die negative Ladungsdichte n+N A durch eine gleichgroße po+ sitive Ladungsdichte p+N D (s. Abb. 12.9) kompensiert sein. Folgende Neutralitätsbedingung regelt also die Lage des Fermi-Niveaus EF im homogen dotierten Halbleiter: n NA p ND ;
12:16
wobei gilt ND ND0 ND ;
12:17 a
NA NA0 NA :
12:17 b
418
12. Halbleiter
Für übliche Störstellenkonzentrationen (1013–1017 cm–3), bei denen sich die einzelnen Donatoren oder Akzeptoren noch nicht beeinflussen, gilt in guter Näherung für die Besetzung der Donatoren mit Elektronen (nD) bzw. der Akzeptoren mit Löchern (pA): nD ND0 ND 1 exp
ED
EF =k T
1
;
12:18 a
pA NA0 NA 1 exp
EF
EA =k T
1
:
12:18 b
Eine geringfügige Modifikation der Fermi-Funktion (Multiplikation des Exponentialterms mit 1/2), die der Möglichkeit des Einfangs nur eines Elektrons, jedoch unabhängig von seiner Spinstellung, Rechnung trägt, wird hier nicht betrachtet. Der allgemeine Fall, der sowohl Donatoren als auch Akzeptoren gleichzeitig berücksichtigt, kann nur numerisch behandelt werden. Im folgenden beschränken wir uns deshalb auf die Behandlung eines reinen n-Halbleiters, in dem nur Donatoren vorhanden sind; es müssen dann die Gln. (12.8 a, 12.17 a, 12.18 a) zur Berechnung der Ladungsträgerkonzentration herangezogen werden. Zur besseren Übersichtlichkeit sind sie hier noch einmal zusammengestellt: L n Neff e
k
EL EF = T
;
12:8 a
ND ND0 ND ; ND0
12:17 a EF =k T
ND 1 exp
ED
1
:
12:18 a
„Freie“ Elektronen im Leitungsband können nur aus Donatoren oder aus dem Valenzband stammen, d. h. n ND p :
12:19
Als weitere Vereinfachung nehmen wir an, dass der Hauptbeitrag zur Leitfähigkeit von den Donatoren herrührt, d. h., dass N +D ni (n p = n 2i ) angenommen werden kann. Dies ist z. B. für Si (ni = 1,5´1010 cm–3 bei 300 K) schon bei relativ geringen Dotierungen gegeben. Für diesen einfachen Fall gilt statt (12.19) n ND ND
ND0 ;
12:20
d. h. mit (12.18 a):
!
1
n ND 1
1 exp
ED
EF =k T
:
12:21
EF lässt sich hier mit Hilfe von (12.8 a) ausdrücken durch L e
n=Neff
k
EL = T
e
k
EF = T
;
12:22
d. h. n
ND 1e
k
Ed = T
; L n=Neff
12:23
12.4 Ladungsträgerdichte in dotierten Halbleitern
419
wobei Ed = EL–ED der energetische Abstand des Donatorenniveaus von der Leitungsbandkante ist. Auflösen von (12.23) nach n ergibt: n
n2 Ed =k T e ND : L Neff
Die physikalisch sinnvolle Lösung ist s! 1 ND E =k T : n 2ND 1 1 4 L e d Neff
12:24
12:25
Diese Beziehung für die Leitungselektronenkonzentration im nHalbleiter ergibt folgende Grenzfälle: I) Wenn die Temperatur T so klein wird, dass L 4
ND =Neff e
k
Ed = T
1
ist, dann ergibt sich q L e Ed =2 k T : n ND Neff
12:26
12:27
In diesem Bereich, wo noch genügend viele Donatoren ihr Valenzelektron enthalten, d. h. nicht ionisiert sind, spricht man von Störstellenreserve. Man beachte die Ähnlichkeit von V und EV (12.27) mit (12.10): Statt der Valenzbandgrößen N eff sind nur die entsprechenden Donatorgrößen ND und ED (d. h. statt Eg hier Ed) einzusetzen. In diesem Temperaturbereich hängt die Elektronenkonzentration wie bei einem intrinsischen Halbleiter exponentiell von der Temperatur T ab, wobei nur statt Eg die wesentlich kleinere Donator-Ionisationsenergie Ed eingeht. Der hier abgehandelte Grenzfall reiner n-Dotierung wird in der Praxis kaum realisiert. Meistens sind auch geringere Mengen von Akzeptoren vorhanden, was zur Folge hat, dass das Fermi-Niveau unterhalb ED liegt. Die Aktivierungsenergie wird deshalb meistens als Ed gemessen. II) Für Temperaturen T, bei denen gilt L e 4
ND =Neff
k
Ed = T
1;
12:28
ergibt (12.25) n ND const ;
12:29
d. h., die Konzentration von Elektronen im Leitungsband hat die maximal erreichbare Konzentration erreicht; alle Donatoren sind ionisiert, man spricht vom Erschöpfungszustand. In erster Näherung spielen Elektronen, die aus dem Valenzband angeregt sind, noch keine Rolle. III) Erst bei weiterer Steigerung der Temperatur nimmt die Konzentration der über die Lücke Eg angeregten Elektronen zu und wird irgendwann die aus Störstellen freigesetzte Elektronen-
420
12. Halbleiter
dichte überwiegen. Der n-Halbleiter verhält sich jetzt wie ein intrinsischer Halbleiter und man spricht in diesem Temperaturbereich vom intrinsischen Bereich der Trägerkonzentration. Die verschiedenen Bereiche der Ladungsträgerkonzentration sind mit der entsprechenden Lage des Fermi-Niveaus EF in Abb. 12.10 dargestellt. Für die Lage des Fermi-Niveaus EF in Abhängigkeit von der Temperatur, die hier nicht explizit ausgerechnet wurde, gilt eine analoge Diskussion wie im Fall des intrinsischen Halbleiters. Im Bereich der Störstellenreserve stelle man sich nur die Valenzbandkante durch das Donatorenniveau repräsentiert vor. Im Bereich sehr hoher Temperaturen, d. h. im intrinsischen Bereich, gelten die Gesetzmäßigkeiten des intrinsischen Halbleiters. Bei n-dotiertem Si mit einer Phosphor-Donatorenkonzentration von 3´1014 cm–3 erstreckt sich der Erschöpfungsbereich zwischen etwa 45 K und 500 K, d. h., bei Zimmertemperatur sind unter diesen Umständen schon alle Donatoren ionisiert. Abbildung 12.11 zeigt als
Abb. 12.10. (a) Qualitative Abhängigkeit der Elektronenkonzentration n im Leitungsband eines n-Halbleiters von der Temperatur für zwei verschiedene Donatorkonzentrationen ND ' > ND . Eg ist die Breite des verbotenen Bandes und Ed die Ionisierungsenergie der Donatorstörstelle. (b) Qualitative Lage der Fermi-Energie EF (T) bei demselben Halbleiter in Abhängigkeit von der Temperatur. EL und EV sind die Unterkante bzw. Oberkante von Leitungs- bzw. Valenzband, ED die Lage des Donatorniveaus und Ei die intrinsische Energie, wo das Fermi-Niveau im intrinsischen Halbleiter liegt
12.5 Leitfähigkeit von Halbleitern
421
Abb. 12.11. Durch Hall-Effekt (s. Tafel XIV) gemessene Konzentration n freier Elektronen in n-Germanium. Für die Proben (1) bis (6) variiert die Donatorkonzentration ND zwischen 1018 und 1013 cm–3. Die im intrinsischen Bereich vorliegende Elektronenkonzentration als Funktion der Temperatur ist gestrichelt eingezeichnet. (Nach Conwell [12.3])
experimentelles Beispiel die aus Hall-Effekt-Messungen bestimmten Elektronenkonzentrationen n (T) in n-dotiertem Ge für Störstellenkonzentration zwischen 1013 cm–3 und 1018 cm–3. Die in Abb. 12.10 qualitativ gezeigten Zusammenhänge sind klar zu erkennen.
12.5 Leitfähigkeit von Halbleitern Wie schon im Abschn. 9.5 genauer diskutiert, ist für die Berechnung der elektrischen Leitfähigkeit r als Funktion der Temperatur T eine zusätzliche Betrachtung der Beweglichkeit erforderlich. Für einen Halbleiter müssen dabei sowohl die Elektronen im unteren
422
12. Halbleiter
Leitungsbandbereich (Konzentration: n, Beweglichkeit: ln) als auch die Löcher nahe der oberen Valenzbandkante (p, lp) berücksichtigt werden. Die Stromdichte j im isotropen Halbleiter (nichttensorielle Leitfähigkeit r ) ist also j e
n ln p lp E :
12:30
Im Gegensatz zum Metall, wo nur Elektronen an der Fermi-Kante berücksichtigt werden müssen, d. h. l = l (EF) (s. Abschn. 9.5), sind die Beweglichkeiten ln und lp beim Halbleiter als Mittelwerte über die von Elektronen bzw. Löchern besetzten Zustände im unteren Leitungsband bzw. oberen Valenzband aufzufassen. In nichtentarteten Halbleitern kann in diesen Bereichen die Fermi-Statistik durch die Boltzmann-Statistik angenähert werden. Im Rahmen dieser Näherung liefert diese Mittelung, die im vorliegenden Zusammenhang nicht näher ausgeführt wird, ln
1 hs
kv 2
ki e: mn hv 2
ki
12:31
Hierbei ist v
k die im elektrischen Feld E vorliegende Geschwindigkeit eines Elektrons im Punkt k des reziproken Raumes und s (k) seine zugehörige Relaxationszeit (genauere Definition im Abschn. 9.4). Für Defektelektronen sind in (12.31) diese Größen an entsprechenden Stellen des Valenzbandes zu nehmen und die effektive Masse m n der Elektronen durch die der Löcher zu ersetzen. Statt einer rigorosen Lösung der Boltzmann-Gleichung und einer exakten weiteren Betrachtung von (12.31) beschränken wir uns im vorliegenden Zusammenhang ähnlich wie für Metalle (Abschn. 9.5) auf eine mehr qualitative Diskussion der Streuprozesse, die Elektronen bzw. Löcher im Halbleiter erleiden. Elektronen und Löcher verhalten sich hierbei qualitativ gleichwertig. Stark vereinfacht folgt aus (12.31) eine Proportionalität der Beweglichkeit zur Relaxationszeit (l ! s), die für Metalle nach (9.58 b) exakt gegeben ist. Da s auch proportional zur mittleren freien Flugzeit zwischen zwei Stößen ist, folgt 1 / hviR ; s
12:32
wobei R den Streuquerschnitt für Elektronen bzw. Löcher an einem Streuzentrum darstellt. hvi ist im Gegensatz zu Metallen (Abschn. 9.5) als thermischer Mittelwert (nach Boltzmann-Statistik) über alle Elektronen- bzw. Löchergeschwindigkeiten im unteren Leitungsband- bzw. oberen Valenzbandbereich zu betrachten. Gleichung (12.32) gibt im wesentlichen die Stoßwahrscheinlichkeit für Elektronen bzw. Löcher an. Wegen der Gültigkeit der Boltzmann-Statistik gilt im Halbleiter p hvi / T :
12:33
12.5 Leitfähigkeit von Halbleitern
423
Betrachten wir nun Streuung an akustischen Phononen, so kann man wie bei Metallen (Abschn. 9.5) den Streuquerschnitt RPh durch das Quadrat der mittleren Schwingungsamplitude hs2
qi eines Phonons (q, xq) abschätzen, d. h., für Temperaturen T H, der Debye-Temperatur, folgt (Abschn. 9.5) M x2q hs2
qi k T ;
12:34 a
RPh T :
12:34 b
Wegen (12.32, 12.33) folgt somit die Abschätzung lPh T
3=2
:
12:35
Zusätzlich zur hier betrachteten üblichen Streuung an Phononen können in piezoelektrischen Halbleitern (z. B. III–V- und II–VIVerbindungen) markante Beiträge von Streuung an Phononen herrühren, die mit einer Polarisation behaftet sind (piezoelektrische Streuung). Ferner können Ladungsträger an optischen Phononen höherer Energie gestreut werden. In diesem Fall wird die Beschreibung außerordentlich kompliziert, da die Relaxationszeitnäherung (Abschn. 9.4) weitgehend zusammenbricht. In Halbleitern spielt insbesondere die Streuung an geladenen Störstellen (ionisierte Donatoren oder Akzeptoren) eine wichtige Rolle. Ein an einer punktförmigen, geladenen Störstelle „vorbeifliegender“ Ladungsträger unterliegt dabei der Coulomb-Wechselwirkung und der Streuquerschnitt RSt für diese „Rutherford-Streuung“ ist RSt / hvi
4
;
12:36
wobei pfür seine Geschwindigkeit der thermische Mittelwert hvi / T angenommen wird. Gleichung (12.36) folgt aus einer klassischen oder quantenmechanischen Berechnung des Streuprozesses (siehe einschlägige Lehrbücher der Mechanik oder Quantenmechanik). Da die Gesamtstreuwahrscheinlichkeit ferner proportional zur Konzentration NSt der Störstellen sein muss, folgt mit (12.32, 12.33 und 12.36) 1 / NSt =T 3=2 sSt
12:37
Abb. 12.12. Schematische Abhängigkeit der Beweglichkeit l in einem Halbleiter von der Temperatur bei Streuung an Phononen und an geladenen Störstellen
424
12. Halbleiter
Abb. 12.13. Experimentell ermittelte Abhängigkeit der Beweglichkeit l freier Elektronen von der Temperatur. Für die Proben (1) bis (6) variiert die Donatorkonzentration ND zwischen 1018 und 1013 cm–3. Es handelt sich um die Proben, die auch für die Messungen in Abb. 12.11 verwendet wurden. (Nach Conwell [12.3])
bzw. für die Beweglichkeit, sofern nur Streuung an geladenen Störstellen vorliegt, lSt / T 3=2 :
12:38
Die reziproke Gesamtbeweglichkeit bei Vorliegen von Störstellenund Phononenstreuung ergibt sich durch Summation der reziproken Beweglichkeit aus (12.35) und (12.38), d. h., qualitativ ergibt sich ein Verlauf wie in Abb. 12.12 dargestellt. Abbildung 12.13 zeigt die aus Hall-Effekt- und Leitfähigkeitsmessungen ermittelte experimentelle Abhängigkeit l (T) der Elektronenbeweglichkeit für n-Ge; für die reinsten Kristalle (ND^1013 cm–3) liegt l (T) nahe bei der theoretisch erwarteten Abhängigkeit (12.35) für reine Phononenstreuung. Mit wachsender Donatorenkonzentration ND ist der durch (12.38) hinzukommende Störstellenbeitrag (s. a. Abb. 12.12) zu erkennen. Abbildung 12.14 zeigt, dass der charakteristische Beweglichkeitsverlauf aus Abb. 12.12 in der Abhängigkeit der Leitfähigkeit von der Temperatur T im Bereich der Störstellenerschöpfung, wo n (T) nahezu konstant ist (Abb. 12.10, 12.11), durchschlägt. Dort zeigt r (T) ein Maximum, während im Bereich der intrinsischen Leitfähigkeit und der Störstellenreserve (kleine T) die exponentiellen Abhängigkeiten der Ladungsträgerkonzentration n (T) (Abb. 12.11) die schwache Abhängigkeit der Beweglichkeit l von der Temperatur T überdecken. Die experimentellen Ergebnisse der Abb. 12.11, 12.13 und 12.14 wurden jeweils an den gleichen GeProben [durchnummeriert mit (1) bis (6)] gewonnen, so dass die
12.5 Leitfähigkeit von Halbleitern
425
Abb. 12.14. Experimentell ermittelte Leitfähigkeit r von n-Germanium in Abhängigkeit von der Temperatur. Für die Proben (1) bis (6), die auch für die Messungen in den Abb. 12.11 u. 12.13 verwendet wurden, variiert die Donatorkonzentration ND zwischen 1018 und 1013 cm–3. (Nach Conwell [12.3])
Leitfähigkeit r sich unmittelbar aus n (T) und l (T) ausrechnen lässt. Die bisherigen Betrachtungen zur Leitfähigkeit von Halbleitern betreffen das ohmsche Verhalten für relativ niedrige elektrische Felder E , wo die Stromdichte j proportional zu E ist und somit die Leitfähigkeit r durch eine Beweglichkeit l beschrieben wird. In modernen Halbleiterbauelementen mit Dimensionen im Submikrometerbereich erreicht die Feldstärke Werte oberhalb von 105 V/cm; in diesem Hochfeldbereich gilt das Ohmsche Gesetz nicht mehr. Die mittlere Driftgeschwindigkeit der Ladungsträger v D ist nicht mehr proportional zur Feldstärke. Wie Messungen und theoretische Rechnungen ergeben, gilt die Proportionalität v D!E bei den wichtigen Halbleitern Si, Ge, GaAs u.a. bis zu Feldstärken von etwa
426
12. Halbleiter
2´103 V/cm (Abb. 12.15). Für höhere Feldstärken sättigt sich v D für den indirekten Halbleiter Si (ähnlich für Ge) bei einem Wert von v D&107 cm/s. Die Energie, die den Ladungsträgern durch das äußere Feld zugeführt wird, geht durch Phononstreuprozesse weitgehend wieder verloren, sie wird an Schwingungen des Kristallgitters abgegeben. Besonders wirksam sind in diesem Energiebereich Stöße an optischen Phononen. Die Ladungsträger werden also im äußeren Feld entlang der Energiebänder E (k) beschleunigt, bis sie die Energie (bezogen auf EF) optischer Phononen mit hoher Zustandsdichte (etwa 60 meV bei Si, 36 meV bei GaAs) erreichen. Durch Anregung dieser Phononen und weitere Thermalisierung durch niederenergetische akustische Phononen wird die Energieaufnahme begrenzt und die Driftgeschwindigkeit strebt einem Sättigungswert zu. Eine Besonderheit ist bei direkten Halbleitern wie GaAs, InP, GaN zu beobachten, die neben dem C-Minimum des Leitungsbandes energetisch höher liegende Seitenminima bei L und X in der Bandstruktur besitzen (Abb. 12.4). In diesem Fall durchläuft die Driftgeschwindigkeit v D mit wachsender Feldstärke ein Maximum, bevor sie sich bei einem niedrigeren Wert ähnlich wie bei Si sättigt. Die Erklärung für dieses Phänomen, das bei GaAs für Feldstärken zwischen 3´103 V/cm und 105 V/cm zu einem negativen differentiellen Widerstand Anlass gibt, beruht auf der Streuung von Elektronen aus dem niedrigsten C-Leitungsbandminimum in die flachen Seitenminima bei X und L (Abb. 12.4). Solche Streuprozesse setzen ein, wenn die im äußeren Feld aufgenommene Energie ausreicht, die Schwelle bis zum Erreichen der Seitenminima zu überwinden. Während bei GaAs die kleine effektive Masse von 0,068 m0 im C-Minimum zu recht hohen Beweglichkeiten im Niederfeldbereich (< 103 V/cm) Anlass gibt, werden bei Einsetzen der Streuprozesse in die Seitenminima immer mehr Elektronen die wesentlich größere effektive Masse (> m0) der flachen Seitentäler bei X bzw. L annehmen; die Driftgeschwindigkeit v D der Elektronen nimmt ab (Abb. 12.15). Bei weiterer Zunahme der äußeren Feldstärke über 3´105 V/cm hinaus werden dann Elektronen in den Seitentälern der Bandstruktur mit ihrer weitaus höheren effektiven Masse als im C-Tal weiter beschleunigt. Dementsprechend würde v D wieder proportional zur Feldstärke mit einer weitaus geringeren Beweglichkeit als im Niederfeldbereich (< 103 V/cm) zunehmen. In diesem Bereich extrem hoher Felder wird dieses Verhalten jedoch überdeckt durch den Effekt des Lawinendurchbruchs: die beschleunigten Elektronen gewinnen soviel Energie, dass sie weitere Elektronen aus dem Valenzband ins Leitungsband anregen. Die Leitfähigkeit des Halbleiters nimmt lawinenartig durch die Multiplikation freier Ladungsträger zu. Auch dieser Effekt findet Anwendung in Bauelementen. Bemerkenswert an Abb. 12.15 ist, dass der indirekte Halbleiter Si eine ähnliche Sättigungsgeschwindigkeit bei Feldstärken oberhalb von 3´104 V/cm hat wie der direkte Halbleiter GaAs. Bei kleinen Bauelementdimensionen, wo solche Feldstärken auftreten,
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
427
Abb. 12.15. Ladungsträger-Driftgeschwindigkeit vD als Funktion der elektrischen Feldstärke E bei Zimmertemperatur 300 K. Die Kurven für Si und GaAs sind Messdaten an hochreinen kristallinen Proben, die einer Literaturzusammenstellung entnommen wurden. (Nach Sze [12.4]). Die Kurve für GaN entstammt einer Monte Carlo-Simulation. (Nach Gelmont et al. [12.5])
geht also der Geschwindigkeitsvorteil, den das GaAs gegenüber dem Si bei kleineren Feldstärken hat, verloren. Des weiteren sind die hohen Driftgeschwindigkeiten von Halbleitern mit großen Bandlücken wie GaN auffallend. Wegen seiner zusätzlichen hohen thermischen Stabilität eignet sich GaN also grundsätzlich sehr gut für die Verwendung in schnellen Hochtemperaturbauelementen.
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt Die moderne Festkörperphysik ist eng verknüpft mit der Entwicklung der Halbleiterbauelemente, d. h. der Festkörperelektronik. Die Wirkungsweise fast aller Halbleiterbauelemente beruht dabei auf Phänomenen, die auf Inhomogenitäten im Halbleiter zurückzuführen sind. Vor allem inhomogene Konzentrationen von Donator- und Akzeptorstörstellen bewirken interessante Leitfähigkeitsphänomene, die die Konstruktion von Halbleiterbauelementen ermöglichen. Die wichtigsten Grundstrukturen zur Realisierung von Bauelementen sind der sog. p-n-Übergang und der in seiner Funktionsweise ähnliche Metall/Halbleiter-Schottky-Kontakt. Bei einem p-nÜbergang handelt es sich um einen Halbleiterkristall, der auf der einen Seite p-, auf der anderen Seite n-leitend dotiert ist (s. Abb. 12.16). Im einfachsten (in der Realität natürlich nicht zu verwirklichenden) Fall wird der Übergang von der einen in die andere Zone als abrupt angenommen.
428
12. Halbleiter
Abb. 12.16 a–e. Qualitatives Schema eines p-n-Übergangs im thermischen Gleichgewicht. (a) Halbleiterkristall, der auf der einen Seite mit Akzeptoren (NA) und auf der anderen mit Donatoren (ND) dotiert ist. (b) Bänderschema der p- und n-Seite für den gedachten Fall einer totalen Entkopplung beider Seiten. EA und ED bezeichnen die Grundzustände der Akzeptoren bzw. Donatoren; EF ist das Fermi-Niveau. (c) Bänderschema des p-n-Übergangs, wenn beide Seiten im thermischen Gleichgewicht miteinander sind. Der Übergang der p- in die nDotierung ist abrupt angenommen. Die Lagen der Leitungs- bzw. Valenzbandkanten tief im p-Gebiet werden mit E pL bzw. E pV und mit E nL bzw. E nV tief im nGebiet bezeichnet. VD heißt Diffusionsspannung. Im Bereich des p-n-Übergangs stellt sich ein sog. Makropotential V (x) ein. (d) Die aus den ionisierten Störstellen sich ergebende ortsfeste Raumbeladung R
x im Bereich des pn-Übergangs. (e) Qualitativer Verlauf der Konzentrationen von Akzeptoren NA, Donatoren ND, Löchern p und freien Elektronen n; ni ist die intrinsische Ladungsträgerkonzentration; pp und pn bezeichnen die Löcherkonzentration tief im p- bzw. tief im n-Gebiet (entsprechend np, nn). Es ist der häufig auftretende Fall betrachtet, dass im Kristallinnern Donatoren und Akzeptoren fast völlig ionisiert sind
In der Praxis werden solche Dotierungsinhomogenitäten mit einer Vielzahl technologischer Prozesse erzeugt. Zum Beispiel können durch Diffusion Akzeptor- und in einen anderen Raumbereich Donatorstörstellen eingebracht werden. Dieses Einbringen von Dotierungsatomen kann ebenfalls über sog. Ionenimplantation geschehen, bei der mit hoher kinetischer Energie (durch hohe elektrische Felder) die entsprechenden Ionen der Dotierungsatome in das Halbleitermaterial „eingeschossen“ werden. Im folgenden soll das Leitfähigkeitsverhalten eines solchen p-nÜbergangs, bestehend z. B. aus einem Si-Kristall, der in seiner linken Hälfte mit Akzeptoren (z. B. B, Al, Ga) und in seiner rechten Hälfte mit Donatoren (z. B. P, As, Sb) dotiert ist, betrachtet werden. Dazu muss ein solcher inhomogen dotierter Halbleiter erst einmal im thermischen Gleichgewicht, d. h. ohne äußere anliegende Spannung (s. Abb. 12.16), behandelt werden.
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
429
Der p-n-Übergang im thermischen Gleichgewicht Stellen wir uns in einem rein gedanklichen Schritt die beiden Kristallhälften mit p- und n-Dotierung einmal als nicht verbunden vor (Abb. 12.16 b), so liegen die Fermi-Niveaus in beiden Gebieten verschieden hoch auf ein und derselben Energieskala. In Wirklichkeit handelt es sich jedoch um ein und denselben Kristall, der nur einen abrupten Dotierungsübergang aufweist. Das Fermi-Niveau als elektrochemisches Potential muss deshalb beiden Kristallhälften im thermischen Gleichgewicht gemeinsam sein. Im Bereich der Übergangszone zwischen n- und p-Gebiet muss sich deshalb eine sog. Bandverbiegung, wie in Abb. 12.16 c gezeigt, einstellen. Im Rahmen dieser hier durchgeführten quasiklassischen Beschreibung werden die Verhältnisse in der Übergangsschicht also durch ein ortsabhängiges sog. Makropotential V (x) beschrieben, was die Verbiegung der Bandstruktur wiedergibt. Diese Beschreibung ist zulässig, weil sich das Potential V (x) nur schwach über einen Kristallatomabstand ändert. Der Krümmung des Makropotentials V (x) entspricht über die Poisson-Gleichung @ 2 V
x @x2
R
x e e0
12:39
eine Raumladung R (x). Wie diese Raumladung zustande kommt, ist für den Grenzfall T^0, wo EF tief im Innern des Kristalls in der Nähe des Akzeptor- bzw. Donatorniveaus liegt, qualitativ so zu verstehen: Die Verbiegung der Bänder hat zur Folge, dass in der Übergangszone im Bereich des p-Gebietes Akzeptoren unter das Fermi-Niveau gedrückt, d. h. mit Elektronen besetzt werden, während im n-Gebiet Donatoren über das Fermi-Niveau hinausgehoben werden und somit entleert, d. h. positiv geladen werden. Die aus (12.39) sich ergebende Raumladung besteht also aus ortsfesten ionisierten Akzeptoren bzw. Donatoren, die eine geladene Doppelschicht zu beiden Seiten des Dotierungssprunges zur Folge haben. Im Fall der in Abb. 12.16 gezeigten Störstellenerschöpfung (T&300 K, EF zwischen Störstellenniveaus und Mitte des verbotenen Bandes) rührt die Raumladung daher, dass die Ladung der ortsfesten Akzeptor- und Donatorstörstellen um den Dotierungssprung herum nicht mehr durch die beweglichen Löcher und Elektronen in Valenz- und Leitungsband kompensiert wird. Man spricht deshalb vom sog. Raumladungsbereich oder der sog. Raumladungszone, wo R
x j 0 ist. Die mit dieser Raumladungszone zusammenhängenden Konzentrationen der Ladungsträger und Störstellen sind in Abb. 12.16 e dargestellt. Weit außerhalb des Raumladungsbereiches sind die Donator- (N +D falls geladen) bzw. Akzep– tor-(NA )-Störstellen durch gleichgroße Elektronen- (nn) bzw. Löcherkonzentrationen (pp) ladungsmäßig kompensiert. Die Indizes n und p besagen, dass es sich um Elektronen bzw. Löcher im nbzw. p-Gebiet handelt. Diese Ladungsträger entsprechen den in diesen Gebieten vorgegebenen Dotierungen und sie werden als Ma-
430
12. Halbleiter
joritätsladungsträger bezeichnet. Da Elektronen und Löcher „frei“ beweglich sind, diffundieren Elektronen ins p-Gebiet und Löcher ins n-Gebiet hinein. Dort heißen sie Minoritätsladungsträger und ihre Konzentrationen werden mit np (Elektronen) und pn (Löcher) bezeichnet. Im thermischen Gleichgewicht muss dabei in jedem Punkt das sog. Massenwirkungsgesetz (n 2i = n p) erfüllt sein. Für die Konzentration der Majoritätsladungsträger (Elektronen im n-Gebiet: nn bzw. Löcher im p-Gebiet: pp ) gilt nach den Betrachtungen im Abschn. 12.3 ! n E E F L L ;
12:40 a exp nn Neff kT ! p E E F V V :
12:40 b exp pp Neff kT Weiterhin gilt n2i
nn pn
V L Neff Neff
exp
ELn
EVn kT
! :
12:41
Die sich im thermischen Gleichgewicht einstellende Diffusionsspannung VD – die Maximaldifferenz des Makropotentials V (x) (s. Abb. 12.16 c) – hängt somit wie folgt mit den Ladungsträgerdichten zusammen: pp nn eVD
EVn EVp k T ln 2 :
12:42 ni Für niedrige Temperaturen im Bereich der Störstellenreserve ist offenbar jeVDj*Eg (Abb. 12.16 c). Hierbei sind E nV und E pV die Valenzbandkanten im n- und p-Gebiet. Ein Zustand des Halbleiters, wie er in Abb. 12.16 b–e dargestellt ist, muss als dynamisches Gleichgewicht aufgefaßt werden, denn Konzentrationsprofile von „freien“ Ladungsträgern wie in Abb. 12.16 e haben Diffusionsströme (Elektronen von rechts nach links, Löcher von links nach rechts) zur Folge. Auf der anderen Seite ist eine Raumladung wie in Abb. 12.16 d mit einem elektrischen Feld E (x) und deshalb mit Feldströmen von Elektronen und Löchern verknüpft. Die entsprechenden (Ladungs-!) Stromdichten stellen sich wie folgt dar: @n @p Diff Diff Diff j Dp ;
12:43 j n j p e Dn @x @x mit Dn und Dp den Diffusionskonstanten für Elektronen bzw. Löcher, j Feld e
n ln plp E x : j Feld j Feld n p
12:44
Im thermischen (dynamischen) Gleichgewicht kompensieren sich diese Ströme gerade. Im p- bzw. n-Gebiet werden beständig auf-
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
431
grund der endlichen Temperatur Elektronen-Loch-Paare erzeugt, die wieder rekombinieren. Es gilt j Diff j Feld 0
12:45
und damit verschwinden auch die Beiträge der Elektronen und Löcher einzeln, d. h., für Elektronen gilt somit nach (12.43–12.45): @n @V
x nln ;
12:46 @x @x wobei E x @V=@x benutzt wurde. Betrachtet man nicht wie in (12.40) die Ladungsträgerkonzentrationen weit außerhalb der Raumladungsschicht, wo E nL bzw. E pV konstant sind, sondern in der Raumladungszone, so wird natürlich die Leitungsbandkante beschrieben durch [ E pL– e V (x)] und die Konzentration der Elektronen ist ortsabhängig mit ! p E eV
x E F L L ;
12:47 exp n
x Neff kT Dn
damit folgt @n e @V n @x k T @x
12:48
bzw. durch Einsetzen in (12.46) Dn
kT
12:49 l : e n Diese sog. Einstein-Beziehung zwischen Trägerdiffusionskonstante und Beweglichkeit gilt immer dann, wenn Diffusionsstrom und Feldstrom von ein und derselben Ladungsträgersorte getragen werden. Die analoge Beziehung zu (12.49) folgt natürlich für Löcher wegen des Verschwindens des Gesamtlöcherstromes. Eine rigorose mathematische Behandlung des p-n-Übergangs ist nicht einfach, weil in der Poisson-Gleichung (12.39) der genaue Verlauf der Raumladungsdichte R (x) vom Wechselspiel zwischen Diffusions- und Feldstrom [und dieser wiederum von V (x)] abhängt. Für einen „abrupten“ p-n-Übergang, wie er hier betrachtet wird, lässt sich folgende Näherungslösung angeben, die unter dem Namen „Schottky-Modell “ der Raumladungszone bekannt ist. Denken wir uns den Nullpunkt der x-Achse in Abb. 12.16 in den Übergang zwischen n- und p-Gebiet gelegt, dort wo die Donatoren (ND)- und die Akzeptorenkonzentrationen (NA) abrupt aufeinander stoßen, so gilt für die Raumladung allgemein: R
x > 0 e
ND R
x < 0
n p
e
NA n
p
im n-Gebiet ;
12:50 a
im p-Gebiet :
12:50 b
Die ortsabhängigen Konzentrationen n (x), p (x) der „freien“ Ladungsträger stellen sich natürlich nach Maßgabe des Abstandes der
432
12. Halbleiter
Leitungsband- bzw. Valenzbandkante zum Fermi-Niveau ein (s. Abb. 12.16 c). Obwohl dieser Abstand sich in der gesamten Raumladungszone allmählich und monoton ändert, ändert sich die FermiFunktion und damit die Besetzung in einem Energiebereich von *2 k T (300 K)^0,05 eV, der klein ist gegen den Bandabstand, von annähernd Null auf ihren Maximalwert. Vernachlässigt man also die sog. „Aufweichungszone“ der Fermi-Verteilung, so lässt sich die Konzentration N +D der geladenen, nicht durch freie Elektronen kompensierten Donatoren bzw. die Konzentration der geladenen Ak– zeptoren N A durch Kastenfunktionen annähern (s. Abb. 12.16 d), d. h., die Raumladungsdichte wird damit 8 0 fur x < dp > < eNA fur dp < x < 0 R
x
12:51 eN f u r 0 < x < dn > : D 0 fur x > dn . Mit dieser stückweise konstanten Raumladungsdichte lässt sich die Poisson-Gleichung z. B. fürs n-Gebiet (0 < x < dn ) d 2 V
x eND '
12:52 2 e e0 dx sehr einfach integrieren. Die Rechnung fürs p-Gebiet verläuft natürlich völlig analog. Für elektrisches Feld E x (x) und Potential V (x) im n-Gebiet der Raumladungszone ergeben sich e E x
x ND
dn x
12:53 e e0 bzw. eND
dn x2 :
12:54 2e e0 Außerhalb der „Schottky-Raumladungszone“ liegen die Potentiale Vn (?) im n-Gebiet bzw. Vp (–?) im p-Gebiet vor (s. Abb. 12.17 c). Man beachte den inversen Verlauf der Energiebandkanten EV (x) und EL (x) (Abb. 12.15 c) im Vergleich zu dem des Potentials [E (x) = – eV (x)]. Die Längen dn bzw. dp geben im Rahmen des Schottky-Modells die Ausdehnung der Raumladungszone ins n- bzw. p-Gebiet an. Aus der Ladungsneutralität folgt: V
x Vn
1
ND dn NA dp ; und die Kontinuität von V (x) bei x = 0 verlangt: e
ND dn2 NA dp2 Vn
1 VP
1 VD : 2 e e0
12:55
12:56
Aus der Diffusionsspannung VD, dem Unterschied zwischen den Lagen der Bandkanten im p- und n-Gebiet, lässt sich also bei bekannten Störstellenkonzentrationen die Ausdehnung der Raumladungsschicht ausrechnen.
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
Aus (12.55) und (12.56) folgt: 2 e e0 VD NA =ND 1=2 dn ; e NA ND 2 e e0 VD ND =NA 1=2 dp : e NA ND
433
12:57 a
12:57 b
Da Diffusionspotentiale typischerweise in der Größenordnung von Eg, also bei ca. 1 V liegen, ergeben sich bei Störstellenkonzentrationen zwischen 1014 und 1018 cm–3 Ausdehnungen der Raumladungszonen dn bzw. dp zwischen 104 und 102 Å, d. h., es herrschen elektrische Feldstärken zwischen 104 und 106 V/cm in solchen Raumladungszonen. Der vorgespannte p-n-Übergang – Gleichrichtung Wenn eine zeitlich konstante, äußere elektrische Spannung U an den p-n-Übergang gelegt wird, so wird das thermische Gleichgewicht gestört, und die Verhältnisse im p-n-Übergang können als stationärer Zustand nahe am thermischen Gleichgewicht beschrieben werden. Da aufgrund der Verarmung an freien Ladungsträgern (Verarmungszone) die Raumladungszone zwischen –dp und dn einen wesentlich höheren elektrischen Widerstand besitzt als die Gebiete außerhalb des p-n-Übergangs, fällt bei außen anliegender Spannung U fast der ganze Betrag von U über der Raumladungszone ab, d. h., das Bänderschema der Abb. 12.16 bzw. der Potentialverlauf der Abb. 12.17 c ändert sich nur im Bereich der Raumladungszone; außerhalb bleiben EL (x), EV (x) und V (x) konstant, also weiterhin waagerecht. Über der Raumladungszone fällt statt der Diffusionsspannung VD (im Gleichgewicht: U = 0 V) nun der Wert Vn
1
Vp
1 VD
U
12:58
ab. Hierbei wird U positiv gezählt, wenn das Potential auf der pSeite gegenüber der n-Seite angehoben wird. Die außen anliegende Spannung ändert nun die Ausdehnung der Raumladungszone, denn in (12.57) muss statt VD die um U verringerte Diffusionsspannung eingesetzt werden, d. h., es folgt: dn
U dn
U 0
1
U=VD 1=2 ;
12:59 a
dp
U dp
U 0
1
U=VD 1=2 :
12:59 b
Im thermischen Gleichgewicht sind Feld- und Diffusionsstrom von Elektronen entgegengesetzt und gleich, dasselbe gilt für die Löcherströme. Legt man eine äußere Spannung U an, so wird dieses Gleichgewicht gestört. Betrachten wir z. B. die Strombilanz der Elektronen: Hier handelt es sich einerseits um den Feldstrom der Minoritätsladungsträger, der, aus dem p-Gebiet (wo Elektronen Minoritätsladungsträger sind) kommend, durch die Diffusionsspan-
434
12. Halbleiter
Abb. 12.17. Das Schottky-Modell der Raumladungszone eines p-n-Übergangs (bei x = 0). (a) Ortsabhängigkeit der Raumladungsdichte R
x, die aus ionisierten Akzeptoren (NA) bzw. Donatoren (ND) gebildet wird. Der reale Verlauf (gestrichelt) wird durch den rechteckigen Verlauf (durchgezogen) angenähert. (b) Verlauf der elektrischen Feldstärke Ex (x). (c) Potentialverlauf V (x) im Bereich des p-n-Übergangs
nung VD in das n-Gebiet hinübergezogen wird. Weil diese Minoritätsträger im p-Gebiet durch fortwährende thermische Generation entstehen, heißt dieser Strom Generationsstrom I gen n . Bei genügend dünner Raumladungszone und genügend geringer Rekombination in dieser wird jedes Elektron, das, vom p-Gebiet her kommend, in das Feld der Raumladungszone gerät, von diesem in das n-Gebiet hinübergezogen. Dieser Effekt ist weitgehend unabhängig von der Größe der Diffusionsspannung und somit auch von einer äußeren Spannung. Anders verhält es sich mit dem Diffusionsstrom der Elektronen aus dem n-Gebiet, wo die Elektronen Majoritätsladungsträger sind, in das p-Gebiet (genannt Rekombinationsstrom I rec n ). In dieser Richtung müssen die Elektronen gegen die Potentialschwelle der Diffusionsspannung anlaufen. Der Bruchteil der Elektronen, der die Potentialschwelle überwindet, bestimmt sich nach dem Boltzmann-Faktor exp [– e (VD–U)/k T ] und ist somit stark abhängig von der außen anliegenden Spannung U. Es gelten also bei einer äußeren Spannung U folgende Beziehungen für die Elektronenströme In durch den p-n-Übergang: Inrec
U 0 Ingen
U j 0 ; Inrec / e
k
e
VD U= T
;
12:60
12:61
d. h. mit (12.60) Inrec Ingen e
k
e U= T
;
und damit für den Gesamtelektronenstrom
12:62
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
Sperrrichtung
435
Durchlassrichtung
Abb. 12.18. Schema der Strom-Spannungs (I–U)-Kennlinie eines p-n-Übergangs mit entsprechendem Schaltbild. Der maximale Sperrstrom ist durch die Summe der Generationsströme für Elektronen und Löcher gegeben
In Inrec
Ingen Ingen
e
k
eU= T
1 :
12:63
Die gleiche Analyse folgt für die Löcherströme Ip, so dass sich für die Kennlinie eines p-n-Übergangs ergibt ! eU gen gen 1 :
12:64 I
U
In Ip exp kT Der extrem asymmetrische Verlauf dieser typischen GleichrichterKennlinie für beide Polungsrichtungen ist aus Abb. 12.18 zu ersehen. gen Um den Sättigungsstrom in Sperrrichtung –(I gen n +I p ) quantitativ zu ermitteln, ist eine etwas genauere Betrachtung des stationären Zustandes bei Anlegen einer Gleichspannung U erforderlich. Wie aus dem Vorherigen folgt, ist für die Störung des thermischen Gleichgewichts vor allem eine Änderung der Diffusionsströme verantwortlich, während in guter Näherung der Einfluss der äußeren Spannung U auf die Feldströme vernachlässigt werden kann. Im Rahmen dieser sog. Diffusionsstrom-Näherung genügt es also, nur die Diffusionsströme unter dem Einfluss der Spannung U zu betrachten. Betrachten wir den p-n-Übergang in Durchlassrichtung gepolt (Abb. 12.19), so erhöht sich, wie aus Abb. 12.19 b ersichtlich, im Raumladungsgebiet die Trägerkonzentration, wobei nicht mehr das Massenwirkungsgesetz n p = n 2i erfüllt ist. Die Fermi-Niveaus weit außerhalb der Raumladungszone unterscheiden sich gerade um die der außen angelegten Spannung U entsprechende Energie –eU (Abb. 12.19 a). In der Raumladungszone, wo kein thermisches Gleichgewicht mehr herrscht, kann im Grunde genommen kein Fermi-Niveau mehr definiert werden. Befindet sich der stationäre Zustand, wie hier angenommen, jedoch nahe am thermischen Gleichgewicht, so ist näherungsweise weiterhin eine Beschreibung mit Hilfe der Boltzmann-Statistik möglich, nur müssen statt eines einzigen Fermi-Niveaus jetzt formal zwei sog. Quasi-Fermi-Niveaus für Elektronen (in Abb. 12.19 a punktiert) und für Löcher (in Abb. 12.19 a gestrichelt) eingeführt werden. Auf weitere Details soll hier nicht eingegangen werden. Mit der Näherungsannahme, dass innerhalb der Raumladungszone Rekombinationsprozesse von Elektronen mit Löchern vernach-
436
12. Halbleiter
Durchlassrichtung
Sperrrichtung
Abb. 12.19 a, b. Schema eines p-n-Übergangs, der in Durchlass- bzw. Sperrrichtung gepolt ist (Nichtgleichgewichtszustände). (a) Bänderschema bei Anliegen einer äußeren Spannung –U bzw. +U. Um entsprechende Potentialbeträge e U sind die Fermi-Niveaus E pF bzw. E nF im p- bzw. n-Gebiet gegeneinander verschoben. Im Bereich des p-n-Übergangs spaltet das Fermi-Niveau des Gleichgewichts (– · – · –) in sog. Quasi-Fermi-Niveaus für Elektronen (· · ·) und Löcher (– – –) auf. (b) Ortsabhängigkeit der Konzentration der Löcher p und der Elektronen n im vorgespannten p-nÜbergang (durchgezogen) und ohne Vorspannung im thermischen Gleichgewicht (– – –). – dp und dn geben die Ausdehnung der Raumladungszone im thermischen Gleichgewicht, d. h. ohne Vorspannung, an. pp und pn wie auch np und nn bezeichnen die Konzentrationen tief im p- bzw. n-Gebiet
Abb. 12.19 c. Ortsabhängigkeit der Löcherkonzentration p(x) im vorgespannten p-n-Übergang außerhalb der Raumladungszone des thermischen Gleichgewichts (x > dn); Ausschnittsvergrößerung der Darstellung in Abb. 12.19 b für Polung in Durchlassrichtung
lässigt werden können, genügt es, die Änderung der Diffusionsstromdichten am Rande der Raumladungszone, d. h. bei x = –dp und x = dn, zu betrachten. In diesem nach Shockley benannten Modell für den Fall geringer Ladungsträgerinjektion werden dn und dp als konstant angenommen [nicht wie in (12.57) als Funktion von VD]; für dn und dp werden die Werte des stromlosen Falles benutzt, wie in Abb. 12.18 angedeutet ist. Die Rechnung gestaltet sich dann besonders einfach. Wir beschränken uns auf die Betrachtung der Löcher-Diffusionsstromdichte j Diff p , da für Elektronen die Rechnung analog verläuft. Für den Diffusionsstrom bei x = dn gilt nach (12.43)
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
j Diff p
x dn
e Dp
@p : @x xdn
437
12:65
Der Konzentrationsgradient @p=@x kann über die Diffusionstheorie, wie folgt, leicht auf die Erhöhung der Löcherkonzentration bei x = dn zurückgeführt werden. Die bei x = dn aufgrund der anliegenden Durchlassspannung U sich ergebende Löcherkonzentration p (x = dn) (s. Abb. 12.19 b) folgt nach der Boltzmann-Statistik zu ! VD U ;
12:66 e p
x dp pp exp kT p
x dn pn exp
e U=k T :
12:67
Hierbei sind dn bzw. dp die Ausdehnungen der Raumladungszone im thermischen Gleichgewicht (U = 0 V). Diese erhöhte Löcherkonzentration führt zu erhöhter Rekombination im n-Gebiet, was einen erhöhten Elektronenzustrom zur Folge hat. Weit im n-Gebiet wird der Strom also durch Elektronen und weit im p-Gebiet durch Löcher getragen. Aufgrund der Kontinuitätsbeziehung kann sich die Löcherkonzentration in einem Volumenelement nur dadurch ändern, dass Löcher hinein- oder hinausfließen bzw. rekombinieren oder thermisch erzeugt werden. Die Rekombinationsrate ist umso höher, je mehr Löcher über die Gleichgewichtskonzentration pn hinaus angeregt sind. Mit einer mittleren Lebensdauer sp eines Loches lautet deshalb die Kontinuitätsbeziehung für die Nichtgleichgewichtsladungsträger: @p @t
1 div j Diff p e
p
pn sp
:
12:68
Im hier betrachteten stationären Fall muss @p=@t 0 sein, und es folgt aus (12.65 und 12.68) @p @2p Dp 2 @t @x
p
pn sp
0;
12:69 a
d. h. weiter @2p 1
p @x2 Dp sp
pn :
12:69 b
Diese Diffusionsdifferentialgleichung liefert als Lösung ein Diffusionsprofil p
12:70 p
x exp
x= Dp sp : p Hierbei ist Lp = Dp sp die Diffusionslänge für Löcher, längs der die Löcherkonzentration von einem bestimmten Wert, z. B. p (x = dn) in Abb. 12.19 b auf 1/e abgenommen hat. Aus (12.70) folgt mittels Abb. 12.19 c
438
12. Halbleiter
Abb. 12.20. Beispiel einer an einem Sip-n-Übergang gemessenen Strom-Spannungs-Kennlinie. Sperrspannungen und -ströme sind negativ angegeben. (Aus dem Praktikum des 2. Physikalischen Instituts der RWTH Aachen)
Flussspannung (V)
@p p
x dn Lp @x xdn
pn
;
12:71
wobei weiter aus (12.67) für den Fall einer von außen angelegten Spannung p
x dn
pn pn exp
e U=k T
1
12:72
folgt. Aus (12.65, 12.71 und 12.72) ergibt sich die durch die äußere Spannung U erzeugte Löcher-Diffusionsstromdichte zu e Dp Diff jp pn exp
e U=k T 1 :
12:73 Lp xdn
Analoge Rechnungen folgen für den von Elektronen getragenen Diffusionsstrom und die gesamte über den p-n-Übergang fließende Stromdichte ergibt sich als Summation über diese beiden Anteile. Die Feldströme brauchen, wie oben ausgeführt, nicht berücksichtigt
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
439
zu werden. Ihre Anteile aus dem p- und n-Gebiet sind im Rahmen der Näherung gleich groß wie im thermischen Gleichgewicht und kompensieren den Gleichgewichtsanteil der Diffusionsströme, d. h.: ! e Dp e Dn eU 1 :
12:74 exp pn np j
U Lp Ln kT Damit sind die in (12.64) auftretenden Generationsströme zurückgeführt auf die Diffusionskonstanten und Diffusionslängen für Elektronen und Löcher, sowie auf die Minoritätsladungsträgerkonzentrationen pn und np. Abbildung 12.20 zeigt eine experimentell ermittelte Strom-Spannungskennlinie I (U) eines p-n-Übergangs. Der schon in Abb. 12.18 gezeigte qualitative Verlauf einer Gleichrichterkennlinie ist klar zu erkennen. Legt man eine äußere Spannung U an einen p-n-Übergang, so ändert sich die räumliche Ausdehnung der Raumladungszone dn nach (12.59) und damit ändert sich auch die gesamte in der Raumladungszone gespeicherte Ladung Qsc ' e ND dn
UA :
12:75
Diese Beziehung gilt im Rahmen der oben besprochenen „Schottky-Näherung“ für den p-n-Übergang, wobei A die Querschnittsfläche des Überganges (senkrecht zum Stromfluss) und ND wie oben die Konzentration der Donatoren ist. Mit dem p-n-Übergang ist deshalb eine spannungsabhängige Raumladungskapazität Csc gegeben: dQsc d Csc e ND A dn
U :
12:76 dU dU Aus (12.59 a) und (12.57 a) folgt:
Abb. 12.21. Experimentell ermittelte Abhängigkeit der Raumladungskapazität von der Sperrspannung (negativ gewählt) für die in Abb. 12.19 betrachtete Si-p-n-Diode. (Aus dem Fortgeschrittenen Praktikum des 2. Physikalischen Instituts der RWTH Aachen)
440
12. Halbleiter
d 1 2 e e0 VD NA =ND dU dn
U 2V e
NA ND 1 D
1 U=VD
1=2 ;
12:77
und damit ergibt sich für die Raumladungskapazität (12.76) A NA ND 2 e e e0 1=2 :
12:78 Csc 2 NA ND
VD U Wegen dieses Zusammenhanges (12.78), d. h. also 1 2 ;
12:79 Csc VD U dient die Messung der Raumladungskapazität in Abhängigkeit von der äußeren Spannung häufig zur Bestimmung von Störstellenkonzentrationen. Abbildung 12.21 zeigt eine experimentell ermittelte Abhängigkeit der Raumladungskapazität von der äußeren Spannung. Der Metall/Halbleiter-Schottky-Kontakt In seiner Funktionsweise mit dem p-n-Übergang verwandt ist der Metall/Halbleiter-Kontakt, der als gleichrichtendes Bauelement bereits Anfang des 20. Jahrhunderts am Beginn der Entwicklung der Halbleiterelektronik stand („Kristalldetektor“). Dampft man bei guten Vakuumbedingungen auf eine saubere Halbleiteroberfläche ein Metall auf, so stellt sich im Fall eines n-dotierten Halbleiters zumeist ein elektronisches Bänderschema wie in Abb. 12.22 ein. Der Grund liegt darin, dass sich am Metall/Halbleiterübergang elektronische Grenzflächenzustände ausbilden [12.6], deren räumliche Ausdehnung auf wenige Atomlagen begrenzt ist und deren energetische Lage in bezug auf die Leitungs- und Valenzbandkante des Halbleiters festgelegt ist. Die Existenz dieser Grenzflächenzustände an einem Metall/Halbleiterübergang hängt damit zusammen, dass die ausgedehnten BlochZustände des Metalls beim Übergang in den Halbleiter nicht abrupt abbrechen können, sondern in den Halbleiter hinein abklingen und deshalb dort durch eine Überlagerung von Wellenfunktionen des Leitungs- bzw. Valenzbandes dargestellt werden müssen. Je nachdem, ob die Zustände mehr „Leitungsband-“ oder mehr „Valenzbandcharakter“ haben, sind sie im mit Elektronen besetzten Zustand negativ aufgeladen (leitungsbandartig) oder neutral (valenzbandartig). Die im besetzten Zustand neutralen Zustände sind positiv geladen, wenn sie unbesetzt sind. Anders ausgedrückt, die valenzbandartigen Zustände haben Donatorcharakter, die leitungsbandartigen Zustände Akzeptorcharakter. Die Ladung in den Oberflächenzuständen wird durch die Lage des Fermi-Niveaus bestimmt. Verschwindet die Ladung, so liegt das Fermi-Niveau am sog. Neutralitätsniveau. Die sich einstellende Bandverbiegung in Abb. 12.22 a ist also durch die Bedingung der Ladungsneutralität in dem Sinne gegeben, dass die aus entleerten Donatoren in der Verarmungsrandschicht stammende Raumladung Qsc durch die Ladung in den Grenzflächenzuständen Qis kompensiert wird.
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
eUSB
eUSB
: ;
441
: ;– eVD
: ; ejUj Abb. 12.22. Elektronisches Bänderschema eines Metall/Halbleiter (n-dotiert)Übergangs, bei dem sich durch „pinning“ des Fermi-Niveaus EF in Grenzflächenzuständen eine Schottky-Barriere eySB und eine Verarmungsrandschicht im Halbleiter ausbildet; VD Diffusionsspannung (a) im thermischen Gleichgewicht, (b) bei außen anliegender Spannung U
Bei Atomdichten an der Grenzfläche von einigen 1014 cm–2 können elektronische Grenzflächenzustandsdichten von vergleichbarer Größenordnung erreicht werden. Diese verteilen sich typischerweise über Energiebereiche von 0,1 bis 1 eV im Bereich des verbotenen Bandes. Grenzflächenzustandsdichten pro Energie können also Werte um 1015 (eV)–1 cm–2 erreichen. Durch diese hohe Zustandsdichte wird das Fermi-Niveau praktisch am Neutralitätsniveau festgehalten („gepinnt“). Eine größere Abweichung vom Neutralitätsniveau würde zu sehr großen Ladungsdichten in den Grenzflächen führen, die nicht durch die Raumladungszone kompensiert werden könnten. Raumladungsänderungen durch Variation der Dotierung oder äußere angelegte Felder führen damit nur zu sehr kleinen Verschiebungen des Fermi-Niveaus von 10–2 bis 10–3eV im Band der Grenzflächenzustände. Von daher ist die sog. Schottky-Barriere eySB (Abb. 12.22) eine für den speziellen Metall-Halbleiterübergang charakteristische Größe. Sie ist natürlich in gewissen Grenzen von Details der Grenzflächenstruktur abhängig. Vergleicht man Abb. 12.22 a mit Abb. 12.16 b, so ist unmittelbar evident, dass eine Schottky-Barriere an einem Metall/Halbleiterübergang bezüglich ihrer Raumladungseigenschaften vereinfachend als die „Hälfte eines p-n-Übergangs“ aufgefaßt werden kann, wobei der p-Halbleiter durch das Metall ersetzt ist. Es ist klar, dass
442
12. Halbleiter
man die Verhältnisse auch umkehren kann; die n-Seite des p-nÜbergangs kann man sich durch ein Metall ersetzt denken, und es ergibt sich eine Schottky-Barriere in einem p-Halbleiter mit Löcherverarmung. Beim p-dotierten Halbleiter liegt EF tief im Volumen nahe der Valenzbandoberkante EV (Abb. 12.22); die Krümmung der Bänder in der Raumladungszone des Schottky-Kontakts bei p-Dotierung ist also invers zu der beim n-Halbleiter. Bei vollständig „gepinntem“ Fermi-Niveau ist die Summe aus der Schottky-Barriere für Elektronen und der Schottky-Barriere für Löcher gleich der Bandlücke. Wie bei einem p-n-Übergang liegt im Bereich der Verarmungszone einer Schottky-Randschicht ein hoher Widerstand vor. Eine von außen angelegte Spannung U fällt im Wesentlichen über der Raumladungszone ab (Abb. 12.22 b); außerhalb dieses Bereiches, d. h. im Metall und tief im Halbleiter, hat man vernachlässigbare Spannungsabfälle und damit fast thermisches Gleichgewicht. Dort können Fermi-Energien EF definiert werden, deren Differenz der außen anliegenden Spannung entspricht. Im Bereich der SchottkyBarriere können wie im Fall des p-n-Übergangs Quasi-Fermi-Niveaus definiert werden. Die formale Beschreibung der Schottky-Barriere am MetallHalbleiterübergang ist völlig analog zum p-n-Übergang. Beispielsweise ergibt sich die „Dicke“ der Metall/Halbleiter-Schottky-Randschicht im Gleichgewicht aus der Formel für den p-n-Übergang (12.57 a) mit NDNA (höhere Leitfähigkeit des Metalls als des pHalbleiters) zu: 2 e e0 VD 1=2 d :
12:80 e ND Ähnlich kann man die Kapazität einer Metall/Halbleiter-SchottkyBarriere als Funktion der außen anliegenden Spannung aus (12.78) ermitteln zu A 2 e e e0 ND 1=2 C ;
12:81 2 VD U wobei A die Fläche des Kontaktes ist. Die gleichrichtenden Eigenschaften der p-n-Diode werden in gleicher Form beim Metall/Halbleiter-Schottky-Kontakt wiedergefunden. Dies ist unmittelbar einleuchtend aus Abb. 12.22. Elektronentransport vom Metall in den Halbleiter verlangt immer das Überwinden der Schottky-Barriere eySB, während umgekehrt für Elektronen, die vom Halbleiter in das Metall fließen sollen, im Fall jUj > ySB keine Barriere auftritt.
12.7 Halbleiterheterostrukturen und Übergitter
443
12.7 Halbleiterheterostrukturen und Übergitter Mittels moderner Epitaxiemethoden für Halbleiterschichten wie Molekularstrahlepitaxie (MBE, Tafel XVII) oder metallorganischer Gasphasenepitaxie (MOCVD, Tafel XVII) ist es heute möglich, zwei verschiedene Halbleiter mit unterschiedlichen elektronischen Eigenschaften, insbesondere Bandlücken, aufeinander kristallin abzuscheiden. Besonders für Bauelemente aus III–V-Halbleitern, wie GaAs, InP u. ä. spielen solche Schichtstrukturen heute eine wichtige Rolle. Hierbei ist weiterhin von Bedeutung, dass mit diesen Epitaxieverfahren auch ternäre oder quaternäre Legierungen des Typs AlxGa1–x As oder GaxIn1–xAsy P1–y abgeschieden werden können, deren Bandlücken dann zwischen denen der entsprechenden binären Verbindungen liegen. Durch gezielte Variation der Komposition x in AlxGa1–xAs kann so die elektronische Bandstruktur kontinuierlich zwischen der des GaAs und der des AlAs „eingestellt“ werden. Bei der Komposition x = 0,45 geht hierbei die Legierung von einem direkten Halbleiter (wie GaAs) in einen indirekten Halbleiter (wie AlAs) über (Abb. 11.13). Für die wichtigsten binären Halbleiter und Elementhalbleiter sind in Abb. 12.23 die Bandlückenenergien bei 300 K gegen den Gitterabstand aufgetragen. Diese Auftragung ist deshalb von besonderem Interesse, weil erwartungsgemäß solche Halbleiter besonders gut und störungsfrei epitaktisch aufeinander aufwachsen, bei denen der Gitterabstand gut übereinstimmt. Aus Abb. 12.21 lässt sich auch entnehmen, wie sich sowohl Bandlücke als auch Gitterabstand ändern, wenn man bei der Epitaxie eine ternäre Komposition zwischen je zwei binären Halbleitern einstellt. Man erkennt leicht, dass die Epitaxie von Ge auf GaAs, und umgekehrt, zu besonders guter Gitteranpassung führt, und dass das Legierungssystem GaAlAs eine Variation der Bandlücke zwischen etwa 1,4 und 2,2 eV gestattet, wobei wegen
Abb. 12.23. Bandlücke Eg wichtiger Element- und binärer Verbindungshalbleiter, aufgetragen gegen die Gitterkonstante bei 300 K. Auf der rechten Abszisse ist die der Bandlückenenergie entsprechende Lichtwellenlänge k angegeben. Die Verbindungslinien zeigen die Verhältnisse bei ternären Verbindungen an, die sich aus Mischung der entsprechenden binären Komponenten ergeben
444
Abb. 12.24 a–c. Bänderschemata (Einelektronenenergie gegen Ortskoordinate), die sich bei der Bildung einer Heterostruktur aus den Halbleitern I und II ergeben. (a) Halbleiter I und II sind als getrennt gedacht. vI und vII sind die Elektronenaffinitäten, d. h. die energetischen Abstände zwischen der Vakuumenergie EVac und der unteren Leitungsbandkante EL. (b) Halbleiter I und II sind in Kontakt, jedoch besteht kein thermisches Gleichgewicht, da die Fermi-Niveaus EF auf beiden Seiten nicht übereinstimmen. DEL bzw. DEV sind die Banddiskontinuitäten im Leitungs- und im Valenzband. (c) Im thermischen Gleichgewicht müssen die Fermi-Energien EF im Halbleiter I und II übereinstimmen. Wegen der festvorgegebenen Banddiskontinuitäten DEL und DEV müssen sich Bandverbiegungen in Halbleiter I und II ausbilden
12. Halbleiter
EL
der extrem guten Gitteranpassung der beiden Komponenten GaAs und AlAs hervorragende kristalline Qualität beim Aufwachsen eines Halbleiters auf dem anderen zu erwarten ist. CdTe und HgTe sind auch ausgezeichnete Paare von Halbleitern, die weitgehend störungsfrei aufeinander aufwachsen können. Die Kombination zweier verschiedener epitaktisch aufeinander aufgewachsener Halbleiter nennt man eine Halbleiterheterostruktur. Die Schärfe des Übergangs kann bei geeigneten Epitaxieverfahren (MBE, MOCVD) im Bereich von einer Atomlage liegen. Die Bandlücke ändert sich bei einer solchen Heterostruktur also über Distanzen von atomaren Dimensionen. Wie sieht das elektronische Bänderschema einer Halbleiterheterostruktur somit aus (Abb. 12.24)? Zwei verschiedene Fragen sind zu beantworten: (a) Wie müssen Valenzbandkante EV bzw. Leitungsbandkante EL beider Halbleiter „aneinander gelegt“ werden? Dies ist die Frage nach der sog. Banddiskontinuität DEV (Abb. 12.24 b). (b) Welche Bandverbiegungen stellen sich in den beiden Halbleitern I und II links und rechts des Halbleiterübergangs ein (Abb. 12.24 c)? In den weitaus meisten Fällen können beide Fragestellungen getrennt und unabhängig voneinander behandelt werden, weil die relevanten Phänomene auf verschiedenen Energie- und Längenskalen zu betrachten sind. Die Anpassung der beiden Bandstrukturen aneinander findet innerhalb eines Atomabstandes statt. Interatomare Kräfte und Energien sind hierfür entscheidend und die elektrischen Felder sind in der Größenordnung atomarer Felder (0108 V/cm). Die Bandverbiegung hingegen stellt sich über hunderte von Ångström so ein, dass im thermischen Gleichgewicht das Fermi-Niveau, das tief im Innern beider Halbleiter jeweils durch die Dotierung bestimmt ist, auf beiden Seiten der Halbleitergrenzschicht denselben Wert hat (Abb. 12.24 c). Die
12.7 Halbleiterheterostrukturen und Übergitter
445
entscheidende Bedingung ist genau wie beim p-n-Übergang, dass die gesamte Heterostruktur im thermischen Gleichgewicht stromlos ist (s. (12.45)). Die Bandverbiegungen in Halbleiter I und II sind wie beim p-n-Übergang mit Raumladungen verknüpft und die Raumladungs-Feldstärken sind in der Größenordnung von 105 V/cm. Die wichtigste materialbezogene Kenngröße einer Halbleiterheterostruktur ist also die Valenz- oder Leitungsband-Diskontinuität DEV oder DEL. Die klassische, jedoch mittlerweile revidierte, Annahme war die, dass im Idealfall beide Bänderschemata der Halbleiter so aneinander zu legen sind, dass die Vakuum-Energieniveaus EVac übereinstimmen. Damit ergäbe sich die Leitungsbanddiskontinuität DEL als die Differenz der Elektronenaffinitäten Dv (Abb. 12.24) DEL vI
vII Dv :
12:82
Die Elektronenaffinität v, die Differenz zwischen Vakuumenergie und unterer Leitungsbandkante, ist eine für das Volumen eines Materials theoretisch wohl definierte Größe. Ihre experimentelle Bestimmung aber geschieht über Oberflächenexperimente, bei denen das im Volumen definierte v durch Grenzflächendipole (z. B. durch geänderte Atomkoordinaten an der Oberfläche) stark verändert sein kann. Erst recht für die Grenzschicht zwischen zwei Halbleitern kann v nicht ohne weiteres von Volumengrößen her abgeleitet werden. Es werden deshalb heute Modelle diskutiert, bei denen in einer idealen, abrupten Halbleiterheterostruktur die elektronischen Bänder so „aneinander gelegt“ werden, dass keine atomaren Dipole entstehen, z. B. durch elektronische Grenzflächenzustände oder Ladungstransfer in den chemischen Bindungen an der Grenzschicht. Eine detaillierte theoretische Behandlung dieser Modelle verlangt eine atomistische Beschreibung der elektronischen Eigenschaften der wenigen Atomlagen am Halbleiterheteroübergang. Dies geht über den Rahmen des vorliegenden Buches hinaus. Wir betrachten deshalb die Banddiskontinuität DEL oder DEV als phänomenologische Größe, die sich experimentell bestimmen lässt. Einige zur Zeit weitgehend anerkannte Werte sind in Tabelle 12.7 [12.7] aufgelistet. Aus der Kenntnis der Valenzbanddiskontinuität DEV und der Energie der verbotenen Bänder der beiden Halbleiter lässt sich natürlich sofort die Leitungsbanddiskontinuität DEL bestimmen. Die Berechnung der Raumladungszonen geschieht völlig analog zu den Rechnungen am einfachen p-n-Übergang (Abschn. 12.6), nur dass sich jetzt positive und negative Raumladungen in zwei verschiedenen Halbleitermaterialien I und II mit verschiedenen Dielektrizitätskonstanten e I und e II befinden. Die entsprechenden Bezeichnungen für einen p-n-Heteroübergang sind in Abb. 12.25 dargestellt. Die einfachste Beschreibung ist wiederum im Rahmen des Schottky-Modells möglich, bei dem die Raumladungsdichten – e N IA bzw. e N IID über die Ausdehnung der Raumladungszonen d I und d II als konstant angenommen werden. Die Poisson-Gleichung (12.39 bzw. 12.52) kann dann wieder stückweise in Halbleiter I
446
12. Halbleiter
Abb. 12.25. Bänderschema eines Halbleiter-Heteroübergangs: Halbleiter I mit dielektrischer Funktion e I ist p-dotiert mit einer Akzeptorkonzentration N IA, Halbleiter II mit dielektrischer Funktion e II ist n-dotiert mit einer Donatorkonzentration N IID. Die Raumladungszonen haben die Ausdehnungen d I bzw. d II; die mit den Raumladungszonen verbundenen Diffusionsspannungen sind V ID bzw. V IID. DEV ist die Valenzband-Diskontinuität. Ein solcher Heteroübergang bestehend aus einem p-Halbleiter mit kleinerer und einem n-Halbleiter mit größerer Bandlücke wird auch als p-NHeteroübergang bezeichnet (klein p wegen kleiner Bandlücke, groß N wegen großer Bandlücke)
und II integriert werden. Man muss nur berücksichtigen, dass sich die gesamte Diffusionsspannung VD jetzt auf zwei verschiedene Halbleiter, d. h. auf V ID und V IID, aufteilt: VD VDI VDII :
12:83
Gleiches gilt auch für eine von außen an den p-n-Heteroübergang angelegte Spannung U U I U II :
12:84
Um die beiden Lösungen der Poissongleichung am Heteroübergang (x = 0) aneinander anzuschließen, ist die Kontinuität der dielektrischen Verschiebung e0 eI E I
x 0 e0 eII E II
x 0
12:85
Tabelle 12.7. Zusammenstellung einiger experimentell bestimmter Valenzband-Diskontinuitäten DEV. Der zuerst genannte Halbleiter ist das Substrat, auf das der als zweiter genannte Halbleiter i. a. als dünne verspannte Schicht deponiert wurde. (Nach Margaritondo und Perfetti [12.7]) Heterostruktur
ValenzbandDiskontinuität DEV [eV]
Heterostruktur
ValenzbandDiskontinuität DEV [eV]
Heterostruktur
ValenzbandDiskontinuität DEV [eV]
Si-Ge AlAs-Ge AlAs-GaAs AlSb-GaSb GaAs-Ge GaAs-Si GaAs-InAs GaP-Ge GaP-Si GaSb-Ge GaSb-Si
0,28 0,86 0,34 0,4 0,49 0,05 0,17 0,80 0,80 0,20 0,05
InAs-Ge InAs-Si InP-Ge InP-Si InSb-Ge InSb-Si CdS-Ge CdS-Si CdSe-Ge CdSe-Si CdTe-Ge
0,33 0,15 0,64 0,57 0,0 0,0 1,75 1,55 1,30 1,20 0,85
CdTe-a-Sn ZnSe-Ge ZnSe-Si ZnSe-GaAs ZnTe-Ge ZnTe-Si GaSe-Ge GaSe-Si CuBr-GaAs CuBr-Ge
1,1 1,40 1,25 1,03 0,95 0,85 0,83 0,74 0,85 0,7
12.7 Halbleiterheterostrukturen und Übergitter
447
zu berücksichtigen. Für die Dicken der Raumladungszonen in Halbleiter I und II ergeben sich zu (12.57) analoge Formeln: II I II 1=2 2ND e0 e e
VD U dI ;
12:86 a eNAI
eI NAI eII NDII I 1=2 2NA e0 eI eII
VD U d II :
12:86 b eNDII
eI NAI eII NDII Hierbei wurde ergänzend zu (12.57) noch eine außen anliegende Spannung U berücksichtigt. Die Verteilung der Gesamtspannung auf die beiden Halbleiter ergibt sich zu VDI VDII
UI NDII eII : U II NAI eI
12:87
Für den Fall eines einfachen p-n-Übergangs (eI eII ) ergibt sich natürlich im thermischen Gleichgewicht (U = 0) gerade wieder (12.57). Von besonderem Interesse sind Heteroübergänge zwischen verschiedenen Halbleitern mit gleicher Dotierung, sog. isotype Heteroübergänge (z. B. n-n in Abb. 12.24 c). In diesem Fall stellt sich wegen der Kontinuitätsbedingung für das Fermi-Niveau auf der Seite des Halbleiters mit geringerem verbotenen Band eine AnreicherungsRaumladungszone für Elektronen ein, die zu einer lokal sehr starken Anhebung der Elektronenkonzentration führt. Dies gilt auch, wenn diese Seite der Heterostruktur nur sehr schwach dotiert, d. h. nahezu intrinsisch ist (Abb. 12.26 a). Die hohe Konzentration von freien Elektronen in dieser Raumladungszone (Halbleiter II) wird dann ladungsmäßig kompensiert durch die ihr in Halbleiter I gegenüberstehende Verarmungs-Raumladungszone, die infolge der hohen Konzentration ionisierter Donatoren eine starke positive Raumladung trägt. Diese Donatorstörstellen haben ihr Valenzelektron in den energetisch günstigeren Potentialtopf der Anreicherungszone in Halbleiter II abgegeben. Auf diese Weise ist die hohe Dichte von freien Elektronen räumlich von den ionisierten Störstellen getrennt, von denen sie stammen. Störstellenstreuung als wichtige Ursache für den elektrischen Widerstand bei tiefen Temperaturen ist deshalb stark unterdrückt für dieses freie Elektronengas. Im homogen dotierten Halbleiter verlangt eine Steigerung der Ladungsträgerkonzentration gleichzeitig eine Erhöhung des Dotierungsgrades und damit verstärkte Störstellenstreuung, was zu einer Erniedrigung der Leitfähigkeit führt. Diese notwendige Verknüpfung von erhöhter Störstellenstreuung mit wachsender Ladungsträgerkonzentration ist nicht gegeben für solche Heterostrukturen wie in Abb. 12.26. Man nennt diese Art der einseitigen Dotierung einer Heterostruktur „Modulationsdotierung“. Elektronenbeweglichkeiten einer modulationsdotierten AlxxAs/GaAs-Heterostruktur sind in Abb. 12.27 dargestellt. Wäre die Elektronenbeweglichkeit durch Streuung an ionisierten Störstellen (IS) und Phononen (P) so wie in homogen dotiertem GaAs be-
448
12. Halbleiter
Abb. 12.26. (a) Modulationsdotierter Heteroübergang, bestehend aus einem hoch n-dotierten Halbleiter I mit großer Bandlücke und einem schwach (oder nahezu intrinsisch) n-dotierten Halbleiter II mit kleiner Bandlücke (N–n-Heteroübergang). (b) Bänderschema eines modulationsdotierten KompositionsÜbergitters; die Halbleiterschichten I sind jeweils hoch n-dotiert, während die Schichten des Typs II schwach dotiert oder nahezu intrinsisch sind
stimmt, dann ergäbe sich eine durch diese Prozesse charakteristische Begrenzung, abfallend zu hohen und zu tiefen Temperaturen. Ein Maximum der Beweglichkeit von etwa 4´103 cm2/Vs würde bei einer Donatorkonzentration ND von 1017 cm–3 bei etwa 150 K erreicht. Die experimentell ermittelten Beweglichkeiten von modulationsdotierten Strukturen (schattierter Bereich) zeigen jedoch keinen Abfall der Beweglichkeit zu tiefen Temperaturen hin. Die Variation der Beweglichkeiten im schattierten Bereich ist wesentlich durch die von verschiedenen Autoren erreichte Perfektion des Heteroübergangs bedingt. Bei Temperaturen unterhalb von 10 K werden extrem hohe Beweglichkeiten bis zu 2´106 cm2/Vs erreicht. Die Beweglichkeitserhöhung bei tiefen Temperaturen kann noch verstärkt werden, wenn eine undotierte AlxGa1–xAs-Schicht einer Dicke von etwa 100 Å zwischen dem hoch n-dotierten AlGaAs und dem sehr schwach dotierten GaAs bei der Epitaxie eingeschoben wird. Auf diese Weise werden Streuprozesse an Störstellen unmittelbar am Halbleiterübergang ausgeschaltet. Für n-Dotierungen des AlGaAs im Bereich von 1018 cm–3 liegen typische Dicken der Elektronen-Anreicherungsschicht im Bereich von 50 bzw. 100 Å. Die freien Elektronen sind hierbei in z-Richtung (senkrecht zum Heteroübergang) in einen schmalen, dreieckigen Potentialtopf eingesperrt (Abb. 12.26 a). Sie können sich nur parallel zur Heterostruktur frei bewegen. Die Wellenfunktion eines solchen Elektrons hat also nur parallel zur Heterostruktur Blochwellen-Charakter, senkrecht dazu (längs z ) erwartet man Quantisierungseffekte wie für Elektronen in einem Potentialkasten (Abschn. 6.1). Man spricht von einem zweidimensionalen Elektronengas (2 DEG). Gleichartige Effekte wie die an der einfachen modulationsdotierten Heterostruktur (Abb. 12.26 a) treten auf, wenn man epitaktisch zwei spiegelbildlich zueinander liegende Heterostrukturen oder gar eine ganze Serie von Schichten aus Halbleitern I und II mit unterschiedlicher Bandlücke aufeinander aufwachsen lässt (Abb. 12.26 b). Es bildet sich dann in der Bandstruktur eine Serie von sog. „Quantentöpfen“ aus, in denen sich die freien Elektronen des Leitungsbandes ansammeln. Man nennt eine solche Struktur wie in
12.7 Halbleiterheterostrukturen und Übergitter
449
Abb. 12.27. Temperaturabhängigkeit der elektronischen Beweglichkeit von quasi2 D-Elektronengasen in modulationsdotierten AlGaAs/GaAs-Strukturen; der schattierte Bereich umfaßt eine Vielzahl experimenteller Daten. Zum Vergleich sind Beweglichkeitskurven für homogen dotiertes GaAs mit Donatorkonzentrationen ND 4´1013 cm–3 und ND = 1017 cm–3 angegeben (gestrichelt). Die Begrenzung der Beweglichkeiten ist durch folgende Mechanismen gegeben: Streuung an ionisierten Störstellen (IS) (· · ·); Phonon-Streuung (P) (– · –); piezoelektrische Streuung (PE) (– ·· –). (Nach Morkoç [12.8])
Abb. 12.26 b ein Kompositionsübergitter, da dem Kristallgitter eine künstlich erzeugte größere periodische Struktur von Potentialtöpfen überlagert ist. Man spricht weiter von einem modulationsdotierten Übergitter, wenn wie in Abb. 12.26 b nur der Halbleiter I mit der größeren Bandlücke hoch n-dotiert ist, der Halbleiter II mit der kleineren Lücke hingegen sehr schwach dotiert ist. Die freien Elektronen in den Quantentöpfen des Halbleiters II sind wiederum von den Donatorstörstellen in Halbleiter I, von denen sie stammen, räumlich getrennt. Störstellenstreuung wird stark herabgesetzt und es werden senkrecht zur Übergittertranslation (z-Achse) extrem hohe Tieftemperaturbeweglichkeiten wie in Abb. 12.27 gefunden. Die in Abb. 12.26 b eingezeichneten Bandkrümmungen, positiv in Halbleiter I und negativ in Halbleiter II, entsprechen dem Vorzeichen der Raumladung im jeweiligen Gebiet. Eine eindeutige Verknüpfung ist über die Poisson-Gleichung (12.39) gegeben. Sind die Quantentöpfe in Abb. 12.26 b genügend eng, d. h. ist ihre Ausdehnung in z-Richtung kleiner oder in der Größenordnung von 100 Å, so treten wiederum wie in engen Raumladungszonen (Abb. 12.26 a) Quantisierungseffekte in z-Richtung deutlich in Erscheinung. Diese sog. z-Quantisierung wird unmittelbar klar, wenn wir die zeitunabhängige Schrödinger-Gleichung für ein Kristallelektron betrachten, das wie in Abb. 12.26 a und b in einer Richtung ( zAchse) „eingesperrt“ ist, während senkrecht dazu fast freie Beweglichkeit gegeben ist. Das Potential V ist dann nur eine Funktion von z und mit den drei effektiven Massenkomponenten mx , my , mz ergibt sich
450
12. Halbleiter
h2 1 @ 2 1 @2 1 @2 2 mx @x2 my @y2 mz @z2
e V
z w
r E
w
r :
12:88
Durch einen Ansatz der Form w
r uj
zei kx xi ky y uj
zei kk r ;
12:89
der der freien Beweglichkeit parallel zu den Schichten (mit Wellenvektor kk) Rechnung trägt, separiert sich (12.88) in zwei getrennte Differentialgleichungen h2 @ 2 e V
z uj
z ej uj
z ; und
12:90 2 mz @z2 h2 @ 2 h2 @ 2 i kx xi ky y e Exy ei kx xi ky y :
12:91 2 mx @x2 2 my @y2 Gleichung (12.91) liefert als Lösungen Energieeigenwerte, die der freien Bewegung eines Elektrons senkrecht zu z entsprechen Exy
h2 2 h2 2 h2 2 k k k : 2 mx x 2 my y 2 mk k
12:92
Für die Bestimmung von ej muss in (12.90) der genaue Potentialverlauf V (z) bekannt sein. Unter Berücksichtigung der Raumladung hängt V (z) natürlich von der Dichte der freien Elektronen und der ionisierten Donatorrümpfe ab, d. h. über die Elektronendichte gehen die Aufenthaltswahrscheinlichkeitsdichten juj
zj2 mit ins Potential ein. Gleichung (12.90) müsste also selbstkonsistent gelöst werden. In einfacher Näherung jedoch beschreibt man V (z) durch ein starres Rechteck-Kastenpotential (wie in Abschn. 6.1) im Fall der Quantentöpfe (Abb. 12.26 b) oder durch ein Dreieckpotential im Fall einer einfachen modulationsdotierten Heterostruktur (Abb. 12.26 a). Nimmt man im Fall des Kastenpotentials auch noch unendlich hohe „Potentialwände“ an, d. h. einfache stehende Elektronenwellen längs z in diesem Kasten, so folgt gemäß Abschn. 6.1 für die Energieeigenwerte ej ej '
h2 p2 j2 ; 2 mz dz2
j 1; 2; 3 . . . ;
12:93
wenn dz die Ausdehnung des Potentialtopfes in z-Richtung ist. Die Gesamtenergieeigenwerte eines solchen in z-Richtung gequantelten Elektronenzustandes Ej
kk
h2 kk2 ej 2 m k
12:94
werden durch eine Schar diskreter Energieparabeln längs kx und ky , sog. Subbändern, beschrieben (Abb. 12.28 b). Diese zweidimen-
12.7 Halbleiterheterostrukturen und Übergitter
451
sionalen (2 D)-Subbänder besitzen eine konstante Zustandsdichte D
E dZ=dE, wie leicht zu sehen ist: Analog zu Abschn. 6.1 schließt man, dass im 2 D-reziproken Raum der Wellenzahlen kx, ky die Anzahl der Zustände dZ in einem Ring mit der Dicke dk und Radius k gerade durch dZ
2pk dk
12:95
2p2
gegeben ist. Wegen dE = h 2 k dk/mk erhält man für die Zustandsdichte
12:96 D dZ=dE mk =ph2 const ; wenn die Spinentartung durch einen Faktor 2 berücksichtigt wird. Die Gesamtzustandsdichte D (E) aller Subbänder ist somit eine Superposition von konstanten Beiträgen, eine Treppenfunktion wie in Abb. 12.28 c. Scharfe parabelförmige Subbänder wie in Abb. 12.28 b werden nur dann auftreten, wenn die Energieeigenwerte ej (12.93) scharfe Energieniveaus sind. Dies ist der Fall, falls es sich um einen einzelnen Potentialtopf im Leitungsband handelt, oder wenn in einem Übergitter die benachbarten Potentialtöpfe so weit voneinander entfernt sind, dass die entsprechenden Wellenfunktionen aus den ein-
a
b
c Abb. 12.28 a–c. Quantisierung eines quasi-2 D-Elektronengases in einem dreieckigen Potentialwall, der sich in einer starken Anreicherungsrandschicht an einem Heteroübergang bei z = 0 ergibt. (a) Verlauf der Leitungsbandkante EL (z); EF ist das Fermi-Niveau. e1, e2, . . . sind die Energieniveaus, die sich aus der Quantisierung der Einelektronenzustände längs z ergeben. (b) Energieparabeln der Subbänder, aufgetragen längs kx einem Wellenvektor in der Ebene der freien Beweglichkeit senkrecht zu z. (c) Zustandsdichte des in Subbändern gequantelten quasi-2-DElektronengases
452
12. Halbleiter
zelnen Potentialtöpfen sich nicht überlappen. Wird der Abstand zwischen den Potentialtöpfen so gering (kleiner als 50 bis 100 Å), dass ein merklicher Überlapp zwischen den Wellenfunktionen auftritt, dann führt dies zu einer Aufspaltung in Bänder. Diese Aufspaltung ist völlig analog zu der einzelner atomarer Energieniveaus bei Atomen, die sich in einem Kristallverband befinden (Abschn. 7.3). Abbildung 12.29 zeigt die theoretisch erwartete Aufspaltung der Subbandenergien e1, e2, . . . für den Fall eines Rechteck-Übergitters, bei dem die Breite der Potentialtöpfe dz der räumlichen Entfernung zweier Heteroübergänge entspricht. Man sieht, dass das energetisch tiefste Subband e1 unterhalb eines Periodizitätsabstandes von etwa 50 Å merklich verbreitert wird und in ein Band aufspaltet. Für höhere Subbänder tritt die Aufspaltung schon bei größeren Abständen der Potentialtöpfe auf. Der Effekt der Subbandaufspaltung, insbesondere die Abhängigkeit der Subbandenergien von der räumlichen Breite der Potentialtöpfe wird in Photolumineszenzexperimenten deutlich. Photolumineszenzspektroskopie ist eine wichtige optische Charakterisierungsmethode für Halbleiterheterostrukturen und Übergitter. Es handelt sich hierbei um die Umkehrung eines optischen Absorptionsexperimentes: Die Halbleiterstruktur wird mit monochromatischem Laser-Licht einer Photonenenergie oberhalb der Bandkante bestrahlt, d. h. es werden Elektron-Loch-Paare erzeugt, die die Subbänder des Leistungs- bzw. Valenzbandes des Halbleiters bzw. die entsprechenden exzitonischen Zustände (Abschn. 11.11) besetzen. Im Fall von direkten Halbleitern (Abschn. 12.1) ist die Rekombination der freien Elektronen mit den Defektelektronen mit einer starken Lumineszenzstrahlung verbunden, die im Fall scharfer Subbänder monochromatisch ist und bis auf exzitonische Bindungsenergien (Abschn. 11.11) dem energetischen Abstand der Subbänder für Elektronen und Löcher entspricht. Das Experiment muss bei tiefen Temperaturen durchgeführt werden, um die geringe energetische
Abb. 12.29. Energiezustände von Elektronen, die in rechteckigen Potentialtöpfen des Leitungsbandes eines Kompositionsübergitters „eingesperrt“ sind (Einschub); die Potentialtöpfe haben eine Weite dz, die auch ihrem Abstand voneinander entspricht. Für die Rechnung wurde eine elektronische effektive Masse von m = 0,1 m0 angenommen. Die scharfen Kurven im schraffierten Gebiet folgen für einzelne Potentialtöpfe mit den entsprechenden Weiten dz; Potentialtöpfe in einem Übergitter führen bei genügend geringem Abstand zu einem Überlapp und damit zu einer Aufspaltung in Bänder (schraffierte Gebiete). (Nach Esaki [12.9])
12.7 Halbleiterheterostrukturen und Übergitter
453
Aufspaltung der Subbandstruktur (e1, e2, . . . ) beobachten zu können. Die Beobachtung bei tiefer Temperatur ist auch der Grund dafür, dass Subband-Exzitonen stabil sind und die Rekombinationsstrahlung aus den exzitonischen Elektron-Loch-Zuständen erfolgt. Abbildung 12.30 zeigt ein Photolumineszenzspektrum, das an einer AlGaAs/GaAs-Vielfachschichtstruktur bei einer Temperatur von 2,7 K aufgenommen wurde. Die Schichtstruktur besteht aus vier GaAs-Quantentöpfen verschiedener Dicke (20, 30, 60, 100 Å), die zwischen Al0,3Ga0,7As-Barrieren eingebettet sind. Entsprechend den verschiedenen Dicken der Quantentöpfe werden vier scharfe unterschiedliche Lumineszenzlinien bei Photonenenergien zwischen 1,55 und etwa 1,75 eV beobachtet. Da die Subbänder dadurch gekennzeichnet sind, dass jeweils ein Vielfaches der halben Elektronenwelle in etwa in den Quantentopf hineinpassen muss, liefern dünnere Quantentöpfe weiter auseinander liegende Subbänder im Valenz- bzw. Leitungsband und damit energetisch höhere Übergangsenergien in der Photolumineszenz. Für eine genaue theoretische Auswertung der Beziehung zwischen Photonenenergie der Lumineszenzbande und der Quantentopfdicke muss natürlich noch berücksichtigt werden, dass die angeregten Elektron-Loch-Paare einer Coulombanziehung unterliegen und daher die Differenz der Elektronen- und Lochsubbänder nur bis auf eine Exzitonenbindungsenergie mit der ausgesandten Photonenenergie übereinstimmt. Da lokal variierende Dicken von Quantentöpfen verschiedene spektrale Lagen der ausgesandten Photolumineszenzlinien zur Folge haben, eignet sich hochaufgelöste Photolumineszenzspektroskopie sehr gut, um räumliche Schichtdickenschwankungen von Quantentopfschichten zu untersuchen. Neben den bisher betrachteten Kompositionsübergittern existiert ein zweiter Typ von Halbleiter-Übergittern, sog. Dotierungsübergitter. Hierbei besteht die Übergitterstruktur aus ein und demselben Halbleitermaterial, jedoch ist das Material in periodischer Abfolge abwechselnd n- und p-dotiert. Im Prinzip handelt es sich also um eine periodische Sequenz von p-n-Übergängen (Abschn. 12.6). Weil jeweils zwischen den n- und p-Zonen quasi-intrinsische (i)
Abb. 12.30. Photolumineszenzspektrum, aufgenommen bei 2,7 K an einer Mehrfachquantentopfstruktur aus Al0, 3Ga0,7As/GaAs, die mittels MBE hergestellt wurde. Die verschiedenen Emissionslinien resultieren aus Elektron-Loch-Rekombinationsprozessen in den verschieden dicken Quantentöpfen ˚ ). Das entsprechende Bän(20 bis 100 A derschema (EL, EV) der Schichtstruktur mit Zuordnung der Quantentöpfe zu den Emissionslinien ist angedeutet. (Nach Förster [12.10])
454
12. Halbleiter
Bereiche vorhanden sind, haben diese Strukturen auch den Namen „ nipi-Strukturen “. Die Herstellung dieser Gitter geschieht auch in Epitaxieanlagen (MOCVD, MBE etc., Tafel XVII). Während des Wachstums werden abwechselnd p- und n-Dotierungsquellen angeschaltet. Die interessanten Eigenschaften von nipi-Übergittern zeigen sich in der ortsabhängigen elektronischen Bandstruktur (Abb. 12.31). Wegen der periodischen Abfolge von n- und p-dotierten Gebieten muss einmal die Leitungsband- und dann die Valenzbandkante nahe am Fermi-Niveau liegen. Dies führt zu einer räumlich periodischen Modulation der Bandkanten. Angeregte freie Elektronen (thermisch wie im Nichtgleichgewicht) befinden sich dann in den Leitungsbandminima, während angeregte Defektelektronen sich räumlich getrennt in den Maxima des Valenzbandes ansammeln. Diese räumliche Trennung von Elektronen und Löchern ist verantwortlich dafür, dass die Stoßrate zwischen diesen beiden Teilchen drastisch herabgesetzt wird. Als interessante Eigenschaft resultiert eine extrem hohe Lebensdauer von Elektronen und Löchern gegen Rekombination. Dies wird vor allem deutlich, wenn ElektronLoch-Paare durch Einstrahlen von Licht erzeugt werden. Ein Photostrom kann in solchen nipi-Strukturen wesentlich länger existieren als in homogen dotierten Halbleitern. Eine andere interessante Eigenschaft von Dotierungsübergittern betrifft die Bandlücke. Trotz weitgehender räumlicher Trennung von Elektronen- und Lochzuständen besteht ein gewisser Überlapp der Wellenfunktionen im Übergangsbereich (i-Bereich). Daraus resultiert die Möglichkeit optischer Übergänge sowohl in Absorption wie in Emission. Optische Übergänge erscheinen also infolge der Bandmodulation bei Quantenenergien unterhalb der Bandkante des homogen dotierten Halbleiters (Abb. 12.31). nipi-Strukturen haben eine effektive Bandlücke E eff g , die durch die jeweilige n- und p-Dotierung gezielt eingestellt werden kann. In einfachster Näherung geht man in der theoretischen Beschreibung wie beim p-n-Übergang (Abschn. 12.6) von vollständig ionisierten Störstellen aus und
Abb. 12.31 a–c. Bänderschema eines Dotierungs-(nipi)-Übergitters, bei dem ein und dasselbe Halbleitermaterial (z. B. GaAs) abwechselnd n- und p-dotiert wird. (a) Qualitative räumliche Darstellung der Struktur. (b) Bänderschema im thermischen Gleichgewicht. (c) Bänderschema bei starker Anregung von Elektron-Loch-Paaren über das thermische Gleichgewicht hinaus
12.7 Halbleiterheterostrukturen und Übergitter
455
verwendet die Schottky-Näherung mit „ rechteckigen“ Raumladungsverteilungen. Wegen der Verknüpfung von Bandkrümmung mit Raumladungsdichte über die Poisson-Gleichung (12.39) ist unmittelbar einsichtig, dass eine Verringerung der Raumladung eine Abnahme der Bandkrümmung und damit ein Abflachen der Bandmodulation zur Folge hat. Die effektive Bandlücke wird größer (Abb. 12.31). Die Raumladung setzt sich zusammen aus ionisierten Donatoren (positiv) und Elektronen im n-Gebiet sowie aus ionisierten Akzeptoren (negativ) und Defektelektronen im p-Gebiet. Genügend hohe Anregung von Elektronen und Löchern, z. B. durch Lichteinstrahlung, verringert also die Raumladung und schwächt die Bandmodulation ab. Bei nipi-Übergittern wird die effektive Bandlücke abhängig von der Anregungsdichte optisch erzeugter Nichtgleichgewichtsladungsträger. Die effektive Bandlücke kann optisch verändert werden. Dies lässt sich leicht in einem Photolumineszenzexperiment (Abb. 12.32) zeigen, bei dem die Rekombinationsstrahlung von optisch angeregten Elektronen und Löchern in Abhängigkeit von der Laser-Anregungsleistung beobachtet wird [12.11]. An einem GaAs-nipi-Übergitter mit einer p- und n-Dotierung von etwa 1018 cm–3 und einer Translationsperiode von etwa 800 Å erscheint die Bandkantenlumineszenzlinie bei niedriger Anregungsleistung knapp oberhalb von 1,2 eV (Abb. 12.32), während homogen dotiertes GaAs bei 2 K eine Bandlücke von etwa 1,5 eV hat. Mit wachsender Anregungsleistung verschiebt sich die Lumineszenzlinie zu höheren Energien bis in den Bereich der GaAs-Bandkante, so wie man bei Abnahme der Bandmodulation erwarten würde. Halbleiterheterostrukturen und Übergitter haben wegen ihrer völlig neuen Eigenschaften, die bei homogenen Halbleitern nicht auftreten, eine „neue Dimension“ im Bereich der Mikroelektronik geöffnet. Neue Bauelementkonzepte sowohl im Bereich sehr schneller Schaltungen wie auch in der Optoelektronik werden möglich. Die Entwicklung auf diesem Gebiet ist erst am Anfang [12.12].
Abb. 12.32. Photolumineszenzspektren, gemessen an einem GaAs-nipi-Übergitter, das mittels metallorganischer MBE (MOMBE) auf einem GaAs-Wafer mit (100)-Orientierung abgeschieden wurde; p-Dotierung durch Kohlenstoff. n-Dotierung durch Si. Die Spektren wurden mit verschiedenen Anregungsleistungsdichten und einer Photonenenergie von 1,92 eV bei 2 K aufgenommen. (Nach Heinecke et al. [12.11])
456
12. Halbleiter
12.8 Wichtige Halbleiterbauelemente Moderne Informationstechnik basiert auf integrierten Halbleiterschaltkreisen (IC) für Datenverarbeitung (Logik) und Speicherung und, soweit der Datentransfer wie z. B. in Netzwerken mittels Glasfaser erfolgt, auf optoelektronischen Bauelementen, wie Detektoren, optischen Emittern, lichtemittierenden Dioden (LEDs) und Halbleiterlasern. Während über 90% aller Halbleiter-ICs auf Siliziumwafern hergestellt werden, sind die wichtigsten Ausgangsmaterialien für optoelektronische Bauelemente III–V-Halbleiter, vor allem GaAs. Der Grund ist, dass höchste Integrationsdichte, d. h. kleinste Strukturgrößen, einfacher auf dem Elementhalbleiter Silizium zu erreichen sind, während für optoelektronische Bauelemente die weitaus stärkere Ankopplung des elektromagnetischen Feldes an elektronische Bandübergänge bei direkten III–V-Halbleitern wesentlich ist. Für Logik- und Speicherschaltkreise in der Informationstechnik wie auch für Leistungselektronik sind Transistoren die wichtigsten aktiven Bauelemente. Transistoren sind sog. Dreitorbauelemente, d. h. Schalter, bei denen ein Eingangssignal an einem Kontakt Ströme oder Spannungen zwischen zwei anderen Kontakten schaltet. Transistoren sind gleichzeitig Verstärker für Strom und/oder Spannung. Die wesentlichen optoelektronischen Bauelemente, Detektoren, lichtemittierende Dioden und Laser sind demgegenüber Zweitorbauelemente (Dioden), bei denen nur Stromfluss über zwei Kontakte erforderlich ist. Bauelemente lassen sich nach einem weiteren Kriterium unterscheiden: je nachdem, ob nur eine Ladungsträgersorte die wesentliche Bauelementfunktion trägt, oder ob beide Ladungsträgerarten, Elektronen und Löcher, beteiligt sind, spricht man von unipolaren oder bipolaren Bauelementen. Mit Hilfe dieses Kriteriums können wir die beiden wichtigen Klassen von Transistoren unterscheiden, nämlich Bipolartransistoren und Feldeffekt-Transistoren (FETs), die unipolaren Charakter haben. Laser, bei denen die Lichtemission aus der Rekombination von Elektronen und Löchern resultiert, sind in diesem Sinne auch bipolare Bauelemente. Der Bipolartransistor Der klassische Bipolartransistor, der 1947 von Bardeen, Brattain und Shockley in den Bell-Laboratorien (USA) erfunden wurde, besteht aus zwei gegeneinander geschalteten pn-Übergängen (Abb. 12.33a). Dementsprechend gibt es npn- und pnp-Transistoren, die sich dadurch voneinander unterscheiden, dass im ersten Fall (npn) Elektronen, im zweiten Fall (pnp) Löcher den Hauptstrom tragen, obwohl, wie der Begriff „bipolar“ ausdrückt, beide Ladungsträgersorten an der Funktion des Bauelementes mitwirken. In Abb. 12.33 a ist die Verschaltung eines npn-Transistors schematisch dargestellt: Der erste n+p-Übergang (hohe n-Dotierung,
12.8 Wichtige Halbleiterbauelemente
457
Elektronenfluss
mäßige p-Dotierung) ist in Durchlassrichtung gepolt, so dass über eine enge Raumladungszone mit niedrigem Widerstand eine hohe Konzentration von Elektronen aus dem sog. n+-Emittergebiet in die p-dotierte Basiszone „hinüberflutet“. Diese aus der Emitterzone emittierten Elektronen sind in der Basis Minoritätsladungsträger. Ihre Tendenz, mit den dort in hoher Zahl vorhandenen Löchern zu rekombinieren, ist groß. Ist jedoch, wie bei einem effizienten Transistor, diese Basiszone räumlich sehr kurz (im Vergleich zur Rekombinationslänge), so gelangt ein Großteil der Elektronen ohne Rekombination in den angrenzenden p(Basis)-n(Kollektor)-Übergang, der in Sperrrichtung gepolt ist. Wie aus dem Bänderschema in Abb. 12.33 c ersichtlich ist, geraten diese Überschusselektronen in das starke, beschleunigende Feld dieser ausgedehnten pn-Raumladungszone und werden in das Kollektor-Gebiet hineingezogen. Bei genügend schmaler Basiszone ist der Kollektorstrom IC nur geringfügig kleiner als der Emitterstrom IE, nämlich gerade um den Anteil IBn, der in der Basis durch Rekombination mit zufließenden Löchern (Majoritätsladungsträger) verloren geht (Abb. 12.33 b). Der Kollektorstrom ist im wesentlichen durch die an Emitter und Basis anliegende Durchlassspannung UEB und deshalb auch durch
Abb. 12.33. Schema und Funktionsweise eines npn-Bipolartransistors. (a) Schematischer Aufbau des Transistors mit Verschaltungsskizze in der sog. Basisschaltung; die Raumladungszonen der in Flussrichtung geschalteten Emitter (E)-Basis (B) und in Sperrrichtung gepolten Basis (B)-Kollektor (C)-Übergänge sind schattiert angedeutet. (b) Schematische Darstellung der bei der Transistorfunktion mitwirkenden Ströme. Der für die Funktion des npn-Transistors wichtige Elektronenfluss von der Basis zum Kollektor ist schraffiert eingezeichnet. Stromrichtungen sind in technischer Konvention angegeben (IE, IC, IB etc.). (c) Elektronisches Bänderschema E (x) längs einer Raumrichtung x von Emitter über Basis zum Kollektor hin, bei anliegender Emitter-Basisspannung UEB und Basis-Kollektorspannung UBC; ELE, EVE und ELC, EVC sind Leitungs- bzw. Valenzbandkante in der Emitter (E)- bzw. Kollektor (C)-Region; EFE, EFC sind die Quasi-Fermi-Niveaus in der Emitterbzw. Kollektorregion. In der Basisregion ist ein unerwünschter Elektron-LochRekombinationsprozess angedeutet (gestrichelte Pfeile)
458
12. Halbleiter
den Basisstrom IB bestimmt. Man kann also den Kollektorstrom IC als durch den Basisstrom IB kontrolliert auffassen. Die Sperrspannung UBC am Basis-Kollektor-Übergang hat dagegen nur geringen Einfluss auf IC. Der von außen in die Basis fließende Strom IB setzt sich aus drei Anteilen zusammen. Der Anteil IBn entsteht durch Rekombination von Löchern mit aus dem Emitter fließenden Elektronen. Der Löcherstrom IEp (Majoritätsladungsträger in der Basis) diffundiert über die Valenzbandbarriere in den Emitter. Einen dritten Anteil ICp bilden die im Kollektor thermisch erzeugten Löcher (dort Minoritätsladungsträger), die über das zwischen Basis und Kollektor bestehende Sperrfeld in die Basis hinein beschleunigt werden (Abb. 12.33b). Damit ergeben sich folgende Beziehungen zwischen den verschiedenen Stromanteilen: IE IEn IEp ;
12:97 a
IC ICn ICp
12:97 b
IB IE
IC IEp IBn
ICp :
12:97 c
Da der Basisstrom IB typisch unterhalb von 1% des Kollektorstromes liegt, lässt sich der Kollektorstrom, der als Emitter-Basisstrom über die Basis in den Kollektor hineingezogen wird, vereinfachend aus der Beziehung für den p-n-Übergang (12.74) hinschreiben [12.4]: IC IE A
eDn nB exp
eUEB =k T Ln
1 ;
12:98
wo A die stromführende Fläche des Transistors, Dn die Diffusionskonstante der Elektronen in der Basis, nB deren Gleichgewichtskonzentration dort und Ln die elektronische Diffusionslänge in der p-dotierten Basis sind. Da die Diffusionslänge Ln mit der Diffusionslebensdauer sn bzw. Diffusionszeit zusammenhängt über p Ln = Dn sn , kann man Dn/Ln als eine Diffusionsgeschwindigkeit der Elektronen in der Basis auffassen, so dass der Strom (12.98) als ein Produkt aus der Zahl der in die Basis injizierten Elektronen und der Diffusionsgeschwindigkeit aufgefaßt werden kann. Letztere bestimmt also maßgeblich die Geschwindigkeit des Transistors. Der exponentielle Anstieg des Kollektorstromes mit der BasisEmitterspannung UEB ist in Abb. 12.34 b dargestellt. Diese Darstellung wird als Übertragungskennlinie bezeichnet. Die sog. Ausgangskennlinien IC (UCE) sind in Abb. 12.34 c dargestellt. Sie zeigen im wesentlichen das Verhalten des gesperrten Basis-Kollektorpn-Übergangs, da der Emitter-Basis-Widerstand sehr klein ist. Die Ausgangskennlinien stellen also Sperrströme einer pn-Diode dar, bei der die Höhe des Sperrstroms durch die Emitter-Basis-Spannung UEB gesteuert wird. Bipolartransistoren können entsprechend verschiedener Anwendungsbereiche in drei verschiedenen Grundschaltungen betrieben werden [12.13], benannt danach, welcher Kontakt auf Erdpotential liegt. In der Basisschaltung (Basis auf Erdpotential), die auch
12.8 Wichtige Halbleiterbauelemente
459
Abb. 12.34. (a) Aufbau eines planar hergestellten Bipolartransistors. Verschieden dotierte Emitter-, Basis- und Kollektorregionen sowie die dazwischen liegenden Raumladungszonen (E/B und B/C, unschattiert) sind verschieden stark schattiert angedeutet. Die dargestellte Schnittrichtung durch die Struktur längs AA ist in der Aufsicht auf die metallischen Kontakte (E, B) angegeben (Einschub). (b) Übertragungskennlinie eines Bipolartransistors (Nach Tietze und Schenk [12.13]). (c) Ausgangskennlinienfeld eines Bipolartransistors mit der Emitter-Basisspannung UEB als Parameter. Änderungen im Kollektorstrom DIC als Funktion von DUEB werden durch die Steilheit gm = @IC/@UEB beschrieben. (Nach Tietze und Schenk [12.13])
schon den Überlegungen zur Abb. 12.33 zugrunde lag, ist der Kollektor-Ausgangsstrom IC immer um den Basisstromanteil IBn (IBnIC) kleiner als der Eingangsstrom IE. Jedoch können signifikante Spannungs- und Leistungsverstärkungen erzielt werden, weil im Eingangskreis des Transistors der niederohmige, in Durchlassrichtung gespannte, Emitter-Basis-pn-Übergang liegt, während der Ausgangsstrom IC (&IE) über den hochohmigen, gesperrten BasisKollektor-pn-Übergang fließt und damit einen großen Lastwiderstand mit hohem Spannungsabfall im Ausgangskreis ermöglicht. In der häufiger verwendeten Emitterschaltung liegt der Emitteranschluss des Transistors auf Erdpotential und der im Verhältnis zum Kollektorstrom geringe Basisstrom IB steuert als Eingangsstrom den Kollektorstrom. In dieser Schaltungsart zeigt der Transistor offensichtlich Stromverstärkung. Neben der Stromverstärkung sind die in Abb. 12.34 c erklärte Steilheit gm @IC =@UEB und die sog. Emittereffizienz c = @IEn/@IE wichtige Charakterisierungsgrößen eines Bipolartransistors. Die Emittereffizienz gibt an, welcher Bruchteil des gesamten Emitterstromes IE wirklich von den Majoritätsladungsträgern und nicht von Löchern aus der Basisregion getragen wird. Zwecks Steigerung der Schnelligkeit möchte man den Leitwert der Basis erhöhen; dies verlangt höhere Basisdotierungen, was wiederum den Rückstrom IEp von Löchern in den Emitter erhöht und damit die Emittereffizienz c verringert. Einen Ausweg aus diesem Problem bieten moderne Hetero-Bipolartransistoren (HBT), bei denen die Emitterzone in Form einer Heterostruktur aus einem Halbleiter mit
460
12. Halbleiter
größerer Bandlücke (z. B. AlGaAs auf GaAs) epitaktisch auf die Basis-Kollektorschichten abgeschieden wird. Bei einer merklichen Banddiskontinuität im Valenzband (Abschn. 12.7) verhindert die Valenzbandbarriere den erhöhten Rückstrom von Löchern aus der Basis in den Emitter trotz hoher p-Dotierung der Basis. Ähnliche Konzepte sind möglich, indem als Basismaterial Halbleiter mit geringerer Bandlücke als beim Emittermaterial eingesetzt werden. Feldeffekt-Transistoren (FET) Feldeffekt-Transistoren sind prinzipiell Widerstände, die durch eine äußere Spannung gesteuert werden. Von daher ist ihr Aufbau einfacher. Da nur eine einzige Ladungsträgersorte gesteuert wird, handelt es sich um unipolare Bauelemente. Ein FET besteht also prinzipiell aus einem Stromkanal mit zwei Kontakten, „Source“ (Quelle) und „Drain“ (Abfluss). Ein dritter Steuerkontakt, das „Gate“ (Tor), ist über eine hochohmige Barriere vom leitenden Kanal getrennt und gestattet das Anlegen einer Steuerspannung gegenüber dem Kanalpotential. Über diese Steuerspannung kann mehr oder weniger Ladung im Kanal influenziert und dadurch der Kanalwiderstand modifiziert werden. Es gibt drei Haupttypen von FETs (Abb. 12.35), die sich im wesentlichen durch die Art des Kanals und durch die Gatebarriere unterscheiden. Der wichtigste Transistor, der die Basis für alle hochintegrierten Silizium-Logik- und Speicherschaltkreise darstellt, ist der MOSFET (metal oxide semiconductor FET) (Abb. 12.35 a). In der Aufsicht sind für FETs jeweils drei längliche, fingerartige Metallkontakte (S, G, D) charakteristisch (Abb. 12.35 a). Der schematische Querschnitt des MOSFET zeigt den Aufbau darunter: Source und Drain-Gebiet unter den Metallkontakten bestehen aus hochdotierten n+-Wannen, die durch Ionenimplantation in einem pdotierten Siliziumwafer erzeugt werden. Zwischen den beiden n+Wannen liegt also ein p-dotiertes Gebiet. Beim Anlegen einer Source-Drainspannung ist einer der pn-Übergänge gesperrt, so dass zwischen Source und Drain nur ein sehr geringer Strom fließt. Durch eine Oxidschicht (SiO2) ist das p-Gebiet zwischen den n+Wannen von der metallischen Gateelektrode getrennt. Wird nun eine genügend hohe positive Gatespannung UG (bezogen auf SourcePotential) angelegt, so fällt diese natürlich über der SiO2-Isolatorschicht ab und das elektronische Bänderschema unterhalb des Gates verbiegt sich (Abb. 12.35a), so dass aus der anfänglichen (UG = O) p-Randzone im Silizium durch Inversion (Ei < EF) eine starke n-Anreicherungsrandschicht unterhalb des Gateoxids wird. Die beiden n+-Wannen des Source- und Draingebietes sind dann leitend miteinander über den n-Anreicherungskanal verbunden. Der Transistor ist durch die positive Gatespannung von „zu“ nach „auf“ geschaltet worden. Die Funktion des MOSFET hängt ganz wesentlich von der Perfektion der SiO2-Schicht und deren Grenzfläche zum darunter liegenden Si-Kanal ab. Störstellen im Oxid oder an der Grenzfläche
12.8 Wichtige Halbleiterbauelemente
461
n-GaAs
Abb. 12.35. Schematischer Aufbau und elektronische Bänderschemata längs einer Achse senkrecht zur Waferoberfläche unterhalb der metallischen Gate-Elektrode für die drei wichtigsten Typen von Feldeffekt-Transistoren (FET): (a) MOSFET (metal-oxide-semiconductor FET) nur auf Si-Basis mit SiO2 als Oxid realisierbar; ch leitender Kanal, L Kanallänge. Aus technologischen Gründen wird die metallische Gate-Elektrode aus hoch in die Entartung dotiertem polykristallinen Silizium (polySi) gefertigt. (b) MESFET (metal-semiconductor FET), bevorzugt auf III–V-Halbleiterbasis, z. B. GaAs; (c) HEMT (high electron mobility transistor), bevorzugt auf III–V-Halbleiterheterostrukturen, z. B. AlGaAs/GaAs; der leitende Kanal wird durch ein 2-dimensionales Elektronengas (2DEG) gebildet, das über hoch n+-dotierte Zonen leitend an die Source- und Drainkontakte angeschlossen ist. Die Bänderschemata sind gezeichnet für den spannungslosen Fall (Gate-Spannung UG = 0, oben) und darunter für positive Gatespannung UG (MOSFET) bzw. negative Gatespannung (MESFET, HEMT); EF (Quasi) Fermi-Niveau, EL Leitungsbandkante, EV Valenzbandkante, Ei intrinsisches Energieniveau
würden bei Veränderung der Gatespannung gleichfalls umgeladen, so dass dann nur ein geringer Teil der Gatespannung für die Steuerung der Inversionsschicht wirksam würde. Die Möglichkeit, dünne geschlossene Oxidschichten der gewünschten hohen Volumen- und Grenzflächenqualität herzustellen, bietet aber nur Silizium. MOSFETs können also nur auf Siliziumwafern hergestellt werden. Insbesondere III–V-Halbleiter wie GaAs, die wegen ihrer höheren Elektronenbeweglichkeit dem Silizium an Schnelligkeit überlegen sind, können nicht mit perfekten Oxidschichten bedeckt werden. Selbst bei hervorragenden Volu-
462
12. Halbleiter
meneigenschaften einer Isolatorschicht würde die Grenzfläche zwischen dem GaAs und dem Gate-Isolator hohe Defektdichten aufweisen, die zum Teil durch Nichtstöchiometrie zustande kommen. Von daher ist bei III–V-Halbleitern der MESFET (metal semiconductor FET) (Abb. 12.35 b) der gängigste FET. Auf ein intrinsisches (i) oder sog. semi-isolierendes GaAs-Substrat (Cr-dotiert), wo das Fermi-Niveau EF nahe der Mitte des verbotenen Bandes liegt, wird n-dotiertes GaAs als dünne kristalline Schicht abgeschieden, oder durch Ionenimplantation erzeugt. Da in dieser Schicht freie Elektronen von den Donatoren herrührend in hoher Zahl vorhanden sind, liegt die Leitungsbandkante hier nahe an EF, so dass sich ein leitender n-Kanal ausbildet, der nach oben hin durch die Schottky-Verarmungsrandschicht unter der unmittelbar auf das GaAs aufgedampften metallischen Gateelektrode begrenzt ist. Wie in Abschn. 12.6 ausgeführt, ist in einer solchen MetallGaAs-Schottky-Barriere das Fermi-Niveau an der Grenzfläche nahe der Mitte des verbotenen Bandes „gepinnt“, so dass sich unterhalb der Gate-Metallelektrode die elektronischen Bänder vom leitenden n-Gebiet zur Metallelektrode hin wieder aufwärts biegen. Das metallische Gate ist also vom n-Kanal über eine Zone hohen Widerstands getrennt. Source- und Drain-Kontakte sind demgegenüber als niederohmige leitende Kontakte ausgebildet, was durch eine lokale, sehr hohe n+-Dotierung unter der Metallisierung geschehen kann. In der Anordnung in Abb. 12.35 b besteht also bei UG = O zwischen Source und Drain ein leitender n-Kanal, der durch Anlegen einer negativen Spannung UG ans Gate abgeschnürt wird, indem das Fermi-Niveau des metallischen Gate gegenüber dem Fermi-Niveau EF im i-GaAs angehoben wird. Da wegen des „pinning“ des Fermi-Niveaus nahe der Bandmitte (UB = const) auch das gesamte Bandschema dabei „angehoben“ wird, verarmt die Kanalzone an Elektronen, sie wird nichtleitend. Der Transistor schaltet bei Anlegen einer genügend hohen negativen Gatespannung von „auf“ nach „zu“. Die Funktion hängt natürlich empfindlich von der Dicke der n-dotierten Schicht im Vergleich zur Ausdehnung der Schottky-Verarmungsrandschicht (typisch 50 nm) unter der Gate-Metallelektrode ab. Komplementär zu diesem beschriebenen „Normal-Auf“ („Normally-On“)-MESFET führt ein dünnerer n-GaAs-Kanal mit einer zur Schottky-Verarmungsrandschicht vergleichbaren Kanaldicke zu einem „Normal-Zu“ („Normally-Off“)-Transistor, bei dem durch Anlegen einer genügend großen positiven Gatespannung eine unter dem Gate abwärts weisende Bandverbiegung den Kanal öffnet und den Transistor nach „auf“ schaltet. Seit man Halbleiterheterostrukturen hoher Qualität mittels moderner Epitaxieverfahren (MBE, MOCVD, Tafel XVII) herstellen kann, hat sich für extrem hohe Frequenzen (20–100 GHz) der besonders schnelle und rauscharme HEMT (high electron mobility transistor) als eine Weiterentwicklung des MESFET, insbesondere für Radaranwendungen und Satellitenkommunikation etabliert
12.8 Wichtige Halbleiterbauelemente
463
(Abb. 12.35 c). Der HEMT ist ein Heterostruktur-FET, der genau wie ein MESFET über eine Schottky-Barriere unter dem metallischen Gate geschaltet wird, bei dem der n-Kanal jedoch durch ein modulationsdotiertes 2DEG an der Grenzfläche zwischen einer AlGaAs/GaAs-Heterostruktur gebildet wird (Abschn. 12.7). Die hohe Elektronenkonzentration von typisch 2´1012 cm–2 im 2DEG rührt von Donatoren in der n+-AlGaAs-Barriere her, so dass der Kanal weitgehend frei von Streuzentren ist, was die hohe KanalBeweglichkeit und Rauscharmut des Transistors bewirkt. Eine Variationsmöglichkeit, die bei allen drei Typen von FETs gegeben ist, besteht darin, die jeweiligen Dotierungen zu invertieren (p nach n). Man erhält dann gleichartige Funktionen der Transistoren, die aber bei invertierten anliegenden Potentialen (plus nach minus) jeweils durch Löcher statt durch Elektronen getragen werden. Löcher haben größere effektive Massen als Elektronen. Ihre Beweglichkeit ist daher geringer und die p-Kanal-FETs sind langsamer als ihre n-Kanal-Analoga. Dennoch beruhen fast alle modernen digitalen Siliziumschaltkreise heute auf Kombinationen aus jeweils einem p- und einem n-Kanal MOSFET (CMOS = complementary MOS). Die Gegeneinanderschaltung dieser beiden Transistoren ermöglicht den Aufbau logischer Gatter, die wegen der entgegengesetzten Spannungspolaritäten an den Transistoren nur Strom führen, wenn der Schaltvorgang zwischen verschiedenen Bit-Operationen stattfindet. CMOS-Schaltungen sind deshalb extrem leistungsarm, ein großer Vorteil bei immer höherer Integrationsdichte. Die verstärkende Wirkung von FETs rührt daher, dass sehr kleine Gateströme bereits genügend Ladung auf das Gate bringen, um wesentlich größere Source-Drain-Ströme zu schalten. Wegen des wesentlich höheren Widerstandes der dünnen SiO2-Gate-Isolation beim MOSFET im Vergleich zum Widerstand der SchottkyBarriere bei MESFET und HEMT fließen beim MOSFET natürlich kleinere Gateströme. Wichtige Kenngrößen eines FET sind die Steilheit g (Änderung des Drainstroms mit der Gatespannung) und die Gatekapazität Cg. Das Verhältnis von Steilheit zu Kapazität bestimmt die maximale Frequenz f = g/Cg, bei der der FET noch effektiv arbeitet. Um die Hochfrequenzeigenschaften eines FET zu verbessern, gilt es also, seine Gatekapazität möglichst klein und seine Steilheit möglichst groß zu machen. Sehr schnelle HEMTs im Materialsystem GaInAs/InP erreichen bei Kanallängen von 0,10 lm heute Steilheiten von etwa 600 mS/mm und obere Grenzfrequenzen fmax&300 GHz, bei denen die Leistungsverstärkung gerade auf 1 abfällt [12.14]. Typische Source-Drain-Strom-Spannungskennlinien ISD (USD) von FETs, in diesem Fall von MOSFETs, sind in Abb. 12.36 dargestellt, mit der Gatespannung UG als Parameter. Für kleine USD, wo die Inversionsrandschicht entlang des Kanals fast nicht von USD abhängt, ist der Strom ISD näherungsweise proportional zur anliegenden Spannung USD (quasi-Ohmsches Verhalten). Wachsen-
464
12. Halbleiter
Abb. 12.36. Kennlinienfelder von SiMOS-Feldeffekttransistoren (MOSFET): Source/Drain-Strom ISD als Funktion der Source/Drain-Spannung USD mit Gate-Spannung UG als Parameter (a) für einen Kurzkanal-MOSFET (GateLänge Lg = 0,6 lm, Gate-Weite 5 lm); (b) für einen Langkanal-MOSFET (Gate-Länge Lg = 10 lm, Gate-Weite 5 lm). (Nach Mühlhoff und McCaughan [12.15])
de Source-Drain-Spannung USD führt zu einem merklichen Potentialgefälle längs des Kanals auf der Halbleiterseite, während das Potential auf der Gateseite durch das metallische Gate konstant gehalten wird. Entlang des Kanals erhöht sich also die Spannung, die quer zum Kanal abfällt. Dies führt zu einer längs des Kanals abnehmenden Kanaldicke (12.80), wodurch die Sättigung des Stroms ISD oberhalb von Spannungen USD > 2 V bewirkt wird. Die Abhängigkeit des Sättigungsstroms ISD vom Parameter Gatespannung UG ist für Kurzkanaltransistoren und Langkanaltransistoren verschieden. In kurzen Kanälen (Abb. 12.36 a) erreichen die Ladungsträger wegen der hohen Feldstärke zwischen Source und Drain die konstante Sättigungsgeschwindigkeit v s (Abb. 12.15). Der Strom ISD wächst proportional zur influenzierten Ladung und damit proportional zur Gatespannung UG (Abb. 12.36 a). Im Fall langer Kanäle muss man in Betracht ziehen, dass die Potentialdifferenz zwischen Gate und Kanal längs des Kanals variiert. Im Sättigungsbereich bei hohen Source-Drain-Spannungen kann das Gate in der Nähe des Source-Kontaktes gegenüber dem Kanal positiv geladen sein, während es nahe am Drain in Bezug auf den Kanal noch negativ ist. Folglich ist der Kanal in der Nähe des Drain-Kontaktes verengt und damit hochohmig. Eine höhere positive Gate-Spannung ändert somit nicht nur die lokale Ladungsträgerkonzentration sondern auch die Länge, längs der der Kanal hochohmig ist. In diesem Fall ergibt sich eine quadratische Abhängigkeit des Source-Drain-Stromes ISD von der Gate-Spannung UG (Abb. 12.36 b). Ähnliche Kennlinien wie hier für den MOSFET diskutiert, werden auch für MESFET und HEMT gefunden.
12.8 Wichtige Halbleiterbauelemente
465
Halbleiterlaser Optoelektronische Bauelemente, wie Photodetektoren, Solarzellen, lichtemittierende Dioden (LED) und Laser, beruhen auf der Wechselwirkung eines Lichtfeldes mit elektronischen Anregungen im Halbleiter. Diese Wechselwirkung beinhaltet drei Prozesse: Absorption von Lichtquanten durch Anregung von Elektronen aus dem Valenzband ins Leitungsband (oder zwischen Störstellen im verbotenen Band), der dazu inverse Prozess, die stimulierte Emission, bei der durch das einfallende Photon ein Elektron aus dem angeregten Zustand in den Grundzustand übergeht, und die spontane Emission. Absorption und stimulierte Emission sind abhängig von der Feldstärke E
x des Lichtfeldes (Abschn. 11.10). Anregung und Aussendung des Photons sind kohärent mit dem Lichtfeld gekoppelt, anregende und emittierte Lichtwellen stehen in fester Phasenbeziehung. Im Unterschied dazu gibt es bei der spontanen Emission keine kohärente Kopplung an das Lichtfeld. Für Photodetektoren und Solarzellen ist die Absorption der entscheidende Prozess. Lichtemittierende Dioden (LED) beruhen im wesentlichen auf spontaner Emission, während bei Lasern die stimulierte kohärente Emission der entscheidende Prozess ist. Für alle drei Prozesse gilt die Energieerhaltung hx E2
E1 ;
12:99
mit hx der Photonenergie und E2 und E1 den Energien des angeregten bzw. Grundzustandes. Im stationären Zustand unter Einstrahlung von Licht müssen die Übergangsraten sich kompensieren. Bezeichnet man mit A21 die Wahrscheinlichkeit für spontane Emission und mit B21 und B12 die Wahrscheinlichkeit für stimulierte Emission und Absorption und ferner mit n1 und n2 die Besetzungszahlen im Grund- und Endzustand, so gilt im stationären Zustand für die Raten n_ 2
B21 n2 jE
xj2
A21 n2 B12 n1 jE
xj2
n_ 1 0 :
12:100
Die Koeffizienten B21 und B12 entsprechen bis auf Faktoren den Quadraten der Matrixelemente xij für stimulierte Emission bzw. Absorption (11.93). Die beiden Koeffizienten B21 und B12 sind deswegen einander gleich (11.93); n1 und n2 sind die Besetzungszahlen für Grund- und Endzustand der Anregung. Das Verhältnis von stimulierter zu spontaner Emissionsrate ist n_ 2stim =n_ 2spon
B21 jE
xj2 : A21
12:101
Da die Laserfunktion ein Überwiegen der stimulierten Rate verlangt, wird der Laser als optischer Resonator für stehende Lichtwellen mit der auszusendenden Wellenlänge ausgebildet, wodurch eine hohe Feldstärke erzeugt wird. Beim Laser muss weiter die sti-
466
12. Halbleiter
mulierte Emissionsrate die Absorptionsrate überwiegen. Unter Vernachlässigung der spontanen Emission und unter Berücksichtigung von B21 = B12 erhält man aus (12.100) die Laserbedingung n_ 2
n2
n1 B21 jE
xj2 < 0 d: h:
n2 > n1 :
12:102
Diese Bedingung wird als Besetzungsinversion (vgl. Übung 11.8) bezeichnet, da unter Gleichgewichtsbedingungen das Umgekehrte gilt. Besetzungsinversion wird durch „Pumpen“ in den angeregten Zustand erreicht. Beim Halbleiterlaser speziell wird hierzu ein pnÜbergang in Durchlassrichtung gepolt und mit Nichtgleichgewichtselektronen und -löchern überflutet. In (12.100–12.102) war vorausgesetzt, dass die Endzustände der Übergänge jeweils unbesetzt waren, dass also die Wahrscheinlichkeit für Nicht-Besetzung gleich „eins“ war. Dies ist für ein Ensemble von einzelnen Atomen gegeben, bei denen jeweils die Besetzung des angeregten Zustandes aus der Nicht-Besetzung des Grundzustandes resultiert. Für die Zustände an der Valenz-(EV) bzw. Leitungsbandkante (EL) eines Halbleiterlasers, die durch Stromfluss besetzt werden, gilt dies nicht und die Übergangsraten müssen proportional zur Anzahl der besetzten Anfangszustände und zur Anzahl der unbesetzten Endzustände angenommen werden. Damit ergibt sich die Bedingung für Besetzungsinversion in einem pn-Übergang, der in Durchlassrichtung gepolt ist. B21 DL
EL DV
EV f
EL 1 f
EV B12 DV
EV D
EL f
EV 1 f
EL < 0 :
12:103
Hierbei werden die besetzten und unbesetzten Bereiche des Leitungs- bzw. Valenzbandes näherungsweise als scharfe Niveaus bei EL bzw. EV beschrieben und die Integrale über die jeweiligen Energiebereiche (*kT) durch konstante Zustandsdichten DL (EL) bzw. DV (EV) genähert. f (E) ist die Fermi-Besetzungswahrscheinlichkeit, die bei hohen Dotierungen nicht durch die BoltzmannVerteilung genähert werden darf. Wegen B21 = B12 folgt aus (12.103): f
EL 1
f
EV > f
EV 1
f
EL
f
EL > f
EV :
12:104 a
12:104 b
Mit der Fermi-Funktion als Näherung in der Nähe des Gleichgewichts und E nF , E pF als Quasi-Fermi-Niveaus im n- bzw. p-Gebiet (Abb. 12.37) f
EL 1 exp
EL
EFn =kT
1
;
12:105 a
f
EV 1 exp
EV
EFp =kT 1
;
12:105 b
folgt damit als Bedingung für die Besetzungsinversion E nF
E pF > EL
EV Eg ;
12:106
12.8 Wichtige Halbleiterbauelemente
467
Abb. 12.37. Elektronische Bänderschemata E (x) von pn-Halbleiter-Laserstrukturen längs einer Achse x senkrecht zur Schichtstruktur: (a) in die Entartung dotierter p++n– –-Übergang ohne äußere Spannung (thermisches Gleichgewicht); (b) gleicher p++n– –-Übergang mit maximaler Vorspannung U in Flussrichtung; (c) Doppelheterostruktur-pin-Übergang aus p-AlGaAs/i-GaAs/n-AlGaAs mit maximaler Vorspannung U in Flussrichtung. EnF , EpF bezeichnen die Quasi-Fermi-Niveaus im n- bzw. p-Gebiet, EL, EV Leitungs- bzw. Valenzbandkanten
d. h. die Quasi-Fermi-Niveaus im n- und p-Gebiet müssen energetisch weiter voneinander entfernt sein als die Breite des verbotenen Bandes. p- und n-Gebiete müssen also weit in die Entartung dotiert sein, damit durch eine außen anliegende Durchlassspannung U = (E nF –E pF)/e Besetzungsinversion erreicht werden kann (Abb. 12.37 a, b). Damit bestimmt der durch den pn-Übergang fließende Strom das Einsetzen der Lasertätigkeit. Die emittierte Lichtleistung aufgetragen über der Stromdichte durch den pn-Übergang steigt infolge von spontaner Emission langsam an, bis bei einer bestimmten sog. Schwellstromdichte die Besetzungsinversion erreicht wird und durch Überwiegen der induzierten Emission die Lasertätigkeit einsetzt (Abb. 12.38). Die Schwellstromdichte ist somit das entscheidende Qualitätskriterium eines Halbleiterlasers: je niedriger sie ist, um so effektiver arbeitet der Laser, wobei insbesondere zu hohe Schwellstromdichten wegen der damit verbundenen Joule’schen Wärme die Lebensdauer des Lasers begrenzen. Ein entscheidender Durchbruch, der zu kommerziell einsetzbaren Lasern führte, war die Verwendung von Halbleiterheterostrukturen im Doppelheterostrukturlaser, dargestellt in Abb. 12.37 c in Form einer AlGaAs/GaAs/AlGaAs-Schichtstruktur. Zwischen den p- und n-dotierten AlGaAs-Gebieten (p-n-Übergang) mit größerer Bandlücke ist eine schwach dotierte oder intrinsische (i) GaAsSchicht eingebettet, die als aktive Zone im p-n-Übergang dient.
468
12. Halbleiter
Abb. 12.38. Emissions-Kennlinie eines AlGaAs/GaAs/AlGaAs-Doppelheterostrukturlasers als Funktion des aufgeprägten Stromes I, gemessen bei Zimmertemperatur T = 300 K; Ith Schwellstromstärke. Einschub: Schema der Laserstruktur mit Andeutung der emittierten Strahlung (hm). (Nach Kressel und Ackley [12.16])
Emittierte Leistung
Trotz mäßiger Dotierung im p- und n-AlGaAs-Gebiet beidseits dieser Schicht liegen bei Polung in Flussrichtung die Quasi-Fermi-Niveaus im aktiven i-GaAs-Gebiet innerhalb des Leitungs- bzw. Valenzbandes und gewährleisten das Erreichen der Besetzungsinversion (12.106). Die aktive i-GaAs-Zone wird mit Elektronen und Löchern überflutet, die wegen der im Leitungs- und Valenzband vorhandenen Banddiskontinuitäten „eingesperrt“ sind und damit eine erhöhte strahlende Rekombination gewährleisten. Dieser Effekt der Doppelheterostruktur wird als „electrical confinement“ bezeichnet. Zusätzlich tritt ein „optical confinement“ dadurch auf, dass für die emittierte Lichtwellenlänge (dem GaAs-Bandabstand entsprechend) der Brechungsindex der aktiven GaAs-Zone höher ist als der der angrenzenden AlGaAs-Schichten (vgl. Übung 11.9). Das bei der stimulierten Emission erzeugte Licht wird zum großen Teil an den AlGaAs-Schichten totalreflektiert; es wird im aktiven GaAs-Kanal gebündelt und konzentriert. Wie die schematische Darstellung des Aufbaus eines Doppelheterostruktur-Lasers (Abb. 12.38) zeigt, wird der aktive Kanal (Resonator) begrenzt durch die oben und unten an den GaAs-Kanal angrenzenden AlGaAs-Schichten sowie lateral durch einen in die SiO2-Maske eingeätzten Streifen, wo die aufgedampfte Metallisierung Kontakt zum Halbleiter hat und somit das elektrische Feld und den Stromfluss lateral auf diesen Bereich begrenzt.
12.8 Wichtige Halbleiterbauelemente
469
Die für den optischen Resonator (Fabry-Pérot-Interferometer) wichtigen halbdurchlässigen Spiegel, durch die an der Vorder- und Rückseite des Kanals das Licht austritt bzw. reflektiert wird, werden im einfachsten Fall durch Spalten des GaAs-Wafers entlang (110) erzeugt. Typischerweise hat ein solcher aktiver Kanal Längen zwischen 100 und 1000 lm. Die emittierte Lichtleistung als Funktion der aufgeprägten Stromstärke durch die Laserdiode (Abb. 12.38) zeigt bei geringeren Strömen ein schwaches Ansteigen der Leistung, das im wesentlichen durch spontane Emission verursacht wird. In diesem Bereich ist die Verstärkung zu niedrig, um die Verluste im Resonator zu übertreffen. Bei einer gewissen Schwellstromstärke Ith entspricht die Verstärkung des Bauelementes den Resonatorverlusten, der Laser-Prozess setzt ein und die optische Ausgangsleistung steigt sprungartig an. Ein entscheidendes Qualitätskriterium eines solchen Halbleiterlasers ist also eine möglichst geringe Schwellstromstärke (oder Schwellstromdichte) durch geringe Verluste im Resonator. Bei steigender Betriebstemperatur eines Lasers wird insbesondere das elektrische „Confinement“ schlechter, da sich die Ladungsträger wegen des „Aufweichens“ der Fermi-Kante über größere Energiebereiche verteilen; die Schwellstromstärke nimmt zu und der Laser arbeitet weniger effizient. Wegen der näherungsweisen Gültigkeit der Boltzmann-Statistik gilt eine exponentielle Abhängigkeit des Schwellstroms von der Betriebstemperatur T Ith / exp
T=T0 :
12:107
Ein weiteres Qualitätskriterium eines Halbleiterlasers ist also eine möglichst große kritische Temperatur T0, d. h. ein möglichst geringer Anstieg der Schwellstromstärke mit der Betriebstemperatur. Typische Werte von T0 liegen bei Doppelheterostrukturlasern um etwa 100 8C. In den bisher betrachteten Doppelheterostruktur-Lasern (DHL) ist die vertikale Ausdehnung des aktiven Kanals, d. h. die Dicke der eingebetteten GaAs-Schicht, weitaus größer als 200 Å. Ladungsträger in der aktiven Zone nehmen Quantenzustände eines makroskopischen 3D-Kristalls ein. Eine weitere Verbesserung der Lasereigenschaften wird erzielt, wenn man in diese aktive Zone des Lasers noch dünne Schichten (Dicke £ 100 Å) eines Halbleiters mit geringerem Bandabstand als dem von GaAs, z. B. InGaAs, einbaut. Da InxGa1-xAs nicht gitterangepasst an GaAs ist, können diese hochverspannten Schichten nur unterhalb einer gewissen kritischen Schichtdicke versetzungsfrei eingebaut werden. Wegen ihres kleineren Bandabstandes, d. h. ihrer Band-Diskontinuitäten zu GaAs, sowohl im Leitungs- wie im Valenzband, wirken die dünnen InGaAs-Schichten für Elektronen wie für Löcher als Quantentöpfe. Die elektronischen Zustände im Leitungs- und im Valenzband sind senkrecht zur Schichtenfolge quantisiert und die Zustandsdichte ist für jedes Subband konstant und in der Überlagerung mehrerer Sub-
470
12. Halbleiter
bänder treppenartig (Abb. 12.28 c). Die Ladungsträger, die sich natürlich in den energetisch günstigeren Bereichen, also in den Quantentöpfen sammeln, werden noch stärker als im Doppelheterostruktur-Laser räumlich und energetisch eingeschränkt. Solche sog. Quantentopf-Laser zeigen ein noch besseres „Confinement“, damit noch niedrigere Schwellstromstärken und größere kritische Temperaturen T0.
Übungen zu Kapitel 12
12.1 Silizium kristallisiert in der Diamantstruktur mit einer Gitterkonstanten von 5,43 Å. (a) Wieviele Atome enthält die kubische Einheitszelle? (b) Phosphoratome, die anstelle von Siliziumatomen eingebaut werden, wirken als Donatoren. Man berechne die Ionisierungsenergie eines Donators im Rahmen des Wasserstoffmodells (eSi = 12)! (c) Man berechne den Bohrschen Radius r0 für den tiefsten gebundenen Zustand! Wie groß ist die Wahrscheinlichkeit, das Elektron innerhalb einer Kugel mit dem Radius r0 zu finden? Wieviele Siliziumatome liegen innerhalb dieser Kugel! (d) Diskutieren Sie auf der Basis dieser Ergebnisse die Gültigkeit und Grenzen des Wasserstoffmodells für Donatoren! (e) Bei welcher Konzentration wird die Wechselwirkung zwischen Donatoren entscheidend? 12.2 Die effektive Masse von Elektronen im Minimum des Leitungsbandes betrage ein Drittel der effektiven Masse von Löchern im Maximum des Valenzbandes. Wo liegt das Fermi-Niveau im Falle der Eigenleitung? Die Bandlücke Eg sei größer als 8 kT. 12.3 Ein Halbleiter habe eine Bandlücke von Eg = 1 eV. Elektronen und Löcher sollen eine effektive Masse gleich der freien Elektronenmasse haben. Der Halbleiter sei p-dotiert mit einer Akzeptorkonzentration von p = 1018 cm–3. Das Akzeptorniveau liege 0,2 eV über dem Valenzband. (a) Man zeige, dass die Eigenleitung bei 300 K vernachlässigbar ist!
(b) Man berechne die Leitfähigkeit r bei 300 K unter der Annahme einer Löcherbeweglichkeit von lp = 100 cm2/Vs! (c) Man erstelle einen Graphen für den Logarithmus der Löcherkonzentration ln p über der reziproken Temperatur im Bereich von 100–1000 K! 12.4 Man betrachte die elektronische Bandstruktur eines direkten III–V-Halbleiters wie z. B. GaAs. Das Leitungsband habe ein scharf ausgeprägtes Minimum im C-Punkt und ein zusätzliches breiteres Minimum bei höherer Energie außerhalb von C (vgl. Abb. 12.4). (a) Diskutieren Sie qualitativ die Abhängigkeit der Driftgeschwindigkeit von Elektronen vom elektrischen Feld unter Berücksichtigung von Streuprozessen! (b) Diskutieren Sie auch den Fall eines indirekten Halbleiters (Abb. 7.13)! 12.5 Man berechne die Hall-Konstante RH für einen Eigenhalbleiter, bei dem sowohl Elektronen als auch Löcher zum Strom beitragen. (a) Diskutieren Sie die Temperaturabhängigkeit von RH für den Fall, dass die Beweglichkeiten für Elektronen und Löcher gleich sind! (b) Experimentell findet man, dass die gemessenen Hallspannungen bei Umkehrung des Magnetfeldes gewöhnlich nicht dem Betrag nach gleich sind. Erklären Sie den Grund dafür! 12.6 Man betrachte den Prozess der Photoleitung in Halbleitern. Elektronen und Löcher entstehen dabei über die thermische Gleichgewichtskonzentration hinaus durch Photoionisation aus Störstellen oder dem Valenzband.
472
Übungen zu Kapitel 12
Man stelle die Ratengleichungen bei direkter Rekombination von Elektron-Loch-Paaren für den Fall (a) der Eigenleitung und (b) für n- oder p-Dotierung auf! Man berechne den stationären Photostrom bei konstanter Beleuchtung sowie die Zeitabhängigkeit des Photostroms nach Abschalten der Beleuchtung! 12.7 Erklären Sie die Wirkungsweise einer Solarzelle, bei der die Zone eines p-n-Übergangs beleuchtet wird! Nehmen Sie dazu an, dass der Stromkreis durch einen äußeren Widerstand R geschlossen wird! Zeichnen Sie qualitativ den Strom-Spannungsverlauf mit und ohne Lichteinstrahlung! Welche Frequenz muss das Licht mindestens haben? Wie sieht der theoretische Wirkungsgrad als Funktion der Lichtfrequenz aus? Wie erhält man die photoelektrisch erzeugte Leistung aus der Strom-Spannungskennlinie? Diskutieren Sie die verschiedenen Parameter, die den Wirkungsgrad beeinflussen! Warum ist es günstig, mehrere p-n-Übergänge von Halbleitern mit verschiedener Bandlücke in Dünnschichttechnik zu kombinieren? 12.8 Halbleiter mit niedrigem Bandabstand wie InAs (Eg = 0,35 eV) und InSb (Eg = 0,18 eV) zeigen üblicherweise „pinning“ des FermiNiveaus im Leitungsband (ca. 100 meV oberhalb der Leitungsbandkante EL bei
InSb). Zeichnen Sie qualitativ das Bänderschema (Bandenergien gegen Ortskoordinate) in der Nähe eines Metallkontaktes auf einem solchen Halbleiter, der hoch n-dotiert ist. Wie ist das Widerstandsverhalten für angelegte Spannungen beider Vorzeichen? 12.9 Berechnen Sie für einen Feldeffekttransistor (MOSFET, MESFET oder HEMT, Abschn. 12.8) die Steilheit gm =
@I SD/@UG als Funktion der Gatekapazität Cg und der Gatelänge Lg. Man beachte, dass ohne anliegende Gatespannung (UG = 0) im allgemeinen schon eine Bandverbiegung unter dem Gate mit einer Einsatzspannung U0 vorhanden ist. In einfacher Näherung mache man die für Kurzkanal-Transistoren angemessene Annahme, dass die Geschwindigkeit der Ladungsträger im Kanal konstant und gleich der Sättigungsgeschwindigkeit v s für hohe elektrische Feldstärken (Abb. 12.15) ist. Der Source-Drain-Strom ISD resultiert aus der als zweidimensional (2D) angenommenen, über das Gate in den Kanal influenzierten, Ladungsträgerdichte n2D. (a) Schätzen Sie mittels Abb. 12.15 für einen Kurzkanal – AlGaAs/GaAs-HEMT – mit Lg = 100 nm die Transitzeit (Laufzeit) für Ladungsträger unter dem Gate ab. (b) Wie hoch sind Gate-Kapazitäten solcher Transistoren bei Steilheiten von gm = 150 mS?
Tafel XIV
Tafel XIV Hall-Effekt
Um in der Leitfähigkeit r = n e l Trägerkonzentration n und Beweglichkeit l getrennt bestimmen zu können, wird neben der Messung der Leitfähigkeit r als zweite Messung die des Hall-Effektes durchgeführt. Hierbei wird durch eine Kristallprobe ein Strom I geschickt und senkrecht zum Strom ein Magnetfeld (magnetische Induktion B ) angelegt. An zwei gegenüberliegenden Kontakten (senkrecht zu I und B ) kann dann stromlos (IH = 0), d. h. über eine Kompensationsschaltung, eine sog. Hallspannung UH gemessen werden. Dies ist schematisch in Abb. XIV.1 dargestellt. Weil UH stromlos gemessen wird, kompensiert die sich an der Probe in y-Richtung aufbauende Hallspannung UH gerade die auch in y-Richtung wirkende Lorentz-Kraft auf ein Elektron, das sich in x-Richtung mit der Geschwindigkeit v x bewegt:
Fy
e
v By
eE y ev x B
eE y 0 :
XIV:1
Hierbei ist E y = UH/b das sog. Hall-Feld. Unter der Annahme, dass nur Elektronen den Strom tragen (n-Halbleiter oder Metall), gilt jx I=
b d
n ev x
XIV:2
IH = 0
I
Abb. XIV.1. Schema einer Hall-Effekt-Messung. Messgrößen: B: magnetische Induktion; I: Strom durch die Probe; UH: Hallspannung. Gestrichelt sind Bahnen von Elektronen (Konzentration n) und Löchern (Konzentration p) angegeben, die durchlaufen würden, falls ohne Kompensationsschaltung für UH ein Strom IH j 0 fließen würde. Bei IH = 0 werden die Ladungsträger durch die sich aufbauende Hallspannung UH auf ihrer geradlinigen Bahn (parallel zu x ) gehalten
(10–3 K–1) Abb. XIV.2 a, b. Temperaturabhängigkeit der Hall-Konstanten RH für p-Silizium (a) und n-Silizium (b). Für Temperaturen im Bereich von 1300 K setzt bei p-Silizium mit einer BorStörstellenkonzentration von 2´1017 cm–3 (a) intrinsische Leitfähigkeit ein, die Kurve in Teil (a) würde dort einen Nulldurchgang haben und schließlich in den intrinsischen Ast der Abb. XIV.2 b einmünden [XIV.1]
Tafel XIV
474
Tafel XIV Hall-Effekt
und damit folgt UH 1 1 IB jx B :
XIV:3 b ne n e bd Die Größe RH = – (ne)–1 heißt Hallkonstante. Sie kann also durch Messung von UH, I und B gemäß
E y
UH R I B=d
XIV:4
bestimmt werden. Ihr Vorzeichen gibt die Art der Ladungsträger (negativ für Elektronen) und ihre Absolutgröße die Ladungsträgerkonzentration n an. Wird in einem Halbleiter der Strom sowohl durch Elektronen (Konzentration n, Beweglichkeit ln) als auch durch Löcher (Konzentration p, Beweglichkeit lp) getragen, so ergibt eine analoge Rechnung folgenden Wert für die Hallkonstante: RH
pl2p
nl2n
e
plp nln 2
:
XIV:5
Abbildung XIV.2 zeigt experimentell ermittelte Hallkonstanten RH für Bor-dotiertes p-Silizium
(a) bzw. Arsen-dotiertes n-Silizium (b). Da die Hallkonstante bis auf die Elementarladung e die reziproke Ladungsträgerkonzentration wiedergibt, ähnelt der Kurvenverlauf in logarithmischer Auftragung zumindest im Temperaturbereich 33 bis 500 K dem typischen Verlauf der Ladungsträgerdichtekurven für Halbleiter (s. z. B. Abb. 12.10). Die Steigungen im Bereich 33 bis 50 K sind durch die Ionisierungsenergien der Akzeptoren bzw. Donatoren festgelegt (12.27). Der steil verlaufende Kurvenabschnitt in Abb. XIV.2 b bei etwa 103 K zeigt intrinsische Leitfähigkeit durch Elektron-Loch-Paarerzeugung an. Die verschiedenen Vorzeichen von RH in Abb. XIV.2 a, b entsprechen den verschieden geladenen Trägersorten in p- und n-dotiertem Material.
Literatur XIV.1 F. J. Morin, J. P. Maita: Phys. Rev. 96, 29 (1954)
Effektive Massen von Elektronen
mn und Löchern
mp in Halbleitern werden in einem Zyklotron-Resonanz-Experiment bestimmt, bei dem die Kristallprobe in ein variables statisches Magnetfeld B gebracht wird und in Abhängigkeit von B die Absorption eines Hochfrequenz-Wechselfeldes gemessen wird. Elektronen im statischen Magnetfeld bewegen sich im k-Raum (Tafel VIII) auf Flächen konstanter Energie in einer Ebene senkrecht zu B um die Magnetfeldachse. Auch im Ortsraum ergibt sich eine geschlossene Bahn, die allerdings, wie die Bahn im k-Raum, für Kristallelektronen nicht einfach eine Kreisbahn ist (Abb. XV.1). Absorption des Hochfrequenz-Wechselfeldes tritt ein, wenn die Kreisfrequenz gerade gleich der Umlauffrequenz xc ist
xc eB=mn. Hierbei sind insbesondere solche Bahnen im k-Raum wichtig, bei denen die eingeschlossene Fläche gerade einen extremalen (maximalen oder minimalen) Querschnitt hat. Von solchen Zuständen gibt es nämlich pro Frequenzintervall besonders viele. Die HF-Absorption hat dann also ein deutliches Maximum und man braucht für die Interpretation deshalb nur die „Extremalbahnen“ zu diskutieren.
Abb. XV.1. Klassische Beschreibung der Zyklotron-Resonanz von Elektronen mit einer effektiven Masse mn . Auf einer stabilen Umlaufbahn um das Magnetfeld B halten sich Zentrifugalkraft und Lorentz-Kraft das Gleichgewicht. Im allgemeinen wird das Hochfrequenzfeld E HF in seiner Frequenz konstant gehalten und das Magnetfeld B variiert
Wir wollen als Beispiel die Zyklotronresonanz an den Halbleitern Si und Ge betrachten. Elektronen und Löcher befinden sich bei einem Halbleiter in der Nähe der Kanten des Leitungsbandes bzw. Valenzbandes. Wie wir in Abschn. 12 gezeigt hatten, haben die Flächen konstanter Energie um das Leitungsband-Minimum die Form von Ellipsoiden mit Rotationssymmetrie um die [100]- bzw. [111]-Richtungen. Bei beliebiger Orientierung des Magnetfeldes gibt es für jedes Ellipsoidpaar entlang der [100]- bzw. [111]-Achsen eine verschiedene Extremalbahn, also eine verschiedene Zyklotronfrequenz. Für Silizium sind das drei verschiedene Werte entsprechend den drei verschiedenen [100]-Achsen und für Germanium vier für die vier [111]-Richtungen im Raum (Abb. XV.2 a). Bei Orientierung des Magnetfeldes in einer Symmetrieebene reduziert sich diese Zahl. In Abb. XV.2 b sind die Zyklotron-Resonanz-Spektren von Dresselhaus et al. [XV.1] gezeigt. Das Magnetfeld lag dabei in der (110)-Ebene. Dann ist die relative Lage zum Magnetfeld für je zwei Ellipsoidpaare gleich und die Zahl der Absorptionsmaxima für Elektronen erniedrigt sich auf zwei bzw. drei. Zyklotron-Resonanz wird auch für Löcher beobachtet. Ihr Umlaufsinn um das Feld ist umgekehrt. Elektronen und Löcher lassen sich also unterscheiden, wenn man ein zirkular polarisiertes HF-Feld mit Einstrahlrichtung entlang der Richtung des B-Feldes verwendet. Elektronen und Löcher absorbieren dann entsprechend ihrem Umlaufsinn nur rechts bzw. links zirkulare HF-Strahlung. In den Absorptionsspektren (Abb. XV.2 b) sehen wir, dass zwei Maxima Löchern zugeschrieben werden. Die Interpretation ist hier aber anders als bei den Elektronen. Löcher gibt es im Valenzband-Maximum im Punkt C der Brillouin-Zone. In einer (vereinfachten) Betrachtung würde man aufgrund der Symmetrie der Brillouin-Zone kugelförmige Energieflä-
Tafel XV
Tafel XV Zyklotron-Resonanz bei Halbleitern
Tafel XV Zyklotron-Resonanz bei Halbleitern
Tafel XV
476
Abb. XV.2. (a) Flächen konstanter Energie um das Minimum des Leitungsbandes für Si (links) und Ge (rechts). Elektronen bewegen sich senkrecht zum Magnetfeld in geschlossenen Bahnen auf diesen Flächen. Die Umlauffrequenzen für die verschiedenen Bahnen bei gegebenem Magnetfeld sind i. allg. verschieden. Für die spezielle Gestalt der Energieflächen in der Form von Ellipsoiden sind sie allerdings gleich für alle Elektronen eines Ellipsoids. Das ist für die Beobachtbarkeit der Zyklotron-Resonanz jedoch nicht wichtig, da in jedem Fall die Extremalbahn (hier Bahn um den größten Querschnitt) zu einem deutlichen Maximum der HF-Absorption führt. Bei allgemeiner Orientierung des Magnetfeldes gäbe es für Si drei und
für Ge vier verschiedene Extremalbahnen. (b) Zyklotron-Resonanzabsorption für Si und Ge bei einer Orientierung des Magnetfeldes in der (110)-Ebene und einem Winkel von 30 ° bzw. 60 ° zur [100]-Richtung (magnetische Flussdichte in Gauß: 1 G = 10–4 Tesla = 10–4 kg s–2 A–1 oder Vs/m2). In beiden Fällen sind für Elektronen zwei der Extremalbahnen aus Symmetriegründen gleich, und es bleiben 2 bzw. 3 übrig. Die zwei Valenzbänder in C mit verschiedener Krümmung machen sich durch zwei Löcher, „leichte“ und „schwere“, bemerkbar. Für die Beobachtung der Zyklotron-Resonanz sind tiefe Temperaturen erforderlich. Elektron-Loch-Paare werden durch Lichteinstrahlung erzeugt. (Nach Dresselhaus et al. [XV.1])
chen, also nur eine Zyklotronfrequenz, erwarten. Wie wir in Abschn. 12.1 besprochen haben (s. auch Abb. 12.3 u. 12.4), ist die Bandstruktur am Valenzbandmaximum jedoch komplizierter: es gibt „leichte“ und „schwere“ Löcher. Zyklotron-Resonanz kann nur dann beobachtet werden, wenn die Ladungsträger geschlossene Umläufe um das Magnetfeld ohne Stöße mit Phononen oder Störstellen durchlaufen können. Dies ist erfüllt, falls die Relaxationszeit (von der
Größenordnung der freien Flugzeit) s groß gegen die inverse Zyklotronfrequenz x –1 ist. Zykloc tron-Resonanz wird deshalb nur an reinen, möglichst ungestörten Kristallen bei tiefer Temperatur (flüssiges He) beobachtet.
Literatur XV.1 G. Dresselhaus, A. F. Kip, C. Kittel: Phys. Rev. 98, 368 (1955)
Tafel XVI
Tafel XVI Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt
Durch die kontrollierte Epitaxie von atomar scharfen Halbleiterheterostrukturen und Übergittern (Abschn. 12.7) ist es möglich geworden, freie Leitungsbandelektronen in quasi-zweidimensionalen (2 D)-Quantentopfstrukturen von ˚ (typische Ausdehnung in einer Rich50–100 A tung) „einzusperren“. Die hierbei erzeugten quasi-2 D-Elektronengase zeigen hochinteressante physikalische Effekte, vor allem in einem von außen anliegenden starken Magnetfeld. Ein Elektronengas, das sich in einem quasi-2 D-Quantentopf befindet, ist längs einer Koordinate (z, senkrecht zur Heterozwischenschicht oder zur Schichtenfolge in einem Übergitter) in seiner Bewegung stark eingeschränkt, während in der x, yEbene senkrecht dazu freie Bewegung möglich ist. Dementsprechend stellen sich die Energieeigenwerte eines Elektrons dar als (Abschn. 12.7): Ej
kk
h2 2 h2 2 k k ej ; 2mx x 2my y
j 1; 2; . . .
XVI:1
wobei mx und my die effektiven Massenkomponenten in der Ebene der freien Beweglichkeit sind. ej ist ein Spektrum diskreter Energieeigenwerte, das aus der Quantisierung in z-Richtung resultiert (12.90). Für einen tiefen, rechteckigen Quantentopf der Dicke dz nimmt ej z. B. näherungsweise die Werte an, die eindimensionalen, stehenden Elektronenwellen in einem Potentialkasten (Abschn. 6.1) entsprechen (12.93) ej '
h2 p2 j2 ; 2mz dz2
j 1; 2; 3; . . . :
XVI:2
(XVI.1) beschreibt also ein Spektrum diskreter Energieparabeln längs kx und ky, sog. Subbänder (Abschn. 12.7). Legt man nun ein starkes Magnetfeld B senkrecht zur x, y-Ebene der freien Beweglichkeit an, so wird die Dimensionalität des Elek-
tronengases weiter eingeschränkt. Die Elektronen werden senkrecht zum B-Feld auf sog. Zyklotron-Kreisbahnen gezwungen (Tafel XV), auf denen die Umlauffrequenz (Zyklotronfrequenz) eB xc
XVI:3 mk durch das Gleichgewicht zwischen Lorentz-Kraft und Zentrifugalkraft bestimmt ist. mk ist die effektive Masse der Elektronen parallel zur Kreisbewegung (speziell für Isotropie in der Ebene: mx =my = mk ). Da eine Kreisbahn in zwei senkrecht zueinander liegende harmonische Schwingungen zerlegt werden kann, sind die quantenmechanischen Energieeigenwerte der ZyklotronBewegung die eines harmonischen Oszillators der Eigenfrequenz xc. Somit bewirkt das Magnetfeld B eine weitere Quantisierung der Subbänder (XVI.1), die auf Einteilchenenergien Ej;n;s ej
n 12hxc sglB B
XVI:4
führt. Der letzte Term trägt den beiden möglichen Spineinstellungen im Magnetfeld Rechnung; s = ±1 ist die Spinquantenzahl, lB das Bohrsche Magneton und g der Landé-Faktor der Elektronen. Die in (XVI.1) dargestellte Quantisierung durch das Magnetfeld wurde in Tafel VIII für das Elektronengas eines Metalles schon auf etwas andere Weise hergeleitet. Hier wie dort führt die durch das B-Feld erzeugte Quantisierung in sog. Landau-Niveaus (Energieabstand h xc) zu einer Aufspaltung der kontinuierlichen Energieparabeln (Subbänder) in diskrete Energieeigenwerte (Abb. XVI.1 b). Für ein spezielles Subband ist ohne Magnetfeld (B = 0) die Zustandsdichte wegen der Zweidimensionalität eine Stufenfunktion (Abb. 12.28 c). Diese kontinuierliche Funktion spaltet bei endlichem B-Feld in eine Reihe von d-funktionsartigen Spitzen auf, die auf der Energieskala um h xc voneinander entfernt sind. Die
Tafel XVI Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt
Tafel XVI
478
Damit ergibt sich für den Entartungsgrad eines Landau-Niveaus NL eB=h 2;42 1010 cm 2 T
1
B:
XVI:7
Abb. XVI.1 a–c. Qualitative Darstellung der Quantelung eines 2 D-Elektronengases in einem äußeren Magnetfeld B (senkrecht zur x, y-Ebene freier Beweglichkeit). (a) Energieparabel des 1. Subbandes (12.92) eines freien 2 D-Elektronengases längs kx (gestrichelt). Bei Anlegen eines äußeren Magnetfeldes tritt eine weitere Quantisierung in Form von Landau-Zuständen auf (Punkte). (b) Zustandsdichte D im 1. Subband des 2 D-Elektronengases, ohne Magnetfeld (gestrichelt) und mit äußerem Magnetfeld (durchgezogen). xc = –e B / mk ist die Zyklotronfrequenz der elektronischen Kreisbahnen senkrecht zum Magnetfeld B. (c) Darstellung der Landau Aufspaltung n 12 h xc in der kx, ky-Ebene des reziproken Raumes
Zustände „kondensieren“ in scharfe Landau-Niveaus. Weil keine Zustände verloren gehen, müssen soviele Zustände in einem solchen d-funktionsartigen Landau-Niveau enthalten sein, wie ursprünglich bei B = 0 in der Fläche zwischen je zwei Landau-Niveaus vorhanden waren, d. h., der Entartungsgrad NL eines Landau-Niveaus beträgt NL hxc D0 ;
XVI:5
wo D0 die Dichte des Subbands bei B = 0 ist. Im Vergleich zu (12.96) muss die Aufhebung der Spinentartung im Magnetfeld berücksichtigt werden, d. h. es folgt aus (12.96) D0 mk =2ph2 :
XVI:6
Wenn der Landau-Zustand energetisch unterhalb des Fermi-Niveaus liegt, ist er bei genügend tiefer Temperatur gerade mit NL Elektronen besetzt. Eine Variation des äußeren Magnetfeldes ändert nun die energetische Aufspaltung h xc der Landau-Niveaus wie auch den Entartungsgrad (XVI.5) jedes Niveaus. Mit wachsender Magnetfeldstärke verschieben sich die Landau-Zustände zu höheren Energien und durchlaufen schließlich das Fermi-Niveau EF. Dabei werden sie entleert, wobei die überzähligen Elektronen jeweils auf dem darunterliegenden Landau-Niveau Platz finden (wegen der angestiegenen Zustandsdichte). Wenn bei genügend tiefer Temperatur die FermiKante scharf ist, hat das Gesamtsystem seine tiefste freie Energie, wenn gerade ein Landau-Niveau das Fermi-Niveau gekreuzt hat. Mit wachsendem B-Feld steigt die freie Energie an, bis der nächste Landau-Zustand entleert wird. Dies führt zu Oszillationen der freien Energie als Funktion des äußeren Magnetfeldes. Daraus resultieren verschiedene oszillatorische Effekte, z. B. der de Haas-van Alphen-Effekt, der besondere Bedeutung bei der Ausmessung der Topologie von Fermi-Flächen erlangte (Tafel VIII). Vor allem aber der Quanten-Hall-Effekt [XVI.1] liefert heute nicht nur eine wichtige Methode zur Charakterisierung von 2D-Elektronengasen (2DEG) in Halbleiterheterostrukturen, sondern er hat nach seiner Entdeckung durch von Klitzing (Nobelpreis 1985) neue wissenschaftliche Impulse bei der Entwicklung einer Halbleiter-Nanostrukturphysik gegeben. Zur Beobachtung des Quanten-Hall-Effekts wird wie beim klassischen Hall-Effekt (Tafel XIV) eine Spannung UH stromlos an zwei gegenüberliegenden Kontakten senkrecht zum Stromfluss gemessen. Der Strom wird jedoch anders als beim klassischen Hall-Effekt (Tafel XIV) durch ein 2DEG in einer Halbleiterheterostruktur, z. B. aus AlGaAs/GaAs, getragen. Das variable Magnetfeld B liegt senkrecht zur Stromrichtung und damit normal zur Ebene des 2DEG an (Abb.
rH
XVI.2, Einschub, und Abb. XVI.5 c). Die Messung geschieht bei tiefen Temperaturen, um eine scharfe Fermi-Kante im hoch entarteten 2DEG zu gewährleisten. Wird nun das Magnetfeld sukzessive erhöht, so ändert sich der Hall-Widerstand rH = UH/I sprunghaft, jeweils mit Stufen bei den Magnetfeldern, bei denen ein scharfes Landau-Niveau das Fermi-Niveau durchkreuzt (Abb. XVI.2a). Wird gleichzeitig der Magnetowiderstand Rxx (!UL/I) (Abb. XVI.2b) parallel zur Strombahn über entsprechende hintereinander liegende Kontakte (Abb. XVI.5b) gemessen, so erscheint eine Folge von Banden jeweils dort, wo im Quanten-Hall-Effekt Stufen zwischen zwei aufeinanderfolgenden Plateaus auftreten, d. h.
479
dort, wo ein Landau-Niveau das Fermi-Niveau durchkreuzt. Diese Widerstandsoszillationen heißen nach ihrem Entdecker Shubnikov-de HaasOszillationen. Die experimentell gefundenen Hall-Widerstandswerte bei den Magnetfeldern, wo jeweils ein Landau-Niveau das Fermi-Niveau EF kreuzt, ergeben sich unmittelbar aus der Formel für den klassischen Hall-Effekt (Tafel XIV). Aus (XIV.3) folgt für den Hall-Widerstand rH
UH B B ; I nde eN2D
XVI:8 a
wobei N2D die zweidimensionale Dichte des 2DEG ist, die im Magnetfeld B natürlich nur Vielfache des Entartungsgrades NL (XVI.7) annehmen kann. Damit folgen die Widerstandswerte, bei denen Landau-Niveaus EF kreuzen, zu rH
B mNL e
h 1 ; e2 m
m 1; 2; 3; . . .
XVI:8 b
Abb. XVI.2. (a) Quanten-Hall-Effekt, gemessen bei 4 K am quasi-2 D-Elektronengas einer modulationsdotierten AlGaAs/ GaAs-Heterostruktur; 2 D-Elektronendichte N = 4´1011 cm–2, elektronische Beweglichkeit l = 8,6´104 cm2/Vs. Der HallWiderstand rH = UH/I wird in Abhängigkeit vom Magnetfeld B mit einer Messanordnung wie im Einschub gezeigt gemessen. (b) Shubnikov-de Haas-Oszillationen im Magnetowiderstand Rxx, gemessen wie angedeutet im Einschub durch UL/I als Funktion des äußeren Magnetfeldes B. Die angegebenen Zahlen nummerieren die Subbänder, wobei die Pfeile entsprechende Spin-Einstellungen zum B-Feld andeuten. (Nach Paalonen et al. [XVI.2])
Mit (XVI.8 b) sind zwar einzelne diskrete Werte des Kurvenverlaufs in Abb. XVI.2 a richtig beschrieben, jedoch wird in keiner Weise das Auftreten der charakteristischen Plateaus erklärt. Hierzu ist eine genauere Betrachtung der Bewegung von Ladungsträgern in Gegenwart starker Magnetfelder erforderlich. In einem starken magnetischen Feld können nur Elektronen im Innern der Probe, d. h. des 2DEG, ungestörte Zyklotronorbits ausführen (Abb. XVI.3). Ihre Energiezustände entsprechen den ungestörten LandauNiveaus (XVI.4). Am Rand der Probe jedoch stoßen die Elektronen auf die Probenbegrenzung, sie können keine geschlossenen Kreisbahnen mehr ausführen. Im einfachsten Fall elastischer Reflexion ergeben sich als Bahnkurven Teilkreise mit stark gekrümmten Verläufen bei der Reflexion. Die starke Krümmung, die sich auch in den Wellenfunktionen widerspiegelt, führt zu einer Zunahme der kinetischen Energie und damit zu einer „Aufbiegung“ der Landau-Niveaus am Rand der Probe. In der Nähe der Probenberandung y1 und y2 schneiden die Landau-Zustände das Fermi-Niveau EF. Auch wenn im Innern der Probe die Landau-Zustände weit unter EF liegen,
Tafel XVI
Tafel XVI Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt
Tafel XVI
480
Tafel XVI Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt
findet dennoch elektrische Leitung am Rande statt, da dort die Landau-Zustände EF schneiden, also besetzte und unbesetzte Zustände infinitesimal nahe beieinander liegen. Diese sog. Randkanäle (edge channels) besitzen eine weitere interessante Eigenart: sie leiten widerstandsfrei, selbst im Fall makroskopischer Probendimensionen, wo Störstellenstreuung auch bei tiefer Temperatur nicht vernachlässigbar ist. Bei Störstellenstreu-
ung an einem Defekt S auf einer Randbahn (Abb. XVI. 4) wird das Elektron durch das starke Magnetfeld wieder in Vorwärtsrichtung gezwungen; der Gesamtstrom in Vorwärtsrichtung wird nicht reduziert, so dass der Stromtransport in einer solchen Randbahn widerstandsfrei, d. h. quasi-ballistisch, ist. Falls die Landau-Zustände bei geeignetem Magnetfeld energetisch genügend weit vom Fermi-Niveau EF entfernt sind, gibt es keine Zustände im Innern der Probe nahe EF , über die Elektronen im rechten Randkanal mit Zuständen im linken Kanal über Streuung kommunizieren können. Bei Elektronenfluss von links nach rechts befinden sich Elektronen im linken Randkanal auf dem elektrochemischen Potential lL des linken Kontaktes, während Elektronen im rechten „Rückkanal“ sich auf dem Potential des rechten Kontaktes lR befinden (Abb. XVI.5). lL
lR eV :
XVI:9
Der Strom zwischen linkem und rechtem Kontakt wird also im Fall vernachlässigbarer Streuung zwischen Hin- und Rückkanälen als ballistischer Strom in den eindimensionalen (1D) Randkanälen getragen. Die Differenz zwischen beiden Kontakten ergibt den Nettostrom: I
l nc
L X n1
Abb. XVI.3. Erklärung der sog. Randkanäle (edge channels) für Elektronen bei Anliegen eines Magnetfeldes B senkrecht zur Ebene des 2-dimensionalen Elektronengases (2DEG). (a) Ein starkes Magnetfeld B senkrecht zum 2DEG bewirkt Quantisierung der elektronischen Zustände in Landau-Niveaus (n = 1, 2, 3, . . .), die im Innern der Probe geschlossenen Zyklotronbahnen entsprechen. An den beiden Probenrändern y1 und y2 sind geschlossene Bahnen nicht mehr möglich, die stark gekrümmten Randbahnen (durch elastische Reflexion) führen zu einem Anwachsen der Energie der Landau-Zustände, die schließlich die Fermi-Energie EF kreuzen. (b) Bei Stromfluss sind die chemischen Potentiale lR und lL der rechten und linken Randkanäle verschieden, wobei lL–lR der Potentialunterschied zwischen den entsprechenden Kontakten ist. (c) Mit wachsendem Magnetfeld B nimmt die Aufspaltung der Landau-Niveaus zu, wobei das oberste Niveau sich an die Fermi-Energie EF heranschiebt. Im Innern der Probe stehen dann elektronische Zustände nahe EF für Streuung zur Verfügung; linke und rechte Randkanäle kommunizieren
eD
1 n
Ev n
EdE :
XVI:10
lR
Hierbei läuft die Summe über alle besetzten Landau-Niveaus n (bis zu einem maximal besetzten nc), die als Randkanäle EF schneiden. –1 –1 D(1) ist die 1D-Zustandsn = (2p) (dEn/dkx) dichte, die dem n-ten Randkanal zukommt, wäh-
Abb. XVI.4. Schematische Trajektorie eines Ladungsträgers auf einer Randbahn (edge channel), der an einem Streuzentrum S einen elastischen Streuprozess erleidet. Das Magnetfeld ist senkrecht zum 2DEG orientiert, das am Probenrand endet. Dort ist die Streuung als elastisch angenommen
rend v n = h 1 (dEn/dkx) die Elektronengeschwindigkeit in diesem Zustand ist. Damit folgt für den n-ten Randkanal ein Strombeitrag e e2
XVI:11 In
lL lR V : h h Bei der Messung des Quanten-Hall-Effekts wird über zwei Kontakte senkrecht zum Stromfluss (Abb. XVI.5 c) der Widerstand zwischen linken und rechten (hin und zurück) Randkanälen gemessen. Mit (XVI.11) trägt jeder Randkanal den Betrag e2/h zur Leitfähigkeit, d. h. h/e2 zum Hall-Wi-
derstand, bei, genau das Quantum (XVI.8 b), um das der Widerstand sprunghaft zunimmt, wenn bei Vergrößerung des Magnetfeldes ein weiteres Landau-Niveau die Fermi-Energie kreuzt und von Elektronen entleert wird. Die Erklärung des Shubnikov-de Haas-Effektes ist ähnlich zwanglos. Hier wird der Magnetowiderstand mittels zweier Kontakte entlang der Strombahn, also entlang von Randkanälen auf ein und demselben Potential, gemessen (Abb. XVI.5 b). Solange die Landau-Niveaus im Innern der Probe sich energetisch genügend weit von EF befinden, fällt keine Spannung ab. Bei Änderung des Magnetfeldes erreicht einer der Randkanäle im Innern der Probe EF . Es stehen dann Zustände für Streuung zwischen den Hin- und Rückkanälen (links und rechts) zur Verfügung. Streuung zwischen den sonst entkoppelten Hin- und Rückkanälen tritt auf, was einen Widerstand längs der Kanäle bewirkt. Für diese Magnetfelder, wo ein Landau-Niveau im Innern der Probe EF durchdringt, wird eine bandenartige Widerstandszunahme wie im Experiment (Abb. XVI.2 b) gemessen. Quanten-Hall-Effekt und Shubnikov-de Haas-Oszillationen werden in dieser Interpretation also auf quasi-eindimensionalen Transport in Randkanälen zurückgeführt [XVI.4]. Die sprunghaften Änderungen des Hall-Widerstandes rH konnten experimentell mit einer Genauigkeit von 10–7 an realen Proben verschiedenster Herkunft und Struktur gefunden werden [XVI.1]. Man benutzt deshalb mittlerweile die Messung des Quanten-Hall-Effektes zur Präzisionsbestimmung der Feinstrukturkonstanten e2 l0 c 1 :
XVI:12 h 2 137 Nimmt man auf der anderen Seite als bekannt an (bestimmt durch eine Vielzahl von Präzisionsmessungen), so lässt sich der Quanten-Hall-Effekt mittels (XVI.8 b) zur Einführung eines Eichnormals für die Widerstandseinheit „Ohm“ verwenden. Weiterhin sei bemerkt, dass der Quanten-HallEffekt mit einer Reihe anderer Phänomene in der Physik mesoskopischer Systeme oder Nanostrukturen verwandt ist. Die Tatsache, dass Randkanäle (durch das hohe B-Feld verursachte 1D-Leitungskanäle) jeweils einen Betrag e2/h zur Leitfähigkeit beitragen, lässt sich sofort auf 1D-Leitungska-
Abb. XVI.5. (a) Ballistischer Elektronentransport in Randkanälen (edge channels), die durch Quantisierung in einem starken Magnetfeld B senkrecht zum räumlich begrenzten 2DEG erzeugt werden. Unter Vernachlässigung inelastischer Streuung zwischen linken (L) und rechten (R) Kanälen entsprechen die chemischen Potentiale lL und lR denen des linken und rechten elektrischen Kontaktes. (b) Leitung durch Randkanäle in einem 2DEG bei Vorhandensein zweier Kontakte 1) und 2) zur Messung von Shubnikov-de-Haas-Oszillationen in einem starken Magnetfeld B. Inelastische Streuung (i.s.) zwischen linken und rechten Kanälen verursacht einen Spannungsabfall zwischen den Kontakten. (c) Leitung durch Randkanäle in einem 2DEG mit Kontakten 1) und 2) zur Messung des Quanten-Hall-Effektes
481
Tafel XVI
Tafel XVI Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt
Tafel XVI
482
Tafel XVI Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt
näle allgemeinerer Art übertragen, sofern die Breite der Kanäle mit der Fermi-Wellenlänge der Elektronen kF vergleichbar ist und die elektrische Leitung quasi-ballistisch, d. h. bei Leiterdimensionen kleiner als der freien Weglänge der Ladungsträger erfolgt. So konnte gezeigt werden, dass die Leitfähigkeit kurzer 1D-Kanäle, die mittels aufgedampfter Metallelektroden in einem 2D-Elektronengas an einer modulationsdotierten AlGaAs/GaAs-Heterostruktur (Abschn. 12.7) erzeugt werden, in Quanten von 2 e2/h zunimmt, wenn die Kanalweite durch Variation einer an den Metallelektroden anliegenden Spannung sukzessive vergrößert wird [XVI.5]. Das Leitfähigkeitsquantum pro „ballistischem“ Kanal beträgt hier 2 e2/h, der doppelte Wert wie beim Quanten-Hall-Effekt. Der Grund ist die Spin-Entartung, die beim QuantenHall-Effekt durch das Magnetfeld aufgehoben ist. Selbst beim elektrischen Schalten makroskopischer metallischer Relais aus Au, Ag und Cu wurden Leitfähigkeitssprünge des Betrages 2 e2/h bei Zimmertemperatur gefunden, die auf mesoskopi-
sche Verengungen der Leitfähigkeitskanäle in den aufgedampften polykristallinen Metallfilmen zurückgeführt werden [XVI.6].
Literatur XVI.1 K. von Klitzing, G. Dorda, M. Pepper: Phys. Rev. B 28, 4886 (1983) XVI.2 M. A. Paalonen, D. C. Tsui, A. C. Gossard: Phys. Rev. B 25, 5566 (1982) XVI.3 H. Lüth: Solid Surfaces, Interfaces and Thin Films (Springer, Berlin Heidelberg 2001) 4th edition, S. 419 XVI.4 M. Janßen, O. Viehweger, U. Fastenrath, J. Hajdu: Introduction to the Theory of the Integer Quantum Hall Effect (VCH, Weinheim 1994) XVI.5 B. J. van Wees, H. van Houten, C. W. J. Beenakker, J. W. Williamson, L. P. Kouwenhoven, D. van der Marel, C. T. Foxon: Phys. Rev. Let. 60, 848 (1988) XVI.6 K. Hansen, E. Laegsgaard, I. Stensgaard, F. Besenbacher: Phys. Rev. B56, 2208 (1997)
Tafel XVII
Tafel XVII Halbleiterepitaxie
In der modernen Halbleiterphysik wie auch in der Bauelementtechnologie spielen in immer stärkerem Maße dünne kristalline Schichten eine wichtige Rolle. Insbesondere Mehrschichtenstrukturen, z. B. Vielfachschichtsysteme von GaAlAs- und GaAs- oder GaInAs-Schichten auf InP sind von Interesse, sowohl um neuartige Phänomene wie den Quanten-Hall-Effekt (Tafel XVI) zu studieren als auch um schnelle Transistoren und Halbleiter-Laser herzustellen. Zur Erzeugung solcher Halbleiterschichtstrukturen werden Epitaxieverfahren verwendet, die eine präzise Abscheidung bis in atomare Bereiche ermöglichen. Im Bereich der Grundlagenforschung wird vor allem die sog. Molekularstrahlepitaxie (Molecular Beam Epitaxy, MBE) angewendet, bei der die Halbleiterschichtstrukturen in einer Ultrahochvakuumkammer epitaktisch wachsen [XVII.1, 2] (Abb. XVII.1). Die Epitaxie besteht prinzipiell im Verdampfen von Materialien wie Ga, Al und
Abb. XVII.1. Schema einer UHVKammer für Molekularstrahlepitaxie (MBE) von III–V-Halbleiterschichten (Schnitt, von oben gesehen). (Nach Cho und Cheng [XVII.3])
As und der Deposition auf Substraten, z. B. GaAs. Ultrahochvakuum (UHV)-Anlagen mit Ausgangsdrücken im Bereich von 10–8 Pa werden benutzt, um möglichst reine und wohldefinierte Bedingungen sowohl im Molekularstrahl als auch auf der Substratoberfläche zu erreichen. Man schätzt ab, dass es bei 10–8 Pa einige Stunden dauert, bis eine als rein präparierte Oberfläche eine Monolagen-Adsorbatbedeckung aus dem Restgas hat, wenn jedes auftreffende Atom oder Molekül haften bleibt. Solche UHV-Kammern sind Edelstahlgefäße, in denen die extrem niedrigen Drücke von weniger als 10–8 Pa (freie Weglänge der Gasmoleküle in der Größenordnung von Metern) durch Ionengetterpumpen oder Turbomolekularpumpen aufrechterhalten werden. Bei Ionengetterpumpen werden die Restgasatome durch hohe elektrische Felder ionisiert und an den entsprechend elektrisch geladenen Elektroden durch aktive Metallfilme (z. B. Ti) chemisorbiert („gegettert“). Bei
PumpenAnschluss
Tafel XVII
484
Tafel XVII Halbleiterepitaxie
Turbomolekularpumpen beruht die Pumpwirkung auf dem Impulsaustausch von Gasmolekülen mit schnell rotierenden Turbinenrädern. Die UHV-Kammer, der Hauptteil einer MBEAnlage (Abb. XVII.1), ist im Innern mit einem Stickstoff-gekühlten Kryoschild ausgekleidet, um Fremdatome und Moleküle „auszufrieren“ und den Restgasdruck weiter herabzusetzen. Das Substratmaterial, z. B. ein GaAs-Wafer, auf dem eine GaAlAs-Schicht abgeschieden werden soll, ist auf einem rotierenden Substrathalter aufgeklemmt. Während des Wachstums muss das Substrat auf etwa 500 bis 600 °C geheizt werden, um eine genügend hohe Oberflächenbeweglichkeit für die auftreffenden Atome bzw. Moleküle (Ga, As4, Si u. ä.) zu erzielen. Die Zulieferung der Atome bzw. Moleküle für den wachsenden Kristall geschieht aus sog. Effusionszellen, in denen die Ausgangsmaterialien, z. B. festes Ga und As bei der GaAs-Epitaxie, durch elektrisches Heizen aus Bornitrid-Tiegeln verdampft werden. Sog. Shutter, mechanisch betriebene Klappen, können von außen gesteuert die einzelnen Effusionszellen schließen und öffnen und so die entsprechenden Molekularstrahlen aus- und einschalten. Die Wachstumsgeschwindigkeit der Epitaxieschicht wird durch den Teilchenfluss im Molekularstrahl, d. h. also durch die Tiegeltemperatur, gesteuert. Um gezielt wohldefinierte Schichtenfolgen wie bei einem Kompositionsübergitter (Abschn. 12.7) mit atomarer Schärfe abzuscheiden, müssen die Tiegeltemperaturen wie auch die Shutter-Öffnungs- und Schließungszeiten durch Rechnerprogramme gesteuert und kontrolliert werden. Dies ist insbesondere dann erforderlich, wenn eine ternäre oder quaternäre Legierung wie Ga0,45Al0,55As mit fester Zusammensetzung abgeschieden werden soll. Die Homoepitaxie von GaAs-Schichten auf GaAs erfordert keine besonders genaue Steuerung der Molekularstrahlflüsse. Hier kommt die Natur zu Hilfe; stöchiometrisches Wachstum von GaAs ist möglich mit nichtstöchiometrischer Strahlzusammensetzung. Das Wachstum ist begrenzt durch die Ga-Auftreffrate. Bei einer Wachstumstemperatur zwischen 500 und 600 °C bleibt Arsen nur dann an der wachsenden Oberfläche haften, wenn genügend GaAtome auf der wachsenden Oberfläche vorhanden sind; der Haftkoeffizient für As ist nahe eins
bei Ga-Überschuss auf der Oberfläche und verschwindend gering bei Ga-Mangel. GaAs-Epitaxie geschieht also optimal bei Arsen-Überschuss. Für ein tieferes Verständnis des GaAs-Wachstums in MBE ist weiter von Bedeutung, dass der Arsenmolekularstrahl beim Verdampfen von festem Arsen im wesentlichen aus As4-Molekülen besteht, die vor dem Einbau in die wachsende Schicht erst durch die thermische Energie der heißen Substratoberfläche in As gespalten werden müssen. Dieser Spaltungsprozess wird manchmal auch durch thermische Zersetzung an heißem Graphit in sog. Cracker-Zellen vorher ausgeführt, was zu besserer Schichtqualität führt. Wichtige Dotierstoffe in der III–V-MBE sind Si für n- und Be für p-Dotierung. Beide Materialien werden ebenfalls aus Effusionszellen verdampft, die gezielt während des Wachstums über Shutter ein- und ausgeschaltet werden können. Wie in Abb. XVII.1 dargestellt, ist eine MBEAnlage üblicherweise mit einer Elektronenkanone und einem Fluoreszenzschirm zur Beobachtung von Elektronenbeugungsbildern (Reflection High Energy Electron Diffraction, RHEED) ausgestattet. Beugungsbilder geben Aufschluss über die kristallographische Struktur der wachsenden Oberfläche. Des weiteren ist natürlich eine Ionisationsmanometerröhre vorhanden, die sowohl eine Messung des Kammerdrucks wie auch der Drücke in den Molekularstrahlen gestattet. Die in Abb. XVII.1 dargestellte MBE-Anlage ist typisch für die Epitaxie von III–V- und II–VIHalbleitern. Si-MBE [XVII.4] wird in ähnlichen Anlagen durchgeführt, nur wird der Si-Molekularstrahl nicht durch thermisches Verdampfen aus Effusionszellen erzeugt, sondern ein festes SiTarget wird durch Elektronenbeschuss so stark erhitzt, dass es verdampft. Der entscheidende Vorteil von MBE gegenüber Epitaxieverfahren, die bei höherem Druck arbeiten, besteht in der schnellen Umschaltzeit zwischen verschiedenen Quellen und damit in der Möglichkeit, atomar scharfe Dotierungs- und Kompositionsprofile auf einfache Weise zu erzeugen. Eine typische Wachstumsrate von 1 lm/h entspricht etwa 0,3 nm/s und somit dem Wachstum einer Monolage in einer Sekunde. Schaltzeiten zwischen verschiedenen Quellen sollten also merklich unterhalb einer Sekunde liegen.
Solch kurze Umschaltzeiten sind bei dem zweiten wichtigen Epitaxieverfahren der metallorganischen Gasphasenepitaxie [XVII.5] (Metal Organic Chemical Vapour Deposition, MOCVD oder Metal Organic Vapour Phase Epitaxy, MOVPE) schwerer zu erreichen, da hier das Wachstum in einem Flussreaktor stattfindet, dessen gesamtes Gasvolumen beim Umschalten von einer Quelle auf eine andere ausgetauscht werden muss. Gegenüber MBE besitzt MOCVD den besonders für industrielle Anwendungen interessanten Vorteil einer leichten Steuerbarkeit der Quellen über Gasflussregler. Weiterhin erlauben die gasförmigen Quellen einen weithin kontinuierlichen Betrieb der Anlage. Das Prinzip des MOCVD-Prozesses sei am Beispiel der Epitaxie von GaAs erklärt. Es handelt sich hierbei um die Abscheidung von festem GaAs aus gasförmigen Materialien, die Ga und As enthalten. Häufig werden AsH3 und das metallorganische Gas Trimethylgallium [TMG = Ga(CH3)3] verwendet. Die Gesamtreaktion, die
Abb. XVII.2 a, b. Schema einer Epitaxie-Apparatur zur metallorganischen Abscheidung (MOCVD) von III–V-Halbleiterschichten. (a) Gesamtübersicht. (b) Reaktor aus Quarzglas (typische Länge 50 cm); der Suszeptor zur Aufnahme des zu beschichtenden Wafers wird während des Wachstums auf 700–1200 K geheizt. (Nach Heinecke et al. [XVII.6])
485
über komplizierte schreibt sich
Zwischenschritte
abläuft,
Ga
CH3 3 gas AsH3 gas ! GaAsfest 3CH4 gas :
XVII:1
AsH3 wird hierbei unmittelbar aus der Gasflasche über ein geregeltes Gasflussventil in den aus Quarz bestehenden Reaktor geleitet (Abb. XVII.2 a). Die metallorganische Komponente TMG befindet sich in einem Kolben, in dem der TMG-Dampfdruck durch ein Temperaturbad eingestellt wird. Wasserstoff (H2) wird als Trägergas durch diesen Kolben geleitet und transportiert das TMG zum Reaktor. Des weiteren erlaubt eine Spülgasleitung das Spülen der gesamten Anordnung mit H2. Die bei der Reaktion nicht verbrauchten Komponenten, bzw. die Reaktionsprodukte, werden am Ende des Reaktors abgepumpt, wobei ein Zerlegungsofen das gefährliche, überschüssige AsH3 zerlegt. Das Pumpsystem erlaubt auch den Betrieb des Reaktors bei niedrigen
Gaseinlass
Gasauslass
Tafel XVII
Tafel XVII Halbleiterepitaxie
Tafel XVII
486
Tafel XVII Halbleiterepitaxie
Drücken (sog. Niedrigdruck MOCVD). Hierdurch können z. B. die Umschaltzeiten zwischen verschiedenen Quellen verringert werden und Vorteile der MBE gewonnen werden. Außer den eigentlichen Quellen für das Wachstum des Grundmaterials (AsH3 und TMG) werden natürlich Gasleitungen für Dotiergase wie SiH4, (C2H5)2 Te, (C5H5)2 Mg zwecks Si-, Te- bzw. Mg-Dotierung benötigt. Für das Wachstum von ternären und quaternären III–V-Legierungen sind außerdem weitere Gaszufuhrleitungen erforderlich. Gebräuchliche Metallorganika sind hier z. B. Trimethylaluminium (CH3)3Al, Trimethylantimon (CH3)3Sb, Trimethylindium (CH3)3In u. ä. Für das Wachstum von Phosphorkomponenten wie InP, GaP wird als Hydrid Phosphin PH3 verwendet. Abbildung XVII.2 b zeigt eine mögliche Bauform für einen Flussreaktor. Der zu beschichtende Wafer ruht auf dem sog. Graphitsuszeptor, der während der Epitaxie eine Wachstumstemperatur zwischen 600 und 800 °C haben muss. Die Heizung erfolgt über Strahlung, über direkten elektrischen Stromfluss oder über Mikrowellenverluste. Verglichen mit MBE stellt der Wachstumsprozess bei MOCVD ein wesentlich komplexeres Geschehen dar. Oberhalb der wachsenden Schicht strömt Gas vorbei. Aus dieser strömenden Schicht diffundieren die Reaktionskomponenten zur Oberfläche. Dort und in der Gasphase geschehen Zersetzungsreaktionen, z. B. wird AsH3 sowohl durch Stöße in der Gasphase wie auch an der Oberfläche selbst zersetzt. Nachdem die nötigen Oberflächenreaktionen, u. a. Einbau des abgespaltenen As in das wachsende Kristallgitter, abgelaufen sind, werden die Reaktionsprodukte, z. B. CH4, wieder durch Diffusion von der Oberfläche weg in den abfließenden Gasstrom transportiert. MOCVDWachstum wird also maßgeblich bestimmt durch Transport hin und weg von der Oberfläche und durch Oberflächenreaktionen, sog. Oberflächenkinetik. Dies zeigt sich sehr klar, wenn man im MOCVD-Prozess die Wachstumsrate als Funktion der Substrattemperatur aufträgt (Abb. XVII.3). Es ergeben sich typische Abhängigkeiten, die zu niedrigen Temperaturen hin einen exponentiellen Abfall wie exp (–Eact/k T) zeigen, der durch Oberflächenreaktionen kinetisch begrenzt ist. Typische Aktivierungsenergien Eact in diesem Bereich lie-
Abb. XVII.3. Wachstumsraten für GaAs-Schichten bei der metallorganischen Gasphasen (MOCVD)-Abscheidung aus AsH3 und Trimethylgallium (TMG) bzw. Triethylgallium (TEG); GaAs-Wafer-Orientierung (100). Es sind jeweils die Gasstromgeschwindigkeiten v und die Partialdrücke pTEG, pTMG bzw. pAsH3 mitangegeben. Der Totaldruck ist in beiden Experimenten 104 Pa. (Nach Plass et al. [XVII.7])
gen bei etwa 1 eV pro Atom. Bei welchen Temperaturen dieser kinetisch begrenzte Bereich liegt, hängt von den verwendeten Quellenmaterialien ab. Während für das thermisch stabilere TMG der exponentielle Abfall unterhalb von 850 K beobachtet wird, tritt er bei Verwendung des leichter zerfallenden Triethylgalliums [TEG, (C2H5)3 Ga] erst unterhalb von 700 K auf. Oberhalb des kinetisch begrenzten Bereiches zeigt die Wachstumsrate ein Plateau, dessen Höhe von den Bedingungen der Hin- und Wegdiffusion abhängt (z. B. Strömungsgeschwindigkeit im Reaktor). Hier ist das Wachstum durch die Transportprozesse in der Gasphase begrenzt. Zu noch höheren Temperaturen hin wird wieder ein Abfall der Wachstumsrate beobachtet (Abb. XVII.3). Für diesen Abfall liegt vermutlich kein prozessinhärenter Grund vor. Ein Verlust von Reaktanten aus dem Gasstrom durch Abscheidung an den Reaktorwänden wird angenommen. Durch geschickte Prozessführung in der Niedrigdruck-MOCVD und durch besondere Ventilkonstruktionen werden heute so kurze Umschaltzeiten erreicht, dass auch in MOCVD atomar scharfe Heteroübergänge von einem Halbleiter zu einem anderen erzeugt werden können.
Eine dritte moderne Epitaxiemethode, die sog. metallorganische MBE (MOMBE) oder auch manchmal CBE (Chemical Beam Epitaxy) genannt, vereinigt Vorteile von MBE und MOCVD in sich [XVII.8]. Wie in MBE dient ein UHV-System (Abb. XVII.1) als Wachstumskammer. Als Quellenmaterialien werden jedoch wie in MOCVD Gase verwendet, die über Leitungen und gesteuerte Ventile von außen in die UHVKammer eingelassen werden. Im Innern dienen speziell konstruierte Einlasssysteme (Kapillaren) dazu, Molekularstrahlen zu formen, die auf die zu beschichtende Substratfläche gerichtet sind. Für das Wachstum von GaAs werden z. B. AsH3 und Triethylgallium [(C2H5)3 Ga, TEG] verwendet. Während jedoch im MOCVD-Reaktor Stöße im Gasraum oberhalb der heißen Substratfläche zu einer signifikanten Vorzerlegung des AsH3 führen, fällt dieser Mechanismus wegen des verschwindend geringen Hintergrunddruckes aus. In MOMBE muss deshalb das AsH3 in der Einlasskapillare selbst thermisch vorzerlegt werden. Bei allen metallorganischen Epitaxieprozessen ist Kohlenstoff, der aus der Zerlegung der Metallorganika stammt, eine markante Verunreinigung, die meist als Akzeptor auf As-Plätzen eingebaut zu p-Leitung führt (obwohl C auch als Donator auf Ga-Plätzen eingebaut werden kann). Dieser C-Einbau wird umso stärker, je niedriger
487
die verwendeten Drücke bei der Epitaxie sind. In MOMBE können niedrigdotierte p-GaAs-Schichten deshalb nur mit TEG und nicht wie in MOCVD auch mit TMG abgeschieden werden.
Literatur XVII.1 M. A. Herman, H. Sitter: Molecular Beam Epitaxy, Springer Ser. Mater. Sci., Vol. 7 (Springer, Berlin Heidelberg 1988) XVII.2 E. H. C. Parker (Hrsg.): The Technology and Physics of Molecular Beam Epitaxy (Plenum, New York 1985) XVII.3 A. Y. Cho, K. Y. Cheng: Appl. Phys. Lett. 38, 360 (1981) XVII.4 E. Kasper, H.-J. Herzog, H. Dämbkes, Th. Richter: Growth Mode and Interface Structure of MBE Grown SiGe Structures, in Two-Dimensional Systems: Physics and New Devices, ed. by G. Bauer, F. Kuchar, H. Heinrich, Springer Ser. Solid-State Sci., Vol. 67 (Springer, Berlin Heidelberg 1986) XVII.5 Proc. ICMOVPE I, J. Crystal Growth 55 (1981) Proc. ICMOVPE II, J. Crystal Growth 68 (1984) W. Richter: Physics of Metal Organic Chemical Vapour Deposition, in Festkörperprobleme XXVI (Adv. Solid State Phys. 26) ed. by P. Grosse (Vieweg, Braunschweig 1986) p. 335 XVII.6 H. Heinecke, E. Veuhoff, N. Pütz, M. Heyen, P. Balk: J. Electron. Mater. 13, 815 (1984) XVII.7 C. Plass, H. Heinecke, O. Kayser, H. Lüth, P. Balk: J. Crystal Growth 88, 455 (1988) XVII.8 H. Lüth: Surf. Science 299/300, 867 (1994)
Tafel XVII
Literatur
Tafel XVIII
Tafel XVIII Präparation von Nanostrukturen
Untersuchungen des elektronischen Transports in Nanostrukturen mit Leiterquerschnitten zwischen 10 und einigen 100 nm benötigen entsprechend strukturierte Proben. Dies gilt insbesondere für Untersuchungen des Quantentransports bei tiefen Temperaturen, so wie er in Abschn. 9.9 beschrieben wurde. Geeignete Strukturierungsmethoden sowohl für Metalle als auch für Halbleitermaterialien wurden im Zusammenhang mit der Halbleiter-Mikroelektronik entwickelt. Im Wesentlichen handelt es sich dabei um Techniken, die auch zur Herstellung hochintegrierter Schaltkreise auf Silizium-Wafern Verwendung finden. Eine häufig angewandte Methode zur Präparation von dreidimensionalen (3D) Nanostrukturen auf einem Substrat beginnt mit der flächenhaften Beschichtung des Substrats, z. B. einem Silizium-, GaAs-, oder Saphir (Al2O3)-Wafer mit dem erwünschten Nanostrukturmaterial. Metalle werden aus einem elektrisch beheizten Wolfram- oder Graphittiegel verdampft und auf dem Substrat deponiert. Bei hochschmelzenden Materialien geschieht das Verdampfen auch häufig durch Elektronenbeschuss des im Tiegel vorhandenen Ausgangsmaterials. Wenn das Substrat zum aufwachsenden Film gut gitterangepasst ist, lässt sich bei höheren Substrattemperaturen, bei denen die Oberflächenbeweglichkeit der auftreffenden Atome genügend hoch ist, auch kristallines Wachstum der Epischicht erzielen. Man spricht dann von Epitaxie (Tafel XVII). Besonders kristalline Halbleiterschichten und Mehrschichtsysteme, z. B. aus GaAs/AlGaAs, InGaAs/InP oder Si/Ge werden mittels Epitaxieverfahren wie Molecular Beam Epitaxy (MBE) oder Metal Organic Vapour Phase Epitaxy (MOVPE) auf geeigneten Substraten abgeschieden (siehe Tafel XVII). Mittels Deposition von polykristallinen bzw. amorphen Schichten oder Epitaxie von kristallinen Epischichten und
Schichtsystemen wird so eine Nanostrukturierung in einer, nämlich der z-Richtung senkrecht zur Substratoberfläche erreicht. Bei Schichtwachstumsraten von 1mm/h, d. h. 0.3 nm/s können Schichtdicken unterhalb von 1nm und atomar scharfe Übergänge zwischen verschiedenen Materialien erzielt werden. Um 3D-Nanostrukturen durch “maschinelle” Strukturierung herzustellen, ist Lithographie (griech. kiho& = Stein, cqueim = schreiben) erforderlich. Laterale Strukturierung bis in den 100 nm Bereich wird mittels optischer Lithographie, d. h. unter Verwendung von Belichtungsmethoden mit sichtbarem und UV-Licht durchgeführt. Nanostrukturierung bis auf die 5–10 nmSkala wird mittels Elektronenstrahl-Lithographie (engl. e-beam-lithography), also unter Verwendung von Elektronenstrahlschreibern erreicht. Beide Prozesse sind darin ähnlich, dass ein Photolack (engl. photoresist) entweder durch Licht oder durch einen Elektronenstrahl belichtet und dadurch chemisch und strukturell bezüglich seiner Löslichkeit in einem organischen Lösungsmittel verändert wird. Bei der optischen Lithographie geschieht die Belichtung durch eine Maske (entweder als Kontaktdurchleuchtung oder durch optische Projektion), d. h. das gewünschte Muster wird in seiner Gesamtheit parallel, in einem einzigen Beleuchtungsschritt auf den Lack übertragen. Bei der Elektronenstrahl-Lithographie erfolgt die Belichtung seriell, indem ein fokussierter Elektronenstrahl rechnergesteuert über den Lack geführt wird. Dies geschieht in einer elektronenmikroskopischen Säule wie bei einem Rasterelektronenmikroskop. Verglichen mit der optischen Lithographie ist die Elektronenstrahl-Lithographie zeit- und kostenintensiver. Für industrielle Anwendung zielt deshalb die Forschung darauf ab, die Elektronenstrahl-Lithographie durch parallele Belichtungsverfahren mit extrem
489
Tafel XVIII
Tafel XVIII Präparation von Nanostrukturen
Abb. XVIII.1. Schematische Darstellung wichtiger lithographischer Strukturierungsverfahren. Die Belichtungsschritte (3) bei der Metall-Ätzung bzw. (2) beim Lift-off-Prozess werden in der optischen Lithographie durch Masken (wie dargestellt) bzw. durch optische Projektion parallel oder in der Elektronenstrahl-Lithographie seriell durchgeführt. Ein Negativlack wird an den belichteten Stellen unlöslich, ein Positivlack löslich für die nachfolgende Lack-Entwicklung
kurzwelligem Licht zu ersetzen, z. B. durch extreme UV (EUV)-Lithographie mit einer Lichtwellenlänge von 13,5 nm (entsprechend einer Photonenenergie von 91,82 eV). Um laterale Strukturen im belichteten Photolack auf Halbleiterschichtsysteme oder Wafer zu übertragen, werden verschieden Ätzverfahren eingesetzt. Die wichtigsten Übertragungsverfahren sind in Abb. XVIII.1 zusammengestellt. Im Fall der Metallstrukturierung auf dem Wafer sind zwei Wege möglich, die Metallätzung und das sog. Lift-off Verfahren. Bei der Metallätzung (linke Kolumne in Abb. XVIII.1) wird eine durch Verdampfung deponierte Metallschicht (Schritt 1) strukturiert geätzt. Dazu wird die Metallschicht (typische Dicke 100 nm) mit dem organischen Photolack, häufig mit Poly-Methyl-Meta-Acrylat (PMMA) in einer Lackschleuder durch Aufsprühen bedeckt (Schritt 2). Im hier beschriebenen Prozess wird ein sog. Negativlack benutzt, bei dem die nachfolgende Belichtung (Schritt 3) durch eine Maske oder durch einen Elektronenstrahl lokal in den beleuchteten Arealen zu einer Verfestigung der chemischen Struktur des Lackes (Polymerbildung), d. h. zu einer geringeren Lös-
lichkeit führt. Bei der nachfolgenden Entwicklung (Schritt 4) werden durch ein organisches Lösungsmittel die nichtbelichteten Areale des Lacks entfernt. Die verbleibenden Lackstrukturen schützen nun die darunter liegende Metallschicht davor, beim Ätzen entfernt zu werden. Ätzen von Strukturen kann je nach verlangten Anforderungen nasschemisch in Lösungen (HCL, H2O2 u.a.) erfolgen oder in einer Plasmaentladung in O2 durch Ionenbeschuss mit mehr oder weniger chemisch aktiven Beimischungen (HF, HBr). Letztere Methode, die in Ionenätzanlagen erfolgt, heißt Reaktives Ionenätzen (engl. Reactive Ion Etching, RIE, Abb. XVIII.2). Die Metallätzung (Schritt 5) hinterlässt nun auf dem Wafer die Nanostrukturen, bestehend aus Metall und der darüber liegenden Lackschicht. In Schritt 6 wird der Lack in einem Ofen durch Veraschung entfernt und die gewünschten Metall-Nanostrukturen verbleiben auf dem Wafer. Da III–V Halbleiter und Metalle sehr ähnliches Ätzverhalten zeigen, eignet sich die beschriebene Methode nur sehr begrenzt zur Erzeugung metallischer Nanostrukturen auf III–V Halbleitern. Hier wird der sogenannte Lift-off-
Tafel XVIII Präparation von Nanostrukturen
Tafel XVIII
490
Abb. XVIII.2. Schema einer Apparatur für Reaktives Ionenätzen (RIE). Zur Aufrechterhaltung der Plasmaentladung mit reaktiven Ionen werden üblicherweise Niedrigdruck-Vakuumkammern als Reaktor eingesetzt
Prozess bevorzugt angewendet. Die III–V-WaferOberfläche wird mit einem Positivlack bedeckt (Schritt 1). Ein solcher Lack wird durch Belichtung, optisch oder durch Elektronenstrahl, chemisch so verändert, dass er in den belichteten Bereichen leichter löslich wird (Aufbrechen von Polymer-Bindungen). Danach wird der Positivlack belichtet, optisch oder durch Elektronenstrahl (Schritt 2). Nach der Entwicklung, dem Entfernen des Lacks an den belichteten Stellen (Schritt 3), ist der Wafer dann mit einer strukturierten Lackschicht bedeckt. Eine nachfolgende Deposition von Metall bedeckt sowohl Lack und Waferbereiche mit Metall (Schritt 4). Im Lift-offProzess werden nun im fünften Schritt die verbliebenen metallbedeckten Lackstrukturen entfernt und nur die auf dem Wafer angeordneten Metallstrukturen bleiben übrig, genauso wie in der vorher beschriebenen Metallätzung. Diesen mit Positivlack durchgeführten Prozess kann man auch einsetzen, um Strukturen direkt in den Halbleiter-Wafer zu übertragen. Nach der Belichtung (Schritt 2) muss man nur einen Ätzschritt, meist RIE, anschließen, der direkt das Halbleitersubstrat angreift (Schritt 4). Hierbei entstehen entsprechende Vertiefungen im Halbleiter, bzw. entsprechende 3D-Nanostrukturen, die erhaben aus dem Halbleiter-Wafer herausragen. Diese Strukturierungsmethode eignet sich also hervorragend, um Halbleiter-Heterostrukturen, die schon in ihrer Schichtstruktur zwei energetische Barrieren für Elektronen, z. B. aus AlAs eingebettet in GaAs (Abschn. 12.7) aufweisen, weiter
in 3D-Quantenpunkte zu überführen, indem die laterale Einschränkung durch lithographische Herausformung von Säulenstrukturen erreicht wird. In einem letzten fünften Schritt wird dann nur noch der übrig gebliebene Photolack entfernt. Alle bisher vorgestellten Methoden der Herstellung von Nanostrukturen gehen von makroskopischen Festkörpern aus und verwenden lithographische Techniken zur Verkleinerung bis in den Nanometerbereich (sog. top-down Verfahren). In den letzten Jahren sind mit wachsender Bedeutung sog. bottom-up Verfahren ins Blickfeld gerückt, bei denen man das Selbstorganisationsprinzip der Natur einsetzt, wie wir es vom Kristallwachstum her kennen. Wenn man die richtigen physikalischen und chemischen Voraussetzungen schafft, bilden sich Nanostrukturen von selbst aus, ohne den Einsatz komplexer und kostenintensiver Lithographietechniken. Ein Beispiel ist die Selbstorganisation organisch-chemischer Nanopartikel und Fadenstrukturen. Speziell für die Halbleiterphysik hat das epitaktische Wachstum von Halbleiterwhiskern (HalbleiterNanosäulen) enorme Bedeutung gewonnen. Deponiert man auf einem Halbleiter-Wafer metallische Tröpfchen mit Durchmessern von 10– 100 nm, so wirken diese als Nukleationskeime und als Katalysatoren beim Kristallwachstum in der Epitaxie, sowohl in der MBE wie auch in der MOVPE bzw. MOCVD (Tafel XVII). Bei der MOVPE bewirken diese metallischen Keime eine gesteigerte katalytische Zersetzung der gasförmi-
491
Tafel XVIII
Tafel XVIII Präparation von Nanostrukturen
Abb. XVIII.3. Rasterelektronenmikroskopische Aufnahmen einer in der Molekularstrahlepitaxie hergestellten Ansammlung von GaN-Whiskern auf einem Si(111)-Substrat (a) und eines einzelnen vom Si-Substrat abgelösten Whiskers, der auf einem mit metallischen Markern (helle Punkte) elektronenlithographisch vorstrukturiertem Si/SiO2-Substrat deponiert wurde und anschließend mit metallischen ohmschen Kontakten überdeckt wurde (b). Die ohmschen Kontakte (großflächige helle Bereiche) wurden auch mittels Elektronenstrahl-Lithographie präpariert. (Nach Calarco et al. [XVIII.1])
gen Ausgangsmaterialien und lassen bei geeigneten Wachstumsparametern nur Wachstum an der Stelle des Metallkeims zu. Dies führt zu Whisker-Wachstum; 10 bis 100 nm dicke Nanosäulen wachsen bis zu Längen von Mikrometern und können nach Abtrennung vom Substrat und elektrischer Kontaktierung, meist mit lithographisch präparierten Metallkontakten (Abb. XVIII.3), zur Untersuchung von Quanteneffekten benutzt werden. Denkt man an Anwendungen in der Quantenelektronik, dann wäre ein geordnetes Wachstum dieser Halbleiter-Nanosäulen, sowohl bezüglich ihrer Dicke und Länge als auch in ihrer räumlichen Anordnung wünschenswert. Dies kann man erreichen, indem man die Metallkeime mit einheitlicher Dicke an wohlbestimmten Plätzen deponiert. Als erfolgreich hat sich aber auch ein geordnetes selektives Wachstum mittels vorher auf dem Wafer abgeschiedener Masken herausgestellt. In Abb. XVIII.4 ist als Beispiel das geordnete
Abb. XVIII.4. Geordnetes selektives Wachstum von GaAs-Nanosäulen auf einem maskierten GaAs(111)-Substrat (rasterelektronenmikroskopische Aufnahmen). (a) Elektronenlithographisch hergestellte Maske aus HSQ (Hydrogen Silesquioxane) auf einem GaAs(111)-Wafer; (b) Mittels metallorganischer Gasphasenepitaxie (MOVPE, Tafel XVII) hergestellte GaAs-Nanosäulen (Durchmesser etwa 150 nm) unter Benutzung der HSQ-Maske aus (a). (Nach Klinger et al. [XVIII.2])
Wachstum von GaAs-Säulen auf GaAs(111) mit Durchmessern von etwa 150 nm dargestellt. Die Maske aus einem anorganischen Negativ-Photolack (HSQ = Hydrogen Silesquioxane) wurde mittels Elektronenstrahl-Lithographie hergestellt (Abb. XVIII.4a). Die GaAs-Säulen wurden in der MOVPE mit den Ausgangsmaterialien AsH3 und TMGa (Trimethylgallium) bei einer Wachstumstemperatur von 750 8C hergestellt. Es sei noch einmal betont, dass für die Herstellung dieser wohlgeordneten Säulen das in der MOVPE mögliche selektive Wachstum entscheidend ist, bei dem die nicht-reaktive Maskenoberfläche wegen ihrer fehlenden Fähigkeit zur oberflächenkatalytischen Zersetzung der Ausgangsgase kein GaAs-Wachstum zulässt. Das Wachstum von Halbleiter-Nanosäulen in MBE und MOVPE bzw. MOCVD wurde mittlerweile für die Halbleitersysteme Si, SiGe, GaAs, InAs, GaN, InN, ZnO gezeigt und lässt interessante neue Entwicklungen im Hinblick auf eine zukünftige Quantenelektronik erwarten.
Tafel XVIII
492
Tafel XVIII Präparation von Nanostrukturen
Literatur XVIII.1 R. Calarco, M. Marso, R. Meijers, Th. Richter, N. Aykanat, T. Thillosen, T. Stoica, H. Lüth: NanoLetters 5, 981 (2005) XVIII.2 V. Klinger, J. Wensorra (Forschungszentrum Jülich 2007): private Mitteilung
Literatur
Zu Kapitel 1 Spezielle Literatur 1.1 L. Pauling: The Nature of the Chemical Bond, 3rd edn. (Cornell Univ. Press, Ithaca, NY 1960) 1.2 S. Göttlicher: Acta Cryst. B 24, 122 (1968) 1.3 Y. W. Yang, P. Coppens: Solid State Commun. 15, 1555 (1974) 1.4 S. P. Walch, W. A. Goddard, III: Surf. Sci. 72, 645 (1978) Weiterführende Literatur Ballhausen, C. J., Gray, H. B.: Molecular Orbital Theory (Benjamin, New York 1964) Cartmell, E., Fowles, G. W. A.: Valency and Molecular Structure, 2nd edn. (Butterworths, London 1961) Coulson, C. A.: Valence, 2nd edn. (Oxford Univ. Press, Oxford 1961) Hartmann, H.: Theorie der chemischen Bindung (Springer, Berlin Heidelberg 1954) Pauling, L.: Die Natur der chemischen Bindung (Chemie-Verlag, Weinheim 1964) Philips, J. C.: Covalent Bonding in Crystals, Molecules and Polymers (The Univ. of Chicago Press, Chicago 1969) Slater, J. C.: Quantum Theory of Molecules and Solids (McGrawHill, New York 1963) Vinogradov, S. N., Linell, R. H.: Hydrogen Bonding (Van NostrandReinhold, New York 1971)
Zu Kapitel 2 Spezielle Literatur 2.1 K. Urban, P. Kramer, M. Wilkens: Phys. Bl. 42, 373 (1986) 2.2 T. B. Massalski (ed.): Binary Alloy Phase Diagrams, American Society for Metals, Metals Park, Ohio 44073, 2nd ed. 1990 Eine Datenbank ist verfügbar unter dem Namen TAPP von ES Microwave, 2234 Wade Court, Hamilton, OH 45013, USA
494
Literatur
Weiterführende Literatur Burzlaff, H., Thiele, G. (Hrsg.): Kristallographie – Grundlagen und Anwendungen (Thieme, Stuttgart 1977), insbesondere: Burzlaff, H., Zimmermann, H.: „Symmetrielehre“, Bd. I Hamermesh, M.: Group Theory and Its Application to Physical Problems (Addison-Wesley/Pergamon, London Paris 1962) Heine, V.: Group Theory in Quantum Mechanics (Pergamon, London 1960) Koster, G. F., Dimmock, J. O., Wheeler, R. G., Statz, H.: Properties of the 42 Point Groups (MIT Press, Cambridge, MA 1963) Streitwolf, H.: Gruppentheorie in der Festkörperphysik (Akademische Verlagsges., Leipzig 1967) Tinkham, M.: Group Theory and Quantum Mechanics (McGrawHill, New York 1964) Vainshtein, B. K.: Modern Crystallography I, Springer Ser. SolidState Sci., Vol. 15 (Springer, Berlin Heidelberg 1981)
Zu Kapitel 3 Spezielle Literatur 3.1 W. Marshall, S. W. Lovesey: Theory of Thermal Neutron Scattering (Clarendon, Oxford 1971) 3.2 L. D. Landau, E. M. Lifschitz: Lehrbuch der theoretischen Physik, Bd. VIII: „Elektrodynamik der Kontinua“ (Akademie Verlag, Berlin 1874) S. 436 ff. 3.3 J. B. Pendry: Low Energy Electron Diffraction (Academic, London 1974) 3.4 S. Kugler, L. Pusztai, L. Rosta, P. Chieux, R. Bellissent: Phys. Rev. B48, 7685 (1993) 3.5 Y. Waseda: The Structure of Non-Crystalline Materials (McGraw-Hill, New York 1981) Weiterführende Literatur Bacon, G. F.: Neutron Diffraction, 2nd edn. (Oxford Univ. Press, Oxford 1962) Dachs, H. (ed.): Neutron Diffraction, Topics Curr. Phys., Vol. 6 (Springer, Berlin Heidelberg 1978) Kleber, W.: Einführung in die Kristallographie, 10. Aufl. (VEB, Berlin 1972) Lovesey, S., Springer, T. (eds.): Dynamics of Solids and Liquids by Neutron Scattering. Topics Curr. Phys., Vol. 3 (Springer, Berlin Heidelberg 1977) Pinsker, Z. G.: Dynamical Scattering of X-Rays in Crystals, Springer Ser. Solid-State Sci., Vol. 3 (Springer, Berlin Heidelberg 1978)
Literatur
495
Sellin, A. (ed.): Structure and Collisions of Ions and Atoms, Topics Curr. Phys., Vol. 5 (Springer, Berlin Heidelberg 1978) Summer Course on Material Science, Antwerp 1969: Modern Diffraction and Imaging Techniques in Material Science, ed. by S. Amelinckx, R. Gevers, G. Remaut, J. van Landuyt (North Holland, Amsterdam 1970)
Zu Kapitel 4 Spezielle Literatur 4.1 M. Born, R. Oppenheimer: Ann. Phys. (Leipzig) 84, 457 (1927) 4.2 G. Leibfried: In Handbuch der Physik, Vol. 7/1 (Springer, Berlin Heidelberg 1955) S. 104 4.3 G. Dolling: In Inelastic Scattering of Neutrons in Solids and Liquids, Vol. II (Intern. Atomic Energy Agency, Vienna 1963) p. 37 4.4 R. F. S. Hearman: Advances in Physics 5, 323 (1956) 4.5 W. A. Brantley: J. App. Phys. 44, 534 (1973) 4.6 G. Simmons, H. Wang: Single crystal elastic constants and calculated aggregate properties; A Handbook, 2nd ed., Cambridge, USA (MIT Press, Cambridge 1971) Weiterführende Literatur Bak, T. A.: Phonons and Phonon Interactions (Benjamin, New York 1964) Bilz, H., Kress, W.: Phonon Dispersion Relations in Insulators, Springer Ser. Solid-State Sci., Vol. 10 (Springer, Berlin Heidelberg 1979) Born, M., Huang, K. H.: Dynamical Theory of Crystal Lattices (Clarendon, Oxford 1954) Leibfried, G., Breuer, N.: Point Defects in Metals I, Introduction to the Theory, Springer Tracts Mod. Phys. Vol. 81 (Springer, Berlin Heidelberg 1977) Ludwig, W.: Recent Developments in Lattice Theory, Springer Tracts Mod. Phys., Vol. 43 (Springer, Berlin Heidelberg 1967) Maradudin, A. A., Montroll, E. W., Weiss, G. H.: “Theory of Lattice Dynamics in the Harmonic Approximation” in Solid State Physics, Advances and Applications, ed. by H. Ehrenreich, F. Seitz, D. Turnbull (Academic, New York, 1971) Suppl. 3 Wallis, R. F. (ed.): Lattice Dynamics (Plenum, New York 1965)
496
Literatur
Zu Kapitel 5 Spezielle Literatur 5.1 G. Dolling, R. A. Cowley: Proc. R. Soc. London 88, 463 (1966) 5.2 American Institute of Physics Handbook, 3rd edn. (McGrawHill, New York 1972) pp. 4–115 5.3 Wei Chen, D. L., Mills: Phys. Rev. B 36, 6269 (1987) 5.4 H. Ibach: Phys. Status Solidi 31, 625 (1969) 5.5 R. W. Powell, C. Y. Ho, P. E. Liley: NSRDS-N 13S8 (1966) 5.6 R. Berman, P. G. Klemens, F. E. Simon, T. M. Fry: Nature 166, 865 (1950) Weiterführende Literatur Rosenberg, H. M.: Low Temperature Solid-State Physics (Clarendon, Oxford 1963)
Zu Kapitel 6 Spezielle Literatur 6.1 A. Sommerfeld, H. Bethe: Elektronentheorie der Metalle, Heidelberger Taschenbuch, Bd. 19 (Springer, Berlin Heidelberg 1967) 6.2 Landolt Börnstein, Neue Serie III/6 (Springer, Berlin Heidelberg 1971) 6.3 C. A. Bailey, P. L. Smith: Phys. Rev. 114, 1010 (1959) 6.4 N. F. Mott: Cdn. J. Phys. 34, 1356 (1956); Nuovo Cimento 7 (Suppl.), 312 (1958) 6.5 H. B. Michaelson: J. Appl. Phys. 48, 4729 (1977) Weiterführende Literatur Grosse, P.: Freie Elektronen in Festkörpern (Springer, Berlin Heidelberg 1979)
Zu Kapitel 7 Spezielle Literatur 7.1 W. Shockley: Electrons and Holes in Semiconductors (Van Nostrand, New York 1950) 7.2 L. P. Howard: Phys. Rev. 109, 1927 (1958) 7.3 B. Segall: Phys. Rev. 124, 1797 (1961)
Literatur
497
7.4 R. Courths, S. Hüfner: Phys. Rep. 112, 55 (1984) 7.5 H. Eckhardt, L. Fritsche, J. Noffke: J. Phys. F 14, 97 (1984) 7.6 F. Herman, R. L. Kortum, C. D. Kuglin, J. L. Shay: In II–VI Semiconducting Compounds, ed. by D. G. Thomas (Benjamin, New York 1967) 7.7 T. H. Upton, W. A. Goddard, C. F. Melius: J. Vac. Sci. Technol. 16, 531 (1979) 7.8 H. Haberland (ed.): Clusters of Atoms and Molecules I and II, Springer Series in Chem. Phys. 52, 56 (Springer Berlin Heidelberg 1994) Weiterführende Literatur Brillouin, L.: Wave Propagation in Periodic Structures (Academic, New York 1960) Callaway, J.: Energy Band Theory (Academic, New York 1964) Harrison, W. A.: Pseudopotentials in the Theory of Metals (Benjamin, New York 1966) Herrmann, R., Preppernau, U.: Elektronen im Kristall (Springer, Berlin Heidelberg 1979) Jones, H.: The Theory of Brillouin-Zones and Electronic States in Crystals (North-Holland, Amsterdam 1962) Loucks, T. L.: Augmented Plane Wave Method (Benjamin, New York 1967) Madelung, O.: Introduction to Solid-State Theory, Springer Ser. Solid State Sci., Vol. 2 (Springer, Berlin Heidelberg 1978) Skriver, H. L.: The LMTO Method, Springer Ser. Solid-State Sci., Vol. 41 (Springer, Berlin Heidelberg 1984) Wilson, A. H.: The Theory of Metals, 2nd edn. (Cambridge Univ. Press, London 1965)
Zu Kapitel 8 Spezielle Literatur 8.1 A. S. Arrot, in J. A. C. Bland, B. Heinrich (eds.): Ultrathin Magnetic Structures, Vol. I, Springer, Berlin 1994, p. 7 8.2 J. F. Janak: Phys. Rev. B 16, 255 (1977) 8.3 J. Callaway, C. S. Wang: Phys. Rev. B 7, 1096 (1973) 8.4 P. Weiss, G. Foex: Arch. Sci. Natl. 31, 89 (1911) 8.5 P. Weiss, R. Porrer: Ann. Phys. 5, 153 (1926) 8.6 H. A. Mook, D. McK. Paul: Phys. Rev. Lett. 54, 227 (1985)
498
Literatur
Weiterführende Literatur Chakravarty, A. S.: Introduction to the Magnetic Properties of Solids (Wiley, New York 1980) Crangle, J.: The Magnetic Properties of Solids (Arnold, London 1977) Ibach, H.: Physics of Surfaces and Interfaces (Springer, Berlin Heidelberg New York 2006) Moriya, T.: Spin Fluctuations in Itinerant Electron Magnetism, Springer Ser. Solid-State Sci., Vol. 56 (Springer, Berlin Heidelberg 1985) White, R. M.: Quantum Theory of Magnetism, Springer Ser. SolidState Sci., Vol. 32 (Springer, Berlin Heidelberg 1983) siehe auch D. C. Mattis: The Theory of Magnetism I and II, Springer Ser. Solid-State Sci., Vols. 17, 55 (Springer, Berlin Heidelberg 1985, 1988)
Zu Kapitel 9 Spezielle Literatur 9.1 P. Drude: Ann. Phys. (Leipzig) 1, 566 (1900) 9.2 E. Grüneisen: Ann. Phys. (Leipzig) (5) 16, 530 (1933) 9.3 D. K. C. McDonald, K. Mendelssohn: Proc. R. Soc. Edinburgh, Sect. A 202, 103 (1950) 9.4 J. Linde: Ann. Phys. (Leipzig) 5, 15 (1932) 9.5 J. M. Ziman: Principles of the Theory of Solids (Cambridge Univ. Press, London 1964) 9.6 N. F. Mott: Phil. Mag. B19, 835 (1984) N. F. Mott: in The Physics of Hydrogenated Amorphous Silicon Vol. II, ed. by J. D. Joannopoulos and G. Luckowsky, Topics in Applied Physics, Vol. 56 (Springer, Berlin Heidelberg 1984) p. 169 9.7 B. Ruttensperger, G. Müller, G. Krötz: Phil. Mag. B68 203 (1993) 9.8 B. J. van Wees, H. van Houten, C. W. J. Beenacker, J. W. Williamson, L. P. Kouwenhoven, D. van der Marel, C. T. Foxon: Phys. Rev. Lett. 60, 848 (1988) 9.9 K. Hansen, E. Laegsgaard, I. Stensgaard, F. Besenbacher: Phys. Rev. B56, 2208 (1997) 9.10 Y. Aharonov and D. Bohm: Phys. Rev. 115, 485 (1959) 9.11 R. A. Webb, S. Washburn, C. P. Umbach, R. B. Laibowitz: Phys. Rev. Lett. 54, 2696 (1985) 9.12 J. Wesorra, M. Lepsa, M. Indlekofer, Ch. Blömers, S. Heiderich, Th. Schäpers, H. Lüth: unveröffentlicht 9.13 G. J. Dolan, J. C. Licini, D. J. Bishop: Phys. Rev. Lett. 56, 1493 (1986)
Literatur
499
9.14 Ch. Blömers, Th. Schäpers, T. Richter, R. Calarco, H. Lüth, M. Marso: Appl. Phys. Lett. 92, 132101 (2008) 9.15 C. P. Umbach, C. Van Haesendonck, R. B. Laibowitz, S. Washburn, R. A. Webb: Phys. Rev. Lett. 56, 386 (1986) Weiterführende Literatur Blatt, F. J.: Physics of Electronic Conduction in Solids (McGrawHill, New York 1968) Buckel, W.: Supraleitung – Grundlagen und Anwendung (Physik Verlag, Weinheim 1972) Busch, G., Schade, H.: Vorlesungen über Festkörperphysik (Birkhäuser, Basel 1973) Heinzel, Th.: Mesosopic Electronics in Solid State Nanostructures (Wiley-VCH, Weinheim 2003) Madelung, O.: Introduction to Solid-State Theory, Springer Ser. Solid-State Sci., Vol. 2 (Springer, Berlin Heidelberg 1978) Nag, B. R.: Electron Transport in Compound Semiconductors, Springer Ser. Solid-State Sci., Vol. 11 (Springer, Berlin Heidelberg 1980) Smith, A. C., Janak, J. F., Adler, R. B.: Electronic Conduction in Solids (McGraw-Hill, New York 1967) Ziman, J. M.: Electrons and Phonons (Clarendon, Oxford 1960)
Zu Kapitel 10 Spezielle Literatur 10.1 H. K. Onnes: Akad. van Wetenschappen (Amsterdam) 14, 113, 818 (1911) 10.2 J. Bardeen, L. N. Cooper, J. R. Schrieffer: Phys. Rev. 108, 1175 (1957) 10.3 N. E. Phillips: Phys. Rev. 114, 676 (1959) 10.4 W. Meissner, R. Ochsenfeld: Naturwissensch. 21, 787 (1933) 10.5 F. London, H. London: Z. Phys. 96, 359 (1935) 10.6 L. N. Cooper: Phys. Rev. 104, 1189 (1956) 10.7 H. Fröhlich: Phys. Rev. 79, 845 (1950) 10.8 N. N. Bogoliubov: Nuovo Cimento 7, 794 (1958) 10.9 J. Hinken: Supraleiter-Elektronik (Springer, Berlin Heidelberg 1988) 10.10 V. V. Schmidt (eds. P. Müller, A. V. Ustinov): The Physics of Superconductors (Springer, Berlin Heidelberg 1997) 10.11 P. L. Richards, M. Tinkham: Phys. Rev. 119, 575 (1960) 10.12 I. Giaever, K. Megerle: Phys. Rev. 122, 1101 (1961)
500
Literatur
10.13 E. Maxwell: Phys. Rev. 86, 235 (1952); B. Serin, C. A. Reynolds, C. Lohman: Phys. Rev. 86, 162 (1952); J. M. Lock, A. B. Pippard, D. Schoenberg: Proc. Cambridge Phil. Soc. 47, 811 (1951) 10.14 V. L. Ginzburg, L. D. Landau: Soviet Phys.-JETP (USSR) 20, 1064 (1950) siehe auch V. L. Ginzburg: Nuovo Cimento 2, 1234 (1955) 10.15 A. C. Rose-Innes, E. H. Rhoderick: Introduction to Superconductivity (Pergamon, Oxford 1969) p. 52 10.16 R. Doll, M. Näbauer: Phys. Rev. Lett. 7, 51 (1961) 10.17 B. S. Deaver Jr., W. M. Fairbank: Phys. Rev. Lett. 7, 43 (1961) 10.18 T. Kinsel, E. A. Lynton, B. Serin: Rev. Mod. Phys. 36, 105 (1964) 10.19 J. Schelten, H. Ullmeier, G. Lippmann, W. Schmatz: in Low Temperature Physics – LT 13, Vol. 3, ed. by K. D. Timmerhaus, W. J. O’Sullivan, E. F. Hammel (Plenum, New York 1972) p. 54 10.20 J. G. Bednorz, K. A. Müller: Z. Phys. B 64, 189 (1986) 10.21 M. K. Wu, J. R. Ashburn, C. J. Tornq, P. H. Hor, R. L. Meng, L. Gao, Z. J. Huang, Y. Q. Wang, C. W. Chu: Phys. Rev. Lett. 58, 908 (1987) 10.22 J. R. Cooper, S. D. Obertelli, A. Carrington, J. W. Loran: Phys. Rev. B 44, 12 086 (1991) 10.23 R. Wördenweber: Private Mitteilung (ISI, Forschungszentrum Jülich) 10.24 H. Maeda, Y. Tanaka, M. Fukutomi, T. Asano: Jpn. J. Appl. Phys. Lett. 27, L 209 (1988) 10.25 Z. Z. Sheng, A. M. Hermann: Nature 332, 55 (1988) 10.26 R. Hott, H. Rietschel, M. Sander: Phys. Bl. 48, 355 (1992) 10.27 B. Kabius: Private Mitteilung (IFF, Forschungszentrum Jülich) 10.28 S. J. Hagen, T. W. Jing, Z. Z. Wang, J. Horvath, N. P. Ong: Phys. Rev. B 37, 7928 (1988) 10.29 J. Zaanen, A. T. Paxton, O. Jepsen, O. K. Anderson: Phys. Rev. Lett. 60, 2685 (1988) 10.30 Ching-ping S. Wang: Electronic Structure, Lattice Dynamics, and Magnetic Interactions, in High Temperature Superconductivity, ed. by J. W. Lynn, Graduate Texts Contemp. Phys. (Springer, Berlin Heidelberg 1990) p. 122 10.31 H. Takagi, S. Uchida, Y. Tokura: Phys. Rev. Lett. 62, 1197 (1989) 10.32 Y. Zhang, Y. Tavrin, M. Mück, A. I. Braginski, C. Heiden, T. Elbert, S. Hampson: Physiol. Meas. 14, 113 (1993) 10.33 J. Fink, E. Sohmen: Phys. Bl. 48, 11 (1992) 10.34 C. Politis, V. Buntar, W. Krauss, A. Gurevich: Europhys. Lett. 17, 175 (1992)
Literatur
501
Weiterführende Literatur Buckel, W.: Supraleitung, 4. Aufl. (VCH, Weinheim 1990) De Gennes, P. G.: Superconductivity of Metals and Alloys (Benjamin, New York 1966) Huebener, R. P.: Magnetic Flux Structures in Superconductors, Springer Ser. Solid-State Sci., Vol. 6 (Springer, Berlin Heidelberg 1979) Kuper, Ch. G.: An Introduction to the Theory of Superconductivity (Clarendon, Oxford 1968) Lynn, J. W. (ed.): High Temperature Superconductivity, Graduate Texts Contemp. Phys. (Springer, Berlin Heidelberg 1990) Lynton, E. A.: Superconductivity (Methuen’s Monographs on Physical Subjects, London 1964). (Deutsche Übersetzung: Bibliographisches Institut, Mannheim 1966) Rickayzen, G.: Theory of Superconductivity (Wiley, New York 1965) Rose-Innes, A. C., Rhoderick, E. H.: Introduction to Superconductivity (Pergamon, Braunschweig 1969) Schmidt, V. V. (eds. P. Müller and A. V. Ustinov): The Physics of Superconductors (Springer, Berlin Heidelberg 1997) Stolz, H.: Supraleitung (Vieweg, Braunschweig 1979) Tinkham, M.: Introduction to Superconductivity (McGraw-Hill, New York 1975)
Zu Kapitel 11 Spezielle Literatur 11.1 B. Schrader, W. Meier: Raman/IR Atlas organischer Verbindungen, Bd. 1 (VCH, Weinheim 1974) 11.2 L. H. Henry, J. J. Hopfield: Phys. Rev. Lett. 15, 964 (1965) 11.3 T. P. Martin: Phys. Rev. B 1, 3480 (1970) 11.4 M. Hass, B. W. Henri: J. Phys. Chem. Sol. 23, 1099 (1962) 11.5 G. Frank, E. Kauer, H. Köstlin: Phys. Bl. 34, 106 (1978) 11.6 J. C. Phillips: in Solid State Physics, Vol. 18, ed. by F. Seitz, P. Turnbull (Academic, New York 1966) 11.7 G. W. Gobeli, H. Y. Fan: in Semiconductor Research, 2nd Quarterly Report, Purdue Univ. (1956) 11.8 E. J. Johnson: in Semiconductors and Semimetals, Vol. 3, ed. by R. K. Willardson, A. C. Beer (Academic, New York 1967) p. 171 11.9 H. Ehrenreich, H. R. Philipp: Phys. Rev. 128, 1622 (1962) 11.10 M. D. Sturge: Phys. Rev. 127, 768 (1962) 11.11 H. Lüth: Solid Surfaces, Interfaces and Thin Films, 4th edn. (Springer, Berlin Heidelberg New York 2001) 11.12 J. Geiger, K. Wittmaack: Z. Phys. 195, 44 (1966) 11.13 H. Ibach: Phys. Rev. Lett. 24, 1416 (1970)
502
Literatur
Weiterführende Literatur Abeles, F. (ed.): International Colloquium on Optical Properties and Electronic Structure of Metals and Alloys (North-Holland, Amsterdam 1966) Cho, K. (ed.): Excitons, Topics Curr. Phys., Vol. 14 (Springer, Berlin Heidelberg 1979) Fröhlich, H.: Theory of Dielectrics (Clarendon, Oxford 1958) Geiger, J.: Elektronen und Festkörper (Vieweg, Braunschweig 1968) Greenaway, D. L., Harbeke, G.: Optical Properties and Band Structure of Semiconductors (Pergamon, Oxford 1968) Haken, H., Nikitine, S. (eds.): Excitons at High Densities, Springer Tracts Mod. Phys., Vol. 73 (Springer, Berlin Heidelberg 1975) Mitra, S. S., Nudelman, S. (eds.): Far Infrared Properties of Solids (Plenum, New York London 1970) Nakajima, S., Toyozawa, Y., Abe, R.: The Physics of Elementary Excitations, Springer Ser. Solid-State Sci., Vol. 12 (Springer, Berlin Heidelberg 1980) Nudelman, S., Mitra, S. S. (eds.): Optical Properties of Solids (Plenum, New York 1969) Willardson, R. K., Beer, A. C. (eds.): Semiconductors and Semimetals, Vol. 3, Optical Properties of III–V-Compounds (Academic, New York 1968)
Zu Kapitel 12 Spezielle Literatur 12.1 J. R. Chelikowsky, M. L. Cohen: Phys. Rev. B 14, 556 (1976) 12.2 J. H. Reuszer, P. Fischer: Phys. Rev. 135, A 1125 (1964) 12.3 E. M. Conwell: Proc. IRE 40, 1327 (1952) 12.4 S. M. Sze: Physics of Semiconductor Devices, 2nd edn. (Wiley, New York 1969) 12.5 B. Gelmont, K. Kim, M. Shur: J. Appl. Phys. 74, 1818 (1993) 12.6 H. Lüth: Solid Surfaces, Interfaces and Thin Films, 4th edn. (Springer, Berlin Heidelberg 2001) 12.7 G. Margaritondo, P. Perfetti: The Problem of Heterojunction Band Discontinuities, in Heterojunction Band Discontinuities, Physics and Device Applications, ed. by F. Capasso, G. Margaritondo (North-Holland, Amsterdam 1987) p. 59 12.8 H. Morkoç: Modulation-doped AlxGa1–xAs/GaAs Heterostructures, in The Technology and Physics of Molecular Beam Epitaxy, ed. by E. H. C. Parker (Plenum, New York 1985) p. 185
Literatur
12.9 12.10 12.11 12.12 12.13 12.14 12.15
12.16
503
L. Esaki: Compositional Superlattices, in The Technology and Physics of Molecular Beam Epitaxy, ed. by E. H. C. Parker (Plenum, New York 1985) p. 185 A. Förster: Private Mitteilung (ISI, Forschungszentrum Jülich) H. Heinecke, K. Werner, M. Weyers, H. Lüth, P. Balk: J. Crystal Growth 81, 270 (1987) F. Capasso (ed.): Physics of Quantum Electron Devices, Springer Ser. Electron. Photon., Vol. 28 (Springer, Berlin Heidelberg 1989) U. Tietze, Ch. Schenk: Halbleiterschaltungstechnik (Springer, Berlin Heidelberg 1983) K. Schimpf, M. Sommer, M. Horstmann, M. Hollfelder, A. van der Hart, M. Marso, P. Kordos, H. Lüth: IEEE Electron Device Letters 18, 144 (1997) H.-M. Mühlhoff, D.V. McCaughan: MOS Transistors and Memories, in Handbook of Semiconductors, Vol. 4, ed. by T.S. Moss, C. Hilsum (North-Holland, Amsterdam 1993) p. 265 H. Kressel, D.E. Ackley: Semiconductor Lasers, in Handbook of Semiconductors, Vol. 4, ed. by T.S. Moss, C. Hilsum (North Holland, Amsterdam 1993) p. 725
Weiterführende Literatur Allan, G., Bastard, G., Boccara, N., Lanoo, M., Voos, M. (eds.): Heterojunctions and Semiconductor Superlattices (Springer, Berlin Heidelberg 1986) Bauer, G., Kuchar, F., Heinrich, H. (eds.): Two-dimensional Systems: Physics and New Devices, Springer Ser. Solid-State Sci., Vol. 67 (Springer, Berlin Heidelberg 1986) Brauer, W., Streitwolf, H. W.: Theoretische Grundlagen der Halbleiterphysik (Akademie-Verlag, Berlin 1976) Buchreihe: Halbleiter-Elektronik, Bd. 1–20, ed. by W. v. Heywang, R. Müller (Springer, Berlin Heidelberg) Capasso, F., Margaritondo, G. (eds.): Heterojunction Band Discontinuities, Physics and Device Applications (North-Holland, Amsterdam 1987) Chang, L. L., Ploog, K. (eds.): Molecular Beam Epitaxy and Heterostructures, NATO ASI Ser. E, No. 87 (Martinus Nijhoff, Dordrecht 1985) Kelly, M.J.: Low-Dimensional Semiconductors, Materials, Physics, Technology, Devices (Clarendon Press, Oxford 1995) Lanoo, M., Bourgoin, J.: Point Defects in Semiconductors I and II, Springer Ser. Solid-State Sci., Vols. 22, 35 (Springer, Berlin Heidelberg 1981, 1983) Madelung, O.: Grundlagen der Halbleiterphysik, Heidelberger Taschenbuch, Bd. 71 (Springer, Berlin Heidelberg 1970)
504
Literatur
Nizzoli, F., Rieder, K.-H., Willis, R. F. (eds.): Dynamical Phenomena at Surfaces, Interfaces and Superlattices, Springer Ser. Surf. Sci., Vol 3 (Springer, Berlin Heidelberg 1985) Parker, E. H. C. (ed.): The Technology and Physics of Molecular Beam Epitaxy (Plenum, New York 1985) Reggiani, L. (ed.) Hot-Electron Transport in Semiconductors, Topics Appl. Phys., Vol. 58 (Springer, Berlin Heidelberg 1985) Seeger, K.: Semiconductor Physics, 4th edn., Springer Ser. SolidState Sci., Vol. 40 (Springer, Berlin Heidelberg 1988) Shklovskii, B., Efros, A. L.: Electronic Properties of Doped Semiconductors, Springer Ser. Solid-State Sci., Vol. 45 (Springer, Berlin Heidelberg 1984) Shockley, W.: Electrons and Holes in Semiconductors (Van Nostrand, Princeton 1950) Spenke, E.: Elektronische Halbleiter (Springer, Berlin Heidelberg 1965) Sze, S. M.: Physics of Semiconductor Devices, 2nd edn. (Wiley, New York 1969) Ueta, M., Kanzaki, H., Kobayashi, K., Toyozawa, Y., Hanamura, E.: Excitonic Processes in Solids, Springer Ser. Solid-State Sci., Vol. 60 (Springer, Berlin Heidelberg 1986)
Sachverzeichnis
Absolute Thermokraft 258 Absorption elektromagnetischer Strahlung 364 ff. Absorptionskonstante 366 Adiabatische Entmagnetisierung 130 – Näherung 81, 135 Aharonov-Bohm-Effekt 270 Akustischer Zweig 86 Akzeptoren 413 ff. Altshuler-Aronov-Spivak-Oszillationen 273 Amorphe Materialien, elektrische Leitfähigkeit 261 – Paarkoorelationsfunktion 55 – Wärmeleitfähigkeit 127 – Zustandsdichte 179 Anharmonische Effekte 119 Anisotropie, magnetische 230 Anomale Absorption 77 – Transmission 77 Anregungsspektrum, Ferromagnet 217 – Supraleiter 309 Antibindendes Orbital 6 Antiferromagnetismus 210 ff. Anti-Stokes-Linien 106, 230 Antisymmetrisierung 198 ARUPS (Angle Resolved Ultraviolett Photoemission Spectroscopy) 185 Atomfaktor (Atomformfaktor) 55, 65 Atomstrahlen 67, 73 Ausgangskennlinie 458 Austauschanisotropie 231 Austauschaufspaltung 201 Austauschloch 200 Austauschwechselwirkung 195 ff Austrittsarbeit 152 – Tabelle 155 Bahndrehimpuls 191 Ballistischer Transport 266 Bandaufspaltung 167 Banddiskontinuität 444 Bänderschema 163 ff Bandlücken von Halbleitern 412, 443 Bandstrukturen 173, 405 Basis, Kristallstruktur 25 – Transistor 457 Basisvektoren 23 Baugruppe (Basis) 25
BCS-Anregungsspektrum 309 ff. BCS-Grundzustand 299 ff. – Kohärenz 322 ff. BCS-Theorie 299 ff. Beersches Gesetz 366, 369 Besetzungsinversion 466 Beugungsexperimente 72 Beugungstheorie 51 ff. Beweglichkeit, Halbleiter 422 – Metalle 250 Beweglichkeitskante 261 Bewegung von Ladungsträgern und Transportphänomene 233 ff. Bewegungsgleichungen, Atome 85 ff. – Elektronen 237 Bindendes Orbital 6 Bipolartransistor 456 ff. Blochsches Theorem 161 Blochsches T2/3-Gesetz 218 Bloch-Wand 221 Bloch-Wellen 161 ff. Bogoliubov-Gleichungen 312 ff. Bohrsches Magneton 190 Boltzmann-Gleichung 124, 246 Bose-Statistik 116 Bottom-up Verfahren 490 Braggsche Gleichung 62 Bragg-Williams Näherung 40 Bravais-Gitter 24 Brechzahl 366 Brillouin-Streuung 91, 108 Brillouin-Zone 63, 88, 163 Burgersvektor 47 C60 8 Cäsiumchlorid-Struktur 9 Chemische Bindung 4 ff. Chemisches Potential, Elektronen 143 – Legierungen 42 Clausius-Mossotti-Beziehung 378 Cluster (Clusterrechnungen) 181 Cooper-Paare 294 ff. – Tunneln 356 – Wellenfunktion 294 ff. Coulomb-Potential 10 – abgeschirmtes 151 Curie-Temperatur 202, 206, 379 Curie-Weiss Gesetz 207
Damon-Eshbach Wellen 227 Darstellung einer Gruppe 29 De Broglie Wellenlänge, Teilchen 67 De Haas-van Alphen-Effekt 284 Debyesche Abschneidefrequenz 117 Debye-Scherrer Verfahren 69 Debyesches Modell der spez. Wärme 117 Debye-Temperaturen, Tabelle 118 Debye-Waller Faktor 104 Defekte 46 Defektelektronen, Löcher 238, 406 Dehnungstensor 94 d-Elektronen 13, 34, 149, 176, 305 Depolarisationsfeld 230 Diamagnetismus 190, 194 Diamantstruktur 35 Dielektrische Eigenschaften 361 ff. – Energieverluste von Elektronen 390 ff. – Funktion 361 ff – Suszeptibilität 363 Diffusionslänge 437 Diffusionsspannung 432 Diffusionsstromnäherung 436 Diffusiver Transport 266 Dipolwechselwirkung 16, 376 Direkte Übergänge 365, 367 Dispersionsrelation 85 f. Domänen, magnetische 218, 221 Donatoren 413 Doppelheterostrukturlaser 468 Dotierte Halbleiter 412 ff. Dotierungsübergitter 453 Drain (Abflusskontakt) 460 Drehachse 25 Drehinversionsachse 26 Drehkristallverfahren 69 Dreiachsenspektrometer 75 III-V-Halbleiter 407 Driftgeschwindigkeit 425 ff. Drude-Leitfähigkeit 248, 251 Dynamik von Atomen 81 ff. Dynamische Matrix 84 – Streutheorie 52 Effektive Bandlücke 454 – Ionenladung 367 – Masse, Definition 237
506 – – Tabellen für Halbleiter 406, 408 – Zustandsdichte 411 Eigenschwingungen eines Moleküls 30 Einelektronennäherung 136 ff., 242 Einstein-Beziehung 431 Elastische Energiedichte 95, 104 Elastische Isotropie 101 Elastische Konstanten 98 – Module 95 – – Tabelle für kubische Kristalle 101 Elastische Streuung, Kinematik 53 – – von Elektronen in Bändern 243 Electrical confinement 469 Elektrische Leitfähigkeit, amorphe Materialien 261 – – Halbleiter 421 ff. – – Metalle 250 ff. Elektrische Suszeptibilität 105, 363 Elektronen, de Broglie Wellenlänge 67 Elektronenaffinität 9, 444 Elektronen-Energieverlustspektroskopie 390 ff. Elektronennegativität 11 Elektronische Bandstruktur 159 ff. Elektronisches Bänderschema, quasifreie Elektronen 166 – – stark gebundene Elektronen 168 Elementarzelle 22, 73 Emitter 457 Emittereffizienz 459 Energielücke, amorphe Materialien 180 – Halbleiter 176, 403 ff. – – Tabellen 386, 404, 410 Entartung und Gruppentheorie 29 Entropie einer Mischung 40 Epitaxie 443, 454, 482 Erschöpfung von Akzeptoren und Donatoren 419 ESCA (Electron Spectroscopy for Chemical Analysis) 185 Ewald-Kugel (Konstruktion) 60 Exchange bias 231 Exzitonen 389 Fabry-Pérot-Interferometer 108, 228 Feinstrukturkonstante 480 Feldeffekt Transistor 460 ff. Fermi-Energie, Definition 140 Fermi-Fläche 177, 284 Fermi-Gas 140 ff. Fermi-Kugel 141, 242, 249, 299 Fermi-Niveau, Definition 140 – Bauelemente 451, 467 – Funktion der Temperatur 420 – Heterostrukturen 436, 441, 444 – pinning 431, 462
Sachverzeichnis
– p-n Übergang 436 – verschiedene Dotierung 414 Fermi-Verteilung 144 Ferroelektrika 378 Ferromagnetismus 200 ff. Feste Randbedingungen 137 FET (Field Effect Transistor) 460 ff. Flussquant 272 Flussquantisierung 327 ff. Flussschläuche 336 Flusswirbel 336 ff. Fluxoid 328 Formanisotropie 230 Fourier-Spektroskopie 400 Fourier-Transformation 53, 400 Freie Energie, harmonischer Oszillator 121 – – Legierungen 40 – – Punktdefekte 47 Freie Weglänge 265 Freies Elektronengas 136 ff., 379 – zweidimensionales 448, 451 Frenkel-Defekt 46 – Exzitonen 390 Friedelsche Regel 59 Fröhlich-Wechselwirkung 294 Frustrierte Totalreflexion 401 Gate (Tor) 460 Gemischter Zustand 335 Generationsstrom 434 Ginzburg-Landau-Theorie 334 Gitterdeformation 48, 294 Gitterdynamik 81 ff. Glühemission 152 GMR-Effekt 232 Grenzflächenanisotropie 231 Grenzflächenenergie (Supraleitung) 333 Grenzflächenzustände 441 Grüneisen-Formel 254 Grüneisen-Zahl 122 Gruppengeschwindigkeit 103, 124, 236 Halbleiter 7, 176, 403 ff. – Bauelemente 456 ff. – Epitaxie 482 – Heterostrukturen 443 ff. – Heteroübergang 446 ff. – Laser 464 ff. – Übergitter 448 Hall-Effekt 421, 473 ff. – Quanten 477 Harmonische Näherung 84 Harmonischer Oszillator 111, 367 Hebelgesetz der Zustandsdiagramme 43 Heisenberg Operator 197, 215, 222 HEMT (High Electron Mobility Transistor) 461 ff.
He-Streuung 74 Heterobipolartransistor 459 Heterostruktur-FET 460 ff. Hexagonal dichteste Kugelpackung 32 H+2 , H2 Molekül 4, 195 Hochfeldbeweglichkeit 425 ff. Hochtemperatur-Supraleiter 338 ff. Hopping Leitfähigkeit 262 Hysteres 219, 232 Idealer Leiter 290 Impulserhaltung, Lichtabsorption 385 – Photoemission 186 – Raman Effekt 105 – Streuung 90 – Unschärfe eines Cooper-Paares 323 Indirekte Halbleiter 404 – Übergänge 385 Inelastische Streuung 90 – – von Elektronen in Bändern 249 Inelastisches Tunneln 354 Infrarot-aktives Phonon 89, 367 Infrarot-Spektroskopie 373, 399 Innere Energie, freies Elektronengas 142 – – harmonischer Festkörper 116 – – Legierungen 40 Instabilität des Fermi-Sees 294 Interband-Übergänge 382 ff. Intrinsische Halbleiter 408 ff. Inversion 25 – Ladungsträger 395, 466 Ionenbindung 9 ff. Ionisierungsenergie 9 – Akzeptoren, Donatoren 414 – – Tabellen 415, 416 irreduzible Darstellung 29 Isotopeneffekt, Supraleiter 318 Isotropie, elastische 101 Josephson-Effekt 356 ff. Josephson-Kontakt 356 Kanal 460 Kennlinie, Diode 153, 435 Kinematische Beugungstheorie (Streutheorie) 52 Koerzitivfeldstärke 219 Kohärenz, BCS-Grundzustand 322 ff. Kohärenzlänge, Cooper-Paar 322 ff. Kollektor 457 Kombinierte Zustandsdichte 385 Kompositionsübergitter 449 Kondensationsenergiedichte (Supraleitung) 305 Kondo-Effekt 256 Koordinationszahl 32 Kopplungskonstante 83 Kopplungspotential des Supraleiters 312
Sachverzeichnis Kovalente Bindung 4 ff. Kramers-Kronig-Relationen 364 Kristallanisotropie 218 ff. Kristallklassen 27 Kristallstrukturen 21 ff. Kritische Magnetfeldstärke 292, 321, 326, 335 Kritische Punkte, Bandstruktur 178, 386 Kritischer Exponent 206 Kritischer Strom, Supraleitung 318 ff. Kubisch flächenzentrierte Struktur 32 – raumzentrierte Struktur 33 Ladungsträgerkonzentration, Halbleiter 408 ff., 416 ff. Landau-Niveaus 283 Laserbedingung 466 Laue-Bedingung 52 Laue-Verfahren 69 Lawinendurchbruch 426 LCAO-Methode 168 LEED (Low Energy Electron Diffraction) 72 Leitfähigkeit (elektrisch), amorphe Materialien 261 – Halbleiter 408, 421 ff. – Metalle 250 Leitfähigkeit (Wärme), Elektronen 260 – Phononen 123 ff. Leitfähigkeitsquantum 269, 277, 481 Leitungsband 403 Lichtquellen 397 Lift-off Verfahren 489 f. Lineare zweiatomige Kette 85 Linearer Ausdehnungskoeffizient 120 Liniendefekte 47 Liquidus Kurve 38 Lithografie 488 Löcher 240, 406 Lokales Feld 375 ff. London-Gleichungen 292 – Eindringtiefe 293 Longitudinale effektive Masse – Wellen, elastische 93 – Wellen, dielektrische 370 Lorenz-Zahl 260 Lücke 2D 306 Lückenenergie (Supraleitung) 304, 314 ff. Lyddane-Sachs-Teller-Relation 372 Madelung-Konstante 11 Magnetische Anisotropie 230 Magnetische Flussquanten 328 – Flussschläuche 336 ff. Magnetische Suszeptibilität, Atome 192
507
– – Antiferromagnet 212 – – freies Elektronengas 194 – – von Supraleitern 336 Magnetisches Dipolmoment 190 Magnetisierung, Definition 190 – Antiferromagnet 210 – Ferromagnet 206 ff., 219 Magnetisierungskurve (Supraleitung) 335 Magnetismus 189 ff. Majoritätsladungsträger 429 Massentensor, effektive Masse 237 Massenwirkungsgesetz, Ladungsträger 411, 417 Matthiesensche Regel 254 MBE (Molecular Beam Epitaxy) 443, 483 Meissner-Ochsenfeld Effekt 291, 293, 322 ff. Meissner-Phase 335 ff. MESFET (Metal Semiconductor Field Effect Transistor) 461 ff. Metall-Halbleiter Kontakt 440 ff. Metallische Bindung 13 Metallorganische Gasphasenepitaxie (MOCVD) 485 Metallorganische Molekularstrahlepitaxie (MOMBE) 487 Mikrobrücke 356 Millersche Indizes 60 Minoritätsladungsträger 430 Mischungsentropie 40 Mischungslücke 38 MOCVD (Metal Organic Chemical Vapor Deposition) 485 Modulationsdotierung 447 Moiré-Topographie 78 Molekularfeldnäherung, Legierungen 40 –, Magnetismus 208 Molekularstrahlepitaxie (MBE) 483 Molekülorbital 5 MOSFET (Metal Oxide Semiconductor Field Effect Transistor) 460 ff. Mott-Relation (Leitfähigkeit amorpher Festkörper) 264 Mott-Übergang 151 Mott-Wannier-Exzitonen 390 Multiphononprozesse 119, 126 Natriumchloridstruktur 9 Néel-Temperatur 211 Neél-Wand 221 Nernst-Kalorimeter 130 Netzebenen 60 Neutralitätsbedingung 417 Neutralitätsniveau 440 Neutronen, Broglie Wellenlänge Neutronenbeugung 74
67
Nichtentartete Halbleiter nipi-Übergitter 454 Normalprozess 126
411
Oberflächenphononen 104 Oberflächenstrukturanalyse 72 ff. Oberflächenwellen, dielektrische 372 Optical confinement 468 Optischer Zweig 87 Orbital 4 ff. Oszillationen, de Haas-van Alphen 285 –, Shubnikov-de Haas 477 Oszillator, harmonischer 111, 367 Paarkorrelationsfunktion 55 Paarwellenfunktion von Cooper-Paaren 324 Paramagnetismus, freie Elektronen 194 Parität 29 Partialversetzung 48 Patterson-Funktion 54 Pauli-Matrizen 214 – Paramagnetismus 194 – Prinzip 136, 195 Peltier-Effekt 259 Periodensystem 1 ff. Periodische Randbedingungen 112, 139 – Strukturen 21 ff. Permalloy 219 Phasen 36 Phasendiagramme 38 Phasenkohärenzlänge 265 Phononen 81 ff., 88, – Austausch 295 – -Elektron Streuung 254 – Spektroskopie 89 – Zerfall 124 Photoemissionsspektroskopie 185 Photolack 488 f. Photolumineszenz 452 Plasmonen 380, 392 p-n Übergang 427 ff. Poisson-Gleichung 432 – -Zahl 102 Polarisation, dielektrische 367, 370 Polarisationskatastrophe 378 Polaritonen 371 Potentialkastenmodell, Metalle 136 Pulvermethode 68 Punktdefekte 46 Punktgruppen 27 Punktgruppensymbole nach Schönflies 28 Punktsymmetrie 25
508 Quanten-Hall-Effekt 477 Quantenoszillationen 270 ff, 277, 477 Quantentöpfe 448 Quantentopf-Laser 469 Quantentransport 264 Quantisierung des magnetischen Flusses 327 ff. Quasielektronen 311 Quasi-Ferminiveau 436 Quasiharmonische Näherung 121 Quasiimpuls 90 –, Erhaltung 90 Quasilöcher 311 Quasiteilchen 311 Raman-aktives Phonon 107 – Spektroskopie 105 f. – Streuung 91 – Streuung an Spinwellen 228 Randkanal (edge channel) 479 Raumladungskapazität 439 Raumladungszone 429 Rayleigh-Streuung 106 Reaktives Ionenätzen (RIE) 489 Reduktion auf 1. Brillouin-Zone 163 Reflexionsvermögen 365, 374 f. Rehybridisierung 7 Rekombination, Elektronen und Löcher 453 –, induzierte 465 –, spontane 465 Rekombinationsstrom 434 Relaxationszeit 125, 247 Remanenz 219 Resonanzfrequenz 367 Resonanz-Raman-Streuung 108 Reststrahlen (Reststrahlbande) 375 Restwiderstand 255 Reziprokes Gitter 56 ff. RHEED (Reflection High Energy Electron Diffraction) 484 Richardson-Dushman-Formel 154 Riesenmagnetowiderstand 232 Ritzsches Verfahren 169 Röntgenbeugung 66 Röntgeninterferometer 77 Röntgentopographie 78 Sättigungsgeschwindigkeit 426 ff. Schalen 2 Schallwellen 93, 98 Schönflies-Symbole 28 Schottky-Barriere 441 ff. Schottky-Kontakt 440 ff. Schottky-Modell der Raumladungszone 427 ff., 434 Schraubenversetzung 47 Schwache Lokalisierung 274 ff. Schwellstromdichte 467
Sachverzeichnis
Seebeck-Effekt 259 Shubnikov-de Haas Oszillationen 477 Shubnikov-Phase 335 Sine-Gordon Gleichung 223 Singulett-Zustand 196 Slater-Determinante 324 Solidus Kurve 38 Source (Quellkontakt) 460 Spannungen, mechanische 96 Sperrrichtung (Sperrstrom) 435 Spezifische Wärme, freies Elektronengas 145 ff. – – , Phononenbeitrag 116 ff. – – von Supraleitern 288 sp2-Hybridisierung 7 ff. sp3-Hybridisierung 7 Spiegelung 25 Spin-Bahnaufspaltung 406 Spin-Bahn Kopplung 218, 230 Spinoperator 197, 208, 213, 401 Spinventil 233 Spinwellen 214 –, magnetostatische 226 ff. Spontane Emission 465 Sprungtemperatur (Supraleitung) 281, 317, 339, 341 SQUID (Superconducting Quantum Interference Device) 359 Steilheit 459, 463 Stereographische Projektion 27 Stimulierte Emission 465 Stokes-Linien 106, 228 Stoner-Kriterium 202 – Lücke 205, 217 – Wohlfarth Modell 200 ff. Störstellen in Halbleitern 412 ff. Störstellenerschöpfung 419 Störstellenreserve 419 Strahlungsarten 66 Streubedingung, Kristalle 58 Streudichte 53 Streukinematik 52 Streuung, Elektron-Elektron 242 – Elektron-Phonon 242, 253, 423 – Elektron-Störstellen 242, 253, 423 – in Bändern 242 Streuvektor 53 Stromverstärkung 459 Strukturanalyse 51 ff., 68 Strukturfaktor – amorphe Materialien 55 – flüssige Phasen 55 – Kristalle 64 ff. Stufenversetzung 47 Subbänder 267, 451 Substitutionslegierung 37 Supraleiter 286 ff. – Elemente 288 – oxidische 338 ff.
– zweiter Art 330 ff. Supraleitung 286 ff. – Kopplungskonstante 317 Suprastrom 287, 318 ff. Symmetrie 28 Symmetriepunkte, Brillouinzone Synchrotronstrahlung 407
53
T 3-Gesetz, spez. Wärme 118 T 3/2-Gesetz, Magnetisierung 218 Thermische Ausdehnung 120 ff. – Eigenschaften des Festkörpers 111 ff. – Energie des Festkörpers 116 Thermoelektrische Effekte 256 ff. Thomas-Fermi-Abschirmlänge 151 Tieftemperaturexperimente 130 Totalreflexion 375, 401 Transistor, bipolarer 456 – Feldeffekt 460 Translationsgitter 22 ff. Tranlationsinvarianz 160 Transportkoeffizienten, allgemeine 258 Transportphänomene 235 ff. Transversale effektive Masse 416 – Wellen, elastische 98 – Wellen, dielektrische 370 Triplett-Zustand 196 Tunnelbarriere 351 – Prozesse 262, 349 – Spektroskopie 354 Tunneln, Cooper-Paare 356 – Einzelelektronen 349 Übergitter 443 ff. Überlapp, Wellenfunktion 5, 171, 196 Überstruktur 72 Übertragungskennlinie 458 UHV-Technik (Ultrahochvakuum) 72, 483 – Anlage 483 Umklappprozesse 127 Universelle Leitfähigkeitsfluktuationen 276 UPS (Ultraviolett Photoemission Spectroscopy) 185 Valenzband 403 Van der Waals-Bindung 15 Van Hove-Singularität 114, 178, 386 Verbotenes Band 167, 172, 176, 404 Versetzungen 47 Vielelektronentheorie 189 Virtuelle Phononen 295 Voigtsche Notation 96 Volumenausdehnungskoeffizient 120
Sachverzeichnis Wärmeleitfähigkeit, Elektronen 260 – Phononen 123 ff. Wärmeschutzfenster 381 Wasserstoffbrückenbindung 14 Wasserstoffmodell 413 Wasserstoffmolekülion 4 Weissenberg-Verfahren 69 Wellenpaket 124, 236 Wiedemann-Franz-Gesetz 260 Wigner-Seitz-Zelle 63 Wurtzitstruktur 35
509
XPS (X-ray Photoemission Spectroscopy) 185 Young Modul
102
Zähligkeit einer Drehachse 25 Zinkblendegitter 35 Zonenreinigung 45 Zustandsdichte (Elektronen), amorphe Materialien 180 – Ferromagnete 205
– freies Elektronengas 138 – lokalisierte Elektronen 262 – Kristalle 170 Zustandsdichte (Phononen) 113 Zweidimensionales Elektronengas 450 Zweiflüssigkeitsmodell des Supraleiters 314 Zyklotronfrequenz 283, 475 Zyklotronresonanz 475