Gerd Fischer Lehrbuch der Algebra
Gerd Fischer
Lehrbuch der Algebra Mit lebendigen Beispielen, ausführlichen Erläuterungen und zahlreichen Bildern 2., überarbeitete Auflage STUDIUM
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
Prof. Dr. Gerd Fischer TU München Zentrum Mathematik (M10) Boltzmannstr. 3 85748 Garching
[email protected] 1. Auflage 2008 2., überarbeitete Auflage 2011 Alle Rechte vorbehalten © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011 Lektorat: Ulrike Schmickler-Hirzebruch | Barbara Gerlach Vieweg+Teubner Verlag ist eine Marke von Springer Fachmedien. Springer Fachmedien ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.viewegteubner.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: KünkelLopka Medienentwicklung, Heidelberg Druck und buchbinderische Verarbeitung: STRAUSS GMBH, Mörlenbach Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Printed in Germany ISBN 978-3-8348-1249-0
Grau, teurer Freund, ist alle Theorie, und grün des Lebens goldner Baum.
MEPHISTOPHELES zum SCHÜLER
Vorwort
Der vorliegende Text ist ein einführendes Lese- und Lernbuch für Studierende, die sich nach dem Studium der Linearen Algebra erstmals mit grundlegenden Problemen, Methoden und Ergebnissen der höheren Algebra vertraut machen möchten. Der Titel steht beim Vieweg-Verlag in einer alten Tradition: ab 1896 erschien das dreibändige Werk Lehrbuch der Algebra von H. Weber, 1924 folgten zwei Bände mit dem gleichen Titel von R. Fricke, aber mit einer ganz anderen Intention. In den beiden klassischen Werken wurde versucht, möglichst umfassend den damaligen Stand der Algebra zu vermitteln. Die Darstellung der Algebra hat sich seit Weber und Fricke stark verändert. Durch das Programm von Hilbert ist das axiomatische Gerüst ausgeprägt worden; die grundlegenden Vorlesungen in diesem Stil von Emil Artin und Emmy Noether waren die Quellen für die 1930 erstmals veröentlichte Moderne Algebra von van der Waerden, sie haben alle seither erschienenen Bücher über Algebra geprägt. Durch die Axiomatik wird die Darstellung klarer, Beweise werden einfacher und durchsichtiger. Aber für Studierende besteht die Gefahr, die zahllosen hinter dem klaren Gerüst verborgenen konkreten Situationen nicht genügend kennen zu lernen. Dazu sei erinnert an die Arbeiten von C.F. Gauss: Hier gab es keinen der abstrakten Begrie wie Gruppe, Ring oder Körper; es wurden viele ranierte Überlegungen und Berechnungen durchgeführt, deren Ergebnisse später elegante Formulierungen im abstrakten Rahmen gefunden haben. In diesem Buch kann und soll die Zeit nicht zurückgedreht werden. Aber es wird versucht, durch sehr viele konkrete Beispiele die Bodenhaftung der Studierenden zu erhalten. In dieser Absicht beschreiben wir ausführlich die Symmetrien der Platonischen Körper als Illustration der Beziehungen zwischen Gruppen und Geometrie, quadratische Zahlringe zur Erläuterung der subtilen Teilbarkeitseigenschaften in Ringen und von Gauss gefundene Formeln zur Darstellung von Einheitswurzeln aus der Sicht der Körpererweiterungen. In einer einführenden Vorlesung verbleibt kaum Zeit zur Behandlung all dieser Themen; die Studierenden erhalten die Möglichkeit, solche zur Vertiefung des Verständnisses wichtige Ergänzungen hier nachzulesen. Auÿerdem enthält dieser Text für ein Buch über Algebra ungewöhnlich viele Bilder. Dazu sei erinnert, dass die Algebra ein hervorragendes
VI Werkzeug für die Geometrie ist, und dass vor der Entwicklung einer guten Symbolik für die Buchstabenrechnung viele algebraische Beweise geometrisch geführt wurden. Die zahlreichen Veränderungen der letzten Jahre in den Studiengängen haben sich mittlerweile etwas stabilisiert; dieses Buch versucht, darauf Rücksicht zu nehmen. Der gesamte Inhalt ist für eine zweisemestrige einführende Vorlesung ausgelegt, die nur Kenntnisse aus der Linearen Algebra voraussetzt und ab dem dritten Studiensemester besucht werden kann. In vielen Studiengängen ist nur eine einsemestrige Einführung in die Algebra vorgesehen. Daher sind einige Paragraphen und Abschnitte mit einem Stern ∗ versehen: man kann sie beim ersten Durchgang weglassen, und eventuell im zweiten Semester nachholen. Insbesondere ist dadurch ein Minimalkanon für den Bachelor vorgeschlagen. Ganz besonders Studierende für das Lehramt können durch geeignete Auswahl aus dem Inhalt eine solide und nicht zu abstrakte Grundlage für die spätere Tätigkeit erhalten und das Buch dann als Nachschlagewerk nutzen. In dieser Einführung soll nur die relativ klassische Algebra behandelt werden, Höhepunkte sind die Ergebnisse über die Lösbarkeit von Polynomgleichungen; dieser Teil der Algebra kam im 19. Jahrhundert - abgesehen von der Darstellung zu einem Abschluss. Einen sehr guten Eindruck von dem langen Weg dorthin seit den Wurzeln in der Antike vermittelt der historische Text von van der Waerden [vdW2 ]. Die anschlieÿende Entwicklung der Algebra im 20. Jahrhundert war rasant, vor allem in Richtung der algebraischen Geometrie und der Zahlentheorie; zwischen beiden wurden innige Zusammenhänge entdeckt, ein Höhepunkt war die Lösung des Problems von Fermat im Jahr 1993. All das muss fortgeschrittenen Vorlesungen und weiterführenden Büchern vorbehalten bleiben; einen knappen historischen Abriss über das vergangene Jahrhundert ndet man bei [Mi]. Wie überall in der Mathematik setzt das Studium der neueren Entwicklungen eine solide Kenntnis der klassischen Methoden voraus. Die Gliederung des Inhalts folgt der üblichen Systematik Gruppen, Ringe, Körper, dadurch wird das logische Gerüst deutlich und die Darstellung vereinfacht. Zur Erhöhung der Motivation beim Lernen kann man getrost davon abweichen: Man kann ganz hinten anfangen mit den geometrischen Konstruktionen und die zunehmend komplexeren algebraischen Hilfsmittel nach Bedarf nachlesen. Wenn man mit dem Paragraphen über die Lösungen von Polynomgleichungen anfängt, wird man feststellen, dass die wesentlichen zuvor entwickelten Techniken über Gruppen, Ringe und Körper benötigt werden. In den zahlreichen Beispielen sind nicht immer alle Einzelheiten ausgeführt; da verbleiben viele kleinere und gröÿere Übungsaufgaben. An der Darstellung der grundlegenden Ergebnisse der Algebra ist von vielen Autoren gefeilt worden. Es gibt zahllose Tricks, deren Urheber kaum noch festzustellen sind; man kann sie schon als Folklore bezeichnen. Im Literaturverzeichnis sind Bücher aufgeführt, aus denen ich gelernt habe, auÿerdem zahlreiche Texte für weiterführende Lektüre. Aus den Werken von C.F. Gauss sind einige Stellen im Faksimile abgedruckt, in der Honung, die Neugier des Lesers auf diese einmaligen
VII Texte zu wecken. Mein Dank gilt den Studierenden der TU-München für viele kritische Bemerkungen, und vor allem Reinhard Sacher, dem Coautor unseres gemeinsamen Buches Einführung in die Algebra [F-S]; aus diesem alten Text ist vieles übernommen worden. Sowie Florian Quiring, der vier Semester lang Übungen zur Vorlesung betreut und viele wertvolle Details beigesteuert hat. Brigitte Singhof hat mit groÿer Präzision und persönlichem Einsatz die druckfertige TEX-Vorlage erstellt, Ulrike Schmickler-Hirzebruch hat das Projekt vom Verlag begleitet und vorangetrieben. Trotz sorgfältiger Suche nach Dreckfuhlern und mathematischen Irrtümern werden wohl einige verblieben sein. Daher möchte ich alle Leser bitten, mir Fundstellen mitzuteilen, am einfachsten an g
[email protected] Wir haben unter http://www-m10.ma.tum.de/∼GerdFischer eine Seite mit Kommentaren und Verbesserungen eingerichtet. München, im November 2007
Gerd Fischer
Auf meine Bitte an die Leser habe ich zahlreiche Antworten erhalten, für die ich mich hier noch einmal bedanken möchte. Die Hinweise habe ich in die vorliegende 2. Auage eingearbeitet. Darüber hinaus wurden einige Ergänzungen aufgenommen, etwa eine Beschreibung des RSA-Kryptosystems. München, im Mai 2011
Gerd Fischer
Inhaltsverzeichnis
I
Gruppen 1 Halbgruppen, Gruppen und Untergruppen . . . . . . . . . . 1.1 Innere Verknüpfungen und Halbgruppen . . . . . . . 1.2 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Denition einer Gruppe . . . . . . . . . . . . . . . . 1.4 Abschwächung der Gruppenaxiome . . . . . . . . . . 1.5 Translationen und Kürzungsregeln . . . . . . . . . . 1.6 Denition einer Untergruppe . . . . . . . . . . . . . 1.7 Erzeugung von Untergruppen . . . . . . . . . . . . . 1.8 Untergruppen von Z, Kongruenzen und Restklassen 1.9 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . 2 Homomorphismen und Normalteiler . . . . . . . . . . . . . 2.1 Denition eines Homomorphismus . . . . . . . . . . 2.2 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Nebenklassen . . . . . . . . . . . . . . . . . . . . . . 2.4 Ordnung und Index . . . . . . . . . . . . . . . . . . 2.5 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Denition eines Normalteilers . . . . . . . . . . . . . 2.7 Homomorphismen und Normalteiler . . . . . . . . . 2.8 Faktorgruppen . . . . . . . . . . . . . . . . . . . . . 2.9 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . 3 Isomorphiesätze und Produkte von Gruppen . . . . . . . . . 3.1 Isomorphiesätze . . . . . . . . . . . . . . . . . . . . . 3.2 Äuÿeres direktes Produkt . . . . . . . . . . . . . . . 3.3 Inneres direktes Produkt . . . . . . . . . . . . . . . . 3.4 Äuÿeres semidirektes Produkt ∗ . . . . . . . . . . . . 3.5 Inneres semidirektes Produkt ∗ . . . . . . . . . . . . 3.6 Beispiele∗ . . . . . . . . . . . . . . . . . . . . . . . . 3.7 Zyklische Gruppen . . . . . . . . . . . . . . . . . . . 3.8 Teilbarkeit ganzer Zahlen . . . . . . . . . . . . . . . 3.9 Produkte zyklischer Gruppen . . . . . . . . . . . . . 3.10 Untergruppen zyklischer Gruppen . . . . . . . . . . 3.11 Die Eulersche ϕ-Funktion . . . . . . . . . . . . . . . 3.12 Primrestklassengruppen . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 1 1 2 4 4 5 6 7 8 11 21 21 22 27 28 30 33 34 35 36 39 39 41 42 45 46 49 55 56 59 60 61 63
X
INHALTSVERZEICHNIS
4
5
6
7
3.13 Der euklidische Algorithmus . . . . . . . . . . . . . . . . . . 3.14 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Operationen von Gruppen auf Mengen . . . . . . . . . . . . . . . . 4.1 Denition einer Operation . . . . . . . . . . . . . . . . . . . 4.2 Beispiele und Satz von Cayley . . . . . . . . . . . . . . . . 4.3 Bahnenraum und Standgruppe . . . . . . . . . . . . . . . . 4.4 Die Klassengleichung . . . . . . . . . . . . . . . . . . . . . . 4.5 Zyklenzerlegung einer Permutation . . . . . . . . . . . . . . 4.6 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Symmetriegruppen∗ . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Regelmäÿige n-Ecke und die Diedergruppe . . . . . . . . . . 5.2 Endliche Untergruppen von O(2) . . . . . . . . . . . . . . . 5.3 Symmetrien des Tetraeders . . . . . . . . . . . . . . . . . . 5.4 Symmetrien von Würfel und Oktaeder . . . . . . . . . . . . 5.5 Symmetrien von Ikosaeder und Dodekaeder . . . . . . . . . 5.6 Die Klassengleichung der Ikosaedergruppe . . . . . . . . . . 5.7 Endliche Untergruppen von SO (3) . . . . . . . . . . . . . . 5.8 Symmetrien von Fuÿbällen . . . . . . . . . . . . . . . . . . Struktursätze∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Summen zyklischer Gruppen . . . . . . . . . . . . . . . . . 6.2 Zählung von zyklischen Summanden . . . . . . . . . . . . . 6.3 Primärzerlegung . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Zerlegung von endlichen abelschen p-Gruppen . . . . . . . . 6.5 Elementarteiler . . . . . . . . . . . . . . . . . . . . . . . . . 6.6 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.7 Torsionsuntergruppen . . . . . . . . . . . . . . . . . . . . . 6.8 Freie abelsche Gruppen . . . . . . . . . . . . . . . . . . . . 6.9 Endlich erzeugte abelsche Gruppen . . . . . . . . . . . . . . 6.10 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.11 Satz von Cauchy und p-Gruppen . . . . . . . . . . . . . . 6.12 Die Sätze von Sylow . . . . . . . . . . . . . . . . . . . . . 6.13 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einfache und auösbare Gruppen ∗ . . . . . . . . . . . . . . . . . . 7.1 Einfache Gruppen . . . . . . . . . . . . . . . . . . . . . . . 7.2 Kommutatorgruppen . . . . . . . . . . . . . . . . . . . . . . 7.3 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4 Auösbare Gruppen . . . . . . . . . . . . . . . . . . . . . . 7.5 Auösbarkeit von p-Gruppen . . . . . . . . . . . . . . . . . 7.6 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
II Ringe
1 Grundbegrie . . . . . . . . . . . . . . 1.1 Denition eines Rings . . . . . 1.2 Einheiten, Körper, Unterringe . 1.3 Ringhomomorphismen . . . . . 1.4 Beispiele . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
65 66 73 73 74 75 76 78 80 85 85 87 89 91 94 98 100 100 102 102 103 105 107 111 113 114 115 120 121 122 124 127 136 136 138 139 140 143 143 145
145 145 147 149 149
INHALTSVERZEICHNIS
1.5 1.6 1.7 1.8 1.9 1.10 1.11
Polynomringe . . . . . . . . . . . . . . . . . . . . . . . . . . Grad eines Polynoms . . . . . . . . . . . . . . . . . . . . . . Division mit Rest . . . . . . . . . . . . . . . . . . . . . . . . Nullstellen und Werte von Polynomen . . . . . . . . . . . . Einheitswurzeln in C . . . . . . . . . . . . . . . . . . . . . . Polynome in mehreren Veränderlichen ∗ . . . . . . . . . . . Endliche Untergruppen der multiplikativen Gruppe eines Körpers . . . . . . . . . . . . . . . . . . . . . . . . . . 1.12 Einbettung einer Halbgruppe in eine Gruppe . . . . . . . . 1.13 Quotientenkörper . . . . . . . . . . . . . . . . . . . . . . . . 1.14 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Ideale und Restklassenringe . . . . . . . . . . . . . . . . . . . . . . 2.1 Denition von Idealen . . . . . . . . . . . . . . . . . . . . . 2.2 Ideale und Einheiten . . . . . . . . . . . . . . . . . . . . . . 2.3 Restklassenringe . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Isomorphiesätze . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Hauptidealringe und noethersche Ringe . . . . . . . . . . . 2.7 Euklidische Ringe . . . . . . . . . . . . . . . . . . . . . . . 2.8 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9 Der Hilbertsche Basissatz∗ . . . . . . . . . . . . . . . . . . . 2.10 Operationen mit Idealen∗ . . . . . . . . . . . . . . . . . . . 2.11 Der Chinesische Restesatz∗ . . . . . . . . . . . . . . . . . . 2.12 Beispiele∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.13 Primideale und maximale Ideale . . . . . . . . . . . . . . . 2.14 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.15 Existenz maximaler Ideale und das Lemma von Zorn∗ . . 3 Teilbarkeit in Integritätsringen . . . . . . . . . . . . . . . . . . . . 3.1 Teiler und assoziierte Elemente . . . . . . . . . . . . . . . . 3.2 Irreduzible Elemente und Primelemente . . . . . . . . . . . 3.3 Teilerketten . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Primzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Faktorielle Ringe . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Gemeinsame Teiler und Vielfache . . . . . . . . . . . . . . . 3.7 Polynomringe über faktoriellen Ringen . . . . . . . . . . . . 3.8 Irreduzibilitätskriterien für Polynome . . . . . . . . . . . . 3.9 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.10 Ringe holomorpher Funktionen ∗ . . . . . . . . . . . . . . . 3.11 Quadratische Zahlkörper∗ . . . . . . . . . . . . . . . . . . . 3.12 Quadratische Zahlringe∗ . . . . . . . . . . . . . . . . . . . . 3.13 Einheiten in quadratischen Zahlringen ∗ . . . . . . . . . . . 3.14 Euklidische quadratische Zahlringe ∗ . . . . . . . . . . . . . 3.15 Faktorzerlegung in quadratischen Zahlringen ∗ . . . . . . . . 3.16 Ideale als ideale Zahlen∗ . . . . . . . . . . . . . . . . . . . .
XI 155 159 160 163 164 166 170 171 172 174 176 176 177 178 179 180 184 185 187 189 192 193 195 198 199 202 206 206 207 209 211 214 215 217 221 223 225 226 229 232 235 239 244
XII
INHALTSVERZEICHNIS
III Körpererweiterungen
1 Grundbegrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Charakteristik und Primkörper . . . . . . . . . . . . . . . . 1.2 Grad einer Körpererweiterung . . . . . . . . . . . . . . . . . 1.3 Adjunktion von Elementen . . . . . . . . . . . . . . . . . . 1.4 Algebraische und transzendente Elemente . . . . . . . . . . 1.5 Das Minimalpolynom . . . . . . . . . . . . . . . . . . . . . 1.6 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7 Algebraische Körpererweiterungen . . . . . . . . . . . . . . 1.8 Algebraisch abgeschlossene Körper . . . . . . . . . . . . . . 2 Konstruktion von Körpererweiterungen . . . . . . . . . . . . . . . . 2.1 Symbolische Adjunktion von Nullstellen . . . . . . . . . . . 2.2 Fortsetzung von Körperisomorphismen . . . . . . . . . . . . 2.3 Zerfällungskörper eines Polynoms . . . . . . . . . . . . . . . 2.4 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Der algebraische Abschluss∗ . . . . . . . . . . . . . . . . . . 3 Einfache und mehrfache Nullstellen . . . . . . . . . . . . . . . . . . 3.1 Vielfachheit von Nullstellen und formale Ableitung . . . . . 3.2 Separabilität . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Der Frobenius-Homomorphismus . . . . . . . . . . . . . . . 3.4 Endliche Körper . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Algebraischer Abschluss eines endlichen Körpers . . . . . . 3.7 Der Satz vom primitiven Element . . . . . . . . . . . . . . . 3.8 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.9 Resultanten∗ . . . . . . . . . . . . . . . . . . . . . . . . . . 3.10 Diskriminanten∗ . . . . . . . . . . . . . . . . . . . . . . . . 3.11 Beispiele∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Galois-Erweiterungen . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Symmetrische Polynome . . . . . . . . . . . . . . . . . . . . 4.2 Relative Automorphismen und Fixkörper . . . . . . . . . . 4.3 Gruppenordnung und Körpergrad . . . . . . . . . . . . . . 4.4 Galois-Erweiterungen . . . . . . . . . . . . . . . . . . . . . 4.5 Der Hauptsatz der Galois-Theorie . . . . . . . . . . . . . . 4.6 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7 Der Fundamentalsatz der Algebra ∗ . . . . . . . . . . . . . . 4.8 Diskriminante und Galois-Gruppe ∗ . . . . . . . . . . . . . . 4.9 Galois-Theorie endlicher Körper ∗ . . . . . . . . . . . . . . . 5 Lösung von Polynomgleichungen ∗ . . . . . . . . . . . . . . . . . . . 5.1 Quadratische Gleichungen . . . . . . . . . . . . . . . . . . . 5.2 Kubische Gleichungen . . . . . . . . . . . . . . . . . . . . . 5.3 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Gleichungen vierten Grades . . . . . . . . . . . . . . . . . . 5.5 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6 Kreisteilung in Charakteristik Null . . . . . . . . . . . . . . 5.7 Kreisteilung in Charakteristik p > 0 . . . . . . . . . . . . .
247
247 247 248 250 251 252 255 258 260 264 264 265 267 272 276 281 281 284 285 286 289 293 294 295 296 302 304 309 309 313 315 317 319 321 324 329 330 333 333 334 337 339 344 348 352
INHALTSVERZEICHNIS
5.8 Reine Polynome . . . . . . . . . . . . . . . . . . . . . . . . 5.9 Zyklische Erweiterungen . . . . . . . . . . . . . . . . . . . . 5.10 Lösbarkeit von Polynomgleichungen . . . . . . . . . . . . . 5.11 Die allgemeine Polynomgleichung . . . . . . . . . . . . . . . 5.12 Gleichungen fünften Grades und das Ikosaeder . . . . . . . 5.13 Darstellung von Einheitswurzeln . . . . . . . . . . . . . . . 5.14 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.15 Das Umkehrproblem der Galois-Theorie . . . . . . . . . . . 6 Geometrische Konstruktionen . . . . . . . . . . . . . . . . . . . . . 6.1 Konstruktionen mit Zirkel und Lineal . . . . . . . . . . . . 6.2 Der Körper der konstruierbaren Punkte . . . . . . . . . . . 6.3 Struktur des Körpers der konstruierbaren Punkte . . . . . . 6.4 Unlösbarkeit klassischer Konstruktionsaufgaben . . . . . . . 6.5 Konstruktion von regelmäÿigen n-Ecken∗ . . . . . . . . . . 6.6 Andere Regeln für Konstruktionsverfahren . . . . . . . . . .
Anhang Platonische Körper Literaturverzeichnis Index Symbolverzeichnis
XIII 355 357 360 363 365 368 371 375 378 379 380 382 386 388 392
393 399 409 409
Kapitel I Gruppen In diesem Kapitel beschäftigen wir uns mit der einfachsten algebraischen Struktur, der Gruppe, deren Ursprung im Studium von Symmetrien verschiedenster Art liegt. Es ist bemerkenswert, dass der Name Gruppe erstmals bei
Galois in einer
relativ komplexen Situation auftrat: als Gruppe von Permutationen der Nullstellen eines Polynoms. Erst später betrachtete
Cayley abstrakte endliche Gruppen, die Weber [We1]. Mehr zur Geschichte
erste allgemeine axiomatische Denition gab des Gruppenbegris ndet man in [Wu].
1 Halbgruppen, Gruppen und Untergruppen 1.1 Innere Verknüpfungen und Halbgruppen Eine innere Verknüpfung auf einer Menge
∗ : M × M → M, Die Verknüpfung
∗
M
ist eine Abbildung
(a, b) → a ∗ b .
heiÿt assoziativ , wenn
(a ∗ b) ∗ c = a ∗ (b ∗ c)
für alle
a, b, c ∈ M ,
und kommutativ , wenn
a∗b=b∗a
für alle
a, b ∈ M .
M = {a1 , . . . , an } kann man eine Verknüpfung eine Verknüpfungstafel beschreiben:
Auf einer endlichen Menge
∗ a1
a1 a1 ∗ a 1
··· ···
ai
ai ∗ a 1
···
an ∗ a 1
···
. . . . . .
an
. . . . . .
aj a1 ∗ aj
··· ···
ai ∗ a j
···
. . . . . .
an ∗ aj
···
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9_1, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
an a1 ∗ an . . .
ai ∗ a n . . .
an ∗ an
∗ durch
2
I GRUPPEN
Ob ∗ kommutativ ist, kann man sofort an der Symmetrie der Tafel erkennen; für die Assoziativität muss man im Prinzip n3 Gleichungen prüfen!
Denition Eine Menge H zusammen mit einer assoziativen inneren Verknüpfung ∗ heiÿt Halbgruppe . Genauer sagt man auch: das Paar (H, ∗) ist Halbgruppe. In einer Halbgruppe H nennt man ein Element e ∈ H
linksneutral, rechtsneutral, neutral, Bemerkung Beweis
wenn wenn wenn
e∗a=a a∗e=a e∗a=a∗e=a
für alle für alle für alle
a∈H, a∈H, a∈H.
Ein neutrales Element ist eindeutig bestimmt.
Sind e, e neutral, so folgt
e = e ∗ e = e . 2
1.2 Beispiele
Beispiel 1
Die Menge N = {0, 1, 2, . . .} der natürlichen Zahlen ist sowohl mit der Addition als auch mit der Multiplikation eine kommutative Halbgruppe. Das Gleiche gilt für die Teilmengen
Nm := {n ∈ N : n ≥ m} und
mN := {m · n : n ∈ N} ,
wobei m ∈ N beliebig gewählt werden kann. Für m ≥ 2 gibt es in beiden Mengen kein neutrales Element bezüglich der Multiplikation, in Nm gibt es nur für m = 0 ein neutrales Element bezüglich der Addition. Dagegen ist die Verknüpfung
∗ : N × N → N , (m, n) → m ∗ n := mn , mit 00 := 1 weder assoziativ noch kommutativ.
Beispiel 2
Abbildungen
Ist M eine nicht leere Menge, so ist die Menge Abb (M, M ) aller
f :M →M
mit der Hintereinanderschaltung als Verknüpfung eine Halbgruppe, mit der identischen Abbildung idM als neutralem Element. Hat M mehr als ein Element, so ist diese Verknüpfung nicht kommutativ.
Beispiel 3
In der Menge M(n × n; R) der n-reihigen quadratischen Matrizen mit reellen Einträgen kann man aus Addition und Multiplikation die neuen Verknüpfungen (A, B) → A ∗ B := AB + BA und (A, B) → A ∗ B := AB − BA
3
1.2 BEISPIELE
erklären. Für n ≥ 2 sind sie nicht assoziativ.
Beispiel 4
Sei I = [ 0, 1 ] ⊂ R das Einheitsintervall, X ⊂ R2 wegzusammenhängend und p ∈ X ein fester Punkt. Mit
Ω(X; p) := {f : I → X : f stetig,
f (0) = f (1) = p}
werde der Schleifenraum (d.h. die Menge der geschlossenen Wege um p) bezeichnet. Für f, g ∈ Ω(X; p) sei f (2t) für 0 ≤ t ≤ 12 , (f ∗ g)(t) := g(2t − 1) für 12 ≤ t ≤ 1
erklärt. Anschaulich durchläuft man beim Weg f ∗ g zunächst f und dann g , aber beide mit doppelter Geschwindigkeit. Diese Verknüpfung ist nicht assoziativ: In (f ∗ g) ∗ h läuft man bei f und g viermal so schnell, bei h zweimal so schnell; in f ∗ (g ∗ h) ist es anders.
Vom algebraischen Standpunkt sind die Voraussetzungen stetig und zusammenhängend irrelevant, aber in der Topologie ist der Schleifenraum der erste Schritt zur Fundamentalgruppe. Dazu erklärt man eine Äquivalenz von Schleifen durch Homotopie, d.h. stetige Deformierbarkeit. Die Fundamentalgruppe π(X; p) ist dann der Quotient von Ω(X; p) nach dieser Äquivalenz (vgl. etwa [Os]). Historisch hat dieses Beispiel viel zur Entwicklung der Gruppentheorie beigetragen.
Beispiel 5
Die Menge a H := 0
b 0
: a, b ∈ R ⊂ M(2 × 2 ; R)
ist mit der Multiplikation von Matrizen eine nicht kommutative Halbgruppe. Geometrisch gesehen ist H die Menge der linearen Abbildungen von R2 nach R. Offensichtlich ist 1 x 0 0 für jedes x ∈ R ein linksneutrales Element von H . Dagegen gibt es in H kein rechtsneutrales Element: Aus a b x y a b = 0 0 0 0 0 0
b für alle a, b ∈ R. a Der Unterschied von rechts und links in diesem Beispiel wird geometrisch durch Betrachtung der entsprechenden linearen Abbildungen R2 → R klar.
für alle a, b ∈ R folgt ax = a und ay = b, also x = 1 und y =
Die Beispiele 3 und 5 sind erste Hinweise darauf, welche Tücken in den Rechenregeln für Matrizen stecken.
Beispiel 6
Die Menge H = R × R mit der Verknüpfung
(a, b) ∗ (c, d) := (ac, bd) ist eine kommutative Halbgruppe mit neutralem Element (1, 1).
4
I GRUPPEN
1.3 Denition einer Gruppe In einer Halbgruppe kann vieles fehlen: Es muss weder ein neutrales Element noch Inverse geben. Dies wird nun zusätzlich gefordert.
Denition
Eine Menge G zusammen mit einer Verknüpfung
∗ : G × G → G , (a, b) → a ∗ b ,
Gruppe , wenn folgendes gilt: G1 ∗ ist assoziativ , d.h. (a ∗ b) ∗ c = a ∗ (b ∗ c) für alle a, b, c ∈ G. G2 a) Es gibt ein eindeutig bestimmtes e ∈ G mit e ∗ a = a ∗ e = a für alle a ∈ G (e heiÿt neutrales Element von G).
heiÿt
b) Zu jedem a ∈ G gibt es ein eindeutig bestimmtes a−1 ∈ G mit von a). a−1 ∗ a = a ∗ a−1 = e (a−1 heiÿt
G heiÿt
Inverses
kommutativ (oder abelsch ), wenn a∗b=b∗a
für alle
a, b ∈ G .
Multiplikation Addition
In den meisten Fällen schreibt man die Verknüpfung als , also a ∗ b = a · b, oder noch einfacher ab. Die additive Schreibweise a ∗ b = a + b ist nur im abelschen Fall üblich. Das neutrale Element e bei einer wird mit 0 ( ) bezeichnet, invers zu a ist das −a. Bei einer Multiplikation setzt man oft e = 1.
Null
Negative
Will man deutlich machen, welche Verknüpfung ∗ zugrunde gelegt wird, so kann man eine Gruppe als Paar (G, ∗) schreiben.
Assoziativgesetz G1
Das ist als Axiom nur für drei Faktoren gefordert. Durch wiederholte Anwendung kann man zeigen, dass bei beliebig vielen Faktoren a1 , . . . , an das Ergebnis unabhängig von allen möglichen Klammerungen ist, und einfach a1 · . . . · an schreiben. Man beachte, dass das Inverse eines Produktes a · b gleich b−1 · a−1 ist, denn
(a · b) · (b−1 · a−1 ) = a · (b · b−1 ) · a−1 = a · a−1 = e .
1.4 Abschwächung der Gruppenaxiome In der Axiomatik herrscht Purismus: Man versucht so wenig wie möglich in den Axiomen zu fordern und alles andere daraus abzuleiten. In diesem Sinne kann man das Axiom abschwächen zu
G2
G2
Es gibt ein e ∈ G mit folgenden Eigenschaften: a) e ∗ a = a für alle a ∈ G
(e heiÿt
linksneutral ).
5
1.5 TRANSLATIONEN UND KÜRZUNGSREGELN
b) Zu jedem a ∈ G gibt es ein b ∈ G mit b∗a = e
(b heiÿt
linksinvers
).
Man beachte, dass wegen der nicht vorausgesetzten Eindeutigkeit von e die Bedingungen a) und b) an ein gemeinsames e gekoppelt werden müssen.
Lemma Aus den Axiomen G1 und G2 folgt G2 .
Beweis erfolgt in mehreren Schritten. 1. Ein linksinverses Element ist auch rechtsinvers : Der
Sei b linksinvers zu a. Wir wählen ein zu b linksinverses c, dann ist ba = cb = e. Es folgt
ab = (ea)b = ((cb)a)b = (c(ba))b = (ce)b = c(eb) = cb = e .
2. Ein linksneutrales Element e ist auch rechtsneutral und damit eindeutig
bestimmt :
Zu a ∈ G wählen wir ein linksinverses b, dann ist ba = e und nach Es folgt ae = a(ba) = (ab)a = ea = a .
1. auch ab = e.
Die Eindeutigkeit von e folgt wie in I 1.1 aus e = ee = e.
3. Ein linksinverses (und damit nach 1. auch rechtsinverses) b von a ist
eindeutig bestimmt :
Seien b, b linksinvers zu a, also ba = b a = ab = ab = e. Es folgt
2
b = eb = (b a)b = b (ab) = b e = b .
1.5 Translationen und Kürzungsregeln In einer Menge H mit innerer Verknüpfung · erhält man für jedes feste a ∈ H Abbildungen
la : H → H ,
x → a · x ,
ra : H → H ,
x → x · a ,
(Linkstranslation)
und
(Rechtstranslation).
In einer Verknüpfungstafel kann man die Bilder von H unter la bzw. ra als Zeilen bzw. Spalten ablesen.
Bemerkung a) In einer Gruppe G sind alle Translationen la und ra bijektiv.
b) Sind in einer Halbgruppe H die Translationen la und ra für alle a ∈ H surjektiv, so ist H eine Gruppe. Beweis
a) Für b ∈ G gilt
la (x) = b ⇔ ax = b ⇔ x = a−1 b
und
ra (y) = b ⇔ ya = b ⇔ y = ba−1 .
6
I GRUPPEN
b) Sei b ∈ H fest gewählt und a ∈ H beliebig. Da lb und rb surjektiv sind, gibt es a und e ∈ H mit a = lb (a ) = ba Daraus folgt
und
b = rb (e) = eb .
ea = e(ba ) = (eb)a = ba = a .
Also ist e linksneutrales Element. Da ra surjektiv ist, gibt es ein c ∈ H mit 2 e = ra (c) = ca. Nach I 1.4 folgt, dass G eine Gruppe ist. Die gerade nachgewiesenen Eigenschaften der Translationen kann man auch so ausdrücken: In einer Gruppe G gelten die
Kürzungsregeln
ax = ay ⇒ x = y
und
xa = ya ⇒ x = y .
Weiter sind die Gleichungen ax = b und ya = b stets eindeutig lösbar durch
x = a−1 b und
Korollar
y = ba−1 .
In einer endlichen abelschen Gruppe
a∈G
G
mit
n
Elementen gilt für jedes
an = e . Beweis
Ist G = {a1 , . . . , an }, so ist auch G = {aa1 , . . . , aan }, also n i=1
ai =
n i=1
aai = an
n
ai ,
also
an = e .
i=1
2 In I 2.4 werden wir zeigen, dass diese Aussage auch in nicht kommutativen Gruppen gilt.
1.6 Denition einer Untergruppe Bevor wir eine Serie von Beispielen beschreiben, noch ein grundlegender Begri.
Denition
Sei G eine Gruppe und H ⊂ G eine Teilmenge. H heiÿt von G (in Zeichen H < G), wenn gilt:
U1 Mit a, b ∈ H ist a · b ∈ H (H ist abgeschlossen unter · ). U2 H zusammen mit der von G vererbten Verknüpfung H × H → H , (a, b) → a · b , ist wieder eine Gruppe.
Untergruppe
7
1.7 ERZEUGUNG VON UNTERGRUPPEN
Ganz analog kann man auch andere Unterstrukturen (etwa bei Ringen, Körpern, Vektorräumen,...) erklären. Zur Kontrolle der Bedingungen in der Praxis hilft ein einfaches Kriterium.
Lemma Eine Teilmenge H einer Gruppe wenn H = ∅ und wenn gilt:
G
ist genau dann eine Untergruppe,
a, b ∈ H ⇒ ab−1 ∈ H .
Beweis
Es ist klar, dass die angegebene Bedingung notwendig ist. Sie ist auch
hinreichend: Das Assoziativgesetz gilt in G, also auch in H . Da H = ∅, gibt es ein a ∈ H , also ist aa−1 = e ∈ H . Zu b ∈ H ist eb−1 ∈ H , also enthält H auch die Inversen. Schlieÿlich ist H abgeschlossen unter der Multiplikation, denn mit a, b ∈ H ist ab = a(b−1 )−1 ∈ H .
2 In jeder Gruppe G gibt es die
trivialen Untergruppen
{e} und G.
1.7 Erzeugung von Untergruppen Wir geben ein Verfahren an, mit dem eine beliebige Teilmenge zu der kleinsten möglichen Untergruppe ausgebaut werden kann.
Bemerkung Ist G eine Gruppe, I eine beliebige Indexmenge und sind für alle i ∈ I , so ist
Hi < G
Hi < G .
i∈I
Denn: Sind a, b ∈ Hi für alle i, so ist ab−1 ∈ Hi , also ab−1 ∈
Hi .
i∈I
Ist G eine Gruppe und M ⊂ G eine beliebige Teilmenge, so wird die von M erzeugte Untergruppe von G erklärt als Durchschnitt aller M umfassenden Untergruppen, in Zeichen H. Erz (M ) := M ⊂H 0} < Q ,
× R× + := {α ∈ R : α > 0} < R ,
C := {z ∈ C : |z| = 1} < C× , Cn := {ζnk : k ∈ Z} < C
mit
i ζn := exp( 2π n ).
15
1.9 BEISPIELE
Die Elemente ζ ∈ Cn heiÿen n-te Einheitswurzeln , ζn ist eine primitive Einheitswurzel ; die Gruppe Cn bildet die Ecken eines regulären n-Ecks. Für n = 5 erhält man das berühmte Pentagramm :
Beispiel 7
Die Gruppe (Z, +) ist erzeugt von dem einen Element 1, die Gruppe (Q, +) dagegen ist nicht endlich erzeugt. Das ist einfach zu sehen: Sind q1 , . . . , qn ∈ Q und ai qi = mit ai , bi ∈ Z, bi = 0 , bi so betrachten wir alle in b1 , . . . , bn enthaltenen Primfaktoren p1 , . . . , pm . Ist p eine davon verschiedene weitere Primzahl, so gilt
1 ∈ / Erz (q1 , . . . , qn ) . p Wir haben dabei benutzt, dass es unendlich viele Primzahlen gibt; das wird in II 3.4 näher ausgeführt.
Beispiel 8 Teilbarkeit durch kleine Primzahlen
Ob eine natürliche Zahl n durch eine Primzahl p teilbar ist, kann man für einige kleine p einfach an der Dezimaldarstellung
n=
N
rk 10k
rk ∈ {0, . . . , 9}
mit
k=0
erkennen. Oensichtlich ist n genau dann durch 2 oder 5 teilbar, wenn dies für die letzte Stelle r0 zutrit. Der Grund dafür ist, dass 2 und 5 Teiler von 10 und damit auch von 10k sind; also gilt
n ≡ r0 (mod 2)
n ≡ r0 (mod 5) .
und
Wie aus der Schule mehr oder weniger bekannt ist, kann man die Teilbarkeit durch 3 und 11 an den Quersummen
Q(n) :=
N
rk
und
k=0
Q (n) :=
N
(−1)k rk
k=0
erkennen. Um das zu begründen, zeigen wir zunächst die
Bemerkung
Für jedes n ∈ N gilt:
16
I GRUPPEN
a) n ≡ Q(n) (mod 9), also 9 | n ⇔ 9 | Q(n), b) n ≡ Q (n) (mod 11), also 11 | n ⇔ 11 | Q (n). Beweis Für k ≥ 1 gilt k
k
10 = 9 + 1 , also 10 = (9 + 1) = k
k
l=0
l
9k−l · 1l ≡ 1 (mod 9) ,
denn die ersten k Summanden sind durch 9 teilbar, der letzte ist 1, und analog
10 = 11 − 1 , also 10 = (11 − 1) = k
k
k
k l=0
l
11k−l (−1)l ≡ (−1)k (mod 11) .
Nach den Rechenregeln (+) und (·) für Kongruenzen aus I 1.8 folgt N = Q(n)(mod 9), ( rk )(mod 9)
k n= rk 10 ≡ ( (−1)k rk )(mod 11) = Q (n)(mod 11). k=0
2 Da n ≡ Q(n)(mod 9) und 3 | 9, folgt n ≡ Q(n)(mod 3).
Folgerung
3 | n ⇔ 3 | Q(n).
Bei gröÿeren n kann Q(n) recht groÿ werden, da hilft eine Iteration Q(Q(n)) u.s.w. Die alternierende Quersumme Q (n) bleibt dagegen im Allgemeinen recht klein. Dass die Teilbarkeit einer Zahl durch 2, 3, 5, 9 und 11 so leicht an der Dezimaldarstellung abzulesen ist, folgt im Grunde aus den besonders einfachen für k 1 gültigen Kongruenzen
10k ≡ 0(mod m) für m = 2, 5, 10k ≡ 1(mod m) für m = 3, 9 und 10k ≡ (−1)k (mod 11). Für andere Zahlen m können die Reste rk bei der Teilung von 10k durch m wesentlich komplizierter ausfallen. Ein besonderes interessanter Fall ist m = 7, da erhält man die Werte
k rk
0 1
1 3
2 2
3 6
4 4
5 5
und rk+6l = rk für alle l ∈ N.
Das kann man einfach sehen, indem man die periodische Dezimalbruchentwicklung
1 = 0.142857 7 berechnet, und die bei der Division verbleibenden Reste rk festhält.
17
1.9 BEISPIELE
Mit Hilfe dieser Werte von rk kann man nun relativ leicht feststellen, ob eine gegebene Zahl n ∈ N durch 7 teilbar ist. Ist zum Beispiel
n = 3 489 327 548 so erhält man durch Rechnung modulo 7 3 · 109
+ +
4 · 108 7 · 103
+ +
8 · 107 5 · 102
+ +
9 · 106 4 · 101
+ +
3 · 105 8 · 100
+
2 · 104
≡
3·6
+ +
4·2 0·6
+ +
1·3 5·2
+ +
2·1 4·3
+ +
3·5 1·1
+
2·4
=
77
=
7 · 101
+
7 · 100
≡
0·3
+
0·1
=
0
Also folgt n ≡ 0(mod7), d.h. n ist durch 7 teilbar. Mit Hilfe von derartigen durch die Reste rk gewichteten Quersummen kann man im Prinzip auch die Teilbarkeit durch andere Zahlen prüfen. Mehr zu diesem Thema ndet man etwa bei [R-U, 5.1.3].
Beispiel 9
Mit Hilfe elementarer Gruppentheorie erhält man ein klassisches Resultat über ganze Zahlen:
Kleiner Satz von Fermat p,
so gilt
Ist
p
eine Primzahl und
x∈Z
kein Vielfaches von
xp−1 ≡ 1 (mod p) .
Die Gruppe (Z/pZ)∗ aus I 1.8 hat p − 1 Elemente, also ist nach dem Korollar aus I 1.5 (x + pZ)p−1 = 1 + pZ . Beweis
Gauss
Fermat
2
Euler
gefundenen und von [Ga3 , 50] schreibt zu diesem von bewiesenen Ergebnis: Dieser Satz, welcher sowohl wegen seiner Eleganz als wegen seines hervorragenden Nutzens höchst bemerkenswert ist .... Mit den elementaren Techniken der Gruppentheorie ist der Sachverhalt ganz oensichtlich geworden.
Man kann diesen Satz zum Beispiel dazu verwenden, um Potenzreste modulo Primzahlen zu berechnen. So ist etwa
512 ≡ 1 (mod 13) , also 586 = 57·12+2 = (512 )7 · 52 ≡ 52 (mod 13) ≡ 12 (mod 13) . Dabei wird die Rechenregel für die Multiplikation von Kongruenzen verwendet. Weitere Anwendungen ndet man etwa bei [B-R-K]und [M-P].
18
I GRUPPEN
Beispiel 10 ISBN-Prüfziern Um 1970 wurde weltweit von den Verlagen eine 10-stellige International Standard Book Number (ISBN-10 ) eingeführt, ab 2007 wird sie abgelöst durch die 13stellige ISBN-13. Mathematisch interessant dabei ist die Codierung durch eine Prüfzier. Zum Beispiel hat die erste Auage des Buches [F-S] die ISBN 3 − 519 − 02053 − X . Die allgemeine Form ist
a1 − a2 a3 a4 − a5 a6 a7 a8 a9 − a10 , wobei a1 bis a9 durch Ländergruppe-Verlag-Titel bestimmt sind, a10 ist die Prüfzier. Im Prinzip können alle ai der Ziernmenge
Z := {0, 1, . . . , 9, X}
mit X = 10
entnommen sein, in der Praxis werden für a1 bis a9 nur die Ziern 0 bis 9 verwendet. Die Prüfzier a10 ∈ Z ist festgelegt durch die Prüfbedingung 10
(11 − k)ak ≡ 0 (mod 11) .
(∗)
k=1
Sie ist oensichtlich äquvalent zu 10
(∗ )
kak ≡ 0 (mod 11) .
k=1
In obigem Beispiel ist
s :=
9
k=1
(11 − k)ak = 177 ≡ 1 (mod 11) und
10
(11 − k)ak = 187 ≡ 0 (mod 11) .
k=1
Daran erkennt man sofort, wie die Prüfzier a10 berechnet werden kann: Es muss
a10 ≡ −s (mod 11) sein, dadurch ist a10 ∈ Z eindeutig bestimmt. Das Anfügen der Prüfzier hat zwei Konsequenzen: - Ist genau eine Zier ai ∈ Z falsch eingegeben, so ist die Prüfbedingung (∗) verletzt. - Ist genau eine Zier ai unlesbar, so kann sie aus den restlichen Ziern rekonstruiert werden.
19
1.9 BEISPIELE
Beides folgt aus dem
Lemma Seien n ∈ {1, . . . , 10} und ak ∈ Z für alle k = n vorgegeben. Dazu gibt es genau ein an ∈ Z , so dass 10
(11 − k)ak ≡ 0 (mod 11) .
(∗)
k=1
Beweis Wir setzen s :=
10
(11 − k)ak .
k=1 k=n
Dann ist die Prüfbedingung (∗) äquivalent zu
s + (11 − n)an ≡ 0 (mod 11) , d.h. nan ≡ s (mod 11) . Um eine eindeutige Lösung an ∈ Z zu bestimmen, benutzt man die multiplikative Gruppe (Z/11 Z)∗ aus I 1.8 (hier wird benutzt, dass 11 eine Primzahl ist). Modulo 11 hat man die folgenden Inversen:
n
1
2
3
4
5
6
7
8
9
X
n−1
1
6
4
3
9
2
8
7
5
X
Also ist an durch
an ≡ s · n−1 (mod 11)
eindeutig festgelegt. Ist in obigem Beispiel n = 2 gewählt, so ist
s = 142, 2a2 ≡ 142 (mod 11) ≡ 10 (mod 11) und a2 ≡ 10 · 6 (mod 11) ≡ 5 (mod 11), also a2 = 5 . 2 Sind zwei Ziern falsch eingegeben, so kann die Prüfbedingung (∗) trotzdem erfüllt sein. Aber alle , d.h. Vertauschungen von aufeinanderfolgenden Ziern werden erkannt: Wir verwenden die Prüfbedingung (∗ ); sind a, b ∈ Z und gilt
Dreher
ka + (k + 1)b ≡ (kb + (k + 1)a) (mod 11) , so folgt b ≡ a (mod 11), also b = a. Die neue
ISBN-13 enthält nur die Ziern aus Z = {0, 1, . . . , 9} .
Sie beginnt mit dem Präx a1 a2 a3 = 978, der anzeigt, dass es sich um ein Buch handelt. Die Ziern a4 , . . . , a12 identizieren das Buch, a13 ist die Prüfzier. Die Gewichte für die Prüfbedingung sind ganz anders: Sie lautet
20
I GRUPPEN
13
gk ak ≡ 0 (mod 10) , wobei
(∗∗)
k=1
gk :=
1 für 3 für
k k
ungerade , gerade .
Das vorliegende Buch hat die ISBN 978 − 3 − 8348 − 0226 − 2 , die Prüfsumme ist 120. Der Leser möge sich zur Übung vergewissern, dass auch dieser Code wie der ISBN-10 einen einzigen Fehler erkennen und eine fehlende Zier ergänzen kann. Dazu muss man nur benutzen, dass 1 und 3 zu 10 teilerfremd sind. Bei der Entdeckung von Drehern ist dieser Code jedoch schlechter. Es gilt für a, b ∈ Z a + 3b ≡ (3a + b) (mod 10) ⇔ a ≡ b (mod 5) . 10 Von den 2 = 45 möglichen Drehern bleiben daher die fünf zu
(0, 5), (1, 6), (2, 7), (3, 8)
und
gehörenden durch die Prüfbedingung (∗∗) unerkannt.
(4, 9)
21
2. HOMOMORPHISMEN UND NORMALTEILER
2 Homomorphismen und Normalteiler 2.1 Denition eines Homomorphismus Zur weiteren Untersuchung der Struktur von Gruppen benötigt man den Begri einer mit der Struktur verträglichen Abbildung.
Denition
ϕ : G → G
Sind (G, ∗) und (G , ∗ ) Gruppen, so heiÿt eine Abbildung
Homomorphismus (oder Gruppen-Homomorphismus ), wenn ϕ(a ∗ b) = ϕ(a) ∗ ϕ(b)
Monomorphismus Isomorphismus
für alle a, b ∈ G. Ein Homomorphismus heiÿt , wenn er injektiv ist, , wenn er surjektiv ist und , wenn er bijektiv ist. G und G heiÿen (in Zeichen G ∼ G ), wenn es einen Iso= morphismus ϕ : G → G gibt. Im Fall G = G nennt man einen Homomorphismus auch und einen Isomorphismus auch .
Epimorphismus
isomorph
Endomorphismus
Automorphismus
Die Teilmenge Im ϕ := ϕ(G) ⊂ G heiÿt neutrale Element, so heiÿt
Bild von ϕ, und, bezeichnet e
∈ G das
Ker ϕ := {a ∈ G : ϕ(a) = e } der
Kern von ϕ.
Bevor wir die vielen Namen mit Beispielen beleben, einige ganz einfache Eigenschaften von Homomorphismen.
Bemerkung
1) Sei ϕ : G → G ein Homomorphismus und seien e ∈ G sowie e ∈ G die neutralen Elemente. Dann gilt:
a) ϕ(e) = e . b) Für alle a ∈ G gilt ϕ(a)−1 = ϕ(a−1 ). c) Ist H < G Untergruppe, so ist ϕ(H) < G Untergruppe. d) Ist H < G Untergruppe, so ist ϕ−1 (H ) < G Untergruppe. e) ϕ ist injektiv genau dann, wenn Ker ϕ = {e}. f ) Ist ϕ Isomorphismus, so ist auch ϕ−1 : G → G Isomorphismus. 2) Sind ϕ : G → G und ψ : G → G Homomorphismen, so ist ψ ◦ ϕ : G → G
Homomorphismus. Beweis Wie üblich lassen wir die in der Denition benutzten Symbole für die Verknüpfungen weg.
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9_2, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
22
I GRUPPEN
1a ) ϕ(e) = ϕ(ee) = ϕ(e)ϕ(e) ⇒ ϕ(e) = e . b ) e = ϕ(e) = ϕ(aa−1 ) = ϕ(a)ϕ(a−1 ). c ) Ist a = ϕ(a), b = ϕ(b) ∈ ϕ(H) mit a, b ∈ H , so ist a (b )−1 = ϕ(a)ϕ(b)−1 = ϕ(ab−1 ) ∈ ϕ(H), da ab−1 ∈ H .
d ) a, b ∈ ϕ−1 (H ) bedeutet ϕ(a), ϕ(b) ∈ H . Dann ist ϕ(ab−1 ) = ϕ(a)ϕ(b)−1 ∈ H , also ab−1 ∈ ϕ−1 (H ).
e) ⇒ ⇐
ϕ(e) = e und ϕ(a) = e ⇒ a = e. Seien a, b ∈ G mit ϕ(a) = ϕ(b). Dann folgt
ϕ(ab−1 ) = ϕ(a)ϕ(b)−1 = e , also ab−1 ∈ Ker ϕ = {e}, also a = b.
f ) Es ist zu zeigen, dass ϕ−1 ein Homomorphismus ist: Zu a , b ∈ G gibt es a, b ∈ G mit ϕ(a) = a , ϕ(b) = b und a = ϕ−1 (a ), b = ϕ−1 (b ). Also ist ϕ−1 (a b ) = ϕ−1 (ϕ(a)ϕ(b)) = ϕ−1 (ϕ(ab)) = ab = ϕ−1 (a )ϕ−1 (b ).
2 ) Für a, b ∈ G gilt (ψ ◦ ϕ)(ab) = ψ(ϕ(ab)) = ψ(ϕ(a)ϕ(b)) = ψ(ϕ(a))ψ(ϕ(b)) = (ψ ◦ ϕ)(a)(ψ ◦ ϕ)(b) . 2
Korollar
Die Menge Aut (G) aller Automorphismen von G mit der Hintereinanderschaltung als Verknüpfung ist eine Gruppe.
2.2 Beispiele Auch in den folgenden Beispielen für Homomorphismen überlassen wir die Prüfung der Einzelheiten dem Leser zur Übung.
Beispiel 1 I 1.9.
Wir suchen nach Automorphismen der Gruppen aus Beispiel 1 in
Für G = {e, a} gibt es nur den Automorphismus ϕ mit ϕ(e) = e und ϕ(a) = a, das ist idG . Für G = {e, a, b} gibt es neben idG auch einen Automorphismus ϕ mit ϕ(a) = b und ϕ(b) = a. In der zyklischen Gruppe G = {e, a, b, c} gibt es neben idG einen Automorphismus ϕ mit ϕ(a) = c , ϕ(c) = a und ϕ(b) = b, aber keinen Automorphismus mit ϕ(a) = b.
23
2.2 BEISPIELE
In der Kleinschen Vierergruppe ergeben alle 6 Permutationen von a, b, c einen Automorphismus. Die zyklische Gruppe mit 4 Elementen und die Kleinsche Vierergruppe sind nicht isomorph. Weiter hat man Isomorphismen
G = {e, a} → Z/2Z , e → ¯0 , a → ¯1 Z/2Z → {+1, −1} ⊂ Q×
mit
und
¯0 → +1 , ¯1 → −1 ,
G = {e, a, b} → Z/3Z , e → ¯0 , a → ¯1 , b → ¯2 , und für die zyklische Gruppe mit 4 Elementen
G = {e, a, b, c} → Z/4Z , e → ¯ 0 , a → ¯1 , b → ¯2 , c → ¯3 .
Beispiel 2
Für jedes m ∈ Z ist die Abbildung
ϕm : Z → Z , k → mk , ein Endomorphismus von (Z, +). ϕm ist injektiv, ϕm (Z) = mZ. Die Abbildung
ϕ : Z → Z/mZ , k → k + mZ ,
ist ein Epimorphismus, Ker ϕ = mZ.
Beispiel 3
Für die Abbildung k , mit ζm = exp ϕ : Z → C× , k → ζm
i
2π m
gilt ϕ(Z) = Cm (Beispiel 6 aus I 1.9) und Ker ϕ = mZ. Die Abbildung k , Z/mZ → Cm , k + mZ → ζm
ist wohldeniert (d.h. unabhängig von der Auswahl des Repräsentanten k deniert) und ein Isomorphismus.
Beispiel 4
Die Abbildung
exp : R → R× , x → ex , ist ein Monomorphismus von (R, +) nach (R× , ·) mit Bild R× +. Die Abbildung
exp : C → C× , z → ez ,
ist ein Epimorphismus von (C, +) nach (C× , ·) mit
i
Ker(exp) = {2π n : n ∈ Z} .
24
I GRUPPEN
Die Abbildung
Z → Ker(exp) , n → 2π in ,
ist ein Isomorphismus. Beispiel 5
Die Determinante
det : GL(n; R) → R× , A → det A , ist ein Epimorphismus, ihr Kern ist
{A ∈ GL(n; R) : det A = 1} . Eingeschränkt auf die orthogonale Gruppe erhält man einen Homomorphismus
det : O(n) → {+1, −1} mit Kern SO(n), das ist die spezielle orthogonale Gruppe . Schon in der Theorie der Determinanten benötigt man das Signum einer Permutation, das ist ein Homomorphismus Beispiel 6
sign : Sn → {+1, −1} , σ → sign σ , an den wir erinnern wollen. Elementar erklärt man das Signum mit Hilfe der Fehlstände in der Folge
σ(1) , σ(2) , . . . , σ(n) . Ein Fehlstand liegt vor, wenn i < j , aber σ(i) > σ(j). Ist k die Gesamtzahl der Fehlstände, erstreckt über alle Paare i, j mit i < j , so ist oensichtlich 0 ≤ k ≤ n2 , wobei das Maximum k = n2 für
σ=
1 n
2 ... n − 1 ...
n−1 2
n 1
auftritt. Nun kann man das Signum erklären durch sign σ := (−1)k . Man nennt σ gerade , wenn sign σ = +1 und ungerade , wenn sign σ = −1. Die Abbildung sign ist ein Homomorphismus, d.h. sign (τ ◦ σ) = sign τ · sign σ für alle σ, τ ∈ Sn . Um das zu beweisen, kann man eine schöne, aber etwas tückische Formel verwenden: sign σ =
σ(j) − σ(i) i<j
j−i
.
(∗)
25
2.2 BEISPIELE
Die Faktoren im Nenner sind alle positiv, und im Zähler negativ bei jedem Fehlstand, sonst positiv. Zum Beispiel hat die Permutation 1 2 3 σ= , 2 3 1 2 Fehlstände, also sign σ = +1. Das Produkt ist gleich
1−2 1−3 3−2 3−2 1−2 1−3 · · = · · = (−1) · (−1) · 1 = 1 . 2−1 3−1 3−2 2−1 3−1 3−2 In der Praxis genügt es, zur Bestimmung des Signums das Vorzeichen von σ(j) − σ(i) i<j
anzusehen. Sehr nützlich ist die Formel (∗) beim Nachweis, dass sign ein Homomorphismus ist: Für Permutationen σ, τ ∈ Sn ist sign (τ ◦ σ) =
τ (σ(j)) − τ (σ(i)) i<j
=
j−i
τ (σ(j)) − τ (σ(i)) σ(j) − σ(i) · σ(j) − σ(i) j−i i<j i<j
= sign τ · sign σ , denn das erste Produkt ist bis auf die durch σ permutierte Reihenfolge der Faktoren gleich
τ (j) − τ (i) i<j
j−i
= sign τ , da
τ (σ(i)) − τ (σ(j)) τ (σ(j)) − τ (σ(i)) = . σ(i) − σ(j) σ(j) − σ(i)
2
Da das Signum ein Homomorphismus ist, ist der Kern Ker(sign) = {σ ∈ Sn : sign σ = +1} =: An < Sn eine Untergruppe; man nennt An die alternierende Gruppe . Eine Permutation τ ∈ Sn für n i, j ∈ {1, . . . , n} gibt mit i = j und
≥
2 heiÿt Transposition , wenn es
τ (i) = j , τ (j) = i , τ (k) = k für k = i, j .
Bemerkung
Für jede Transposition τ
∈ Sn
gilt sign τ
= −1.
Beweis Die Transposition τ0 mit τ0 (1) = 2 und τ0 (2) = 1 hat genau einen Fehlstand, also ist sign τ0 = −1.
26
I GRUPPEN
Für ein beliebiges τ nehme man ein σ ∈ Sn mit
σ(1) = i
und
σ(2) = j .
Dann ist τ = σ ◦ τ0 ◦ σ −1 und sign τ = sign σ · sign τ0 · (sign σ)−1 = sign τ0 = −1 .
2 Wie man leicht sieht, ist An für n ≥ 4 nicht abelsch. Ist 1 2 3 σ= ∈ S3 , 2 3 1 so ist oensichtlich A3 = {σ, σ 2 , σ 3 = id}, also ist durch
A3 → Z/3Z , σ k → k + 3Z , ein Isomorphismus erklärt.
Beispiel 7
Ist H < G Untergruppe, so ist die Inklusion
ι : H → G , a → a , ein Homomorphismus. Ist a ∈ G ein beliebiges Element einer Gruppe, so ist die Konjugation
κa : G → G , x → axa−1 , ein Automorphismus mit κ−1 a = κa−1 . Sie heiÿt innerer Automorphismus . Ist G abelsch, so ist κa =idG für alle a. Ist G = S(X), so kann man sich die Konjugation - wie in der linearen Algebra bei Automorphismen eines Vektorraumes - als Koordinatentransformation vorstellen: Für f, g ∈ S(X) hat man ein Diagramm
X⏐ ⏐ g X
f −→
⏐X ⏐ g
gf g −1 −−−−−→
X.
Die ursprüngliche Abbildung f wird nach der durch g bewirkten Transformation durch gf g −1 beschrieben. Die Translationen
la : G → G , x → ax , und
ra : G → G , x → xa ,
2.3 NEBENKLASSEN
27
sind wegen la (e) = ra (e) = a nur für a = e Homomorphismen, es ist le = re =idG . Die Abbildung
G → S(G) , a → la , ist wegen (lb ◦ la )(x) = lb (la (x)) = bax = lba (x) ein Gruppenhomomorphismus. Dagegen ist ra : G → S(G) , a → ra , wegen (rb ◦ ra )(x) = rb (ra (x)) = xab = rab (x) genau dann ein Homomorphismus, wenn G abelsch ist (ab = (rb ◦ ra )(e) = rba (e) = ba). Die modizierte Rechtstranslation
G → S(G) , a → ra
mit
ra : G → G , x → xa−1 ,
ist stets ein Homomorphismus und κa = la ◦ ra . Dass hier links vor rechts bevorzugt scheint, liegt nur an der Konvention, in welcher Reihenfolge Abbildungen angewandt werden! Die Inversion ist wegen
G → G , a → a−1 , (ab)−1 = a−1 b−1 ⇔ ab = (a−1 b−1 )−1 = ba
genau dann ein Homomorphismus, wenn G abelsch ist.
2.3 Nebenklassen Das Gegenstück von Untergruppen einer Gruppe G sind Faktorgruppen, ihre Elemente sind spezielle Teilmengen von G. Diese werden zunächst betrachtet.
Denition
Gegeben sei eine Untergruppe H < G und a ∈ G. Dann heiÿt
aH := {ax : x ∈ H}
die linke Nebenklasse von a bezüglich H ,
Ha := {xa : x ∈ H}
die rechte Nebenklasse von a bezüglich H .
Oensichtlich ist aH = la (H) und Ha = ra (H). Ist H = G, so ist aH = bH = Ha = Hb für alle a, b ∈ G. Allgemein gilt:
Lemma
Für H < G und a, b ∈ G sind folgende Aussagen äquivalent: i) aH = bH ,
ii) b ∈ aH ,
iii) a−1 b ∈ H .
Ebenso sind folgende Aussagen äquivalent: i ) Ha = Hb ,
ii ) b ∈ Ha ,
iii ) ab−1 ∈ H .
Man beachte die Eselsbrücke: In der dritten Bedingung steht das Inverse je nach Nebenklasse links oder rechts!
Beweis
i) ⇒ ii):
b = be ∈ bH = aH .
28
I GRUPPEN
ii) ⇒ iii): b = ax für ein x ∈ H ⇒ a−1 b = x ∈ H . iii) ⇒ i): x ∈ aH ⇒ x = ay für ein y ∈ H ⇒ x = ay = bb−1 ay = b(a−1 b)−1 y ∈ bH . x ∈ bH ⇒ x = by für ein y ∈ H ⇒ x = by = a(a−1 b)y ∈ aH . Analoge Rechnungen ergeben die Äquivalenzen für die rechten Nebenklassen.
2
Die Aussage des obigen Lemmas kann man auch so lesen: Durch die linken und rechten Nebenklassen bezüglich H < G sind zwei Äquivalenzrelationen auf G erklärt: a ≡ b(mod H) ⇔ a−1 b ∈ H und l
a ≡ b(mod H) ⇔ ab−1 ∈ H . r Man sagt dafür a kongruent b modulo H . Das verallgemeinert die in I 1.8 erklärte Kongruenz in Z. Für die Gruppe G hat man also zwei Zerlegungen, nämlich in linke und rechte Nebenklassen, modulo H . Die Mengen dieser Nebenklassen bezeichnet man mit
G/H := {aH : a ∈ G}
und
H\G := {Ha : a ∈ G} .
Bemerkung Es gibt eine kanonische bijektive Abbildung G/H → H\G , aH → Ha−1 .
Beweis
Die Abbildung ist wohldeniert und injektiv, denn
aH = bH ⇔ a−1 b = a−1 (b−1 )−1 ∈ H ⇔ Ha−1 = Hb−1 . 2
Die Surjektivität ist trivial.
2.4 Ordnung und Index Die Anzahl der Elemente einer Gruppe G (oder allgemeiner auch einer Menge) bezeichnet man üblicherweise mit Ordnung , in Zeichen ord (G) . Hat G unendlich viele Elemente, so setzt man ord (G) = ∞, andernfalls ist ord (G) ∈ N .
29
2.4 ORDNUNG UND INDEX
Ist H < G, so nennt man die Anzahl der Nebenklassen, d.h. der Elemente in G/H oder H\G, den Index von H in G, in Zeichen ind (G : H) := ord (G/H) . Diese Notation ist motiviert durch den
Satz von Lagrange
Ist
H
Untergruppe der endlichen Gruppe
G,
so gilt
ord (G) = ord (H) · ind (G : H) . Daraus folgt unmittelbar:
Korollar
Eine Gruppe
G
von Primzahlordnung besitzt nur die trivialen Unter-
gruppen
{e}
Beweis
Für jedes a ∈ G ist die Abbildung
und
G. H → aH , x → ax
bijektiv, also enthalten alle Nebenklassen ord (H) Elemente. G ist disjunkte Vereinigung von ind (G : H) Nebenklassen, daraus folgt die Behauptung. 2 Für ein Element a ∈ G deniert man die Ordnung als Anzahl der Elemente in der von a erzeugten Untergruppe, also ord (a) := ord Erz (a) ∈ N ∪ {∞} . Oensichtlich ist
ord (a) = min{k ∈ N {0} : ak = e} ,
falls ord (a) < ∞. Eine enge Beziehung zu den Untergruppen von Z (I 1.8) ergibt sich aus dem Homomorphismus
ϕ : Z → G , k → ak , denn für das eindeutig bestimmte m ∈ Z mit Ker ϕ = mZ gilt m = ord a. Es gilt
ak = e ⇔ k ∈ Ker ϕ ⇔ k = mx für ein x ∈ Z , daraus folgt sofort das
Lemma
Ist
a∈G
ein Element endlicher Ordnung und
k ∈ Z,
so gilt
ak = e ⇔ ord a teilt k . Insbesondere gilt
aord G = e
für jedes
a
aus einer endlichen Gruppe
G.
2
Der Satz von Lagrange gibt eine notwendige Bedingung für die Ordnung einer Untergruppe und die Ordnung eines Elementes: Sie müssen Teiler der Gruppenordnung sein. In den folgenden Paragraphen werden einige Ergebnisse zur Frage nach der Umkehrung dieser Aussage erhalten; hier eine kleine Vorschau:
30
I GRUPPEN
- In einer zyklischen Gruppe gibt es zu jedem Teiler der Ordnung genau eine Untergruppe und mindestens ein Element dieser Ordnung (I 3.10). - In der Gruppe A4 der Ordnung 12 gibt es keine Untergruppe der Ordnung 6 und damit auch kein Element der Ordnung 6 (Beispiel 4 in I 4.6). - Zu jedem Primteiler der Gruppenordnung gibt es ein Element dieser Ordnung (Satz von Cauchy in I 6.11). Hat man in einer Gruppe G Elemente a1 , . . . , an von endlicher Ordnung, so kann man im allgemeinen keine brauchbare Vorhersage über die Ordnung des Produkts machen (Beispiele 5 aus I 2.5 und 3 aus I 4.6). In einem Spezialfall kann man wenigstens eine Teilbarkeitsaussage machen.
Bemerkung Sind die Elemente a1 , . . . , an ∈ G vertauschbar, (d.h. ai aj = aj ai für alle i, j = 1, . . . , n) und ist ki := ord (ai ) < ∞, so folgt ord (a1 · . . . · an )
teilt kgV(k1 , . . . , kn ) .
Beweis Es gilt nach Voraussetzung (a1 · . . . · an )k = ak1 · . . . · akn . Für jedes Vielfache k von ki ist aki = e, also für jedes gemeinsame Vielfache k auch 2 (a1 · . . . · an )k = e. In speziellen Situationen kann man bessere Aussagen über die Ordnung eines Produktes machen:
• in direkten Produkten (Lemma in I 3.9) • für a1 = . . . = an (Lemma in I 3.10) • für n = 2 (Beispiel 5 in I 3.14) • für elementfremde Zyklen (Rechenregeln aus I 4.5)
2.5 Beispiele Wir geben Beispiele für Zerlegungen einer Gruppe in Nebenklassen und Ordnungen von Elementen.
Beispiel 1
Ist G abelsch, so stimmen linke und rechte Nebenklassen überein. Das ist für G = Z und H = mZ der Fall; wie in I 1.8 ausgeführt, ist
Z/mZ = {¯ 0, . . . , m − 1}
mit
k¯ := k + mZ .
2.5 BEISPIELE
Beispiel 2
31
Ist G = GL(n; R) und
H := GL+ (n; R) := {A ∈ GL(n; R) : det A > 0} < GL(n; R) , so hat man für jede Matrix A ∈ G mit det A < 0 eine Zerlegung GL(n; R) = H ∪ AH = H ∪ HA . Das folgt ganz einfach aus
AH = HA = {B ∈ GL(n; R) : det B < 0} , falls det A < 0 . Es gibt also genau zwei Nebenklassen, linke und rechte stimmen überein (obwohl die Gruppe nicht abelsch ist, also im allgemeinen AB = BA in AH = HA.) Ganz analog ist die Situation bei H := An < Sn =: G. Hier ist
Sn = An ∪ σAn = An ∪ An σ für jedes σ ∈ Sn und sign σ = −1.
Beispiel 3
In der nicht-abelschen Gruppe S3 sei 1 2 3 τ := und H := {id, τ } < S3 . 2 1 3 1 2 3 Für σ = ist 2 3 1 1 2 3 σH = {σ, στ } und στ = , aber 3 2 1 1 2 3 Hσ = {σ, τ σ} und τ σ = = στ . 1 3 2 Weiter gilt σ −1 H = Hσ −1 und
S3 = H ∪ σH ∪ σ −1 H = H ∪ Hσ ∪ Hσ −1 .
Beispiel 4
Hat in einer Gruppe G jedes Element die Ordnung 2, so ist G abelsch:
2
Aus a = e folgt a−1 = a für alle a ∈ G. Also ist
(ab)(ab) = e, d.h. ab = b−1 a−1 = ba . Ein Beispiel dafür ist die Kleinsche Vierergruppe (Beispiel 1 in I 1.9).
Beispiel 5
Die Menge M(n × n; Z) der quadratischen n-reihigen Matrizen mit Einträgen aus Z ist bezüglich der Multiplikation eine Halbgruppe, die Determinantenabbildung det : M(n × n; Z) → Z , A → det A ,
32
I GRUPPEN
ist multiplikativ, d.h. det (A · B) = (det A) · (det B).
A, B ∈ M(n × n; Z) mit A · B = En , so ist det (AB) = det (A) · det (B) = 1, det A = det B = ±1. Umgekehrt gibt es nach der Cramerschen Regel zu # ∈ M(n × n; Z) mit jedem A ∈ M(n × n; Z) eine komplementäre Matrix A Sind
also
A · A# = A# · A = (det A) · En (vgl. etwa [Fi 1 , 3.3.2]). Also hat jedes
A−1 ∈ M(n × n; Z),
A ∈ M(n×n; Z) mit det A = ±1 ein Inverses
und
SL
(n; Z) := {A ∈ M(n × n; Z) : det A = 1}
ist eine Gruppe. In SL
(2; Z)
gibt es Elemente endlicher und unendlicher Ordnung. Als Beispiele
geben wir
0 , A2 := −1 0 −1 A4 := , 1 0 −1 0
A3 := A6 :=
Wie man leicht nachrechnet, ist ord
1 , −1 1 , 1
0 −1 0 −1
Ai = i
A∞ :=
1 0
1 1
.
und
A4 · A3 = A∞ . Das Produkt von zwei Elementen endlicher Ordnung kann also unendliche Ordnung haben! Die Ordnungen 1 und 2 werden durch
1, 2, 3, 4, 6
A= Wir betrachten
λ ∈ C.
E2
und
−E2
realisiert. Wir zeigen nun, dass
die einzigen möglichen endlichen Ordnungen sind. Angenommen
A
a c
b d
und
An = E2 .
C2 , als solcher 0 = z ∈ C2 , also
als Endomorphismus des
Dazu gibt es einen Eigenvektor
A · z = λ · z ⇒ An · z = λn · z ⇒ λn = 1 Daraus folgt, dass jeder Eigenwert eine
n-te
da
hat er einen Eigenwert
An = E2 .
Einheitswurzel ist. Auÿerdem ist
λ
Nullstelle des charakteristischen Polynoms
PA (X) = X 2 − (a + d)X + det A . Sind
λ1 , λ2 ∈ C
die beiden Nullstellen, so ist
λ 2 = λ1 Aus
und
λ1 + λ2 = a + d ∈ Z .
|λ1 | = |λ2 | = 1, λ2 = λ1 und λ1 + λ2 ∈ Z folgt, dass es für λ1 + λ2 −2, −1, 0, 1, 2 gibt. Im Bild sieht das so aus:
möglichen Werte
nur die
2.6 DEFINITION EINES NORMALTEILERS
33
Es gibt also nur die folgenden Möglichkeiten ord A
λ1
λ2
PA (X)
1
1
X 2 − 2X + 1
1
ζ6
ζ6
X2 − X + 1
6
i
−i
X2
4
ζ3
ζ3
X2 + X + 1
3
−1
−1
X 2 + 2X + 1
2
+1
Diese werden durch die oben angegeben Matrizen realisiert.
2.6 Denition eines Normalteilers Ist ϕ : G → G ein Homomorphismus und H := Ker ϕ, so gilt für x ∈ H und a ∈ G
ϕ(axa−1 ) = ϕ(a)ϕ(x)ϕ(a)−1 = e , also
axa−1 ∈ H ,
d.h. der Kern ist stabil unter allen Konjugationen. Wir untersuchen nun allgemein Untergruppen mit dieser besonderen Eigenschaft. Eine Untergruppe H < G heiÿt H G), wenn für alle a ∈ G aH = Ha ,
Denition
Normalteiler
d.h. die linken und die rechten Nebenklassen stimmen überein. Diese Bedingung kann man noch etwas variieren.
(in Zeichen
34
I GRUPPEN
Bemerkung
Für eine Untergruppe folgendes zu fordern: i) aH = Ha ,
H 0 auch etwas anders beschreiben. Dazu verwendet man die primitive m-te Einheitswurzel
ζm := exp
i
2π ∈C m
und den Homomorphismus k ϕm : Z → C = {z ∈ C : |z| = 1} , k → ζm ,
von der additiven Gruppe Z in die multiplikative Gruppe C . Oensichtlich ist Ker ϕm = mZ
und
2 m Im ϕm = Cm := {ζm , ζm , . . . , ζm = 1} < C .
Einen Isomorphismus k ϕm : Z/mZ = Zm → Cm , k + mZ → ζm ,
erkärt man aus ϕm sofort mit Hilfe des in I 3.1 bewiesenen Ersten Isomorphiesatzes. Zm kann daher als Untergruppe der Kreislinie C angesehen werden, was den Namen zyklisch erklärt.
37
2.9 BEISPIELE
Beispiel 3
In der symmetrischen Gruppe Sn hat man An Sn als Kern des Signum-Homomorphismus. Für n ≥ 2 sei τ die Transposition, die 1 und 2 vertauscht; es ist sign τ = −1. Ist σ ∈ Sn mit sign σ = −1, so ist τ ◦ σ ∈ An , also τ 2 ◦ σ = σ und Sn = An ∪ τ An = An ∪ An τ . Daher gibt es einen Isomorphismus
Sn /An → Z/2Z . Die zu Z/2Z isomorphe Untergruppe H := {id, τ } < Sn ist für n ≥ 3 kein Normalteiler (Beispiel 3 aus I 2.5).
Beispiel 4
Ist K ein beliebiger Körper, so ist die spezielle lineare Gruppe SL(n; K) := {A ∈ GL(n; K) : det A = 1} GL(n; K) ,
als Kern eines Homomorphismus ein Normalteiler. In Beispiel 4 aus I 3.6 werden wir zeigen, dass es einen Isomorphismus GL(n; K)/SL(n; K) → K ∗ = K {0} gibt. In GL(n; R) hat man den Normalteiler GL+ (n; R) := {A ∈ GL(n; R) : det A > 0} GL(n; R) , denn det (BAB −1 ) = det A. Er hat den Index 2; es gibt noch eine weitere Nebenklasse GL− (n; R) := {A ∈ GL(n; R) : det A < 0} , und für jedes S ∈ GL− (n; R) ist GL− (n; R) S 2 ∈ GL+ (n; R). Die Faktorgruppe
=
S · GL+ (n; R) und
GL(n; R)/GL+ (n; R) hat die Ordnung 2, ist also isomorph zu Z/2Z. Es gibt auch wichtige zu Z/2Z isomorphe Untergruppen von GL (n; R), insbesondere solche von der Form
S ∈ GL− (n; R)
H = {En , S} mit
und
S 2 = En .
Für ungerades n können wir S = −En wählen. Wegen A(−En )A−1 = −En für alle A ∈ GL(n; R) ist Hn := {En , −En } GL(n; R) Normalteiler und es gibt einen Homomorphismus GL+ (n; R) → GL(n; R)/Hn , A → {A, −A} . Für gerades n wählen wir ⎛
⎜ ⎜ S := ⎜ ⎝
⎞
1 .. 0
.
1
0 ⎟ ⎟ ⎟ ∈ GL− (n; R) . ⎠ −1
38
I GRUPPEN
In diesem Fall ist Hn := {En , S} < GL(n; R) kein Normalteiler. Es genügt, das im Fall n = 2 zu zeigen: Etwa für 0 −1 A= ist ASA−1 = −S ∈ / Hn . 1 0 Da die gerade verwendeten Matrizen S und A orthogonal sind, gilt analog
O(n)/SO(n) ∼ = Z/2Z
für alle n ,
O(n)/Hn ∼ = SO(n)
für ungerades n .
Dagegen ist Hn < O(n) für gerades n kein Normalteiler. Darauf werden wir in Beispiel 3 aus I 3.6 zurückkommen.
Beispiel 5
Jede Untergruppe H < G mit ind (G : H) = 2
ist Normalteiler. Man hat nämlich für jedes a ∈ G H disjunkte Vereinigungen
G = H ∪ aH = H ∪ Ha , also ist aH = G H = Ha.
Beispiel 6
Die Quaternionengruppe
Q = {±E, ±I, ±J, ±K} < GL (2; C) der Ordnung 8 aus Beispiel 4 in I 1.9 ist nicht abelsch. Wir zeigen
Jede Untergruppe H < Q ist Normalteiler. Nach dem Satz von Lagrange aus I 2.4 kommen für H die Ordnungen 1, 2, 4 und 8 in Frage. Die Fälle 1 und 8 sind trivial; ist ord H = 4, so folgt die Aussage aus dem vorhergehenden Beispiel 5. Oensichtlich gilt die Aussage auch für H = {E, −E}. Es genügt also zu zeigen, dass es keine andere Untergruppe der Ordnung 2 gibt. Das ist ganz einfach: Ist A ∈ H und A = ±E , so ist A2 = −E ∈ H , also ord H > 2.
3. ISOMORPHIESÄTZE UND PRODUKTE VON GRUPPEN
39
3 Isomorphiesätze und Produkte von Gruppen Es ist ein zentrales Problem der Gruppentheorie, eine gute Übersicht über alle möglichen Gruppen zu erhalten. Genauer gesagt versucht man eine , d.h. die Aufstellung einer Liste mit allen Klassen isomorpher Gruppen. In dieser Allgemeinheit ist das Problem aus prinzipiellen Gründen unlösbar; aber selbst für den Fall endlicher Gruppen gibt es bis heute keine abschlieÿende Antwort. Ein positives Ergebnis sei angekündigt: Die endlich erzeugten abelschen Gruppen kann man klassizieren (I 6.9).
Klassikation
Ein erster Schritt in diese Richtung ist die Konstruktion von Isomorphismen und Produkten von Gruppen. Mit Hilfe von Produkten kann man einerseits aus gegebenen Gruppen neue und im allgemeinen komplexere Gruppen konstruieren; andererseits kann man versuchen, gegebene Gruppen in einfachere Faktoren zu zerlegen. In diesem Paragraphen werden einige hierfür grundlegende Techniken beschrieben und durch Beispiele belebt.
3.1 Isomorphiesätze Verschiedene klassische Isomorphiesätze helfen beim Umgang mit Faktorgruppen. Sie sind einfache Folgerungen aus dem
Faktorisierungssatz
Sei ϕ : G → G ein Gruppenhomomorphismus, N G mit N ⊂ Ker ϕ und ρ : G → G/N der kanonische Epimorphismus. Dann gibt es genau einen Gruppenhomomorphismus ϕ : G/N → G derart, dass das Diagramm G ρ
G/N
ϕ
/ G
0 auch dem Betrag nach der gröÿte gemeinsame Teiler. Insgesamt haben wir gezeigt, dass es x1 , . . . , xr ∈ Z gibt, mit
d = ggT (n1 , . . . , nr ) = x1 n1 + . . . + xr nr . Dieses Ergebnis wird manchmal Relation von Bézout genannt. Dabei ist zu bedenken, dass die Koezienten x1 , . . . , xr keineswegs eindeutig bestimmt sind. Man nennt n1 , . . . , nr teilerfremd , wenn ggT (n1 , . . . , nr ) = 1. Oensichtlich ist das äquivalent zur Existenz von x1 , . . . , xr ∈ Z mit
1 = x 1 n1 + . . . + x r nr . Diese Regel ist besonders nützlich. Ein kleinstes gemeinsames Vielfaches von m1 , . . . , mr erhält man mit Hilfe des diagonalen Homomorphismus
δ : Z → Zm1 × . . . × Zmr , x → (x + m1 Z, . . . , x + mr Z) . Oenbar ist Ker δ = {x ∈ Z : x ∈ m1 Z, . . . , x ∈ mr Z} = m1 Z ∩ . . . ∩ mr Z , d.h. Ker δ besteht aus allen gemeinsamen Vielfachen von m1 , . . . , mr . Nach I 1.8 gibt es ein bis auf das Vorzeichen eindeutig bestimmtes k ∈ Z mit Ker δ = kZ. Also ist k = kgV (m1 , . . . , mr ) als erzeugendes Element für k > 0 auch ein dem Betrag nach kleinstes gemeinsames Vielfaches.
58
I GRUPPEN
Als erzeugende Elemente der Untergruppen von Z sind ggT und kgV nur bis auf das Vorzeichen (d.h. bis auf Einheiten in Z) bestimmt. Man kann sie eindeutig machen, indem man immer den nicht negativen Wert wählt.
Bemerkung
Sind m, n, r ∈ Z mit ggT (m, n) = 1, so gilt:
a) m| rn ⇒ m| r . b) m| r und n| r ⇒ mn| r . Beweis a) Wir wählen x, y ∈ Z mit 1 = xm + yn. Also ist r = (rx)m + y(rn) . Wegen m| rn folgt m| r. b) Da n| r ist r = xn mit x ∈ Z. Aus m| r folgt nach a), dass m| x; also folgt mn| r. 2 Als Folgerung erhalten wir eine Aussage über die simultane Lösbarkeit von Kongruenzen, der Tradition folgend bezeichnet als
Chinesischer Restesatz Sind m, n ∈ Z teilerfremd, so gibt es zu beliebig vorgegebenen a, b ∈ Z stets ein x ∈ Z mit x ≡ a (mod m)
und x ≡ b (mod n) .
Ein x ∈ Z ist genau dann eine weitere Lösung der beiden Kongruenzen, wenn x ≡ x (mod mn). Beweis Wir betrachten den diagonalen Homomorphismus δ : Z → Zm × Zn , x → (x + mZ, x + nZ) . Die Lösbarkeit der beiden Kongruenzen für beliebige a, b ∈ Z bedeutet, dass δ surjektiv ist. Um das zu zeigen, wählen wir nach der Relation von Bézout k, l ∈ Z mit 1 = km + ln. Ist
x := aln + bkm , so folgt x − a = a(ln − 1) + bkm = mk(b − a) ∈ mZ und analog x − b ∈ nZ. Dass x und x Lösungen sind, ist gleichbedeutend mit
x − x ∈ Ker δ = mZ ∩ nZ . Es bleibt also mZ ∩ nZ = (mn)Z zu beweisen. Die Inklusion (mn)Z ⊂ mZ ∩ nZ ist klar. Die umgekehrte Inklusion folgt aus Teil b) der obigen Bemerkung. 2
Korollar
Für m, n ∈ N {0} gilt ggT (m, n) = 1 ⇔ kgV (m, n) = m · n .
3.9 PRODUKTE ZYKLISCHER GRUPPEN
59
Beweis
Wir setzen d := ggT (m, n) und k := kgV (m, n). Da Ker δ = kZ, erhalten wir nach I 3.1 einen Monomorphismus
δ¯ : Z/kZ → Zm × Zn . Ist d = 1, so ist nach dem Chinesischen Restesatz k = m · n. Ist umgekehrt k = m · n vorausgesetzt, so ist δ¯ wegen
m · n = ord Zk = ord (Zm × Zn ) ein Isomorphismus. Daher gibt es ein x ∈ Z mit
δ(x) = (mZ, 1 + nZ), also x = rm , 1 − x = sn mit m, n ∈ Z; daraus folgt 1 = rm + sn und ggT (m, n) = 1.
2
Den Fall von mehr als zwei simultanen Kongruenzen behandeln wir in allgemeinerem Rahmen in II 2.11.
3.9 Produkte zyklischer Gruppen Mit den in I 3.8 bereitgestellten Hilfsmitteln zur Teilbarkeit ganzer Zahlen können wir nun einfach klären, wann ein Produkt von zwei zyklischen Gruppen wieder zyklisch ist. Zunächst zeigen wir, dass der Fall eines unendlichen zyklischen Faktors trivial ist. Allgemeiner gilt die
Bemerkung Ist G = {e} eine beliebige Gruppe, so ist G × Z nicht zyklisch. Beweis
Angenommen (a, n) ∈ G × Z ist erzeugendes Element. Dann muss a = e ∈ G und n = 0 ∈ Z sein. Da (a, 0) ∈ G × Z, muss es ein k ∈ Z geben mit
(a, 0) = (a, n)k = (ak , kn) , also k = 0 und a = a0 = e , im Widerspruch zu a = e.
2
Für Produkte endlicher zyklischer Gruppen benutzen wir das
Lemma Seien G und H beliebige Gruppen, a ∈ G und b ∈ H . Dann gilt für
(a, b) ∈ G × H
Beweis
ord (a, b) = kgV (ord a, ord b) .
Sind e ∈ G und e ∈ H die neutralen Elemente, so gilt nach dem Lemma
aus I 2.4
(a, b)k = (ak , bk ) = (e, e ) ⇔ ak = e und bk = e ⇔ (ord a)| k und (ord b)| k , d.h. k muss gemeinsames Vielfaches von ord a und ord b sein, die Ordnung ist das kleinste. 2 Zentrales Ergebnis dieses Abschnitts ist der
Satz über Produkte endlicher zyklischer Gruppen Seien G und H endliche zyklische Gruppen mit m := ord G und n := ord H . Dann gilt:
60
I GRUPPEN
1) G × H ist zyklisch ⇔ m und n teilerfremd. 2) Ist G × H zyklisch und (a, b) ∈ G × H , so gilt: G × H = Erz (a, b) ⇔ G = Erz(a) und H = Erz (b) .
Beweis 1) Ist G × H zyklisch, so gibt es a ∈ G und b ∈ H mit G × H = Erz (a, b), also ord (a, b) = ord (G × H) = mn. Nach dem obigen Lemma ist mn = ord (a, b) = kgV (m, n) , also ggT (m, n) = 1 nach dem Korollar aus I 3.8. Ist ggT (m, n) = 1, so wähle man a ∈ G und b ∈ H mit G = Erz (a) und H = Erz (b). Dann ist ord (a, b) = kgV(m, n) = mn , also G × H = Erz (a, b) zyklisch.
2) ⇐ wurde schon unter 1) bewiesen. ⇒ Ist x ∈ G, so gibt es ein k ∈ Z mit (x, e ) = (a, b)k , also x = ak .
2
3.10 Untergruppen zyklischer Gruppen Zur weiteren Untersuchung der Struktur zyklischer Gruppen wollen wir alle Untergruppen bestimmen. In der unendlichen zyklischen Gruppe Z ist jede Untergruppe von der Form mZ mit m ∈ Z (vgl. I 1.8). Es genügt also, die endlichen zyklischen Gruppen Zm = Z/mZ zu betrachten. Entscheidend ist das folgende
Lemma Ist G eine Gruppe und a ∈ G von der endlichen Ordnung m := ord a, so gilt für jedes n ∈ Z m ord (an ) = . ggT (m, n) Beweis Da an ∈ Erz (a) ist r := ord (an ) ≤ m. Setzen wir d := ggT (m, n), so ist m = rd zu zeigen. Da d = xm + yn mit x, y ∈ Z, ist
ard = ar(xm+yn) = (am )rx · (an )ry = e , also m| rd nach dem Lemma aus I 2.4. Weiter ist m = dm und n = dn mit m , n ∈ N, also nm = mn ; damit folgt analog
(an )m = anm = (am )n = e und r| m , also rd| m . 2
61
3.11 DIE EULERSCHE ϕ-FUNKTION
Korollar
Ist
G
erzeugt von
a
und
ord a = m,
so gilt für alle
n∈Z
G = Erz (an ) ⇔ ggT (m, n) = 1 . Ist insbesondere
m
eine Primzahl, so wird
G
von jedem Element
b∈G
erzeugt.
mit
b = e 2
Nach dem Satz von Lagrange (I 2.4) teilt die Ordnung einer Untergruppe die Ordnung der Gruppe. Umgekehrt gibt es im allgemeinen zu einem Teiler der Gruppenordnung keine entsprechende Untergruppe (Beispiel 1 in I 6.13). Für zyklische Gruppen ist die Situation besonders einfach. Zunächst eine
Bemerkung Beweis
Jede Untergruppe einer zyklischen Gruppe ist zyklisch.
Ist H < G = Erz (a), so betrachten wir den Epimorphismus
ϕ : Z → G , k → ak . Es gibt ein n ∈ N mit ϕ−1 (H) = nZ < Z und H = ϕ(nZ). Also ist H = Erz(an ). 2 Nun folgt das zentrale Ergebnis
Satz
Teiler
Ist G eine endliche zyklische Gruppe der Ordnung m, so gibt k ≥ 1 von m genau eine Untergruppe H < G der Ordnung k .
Genauer gilt: Ist
G = Erz (a)
und
m = kn,
so ist
es zu jedem
H = Erz (an ).
Wir denieren H := Erz (an ). Da m = kn, folgt ggT (m, n) = n, also ist nach obigem Lemma ord H = ord (an ) = k . Beweis
Zum Beweis der Eindeutigkeit betrachten wir H < G mit ord H = k . Nach obiger Bemerkung ist H zyklisch, also H = Erz (al ) für ein l ∈ N. Ist d := ggT (m, l), so ist nach obigem Lemma ord H = ord (al ) = also
kn m = , d d
ord H = k ⇔ d = n ⇒ n| l ⇒ H < H .
Da ord H = k = ord H vorausgesetzt war, muss H = H sein.
2
3.11 Die Eulersche ϕ-Funktion Besonders in der Kreisteilungstheorie benötigt man eine von Euler untersuchte Funktion, die eng mit der Struktur zyklischer Gruppen zusammenhängt. Die ϕ-Funktion ϕ : N {0} → N
62
I GRUPPEN
ist erklärt durch ϕ(n) := Anzahl der m ∈ N mit 0 ≤ m < n und m, n teilerfremd, d.h. ggT (m, n) = 1. Man beachte dabei, dass für alle n ∈ N ggT (0, n) = n
und
ggT(1, n) = 1 ,
denn 0 Z + n Z = n Z und Z + n Z = Z. Also ist ggT (0, 1) = 1 und ϕ(1) = 1. Der Zusammenhang mit zyklischen Gruppen ergibt sich nach dem Korollar aus I 3.10:
ϕ(n)
ist gleich der Anzahl der erzeugenden Elemente von
Zn .
Daraus folgt die grundlegende
Produktregel Beweis
ϕ(m · n) = ϕ(m) · ϕ(n) , f alls ggT (m, n) = 1 .
Nach dem Satz aus I 3.9 gibt es einen Isomorphismus
Zmn → Zm × Zn , beide Gruppen haben also gleich viele Erzeugende. In Zmn ist die Anzahl gleich ϕ(mn), in Zm × Zn gleich ϕ(m) · ϕ(n), da das direkte Produkt von Paaren von Erzeugenden erzeugt wird. 2 Mit Hilfe dieser Produktregel kann man nun leicht eine Formel für die Berechnung von ϕ(n) aus der Primfaktorzerlegung von n (vgl. II 3.4) herleiten.
Berechnungsformeln
a) Für eine Primzahl
p
gilt
ϕ(p) = p − 1 . b) Ist
p
eine Primzahl und
k ∈ N {0},
so ist
ϕ(pk ) = pk−1 (p − 1) . c) Ist
n = pk11 · . . . · pkr r
mit paarweise verschiedenen Primzahlen, so ist
ϕ(n) = p1k1 −1 · . . . · prkr −1 (p1 − 1) · . . . · (pr − 1) .
Beweis a)
Ist 0 ≤ m < p, so gilt ggT (m, p) = 1 ⇔ m = 1, 2, . . . , p − 1.
Die einzigen Teiler von pk sind 1 und pl für 1 ≤ l ≤ k . Also kann auch ggT (m, pk ) nur diese Werte annehmen. Es folgt b)
ggT (m, pk ) = 1 ⇔ m = 0, p, 2p, . . . , (pk−1 − 1) · p, pk−1 · p = pk . Für die teilerfremden Zahlen m verbleiben also die Plätze in den pk−1 Lücken von jeweils p − 1 Zahlen. c)
folgt aus
b)
nach der obigen Produktregel.
2
3.12 PRIMRESTKLASSENGRUPPEN
63
Für eine spätere Anwendung in der Körpertheorie beweisen wir noch die
Eulersche Identität Für n ∈ N {0} gilt
ϕ(d) = n ,
d|n
wobei d alle positiven Teiler von n durchläuft. Beweis Für 1 ≤ d ≤ n betrachten wir die Menge Md (Zn ) := {a ∈ Zn : ord a = d} ⊂ Zn . Oensichtlich ist Md (Zn ) = ∅ genau dann, wenn d | n und man hat eine disjunkte Zerlegung
Zn =
Md (Zn ) .
(∗)
d|n
Nach dem Satz aus I 3.10 gibt es zu jedem Teiler d von n genau eine zyklische Untergruppe H ⊂ Zn mit ord H = d, ihre Erzeugenden sind genau die Elemente von Md (Zn ). Also enthält Md (Zn ) genau ϕ(d) Elemente, falls d | n. Somit folgt die Eulersche Identität aus (∗). 2 Ist etwa n = 6, so ist
d
1
2
3
6
ϕ(d)
1
1
2
2
3.12 Primrestklassengruppen Die Eulersche ϕ-Funktion ist auch wichtig von einem etwas anderen Standpunkt. Wie wir schon in I 1.8 bemerkt hatten, hat man in der bezüglich der Addition zyklischen Gruppe Zm = Z/mZ mit m ≥ 1 durch
(k + mZ) · (l + mZ) := k · l + mZ auch eine Multiplikation erklärt; dadurch wird (Zm , ·) zu einer kommutativen Halbgruppe mit neutralem Element 1 + mZ. Sie ist keine Gruppe, da das Nullelement 0 + mZ bezüglich der Addition kein Inverses bezüglich der Multiplikation besitzt. Zm enthält jedoch eine multiplikative Gruppe:
Lemma Für m ≥ 1 ist
× Zm := {k + mZ ∈ Zm : k ∈ / mZ
und
ggT (k, m) = 1} ⊂ Zm
mit der Multiplikation als Verknüpfung eine abelsche Gruppe der Ordnung
ϕ(m).
64
I GRUPPEN
× Man nennt Zm die Primrestklassengruppe modulo m. In der Terminologie von Kapitel II nennt man die additive zyklische Gruppe Zm zusammen mit der Mul× sind die Einheiten in tiplikation einen Restklassenring . Die Elemente von Zm diesem Ring.
Beweis
× Zunächst ist zu zeigen, dass Zm multiplikativ abgeschlossen ist. Ist
ggT (k, m) = 1 und ggT (l, m) = 1 , so gibt es wegen der Relation von
Bézout x, x , y, y ∈ Z mit
xk + x m = 1 und yl + y m = 1 , also (xy)kl + (xky + x yl + x y m)m = 1 . × Daher ist ggT (kl, m) = 1. Für ein Inverses von k + mZ ∈ Zm hat man die Bedingung
(k + mZ)(x + mZ) = 1 + mZ , d.h. es gibt ein y ∈ Z mit xk + ym = 1 . Wieder nach
Bézout folgt die Existenz des Inversen.
2
× Zm
Die Gruppe kann man auch etwas anders beschreiben. Nach dem Korollar aus × I 3.10 besteht Zm aus allen erzeugenden Elementen der additiven Gruppe Zm . Die Automorphismen ψ : Zm → Zm entsprechen den erzeugenden Elementen als Bilder von 1 + mZ. Daraus ergibt sich der
Satz Für m ≥ 1 ist die Abbildung × Aut (Zm ) → Zm , ψ → ψ(1 + mZ) ,
ein Isomorphismus von abelschen Gruppen. Beweis Die Bijektivität ist schon gezeigt. Die Abbildung ist auch ein Homomorphismus, denn ist
ψ1 (1 + mZ) = k + mZ und
ψ2 (1 + mZ) = l + mZ , so folgt
ψ2 (ψ1 (1 + mZ)) = ψ2 (k + mZ) = l · k + mZ . 2
Korollar Für teilerfremde m, n ≥ 1 hat man Isomorphismen × × Aut (Zmn ) ∼ × Zn× ∼ . = Aut (Zm ) × Aut (Zn ) ∼ = Zm = Zmn
Insbesondere ist ord Aut (Zmn ) = ϕ(m) · ϕ(n). Aus der in I 1.5 für jede endliche abelsche Gruppe G bewiesenen Aussage
aord G = e
2
3.13 DER EUKLIDISCHE ALGORITHMUS
65
× , folgt sofort als Verallgemeinerung des kleinen für alle a ∈ G, angewandt auf Zm Fermatschen Satzes der
Satz von Fermat-Euler Für m ∈ N mit m ≥ 2 und k ∈ Z mit ggT (k, m) = 1 gilt 2
k ϕ(m) ≡ 1 (mod m) . Ist etwa m = 16 und k = 7, so ist ϕ(m) = 8 und
78 = 5 764 801 = 360 300 · 16 + 1 .
3.13 Der euklidische Algorithmus Zur Berechnung des gröÿten gemeinsamen Teilers d von zwei Zahlen m, n ∈ N{0} und von x, y ∈ Z mit d = xm + yn gibt es den euklidischen Algorithmus , der ohne die Primfaktorzerlegung von m und n auskommt (vgl. [Eu, 7. Buch 2], in der Übersetzung steht gemeinsames Maÿ). Wir verwenden die Rechenregel ggT (m, n) = ggT (m, n + km)
für alle k ∈ Z .
Dazu hat man nach der Denition des ggT zu zeigen, dass
mZ + nZ = mZ + (n + km)Z . Die Inklusion ⊃ folgt aus n + km ∈ mZ + nZ, die Inklusion ⊂ aus n = (n + km) − km. 2 Zur Beschreibung des Algorithmus nehmen wir 0 < m < n an, und wir setzen n0 := n, n1 := m. Nun wird wiederholt mit Rest dividiert (vgl. I 1.8):
n0 = q1 n1 + n2 ,
0 ≤ n2 < n1 ,
ggT (n0 , n1 ) = ggT (n1 , n2 )
n1 = q2 n2 + n3 , .. .
0 ≤ n3 < n2 , .. .
ggT (n1 , n2 ) = ggT (n2 , n3 )
nk−2 = qk−1 nk−1 + nk ,
0 ≤ nk < nk−1 ,
ggT (nk−2 , nk−1 ) = ggT (nk−1 , nk )
nk−1 = qk nk + nk+1 ,
0 = nk+1 < nk ,
ggT (nk−1 , nk ) = ggT (nk , 0)
.. .
Da die Folge der Reste ni ∈ N streng monoton abnimmt, gibt es in der Tat ein k ≥ 1 mit nk+1 = 0. Die Regeln für den ggT in der letzten Spalte folgen aus ni+1 = ni−1 − qi ni , also ist nk = ggT (nk , 0) = ggT (n0 , n1 ) = ggT (m, n) .
66
I GRUPPEN
Zur Berechnung einer Darstellung mit x, y ∈ Z
ggT (m, n) = xm + yn setzt man rekursiv ein:
nk
=
nk−2 − qk−1 nk−1
nk−1
=
nk−3 − qk−2 nk−2
= .. .
−qk−1 nk−3 + (1 + qk−2 qk−1 )nk−2
nk−2
= .. .
nk−4 − qk−3 nk−3
=
(. . .)n1 + (. . .)n2
n2
=
n0 − q 1 n 1
=
y · n0 + x · n1
Die Koezienten x und y sind also aus q1 , . . . , qk−1 berechenbar. Um ein Beispiel mit vorhersehbarem Ergebnis zu erhalten, benutzen wir die Primzahlen 17, 257 und 65 537; und wir setzen
n0 = 17 · 65 537 = 1 114 129 , n1 = 17 · 257 = 4 396 Die Rechnung kann man nach folgendem Schema durchführen:
n0 −q1 n1
: n1
= q1
: n2
= q2
+ nn32
n1 −q2 n2 n2 : n3
= q3
+ nn21
1 114 129 : 4 369 −1 114 095 4 369 −4 352 34 : 17
: 34
= 128
=2
+0
= 255
+...
+...
Also ist n3 = 17 = ggT (1 114 129, 4 369). Schlieÿlich erhält man
17 = −128n0 + (1 + 128 · 255)n1 = −128n0 + 32 641n1 .
3.14 Beispiele
Beispiel 1
Ob ein Produkt Zm × Zn von zyklischen Gruppen wieder zyklisch ist, hängt davon ab, ob die diagonale Abbildung
Z → Z × Z , x → (x, x) eine surjektive Abbildung δ : Z → Zm × Zn induziert (vgl. I 3.8). Das kann man geometrisch beschreiben, indem man die Bildpunkte der Diagonalen in Z × Z mit Rest durch m und n teilt. Wir betrachten zwei besonders einfache Fälle:
3.14 BEISPIELE
67
Im ersten Fall m = n = 2 treten nur die 2 Paare von Resten (0, 0) und (1, 1) auf, im zweiten Fall m = 2, n = 3 alle 6 Paare von Resten (a, b) mit a = 0, 1 und b = 0, 1, 2. Im Allgemeinen ist nach I 3.8 der Index von δ(Z) < Zm × Zn gleich ggT (m, n).
Beispiel 2
Sind G1 , G2 beliebige Gruppen mit Untergruppen H1 < G1 , H2 < G2 , so gibt es im direkten Produkt G1 × G2 die trivialen Untergruppen
H1 × H2 < G1 × G2 . Ob es weitere Untergruppen gibt, hängt ganz von G1 und G2 ab. Wir betrachten den Spezialfall der zyklischen Gruppen G1 = Zm und G2 = Z2 . Eine Untergruppe H < Zm × Z2 ist oensichtlich genau dann von der trivialen 0, ¯ 1) ∈ H . Für ein n ¯ ∈ Zm betrachten wir Form H = H1 × Z2 , wenn (¯
H := Erz (¯ n, ¯ 1) < Zm × Z2 .
(∗)
¯ ¯1) ∈ H , also H Ist ord n ¯ ungerade, so ist ord H = ord (¯ n, ¯ 1) = 2 · ord n ¯ und (0, trivial. Ist m ungerade, so tritt nur dieser Fall auf. Ist ord n ¯ gerade, so ist ord H = ord n ¯ und (¯ 0, ¯1) ∈ / H , also H nicht trivial. Ist etwa m = 6 und n = 3, so ist ord n ¯ = 2 und H = {(¯ 3, ¯ 1), (¯ 6, ¯ 0) = (¯0, ¯0)} . Wir zeigen nun, dass jede nicht triviale Untergruppe H < Zm × Z2 von der Form (∗) mit geradem ord n ¯ ist. Dazu betrachten wir die Projektion
n ∈ Zm : (¯ n, ε) ∈ H für ein ε ∈ Z2 } < Zm . H = {¯ Nach I 3.10 ist H zyklisch, es gibt also ein d ∈ N mit 0 ≤ d ≤ m − 1 mit ¯ . Nach Denition gilt d| n für jedes (¯ n, ε) ∈ H . H = Erz (d) ¯ ¯0) ∈ H : ¯ ∈ H mit n Ist H nicht trivial, so gibt es ein (¯ n, 1) ¯ = ¯0. Angenommen, (d, ¯¯ ¯ ¯1) ∈ H , und Dann gibt es ein k ∈ N mit (¯ n, ¯ 1) + k(d, 0) = (¯0, ¯1) ∈ H . Also ist (d, ¯ ¯1). ord d muss, wie oben gezeigt, gerade sein. Das beweist H = Erz (d, Insgesamt ist damit gezeigt, dass es so viele nicht triviale Untergruppen von Zm × Z2 wie gerade Teiler von m gibt. Für ungerades m sind also alle Untergruppen trivial. Zum Beispiel hat m = 12 die 6 Teiler 1,2,3,4,6,12, davon 4 gerade. Daher gibt es in Z12 × Z2 6 · 2 + 4 = 16 Untergruppen , davon 12 trivial. Allgemeiner kann man versuchen, alle Untergruppen von Zm × Zn zu bestimmen. Sind m und n teilerfremd, so ist das Ergebnis nach den Sätzen aus I 3.9 und 10 klar: Zu jedem Teiler von m · n gibt es genau eine Untergruppe. Dagegen hat etwa Z6 ×Z6 insgesamt 30 verschiedene Untergruppen, davon 16 trivial. Die Einzelheiten seien dem Leser überlassen; als Anleitung kann das folgende Bild dienen (die Zahl über der Spalte gibt die Ordnung an).
68
I GRUPPEN
F.Q.pinxit
Beispiel 3
Bei einer viertägigen Tagung mit 9 Teilnehmern gibt es zum Abendessen drei Tische mit je drei Plätzen. Es soll eine Folge von Sitzordnungen gefunden werden, bei der jeder Teilnehmer mit jedem anderen Teilnehmer an genau einem Abend am gleichen Tisch sitzt. Der Tagungsleiter will immer am gleichen Tisch sitzen. Die Zahlen sind so gewählt, dass folgende Methode eine Lösung ergibt. Wir betrachten die Gruppe
G := Z3 × Z3 = {(i, j) : i, j ∈ {0, 1, 2}} . Jedes von (0, 0) verschiedene Element a ∈ G hat die Ordnung 3, erzeugt also eine Untergruppe H := Erz (a) < G mit ord H = 3 .
3.14 BEISPIELE
69
Zwei verschiedene Untergruppen der Ordnung 3 von G haben nur (0, 0) gemeinsam, also gibt es genau 9−1 =4 3−1 verschiedene Untergruppen der Ordnung 3. Sie sehen zusammen mit ihren Nebenklassen so aus:
Zu zwei verschiedenen Elementen a, b ∈ G gibt es genau eine Untergruppe H < G, nämlich H := Erz (b − a) mit a + H = b + H , d.h. a und b liegen in derselben Nebenklasse. Damit kann man die Sitzordnungen festlegen. Jedem Teilnehmer wird ein Gruppenelement zugeordnet, dem Tagungsleiter das neutrale Element (0, 0), und zu jedem Tag gehört eine Untergruppe. Die Untergruppe sitzt am Tisch des Tagungsleiters, die zugehörigen Nebenklassen an den beiden anderen Tischen. Für gröÿere und längere Tagungen kann man andere Zahlenkombinationen nden: Ist p eine Primzahl, so kann man für p2 Teilnehmer, p + 1 Tage und p Tische mit jeweils p Plätzen eine entsprechende Sitzordnung konstruieren. Das sei dem Leser zur Übung empfohlen. Man benutze dabei
p2 − 1 = (p + 1)(p − 1) .
Beispiel 4
Mit den nun zur Verfügung stehenden Hilfsmitteln über zyklische Gruppen kann man ganz einfach alle Gruppen der Ordnung ≤ 5 klassizieren. Ist ord G eine der Primzahlen p = 2, 3, 5, so ist G zyklisch, also G ∼ = Zp (I 3.7). Es bleibt der Fall ord G = 4. Ist G von einem Element erzeugt, so ist G zyklisch, also G ∼ = Z4 . Andernfalls ist G = Erz (a, b) = {e, a, b, c = ab} die zu Z2 × Z2 isomorphe Kleinsche Vierergruppe. Von der Ordnung 6 gibt es die Gruppen
Z6 und S3 . S3 ist also die kleinste nicht abelsche Gruppe. Von der Ordnung 7 gibt es nur die zyklische Gruppe Z7 .
70
I GRUPPEN
Von der Ordnung 8 gibt es die Gruppen
Z8 , Z4 × Z2 , Z2 × Z2 × Z2 , D4 und Q , wobei Q die Quaternionengruppe aus Beispiel 4 in I 1.9 bezeichnet. Mit etwas mehr theoretischem Werkzeug kann man zeigen, dass es bis auf Isomorphie keine weiteren Gruppen der Ordnung 6 und 8 gibt. (Beispiele 1 und 3 in I 6.13).
Beispiel 5
Sind in einer beliebigen Gruppe G zwei Elemente a, b vertauschbar (d.h. ab = ba), so gilt: ord (ab) = ord a · ord b ⇔ ord a und ord b teilerfremd . Zum
Beweis
betrachte man die zyklischen Untergruppen
G1 := Erz (a) < G
und
G2 := Erz (b) < G .
Wir setzen m := ord a = ord G1 , n := ord b = ord G2 und r := ord (ab). Haben m und n einen gemeinsamen Teiler d > 1, so ist m = dm und n = dn mit m , n ∈ N und es folgt
(ab)dm n = (am )n · (bn )m = e , also r < mn . Ist ggT (m, n) = 1, so behaupten wir, dass G1 G2 < G zyklisch von der Ordnung mn und von ab erzeugt ist. Da
G1 ∩ G2 ⊂ Gi für i = 1, 2 , gilt ord (G1 ∩ G2 )| ord Gi , also ist G1 ∩ G2 = {e}. Daher ist das Produkt G1 G2 direkt (I 3.3) und die Behauptung folgt aus dem Satz in I 3.9.
Beispiel 6
Das RSA-Kryptosystem
Im Jahr 1977 wurde von Rives, Shamir, Adleman eine sehr sichere Methode zur Verschlüsselung von Nachrichten entwickelt, die auf einfachen Eigenschaften von zyklischen Gruppen beruht. Der theoretische Hintergrund ist folgendes elementares Ergebnis, das durch geschickte Rechnung mit Kongruenzen nach verschiedenen Moduln bewiesen wurde.
Satz Seien p, q zwei verschiedene Primzahlen, n := p · q und Zn = Z/nZ der Restklassenring modulo n. Weiter sei k ∈ N mit 1 < k < ϕ(n) = (p − 1) · (q − 1) eine zu ϕ(n) teilerfremde Zahl. Dann ist die Abbildung σ : Z n → Zn ,
x → xk
bijektiv. Genauer gilt: Ist l ∈ N mit 1 < l < ϕ(n) eine weitere zu ϕ(n) teilerfremde Zahl mit k · l ≡ 1(mod ϕ(n))
3.14 BEISPIELE so ist die Umkehrabbildung von
71
σ gegeben durch
τ : Z n → Zn ,
y → y l .
Da Zn endlich ist, genügt es die Injektivität von σ zu zeigen; dazu genügt der Nachweis von (xk )l = x für alle x ∈ Zn .
Beweis
Da ord Zn× = ϕ(n) und k teilerfremd zu ϕ(n) ist, folgt diese Gleichung für alle x ∈ Zn× aus dem Lemma in I 2.4. Um sie für alle x ∈ Zn zu beweisen, hat man die Kongruenz
(mk )l ≡ m(mod n) für alle m ∈ Z
(∗)
zu zeigen. Nach den Voraussetzungen über k ist die Restklasse k + ϕ(n) · Z von × . Daher gibt es ein Inverses k eine Einheit im Ring Zϕ(n) , also enthalten in Zϕ(n) × , wobei man 1 < l < ϕ(n) annehmen kann. Also ndet man l + ϕ(n) · Z ∈ Zϕ(n) schlieÿlich ein r ∈ N, so dass
k · l = 1 + r · ϕ(n). Zum Beweis von (∗) genügt es nun zu zeigen, dass
mk·l ≡ m(mod p) und mk·l ≡ m(mod q), denn nach I 3.8 ist pZ ∩ qZ = pqZ. Da p und q gleichberechtigt sind, genügt es die erste Kongruenz zu beweisen. Im Fall p|m ist sie oensichtlich. Falls p m ist, können wir den kleinen Satz von Fermat aus Beispiel 9 in I 1.9 anwenden
mp−1 ≡ 1(mod p). Da ϕ(n) = (p − 1) · (q − 1), folgt daraus
mk·l = m1+r·ϕ(n) = m · (mp−1 )r·(q−1) ≡ m(mod p), was noch zu beweisen blieb.
2
Nun ein paar Worte zur praktischen Anwendung. Die Abbildung σ bewirkt eine Permutation der n Elemente von Zn , die durch τ wieder rückgängig gemacht wer× zu k ein Inverses den kann. Dazu muss man in der multiplikativen Gruppe Zϕ(n)
l bestimmen, das geht relativ einfach mit dem Euklidischen Algorithmus, wenn nicht nur n, sondern auch p und q und damit ϕ(n) bekannt sind. Für sehr kleine p und q kann man das ganz schnell ausrechnen. Ist etwa p = 3, q = 5, also n = 15 und ϕ(n) = 8, so kann man k = l = 3 wählen, denn 9 ≡ 1( mod 8). Die durch σ(x) = x3 bestimmte Permutation ist dann modulo 15 beschreiben durch
72
I GRUPPEN
x σ(x)
0 0
1 1
2 8
3 12
4 4
5 5
6 6
7 13
8 2
9 9
10 10
11 11
12 3
13 7
14 14
Der Leser kann zur Übung prüfen, dass sie durch y → y 3 rückgängig gemacht wird. Das geht auch ohne Rechnung! Nun soll eine Nachricht vom Absender zum Empfänger so übermittelt werden, dass sie jeder andere, der sie eventuell lesen konnte, nicht verstehen kann. Dazu wird ein genügend groÿes vorgegebenes n = p · q gewählt, wobei die Primfaktoren p und q geheim gehalten werden. Das ist der Clou dabei: Man kann aus bekannten Primzahlen p und q ein solches n ausrechnen; die Primfaktoren von n zu rekonstruieren, erfordert für genügend groÿe n einen unüberwindlichen Rechenaufwand. Wenn n groÿ ist, kann die zu übermittelnde Nachricht in längere Blöcke gleicher Länge zerlegt werden; jeder Block wird durch eine Zahl zwischen 2 und n − 1 codiert. Der dabei verwendete Code kann allgemein bekannt sein. Die so aus der Nachricht entstandene Folge von Zahlen wird durch σ verschlüsselt und in dieser Form zusammen mit der Angabe der vom Absender gewählten Zahl k übermittelt. Der Empfänger kann die Nachricht nur dann entschlüsseln, wenn er einen zu k passenden Exponenten l und damit τ ndet; dazu muss er aber ϕ(n) und somit p und q kennen. Schlieÿlich wird die entschlüsselte Nachricht wieder von der Zahlenfolge in die ursprüngliche Form decodiert. Man beachte bei diesem Verfahren den grundlegenden Unterschied zwischen Codierung und Verschlüsselung: Die Codierung einer Nachricht - etwa die Übersetzung eines Textblockes in eine Zahl - soll in beiden Richtungen möglichst einfach und sicher sein. Eine Verschlüsselung dagegen soll besonders raniert sein, so dass sie nur mit besonderen geheim zu haltenden Hilfsmitteln entschlüsselt werden kann.
4. OPERATIONEN VON GRUPPEN AUF MENGEN
73
4 Operationen von Gruppen auf Mengen 4.1 Denition einer Operation Die symmetrische Gruppe S(M ) aller bijektiven Abbildungen einer Menge M auf sich operiert auf M . Es können aber auch Elemente einer anderen Gruppe G solche Abbildungen von M ergeben.
Denition
Eine eine Abbildung
Operation einer Gruppe G auf einer nicht leeren Menge M ist τ : G × M → M , (a, x) → τa (x) ,
mit τa·b (x) = τa (τb (x)) und τe (x) = x für alle a, b ∈ G und x ∈ M . Anstelle von τa (x) schreibt man meist a(x), dann lautet die obige Verträglichkeitsregel (ab)(x) = a(b(x)) und e(x) = x . Den Zusammenhang mit der symmetrischen Gruppe zeigt die
Bemerkung
Sei G eine Gruppe und M eine nicht leere Menge.
a) Ist τ eine Operation von G auf M , so ist für jedes a ∈ G die Abbildung τa : M → M , x → τa (x) ,
bijektiv und die Abbildung G → S(M ) , a → τa ,
ist ein Gruppenhomomorphismus. b) Umgekehrt ist für jeden Gruppenhomomorphismus τ : G → S(M ) , a → τa ,
die Abbildung
G × M → M , (a, x) → τa (x) ,
eine Operation. Die einzige kleine Schwierigkeit im Beweis besteht darin zu zeigen, dass die Abbildung τa auf M bijektiv ist. Dazu benutzt man, dass τa−1 eine Umkehrabbildung ist, in Zeichen (τa )−1 = τa−1 . Dazu ist nachzuprüfen, dass τa ◦ τa−1 = idM = τa−1 ◦ τa . Das folgt aber sofort aus
τa−1 (τa (x)) = τe (x) = τa (τa−1 (x)) für alle a ∈ G und alle x ∈ M .
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9_4, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
2
74
I GRUPPEN
Es ist klar, dass die Bedingung τe = idM nicht überüssig ist. Ist etwa M = {0, 1} und G beliebig, so ist durch τa (x) = 0 für alle a ∈ G und x ∈ M keine Operation von G auf M erklärt. Eine Operation von G auf M kann man also auch als Homomorphismus
τ : G → S(M ) erklären. Dann ist τ (G) < S(M ), aber τ muss nicht injektiv sein. Man nennt die Operation eektiv , wenn τ injektiv ist. Nach dem Ersten Isomorphiesatz (I 3.1) kann man jedes τ eektiv machen durch Übergang zu τ¯ : G/Ker τ → S(M ) . Schlieÿlich nennt man eine Operation von G auf M transitiv , wenn es zu x, y ∈ M ein a ∈ G gibt mit a(x) = y , und einfach transitiv , wenn a ∈ G zu x, y ∈ M eindeutig bestimmt ist.
4.2 Beispiele und Satz von
Cayley
Interessante geometrische Beispiele für Gruppenoperationen werden wir in § 5 beschreiben. Zunächst einige elementare Situationen:
Beispiel 1
Ist K ein Körper, so ist durch jede invertierbare Matrix A ∈ GL(n; K) eine bijektive Abbildung K n → K n , x → Ax , erklärt. In dieser Weise operiert GL (n; K) auf K n ; die Operation ist nicht transitiv, da der Nullpunkt stets fest bleibt.
Beispiel 2
Eine Gruppe G operiert in verschiedener Weise auf sich selbst
G × G → G , (a, x) → a · x ,
Linkstranslation ,
G × G → G , (a, x) → axa−1 ,
Konjugation ,
und falls G abelsch ist (Beispiel 7 aus I 2.2)
G × G → G , (a, x) → x · a ,
Rechtstranslation .
Die Translationen sind eektiv und einfach transitiv, die Konjugation ist für G = {e} nicht transitiv. Da abstrakte Gruppen erst später als Permutationsgruppen untersucht wurden, ist folgendes Ergebnis aus historischer Sicht erwähnenswert.
Satz von Cayley trischen Gruppe.
Jede Gruppe ist isomorph zu einer Untergruppe einer symme-
75
4.3 BAHNENRAUM UND STANDGRUPPE
Beweis
Man kann M = G wählen; dann ist die Abbildung
τ : G → S(G) , a → la , injektiv, also G ∼ = τ (G) < S(G).
2
Dieses Ergebnis kann man auch so sehen: Die kompliziertest möglichen Situationen der Gruppentheorie können innerhalb der symmetrischen Gruppen auftreten.
4.3 Bahnenraum und Standgruppe Ist die Operation einer Gruppe auf einer Menge transitiv, so kann jeder Punkt in jeden anderen transportiert werden. Im Allgemeinen geht das nicht. Operiert G auf M und ist x ∈ M , so heiÿt
G(x) := {a(x) ∈ M : a ∈ G} ⊂ M die
Bahn von x.
Aus der Denition einer Operation folgt, dass G(x) = G(y) für y ∈ G(x), und dass durch x ∼ y := y ∈ G(x) G
eine Äquivalenzrelation auf M erklärt wird. Die Menge M/ ∼ heiÿt G
Bahnenraum .
Ist N ⊂ M , so heiÿt StaG (N ) := {a ∈ G : a(N ) = N } ⊂ G
Standgruppe
Isotropiegruppe
Stabilisator
die (oder , oder ) von N bezüglich der Operation von G auf M . Es ist StaG (N ) < G, denn für a, b ∈ StaG (N ) ist
(ab−1 )(N ) = a(b−1 (N )) = a(N ) = N . Da eine Menge unter der Operation einer Gruppe in disjunkte Bahnen zerlegt wird, hat man eine gute Möglichkeit zur Abzählung der Elemente.
Bahn-Lemma Operiert G auf M und ist x ∈ M , so gilt
Beweis
ord G
=
(ord G(x)) · (ord StaG (x)) , d.h.
ord G(x)
=
ind (G : StaG (x))
.
Wir setzen H := StaG (x) und zeigen, dass es eine bijektive Abbildung
μ : G(x) → G/H , a(x) → aH , gibt. Dann folgt die Behauptung aus dem Satz von
Lagrange (I 2.4).
76
I GRUPPEN
Für a, b ∈ G ist
a(x) = b(x) ⇔ (a−1 b)(x) = x ⇔ a−1 b ∈ H ⇔ aH = bH , 2
also ist μ wohldeniert und injektiv. Oensichtlich ist μ auch surjektiv.
Vertretersystem
Unter einem der Bahnen versteht man eine Teilmenge V ⊂ M , die aus jeder Bahn genau ein Element enthält. Durch Addition der im Bahn-Lemma berechneten Ordnungen der Bahnen erhält man unmittelbar die
Bahnengleichung
Operiert die Gruppe G auf der endlichen Menge M und ist V ⊂ M ein Vertretersystem der Bahnen, so gilt ord M =
ord G(x) =
x∈V
ind (G : StaG (x)) .
2
x∈V
4.4 Die Klassengleichung Die elementare Bahnengleichung hat wichtige Konsequenzen, wenn man spezielle Operationen einer Gruppe G betrachtet. Für a ∈ G hat man die Konjugation
κa : G → G, x → axa−1 , sie heiÿt auch ein Operation
innerer Automorphismus
von G. Daraus ergibt sich die
G × G → G, (a, x) → axa−1 ,
von G auf sich selbst. Die Standgruppe eines Elements x ∈ G, ZenG (x) := StaG (x) = {a ∈ G : axa−1 = x, d.h. ax = xa} , wird auch
Zentralisator von x in G genannt. Die Menge Z(G) := {a ∈ G : ax = xa für alle x ∈ G}
Zentrum
heiÿt auf G.
von G, seine Elemente operieren bei der Konjugation trivial
Ohne jede Mühe beweist man die
Bemerkung
Ist
G
eine Gruppe und
a)
Z(G) < ZenG (x) < G
b)
Z(G)
c)
G/Z(G)
ist abelsch und
x ∈ G,
so gilt:
sind Untergruppen.
Z(G) G
ist Normalteiler.
ist isomorph zur Gruppe der inneren Automorphismen von
G.
2
77
4.4 DIE KLASSENGLEICHUNG
Nun betrachten wie in G die Bahnen G(x) bei der Konjugation. G(x) = {x} ist gleichbedeutend mit x ∈ Z(G), die Elemente des Zentrums sind also die einelementigen Bahnen. Ist x ∈ / Z(G), so ist ZenG (x) = G, also ist ord G(x) = ind (G : ZenG (x)) > 1 und ein Teiler von ord G. Aus der allgemeinen Bahngleichung ergibt sich unmittelbar die
Klassengleichung
Ist
G
eine endliche Gruppe, und sind
x1 , . . . , x k
Vertreter
der mehrelementigen Bahnen bei der Konjugation, so gilt
ord G = ord Z(G) +
k
ind (G : ZenG (xi )) .
i=1
2 Diese Gleichung ist ein entscheidendes Werkzeug beim Beweis von Sätzen über die Struktur endlicher Gruppen in § 6. Hier nur ein kleiner Vorgeschmack:
Korollar
Ist
p
eine Primzahl und
G
eine Gruppe mit
ord G = p2 ,
so ist
G
abelsch.
Wir benutzen den folgenden
Hilfssatz
Ist
G/Z(G)
zyklisch, so ist
G
abelsch, also
Z(G) = G.
Wir setzen Z = Z(G) und wählen ein erzeugendes Element xZ von G/Z , wobei x ∈ G. Zu a, b ∈ G gibt es dann k, l ∈ Z und z, w ∈ Z mit
Beweis des Hilfssatzes
aZ = xk Z, bZ = xl Z
und
a = xk z, b = xl w .
Daraus folgt
ab = xk zxl w = xk+l zw = xk+l wz = xl wxk z = ba . 2 Für ord Z(G) kommen die Werte 1, p und p2 in Frage; es genügt, die Fälle 1 und p auszuschlieÿen. In den Termen der Klassengleichung teilt p die Indizes und ord G, also ist p Teiler von ord Z(G). Daher verbleiben nur die Fälle p und p2 . Aus
Beweis des Korollars
ord Z(G) = p
folgt
ord G/Z(G) = p ,
also ist G/Z(G) zyklisch und G abelsch; das ist ein Widerspruch zur Annahme Z(G) = G. 2
78
I GRUPPEN
4.5 Zyklenzerlegung einer Permutation Wir wenden nun die in I 4.3 erhaltene Zerlegung einer Menge in Bahnen auf eine Permutation σ ∈ Sn an. Damit wird die Struktur von σ klarer erkennbar und man kann dann einfacher mit Permutationen rechnen. Zunächst erklären wir besonders einfache Permutationen. Ist M eine beliebige nicht leere Menge, so heiÿt ein ξ ∈ S(M ) ein Zyklus der Länge m (oder m-Zyklus ), wenn es paarweise verschiedene x1 , . . . , xm ∈ X gibt, so dass
i = 1, . . . , m − 1 , ξ(xm ) = x1 und
ξ(xi ) = xi+1
für
ξ(x) = x
für alle
x ∈ X {x1 , . . . , xm } .
Man schreibt dafür ξ := (x1 , . . . , xm ). Man beachte, dass
(x1 , x2 , . . . , xm ) = (x2 , x3 , . . . , xm , x1 ) = . . . = (xm , x1 , . . . , xm−1 ) , (x1 , x2 , . . . , xm )−1 = (xm , xm−1 , . . . , x1 ) . Ein 1-Zyklus ist die Identität; ein 2-Zyklus τ = (x1 , x2 ) ist eine Transposition, er vertauscht x1 und x2 .
Bemerkung
a) Sind ξ = (x1 , . . . , xm ) und η = (y1 , . . . , yn )
Zyklen (d.h. {x1 , . . . , xm } ∩ {y1 , . . . , yn } = ∅), so ist
elementfremde
ξ◦η =η◦ξ ,
die Zyklen sind also vertauschbar. b) Jeder m-Zyklus ist Produkt von m − 1 Transpositionen. c) sign (x1 , . . . , xm ) = (−1)m−1 . d) ord (x1 , . . . , xm ) = m (vgl. I 2.4). Beweis a) ist klar, da die beiden Zyklen unabhängig voneinander wirken. b) folgt aus (x1 , . . . , xm ) = (x1 , xm ) ◦ (x1 , xm−1 ) ◦ . . . ◦ (x1 , x2 ). c) folgt aus b) und sign (x1 , xj ) = −1. (Bemerkung in Beispiel 6 aus I 2.2) d) Ist ξ = (x1 , . . . , xm ), so gilt oenbar ξ m = id, also ord ξ ≤ m. Andererseits ist für k < m ξ k (x1 ) = xk+1 = x1 . 2 Die Bedeutung der Zyklen wird klarer durch den
Satz über die Zyklenzerlegung einer Permutation
Für n ≥ 2 ist jedes σ ∈ Sn Produkt elementfremder Zyklen und die Faktoren sind bis auf die Reihenfolge eindeutig bestimmt. Beweis Wir betrachten die Gruppe G := Erz σ = {σ r : r ∈ Z} < Sn
4.5 ZYKLENZERLEGUNG EINER PERMUTATION
79
und ihre Operation auf M = {1, . . . , n}. Nach I 4.3 hat man eine disjunkte Zerlegung M = G(i1 ) ∪ . . . ∪ G(im ) in m ≤ n Bahnen, wobei ij ∈ G(ij ) für j = 1, . . . , m ein beliebiger Repräsentant ist. Ist G(i) eine dieser endlichen Bahnen, so gibt es dazu r, k ∈ N {0} mit
σ r (i) = σ r+k (i) , also i = σ k (i) . Ist k minimal gewählt, so folgt
G(i) = {i, σ(i), . . . , σ k−1 (i)} , ord G(i) = k . Zu dieser Bahn gehört der k -Zyklus
ξ = (i, σ(i), . . . , σ k−1 (i)) . Insgesamt erhält man elementfremde Zyklen ξ1 , . . . , ξm der Längen k1 , . . . , km mit k1 + . . . + km = n und es ist nach Konstruktion
σ = ξ1 ◦ . . . ◦ ξ m . Hat man umgekehrt eine solche Darstellung, so muss sie zu den Bahnen passen; daraus folgt die Eindeutigkeit. 2
Korollar
n ≥ 3, so gilt: σ ∈ Sn ist Produkt von Transpositionen. Permutation σ ∈ An ist Produkt von 3-Zyklen. Ist
a) Jede Permutation b) Jede
a) Nach dem Satz ist σ Produkt von Zyklen, nach der Bemerkung ist jeder Zyklus Produkt von Transpositionen. b) Wegen sign σ = +1 und sign τ = −1 für jede Transposition τ , ist σ Produkt einer geraden Zahl von Transpositionen. Also genügt es jedes Produkt von zwei Transpositionen als Produkt von 3-Zyklen darzustellen. Hierbei muss man unterscheiden, ob die beiden Transpositionen elementfremd sind oder nicht: Sind i, j, k, l paarweise verschieden, so folgt Beweis
(k, l) ◦ (i, j) = (i, l, k) ◦ (i, j, k) , (i, k) ◦ (i, j) = (i, j, k) . 2 Besonders nützlich für den Umgang mit Permutationen sind die folgenden
Rechenregeln
Ist σ = ξ1 ◦ . . . ◦ ξm ∈ Sn k1 , . . . , km , so gilt a) sign σ = (−1)k1 −1 · . . . · (−1)km −1 b) ord σ = kgV (k1 , . . . , km )
mit elementfremden Zyklen der Längen
80
I GRUPPEN
Beweis
Regel a) gilt, da das Signum multiplikativ ist. Zum Beweis von b) setzen wir k := ord σ . Da die ξi vertauschbar sind, folgt k|kgV (k1 , . . . , km ) aus der Bemerkung in I 2.4. Aus σ k = id folgt in diesem Fall auch ξik = id für alle i, da die Faktoren elementfremde Zyklen sind. Das ergibt ki | k und kgV (k1 , . . . , km )| k . 2
Vorsicht!
Über die Ordnung eines Produktes von nicht elementfremden Zyklen kann man keine brauchbare Vorhersage machen (Beispiel 3 in I 4.6).
4.6 Beispiele Wir geben einige Beispiele für das Rechnen mit Zyklen.
Beispiel 1
Sei
σ=
1
2
3
4
5
6
7
8
9
10
9
4
8
10
1
2
7
3
5
6
∈ S10 .
Dann ist σ = (1, 9, 5)(2, 4, 10, 6)(3, 8)(7), also sign σ = (+1)(−1)(−1)(+1) = +1
und
ord σ = kgV (3, 4, 2, 1) = 12 .
Beispiel 2
Die Potenz eines Zyklus muss kein Zyklus sein, zerfällt aber in ein Produkt von Zyklen gleicher Länge. Es ist etwa für ξ = (1, 2, 3, 4, 5, 6)
ξ2
=
(1, 3, 5)(2, 4, 6)
ξ
3
=
(1, 4)(2, 5)(3, 6)
ξ
4
=
(1, 5, 3)(2, 6, 4)
ξ
5
=
(1, 6, 5, 4, 3, 2)
ξ6
=
(1)(2)(3)(4)(5)(6) = id .
Allgemein zerfällt für einen m-Zyklus ξ die Potenz ξ n in ein Produkt von ggT (m, n) elementfremden Zyklen gleicher Länge m/ggT (m, n). Der Beweis davon mit Hilfe des Lemmas aus I 3.10 sei dem Leser überlassen.
Beispiel 3
Wir illustrieren mögliche Ordnungen des Produkts von zwei nicht vertauschbaren Permutationen. Bei Transpositionen ist
(2, 3)(1, 2) = (1, 3, 2) , also hat das Produkt die Ordnung 3. Nun betrachten wir Transpositionen und 3-Zyklen.
81
4.6 BEISPIELE
Ist τ = (1, 2) und ξ = (2, 3, 4) ∈ S4 , so ist τ ξ = (1, 2, 3, 4), also ist ord τ = 2 , ord ξ = 3 , ord (τ ξ) = 4 . Ist τ1 = (1, 5) , τ2 = (3, 2) , ξ = (1, 3, 4) ∈ S5 , so ist τ1 τ2 ξ = (1, 2, 3, 4, 5), also ord (τ1 τ2 ) = 2 , ord ξ = 3 , ord ((τ1 τ2 ) · ξ) = 5 . Ist τ1 = (1, 5) , τ2 = (3, 2) , ξ1 = (1, 3, 4) , ξ2 = (5, 6, 7) ∈ S7 , so ist τ1 τ2 ξ1 ξ2 = (1, 2, 3, 4, 5, 6, 7), also ord (τ1 τ2 ) = 2 , ord (ξ1 ξ2 ) = 3 , ord ((τ1 τ2 )(ξ1 ξ2 )) = 7 .
Beispiel 4
Mit Hilfe der Zyklenzerlegung von Permutationen erhält man wichtige Informationen über die Struktur der Gruppen Sn . Wir führen das für S3 und S4 aus. Elemente von S3
Anzahl
Ordnung
Signum
id
1
1
+
(1, 2), (1, 3), (2, 3)
3
2
−
(1, 2, 3), (3, 2, 1)
2
3
+
Summe
6
Elemente von S4
Anzahl
Ordnung
Signum
id
1
1
+
(1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4)
6
2
−
8
3
+
6
4
−
(1, 2) · (3, 4), (1, 3) · (2, 4), (2, 3) · (1, 4)
3
2
+
Summe
24
(1, 2, 3), (1, 2, 4), (1, 3, 4), (2, 3, 4) (3, 2, 1), (4, 2, 1), (4, 3, 1), (4, 3, 2) (1, 2, 3, 4), (1, 3, 2, 4), (1, 4, 2, 3) (1, 2, 4, 3), (1, 3, 4, 2), (1, 4, 3, 2)
82
I GRUPPEN
Folgende Informationen seien notiert:
Ordnungen von Elementen
In S3 gibt es Elemente der Ordnung 1, 2 und 3, aber kein Element der Ordnung 6. In S4 gibt es Elemente der Ordnung 1, 2, 3 und 4, aber keine der weiteren Teiler 6, 8, 12 und 24 von 24.
Ordnungen von Untergruppen gen 2 und 3.
In S3 gibt es echte Untergruppen der Ordnun-
In S4 gibt es neben den von Elementen erzeugten zyklischen Untergruppen der Ordnungen 2, 3 und 4 auch Untergruppen der
Ordnung 6, etwa S3 , Ordnung 8, etwa D4 erzeugt von (1, 2, 3, 4) und (2, 3), Ordnung 12, nämlich A4 . In A4 gibt es keine zu S3 isomorphe Untergruppe: Beide enthalten 3 Elemente der Ordnung 2. Aber in A4 bilden sie zusammen mit id eine Untergruppe, isomorph zur Kleinschen Vierergruppe. Dagegen erzeugen die drei Transpositionen von S3 die ganze Gruppe S3 . Da nicht einmal S4 ein Element der Ordnung 6 enthält, kann A4 keine zyklische Untergruppe der Ordnung 6 enthalten. In Beispiel 1 aus I 6.13 werden wir sehen, dass jede Gruppe der Ordnung 6 entweder zyklisch oder isomorph zu S3 ist. Daraus folgt dann:
alt keine U ntergruppe der Ordnung 6 , A4 enth¨ obwohl 6 ein Teiler von 12 ist. Also gibt es keine Umkehrung des Lagrange.
Satzes von
Wirkung der Konjugation Die in I 4.4 untersuchten Bahnen bei der Konjugation nennt man auch Konjugationsklassen . Zwei Permutationen σ, σ ∈ Sn
liegen in der gleichen Konjugationsklasse, wenn es ein τ ∈ Sn gibt mit
σ = τ ◦ σ ◦ τ −1 . Es ist einfach zu sehen, dass dies gleichbedeutend damit ist, dass σ und σ die gleiche besitzen, denn eine Konjugation bedeutet nicht mehr als eine Umverteilung der Nummern. Da der allgemeine Fall nur mit einigem formalen Aufwand beschrieben werden kann, geben wir ein typisches Beispiel in S5 .
Zyklenstruktur
Ist σ = (1, 2, 3) · (4, 5) und τ = (1, 4), so folgt
τ · σ · τ −1 = (1, 5)(2, 3, 4) . Das ist die gleiche Zyklenstruktur, nämlich das Produkt von einem 2-Zyklus mit einem 3-Zyklus. Umgekehrt erhält man zu σ und σ ein τ , indem man σ und σ übereinanderschreibt:
83
4.6 BEISPIELE
σ := (1, 2, 3)(4, 5) σ := (2, 3, 4)(1, 5)
und τ :=
1 2
2 3
3 4
4 1
5 5
= (1, 2, 3, 4) .
Dann ist τ · σ · τ −1 = σ . Daran sieht man auch, dass τ nicht eindeutig bestimmt ist. Die Klassengleichungen in S3 und S4 kann man damit aus den obigen Tabellen ablesen, wobei das Zentrum nur aus dem neutralen Element besteht.
S3 : S4 :
Beispiel 5 phismus
6=1+3+2, 24 = 1 + 6 + 8 + 6 + 3 .
Zu jedem beliebigen Körper K gibt es einen kanonischen Monomor-
ψ : Sn −→ GL (n; K) ,
der wie folgt erklärt ist. Bezeichnen e1 , . . . , en ∈ K n die kanonischen Basisvektoren, so gibt es zu jedem σ ∈ Sn eine eindeutig bestimmte Permutationsmatrix Aσ mit Aσ · ei = eσ(i) und ψ(σ) := Aσ .
Aσ entsteht aus En , indem man mit σ die Spalten permutiert. Da ψ injektiv ist, kann Sn als Untergruppe von GL (n; K) angesehen werden. Andrerseits ist nach dem Satz von Cayley aus I 4.2 jede Gruppe G Untergruppe von S(G). Damit ist jede endliche Gruppe G der Ordnung n auch Untergruppe von GL (n; K). Das zeigt, dass alle möglichen Verknüpfungen in endlichen Gruppen durch die Multiplikation von Matrizen beschrieben werden können. Allerdings geht das im Allgemeinen mit einem n, das wesentlich kleiner als die Gruppenordnung ist (vgl. etwa die Quaternionengruppe der Ordnung 8 als Untergruppe von GL (2; C) in Beispiel 4 aus I 1.9). Die Einträge in Aσ sind nur 0 und 1. Daher kann man sich auf den kleinsten Körper K = F2 = {0, 1} beschränken. Dass die Abbildung ψ nie surjektiv sein kann, folgt aus dem
Hilfssatz
Für n ≥ 2 gilt ord GL (n; F2 ) > n!
Beweis Man muss die invertierbaren Matrizen mit Einträgen {0, 1} abzählen. In Fn2 gibt es 2n Vektoren. In der ersten Spalte ist nur der Nullvektor ausgeschlossen; für 1 ≤ k ≤ n sind in der Spalte k alle Linearkombinationen der Spalten 1, . . . , k−1 ausgeschlossen. Also hat man 2n − 2k−1 Möglichkeiten und ord GL (n; F2 ) =
n
(2n − 2k−1 ) .
k=1
Nach der Formel für die geometrische Reihe ist
2 −2 n
k−1
k−1
=2
(2
n−k+1
− 1) = 2
k−1
n−k
r=0
2r ≥ 2k−1 (n − k + 1) ≥ n − k + 1 ,
84
I GRUPPEN
daraus folgt die behauptete Ungleichung. Schon für n = 2 gibt es 6 invertierbare Matrizen. 2 Ist allgemeiner K ein endlicher Körper mit q = pr Elementen (vgl. III 3.4), so kann man ganz analog beweisen, dass ord GL (n; K) =
n
(q n − q k−1 ) .
k=1
Insbesondere folgt wegen q ≥ 2, dass ord GL (n; K) ≥ ord GL (n; F2 ).
Beispiel 6
Zunächst ist
Wir bestimmen das Zentrum für die Gruppen Sn , An und GL (n; K). S2 für n = 2 , Z(Sn ) = {e} für n = 2 .
S1 = {e} und S2 ist abelsch. Also bleibt der Fall n ≥ 3 zu behandeln. Dazu zeigen wir, dass es zu jedem σ ∈ Sn mit σ = e ein τ ∈ Sn gibt, so dass στ = τ σ . Es gibt i, j ∈ {1, . . . , n} mit σ(i) = i und i = j = σ(i). Ist dann τ := (i, j), so ist
(σ ◦ τ )(i) = σ(j) = σ(i) = (τ ◦ σ)(i) . Weiter ist
Z(An ) =
An für {e} für
n≤3, n≥4.
Für n ≤ 3 ist die Aussage klar, da An abelsch ist. Sei also n ≥ 4 und σ ∈ A4 mit σ = id. Wir können annehmen, dass σ(1) = 2. Da n ≥ 4, gibt es ein i mit i = 2 und i = σ(2). Daher gilt
((1, 2, i) ◦ σ)(1) = σ(2) = (σ ◦ (1, 2, i))(1) . Etwas schwieriger ist der Beweis von
Z(GL (n; K)) = {λEn : λ ∈ K × } für jeden Körper K . Die Inklusion ⊃ ist klar; zum Beweis von ⊂ zeigen wir zuerst, dass eine Matrix A = (aij ) aus dem Zentrum keinen Eintrag auÿerhalb der Diagonalen besitzt, d.h. für i = j muss aij = 0 sein. Dazu verwenden wir die aus der linearen Algebra bekannte Elementarmatrix Bji mit Einsen in der Diagonalen und an der Stelle (j, i), sonst Nullen. Dann ist für aij = 0
Bji · A = A · Bji , denn aii = aii + aij , das sind die Einträge an der i-ten Stelle der Diagonalen der Produktmatrizen. Angenommen A ist eine Diagonalmatrix mit aii = ajj für i = j . Ist Pij die zur Transposition (i, j) gehörende Permutationsmatrix, so ist
Pij · A = A · Pij , weil die Einträge in den Zeilen i und j der Produktmatrizen verschieden sind.
5. SYMMETRIEGRUPPEN∗
85
5 Symmetriegruppen∗ Mit den nun zur Verfügung stehenden Techniken der Gruppentheorie können wir die Struktur der Symmetriegruppen einiger geometrischer Figuren aufklären. Wir beginnen mit den regelmäÿigen n-Ecken in der Ebene, dann folgen die Platonischen Körper. Viele weitere Untersuchungen dazu ndet man etwa bei [N-S-T] und [Kn].
5.1 Regelmäÿige n-Ecke und die Diedergruppe Zur Beschreibung regelmäÿiger n-Ecke Pn ⊂ R2 benutzen wir für n ∈ N {0} die primitive komplexe n-te Einheitswurzel
ζn := exp
2π i ∈ C = R2 n
Ihre Potenzen ζn0 = 1, ζn , ζn2 , . . . , ζnn−1 bilden die n Ecken von Pn .
Unter einer Symmetrie von Pn versteht man eine Isometrie des R2 , die Pn auf sich abbildet. Für n ≥ 2 muss sie den Ursprung fest lassen, wird also durch eine orthogonale Matrix beschrieben. Um Fallunterscheidungen zu vermeiden, setzen wir das auch für n = 1 beim armen Eineck voraus. Bei der Symmetrie ist noch zu beachten, ob die Orientierung erhalten wird. Nach diesen Vorbemerkungen erklären wir für n ≥ 1 die Symmetriegruppen Sym (Pn ) := {A ∈ O(2) : A(Pn ) = Pn } < O(2) und Sym+ (Pn ) := {A ∈ Sym (Pn ) : det A = +1} < SO(2) . Zur Beschreibung der Struktur dieser Gruppen bezeichnen wir zur Abkürzung mit Zn = Z/nZ die zyklische Gruppe der Ordnung n und mit
Dn = D(Zn ) = Zn ×Φ Z2
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9_5, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
86
I GRUPPEN
die in Beispiel 5 aus I 3.6 erklärte Diedergruppe der Ordnung 2n, wobei
Zn ∼ = Zn × {1} Dn .
Satz Für ein regelmäÿiges n-Eck Pn ⊂ R2 mit n ≥ 1 gibt es Isomorphismen Sym (Pn ) ∪ Sym+ (Pn )
∼ =
−→ ∼ =
−→
Dn ∪ Zn .
Man beachte, dass Zn abelsch, aber Dn für n ≥ 3 nicht abelsch ist.
Beweis
Wir behandeln zunächst den orientierbaren Fall und wir zeigen, dass alle orientierungserhaltenden Symmetrien Drehungen um ein ganzzahliges Vielfaches des Winkels 2π/n sind. Dazu erinnern wir, dass es zu jeder Matrix A ∈ SO (2) einen Winkel ϕ ∈ [0, 2π[ gibt mit cos ϕ − sin ϕ . A = Aϕ = sin ϕ cos ϕ Ist nun A eine Symmetrie, also A(Pn ) = Pn , so muss die Ecke 1 auf eine Ecke
ζnk = exp
2π ik = eiϕ n
mit
ϕ=k
2π n
abgebildet werden, also ist A = Aϕ . Da Aψ ◦ Aϕ = Aϕ+ψ erhält man einen Homomorphismus α : Sym+ (Pn ) → Zn , A → k + nZ . Umgekehrt gehört zu jedem Winkel ϕ = k 2π n mit 0 ≤ k ≤ n − 1 genau eine Symmetrie Aϕ , also ist α ein Isomorphismus. Für den allgemeinen Fall erinnern wir zunächst daran, dass SO (2) abelsch, aber O(2) nicht abelsch ist. Die Matrix 1 0 S := mit det S = −1 0 −1 beschreibt die Spiegelung an der x-Achse, komplex gesehen die Konjugation z → z . Da ζnk = ζn−k ist S(Pn ) = Pn , also S ∈ Sym (Pn ) Sym+ (Pn ) . Der Normalteiler Sym+ (Pn ) Sym (Pn ) (als Kern der Determinante) hat demnach den Index 2, also hat man eine disjunkte Vereinigung Sym (Pn ) = Sym+ (Pn ) ∪ Sym+ (Pn ) · S . Bezeichnet H := {E, S} < Sym (Pn ) die zu Z2 isomorphe Untergruppe, so folgt Sym (Pn ) = Sym+ (Pn ) · H .
5.2 ENDLICHE UNTERGRUPPEN VON O(2)
87
Da Sym+ (Pn ) ∩ H = {E}, ist Sym (Pn ) Produkt der beiden Untergruppen. Um zu prüfen, ob H ein Normalteiler ist, und um den geometrischen Hintergrund aufzuhellen, benutzen wir die Beziehung
Aϕ · S = S · A−1 ϕ
für alle ϕ ∈ R .
(∗)
Oensichtlich sind die beiden Matrizen links und rechts gleich cos ϕ sin ϕ = SA−ϕ , sin ϕ − cos ϕ und diese Abbildung beschreibt eine Spiegelung an der Geraden mit dem Winkel ϕ/2.
Aus (∗) folgt sofort Aϕ SA−1 ϕ = A2ϕ S . Also ist H genau dann Normalteiler, wenn mit ϕ = 2π n A2ϕ = E gilt , d.h. n = 1 oder 2 . Daher ist für n ≥ 3
Sym (Pn ) = Sym+ (Pn ) H
semidirektes Produkt. Die Isomorphie zur Diedergruppe erkennt man an den typischen Relationen
Anϕ = E , S 2 = E
und
Aϕ S = SA−1 ϕ .
Für n = 1 ist Z1 = {E} und D1 = {E, S} ∼ = Z2 , für n = 2 ist D2 ∼ = Z2 × Z2 die abelsche Kleinsche Vierergruppe. 2
5.2 Endliche Untergruppen von
O(2)
Wie wir gerade gesehen haben, gibt es die endlichen Untergruppen Z < SO(2) und D < O(2) n
n
88
I GRUPPEN
als Symmetriegruppen eines regulären n-Ecks. Wir wollen nun zeigen, dass dies in SO(2) alle und in O(2) im Wesentlichen alle endlichen Untergruppen sind. Dies ist ein weiterer Hinweis auf die engen Beziehungen zwischen Gruppentheorie und Geometrie. Was bedeutet im Wesentlichen? Das reguläre n-Eck Pn war so gewählt, dass (1, 0) ein Eckpunkt war, durch die spezielle Spiegelung S an der x-Achse bleibt er fest. Verwendet man ein um den Winkel ϕ gedrehtes n-Eck Pn = Aϕ (Pn ), so ist Sym (Pn ) = Aϕ · Sym (Pn ) · A−1 ϕ , also eine konjugierte Untergruppe. Da Sym + (Pn ) abelsch ist, hat die Konjugation im orientierbaren Fall keine Wirkung. Nach diesen Vorbemerkungen der
Satz über die endlichen Untergruppen von
O(2) a) Ist G < SO (2) endlich, ord G = n, so ist G = Sym+ (Pn ). Insbesondere ist G zyklisch und erzeugt von einer Drehung. b) Ist G < O(2) endlich, G ⊂ SO (2), so ist G konjugiert zu einer Gruppe Sym (Pn ), d.h. es gibt ein A ∈ SO(2) derart, dass
G = A · Sym (Pn ) · A−1 .
Insbesondere ist G isomorph zur Diedergruppe Dn und ord G = 2n. Beweis a) Jedes A ∈ SO (2) ist von der Form cos α − sin α Aα = sin α cos α mit α ∈ [ 0, 2π[. Ist G = {E}, so gibt es ein Aα ∈ G mit α > 0; wir setzen
ϕ := min{α : 0 < α < 2π , Aα ∈ G} . Da G endlich ist, folgt 0 < ϕ < 2π . Wir zeigen, dass es ein n ∈ N mit n ≥ 2 und nϕ = 2π gibt. Dazu nehmen wir das minimale n ∈ N mit (n + 1)ϕ > 2π ; insbesondere ist nϕ ≤ 2π . Angenommen es wäre
nϕ < 2π < (n + 1)ϕ . Dann ist ψ := (n + 1)ϕ − 2π < ϕ und Aψ ∈ G im Widerspruch zur Minimalität von ϕ. Es folgt, dass die zu Zn isomorphe Gruppe
G = Erz (Aϕ ) = {Akϕ : k = 0, . . . , n − 1} in G enthalten ist. Angenommen G = G: Dann gibt es ein Aψ ∈ G mit ψ∈ / {kϕ : k = 0, . . . , n − 1}. Daher gibt es ein k mit
kϕ < ψ < (k + 1)ϕ , also 0 < ψ − kϕ < ϕ .
5.3 SYMMETRIEN DES TETRAEDERS
89
Aus Aψ−kϕ ∈ G ergibt sich ein Widerspruch, und G = G ist bewiesen.
b) Ist G ⊂ SO (2), so setzen wir G+ := G ∩ SO (2) = {A ∈ G : det A = 1} G . Ist n := ord G+ , so ist G+ = Sym+ (Pn ) nach Teil a) und ord G = 2n. Ist B ∈ G G+ , so ist
B=
cos ψ
sin ψ
sin ψ
− cos ψ
für ein
ψ ∈ [ 0, 2π[ ,
also B 2 = E und H := {E, B} < G. Da G+ G vom Index 2 ist, hat man ein semidirektes Produkt
G = G+ H = G+ ∪ G+ · B . Ist ϕ =
ψ 2,
so ist B = Aϕ SA−1 ϕ und somit −1 G+ B = G+ (Aϕ SA−1 ϕ ) = Aϕ (G+ S)Aϕ ,
also insgesamt G = Aϕ · Sym (Pn ) · A−1 ϕ .
2
5.3 Symmetrien des Tetraeders Die fünf Platonischen Körper werden im Anhang beschrieben. Grundlegend für die Bestimmung ihrer Symmetriegruppen ist das Ergebnis der linearen Algebra, dass jede Matrix A ∈ SO (3) einen Eigenwert +1 hat, d.h. eine Drehung um eine Achse im R3 beschreibt [Fi1 , 5.5.4]. Auÿerdem sei daran erinnert, dass O(3) ∼ = SO(3) × Z2 ein direktes Produkt ist (Beispiel 3 aus I 3.6). Bei der Untersuchung der Symmetriegruppen beginnen wir mit dem Tetraeder T . Es wird so in den R3 gelegt, dass die Ecken p1 , . . . , p4 auf der Einheitskugel liegen. Dann ist Sym (T ) := {A ∈ O (3) : A(T ) = T } und Sym+ (T ) := Sym (T ) ∩ SO (3) ; man nennt diese Gruppen
Tetraedergruppen .
Die Ordnung von Sym+ (T ) kann man leicht angeben: Man zeichnet sich ein Dreieck auf und überlegt, wie viele Möglichkeiten es gibt, das Tetraeder darauf zu stellen: T besteht aus 4 Dreiecken, jedes kann man auf 3 Arten darauf stellen. Also ist ord Sym+ (T ) = 4 · 3 = 12
90
I GRUPPEN
plausibel. Formaler geht diese Rechnung mit dem Bahn-Lemma aus I 4.3. Ist G := Sym+ (T ) und p ∈ T eine Ecke, so gilt ord G = (ord G(p)) · ord StaG (p) = 4 · 3 = 12 , da G auf den Ecken transitiv operiert. Durch die Operation von G auf den 4 Ecken wird eine Permutationsdarstellung
χ : Sym (T ) → S4 erklärt. Damit lässt sich das Ergebnis so formulieren.
Satz Für das Tetraeder T ist χ ein Isomorphismus und man hat ein Diagramm Sym (T ) ∨ Sym+ (T )
∼ =
−→ ∼ =
−→
S4 ∨ A4 .
Beweis Da nur E ∈ O(2) alle Ecken von T fest lässt, ist χ injektiv. Um nachzuweisen, dass χ surjektiv ist, genügt es jede Transposition τ ∈ S4 der Ecken durch ein B ∈ Sym (T ) darzustellen. Ist etwa τ = (1, 2), so tut es die Spiegelung B an der Ebene durch p3 , p4 und den Ursprung. Nach dem Korollar aus I 4.5 wird A4 erzeugt von allen Dreierzyklen. Ist etwa σ = (1, 2, 3) ∈ A4 , so nehme man für A ∈ Sym+ (T ) die Drehung mit der Achse durch p4 und den Ursprung um den Winkel 2π 3 . Alle anderen Dreierzyklen erhält man durch analoge Drehungen.
2 Aus der oben benutzten Ebenenspiegelung B erhält man eine zu Z2 isomorphe Untergruppe H := {E, B} < Sym (T ) ,
5.4 SYMMETRIEN VON WÜRFEL UND OKTAEDER
91
die kein Normalteiler ist, und man sieht ganz einfach, dass Sym (T ) = Sym+ (T ) H ein nicht direktes semidirektes Produkt ist. Der geometrische Grund dafür ist, dass die durch −E3 beschriebene Punktspiegelung keine Symmetrie des Tetraeders ist. Bei den vier anderen Platonischen Körpern ist das der Fall; das sieht man ganz deutlich an den im Anhang beschriebenen Konstruktionen. Eine explizite Beschreibung der 24 Symmetrien des Tetraeders kann man der Liste der Elemente von S4 in Beispiel 4 aus I 4.6 entnehmen.
5.4 Symmetrien von Würfel und Oktaeder Oktaeder und Würfel sind dual, haben also die gleichen Symmetriegruppen. Wir betrachten den Würfel W mit den 8 Ecken
p1 = (1, 1, 1) , p1 = −p1 , p2 = (−1, 1, 1) , p2 = −p2 , p3 = (−1, −1, 1) , p3 = −p3 , p4 = (1, −1, 1) , p4 = −p4 . Er hat die Symmetriegruppen Sym (W ) := {A ∈ O(3) : A(W ) = W }) und Sym+ (W ) := Sym (W ) ∩ SO (3) ,
man nennt sie die
Würfelgruppen .
Die orientierbaren Symmetrien operieren wieder transitiv auf den 8 Ecken und der Stabilisator einer Ecke hat die Ordnung 3, also ist ord Sym+ (W ) = 8 · 3 = 24 . Durch die geometrische Überlegung, wie viele Möglichkeiten es gibt, den Würfel auf ein Quadrat zu stellen, erhält man 6 · 4 = 24. Im Gegensatz zum Tetraeder sind die Paare von Ecken des Würfels nicht mehr gleichberechtigt: Nicht alle Paare sind durch eine gemeinsame Kante verbunden. Daher ist es nicht Erfolg versprechend, die Symmetriegruppe mit der Gruppe S8 der Permutationen zu vergleichen. Der Kni ist nun, die vier Diagonalen
pi pi
i = 1, . . . , 4 ,
zu betrachten. Bei jeder Symmetrie werden die Diagonalen permutiert, das ergibt eine Permutationsdarstellung
χ : Sym (W ) → S4 . Das Ergebnis ist der
92
I GRUPPEN
Satz Für den Würfel W ist die Darstellung χ surjektiv, Ker χ = {E3 , −E3 } ∼ = Z2 und χ induziert Isomorphismen Sym (W ) ∪ Sym+ (W )
∼ =
−→ ∼ =
−→
S4 × Z 2 ∪ S4 .
Man beachte, dass das Produkt S4 × Z2 direkt und nicht nur semidirekt ist!
Beweis
Es genügt zu zeigen, dass die Einschränkung von χ
χ+ : Sym+ (W ) → S4 surjektiv ist. Da ord S4 = 24 = ord Sym+ (W ), ist dann χ+ ein Isomorphismus. Wie wir in Beispiel 3 aus I 3.6 gesehen haben, ist O (3) = SO (3) ∪ SO (3) · (−E3 ) ∼ = SO (3) × Z2 , da 3 ungerade ist. Daher ist Sym (W ) = Sym+ (W ) ∪ Sym+ (W ) · (−E3 ) ∼ = Sym+ (W ) × Z2 . Die Matrix −E3 beschreibt die Spiegelung am Ursprung, bei der alle Diagonalen fest bleiben; also ist −E3 ∈ Ker χ = {E3 , −E3 }. Für die Surjektivität von χ+ geben wir einen geometrischen Beweis. Jedes A ∈ Sym+ (W ) ist eine Drehung, je nach der Lage der Drehachse zum Würfel unterscheiden wir drei Typen: Typ a:
Die Achse geht durch die Mittelpunkte gegenüberliegender Quadrate.
Typ b:
Die Achse geht durch die Mittelpunkte gegenüberliegender Kanten.
Typ c:
Die Achse geht durch gegenüberliegende Ecken, d.h. sie enthält eine Diagonale.
93
5.4 SYMMETRIEN VON WÜRFEL UND OKTAEDER
Sind die Achsen so wie im Bild gelegt, ergeben Drehungen folgende Permutationen der Diagonalen: Typ
Drehwinkel
Permutation
Signum
a
π 2
(1, 2, 3, 4)
−
a
π
(1, 3)(2, 4)
+
a
3π 2
(1, 4, 3, 2)
−
b
π
(1, 2)
−
c
2π 3
(2, 4, 3)
+
c
4π 3
(2, 3, 4)
+
Wenn wir alle Möglichkeiten für die Lagen der Achsen zusammennehmen, erhalten wir die folgende Bilanz der dargestellten Permutationen: Typ
Anzahl der Achsen
Anzahl der Drehungen
insgesamt
in A4
in S4 A4
a
3
3
9
3
6
b
6
1
6
c
4
2
8
8
1
1
24
12
Identität Summe
6
12
Man kann sich auch auf Drehungen vom Typ b beschränken: Alle 42 = 6 Transpositionen werden dargestellt, damit ganz S4 . Die obige Tabelle gibt aber zusätzliche Informationen, z.B. über die Anzahl von Elementen verschiedener Ordnung in Sym+ (W ): Ordnung
Typ a
Typ b
Typ c
1 2
1 3
3 4
Insgesamt
6
9 8
6
8 6
Summe
24
94
I GRUPPEN
Das entspricht der Bilanz bei der Gruppe S4 in Beispiel 4 aus I 4.6.
2
Dass die Tetraedergruppe Untergruppe der Würfelgruppe ist, hat den geometrische Hintergrund, dass man aus den acht Ecken des Würfels vier passende auswählen und daraus ein Tetraeder bauen kann.
5.5 Symmetrien von Ikosaeder und Dodekaeder Im dritten und letzten Streich bestimmen wir nun die gemeinsamen Symmetriegruppen vom Dodekaeder D und Ikosaeder, also Sym (D) = {A ∈ O (3) : A(D) = D} und Sym+ (D) = Sym (D) ∩ SO (3) . Üblicherweise werden diese beiden Gruppen Ikosaedergruppen genannt. Die Ordnung kann man wie in den beiden vorhergehenden Fällen berechnen, es ist ord Sym+ (D) = 12 · 5 = 20 · 3 = 60 . Eine Permutationsdarstellung dieser Gruppen ergibt sich aus der geometrischen Beobachtung, dass es im Ikosaeder fünf Oktaeder und im Dodekaeder fünf Würfel gibt, die bei jeder Symmetrie des umgebenden Platonischen Körpers permutiert werden. Im Bild ist jeweils nur einer davon eingezeichnet:
5.5 SYMMETRIEN VON IKOSAEDER UND DODEKAEDER
95
Wir haben dem Dodekaeder den Vorzug gegeben,weil sich dieser Fall leichter zeichnen lässt. In jedem Fünfeck des Dodekaeders liegt genau eine Kante von jedem der fünf Würfel. Die Nummern gehören zum entsprechenden Würfel.
Wir betrachten nun die Darstellung
χ : Sym (D) → S5 , die durch die Permutation der Würfel entsteht.
Satz Für das Dodekaeder induziert χ Isomorphismen
D
ist
Im χ = A5
Sym (D) ∪ Sym+ (D)
und
Ker χ = {E3 , −E3 }.
Weiter
A 5 × Z2 ∪ −→ A5 .
−→
Beweis
Entscheidend ist die durch −E3 beschriebene Punktspiegelung am Ursprung. Ist H := {E3 , −E3 } < Sym (D), so hat man ein direktes Produkt Sym (D) = Sym+ (D) × H = Sym+ (D) ∪ Sym+ (D) · (−E3 ) .
96
I GRUPPEN
Da die Punktspiegelung −E3 alle 5 Würfel invariant lässt, ist H ⊂ Ker χ. Da ord S5 = 120
und
ord A5 = 60 ,
bleibt nur noch χ(Sym+ (D)) = A5 zu zeigen. Wir unterscheiden wieder drei Typen von Drehungen Typ a:
Die Achse geht durch die Mittelpunkte gegenüberliegender Fünfecke.
Typ b:
Die Achse geht durch die Mittelpunkte gegenüberliegender Kanten.
Typ c:
Die Achse geht durch gegenüberliegende Ecken. Typ a Drehung um
Permutation
72◦
(1, 2, 3, 4, 5)
144◦
(1, 3, 5, 2, 4)
216◦
(1, 4, 2, 5, 3)
◦
(1, 5, 4, 3, 2)
288
Typ b
Drehung um
180
◦
Permutation
(1, 5) · (3, 4)
5.5 SYMMETRIEN VON IKOSAEDER UND DODEKAEDER
97
Typ c
Drehung um
Permutation
◦
(2, 5, 4)
240◦
(4, 5, 2)
120
Dass die angegebenen Permutationen auftreten, liegt an der speziellen Wahl der Achsen; bei festem Typ ist aber die Zyklenstruktur unabhängig von der gewählten Achse. Da A5 von den Dreierzyklen erzeugt wird, konzentrieren wir uns zunächst auf Typ c. Da ein Dodekaeder 20 Ecken hat, gibt es 10 verschiedene Achsen durch gegenüberliegende Ecken. Zu jeder Achse gehören zwei Dreierzyklen, die zwei Würfel fest lassen. In obigem Beispiel sind das die Würfel 1 und 3, die beide auf der Drehachse liegenden Ecken des Dodekaeders als gemeinsame Ecken haben. In der Skizze zu Typ c sind 10 Ecken des Dodekaeders enthalten, jede enthält nur einen Punkt einer Drehachse. Wie man sofort sieht, gehören zu verschiedenen Ecken verschiedene Paare von Würfeln. Daher sind alle 20 Dreierzyklen von A5 im Bild von χ enthalten und nach dem Korollar aus I 4.5 folgt
χ(Sym+ (D)) = A5 . Indem man sich analog die Typen a und b genauer ansieht, erhält man schlieÿlich die folgende Bilanz:
98
I GRUPPEN
Typ
Anzahl der Achsen
Anzahl der Drehungen
Ordnung
Insgesamt
a
6
4
5
24
b
15
1
2
15
c
10
2
3
20
1
1
Summe
60
Identität
2
5.6 Die Klassengleichung der Ikosaedergruppe Mit Hilfe der Bilanz der Ordnungen der Elemente aus A5 kann man nun die Klassengleichung k
ord A5 (σi ) 60 = ord (A5 ) = ord Z(A5 ) + i=1
(vgl. I 4.4) explizit berechnen. Dabei operiert A5 auf sich selbst durch Konjugation; die Elemente σi sind Vertreter der mehrelementigen Bahnen. Der erste Summand ist klar, denn nach Beispiel 6 aus I 4.6 ist ord Z(A5 ) = 1 . Für die Ordnungen der Bahnen hat man zwei wichtige Vorinformationen: 1) In jeder Bahn liegen Elemente der gleichen Ordnung. 2) Die Ordnung jeder Bahn teilt 60 = ord A5 (Bahn-Lemma aus I 4.3). Vergleicht man das mit der Bilanz der Ordnungen aus I 5.5
60 = 1 + 15 + 20 + 24 , so sieht man, dass die Menge der 24 Elemente der Ordnung 5 in mindestens zwei Bahnen der Ordnung 12 zerfallen muss; demnach ist k ≥ 4. Die drei Klassen von Elementen der Ordnungen 2, 3 und 5 aus A5 entsprechen den drei Typen b, c, und a von Symmetrien des Ikosaeders. Da sie jeweils die gleiche Zyklenstruktur besitzen, sind sie unter der Wirkung von S5 konjugiert (vgl. Beispiel 4 aus I 4.6). Es bleibt zu prüfen, ob und wie sich die Bahnen verkleinern, wenn man nur noch mit Elementen aus A5 konjugiert. Wir benutzen den allgemeineren
Hilfssatz Gegeben sei die Operation einer endlichen Gruppe G auf einer Menge
M und N G. Dann gibt es zu jedem x ∈ M x1 , . . . , xd ∈ M und eine disjunkte Zerlegung
einen Teiler d von ind (G : N ),
G(x) = N (x1 ) ∪ . . . ∪ N (xd )
99
5.6 DIE KLASSENGLEICHUNG DER IKOSAEDERGRUPPE
N . Insbesondere muss d auch Teiler von ord G(x) sein.
in gleich groÿe Bahnen von Genauer gilt
ind (G : N ) = d · ind (StaG (x) : StaN (x)) . In unserem Fall ist ind (S5 : A5 ) = 2, also muss d = 1 oder 2 sein. Ist σ1 ∈ A5 mit ord σ1 = 2, so muss
S5 (σ1 ) = A5 (σ1 ) , also ord A5 (σ1 ) = 15 sein, da 15 ungerade ist. Ist σ3 ∈ A5 mit ord σ3 = 5, so muss
S5 (σ3 ) = A5 (σ3 ) ∪ A5 (σ4 ) disjunkte Vereinigung mit σ4 ∈ A5 sein, da 24 kein Teiler von 60 ist. Ist schlieÿlich σ2 = (1, 2, 3) ∈ A5 mit ord σ2 = 3, so sieht man leicht, dass StaA5 (1, 2, 3) = {id, (1, 2, 3), (1, 3, 2)} . Aus dem Bahn-Lemma folgt ord A5 (σ2 ) = Insgesamt lautet also die
60 3
= 20.
Klassengleichung der Ikosaedergruppe A
5
60 = 1 + 15 + 20 + 12 + 12 . Beweis des Hilfssatzes
Da N < G hat man eine disjunkte Zerlegung
G(x) = N (x1 ) ∪ . . . ∪ N (xd ) , wobei x1 = x und xi = gi (x) mit gi ∈ G. Da N G Normalteiler ist, folgt
N (g(x)) = g(N (x)) , also ord N (xi ) = ord N (x) . Daraus folgt ord G(x) = d · ord N (x). Aus dem Bahn-Lemma, angewandt auf G und N , erhält man ord G
=
ord G(x) · ord StaG (x) und
ord N
=
ord N (x) · ord StaN (x) .
Durch Einsetzen ergibt sich schlieÿlich
d·
ord G ord StaG (x) = . ord StaN (x) ord N
Daraus folgen die Behauptungen.
2
100
I GRUPPEN
5.7 Endliche Untergruppen von SO (3) Auf der Suche nach endlichen Untergruppen von SO (3) sammeln wir zunächst die Beispiele aus den vorliegenden Abschnitten. 1) Ein reguläres n-Eck Pn ⊂ R2 kann auch als Teil von R3 angesehen werden. Also ist Zn ∼ = Sym+ (Pn ) < SO (3) . 2) Die Spiegelung S ∈ O (2) an der x-Achse im R2 kann im R3 als Drehung S ∈ SO (3) um die x-Achse angesehen werden und wird dadurch orientierbar. Also ist Dn ∼ = Sym (Pn ) < SO (3) . 3) Die Tetraedergruppe A4 ∼ = Sym+ (T ) < SO (3) . 4) Die Würfelgruppe S4 ∼ = Sym+ (W ) < SO (3) . 5) Die Ikosaedergruppe A5 ∼ = Sym+ (D) < SO (3) . Durch eine beliebige orthogonale Transformation im R3 erhält man aus jeder dieser Gruppen eine konjugierte und damit isomorphe Untergruppe. Dass die Suche damit beendet werden kann, zeigt das
Klassikations - Theorem
Jede endliche Untergruppe von SO (3) ist konjugiert zu einer Untergruppe aus der obigen Liste. Der Beweis ist ziemlich umfangreich, wir verweisen etwa auf [N-S-T, Ch. 15] oder [ArM, 5.9].
5.8 Symmetrien von Fuÿbällen Der Ball ist rund wird oft gesagt, trit aber nur annähernd zu. Die meisten Bälle sind aus mehreren verschiedenartigen Flecken zusammengesetzt, im Lauf der Zeit hat sich die Form verändert. Wir geben drei markante Beispiele
1 Wunder von Bern
2 Telestar
3 Teamgeist
5.8 SYMMETRIEN VON FUßBÄLLEN
101
Der mit Wunder von Bern bezeichnete Ball ist der Klassiker; er wurde zur WM 1974 abgelöst vom Telestar, zur WM 2006 folgte der Teamgeist. Über die unterschiedlichen Eigenschaften der Bälle wird viel spekuliert; wir wollen uns hier darauf beschränken, die Symmetrien zu bestimmen. Alle drei Arten von Bällen sind abgeleitet von Platonischen Körpern: 1 und 3 vom Würfel und 2 vom Ikosaeder. Beim Wunder von Bern werden die Quadrate des Würfels ersetzt durch drei längliche Flecken, dadurch wird die Symmetrie des Quadrates reduziert von 4 auf 2 Drehungen. Beim Teamgeist sitzt an der Stelle jedes Quadrates ein Fleck, dessen Form einer Schuhsohle ähnlich ist; in den Positionen der 8 Ecken des Würfels sitzen Flecken von der Form eines Propellers mit 3 Flügeln. Beide Bälle haben also die Symmetrie eines modizierten Würfels W , bei dem jedes der 6 Quadrate nur noch 2 orientierbare Symmetrien hat; also ist ord Sym+ (W ) = 6 · 2 = 12 . Die Symmetrien von W sind genau die Symmetrien des Würfels W , die das in I 5.4 markierte Tetraeder im Würfel invariant lassen. Also ist Sym+ (W ) ∼ = Sym+ (T ) ∼ = A4 . Der Telestar hat deutlich mehr Symmetrien. Er entsteht durch Aufblasen eines gestutzten Ikosaeders I mit 20 Sechsecken und 12 Fünfecken (siehe Anhang). Dabei bleibt die Symmetrie des Ikosaeders I erhalten, also ist Sym+ (I ) = Sym+ (I) ∼ = Sym+ (D) ∼ = A5 . Dass ord Sym+ (I ) = 60 kann man auch ganz elementar sehen: Stellt man den Ball auf eine fünfeckige Unterlage, so kann man dafür 12 Fünfecke aussuchen, bei jedem gibt es 5 Möglichkeiten, also ist ord Sym+ (I ) = 12 · 5 = 60 . Bei den 20 Sechsecken muss man bedenken, dass es wegen der Anordnung von Fünfecken für jedes nur 3 Möglichkeiten gibt, also ist ord Sym+ (I ) = 20 · 3 = 60 . Für die 60 Ecken von I gibt es dagegen jeweils nur eine Möglichkeit.
Fazit Vom Wunder von Bern zum Telestar wurde die Symmetrie von 12 auf 60 erhöht, zum Teamgeist wieder auf 12 reduziert. Aber die Eigenschaften des Balles sind nicht allein durch die Symmetrien bestimmt, sondern auch durch das Material und die Verarbeitung. Mehr zu diesem Thema ndet man bei [Ho].
102
I GRUPPEN
6 Struktursätze∗ Wie schon erwähnt, ist es ein honungsloses Unterfangen, alle Klassen isomorpher Gruppen angeben zu wollen. In diesem Paragraphen behandeln wir einige wichtige Teilergebnisse. Die einfachste Invariante einer Isomorphieklasse ist die Ordnung: Zwei isomorphe Gruppen enthalten gleich viele Elemente; sind sie endlich, so ist das eine natürliche Zahl n. Die nächstliegende Frage ist also:
Wie viele nicht-isomorphe Gruppen der Ordnung n gibt es?
Eine erste Antwort ndet sich schon in I 3.7: Ist die Ordnung einer endlichen Gruppe eine Primzahl, so ist sie zyklisch. Für endliche abelsche Gruppen kann die obige Frage für beliebiges n beantwortet werden, allgemeiner lässt sich für endlich-erzeugte abelsche Gruppen die Struktur als Produkt von zyklischen Gruppen angeben. Damit beschäftigen sich die Abschnitte 6.1 bis 6.10. Für nicht-abelsche endliche Gruppen gibt es nur Teilresultate, die wichtigsten Werkzeuge dabei sind die Sätze von Sylow aus 6.12. Es gibt für die Resultate über abelsche Gruppen elegantere Beweise als die hier dargestellten (etwa im Rahmen der Theorie von Moduln über Hauptidealringen mit Hilfe von Elementarteilern [Bo, 2.9]). Wir bevorzugen einen etwas direkteren handwerklichen Weg. Dabei benutzen wir den klassischen Satz über die Primfaktorzerlegung natürlicher Zahlen, der in II 3.4 im Rahmen der Ringtheorie behandelt wird.
6.1 Summen zyklischer Gruppen Wir geben zunächst Beispiele für endliche abelsche Gruppen an; danach werden wir zeigen, dass es keine anderen gibt. Ist G eine abelsche Gruppe, so schreiben wir die Verknüpfung additiv, also für a, b ∈ G und n ∈ Z
a + b, a − b, na ∈ G und für abelsche Gruppen G1 , . . . Gk schreiben wir das in I 3.2 eingeführte direkte Produkt als direkte Summe G1 ⊕ . . . ⊕ Gk . Aus typographischen Gründen wird in diesem Paragraphen die Notation
Z(n) := Z/nZ für die sonst mit Zn bezeichnete zyklische Gruppe der Ordnung n verwendet. Wählt man nun n1 , . . . , nt ∈ N {0}, so erhält man daraus die endliche abelsche Gruppe
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9_6, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
103
6.2 ZÄHLUNG VON ZYKLISCHEN SUMMANDEN
G := Z(n1 ) ⊕ . . . ⊕ Z(nt )
n := ord G = n1 · . . . · nt .
mit
(∗)
Es wird sich zeigen, dass jede endliche abelsche Gruppe eine solche Darstellung (∗) besitzt. Das ist jedoch noch nicht befriedigend, denn die Zahlen t und n1 , . . . , nt sind durch G keineswegs eindeutig festgelegt. Grund dafür ist die Isomorphie
Z(m) ⊕ Z(n) ∼ = Z(m · n)
falls
⊕
ggT (m, n) = 1
aus I 3.9. Damit kann man Darstellungen der Form (∗) in zweierlei Weisen umformen: zusammenfassen oder aufspalten. Die Aufspaltung geht so: Aus der Primfaktorzerlegung
n = pk11 · . . . · pkr r
folgt
Z(n) = Z(pk11 ) ⊕ . . . ⊕ Z(pkr r ) ,
(vgl. dazu den Chinesischen Restesatz in II 2.11) und die Summe rechts kann nicht weiter zerlegt werden. Die entsprechende Aufspaltung von (∗) ist etwas mühsam aufzuschreiben. Ist p eine Primzahl und (p)
(p)
n1 = pl1 n∗1 , . . . , nt = plt n∗t
mit
p n∗1 , . . . , p n∗t ,
so verwenden wir diese Teiler von n1 , . . . , nt zur Denition der Untergruppe (i) Gp := G(1) p ⊕ . . . ⊕ Gp < G .
(∗∗)
(i) (i) wobei Gp < Z(ni ) für i = 1, . . . , t die durch Gp ∼ = Z(pli (p) ) eindeutig bestimmte Untergruppe ist.
Ist
(p)
(p)
k(p) := l1 + . . . + lt ,
so gilt
ord Gp = pk(p) .
Sind nun p1 , . . . , pm die Primfaktoren, die in mindestens einer der Zahlen n1 , . . . , ns vorkommen, so ist oensichtlich
G∼ = Gp1 ⊕ . . . ⊕ Gpm
und
k(p1 )
ord G = p1
m) · . . . · pk(p =n. m
(∗ ∗ ∗)
Bedenkt man, dass jeder Summand in (∗ ∗ ∗) nach (∗∗) aufgespalten ist, so ist klar, dass damit die Aufspaltung von G nicht weiter fortgesetzt werden kann; die Regel ⊕ ist ausgeschöpft. Was wir hier zur Übung mit der Summe (∗) von zyklischen Gruppen ausgerechnet haben, ist der Leitfaden für die Darstellung einer beliebigen endlichen abelschen Gruppe G.
6.2 Zählung von zyklischen Summanden (p)
Ein Exponent li in der Summendarstellung (∗∗) von Gp aus I 6.1 ist genau dann positiv, wenn die Primzahl p Teiler von ni ist. Daher ist die Anzahl der nicht
104
I GRUPPEN
trivialen Summanden in (∗∗) gleich der Anzahl der durch p teilbaren ni , also im Allgemeinen kleiner als t. Wir benötigen als technische Vorbereitung für den Beweis des Struktursatzes in I 6.4 eine zuverlässige Methode zur Zählung von zyklischen Summanden. Dabei ist zu bedenken, dass es in abelschen Gruppen - im Gegensatz zu Vektorräumen - unverkürzbare Erzeugendensysteme verschiedener Länge geben kann. Das einfachste Beispiel ist Z mit den Erzeugendensystemen {1} und {2, 3} der Längen 1 und 2. Mit einem schönen Kni kann man nun in abelschen Gruppen gewisse Zählungen auf das solide Fundament von Vektorräumen stellen. Grundlage ist folgendes
Lemma G/p G Beweis
Ist
G
eine abelsche Gruppe und
ein Vektorraum über dem Körper
p eine Primzahl, Fp = Z/p Z.
so ist die Faktorgruppe
Ist H := G/p G, so gilt pH = 0, denn
p(a + p G) = pa + p G = 0 + p G . Also genügt es, die Behauptung für eine abelsche Gruppe H mit pH = 0 zu beweisen. Was wir brauchen, ist eine Multiplikation
Fp × H → H , (λ, a) → λ · a , mit Skalaren, und was wir haben ist eine Multiplikation
Z × H → H , (m, a) → m · a . Ist λ = m+p Z, so denieren wir λ·a := m·a. Diese Multiplikation ist wohldeniert, denn
m + p Z = n + p Z ⇔ n − m ∈ p Z ⇒ n · a − m · a = (n − m) · a = 0 , da p · a = 0. Mit Hilfe der Rechenregeln für Kongruenzen prüft man ohne Mühe die Vektorraumaxiome nach. 2 Man beachte, dass die Multiplikations-Abbildung Z × H → H kein Gruppenhomomorphismus ist. In der hier nicht benutzten Sprache der Moduln ist eine abelsche Gruppe ein Z-Modul und G/p G ∼ = G ⊗Z Fp ein Tensorprodukt. Wir wollen den Vektorraum G/p G in einigen einfachen Fällen bestimmen. a) Ist G = Z und p beliebig, so ist G/p G = Fp . b) Ist G = Z(pk ) mit k ≥ 1, so ist p G = Z(pk−1 ) und G/p G = Z(p) = Fp . c) Ist G = Z(n) und die Primzahl p Teiler von n, so ist
n Z ⊂ p Z ⊂ Z,
also G/p G = (Z/n Z)/(p Z/n Z) ∼ = Z/p Z = Fp
nach dem Dritten Isomorphiesatz aus I 3.1.
105
6.3 PRIMÄRZERLEGUNG
d) Ist G endlich und abelsch, sowie p eine Primzahl mit p ord G, so ist G/p G = 0. Ist nämlich m = ord G, so ist ggT(m, p) = 1, also gibt es x, y ∈ Z mit
a = xma + ypa = pya ∈ p G
also
1 = xm + yp, für alle a ∈ G, da ma = 0.
Satz so ist
Ist G = Z(n1 ) ⊕ . . . ⊕ Z(nt ) mit n1 , . . . , nt ∈ N {0} und p eine dim Fp G/p G gleich der Anzahl der ni , die von p geteilt werden.
Beweis
Primzahl,
Die Behauptung folgt aus den oben bewiesenen Fällen c) und d), da
pG = pZ(n1 ) ⊕ . . . ⊕ pZ(nt ) und G/pG = Z(n1 )/pZ(n1 ) ⊕ . . . ⊕ Z(nt )/pZ(nt ) . 2
6.3 Primärzerlegung Als erste Vorbereitung zur Klassikation dient der
Satz von die
ord G
Cauchy
Ist
G
teilt, so gibt es ein
eine endliche abelsche Gruppe und
a∈G
mit
p
ord a = p.
eine Primzahl,
In I 6.11 werden wir zeigen, dass die Voraussetzung abelsch nicht nötig ist. Dass es nicht zu jedem Teiler der Gruppenordnung ein Element dieser Ordnung geben kann, sieht man schon am Beispiel der Kleinsche Vierergruppe
G = Z(2) ⊕ Z(2) . Sie hat die Ordnung 4, aber nur Elemente der Ordnung 1 und 2.
Beweis des Satzes von Cauchy Wir führen Induktion über n := ord G ≥ 2 und wählen dazu ein Element 0 = a ∈ G. Im Fall p | ord a ist ord a = p · m und ord (m · a) = p. Andernfalls ist p ord a und wir betrachten
G := G/Erz(a)
mit
n = ord G = ord G · ord a .
Aus p | n und p ord a folgt p | ord G. Da ord G < n, gibt es nach Induktionsvoraussetzung ein
b = b + Erz(a) ∈ G
mit
b∈G
mit
ord b = p .
Da die Abbildung Erz(b) → Erz(b) surjektiv ist, folgt ord b = ord Erz(b) = (ord b) · m für ein m ∈ N {0}, also gilt ord(mb) = p.
2
106
I GRUPPEN
Diese Vorüberlegung zeigt, dass die folgende Denition sinnvoll ist: Ist G eine endliche abelsche Gruppe und p eine Primzahl, so nennt man
Gp := {a ∈ G : ord a = pk(a) eine
mit
k(a) ∈ N}
Primärkomponente von G.
Bemerkung
a) Gp < G ist Untergruppe. b) ord Gp = p für ein k ∈ N. k
Beweis a) Ist a ∈ Gp , so ist −a ∈ Gp wegen ord(−a) = ord a. Für a, b ∈ Gp weiÿ man nach I 2.4, dass ord(a + b)
teilt
kgV (ord(a), ord(b)) .
Da das kgV Potenz von p ist, folgt a + b ∈ Gp .
b) Ist q Primfaktor von ord Gp , so gibt es nach dem Satz von mit ord a = q ; also ist q = p.
Cauchy ein a ∈ Gp
2
Der erste Schritt zur Klassikation endlicher abelscher Gruppen ist der
Satz über die Primärzerlegung einer endlichen abelschen Gruppe Ist G eine endliche abelsche Gruppe und
ord G = pk11 · . . . · pkr r
mit paarweise verschiedenen Primzahlen p1 , . . . , pr , so ist ⊕
G = Gp1 ⊕ . . . ⊕ Gpr .
Insbesondere ist ord Gpi = pki i für i = 1, . . . , r. Beweis Wir setzen Gi := Gpi und Gi := G1 + . . . + Gi−1 + Gi+1 + . . . + Gr . Zum Nachweis von ⊕ ist entsprechend I 3.3 zu zeigen, dass 1) G = G1 + . . . + Gr und 2) Gi ∩ Gi = {0} für i = 1, . . . , r. Ad 1) Wir setzen für i = 1, . . . , r
ni :=
n , pki i
wobei
n := ord G .
Dann sind oensichtlich n1 , . . . , nr teilerfremd, nach Bézout gibt es daher xi ∈ Z mit
xi ni , also a = xi ni a für a ∈ G , 1= i
6.4 ZERLEGUNG VON ENDLICHEN ABELSCHEN P -GRUPPEN
107
und es bleibt xi ni a ∈ Gi zu zeigen. Das folgt aber aus
pki i (xi ni a) = xi (na) = 0 , denn nach I 1.5 ist na = 0. Ad 2) Ist a ∈ Gi ∩ Gi , so gilt
a ∈ Gi ⇒ pli a = 0 für ein l ∈ N und
m aj ⇒ pj j aj = 0 mit mj ∈ N. a= j =i
Setzen wir m :=
m
pj j , so ist m · a = 0. Nun ist ggT (pli , m) = 1, also gibt es
j =i
x, y ∈ Z mit
1 = x pli + y m;
daher ist
a = x pli a + y m a = 0 + 0 = 0 .
Nach obiger Bemerkung wissen wir schon, dass ord Gi = plii mit li ∈ N. Daher ist nach ⊕ pk11 · . . . · pkr r = ord G = pl11 · . . . · plrr ,
2
also li = ki für i = 1, . . . , r.
6.4 Zerlegung von endlichen abelschen p-Gruppen Nachdem wir eine endliche abelsche Gruppe in ihre Primärkomponenten zerlegt haben, werden diese im zweiten Schritt in zyklische Gruppen zerlegt. Dabei spielt es keine Rolle mehr, dass die Primärgruppen Untergruppen einer gegebenen Gruppe waren. Es ist vielmehr zweckmäÿig, einen später weiter benutzten Namen einzuführen. Ist p eine Primzahl, so nennt man eine Gruppe G eine pa∈G ord a = pk(a) mit k(a) ∈ N
Gruppe , wenn für jedes
gilt. Oenbar ist jede Primärkomponente einer Gruppe eine p-Gruppe. Beispiele für endliche abelsche p-Gruppen sind direkte Summen
G = Z(pl1 ) ⊕ . . . ⊕ Z(pls )
mit
s, l1 , . . . , ls ∈ N {0} .
Für a ∈ G ist dann ord a = pk(a) mit k(a) ≤ max{l1 , . . . , ls }. Erstaunlicherweise gibt es keine anderen Beispiele:
Zerlegungssatz
Sei p eine Primzahl und G eine endliche abelsche p-Gruppe. Dann gibt es ein k ∈ N, so dass ord G = pk , eine Partition k = l 1 + l 2 + . . . + ls
mit 1 ≤ l1 ≤ l2 ≤ . . . ≤ ls ≤ k
108
I GRUPPEN
und einen Isomorphismus G∼ = Z(pl1 ) ⊕ . . . ⊕ Z(pls ) .
⊕
Dabei ist die Partition von k durch G eindeutig bestimmt, es ist s = dimFp (G/p G). Beweis Dass ord G eine Potenz von p ist, folgt wieder aus dem Satz von Cauchy. Zum Beweis der Eindeutigkeit der Zerlegung ⊕ sei m := max{k(a) : a ∈ G}; dann ist pm G = 0. Wir betrachten nun genauer in G die wiederholte Multiplikation mit p und ihre Wirkung auf einen direkten Summanden Z(pl ) in G:
G → pG ∪ Z(pl ) → Z(pl−1 )
→
...
→ ...
→
pl−1 G ∪ → Z(p) 0
→
→
pl G
...
→
pm G = 0
→ Z(p0 ) 0
Daran sieht man, dass sich ein Summand Z(pl ) in pl G verabschiedet hat. Bezeichnen wir mit si die Anzahl der direkten Summanden in pi G, so ist nach Denition von G
s0 = s,
und
si = dimFp (pi G/pi+1 G)
für
i = 0, . . . , m − 1
nach dem Satz in I 6.2. Daraus folgt, dass für jedes l mit 1 ≤ l ≤ m die Anzahl der Summanden Z(pl ) in G gleich sl−1 − sl ist; das ist genau die Abnahme der Zahl der Summanden beim Übergang von pl−1 G nach pl G. Da die Zahlen si allein durch G und p bestimmt sind, folgt die Eindeutigkeit der Zerlegung ⊕. Die Existenz einer Zerlegung ⊕ beweisen wir durch Induktion über m, wobei pm G = 0. Der Fall m = 0 ist trivial. Zum besseren Verständnis führen wir auch den besonders einfachen Fall m = 1 aus: Ist p G = 0, so ist G ein endlich-dimensionaler Fp -Vektorraum, also
G∼ = Fp × . . . × Fp = Z(p) ⊕ . . . ⊕ Z(p) mit dimFp G =: s. In diesem Fall ist l1 = . . . = ls = 1 und k = s. Angenommen, die Existenz sei für m − 1 bewiesen. Da
0 = pm G = pm−1 (p G) , gibt es daher eine Zerlegung
p G = Erz(c1 ) ⊕ . . . ⊕ Erz(cs ) ∼ = Z(pl1 ) ⊕ . . . ⊕ Z(pls ) , wobei c1 , . . . , cs ∈ p G erzeugende Elmente der zyklischen Summanden sind. Insbesondere ist ord ci = pli mit li ≥ 1. Nun wählen wir beliebige Urbilder
bi ∈ G
mit
pbi = ci ,
es gilt
ord bi = pli +1
und
Erz(bi ) ∼ = Z(pli +1 ) .
6.4 ZERLEGUNG VON ENDLICHEN ABELSCHEN P -GRUPPEN
109
Diese zyklischen Gruppen ergeben eine direkte Summe
G := Erz(b1 ) ⊕ . . . ⊕ Erz(bs ) ∼ = Z(p1l1 +1 ) ⊕ . . . ⊕ Z(plss +1 ) ,
(∗)
mit G < G, da die entsprechende Summe von p G = p G direkt ist. Es genügt nun noch zu zeigen, dass es ein r ∈ N gibt, so dass
G = Z(p) ⊕ . . . ⊕ Z(p) ⊕G , r−
(∗∗)
mal
d.h. man muss zu G noch Elemente der Ordnung p dazunehmen, um ganz G zu erhalten. Dazu betrachten wir den Kern
H := {a ∈ G : pa = 0} der Multiplikation mit p. Da p H = 0, ist H nach dem Lemma in I 6.2 ein Vektorraum über Fp . Um eine Basis von H zu erhalten, bemerken wir zunächst
pl1 b1 , . . . , pls bs ∈ H,
denn
ord bi = pli +1 .
Diese s Vektoren sind linear unabhängig: Angenommen s
ri pli bi = 0 mit
r1 , . . . , rs ∈ Z ;
i=1
da ri pli bi ∈ Erz(bi ), folgt aus (∗), dass ri pli bi = 0. Also muss p Teiler von ri sein; das ergibt die lineare Unabhängigkeit über Fp . Durch Ergänzung erhält man nun eine Basis
(pl1 b1 , . . . , pls bs , a1 , . . . , ar )
von
H,
für jedes j = 1, . . . , r ist Erz(aj ) ∼ = Z(p). Wir denieren
H := Erz(a1 ) ⊕ . . . ⊕ Erz(ar ) ∼ = Z(p) ⊕ . . . ⊕ Z(p) < H . r−
mal
Sowohl die Analogie als auch die Unterschiede zu Homomorphismen von Vektorräumen kann man sich durch folgendes schematisches Bild klarmachen
110
I GRUPPEN
Man beachte, dass im Gegensatz zu Vektorräumen H ∩ G = {0} sein kann! Es bleibt zu zeigen, dass G = H ⊕ G .
G = H + G : Ist a ∈ G, so gibt es x1 , . . . , xs ∈ Z mit
p xi bi , also p (a − xi bi ) = 0 und a − xi b i ∈ H . pa = xi ci = Kombiniert man diese Dierenz linear aus der Basis von H , erhält man a = b + a mit b ∈ H und a ∈ G .
H ∩ G = 0 : Ist a ∈ H ∩ G , so gibt es x1 , . . . , xr , y1 , . . . , ys ∈ Z mit
yi bi . a= x j aj = Da a ∈ H , ist weiter
yi c i , 0 = pa = yi p bi =
also
yi ci = 0 für
i = 1, . . . , s .
Da ord ci = pli , ist yi = yi pli , also folgt
xj aj . 0= yi pli bi − Da dies eine Linearkombination der Basisvektoren von H ist, folgt insbesondere
x 1 = . . . = xr = 0 ,
also
a=0. 2
111
6.5 ELEMENTARTEILER
Zusammenfassend können wir die bisher bewiesenen Ergebnisse so formulieren:
Struktursatz für endliche abelsche Gruppen Zu einer endlichen abelschen Gruppe G gibt es (nicht notwendig verschiedene) Primzahlen q1 , . . . , qs , Exponenten l1 , . . . , ls ∈ N {0} und einen Isomorphismus G∼ = Z(q1l1 ) ⊕ . . . ⊕ Z(qsls ) .
Dabei sind die zyklischen Summanden bis auf die Reihenfolge eindeutig bestimmt. 2
Sicherheitshalber schreiben wir das Ergebnis noch einmal ganz explizit auf - trotz der vielen Indizes: Ist ord G = pk11 · . . . · pkr r mit paarweise verschiedenen Primfaktoren pi , so gibt es zu jedem i ∈ {1, . . . , r} eine Partition (i)
ki = l1 + . . . + ls(i) i
mit
(i)
(i)
l1 ≤ l2 ≤ . . . ≤ ls(i) i
und einen Isomorphismus l(1)
(1)
(r)
l(r)
s G∼ = Z(p11 ) ⊕ . . . ⊕ Z(p1 1 ) ⊕ . . . ⊕ Z(pr1 ) ⊕ . . . ⊕ Z(prsr ) .
l
l
Setzt man noch zusätzlich p1 < p2 < . . . < pr voraus, so ist diese Darstellung eindeutig. Auf diese Weise kann man im Prinzip alle endlichen abelschen Gruppen gegebener Ordnung bis auf Isomorphie angeben (siehe I 6.6). Das ist in der Tat ein abschlieÿendes Ergebnis.
6.5 Elementarteiler Die im gerade formulierten Struktursatz angegebene Zerlegung in zyklische Gruppen kann natürlich auch anders dargestellt werden, da die Summe von zyklischen Gruppen teilerfremder Ordnung wieder zyklisch ist. Eine Variante ist der
Struktursatz in Elementarteilerform Ist G eine endliche abelsche Gruppe, so gibt es d1 , d2 , . . . , dt ∈ N{0, 1} mit d1 | d2 , . . . , dt−1 | dt und einen Isomorphismus G∼ = Z(d1 ) ⊕ Z(d2 ) ⊕ . . . ⊕ Z(dt ) .
Die Zahlen t und d1 , . . . dt sind durch G eindeutig bestimmt. Man nennt die Zahlen d1 , . . . , dt
Elementarteiler
von G.
Beweis Man kann die Elementarteiler dj aus den Partitionen der Primzahlexponenten ki berechnen. Das ist ganz einfach - bis auf die vielen Indizes. Daher zunächst ein Beispiel: Ist
G∼ = Z(2) ⊕ Z(22 ) ⊕ Z(24 ) ⊕ Z(3) ⊕ Z(33 ) ⊕ Z(5) ,
112
I GRUPPEN
so deniert man beginnend mit den höchsten Potenzen
d3 := 24 · 33 · 5 = 2160, d2 := 3 · 22 = 12, d1 := 2 . Nach Konstruktion gilt d1 | d2 | d3 . Die Zahl t = 3 ist durch G bestimmt, denn 2 | di und nach I 6.2 folgt
dim F2 G/2 G = 3 = t . Die Gruppe G hat also auch die Darstellung G∼ = Z(2) ⊕ Z(12) ⊕ Z(2160) . Im allgemeinen Fall verwendet man die Partitionen (i)
ki = l1 + . . . + ls(i) i der Primfaktorpotenzen k1 , . . . , kr aus dem vorhergehenden Abschnitt 6.4. Man setzt t := max{s1 , . . . , sr } , das ist die maximale Länge einer Partition und dann l(1)
l(r)
l
(1)
l
(r)
dt := p1s1 · . . . · prsr , dt−1 := p1s1 −1 · . . . · prsr −1 , . . . . (i)
Dabei setzt man lj = 0 für j < 1. Aus der Denition folgt sofort d1 | d2 | . . . | dt−1 | dt und G ∼ = Z(d1 ) ⊕ . . . ⊕ Z(dt ) . Man kann sich leicht überlegen, dass die Elementarteiler dj durch die Partitionen 2 der ki und damit durch G eindeutig bestimmt sind. Die Zahlen t und dt haben noch eine besondere Bedeutung. Ist p ein Primteiler von d1 , so teilt er alle dj und damit ist
t = dim Fp G/p G nach I 6.2. Zur Interpretation von dt erklären wir für eine beliebige endliche abelsche Gruppe G den Exponenten
exp(G) := max{ord (a) : a ∈ G} ∈ N {0} . Aus dem obigen Struktursatz folgt sofort das
Korollar
Für eine endliche abelsche Gruppe G hat exp(G) folgende Eigenschaften: a) exp(G) = dt und exp(G) teilt ord (G). b) Für jedes a ∈ G ist ord (a) Teiler von exp(G) und aexp(G) = e 2 Wie schon zu Beginn dieses Paragraphen bemerkt, kann man auch umgekehrt vorgehen, und den Struktursatz aus I 6.4 mit Hilfe der Methode der Elementarteiler beweisen. Der Leser möge sich zur Übung überlegen, wie man die Partitionen der ki aus den dj berechnen kann. Grundlage ist die Gleichung
pk11 · . . . · pkr r = ord G = d1 · . . . · dt .
113
6.6 BEISPIELE
6.6 Beispiele
Beispiel 1
Abelsche Gruppen der Ordnung 2k
Nach dem Zerlegungssatz aus I 6.4 entsprechen die Isomorphieklassen abelscher Gruppen der Ordnung 2k den Partitionen von k . Für k = 1 gibt es nur die Gruppe Z2 . Für k = 2 hat man die Partitionen k = 2 und k = 1 + 1, die entsprechenden Gruppen sind Z4 und Z2 × Z2 .
k = 3, ord G = 8 Partition
3
2+1
1+1+1
Gruppe
Z8
Z4 × Z2
Z2 × Z2 × Z2
k = 4, ord G = 16 Partition
4
3+1
2+2
2+1+1
1+1+1+1
Gruppe
Z16
Z8 × Z2
Z4 × Z4
Z4 × Z2 × Z2
Z2 × Z2 × Z2 × Z2
Für die Berechnung der Anzahl n(k) der Partitionen von k hat man lange nach einer Formel als endliche Summe gesucht. Ein Ergebnis aus dem Jahr 2011 (mit allerdings ziemlich komplizierten Summanden) ndet man bei [B-O]. Wir begnügen uns hier damit, die Werte für k ≤ 16 anzugeben:
k 5
2k 32
n(k) 7
k 11
2k 2048
n(k) 56
6
64
11
12
4096
77
7
128
15
13
8192
101
8
256
22
14
16384
135
9
512
30
15
32768
176
10
1024
42
16
65536
231
Für k = 5 geben wir die Liste in umgekehrt lexikograscher Ordnung an:
5 4+1 3+2 3+1+1 2+2+1 2+1+1+1 1+1+1+1+1
114
I GRUPPEN
Beispiel 2
Abelsche Gruppen der Ordnung 432
Da 432 = 16 · 27 = 24 · 33 , gilt für jede abelsche Gruppe G mit ord G = 432 nach dem Struktursatz in I 6.4
G = G2 ⊕ G3
mit
ord G2 = 24
und
ord G3 = 33 .
Für G2 gibt es die in Beispiel 1 aufgelisteten 5 Möglichkeiten, für G3 gibt es die 3 Möglichkeiten Z27 , Z9 ⊕ Z3 und Z3 ⊕ Z3 ⊕ Z3 . Also gibt es insgesamt 5 · 3 = 15 Isomorphieklassen abelscher Gruppen der Ordnung 432.
6.7 Torsionsuntergruppen In den ersten Abschnitten dieses Paragraphen haben wir uns auf endliche abelsche Gruppen beschränkt. Die einfachsten Beispiele für unendliche abelsche Gruppen sind die zyklische Gruppe Z und direkte Summen von mehreren Exemplaren von Z, etwa F = Z ⊕ ... ⊕ Z . r−
mal
Wir erinnern daran, dass eine Gruppe G endlich erzeugt heiÿt, wenn es a1 , . . . , an ∈ G gibt mit G = Erz(a1 , . . . , an ) . Ist G abelsch, so bedeutet das
G = {x1 a1 + . . . + xn an : x1 , . . . , xn ∈ Z} . Wir wollen nun zeigen, dass jede endlich erzeugte abelsche Gruppe G direkte Summe einer endlichen Gruppe T (G) und einer freien Gruppe F vom Rang r wie oben erklärt ist. Wir beginnen mit dem endlichen Anteil T (G).
Bemerkung
Ist
G
eine abelsche Gruppe, so ist
T (G) := {a ∈ G : ord a < ∞} ⊂ G eine Untergruppe.
Man nennt T (G) die Torsionsuntergruppe von G. Beweis
Für a, b ∈ G ist ord (−a) = ord a und nach der Bemerkung aus I 2.4 gilt ord (a + b)
also ist T (G) < G.
teilt
(ord a) · (ord b) ; 2
6.8 FREIE ABELSCHE GRUPPEN
115
Vorsicht!
In I 6.9 zeigen wir, dass T (G) endlich ist, wenn G endlich erzeugt ist. Das ist nicht selbstverständlich, weil nicht ohne weiteres klar ist, dass T (G) ebenfalls endlich erzeugt ist. Auÿerdem ist zu beachten, dass die Menge
{a ∈ G : ord a = ∞} keine Untergruppe von G ist, denn ord 0 = 1 < ∞. Daher sind die Anteile endlicher und unendlicher Ordnung in verschiedener Weise zu behandeln. Folgender Begri ist hierfür nützlich: Eine abelsche Gruppe G heiÿt
Lemma Beweis
torsionsfrei ,
wenn T (G) = 0.
Für jede abelsche Gruppe G ist die Faktorgruppe G/T (G) torsionsfrei. Angenommen für a ∈ G und m ∈ Z gilt
0 = m(a + T (G)) = ma + T (G) . Dann ist ma ∈ T (G) und somit a ∈ T (G).
2
Die Torsionsgruppe T (G) und die torsionsfreie Gruppe G/T (G) sind nun die Grundlage für die gesuchte Zerlegung von G.
6.8 Freie abelsche Gruppen Beispiele für torsionsfreie abelsche Gruppen sind direkte Summen von Exemplaren von Z. Sie gehören zu der wichtigen Klasse von freien Gruppen. Wir beginnen mit einer sehr allgemeinen Konstruktion.
Satz
Sei B eine beliebige Menge. Dann gibt es dazu eine abelsche Gruppe Fab (B) zusammen mit eine injektiven Abbildung ι : B → Fab (B)
mit folgender universellen Eigenschaft: Ist G eine abelsche Gruppe und f : B → G eine Abbildung, so gibt es dazu genau einen Gruppenhomomorphismus ϕf : Fab (B) → G, so dass das Diagramm ι / Fab (B) BF FF FF FF ϕf FF f # G
kommutiert. Man nennt Fab (B) die von der Menge B heiÿt Basis von Fab (B).
erzeugte freie abelsche Gruppe ,
B
116
I GRUPPEN
Die Analogie zu Vektorräumen ist oensichtlich: Dort kann man einem Homomorphismus auf einer Basis die Werte in einem anderen Vektorraum beliebig vorschreiben.
Beweis
Ist B endlich, etwa B = {1, . . . , n}, so erklärt man
Fab (1, . . . , n) := Zn = {(x1 , . . . , xn ) : xi ∈ Z} als direktes Produkt, oder in der additiven Schreibweise
Zn ∼ ⊕ ... ⊕ Z =Z n−
mal
als direkte Summe. Im allgemeinen Fall deniert man
Fab (B) := {Φ : B → Z : Φ(a) = 0 für fast alle a ∈ B} .
Fast alle
bedeutet wie üblich, bis auf endlich viele Ausnahmen. Sind Φ, Φ ∈ Fab (B), so ist die Summe Φ + Φ erklärt durch
(Φ + Φ )(a) := Φ(a) + Φ (a) ∈ Z . Damit wird Fab (B) oensichtlich zu einer abelschen Gruppe. Nun erklärt man 1 für b = a ι : B → Fab (B), a → Φa , durch Φa (b) := 0 für b = a ; diese Abbildung ist injektiv. Zu jedem Φ ∈ Fab (B) gibt es somit eindeutig bestimmte n ∈ N, a1 , . . . , an ∈ B und x1 , . . . , xn ∈ Z {0}, so dass
Φ = x 1 Φa 1 + . . . + x n Φa n . Dabei erhält man für n = 0 die Nullabbildung. Ist nun f : B → G vorgegeben, so gilt für jeden Homomorphismus ϕ : Fab (B) → G mit ϕ ◦ ι = f
ϕ(x1 Φa1 + . . . + xn Φan ) = x1 f (a1 ) + . . . + xn f (an ) .
(∗)
Also gibt es höchstens einen solchen Homomorphismus ϕ; da G abelsch ist, wird durch (∗) ein Homomorphismus ϕf = ϕ erklärt. 2 Ist G erzeugt von einer Teilmenge B ⊂ G und bezeichnet f : B → G die Inklusion, so ist der Homomorphismus
ϕf : Fab (B) → G, x1 Φa1 + . . . + xn Φan → x1 a1 + . . . + xn an , surjektiv. Daher ist jede abelsche Gruppe Faktorgruppe einer freien abelschen Gruppe. Aber diese Darstellung ist keineswegs eindeutig, denn es gibt im Allgemeinen viele verschiedene erzeugende Teilmengen B ⊂ G. In jedem Fall ist G erzeugt von B = G.
117
6.8 FREIE ABELSCHE GRUPPEN
Man nennt G frei abelsch, wenn es eine Teilmenge B ⊂ G gibt, so dass der Homomorphismus ϕι bijektiv ist. Das bedeutet direkter ausgedrückt, dass es zu jedem a ∈ G eindeutig bestimmte n ∈ N, a1 , . . . , an ∈ B und x1 , . . . , xn ∈ Z {0} gibt, so dass a = x1 a 1 + . . . + xn a n . Dabei wird die Null in G wieder mit n = 0 durch die leere Summe dargestellt. Diese Eindeutigkeit hat eine wichtige Konsequenz: Sind a1 , . . . , an ∈ B gegeben, und besteht eine Relation der Form
x1 a1 + . . . + xn an = 0 mit
n≥1
und
xi ∈ Z ,
so folgt x1 = . . . = xn = 0, d.h. die Relation ist trivial. Umgekehrt ausgedrückt: Besteht zwischen a1 , . . . , an ∈ G eine nicht-triviale Relation, so können die a1 , . . . , an nicht aus einer Basis genommen sein. So ist eine endliche abelsche Gruppe nicht frei, denn für jedes a ∈ G gibt es ein x ∈ Z {0} mit xa = 0 ; das ist das einfachste Beispiel einer nicht-trivialen Relation. Die Beziehungen zwischen freien abelschen Gruppen und Vektorräumen sind offensichtlich. In der linearen Algebra lernt man, dass je zwei endliche Basen gleiche Länge haben. Analog gilt das
Ranglemma
Ist
G
eine freie abelsche Gruppe mit Basen
B = {a1 , . . . , am } so ist
und
B = {a1 , . . . , an } ,
m = n.
Die Länge n einer Basis einer endlich erzeugten freien abelschen Gruppe G nennt man den Rang von G, in Zeichen rang G. Beweis Aus einem Isomorphismus Zm → Zn von abelschen Gruppen erhält man durch Reduktion modulo einer beliebigen Primzahl p einen Isomorphismus n Fm p → Fp
von Fp -Vektorräumen. Daher ist m = n.
2
Für den Beweis des Struktursatzes benötigen wir noch einige grundlegende Aussagen über freie abelsche Gruppen. Wir beginnen mit dem
Spaltungslemma
Sei
G
eine abelsche Gruppe,
und
F
eine freie abelsche Gruppe
ϕ:G→F
ein Epimorphismus. Dann gibt es eine freie abelsche Gruppe
G = Ker ϕ ⊕ F
und
ϕ | F : F → F
F < G,
so dass
ist Isomorphismus .
118
I GRUPPEN
Beweis Ist B eine Basis von F , so wählt man zu jedem b ∈ B ein a ∈ G mit ϕ(a) = b. Ist B ⊂ G die Menge der so erhaltenen a ∈ G, so denieren wir F := Erz (B ) < G und es ist zunächst zu zeigen, dass F frei abelsch ist. Das ist klar, denn sind a1 , . . . , an ∈ B gegeben, und ist n
xi ai = 0, so folgt
xi ϕ(ai ) =
x i bi = 0
i=1
und x1 = . . . = xn = 0, da B eine Basis ist. Mit dem gleichen Argument folgt, dass ϕ | F injektiv ist. Also ist Ker ϕ ∩ F = {0} . Es bleibt zu zeigen, dass G = Ker ϕ + F . Ist a ∈ G, so folgt
ϕ(a) = xi bi , also a − xi ai ∈ Ker ϕ , das ergibt die gesuchte Darstellung von a.
2
Als nächstes zeigen wir die
Freiheit von Untergruppen Ist G eine freie abelsche Gruppe, so ist auch jedes H < G frei abelsch und es ist rang H ≤ rang G .
Vorsicht!
Es sei nachdrücklich bemerkt, dass es keine analoge Aussage im nichtabelschen Fall gibt.
Beweis Wir beschränken uns auf den Fall, dass rang G < ∞, im allgemeinen Fall benötigt man das Zorn'sche Lemma. Sei also G = Fab (a1 , . . . , an ) ∼ = Za1 ⊕ . . . ⊕ Zan . Wir führen Induktion über n. Für n = 1 ist die Aussage klar, da jede Untergruppe von Z zyklisch ist. Für beliebiges n betrachten wir die Projektion von H
ρ : H → Za1 auf den ersten Summanden von G, oensichtlich ist Ker ρ < Za2 ⊕ . . . ⊕ Zan ,
6.8 FREIE ABELSCHE GRUPPEN
119
also folgt aus der Induktionsvoraussetzung, dass Ker ρ frei abelsch ist. Weiter ist
F := ρ(H) ⊂ Za1 frei nach Induktionsbeginn n = 1; nach dem Spaltungslemma folgt
H = Ker ρ ⊕ F mit frei abelschen F , also ist H frei abelsch. Die Ungleichung für die Ränge folgt aus rang F = rang F ≤ 1 und rang (Ker ρ) ≤ n − 1 .
2
Korollar H 1, gibt es ein a ∈ G/N mit a = e. Die Gruppe Erz (a) < G/N ist zyklisch; zu einem Primteiler p von ord a gibt es nach I 3.10 eine Untergruppe H < Erz (a) < G/N mit ord H = p. Nun betrachten wir das Diagramm G H N ↓
↓ρ G/N
H
↓
{e}
mit dem kanonischen Epimorphismus ρ und H := ρ−1 (H ). Nach dem Faktorisierungssatz in I 3.1 ist H/N ∼ 2 = H . Für eine spätere Anwendung in der Galois-Theorie benötigen wir noch eine Aussage über die Auösbarkeit von Untergruppen und Faktorgruppen. Dazu benutzen wir die
142
I GRUPPEN
Bemerkung
Ist
ϕ : G → G
ein Gruppenhomomorphismus, so gilt für alle
k∈N
ϕ(Komk (G)) = Komk (ϕ(G)) ⊂ Komk (G ) .
Beweis
Entscheidend ist die Gleichung ϕ([a, b]) = [ϕ(a), ϕ(b)] ∈ G
(∗)
für alle a, b ∈ G. Da ϕ(G) < G , genügt es die erste Gleichung zu beweisen. Für k = 0 ist sie trivial, für k = 1 folgt sie aus (∗). Der allgemeine Fall ergibt sich durch Induktion, denn ϕ(Komk+1 (G)) = ϕ(Kom (Komk (G)) = Kom (ϕ(Komk (G)) = Kom (Komk (ϕ(G)) = Komk+1 (ϕ(G)) .
Korollar b) Ist
2 a) Jede Untergruppe einer auösbaren Gruppe ist auösbar.
N G
Normalteiler, so gilt:
G
Beweis
a)
auösbar
⇔ N
und
G/N
auösbar
.
Ist H < G und ι : H → G die Inklusion, so folgt aus der Bemerkung Komk (H) = ι(Komk (H)) < Komk (G) .
Also ist mit Komk (G) = {e} auch Komk (H) = {e}. b) ⇒ N ist nach Teil a) auösbar. Bezeichnet ρ : G → G/N den kanonischen Homomorphismus, so folgt aus der Bemerkung Komk (G/N ) = ρ(Komk (G)) . Daher ist auch G/N auösbar. ⇐ Wir wählen ein k ∈ N mit Komk (N ) = {e} und Komk (G/N ) = {e}, wobei e = N ∈ G/N das neutrale Element bezeichnet. Wieder nach der Bemerkung folgt ρ(Komk (G)) = Komk (G/N ) = {e} ,
also Komk (G) < N .
Damit erhält man Kom2k (G) = Komk (Komk (G)) < Komk (N ) = {e}.
2
143
7.5 AUFLÖSBARKEIT VON P -GRUPPEN
7.5 Auösbarkeit von p-Gruppen In I 4.4 hatten wir gesehen, dass jede Gruppe der Ordnung p2 abelsch ist. Für eine Anwendung in der Körpertheorie notieren wir den folgenden allgemeineren
Satz
Ist
p eine Primzahl und n ∈ N, so ist jede Gruppe der Ordnung pn
auösbar.
Beweis durch Induktion über n. Der Fall n = 0 ist trivial. Falls n ≥ 1, betrachten wir das Zentrum Z(G) G, es ist ord Z(G) = pm mit m ≤ n. Nach der Klassengleichung aus I 4.4 ist der Fall m = 0 ausgeschlossen, also ist
ord (G/Z(G)) = pn−m < pn . Nach Induktionsannahme ist G/Z(G) auösbar, Z(G) ist abelsch; also folgt die Behauptung nach dem Korollar aus I 7.4. 2 Wir vermerken noch ein spektakuläres Ergebnis aus dem Jahr 1963 [F-T]:
Theorem von
Feit und Thompson
Jede endliche Gruppe von ungerader
Ordnung ist auösbar.
Der Originalbeweis ist 255 Seiten lang.
7.6 Beispiele Beispiel 1 Die Gruppen An
und Sn sind für n ≤ 4 auösbar.
Für n = 1, 2 ist S2 abelsch. Für n = 3 ist
S3 A3 {id} eine Normalreihe mit abelschen Faktoren. Für n = 4 hat man
S4 A4 K4 Z2 {id} ,
(∗)
wobei K4 die Kleinsche Vierergruppe aus Beispiel 3 in I 7.3 ist. Da
S4 /A4 ∼ = Z2
und
A4 /K4 ∼ = Z3 ,
ist (∗) eine Normalreihe mit Faktoren von Primzahlordnung.
Beispiel 2
Die Gruppen An und Sn sind für n ≥ 5 nicht auösbar, da nach Beispiel 3 aus I 7.3 Kom (An ) = An .
Die Kommutatorreihe Kom k (Sn ) wird also bei der einfachen Gruppe An stationär. Dies ist der Schlüssel dafür, dass Polynomgleichungen vom Grad ≥ 5 im Allgemeinen nicht durch Radikale lösbar sind. Das wird in III 5.11 entscheidend sein.
Kapitel II Ringe Eine zentrale Aufgabe der Algebra ist es, Aussagen über die Nullstellen von Polynomen zu machen. Für den Umgang mit Polynomen ist es nützlich, die abstrakten Hintergründe der Addition und Multiplikation zu formalisieren und die Analogien zu den entsprechenden Operationen mit ganzen Zahlen zu nutzen. Das ist der Ursprung der Theorie der Ringe. Als Hilfsmittel in der Körpertheorie sind vor allem die Kriterien für die Irreduzibilität aus 3 wichtig. Weitergehende Ergebnisse der Idealtheorie sind Grundlage für die algebraische Geometrie.
1 Grundbegrie 1.1 Denition eines Rings Im Gegensatz zu Gruppen gibt es in einem Ring R zwei Verknüpfungen: Eine Addition, mit der R zu einer abelschen Gruppe wird, und eine Multiplikation mit der R nur Halbgruppe sein muss. Die beiden Verknüpfungen sind durch Distributivgesetze gekoppelt. Ausführlich aufgeschrieben hat man folgende Denition Ein Ring ist eine Menge R zusammen mit zwei inneren Verknüpfungen + und ·, die folgende Bedingungen erfüllen:
R1 R zusammen mit + ist eine abelsche Gruppe. R2 Die Multiplikation · ist assoziativ. R3 Es gelten die Distributivgesetze , d.h. für alle a, b, c ∈ R ist a · (b + c) = a · b + a · c
und
(b + c) · a = b · a + c · a .
Das neutrale Element 0 ∈ R der Addition heiÿt Nullelement von R. G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9_8, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
146
II RINGE
Wenn deutlich gemacht werden soll, um welche Verknüpfungen es sich handelt, kann man einen Ring als Tripel (R, +, ·) schreiben. Um Klammern zu sparen, gilt die übliche Regel Punkt vor Strich, zudem lässt man den Malpunkt meist weg. Oensichtlich ist die Bedingung für die Multiplikation weit schwächer als für die Addition. Für zusätzliche Eigenschaften der Multiplikation gibt es Namen: Ein Ring heiÿt kommutativ, wenn die Multiplikation kommutativ ist, d.h. a · b = b · a für alle a, b ∈ R. Ein Element 1 ∈ R heiÿt Einselement , wenn 1 · a = a · 1 = a für alle a ∈ R. Dass beide Bedingungen nötig sind, sieht man am Beispiel 5 aus I 1.2 Wir notieren zwei elementare Regeln über den Zusammenhang von Addition und Multiplikation:
Bemerkung 1 a)
In einem Ring
R
gilt:
a0 = 0a = 0 , (−a)b = a(−b) = −(ab) , (−a)(−b) = ab.
b) Hat
R
ein Einselement
Nullring
1,
so gilt
1 = 0
genau dann, wenn
R = {0}
der
ist.
a) a0 = a (0 + 0) = a0 + a0, 0a = (0 + 0) a = 0a + 0a, ab + (−a) b = (a − a) b = 0, ab + a(−b) = a(b − b) = 0 , ab − (−a)(−b) = ab + a(−b) = 0. b) Ist R = {0}, so hat oensichtlich 0 die Eigenschaft eines Einselements. Ist umgekehrt 1 = 0, so folgt a = 1a = 0a = 0 für jedes a ∈ R. 2
Beweis
Ein a ∈ R heiÿt rechter bzw. linker Nullteiler , wenn es ein b ∈ R mit b = 0 gibt, so dass b · a = 0 bzw. a · b = 0 . Nach der obigen Bemerkung ist 0 sowohl rechter als auch linker Nullteiler. R heiÿt nullteilerfrei , wenn es keine rechten oder linken Nullteiler auÿer 0 gibt. Oensichtlich gilt:
Bemerkung 2 i) ii)
R
Für einen Ring
R
sind folgende Bedingungen gleichwertig:
ist nullteilerfrei.
R {0}
ist multiplikativ abgeschlossen.
iii) Es gelten die Kürzungsregeln falls
a, b, x ∈ R
und
x = 0.
a·x=b·x⇒a=b
und
x · a = x · b ⇒ a = b,
Schlieÿlich nennt man einen Ring Integritätsring , wenn er folgende Bedingungen erfüllt:
147
1.2 EINHEITEN, KÖRPER, UNTERRINGE
1)
R hat ein Einselement 1 = 0.
2)
R ist kommutativ.
3)
R ist nullteilerfrei.
1.2 Einheiten, Körper, Unterringe Im Gegensatz zur Addition haben Ringelemente im Allgemeinen kein Inverses bezüglich der Multiplikation. Das führt zu einer neuen
Denition
a ˜ ∈ R gibt mit
Ist R ein Ring mit 1, so heiÿt ein a ∈ R
Einheit
, wenn es ein
a˜ a=a ˜a = 1 . Ist R nicht kommutativ, so sind in der Tat beide Bedingungen nötig (Beispiel 5 in II 1.4).
Bemerkung
In einem Ring
R
mit
1
ist die Menge
R× := {a ∈ R : a bezüglich der Multiplikation eine Gruppe. Beweis
mit
}⊂R
ist Einheit
R×
heiÿt
Einheitengruppe von R.
×
R ist multiplikativ abgeschlossen, denn sind a, b ∈ R× , so gibt es a ˜, ˜b ∈ R a˜ a=a ˜a = b˜b = ˜bb = 1 , also (ab)(˜b˜ a) = (˜b˜ a)(ab) = 1 .
˜ ein Inverses. Auÿerdem ist 1 ∈ R× und zu a ∈ R× ist a ×
2 ×
Ist 1 = 0, so gilt R ⊂ R{0}. Besonders wichtig ist der Extremfall R = R{0}, d.h. jedes a = 0 hat als Element der Gruppe R× nach I 1.3 ein eindeutiges Inverses a−1 ∈ R× . Das führt zur
Denition
Ein Körper ist eine Menge K zusammen mit zwei inneren Verknüpfungen + und ·, die folgende Bedingungen erfüllen:
K1 K zusammen mit der Addition ist eine abelsche Gruppe mit neutralem Element 0 und Inversem −a von a.
K2 K {0} zusammen mit der Multiplikation ist eine abelsche Gruppe mit neutralem Element 1 und Inversem a−1 von a.
K3 Für a, b, c ∈ K gilt das Distributivgesetz a · (b + c) = a · b + a · c . Sind diese Bedingungen mit Ausnahme der Kommutativität der Multiplikation in erfüllt, so spricht man von einem Schiefkörper (in diesem Fall muss man das Distributivgesetz auch in der anderen Reihenfolge fordern).
K2
K3
148
II RINGE
In II 1.13 werden wir zeigen, dass man jeden Integritätsring R zu einem Körper Q(R), dem Quotientenkörper, erweitern kann. Ist R endlich, so ist die Erweiterung gar nicht nötig:
Lemma Ein endlicher Integritätsring ist ein Körper. Beweis Ist a ∈ R mit a = 0 gegeben, so betrachten wir die Abbildung μa : R → R , x → ax . In einem Integritätsring ist μa injektiv, ist R endlich auch surjektiv. Also gibt es ein b ∈ R mit ab = 1. 2 Nun zum nächsten grundlegenden Begri:
Denition
Ist R ein Ring und S ⊂ R eine Teilmenge, so heiÿt S von R, wenn gilt:
Unterring
1) Für a, b ∈ S ist auch a + b ∈ S und a · b ∈ S . 2) S mit den von R geerbten Verknüpfungen + und · ist wieder ein Ring. Diese Denition folgt dem allgemeinen Schema für eine Unterstruktur. Für die Praxis verwendet man wieder ein der speziellen Situation angepasstes handliches Kriterium:
Bemerkung
gilt:
Eine Teilmenge S ⊂ R ist genau dann Unterring, wenn folgendes
a) S = ∅. b) a, b ∈ S ⇒ a − b ∈ S
und
a · b ∈ S.
Der Beweis folgt sofort aus dem entsprechenden Kriterium für Untergruppen in I 1.6.
Unterkörper Oberkörper
Ist schlieÿlich K ein Körper, so heiÿt L ⊂ K ein , wenn L ein Körper und ein Unterring ist. K heiÿt dann von L, man nennt K ⊃ L auch . Damit beschäftigen wir uns ausführlich in Kapitel III.
Körpererweiterung
Wie bei Gruppen sieht man, dass der Durchschnitt beliebig vieler Unterringe S eines Ringes R wieder ein Unterring ist. Also kann man für eine Teilmenge M ⊂ R den von M Erz (M ) := S
erzeugten Unterring
M ⊂S⊂R
erklären. Ist S ⊂ R Unterring und a ∈ R, so ist die Notation
S[a] := Erz (S ∪ {a}) üblich. Man sagt dafür, a wird zu S
adjungiert .
1.3 RINGHOMOMORPHISMEN
149
1.3 Ringhomomorphismen Die mit Addition und Multiplikation verträglichen Abbildungen zwischen Ringen nennt man wieder Homomorphismen.
Denition ϕ:R→R
Sind (R, +, ·) und (R , + , · ) Ringe, so heiÿt eine Abbildung , wenn für alle a, b ∈ R
Ringhomomorphismus ϕ(a + b) = ϕ(a) + ϕ(b)
und
ϕ(a · b) = ϕ(a) · ϕ(b) .
Monomorphismus, Epimorphismus, Isomorphismus, Endomorphismus und Automorphismus erklärt man wie bei Gruppen (I 2.1). Die Begrie
Ist ϕ : R → R ein Ringhomomorphismus, so heiÿt Ker ϕ = {a ∈ R : ϕ(a) = 0} ⊂ R
Kern
Bild
der von ϕ und Im ϕ = ϕ(R) ⊂ R das von ϕ. Man beachte, dass bei der Denition des Kerns nur das neutrale Element der Addition vorkommt. Ohne jede Mühe zeigt man die folgenden Aussagen:
Bemerkung
a) Ist ϕ : R → R ein Ringhomomorphismus, so sind Ker ϕ ⊂ R und Im ϕ ⊂ R Unterringe. b) Sind ϕ : R → R und ψ : R → R Ringhomomorphismen, so ist ψ ◦ ϕ : R → R Ringhomomorphismus. c) Ist ϕ : R → R Ringisomorphismus (d.h. bijektiver Homomorphismus), so ist ϕ−1 : R → R Ringisomorphismus. d) Ist S ⊂ R Unterring, so ist die Inklusion ι : S → R Ringhomomorphismus. e) Ein Ringhomomorphismus ϕ : R → R ist genau dann injektiv, wenn Ker ϕ = {0}. f ) Ist ϕ : R → R Ringhomomorphismus und R Körper, so ist ϕ injektiv oder ϕ(a) = 0 für alle a ∈ R . 2
Zum Beweis von f ) ein kleiner Hinweis: Gibt es ein a ∈ R{0} = R× mit ϕ(a) = 0, so folgt ϕ(1) = 0 und daraus ϕ(b) = 0 für alle b ∈ R. 2
1.4 Beispiele Das für die späteren Untersuchungen wichtigste Beispiel ist der Polynomring, dafür ist Abschnitt II 1.5 reserviert. Wir geben zunächst einige andere Beispiele.
Beispiel 1
Die ganzen Zahlen Z mit Addition und Multiplikation bilden einen Integritätsring. Ein formaler Beweis dieser Eigenschaften gründet sich auf die Peano-Axiome. Die dazu nötigen Peano-Spielereien ndet man etwa bei [ArM, 10.2] oder [Eb, Kap. 1].
Beispiel 2
Z ist ein Unterring des Körpers m Q= : m, n ∈ Z , n = 0 n
150
II RINGE
der rationalen Zahlen. In II 1.13 werden wir in Analogie zu Z ⊂ Q für jeden Integritätsring R einen Quotientenkörper Q(R) konstruieren. Mit Hilfsmitteln der Analysis (etwa Cauchy-Folgen oder Dedekindschen Schnitten) erhält man den Körper R der reellen Zahlen als Oberkörper von Q. Wir werden in Kapitel III sehen, dass es noch viele Körper K mit Q ⊂ K ⊂ R gibt, man nennt sie Zwischenkörper . Die wichtigste Körpererweiterung von R sind die komplexen Zahlen C ⊃ R. Ihre geometrische Beschreibung als Zahlenebene R2 mit der lateralen Einheit √ −1 geht auf zurück [Ga4 , 31], (vgl. auch [vdW2 ]). i =
Gauss
R2 hat über R die Basis (1, 0) und (0, 1), wir setzen 1 := (1, 0) als reelle Einheit und i := (0, 1) als imaginäre Einheit. Dann ist als Vektorraum C = R2 = {a + bi : a, b ∈ R} bezüglich der Addition eine abelsche Gruppe. Die Multiplikation ist dadurch festgelegt, dass i2 = −1 sein soll, also
(a + bi)(c + di) := (ac − bd) + (ad + bc) i . Damit ist 1 = 1 + 0 i Einselement, das Inverse erhält man aus der Rechnung
1 a − bi a b = = 2 − 2 i . a + bi (a + bi)(a − bi) a + b2 a + b2 Wir überlassen dem Leser die restlichen kleinen Nachweise für die Axiome im Körper C der komplexen Zahlen . Wie wir in Kapitel III sehen werden, gibt es zwischen R und C keinen echten Zwischenkörper. Dagegen gibt es zwischen Z und C viele interessante Zwischenringe, etwa den Ring Z + Zi := {m + ni : m, n ∈ Z} ⊂ C der
ganzen Gauÿschen Zahlen
(mehr dazu in II 3.12).
Zu z = a + bi ∈ C heiÿt z¯ := a − bi ∈ C die komplex konjugierte Zahl und N (z) := z · z¯ = a2 + b2 ∈ R die Norm von z . Es gelten die Rechenregeln
z + z = z¯ + z¯ , z · z = z¯ · z¯ , N (z · z ) = N (z) · N (z ) . Aus der Norm erhält man den
Absolutbetrag
| z |=
√ z · z = a 2 + b2 .
Man kann die Multiplikation auch schön mit Polarkoordinaten in R2 beschreiben, das ndet man z.B. in [Fi 1 , 1.3.4]. Natürlich kann man R2 auch durch die Multiplikation
(a, b) · (c, d) := (a · c, b · d)
151
1.4 BEISPIELE
zu einem kommutativen Ring mit Einselement (1, 1) machen. Allerdings wimmelt es dann von Nullteilern, etwa
(1, 0) · (0, 1) = (0, 0) .
Beispiel 3
Es ist naheliegend eine zur Körpererweiterung R ⊂ R2 = C analoge Konstruktion R ⊂ Rn mit n ≥ 3 zu versuchen. In III 1.8 werden wir mit Hilfe des Fundamentalsatzes der Algebra zeigen, dass dies unmöglich ist. Dass es für ungerades n nicht geht, kann man schon daraus folgern, dass ein reelles Polynom ungeraden Grades eine reelle Nullstelle hat. Es gilt (vgl. [Eb, Kap. 6]): Ist
R ⊂ Rn = K
eine Körpererweiterung mit ungeradem
n,
so ist
n = 1.
Rn = K bedeutet, dass K ein R-Vektorraum der Dimension n ist. Für jedes a ∈ K ist die Abbildung Beweis
F : Rn → Rn , v → v · a , ein Vektorraum-Endomorphismus, denn
(v + v ) a = va + v a , (λ v) a = λ (va) . Da n ungerade ist, hat das charakteristische Polynom von F eine reelle Nullstelle λ, es gibt also einen Eigenvektor 0 = v ∈ Rn . Aus a v = λ v folgt (a − λ · 1) v = 0. Da K nullteilerfrei ist, muss a = λ · 1 ∈ R sein. 2 In Beispiel 6 zeigen wir, wie R4 zum Schiefkörper der Quaternionen gemacht werden kann.
Divisionsalgebren
Für gröÿeres n hat es nur noch Sinn im Rn nach sogenannten zu suchen. Man kann zeigen, dass dafür n eine Potenz von 2 sein muss, noch genauer: Es geht höchstens für n = 1, 2, 4 oder 8. Im R8 hat man die Struktur der von Cayley, sie ist nicht mehr assoziativ. All das ndet man sehr schön ausgeführt in [Eb, Kap. 7 und Kap. 10].
Oktaven
Beispiel 4
Ist M eine nicht leere Menge und R ein Ring, so kann man in Abb (M, R) := {f : M → R}
durch (f + g)(x) := f (x) + g(x) und (f · g)(x) := f (x) · g(x) für alle x ∈ R eine Addition und eine Multiplikation erklären; wie man leicht sieht, wird Abb (M, R) dadurch zu einem Ring. Ist M = {1, . . . , n}, so ist Abb (M, R) = R × . . . × R =: Rn ein direktes Produkt; man nennt Rn den
Produktring .
Ist M ⊂ R oen und R = R, so ist n
C(M, R) := {f ∈ Abb (M, R) : f stetig} ⊂ Abb (M, R)
152
II RINGE
ein Unterring. Ein f ∈ C (M, R) ist genau dann Einheit, wenn f (x) = 0 für alle x ∈ M. Ist M ⊂ C oen und zusammenhängend (in der komplexen Funktionentheorie sagt man dafür ), so ist
Gebiet
O(M ) := {f ∈ Abb (M, C) : f holomorph} ⊂ Abb (M, C) ein Unterring, weil Summen und Produkte holomorpher Funktionen wieder holomorph sind. Wie bei den stetigen Funktionen ist f ∈ O(M ) genau dann Einheit, wenn f in M keine Nullstelle hat. Im Gegensatz zu C(M, R) ist O(M ) ein Integritätsring, denn ist 0 = f ∈ O(M ), so hat f höchstens isolierte Nullstellen (wie man in der Funktionentheorie mit Hilfe des Identitätssatzes beweist).
Beispiel 5
Sei G eine abelsche Gruppe, die Verknüpfung wird als Addition geschrieben. Mit End (G) := { ϕ : G → G : ϕ Homomorphismus} bezeichnen wir die Menge der Endomorphismen von G. Eine Addition in End (G) ist erklärt durch (ϕ + ψ)(a) := ϕ(a) + ψ(a) , als Multiplikation dient die Hintereinanderschaltung ϕ◦ψ . Bezüglich der Addition ist End (G) eine abelsche Gruppe, die Hintereinanderschaltung ist assoziativ und
(ϕ ◦ (ψ1 + ψ2 ))(a)
= ϕ(ψ1 (a) + ψ2 (a)) = (ϕ ◦ ψ1 )(a) + (ϕ ◦ ψ2 )(a) = (ϕ ◦ ψ1 + ϕ ◦ ψ2 )(a) .
Analog zeigt man das andere Distributivgesetz, also ist End (G) ein Ring; er heiÿt von G. Einselement ist die identische Abbildung, Einheiten sind die Automorphismen.
Endomorphismenring
Endomor-
Ist V ein Vektorraum über einem Körper K , so hat man analog den End (V ). Als Beispiel betrachten wir den R-Vektorraum V = R[X] der Polynome mit reellen Koezienten (vgl. II 1.5). Er hat die abzählbare Basis (1, X, X 2 , . . . , X k , . . .). Wir geben zwei wichtige Endomorphismen an:
phismenring
Die Dierentiation ergibt:
D : R[X] → R[X] , an X n + . . . + a1 X + a0 → nan X n−1 + . . . + a1 , durch Integration erhält man
I : R[X] → R[X] , bm X m + . . . + b1 X + b0 →
bm b1 X m+1 + . . . + X 2 + b0 X . m+1 2
Der Endomorphismus D ist nicht injektiv (den Kern bilden die konstanten Polynome) und I ist nicht surjektiv (die konstanten Polynome liegen nicht im Bild). Oensichtlich ist D ◦ I = idR[X] ,
153
1.4 BEISPIELE
also ist D Linksinverses von I und I Rechtsinverses von D, aber D und I sind keine Einheiten im Ring End (R[X])! In einem beliebigen Körper K kann man Probleme mit den ganzzahligen Faktoren bekommen (vgl. III 1.1). Ein analoges Beispiel erhält man allgemein, indem man D und I auf der Basis (1, X, . . . , X k , . . . ) von K[X] durch
D(X k ) := X k−1 , D(1) := 0
und
I(X k ) := X k+1
erklärt. In einem endlich-dimensionalen Vektorraum geht das nicht: Ist
dimK V < ∞
und sind
F, G ∈ End (V )
gegeben mit
F ◦ G = idV ,
so sind
F, G
Isomorphismen, also Einheiten im Endomorphismenring.
Das weiÿ man aus der linearen Algebra, denn aus F ◦ G = idV folgt durch Betrachtung der Dimensionen, dass F surjektiv und G injektiv ist (vgl. etwa [Fi1 , 2.2.4]).
Beispiel 6
Im vorhergehenden Beispiel hatten wir den Endomorphismenring einer abelschen Gruppe betrachtet, ein Spezialfall sind Vektorräume V über einem Körper K . Ist dimK V = n < ∞, so wird nach Wahl einer Basis jeder Endomorphismus durch eine n × n-Matrix beschrieben, das ergibt nach den Regeln der linearen Algebra [Fi1 , 2.6.4] einen Ringisomorphismus ∼ =
Matrizenring
EndK (V ) −→ M (n × n; K) .
Der M (n × n; K) hat als Einselement die Einheitsmatrix En , für n ≥ 2 ist er nicht kommutativ und hat Nullteiler. Man kennt die Einheiten:
(M (n × n; K))× = GL (n; K) = {A ∈ M (n × n; K) : det A = 0} . Der Matrizenring ist sehr nützlich, weil man viele Ringe als Unterringe realisieren kann, das nennt man (in Analogie zur Permutationsdarstellung von Gruppen in I 4.2). Wir wollen den Nutzen einer solchen Darstellung am Beispiel der Konstruktion der H von vorführen.
Matrixdarstellung Quaternionen
Hamilton
Es ist naheliegend, die Konstruktion folgendermaÿen zu beginnen: Die Addition in H = R4 ist die Addition im Vektorraum. Zur Denition der Multiplikation betrachten wir zunächst die kanonische Basis
e := e1 , i := e2 , j := e3 , k := e4 . Darauf wird die Multiplikation erklärt wie in der Quaternionengruppe (Beispiel 4 aus I 1.9) durch die Tafel
·
e i j k
e e i j k
i i -e -k j
j j k -e -i
k k -j i -e
154
II RINGE
Das Produkt beliebiger Elemente aus H erhält man daraus, indem man nach dem Distributivgesetz ausmultipliziert:
(ae + bi + cj + dk) · (a e + b i + c j + d k) =
(aa − bb − cc − dd ) e + (ab + ba + cd − dc ) i +(ac − bd + ca + db ) j + (ad + bc − cb + da ) k .
(∗)
Aber nun beginnt der Ärger mit dem Nachweis der Axiome. Schon um das Inverse zu nden, muss man ein Gleichungssystem für die vier Unbekannten a , b , c , d lösen. Der Leser möge das zur Übung in Angri nehmen.
Wir kommen zurück auf den Trick von Cayley, der schon in Beispiel 4 aus I 1.9 bei der Denition der Quaternionengruppe verwendet wurde, nämlich die Benutzung des Rings M (2 × 2; C). Dazu betrachten wir die Abbildung z w ϕ C × C −→ M (2 × 2; C) , (z, w) → . −w ¯ z¯
ϕ ist ein injektiver Homomorphismus von C-Vektorräumen, also ist H := ϕ(C × C) ⊂ M (2 × 2; C) ein 2-dimensionaler komplexer Untervektorraum. C × C ist ein 4-dimensionaler reeller Vektorraum, wir verwenden den R-Isomorphismus
R4 → C × C , (a, b, c, d) → (a + bi, c + di) und seine Komposition mit ϕ 4
R → M (2 × 2; C) , (a, b, c, d) →
a + bi
c + di
−c + di
a − bi
.
Das ergibt einen R-Vektorraum-Isomorphismus ψ : R4 → H , als Bild der kanonischen Basis in R4 erhält man die R-Basis 1 0 i 0 E = ψ(e1 ) = , I = ψ(e2 ) = 0 1 0 −i 0 1 0 i J = ψ(e3 ) = , K = ψ(e4 ) = . −1 0 i 0 von H . Damit ist gewonnen: Unsere ins Auge gefasste Multiplikation in R4 wird realisiert durch die Multiplikation von Matrizen. H ⊂ M (2×2; C) ist ein Unterring, denn ¯ zw + w¯ z z w zz − ww z w = . −w ¯ z¯ −(¯ zw ¯ + wz ¯ ) z¯z¯ − ww ¯ −w ¯ z¯
155
1.5 POLYNOMRINGE
In C × C ergibt das via ϕ−1 die Multiplikation
(z, w) · (z , w ) = (zz − ww ¯ , zw + w¯ z) , in R4 entspricht das via ψ −1 der Formel (∗) von oben. Insbesondere ist die Multiplikation in H assoziativ und auch das Distributivgesetz ist erfüllt, da diese Regeln für Matrizen in der Linearen Algebra bewiesen wurden. Weiter ist für (z, w) ∈ C × C z w det = z z¯ + ww ¯≥0 −w ¯ z¯ und für (z, w) = (0, 0) ist z z¯ + ww ¯ > 0, also
z
w
−w ¯
z¯
−1
1 = z z¯ + ww ¯
z¯ −w w ¯
z
∈ H .
Damit ist gezeigt, dass H ein Schiefkörper ist. Da
ψ : R4 → H ein R-Vektorraum-Isomorphismus ist, überträgt sich die Struktur des Schiefkörpers H auf H = R4 , derart dass die Regel (∗) gilt. Damit wird ψ zu einem Ringisomorphismus. Wie man sofort sieht, gilt damit in H
(ae + bi + cj + dk)−1 =
a2
+
b2
1 (ae − bi − cj − dk) . + c 2 + d2
Man nennt H den Schiefkörper der Quaternionen . Die Quaternionengruppe Q ist eine Untergruppe der Ordnung 8 von H× .
1.5 Polynomringe Vom naiven Standpunkt ist ein
Polynom
ein formaler Ausdruck
f (X) = an X n + an−1 X n−1 + . . . + a1 X + a0 . Damit man wie gewohnt damit rechnen kann, sollen die Koezienten a0 , . . . , an Elemente eines Ringes R sein; damit die Monome X k Polynome sind, soll der Ring eine 1 besitzen. Wie wir später sehen werden, ist es nützlich, wenn R kommutativ ist. Von der Unbestimmten X erwartet man, ihrem Namen entsprechend, dass man dafür einsetzen kann, was man will - oder zumindest alles was sinnvoll ist. Das ist von einem formalen Standpunkt keine befriedigende Erklärung. Um es besser zu machen, nutzt man die Beobachtung, dass ein Polynom eindeutig festgelegt ist durch eine Verteilung einer endlichen Zahl von Ringelementen auf vorgegebene
156
II RINGE
Positionen, nämlich als Faktoren der Monome X 0 , X 1 , . . . , X k , . . .. Damit sind wir startklar. Sei R ein kommutativer Ring mit 1. Dann ist R[X] erklärt als Menge aller Folgen
(a0 , a1 , . . . , ak , . . .) mit ak ∈ R und ak = 0 für fast alle
k∈N.
Eine Addition in R[X] ist komponentenweise erklärt, also
(a0 , a1 , . . . , ak , . . .) + (b0 , b1 , . . . , bk , . . .) := (a0 + b0 , a1 + b1 , . . . , ak + bk , . . .) . Die komponentenweise Multiplikation ist nicht angemessen; dem üblichen Rechnen mit Polynomen entspricht das (oder die )
Cauchy-Produkt
Faltung
(a0 , a1 , . . . , ak , . . .) · (b0 , b1 , . . . , bk , . . . ) = (c0 , c1 , . . . , ck , . . . ) mit ck :=
k
al bk−l .
l=0
Der Name Faltung rührt daher, dass bei einer Faltung der Zahlengeraden im Punkt k2 die Indizes l und k − l zusammentreen. Mit Hilfe der Ringaxiome in R weist man ohne jede Mühe nach, dass R[X] mit der oben erklärten Addition und Multiplikation ein kommutativer Ring mit Einselement 1 = (1, 0, . . . , 0, . . .) ist. Durch den Monomorphismus
R → R[X] , a → (a, 0, . . . , 0, . . .) kann man R als Unterring von R[X] auassen. Nun kommt die Katze aus dem Sack: Wir erklären X := (0, 1, 0, . . . , 0, . . .) ∈ R[X] . Nach Denition der Multiplikation in R[X] folgt
X k = (0, . . . , 0, 1, 0, . . .)
für k ∈ N ,
wobei die 1 an der (k + 1)-ten Stelle steht. Damit sind wir am Ausgangspunkt angelangt: Ist
f = (a0 , a1 , . . . , an , 0, . . .) ∈ R[X] mit ak = 0 für k > n , so folgt aus den Rechenregeln in R[X]
f = a0 + a1 X + . . . + an X n . Die Fähigkeit der Unbestimmten X , alle möglichen Werte anzunehmen, kann man so formulieren:
Universelle Eigenschaft des Polynomrings 1,
so hat der
Gegeben ein Ring ein
x ∈ S,
Ist
R
ein kommutativer Ring mit
Polynomring R[X] folgende Eigenschaft: S
(kommutativ mit
1), ein Ringhomomorphismus ϕ : R → S und Φ : R[X] → S mit Φ(X) = x,
so gibt es genau einen Homomorphismus
1.5 POLYNOMRINGE
157
so dass das Diagramm
R[X] p p ∪ R kommutiert, d.h. Beweis
pp Φ pp pp ϕ R - S
Φ eine Fortsetzung von ϕ ist.
Da Φ ein Homomorphismus sein soll, muss
Φ
ak X k = ϕ(ak )xk
k
(∗)
k
sein. Also gibt es höchstens ein solches Φ. Verwendet man die Gleichung (∗) als Denition von Φ, so zeigen elementare Rechnungen, dass Φ ein Homomorphismus ist. Man beachte, dass beim Nachweis von Φ(f ·g) = Φ(f )·Φ(g) die Kommutativität von S benötigt wird. Am einfachsten sieht man das schon für
f = aX , g = b , f · g = abX und !
Φ(f · g) = Φ(abX) = ϕ(ab)x = ϕ(a)ϕ(b)x = ϕ(a)xϕ(b) = Φ(f ) · Φ(g) . 2 Ist etwa R = R, S = C, ϕ die Inklusion und x = i, so ist Φ : R[X] → C surjektiv und X 2 + 1 ∈ Ker Φ. Ursprünglich ist ein Polynom eine Funktion, dieser Zusammenhang lässt sich schön mit der universellen Eigenschaft beschreiben. Ist R ein Ring (kommutativ mit 1), so ist auch die Menge Abb (R, R) der Abbildungen von R in sich ein Ring (Beispiel 4 aus II 1.4). Spezielle Elemente sind die konstanten Abbildungen
ϕa : R → R mit ϕa (x) = a für alle x ∈ R und die identische Abbildung idR : R → R mit idR (x) = x für alle x ∈ R . Oensichtlich ist die Abbildung
ϕ : R → Abb (R, R) , a → ϕa ein Homomorphismus. Nach der universellen Eigenschaft von R[X] gibt es genau einen Homomorphismus
Φ : R[X] → Abb (R, R) mit Φ(a) = ϕa und Φ(X) = idR .
158
II RINGE
Schreiben wir f¯ = Φ(f ), so ist
f = an X n + . . . + a1 X + a0 und f¯(x) = an xn + . . . + a1 x + a0 für x ∈ R . Aus dem abstrakten Polynom f entsteht also die reale
Polynomfunktion f¯.
Wir fassen das Ergebnis zusammen:
Satz über die Polynomfunktion die Abbildung
Ist
R ein kommutativer Ring mit 1, so ist
R[X] → Abb (R, R) , f → f¯ ,
ein Homomorphismus.
Vorsicht! Die Unterscheidung von f und f¯ ist wichtig, weil die Abbildung f → f¯ im Allgemeinen nicht injektiv ist. Als Beispiel nehme man den Ring R = {0, 1} und f = X 2 +X . Eine positive Antwort wird in der Bemerkung aus II 1.8 gegeben. Abbildungen eines Rings in sich kann man hintereinanderschalten, bei Polynomfunktionen bedeutet das, dass man sie ineinander einsetzt, d.h. man betrachtet die Funktion f (g(x)). Genauer bedeutet das Folgendes: Ist g ∈ R[X] ein festes Polynom, so gibt es nach der universellen Eigenschaft des Polynomrings genau einen Homomorphismus σg : R[X] → R[X] mit σg (a) = a für a ∈ R und σg (X) = g . Man nennt σg den Einsetzungshomomorphismus (oder Substitutionshomomorphismus ) und schreibt f (g) := σg (f ). Insbesondere gilt f (X) = f , d.h. wenn man g = X einsetzt, ändert sich nichts. Bei der Denition von Polynomen war vorausgesetzt worden, dass nur endlich viele der Koezienten ak ∈ R von Null verschieden sind. Lässt man diese Bedingung fallen, so erhält man formale unendliche Summen f :=
∞
ak X k ,
k=0
das ist eine formale Potenzreihe . Man kann solche Reihen addieren und multiplizieren wie Polynome, und erhält damit eine neue Erweiterung R[X] ⊂ R[[X]] =
∞
a k X k : ak ∈ R
k=0
des Polynomrings zum Ring der formalen Potenzreihen . Im Gegensatz zu Polynomen ergibt eine formale Potenzreihe im Allgemeinen keine Abbildung von R nach R; etwa für R = R oder C kann man Konvergenzbereiche von Potenzreihen studieren.
159
1.6 GRAD EINES POLYNOMS
1.6 Grad eines Polynoms Besondere Bedeutung in einem Polynom f = an X n + . . . + a0 mit an = 0 hat der Leitterm an X n und der Leitkoezient an . Diese höchste auftretende Potenz n von X heiÿt Grad von f . In Zeichen: Ist
f = an X n + . . . + a1 X + a0 mit an = 0, so ist deg f := n . Demnach hat ein konstantes Polynom a0 = 0 den Grad 0. Das Nullpolynom soll noch kleineren Grad haben, wir setzen deg 0 := −∞.
Gradformel
Ist
R
kommutativ mit
1,
so gilt für alle
f, g ∈ R[X]
deg(f · g) ≤ deg f + deg g . Ist der Leitkoezient von Beweis
f
oder
g
Nichtnullteiler, so hat man Gleichheit.
Ist f = 0 oder g = 0, so ist f · g = 0, also
deg(f g) = −∞ = deg f + deg g , denn für alle n ∈ N ist n − ∞ = −∞ − ∞ = −∞. Gilt f = 0 und g = 0, also
f=
m
ak X k mit am = 0 und g =
k=0
n
bk X k mit bn = 0 ,
k=0
so ist deg f = m und deg g = n. Der höchstmögliche Koezient von f · g ist cm+n = am bn , also deg(f g) ≤ m + n. Ist am oder bn kein Nullteiler, so ist cm+n = 0. 2 Man beachte, dass sich für die Summe nur die triviale Vorhersage
deg(f + g) ≤ max{deg f, deg g} machen lässt (es kann g = −f sein!). Besonders angenehm sind Polynome, bei denen der Leitkoezient an eine Einheit ist. Durch Multiplikation mit a−1 n erhält man
f˜ = X n + a ˜n−1 X n−1 + . . . + a ˜1 X + a ˜0 mit a ˜i = ai a−1 n . Ein solches Polynom mit dem Leitkoezienten 1 heiÿt
normiert .
Nullteiler und Einheiten im Polynomring R[X] sind durch R bestimmt:
Bemerkung a) b)
Im Polynomring R[X] gilt: R[X] nullteilerfrei ⇔ R nullteilerfrei. R nullteilerfrei ⇒ (R[X])× = R× .
Beweis
a) ⇒ ist klar, da R ⊂ R[X]; ⇐ folgt aus der Gradformel.
160
II RINGE
b) ⊃ ist klar. Zum Nachweis von ⊂ sei f ∈ (R[X])× . Dann gibt es ein g ∈ R[X] mit f · g = 1, also folgt aus der Gradformel deg f + deg g = deg(f g) = 0 und deg f = deg g = 0 . Somit sind f, g ∈ R konstante Polynome, aus f g = 1 folgt f, g ∈ R× .
2
Wir kommen noch einmal zurück auf den Einsetzungshomomorphismus. Für Polynomfunktionen ist f (g) die Hintereinanderschaltung. Daraus kann man jedes f zurückerhalten, wenn g eine Umkehrung h besitzt: Ist g(h) = idR , so ist die Komposition g f h R→R→R→R gleich f : Wir zeigen nun, dass dies im Allgemeinen genau dann geht, wenn g linear ist.
Lemma
Ist
R
Integritätsring und
mus
g ∈ R[X],
σg : R[X] → R[X] , f → f (g) ,
genau dann ein Isomorphismus, wenn Beweis
so ist der Einsetzungshomomorphis-
g = aX + b
mit
a ∈ R× .
Ist g = aX + b mit a ∈ R× , so denieren wir
h := a−1 (X − b) und oensichtlich ist σg (σh (X)) = X = σh (σg (X)). Nach der universellen Eigenschaft des Polynomrings ist σh invers zu σg . Ist σg surjektiv, so gibt es ein f ∈ R[X] mit X = f (g). Da R Integritätsring ist, gilt deg(f (g)) = (deg f ) · (deg g), also im Fall X = f (g)
(deg f ) · (deg g) = 1 und deg f = deg g = 1 . Daher ist f = cX + d, g = aX + b mit a, c ∈ R {0} und
f (g) = caX + cb + d = 1 · X, also c, a ∈ R× . 2
1.7 Division mit Rest So wie ganze Zahlen kann man auch Polynome mit Rest dividieren. Wir behandeln zunächst den einfachsten Fall, dass die Koezienten aus einem Körper stammen.
Satz über die Division mit Rest
gegeben, wobei
g = 0.
Sei
K
ein Körper und seien
Dann gibt es eindeutig bestimmte
f = qg + r
und
deg r < deg g .
q, r ∈ K[X],
f, g ∈ K[X] derart dass
(∗)
1.7 DIVISION MIT REST
161
Im Quotientenkörper K(X) von K[X] (Beispiel 2 in II 1.14) kann man die Beziehung (∗) auch als f r =q+ g g schreiben. Das Polynom q ist der Anteil des als .
Rest
Beweis
Quotienten , der aufgeht, r verbleibt
Wir zeigen zunächst die Eindeutigkeit. Ist
qg + r = q˜g + r˜ so folgt r − r˜ = (˜ q − q)g . Nun ist einerseits deg (r − r˜) < deg g , wenn deg r , deg r˜ < deg g . Andererseits folgt aus dem Gradsatz
deg (r − r˜) = deg (˜ q − q) + deg g . Das kann nur dann gehen, wenn q˜ − q = 0 ist, also q˜ = q und r˜ = r. Um die Existenz von q und r zu zeigen, sei
f = an X n + . . . + a0 und g = bm X m + . . . + b0 mit n = deg f, m = deg g ≥ 0 . Ist n < m, so kann man q = 0 und r = f setzen,
f =0·g+f ist eine Lösung. Für n ≥ m konstruieren wir schrittweise q1 , . . . , qk ∈ K[X] mit k ≤ n − m + 1, so dass q = q1 + . . . + qk eine Lösung wird. Im ersten Schritt setzen wir f0 := f
q1 := Wir erhalten
f1 := f0 − q1 g
an n−m X . bm
mit
deg f1 < deg f0 .
Ist deg f1 < deg g , so ist q = q1 und r = f1 eine Lösung. Andernfalls fahren wir mit f1 fort wie oben mit f0 und erhalten aus q2
f2 := f1 − q2 g
mit
deg f2 < deg f1 .
Das Verfahren wird so lange fortgesetzt, bis
fk := fk−1 − qk g
mit
deg fk < deg g
erreicht wird. Das ist spätestens bei k = n − m + 1 der Fall. Insgesamt erhält man
f = (q1 + . . . + qk )g + fk ,
162
II RINGE
2
man hat also eine Lösung q = q1 + . . . + qk , r = fk . Als Beispiel für eine konkrete Rechnung setzen wir f = X n − 1 und g = X − 1:
−1
(X n
−X n
) : (X − 1) = X n−1 + X n−2 + . . . + X + 1
+X n−1 −1
X n−1 ..
.
X −1 −X + 1 0 Also ist q = X n−1 + . . . + X + 1 und r = 0. Sind Polynome f, g ∈ R[X] gegeben und ist R kein Körper, sondern nur ein Ring, so muss die Division mit Rest modiziert werden. Betrachtet man den Beweis für Körper, so sieht man, dass nur durch den Leitkoezienten b = bn von g dividiert werden muss. Ist b ∈ R× , so geht alles analog. Im allgemeinen Fall wird in der Iteration statt fi das Polynom bfi bearbeitet. Das Ergebnis sieht so aus:
f1 = bf0 − q1 g , f2 = bf1 − q2 g , .. .
deg f1 < deg f0 , deg f2 < deg f1 ,
fk = bfk−1 − qk g ,
deg fk < deg g .
Dann ist mit f0 = f
bf b2 f .. .
= =
f 1 + q1 g bf1 + bq1 g = f2 + (q2 + bq1 )g
bk f
=
fk + (qk + bqk−1 + . . . + bk−1 q1 )g =: r + qg
Insgesamt erhält man eine
Variante der Division mit Rest
Sei R ein Integritätsring, seien f, g ∈ R[X] mit g = 0, b ∈ R sei der Leitkoezient von g . Dann gibt es q, r ∈ R[X] und k ∈ N, so dass bk f = qg + r
und
deg r < deg g .
2
Ähnlich wie bei Körpern kann man sagen, dass q und r bis auf eine Potenz von b eindeutig bestimmt sind.
163
1.8 NULLSTELLEN UND WERTE VON POLYNOMEN
1.8 Nullstellen und Werte von Polynomen Die Division mit Rest ergibt wichtige Konsequenzen für die Nullstellen von Polynomen. Dabei bezeichnet f (a) für f ∈ R[ X ] und a ∈ R den Wert σa (f ).
Korollar
für ein
Ist
a ∈ R,
R
f ∈ R[X] mit deg f ≥ 1 q ∈ R[X] mit
ein Integritätsring,
so gibt es genau ein
f = (X − a) · q
Beweis
f (a) = 0
deg q = deg f − 1 .
und
Insbesondere hat ein Polynom vom Grad
und gilt
n≥1
höchstens
n
Nullstellen in
R.
Wir dividieren f mit Rest durch g = X − a, das ergibt
f = q(X − a) + r
mit
deg r < 1 .
Aus f (a) = 0 folgt r(a) = 0, also r = 0. Sind a1 , . . . , am ∈ R paarweise verschieden mit f (ai ) = 0, so folgt
f = (X − a1 ) · . . . · (X − am ) · h
und
0 ≤ deg h = deg f − m .
Also muss m ≤ n sein. In II 1.5 hatten wir den Homomorphismus
2
Φ : R[X] → Abb(R, R) , f → f , betrachtet, der jedem abstrakten Polynom f die Polynomfunktion f zuordnet, und wir hatten gesehen, dass Φ nicht injektiv sein muss.
Bemerkung
Ist
R
ein Integritätsring mit unendlich vielen Elementen, so ist
Φ : R[X] → Abb(R, R) injektiv. Beweis f = 0 bedeutet, dass f unendlich viele Nullstellen hat. Nach dem obigen Korollar muss dann f = 0 das Nullpolynom sein. 2
Sind in einem Ring R paarweise verschiedene Elemente a1 , . . . , an gegeben, so ist
f := (X − a1 ) · . . . · (X − an ) ein Polynom vom Grad n mit Nullstellen in a1 , . . . , an . Über einem Körper kann man sogar die Werte eines Polynoms vorschreiben.
Interpolationsformel von Lagrange a 1 , . . . , an ∈ K f ∈ K[X] mit
verschiedene ein
f (ai ) = bi
In einem Körper
K
seien paarweise
und beliebige b1 , . . . , bn vorgegeben. Dazu gibt es genau
für
i = 1, . . . , n
und
deg f ≤ n − 1 .
164
II RINGE
Beweis
Zunächst sieht man, dass für jedes i das Polynom
gi :=
(X − a1 ) · . . . · (X − ai−1 ) · (X − ai+1 ) · . . . · (X − an ) ∈ K[X] (ai − a1 ) · . . . · (ai − ai−1 ) · (ai − ai+1 ) · . . . · (ai − an )
die Eigenschaften
gi (aj ) =
1 für 0 für
i=j, i = j ,
deg gi = n − 1
und
hat. Daher ist durch
f := b1 g1 + . . . + bn gn eine Lösung der Interpolationsaufgabe gefunden. Man nennt f ein Interpolationspolynom . Die Eindeutigkeit ist klar: Aus
f (ai ) = f˜(ai )
folgt
(f − f˜)(ai ) = 0 für
i = 1, . . . , n .
Da deg (f − f˜) ≤ deg gi = n − 1, folgt f = f˜ aus obigem Korollar.
2
1.9 Einheitswurzeln in C Die Nullstellen des Polynoms X n − 1 sind die Grundlage für Fragen der Kreisteilung, mit denen wir uns in Kapitel III näher beschäftigen. Zunächst nennt man ξ ∈ C eine n-te Einheitswurzel , wenn
ξ n = 1 , d.h. ξ ist Nullstelle von X n − 1 . Weiter sei
Cn := {ξ ∈ C : ξ n = 1} ⊂ C
die Menge aller komplexen n-ten Einheitswurzeln. Man kann Cn explizit angeben mit Hilfe einer primitiven n-ten Einheitswurzel
ζn := exp
2π i
. n
Lemma Für jedes n ∈ N {0} ist Cn = {1, ζn , . . . , ζnn−1 }
und
X − 1 = (X − 1) · (X − ζn ) · . . . · (X − ζnn−1 ) . n
Weiter induziert der Homomorphismus ϕn : Z → Cn , r → ζnr = exp
2π ir
, n
165
1.9 EINHEITSWURZELN IN C
einen Isomorphismus
ϕn : Z/nZ → Cn , r + nZ → ζnr , von der additiven zyklischen Gruppe Z/nZ auf die multiplikative Gruppe Cn . Beweis
Für jedes r ∈ Z ist ζnr ∈ Cn , denn r r n ζn = ζnr·n = ζnn = 1r = 1 .
Ebenfalls nach den Rechenregeln für Potenzen ist ϕn ein Homomorphismus. Das erzeugende Element ζn von Cn hat die Ordnung n, daraus folgt Ker ϕn = nZ , nach dem Ersten Isomorphiesatz aus I 3.1 ist ϕn ein Isomorphismus. Insbesondere folgt, dass X n − 1 die n Nullstellen 1, ζn , . . . , ζnn−1 hat; aus II 1.8 2 erhält man die angegebene Zerlegung von X n − 1 in Linearfaktoren. In II 1.7 haben wir gesehen, dass
X n − 1 = (X − 1) · q
mit
q = X n−1 + . . . + X + 1 .
Da ζn = 1 für n > 1, folgt q(ζn ) = 0, d.h. für ζ = ζn gilt
1 + ζ + ζ 2 + . . . + ζ n−1 = 0 . Das bedeutet, dass 0 der Schwerpunkt von Cn ist.
ζ = ζ7
Aus dem Lemma ergibt sich sehr einfach die
Bemerkung
Für m, n ∈ N {0} sei d := ggT (m, n). Dann gilt
C m ∩ C n = Cd . ⊂ Ist ξ ∈ Cm ∩ Cn , so ist ξ m = ξ n = 1. Nach mit d = xm + yn. Also ist Beweis
ξ d = ξ xm+yn = (ξ m )x · (ξ n )y = 1 und
Bézout gibt es x, y ∈ Z ξ ∈ Cd .
⊃ Ist ξ ∈ Cd , so ist ξ d = 1. Da d|m und d|n, folgt ξ m = ξ n = 1, also ξ ∈ Cm ∩Cn . 2
166
II RINGE
1.10 Polynome in mehreren Veränderlichen ∗ Betrachtet man statt einer einzigen Unbestimmten X eine endliche Anzahl X1 , . . . , Xn , so kann man damit ein Polynom als formalen Ausdruck ak1 ...kn X1k1 · . . . · Xnkn f= (k1 ,...,kn )∈Nn
betrachten. Der Strich an der Summe soll bedeuten, dass nur endlich viele der Koezienten ak1 ...kn mit dem Multiindex k1 . . . kn von Null verschieden sind. Lässt man diese Einschränkung fallen, so spricht man von einer formalen Potenzreihe . Zwei Fragen stellen sich unmittelbar: - Das praktische Problem, wie man mit solchen Polynomen rechnet. - Eine theoretische Erklärung des Begris von mehreren unabhängigen Unbestimmten. Da Polynome von mehreren Veränderlichen in diesem einführenden Buch nur gelegentlich auftauchen, begnügen wir uns damit, die Antworten zu skizzieren. Zur ersten Frage ist zunächst zu bemerken, dass die Reihenfolge, in der die Monome ak1 ...kn X1k1 · . . . · Xnkn zu summieren sind, im Gegensatz zum Fall n = 1 nicht eindeutig festgelegt ist. Daher ist es von Vorteil zu festem k ∈ N all die Monome mit k1 + . . . + kn = k zusammenzufassen zum homogenen Anteil ak1 ...kn X1k1 · . . . · Xnkn , fk := k1 +...+kn =k
vom
Grad k, dann ist f=
N
fk ,
k=0
wobei N maximal mit fN = 0 gewählt ist. Die Menge aller Polynome in X1 , . . . , Xn mit Koezienten aus einem kommutativen Ring R mit 1 bezeichnet man mit
R [X1 , . . . , Xn ] . Daraus wird ein Ring, indem man die formalen Ausdrücke nach den oensichtlichen Regeln addiert und multipliziert. Das kann man mit etwas Theorie untermauern. Zunächst betrachten wir die
primitiven Monome X1k1 · . . . · Xnkn ,
sie sind durch ihre Exponenten (k1 , . . . , kn ) ∈ Nn eindeutig bestimmt. Also wird die Menge X der primitiven Monome zu einer kommutativen Halbgruppe, wenn eine Multiplikation in X durch die Addition in Nn beschrieben wird:
(X1k1 · . . . · Xnkn ) · (X1l1 · . . . · Xnln ) := X1k1 +l1 · . . . · Xnkn +ln .
1.10 POLYNOME IN MEHREREN VERÄNDERLICHEN∗
167
Das ergibt genau genommen einen Isomorphismus
Nn → X , (k1 , . . . , kn ) → X1k1 · . . . · Xnkn , von Halbgruppen. Links wird addiert, rechts multipliziert. Neutrales Element in X ist e := X10 · . . . · Xn0 . Nun erklären wir den Polynomring als sogenannten
Halbgruppenring von X, d.h.
R [X1 , . . . , Xn ] := R[X] := {f : X → R , wobei f (x) = 0 für fast alle x ∈ X} . Ist x = X1k1 ·. . .·Xnkn , so setzt man ak1 ...kn := f (x). Die Elemente von R[X] heiÿen . In R[X] kann man addieren und multiplizieren: (f + g)(x) := f (x) + g(x) , (f · g)(x) := f (y) · g(z) ;
Polynome
y,z∈X y·z=x
das sind Verallgemeinerungen der Formeln aus II 1.5, wo n = 1 war. Schlieÿlich erklären wir für jedes a ∈ R das konstante Polynom ca durch
a für x = e , ca (x) = 0 sonst. Es ist nun Routinearbeit nachzuprüfen, dass R[X] zusammen mit der oben erklärten Addition und Multiplikation ein kommutativer Ring mit Einselement c1 ist, und dass die Abbildung R → R[X] , a → ca , ein Monomorphismus von Ringen ist. Man kann also
R ⊂ R[X] = R [X1 , . . . , Xn ] als Unterring des Polynomrings in n Unbestimmten auassen. Schlieÿlich hat jedes f ∈ R [X1 , . . . , Xn ] eine eindeutige Darstellung f= ak1 ...kn X1k1 · . . . · Xnkn mit ak1 ...kn := f (X1k1 · . . . · Xnkn ) (k1 ,...,kn )∈Nn
Monomen
als endliche Summe von , wobei die Additionen und Multiplikationen nach den Regeln in R[X] ausgeführt werden. Damit ist der zu Beginn angegebene formale Ausdruck theoretisch abgesichert. Da f nach Denition eine endliche Summe von Monomen
ak1 ...kn X1k1 · . . . · Xnkn ist, gibt es im Fall f = 0 mindestens eines davon, bei dem ak1 ...kn = 0 und die Summe d := k1 + . . . + kn
168
II RINGE
der Exponenten maximal ist. Dieses d heiÿt (totaler) Grad von f , in Zeichen
deg f := max{k1 + . . . + kn : ak1 ...kn = 0} . Man setzt wieder deg 0 := −∞. Anschaulich ausgedrückt entsteht ein Element des Halbgruppenrings R [X1 , . . . , Xn ], indem man endlich viele Ringelemente in Nn verteilt. Für n = 2 kann man das einfach grasch beschreiben, wir geben ein Beispiel mit R = Z und setzen X = X1 , Y = X2 :
Y 6 4
1
3
2
2
3
1
-1
0
2 0
-1
4
3 1
1
2
3
4
X
Die Monome von f kann man in verschiedener Reihenfolge summieren: In lexikograscher Anordnung ist
f = 2 − Y + 4XY + 3XY 2 + X 2 + 2X 2 Y 3 − X 3 Y 2 + X 3 Y 4 + 3X 4 Y . Nach homogenen Anteilen zerlegt ist
f = 2 + (−Y ) + (4XY + X 2 ) + (3XY 2 ) + (2X 2 Y 3 − X 3 Y 2 + 3X 4 Y ) + (X 3 Y 4 ) . Schlieÿlich kann man nach Potenzen von Y sortieren:
f = (2 + X 2 ) + (−1 + 4X + 3X 4 ) Y + (3X − X 3 ) Y 2 + (2X 2 ) Y 3 + (X 3 ) Y 4 . Also ist f auch ein Polynom in Y mit Koezienten im Ring Z[X]. Daran erkennt man, dass sich allgemeiner Polynomringe in mehreren Unbestimmten auch rekursiv denieren lassen durch
R [X1 , . . . , Xn ] := (R [X1 , . . . , Xn−1 ])[Xn ] . Das ist vor allem für Induktionsbeweise nützlich.
169
1.10 POLYNOME IN MEHREREN VERÄNDERLICHEN∗
Für spätere Anwendungen benötigen wir elementare Eigenschaften homogener Polynome. Dabei nennt man f ∈ R[ X1 , . . . , Xn ] homogen vom Grad k , in Zeichen deg f = k , wenn
f=
ak1 ...kn X1k1 · . . . · Xnkn .
k1 +...+kn =k
Das bedeutet, dass f gleich seinem homogenen Anteil vom Grad k ist. Eine nützliche Charakterisierung erhält man durch Multiplikation aller Variablen mit einem Faktor. Um Probleme mit den Elementen des Rings R zu vermeiden, nehmen wir als Faktor eine weitere Unbestimmte T dazu.
Lemma Ein Polynom f ∈ R[ X1 , . . . , Xn ] ist genau dann homogen vom Grad k, wenn in R[ X1 , . . . , Xn ][ T ] gilt: f (T X1 , . . . , T Xn ) = T k f (X1 , . . . , Xn ) .
Beweis
Ist f = f0 + . . . + fN die Zerlegung in homogene Anteile, so ist
f (T X1 , . . . , T Xn ) =
N
fl (T X1 , . . . , T Xn ) =
l=0
N
T l fl (X1 , . . . , Xn ) .
l=0
2
Daraus folgt die Behauptung durch Koezientenvergleich. Schlieÿlich notieren wir noch eine Aussage über
Produkte homogener Polynome Gegeben seien ein Integritätsring mit f = g · h. Dann gilt
f, g, h ∈ R[ X ]
f
homogen
⇔
und
g
h
R
und
homogen .
Beweis
⇐ ist oensichtlich, die Grade addieren sich. Zum Nachweis von ⇒ zerlegen wir g und h in die nicht verschwindenden homogenen Anteile:
g = g k 1 + . . . + g kr
und
h = hl1 + . . . + hls
mit k1 < . . . < kr und l1 < . . . < ls . Angenommen g ist nicht homogen, dann ist r ≥ 2 und
f = g k 1 hl 1 + . . . + g kr hl s Also ist f nicht homogen.
mit
k1 + l 1 < k r + l s . 2
170
II RINGE
1.11 Endliche Untergruppen der multiplikativen Gruppe eines Körpers Mit den nun zur Verfügung stehenden Hilfsmitteln können wir ein überraschendes Ergebnis beweisen, das entscheidend sein wird bei der Untersuchung der Struktur endlicher Körper in III 3.4.
Satz Jede endliche Untergruppe G der multiplikativen Gruppe K × eines Körpers K ist zyklisch.
Beweis Verwendet man die Struktursätze über endliche abelsche Gruppen, so geht es ganz schnell: Ist n := exp (G) , so ist an = 1 für alle a ∈ G nach dem Korollar aus I 6.5. Also ist jedes a ∈ G Nullstelle des Polynoms
X n − 1 und daher
ord (G) ≤ n ,
da X n − 1 höchstens n Nullstellen hat (II 1.8). Da es aber nach Denition des Exponenten ein a ∈ G mit ord (a) = n gibt, folgt G = Erz (a). 2 Viel elementarer aber etwas länger ist der Beweis mit Hilfe der Eulerschen Identität aus I 3.11. Ist n := ord G, so vergleichen wir G mit Zn . Wir haben für 1 ≤ d ≤ n
Md (G)
:=
{a ∈ G : ord a = d}
ψ(d)
:=
ord Md (G)
ψ(d)
d|n
=
n
Md (Zn )
:=
{a ∈ Zn : ord a = d}
ϕ(d)
:=
ordMd (Zn )
=
ϕ(d)
d|n
Es genügt, ψ(d) ≤ ϕ(d) für alle d zu beweisen, denn daraus folgt ψ(d) = ϕ(d), insbesondere ψ(n) = ϕ(n) ≥ 1, denn Zn ist zyklisch. Sei also d so gewählt, dass ψ(d) ≥ 1 und a ∈ Md (G). Dann ist
H := Erz (a) < G
und
H∼ = Zd , also ord Md (H) = ϕ(d) .
Also genügt es, Md (G) ⊂ Md (H) und dazu Md (G) ⊂ H zu zeigen. Jedes Element von H ist Nullstelle von X d − 1, also ist
X d − 1 = (X − 1)(X − a) · . . . · (X − ad−1 ) in K[X] . Für jedes b ∈ Md (G) gilt bd = 1, also folgt b ∈ H .
2
Die einfachsten Beispiele sind die zyklischen Gruppen Cn < C× (Beispiel 6 in I 1.9).
1.12 EINBETTUNG EINER HALBGRUPPE IN EINE GRUPPE
171
1.12 Einbettung einer Halbgruppe in eine Gruppe Die ganzen Zahlen Z erhält man aus den natürlichen Zahlen N, indem man Negative dazu nimmt, die rationalen Zahlen Q aus Z, indem man Brüche bildet. Man muss sich nicht allzu sehr den Kopf zerbrechen, was eine negative Zahl an sich ist, es genügt zu wissen, wie man damit rechnet. Der formale Hintergrund einer solchen Erweiterung eines Zahlbereichs ist die Ergänzung einer Halbgruppe H zu einer Gruppe G. Das geht nicht ohne Voraussetzungen an H .
Satz über die Einbettung von Halbgruppen Sei (H, ·) eine Halbgruppe, die
folgende Bedingungen erfüllt: 1) H ist nicht leer und kommutativ. 2) In H gilt die Kürzungsregel a · x = b · x ⇒ a = b, falls a, b, x ∈ H . Dann gibt es eine abelsche Gruppe (G, ∗), so dass H ⊂ G und a ∗ b = a · b für a, b ∈ H .
Man nennt H ⊂ G eine Einbettung von H in G. Eine kommutative Halbgruppe, in der die Kürzungsregel 2) nicht gilt, ndet man in Beispiel 6 aus I 1.2.
Beweis Schulden entstehen dann, wenn man für einen Betrag b einkauft, aber nur
einen kleineren Betrag a auf dem Konto hat. Der gleiche Schuldenstand kann auch durch eine andere Kombination a , b entstehen, nämlich dann, wenn a−b = a −b , oder, ohne Minuszeichen ausgedrückt, a + b = b + a . Dem entsprechend denieren wir in H × H die Relation
(a, b) ∼ (a , b ) :⇔ a · b = b · a . Um zu zeigen, dass es sich um eine Äquivalenzrelation handelt, benötigt man die angegebenen Voraussetzungen:
(a, b) ∼ (a, b), denn ab = ba. (a, b) ∼ (a , b ) ⇒ a b = ba = ab = b a ⇒ (a , b ) ∼ (a, b). (a, b) ∼ (a , b ) ∼ (a , b ) ⇒ ab = ba und a b = b a ⇒ ab a b = ba b a ⇒ ab (a b ) = ba (a b ) ⇒ ab = ba ⇒ (a, b) ∼ (a , b ). Die Äquivalenzklasse von (a, b) bezeichnen wir mit [ a, b ], die Menge aller Äquivalenzklassen mit G. In G wird eine Verknüpfung erklärt durch
[ a, b ] ∗ [ c, d ] := [ a · c, b · d ] . Diese ist wohldeniert, denn aus [ a, b ] = [ a , b ] und [ c, d ] = [ c , d ] folgt
ab = ba und cd = dc , also acb d = bda c , d.h. [ ac, bd ] = [a c , b d ] , da H kommutativ ist. Auÿerdem ist ∗ assoziativ und kommutativ, da in H diese Regeln gelten.
172
II RINGE
Ein neutrales Element e ∈ G ist e = [ a, a ] für beliebiges a ∈ H . Da
[ a, b ] ∗ [ b, a ] = [ ab, ba ] = e , ist [ a, b ]−1 = [ b, a ] . Also ist (G, ∗) eine abelsche Gruppe. Um H als Teilmenge von G wiederzunden, betrachten wir die Abbildung
H → G , a → [ a · a, a ] . Sie ist injektiv, denn aus
[ aa, a ] = [ bb, b ] folgt aab = abb und a = b nach der Kürzungsregel in H . Weiter ist
[ aa, a ] ∗ [ bb, b ] = [ aabb, ab ] = [ (ab)(ab), ab ] , also kann man a ∈ H mit [ aa, a ] ∈ G identizieren und es folgt a · b = a ∗ b für a, b ∈ H . 2 Im Fall einer multiplikativen oder additiven Verknüpfung kann man auch
a = [ a, b ] b
und
a − b = [ a, b ]
als formalen Quotienten oder formale Dierenz schreiben. Als Beispiel im additiven Fall erhält man die Einbettung N ⊂ Z. Den multiplikativen Fall werden wir im nächsten Abschnitt bei Ringen weiter verfolgen.
1.13 Quotientenkörper Ein Integritätsring R ist bezüglich der Addition eine abelschen Gruppe und bezüglich der Multiplikation ist R {0} eine kommutative Halbgruppe mit Kürzungsregel. Also kann man R {0} nach dem Satz über die Einbettung von Halbgruppen zu einer multiplikativen Gruppe erweitern. Wir zeigen nun, dass R auf diese Weise zu einem Körper Q(R) wird. Es sei daran erinnert, dass jeder nicht triviale Homomorphismus von einem Körper in einen Ring injektiv ist (Bemerkung f ) in II 1.3).
Satz über den Quotientenkörper Körper
Q(R)
len Eigenschaft: Ist
ϕ : R → K,
Ist
und einen Monomorphismus
K
R ein Integritätsring, so gibt es einen ι : R → Q(R) mit folgender universel-
irgend ein Körper zusammen mit einem Monomorphismus
so gibt es genau einen Monomorphismus
Diagramm
Φ Q(R) _ _ _ 0. Im Restklassenring R[X]/(X 2 + 1) hat X 2 + 1 die Nullstelle
x = X + (X 2 + 1) , denn x2 + 1 = X 2 + 1 + (X 2 + 1) = 0 + (X 2 + 1) , in C ist das gerade i. Nun ist C nicht nur ein Ring, sondern sogar ein Körper; um das im Restklassenring zu begründen, bleibt die Frage, wieso jedes Element = 0 in R[X]/(X 2 +1) eine Einheit ist. In II 3.2 werden wir sehen, dass die Irreduzibilität des Polynoms X 2 + 1 dafür entscheidend ist.
Beispiel 3
Im Gauÿschen Ring
i
i
R := Z + Z = {m + n : m, n ∈ Z} ⊂ C
183
2.5 BEISPIELE
(Beispiel 2 aus II 1.4) betrachten wir das Hauptideal
a := R · (1 + 2i) . Als Untergruppe von R ist a erzeugt durch 1 + 2i und i(1 + 2i) = −2 + i.
re r r r r e r r r r r e r
r r r re r r r r re r r
r re r r r r re r r r r
r r r r r re r r -2+i re r r r r r r re r r re r r r
re r r r r re0 r r r r re
r r r re r r 1+2i re r r r r r r re r r re r r r r r
r r r r re r r r r re r
r r re r r r r re r r r
re r r r r re5 r r r r re
Um die Struktur des Restklassenrings R/a aufzuklären, bemerken wir zunächst, dass modulo a folgende Kongruenzen gelten:
1 + 2i ≡ 0 ⇒ −1 ≡ 2i ⇒
i
≡ 2 ⇒ −1 ≡ 4 ⇒ 5 ≡ 0 .
Dabei wird für die zweite Implikation mit −i multipliziert, für die dritte quadriert. Durch Beschränkung der kanonischen Abbildung ρ : R → R/a auf den Unterring
Z = {m + ni ∈ Z + Zi : n = 0} erhält man einen Homomorphismus ρ : Z → R/a. Da 5 ≡ 0( mod a) ist 5 ∈ Ker ρ . Ist k ∈ Ker ρ = a ∩ Z, so gibt es m, n ∈ Z mit
k = (m + ni)(1 + 2i) = (m − 2n) + (2m + n)i ⇒ 2m + n = 0 , m − 2n = 5m . Also ist k ∈ 5 Z und es folgt Ker ρ = 5 Z. Es ist einfach zu sehen, dass ρ surjektiv ist: i
≡ 2 ⇒ m + ni ≡ m + 2n ∈ Z ,
also hat jede Äquivalenzklasse einen Repräsentanten in Z. Aus dem Isomorphiesatz folgt schlieÿlich das Endergebnis
R/a ∼ = Z/5 Z .
184
II RINGE
2.6 Hauptidealringe und noethersche Ringe Um eine beliebige Teilmenge eines Ringes zu einem Ideal auszubauen, benutzt man die
Bemerkung
ai ⊂ R ,
Ist
R
ein Ring und
so ist
(ai )i∈I
eine beliebige Familie von Idealen
ai ⊂ R
i∈I
ein Ideal.
Sind a, b ∈
Beweis
%
ai und ist x ∈ R, so sind a, b ∈ ai für alle i ∈ I , somit folgt
i∈I
a − b , xa , ax ∈ ai für alle i und a − b , xa , ax ∈
ai .
i∈I
2 Ist A ⊂ R Teilmenge eines Ringes, so wird das von A erzeugte Ideal (A) ⊂ R erklärt als der Durchschnitt aller A umfassenden Ideale a ⊂ R, in Zeichen (A) := a. A⊂a⊂R
Ist R kommutativ, so ist
(A) = {x1 a1 + . . . + xn an : n ∈ N , ai ∈ A , xi ∈ R} , das ist die Menge aller endlichen Linearkombinationen von Elementen aus A mit Koezienten in R. Ist A = {a1 , . . . , an } endlich, so schreibt man
(A) = (a1 , . . . , an ) = Ra1 + . . . + Ran = {x1 a1 + . . . xn an : xi ∈ R} und im Fall A = {a} ist
(a) = Ra = {xa : x ∈ R} das von a erzeugte Hauptideal.
Denition
Ein Ring R heiÿt Hauptidealring , wenn er ein Integritätsring ist, und wenn jedes Ideal a ⊂ R Hauptideal ist. Ein Ring R heiÿt noethersch , wenn jedes Ideal a ⊂ R endlich erzeugt ist, d.h. wenn es a1 , . . . , an ∈ R gibt, so dass a = (a1 , . . . , an ). Insbesondere für die Teilbarkeitstheorie sind alternative Charakterisierungen von noetherschen Ringen wichtig.
Satz* i)
R
Für einen Ring ist noethersch.
R
sind folgende Bedingungen gleichwertig:
185
2.7 EUKLIDISCHE RINGE
ii) Jede aufsteigende Kette von Idealen
a 0 ⊂ a1 ⊂ . . . ⊂ a k ⊂ . . . ⊂ R wird
stationär,
d.h. es gibt ein
iii) Jede nicht leere Menge d.h. es gibt ein
Beweis
i)
b ∈ I,
I
n ∈ N,
von Idealen
so dass
ba
so dass
a⊂R
für kein
an = an+k
für alle
k ∈ N.
besitzt ein maximales Element,
a∈I
gilt.
⇒ ii) : Da die gegebene Kette aufsteigend ist, ist die Vereinigung a := ak ⊂ R k∈N
wieder ein Ideal. Da R noethersch ist, gibt es a1 , . . . , am ∈ R, so dass
a = (a1 , . . . , am ) . Zu jedem ai gibt es ein ni ∈ N, so dass ai ∈ ani . Ist n := max {n1 , . . . , nm }, so folgt ai ∈ an für alle i , also a = ani und an+k = an .
⇒ iii) : Gäbe es eine nichtleere Menge I von Idealen ohne maximales Element, so könnte man damit eine unendliche echt aufsteigende Kette ii)
a 0 a1 . . . a k . . . ⊂ R von Idealen in R aufbauen. iii)
⇒ i) : Sei a ⊂ R ein beliebiges Ideal und I := {b ⊂ R : b endlich erzeugtes Ideal und b ⊂ a} .
Da {0} ∈ I , ist I = ∅; sei c = (a1 , . . . , am ) ⊂ a maximal in I . Angenommen c a, dann gibt es ein a ∈ a c und
c (a1 , . . . , am , a) ⊂ a , im Widerspruch zur Maximalität von c.
2
2.7 Euklidische Ringe Die wichtigsten Beispiele für Hauptidealringe sind der Ring Z der ganzen Zahlen und der Polynomring K[X] über einem Körper K . Das kann man in beiden Fällen durch eine Division mit Rest beweisen. Daher ist ein allgemeiner Begri nützlich.
Denition dung
Ein Integritätsring R heiÿt euklidischer Ring , wenn es eine Abbil-
δ : R {0} → N
186
II RINGE
mit folgender Eigenschaft gibt: Zu a, b ∈ R {0} gibt es q, r ∈ R, so dass
a = qb + r und δ(r) < δ(b) falls r = 0 .
(∗)
Im Quotientenkörper Q(R) lautet die Gleichung (∗)
r a =q+ b b
und
δ(r) < 1 falls r = 0 . δ(b)
q steht für Quotient, r für Rest. Die beiden Standardbeispiele für euklidische Ringe sind Z mit δ(n) := |n | (I 1.8) und der Polynomring K[X] über einem Körper K mit δ(f ) := deg f (vgl. II 1.7). Man beachte einen wesentlichen Unterschied zwischen Betrag und Grad:
| m · n | = | m | · | n | , deg (f · g) = deg f + deg g . Im Ring K[X] sind q und r eindeutig bestimmt (vgl. II 1.7), in Z ist das nicht ohne weiteres der Fall, etwa
7=2·3+1=3·3−2. Man kann q und r in Z aber eindeutig machen, indem man r ≥ 0 verlangt. Kompliziertere Beispiele für euklidische Ringe nden sich in II 3.14.
Satz Ein euklidischer Ring ist Hauptidealring.
Beweis In I 1.8 wurde gezeigt, dass jede Untergruppe von Z von der Form mZ ist. Es genügt, die dort verwendeten Argumente auf einem abstrakteren Niveau zu wiederholen. Sei R euklidisch und a ⊂ R ein Ideal. a = {0} ist Hauptideal, wir können also a = {0} annehmen. Wir betrachten die Menge
M := {n ∈ N : es gibt ein a ∈ a {0} mit n = δ(a)} . Da a = {0}, ist M = ∅, also enthält M ein kleinstes Element k = δ(a) für ein a ∈ a {0}. Wir behaupten a = (a). Angenommen es gäbe ein b ∈ a (a). Dann teilen wir b mit Rest durch a:
b = qa + r mit δ(r) < δ(a) = k falls r = 0 . Da b ∈ / (a), ist r = 0 und aus r = b − qa folgt r ∈ a; das ist ein Widerspruch zur Minimalität von k . 2
Korollar Der Ring Z der ganzen Zahlen und der Polynomring K[X] über einem Körper K sind Hauptidealringe. 2
187
2.8 BEISPIELE
2.8 Beispiele
Beispiel 1
Die Ringe Hauptidealringe.
Z[X]
und
(für einen Körper K ) sind keine
K[X, Y ]
In Z[X] betrachten wir das von zwei Elementen erzeugte Ideal
(2, X) Z[X] . Angenommen, es gibt ein
f = a0 + a1 X + . . . + an X n ∈ Z[X]
mit
(2, X) = (f ) Z[X] .
Da dann 2 ∈ (f ) und X ∈ (f ), muss es g, h ∈ Z[X] geben mit
2=g·f
X =h·f .
und
Aus der ersten Gleichung folgt
f = a0 , g = b0
und
a 0 b0 = 2 ,
nimmt man die zweite Gleichung dazu, so folgt
X = h · a0 , also
h = a1 X
mit
a 0 a1 = 1 .
Da a0 , a1 ∈ Z ist a0 = ±1, also f = ±1 und (f ) = Z[X] im Widerspruch zur Annahme. Ganz analog behandelt man den Fall K[X, Y ]. Angenommen
(X, Y ) = (f )
mit
f = a00 + a10 X + a01 Y + . . . ,
so folgt aus X = gf und Y = hf , dass f = a00 ∈ K × und (f ) = K[X, Y ].
Beispiel 2
Viele für die Algebra interessante Ringe treten in der Analysis auf, besonders wichtig sind Potenzreihenringe. Wie in II 1.5 bezeichnen wir für einen Ring R mit ∞
ak X k : ak ∈ R} R[ [X] ] = {f = k=0
den Ring der formalen Potenzreihen mit Koezienten in R. Im Gegensatz zu Polynomen haben Potenzreihen keinen höchsten Koezienten und damit keinen Grad; ein Ersatz ist der niedrigste Koezient und die : ∞ Ist f := ak X k = 0, so ist
Ordnung
k=0
ord f := min{k : ak = 0} und ord 0 := ∞. Ist R Integritätsring, so gilt oensichtlich ord (f · g) = ord f + ord g .
188
II RINGE
Erstes Ziel unserer Überlegungen ist der
Satz
Ist
K
ein Körper, so ist
K[ [X] ]
ein Hauptidealring.
Zunächst bestimmen wir die Einheiten.
Lemma 1
f ∈ (K[ [X] ])× ⇔ ord f = 0.
Beweis ⇒ Ist ord f > 0, so ist ord (f · g) ≥ ord f > 0, also kann f wegen ord (1) = 0 keine Einheit sein. ⇐ Ist f = ak X k , so können wir a0 = 1 annehmen. Dann erklären wir
g := 1 − f ∈ K[ [X] ] mit ord g > 0 und h := 1 + g + g 2 + . . . ∈ K[ [X] ] , denn bei dieser unendlichen Summation ist jeder Koezient von h eine endliche Summe. Nach der Formel für die geometrische Reihe ist
(1 − g)(1 + g + g 2 + . . .) = 1 , also f · h = 1 . 2 Der Satz ist bewiesen mit folgendem Lemma
Lemma 2
Die Menge der Nicht-Einheiten
m := {f ∈ K[ [X] ] : ord f > 0} ⊂ K[ [X] ]} ist ein Ideal. Es gilt ein
n ∈ N,
Beweis
so dass
m = (X)
und für jedes weitere Ideal
0 = a ⊂ K[ [X] ]
gibt es
a = mn = (X n ) .
Wir betrachten den Homomorphismus
ρ : K[ [X] ] → K , f =
∞
ak X k → a0 .
k=0
Er ist surjektiv und Ker ρ = m, also ist m ein Ideal und es ist K[ [X] ]/m ∼ = K. Ist a ⊂ K[ [X] ] ein beliebiges Ideal, so sei
n := min{k ∈ N : es gibt ein f ∈ a mit ord f = k} . Ist n = ∞, so ist a = 0. Andernfalls sei
f = an X n + an+1 X n+1 + . . . ∈ a mit an = 0 . Dann ist f ∈ mn , also f = g · X n mit g ∈ K[ [X] ]. Da ord g = 0 sein muss, ist g 2 Einheit; also ist auch mn ⊂ a.
2.9 DER HILBERTSCHE BASISSATZ∗
189
Beispiel 3
Nach dem Satz aus II 2.6 ist ein Ring nicht noethersch, wenn es eine nicht stationäre aufsteigende Kette von Idealen gibt. Dafür kann man leicht Beispiele nden. Im Ring C(R) der stetigen Funktionen f : R → R hat man für jedes n ∈ N {0} das Ideal & 1' = 0} , an := {f ∈ C(R) : f | 0, n es gilt a1 a2 . . . an . . . . Also ist C(R) nicht noethersch.
Beispiel 4
Wie wir in Beispiel 2 gesehen haben, ist der Ring C[ [X] ] der formalen Potenzreihen mit komplexen Koezienten ein Hauptidealring. In der komplexen Funktionentheorie beweist man, dass der Ring
O(C) := {f : C → C : f holomorph} gleich dem Unterring von C[ [X] ] der Potenzreihen mit unendlichem Konvergenzradius ist. Im Ring O(C) betrachten wir für n > 0 die Funktion
fn (z) := πz
∞
(1 +
k=n
z z )(1 − ) . k k
Sie hat in C die Nullstellen 0, ± n, ± (n+1), . . . und f1 (z) = sin πz ist die klassische Produktentwicklung des Sinus [F-L, VII, 3]. Oensichtlich ist
(f1 ) (f2 ) . . . (fn ) . . . eine nicht stationäre Idealkette. Als Ergebnis halten wir fest:
Der Unterring O(C) des Hauptidealrings C[ [X] ] ist nicht noethersch. 2.9 Der Hilbertsche Basissatz ∗ Die Ringe Z und K[X] für einen Körper K sind nach II 2.7 als euklidische Ringe auch Hauptidealringe, die Ringe Z[X] und K[X, Y ] nach Beispiel 1 aus II 2.8 dagegen nicht mehr. Wie im Jahr 1888 zeigte, sind diese Ringe jedoch noethersch, d.h. alle Ideale sind endlich erzeugt. Allgemeiner gilt der
Hilbert
Basissatz von Hilbert Ist R ein kommutativer noetherscher Ring mit Einselement, so ist auch der Polynomring R[X] noethersch.
Emmy Noether
Im Jahr 1888 war 6 Jahre alt! Der Basissatz wurde erst viel später so formuliert, der folgende sehr kurze Beweis stammt aus dem Jahr 1976 (vgl. [S]). Angenommen, R[X] wäre nicht noethersch: Dann gäbe es ein nicht endlich erzeugtes Ideal 0 = a ⊂ R[X] .
190
II RINGE
Wir konstruieren daraus eine nicht stationäre Idealkette (a1 ) (a1 , a2 ) . . . (a1 , . . . , ak ) . . . ⊂ R .
Im ersten Schritt wählen wir ein Polynom f sei der Leitkoezient von f , also
1
a1 ∈ R
mit minimalem Grad n
∈a
1
1
,
≥0
f 1 = a 1 X n1 + . . . .
Da a nicht endlich erzeugt ist, folgt a (f ) = ∅, wir wählen in dieser Menge ein Polynom f mit minimalem Grad n und Leitkoezienten a . Allgemein erhalten wir ∈ a (f , . . . , f ) , f =a X + ... f mit minimalem n : Aus der Konstruktion folgt sofort n ≤ n ≤ . . . ≤ n ≤ . . . und (a ) ⊂ (a , a ) ⊂ . . . ⊂ (a , . . . , a ) ⊂ . . . ⊂ R und es bleibt zu zeigen, dass diese Idealkette in jedem Schritt echt aufsteigt. Angenommen, es wäre (a , . . . , a ) = (a , . . . a , a ) für ein k ∈ N . Dann gäbe es b , . . . , b ∈ R mit a = b a + . . . + b a . Nun kommt der Kni: Das Polynom 1
2
2
1
k+1
2
k
k+1
k+1
nk+1
k+1
1
2
1
k
1
1
k
1
k
1
k
g :=
1
k
k+1
1 1
k+1
k
2
k k
bi X nk+1 −ni fi
i=1
hat den Grad n , den Leitkoezienten a und liegt im Ideal (f , . . . , f ). Das ergibt den Widerspruch 2 deg (f − g) < n und f − g ∈ a (f , . . . , f ) . Nach II 1.10 ist K[X , . . . , X ] = (K[X , . . . , X ])[X ], also folgt das k+1
k+1
Korollar n∈N
k+1
1
Ist
K
1
k+1
1
k+1 1
n
n−1
k
k
n
ein Körper, so sind die Polynomringe
K[X1 , . . . , Xn ]
noethersch.
für alle
2
In K[X] wird jedes Ideal von einem Element erzeugt, in K[X , . . . , X ] von endlich vielen Elementen. Es ist eine naheliegende Frage, die minimale Anzahl von Erzeugenden abzuschätzen. Aber Macaulay hat zu jeder Schranke k > 1 ein Ideal a ⊂ C[X , X , X ] angegeben, das nicht durch k Polynome erzeugt werden kann (vgl. [M], [Ab]). Für konkrete Rechnungen mit einem Ideal ist eine sogenannte Gröbnerbasis hilfreich (vgl. dazu etwa [C-L-O'S]). Der Hilbertsche Basissatz ist das Portal zur algebraischen Geometrie, in der die Nullstellenmengen in K von Polynomen aus K[X , . . . , X ] studiert werden. Im 1
k
n
1
2
3
1
n
n
191
2.9 DER HILBERTSCHE BASISSATZ∗
beinahe trivialen Fall n = 1 und K = C wird das in Beispiel 2 aus II 2.12 durchgespielt. Für n = 2 studiert man ebene algebraische Kurven, eine Einführung hierzu ndet man in [Fi3 ]. Höhere Dimensionen werden zum Beispiel bei [Hu] behandelt. In K[ X ] wird jedes Ideal nach II 2.7 von einem Element erzeugt, in K[ X1 , . . . , Xn ] von endlich vielen Elementen. Dass es für n ≥ 2 keine obere Schranke für die minimale Anzahl der erzeugenden Elemente eines Ideals gibt, zeigt das folgende
Beispiel k∈N
a)
In
K[ X, Y ] betrachten mk . Dann gilt:
wir das maximale Ideal
m = (X, Y )
und für
die Potenz
mk
wird als Ideal erzeugt von
A := {X k , X k−1 Y, . . . , XY k−1 , Y k } = {X r Y s : r, s ∈ N, r + s = k} und als
K -Vektorraum
hat
mk
eine Basis
B := {X r Y s : r, s ∈ N, r + s ≥ k} . f1 , . . . , fm ∈ K[ X, Y ] m ≥ k + 1. b) Ist
Beweis
Zu
b)
Teil
a)
ein Erzeugendensystem des Ideals
mk ,
so folgt
ist eine einfache Übungsaufgabe.
betrachten wir den K -Vektorraum
V ⊂ mk ⊂ K[ X, Y ] der homogenen Polynome vom Grad k ; er hat A als Basis, also ist dim V = k + 1. Weiter hat man einen Vektorraumepimorphismus
ρ : mk → V , f → f˜ , wobei f˜ den homogenen Anteil vom Grad k von f bezeichnet (vgl. II 1.10). Es genügt nun zu zeigen, dass f˜1 , . . . , f˜m den Vektorraum V erzeugen. Dazu genügt es, für jedes X r Y s ∈ A Skalare a1 , . . . , am ∈ K zu nden, so dass m
XrY s = ai f˜i . (∗) i=1
Da X Y ∈ m , gibt es zunächst g1 , . . . gm ∈ K[ X, Y ] mit m
g i fi . XrY s = r
s
k
(∗∗)
i=1
Da die Polynome fi ∈ mk keine homogenen Anteile vom Grad kleiner als k haben, kann man deg gi = 0, also gi = ai ∈ K annnehmen. Durch Anwendung von ρ auf (∗∗) erhält man schlieÿlich (∗). 2 Die oben betrachteten Ideale mk ⊂ K[ X, Y ] sind für k ≥ 2 nicht prim. In C[ X, Y ] benötigt man zur Erzeugung eines Primideals höchstens zwei Polynome, denn die
192
II RINGE
Nullstellenmenge ist eine irreduzible Kurve oder ein einzelner Punkt (vgl. etwa zu jeder Schranke m > 1 Primideale [Fi3 ]). Dagegen hat
Macaulay
pm ⊂ C[ X, Y, Z ] angegeben, die nicht von m Polynomen erzeugt werden können. Die Ideale pm gehören zu Kurven im C3 , die durch eine genügend groÿe Zahl von Punkten im C3 gehen (vgl. [M], [Ab]).
2.10 Operationen mit Idealen ∗ Aus zwei Idealen a, b eines Ringes R kann man auf verschiedene Arten ein neues Ideal konstruieren. Neben dem Durchschnitt a ∩ b hat man noch die Summe
a + b := (a ∪ b) = {a + b ∈ R : a ∈ a , b ∈ b} und das
Produkt
a · b := ({ab : a ∈ a , b ∈ b}) = {
n
ai bi : n ∈ N , ai ∈ a , bi ∈ b} .
i=1
Beispiele dazu ndet man in II 2.12. Oensichtlich gelten die folgenden
Rechenregeln
Für Ideale a, b, c eines Ringes R gilt:
1) ab ⊂ a ∩ b. 2) a · (b + c) = a · b + a · c, (b + c) · a = b · a + c · a. 3) (a · b) · c = a · (b · c). Allgemein nennt man Ideale a, b ⊂ R
coprim , wenn a + b = R.
Bemerkung
Sind die Ideale a, b ⊂ R coprim, und ist R kommutativ mit 1, so ist ab = a ∩ b. Beweis Sei x ∈ a ∩ b und 1 = a + b mit a ∈ a und b ∈ b. Dann ist x = 1 · x = (a + b)x = ax + bx ∈ a · b . 2 Analog zur Gruppentheorie (I 3.5) gilt ein sogenannter
Zweiter Isomorphiesatz
Sind a, b Ideale eines kommutativen Ringes, so gilt:
1) a ∩ b ⊂ a und a ⊂ a + b sind Ideale.
2.11 DER CHINESISCHE RESTESATZ∗
2) Durch
193
ϕ : a/a ∩ b → (a + b)/b , a + (a ∩ b) → a + b ,
ist ein Ringisomorphismus gegeben. Dies kann man wieder durch ein Diagramm illustrieren
a ⊂ a+b ∪ ∪ a∩b ⊂ b. Zum Beweis genügt es zu bemerken, dass der Isomorphismus ϕ von Gruppen oensichtlich die Multiplikation respektiert und damit auch Isomorphismus von Ringen ist.
2.11 Der Chinesische Restesatz ∗ In I 3.8 haben wir das Problem von zwei simultanen Kongruenzen in Z betrachtet. Allgemeiner kann man folgende Frage stellen: Man teilt eine Zahl x ∈ Z nacheinander durch m1 , . . . , mk ∈ Z, dabei bleiben die Reste r1 , . . . , rk . Kann man x aus r1 , . . . , rk rekonstruieren? Im Fall k = 2 war gesagt worden, dass das bis auf Vielfache von m1 · m2 möglich ist, wenn m1 und m2 teilerfremd sind. Im Fall k > 2 genügt es nicht vorauszusetzen, dass m1 , . . . , mk teilerfremd sind; man muss vielmehr verlangen, dass mi und mj teilerfremd sind, falls i = j . Das Wesentliche sieht man schon für k = 3: Seien m1 , m2 , m3 paarweise teilerfremd und r1 , r2 , r3 ∈ Z beliebig. Gesucht sind alle x ∈ Z mit
x ≡ ri (mod mi ) für i = 1, 2, 3 . Man deniert n1 := m2 m3 , n2 := m1 m3 und n3 := m1 m2 und überlegt sich, dass mi und ni für i = 1, 2, 3 teilerfremd sind. Daher gibt es yi , yi ∈ Z mit
1 = yi mi + yi ni . Ist x :=
3
ri yi ni , so sieht man sofort, dass x eine Lösung ist: Für i = 1 gilt
i=1
x − r1 = r1 (y1 n1 − 1) + r2 y2 n2 + r3 y3 n3 = −r1 y1 m1 + r2 y2 m1 m3 + r3 y3 m1 m2 ∈ m1 Z , analog für i = 2, 3. Nach dieser Vorbemerkung behandeln wir den allgemeinen Fall:
Chinesischer Restesatz
In einem Ring R (kommutativ mit 1) seien paarweise coprime Ideale a1 , . . . , ak gegeben (d.h. ai + aj = R für i = j ). Dann ist der Homomorphismus
194
II RINGE
δ : R → R/a1 × . . . × R/ak , x → (x + a1 , . . . , x + ak ) , surjektiv und
Ker δ = a1 · . . . · ak .
δ(x) = δ(x ) ⇔ x − x ∈ a1 · . . . · ak und
Insbesondere gilt
R/(a1 · . . . · ak ) ∼ = R/a1 × . . . × R/ak .
Beweis
Wir betrachten für i = 1, . . . , k die Ideale bi := aj ⊂ R . i =j
Zunächst zeigen wir ai + bi = R. Dazu wählen wir bei festem i für alle j = i Elemente aj ∈ ai und aj ∈ aj mit 1 = aj + aj . Daraus folgt
1=
(aj + aj ) ∈ ai +
j =i
a j ⊂ ai +
i =j
a j = ai + b i ,
j =i
also ist 1 ∈ ai + bi und 1 = ai + bi mit ai ∈ ai und bi ∈ bi . Damit können wir zeigen, dass δ surjektiv ist: Sind r1 , . . . , rk ∈ R beliebig, so ist
δ(
k
ri bi ) = (r1 + a1 , . . . , rk + ak ) ,
i=1
denn bi − 1 ∈ ai und bi ∈ b ⊂ aj für i = j . Oensichtlich ist Ker δ = a1 ∩ . . . ∩ ak , also a1 · . . . · ak ⊂ Ker δ . Wir zeigen durch Induktion nach k , dass
a 1 ∩ . . . ∩ a k = a1 · . . . · a k . Der Fall k = 1 ist trivial, sei also b := a1 ∩ . . . ∩ ak−1 = a1 · . . . · ak−1 . Wie wir oben gezeigt haben, sind b und ak coprim, also folgt nach der Bemerkung aus II 2.10
a 1 ∩ . . . ∩ a k = b ∩ a k = b · a k = a1 · . . . · a k . 2 Wieder daheim im Ring R = Z erhalten wir das
2.12 BEISPIELE∗
195
Korollar
Sind paarweise teilerfremde Zahlen m1 , . . . , mk ∈ Z und beliebige r1 , . . . , rk ∈ Z gegeben, so gibt es stets eine Lösung x ∈ Z der simultanen Kongru-
enzen
x ≡ ri (mod mi ) für i = 1, . . . , k ,
und ein x ∈ Z ist ebenfalls eine Lösung genau dann, wenn x ≡ x (mod m1 · . . . · mk ) .
2
2.12 Beispiele∗
Beispiel 1
Wir wollen die Operationen Summe und Produkt von Idealen etwas erläutern und den Unterschied von Produkt und Durchschnitt aufklären. a) Sind die Ideale a, b ⊂ R endlich erzeugt, etwa
a = (a1 , . . . , am ) , b = (b1 , . . . , bn ) , so ist a + b = (a1 , . . . , am , b1 , . . . , bn ) . Insbesondere ist für Hauptideale a = (a) und b = (b) die Summe a + b = (a, b). In einem Hauptidealring ist die Situation noch einfacher. Ist R = Z, so haben wir in I 3.8 gesehen, dass
(m) + (n) = (d) mit d = ggT (m, n) . Wie wir in II 3.3 sehen werden, geht das analog in beliebigen Hauptidealringen. b) Zunächst bemerken wir, dass im Allgemeinen
a · b {a · b : a ∈ a, b ∈ b} . Die Menge auf der rechten Seite ist im Allgemeinen kein Ideal. Ist etwa R = K[X, Y ] , a = (X) und b = (Y ), so ist
X 2 Y + XY 2 ∈ a · b , aber X 2 Y + XY 2 = f · g mit f ∈ a und g ∈ b . Ist R Hauptidealring und a = (a) , b = (b), so ist
a · b = (a · b) . c) Im Allgemeinen ist
a·ba∩b.
Das sieht man einfachsten im Fall a = b, denn dann ist a · b = a2 und a ∩ b = a. Ist etwa a = (m) ⊂ Z, so ist (m2 ) (m) für |m| ≥ 2. Im Fall R = Z ist nach I 3.8
(m) ∩ (n) = (k) mit k = kgV (m, n) , also (m) · (n) = (m) ∩ (n) ⇔ ggT (m, n) = 1 ⇔ (m) + (n) = Z .
196
II RINGE
Beispiel 2
Ist K ein Körper, so kann man auch im Polynomring K[X] die Operationen mit Idealen analog beschreiben wie oben im Ring Z, denn K[X] hat die gleich guten Teilbarkeitseigenschaften wie Z (vgl. dazu II 3.3). Auÿerdem gibt es eine schöne geometrische Illustration der Operationen mit Idealen. Wir beschränken uns hier auf den einfachsten Fall K = C und benutzen die in II 2.7 bewiesene Tatsache, dass K[X] ein Hauptidealring ist. Wir stellen eine Beziehung her zwischen folgenden beiden Mengen: I := Menge der Ideale a ⊂ C[X], M := Menge der endlichen Teilmengen A ⊂ C, vereinigt mit A = ∅ und A = C. Einerseits hat man die Abbildung
I → M , a → N (a) := {x ∈ C : f (x) = 0 für alle f ∈ a} . N (a) heiÿt
Nullstellenmenge von a; ist a = (f ), so ist N (a) = N (f ) := {x ∈ C : f (x) = 0} .
In der umgekehrten Richtung hat man die Abbildung
M → I , A → I(A) := {f ∈ C[X] : f |A = 0} . I(A) heiÿt das
Ideal von A.
Es wäre zu optimistisch zu hoen, diese beiden Abbildungen wären bijektiv und zueinander invers. Ein schöner Vergleich sind zwei Sprachen und ein Wörterbuch: Übersetzt man ein Wort von einer Sprache in die andere und dann wieder zurück, so kann etwas anderes aber immerhin Ähnliches herauskommen. Dieser Eekt wird umso deutlicher, je reichhaltiger die eine Sprache ist. In unserem Fall wird sich zeigen, dass die algebraische Sprache der Ideale subtiler ist als die plumpere Sprache der Teilmengen. Erst einmal schreiben wir eine ganze Liste von Übersetzungsregeln auf. Dabei sind jeweils a, b ∈ I und A, B ∈ M.
1) a ⊂ b ⇒ N (a) ⊃ N (b) , 2) N (a + b) = N (a) ∩ N (b) , 3) N (a ∩ b) = N (a) ∪ N (b) 4) N (I(A)) = A , 5) N (a · b) = N (a ∩ b) ,
A ⊂ B ⇒ I(A) ⊃ I(B) , I(A ∩ B) = I(A) + I(B) , I(A ∪ B) = I(A) ∩ I(B) , I(N (a)) ⊃ a , a · b = a ∩ b ⇔ N (a) ∩ N (b) = ∅ .
Da der Körper C zugrunde gelegt wurde, kann man all diese Regeln nach folgendem Schema ganz einfach beweisen: Ist {0} = a ∈ I, so gibt es genau ein normiertes f ∈ C[X] mit a = (f ). Aus
f = (X − x1 ) · . . . · (X − xn ) folgt N (a) = {x1 , . . . , xn }; dabei können auch mehrfache Nullstellen vorkommen. Ist f = 1, so folgt N (a) = ∅; für a = {0} ist N (a) = C.
2.12 BEISPIELE∗
197
Ist A = {x1 , . . . , xn } mit paarweise verschiedenen xi , so hat f := (X − xi ) · . . . · (X − xn ) nur einfache Nullstellen. Ist g|A = 0, so ist f ein Teiler von g , also folgt I(A) = (f ). Ist a = (f ) und b = (g), so ist a · b = (f · g). Erzeugende Polynome von a + b und a ∩ b sind etwas subtiler. Wir denieren
h∗ := (X − y1 )k1 · . . . · (X − ym )km , wobei {y1 , . . . , ym } = N (f ) ∩ N (g) und die Exponenten ki die minimalen in f und g auftretenden Ordnungen sind. Analog ist
h∗ := (X − z1 )l1 · . . . · (X − zr )lr , wobei {z1 , . . . , zr } = N (f ) ∪ N (g) und die Exponenten lj die maximalen in f und g auftretenden Ordnungen sind. In Terminologie von Teilbarkeit ist (vgl. II 3.6)
h∗ = ggT (f, g)
und
h∗ = kgV (f, g) .
Nun ist einfach zu sehen, dass
a · b = (f · g) ⊂ a ∩ b = (h∗ ) ⊂ a + b = (h∗ ) . Damit kann man die Übersetzungsregeln ganz explizit nachprüfen. Bemerkenswert ist die Regel a ⊂ I(N (a)), bei der im Allgemeinen keine Gleichheit gilt. Ist a = (f ) mit f = (X − x1 )k1 · . . . · (X − xm )km mit paarweise verschiedenen xi , so ist N (a) = {x1 , . . . , xm } und I(N (a)) = (f∗ ) mit f∗ := (X − x1 ) · . . . · (X − xm ) . Zur zweiten Beziehung in 5) bemerken wir
a · b = a ∩ b ⇔ f · g = h∗ ⇔ N (f ) ∩ N (g) = ∅ , denn nur in diesem Fall kumuliert h∗ alle Nullstellen von f und g . Am drastischsten sieht man den Unterschied zwischen Idealen und Mengen im Fall A = {0}: Für jedes n ∈ N {0} ist N (X n ) = {0}. Was im Ring C[X] nur nach Spielerei aussieht, ist in Polynomringen von mehreren Veränderlichen Startpunkt der algebraischen Geometrie.
Beispiel 3
Eine Schulklasse mit 26 Schülern ist auf Klassenausug; da muss mehrmals am Tag nachgezählt werden, ob noch alle da sind. Zur Vereinfachung kann man die Schüler in Reihen der Zahl m aufstellen und nur nachsehen, welcher Rest r bleibt. Bei m1 = 2, m2 = 3 und m3 = 5 müssen Reste r1 = 0, r2 = 2 und r3 = 1 bleiben.
198
II RINGE
Stimmt die Probe mit 2 und 3, so ist die Zahl nur modulo 6 gesichert; es könnten 6,12,... Schüler fehlen. Bei 3 und 5 könnten nur 15 fehlen, bei 2, 3 und 5 ist man modulo 30 also ganz sicher! Allgemeiner kann man aus den verbleibenden Resten r1 , r2 und r3 die Gesamtzahl modulo 30 = m1 m2 m3 bestimmen. Dazu berechnet man zunächst
n1 = m2 m3 = 15 , n2 = m1 m3 = 10 , n3 = m1 m2 = 6 . Da ggT (mi , ni ) = 1 ist 1 = yi mi + yi ni . Die Faktoren yi , yi kann man allgemein mit Hilfe des Euklidischen Algorithmus bestimmen (I 3.13), in diesem Fall sieht man die Lösungen sofort:
1 = −7 · 2 + 1 · 15 = −3 · 3 + 1 · 10 = −1 · 5 + 1 · 6 , also ist z1 = z2 = z3 = 1 und
x = r1 n1 + r2 n2 + r3 n3 = 15r1 + 10r2 + 6r3 ist eine Lösung. Ist etwa r1 = 1, r2 = 1, r3 = 0, so ist x = 25. Das ist modulo 30 die einzige realistische Lösung, also fehlt genau ein Schüler.
Beispiel 4
Im Handbuch der Arithmetik des chinesischen Rechenmeisters Sun Tsu (etwa 400 n.Chr.) ndet sich folgende Aufgabe:
Wir haben eine Anzahl von Dingen, wissen aber nicht genau wie viele. Wenn wir sie zu dreien zählen, bleiben zwei übrig. Wenn wir sie zu fünfen zählen, bleiben drei übrig. Wenn wir sie zu sieben zählen, bleiben zwei übrig. Wie viele Dinge sind es? 2.13 Primideale und maximale Ideale
Beim Übergang von einem Ring R zu einem Restklassenring R/a bleiben einige Eigenschaften wie Kommutativität erhalten, andere wie Nullteiler oder Einheiten können sich deutlich verändern. Das kann man durch Bedingungen an das Ideal a ⊂ R kontrollieren.
Denition 1
Ist R ein Ring, so heiÿt ein Ideal p ⊂ R
Primideal , wenn
a) p = R b) a, b ∈ R und a · b ∈ p ⇒ a ∈ p oder b ∈ p. Bedingung a) ist eine nützliche Konvention; Bedingung b) bedeutet, dass R p multiplikativ abgeschlossen ist. Das Nullideal {0} ist genau dann ein Primideal, wenn R nullteilerfrei ist. Allgemeiner hat man
Lemma 1
Ist der Ring R kommutativ mit 1 = 0 und p ⊂ R ein Ideal, so gilt: p Primideal ⇔ R/p Integritätsring .
199
2.14 BEISPIELE
Beweis
⇒ Ist a ∈ R und a + p ∈ R/p Nullteiler, so gibt es ein b ∈ R p mit
(a + p) · (b + p) = ab + p = p , also ab ∈ p . Da b ∈ / p, folgt a ∈ p, also a + p = 0 + p. ⇐ Ist a · b ∈ p, so folgt (a + p)(b + p) = 0 + p, also a ∈ p oder b ∈ p.
2
Eine zunächst ganz anders aussehende Bedingung ist die folgende:
Denition 2
Ist R ein Ring, so heiÿt ein Ideal m ⊂ R
maximal , wenn
a) m = R b) Es gibt kein Ideal a ⊂ R mit m a R.
Vorsicht!
Man beachte, dass Bedingung b) nicht bedeutet, dass jedes echte Ideal von R in m enthalten sein muss. Die Beziehung zu Primidealen wird sofort klarer durch
Lemma 2
Ist der Ring R kommutativ mit 1 = 0 und m ⊂ R ein Ideal, so gilt: m
maximal
⇔ R/m
Körper .
Beweis
m ist genau dann maximal, wenn für ein Ideal a ⊂ R mit m ⊂ a ⊂ R folgt, dass a = m oder a = R. Nach dem Korrespondenzsatz in II 2.4 ist das gleichbedeutend damit, dass es in R/m nur die trivialen Ideale gibt; nach dem Satz in II 2.2 ist das gleichwertig damit, dass R/m ein Körper ist, denn aus 1 = 0 folgt, dass die Multiplikation in R nicht trivial ist. 2
Korollar
Ist R kommutativ mit 1 = 0, so ist jedes maximale Ideal Primideal. 2
In II 3.2 werden wir sehen, dass in einem Hauptidealring auch die Umkehrung gilt.
2.14 Beispiele
Beispiel 1
Im Ring Z ist jedes Ideal von der Form mZ und
mZ ⊂ nZ ⇔ m = nk mit k ∈ Z ⇔ n teilt m . Für m = 0 ist der Ring Zm = Z/mZ endlich; nach dem Lemma aus II 1.2 ist Zm genau dann Körper, wenn er Integritätsring ist. Also gilt
mZ maximal ⇔ mZ Primideal ⇔ | m | Primzahl .
200
II RINGE
Ist p ein Primteiler von m, so ist mZ enthalten im maximalen Ideal pZ. Ein Ideal aus Z ist also stets in einem maximalen Ideal enthalten, im Allgemeinen in mehreren verschiedenen.
Beispiel 2
Wir betrachten den Polynomring K[X] über einem Körper K , der nach II 2.7 ein Hauptidealring ist. Für jedes a ∈ K ist die
Auswertung
ϕ : K[X] → K , f → f (a) , ein Ringhomomorphismus. Nach dem Korollar aus II 1.8 und dem Ersten Isomorphiesatz in II 2.4 folgt, dass Ker ϕ = (X − a) · K[X] ⊂ K[X] ein maximales Ideal ist. Ob es weitere maximale Ideale gibt, hängt ganz vom Körper ab. Für K = R betrachten wir den Homomorphismus
i
ϕ : R[X] → C , f → f ( ) .
i
Da es kein f ∈ R[X] mit deg f = 1 und f ( ) = 0 gibt, sieht man wieder durch Division mit Rest durch X 2 + 1, dass Ker ϕ = (X 2 + 1) · R[X] ⊂ R[X] , (vgl. Beispiel 2 in II 2.5). Auch dieser Kern ist ein maximales Ideal. Im Fall K = C ist die Situation besonders übersichtlich, denn nach dem Fundamentalsatz der Algebra (III 1.8 ) zerfällt jedes Polynom f ∈ C[X] mit deg f ≥ 1 in Linearfaktoren. Wir geben verschiedene Punkte a1 , . . . , an ∈ C vor und betrachten die Auswertungsabbildung ϕ
C[X] −→ C × . . . × C , f → (f (a1 ), . . . , f (an )) . Sie ist ein Homomorphismus, und surjektiv nach der Interpolationsformel II 1.8. Durch wiederholte Division stellt man fest, dass Ker ϕ das von
f := (X − a1 ) · (X − a2 ) · . . . · (X − an ) erzeugte Hauptideal in C[X] ist. Nach dem Ersten Isomorphiesatz hat man einen Isomorphismus C[X]/(f ) → C × . . . × C . Der Produktring C × . . . × C hat für n ≥ 2 Nullteiler, für n = 1 ist er ein Körper. Also gilt (f ) maximal ⇔ (f ) Primideal ⇔ n = 1 . Man kann die Auswertung eines Polynoms an einer Stelle auch steigern. Für a = 0 sei ϕ : K[X] → K × K , f = a0 + a1 X + . . . → (a0 , a1 ) .
2.14 BEISPIELE
201
Dann ist Ker ϕ = (X 2 ) ; da K × K Nullteiler hat, ist (X 2 ) weder prim noch maximal (was man auch ganz direkt nachprüfen kann). Ist schlieÿlich
f = (X − a1 )r1 · . . . · (X − an )rn mit paarweise verschiedenen ai , so ist das Ideal (f ) in den maximalen Idealen (X − a1 ), . . . , (X − an ) und keinem anderen maximalen Ideal enthalten.
Beispiel 3
Um nicht maximale Primideale sehen zu können, gehen wir in den Polynomring K[X, Y ] von zwei Veränderlichen X, Y über einem Körper K (vgl. II 1.10). In K[X, Y ] betrachten wir die drei Ideale
(X, Y ) ⊃ (Y ) ⊃ (X · Y ) . Zur Beschreibung der Restklassenringe benutzen wir zunächst den Homomorphismus
ϕ0 : K[X, Y ] → K , f → f (0, 0) = a00 . Er ist surjektiv mit Ker ϕ0 = (X, Y ), also ist dieses Ideal maximal; denn K ist Körper. Nun sei
ϕ1 : K[X, Y ] → K[X] , f → f (X, 0) = a00 + a10 X + . . . + an0 X n . Auch ϕ1 ist surjektiv mit Ker ϕ1 = (Y ); also ist (Y ) ein Primideal, da K[ X ] nullteilerfrei ist, aber nicht maximal, denn
(Y ) (X, Y ) K[X, Y ] . Schlieÿlich betrachten wir den Homomorphismus
ϕ2 : K[X, Y ] → K[X] × K[Y ] , f → (f (X, 0), f (0, Y )) . Er ist nicht ganz surjektiv, aber fast: Im ϕ2 = {(g(X), h(Y )) ∈ K[X] × K[Y ] : g(0) = h(0)} . Dieses Bild Im ϕ2 hat Nullteiler, zum Beispiel ist
(X, 0) · (0, Y ) = (0, 0) . Da K[X, Y ]/(X · Y ) ∼ = Im ϕ2 , ist (X · Y ) kein Primideal. Zu den drei betrachteten Idealen gehören Nullstellenmengen in K 2 , die man im Fall K = R ganz einfach zeichnen kann:
202
II RINGE
s
(X, Y )
(Y )
(X · Y )
Zum maximalen Ideal (X, Y ) gehört die Nullstellenmenge
{(x, y) ∈ R2 : x = y = 0} , das ist der Ursprung. Er ist eine minimale nicht leere Teilmenge von R2 . Zum Primideal (Y ) gehört {(x, y) ∈ R2 : y = 0} , das ist eine Gerade. Zum nicht-primen Ideal (X · Y ) gehört
{(x, y) ∈ R2 : x · y = 0} , das ist ein Achsenkreuz. Es ist in zwei Geraden zerlegbar. Dass das geometrische Bild die algebraischen Eigenschaften nur unvollständig beschreibt, sieht man schon im eindimensionalen Fall an Beispiel 2 aus II 2.12.
2.15 Existenz maximaler Ideale und das Lemma von
Zorn∗
In diesem Abschnitt wollen wir zeigen, dass jedes echte Ideal in mindestens einem maximalen Ideal enthalten ist. Der Beweis wird sehr abstrakt und nicht konstruktiv sein, daher vorweg einige einfache Spezialfälle.
1. Im Ring Z ist jedes Ideal von der Form mZ, die maximalen Ideale sind pZ mit einer Primzahl p. Also ist mZ ⊂ pZ ⊂ Z für alle Teiler p von m, falls | m | = 1.
2. Ist K ein Körper, so ist jedes Ideal im Polynomring K[X] von der Form (f ) mit f ∈ K[X]. Im Fall K = C sind die maximalen Ideale von C[X] von der Form (X − a) mit a ∈ C (Beispiel 2 aus II 2.14). Für die echten Ideale (f ) C[X] ist deg f ≥ 1, für jede Nullstelle a von f gilt
(f ) ⊂ (X − a) ⊂ C[X] .
2.15 EXISTENZ MAXIMALER IDEALE UND DAS LEMMA VON ZORN∗
203
Für einen beliebigen Körper K kann man die in II 3.5 bewiesene Aussage verwenden, dass jedes f ∈ K[X] einen irreduziblen Faktor g besitzt. Dann ist (g) maximal und (f ) ⊂ (g) ⊂ K[X] .
3. Als Verallgemeinerung von 2. betrachten wir für einen Körper K den Polynomring K[ X1 , . . . , Xn ] und für eine beliebige Teilmenge ∅ = A ⊂ K n das Ideal
I(A) := {f ∈ K[ X1 , . . . , Xn ] : f |A = 0} ⊂ K[ X1 , . . . , Xn ] . Für jeden Punkt a ∈ K n ist I(a) maximal, denn dieses Ideal ist Kern des surjektiven Auswertungs-Homomorphismus
K[ X1 , . . . , Xn ] → K , f → f (a) . Also gilt I(A) ⊂ I(a) für jedes a ∈ A.
Hilbertschen Nullstellensatz
Aus dem folgt, dass es für einen algebraisch abgeschlossenen Körper K (etwa K = C, vgl. III 1.8) zu jedem maximalen Ideal m ⊂ K[ X1 , . . . , Xn ] genau einen Punkt a ∈ K n gibt, so dass
m = I(a) . Dieses Ergebnis gehört zu den Grundlagen der algebraischen Geometrie (vgl. etwa [Hu, I 1])
4. Im Ring K[ [X] ] der formalen Potenzreihen ist m := (X) das einzige maximale Ideal, jedes andere echte Ideal ist von der Form mn mit n ≥ 1 und mn ⊂ m ⊂ K[ [X] ] (Beispiel 2 in II 2.8).
5. Ist R ein noetherscher Ring (vgl. II 2.6) und a ⊂ R ein Ideal, so besitzt die Menge
I = {b R : b Ideal und a ⊂ b}
ein maximales Element m. Das ist ein maximales Ideal und
a⊂m⊂R.
6. Im Nullring R = {0} gibt es kein echtes Ideal, also auch kein maximales Ideal. Nun kommen wir zu dem angekündigten allgemeinen Ergebnis:
Theorem Sei R ein kommutativer Ring mit Einselement 1 = 0 und a R ein Ideal. Dann gibt es dazu mindestens ein maximales Ideal m ⊂ R mit a⊂m⊂R.
204
II RINGE
Es ist klar, dass man zum Beweis die Menge aller echten Ideale betrachten muss, die a enthalten. Dabei benötigt man einige grundlegende Begrie der Mengenlehre. Sei M eine beliebige Menge mit einer Relation ≤ (d.h. genau genommen einer Teilmenge R ⊂ M × M ). Die Relation ≤ heiÿt auf M , falls für alle a, b, c ∈ M folgendes gilt:
Halbordnung
H1 H2 H3
a ≤ a. a ≤ b und b ≤ a ⇒ a = b. a ≤ b und b ≤ c ⇒ a ≤ c.
Eine Halbordnung heiÿt
H4
Ordnung , falls
a ≤ b oder b ≤ a für alle a, b ∈ M .
Zwei typische Beispiele: Auf M = Z mit der üblichen ≤ Relation ist eine Ordnung gegeben. Ist X eine beliebige Menge und M := P(X) die Potenzmenge, so ist durch A≤B ⇔ A⊂B⊂X eine Halbordnung gegeben, die im Allgemeinen keine Ordnung ist. Ist auf M eine Halbordnung ≤ gegeben, so heiÿt eine nicht leere Teilmenge K ⊂ M eine in M , falls durch ≤ eine Ordnung auf K gegeben ist, d.h.
Kette
a, b ∈ K ⇒ a ≤ b oder Ein Element s ∈ M heiÿt
b≤a.
obere Schranke der Kette K ⊂ M , wenn a ≤ s für alle
Ein Element m ∈ M heiÿt
a∈K.
maximal , wenn für jedes a ∈ M gilt: m≤a ⇒ m=a.
Schlieÿlich heiÿt eine Menge mit einer Halbordnung jede Kette eine obere Schranke besitzt.
induktiv geordnet , wenn
Mit Hilfe all dieser Begrie kann man nun ein Ergebnis der Mengenlehre formulieren, das äquivalent ist zum , d.h. der Aussage, dass das Produkt jeder nichtleeren Familie von nichtleeren Mengen nicht leer ist.
Auswahlaxiom
Lemma von Zorn maximales Element.
Jede induktiv geordnete Menge besitzt mindestens ein
Damit wird der Beweis des Theorems ganz einfach: Wir betrachten die Menge
M := {b R : b Ideal und a ⊂ b} mit der Halbordnung ⊂. Ist K ⊂ M eine Kette, so behaupten wir, dass b⊂R c := b∈K
2.15 EXISTENZ MAXIMALER IDEALE UND DAS LEMMA VON ZORN∗
205
eine obere Schranke von K ist. Dazu genügt es, c ∈ M zu zeigen.
c ist Ideal: Da K = ∅, ist c = ∅. Für b, b ∈ c gibt es b, b ∈ K mit b ∈ b und b ∈ b . Wir können b ⊂ b annehmen, also ist b − b ∈ b ⊂ c. Für x ∈ R ist xb ∈ b ⊂ c. a ⊂ c = R: a ⊂ c ist klar, da a ⊂ b für alle b ∈ K . Wäre c = R, so wäre 1 ∈ c, also gäbe es ein b ∈ K mit 1 ∈ b. Damit ist gezeigt, dass die Halbordnung ⊂ auf M induktiv ist, nach dem Lemma von Zorn folgt die Existenz eines maximalen Elementes m ∈ M , das ist oenbar ein maximales Ideal mit
2
a⊂mR. Aus dem Korollar in II 2.2 folgt sofort das
Korollar
In jedem kommutativen Ring
R
mit Eins ist die Menge
Nichteinheiten die Vereinigung aller maximalen Ideale.
R R×
der
2
206
II RINGE
3 Teilbarkeit in Integritätsringen In I 3.8 hatten wir schon einige elementare Teilbarkeitsbeziehungen für ganze Zahlen behandelt. In der Theorie der Körpererweiterungen benötigt man auch Ergebnisse über die Teilbarkeit von Polynomen. Allgemeiner betrachten wir in diesem Paragraphen zunächst beliebige Integritätsringe. Die Idealtheorie bleibt dabei anfangs im Hintergrund.
3.1 Teiler und assoziierte Elemente Sei nun R stets ein Integritätsring (d.h. mit 1, kommutativ und nullteilerfrei). Sind a, b ∈ R, so heiÿt a Teiler von b (in Zeichen a| b), wenn es ein c ∈ R gibt mit b = c · a. Gleichbedeutend ist, dass b Vielfaches von a ist. In der Sprache der Hauptideale von R gilt
a| b ⇔ (b) ⊂ (a) . Für die Teilbarkeit notieren wir einige oensichtliche
Rechenregeln
a) Für jedes a ∈ R gilt a| 0, 1| a, a| a und 0| a ⇔ a = 0. b) a| b und b| c ⇒ a| c. c) a| b und c| d ⇒ ac| bd. d) a| b1 , . . . , a| bn ⇒ a| (x1 b1 + . . . + xn bn ) für alle x1 , . . . , xn ∈ R. e) a| 1 ⇔ a ∈ R× . f ) a| b ⇒ (ax)| b für jedes x ∈ R× . Im Ring Z hat man nur die Einheiten ±1, entsprechend sind die Teiler von ±m ∈ Z gleichwertig. In beliebigen Integritätsringen wird das etwas komplizierter. Zwei Elemente a, b ∈ R heiÿen
assoziiert , in Zeichen
a ∼ b : ⇔ a| b und b| a .
Bemerkung
Es gilt a ∼ b ⇔ es gibt ein x ∈ R× mit b = x · a .
Kurz ausgedrückt: Assoziiert bedeutet, bis auf eine Einheit gleich.
Beweis ⇐ Ist x · y = 1, so ist a = y · b. ⇒ Aus b = ca und a = db folgt a = db = (dc)a, also wegen der Kürzungsregel 2 d, c ∈ R× . In der Sprache der Hauptideale ist oensichtlich
a ∼ b ⇔ (a) = (b) .
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9_10, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
3.2 IRREDUZIBLE ELEMENTE UND PRIMELEMENTE
207
3.2 Irreduzible Elemente und Primelemente Eine Zahl p ∈ N mit p ≥ 2 ist Primzahl, wenn 1 und p die einzigen positiven Teiler sind. In Analogie zur Physik kann man die Primzahlen als Atome im Bereich der ganzen Zahlen sehen. Allgemeiner hat man die
Denition 1
Ein Element q ∈ R heiÿt irreduzibel , wenn gilt: a) q = 0 und q ∈ / R× . b) Ist q = a · b mit a, b ∈ R, so folgt a ∈ R× oder b ∈ R× . q heiÿt reduzibel , wenn es nicht irreduzibel ist. Demnach sind neben der Null und Einheiten Elemente reduzibel, wenn sie sich als Produkt von Nichteinheiten darstellen lassen. Es gibt wesentlich kompliziertere Integritätsringe als den Ring Z, daher benötigt man für ein sorgfältiges Studium der Teilbarkeit noch einen etwas einschränkenderen Begri.
Denition 2
Ein Element p ∈ R heiÿt Primelement (oder einfach prim ), wenn gilt: a) p = 0 und p ∈ / R× . b) Aus p| (a · b) für a, b ∈ R folgt p| a oder p| b.
Bemerkung
Ein Primelement ist irreduzibel.
Beweis
Ist p = ab, so folgt p| (ab), also p| a oder p| b. Es genügt den Fall p| a zu behandeln. Dann ist
a = cp, also p = ab = (cp)b = (cb)p, somit ist b ∈ R× . 2 In vielen, aber nicht allen Fällen gilt die Umkehrung, das ist eine wesentliche Tücke der Teilbarkeitslehre. Ein klassisches Gegenbeispiel ist der am Ende von II 3.15 beschriebene Kummerring O−5 . Der Unterschied zwischen beiden Begrien wird auch deutlich durch die Übersetzung in die Idealtheorie:
Lemma 1) 2)
Sei R ein Integritätsring und p ∈ R mit p = 0 und p ∈/ R× . Dann gilt: p irreduzibel ⇔ (p) ⊂ R maximales Hauptideal. p Primelement ⇔ (p) ⊂ R Primideal.
Beweis 1)
(p) ⊂ R maximales Hauptideal bedeutet, dass es kein a ∈ R gibt mit (p) (a) R. ⇒ Ist (p) ⊂ (a) R, so gibt es ein c ∈ R mit p = ca. Da a ∈ / R× , ist c ∈ R× , also (p) = (a). ⇐ Ist p = ab, so ist (p) ⊂ (a), also (p) = (a) oder (a) = R. Im Fall (a) = R ist a ∈ R× ; im Fall (p) = (a) ist a = cp für ein c ∈ R, also p = ab = (cp)b = (cb)p , also 1 = cb und b ∈ R× .
208
II RINGE
2) ⇒ Wegen p ∈ / R× folgt (p) R. Ist ab ∈ (p), so folgt p| ab, also p| a oder p| b, d.h. a ∈ (p) oder b ∈ (p). ⇐ p| ab bedeutet ab ∈ (p), also a ∈ (p) oder b ∈ (p), d.h. p| a oder p| b. 2
Korollar 1
In einem Hauptidealring stimmen die Begrie Primelement und irreduzibles Element, sowie Primideal und maximales Ideal überein. Beweis Dass Primelemente irreduzibel sind, wurde oben bemerkt; nach dem Korollar aus II 2.13 sind maximale Ideale auch Primideale. Nach dem obigen Lemma erzeugt ein irreduzibles Element p ein maximales Ideal, das ist auch Primideal, also ist p Primelement. Weiter wird ein Primideal von einem Primelement p erzeugt, das ist irreduzibel, also ist (p) maximal. 2 Mit Hilfe dieses Korollars sieht man sofort, dass die Ringe Z[X] und K[X, Y ] für einen Körper K keine Hauptidealringe sind:
(X) ⊂ Z[X]
und
(Y ) ⊂ K[X, Y ]
sind nicht maximale Primideale. Etwa die Ideale
(2, X) ⊂ Z[X]
und
(X, Y ) ⊂ K[X, Y ]
sind keine Hauptideale, was schon in Beispiel 1 aus II 2.8 gezeigt wurde. Für die Konstruktion von Körpererweiterungen in Kapitel III benutzt man die Hauptidealringe K[X] und die Restklassenringe K[X]/(f ); dass sie für irreduzible Polynome f Körper sind, folgt aus
Korollar 2
Ist R Hauptidealring und a ∈ R irreduzibel, so ist R/(a) ein Körper.
Da diese Folgerung so wichtig ist, geben wir als Extrakt aus den vorhergehenden Überlegungen noch einen ganz direkten
Beweis Für b + (a) ∈ R/(a) mit b + (a) = 0 + (a), d.h. b ∈ / a, muss ein x ∈ R gefunden werden, so dass (x + (a))(b + (a)) = 1 + (a) , d.h. xb − 1 ∈ (a) . Da R Hauptidealring ist, gibt es ein c ∈ R mit
(a) (a, b) = (c) ⊂ R , also a = d · c für ein d ∈ R . Da (a) = (c), ist d ∈ / R× , also muss c ∈ R× sein. Somit ist (a, b) = R und es gibt x, y ∈ R, so dass 1 = ya + xb , d.h. xb − 1 ∈ (a) .
2
3.3 TEILERKETTEN
209
3.3 Teilerketten Das wichtigste Ziel der Teilbarkeitslehre ist es, beliebige Elemente eines Ringes möglichst eindeutig als Produkt von irreduziblen Elementen darzustellen. So wie man in der Physik ein Molekül in Atome zerlegt. Die nächstliegende Methode dabei ist, ein Element schrittweise in kleinere Teile zu zerlegen, und zu hoen, dass der Vorgang nach endlich vielen Schritten zum Ziel führt.
Denition
Eine Teilerkette in einem Integritätsring R ist eine Folge (an )n∈N von Elementen an ∈ R, so dass stets an+1 | an . Man sagt, dass in R der Teilerkettensatz gilt, wenn jede Teilerkette stationär wird, d.h. es gibt n0 ∈ N, so dass an+1 ∼ an für alle n ≥ n0 .
(an )
Ein Ring, in dem der Teilerkettensatz nicht gilt, wird in Beispiel 3 aus II 2.8 beschrieben. Um festzustellen, ob eine Teilerkette stationär wird, hilft eine Kontrollfunktion, deren Wert bei echten Teilern abnimmt. Bei ganzen Zahlen ist das der Betrag, bei Polynomen der Grad. Damit erhält man das
Lemma
1) Der Teilerkettensatz gilt im Ring Z.
2) Gilt der Teilerkettensatz in R, so gilt er auch im Polynomring R[X]. Beweis 1) Ist (an ) eine Teilerkette in Z, so ist an = bn an+1 , also |an | ≥ |an+1 | und |an | = |an+1 | ⇔ bn = ±1 .
2) Ist (fn ) eine Teilerkette in R[X], so ist fn = gn fn+1 , also deg fn ≥ deg fn+1 . Nach dem Gradsatz aus II 1.6 gibt es ein n1 , so dass deg fn+1 = deg fn =: d für n ≥ n1 . Für n ≥ n1 sei an ∈ R der Leitkoezient von fn , also
fn = an X d + . . . , fn+1 = an+1 X d + . . . . Da fn+1 | fn folgt an+1 | an , wir erhalten also eine Teilerkette (an )n≥n1 in R. Nach Voraussetzung gibt es ein n0 ≥ n1 mit an+1 ∼ an für n ≥ n0 , also ist insgesamt 2 fn+1 ∼ fn für n ≥ n0 . Mit Hilfe von Teilerketten hat schon Euklid gezeigt, dass jede ganze Zahl einen irreduziblen Teiler besitzt [Eu, VII 31]. Allgemeiner ergibt diese Methode den
Satz
Gilt im Integritätsring R der Teilerkettensatz, so gibt es zu jedem a ∈ R mit a = 0 und a ∈ / R× irreduzible Elemente q1 , . . . , qr ∈ R, so dass a = q 1 · . . . · qr .
210
II RINGE
Man beachte, dass unter diesen Voraussetzungen keine Aussage über die Eindeutigkeit der Darstellung gemacht werden kann!
Beweis
Sei M ⊂ R die Menge der a ∈ R mit a = 0 und a ∈ / R× , die sich nicht in der angegebenen Weise darstellen lassen. Wir zeigen, M = ∅.
Angenommen, M = ∅. Dann gibt es ein b ∈ M , das in M keine echten Teiler hat, d.h. gilt a| b für ein a ∈ M , so ist a ∼ b. Andernfalls könnte man in M eine nicht stationäre Teilerkette nden. Nun kann b als Element von M nicht irreduzibel sein; da b = 0 und b ∈ / R× , muss es eine Darstellung b = a1 · a 2 mit ai ∈ R R× geben. Nach Denition von M und b gilt ai ∈ / M . Also haben die ai und somit auch b eine Darstellung als Produkt von irreduziblen Elementen; das ist ein Widerspruch. 2 Aus dem obigen Lemma folgt insbesondere, dass in einem Polynomring über einem Körper der Teilerkettensatz gilt. Das ergibt sich auch aus dem allgemeineren
Satz In einem Hauptidealring gilt der Teilerkettensatz.
Beweis
Kette
Ist (an )n∈N eine Teilerkette in R, so erhält man daraus eine aufsteigende
(a0 ) ⊂ (a1 ) ⊂ . . . ⊂ (an ) ⊂ . . . ⊂ R von Hauptidealen. Oensichtlich ist
a :=
∞
(an ) ⊂ R
n=0
wieder ein Ideal und es gibt ein a ∈ R mit a = (a). Da a die Vereinigung ist, gibt 2 es ein n0 mit a ∈ (an0 ). Daraus folgt (an ) = (an0 ) und an ∼ an0 für n ≥ n0 . Etwas allgemeiner kann man mit der gleichen Methode sehen, dass auch in einem noetherschen Ring der Teilerkettensatz gilt. Wir fassen noch einmal zusammen:
Teilbarkeit in Hauptidealringen Ist R ein Hauptidealring, so gilt:
1) Jedes Element a ∈ R mit a = 0 und a ∈/ R× ist endliches Produkt von irreduziblen Elementen. 2) Jedes irreduzible Element von R ist auch Primelement. 2 In II 3.5 werden wir einen Ring mit diesen Eigenschaften faktoriell nennen.
3.4 PRIMZAHLEN
211
3.4 Primzahlen Der Ring Z der ganzen Zahlen war immer wieder aufgeführt worden als Beispiel, etwa für einen euklidischen Ring und einen Hauptidealring; daraus folgen gute Eigenschaften für die Teilbarkeit ganzer Zahlen. In diesem Abschnitt wollen wir hierfür direktere elementare Beweise geben.
Eine Zahl p ∈ N heiÿt Primzahl , wenn sie als Teiler nur 1 und p hat; auÿerdem hat man sich geeinigt, p ≥ 2 vorauszusetzen. In der Terminologie von II 3.2 bedeutet das, dass p in Z irreduzibel ist; dann ist natürlich auch −p irreduzibel. Wie wir im vorhergehenden Abschnitt unter Verwendung des Absolutbetrages gesehen haben, gilt in Z der Teilerkettensatz. Daraus ergibt sich als
Korollar 1
Jede natürliche Zahl n ≥ 2 ist Produkt von Primzahlen.
Wie schon bemerkt, kann noch keine Aussage über die Eindeutigkeit gemacht werden. Ein wichtiger Schritt dorthin ist der Beweis, dass Primzahlen die Eigenschaft von Primelementen haben. Wir geben einen elementaren Beweis dieses Ergebnisses, das man schon bei Euklid ndet [Eu, VII 30].
Teilbarkeitssatz von Euklid
Ist p ∈ N eine Primzahl und gilt p| (m · n) für m, n ∈ N, so folgt p| m oder p| n. Anders ausgedrückt: Im Ring Z ist jedes irreduzible Element auch Primelement. Beweis Erster Schritt. Wir zeigen, dass es genügt, den Fall 1 < m, n < p zu betrachten. Angenommen, es gibt eine Primzahl p und dazu m, n, so dass p m und p n. Dann gibt es auch eine kleinste Primzahl mit dieser Eigenschaft, sie wird wieder mit p bezeichnet. Wir teilen m und n mit Rest durch p (I 1.8): ˜ + n m = kp + m , n = kp Daher ist
(0 < m , n < p) .
˜ 2 + (kn + km ˜ )p + m n , also p| (m n ) . mn = k kp
Angenommen, m = 1 oder n = 1. Dann folgt p| n oder p| m. Zweiter Schritt. Zur oben gewählten kleinsten Primzahl p wählen wir das kleinste Produkt mn ∈ N mit p| mn , 1 < m, n < p . Insbesondere folgt p m und p n. Weiter gibt es ein k ∈ N mit
mn = kp .
(∗)
Es gilt 1 < k < p, denn p ist irreduzibel und m, n < p. Nach dem Satz aus II 3.3 gibt es eine Primzahl q , die k teilt, also ist k = k q und q ≤ k < p. Aus (∗) folgt q| mn, wegen q < p folgt q| m oder q| n. Es genügt den Fall q| m zu betrachten, dann ist
212
II RINGE
m = m q , k = k q , m qn = mn = kp = k qp , also m n = k p .
(∗∗)
Wegen q > 1 folgt m < m, also m n < mn. Aus (∗∗) folgt p| m n, also p| m oder p| n. p| n war ausgeschlossen, also verbleibt nur die Möglichkeit p| m . Wegen m = m q folgt p| m, das ist ein Widerspruch. 2 Die wesentlichen Eigenschaften von Z, die wir benutzt haben, sind die Teilung mit Rest und der Teilerkettensatz. Wir fassen das Ergebnis noch einmal zusammen.
Korollar 2
Für eine Zahl q ∈ Z sind folgende Bedingungen äquivalent: i) q ∈ Z ist irreduzibel. ii) q ∈ Z ist Primelement. iii) |q| ∈ N ist Primzahl.
2
Aus dem obigen Korollar 1 (das auf dem schon von Euklid beschriebenen Verfahren der Teilerketten beruht) und dem Teilbarkeitssatz ergibt sich nun ganz einfach ein zentrales Ergebnis, das bei Euklid noch nicht zu nden ist.
Haupsatz der elementaren Zahlentheorie
Zu jeder natürlichen Zahl n ≥ 2 gibt es paarweise verschiedene Primzahlen p1 , . . . , pr und k1 , . . . , kr ∈ N {0}, so dass n = pk11 · . . . · pkr r .
Die Zahlen r, sowie p1 , . . . , pr und k1 , . . . , kr sind durch n eindeutig bestimmt. Beweis Nach Korollar 1 ist nur noch die Eindeutigkeit zu beweisen. Sei also n = pk11 · . . . · pkr r = q1l1 · . . . · qsls
mit Primzahlen q1 , . . . , qs . Wir gehen nun schrittweise vor, der erste Schritt zeigt die Methode: p1 | n ⇒ p1 | (q1l1 · . . . · qsls ) ⇒ p1 | qili für ein i ⇒ p1 = qi .
Damit kann man p1 = qi aus dem Produkt kürzen und mit dem verbleibenden Produkt analog fortfahren, bis auf einer Seite das leere Produkt 1 verbleibt. Dann ist auch die andere Seite abgebaut. 2 Eines der berühmtesten Ergebnisse von
Euklid ndet man in Buch IX,
20:
Es gibt mehr Primzahlen als jede vorgelegte Anzahl von Primzahlen. Anders ausgedrückt:
Unendlichkeitssatz von Euklid
Es gibt unendlich viele Primzahlen.
Beweis Seien Primzahlen p1 , . . . , pn vorgelegt; es ist zu zeigen, dass es mindestens eine weitere Primzahl p gibt. Man betrachte nun q := p1 · . . . · pn + 1
213
3.4 PRIMZAHLEN
und einen Primfaktor p von q . Angenommen p = pi für ein i ∈ {1, . . . , n}. Dann gilt p| q und p| (p1 · . . . · pn ) ⇒ p| (q − p1 · . . . · pn ) d.h. p| 1 ,
2
das ist unmöglich.
Diesen wunderschönen klassischen Beweis sollte ein Mathematiker im Traum wiederholen können (-Innen nicht ausgeschlossen)! Man beachte, dass nicht behauptet wird, p1 · . . . · pn + 1 sei eine Primzahl. Sind p1 , . . . , pn die ersten n Primzahlen, so erhält man zunächst die Primzahlen
2+1=3 2·3+1=7 2 · 3 · 5 · 7 + 1 = 211 2 · 3 · 5 · 7 · 11 + 1 = 2 311 Dann aber ist
2 · 3 · 5 · 7 · 11 · 13 + 1 = 30 031 = 59 · 509 , wobei 59 und 509 Primzahlen sind. Will man für eine Zahl n ∈ N entscheiden, ob sie Primzahl ist, so muss man zeigen, √ dass sie keinen kleineren Teiler m hat; dabei genügt es, n durch alle Zahlen m ≤ n zu teilen. Um für eine Zahl n alle Primzahlen p ≤ n zu bestimmen, ist das klassische etwa 250 v. Chr. gefundene Sieb des höchst ezient. Man schreibt alle Zahlen von 2 bis n auf√und streicht bei 2 beginnend alle Vielfachen weg. Ist man beim gröÿten m ≤ n angekommen, sind die nicht gestrichenen Zahlen Primzahlen. Für n = 100 muss man nur die Vielfachen von 2, 3, 5 und 7 streichen. Zur Abkürzung haben wir die geraden Zahlen bis auf 2 (the oddest of all primes) schon weggelassen; statt zu streichen, haben wir unterstrichen, die verbleibenden 25 Primzahlen sind fett gedruckt:
Eratosthenes
2
3
5
7
9
11
13 15
17
19
21
23 25
27
29
31
33
35 37
39
41
43 45
47
49
51
53 55
57
59
61
63
65 67
69
71
73 75
77
79
81
83 85
87
89
91
93
95 97
99
214
II RINGE
3.5 Faktorielle Ringe Wie wir in II 3.3 gesehen haben, gelten in Hauptidealringen besonders gute Regeln für Teilbarkeit und Faktorisierung. Beispiele für Ringe mit unangenehmen Teilbarkeitseigenschaften geben wir später: Der Kummerring O−5 aus II 3.15 und der Ring O(C) der holomorphen Funktionen aus II 3.10. Zunächst befassen wir uns mit den guten Eigenschaften.
Faktorisierungssatz
Sei R ein Integritätsring. Dann ist es gleichwertig zu fordern, dass für jedes Element a ∈ R mit a = 0 und a ∈/ R× Folgendes gilt:
F F
Es gibt Primelemente p1 , . . . , pr ∈ R mit a = p1 · . . . · pr . Es gibt irreduzible Elemente q1 , . . . , qr ∈ R mit a = q1 · . . . · qr und eine solche Zerlegung ist bis auf Reihenfolge und Einheiten eindeutig.
Ein Integritätsring R heiÿt gungen erfüllt.
faktoriell ,
wenn er diese beiden äquivalenten Bedin-
Der Faktorisierungssatz ist eine unmittelbare Konsequenz aus den folgenden Lemmata:
Lemma 1 Jede Zerlegung a = p1 ·. . .·pr in Primelemente pi ist bis auf Reihenfolge und Einheiten eindeutig. Lemma 2
Gilt F , so ist jedes irreduzible Element auch Primelement. Beweis von Lemma 1 Sei a = p1 · . . . · pr = p1 · . . . · ps mit Primelementen pi und pj ∈ R. Aus p1 |p1 · . . . · ps folgt p1 |pj für ein j ; da die Reihenfolge der Faktoren irrelevant ist, können wir j = 1 annehmen. Es folgt also p1 ∼ p1 und p2 · . . . · pr ∼ p2 · . . . · ps . Durch Fortsetzung des Verfahrens folgt bei 2 passender Nummerierung pi ∼ pi und r = s.
Beweis von Lemma 2 Sei q ∈ R irreduzibel und q|ab; dann gibt es ein c ∈ R mit qc = ab. Weiter gibt es nach F irreduzible Zerlegungen a = q1 · . . . · qr , b = q1 · . . . · qs und c = q1 · . . . · qt , also ist
q · q1 · . . . · qt = q1 · . . . · qr · q1 · . . . · qs .
Aus der Eindeutigkeit folgt q ∼ qi für ein i oder q ∼ qj für ein j , also gilt q|a oder q|b. 2 Auf die naheliegende Frage, welche Ringe faktoriell sind, kann man aus den bisher bewiesenen Aussagen eine erste Antwort geben.
3.6 GEMEINSAME TEILER UND VIELFACHE
215
Satz Jeder Hauptidealring ist faktoriell. Beweis Ist R Hauptidealring, so ist er nach Denition auch Integritätsring. Nach II 3.3 gilt der Teilerkettensatz, also ist jedes Element von R in irreduzible Elemente zerlegbar. Nach Korollar 1 aus II 3.2 ist jedes irreduzible Element in einem Hauptidealring auch Primelement. 2 Die wichtigsten Beispiele für faktorielle Ringe sind die ganzen Zahlen Z und der Polynomring K[X] über einem Körper K . Die Ringe Z[X] und K[X, Y ] sind keine Hauptidealringe. In II 3.7 werden wir sehen, dass sie faktoriell sind.
3.6 Gemeinsame Teiler und Vielfache In I 3.8 hatten wir den gröÿten gemeinsamen Teiler und das kleinste gemeinsame Vielfache ganzer Zahlen als erzeugende Elemente von Untergruppen von Z erklärt. Eine ganz analoge Konstruktion kann man in Hauptidealringen durchführen. Im allgemeineren Fall von faktoriellen Ringen lassen sich gemeinsame Teiler und Vielfache an den Zerlegungen in Primfaktoren erkennen. Die Zerlegung in Primfaktoren ist nur bis auf Einheiten eindeutig. Im Ring Z ist das ganz harmlos, da Z× = {+1, −1}; aber im Allgemeinen können faktorielle Ringe viele Einheiten besitzen. Daher ist es hilfreich, die Menge aller Primelemente eines faktoriellen Rings R in Klassen assoziierter (d.h. bis auf Einheiten gleicher) Primelemente aufzuteilen und aus jeder Klasse einen Vertreter p ∈ R auszuwählen. Die Menge P ⊂ R all dieser ausgewählten Primelemente nennt man ein . In R = Z wählt man üblicherweise die (nach Denition positiven) Primzahlen aus, in K[X] die normierten irreduziblen Polynome.
Vertre-
tersystem
Exponent νp(a) ∈ N von p bezüglich a
Ist a ∈ R {0} und p ∈ P , so ist der erklärt durch a = pνp (a) · b
mit
pb.
Die bis auf Einheiten eindeutige Zerlegung in Primfaktoren kann man dann in der Form a = ε(a) pνp (a) mit ε(a) ∈ R× p∈P
schreiben, wobei natürlich nur endlich viele Faktoren pνp (a) = 1 (d.h. νp (a) > 0) sind. Sind a, b ∈ R, so gilt oensichtlich für alle p ∈ P
νp (a · b) = νp (a) + νp (b), also b | a ⇔ νp (b) ≤ νp (a) für alle p ∈ P und a ∈ R× ⇔ νp (a) = 0 für alle p ∈ P .
216
II RINGE
Seien nun ein faktorieller Ring R und a1 , . . . , an ∈ R {0} gegeben. Ein d ∈ R heiÿt gröÿter gemeinsamer Teiler von a1 , . . . , an , wenn Folgendes gilt: 1) d ist gemeinsamer Teiler von a1 , . . . , an , d.h. d | a1 , . . . , d | an . 2) Ist b ∈ R gemeinsamer Teiler von a1 , . . . , an , so folgt b | d. Ein c ∈ R heiÿt kleinstes gemeinsames Vielfaches von a1 , . . . , an , wenn Folgendes gilt: 1) c ist gemeinsames Vielfaches von a1 , . . . , an , d.h. a1 | c, . . . , an | c. 2) Ist b ∈ R gemeinsames Vielfaches von a1 , . . . , an , so folgt c | b. Da sich die Teilbarkeit in R in die Gröÿe der Exponenten in N übersetzen lässt, erhält man sofort den
Gegeben sei ein faktorieller Ring R mit einem Vertretersystem P ⊂ R der Primelemente. Sind a1 , . . . , an ∈ R {0} gegeben, so ist Satz
ggT (a1 , . . . , an ) :=
pmin (νp (a1 ),...,νp (an ))
p∈P
ein gröÿter gemeinsamer Teiler und kgV (a1 , . . . , an ) :=
pmax (νp (a1 ),...,νp (an ))
p∈P
ein kleinstes gemeinsames Vielfaches von a1 , . . . , an . Beide sind bis auf Einheiten in R eindeutig bestimmt. 2 Als Verallgemeinerung einer bekannten Eigenschaft rationaler Zahlen erhält man das
Ist R ein faktorieller Ring und Q(R) sein Quotientenkörper, so gestattet jedes α ∈ Q(R) eine Darstellung a mit teilerfremden a, b ∈ R . α= b
Korollar
Beweis
Ist α = ab00 mit a0 , b0 ∈ R und b0 = 0, so kann man den Bruch mit ggT (a0 , b0 ) kürzen; dadurch werden Zähler und Nenner teilerfremd. 2
Ist der Ring R nicht nur faktoriell, sondern sogar Hauptidealring, so kann man wie in I 3.8 für R = Z eine Relation von beweisen: Zu a1 , . . . , an ∈ R {0} gibt es x1 , . . . , xn ∈ R, so dass
Bézout
ggT (a1 , . . . , an ) = x1 a1 + . . . + xn an . Ist R euklidisch, so kann man einen gröÿten gemeinsamen Teiler und die Koezienten der Relation von Bézout wie in Beispiel 1 aus I 3.13 für R = Z durch den Euklidischen Algorithmus bestimmen.
3.7 POLYNOMRINGE ÜBER FAKTORIELLEN RINGEN
217
3.7 Polynomringe über faktoriellen Ringen Wie wir in II 3.5 gesehen haben, ist der Ring Z und jeder Polynomring K[X] über einem Körper faktoriell. Dass auch der Ring Z[X] und der Polynomring K[X1 , . . . , Xn ] faktoriell ist, folgt aus einem
Satz von
Gauss über faktorielle Ringe
auch der Polynomring
R[X]
Ist der Ring
R
faktoriell, so ist
faktoriell.
Ist K = Q(R) der Quotientenkörper, so wissen wir nach dem Satz aus II 3.5 bereits, dass der Polynomring K[X] als Hauptidealring faktoriell ist. Um zu zeigen, dass die gleichen Teilbarkeitseigenschaften im Unterring R[X] ⊂ K[X] gelten, muss man feststellen, wie sich die Eigenschaft der Irreduzibilität bei den Übergängen zwischen den beiden Ringen verhält. Das Problem dabei ist, dass in R[X] neben der Teilbarkeit von Polynomen auch die Teilbarkeit der Koezienten aus R (etwa ganze Zahlen oder selbst Polynome) eine Rolle spielt. Um diese beiden Probleme etwas zu trennen, ist ein neuer Begri hilfreich. Ist R faktoriell, so heiÿt ein Polynom f ∈ R[X] {0} primitiv, wenn seine Koezienten teilerfremd sind. Oensichtlich ist jedes irreduzible Polynom f ∈ R[X] primitiv, aber nicht umgekehrt: etwa f = X 2 . Zunächst beweisen wir ein so genanntes
Lemma von Gauss
so ist auch
f · g ∈ R[X]
Beweis des Lemmas
Ist
R
ein faktorieller Ring, und sind
f, g ∈ R[X]
primitiv,
primitiv.
Sei
f = a0 + a1 X + . . . + am X m , g = b0 + b1 X + . . . + bn X n und f · g = c0 + c1 X + . . . + cm+n X m+n . Angenommen f · g wäre nicht primitiv; dann gäbe es ein Primelement p ∈ R, das c0 , . . . , cm+n teilt. Da f und g primitiv sind, gibt es ein i und ein j mit 0 ≤ i ≤ m und 0 ≤ j ≤ n, so dass
p | a0 , . . . , p | ai−1 , p ai Nun ist
ci+j =
und
p | b0 , . . . , p | bj−1 , p bj .
a μ bν = ai b j +
.
μ+ν=i+j
, damit auch und p | ci+j , also p | ai bj . Da p p teilt alle Summanden aus Primelement ist, folgt p | ai oder p | bj im Widerspruch zur Voraussetzung. 2 Ist R faktoriell, K = Q(R) und f ∈ K[X], so konstruieren wir eine Zerlegung f = α · f1 mit α ∈ K und einem primitiven f1 ∈ R[X]. Sei also
f = αn X n + . . . + α1 X + α0 ∈ K[X] .
218
II RINGE
Nach II 3.6 gibt es für i = 0, . . . , n eine Darstellung
αi =
ai bi
ai , bi ∈ R
mit
und
ggT (ai , bi ) = 1 .
Wir setzen b := kgV (b0 , . . . , bn ). Dann ist
b·f =
ban n ba0 X + ... + ∈ R[X] , bn b0
und der Inhalt von f ist erklärt durch inh(f ) := ggT Dann ist f = inh(f ) · f1 Ist etwa
5 4X
f=
+
35 6
f1 ∈ R[X].
mit einem primitiven
∈ Q[X],
5 (3X + 14) 12
f=
ba0 ban −1 ·b ∈K . ,..., b0 bn
so ist
also
b = 12
inh
und
(f ) =
5 12
und
f1 = 3X + 14 .
Wir notieren einige elementare Eigenschaften des Inhalts.
Hilfssatz
Sei K = Q(R) und f ∈ K[X].
a) Der Inhalt inh(f ) ∈ K und das primitive f1 ∈ R[X] sind durch die Eigenschaft f = inh(f )f1 bis auf Einheiten in R eindeutig bestimmt. b) f ∈ R[X] ⇔
inh
(f ) ∈ R
c) Ist f normiert, so ist Beweis
inh
(f ) =
1 b
mit b ∈ R {0}.
αf1 = βg1 mit primitiven f1 , g1 ∈ R[X] und α, β ∈ K , so ist α = β und f1 = g1 bis auf Einheiten in R. Nach Multiplikation mit einem Hauptnenner von α und β können wir α, β ∈ R annehmen. Für i = 0, . . . , n = deg f1 = deg g1 seien ai bzw. bi die Koezienten von f1 bzw. g1 . a)
Ist
zu zeigen, dass
Dann gilt
αai = βbi . Da
f1
und
g1
primitiv sind, ist
α = ggT (αa0 , . . . , αan ) ∼ ggT (βb0 , . . . , βbn ) = β , also
b)
α∼β
Ist
und
f1 ∼ g1 . n
f = an X + . . . + a0
mit
umgekehrte Richtung folgt aus
c)
ai ∈ R, so ist inh(f ) = ggT (a0 , . . . , an ) ∈ R. f1 ∈ R[X] und f = inh(f ) · f1 .
Die
Wir benutzen die oben zur Denition des Inhalts verwendeten Bezeichnungen,
d.h.
b = kgV (b0 , . . . , bn ) ∈ R {0} ,
3.7 POLYNOMRINGE ÜBER FAKTORIELLEN RINGEN
219
und wir zeigen, dass bf primitiv ist; dann ist inh (f ) = b−1 ∈ K . Da f normiert ist, folgt bf = bX n + . . . . Die einzig möglichen Teiler der Koezienten von bf sind daher die Primfaktoren p von b. Sei also k := νp (b) ≥ 1. Nach Denition des kgV gibt es mindestens ein i mit
νp (b) = νp (bi ) = k , also b = pk b und bi = pk bi mit p b , p bi . Weiter gilt p ai , da ggT(ai , bi ) = 1 und p | bi . Der i-te Koezient von bf ist
bai pk b ai b = k = ai , bi p bi bi 2
er hat p nicht als Teiler. Also ist bf primitiv. Aus dem Lemma von
Korollar
Gauss ergibt sich das
Für f, g ∈ K[X] ist bis auf Einheiten in R inh(f · g) = inh(f ) · inh(g) .
Beweis
Wegen f = inh(f )f1 und g = inh(g)g1 ist
f · g = inh(f ) · inh(g) · f1 · g1 . Da f1 · g1 wieder primitiv ist, folgt die Behauptung aus Teil a) des obigen Hilfssatzes. 2 Nun stehen alle Hilfsmittel bereit, um die Teilbarkeit in R[X] und K[X] zu vergleichen. Dabei gibt es triviale Probleme: Ist etwa R = Q, so ist
f = 2X irreduzibel in Q[X], aber reduzibel in Z[X] . f = 2 irreduzibel in Z[X], aber reduzibel in Q[X] . Derartige Fälle werden im folgenden ausgeschlossen. Zunächst gilt die elementare
Bemerkung
Ist f ∈ R[X] ⊂ K[ X ] primitiv, so gilt: f
irreduzibel in
K[X] ⇒ f
irreduzibel in
R[X] .
Beweis
Angenommen f = g · h mit g, h ∈ R[X]. Dann ist o.B.d.A. g ∈ K[X]× = K × , also deg g = 0. Da f primitiv ist, folgt g ∈ R× . 2
Für die umgekehrte Richtung gilt der grundlegende
Irreduzibilitäts-Satz
Sei R ein faktorieller Ring, K = Q(R) sein Quotientenkörper und f ∈ R[X] mit deg f ≥ 1. Dann gilt: f
irreduzibel in
R[X] ⇒ f
irreduzibel in
K[X] .
220
II RINGE
Beweis
Angenommen f ist reduzibel in K[X]. Wegen deg f ≥ 1 gibt es g, h ∈ K[X] mit deg g, deg h ≥ 1 und
f = g · h = inh(g) · inh(h) · g1 · h1 = inh(f ) · g1 · h1 . Damit ist inh(g) · inh(h) = inh(f ) ∈ R, also ist f reduzibel in R[X].
2
Wir notieren noch zwei weitere später benötigte Aussagen über die Teilbarkeit in R[X] und K[X].
Zusatz 1 Sei f ∈ R[X] primitiv und g ∈ R[X] {0}. Dann gilt: f |g
Beweis
in
K[X] ⇒ f | g
in
R[X] .
Sei g = h · f mit h ∈ K[X]. Dann ist nach dem Korollar zum Lemma von
Gauss wegen inh(f ) ∈ R×
inh(h) ∼ inh(g) ∈ R , also h ∈ R[X] nach Teil
b) des obigen Hilfssatzes.
2
Gauss [Ga3, 42] ndet man im Fall R = Z den für die Kreisteilungstheorie
Bei wichtigen
Zusatz 2 Sei f ∈ R[X] normiert und f = g · h mit g, h ∈ K[X]. Ist g normiert, so folgt g, h ∈ R[X].
Beweis Da f und g normiert sind, ist auch h normiert. Wir benutzen Teil b) und c) des obigen Hilfssatzes. Es gilt 1 = inh(f ) = inh(g) · inh(h) =
1 1 · c d
mit
c, d ∈ R {0} .
Also folgt c, d ∈ R× und inh(g), inh(h) ∈ R, also g, h ∈ R[X]. Nach all diesen Vorbereitungen ist der rielle Ringe ganz einfach.
Beweis des Satzes von
2
Gauss über fakto-
Im ersten Schritt zeigen wir, dass jedes Polynom f ∈ R[X] mit f = 0 und f∈ / R[X]× = R× endliches Produkt von irreduziblen Elementen ist. Dabei führen wir Induktion über n = deg f . Ist n = 0, so ist die Aussage klar, denn R ist faktoriell. Sei nun n ≥ 1 und die Aussage richtig für alle Polynome vom Grad ≤ n−1. Wir zerlegen f = inh(f )·f˜ mit einem primitiven f˜. Da R faktoriell ist, ist inh(f ) entweder Einheit oder endliches Produkt irreduzibler Elemente aus R. Ist f˜ irreduzibel in R[X], so ist man fertig; andernfalls ist f˜ = g · h mit g, h ∈ / R× . Da f˜ primitiv ist, folgt
deg g ≤ n − 1
und
deg h ≤ n − 1 .
3.8 IRREDUZIBILITÄTSKRITERIEN FÜR POLYNOME
221
Nach Induktionsannahme gibt es Zerlegungen von g und von h, also auch von f˜. Im zweiten Schritt zeigen wir die Eindeutigkeit. Seien also
c1 , . . . , ck und d1 , . . . , dl aus R[X] vom Grad 0, p1 , . . . , pr und q1 , . . . , qs aus R[X] vom Grad ≥ 1 irreduzible Elemente, so dass
c1 · . . . · ck · p1 · . . . · pr = d1 · . . . · dl · q1 · . . . · qs . Als irreduzible Polynome sind die pi und die qj primitiv, also sind nach dem Lemma von auch p1 · . . . · pr und q1 · . . . · qs primitiv. Folglich gilt
Gauss
c1 · . . . · ck ∼ d1 · . . . · dl in R . Da R faktoriell ist, folgt k = l und nach angepasster Reihenfolge ci ∼ di in R. Also ist
p1 · . . . · pr ∼ q1 · . . . · qs in R[X] und damit in Q(R)[X] . Nach dem Irreduzibilitätssatz sind die pi und qj auch irreduzibel im faktoriellen Ring Q(R)[X], also folgt r = s und pi ∼ qi in K[X], d.h. pi | qi und qi | pi . Nach Zusatz 1 folgt schlieÿlich pi ∼ qi in R[X]. 2
3.8 Irreduzibilitätskriterien für Polynome Ein Restklassenring K[X]/(f ) ist genau dann ein Körper, wenn f irreduzibel ist. Daher ist es sehr wichtig, entscheiden zu können, ob ein gegebenes Polynom f diese Eigenschaft hat. Ist speziell K = Q und f ∈ Z[X], so genügt es nach dem Irreduzibilitätssatz aus II 3.7 zu zeigen, dass f in Z[X] irreduzibel ist. Wie man dies an Teilern der Koezienten direkt ablesen kann, zeigt das berühmte
Eisenstein-Kriterium
Sei R ein faktorieller Ring und
f = a0 + a1 X + . . . + an X n ∈ R[X]
ein primitives Polynom vom Grad n ≥ 1. Wenn es ein Primelement p ∈ R gibt, so dass p | a0 , . . . , p | an−1 , p an und p2 a0 , so ist f irreduzibel in R[X] und in Q(R)[X]. Beweis Da n ≥ 1, ist f = 0 und f ∈/ R[X]× . Sei f = g · h mit g, h ∈ R[X] und g = b0 + b1 X + . . . + bk X k und h = c0 + . . . + cl X l , bk = 0 und cl = 0 . Aus p | a0 , p2 a0 und a0 = b0 c0 folgt o.B.d.A. p | b0 und p c0 . Aus p an und an = bk cl folgt insbesondere p bk . Also gibt es ein i mit 0 < i ≤ k , so dass
p | b0 , . . . , p | bi−1 , p bi .
222
II RINGE
Nun ist ai = bi c0 + bi−1 c1 + . . . + b0 ci , wobei cj = 0 gesetzt wird für j > l. Da
p | (bi−1 c1 + . . . + b0 ci ) , p bi , p c0 folgt p ai , also i = n . Daher muss k = n und l = 0, also h ∈ R sein. Da f primitiv ist, folgt h ∈ R× . Nach dem Irreduzibilitätssatz in II 3.7 folgt aus der Irreduzibilität von f in R[X] die Irreduzibilität in Q(R)[X]. 2 Um das Kriterium von Eisenstein anwenden zu können, muss man ein passendes Primelement nden. Wenn das nicht gelingt, kann man versuchen, nach einem geeigneten Primelement zu reduzieren.
Reduktions-Kriterium
Sei R ein faktorieller Ring,
f := an X n + . . . + a1 X + a0 ∈ R[X]
ein primitives Polynom vom Grad n ≥ 1 und p ⊂ R ein Primideal derart, dass
/ p. Ist an ∈
R := R/p
und : R[X] → R[X] , f → f ,
der kanonische Homomorphismus, so gilt f
irreduzibel in R[X] ⇒ f
irreduzibel in R[X] und in Q(R)[X] .
Zunächst ein Hinweis zu den gemachten Voraussetzungen: R muss faktoriell sein, damit primitive Polynome erklärt sind. Da ein nicht primitives f in R[X] reduzibel ist, muss man f als primitiv voraussetzen. Und schlieÿlich muss R ein Integritätsring, also p Primideal sein. Der wichtigste Fall ist R = Z, dann ist Z = Z/pZ ein endlicher Körper und in Z[X] gibt es zu jedem Grad nur endlich viele Polynome, also auch nur endlich viele Kandidaten für Faktoren von f . Beispiele folgen in II 3.9.
Beweis Ist das gegebene primitive f reduzibel in R[X], so gibt es eine Zerlegung f =g·h
mit
g, h ∈ R[X]
und
deg g, deg h ≥ 1 .
Da g ein Homomorphismus ist, erhält man durch Reduktion aller Koezienten modulo p die Zerlegung
f =g·h
in
(∗)
R[X] .
Sind b, c die Leitkoezienten von g, h, so ist
an = b · c
und
0 = an = b · c , also
b, c = 0 .
Daraus folgt deg g = deg g ≥ 1 und deg h = deg h ≥ 1, nach (∗) ist also f reduzibel in R[X]. Die Irreduzibilität von f in Q(R)[X] folgt aus II 3.7.
2
223
3.9 BEISPIELE
3.9 Beispiele Wir geben einige Fälle an, bei denen es gelingt, die Irreduzibilität eines vorgelegten Polynoms zu zeigen.
Beispiel 1
f = X n − p ∈ Z[X] und p prim.
Beispiel 2
f = 2X 4 + 10X 3 + 25X + 30 ∈ Z[X]
Hier kann man sofort das Eisenstein-Kriterium anwenden, also ist f in Z[X] und auch in Q[X] irreduzibel. Daraus folgt insbesondere, dass für n ≥ 2 jede Wurzel √ n p ∈ C irrational ist. Analog kann man die Irreduzibilität von X n − p · . . . · p 1 r mit paarweise verschiedenen Primzahlen p1 , . . . , pr beweisen. ist nach
Eisenstein mit p = 5 irreduzibel.
Beispiel 3
f = X n + Y n − 1 ∈ Z[X, Y ] = (Z[X])[Y ] mit n ≥ 1.
Als Polynom in Y ist f = Y n + (X n − 1), also an = 1 und
a0 = X n − 1 = (X − 1) · (X n−1 + . . . + X + 1) . Da X − 1 ∈ Z[X] Primelement ist und (X − 1)2 a0 , ist f nach irreduzibel. Die Nullstellenmenge von f in C2 nennt man
Beispiel 4
Fermatkurve
Eisenstein
(vgl. etwa [Fi3 ]).
f = X p−1 + X p−2 + . . . + X + 1 ∈ Z[X] mit p prim.
Dies ist ein spezielles Kreisteilungspolynom (vgl. III 5.6), es gilt
X p − 1 = (X − 1) · f .
(∗)
In diesem Fall kann man nach der Substitution X → X + 1 das EisensteinKriterium anwenden. Am besten rechnet man nicht f (X + 1) direkt aus, sondern man substituiert in (∗):
(X + 1)p − 1 = X · f (X + 1) , also g(X) := f (X + 1) = X p−1 +
p p X p−2 + . . . + . 1 p−1
p Da p | pi für i = 1, . . . , p − 1 und p−1 = p, ist g ∈ Z[X] irreduzibel, nach dem Lemma aus II 1.6 ist damit auch f irreduzibel.
Beispiel 5
Ist f ∈ Z[X] und 2 an , so kann man die Koezienten modulo 2 reduzieren. Um festzustellen, ob f ∈ F2 [X] irreduzibel ist, kann man vielerlei Knie benutzen. Die sicherste Methode ist, sich die endlich vielen Polynome von festem Grad aufzuschreiben und analog zur Siebmethode des Eratosthenes all die zu streichen, die als Produkte von Polynomen kleineren Grades entstehen. Für
224
II RINGE
n ≤ 4 wollen wir das ausführen. Die irreduziblen Polynome sind fett gedruckt: n=1:
X X +1
n=2:
X2 X 2 + 1 = (X + 1)2 X 2 + X = X(X + 1) X2 + X + 1
n=3:
X3 X 3 + 1 = (X + 1)(X 2 + X + 1) X 3 + X = X(X 2 + 1) X 3 + X 2 = X 2 (X + 1) X3 + X + 1 X3 + X2 + 1 X 3 + X 2 + X = X(X 2 + X + 1) X 3 + X 2 + X + 1 = (X + 1)3
n=4:
Wir notieren nur noch das Ergebnis.
X4 + X + 1 X4 + X3 + 1 X4 + X3 + X2 + X + 1 Gestrichen sind alle Polynome mit mindestens einer Nullstelle und
(X 2 + X + 1)2 = X 4 + X 2 + 1 . Mit Hilfe dieser Liste kann man nun sofort Polynome vom Grad ≤ 4 angeben, die in Z[X] und damit in Q[X] irreduzibel sind:
3X 2 − 5X + 17 9X 3 + 2X 2 − 7X + 5 X 3 + 3X 2 − 4X + 11 7X 4 + 6X 3 − X + 9 X 4 + 3X 3 − 2X + 1 3X 4 + 5X 3 + 7X 2 + 9X + 11
Beispiel 6
f = X 4 + 6X 3 + 7X 2 − 5X − 2 ergibt bei Reduktion modulo 2 das reduzible Polynom X 4 + X 2 + X ∈ F2 [X] ,
225
3.10 RINGE HOLOMORPHER FUNKTIONEN∗
aber bei Reduktion modulo 3 mit F3 = {0, 1, −1} ist
f = X 4 + X 2 + X + 1 ∈ F3 [X] . Da f (0) = 1 , f (1) = 1 und f (−1) = −1, hat f keine Nullstelle und damit keinen Linearfaktor. Die einzigen irreduziblen normierten Polynome vom Grad 2 in F3 [X] sind (wie man sich leicht überlegt)
X 2 + 1 , X 2 + X − 1 und X 2 − X − 1 . Indem man Produkte dieser Polynome bildet, oder durch diese Polynome teilt, oder Werte in F3 ausrechnet, sieht man, dass f kein Produkt von diesen quadratischen Polynomen ist, also ist f und somit auch f irreduzibel.
Beispiel 7
Eine nützliche kleine Anwendung der Methode aus II 3.8 ist die folgende Aussage:
Hat ein normiertes f ∈ Z[ X ] eine Nullstelle x ∈ Q, so folgt x ∈ Z. Insbesondere hat jedes in Q[ X ] reduzible normierte f ∈ Z[ X ] mit deg f = 3 eine Nullstelle x ∈ Z. Denn: Ist f (x) = 0 für x ∈ Q, so gibt es ein h ∈ Q[ X ] mit f = (X − x) · h . Nach dem Zusatz 2 aus II 3.7 liegen (X − x) und h in Z[ X ], also folgt x ∈ Z. Ist insbesondere deg f = 3 und f reduzibel in Q[ X ], so hat f eine Nullstelle in Q und die muss ganz sein. Der Leser mache sich klar, dass die Voraussetzung normiert an f entscheidend ist.
3.10 Ringe holomorpher Funktionen ∗ In den letzten Abschnitten dieses Paragraphen behandeln wir noch einige wichtige Beispiele von Ringen mit Teilbarkeitseigenschaften, die sich von faktoriellen Ringen unterscheiden. Wir beginnen mit einem Ring, der in der Analysis auftritt. Wie wir in Beispiel 1 aus II 2.8 gesehen haben, ist der Ring C[ [X] ] der formalen Potenzreihen mit komplexen Koezienten ein Hauptidealring, damit ist er nach II 3.5 auch faktoriell. Der Ring O(C) der auf C holomorphen Funktionen ist ein Unterring von C[ [X] ]; wir zeigen, dass O(C) nicht faktoriell ist. Dabei benutzen wir einige bekannte Tatsachen aus der komplexen Funktionentheorie. Einheiten in O(C) sind die Funktionen f ohne Nullstelle, denn dann ist morph.
1 f
holo-
f ∈ O(C) ist genau dann irreduzibel, wenn f genau eine Nullstelle a ∈ C der Ordnung 1 hat. Denn hat f eine mehrfache Nullstelle in a oder eine weitere Nullstelle
226
II RINGE
in b ∈ C, dann ist z − a oder z − b ein echter Teiler von f . Umgekehrt muss jeder echte Teiler mindestens eine Nullstelle besitzen. Ein irreduzibles Element f ist auch prim: Ist f ein Teiler von g · h, und hat f genau eine einfache Nullstelle a ∈ C, so muss g(a) = 0 oder h(a) = 0 sein. Also ist f Teiler von g oder von h. In O(C) gilt der Teilerkettensatz nicht. Die Funktion
sin z =
∞
(−1)n
n=0
z 2n+1 (2n + 1)! für
n ∈ Z.
Also
Radius
R > 0
und
hat unendlich viele Nullstellen, genauer einfache Nullstellen in πn kann sie nicht endliches Produkt von irreduziblen Elementen sein. Ist DR := {z ∈ C : |z| < R} eine oene Kreisscheibe vom O(DR ) der Ring der auf DR holomorphen Funktionen, so ist
O(C) ⊂ O(DR ) ⊂ C[ [X] ] . Mit Hilfe des Weierstraÿschen Produktsatzes [F-L, Kap. VIII] erhält man eine in
DR
holomorphe Funktion mit abzählbar unendlich vielen einfachen Nullstellen.
Wie oben folgt daraus, dass
O(DR )
nicht faktoriell ist.
Betrachtet man dagegen den Ring
C X := O(DR ) ⊂ C[ [X] ] R>0 aller Potenzreihen mit positivem Konvergenzradius, so kann man wie in Beispiel 2 aus II 2.8 mit einer zusätzlichen Konvergenzüberlegung zeigen, dass
C X Haupt-
idealring und damit faktoriell ist. Mehr dazu ndet man etwa in [Fi 3 , Chap. 6]. Die Primfaktorzerlegung in iert zu
X.
Ist
f ∈ C[ [X] ]
C[ [X] ] ist ganz einfach. f = n, so ist
Jedes Primelement ist assozi-
und ord
f = g · Xn mit einer Einheit
g.
Das ist die gesuchte Zerlegung!
3.11 Quadratische Zahlkörper ∗ Die Körpererweiterung
Q⊂C
hat sehr viele Zwischenkörper, wir betrachten hier
eine ganz spezielle Klasse. Zur Vorbereitung eine einfache
Bemerkung
Sei d ∈ N, d ≥ 2, √ quadratfrei (d.h. es gibt keinen Teiler a2 von d mit a ∈ N und a ≥ 2). Dann ist d irrational. √ Beweis Angenommen d = m n mit teilerfremden m, n ∈ N {0}; dann ist m2 = d · n2 . In den Primfaktorzerlegungen von m2 und n2 (II 3.4) treten nur
3.11 QUADRATISCHE ZAHLKÖRPER∗
227
gerade Potenzen auf, die Primfaktoren von d sind nur einfach; das passt nicht zu 2 m2 = d · n2 . Wir nennen eine Zahl d ∈ Z{0} zulässig, wenn je nach dem Vorzeichen folgende Bedingungen erfüllt sind: Ist d > 0, so muss d ≥ 2 und quadratfrei sein, ist d < 0, so muss |d| für d ≤ −2 quadratfrei sein. Folgende Werte von d sind also zulässig:
−1, ±2, ±3, ±5, ±6, ±7, ±10, ±11, ±13, . . . √ C ist ein Q-Vektorraum, für jedes zulässige d sind 1 und d über Q linear unabhängig, bilden also eine Basis des Q-Vektorraums √ √ √ Q( d) := Q + Q d = {a + b d : a, b ∈ Q} . √ Q( d) ⊂ C ist sogar ein Unterkörper, denn √ √ √ √ (a + b d)(a + b d) = (aa + bb d) + (ab + ba ) d ∈ Q + Q d und √ √ √ 1 b a−b d a √ = √ √ = 2 − 2 d∈Q+Q d, 2 2 a −b d a −b d a+b d (a + b d)(a − b d) √ falls a + b d = 0, d.h. (a, b) = (0, 0). √ Man nennt Q( d) einen quadratischen Zahlkörper ; er heiÿt reell-quadratisch , wenn d > 0 und imaginär-quadratisch , wenn d < 0. √ √ Im Fall d > 0 ist Q( d) ⊂ R, im Fall d < 0 ist d = i |d| rein imaginär. √ Die geometrische Beschreibung im Fall√d < 0 ist klar: Q( d) ⊂ C ist ein Teil der komplexen Zahlenebene. Jedes α ∈ Q( d) hat eine eindeutige Darstellung α = a + ib |d| , a = re α ist der Realteil und b |d| = im α ist der Imaginärteil von α. Im Fall d > 0 ist eine analoge geometrische√Beschreibung zunächst ungewohnt, √ aber nützlich. Man stellt jede Zahl α = a + b d als Punkt (a, b d) ∈ R2 dar und nennt √ ra α := a den Rationalteil , ir α := b d den Irrationalteil von α. Höchst√bemerkenswert dabei ist, dass die in R gegebenen Abstände der Zahlen aus Q( d) ⊂ R durch die Darstellung in der Ebene völlig verändert werden. Von Vorteil ist dagegen die gemeinsame geometrische Beschreibung des Körperautomorphismus √ √ √ √ ¯ =a−b d, Q( d) → Q( d) , α = a + b d → α
228
II RINGE
der im Fall d < 0 die komplexe Konjugation ist. Auch im Fall d > 0 nennen wir diese Abbildung . Oensichtlich ist
Konjugation
α+α ¯ = 2 ra α
und
α−α ¯ = 2 ir α
für d > 0 ,
α+α ¯ = 2 re α und α − α ¯ = 2 i (im α) für d < 0 . √ Weiter hat man für α = a + b d eine √ √ N(α) := α · α ¯ = (a + b d) · (a − b d) = a2 − db2 ∈ Q
Norm
und eine
Spur
√ √ S(α) := α + α ¯ = (a + b d) + (a − b d) = 2a ∈ Q . √ Für Norm und Spur gilt für alle α, β ∈ Q( d): S(α + β) = S(α) + S(β). N(α · β) = N(α) · N(β). N(α) = 0 ⇔ α = 0.
Bemerkung
a) b) c) Beweis
a) und b) sind klar. Zum Beweis von c) unterscheiden wir zwei Fälle. Für d ≤ −1 ist N(α) = a2 + |d| b2 ≥ 0, also N(α) = 0 ⇔ a = b = 0. 2
Sei d ≥ 2 und a2 − db2 = 0. Ist b = 0, so folgt a = 0. Andernfalls wäre d = ab2 mit a, b ∈ Q. Indem man Zähler und Nenner von a und b in Primfaktoren zerlegt und 2 bedenkt, dass d quadratfrei ist, sieht man, dass d = ab2 nicht möglich ist. 2
Vorsicht!
Im Fall d > 0 nimmt die Norm positive und negative Werte an, sie ist eine indenite quadratische Form. Man kann sich den Verlauf der Normfunktion (x, y) → (x2 − y 2 ) geometrisch veranschaulichen:
Dabei ist zu √ bedenken, dass im Fall d > 0 die beiden Geraden mit N (α) = 0 den Körper Q( d) nur im Punkt α = 0 treen. Die Punkte α mit N(α) = +1 bzw. N(α) = −1 liegen jeweils auf den zwei Ästen einer Hyperbel.
229
3.12 QUADRATISCHE ZAHLRINGE∗
3.12 Quadratische Zahlringe ∗ So wie man im Körper Q der rationalen Zahlen den Unterring √ Z ⊂ Q ganzer Zahlen hat, erklärt man nun im quadratischen Zahlkörper Q( d) einen Unterring von Zahlen, die ganz genannt werden. Der nächstliegende Kandidat ist der Unterring √ √ √ √ Z + Z d = {m + n d : m, n ∈ Z} ⊂ Q + Q d = Q( d) . √ Man kann ihn aber noch etwas vergröÿern. Ist α ∈ Q( d), so sind α und α ¯ Nullstellen des Minimalpolynoms (III 1.5)
fα := (X − α)(X − α) ¯ = X 2 − (α + α ¯ )X + αα ¯ ∈ Q[X] . √ Ist α = a + b d, so ist αα ¯ = a2 − db2 = N(α) die Norm von α.
ist die Spur von
α+α ¯ = S(α) = 2a ∈ Q √ α. Oensichtlich ist für α ∈ Z + Z d
N(α) ∈ Z und S(α) ∈ Z , also
fα ∈ Z[X] .
Denition Ein α = a + b√d ∈ Q(√d) heiÿt ganz, wenn Norm und Spur ganzrational sind, in Zeichen N(α) ∈ Z und S(α) ∈ Z , d.h. √
Od := {α ∈ Q( d) : α
fα ∈ Z[X] .
ganz }
√
heiÿt quadratischer Zahlring (oder Ganzheitsring in Q( d)). √ Diese Vergröÿerung von im √ √ Z + Z d zu Od entspricht einem ganzen Abschluss Quotientenkörper Q( d), d.h. man nimmt alle Elemente von Q( d) dazu, die Nullstellen eines normierten Polynoms mit ganzen Koezienten sind. Die Bezeichnung Ganzheitsring ist gerechtfertigt durch den
Satz
c)
d ∈ Z zulässig, so gilt √ Od ⊂ Q( d) ist Unterring, insbesondere Integritätsring. √ √ Od = Z + Z √ d = {m + n d : m, n ∈ Z} für d ≡ 2, 3 (mod4). m+n d : m, n ∈ Z, m − n gerade } für d ≡ 1 (mod4). Od = { 2 √ 1 Ist d ≡ 1 (mod4) und ω := 2 (1 + d), so ist Od = Z + Zω.
d)
Od ∩ Q = Z.
a) b)
Ist
Entsprechend Aussage d) nennt man ein α ∈ Od ganz ganzrational .
√
in Q( d)
und ein α ∈ Z
230
Beweis
II RINGE
Zum Nachweis von a) ist zu zeigen, dass
α, β ∈ Od ⇒ α − β, α · β ∈ Od . Ist S(α), S(β), N(α), N(β) ∈ Z, so folgt S(α − β), N(α · β) ∈ Z, da die Spur additiv und die Norm multiplikativ ist. Beim Nachweis von S (α · β), N(α − β) ∈ Z verursacht der Faktor 2 aus S(α) = 2a eine Teilbarkeitsbedingung an die Zahl d. Da sie bei b) wieder auftritt, beginnen wir mit diesem Teil. Zum Nachweis von b) zeigen wir zunächst, dass alle rechts von den Gleichheitszeichen stehenden Zahlen ganz sind. √ Für alle d gilt oensichtlich Z + Z d ⊂ Od . Für d ≡ 1 (mod4) gibt es zusätzliche ganze Zahlen, denn für beliebiges (auch ungerades) m ∈ Z folgt m + n ∈ 2 Z aus m − n ∈ 2 Z, also
m2 − n2 = (m + n)(m − n) ∈ 4 Z
und
m2 − dn2 ∈ 4 Z .
√ Ist α = 12 (m + n d), so folgt N(α) = 14 (m2 − dn2 ) ∈ Z und S(α) = m ∈ Z. Um zu zeigen, dass es keine anderen ganzen Zahlen gibt, nehmen wir an
α=
√ a+b d ∈ Od , wobei a, b ∈ Q . 2
Dann ist S(α) = a ∈ Z und N(α) = 14 (a2 − db2 ) ∈ Z, also a2 − db2 ∈ 4 Z, insbesondere db2 ∈ Z. Daraus folgt b ∈ Z; denn hätte b2 einen echten Nenner, so würden alle Primfaktoren mit gerader Potenz auftreten, diese kann d nicht herausheben. Somit ergibt sich
√ a+b d α= 2
mit a, b ∈ Z
und
a2 − db2 ∈ 4 Z .
Für d ≡ k (mod4) gilt
a2 − db2 ∈ 4 Z ⇔ a2 − kb2 ∈ 4 Z . Durch einfache Rechnungen sieht man, dass diese Bedingung gleichwertig ist mit
a − b ∈ 2Z
für k = 1
und
a, b ∈ 2 Z
für k = 2, 3 .
Der Fall k = 0 kann nicht auftreten, da 4 = 22 kein Teiler von d sein darf. Zum Beweis von c) illustrieren wir zunächst den einfachsten Fall d = −3. Der √ Ring O−3 ⊂ C besteht aus den Gitterpunkten Z + Z · i 3 und den zusätzlichen Mittelpunkten der Rechtecke in diesem Gitter:
231
3.12 QUADRATISCHE ZAHLRINGE∗
r
√ ri 3 r
r ×
r
×
ω
r0
r ×
r
×
× r
r ×
r1 ×
r
r ×
r
r
Es ist zu zeigen, dass
√
m + n d , m, n ∈ Z, m − n gerade . {k + lω : k, l ∈ Z} = 2 √ Die Bedingung k + lω = 12 (m + n d) ergibt m = 2k + l
und
n = l , d.h. l = n
und
k=
1 (m − n) , 2
daraus folgt die behauptete Gleichheit. Nun ist a) einfach zu zeigen. Dass Od unter der Addition abgeschlossen ist, sieht man sofort aus b). Für die Multiplikation folgt die Abgeschlossenheit aus
√ √ √ (m + n d)(m + n d) = (mm + nn d) + (mn + nm ) d und
ω2 =
1 d+1 √ ( + d) 2 2
für
für
d ≡ 2, 3 (mod4)
d ≡ 1 (mod4) .
Auch d) folgt sofort aus b): Für d ≡ 2, 3 (mod4) ist
√ α=m+n d∈Q⇔n=0⇔α=m∈Z und für d ≡ 1 (mod4) ist
α=
√ m m+n d ∈Q⇔n=0⇔α= 2 2
und m gerade .
2
232
II RINGE
3.13 Einheiten in quadratischen Zahlringen ∗ Der wesentliche Unterschied zwischen dem imaginär-quadratischen Fall d < 0 und dem reell-quadratischen Fall d > 0 besteht darin, dass die Norm N im ersten Fall eine positiv denite, im zweiten Fall eine indenite quadratische Form ist. Daher haben die beiden Fälle deutliche Unterschiede, der reell-quadratische wird sich als wesentlich komplizierter erweisen. Zunächst einmal bezeichnen wir für ein beliebiges zulässiges d mit
O× d := {α ∈ Od : es gibt ein β ∈ Od mit αβ = 1} die Menge der Einheiten; nach II 1.2 ist O× d mit der Multiplikation eine abelsche Gruppe.
Bemerkung
Für alle zulässigen d gilt × α ∈ O× d ⇔ N(α) ∈ Z = {1, −1} .
Beweis ⇒ ⇐
Entscheidend ist die Multiplikativität der Norm (Bemerkung aus II 3.11). Aus αβ = 1 folgt N(αβ) = N(α)N(β) = 1, also N(α) = ±1. ±1 = N(α) = αα ¯ , also αβ = 1 mit β = ±¯ α. 2
Die angegebene Bedingung an die Norm kann man nun übersetzen in diophantische Gleichungen, d.h. Gleichungen, für die ganzzahlige Lösungen gesucht sind.
Lemma
Für d ≡ 2, 3 (mod4) und m, n ∈ Z gilt √ 2 2 m + n d ∈ O× d ⇔ m − dn = ±1 ,
(∗)
für d ≡ 1 (mod4) und m, n ∈ Z gilt √ m+n d 2 2 ∈ O× d ⇔ m − dn = ±4 . 2
(∗∗)
Der Tradition folgend nennt man die Bedingungen (∗) und (∗∗) Pellsche Glei-
chungen.
Beweis
Für d ≡ 2, 3 (mod4) folgt die Behauptung sofort aus obiger Bemerkung. Für d ≡ 1 (mod4) folgt ebenso ⇒. Ist umgekehrt d ≡ 1 (mod4), so gilt
m2 − dn2 = ±4 ⇒ m2 − n2 ∈ 4 Z ⇒ m − n ∈ 2 Z . Also ergibt jede Lösung der Pellschen Gleichung auch ein Element aus O× d.
2
Die Suche nach Einheiten in Od kann somit als geometrische Aufgabe angesehen werden. Für d < 0 besteht O× d aus den Zahlen α ∈ Od , die auf dem Kreis N (α) = 1 in C gelegen sind. Ist √ √ m+n d für d ≡ 1 (mod4) , α = m + n d für d ≡ 2, 3 (mod4) oder α = 2
3.13 EINHEITEN IN QUADRATISCHEN ZAHLRINGEN∗
233
so müssen die Koezienten m, n ganzzahlige Punktepaare (m, n) auf der durch die Pellsche Gleichung beschriebenen Ellipse im R2 sein. Für d > 0 sind Kreis und Ellipsen durch jeweils zwei Hyperbeln zu ersetzen. Wir bleiben zunächst beim Fall d < 0.
R×R
C
234
II RINGE
Durch elementare Rechnungen anhand der obigen Bilder erhält man den
Satz
Ist
d < 0,
so gilt
⎧ ∼ ⎪ ⎨ {+1, −1} = Z2 für d = −2 n ∼ O× d = ⎪ {ζ4 : n = 0, 1, 2, 3} = Z4 ⎩ {ζ n : n = 0, 1, . . . , 5} ∼ = Z6 6
Insbesondere sind alle Einheitengruppen
O× d
oder für für
⎫ d ≤ −5 , ⎪ ⎬ d = −1 , ⎪ ⎭ d = −3 .
endlich und zyklisch.
2
Für d > 0 sind die Einheitengruppen O× d weit schwieriger zu bestimmen, wir geben nur einige Hinweise. Einzelheiten ndet man z.B. in [Ha, 16.4] oder [Wü, 11.3].
√ √ √ Ist α = a + b d ∈ Q( d) als Punkt (x, y) = (a, b d) ∈ R2 dargestellt, so ist N(α) = ±1, wenn α auf einer der Hyperbeln x2 − y 2 = +1 oder
x2 − y 2 = −1
liegt. O× d besteht also aus all den Punkten von Od , die auf diesen Hyperbeln liegen. Für d = 2 ndet man neben ±1 ∈ O× d die Einheit ε := 1 + sofort vier Einheiten:
ε=1+
√
2 , ε−1 = −1 +
√
2. Daraus erhält man
√ √ √ 2 , −ε = −1 − 2 , (−ε)−1 = 1 − 2 .
235
3.14 EUKLIDISCHE QUADRATISCHE ZAHLRINGE∗
√ k k Für jedes k ∈ Z ist εk ∈ O× 2 , denn N(ε ) = (N(ε)) . Jedes Element α ∈ Q( 2) hat neben seiner Norm N (α) ∈ Q als Element von R auch einen multiplikativen Absolutbetrag |α| ∈ R und √ |ε| = 1 + 2 > 1 , also εk = εl für k, l ∈ Z und k = l . Daher erzeugt ε eine unendliche zyklische Untergruppe von O× 2. Für d = 5 ist d ≡ 1 (mod4), hier erhält man wie oben aus ε = Einheiten und eine unendliche zyklische Untergruppe von O× 5.
1 2 (1
+
√
5) vier
3.14 Euklidische quadratische Zahlringe ∗ Der Ring Od ist euklidisch, wenn es eine Abbildung
δ : Od {0} → N mit der in II 2.7 angegebenen Eigenschaft gibt. Ein naheliegender Kandidat dafür ist δ = | N |, das ergibt sogar eine Fortsetzung √ √ δ : Q( d) → Q , a + b d → |a2 − db2 | . Die Bedingung für δ bedeutet dann, dass es zu α, β ∈ Od mit β = 0 Zahlen q, r ∈ Od gibt, so dass r α δ =δ −q 0. Wir beginnen mit d < 0, in diesem Fall ist N ≥ 0 das Quadrat des Betrages in C. Für d ≡ 2, 3 (mod4) ist √ Od = Z + Z d ,
236
II RINGE
√ das sind Gitterpunkte in C. Die Punkte aus Q( d) mit maximalem Abstand zum nächstgelegenen Gitterpunkt sind die Mittelpunkte der durch das Gitter gebildeten Rechtecke.
s √d
s ×
× s
s
× s 0
s
s
× Punkt mit
s 1 ×
s
s Gitterpunkt
× s
maximalem Abstand
× s
s
Also ist der maximale Wert von δ( βr ) gleich √ 1 1+ d ) = (1 + |d|) , N( 2 4 und Od ist mit diesem δ euklidisch genau dann, wenn
1 + |d| < 4 , d.h. |d| ≤ 2 . Wir geben ein Beispiel für die Division mit Rest im Fall d = −1. Sei α 1 α = 3 + i , β = −2i , = (−1 + 3i) . β 2
b b
b α β
× bi r 0
rβ
rα r 1
3.14 EUKLIDISCHE QUADRATISCHE ZAHLRINGE∗
237
Für die Wahl von q ∈ O−1 gibt es die vier Möglichkeiten i
, 2 i , −1 + 2 i , −1 + i .
Wählen wir q = i, so ist
3 + i = i · (−2 i) + (1 + i) mit δ(β) = 4 > 2 = δ(r) oder δ( βr ) =
1 2
und
< 1.
Im Fall d ≡ 1 (mod4) ist
Od = Z + Zω
3+i 1+i =i+ −2 i −2 i
mit
√ 1+ d , ω= 2
die Einzugsbereiche der Gitterpunkte sind Sechsecke, einen maximalen Abstand hat der eingezeichnete Punkt ξ .
pp pp pp pp −1 ωr r +ω pp pp pp pp pp ξ pppp p p ×p p p p p p ω2 ppp p p p pppp p p pp p p p p p p p p p p pp p p p p pp pp pp pp pp pp pp pp pp pp pp r pp pp pp 0 pp pp pp pp pp pp pp pp p p p ppp pppppp ppp pppppp p p p p p p ppppppp ppp pppp
Etwa mit Hilfe des Höhensatzes erhält man ξ=
1 1 ·i. |d| + 4 |d|
Daher ist Od mit δ genau dann euklidisch, wenn ρ :=
Man rechnet nach:
1 |d| + < 4 . |d|
pp pp pp pp pp pp pp pp pp
r 1
p
238
II RINGE
d
−3
−7
−11
−15
···
ρ
2.309. . .
3.024. . .
3.618. . .
4.131. . .
···
Insgesamt haben wir Folgendes gezeigt
Satz 1 Für d euklidisch, wenn
< 0
ist der Ring
Od
zusammen mit der Norm
N
genau dann
d = −1 , −2 , −3 , −7 , −11 . √ Der Fall √ d > 0 ist wesentlich komplizierter. Ist α ∈ Q( d), so liegen alle Punkte β ∈ Q( d) mit |N(β − α)| < 1 im Fall d < 0 in einer Kreisscheibe um α, im Fall d > 0 in dem unbeschränkten Bereich zwischen vier Hyperbelästen. Ob Od euklidisch ist, entscheidet sich im Fall d < 0 dadurch, ob die Kreisscheiben vom Radius 1 um alle Punkte von Od die Ebene überdecken, das war leicht zu überprüfen. Ob die Hyperbelbereiche die Ebene überdecken, ist sehr viel mühsamer zu entscheiden. Um wenigstens eine einfach zu überprüfende hinreichende Bedingung zu erhalten, verkleinern wir den Hyperbelbereich zu einem Einheitsquadrat: Da |x2 − y 2 | < 1 für |x| < 1 und |y| < 1, ist
|N(α)| < 1 für
√ α=a+b d
mit
a2 < 1
und
db2 < 1 .
Od ist sicher euklidisch, wenn die oenen Einheitsquadrate um die Punkte von Od die Ebene überdecken. Für d ≡ 2, 3 (mod4) ist das genau dann der Fall, wenn √
d 0 auf ein endliches Problem zurückzuführen, ndet man bei [Ha, § 16.6]. Dabei wird die unendliche Einheitengruppe O× d verwendet. Die bisher betrachteten Ringe O−1 , O−3 und O2 sind euklidisch. Ist das nicht vorausgesetzt, so liefert immerhin die Gleichung N (α) = α · α ¯ einige interessante Zerlegungen von ganzen Zahlen in Od . Wir wählen d = −5 und den Kummerring √ √ O−5 = Z + Z −5 = {α = m + i n 5 : m, n ∈ Z} , O× −5 = {+1, −1} . N(α) = m2 + 5n2 N(α) = αα ¯
m
n
0
1
1
1
2
1
√ √ 5 = (i 5)(−i 5) √ √ 6 = (1 + i 5)(1 − i 5) √ √ 9 = (2 + i 5)(2 − i 5)
3
0
9=3·3
Was sofort auällt, sind die verschiedenen Zerlegungen
√ √ √ √ 6 = 2 · 3 = (1 + i 5)(1 − i 5) , 9 = 3 · 3 = (2 + i 5)(2 − i 5) .
(∗)
Zunächst zeigen wir, dass die Zahlen
√ √ 2, 3, 1 ± i 5, 2 ± i 5
in O−5 irreduzibel sind. Sie haben die Normen 4, 6, 9 mit den Primfaktoren 2 und 3. Wie man sofort sieht, können 2 und 3 aber nicht als Normen in O−5 auftreten. Also hat man in (∗) wesentlich verschiedene Zerlegungen in irreduzible Faktoren.
244
II RINGE
Die Primzahlen 2, 3 ∈ N sind in O−5 nicht mehr prim: √ √ 2 | 6 ⇒ 2| (1 + i 5) · (1 − i 5) . √ Angenommen 2 | (1 ± i 5). Dann wäre √ 1 ± i 5 = 2 · α , also 6 = 4 · N(α) ,
√ das ist wegen N(α) ∈ Z unmöglich. Analog führt man 3 | (2 ± i 5) zum Widerspruch. Aus dem Satz über euklidische Ringe in II 2.7 folgt, dass O−5 mit keinem δ euklidisch sein kann. In diesem Abschnitt war das nur für δ = N gezeigt worden.
3.16 Ideale als ideale Zahlen ∗ Die Ringe Od sind nur für wenige d faktoriell, noch seltener euklidisch. Genauere Aussagen dazu ndet man etwa bei [ArM, 11.7]. Das einfachste Beispiel für einen nicht faktoriellen quadratischen Zahlring ist √ √ √ O−5 = Z + Z −5 mit 6 = 2 · 3 = (1 + −5) · (1 − −5) als Beispiel für verschiedene Zerlegungen in irreduzible Elemente. An diesem Beispiel kann man die bahnbrechende Idee von erklären, wie sich die Teilbarkeitstheorie retten lässt, wenn man von Zahlen zu Idealen als idealen Zahlen übergeht.
Kummer
Zur Vereinfachung der Bezeichnungen setzen wir in diesem ganzen Abschnitt √ ξ := −5 und R := O−5 = Z + ξ Z ⊂ C . Zunächst einmal betrachten wir in R die Hauptideale
(2) = 2R , (3) = 3R
und
(1 + ξ) = (1 + ξ)R .
Als abelsche Gruppen haben sie jeweils zwei Erzeugende, es ist
(2) = 2 Z + 2 ξ Z , (3) = 3 Z + 3 ξ Z , (1 + ξ) = (1 + ξ)Z + (−5 + ξ)Z . Wie in den Bildern zu sehen ist, sind diese Ideale die Ecken von Rechtecken, die durch Multiplikation des Gitters Z + ξ Z mit dem erzeugenden Element des Ideals entstehen. Weiter betrachten wir in R die Untergruppen
p := 2 Z + (1 + ξ)Z
und
q := 3 Z + (1 + ξ)Z .
Oensichtlich hat man die handlicheren Darstellungen
p = {k + l ξ : k, l ∈ Z und k ≡ l (mod 2)} q = {k + l ξ : k, l ∈ Z und k ≡ l (mod 3)} .
und
3.16 IDEALE ALS IDEALE ZAHLEN∗
cq q cq q cq q cq q cq q cq q cq
q q q q qc q q q q q qc q q
q q q q q q q q q q q q q
q q q qc q q q q q qc q q q
cq q cq q cq q pcqp p p p pqp p p p ppcq q cq q cq ppp pppp p q q q q q q qξ q pppppq q q q q pppp ppp cq q cq q cq q cq0 q1 pppcq q cq q cq6
q q ppqcp p p pq q q q q qc q q q q pp p p p p p p pp pppp pp p pp q pqcp p p p q q q q qpξp p pqc q q q q q pppp pp pppp pp pppp p p p p p0ppp 1 qc q q q q q pqc q q q q q qc6
q q q q q q q q q q q q q
q q q q q qc q q q q q qc q
cq q cq q cq q cq q cq q cq q cq
q q q q qc q q q q q cq q q
q q q q q q q q q q q q q
q q q qc q q q q q cq q q q
cq q cq q cq q cq q cq q cq q cq
q q qc q q q q q cq q q q q
(2) = p · p
(1 + ξ) = p · q
cq q cq q cq q cq q cq q cq q cq
q cq q q cq q q cq q q cq q q
q qc q cq q cq q cq q cq q cq q
cq q q cq q q cq q q cq q q cq
cq q cq q cq q cq q cq q cq q cq
q q cq q q cq q q cq q q cq q
q qc q cq q cq qξ cq q cq q cq q
q cq q q cq q qξ cq q q cq q q
cq q cq q cq q cq0 q1 cq q cq q cq6
cq q q cq q q cq0 q1 q cq q q cq6
q qc q cq q cq q cq q cq q cq q
q q cq q q cq q q cq q q cq q
cq q cq q cq q cq q cq q cq q cq
q cq q q cq q q cq q q cq q q
q qc q cq q cq q cq q cq q cq q
cq q q cq q q cq q q cq q q cq
cq q cq q cq q cq q cq q cq q cq
q q cq q q cq q q cq q q cq q
p = (2, 1 + ξ)
q = (3, 1 + ξ)
245
246
II RINGE
Daran kann man sofort sehen, dass p und q Ideale in R sind (hier ist ξ 2 = −5 entscheidend!):
(1 + ξ)(m + n ξ) = (m − 5n) + (m + n)ξ ∈ p ∩ q , denn (m − 5n) − (m + n) = −6n ist durch 2 und 3 teilbar . An den Bildern sieht man, dass p und q keine Hauptideale sein können, denn die Gitter bestehen nicht aus Rechtecken. Nun zu den Teilbarkeitseigenschaften der betrachteten Ideale. Da
2 · 3 = 6 = (1 + ξ)(1 − ξ) ∈ (1 + ξ) R , aber 2, 3 ∈ / (1 + ξ) R , ist (1 + ξ) R kein Primideal. Bezeichnet : Z → R/p die Beschränkung der kanonischen Abbildung : R → R/p, so sieht man sofort, dass surjektiv ist und Ker = p ∩ Z = 2 Z , also R/p ∼ = Z/2Z . Daher ist p ⊂ R Primideal. Analog sieht man, dass q ⊂ R Primideal ist, denn R/q ∼ = Z/3Z. Nun benötigen wir noch die konjugierten Ideale
(1 + ξ) := (1 − ξ) , p := (2, 1 − ξ)
und
q = (3, 1 − ξ) ;
wie oben sieht man, dass p und q Primideale sind. Nun betrachten wir die Produkte von Idealen, die nach II 2.10 von den Produkten der Erzeugenden erzeugt werden, also
p·p =
(2, 1 + ξ) · (2, 1 − ξ)
=
(4, 2 + 2 ξ, 2 − 2 ξ, 6)
q·q
=
(3, 1 + ξ) · (3, 1 − ξ)
=
(9, 3 + 3 ξ, 3 − 3 ξ, 6)
p·q
=
(2, 1 + ξ) · (3, 1 + ξ)
=
(6, 2 + 2 ξ, 3 + 3 ξ, −4 + 2 ξ) .
Wie man ganz leicht nachprüft, ist
p · p = (2) , q · q = (3) und p · q = (1 + ξ) . Daraus erhält man das denkwürdige Ergebnis von
(6)
= =
Kronecker:
p · p · q · q = (2) · (3) p · q · p · q = (1 + ξ) · (1 − ξ) .
(∗ ∗ ∗)
Aus der Sicht der Ideale, d.h. der idealen Zahlen, sind die beiden verschiedenartigen Zerlegungen der Zahl 6 in zwei Faktoren also nur Zwischenschritte auf dem Weg zur Zerlegung des Ideals (6) in ein Produkt von vier Primidealen. Man kann leicht sehen, dass diese Zerlegung in Primideale bis auf Reihenfolge eindeutig ist. Die eben durchgeführte elementare Überlegung ist der Startpunkt zu spannenden Untersuchungen der algebraischen Zahlentheorie. Wer darüber mehr wissen will, kann mit Abschnitt 10 von Kapitel 11 aus [ArM] beginnen, und etwa bei [M-P] und [Ne] einen Überblick zu weiteren Entwicklungen nden.
Kapitel III Körpererweiterungen 1 Grundbegrie 1.1 Charakteristik und Primkörper Für jeden Ring R mit Einselement 1 hat man einen Homomorphismus ϕ : Z → R , n → n · 1 ,
wobei n · 1 := 1 + . . . + 1 (n-mal) für n ∈ N und (−n) · 1 := n · (−1). Nach I 1.8 gibt es genau ein m ∈ N mit Ker ϕ = mZ. Dieses m heiÿt Charakteristik von R, in Zeichen char(R). Oensichtlich ist char(R) = min{k ∈ N {0} : k · 1 = 0} , falls char(R) > 0. Ist K ein Körper, so ist char(K) = 0 oder eine Primzahl, denn mit aus
k, l ∈ N
folgt
0 = m · 1 = (kl) · 1 = (k · 1)(l · 1) ,
dass k · 1 = 0 oder l · 1 = 0. Für die oben erklärte Abbildung ϕ : Z → K bedeutet das Folgendes: Ist char(K) = 0 , so ist ϕ injektiv, man kann also Z mit ϕ(Z) ⊂ K identizieren; damit ist auch der Quotientenkörper Q = Q(Z) ⊂ K . Oensichtlich ist das der kleinste Unterkörper von K und Q heiÿt Primkörper von K . Ist char(K) = p > 0 , so hat man einen Isomorphismus ϕ(Z) ∼ = Z/pZ = Fp .
In diesem Fall ist Fp ⊂ K als kleinster Unterkörper der Primkörper von K . Für spätere Verwendung notieren wir noch die Bemerkung
Der einzige Automorphismus eines Primkörpers ist die Identität.
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9_11, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
248
III KÖRPERERWEITERUNGEN
Beweis
Ist K gleich Q oder Fp und ϕ ein Automorphismus von K , so gilt
m · 1 m · 1 = , falls n · 1 = 0 , n·1 n·1
ϕ(1) = 1 ⇒ ϕ(n · 1) = n · 1 ⇒ ϕ also ϕ(a) = a für alle a ∈ K .
2
Wie sich zeigen wird, bestehen in der Körpertheorie zwischen Charakteristik 0 und p grundlegende Unterschiede. Oensichtlich ist jeder Körper der Charakteristik Null unendlich. Dass es in Charakteristik p auch echte Oberkörper von Fp (sogar unendliche) gibt, ist klar: etwa den Körper Fp (X) der rationalen Funktionen. Andere Beispiele geben wir in III 3.4.
1.2 Grad einer Körpererweiterung Ist k ⊂ K ein Unterkörper, so spricht man aus der Sicht von k von einer , wir schreiben dafür meist
Körpererweiterung
K⊃k. Ein
Zwischenkörper L hat die Eigenschaften k⊂L⊂K,
d.h. k ⊂ K und L ⊂ K sind Unterkörper. Ein Standardbeispiel dafür ist
Q⊂R⊂C. Ziel dieses ganzen Kapitels ist es, solche Körpererweiterungen mit Zwischenkörpern zu konstruieren und ihre Eigenschaften zu studieren. Zunächst einmal ist ein Maÿ für die Gröÿe einer Körpererweiterung K ⊃ k nötig. Dazu benutzen wir die Tatsache, dass K als Vektorraum über k angesehen werden kann, wobei die Multiplikation mit Skalaren
k×K →K die gewöhnliche Multiplikation in K ist, in der ersten Komponente eingeschränkt auf k . Dann ist der von K ⊃ k
Körpergrad
[K : k] := dimk (K) erklärt als die Vektorraum-Dimension. Die einfachsten Beispiele sind
[R : Q] = ∞ und
[C : R] = 2 .
Man benutzt dabei, dass R überabzählbar ist. Eine entscheidende Eigenschaft für den Körpergrad ist die
249
1.2 GRAD EINER KÖRPERERWEITERUNG
Gradformel
Ist
k⊂L⊂K
ein Zwischenkörper, so gilt
[K : k] = [K : L] · [L : k] .
Beweis Ist einer der beiden Faktoren rechts gleich ∞, so ist auch [K : k] = ∞, also ist die Formel in diesem Fall richtig.
Andernfalls sei [L : k] = m < ∞ und [K : L] = n < ∞. Wir wählen Basen
(x1 , . . . , xm ) von L über k
und
(y1 , . . . , yn ) von K über L ;
dann genügt es zu zeigen, dass die Familie
(xi · yj )i=1,...,m, j=1,...n der Produkte xi yj ∈ K eine Basis von K über k ist. Zunächst hat jedes y ∈ K eine eindeutige Darstellung
b1 , . . . , bn ∈ L
mit
y = b 1 y 1 + . . . + bn y n
und jedes bj ∈ L eine eindeutige Darstellung mit
bj = a1j x1 + . . . + amj xm
aij ∈ k .
Daraus folgt, dass K über k von (xi yj ) erzeugt wird, denn
y=
aij xi yj .
i,j
Die Familie (xi yj ) ist auch linear unabhängig, denn aus .
- aij xi yj = 0 folgt aij xi yj = 0 , also i,j
j
i
aij xi = 0 für jedes j und damit
aij = 0
i
2
für alle i, j . Als unmittelbare Folgerung aus der Gradformel erhält man das
Korollar a) Aus b) Ist
Ist
k⊂L⊂K
[K : L] = [K : k]
[K : k]
ein Zwischenkörper und
folgt
[K : k] < ∞,
k = L.
eine Primzahl, so folgt
k=L
oder
L = K.
Insbesondere gibt es keinen echten Zwischenkörper von C ⊃ R.
so gilt
250
III KÖRPERERWEITERUNGEN
1.3 Adjunktion von Elementen Ist K ⊃ k eine Körpererweiterung, so kann man einen kleinsten Zwischenkörper nden, der eine gegebene Teilmenge A ⊂ K enthält, nämlich L , wobei L ⊂ K Unterkörper ist. k(A) := k∪A⊂L⊂K
Man nennt k(A) den von A über k erzeugten Unterkörper von K . Analog kann man R , wobei R ⊂ K Unterring ist, k[ A ] := k∪A⊂R⊂K
als den von A über k erzeugten Unterring von K erklären. Man sagt auch, dass k(A) bzw. k[ A ] durch Adjunktion von A an k entstehen. Dabei ist entscheidend, dass die Menge A in einem gegebenen Oberkörper K enthalten ist. Falls A = {a1 , . . . , an } endlich ist, schreibt man
k[a1 , . . . , an ]
und
k(a1 , . . . , an ) ,
im Fall A = {a} hat man k[ a ] und k(a). Der Zusammenhang mit dem Polynomring k[ X ] und dem Körper k(X) der rationalen Funktionen (Beispiel 2 in II 1.14) ist ziemlich oensichtlich:
Bemerkung a) Für jedes
Ist
K⊃k
a∈K
ist
b) Für jede Teilmenge
eine Körpererweiterung, so gilt
k[ a ] = {f (a) ∈ K : f ∈ k[ X ]}. A ⊂ K ist k(A) = Q(k[ A ]) der Quotientenkörper.
a) S := {f (a) ∈ K : f ∈ k[X]} ist das Bild des EinsetzungsHomomorphismus σa : k[ X ] → K , f → f (a) ,
Beweis
also ist S ⊂ K Unterring. Oensichtlich ist S in jedem Unterring R ⊂ K mit a ∈ R enthalten. Jeder Körper ist ein Ring und der Quotientenkörper ist nach II 1.13 minimal, also ist k ⊂ k[ A ] ⊂ Q(k[ A ]) ⊂ k(A) ⊂ K . b)
Nach Denition von k(A) folgt die Behauptung.
2
Besonders einfach sind Körpererweiterungen, die von einem einzigen Element erzeugt werden. Dem entsprechend nennt man eine Körpererweiterung K ⊃ k einfach , wenn es ein a ∈ K gibt mit
K = k(a) . In diesem Fall heiÿt a ∈ K ein primitives Element . In III 3.4 und III 3.7 werden wir die erstaunlichen Ergebnisse beweisen, dass es sehr oft primitive Elemente gibt (vgl. dazu auch Beispiel 4 in III 1.6).
251
1.4 ALGEBRAISCHE UND TRANSZENDENTE ELEMENTE
1.4 Algebraische und transzendente Elemente Wir kommen nun zu einer wichtigen Unterscheidung von Elementen aus einer Körpererweiterung K ⊃ k . Ein Element a ∈ K heiÿt algebraisch über k , wenn es ein Polynom f ∈ k[ X ] {0} gibt, so dass f (a) = 0. Dagegen heiÿt
a ∈ K transzendent über k , wenn es nicht algebraisch über k ist, ≥ 0 mit Koezienten in k
d.h. wenn es nicht Nullstelle eines Polynoms vom Grad ist. Als Nullstelle von
X − a ∈ k[ X ]
a ∈ k
ist demnach jedes
algebraisch über
k.
Interessantere Beispiele folgen in III 1.6. Der Prototyp eines transzendenten Elements ist die Unbestimmte
X
im Körper
der rationalen Funktionen
K = k(X) ⊃ k X ∈ k(X) transzendent über k : Für f ∈ k[ X ] {0} ist f (X) = f , denn wenn man X für X einsetzt, f nicht. Also ist f (X) = 0. Das ist eine reine Formalität.
über einem beliebigen Körper. In der Tat ist jedes Polynom ändert sich
Ein viel komplizierteres Beispiel erhält man mit
e, π ∈ R ⊃ Q .
Hermite
Nach klassischen Sätzen, von
e
und
also
e
π
Q.
transzendent über
und
π
[Her] für
e und
Lindemann
Mit der Brille der Algebra, von
gleichwertig mit einer Unbestimmten
X.
Q
[Li] für
π , sind
aus gesehen, sind
Diese gewöhnungsbedürf-
tige Tatsache wird anschlieÿend näher ausgeführt. Einen etwas abstrakteren Blick auf den Unterschied zwischen algebraischen und transzendenten
Elementen
Homomorphismus
erhält
man
durch
Betrachtung
des
Einsetzungs-
σa : k[ X ] → K , f → f (a) ,
Oensichtlich gilt
a a
⇔ ⇔
k
transzendent über algebraisch über
k
Ker Ker
σa = {0} σa = {0} .
⇔
σa
injektiv
,
Zunächst zum formal einfacheren Fall eines transzendenten Elementes. Dass es gleichwertig zu einer Unbestimmten ist, folgt aus der
Bemerkung
Ist
a∈K⊃k
a) Der Homomorphismus
σa
transzendent über
b)
[k(a) : k] = ∞ a2 ∈ K
so gilt:
ergibt Isomorphismen
k[ X ] → k[ a ]
c)
k,
ist transzendent über
k
und
und
k(X) → k(a) .
k(a2 ) k(a).
252
III KÖRPERERWEITERUNGEN
Insbesondere folgt aus c), dass es eine echt absteigende unendliche Kette
k(a) k(a2 ) k(a4 ) . . . k von Zwischenkörpern gibt, falls a transzendent über k ist. Beweis
a) folgt sofort aus k[ a ] = σa (k[ X ]) und der Injektivität von σa .
b) folgt aus a), da 1, X, X 2 , . . . , X n , . . . in k[ X ] linear unabhängig über k sind.
Wäre a2 algebraisch über k , so gäbe es ein Polynom f ∈ k[ X ] {0} mit f (a ) = 0. Dann wäre a aber Nullstelle von g := f (X 2 ) = 0 (vgl. II 1.6).
c)
2
Wäre a ∈ k(a2 ), so gäbe es nach Teil b) der Bemerkung aus III 1.3 Polynome f, g ∈ k[ X ] {0} mit f (a2 ) . a= g(a2 ) Dann wäre a Nullstelle von h := Xg(X 2 )−f (X 2 ). Da f (X 2 ) geraden und Xg(X 2 ) ungeraden Grad hat, ist h = 0; also wäre a algebraisch über k . 2 Wir vermerken noch eine besondere Eigenschaft des Körpers rationaler Funktionen, die Aussage c) der obigen Bemerkung verallgemeinert.
Satz
Ist k ein Körper und x ∈ k(X) k , so ist x transzendent über k .
In der Darstellung x = hg mit g, h ∈ k[ X ] {0} können wir annehmen, dass ggT (g, h) = 1 (Korollar aus II 3.6). Angenommen x wäre algebraisch über k . Dann gäbe es ein Beweis
f = a0 + a1 X + . . . + an X n ∈ k[ X ] mit n ≥ 2 ; a0 = 0 und an = 0, so dass f (x) = a0 + a1
g n g + . . . + an =0. h h
(∗)
Der Fall deg g = deg h = 0 ist ausgeschlossen, sei also deg g ≥ 1. Aus (∗) folgt
g (an g n−1 + . . . + a1 hn−1 ) = −a0 hn . Also wäre g Teiler von −a0 hn und damit von h. Analog behandelt man den Fall deg h ≥ 1. 2
1.5 Das Minimalpolynom Ist a ∈ K ⊃ k und [k(a) : k] < ∞, so muss a nach der Bemerkung aus III 1.4 algebraisch über k sein. Dieser Fall ist subtiler als der transzendente Fall; insbesondere braucht man ein ezientes Hilfsmittel, um den Körpergrad zu berechnen. Der Polynomring k[ X ] ist nach II 2.7 ein Hauptidealring. Falls a algebraisch über k ist, ist daher Ker σa = {f ∈ k[ X ] : f (a) = 0} ⊂ k[ X ]
1.5 DAS MINIMALPOLYNOM
253
von einem eindeutig bestimmten normierten Polynom fa ∈ k[ X ] mit deg fa ≥ 1 erzeugt, in Zeichen (fa ) = Ker σa . Man nennt fa ∈ k[ X ] das
Minimalpolynom von a über k.
Weitere charakteristische Eigenschaften des Minimalpolynoms - insbesondere die Irreduzibilität - ergeben sich aus der
Bemerkung Sei K ⊃ k eine Körpererweiterung, a ∈ K und f ∈ Ker σa normiert. Dann sind folgende Aussagen äquivalent: i) f = fa , d.h. f ist das Minimalpolynom von a. ii) Für alle g ∈ Ker σa {0} gilt deg f ≤ deg g . iii) f ist irreduzibel in k[ X ].
Beweis
i) ⇒ ii) Zu g gibt es ein h ∈ k[ X ] {0} mit g = h · fa . Also ist deg g ≥ deg fa .
ii) ⇒ iii) Aus f = g · h mit g, h ∈ k[ X ] folgt 0 = f (a) = g(a) · h(a) , also g ∈ Ker σa oder h ∈ Ker σa . Wegen ii) folgt h ∈ k × oder g ∈ k × .
iii) ⇒ i) Zu f gibt es ein h ∈ k[ X ] {0} mit f = h · fa , nach iii) ist h ∈ k× . Da
fa und f normiert sind, folgt h = 1.
2
Nun kommen wir zu den entscheidenden Eigenschaften des Minimalpolynoms.
Satz
Sei K ⊃ k eine Körpererweiterung, a ∈ K algebraisch über k und fa ∈ k[ X ] das Minimalpolynom von a über k. Dann gilt: a) k[ a ] = k(a) ∼ = k[ X ]/(fa ). b) [k(a) : k] = deg fa . c) Ist n := deg fa , so ist (1, a, a2 , . . . , an−1 ) eine Basis des k-Vektorraums k(a).
Beweis a) Für den Einsetzungs-Homomorphismus σa gilt Im σa = k[ a ]
und
Ker σa = (fa ) , also k[ a ] ∼ = k[ X ]/(fa )
nach dem Isomorphiesatz in II 2.4. Nach der obigen Bemerkung ist das Minimalpolynom fa irreduzibel; nach II 3.2 ist daher k[ a ] ein Körper, also k[ a ] = k(a).
b) und c) Wir zeigen zunächst, dass
254
III KÖRPERERWEITERUNGEN
k[ a ] = {h(a) ∈ K : h ∈ k[ X ] , deg h < deg fa } .
(∗)
Zu b ∈ k[ a ] gibt es ein g ∈ k[ X ] mit b = g(a). Wir teilen g mit Rest durch fa . Dann ist
g = qfa + h mit
deg h < deg fa
und
g(a) = q(a)fa (a) + h(a) .
Da fa (a) = 0, folgt g(a) = h(a). Aus (∗) folgt, dass 1, a, . . . , an−1 den k -Vektorraum k[ a ] erzeugen. Wären 1, a, . . . , an−1 linear abhängig, so gäbe es λ0 , . . . , λn−1 ∈ k , nicht alle gleich Null, so dass λ0 + λ1 a + . . . + λn−1 an−1 = 0 . Dann wäre f := λ0 + λ1 X + . . . + λn−1 X n−1 = 0 und f (a) = 0, was wegen der 2 Minimalität des Grades n von fa nicht möglich ist. Die eben bewiesene Tatsache, dass der Ring k[ a ] gleich seinem Quotientenkörper ist, folgt aus der Irreduzibilität des Minimalpolynoms. Es ist sicher hilfreich, das noch etwas direkter zu beleuchten. Entscheidend ist, für jedes
0 = b = β0 + β1 a + . . . + βm−1 am−1 ∈ k[ a ] ein Inverses b−1 ∈ k[ a ] zu nden. Da dimk k[ a ] = n, gibt es eine Relation
λ 0 + λ 1 b + . . . + λ n bn = 0 mit λ0 , . . . , λn ∈ k , nicht alle gleich Null. Also ist b algebraisch über k ,
fb := c0 + c1 X + . . . + X m mit m ≥ 1 sei das Minimalpolynom von b. Wegen der Minimalität von m ist c0 = 0. Aus fb (b) = 0 folgt
1 1 = − (c1 + c2 b + . . . + bm−1 ) ∈ k[ a ] . b c0
Berechnung des Inversen
Diese Formel für die setzt voraus, dass man das Minimalpolynom kennt. Eine einfachere Methode benutzt den euklidischen Algorithmus und die Relation von Bézout (vgl. I 3.8 und I 3.13). Gegeben sei b = g(a) ∈ k[ a ] mit deg g < deg fa . Gesucht ist ein h ∈ k[ X ] mit
h(a) · g(a) = 1 ,
also
b−1 = h(a) .
Da fa irreduzibel ist, folgt ggT (g, fa ) = 1. Nach mit
Bézout ndet man h, h˜ ∈ k[ X ]
˜ · fa , also 1 = h(a) · g(a) + h(a) ˜ 1=h·g+h · fa (a) = h(a) · g(a) , denn fa (a) = 0 (vgl. Beispiel 3 in III 1.6).
255
1.6 BEISPIELE
1.6 Beispiele
Beispiel 1
Das wichtigste Beispiel für eine einfache Körpererweiterung ist
i
C = R( ) ⊃ R . Da
i2 = −1, ist X 2 + 1 das Minimalpolynom von i über R, also ist [C : R] = dimR C = 2 .
Das ist die Grundlage für die Darstellung komplexer Zahlen durch die [Ga4 , 30 - 32], denn nach dem Satz aus III 1.5 ist Zahlenebene R2 von
Gauss
i
C = {a + b : a, b ∈ R} . In Beispiel 1 aus III 2.4 werden wir sehen, wie diese Erweiterung in allgemeinerem Rahmen beschrieben werden kann.
Beispiel 2
Wir adjungieren eine Quadratwurzel an Q, d.h. wir wählen ein a ∈ C, so dass b := a2 ∈ Q und das Polynom
X 2 − b ∈ Q[ X ]
irreduzibel ist, d.h.
a∈ /Q.
Dann ist fa := X 2 − b das Minimalpolynom von a über Q, deg [Q(a) : Q] = 2 und
Q(a) = {α + βa : α, β ∈ Q} . Die Addition in Q(a) geschieht im Vektorraum, für die Multiplikation hat man
(α + βa)(α + β a) = αα + (αβ + βα )a + ββ a2 = (αα + ββ b) + (αβ + βα )a . √ Zur Berechnung des Inversen muss man die Wurzel a = b aus dem Nenner entfernen: 1 α − βa α − βa α −β = = 2 = 2 + a. α + βa (α + βa)(α − βa) α − β2b α − β 2 b α2 − β 2 b
Beispiel 3
Wir betrachten die primitive dritte Einheitswurzel
ζ := exp
i
2π ∈C 3
und die Erweiterung
Q(ζ) ⊃ Q .
Das Minimalpolynom von ζ über Q ist (vgl. Beispiel 4 aus II 3.9)
f = X 2 + X + 1 = (X − ζ)(X − ζ 2 ) ∈ Q[ X ] , also ist [Q(ζ) : Q] = 2 und Q(ζ) = {α + βζ : α, β ∈ Q}. Die Addition in Q(ζ) erfolgt im Vektorraum. Zur Multiplikation berechnet man
(α + βζ)(α + β ζ) = αα + (αβ + βα )ζ + ββ ζ 2 = (αα − ββ ) + (αβ + βα − ββ )ζ ,
256
III KÖRPERERWEITERUNGEN
denn ζ 2 = −1 − ζ . Ein kleines Problem ist die Berechnung des Inversen. Aus
ζ 2 + ζ + 1 = 0 folgt
1 = −1 − ζ . ζ
Allgemein kann man Inverse durch geeignete Erweiterung des Bruches berechnen. Für b = 0 ist
1 x + yζ x + yζ x + yζ = = 2 = , α + βζ (α + βζ)(x + yζ) ζ +ζ +γ γ−1 β−α α(β − α) , y = β −1 und γ = . 2 β β2 Die Buchstaben x und y weisen darauf hin, dass man die Werte durch Lösen eines Gleichungssystems erhalten kann. wobei
x=
So ist zum Beispiel
1 −2 − ζ −2 − ζ 1 = = 2 = (2 + ζ) . 1−ζ (1 − ζ)(−2 − ζ) ζ +ζ −2 3 Man kann diese Berechnung auch nach dem allgemeinen Rezept mit Hilfe der Koezienten der Relation von Bézout ausführen. Dazu verwendet man den euklidischen Algorithmus mit
f0 = X 2 + X + 1 f0 = q1 f1 + f2 f1 = q2 f2 + f3
und
f1 = −X + 1 .
X 2 + X + 1 = (−X − 2)(−X + 1) + 3 −X + 1 = − 13 X · 3 + 1
Da f4 = 0, folgt 1 = ggT (f0 , f1 ), was wegen der Irreduzibilität von f0 klar ist, und f3 = f1 − q2 f2 = f1 − q2 (f0 − q1 f1 ) = −q2 f0 + (1 + q1 q2 )f1 . Das Inverse von 1 − ζ ist nach III 1.5 bestimmt durch
1 + q1 q2 = also ist (1 − ζ)−1 =
Beispiel 4
1 2 1 (X + 2X + 3) ≡ (X + 2) mod (X 2 + X + 1) , 3 3 1 3
(2 + ζ).
Wir betrachten die Körperkette √ √ √ Q ⊂ Q( 2) ⊂ Q( 2, 3) ⊂ R .
Zunächst zeigen wir, dass √ [Q( 2) : Q] = 2
√ √ √ [Q( 2, 3) : Q( 2)] = 2 . √ Oensichtlich ist f = X 2 − 2 ∈ Q[ X ] Minimalpolynom von 2 über Q, wegen deg f = 2 gilt die erste Gleichung. Weiter ist √ g := X 2 − 3 ∈ Q[ X ] ⊂ Q( 2)[ X ] und
257
1.6 BEISPIELE
√ nicht nur in Q[ X ], sondern auch in Q( 2)[ X ] irreduzibel. Andernfalls gäbe es ein √ √ y = a + b 2 ∈ Q( 2) mit a, b ∈ Q und g(y) = 0 . √ / Q sein muss und somit Eine einfache Rechnung zeigt, dass dann b = 0 wegen 3 ∈ √ 2 ∈ Q folgen würde. Aus der Gradformel in III 1.2 ergibt sich √ √ [Q( 2, 3) : Q] = 4 . √ √ Wir behaupten nun, dass 2 + 3 ein primitives Element dieser Erweiterung ist, d.h. √ √ √ √ Q( 2, 3) = Q( 2 + 3) . Die Inklusion ⊃ ergibt √ √ ( 2 + 3)3 √ 2 √ 3
ist trivial, es genügt ⊂ zu zeigen. Eine einfache Rechnung
√ √ √ 2 2 + 9( 2 + 3) , also √ √ √ √ √ √ = 12 (( 2 + 3)3 − 9( 2 + 3)) ∈ Q( 2 + 3) und √ √ √ √ √ = ( 2 + 3) − 2 ∈ Q( 2 + 3) . √ √ Um das Minimalpolynom von x := 2 + 3 zu bestimmen, muss man im Prinzip nach einer linearen Relation zwischen den Vektoren =
1, x, x2 , x3 suchen. In diesem Fall geht das einfacher, denn √ x2 = 5 + 2 6 , also (x2 − 5)2 = 24 Somit ist h := (X 2 − 5)2 − 24 = X 4 − 10X 2 + 1 das Minimalpolynom von über Q.
Beispiel 5
polynom
√
√ 2+ 3
Ist p eine Primzahl, so ist nach Beispiel 4 aus II 3.9 das Kreisteilungs-
f := X p−1 + X p−2 + . . . + X + 1 ∈ Q[ X ]
irreduzibel und es gilt X p − 1 = (X − 1) · f . Die primitive p-te Einheitswurzel
ζp := exp
i
2π ∈C p
ist Nullstelle von f , also ist f das Minimalpolynom von ζp über Q und
[Q(ζp ) : Q] = p − 1 . Die Elemente der zu Zp isomorphen zyklischen Gruppe
Cp = {1, ζp , ζp2 , . . . , ζpp−1 } < C
258
III KÖRPERERWEITERUNGEN
(vgl.II 1.9) sind Nullstellen von X p − 1, also ist
X p − 1 = (X − 1) · (X − ζp ) · . . . · (X − ζpp−1 ) . Daraus folgt, dass f auch Minimalpolynom über Q von ζp2 , . . . , ζpp−1 ist. Ist p keine Primzahl, dann sind die Minimalpolynome der p-ten Einheitswurzeln schwieriger zu berechnen. Damit beschäftigt sich die Kreisteilungstheorie in III 5.6.
Beispiel 6
Wir betrachten die Körpererweiterung √ 3 Q ⊂ Q( 2) ⊂ R .
√ Ist b := 3 2 = 1.2599 . . . ∈ R, so ist f := X 3 − 2 ∈ Q[ X ] das Minimalpolynom von b über Q, also [Q(b) : Q] = 3 und
f = (X − b) · g
mit
g = X 2 + bX + b2 ∈ Q(b)[ X ] .
g ist irreduzibel in Q(b)[ X ], denn es hat die nicht reellen komplexen Nullstellen bζ3 und bζ32 ∈ C.
Um f in Linearfaktoren zu zerspalten, muss man noch eine Körpererweiterung vornehmen: Q ⊂ Q(b) ⊂ Q(b, bζ3 ) = Q(b, ζ3 ) . Da deg g = 2, folgt nach der Gradformel [Q(b, ζ3 ) : Q] = 6.
1.7 Algebraische Körpererweiterungen In einer Körpererweiterung K ⊃ k haben wir bisher nur einzelne Elemente a ∈ K und den Zwischenkörper k ⊂ k(a) ⊂ K untersucht. Nun betrachten wir die gesamte Erweiterung K ⊃ k ; sie heiÿt algebraisch , wenn jedes a ∈ K algebraisch über k ist, andernfalls transzendent.
1.7 ALGEBRAISCHE KÖRPERERWEITERUNGEN
259
Man beachte, dass es bei einer transzendenten Erweiterung auch Elemente in K k geben kann, die über k algebraisch sind. Schon in der Bemerkung aus III 1.4 haben wir gesehen, dass eine transzendente Erweiterung unendlich sein muss, daraus folgt sofort die
Bemerkung
Jede endliche Körpererweiterung ist algebraisch.
2
Diese einfache Bemerkung hat wichtige Konsequenzen, daher noch eine Erläuterung. Ist [K : k] = n, so müssen die n + 1 Vektoren 1, x, . . . , xn über k linear abhängig sein, also gibt es eine nicht triviale Relation
a0 +a1 x+. . .+an xn = 0 mit a0 , . . . , an ∈ k und f := ao +a1 X +. . .+an X n = 0 . Dadurch hat man die Existenz eines f ∈ k[ X ] mit f = 0 und f (x) = 0 gezeigt, ohne das Polynom angeben zu müssen (vgl. dazu Beispiel 2 in III 3.11). Eine erste Anwendung ist das
Lemma
Ist K ⊃ k eine Körpererweiterung und sind a1 , . . . , an ∈ K algebraisch über k , so ist k(a1 , . . . , an ) ⊃ k eine endliche und damit algebraische Erweiterung.
Beweis Wir führen Induktion über n. Für n = 1 folgt die Behauptung nach dem Satz aus III 1.5. Das Element an ∈ K ist algebraisch über k , also auch algebraisch über k(a1 , . . . , an−1 ). Da nach der Gradformel aus III 1.2
[k(a1 , . . . , an ) : k] = [k(a1 , . . . , an−1 )(an ) : k(a1 , . . . , an−1 )] · [k(a1 , . . . , an−1 ) : k] , folgt die Behauptung aus dem Fall n = 1 und der Induktionsannahme.
2
Wie wir in III 1.8 sehen werden, muss eine algebraische Köpererweiterung nicht endlich sein. Trotzdem folgt mit Hilfe der Gradformel das
Korollar
Ist k ⊂ L ⊂ K ein Zwischenkörper, so gilt: K⊃k
algebraisch
⇔
K ⊃ L und L ⊃ k
algebraisch .
Beweis ⇒ ist oensichtlich. Zum Nachweis von ⇐ ist zu beachten, dass die Erweiterungen K ⊃ L und L ⊃ k unendlich sein können. Ein Element a ∈ K ist aber über eine endliche Leiter k ⊂ L ⊂ L (a) von k aus erreichbar: Da a algebraisch über L ist, gibt es b0 , . . . , bn−1 ∈ L mit an + bn−1 an−1 + . . . + b1 a + b0 = 0 . Da L ⊃ k algebraisch ist, sind b0 , . . . bn−1 ∈ L algebraisch über k . Für
L := k(b0 , . . . , bn−1 ) ⊂ L gilt [L : k] < ∞
260
III KÖRPERERWEITERUNGEN
nach dem Lemma. Weiter ist a ∈ L (a) algebraisch über L , also
[L (a) : L ] < ∞ und [L (a) : k] = [L (a) : L ] · [L : k] < ∞ . Nach obiger Bemerkung ist a algebraisch über k .
2
Nun beweisen wir ein grundlegendes Ergebnis über die Gesamtheit der algebraischen Elemente in einer gegebenen Körpererweiterung.
Satz Sei K ⊃ k eine Körpererweiterung und L := {a ∈ K : a algebraisch über k} .
Dann gilt: a) k ⊂ L ⊂ K ist ein Zwischenkörper. b) Die Erweiterung L ⊃ k ist algebraisch. c) Ist a ∈ K algebraisch über L, so folgt a ∈ L. Beweis a) Um zu zeigen, dass L ⊂ K ein Unterkörper ist, könnte man versuchen,
zu a, b ∈ L Polynome aus k[ X ] zu nden, die a − b und ab−1 als Nullstellen haben. Viel einfacher ist es, die schon im Beweis des obigen Lemmas benutzte Tatsache zu verwenden, dass eine endliche Erweiterung algebraisch ist. Wir betrachten also zu a, b ∈ L die Erweiterung k(a, b) ⊃ k ; nach dem Lemma ist sie algebraisch, also sind a − b und ab−1 ∈ L.
b) ist klar nach Denition von L. c) Nach dem Lemma ist L(a) ⊃ L algebraisch, nach dem Korollar und b) ist
L(a) ⊃ k algebraisch, also ist a algebraisch über k und a ∈ L.
2
1.8 Algebraisch abgeschlossene Körper Auf der Suche nach Nullstellen von Polynomen kann man von einem Körper K nicht mehr erwarten, als dass jedes Polynom f ∈ K[ X ] mit deg f ≥ 1 in K mindestens eine Nullstelle hat. Ein solcher Körper K heiÿt algebraisch abgeschlossen . Jede Nullstelle x ∈ K von f ∈ K[ X ] ergibt einen Linearfaktor X − x von f (vgl. II 1.8), d.h. f = (X − x) · g mit g ∈ K[ X ] . Ist deg g ≥ 1, so kann man auch eine Nullstelle von g nden, schlieÿlich erhält man eine Zerlegung
f = a · (X − x1 ) · . . . · (X − xn ) mit a ∈ K × , x1 , . . . , xn ∈ K und n = deg f , falls K algebraisch abgeschlossen ist. Oensichtlich kann man die algebraische Abgeschlossenheit eines Körpers K auch durch jede der folgenden Eigenschaften charakterisieren:
261
1.8 ALGEBRAISCH ABGESCHLOSSENE KÖRPER
-
Jedes irreduzible Polynom f ∈ K[ X ] ist linear.
-
Ist K ⊃ K eine algebraische Erweiterung, so folgt K = K .
Zunächst eine einfache Bemerkung
Ein algebraisch abgeschlossener Körper ist unendlich.
Beweis Ist K = {a0 , a1 , . . . , an }, so hat f := (X − a0 ) · (X − a1 ) · . . . · (X − an ) + 1 2
keine Nullstelle in K . Das wichtigste Ergebnis in diesem Zusammenhang ist der Fundamentalsatz der Algebra
braisch abgeschlossen.
Der Körper C der komplexen Zahlen ist alge-
Da der Körper C als Erweiterung von R konstruiert wird, und R mit Hilfsmitteln der Analysis deniert wird (etwa Cauchy-Folgen), kann es keinen rein algebraischen Beweis dieses Satzes geben. Besonders schnell geht es mit elementaren Hilfsmitteln aus der Theorie der holomorphen Funktionen: Sei also
f := X n + an−1 X n−1 + . . . + a1 X + a0 ∈ C[ X ]
mit
n≥1.
Angenommen f (z) = 0 für alle z ∈ C; dann ist die Funktion f −1 in ganz C holomorph. Wir verwenden eine wichtige Eigenschaft des Leitterms X n : Hilfssatz
Es gibt ein R ∈ R mit R > 0, so dass 1 n 3 |z| ≤ |f (z)| ≤ |z|n 2 2
für |z| ≥ R .
Ist R so gewählt, so folgt
2 1 | | ≤ n f R
in
f ∈ {z ∈ C : |z| ≥ R} .
Wegen der Stetigkeit von f1 ist | f1 | Menge {z ∈ C : |z| ≤ R}. also ist insgesamt
1 f
holomorph und
1 | | f
beschränkt
beschränkt in
in
der
kompakten
C.
Nach dem Satz von Liouville aus der komplexen Funktionentheorie ist dann f −1 konstant, im Widerspruch zur Annahme deg f ≥ 1.
Beweis des Hilfssatzes Für z = 0 ist a0 an−1 f (z) = z n 1 + + ... + n . z z
262
III KÖRPERERWEITERUNGEN
Also genügt es, := |an−1 | + . . . + |a0 | und R := max {1, 2} zu setzen.
Gauss
2
In seiner Dissertation aus dem Jahr 1799 [Ga 1,2 ] bewies ohne Benutzung komplexer Zahlen ein Ergebnis über Polynome mit rationalen Koezienten, das leicht verallgemeinert so lautet:
Fundamentalsatz der Algebra in reeller Form Jedes Polynom f ∈ R[ X ] mit n := deg f ≥ 1 gestattet eine bis auf die Reihenfolge eindeutige Darstellung f = (X − x1 ) · . . . · (X − xm ) · g1 · . . . · gr , m + 2r = n ,
wobei x1 , . . . , xm ∈ R die reellen Nullstellen von f , und g1 , . . . , gr ∈ R[ X ] irreduzible quadratische Polynome sind. Zum Beweis nehmen wir an, dass f normiert ist, dann gilt nach dem obigen Fundamentalsatz
f = (X − x1 ) · . . . · (X − xm ) · (X − z1 ) · . . . · (X − z2r ) in C[ X ] , wobei z1 , . . . , z2r ∈ C die nicht reellen Nullstellen von f sind. Da f ∈ R[ X ], gilt (vgl. III 2.2) f (z) = 0 für z ∈ C ⇒ f (z) = f (z) = 0 = 0 . Daher kann man die Nummerierung der zi so wählen, dass
zr+i = z i
für
i = 1, . . . , r .
Jedes solches Paar zi , z r+i ergibt einen quadratischen Faktor
gi := (X − zi ) · (X − z i ) = X 2 − (zi + z i ) X + zi z i ∈ R[ X ] ohne reelle Nullstelle, also sind die gi in R[ X ] irreduzibel.
2
Andere Beweise des Fundamentalsatzes geben wir in III 4.7. Eine Körpererweiterung k ⊃ k heiÿt algebraischer Abschluss , wenn folgendes gilt 1) Die Erweiterung k ⊃ k ist algebraisch. 2) k ist algebraisch abgeschlossen. Aus 2) folgt sofort, dass k ⊃ k eine maximale algebraische Erweiterung ist. In III 2.5 werden wir die sehr allgemeine Aussage beweisen, dass es zu jedem Körper einen bis auf Isomorphie eindeutig bestimmten algebraischen Abschluss gibt. Aus dem Fundamentalsatz der Algebra erhalten wir sofort das
Korollar
Ist k ⊂ C ein Unterkörper, so ist k := {a ∈ C : a algebraisch über k}
ein algebraischer Abschluss von k .
1.8 ALGEBRAISCH ABGESCHLOSSENE KÖRPER
263
Beweis Nach dem Satz in III 1.7 ist k ⊃ k eine algebraische Erweiterung. Jedes nicht konstante f ∈ k[ X ] hat in C mindestens eine Nullstelle a. Da a algebraisch 2 über k und somit über k ist, folgt a ∈ k . Insbesondere ist
Q = {a ∈ C : a algebraisch über Q} ⊃ Q ein algebraischer Abschluss. Da es in Q[ X ] irreduzible Polynome beliebigen Grades gibt (etwa X n − 2 nach Beispiel 1 aus II 3.9), folgt [Q : Q] = ∞. Nun können wir auch die in Beispiel 3 aus II 1.4 aufgeworfene Frage beantworten, warum die Körpererweiterung R ⊂ C = R2 nicht auf höherdimensionale Vektorräume Rn mit n ≥ 2 fortgesetzt werden kann. Angenommen, es gäbe eine Körpererweiterung R2 = C ⊂ K = Rn . Dann ist K ein C-Vektorraum und [K : C] < ∞, also K ⊃ C algebraisch. Aus dem Fundamentalsatz folgt K = C, also n = 2.
264
III KÖRPERERWEITERUNGEN
2 Konstruktion von Körpererweiterungen Im vorhergehenden Paragraphen haben wir uns mit den Eigenschaften von vorgegebenen Körpererweiterungen beschäftigt. Interessante Beispiele dafür liefern die Zwischenkörper Q ⊂ L ⊂ C im Fall der Charakteristik Null. Von den endlichen Körpern der Charakteristik p haben wir bisher nur die Primkörper Fp beschrieben; hier gibt es - wie in allen endlichen Körpern (vgl. Bemerkung in III 1.8) - Polynome ohne Nullstellen in Fp . In diesem Paragraphen wollen wir ganz allgemein algebraische Körpererweiterungen konstruieren, mit dem Ziel, möglichst vielen Polynomen zu Nullstellen zu verhelfen.
2.1 Symbolische Adjunktion von Nullstellen Hat man einen beliebigen Körper k und ein Polynom f ∈ k[ X ] ohne Nullstelle in k , so kann man mit einem klassischen Trick einen Erweiterungskörper K ⊃ k angeben, in dem f mindestens eine Nullstelle hat: K wird als Restklassenring des Polynomrings k[ X ] erklärt. Genauer gilt:
Satz über die symbolische Adjunktion von Nullstellen Sei k ein Körper und f ∈ k[ X ] ein irreduzibles Polynom. Dann gilt: a) Der Restklassenring K := k[ X ]/(f ) ist ein Körper. b) Die kanonische Abbildung
k → K = k[ X ]/(f ) , a → a + (f ) ,
ist injektiv, man kann also K ⊃ k als Körpererweiterung ansehen. c) Das Polynom f ∈ k[ X ] ⊂ K[ X ] hat in K die Nullstelle x := X + (f ), das ist die Restklasse der Unbestimmten X . d) Ist f normiert, so ist es das Minimalpolynom von x. Beweis a) folgt sofort aus den in II 3.2 bewiesenen Aussagen: k[ X ] ist Hauptidealring und das Ideal (f ) ⊂ k[ X ] ist maximal, denn f ist irreduzibel. In Korollar 2 aus II 3.2 wird das noch einmal ganz direkt bewiesen. Wie man im Restklassenring die Inversen berechnen kann, wird am Ende von III 1.5 ausgeführt.
b) Ist a + (f ) = b + (f ), so folgt b − a ∈ (f ). Da deg f ≥ 1, folgt b = a. c) Dieser Teil erscheint auf den ersten Blick wie Hokuspokus (daher der Name symbolische Adjunktion): Nach den Rechenregeln im Restklassenring gilt
f (x) = f (X + (f )) = f (X) + (f ) = f + (f ) = 0 + (f ) .
d) folgt aus der Bemerkung in III 1.5.
2
Wenn man nur eine Nullstelle von f nden will, ist die Voraussetzung der Irreduzibilität überüssig:
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9_12, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
265
2.2 FORTSETZUNG VON KÖRPERISOMORPHISMEN
Korollar
Ist
k
ein Körper und
eine Körpererweiterung
K⊃k
f ∈ k[ X ] ein Polynom mit deg f ≥ 1, x ∈ K mit f (x) = 0.
so gibt es
und ein
Man nehme einen irreduziblen Faktor g von f und K := k[ X ]/(g). In K hat g eine Nullstelle x, also auch f . Anders ausgedrückt gibt es ein maximales Ideal m, etwa m = (g), mit Beweis
(f ) ⊂ m ⊂ k[ X ]
x := X + m ∈ k[ X ]/m
und
ist Nullstelle von f , denn
f (x) = f (X + m) = f (X) + m = f + m = 0 + m , da f ∈ m.
2
2.2 Fortsetzung von Körperisomorphismen Ein durch symbolische Adjunktion einer Nullstelle entstandener Erweiterungskörper ist immer nur bis auf Isomorphie eindeutig bestimmt. Um dieses Verfahren mit einem bis auf Isomorphie eindeutig bestimmten Ergebnis iterieren zu können, muss man sich überlegen, wie Körperisomorphismen fortgesetzt werden können. Diese Ergebnisse werden in 4 auch Grundlage der Galoistheorie sein. Im Folgenden benutzen wir immer wieder die aus der universellen Eigenschaft des Polynomrings (II 1.5) folgende Tatsache, dass es zu jedem Körperisomorphismus ϕ : k → k˜ genau einen Ringisomorphismus
˜ X] Φ : k[ X ] → k[
Φ|k=ϕ
mit
und
Φ(X) = X
gibt. Ganz explizit ist für a0 , . . . , am ∈ k
˜ X]. Φ(a0 + a1 X + . . . + am X m ) = ϕ(a0 ) + ϕ(a1 )X + . . . + ϕ(am )X m ∈ k[ Unter Benutzung dieser Fortsetzung auf die Polynomringe beweisen wir nun den
Satz über die Fortsetzung von Körperisomorphismen Körperisomorphismus
ϕ : k → k˜,
Körpererweiterungen
f ∈ k[ X ] das Minimalpolynom ˜ X ], so gibt es genau f˜ := Φ(f ) ∈ k[
Ist
˜ x) ϕˆ : k(x) → k(˜
von
x
über
k
und
Gegeben seien ein
˜ ⊃ k˜ und x ∈ K K ⊃ k, K ˜ x ˜ ∈ K eine Nullstelle von
einen Körperisomorphismus
mit
ϕˆ | k = ϕ
und
ϕ(x) ˆ =x ˜.
Man kann ϕˆ explizit beschreiben durch
˜ x) . ϕ(a ˆ 0 + a1 x + . . . + am xm ) = ϕ(a0 ) + ϕ(a1 )˜ x + . . . + ϕ(am )˜ xm ∈ k(˜ Im Fall k = k˜ und ϕ = idk erhält man unmittelbar das
266
III KÖRPERERWEITERUNGEN
Korollar
K ⊃k
Ist
eine Körpererweiterung und sind
Nullstellen eines irreduziblen Polynoms
f ∈ k[ X ],
x, y ∈ K
zwei beliebige
so gibt es genau einen Isomor-
phismus
ϕˆ : k(x) → k(y) Beweis des Satzes
mit
ϕˆ | k = idk
und
ϕ(x) ˆ =y.
2
Im Grunde genügt es, sich folgendes Diagramm anzusehen:
˜ K ∪
K ∪ k[ X ]/(f ) = k(x) = k[ x ] 6σ f ∈ k[ X ] ∪ k
ϕˆ - k[ ˜ x ˜ x) = k[ ˜ X ]/(f˜) ˜ ] = k(˜ ψ
6σ ˜
Φ - k[ ˜ X ] f˜ ∪ ϕ - k˜
Dabei sind σ und σ˜ die Einsetzungshomomorphismen, erklärt durch σ(g):= g(x) und σ˜ (h) := h(˜x); da f und f˜ Minimalpolynome von x und x˜ sind, folgt Ker σ = (f ) und Ker σ˜ = (f˜). Ist ψ := σ˜ ◦ Φ, so ist ψ(f ) = σ ˜ (f˜) = f˜(˜ x) = 0 ,
also folgt Ker σ ⊂ Ker ψ und nach dem Faktorisierungssatz aus II 2.4 gibt es genau einen Homomorphismus ϕˆ mit ψ = ϕˆ ◦ σ. Also ist ϕ(x) ˆ = ψ(X) = σ ˜ (Φ(X)) = σ ˜ (X) = x ˜.
Da k[ x ] ein Körper ist, muss ϕˆ als nicht trivialer surjektiver Homomorphismus auch injektiv sein (Bemerkung f in II 1.3). 2 Umgekehrt ist es leicht zu sehen, dass jede Fortsetzung eines Körperisomorphismus die Nullstellen zusammengehöriger Polynome respektiert.
Bemerkung morphismus
und eine Fortsetzung
ein beliebiges Polynom und auch
˜ ⊃ k˜, ein IsoK ⊃ k und K ˜ von ϕ. Ist dann f ∈ k[ X ] ψ:K→K ˜ X ], so gilt für jedes x ∈ K mit f (x) = 0 f˜ := Φ(f ) ∈ k[
Gegeben seien Körpererweiterungen
ϕ : k → k˜
f˜(ψ(x)) = 0.
Ist insbesondere
K⊃k
eine Körpererweiterung,
ψ:K→K und
f ∈ k[ X ],
so permutiert
ψ|k = idk ,
Automorphismus mit
ψ
die Nullstellen von
f
in
K.
267
2.3 ZERFÄLLUNGSKÖRPER EINES POLYNOMS
Beweis
Es gilt f˜(ψ(x)) = ψ(f (x)), da ψ eine Fortsetzung von ϕ ist. Sicherheitshalber schreiben wir das ausführlich auf:
f = a0 + a1 X + . . . + an X n ⇒ f˜ = ϕ(a0 ) + ϕ(a1 )X + . . . + ϕ(an )X n , also f˜(ψ(x)) = ϕ(a0 ) + ϕ(a1 )ψ(x) + . . . + ϕ(an )ψ(x)n = ψ(a0 ) + ψ(a1 x) + . . . + ψ(an xn ) = ψ(f (x)). 2 Ein wohlbekanntes Beispiel ist die komplexe Konjugation: Ist f ∈ R[ X ], so ist für z ∈ C
f (z) = a0 + a1 z + . . . + an z n = a0 + a1 z + . . . + an z n = f (z) . Also folgt f (z) = 0 aus f (z) = 0, da 0 = 0.
2.3 Zerfällungskörper eines Polynoms Nach den Vorbereitungen in den vorhergehenden Abschnitten kommen wir nun zu dem zentralen Ergebnis, dass man einem Polynom durch eine geeignete Körpererweiterung zu so vielen Nullstellen verhelfen kann, wie sein Grad vorgibt.
Denition
Ist k ein Körper und f ∈ k[ X ] ein Polynom mit n := deg f ≥ 1, so heiÿt eine Körpererweiterung K ⊃ k ein Zerfällungskörper von f über k , wenn Folgendes gilt: 1) f zerfällt über K in Linearfaktoren, d.h. es gibt a, x1 , . . . , xn ∈ K , so dass
f = a(X − x1 ) · . . . · (X − xn ) . 2) K ist minimal bezüglich Eigenschaft 1), d.h. es gibt keinen Zwischenkörper ˜ K , so dass f über K ˜ zerfällt. k⊂K Anders ausgedrückt:
2 ) Zerfällt f über K , so ist K = k(x1 , . . . , xn ). Man beachte, dass nicht von dem sondern nur von einem Zerfällungskörper die Rede ist. Ganz einfach erhält man einen Zerfällungskörper, wenn ein algebraischer Abschluss k ⊃ k verfügbar ist. Dann zerfällt ein f ∈ k[ X ] {0} über k ,
f = a(X − x1 ) · . . . · (X − xn ) ∈ k[ X ] , und oensichtlich ist K := k(x1 , . . . , xn ) ⊂ k ein Zerfällungskörper von f über k . Hat man keinen algebraischen Abschluss zur Hand, so kann man einen Zerfällungskörper schrittweise durch symbolische Adjunktion von Nullstellen aufbauen.
Satz über Zerfällungskörper n := deg f ≥ 1.
Dann gilt:
Sei
k
ein Körper und
f ∈ k[ X ]
mit
268
III KÖRPERERWEITERUNGEN
a) Es gibt einen Zerfällungskörper K ⊃ k von f über k , dabei ist [K : k] ≤ n! .
b) Sind K ⊃ k und L ⊃ k zwei Zerfällungskörper von f über k , so gibt es einen Isomorphismus ψ : K → L mit ψ | k = idk , der die Nullstellen von f in K auf die Nullstellen von f in L abbildet. Genauer gilt: Ist g ∈ k[ X ] ein irreduzibler Faktor von f , und sind x ∈ K sowie y ∈ L Nullstellen von g , so kann man ψ so wählen, dass ψ(x) = y . Kurz gesagt: Es gibt stets einen Zerfällungskörper und er ist bis auf Isomorphie eindeutig bestimmt.
Beweis a) Wir können annehmen, dass f normiert ist. Es wird ein Körperturm nach folgendem Schema gebaut: f = (X − x1 ) · . . . · (X − xn ).
K k(x1 , . . . , xn−1 ) = kn−1 = kn−2 [ X ]/(gn−1 ) ∪ .. .
k(x1 ) =
f = (X − x1 ) · . . . ·(X − xn−1 ) · fn , .. .
∪ k1
= k0 [ x ]/(g1 )
∪ k0
=
∪ k
f = (X − x1 ) · f2 , f 2 = g 2 · h2 , f = g1 · h 1
Die Bauanleitung ist ziemlich klar. Zunächst wählen wir einen normierten irreduziblen Faktor g1 ∈ k[ X ] von f . Nach dem Satz über die symbolische Adjunktion aus III 2.1 hat g1 im Körper
k1 := k[ X ]/(g1 ) eine Nullstelle x1 := X + (g1 ) , und x1 ist auch Nullstelle von f . Also gilt f = (X − x1 ) · f2 in k1 [ X ] mit deg f2 = n − 1. Da deg g1 ≤ deg f = n, gilt [k1 : k] ≤ n. Im nächsten Schritt wählt man einen irreduziblen Faktor g2 von f2 und erhält im Körper k2 := k1 [ X ]/(g2 ) eine Nullstelle x2 := X + (g2 ) von g1 , also gilt f = (X − x1 )(X − x2 ) · f3 mit deg f3 = n − 2 und [k2 : k1 ] ≤ n − 1. Ist man bei kn−1 angekommen, so ist
f = (X − x1 ) · . . . · (X − xn−1 ) · fn ∈ kn−1 [ X ]
2.3 ZERFÄLLUNGSKÖRPER EINES POLYNOMS
269
mit deg fn = 1, also fn = (X − xn ) mit xn ∈ kn−1 und wir können K := kn−1 setzen. Da ki = k(x1 , . . . , xi ), ist K = k(x1 , . . . , xn ) und damit minimal. Nach dem Gradsatz in III 1.2 ist
[K : k] = [K : kn−2 ] · . . . · [k2 : k1 ] · [k1 : k] ≤ 2 · . . . · (n − 1) · n = n! Es gibt hier zwei Extremfälle: Sind x1 , . . . , xn ∈ k , so sind alle gewählten irreduziblen Faktoren gi linear und [ki+1 : ki ] = 1. Es gibt aber auch Beispiele mit deg gi = n − i, also [ki+1 : ki ] = n − i und [K : k] = n! (siehe etwa Beispiel 6 aus III 1.6). b) Zum Beweis der Eindeutigkeit bis auf Isomorphie vergleichen wir den in a)
konstruierten Zerfällungskörper K mit einem beliebigen Zerfällungskörper L.
Sei
f = (X − x1 ) · . . . · (X − xn ) ∈ K[ X ]
und
f = (X − y1 ) · . . . · (X − yn ) ∈ L[ X ] .
Die schrittweise Konstruktion des Isomorphismus ψ kann durch folgendes Diagramm illustriert werden:
k(x1 , . . . , xn )
=
k(x1 , . . . , xn−1 )
=
=
k(x1 )
=
∪ k2 ∪ k1
ψ
−→ ϕn−1
−→
ϕ2
−→ ϕ1
−→
L
=
k(y1 , . . . , yn )
k˜n−1 ∪ .. .
=
k(y1 , . . . , yn−1 )
=
k˜1 (y2 ) = k(y1 , y2 )
=
k(y1 )
∪ ˜ k2 ∪ k˜1
∪
∪
k(x1 , x2 ) = k1 (x2 )
K kn−1 ∪ .. .
k Der Aufbau von unten nach oben verläuft wie folgt. Ist f = g · h ∈ k[ X ] mit dem vorgegebenen irreduziblen Faktor g und x ∈ K , y ∈ L mit g(x) = g(y) = 0, so wählen wir g1 := g , x1 := x und y1 := y . Nach dem Satz über die Fortsetzung von Körperisomorphismen aus III 2.2, angewandt auf ϕ = idk , gibt es genau einen Isomorphismus
ϕ1 : k(x1 ) → k(y1 )
mit
ϕ1 (x1 ) = y1
und
ϕ1 | k = idk .
Zur Vorbereitung des nächsten Schrittes verwenden wir die Fortsetzung
˜ , von ϕ1 . Φ1 : k1 [ X ] → k˜1 [ X ] , h → h In k1 [ X ] ist f = (X − x1 ) · f2 . Wir wählen einen irreduziblen Faktor g2 ∈ k1 [ X ] von f2 . Dann hat man korrespondierende Zerlegungen
f = (X − x1 ) · g2 · h2 ∈ k1 [ X ]
und
˜ 2 ∈ k˜1 [ X ] . f˜ = (X − y1 ) · g˜2 · h
270
III KÖRPERERWEITERUNGEN
Da g2 irreduzibel und Φ1 ein Isomorphismus ist, ist auch g˜2 irreduzibel. Nun kann man wieder beliebige Nullstellen x ∈ K von g2 und y ∈ L von g˜2 auswählen. Mit x2 := x und y2 := y erhält man eine Fortsetzung
ϕ2 : k1 (x2 ) → k˜1 (y2 ) von ϕ1 mit ϕ2 (x2 ) = y2 . Ist man schlieÿlich bei ϕn−1 angekommen, so ist
f = (X − x1 ) · . . . · (X − xn−1 ) · fn ∈ kn−1 [ X ] und f = (X − y1 ) · . . . · (X − yn−1 ) · f˜n ∈ k˜n−1 [ X ] . Da deg fn = deg f˜n = 1, ist fn = (X − xn ) und f˜n = (X − yn ). Damit ist der Bau vollendet, man kann ψ := ϕn−1 setzen.
2
Die im Beweis von Teil b) benutzte Konstruktion des Isomorphismus ψ zeigt nicht nur die Eindeutigkeit des Zerfällungskörpers. Sie kann auch im Fall L = K angewandt werden und die möglichen Auswahlen in den einzelnen Schritten können einen Überblick über die verschiedenen Automorphismen ϕ von K geben, die auf k die Identität sind. Bei jedem solchen ϕ werden die Nullstellen von f nach der Bemerkung aus III 2.2 permutiert. Damit sind wir am Startpunkt der Galois-Theorie angelangt, nämlich der Frage, welche Permutationen der Nullstellen von f in K zu Automorphismen von K fortgesetzt werden können. Bevor diese Frage in 4 allgemein behandelt werden kann, ist eine technische Vorbereitung nötig. Die Nullstellen x1 , . . . , xn von f in K müssen nicht alle verschieden sein, das heiÿt im Allgemeinen können nur weniger als n Nullstellen permutiert werden. In 3 wird daher zunächst die Vielfachheit von Nullstellen untersucht. Im folgenden Abschnitt 2.4 nehmen wir uns einige Polynome vor, die im Zerfällungskörper K so viele verschiedene Nullstellen haben, wie der Grad angibt, und bestimmen die Gruppe der Automorphismen von K mit Hilfe der Methode des Beweises von Teil b) des obigen Satzes. Das ist ein kräftiger amuse gueule auf die Galois-Theorie. Der Zerfällungskörper eines Polynoms hat zwei weitere vor allem für die GaloisTheorie wichtige Eigenschaften: -
Eine
Stabilität
-
Eine
Zerfällungseigenschaft
unter Monomorphismen. auch für andere Polynome.
Genauer hat man sogar die folgende Für eine endliche Körpererweiterung K ⊃ k sind folgende Bedingungen äquivalent: Charakterisierung von Zerfällungskörpern
i) K ist Zerfällungskörper eines Polynoms f ∈ k[ X ]. ii) Ist K ⊃ K eine Körpererweiterung und ϕ : K → K ein Monomorphismus mit ϕ | k = idk , so folgt ϕ(K) ⊂ K .
271
2.3 ZERFÄLLUNGSKÖRPER EINES POLYNOMS
iii)
g ∈ k[ X ] irreduzibel und K[ X ] in Linearfaktoren.
Ist
Für die ausgezeichnete Eigenschaft passende Adjektiv normal üblich. Beweis
i)
⇒
ii)
hat
iii)
g
eine Nullstelle
y ∈ K,
so zerfällt
g
in
der Erweiterung K ⊃ k ist das wenig
Sind x1 , . . . , xn die Nullstellen von f in K , so ist
K = k(x1 , . . . , xn ) . Da f (ϕ(xi )) = ϕ(f (xi )) = 0 (Bemerkung aus III 2.2), ist ϕ(xi ) ∈ K , also ϕ(K) ⊂ K . ii) ⇒ iii) Die Erweiterung K ⊃ k ist endlich, also gibt es über k algebraische Elemente z1 , . . . zm ∈ K , so dass
K = k(y, z1 , . . . , zm ) . Ist g normiert, so ist es Minimalpolynom von y ; mit h1 , . . . , hm ∈ k[ X ] bezeichnen wir die Minimalpolynome von z1 , . . . , zm . Nun betrachten wir
f := g · h1 · . . . · hm und seinen Zerfällungskörper K ⊃ k ; oensichtlich ist k ⊂ K ⊂ K ein Zwischenkörper. Ist y ∈ K irgendeine Nullstelle von g , so genügt es, y ∈ K zu zeigen. Dazu wenden wir Teil einen Isomorphismus
b)
des Satzes über Zerfällungskörper auf K an, wir erhalten
ψ : K → K
mit
Ist ϕ := ψ | K , so folgt nach iii)
⇒
i)
ii)
ψ | k = idk
und
ψ(y) = y .
, dass ϕ(K) ⊂ K , also y = ψ(y) = ϕ(y) ∈ K .
Da K ⊃ k endlich ist, gibt es über k algebraische x1 , . . . , xn ∈ K mit
K = k(x1 , . . . , xn ) . Sind f1 , . . . , fn ∈ k[ X ] die Minimalpolynome von x1 , . . . , xn , so zerfallen sie wegen in K[ X ], also ist K ⊃ k Zerfällungskörper von
iii)
f := f1 · . . . · fn ∈ k[ X ] . 2
272
III KÖRPERERWEITERUNGEN
2.4 Beispiele
Beispiel 1
Das Polynom f = X 2 + 1 ∈ Q[ X ] ist irreduzibel, denn für jedes x ∈ Q ist x ≥ 0. Den schon bekannten Zerfällungskörper 2
i
i
Q( ) = {a + b ∈ C : a, b ∈ Q} ⊂ C wollen wir durch symbolische Adjunktion noch einmal auf etwas abstraktere Weise neu konstruieren. Wir wissen nach III 2.1, dass
x := X + (X 2 + 1) ∈ Q[ X ]/(X 2 + 1) =: K eine Nullstelle von f ist. Das kann man noch einmal direkt nachrechnen:
x2 = X 2 + (X 2 + 1) = −1 + (X 2 + 1) , denn X 2 − (−1) ∈ (X 2 + 1) .
i
i
Ob man nun x mit oder mit − identizieren soll, ist nicht klar; in der Tat sind beide Möglichkeiten gleichberechtigt. Denn ist x1 = x und x2 := −x ∈ K , so ist auch x2 Nullstelle von f , weil
(−x)2 = (−X)2 + (X 2 + 1) = X 2 + (X 2 + 1) = −1 + (X 2 + 1) ∈ K . Oensichtlich ist K = Q(x1 ) = Q(x2 ) und nach III 2.2 gibt es genau einen Automorphismus
ψ:K→K
ψ | Q = idQ
mit
und
ψ(x1 ) = x2 .
Dabei ist zu bedenken, dass Q als Primkörper nach III 1.1 nur die Identität als Automorphismus zulässt. Daher gibt es auch zwei verschiedene Isomorphismen
i
ϕ1 , ϕ2 : K → Q( )
bestimmt durch
i
i
ϕ | Q = idQ , ϕ1 (x1 ) = , ϕ2 (x1 ) = − .
i
In Q( ) betrachtet, ist ψ beschrieben durch die komplexe Konjugation
i
i
a + b → a − b . Diese schon von Cauchy benutzte Beschreibung der komplexen Zahlen als Restklassen von Polynomen modulo X 2 +1 hat gegenüber der Beschreibung von Gauss als Punkte der Zahlenebene den Vorteil, die Verallgemeinerung durch symbolische Adjunktion bei beliebigen irreduziblen Polynomen vorbereitet zu haben.
√ Das Polynom f = X 2 − 2 ∈ Q[ X ] ist irreduzibel,√denn 2 ∈ R+ ist irrational. Man hat wieder den konkreten Zerfällungskörper Q( 2) ⊂ R und einen abstrakten Zerfällungskörper
Beispiel 2
K := Q[ X ]/(X 2 − 2)
mit
x1 := X + (X 2 − 2)
und
x2 := −x1
273
2.4 BEISPIELE
als Nullstellen von f . Analog zu Beispiel 1 gibt es einen Automorphismus
ψ:K→K
mit
ψ | Q = idQ
und
ψ(x1 ) = x2 ;
√
in Q( 2) ⊂ R betrachtet, erhält man daraus den Automorphismus √ √ √ √ ϕ : Q( 2) → Q( 2) mit ϕ | Q = idQ und ϕ( 2) = − 2 . Man beachte, dass dieses ϕ in R betrachtet völlig √ √ unstetig ist: Beliebig √ nahe bei 2 liegende rationale Zahlen bleiben fest, aber 2 > 0 geht nach − 2 < 0.
Beispiel 3
Ein Zerfällungskörper von
√ √ f := X 4 − 5X 2 + 6 = (X 2 − 2)(X 2 − 3) ∈ Q[ X ] ist L := Q( 2, 3) ⊂ R . √ √ Dabei sind 2, 3 ∈ R die reellen positiven Wurzeln; L ist als Unterkörper von R ein konkreter Zerfällungskörper. Mit der Konstruktion aus III 2.3 kann man ohne Benutzung von R einen abstrakten Zerfällungskörper K von f über Q konstruieren. Wir starten mit dem irreduziblen Faktor g1 = X 2 − 2 von f , dann ist
k1 = Q[ X ]/(X 2 − 2)
und
x1 := X + (X 2 − 2) ∈ k1
eine Nullstelle von g1 und damit von f . Es ist
f = (X − x1 )(X + x1 )(X 2 − 3) , denn (−x1 )2 = x21 = 2 . Also kann man g2 := (X + x1 ) und x2 = −x1 wählen, d.h.
k2 = Q(x1 , x2 ) = Q(x1 ) = k1 . 2 Im nächsten Schritt ist f3 = √X − 3 ∈ k √1 [ X ]. Wie wir in Beispiel 4 aus III 1.6 gesehen haben, ist f3 wegen 2 ∈ / Q und 3 ∈ / Q in k1 [ X ] irreduzibel. Mit g3 = f3 erhält man k3 = k2 [ X ]/(g3 ) , und x3 := X + (g3 ) ∈ k3
ist Nullstelle von g3 und damit von f . Schlieÿlich ist
f = (X − x1 )(X − x2 )(X − x3 )(X + x3 ) , also x4 = −x3 und K := Q(x1 , x3 ) ist ein Zerfällungskörper von f über Q. Nun zu den möglichen Isomorphismen von K und L. Für √ ϕ1 : k1 = Q(x1 ) → Q( 2) gibt es entsprechend der Konstruktion aus III 2.3 zwei Möglichkeiten: √ √ √ √ ϕ1 (x1 ) = 2 und ϕ1 (x2 ) = − 2 oder ϕ˜1 (x1 ) = − 2 und ϕ˜1 (x2 ) = 2 .
274
III KÖRPERERWEITERUNGEN
Analog hat man für die Fortsetzungen
√ √ ϕ3 : k3 = k1 (x3 ) → Q( 2, 3)
unabhängig von der Auswahl für ϕ1 wieder zwei Möglichkeiten √ √ √ √ ϕ3 (x3 ) = 3 und ϕ3 (x4 ) = − 3 oder ϕ˜3 (x3 ) = − 3 und ϕ˜3 (x4 ) = 3 . Insgesamt gibt es also vier Möglichkeiten, einen Isomorphismus
ψ:K→L aufzubauen. Dementsprechend gibt es vier Automorphismen von K (und analog von L) mit folgenden Bildern, wobei die erste Spalte die identische Abbildung von K bedeutet:
x1
x2
x1
x2
x2
x1
x2
x1
x3
x3
x4
x4
x4
x4
x3
x3
Andere Automorphismen von K gibt es nicht, da jeder Automorphismus die Nullstellen permutieren muss und
ψ(x1 ) = x3
wegen
ψ(x1 )2 = 2 = 3 = x23
unmöglich ist. Die Gruppe der Automorphismen von K ist also isomorph zu Z2 × Z2 , der Kleinschen Vierergruppe.
Beispiel 4
Wir betrachten f := X 3 − 2 ∈ Q[ X ] und seinen Zerfällungskörper
K := Q(b, bζ) ⊂ C
mit
b=
√ 3
2∈R
und
ζ = exp
i
2π ∈C 3
(Beispiel 6 aus III 1.6). Um die Automorphismen von K zu bestimmen, verwenden wir wieder die Methode aus III 2.3. Um die Symmetrien besser deutlich zu machen, setzen wir
x1 = b , x2 = bζ , x3 = bζ 2 , also f = (X − x1 )(X − x2 )(X − x3 ) ∈ K[ X ] . Wir zeigen Folgendes:
Zu jeder Permutation σ ∈ S3 gibt es genau einen Automorphismus ¨r i = 1, 2, 3 . ψ : K → K mit ψ(xi ) = xσ(i) f u
275
2.4 BEISPIELE
Da jeder Automorphismus von K die Nullstellen von f permutieren muss, folgt daraus Aut (K) ∼ = S3 .
Beweis Im ersten Schritt nutzen wir aus, dass x1 und xσ(1) Nullstellen des irreduziblen Polynoms f sind. Daher gibt es einen Isomorphismus ϕ1 : Q(x1 ) → Q(xσ(1) ) . Nun hat man für f die Zerlegungen
f = (X − x1 ) · f2 f = (X − xσ(1) ) · f˜2
f2 = X 2 + x1 X + x21 ∈ Q(x1 )[ X ] und f˜2 = X 2 + xσ(1) X + x2σ(1) ∈ Q(xσ(1) )[ X ] .
mit mit
Da Q(x1 ) ⊂ R und f2 die nicht reellen Nullstellen x2 , x3 ∈ C hat, ist f2 und somit auch f˜2 irreduzibel. f2 hat in K die Nullstellen x2 , x3 , die Nullstellen von f˜2 sind xσ(2) , xσ(3) . Im zweiten Schritt mit g2 = f2 konstruiert man eine Fortsetzung
ϕ2 : Q(x1 , x2 ) → Q(xσ(1) , xσ(2) )
mit
ϕ2 (x2 ) = xσ(2)
von ϕ1 . Da K = Q(x1 , x2 ) folgt ϕ2 (x3 ) = xσ(3) und ψ := ϕ2 ist der gesuchte Automorphismus. Von den sechs möglichen Automorphismen wollen wir zwei näher ansehen. Ist ψ(x1 ) = x1 ,ψ(x2 ) = x3 und ψ(x3 ) = x2 , so ist ψ die Einschränkung der komplexen Konjugation, also stetig nach C fortsetzbar. Ist dagegen ψ(x1 ) = x2 , ψ(x2 ) = x3 und ψ(x3 ) = x1 , so folgt
ψ(ζ) = ψ
bζ ψ(bζ) bζ 2 = = =ζ. b ψ(b) bζ
Dieser Automorphismus hat keine stetige Fortsetzung nach C.
Beispiel 5
2
Sei p eine Primzahl,
f := X p−1 + X p−2 + . . . + X + 1 ∈ Q[ X ]
und
ζ := exp
i
2π ∈C. p
Nach Beispiel 5 aus III 1.6 ist f Minimalpolynom von ζ über Q. Da
f = (X − ζ) · (X − ζ 2 ) · . . . · (X − ζ p−1 ) ∈ Q(ζ)[ X ] , ist Q(ζ) Zerfällungskörper von f über Q, es gilt
[Q(ζ) : Q] = deg f = p − 1 . In diesem Fall ist also der Turmbau aus III 2.3 zur Konstruktion des Zerfällungskörpers schon nach dem ersten Schritt vollendet. Durch diesen einen Schritt sind auch die Automorphismen von Q(ζ) festgelegt: Zu jeder Potenz r ∈ {1, . . . , p − 1} gibt es genau einen Automorphismus
ψr : Q(ζ) → Q(ζ)
mit
ψr (ζ) = ζ r ,
276
III KÖRPERERWEITERUNGEN
und jeder Automorphismus von Q(ζ) muss die Nullstellen von f permutieren. Also ist ord Aut (Q(ζ)) = p − 1. Genauer gilt: 2πi Ist p eine Primzahl und ζ = exp p , so ist die Gruppe Aut (Q(ζ)) zyklisch von der Ordnung p − 1. Zum
Beweis
betrachten wir den Gruppenhomomorphismus
ϕ : (Z, +) → (C× , ·) Es ist
mit
ϕ(r) = exp
Im ϕ = {1, ζ, . . . , ζ p−1 } =: Cp ⊂ C
und
2π ir . p
Ker ϕ = pZ .
Also ergibt ϕ einen Isomorphismus von zyklischen Gruppen
ϕ : Zp → Cp , r + pZ → ζ r . Da p eine Primzahl ist, ist Zp = Fp ein Körper mit der Einheitengruppe × F× p = Fp {0} und nach II 1.11 ist Fp zyklisch von der Ordnung p − 1. Es genügt also zu bemerken, dass durch
F× p → Aut (Q(ζ)) , r + pZ → ψr , für r = 1, . . . , p − 1 ein Gruppenisomorphismus gegeben ist. Diese Abbildung ist wie oben erklärt bijektiv, sie ist auch ein Homomorphismus, da
ψs (ψr (ζ)) = ψs (ζ r ) = (ζ r )s = ζ r·s .
2
Man beachte dabei, dass die Teilmenge Cp ⊂ C ein Körper, aber kein Unterkörper von C ist!
2.5 Der algebraische Abschluss ∗ Nach III 1.8 hat jeder Unterkörper k ⊂ C einen algebraischen Abschluss k ⊂ C. Für einen endlichen Körper konstruieren wir in III 3.6 einen (unendlichen) algebraischen Abschluss. Für manche theoretische Überlegungen ist es nützlich, oder zumindest bequem, die Existenz eines algebraischen Abschlusses für jeden beliebigen Körper, etwa einen Funktionenkörper k(X), benutzen zu können. Das Problem beim Beweis ist die Allgemeinheit der Situation, er muss für alle nur denkbaren Körper gültig sein; die Menge aller Körpererweiterungen ist unüberschaubar, isomorphe Erweiterungen müssen identiziert werden. Der erste Existenzbeweis für einen algebraischen Abschluss stammt von Steinitz [St, 21], er benutzt eine transnite Induktion, d.h. den Bau eines Körperturms von unermesslicher Höhe. Wir reproduzieren hier einen formal sehr viel einfacheren Beweis von E. Artin.
Theorem
Jeder Körper
algebraischen Abschluss
k besitzt k ⊃ k.
einen bis auf Isomorphie eindeutig bestimmten
2.5 DER ALGEBRAISCHE ABSCHLUSS∗
277
Artin
Der Trick von besteht darin, jedem nicht konstanten Polynom f ∈ k[ X ] eine eigene Unbestimmte Xf zuzuordnen. Dazu muss zunächst der in II 1.10 eingeführte Polynomring in endlich vielen Unbestimmten verallgemeinert werden. Wir starten mit einem Ring R (kommutativ mit 1), einer beliebigen Indexmenge I und verallgemeinern die in II 1.10 im Spezialfall I = {1, . . . , n} beschriebene Konstruktion. Zunächst erklären wir die Menge
X := {x : I → N : x(i) = 0 für fast alle i ∈ I} der primitiven Monome . Mit der Addition von Abbildungen wird X zu einer abelschen Halbgruppe. Wie üblich stellt man ein Monom multiplikativ dar als x(i) x= Xi = Xir11 · . . . · Xirnn , wenn rj = x(ij ) i∈I
die endlich vielen von Null verschiedenen Werte von x sind. Um die primitiven Monome mit Koezienten aus R zu versehen, bildet man den Halbgruppenring
R[ X ] := {f : X → R : f (x) = 0 für fast alle x ∈ X} . Dann heiÿt ar1 ...rn := f (x) Koezient des primitiven Monoms x = Xir11 · . . . · Xirnn , der Term f (x) · x heiÿt Monom . Zu jedem f ∈ R[ X ] gibt es daher eine endliche Teilmenge {i1 , . . . , in } ⊂ I und eine Darstellung
ar1 ...rn Xir11 · . . . · Xirnn , f= (r1 ,...,rn )∈Nn
wobei nur endlich viele der Koezienten ar1 ...rn ∈ R von Null verschieden sind. Für ein weiteres Polynom g ∈ R[ X ] hat man eine Teilmenge {j1 , . . . , jm } ⊂ I , für f + g und f · g benötigt man die wieder endliche Teilmenge {i1 , . . . , in } ∪ {j1 , . . . , jm } ⊂ I . Suggestiver ist die Notation
R[ I ] := R[ X ] für den Polynomring in I über R. Selbstverständlich gehören zu zwei Polynomen f, g im Allgemeinen verschiedene endliche Teilmengen I1 und I2 von I . Zur Darstellung von f + g und f · g benutzt man I1 ∪ I2 . Für jedes i ∈ I ist das primitive Monom Xi = Xi1 in R[ I ] enthalten, also kann man I ⊂ R[ I ] als Teilmenge betrachten. Wie im Fall einer Veränderlichen hat man eine universelle Eigenschaft:
278
III KÖRPERERWEITERUNGEN
Gegeben seien ein kommutativer Ring S mit 1, ein Homomorphismus ϕ : R → S und für jedes i ∈ I ein Element si ∈ S . Dann gibt es genau einen Homomorphismus Φ : R[ I ] → S mit Φ | R = ϕ und Φ(Xi ) = si für alle i ∈ I . Nach diesen Vorbereitungen sind wir startbereit zum
Beweis des Theorems.
Im ersten Schritt zeigen wir, dass es einen algebraischen Erweiterungskörper K ⊃ k gibt, in dem jedes Polynom f ∈ k[ X ] eine Nullstelle besitzt. Nun kann man jedem nicht konstanten Polynom zunächst seine individuelle Unbestimmte und dann durch symbolische Adjunktion seine Nullstelle zu verschaen. Formal verwendet man die Indexmenge
I := {f ∈ k[ X ] : deg f ≥ 1} der nicht konstanten Polynome und im Polynomring k[ I ] betrachtet man die Polynome f (Xf ). Man beachte, dass jedes solche f (Xf ) nur von der einen Unbestimmten Xf abhängt. Das von allen erzeugte Ideal ist a := (f (Xf ))f ∈I ⊂ k[ I ] . Ist a = k[ I ], was wir anschlieÿend zeigen werden, so gibt es nach II 2.15 ein maximales Ideal m ⊂ k[ I ] mit
a ⊂ m ⊂ R[ I ]
und
K := k[ I ]/m
ist ein Körper.
Da m ∩ k = {0}, kann man k ⊂ K als Unterkörper ansehen. Ist nun f ∈ I , so ist
f (Xf ) ∈ m , also f (Xf + m) = f (Xf ) + m = 0 + m . Also hat f in K die Nullstelle xf := Xf +m, wie bei der symbolischen Adjunktion in III 2.1. Da K von den über k algebraischen Elementen xf erzeugt wird, kann man mit Hilfe des Lemmas aus III 1.7 sehen, dass K ⊃ k algebraisch ist. Angenommen, es wäre a = k[ I ]. Dann gäbe es eine Darstellung
1=
m
gj · fj (Xfj )
mit g1 , . . . , gm ∈ k[ I ]
und
f1 , . . . , fm ∈ I .
j=1
Nach III 2.1 gibt es einen Erweiterungskörper L ⊃ k in dem jedes fj eine Nullstelle xj hat. Wir betrachten den Homomorphismus
Φ : k[ I ] → L
mit
⎧ ⎪ ⎨ Φ | k = idk , Φ(Xfj ) = xj für j = 1, . . . , m , ⎪ ⎩ Φ(Xf ) = 0 für f ∈ / {f1 , . . . , fm } .
279
2.5 DER ALGEBRAISCHE ABSCHLUSS∗
Dann wäre aber in L
1 = Φ(1) =
m
Φ(gj )fj (xj ) = 0 .
j=1
Da wir die mit Hilfe des Lemmas von Zorn bewiesene Existenz eines maximalen Ideals benutzt haben, ist hinter diesem ersten und entscheidenden Schritt eine transnite Induktion verborgen. Im zweiten Schritt muss eine Erweiterung k ⊃ K konstruiert werden, derart dass nicht nur jedes f ∈ k[ X ], sondern sogar jedes f ∈ k[ X ] eine Nullstelle hat. Dazu genügt eine abzählbare Körperkette
k ⊂ K1 ⊂ K2 ⊂ . . . ⊂ k :=
∞
Ki .
i=1
Dabei ist K1 = K und als Ergebnis des ersten Schrittes und Ki+1 ⊃ Ki nach der Methode des ersten Schrittes so konstruiert, dass jedes f ∈ Ki [ X ] in Ki+1 eine Nullstelle hat. Oensichtlich ist k ein Körper; die Erweiterung k ⊃ k ist algebraisch, da Ki ⊃ k für jedes i algebraisch ist. Ist nun f ∈ k[ X ], so gibt es ein i derart, dass die endlich vielen Koezienten in Ki liegen, also ist sogar f ∈ Ki [ X ]. Da f in Ki+1 ⊂ k eine Nullstelle hat, folgt dass k ⊃ K ein algebraischer Abschluss ist. Zum Beweis der Eindeutigkeit von k bis auf Isomorphie benutzen wir folgenden
Einbettungssatz
Ist
k⊃k
ein algebraischer Abschluss und
K ⊃k
eine alge-
braische Erweiterung, so gibt es einen Monomorphismus
ϕ:K→k
mit
ϕ | k = idk .
Man kann also jede algebraische Erweiterung als Teil des algebraischen Abschlusses ansehen. Ist K ⊃ k ein weiterer algebraischer Abschluss, so gibt es nach dem Einbettungssatz einen Monomorphismus ϕ : K → k . Wir betrachten den Zwischenkörper
k ⊂ ϕ(K) ⊂ k . Als isomorphes Bild von K ist ϕ(K) algebraisch abgeschlossen, die Erweiterung k ⊃ ϕ(K) ist algebraisch; also muss ϕ(K) = k sein. Damit ist das Theorem bewiesen. 2 Zum Beweis des Einbettungssatzes könnte man versuchen, wie in III 2.3 von k ausgehend, schrittweise den gesuchten Monomorphismus ϕ aufzubauen. Da aber die Zahl der Schritte nicht abzusehen ist, geht es wieder eleganter mit dem Lemma von Zorn. Es wird sich zeigen, dass damit eine einzige Fortsetzung ausreicht.
280
III KÖRPERERWEITERUNGEN
Wir verwenden die Menge von Paaren k ⊂ L ⊂ K ist Zwischenkörper und M := (L, ϕ) : ist Monomorphismus mit ϕ | k = id . ϕ:L→k In M ist eine Halbordnung gegeben durch (L, ϕ) ≤ (L , ϕ ) ⇔ L ⊂ L und ϕ | L = ϕ . Um zu zeigen, dass M induktiv geordnet ist, betrachten wir eine Kette C ⊂ M und wir denieren k
L∗ :=
L⊂K.
(L,ϕ)∈C
Die Vorschrift (L, ϕ) ∈ C soll bedeuten, dass es zu L ein ϕ gibt, derart, dass (L, ϕ) ∈ C . Zunächst ist zu zeigen, dass L ⊂ K ein Unterkörper ist. Sind x, y ∈ L , so gibt es (L, ϕ) und (L , ϕ ) ∈ C , so dass x ∈ L und y ∈ L . Wegen der Ketteneigenschaft können wir annehmen, dass x L ⊂ L , also x, y ∈ L und x − y, ∈ L ⊂ L . y Ist x ∈ L , so gibt es ein (L, ϕ) ∈ C mit x ∈ L. Aus der Kettenbedingung folgt wieder, dass die Abbildung ∗
∗
∗
∗
ϕ∗ : L∗ → k , x → ϕ(x) ,
unabhängig von der Auswahl von (L, ϕ) ∈ C erklärt, und ein Monomorphismus mit ϕ | k = id ist. Also ist (L , ϕ ) ∈ M obere Schranke von C . Nach dem Lemma von Zorn gibt es in M ein maximales Element (K , ψ). Es bleibt zu zeigen, dass K = K . Angenommen K K ; dann betrachten wir folgendes Diagramm: ∗
k
∗
∗
K ∪
ˆ ψ
K (x) ∪
−→
K ∪ k
−→
ψ
=
−→
k ∪ ˜ (y) K ∪ ˜ = ψ(K ) K ∪ k
Dabei ist x ∈ K K . Da K ⊃ K algebraisch ist, hat x ein Minimalpolynom f ∈ K [ X ]. Nun wenden wir den Fortsetzungssatz aus III 2.2 an. Ist f˜ ∈ K˜ [ X ] das aus f durch ψ entstandene Polynom, so hat f˜ eine Nullstelle ˆ y in k und es gibt eine Fortsetzung ψˆ von ψ mit ψ(x) = y . Das ist aber ein 2 Widerspruch zur Maximalität von (K , ψ).
281
3. EINFACHE UND MEHRFACHE NULLSTELLEN
3 Einfache und mehrfache Nullstellen Wie wir in 2 gesehen haben, permutieren Körperautomorphismen die Nullstellen von Polynomen (Bemerkung in III 2.2). Nahe liegend ist die Frage, welche Permutationen sich zu einem Automorphismus fortsetzen lassen. Dabei entsteht ein technisches Problem durch mehrfache Nullstellen. In diesem Paragraphen geben wir Hilfsmittel an, wie man damit umgehen kann. Höhepunkt sind die klassischen Ergebnisse über Resultanten und Diskrimanten. Als Anwendungen beweisen wir einen Struktursatz über endliche Körper, sowie den Satz vom primitiven Element.
3.1 Vielfachheit von Nullstellen und formale Ableitung Sei f ∈ k[ X ] und K ⊃ k ein Zerfällungskörper. Ist n = deg f , so ist
f = a(X − x1 ) · . . . · (X − xn ) ∈ K[ X ] . Die Nullstellen x1 , . . . , xn müssen keineswegs verschieden sein, es kann mehrfache Nullstellen geben. Allgemein erklärt man für ein beliebiges x ∈ K
μ(f ; x) := max{r ∈ N : (X − x)r teilt f in K[ X ]} die
Vielfachheit von x bezüglich f . In K[ X ] gilt dann f = (X − x)μ(f ;x) · g
mit
g(x) = 0 .
In der Terminologie von II 3.6 ist μ(f ; x) der Exponent von (X − x) in f . Oensichtlich gilt f (x) = 0 ⇔ μ(f ; x) ≥ 1 . Man nennt x ∈ K
einfache Nullstelle von f ⇔ μ(f ; x) = 1 und mehrfache Nullstelle von f ⇔ μ(f ; x) ≥ 2 . Aus der Analysis weiÿ man, dass mehrfache Nullstellen durch die Ableitung charakterisiert werden können. Diese Methode versucht man in der Algebra formal zu imitieren. Für ein Polynom f = an X n + . . . + ar X r + . . . + a1 X + a0 ∈ k[ X ] ist die erklärt durch
Ableitung
formale
f := n · an X n−1 + . . . + r · ar X r−1 + . . . + a1 ∈ k[ X ] . Die Tücke dabei ist die folgende: Der Exponent r von X r ist eine natürliche Zahl; dagegen ist der Koezient r · ar von rar X r−1 ein Element von k , und falls die Charakteristik p von k ein Teiler von r ist, wird rar = 0 in k .
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9_13, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
282
III KÖRPERERWEITERUNGEN
Zunächst einfache Regeln für den Umgang mit der Ableitung
Rechenregel
Für die formale Ableitung
k[ X ] → k[ X ], f → f ,
und
(f · g) = f · g + f · g
(af + bg) = af + bg
gilt
für alle f, g ∈ k[ X ] und a, b ∈ k. Der Beweis der ersten Regel ist klar; sie besagt, dass die Ableitung ein Endomorphismus des Vektorraums k[ X ] ist. Daher genügt es, die zweite Regel für Paare X m , X n von Basisvektoren zu beweisen:
(X m · X n ) = (m + n)X m+n−1 = (X m ) X n + X m (X n ) . Man kann die Ableitung r-mal wiederholen, dafür schreibt man wie in der Analysis f (r) . Wie dort gilt:
Bemerkung
Ist char (k) = 0, so folgt μ(f ; x) = max{r : f (x) = . . . = f (r−1) (x) = 0} .
Denn ist f = (X − x)μ g mit g(x) = 0, so ist
f (r) = μ(μ − 1) · . . . · (μ − r + 1)(X − x)μ−r · g + (X − x) · hr mit hr ∈ k[ X ].
2
Zum Glück gilt eine Abschwächung davon bei beliebiger Charakteristik:
Lemma
Dann gilt:
Sei k ein beliebiger Körper, f ∈ k[ X ] und f (x) = 0 für ein x ∈ K ⊃ k. μ(f ; x) = 1 ⇔ f (x) = 0
und
μ(f ; x) ≥ 2 ⇔ f (x) = 0 .
Beweis
Da f (x) = 0, ist μ(f ; x) ≥ 1 und f = (X − x) · g mit g ∈ K[ X ]. Dierentiation ergibt
f = g + (X − x)g , also f (x) = g(x) . Da μ(f ; x) ≥ 2 ⇔ g(x) = 0, folgen die beiden Behauptungen. Man beachte, dass bei der Dierentiation von f nur der Exponent 1 von X nach unten kommt, der ist ungefährlich! 2 In den bisherigen elementaren Überlegungen musste man den Zerfällungskörper kennen, um festzustellen, ob es mehrfache Nullstellen gibt. Mit Hilfe des obigen Lemmas kann man die Existenz einer mehrfachen Nullstelle schon in k[ X ] prüfen:
Satz
Sei k ein Körper und Aussagen äquivalent:
f ∈ k[ X ]
mit
deg f ≥ 1.
Dann sind folgende
3.1 VIELFACHHEIT VON NULLSTELLEN UND FORMALE ABLEITUNG
i)
f
hat in einem Erweiterungskörper
K⊃k
283
mindestens eine mehrfache Null-
stelle. ii)
f
und
f
haben in
k[ X ]
einen gemeinsamen Teiler
g
mit
deg g ≥ 1.
Ob f und f in k[ X ] einen echten gemeinsamen Teiler haben, kann man mit Hilfe des Euklidischen Algorithmus zur Bestimmung des gröÿten gemeinsamen Teilers entscheiden. Eine Alternative dazu ist die Berechnung der Diskriminante (III 3.10). Beweis des Satzes i) ⇒ ii) Ist x ∈ K mehrfache Nullstelle von f , so ist f (x) = f (x) = 0. Also ist das Minimalpolynom fx ∈ k[ X ] von x gemeinsamer Teiler von f und f . ii)
ist
⇒
i)
g hat in einem Erweiterungskörper K ⊃ k eine Nullstelle x ∈ K . Daher f (x) = f (x) = 0 , 2
also x mehrfache Nullstelle von f .
Für zwei Polynome f, g ∈ k[ X ] kann man den normierten gröÿten gemeinsamen Teiler d = ggT (f, g) ∈ k[ X ] mit Hilfe des Euklidischen Algorithmus berechnen (vgl.I 3.13). Mit Hilfe eines Zerfällungskörpers K ⊃ k von f · g kann man d auch etwas anders beschreiben. Zunächst setzen wir voraus, dass f und g normiert sind. In K[ X ] zerfallen f und g in Linearfaktoren. Wir betrachten die paarweise verschiedenen gemeinsamen Nullstellen x1 , . . . , xm von f und g und denieren
μi := min{μ(f ; xi ), μ(g; xi )} ≥ 1 , d˜ := (X − x1 )μ1 · . . . · (X − xm )μm ∈ K[ X ] . In K[ X ] ist dann f = d˜ · f˜ und g = d˜ · g˜, f˜ und g˜ haben keine gemeinsamen Nullstellen mehr. Somit ist d˜ ein normierter gröÿter gemeinsamer Teiler von f und g in K[ X ]. Wir behaupten nun
d = d˜ , insbesondere d˜ ∈ k[ X ] . Diese auf den ersten Blick überraschende Gleichheit folgt aus der allgemeinen ˜ ⊃ k. Gegeben seien Polynome f, g ∈ k[ X ] und eine Körpererweiterung k
Regel
Es seien
d = ggT (f, g)
in
k[ X ]
und
normierte gröÿte gemeinsame Teiler. Dann
˜ X] d˜ = ggT (f, g) in k[ ˜, insbesondere d˜ ∈ k[ X ]. gilt d = d
˜ X ] gemeinsamer Teiler von f und g ist, folgt d | d˜. Da d auch in k[ Andererseits gibt es nach der Relation von Bézout (II 3.6) Polynome p, q ∈ k[ X ], so dass d = pf + qg . ˜ Diese Relation hat man auch in k[ X ], dort gilt d˜ | f und d˜ | g , also d˜ | d. Da d und d˜ normiert sind, folgt d = d˜. 2 Beweis
Diese Regel wird in Beispiel 1 aus III 3.5 angewandt.
284
III KÖRPERERWEITERUNGEN
3.2 Separabilität Mit den im vorhergehenden Abschnitt bereitgestellten Hilfsmitteln können wir nun die kritische Frage Kann ein irreduzibles Polynom in einem Erweiterungskörper mehrfache Nullstellen haben?
näher beleuchten. Die Antwort wird sein: Ja, aber selten!
Zur Vereinfachung der Formulierungen nennt man ein Polynom f ∈ k[ X ] separabel , wenn jeder irreduzible Faktor g ∈ k[ X ] von f in seinem Zerfällungskörper nur einfache Nullstellen hat. (Diese Terminologie ist nicht ganz einheitlich. Manchmal wird verlangt, dass das ganze Polynom f nur einfache Nullstellen hat.) Eine erste Antwort auf die oben formulierte Frage ist das
Lemma
Ist
k
ein Körper und
f
f ∈ k[ X ]
separabel
irreduzibel, so gilt:
⇔
f = 0 .
Die Voraussetzung irreduzibel ist wichtig, wie etwa die Beispiele f = X p ∈ Fp [ X ] und f = g · h mit g, h irreduzibel, g = 0 und h = 0 zeigen. Beweis
Wir benutzen die Ergebnisse des vorhergehenden Abschnitts III 3.1.
⇒ Ist f = 0, so ist auch f (x) = 0 für jede Nullstelle von f , also ist f nicht separabel. ⇐ Wäre f = 0 und f nicht separabel, so gäbe es einen gemeinsamen Teiler g von f und f mit deg g ≥ 1. Da f irreduzibel ist und deg f < deg f , ist das nicht möglich. 2
Korollar
Ist
char (k) = 0,
so ist jedes nicht konstante
f ∈ k[ X ]
separabel.
Sei g ein irreduzibler Faktor von f . Da deg g ≥ 1, ist deg g = 2 (deg g) − 1 ≥ 0, also g = 0.
Beweis
Im Fall Charakteristik Null ist also der Begri der Separabilität überüssig. Anders in Charakteristik p: Ist etwa char (k) = p und
f := X p − a ∈ k[ X ] , so ist f = pX p−1 = 0 . Wir werden sehen, dass es Beispiele für a ∈ k gibt, so dass f irreduzibel ist. Dann ist f nach dem obigen Lemma nicht separabel.
285
3.3 DER FROBENIUS-HOMOMORPHISMUS
3.3 Der Frobenius-Homomorphismus In diesem Abschnitt beschäftigen wir uns mit der Frage der Separabilität in Charakteristik p > 0. Dazu eine erste
Bemerkung
Ist
k
ein Körper mit
f = 0 ⇔
Beweis
char (k) = p > 0,
es gibt ein
g ∈ k[ X ]
mit
so gilt für jedes
f ∈ k[ X ]:
f = g(X p ) .
Sei f = a0 + a1 X + . . . + an X n . Dann ist
f = 0 ⇔ p | i falls ai = 0 ⇔ f = a0 + ap X p + a2p X 2p + . . . + amp X mp . 2 Ein irreduzibles inseparables Polynom muss also von der Form f (X) = g(X p ) sein. Bleibt die Frage, ob es derartige Polynome gibt, die irreduzibel sind. Dazu betrachten wir die binomische Formel in Charakteristik p > 0: p
(x + y) =
p
p
i
i=0
x
p für i = 1, . . . , p − 1 . y = x + y , denn p | i
p−i p
p
p
Diese Rechenregel (x + y)p = xp + y p nennt man auch freshmens dream, den Traum aller Anfänger. Von einem abstrakteren Standpunkt hat man das
Lemma von Frobenius
In einem Körper
k
der Charakteristik
p>0
ist die
Abbildung
k → k , x → xp , ein Monomorphismus.
Man nennt ihn den
Frobenius-Homomorphismus
von k .
Neben (x + y)p = xp + y p in Charakteristik p > 0, gilt (xy)p = xp y p in jedem Körper. Der Homomorphismus ist nicht trivial, da 1p = 1, also ist er injektiv (Bemerkung f ) in II 1.3). 2
Beweis
Korollar
Ist
k
ein endlicher Körper der Charakteristik
p > 0,
so ist der
Frobenius-Homomorphismus ein Isomorphismus. Insbesondere hat jedes Element von
k
genau eine
Im Primkörper
p-te
Fp
Wurzel in
k.
ist der Frobenius-Homomorphismus die Identität.
Die erste Aussage ist klar, da in einer endlichen Menge eine injektive Abbildung auch surjektiv ist. Beweis
Die zweite Aussage folgt aus der Bemerkung in III 1.1. Sie ergibt sich auch daraus, dass die multiplikative Gruppe F× p nach II 1.11 zyklisch ist. Daher folgt für jedes p−1 = 1; also xp = x für alle x ∈ Fp . 2 x ∈ F× p , dass x
286
III KÖRPERERWEITERUNGEN
Insgesamt erhalten wir den
Satz
Ist
k
ein endlicher Körper, so ist jedes Polynom aus
k[ X ]
separabel.
Beweis Es ist zu zeigen, dass jedes irreduzible f ∈ k[ X ] in seinem Zerfällungskörper K ⊃ k nur einfache Nullstellen hat. Gäbe es eine mehrfache Nullstelle, so wäre f = 0 nach dem Lemma in III 3.2, nach der obigen Bemerkung also
f (X) = g(X p ) = a0 + a1 X p + a2 X 2p + . . . + am X mp . Nach dem obigen Lemma gibt es zu jedem ai ein bi mit ai = bpi , also ist
f = bp0 + (b1 X)p + . . . + (bm X m )p = (b0 + b1 X + . . . + bm X m )p 2
im Widerspruch zur Irreduzibilität von f .
Für Liebhaber schöner Worte noch ein weiterer Begri: Ein Körper k heiÿt vollkommen, wenn jedes Polynom aus k[ X ] separabel ist, d.h. wenn jedes irreduzible
Polynom aus k[ X ] in seinem Zerfällungskörper K ⊃ k nur einfache Nullstellen hat. Damit kann man die Ergebnisse der letzten beiden Abschnitte so zusammenfassen:
Satz über vollkommene Körper
Endliche Körper und Körper der Charakte-
ristik Null sind vollkommen.
Um ein Beispiel für ein nicht separables Polynom zu nden, benötigt man also einen unendlichen Körper der Charakteristik p. Wir wählen
k = Fp (X)
und
f = Y p − X ∈ Fp [ X, Y ] ⊂ k[ Y ] .
Nach Eisenstein ist f irreduzibel in (Fp [ X ])[ Y ], denn X ist irreduzibel in Fp [ X ]. Also ist f nach II 3.7 irreduzibel in k[ Y ]. Im Zerfällungskörper K ⊃ k von f gibt es ein y mit y p = X , also ist
f = Y p − X = Y p − y p = (Y − y)p , d.h. y ist eine p-fache Nullstelle von f .
3.4 Endliche Körper Nach den etwas mühsamen Vorüberlegungen zu mehrfachen Nullstellen ist nun die Bahn frei zum Beweis interessanter Ergebnisse. Wie wir in III 1.1 gesehen haben, enthält jeder endliche Körper k den Primkörper Fp mit p = char (k), nach III 1.2 ist er ein Vektorraum über Fp : Also hat k genau pn Elemente, wenn n = [k : Fp ]. Aber es ist bisher gar nicht klar, ob es zu jedem p und n einen solchen Körper mit pn Elementen gibt. Eine optimale Antwort auf diese Fragen gibt der
Struktursatz für endliche Körper Primkörper der Charakteristik
Sei
p, n ∈ N {0}
p
eine Primzahl,
und
q := pn .
Fp = Z/pZ
Dann gilt:
der
287
3.4 ENDLICHE KÖRPER
a) Ein Zerfällungskörper Fq ⊃ Fp von X q − X ∈ Fp [ X ] hat q Elemente, er ist gleich der Menge der Nullstellen von X q − X in Fq . b) Ist L ⊃ Fp eine Körpererweiterung mit q Elementen, so ist L ∼ = Fq . c) Ist f ∈ Fp [ X ] irreduzibel mit deg f = n, so ist Fq ∼ = Fp [ X ]/(f ). Jede Nullstelle x von f in Fq ist primitives Element der Erweiterung Fq ⊃ Fp , d.h. Fq = Fp (x). d) Sind m, n ∈ N {0}, so ist Fpm ⊂ Fpn Unterkörper genau dann, wenn m Teiler von n ist. Man kann also für gegebenes p und n von
dem Körper Fp
n
sprechen.
Beweis von a) Wir betrachten die Teilmenge K := {x ∈ Fq : xq = x} ⊂ Fq und zeigen im ersten Schritt, dass K ⊂ Fq ein Unterkörper ist. Sind x, y ∈ K , so ist nach den allgemeinen Rechenregeln für Potenzen
(x · y)q = xq · y q = x · y
und
(x−1 )q = (xq )−1 = x−1 ,
also x · y , x−1 ∈ K . Für die Summe folgt wegen q = pn aus der Regel von nius (III 3.3): (x ± y)q = xq ± y q = x ± y .
Frobe-
Im zweiten Schritt zeigen wir, dass K genau q Elemente enthält; dann folgt K = Fq und die Behauptung. Der Körper K besteht aus den Nullstellen des Polynoms X q − X in Fq , er enthält also höchstens q Elemente. Da
(X q − X) = −1 , sind nach dem Lemma aus III 3.1 alle Nullstellen einfach, also enthält K genau q Elemente. Es sei noch einmal ausdrücklich darauf hingewiesen: Bei unendlichen Körpern ist es unmöglich, dass alle Elemente Nullstellen eines einzigen Polynoms f = 0 sind (II 1.8).
Beweis von b) Wir benutzen die in II 1.11 bewiesene Tatsache, dass die Gruppe L× zyklisch von der Ordnung q − 1 ist; also ist jedes Element von L× Nullstelle des Polynoms X q−1 − 1 und jedes Element von L = L× ∪ {0} ist Nullstelle von X q − X . Somit gilt bis auf Isomorphie Fq ⊂ L und aus ord Fq = q = ord L folgt die Behauptung. Beweis von c) Nach dem Satz aus III 1.5 gilt [Fp [ X ]/(f ) : Fp ] = deg f = n , also ist ord Fp [ X ]/(f ) = pn = q und die erste Behauptung folgt aus b).
288
III KÖRPERERWEITERUNGEN
Für jede Nullstelle x von f in Fq gilt deg [Fp [ X ]/(f ) : Fp ] = n, daher ist Fp (x) = Fq .
Beweis von d)
Wir setzen zur Abkürzung q := pm und r := pn .
Ist Fq ⊂ Fr und d := [Fr : Fq ], so folgt r = q d , also pn = (pm )d = pmd und m | n. Um umgekehrt Fq ⊂ Fr nachzuweisen, genügt es, nach der Denition dieser Körper als Zerfällungskörper zu zeigen, dass
Xq − X
teilt
Xr − X
in
Fp [ X ] .
(∗)
Das ergibt sich aus den folgenden beiden ähnlichen Teilbarkeitsaussagen:
Hilfssatz
a) Für q, d ∈ N {0} gilt q − 1 teilt qd − 1 in N. b) Gegeben k, l ∈ N {0} derart, dass k teilt l und ein kommutativer Ring mit 1. Dann gilt in R[ X ] X k − 1 teilt X l − 1 .
R
Daraus folgt in Fp [ X ] wegen r = q d , dass X q−1 − 1 Teiler von X r−1 − 1 ist. Durch Multiplikation mit X folgt (∗). Der
Beweis des Hilfssatzes
folgt sofort aus den Beziehungen
(q − 1)(q d−1 + q d−2 + . . . + q + 1) = q d − 1
und
(X k − 1)(X k(s−1) + X k(s−2) + . . . + X k + 1) = X l − 1
für
l =k·s. 2
Noch eine Bemerkung zu Aussage c). Es ist überraschend, dass Fq durch jedes in Fp [ X ] irreduzible Polynom f vom Grad n erhalten werden kann. Das zeigt andrerseits, dass es nicht sehr viele derartige Polynome geben kann.
Korollar
Teiler von Beweis
Ist
f ∈ Fp [ X ]
irreduzibel mit
deg f = n ≥ 2
und
q := pn ,
so ist
f
g := X q−2 + X q−3 + . . . + X + 1 ∈ Fp [ X ] .
Sei K ⊃ Fp der Zerfällungskörper von f über Fp und
f = a(X − x1 ) · . . . · (X − xn ) in K[ X ] . Für jedes i ist [Fp (xi ) : Fp ] = n, also F(xi ) ∼ = Fq nach Teil b) des Struktursatzes; aus Teil a) folgt xqi = xi . Also sind alle xi auch Nullstellen von
X q − X = X · (X − 1) · g , und somit Nullstellen von g , denn f ist irreduzibel. Da nach III 3.3 alle Nullstellen von f einfach sind, ist f ein Teiler von g . 2
289
3.5 BEISPIELE
3.5 Beispiele
Beispiel 1
Wir verwenden die Regel aus III 3.1 zur Bestimmung des gröÿten gemeinsamen Teilers h ∈ Q[ X ] von
f := X m − 1 und
g := X n − 1
aus
Q[ X ] ,
wobei m, n ∈ N {0}. Ist d := ggT (m, n) ∈ N, so behaupten wir, dass
h := X d − 1 ein gröÿter gemeinsamer Teiler in C[ X ] und damit in Q[ X ] ist. Nach II 1.9 sind für jedes r ∈ N{0} die Nullstellen von X r −1 die Einheitswurzeln
Cr = {1, ζr , . . . , ζrr−1 }
mit
ζr = exp
i
2π . r
Also ist Cm ∩ Cn die Menge der gemeinsamen Nullstellen von f und g , und die Behauptung folgt aus der in II 1.9 bewiesenen Beziehung
C m ∩ C n = Cd .
Beispiel 2
Nach II 1.11 ist die multiplikative Gruppe K × eines endlichen Körpers zyklisch. Es ist aber gar nicht klar, welche Elemente sie erzeugen. Wir wollen das für einige Primzahlen p an den Körpern Fp untersuchen.
¯ F× 2 = {1}, dieser Fall ist trivial. × F3 = {¯ 1, ¯ 2} und ¯ 2·¯ 2=¯ 4=¯ 1, ¯ 2 erzeugt F× 3. × ¯ ¯ ¯ ¯ F5 = {1, 2, 3, 4}. Die Elemente haben folgende Ordnungen: ¯ 1
¯ 2
¯ 3
¯4
1
4
4
2
Also sind ¯ 2 und ¯ 3 erzeugende Elemente von F× 5.
¯ ¯ ¯ ¯ ¯ ¯ F× 7 = {1, 2, 3, 4, 5, 6}. Wir berechnen wieder die Ordnungen: ¯ 1
¯ 2
¯ 3
¯ 4
¯5
¯6
1
3
6
3
6
2
Also sind ¯ 3 und ¯ 5 erzeugende Elemente von F× 7. Besonders einfach ist der Fall, wenn ord K × eine Primzahl ist; dann wird die Gruppe von jedem Element = 1 erzeugt. Die nächstliegenden Kandidaten sind die Körper Fq mit q = 2n .
Bemerkung
Ist
2n − 1
Primzahl, so muss
n
eine Primzahl sein.
290
Beweis
III KÖRPERERWEITERUNGEN
Ist n = r · s eine nicht triviale Zerlegung, so folgt
(2n − 1) = (2r − 1)(2r(s−1) + . . . + 2r + 1) . Da 1 < 2r − 1 < 2n − 1, ist auch diese Zerlegung nicht trivial.
2
Die angegebene Bedingung ist nicht hinreichend, für eine Primzahl p muss 2p − 1 nicht prim sein, etwa 211 − 1 = 2 047 = 23 · 89 . Primzahlen der Form 2p −1 heiÿen
Mersennesche Primzahlen . Beispiele sind
22 − 1 = 3 , 23 − 1 = 7 , 25 − 1 = 31 , 27 − 1 = 127 , 213 − 1 = 8 191 , . . . .
Beispiel 3
Der Körper F4 = F22 ist der Zerfällungskörper von
X 4 − X = X · (X − 1) · (X 2 + X + 1) ∈ F2 [ X ] . Wie wir schon in Beispiel 5 aus II 3.9 gesehen hatten, ist f := X 2 + X + 1 das einzige irreduzible quadratische Polynom in F2 [ X ]. Also ist
F4 = F2 [ X ]/(f ) = F2 (x) , wobei x eine Nullstelle von f ist, also x2 = 1 + x. Weiter ist 2 ∼ F× 4 = {1, x, x } = Z3 .
Damit ist die Multiplikation in F4 festgelegt. Für die Addition ist es geschickter,
F4 = F2 + F2 · x als 2-dimensionalen Vektorraum zu beschreiben. Der Übergang geschieht durch eine Tabelle: multiplikativ
additiv
0=0+0
(0, 0)
1=1+0
(1, 0)
x=0+x
(0, 1)
x2 = 1 + x
(1, 1)
Will man im Vektorraum multiplizieren, rechnet man wie folgt:
(0, 1) · (1, 1) = x · x2 = x3 = 1 = (1, 0) . Umgekehrt ist etwa
x + x2 = (0, 1) + (1, 1) = (1, 0) = 1 .
291
3.5 BEISPIELE
Beispiel 4
Der Körper F8 = F23 ist der Zerfällungskörper von
X 8 − X = X · (X − 1) · (X 6 + X 5 + . . . + X + 1) = X · (X − 1) · f · g ∈ F2 [ X ] f := (X 3 + X + 1)
und
mit
g := (X 3 + X 2 + 1) .
f und g sind die einzigen in F2 [ X ] irreduziblen Polynome vom Grad 3. Man beachte, dass X6 + X5 + . . . + X + 1 nach Beispiel 4 aus II 3.9 in Z[ X ] irreduzibel ist. In F2 [ X ] ist es, wie man sieht, reduzibel. Nun hat man zwei Möglichkeiten zur Beschreibung von F8 :
F8 = F2 [ X ]/(f ) = F2 (x)
F8 = F2 [ X ]/(g) = F2 (y)
f (x) = 0 , d.h. x3 = 1 + x
g(y) = 0 , y 3 = 1 + y 2
0
(0, 0, 0)
0
(0, 0, 0)
1 =1
(1, 0, 0)
1 =1
(1, 0, 0)
(0, 1, 0)
y =
(0, 0, 1)
2
x3 = 1 + x x4 =
x =
x
2
x =
x
2
x + x2
5
2
6
2
x =1+x+x x =1+
x
y
(0, 1, 0)
y =
y
2
(0, 0, 1)
(1, 1, 0)
y3 = 1 +
y2
(1, 0, 1)
(0, 1, 1)
y4 = 1 + y + y2
(1, 1, 1)
5
(1, 1, 1)
y =1+y 6
(1, 0, 1)
y =
y+y
(1, 1, 0) 2
(0, 1, 1)
Man beachte, dass F4 kein Unterkörper von F8 ist, denn ord F× 4 =3
und
ord F× 8 =7.
Auÿerdem ist X 2 + X + 1 kein Teiler von f oder g .
Beispiel 5
Der Körper F16 = F24 ist der Zerfällungskörper von
X 16 − X = X(X − 1)(X 2 + X + 1)f · g · h mit f = X4 + X3 + X2 + X + 1 , g = X4 + X3 + 1 , h = X4 + X + 1 . Wir wählen die Beschreibung F16 = F2 [ X ]/(h) = F2 (x) mit x4 = 1 + x.
292
III KÖRPERERWEITERUNGEN
0
(0, 0, 0, 0)
1
=1
x
=
x
2
(1, 0, 0, 0) x
(0, 1, 0, 0)
=
x
2
x3 = x
4
x
5
x3
=1+x =
x+x
x
9
=1 =
(0, 1, 1, 0)
x2 + x3
(0, 0, 1, 1)
+ x3
(1, 1, 0, 1)
x7 = 1 + x x
+x
2
x
(1, 0, 1, 0) +x
3
x10 = 1 + x + x2 x11 = x
12
x
13
(0, 1, 0, 1) (1, 1, 1, 0)
x + x2 + x3
(0, 1, 1, 1)
2
3
(1, 1, 1, 1)
2
3
(1, 0, 1, 1)
+ x3
(1, 0, 0, 1)
=1+x+x +x =1
(0, 0, 0, 1) (1, 1, 0, 0)
2
x6 = 8
(0, 0, 1, 0)
+x +x
x14 = 1
Wie man sieht, ist
F4 ∼ = {0, 1, x, x4 } ⊂ F16
und
× ∼ Z3 ∼ = F× 4 ⊂ F16 = Z15 .
Beispiel 6
Über dem Körper F3 = {0, 1, 2} = {0, 1, −1} gibt es nach Beispiel 6 aus II 3.9 die irreduziblen quadratischen Polynome
f := X 2 + 1 , g := X 2 + X − 1
und
h := X 2 − X − 1 .
Es ist in F3 [ X ]
X 9 − X = X · (X − 1) · (X + 1) · (X 7 + X 6 + . . . + X + 1)
und
X7 + X6 + . . . + X + 1 = f · g · h . Eine Nullstelle x von f erzeugt eine Untergruppe der Ordnung 4 von F× 9 , eine Nullstelle y von g erzeugt ganz F× 9:
3.6 ALGEBRAISCHER ABSCHLUSS EINES ENDLICHEN KÖRPERS
0
(0, 0)
1 = 1
(1, 0)
y =
y
2
(0, 1)
1−y
(1, −1)
y 3 = −1 − y
(−1, −1)
y = 4
y = −1 5
(−1, 0) −y
y =
(0, −1)
y 6 = −1 + y y7 =
293
(−1, 1)
1+y
(1, 1)
3.6 Algebraischer Abschluss eines endlichen Körpers Bei der Konstruktion eines allgemeinen algebraischen Abschlusses eines Körpers k muss man unübersehbar viele algebraische Erweiterungen vornehmen. Bei endlichen Körpern ist das viel einfacher.
Satz Sei k ein endlicher Körper mit k :=
p := char (k) und ∞
Fp N ! .
N =1
Dann ist k ⊃ k ein algebraischer Abschluss. Beweis Nach Teil d) des Struktursatzes hat man eine aufsteigende Kette Fp ⊂ Fp2 ⊂ Fp6 ⊂ . . . ⊂ FpN ! ⊂ Fp(N +1)! ⊂ . . . ⊂ k . Da es für a, b ∈ k ein N gibt, so dass a, b ∈ FpN ! , ist k ein Körper. Ist
f = a0 + . . . + an X n ∈ k[ X ]
mit
n≥1,
so gibt es dazu ebenfalls ein N mit a0 , . . . , an ∈ FpN ! , also f ∈ FpN ! [ X ]. Der Zerfällungskörper K von f ist ebenfalls endlich, sei r := [K : FpN ! ]. Nach Teil b) und wieder Teil d) des Struktursatzes ist
K∼ = Fpr·N ! , also K ⊂ Fp(rN )! ⊂ k . 2
294
III KÖRPERERWEITERUNGEN
3.7 Der Satz vom primitiven Element In III 1.3 hatten wir ein Element a ∈ K ⊃ k primitiv genannt, wenn K = k(a). Diese Bezeichnung stammt von Steinitz [St], er gab auch einen Beweis für die Existenz primitiver Elemente unter gewissen Voraussetzungen. Wir behandeln hier den besonders einfachen Spezialfall char (k) = 0. Für endliche Körper wurde die Existenz von primitiven Elementen schon im Struktursatz aus III 3.4 gezeigt.
Satz vom primitiven Element Sei k ein Körper mit char (k) = 0 und K ⊃ k eine endliche (und damit algebraische) Erweiterung. Dann gibt es in K ein primitives Element. Beweis Nach III 1.7 gibt es über k algebraische Elemente a1 , . . . an ∈ K , so dass K = k(a1 , . . . , an ) . Wir behandeln zunächst den Fall n = 2 und schreiben K = k(a, b). Gesucht ist ein Element c ∈ K mit K = k(c). Wir betrachten die Minimalpolynome f und g ∈ k[ X ] von a und b. Über einem Zerfällungskörper K ⊃ k von f · g ist
f = (X − a)(X − a2 ) · . . . · (X − ar ) ∈ K [ X ] und g = (X − b)(X − b2 ) · . . . · (X − bs ) ∈ K [ X ] . Um ein geeignetes c zu nden, machen wir den Ansatz
cλ := a + λb mit
λ ∈ k× .
Damit erhalten wir die Körperkette
k ⊂ Lλ := k(cλ ) ⊂ k(a, b) = K ⊂ K . Wir wollen zeigen, dass Lλ = K für fast alle λ ∈ k × . Das führt zum Ziel, da k wegen der char (k) = 0 unendlich ist. Es genügt, b ∈ Lλ zu zeigen, dann ist auch a = cλ − λb ∈ Lλ . Der klassische Trick dazu ist die Denition des Polynoms
hλ (X) := f (cλ − λX) ∈ Lλ [ X ] . hλ hat mit g die gemeinsame Nullstelle b, denn hλ (b) = f (a) = 0. Um zu verhindern, dass hλ und g eine weitere gemeinsame Nullstelle haben, muss wegen hλ (bj ) = f (cλ − λbj ) die Bedingung cλ − λbj = ai , d.h. λ =
ai − a ∈ K für i = 2, . . . , r und j = 2, . . . , s b − bj
(∗)
erfüllt sein. Man beachte, dass b − bj = 0, denn g besitzt als irreduzibles Polynom nach III 3.2 nur einfache Nullstellen (hier haben wir wieder char (k) = 0 verwendet).
295
3.8 BEISPIELE
Unter der Voraussetzung (∗) betrachten wir nun den gröÿten gemeinsamen Teiler von g und hλ , und zwar zunächst in K [ X ]. Da b als Nullstelle eines irreduziblen Polynoms einfach ist, folgt ggT (g, hλ ) = (X − b) ∈ K [ X ] . Nach der Regel aus III 3.1 folgt (X − b) ∈ Lλ [ X ], also b ∈ Lλ . Damit ist der Fall n = 2 erledigt, der allgemeine Fall folgt durch Induktion.
2
Zusatz
n
Wie der Beweis zeigt, gibt es ein primitives Element c ∈ k(a , . . . , a ) von der Form 2 c = a + λ a + ... + λ a mit λ , . . . , λ ∈ k . 1
1
2 2
n n
2
n
Von den zahlreichen Konsequenzen notieren wir ein für die Galois-Theorie wichtiges
Korollar Sei char (k) = 0 und K ⊃ k Zerfällungskörper eines beliebigen Polynoms f ∈ k[ X ]. Dann ist K ⊃ k auch Zerfällungskörper eines irreduziblen Polynoms g ∈ k[ X ]. Beweis Da die Erweiterung K ⊃ k endlich ist, gibt es ein primitives Element
a ∈ K , d.h. K = k(a). Nach der Zerfällungseigenschaft aus III 2.3 ist K auch Zerfällungskörper des Minimalpolynoms g ∈ k[ X ] von a über k . 2 In der klassischen Form von Element so ausgedrückt:
Steinitz [St, 14] wird der Satz vom primitiven
Für eine Körpererweiterung K ⊃ k sind folgende Bedingungen gleichwertig: i) K ⊃ k ist einfach und algebraisch. ii) In K ⊃ k gibt es nur endlich viele verschiedene Zwischenkörper. Satz∗
3.8 Beispiele Beispiel 1 Für die Körpererweiterung
√ √ Q( 2, 3) ⊃ Q
hatten wir schon in Beispiel 4 aus III 1.6 das primitive Element c = dem Minimalpolynom X 4 − 10X 2 + 1 bestimmt. Andere primitive Elemente erhält man durch / √ √ √ √ 2 − 2− 2 √ =− ∈ /Q. cλ = 2 + λ 3 mit λ = √ 3 3+ 3 Also kann λ ∈ Q× beliebig gewählt werden.
√
2+
√
3 mit
296
III KÖRPERERWEITERUNGEN
Wir bestimmen die primitiven Elemente für die Erweiterung √ 2π i ∈C. K := Q(a, ζ) ⊃ Q mit a = 2 ∈ R und ζ = exp 3 (Beispiel 4 in III 2.4). Die Minimalpolynome von b und ζ sind f = X − 2 = (X − a)(X − aζ)(X − aζ ) und Beispiel 2
3
3
Im Ansatz c
2
g = X 2 + X + 1 = (X − ζ)(X − ζ 2 ) .
ergeben sich für λ die Ausnahmen aζ − a a und aζζ −−ζ a = a · (1 + ζ) . =− ζ −ζ ζ Beide sind nicht reell, also liefert jedes λ ∈ Q ein primitives Element c . Für λ = 1 erhalten wir das primitive Element λ
= a + λζ
2
2
2
×
λ
c := a + ζ .
Um das Minimalpolynom von c zu bestimmen, benutzen wir 2 = a = (c − ζ) und ζ + ζ + 1 = 0 . Daraus folgt α ζ= mit α = c − 3c − 3 und β = 3c + c , also β 3
3
2
3
2
0 = α2 + αβ + β 2 = c6 + 3c5 + 6c4 + 3c3 + 9c + 9 .
Daher ist f := X + 3X + 6X + 3X + 9X + 9 ∈ Q[ X ] das Minimalpolynom über Q des primitiven Elements a + ζ . Ein primitives Element von etwas anderer Form ist a − aζ mit dem Minimalpolynom X + 108 . 6
5
4
3
6
3.9 Resultanten∗
Sind Polynome f, g ∈ k[ X ] gegeben, so stellt sich oft die Frage nach einem echten gemeinsamen Teiler in k[ X ]. Wie wir am Ende von III 3.1 gezeigt haben, ist dies gleichwertig zur Existenz mindestens einer gemeinsamen Nullstelle im Zerfällungskörper von f · g. In k[ X ] kann man die Frage mit dem Euklidischen Algorithmus entscheiden, indem man den gröÿten gemeinsamen Teiler d = ggT(f, g) ∈ k[ X ] berechnet. Es gibt aber noch ein anderes klassisches Verfahren, dies direkt an den Koezienten von f und g durch Berechnung einer geeigneten Determinante abzulesen.
297
3.9 RESULTANTEN∗
Gegeben seien ein Ring R (kommutativ mit 1) und in R[ X ] Polynome
f = am X m + . . . + a1 X + a0
und
Wir denieren im Fall m ≥ 1 und n ≥ 1 die
⎛ ⎜ ⎜ ⎜ ⎜ ⎜ res (f, g) := det ⎜ ⎜ ⎜ ⎜ ⎝
g = bn X n + . . . + b1 X + b0 .
Resultante von f und g durch
m+1
am . . . a0 .. .. . . am ... bn . . . b 0 .. .. . . bn
...
n−1
⎞
a0
⎟ ⎟ n ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ m ⎠
b0
In dieser (m + n) × (m + n)-Matrix stehen an den nicht markierten Stellen Nullen. Der Wert der Determinante ist ein Element von R. Ist a0 = b0 = 0, so ist res (f, g) = 0, und X ist ein gemeinsamer Teiler von f und g . Die Resultante kann aber auch andere gemeinsame Teiler von f und g erkennen. Der wichtigste Fall ist am = 0 und bn = 0; es reicht jedoch die Voraussetzung, dass einer der höchsten Koezienten, etwa am , nicht verschwindet. Nach diesen Vorbemerkungen können wir die entscheidende Eigenschaft der Resultante formulieren:
Satz Ist R 1 ≤ deg f = m i)
ein faktorieller Ring, so sind für Polynome und
1 ≤ deg g ≤ n
f, g ∈ R[ X ]
mit
folgende Aussagen äquivalent:
res (f, g) = 0.
ii) Es gibt
ϕ, ψ ∈ R[ X ]
mit
0 ≤ deg ϕ < m, 0 ≤ deg ψ < n
und
ψf + ϕg = 0 . iii)
f und g haben in R[ X ] deg (ggT (f, g)) ≥ 1.
Die wichtigste Aussage dabei ist Beweis
i)
Vektorraum
⇐⇒
ii)
einen nicht trivialen gemeinsamen Teiler, d.h.
i)
⇒
iii).
Wir verwenden den Quotientenkörper K = Q(R) und den
V = {h ∈ K[ X ] : deg h ≤ m + n − 1}
mit der Basis B = (X m+n−1 , . . . , X 2 , X, 1). Die Zeilen der Resultantenmatrix sind die Koezienten von
X n−1 f, . . . , Xf, f, X m−1 g, . . . , Xg, g in der Darstellung durch B .
(∗)
298
III KÖRPERERWEITERUNGEN
Daher ist res (f, g) = 0 gleichwertig mit der linearen Abhängigkeit der m + n Vektoren (∗), d.h. der Existenz von
λn−1 , . . . , λ0 , μm−1 , . . . , μ0 ∈ K , nicht alle gleich Null, mit λn−1 X n−1 f + . . . + λ1 Xf + λ0 f + μm−1 X m−1 g + . . . + μ1 Xg + μ0 g = 0 . Das bedeutet aber
˜ + ϕg ψf ˜ = 0 mit ψ˜ := λn−1 X n−1 + . . . + λ0
und
ϕ˜ := μm−1 X m−1 + . . . + μ0 ∈ K[ X ] .
Indem man mit einem Hauptnenner der Koezienten von ψ˜ und ϕ˜ multipliziert, erhält man
ψf + ϕg = 0 mit ψ, ϕ ∈ R[ X ] , 0 ≤ deg ψ ≤ n − 1 , 0 ≤ deg ϕ ≤ m − 1 . Es sei bemerkt, dass in diesem Teil des Satzes R nur Integritätsring sein muss. iii)
⇒
ii)
ist einfach. Ist f = dϕ und g = dψ mit d ∈ R[ X ] und deg d ≥ 1, so ist
ψf = ϕg , deg ψ < deg g , deg ϕ < deg f . ⇒ iii) Dies ist die entscheidende Aussage; hierfür benötigt man die Voraussetzung, dass R faktoriell ist. Dann ist nach dem Satz von aus II 3.7 auch R[ X ] faktoriell, wir können also beide Seiten der Gleichung ψf = −ϕg in Primfaktoren zerlegen: ii)
Gauss
ψ1 · . . . · ψk · f1 · . . . · fr = ϕ1 · . . . · ϕl · g1 · . . . · gs . Bis auf Einheiten müssen alle Faktoren f1 , . . . , fr auch auf der rechten Seite erscheinen. Da deg ϕ < m = deg f , gibt es mindestens ein Paar i, j mit fi ∼ gj ; das ist ein nicht trivialer gemeinsamer Teiler. 2 Der Vorteil der Resultante gegenüber dem Euklidischen Algorithmus besteht zunächst darin, dass man den gröÿten gemeinsamen Teiler von f und g nicht ausrechnen muss, wenn man nur wissen will, ob er trivial ist oder nicht. Viel wichtiger ist es, dass dies durch die Resultante als ein Polynom in den Koezienten von f und g entschieden werden kann. Ist etwa R = C, so sind f und g durch
(am , . . . , a0 , bn , . . . , b0 ) ∈ Cm+1 × Cn+1 = Cm+n+2 bestimmt, und die Paare (f, g) von nicht teilerfremden Polynomen werden in Cm+n+2 durch die Nullstellen des Resultanten-Polynoms beschrieben. Insbesondere ist eine Polynom-Funktion stetig; also folgt, dass teilerfremde Polynome bei genügend kleinen Veränderungen der Koezienten teilerfremd bleiben. Um das Geheimnis der Resultante zu lüften, muss man in den Zerfällungskörper ˜ ⊃ K = Q(R) von f · g gehen. Setzt man deg f = m und deg g = n voraus, so K ˜ X] gilt in K[
299
3.9 RESULTANTEN∗
f = a(X − x1 ) · . . . · (X − xm )
und
g = b(X − y1 ) · . . . · (X − yn )
˜ . Des Rätsels Lösung ist das mit a, b = 0 und x1 , . . . , xm , y1 , . . . , ym ∈ K
Theorem
Im Zerfällungskörper
˜ K
von
res (f, g) = an bm
f ·g
gilt
(xi − yj ) .
1≤i≤m 1≤j≤n
Man sieht an dieser Gleichung mit bloÿem Auge, dass die Resultante genau dann ˜ eine gemeinsame Nullstelle haben. Wie wir am verschwindet, wenn f und g in K Ende von III 3.1 erläutert haben, ist das Produkt d der gemeinsamen normierten ˜ X ] schon in K[ X ] enthalten und dort ist Linearfaktoren von f und g aus K[ d = ggT(f, g). Man kann die entscheidende Gleichung auch etwas anders schreiben:
Korollar
res(f, g) = an g(x1 ) · . . . · g(xm ) = (−1)mn bm f (y1 ) · . . . · f (yn ) .
2
Insbesondere folgen die
Rechenregeln
res (g, f ) = (−1)mn res (f, g) res (f1 f2 , g) = res (f1 , g) · res (f2 , g) .
2
Zum Beweis des Theorems ersetzt man zunächst die Nullstellen durch Unbestimm˜ unabhängig zu werden. Auf dieser Ebene hat man das te, um vom Körper K entscheidende
Lemma
Sei
R := Z[X1 , . . . , Xm , Y1 , . . . , Yn ]
mit
m, n ≥ 1
und in
R[ X ]
seien
Polynome
F := (X − X1 ) · . . . · (X − Xm ) = X m + A1 X m−1 + . . . + Am , G := (X − Y1 ) · . . . · (X − Yn ) = X n + B1 X n−1 + . . . + Bn gegeben. Dann hat man in
R
die Gleichung
res (F, G) =
(Xi − Yj ) .
1≤i≤m 1≤j≤n
Um daraus das Theorem zu folgern, genügt es, den Substitutions-Homomorphismus
˜ σ : R = Z[X1 , . . . , Xm , Y1 , . . . , Yn ] → K mit
σ(1) = 1 , σ(Xi ) = xi
und
σ(Yj ) = yj ,
˜ X ] geht F anzuwenden, denn beim zugehörigen Homomorphismus R[ X ] → K[ auf f und G auf g .
300
III KÖRPERERWEITERUNGEN
Zum Beweis des Lemmas kann man die grundlegenden Ergebnisse über symmetrische Polynome (vgl. III 4.1) verwenden. Es geht aber auch ganz elementar mit geeigneten Blicken auf die Determinante, mit der die Resultante erklärt ist. Zunächst bemerken wir, dass die Koezienten Ai bzw. Bj ∈ R homogene Polynome in X1 , . . . , Xm bzw. Y1 , . . . , Yn sind, mit (vgl. II 1.10) und
deg Ai = i
deg Bj = j .
Entscheidend ist nun der
Hilfssatz
Das Polynom
⎛
1
⎜ ⎜ ⎜ ⎜ res (F, G) = det ⎜ ⎜1 ⎜ ⎜ ⎝
⎞
A1
...
Am
1 ...
A1 Bn
...
B1
1
B1
...
... ...
... ...
⎟ ⎟ ⎟ Am ⎟ ⎟∈R ⎟ ⎟ ⎟ ⎠ Bn
ist homogen vom Grad m · n in den Unbestimmten X1 , . . . , Xm , Y1 , . . . , Yn . Daraus folgt leicht die Aussage des Lemmas. Oensichtlich ist das Produkt P := (Xi − Yj ) ∈ R i,j
von m · n linearen Faktoren ebenfalls homogen vom Grad m · n. Nun kommt der Kni: Jeder Faktor (Xi −Yj ) ist ein Teiler von H := res (F, G) ∈ R. Um das auch formal präzise zu begründen, betrachten wir für i = 1, . . . , m den Ring Si := Z[ X1 , . . . , Xi−1 , Xi+1 . . . , Xm , Y1 , . . . , Yn ] . Dann ist R = Si [ Xi ] und jedes Yj ∈ Si ist eine Nullstelle von H ∈ Si [ Xi ]: H(Yj ) = 0, denn setzt man Yi für Xi ein, so haben F und G eine gemeinsame Nullstelle und die Resultante verschwindet. Nach dem Korollar aus II 1.8, angewandt in Si [ Xi ], ist
˜ H = (Xi − Yj ) · H
mit
˜ ∈ S i [ Xi ] , H
also ist (Xi − Yj ) Teiler von H . Man beachte, dass in diesem Argument Xi und Yj formal unterschiedlich behandelt werden: Xi ist die Unbestimmte, Yj die Nullstelle. Insgesamt folgt, dass P ein Teiler von H = res (F, G) ist, also ist res (F, g) = r · P
mit
r∈R.
Nun sind res (F, G) und P beide homogen vom Grad m · n, also ist r ∈ Z nach dem Satz über Produkte homogener Polynome aus II 1.9. Da res (F, G) und P beide den Term Bnm = (−1)mn (Y1 · . . . · Yn )m
301
3.9 RESULTANTEN∗
enthalten, ist r = 1. Es bleibt der Hilfssatz zu beweisen. Dazu muss man kontrollieren, wie sich die Resultante verändert, wenn man die Xi und die Yj durch T Xi und T Yj ersetzt, wobei T eine weitere Unbestimmte ist. Dazu setzen wir
F T := (X − T X1 ) · . . . · (XT Xm ) = X m + AT1 X m−1 + . . . + ATm und GT := (X − T Y1 ) · . . . · (X − T Yn ) = X n + B1T X n−1 + . . . + BnT . Da die Ai und Bj homogen sind, folgt
ATi = T i Ai
und
BjT = T j Bj .
Die Einträge der Resultanten-Determinante von T multipliziert: 0 0 0 1 ... m 0 0 .. 0 . 0 0 0 1 0 0 0 1 ... n 0 0 .. 0 . 0 0 0 1
werden also mit folgenden Potenzen
0 0 0 0 .. 0 . 0 . . . m 00 0 0 0 .. 0 . 0 ... n 0
Indem man die Zeilen zusätzlich mit den vorne angegebenen Potenzen von T multipliziert, erhält man bei den Einträgen insgesamt als Faktoren folgende Potenzen von T :
T .. . T
2 ..
...
m
1
2 ..
m+1 ..
.
n
T .. . T
1
n
1+n
...
n+1
... ..
.
m
1+m
.
m+n
.
...
n+m
Wie man nicht nur in diesem speziell skizzierten Fall mit m = n, sondern auch allgemein sieht, wird dabei insgesamt die r-te Spalte mit T r multipliziert. Setzt man
p := (1 + . . . + n) + (1 + . . . + m)
und
q := 1 + . . . + (m + n) ,
so folgt
T p · res (F T , GT ) = T q · res (F, G) , also res (F T , GT ) = T m·n res (F, G) ,
302
III KÖRPERERWEITERUNGEN
da q − p = m · n. Damit ist auch der Hilfssatz bewiesen.
2
Man beachte, dass man die Resultante auch als ein Polynom in den Koezienten ansehen kann. Ist
f = a0 X m + . . . + am
und
g = b0 X n + . . . + bn ,
so kann man a0 , . . . , am und b0 , . . . , bn als Unbestimmte betrachten. Dann ist die Resultante res (f, g) ein homogenes Polynom in a0 , . . . , bn vom Grad m + n, wie man sofort an der Determinante ablesen kann. Da im obigen Beweis durch die Polynome Xi − Yj dividiert werden muss, ist es angemessen die Nullstellen zu Unbestimmten zu machen. Für Anwendungen in der projektiv algebraischen Geometrie ist es von Vorteil, die Resultanten von homogenen Polynomen f und g zu betrachten. Das wird etwa bei [Wa, I 10] ausgeführt.
3.10 Diskriminanten∗ In III 3.1 hatten wir für ein Polynom f ∈ k[ X ] zum Nachweis mehrfacher Nullstellen in seinem Zerfällungskörper K ⊃ k die formale Ableitung benutzt und gezeigt, dass dafür die Existenz eines gemeinsamen Teilers g von f und f mit deg g ≥ 1 notwendig und hinreichend ist. Das kann aber die zuständige Resultante res (f, f ) entscheiden: dis (f ) := res (f, f ) ∈ k nennt man die man sofort das
Korollar Dann gilt
Diskriminante von f . Aus dem Satz über die Resultante erhält
Sei k ein Körper, f ∈ k[ X ] und K ⊃ k der Zerfällungskörper von f .
f hat mindestens eine mehrfache Nullstelle in K ⇔ dis (f ) = 0 in k .
2
Man kann sich also die Berechnung des gröÿten gemeinsamen Teilers von f und f ersparen, wenn man nur wissen will, ob er den Grad 0 hat oder nicht. Dazu reicht die Berechnung einer Determinante, nämlich res (f, f ), die durch die Koezienten von f bestimmt ist. Im Fall dis (f ) = 0 erhält man jedoch keinen Hinweis auf die Werte mehrfacher Nullstellen. Ebenso wie das Geheimnis der Resultante kann man das der Diskriminante im Zerfällungskörper lüften:
Lemma
Ist f = (X − x1 ) · . . . · (X − xn ) ∈ K[ X ] mit n ≥ 1, so gilt
dis (f ) = f (x1 ) · . . . · f (xn ) =
i =j
n
(xi − xj ) = (−1)( 2 )
i<j
(xi − xj )2 .
3.10 DISKRIMINANTEN∗
303
Beweis
Die erste Gleichung folgt sofort aus dem Korollar in III 3.9. Zur zweiten Gleichung dierenzieren wir nach der Produktregel aus III 3.1:
f =
n
(X − x1 ) · . . . · (X − xj−1 ) · (X − xj+1 ) · . . . · (X − xn ) , also
j=1
f (xi ) = (xi − x1 ) · . . . · (xi − xi−1 )(xi − xi+1 ) · . . . · (xi − xn ) . Multipliziert man diese n Produkte mit jeweils n − 1 Faktoren, so erhält man das in der zweiten Gleichung angegebene Produkt mit n(n − 1) Faktoren. Dabei ist für i<j (xj − xi )(xi − xj ) = −(xi − xj )2 . Durch n2 = n(n−1) Vorzeichenwechsel erhält man die dritte Gleichung. 2 2 In manchen Fällen ist es von Vorteil, das Vorzeichen anders zu wählen und n (xi − xj )2 = (−1)( 2 ) dis (f ) mit n := deg f Δ(f ) := i<j
als
Diskriminante zu betrachten.
Zur Bestimmung der Diskriminante muss man eine (2n − 1)-reihige Determinante ausrechnen. Das ist umso einfacher, je mehr Koezienten des gegebenen Polynoms verschwinden. Zu diesem (und nicht nur diesem) Zweck ist es nützlich, eine lineare Transformation anzuwenden (benannt nach Walther Graf von Tschirnhaus, der schon um 1700 versuchte, auch alle anderen Koezienten auÿer an und a0 wegzutransformieren).
Lemma Sei k ein Körper mit char (k) = 0 und f := X n + an−1 X n−1 + . . . + a0 ∈ k[ X ] .
Setzt man Y
:= X +
an−1 n
, so ist
g(Y ) := f (Y −
an−1 ) = Y n + bn−2 Y n−2 + . . . + b1 Y + b0 . n
Insbesondere ist g genau dann irreduzibel, wenn f irreduzibel ist. Die Substitution X = Y −
an−1 n
heiÿt
Tschirnhaus-Transformation .
Im Zerfällungskörper von f und damit auch g hat man die Nullstellen x1 , . . . , xn von f und y1 , . . . , yn von g mit an−1 = −(x1 + . . . + xn ) und bn−1 = −(y1 +. . .+yn ) = 0 (vgl. III 4.1). Durch die Tschirnhaus-Transformation Y = X + an−1 wird also der Mittelwert n
−
an−1 1 = (x1 + . . . + xn ) n n
der Nullstellen von f in den Nullpunkt verschoben. Will man durch weitere Transformationen noch andere Koezienten verschwinden lassen, so muss man dazu Gleichungen von höherem Grad lösen (vgl. etwa [We 1 , Band I].
304
III KÖRPERERWEITERUNGEN
Beweis
Es genügt die einfache Rechnung
an−1 n−1 an−1 n + an−1 Y − + ... g(Y ) = Y − n n an−1 n−1 Y =Yn−n + . . . + an−1 Y n−1 + . . . = Y n + bn−2 Y n−2 + . . . . n Nach dem Lemma aus II 1.6 ist die Abbildung
k[ X ] → k[ Y ] , f → f (Y −
an−1 ), n
ein Isomorphismus. Also bleibt die Irreduzibilität unberührt.
2
3.11 Beispiele∗
Beispiel 1
Für f = X − a und g = bn X n + . . . + b1 X + b0 kann man die Gleichung res (X − a, g) = g(a)
aus dem Korollar in III 3.9 ganz einfach durch Entwicklung der Determinante nach der letzten Zeile nachrechnen: 0 0 0 0 1 −a 0 0 0 0 1 −a 0 0 0 0 .. .. res (X − a, g) = 0 0 . . 0 0 0 0 1 − a 0 0 0 bn . . . b1 b0 0
=
(−1)n+2 bn (−a)n + (−1)n+3 bn−1 (−a)n−1 + . . . + (−1)2n+2 b0
=
bn an + bn−1 an−1 + . . . + b0 = g(a) .
Beispiel 2
In III 1.7 haben wir gezeigt, dass für zwei Elemente a, b ∈ K ⊃ k , die über k algebraisch sind, auch a + b ∈ K algebraisch über K ist, ohne ein Polynom h ∈ k[ X ] mit h(a + b) = 0 angegeben zu haben. Wir behaupten nun Folgendes:
Sind Y
f, g ∈ k[ X ]
mit
f (a) = g(b) = 0 ,
und ist mit einer weiteren Unbestimmten
h := res (f (Y ), g(X − Y )) ∈ k[ X ] ,
so folgt h(a + b) = 0. Man beachte dabei, dass die Resultante im Polynomring R[ Y ] mit R = k[ X ] gebildet wird. Wir können im Zerfällungskörper K von f · g rechnen. Sind f und g normiert, so ist f = (X − a1 ) · . . . · (X − am ) und g = (X − b1 ) · . . . · (X − bn )
305
3.11 BEISPIELE∗
mit a = a1 , . . . , am , b = b1 , . . . , bn ∈ K . Nun ist
g(X − Y ) =
n
(X − Y − bj ) = (−1)n
j=1
n
(Y − (X − bj )) , also
j=1
res (f (Y ), g(X − Y )) = (−1)m·n
(ai − (X − bj )) =
i,j
(X − (ai + bj )) .
i,j
Setzt man X = a + b, so folgt h(a + b) = 0. √ √ Ist etwa k = Q, a = 2, b = 3, f = X 2 − 2 und g = X 2 − 3, so wird
g(X − Y ) = Y 2 − 2XY + (X 2 − 3) , und 0 0 0 0 0 1 0 −2 0 0 = X 4 − 10X 2 + 1 0 1 −2X X 2 − 3 0 0 0 2 0 1 −2X X −3 0 √ √ ist das Minimalpolynom von 2 + 3 (vgl. Beispiel 4 in III 1.6). 0 0 0 0 0 h = 00 0 0 0
Beispiel 3
1
0
−2
0
Für das allgemeine quadratische Polynom f ∈ R[ X ] mit
f = X 2 + pX + q
und f 0 0 1 p 0 0 dis (f ) = res (f, f ) = 0 2 p 0 0 0 2
= 2X + p ist 0 q 00 0 0 0 = 4q − p2 , 0 p 0
also Δ(f ) = (−1)1 dis (f ) = p2 − 4q . Nach der guten alten (p, q)-Formel $ −p ± p2 − 4q x1,2 = 2 hat f
Mit der
⇔ Δ(f ) > 0 , ⇔ Δ(f ) = 0 , ⇔ Δ(f ) < 0 .
zwei verschiedene reelle Nullstellen eine doppelte reelle Nullstelle keine reelle Nullstelle
Tschirnhaus-Transformation Y
=X+
p 2
erhält man
p2 1$ 2 1$ p + q , also y1,2 = ± p − 4q = ± Δ(f ) . f (X) = f (Y − ) = Y 2 − 2 4 2 2 Betrachtet man die Koezienten (p, q) als Punkte der Ebene R2 , so liegen die Nullstellen von f in der Fläche
F = {(p, q, y) ∈ R3 : y 2 −
p2 + q = 0} 4
darüber. F ist oensichtlich ein hyperbolisches Paraboloid.
306
III KÖRPERERWEITERUNGEN
Beispiel 4
Aus dem allgemeinen kubischen Polynom
f = X 3 + aX 2 + bX + c 3
g = Y + pY + q
mit
p=b
X=Y −
und
− a3 2
und
q=
a 3
wird
2 3 27 a
− 13 ab + c ,
g = 3Y + p . Die Berechnung der Diskriminante ergibt 0 0 0 0 1 0 p q 0 0 0 1 0 0 0 0 0 0 0 0 1 0 p q 0 0 0 0 0 0 − 0 0 0 dis (g) = 0 3 0 p 0 0 0 = 0 0 0 0 0 0 0 3 0 p 0 0 0 0 0 0 0 0 0 0 0 0 0 3 0 p 0 0 0
=
0 |
p
q
1 | 0 − − 0 | −2p
p − −3q
0 |
0
−2p
0 |
3
0
0 0 0 0 q 0 − 00 0 00 0 −3q 0 0 p 0 0
4p3 + 27q 2 , also Δ(g) = −(4p3 + 27q 2 ) .
In III 5.2 werden wir die Formeln von angeben. Danach hat g
Cardano zur Berechnung der Nullstellen
drei verschiedene reelle Nullstellen eine einzige reelle Nullstelle eine einfache und eine doppelte reelle Nullstelle eine dreifache Nullstelle
⇔ Δ(g) > 0 , ⇔ Δ(g) < 0 ⇔ Δ(g) = 0 und (p, q) = (0, 0) ⇔ p=q=0.
3.11 BEISPIELE∗
307
Die entsprechende Fläche
F = {(p, q, y) ∈ R3 : y 3 + py + q = 0} hat die Gestalt einer Tuchfalte und wird auch durch die Diskriminante beschriebene Kurve
Cayleysche Kubik genannt. Die
{(p, q) ∈ R2 : 4p3 + 27q 2 = 0} heiÿt
Neilsche Parabel .
Da die Tschirnhaus-Transformation nur eine Translation der Nullstellen bewirkt, ist Δ(f ) = Δ(g), also
Δ(g) = −(4p3 + 27q 2 ) = a2 b2 − 4a3 c − 4b3 + 18abc − 27c2 = Δ(f ) . Setzt man allgemeiner
f = a0 X 3 + a1 X 2 + a2 X + a3 , so wird Δ(f ) = a21 a22 − 4 a31 a3 − 4 a0 a32 + 18 a0 a1 a2 a3 − 27 a20 a23 . Daran sieht man, dass Δ(f ) ein homogenes Polynom vom Grad 4 in den Koezienten und vom Grad 6 in den Nullstellen von f ist.
308
III KÖRPERERWEITERUNGEN
Beispiel 5
Für höhere Grade eines Polynoms f wird die Bestimmung der Diskriminante im Allgemeinen mühsam, schon für deg f = 4 hat man eine 7-reihige Determinante auszurechnen. Noch recht einfach geht es für das spezielle
f = X 4 + qX + r ∈ k[ X ] 0 0 1 0 0 q r 0 0 1 0 0 q 0 0 0 1 0 0 0 0 dis (f ) = 00 4 0 0 q 0 0 4 0 0 q 0 0 4 0 0 0 0 0 4 0
mit
r q
q 0
f = 4X 3 + q .
0 0 0 0 0 0 r 00 0 0 = 256r2 − 27q 3 0 0 0 0 0 0 0 q 0
und Δ(f ) = (−1)6 dis (f ) = dis (f ). Insbesondere sieht man, dass Δ(X 4 − 1) = 256 = 28 . Daher sind für char (k) = 2 alle 4-ten Einheitswurzeln verschieden, für char (k) = 2 ist
X 4 − 1 = X 4 + 1 = (X + 1)4 . In F3 [ X ] ist Δ(X 4 − 1) = 1, in F9 hat X 4 − 1 nach Beispiel 6 aus III 3.5 die vier verschiedenen Nullstellen
1 , −1 , x , −x wobei x2 + 1 = 0 .
4. GALOIS-ERWEITERUNGEN
309
4 Galois-Erweiterungen Die Galois-Theorie ist entstanden aus der Frage nach der Lösbarkeit von Polynomgleichungen durch Radikale, d.h. Formeln für die Nullstellen mit geschachtelten Wurzeln. Das grundraubende Ergebnis von war, dass es solche allgemeinen Formeln für Polynome vom Grad ≥ 5 nicht geben kann; das wird in 5 erläutert. Grundlage dafür ist die Galois-Theorie.
Abel
Galois
Die Methode von besteht darin, diejenigen Permutationen der Nullstellen eines Polynoms zu untersuchen, die sich zu Körperautomorphismen fortsetzen lassen. Das haben wir anhand von einigen Beispielen schon in III 2.4 ausgeführt. Wir beginnen mit einer Vorbereitung über Polynomringe.
4.1 Symmetrische Polynome Hat man einen Körper k und ein Polynom
f = X n + an−1 X n−1 + . . . + a1 X + a0 ∈ k[ X ] das in k[ X ] in Linearfaktoren zerfällt, so ist
f = (X − x1 ) · . . . · (X − xn )
mit
x1 , . . . , xn ∈ k .
Die Koezienten a0 , . . . , an−1 kann man ganz einfach aus den Nullstellen ausrechnen:
a0
= (−1)n x1 · . . . · xn
a1
= (−1)n−1 (x2 · x3 · . . . · xn + x1 · x3 · . . . · xn + . . . + x1 · . . . · xn−1 ) .. .
an−1
= −(x1 + . . . + xn ) .
Wurzelsatz von Vieta
Diese schon vor 1600 gefundenen Formeln bezeichnet man in der klassischen Literatur als . An dem umgekehrten Problem, Formeln für die Nullstellen aus den Koezienten zu nden, hat man sich die Zähne ausgebissen (vgl. dazu III 5). Oensichtlich sind die Koezienten nicht von der Reihenfolge der Nullstellen abhängig, d.h. sie bleiben bei einer Permutation der Nullstellen unverändert. Daher nennt man die Polynomfunktionen im Wurzelsatz symmetrisch. Anstelle der Polynomfunktionen behandeln wir lieber Polynome, den Körper können wir durch einen kommutativen Ring R mit 1 ersetzen.
elementarsymmetrischen Polynome
Für r = 0, . . . , n betrachten wir die
sr := Xi1 · . . . · Xir ∈ R[ X1 , . . . , Xn ] . 1≤i1 0; in R[ X ] gibt es aber keine irreduziblen Polynome vom Grad ≥ 3.
Beispiel
f := X 3 − 3X + 1 ist in Q[ X ] irreduzibel (Reduktion mod 2) und Δ(f ) = −(4 · (−3)3 + 27) = 81 = 92 .
Also ist Gal (f ; Q) ∼ = A3 . Will man das an den Nullstellen von f und ihren Permutationen ablesen, so muss man etwas rechnen. Wir benutzen
2π i 9 und die anderen 9-ten Einheitswurzeln (vgl. II 1.9): ζ := exp
330
III KÖRPERERWEITERUNGEN
Aus den erzeugenden Elementen der zyklischen Gruppe C9 bilden wir die reellen Summen
x1 := ζ + ζ 8 ≈ 1.532 , x2 := ζ 2 + ζ 7 ≈ 0.347 und x3 := ζ 4 + ζ 5 ≈ −1.879 . Eine elementare Rechnung ergibt
(X − x1 )(X − x2 )(X − x3 ) = X 3 − 3X + 1 = f . Dabei wird die Beziehung
ζ + ζ 2 + ζ 4 + ζ 5 + ζ 7 + ζ 8 = −(1 + ζ 3 + ζ 6 ) = 0 benutzt. Eine weitere elementare Rechnung ergibt
x2 = x21 − 2 und
x3 = −x21 − x1 + 2 .
Also ist x1 ein primitives Element des Zerfällungskörpers K = Q(x1 ) von f . Nach dem Lemma aus III 4.2 folgt ord Gal (f ; Q) = deg f = 3 , also Gal (f ; Q) ∼ = Z3 . = A3 ∼ Das Polynom X 3 − 3X + 1 wird in III 6.4 bei der Frage nach der Konstruierbarkeit des regelmäÿigen Neunecks und der Dreiteilung des Winkels von 120◦ wieder auftauchen.
4.9 Galois-Theorie endlicher Körper ∗ Die Ergebnisse der Galois-Theorie hatten wir in III 4.3 bis 4.5 unter der Voraussetzung Charakteristik Null bewiesen, weil dieser Spezialfall wesentlich einfacher darzustellen ist. Ist die Charakteristik positiv, so kann man wenigstens im Fall endlicher Körper die gesamte Galois-Theorie mit Hilfe des Frobenius-Automorphismus
ϕ : K → K , x → xp
mit
p = char (K)
331
4.9 GALOIS-THEORIE ENDLICHER KÖRPER∗
behandeln. Wir betrachten die Körpererweiterung
Fpn ⊃ Fp , n
wobei die Elemente von Fpn die Nullstellen von X p − X ∈ Fp [ X ] sind (vgl. III 3.4).
Satz
Ist
a)
ϕ der Frobenius-Automorphismus ϕ ∈ Aut (Fpn ; Fp ) und ord ϕ = n.
b)
Aut (Fpn ; Fp ) = Erz (ϕ).
Insbesondere ist Beweis
gilt
a)
Fpn ⊃ Fp
von
Fpn ,
so gilt:
eine Galois-Erweiterung und
Aut (Fpn ; Fp )
ist zyklisch.
Da Fp Primkörper ist, gilt ϕ | Fp = idFp (III 1.1). Für jedes x ∈ Fpn
ϕ(x) = xp , ϕ2 (x) = (xp )p = xp
2
und
ϕr (x) = xp
r
für
r∈N.
n
Da xp = x für alle x ∈ Fpn , folgt ord ϕ ≤ n. n Nach II 1.10 ist F× pn zyklisch von der Ordnung p − 1; es gibt also ein
y ∈ F× pn
mit
ord y = pn − 1 .
r
Daher sind die Potenzen y p für 0 ≤ r ≤ n−1 alle verschieden. Denn angenommen r
yp = yp dann wäre y p
s
−p
r
s
für
0≤r <s≤n−1;
= 1, aber ps − pr ≤ ps − 1 < pn − 1. Also folgt ord ϕ ≥ n.
b) Nach III 3.4 ist Fpn = Fp (y) ⊃ Fp eine einfache Erweiterung; dabei ist y ein erzeugendes Element von F× pn . Aus Teil c) des Lemmas in III 4.2 und der Vollkommenheit endlicher Körper (III 3.3) folgt
ord (Aut (Fpn : Fp )) = n . Somit ergibt sich die Behauptung aus Teil
a).
Nach I 3.10 kennt man die Untergruppen von Zn , sie sind von der Form
Zm < Zn , wenn n = m · s und nach III 3.4 sind alle Zwischenkörper von Fpn ⊃ Fp bekannt, das sind
Fp ⊂ Fpm ⊂ Fpn , wenn n = m · s .
2
332
III KÖRPERERWEITERUNGEN
Zusammen mit dem obigen Satz ergibt sich der
Hauptsatz der Galois-Theorie für endliche Körper
und i) ii) iii)
Sei p eine Primzahl
n ∈ N {0}. Es gibt eine eineindeutige Beziehung zwischen Den Teilern m von n; es ist n = m · s. Den Untergruppen G von Zn ; es ist ord G = m. Den Zwischenkörpern Fp ⊂ L ⊂ Fpn ; es ist L = Fpm .
Ist ϕ ∈ Aut (Fpn ; Fp ) der Frobenius-Automorphismus, so gilt Aut (Fpn ; Fpm ) = Erz (ϕm ) ∼ = Zs .
2
333
5. LÖSUNG VON POLYNOMGLEICHUNGEN∗
5 Lösung von Polynomgleichungen∗ Dieser Paragraph ist der Höhepunkt der klassischen Algebra, die Ergebnisse haben eine Geschichte von mehreren Jahrtausenden. Quadratische Gleichungen konnte man schon sehr lange lösen: mit geometrischen Methoden, die auf 1700 v.Chr. datiert werden und beschrieben in den um 800 n.Chr. entstandenen Büchern von al, der beim Kalifen von Bagdad arbeitete. Eine intensive Beschäftigung mit Gleichungen vom Grad 3 und 4 begann zur Zeit der Renaissance in Italien. Höhepunkt war die 1545 erschienene Ars magna von [Ca]. Alle Lösungsversuche für allgemeine Gleichungen vom Grad 5 schlugen fehl; um nachweisen zu können, dass es nicht gehen kann, benötigt man fortgeschrittene Techniken der Algebra. Das gelang nach Vorarbeiten von erst 1826 dem norwegischen Mathematiker . Eine genauere Antwort auf die Frage, wann eine Gleichung höheren Grades durch Radikale lösbar ist, gab 1832 der französische Mathematiker . Mehr zu dieser spannenden Geschichte ndet man etwa bei [Be] oder [vdW 2 ].
Khwarizmi
Cardano
Niels Henrik Abel Évariste Galois
Ruffini
In der Praxis haben Formeln für die Berechnung der Nullstellen aus Koezienten mit fest vorgegebenen Werten keine Bedeutung mehr; hier gibt es sehr schnelle numerische Verfahren. Aber in der Theorie können sie hilfreich sein: Etwa dann, wenn die Koezienten variabel sind, und die Abhängigkeit der Lösung davon untersucht wird. Aber in erster Linie haben die Anstrengungen zur Lösung der klassischen Probleme die Entwicklung algebraischer Methoden beügelt und neue, ganz andersartige Anwendungen gefunden.
5.1 Quadratische Gleichungen Das ist altbekannt und wird nur der Vollständigkeit halber wiederholt. Gegeben sei f = aX 2 + bX + c ∈ k[ X ] , mit a = 0 , wobei es genügt, char (k) = 2 vorauszusetzen. Um die Nullstellen von f zu nden, macht man quadratische Ergänzung :
b 2 b 2 = − ac + 2a 2a √ b 1 − 2a ± 2a b2 − 4ac .
X 2 + ab X + x1,2 = Dabei ist
Δ(f ) =
also
b2 − 4ac = (x1 − x2 )2 a2
die Diskriminante von f (vgl. Beispiel 3 in III 3.11). Ist Δ(f ) ein Quadrat in k , so liegen die Nullstellen x1 , x2 in k .
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9_15, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
334
III KÖRPERERWEITERUNGEN
5.2 Kubische Gleichungen Wir wollen hier die klassischen Lösungsformeln beschreiben und anschlieÿend ihre Beziehung zu den Galois-Gruppen untersuchen. Sei also k ein Körper mit char k = 0 (genau genommen genügt auch char k = 2, 3) und f = X 3 + pX + q ∈ k[ X ] nach Anwendung der Tschirnhaus-Transformation (III 3.10). Für die Diskriminante gilt nach Beispiel 4 aus III 3.11
Δ(f ) = −(4p3 + 27q 2 ) , sie wird durch die Tschirnhaus-Transformation nicht verändert. Weiter ist Δ(f ) = 0, falls f irreduzibel ist. Falls f reduzibel ist, gibt es bereits eine Nullstelle in k . Für das Problem der Berechnung von Nullstellen wird dieser Fall nicht ausgeschlossen. Der Trick, der wohl auf S. Dal Ferro und darin, für die gesuchte Lösung x den Ansatz
N. Tartaglia zurückgeht, besteht
x=u+v mit ebenfalls unbekannten u, v zu machen. Dadurch erscheint das Problem zunächst schwieriger zu werden, da zwei Gröÿen u und v mit f (u + v) = 0 gesucht sind. Aber die binomische Formel
(u + v)3 = u3 + 3u2 v + 3uv 2 + v 3 3
3
ergibt
3
(u + v) − 3uv(u + v) − (u + v ) = 0 , also f (x) = f (u + v) = 0 , wenn − 3uv = p und − (u3 + v 3 ) = q . Nun hilft es, wenn man zunächst nach Lösungen für u3 und v 3 sucht, denn p 3 . (Y − u3 ) · (Y − v 3 ) = Y 2 − (u3 + v 3 ) Y + u3 v 3 = Y 2 + qY − 3 Aus dem ursprünglichen kubischen Polynom f hat sich also ein quadratisches Polynom p 3 g := Y 2 + qY − ∈ k[ Y ] 3 ergeben. Dieses Hilfspolynom wird auch quadratische Resolvente genannt. Nach Beispiel 3 aus III 3.11 ist
Δ(g) = q 2 + 4
p 3 1 = − Δ(f ) . 3 27
1 die Eigenschaft ein Quadrat in k zu sein beim Man beachte, dass der Faktor − 27 Übergang von f zu g heftig verändert. Aber Lösungen von g kann man berechnen als / q 2 p 3 1$ q q y1,2 = − ± Δ(g) = − ± + . 2 2 2 2 3
5.2 KUBISCHE GLEICHUNGEN
335
Lösungen für u und v erhält man, indem man dritte Wurzeln zieht und bei deren Wahl die Nebenbedingung beachtet:
u=
√ 3
y1 , v =
√ 3
y2 , so dass 3uv = −p .
Für k = R ergibt sich durch das Vorzeichen von Δ(f ) eine Fallunterscheidung. $ Δ(f ) < 0 : Dann ist Δ(g) > 0, w := Δ(g) ∈ R+ und da jede reelle Zahl genau eine reelle dritte Wurzel hat, gibt es Lösungen / / 3 1 3 1 u1 := (−q + w) ∈ R , v1 := (−q − w) ∈ R . 2 2 Weitere Lösungen für u und v erhält man durch Multiplikation mit einer dritten Einheitswurzel, d.h. mit Potenzen von
ζ := ζ3 = exp
√ 2π i 1 = (−1 + i 3) . 3 2
Wegen der Nebenbedingung ζ r u1 · ζ s v1 = ζ r+s u1 v1 = −p ∈ R gibt es insgesamt nur die Lösungen
x1 = u1 + v1 , x2 = ζu1 + ζ 2 v1 , x3 = ζ 2 u1 + ζv1 , wobei x1 ∈ R, x2 , x3 ∈ C R mit x2 = x3 und x1 + x2 + x3 = 0.
Cardano
Explizit aufgeschrieben lautet die Formel von für die reelle Lösung: 1 1 / / q 2 p 3 q 2 p 3 q q 3 3 x1 = − + + + − − + 2 2 3 2 2 3
Δ(f ) = 0 : Als Lösungen der quadratischen Resolvente g erhält man / q q y1 = y2 = − ; sei u = 3 − ∈ R . 2 2 Dann ergeben sich als Nullstellen von f
x1 = u + u = 2u
und
x2 = ζu + ζ 2 u = ζ 2 u + ζu = x3 .
Ist q = 0, so ist x1 = x2 und x1 ist einfache, x2 doppelte Nullstelle von f . Für q = 0 ist auch p = 0, also x1 = x2 = x3 = 0 eine dreifache Nullstelle.
Δ(f ) > 0 : Dann ist Δ(g) < 0 und g hat keine reelle Nullstelle. Daher nennt man dies in der klassischen Literatur den casus irreducibilis . Sind δ1 , δ2 ∈ C mit δ1 = δ2 die Wurzeln von Δ(g) ∈ R, die man nach Hilfsaussage 3 aus III 4.7 berechnen kann, so sind y1 =
1 (−q + δ1 ) 2
und
y2 =
1 (−q + δ2 ) mit y1 = y2 2
336
III KÖRPERERWEITERUNGEN
die nicht reellen komplexen Nullstellen von g . Nun stöÿt man auf das Problem, aus komplexen Zahlen dritte Wurzeln ziehen zu müssen. Das geht nicht mehr wie in III 4.7 bei Quadratwurzeln komplexer Zahlen mit Hilfe von Quadratwurzeln reeller Zahlen. Am einfachsten benutzt man Polarkoordinaten:
y = |y| · exp(iϕ) = |y| · (cos ϕ + i sin ϕ) und $ $ w = 3 |y| · exp( i3ϕ ) = 3 |y| · (cos ϕ3 + i sin ϕ3 ) , so ist y = w3 = (ζw)3 = (ζ 2 w)3 . In den klassischen Verfahren hat man dafür Tabellen für die trigonometrischen Funktionen verwendet. Durch geeignete Auswahl der möglichen Werte erhält man
ui , vi ∈ C mit u3i = y1 , vi3 = y2 , ui = vi und ui vi = −
p . 3
Das ergibt schlieÿlich die drei reellen Lösungen
xi = ui + vi ∈ R der Gleichung f (x) = 0 . Zunächst fassen wir das Ergebnis über die Lage der Nullstellen noch einmal zusammen (vgl. Beispiel 4 aus III 3.11).
Satz Sei f
:= X 3 + aX 2 + bX + c ∈ R[ X ] und Δ(f ) = a2 b2 − 4a3 c − 4b3 + 18abc − 27c2
die Diskriminante. Dann gilt: Ist Δ(f ) > 0, so hat f drei verschiedene reelle Nullstellen. Ist Δ(f ) = 0, so hat f drei reelle Nullstellen, mindestens eine davon mehrfach. Ist Δ(f ) < 0, so hat f eine reelle und zwei verschiedene komplex-konjugierte Nullstellen. 2 Es mag auf den ersten Blick verwunderlich erscheinen, dass man im Fall Δ(f ) > 0 zur Berechnung der drei reellen Nullstellen xi von f mit komplexen Zahlen rechnen muss. Der Grund dafür ist die Umkehr des Vorzeichens in
Δ(f ) = −27Δ(g) . Zur Betrachtung der Lösungen aus der Sicht der Galois-Theorie ist es interessanter f ∈ Q[ X ] vorauszusetzen; dann liegen die Nullstellen x1 , x2 , x3 von f im Zerfällungskörper K ⊃ Q von f . Hier ist nur der Fall interessant, in dem f irreduzibel ist. Dann ist 6 oder S3 oder ∼ . [K : Q] = und Gal (f ; Q) = A3 3 Nach III 4.8 ist Gal (f ; Q) ∼ = A3 genau dann, wenn Δ(f ) ∈ Q in Q ein Quadrat ist, d.h. wenn δ(f ) := (x1 − x2 ) · (x1 − x3 ) · (x2 − x3 ) ∈ Q .
337
5.3 BEISPIELE
Bei der oben durchgeführten Berechnung der Nullstellen xi haben wir die dritten Einheitswurzeln benötigt, das sind die Nullstellen von X 3 − 1, und die brauchen keine Nullstellen von f zu sein. Will man die Formeln von Cardano aus der Sicht der Galois-Theorie beleuchten, so ist es angemessen den Zerfällungskörper K von f · (X 2 + X + 1) zu betrachten. Dann hat man folgendes Diagramm:
K(ζ)
=
Q(x1 , x2 , x3 )
=
K ∪ K
⊃ ⊃
L ∪ Q.
=
Q(δ(f ), ζ)
Für die Körpergrade gilt nach dem Gradsatz aus III 1.2
[ K : K ] teilt 2 , [ L : Q ] teilt 4 und [ K : L ] = 3 . Zur Berechnung der xi benutzt man
δ(g) = Da ζ ∈ L, ist auch
i
√
$ Δ(g) = y1 − y2
und
ζ=
√ 1 (−1 + i 3) . 2
3 ∈ L, also
δ(g) = −
i
√
9
3 · δ(f ) ∈ L
und
L = Q(δ(g), ζ) .
Um die Nullstellen xi mit Hilfe von δ(g) und ζ zu erhalten, benötigt man noch die Erweiterung K ⊃ L vom Grad 3. Da Aut (K ; L) = Z3 , folgt aus III 5.9, dass K von einer dritten Wurzel eines Elements aus L erzeugt wird. Das ist der theoretische Hintergrund der konkreten Formel von Cardano.
5.3 Beispiele
Beispiel 1
Das Polynom
f = X 3 − 8X − 3
338
III KÖRPERERWEITERUNGEN
hat schon Cardano als Beispiel behandelt. Wie man schnell sieht, ist 3 eine Nullstelle und f = (X − 3)(X 2 + 3X + 1) . Wir wollen aber, Cardano folgend, die Nullstellen nach seiner Methode berechnen. Zunächst ist Δ(f ) = 1 805 > 0, also hat f drei reelle Nullstellen. Die quadratische Resolvente ist 3 805 mit Δ(g) = − 1 27 < 0 und den Nullstellen g(Y ) = Y 2 − 3Y + 83 2 5 y1,2 = 32 ± i · 19 6 3 .
Das Besondere an diesem Beispiel ist, dass man dritte komplexe Wurzeln leicht angeben kann: / / 1 5 5 1 8 u := (3 + i · ) , v := (3 − i · ), u·v = . 2 3 2 3 3 Etwa mit Hilfe der binomischen Formel kontrolliert man, dass u3 = y1 und v 3 = y2 . Also ist x=u+v =3 √ als Nullstelle von f neu berechnet. Die beiden anderen Nullstellen sind 12 (−3± 5).
Beispiel 2
Wir wollen die Nullstellen von
f = X 3 + X 2 − 2X − 1 mit
Δ(f ) = 49 > 0
nach der Methode von Cardano bestimmen; das Ergebnis ist entscheidend bei der Berechnung der 7-ten Einheitswurzeln (Beispiel 2 in III 5.14). Zunächst ergibt die Tschirnhaus-Transformation
˜− 7 ˜3 − 7X f˜ = X 3 27
f
mit
˜ = X + 1 , also p = − 7 , q = − 7 . X 3 3 27
f˜
339
5.4 GLEICHUNGEN VIERTEN GRADES
Als quadratische Resolvente erhält man
g =Y2− y1,2 =
7 54
3 + 79 √ ± i · 79 3 . 7 27 Y
und
Δ(g) = − 49 27 , also
Aus diesen komplexen Zahlen muss man dritte Wurzeln ziehen, jeweils eine Lösung ist √ 3 y 1,2 ≈ 0.790 ± i · 0.392 , also
p 7 =− . 9 3 Daraus erhält man schlieÿlich die gröÿte Nullstelle von f , nämlich x ˜1 = u1 + v1 ≈ 1.580 , u1 · v1 = 0.777 . . . =
x1 = x ˜1 −
1 ≈ 1.247 . 3
Mit Hilfe von ζ3 erhält man die beiden anderen Nullstellen von f .
Beispiel 3
Um auch ein ganz einfaches Beispiel mit negativer Diskriminante auszuführen, wählen wir
f = X 3 − 1 mit
Δ(f ) = −27 .
Die quadratische Resolvente ergibt
g = Y 2 − Y = Y (Y − 1) , also y1 = 0 , y2 = 1 . √ √ Daher ist u = 3 y1 = 0, für v = 3 1 erhält man die drei Werte v1 = 1 = x1 , v2 = ζ3 = x2 und v3 = ζ32 = x3 , das sind in der Tat die Nullstellen von f .
5.4 Gleichungen vierten Grades Gegeben ist ein Polynom
f = X 4 + a3 X 3 + a2 X 2 + a1 X + a0 ∈ k[ X ] , wobei k ein Körper der Charakteristik Null sei. Gesucht sind Hilfsmittel zur Berechnung der Nullstellen und Aussagen über die Struktur der Galois-Gruppe. Ist f reduzibel, so unterscheiden wir zwei Fälle:
1.
f = (X − a) · g mit a ∈ k und g ∈ k[ X ]. Dann ist deg g = 3, das führt zurück zu kubischen Polynomen.
2.
f = g · h mit g, h ∈ k[ X ], deg g = deg h = 2. Falls die Zerfällungskörper von g und h gleich sind, führt das zurück zu einem quadratischen Polynom. Andernfalls ist der Zerfällungskörper von f gleich K = k(x, y)
mit
g(x) = h(y) = 0 , g(y) = 0 und
h(x) = 0 ,
340
III KÖRPERERWEITERUNGEN
also [ K : k ] = 4. Eine derartige Erweiterung K ⊃ k wird oft biquadratisch genannt. Wenn man die Zerlegung f = g · h kennt, kann man nach III 5.1 die Nullstellen
x1 , x2 von g
und
y1 , y2 von h
und
ϕ(y1 ) = y1 oder y2 .
berechnen. Ist ϕ ∈ Gal (f ; k), so ist
ϕ(x1 ) = x1 oder x2
Daraus folgt wie in Beispiel 3 aus III 2.4 die
Bemerkung
Ist
K⊃k
eine biquadratische Erweiterung, so ist
Aut (K; k)
Kleinsche Vierergruppe.
eine
2
Nun setzen wir voraus, dass f irreduzibel ist; nach einer Tschirnhaus-Transformation ist dann f = X 4 + pX 2 + qX + r ∈ k[ X ] . Wegen char (k) = 0 ist Δ(f ) = 0, aber wir haben noch keine explizite Formel für Δ(f ), falls p = 0 (vgl. Beispiel 5 in III 3.11). Zur Berechnung der Nullstellen von f hilft nun ein Trick, der auf einem Schüler von Cardano, zurückgeht. Aus
L. Ferrari,
X 4 = −pX 2 − qX − r folgt durch Einführung einer neuen Unbestimmten Y und quadratische Ergänzung
X 4 + X 2 Y + 14 Y 2 = −pX 2 − qX − r + X 2 Y + 14 Y 2 , also (X 2 + 12 Y )2 = (Y − p)X 2 − qX + ( 14 Y 2 − r) Die rechte Seite ist gleich
(∗)
2 √ 2 Y − p X + 14 Y 2 − r , wenn −q =
$ (Y − p) · (Y 2 − 4r) ,
und daraus folgt durch Quadrieren
Y 3 − pY 2 − 4rY + (4rp − q 2 ) = 0 . Diese Bedingung ist nach den formal nicht ganz begründeten Operationen mit Wurzeln ein kubisches Polynom. Man nennt
g := Y 3 − pY 2 − 4rY + (4rp − q 2 ) ∈ k[ Y ] eine kubische Resolvente von f . Entscheidend dabei ist, dass der Grad von 4 auf 3 reduziert wurde.
341
5.4 GLEICHUNGEN VIERTEN GRADES
Der weitere Lösungsweg ist ziemlich klar. Ist y eine Nullstelle von g , die man etwa mit der Formel von Cardano berechnet hat, so folgen aus (∗) die Gleichungen 2 √ X 2 + 12 y = ± y − p X + 14 y 2 − r , also 2 √ X 2 ± y − p X ± 14 y 2 − r + 12 y = 0 . Jede hat zwei Lösungen, das ergibt insgesamt vier Lösungen 2 $ √ x1,2 = − 12 y − p ± 12 −y − p − 2 y 2 − 4r 2 $ √ x3,4 = 12 y − p ± 12 −y − p + 2 y 2 − 4r der Gleichung f (x) = 0. Man kann die kubische Resolvente auch etwas anders wählen, dann werden die Formeln einfacher. Die hier getroene Wahl ist günstig zur Beleuchtung des theoretischen Hintergrundes. Im Zerfällungskörper K von f hat man die Nullstellen x1 , x2 , x3 , x4 mit
x1 + x 2 + x 3 + x 4 = 0 ; da f irreduzibel ist, sind sie alle verschieden. Nun betrachtet man in K die Elemente y1 := x1 x2 + x3 x4 , y2 := x1 x3 + x2 x4 , y3 := x1 x4 + x2 x3 und das Polynom
g˜(Y ) := (Y − y1 ) · (Y − y2 ) · (Y − y3 ) ∈ K[ Y ] . Die Gruppe S4 der Permutationen von {x1 , x2 , x3 , x4 } operiert auch auf {y1 , y2 , y3 }. Da S4 von den Transpositionen erzeugt wird, genügt es, das dafür zu prüfen. Nun ist Gal (f ; k) < S4 , also hat g˜ Koezienten in Fix (K; Gal (f ; k)) = k und g˜ ∈ k[ Y ]. Mehr als erfreulich ist der
Satz 1
g˜
ist gleich der kubischen Resolvente von
g
von
f,
d.h.
(Y − y1 ) · (Y − y2 ) · (Y − y3 ) = Y 3 − pY 2 − 4rY + (4rp − q 2 ) . Dazu ist nur eine elementare, aber leider etwas mühsame Rechnung nötig, die man am besten einem Computer-Algebra-System überlässt. Man berechnet die Koezienten von g˜ und von g als Polynome in den xi und vergleicht die Ergebnisse. Besonders einfach geht das für den Koezienten von Y 2 : Beweis
−(y1 + y2 + y3 ) =
1≤i<j≤4
xi xj = −p .
2
342
III KÖRPERERWEITERUNGEN
Die nächste angenehme Überraschung kommt von den Diskriminanten. Sei (xi − xj ) und δ(g) := (yi − yj ) . δ(f ) := 1≤i<j≤4
Satz 2
Ist
g
1≤i<j≤3
die kubische Resolvente von
δ(f ) = δ(g) ,
Beweis
f,
so gilt
insbesondere
Δ(f ) = Δ(g) .
Hier ist die Rechnung zum Glück ganz kurz:
(x1 − x2 ) · (x3 − x4 ) = y2 − y3 , (x1 − x3 ) · (x2 − x4 ) = y1 − y3 , (x1 − x4 ) · (x2 − x3 ) = y1 − y2 . 2
Korollar
Ist
4
2
f = X + pX + qX + r,
so gilt
Δ(f ) = 16p4 · r − 4p3 · q 2 − 128p2 · r2 + 144p · q 2 · r − 27q 4 + 256r3 .
Man benutzt die Formel für Δ(g) aus Beispiel 4 in III 3.11 und setzt die Koezienten aus Satz 1 ein. Auch das lässt man besser rechnen. 2 Beweis
Die kubische Resolvente ist nicht nur wichtig für die Berechnung der Nullstellen, sie liefert auch wichtige Informationen über die Galoisgruppe
G := Gal (f ; k) = Aut (K; k) < S4 . Da f irreduzibel ist, operiert G nach dem Lemma aus III 4.2 transitiv auf {x1 , x2 , x3 , x4 }; also folgt 4 teilt ord G. Daher kommen für G folgende Gruppen in Frage: S4 L | 11B1 BLBLLL | || 11 BBBLLLL || 11 BB LLL | | 11 BBB LLL A40 BB LLL 11 LLL BB 00 11 LLL BB 00 11 B LLL B 00 00 D4 D D 00 AAnnnn 4 iBiBiiii 4 CC } i CC 00 nnAA iii BBB }} CC BB }} nnnniniiiiAiAiAA 00 CC } B i n }nniiii }i ni Z4 Z4 Z4 K4 Jede nach oben gerichtete Verbindung zeigt dabei an, dass die weiter unten liegende Gruppe eine Untergruppe ist. Zunächst beschreiben wir die Gruppen genauer.
5.4 GLEICHUNGEN VIERTEN GRADES
343
A4 < S4 ist die alternierende Gruppe, K4 = {id, (1, 2) · (3, 4), (1, 3) · (2, 4), (1, 4) · (2, 3)} ist eine Kleinsche Vierergruppe, Z4 = Erz (1, 2, 3, 4), Z4 = Erz (1, 3, 2, 4), Z4 = Erz (1, 3, 4, 2) sind konjugierte zyklische Gruppen und D4 = Erz (Z4 ∪(1, 3)), D4 = (Z4 ∪(1, 2)), D4 = Erz (Z4 ∪(1, 4)) sind konjugierte Diedergruppen, das sind die drei 2-Sylowgruppen von S4 (vgl. I 6.12). Es sei daran erinnert, dass man A4 bzw. die Diedergruppen D4 als Symmetriegruppen eines Tetraeders bzw. eines Quadrates ansehen kann.
D4
A4
Die anderen zu K4 isomorphen Untergruppen, etwa {id, (1, 2), (3, 4), (1, 2) · (3, 4)}, operieren nicht transitiv. Wie man leicht nachprüft, ist
K4 = D4 ∩ D4 ∩ D4 . Wir wollen nun untersuchen, welche Informationen über die Galoisgruppe G in der kubischen Resolvente g zu nden sind. Dazu betrachten wir die Operation von S4 auf der Menge {y1 , y2 , y3 } der Nullstellen von g . Nach dem Bahn-Lemma aus I 4.3 ist für i = 1, 2, 3 ord S4 = (ord S4 (yi )) · (ord StaS4 (yi )) . Da die Operation transitiv ist, folgt aus ord S4 = 24 und ord S4 (yi ) = 3, dass ord StaS4 (yi ) = 8 . Für y1 = x1 x2 + x3 x4 ist oensichtlich D4 < StaS4 (y1 ), also StaS4 (y1 ) = D4 . Das kubische Polynom g ist genau dann reduzibel, wenn eine Nullstelle, etwa y1 , in k liegt. Weiter gilt:
y1 ∈ k = Fix (K; G) ⇔ G < StaS4 (y1 ) .
344
III KÖRPERERWEITERUNGEN
Also folgt: g reduzibel ⇔ G ∼ = D4 oder Z4 oder K4 . In III 4.8 wurde gezeigt: δ(f ) ∈ k ⇔ G < An . Diese beiden Ergebnisse kann man in einer Tabelle zusammenfassen:
Satz 3 Sei
k ein Körper mit char (k) = 0, f ∈ k[ X ] irreduzibel mit deg f = 4 und Nullstellen x1 , x2 , x3 , x4 im Zerfällungskörper. Weiter sei δ(f ) :=
(xi − xj )
und
g ∈ k[ Y ]
1≤i<j≤n
die kubische Resolvente von f . Dann gilt für G := Gal (f ; k):
δ(f ) ∈ /k
δ(f ) ∈ k
g irreduzibel
G = S4
G = A4
g reduzibel
G∼ = D4 oder Z4
G = K4 2
Ist g reduzibel und δ(f ) ∈ / k , so können beide Fälle auftreten.
5.5 Beispiele Wir bestimmen die Galois-Gruppen einiger Polynome vierten Grades. Die reellen Graphen sind nur deswegen abgebildet, um jede Illusion zu zerstören, man könnte daran genauere Informationen über die Struktur der Galois-Gruppen ablesen.
Beispiel 1
f := X 4 + X + 1 ∈ Q[ X ]
ist irreduzibel, wie man durch Reduktion modulo 2 sieht (Beispiel 5 in II 3.9). Die kubische Resolvente von f ist
g = Y 3 − 4Y − 1 .
5.5 BEISPIELE
345
Auch g ist irreduzibel, wie man durch Reduktion modulo 3 leicht nachweist. Schlieÿlich ist Δ(f ) = Δ(g) = −(4 · (−4)3 + 27) = 229 . Das ist kein Quadrat in Q, also folgt aus dem Kriterium in III 5.4 Gal (X 4 + X + 1; Q) ∼ = S4 .
Beispiel 2
f := X 4 + 8X + 12 ∈ Q[ X ] ist irreduzibel, wie man mit etwas Mühe unter Benutzung von Zusatz 2 aus II 3.7 zeigen kann.
Die kubische Resolvente ist
g = Y 3 − 48Y − 64 . Wie man durch Reduktion modulo 5 sehen kann, ist g irreduzibel. Für die Diskriminante erhält man
Δ(f ) = Δ(g) = −(4 · (−48)3 + 27 · 642 ) = 331 776 = 5762 . Nach dem Kriterium in III 5.4 folgt Gal (X 4 + 8X + 12; Q) ∼ = A4 .
346
III KÖRPERERWEITERUNGEN
Beispiel 3
f := X 4 − 2
ist irreduzibel nach
Eisenstein. Die kubische Resolvente ist g := Y 3 + 8Y = Y (Y 2 + 8) .
Für die Diskriminante gilt
Δ(f ) = Δ(g) = −(4 · 83 ) = −2048 , das ist kein Quadrat. Also ist Gal (f ; Q) isomorph zu D4 oder Z4 . Da √ √ X 4 − 2 = (X 2 − 2) · (X 2 + 2) , √ ist K := Q( 4 2, ) der Zerfällungkörper von f über Q, also ist
i
ord (Gal (f ); Q) = [K : Q] = 8
und es folgt
Gal (X 4 − 2; Q) ∼ = D4 .
Beispiel 4
f := X 4 + X 3 + X 2 + X + 1 ∈ Q[ X ]
347
5.5 BEISPIELE
ist irreduzibel nach Beispiel 4 aus III 3.9, die Nullstellen sind primitive 5-te Einheitswurzeln. Der Zerfällungskörper von f ist
K = Q(ζ5 )
mit
[K : Q] = deg f = 4 .
Also ist Gal (f ; Q) isomorph zu Z4 oder K4 . Mit Hilfe der Diskriminante könnte man entscheiden, welcher Fall vorliegt, aber das geht einfacher: Man betrachte
σ ∈ Aut (Q(ζ5 ); Q)
mit
σ(ζ5 ) = ζ52 .
Da σ 2 (ζ5 ) = ζ54 = ζ5 , muss ord σ = 4 sein; also folgt Gal (X 4 + X 3 + X 2 + X + 1; Q) ∼ = Z4 . Ein allgemeineres Ergebnis über Kreisteilungspolynome wird in III 5.6 bewiesen.
Beispiel 5
f := X 4 − 2X 2 + 9 ∈ Q[ X ]
ist nach Beispiel 3 aus III 4.6 Minimalpolynom über Q von Die kubische Resolvente von f ist
√
i
2+ , also irreduzibel.
g := Y 3 + 2Y 2 − 36Y − 72 = (Y − 6)(Y + 2)(Y + 6) , also reduzibel. Für die Diskriminante erhält man
Δ(f ) = Δ(g) = 147 456 = 3842 . Also folgt aus dem Kriterium in III 5.4 Gal (X 4 − 2X 2 + 9; Q) ∼ = K4 ∼ = Z2 × Z 2 . Das kann man natürlich auch direkter sehen. Der Zerfällungskörper von f ist √ K = Q( 2, i) mit [K : Q] = 4 , und K ist auch Zerfällungskörper von f˜ = (X 2 − 2) · (X 2 + 1) ∈ Q[ X ] . Daher ist K ⊃ Q eine biquadratische Erweiterung, und die Behauptung folgt aus der Bemerkung in III 5.4.
348
III KÖRPERERWEITERUNGEN
5.6 Kreisteilung in Charakteristik Null Schon bei verschiedenen Gelegenheiten hatten wir in C die n-ten Einheitswurzeln benutzt. Sie sind das Bild des Homomorphismus
ϕ : Z → C , r → ζnr , wobei ζn := exp
2π i . n
Das ergibt einen Isomorphismus
ϕ : Z/nZ → Cn = {1, ζn , ζn2 , . . . , ζnn−1 } ⊂ C× . Man beachte dabei, dass die Gruppe Zn = Z/nZ additiv, Cn dagegen multiplikativ ist. Die Gruppe Cn ist die Menge der komplexen Nullstellen des Polynoms (II 1.9)
X n − 1 ∈ Z[ X ] , die Elemente von Cn heiÿen n-te Einheitswurzeln über Q. Da Cn von ζn erzeugt wird, ist Q(ζn ) ⊃ Q Zerfällungskörper von X n − 1 über Q. Ein wichtiges Problem ist die Berechnung des Körpergrades [Q(ζn ) : Q], d.h. die Bestimmung des Minimalpolynoms Φn ∈ Q[ X ] von ζn . Zunächst ist nur klar, dass Φn ein Teiler von X n − 1 sein muss. In I 3.10 hatten wir gesehen, dass
Zn = Erz (m + nZ) ⇔ ggT (m, n) = 1 . Die erzeugenden Elemente von Zn sind also die Elemente der Primrestklassengruppe Zn× (vgl. I 3.12), es gilt ord Zn× = ϕ(n). Dem entsprechend ist
Cn× := {ζnm : ggT (m, n) = 1} ⊂ Cn die Menge der erzeugenden Elemente von Cn , man nennt sie primitive
wurzeln.
Einheits-
Zn× ist eine multiplikative Gruppe, dem entsprechend ist auch Cn× eine Gruppe mit der Veknüpfung ζnm ∗ ζnr = (ζnm )r = ζnm·r . Die Multiplikation in Zn× wird durch die Exponentialfunktion in die Potenz gehoben. Für die Anzahl der Elemente gilt ord Cn× = ϕ(n) . Wir notieren noch einige elementare Eigenschaften von Einheitswurzeln, die sofort aus den entsprechenden Regeln für zyklische Gruppen (insbesondere I 3.10 und 11) folgen.
Bemerkung b) d|n ⇒
Cd×
a) Cm < Cn ⇔ m|n. = {ξ ∈ Cn : ord ξ = d}.
349
5.6 KREISTEILUNG IN CHARAKTERISTIK NULL
c) Cn =
Cd× und diese Vereinigung ist disjunkt.
2
d|n
Seien nun Cn× = {ξ1 , . . . , ξϕ(n) }, wobei die primitiven Einheitswurzeln ξi in einer beliebigen Reihenfolge aufgeschrieben sind. Dann nennt man
Φn := (X − ξ1 ) · . . . · (X − ξϕ(n) )
Kreisteilungspolynom über Q. Zunächst weiÿ man nur Φ
das n-te gilt aber das
Lemma Beweis
n
∈ C[ X ]. Es
Für alle n ∈ N {0} ist Φn ∈ Z[ X ] und normiert.
Aus der obigen Bemerkung folgt sofort Φd = Φn · Φd . Xn − 1 = d|n
d|n d 0 Im vorhergehenden Abschnitt haben wir zur Vereinfachung die Einheitswurzeln nur in Charakteristik Null behandelt. Bei positiver Charakteristik geht einiges analog, aber es gibt deutliche Unterschiede. Wir starten mit einer Primzahl p, dem Primkörper Fp und einem n ∈ N {0}. Ist
K ⊃ Fp Zerfällungskörper von X n − 1 ∈ Fp [ X ] , so heiÿt jede Nullstelle x ∈ K von X n − 1 eine n-te Einheitswurzel über Fp . Mit Cn ⊂ K bezeichnen wir die Menge der n-ten Einheitswurzeln; als multiplikative Untergruppe Cn < K ist Cn zyklisch . Im Gegensatz zur Charakteristik Null kann aber ord Cn < n sein:
Bemerkung
Ist
n = pr m
mit
p m,
C n = Cm
Beweis
so gilt
und
ord Cn = m .
Da m|n, ist Cm < Cn . Umgekehrt folgt aus r
r
0 = xn − 1 = (xm )p − 1 = (xm − 1)p , dass xm − 1 = 0 , also auch Cn < Cm . Im Fall p m ist
(X m − 1) = mX m−1 = 0 , also hat X m − 1 in K nach III 3.1 insgesamt m verschiedene Nullstellen.
2
Ist etwa n = p , so ist x = 1 die einzige n-te Einheitswurzel über Fp . r
Ganz analog zu III 5.6 erhält man das
Korollar 1
die Menge der
p n, K ⊃ Fp der Zerfällungskörper Nullstellen von X n − 1. Dann gilt
a) Die Gruppe
Cn
Sei
ist zyklisch der Ordnung
von
Xn − 1
und
Cn ⊂ K
n.
b) Es gibt einen kanonischen Monomorphismus von Gruppen
χ : Aut (K; Fp ) → Zn× wenn
ϕ(ζ) = ζ r
mit
für ein erzeugendes Element
χ(ϕ) = r + nZ , ζ ∈ Cn .
2
Die obige Bemerkung zeigt, dass die Voraussetzung p n angemessen ist. Dann hat Cn als zyklische Gruppe erzeugende Elemente ξ1 , . . . , ξϕ(n) , und man kann, wie in Charakteristik Null, das n-te Kreisteilungspolynom
Φ(p) n := (X − ξ1 ) · . . . · (X − ξϕ(n) )
353
5.7 KREISTEILUNG IN CHARAKTERISTIK P > 0 (p)
erklären. Zunächst ist nur Φn ∈ K[ X ] klar; wie man leicht sieht, ist aber
Φ(p) n ∈ Fp [ X ] , (p)
und Φn entsteht aus Φn ∈ Z[ X ] durch Reduktion der Koezienten modulo p. (p)
Im Gegensatz zu Φn ∈ Z[ X ] kann aber Φn reduzibel sein; das hängt von p und n ab, und darüber hinaus vom Grundkörper Fq mit q = pr . Genauer gilt:
Satz Sei p n, q = pr und m := ord (q + nZ)
in Zn× ,
wobei Zn× die multiplikative Primrestklassengruppe mod n bezeichnet. Dann gilt: (p)
Φn zerfällt in Fq [ X ] in Grad m.
ϕ(n) m
paarweise nicht assoziierte irreduzible Faktoren vom
(p)
Der Aufspaltung von Φn entsprechend zerfällt also die Menge der ϕ(n) primitiven n-ten Einheitswurzeln in ϕ(n) m Teilmengen mit jeweils m Elementen. Im Extremfall q ≡ 1 (mod n) ist m = 1.
Beweis Die irreduziblen Faktoren von Φ(p) n sind die Minimalpolynome der paar-
weise verschiedenen primitiven n-ten Einheitswurzeln ξ1 , . . . , ξϕ(n) über Fp . Also genügt es zu zeigen, dass für jedes dieser ξ
m := [Fq (ξ) : Fq ] = ord (q + nZ) =: m . Das ist oensichtlich ein Fall für die Galois-Theorie. Nach III 3.4 ist Fq (ξ) ∼ = Fqm , nach III 4.9 ist
Fqm ⊃ Fq
galoissch und
Aut (Fqm ; Fq ) = Erz (ψ) ;
dabei ist ψ = ϕr , wobei ϕ den Frobenius-Homomorphismus mit ϕ(x) = xp bezeichnet, also r ψ(x) = ϕr (x) = xp = xq . Mit dem Monomorphismus
χ : Aut (Fqm ; Fq ) → Zn×
wird
χ(ψ) = q + nZ .
Nach dem Hauptsatz der Galois-Theorie und der Denition von ord ψ ist
m = ord Erz (ψ) = ord (ψ) = m . 2
Korollar 2
(p) Φn
ist genau dann irreduzibel in Fp [ X ], wenn Zn× zyklisch und
p + nZ ein erzeugendes Element von Zn× ist.
Ob Zn× zyklisch ist, hängt von n ab. Etwa in [R-S-V, [M-P, Aufgabe 7.10] ndet man das folgende abschlieÿende Ergebnis:
12] oder
354
III KÖRPERERWEITERUNGEN
Satz Die Primrestklassengruppe
Zn×
ist genau dann zyklisch, wenn n die Werte
1, 2, 4, pr , 2pr
mit einer ungeraden Primzahl p und einer beliebigen Potenz r ≥ 1 hat. Beispiel 1 Die 7-ten Einheitswurzeln über F2 können wir aus der Darstellung von F8 (Beispiel 4 in III 3.5) ablesen. Zunächst ist ord (2 + 7 Z) = 3
in
Z7× ∼ = Z6 .
Dem entsprechend hat man in F2 [ X ] die Zerlegung
X 6 + X 5 + X 4 + X 3 + X 2 + X + 1 = (X 3 + X + 1)(X 3 + X 2 + 1) . Ist ζ ∈ F8 eine Nullstelle von X 3 + X + 1, so hat man unter dem FrobeniusAutomorphismus ϕ von F8 mit ϕ(x) = x2 die Bahnen
{ζ, ζ 2 , ζ 4 }
und
{ζ 3 , ζ 6 , ζ 5 }
F8 .
in
Mit Hilfe der Regeln für Addition und Multiplikation in F8 berechnet man
(X − ζ)(X − ζ 2 )(X − ζ 4 ) = X 3 + X + 1 3
6
5
3
und
2
(X − ζ )(X − ζ )(X − ζ ) = X + X + 1 . Das sind die Minimalpolynome der zwei Klassen von primitiven 7-ten Einheitswurzeln über F2 . Man beachte, dass F2 (ζ) = F2 (ζ 3 ), denn (ζ 3 )5 = ζ .
Beispiel 2
Wir bestimmen die 5-ten Einheitswurzeln über F3 . Dazu betrachten wir das Kreisteilungspolynom (3)
Φ5 = X 4 + X 3 + X 2 + X + 1 ∈ F3 [ X ] . Wie man leicht nachprüft, ist ord (3 + 5 Z) = 4
in
Z5× ∼ = Z4 .
355
5.8 REINE POLYNOME (3)
Daraus folgt, dass Φ5
in F3 [ X ] irreduzibel ist, und (3) Gal (Φ5 ; F3 ) ∼ = Z4 . (3)
Wenn wir F3 zu F9 erweitern, dann zerfällt Φ5 quadratische Faktoren, denn ord (9 + 5 Z) = 2
in
in F9 [ X ] in zwei irreduzible
Z5× .
Um die Faktoren explizit angeben zu können, betrachten wir den Zerfällungskörper (3) K ⊃ F3 von Φ5 . Da
[K : F3 ] = 4 , ist
K∼ = F34 = F81
nach III 3.4. Ist ζ ∈ K eine primitive 5-te Einheitswurzel, so ist
C5 = {1, ζ, ζ 2 , ζ 3 , ζ 4 } ⊂ F81 . Weiter gilt in F81 [ X ] (3)
Φ5 = (X − ζ)(X − ζ 4 )(X − ζ 2 )(X − ζ 3 ) = = (X 2 − (ζ + ζ 4 )X + 1) · (X 2 − (ζ 2 + ζ 3 )X + 1) =: f1 · f2 . Sei nun ψ ∈ Aut (F81 ; F3 ) mit ψ(ζ) = ζ 9 . Dann ist
ψ(ζ + ζ 4 ) = (ζ + ζ 4 )9 = ζ 4 + ζ
und
ψ(ζ 2 + ζ 3 ) = (ζ 2 + ζ 3 )9 = ζ 3 + ζ 2 ,
also liegen die Koezienten von f1 und f2 wegen ord (ψ) = 2 in Fix (F81 ; Erz (ψ)) = F9 und es folgt f1 , f2 ∈ F9 [ X ]. Der Körper F9 ist in Beispiel 6 aus III 3.5 aufgelistet, die Koezienten a = ζ +ζ 4 und b = ζ 2 +ζ 3 aus F9 kann man bis auf die Reihenfolge (d.h. bis auf einen Körperautomorphismus) ausrechnen. Da √ (a − 1)2 = (b − 1)2 = −1 , ist a, b = ± −1 + 1 . Nun ist die −1 aus F3 gleich y 4 = (−1, 0) ∈ F9 , somit √ −1 = ±y 2 = ±(1, −1) und a = (−1, 1) = y 3 , b = (0, 1) = y .
5.8 Reine Polynome Unter den Polynomgleichungen f (x) = 0 kann man diejenigen der reinen Form xn = a durch Wurzelziehen, also √ x= na
356
III KÖRPERERWEITERUNGEN
√ lösen. Der Ausdruck n a ist jedoch mehrdeutig; für a ∈ C× gibt es n verschiedene Wurzeln, ihre Quotienten sind n-te Einheitswurzeln. Um formal präziser zu sein, nennt man f := X n − a ∈ k[ X ] ein reines Polynom über k . Ist b ∈ K ⊃ k und bn = a für ein n ∈ N {0}, so heiÿt b ein Radikal (oder eine Wurzel ) von a. Auch aus der Sicht der GaloisTheorie sind die reinen Polynome sehr übersichtlich. Wir beschränken uns wieder auf Charakteristik Null. Die Argumente bleiben gültig, wenn p = char (k) kein Teiler von n ist. Was wir in Beispiel 4 aus III 2.4 für das Polynom X 3 − 2 überlegt hatten, ist ein charakteristischer Spezialfall des folgenden allgemeinen Ergebnisses:
Satz über reine Polynome Sei char (k) = 0, a ∈ k× , n ≥ 1, Zerfällungskörper von X n − a , und L := k(ζ) ⊃ k Zerfällungskörper von X n − 1 , K⊃k
wobei ζ eine primitive n-te Einheitswurzel bezeichnet. Dann gilt: a) K ⊃ L ⊃ k ist Zwischenkörper. b) Ist b ∈ K mit bn = a, so folgt K = L(b), insbesondere X n − a = (X − b) · (X − ζb) · . . . · (X − ζ n−1 b)
in K[ X ] .
c) Es gibt einen kanonischen Monomorphismus χ : Aut (K; L) → Zn ;
er ist Isomorphismus, falls X n − a in L[ X ] irreduzibel ist. d) Ist k = Q und X n − a irreduzibel in Q(ζ)[ X ], so hat man einen Isomorphismus Gal (X n − a; Q) → Zn Θ Zn× ,
wobei die Operation Θ von Zn× auf Zn für das semidirekte Produkt durch den Isomorphismus Aut (Zn ) → Zn× gegeben ist (vgl. I 3.12). Man beachte, dass die Erweiterungen K ⊃ k , L ⊃ k und K ⊃ L galoissch sind; dagegen ist k(b) ⊃ k im Allgemeinen nicht galoissch. Deswegen ist es geschickter, zunächst ζ und erst danach b zu adjungieren! Aussage d) zeigt, dass aus abelschen Galoisgruppen von L ⊃ k und K ⊃ L eine nicht abelsche Galoisgruppe von K ⊃ k werden kann.
Beweis a) Da (X n − a) = nX n−1 und a = 0, hat X n − a nach dem Lemma aus
III 3.1 die paarweise verschiedenen Nullstellen b1 , . . . , bn ∈ K × . Daher sind auch
1=
b1 b2 bn , ,..., b1 b 1 b1
mit
b i n a = =1 b1 a
paarweise verschieden; also enthält K alle Nullstellen von X n − 1.
5.9 ZYKLISCHE ERWEITERUNGEN
357
b) Ist klar, wenn wir in a) annehmen, dass
b = b1 , ζ =
b2 br+1 , ζr = . b1 b1
Dann ist ζ r b = br+1 .
c) Zu jedem ϕ ∈ Aut (K; L) gibt es genau ein r ∈ {0, . . . , n − 1}, so dass
ϕ(b) = ζ r b ; man deniert χ(ϕ) := r + n Z ∈ Zn . Diese Abbildung χ ist ein Homomorphismus, denn aus
ψ(b) = ζ s b folgt
(ϕ ◦ ψ)(b) = ζ s · ζ r b = ζ r+s b .
Ist ϕ(b) = ζ 0 b = b, so ist ϕ = idK , also ist χ injektiv. Nach III 2.2 folgt, dass χ surjektiv ist, falls X n − a ∈ L[ X ] irreduzibel ist. Sind ϕ , ψ ∈ Aut (K; Q), so gibt es nach dem Korollar aus III 5.6 m, l, r, s ∈ {0, . . . , n − 1} mit ggT (m, n) = ggT (l, n) = 1, so dass
d)
ϕ(ζ) = ζ m , ψ(ζ) = ζ l , ϕ(b) = ζ r b , ψ(b) = ζ s b . Daraus folgt
ϕ(ψ(ζ)) = ϕ(ζ l ) = (ζ m )l = ζ ml und ϕ(ψ(b)) = ϕ(ζ s b) = ϕ(ζ s ) · ϕ(b) = ζ ms · ζ r · b = ζ r+ms · b .
(∗)
Die Operation von Zn× auf Zn ist gegeben durch Θm (s) = m · s, also wird die Multiplikation in Zn Θ Zn× beschrieben durch
(r, m) ∗Θ (s, l) = (r + ms, m · l) . Vergleicht man das mit (∗), so erhält man sofort den gesuchten Isomorphismus. 2
5.9 Zyklische Erweiterungen Mit Hilfe der Galois-Theorie kann man aus Eigenschaften von Gruppen Aussagen über Körpererweiterungen erhalten. In diesem Abschnitt behandeln wir ein wichtiges Werkzeug für diese Methode. Eine Körpererweiterung K ⊃ k heiÿt zyklisch, wenn gilt 1) K ⊃ k ist galoissch 2) Aut (K; k) ist zyklisch Falls genügend viele Einheitswurzeln verfügbar sind, folgt eine Eigenschaft der Körpererweiterung.
358
III KÖRPERERWEITERUNGEN
Satz über zyklische Erweiterungen Sei k ein Körper mit char (k) = 0 und K ⊃ k eine Körpererweiterung, n := [K : k]. Ist K ⊃ k zyklisch und enthält k eine primitive n-te Einheitswurzel, so gibt es ein mit bn ∈ k und K = k(b) .
b∈K
K ist also Zerfällungskörper des reinen Polynoms X n − bn ∈ k[ X ].
Hilbert
Dieses Ergebnis kann man aus dem berühmten Satz 90 von ableiten (vgl. etwa [La, VIII, 6]). Wir vermeiden hier die Einführung der dazu nötigen Begrie und gehen einen direkteren Weg. Das wesentliche technische Hilfsmittel ist das Folgende. Ist K ein Körper und M eine Menge, so wird die Menge Abb (M, K) := {f : M → K} zu einem K -Vektorraum, indem man die Werte der Abbildungen addiert und mit Skalaren multipliziert. Abb (M, K) hat unendliche Dimension, falls M unendlich ist. Jeder Automorphismus ϕ ∈ Aut (K) hat eine Beschränkung
ϕ|K × : K × → K × , das ist insbesondere ein Homomorphismus der multiplikativen Gruppen. Wir bezeichnen die Beschränkung wieder mit ϕ und betrachten Aut (K) ⊂ Abb (K × , K) als Teilmenge. Entscheidend ist das
Lemma von Artin Sind ϕ1 , . . . , ϕn ∈ Aut (K) paarweise verschieden, so sind ϕ1 , . . . , ϕn in Abb (K × , K) linear unabhängig.
Beweis durch Induktion über n (vgl. [ArE, II F]). Ist λϕ = 0 mit
λ ∈ K , so folgt 0 = λϕ(1) = λ .
Sei also n ≥ 2 und seien λ1 , . . . , λn ∈ K , so dass
(∗)
λ1 ϕ1 (x) + λ2 ϕ2 (x) + . . . + λn ϕn (x) = 0
für alle x ∈ K × . Da die ϕ1 , . . . ϕn verschieden sind, können wir annehmen, dass es ein a ∈ K × gibt mit ϕ1 (a) = ϕn (a) . Nun kann man einerseits in (∗) ax für x einsetzen, andererseits mit ϕn (a) multiplizieren. Das ergibt
λ1 ϕ1 (a)ϕ1 (x) + . . . + λn−1 ϕn−1 (a)ϕn−1 (x) + λn ϕn (a)ϕn (x) = 0 λ1 ϕn (a)ϕ1 (x) + . . . + λn−1 ϕn (a)ϕn−1 (x) + λn ϕn (a)ϕn (x) = 0 .
und
359
5.9 ZYKLISCHE ERWEITERUNGEN
Durch Subtraktion erhält man
λ1 (ϕ1 (a) − ϕn (a))ϕ1 (x) + . . . + λn−1 (ϕn−1 (a) − ϕn (a))ϕn−1 (x) = 0 für alle x ∈ K × . Nach Induktionsannahme folgt insbesondere
λ1 (ϕ1 (a) − ϕn (a)) = 0 , also λ1 = 0 . Trägt man das in (∗) ein, so folgt wieder aus der Induktionsannahme
λ2 = . . . = λn = 0 . 2 Ein Blick auf den Beweis zeigt, dass man ihn genauso führen kann, wenn H eine Halbgruppe und ϕi : H → K × für i = 1, . . . , n Homomorphismen von Halbgruppen sind, d.h. ϕ(a · b) = ϕ(a) · ϕ(b) . für a, b ∈ H . Solche Abbildungen von H nach K × nennt man
Beweis des Satzes über zyklische Erweiterungen
Charaktere
Nach Voraussetzung ist
Aut (K; k) = {idK , ϕ, ϕ2 , . . . , ϕn−1 } . Ist ζ ∈ k eine primitive n-te Einheitswurzel, so betrachte man die Linearkombination ψ := 1 · idK + ζϕ + ζ 2 ϕ2 + . . . + ζ n−1 ϕn−1 ∈ Abb (K × , K) . Nach dem Lemma von
Artin ist ψ = 0, also gibt es ein x ∈ K × , so dass
b := ψ(x) = x + ζϕ(x) + . . . + ζ n−1 ϕn−1 (x) = 0 in Diese Funktion von x nennt man eine
K.
Lagrangesche Resolvente . Nun ist
ϕ(b) = ϕ(x) + ζϕ2 (x) + . . . + ζ n−1 x , also ζϕ(b) = b
und
ϕ(b) = ζ −1 b .
Daraus folgt ϕ(bn ) = ϕ(b)n = ζ −n bn = bn und ϕr (bn ) = bn für alle r ∈ N. Also ist
bn ∈ Fix (K; Aut (K; k)) = k . Um noch K = k(b) zu zeigen, betrachten wir das Minimalpolynom f ∈ k[ X ] von b. Da 0 = f (ϕr (b)) = f (ζ −r b) für r = 0, . . . n − 1 , hat f mindestens n verschiedene Nullstellen, also ist
[k(b) : k] = deg f ≥ n , somit k(b) = K . Schlieÿlich ist wegen (ζ r b)n − bn = 0 für r = 0, . . . , n − 1
X n − bn = (X − b)(X − ζb) · . . . · (X − ζ n−1 b) = f . 2
360
III KÖRPERERWEITERUNGEN
5.10 Lösbarkeit von Polynomgleichungen
Das Ziel der klassischen Verfahren zur Lösung von Polynomgleichungen war gewesen, die Nullstellen durch die Operationen in Körpern und Wurzelziehen zu berechnen. Als Ergebnis suchte man nach Formeln mit geschachtelten Wurzelausdrücken, wie sie für Polynome vom Grad ≤ 4 auch gefunden wurden. Von einem etwas abstrakteren Standpunkt führt das zu folgenden Begrien. Eine Körpererweiterung K ⊃ k heiÿt Radikalerweiterung , wenn es eine Kette K = Lr ⊃ . . . ⊃ Li ⊃ Li−1 ⊃ . . . ⊃ L0 = k
von Zwischenkörpern gibt, so dass es für jedes i = 1, . . . , r ein bi ∈ Li und ein gibt, so dass Li = Li−1 (bi ) und bni ∈ Li−1 . Li entsteht also aus Li−1 durch Adjunktion der Nullstelle bi eines reinen Polynoms X n −ai ∈ Li−1 [ X ], oder durch Ziehen einer ni -ten Wurzel aus einem ai ∈ Li−1 . Ein Polynom f ∈ k[ X ] (oder in der klassischen Formulierung eine Polynomgleichung f (x) = 0) heiÿt durch Radikale lösbar , wenn es zum Zerfällungskörper L ⊃ k von f eine Radikalerweiterung K ⊃ k gibt, so dass
ni ∈ N
i
i
K⊃L⊃k.
Man beachte, dass nach dieser Denition das Polynom X n − 1, also auch die Kreisteilungspolynome, durch Radikale lösbar sind. Damit ist nicht bewiesen, dass sich die n-ten Einheitswurzeln durch geschachtelte Wurzeln berechnen lassen. Auf diese Frage kommen wir in III 5.13 zurück. Mit Hilfe der Galois-Theorie kann man diese Frage auf eine leichter zu entscheidende Aufgabe der Gruppentheorie zurückführen: Theorem Ist k ein Körper mit char (k) = 0, so sind für ein Polynom f ∈ k[ X ] folgende Bedingungen gleichwertig: i)
f
ist durch Radikale lösbar.
Gal (f ; k) ist auösbar. Ein technisches Problem beim Beweis entsteht dadurch, dass bei der Denition einer Radikalerweiterung nichts darüber vorausgesetzt wird, dass die Erweiterungen in der Körperkette galoissch sein sollen. Das ist dem Problem angemessen. In der Praxis hat sich schon bei der Lösung von Polynomgleichungen kleinen Grades gezeigt, dass passende Einheitswurzeln unentbehrlich sind. Um die Galois-Theorie anwenden zu können, benötigt man Galois-Erweiterungen. Daher benutzen wir zwei Hilfsaussagen, die anschlieÿend gezeigt werden. Lemma 1 Zu jeder gegebenen Radikalerweiterung ii) Die Galoisgruppe
K = L r ⊃ . . . ⊃ L i ⊃ . . . ⊃ L0 = k
5.10 LÖSBARKEIT VON POLYNOMGLEICHUNGEN
361
existiert eine modizierte Radikalerweiterung
K = Ls ⊃ . . . ⊃ Lj ⊃ . . . L0 = k ⊃ k mit folgenden Eigenschaften: a) K ⊃ K und K ⊃ k ist eine galoissche Radikalerweiterung. b) Lj ⊃ Lj−1 ist für j = 1, . . . , s zyklisch, insbesondere galoissch. c) k = k(ζ), wobei ζ für geeignetes N ∈ N eine primitive N -te Einheitswurzel ist. Insbesondere ist k ⊃ k galoissch und Aut (k ; k) abelsch.
Lemma 2 Sei L2 ⊃ L1 eine Galois-Erweiterung und ζ eine primitive n-te Einheitswurzel. Dann ist auch die Erweiterung L2 (ζ) ⊃ L1 (ζ)
galoissch,
und Aut (L2 (ζ); L1 (ζ)) < Aut (L2 ; L1 ). i) ⇒ ii) Gegeben ist eine Körperkette K ⊃ L ⊃ k , wobei K ⊃ k eine Radikalerweiterung und L ⊃ k Zerfällungskörper von f ist. Zu der nach Lemma 1 existierenden Körpererweiterung K ⊃ k gehört nach dem Hauptsatz der Galois-Theorie aus III 4.5 eine Normalreihe
Beweis des Theorems
{idK } Aut (K ; Ls−1 ) . . . Aut (K ; Lj ) . . . Aut (K ; k ) Aut (K ; k) . Aus dem Isomorphismus Aut (K ; Lj−1 )/Aut (K ; Lj ) ∼ = Aut (Lj ; Lj−1 ) folgt, dass diese Faktorgruppe zyklisch ist; die Faktorgruppe Aut (K ; k)/Aut (K ; k ) ∼ = Aut (k ; k) ist abelsch. Also ist Aut (K ; k) auösbar. Da L ⊃ k als Zerfällungskörper galoissch ist, folgt Aut (L; k) ∼ = Aut (K ; k)/Aut (K ; L) . Nach I 7.4 ist auch Gal (f ; k) = Aut (L; k) auösbar. ii) ⇒ i) Ist L ⊃ k Zerfällungskörper von f ∈ k[ X ], so gibt es nach Voraussetzung eine Normalreihe
{idL } = Nr Nr−1 . . . Ni Ni−1 . . . N0 = Aut (L; k) = Gal (f ; k) .
(∗)
derart, dass die Faktorgruppen Ni−1 /Ni zyklisch sind (vgl. I 7.4). Zu (∗) gehört nach dem Hauptsatz der Galois-Theorie (III 4.5) eine Körperkette
L = Lr ⊃ Lr−1 ⊃ . . . ⊃ Li ⊃ Li−1 ⊃ . . . ⊃ L0 = k ,
362
III KÖRPERERWEITERUNGEN
wobei Li := Fix (L; Ni ), derart dass
Li ⊃ Li−1 galoissch ist und Aut (Li ; Li−1 ) ∼ = Ni−1 /Ni . Ni−1 /Ni ist zyklisch, ord (Ni−1 /Ni ) teilt n := ord Gal (f ; k). Um den Satz über zyklische Erweiterungen aus III 5.9 anwenden zu können, adjungieren wir zu k eine primitive n-te Einheitswurzel ζ . Nach Lemma 2 ist Li (ζ) ⊃ Li−1 (ζ) galoissch und Aut (Li (ζ); Li−1 (ζ)) < Aut (Li ; Li−1 ) , also ist die Erweiterung Li (ζ) ⊃ Li−1 (ζ) zyklisch. Nach III 5.9 gibt es ein bi ∈ Li (ζ) und einen Teiler ni von n, so dass bni i ∈ Li−1 (ζ) und Li = Li−1 (bi ). Insgesamt erhält man ein Diagramm
L(ζ) ∪ L
⊃
Lr−1 (ζ)
⊃
...
⊃
Li (ζ)
⊃
...
⊃
L0 (ζ) = k(ζ) ⊃ k
Da ζ n ∈ k , ist k(ζ) ⊃ k und somit auch L(ζ) ⊃ k eine Radikalerweiterung; damit ist i) bewiesen. 2 Wir haben gerade benutzt, dass die Eigenschaft Radikalerweiterung zu sein, transitiv ist. Für die Eigenschaft galoissch ist das nach Beispiel 1 aus III 4.6 nicht der Fall. Das hat man zu bedenken beim Zunächst betrachten wir die bi ∈ Li und die Exponenten ni ∈ N mit bni i ∈ Li−1 ; wir setzen N = n1 · . . . · nr . Im Fall k ⊂ C sei
Beweis vom Lemma 1
ζ := exp
2π i und k := k(ζ) ⊂ C . N
Im allgemeinen Fall betrachten wir den Zerfällungskörper k ⊃ k von X N − 1. Nach II 1.11 gibt es eine primitive N -te Einheitswurzel ζ ∈ k , so dass k = k(ζ). Aussage c) folgt daher aus III 5.6. Die Existenz der Radikalerweiterung K ⊃ k zeigen wir nun durch Induktion über r. Für r = 0 ist K = k ⊃ k eine galoissche Radikalerweiterung. Angenommen, wir sind schon bei Lr−1 angekommen. Zur Vereinfachung der Bezeichnungen setzen wir L = Lr−1 , und wir betrachten das Diagramm
K ∪ K
⊃ ⊃
L ∪ L
⊃ ⊃
k ∪ k.
Dabei ist die Radikalerweiterung L ⊃ k mit Eigenschaft b) bereits konstruiert, L ⊃ k ist galoissch. K als Erweiterung von K und L ist noch zu konstruieren.
L ⊃ k ist Zerfällungskörper eines Polynoms f ∈ k[ X ] und K = L(b) mit bn ∈ L, wobei n = nr . Der Trick ist nun die Denition von g := X n − ϕ(bn ) ∈ L [ X ] , wobei G := Aut (L ; k) . ϕ∈G
5.11 DIE ALLGEMEINE POLYNOMGLEICHUNG
363
Die Koezienten von g sind invariant unter der Operation von G, also sind sie in Fix (L ; G) = k enthalten, d.h. g ∈ k[ X ]. Nun können wir K ⊃ k als Zerfällungskörper von f · g ∈ k[ X ] erkären. K enthält nicht nur die n-ten Wurzeln von a = bn ∈ L , sondern auch die von den Bildern ϕ(a) für alle ϕ ∈ G. Oensichtlich ist L ⊂ K ; da g(b) = 0, folgt auch K ⊂ K . Wegen der speziellen Form von g ist K ⊃ L , und somit auch K ⊃ k eine Radikalerweiterung. Ist
K ⊃ . . . ⊃ Lj ⊃ Lj−1 ⊃ . . . ⊃ L einer der neu konstruierten Zwischenschritte, so ist
Lj = Lj−1 (bj )
mit
bj ∈ Lj
und
bm ∈ Lj−1 ,
wobei m Teiler von n und damit von N ist. Da dann Lj−1 die m-ten Einheitswurzeln enthält, folgt aus III 5.8, dass Lj ⊃ Lj−1 eine zyklische Erweiterung ist. 2
Beweis von Lemma 2 L2 ⊃ L1 ist nach III 4.4 Zerfällungskörper eines Polynoms f ∈ L1 [ X ], die Erweiterungen Li (ζ) ⊃ Li sind für i = 1, 2 Zerfällungskörper von X n − 1 ∈ Li [ X ]. Also ist L2 (ζ) ⊃ L1 Zerfällungskörper von f · (X n − 1) ∈ L1 [ X ] , daher ist diese Erweiterung galoissch, somit auch L2 (ζ) ⊃ L1 (ζ). Oensichtlich ist Aut (L2 (ζ); L1 (ζ)) < Aut (L2 (ζ); L1 ). Die Erweiterungen
L2 (ζ) ⊃ L2 ⊃ L1 sind galoissch; nach III 4.5 gilt also ϕ(L2 ) = L2 für ϕ ∈ Aut (L2 (ζ); L1 ). Also folgt
ϕ ∈ Aut (L2 (ζ); L1 (ζ)) ⇒ ϕ ∈ Aut (L2 ; L1 ) .
2
5.11 Die allgemeine Polynomgleichung Von einer Formel zur Berechnung der Nullstellen eines Polynoms aus den Koezienten erwartet man, dass sie für beliebige Koezienten gültig ist. Formalisiert bedeutet das, dass man die Koezienten als Unbestimmte betrachtet. Genauer gesagt, geht man vom Polynomring k[ S1 , . . . , Sn ] über zum Quotientenkörper k(S1 , . . . , Sn ) und man nennt
f := X n − S1 X n−1 + . . . + (−1)n Sn ∈ k(S1 , . . . , Sn )[ X ] das Polynom n-ten Grades mit allgemeinen Koezienten über dem Grundkörper k . Der Sinn der alternierenden Vorzeichen und die Wahl der Buchstaben
364
III KÖRPERERWEITERUNGEN
Si für die Unbestimmten wird gleich klar werden. Über einem Zerfällungskörper K ⊃ k(S1 , . . . , Sn ) ist f = (X − x1 ) · . . . · (X − xn )
mit
x1 , . . . , xn ∈ K = k(x1 , . . . , xn ) .
Dabei wird benutzt, dass die Koezienten von f die elementarsymmetrischen Funktionen der Nullstellen sind (vgl. III 4.1). Dieses allgemeine Polynom hat eine maximale Galoisgruppe:
Satz
Ist
f ∈ k(S1 , . . . , Sn )[ X ]
das Polynom
n-ten
Grades mit allgemeinen
Koezienten, so hat man einen Isomorphismus
Gal (f ; k(S1 , . . . , Sn )) → Sn . Beweis
Als Hilfsmittel benutzen wir das Polynom
g := (X − X1 ) · . . . · (X − Xn ) ∈ k(X1 , . . . , Xn )[ X ] mit allgemeinen Nullstellen . Die Gruppe Sn operiert auf k[ X1 , . . . , Xn ] durch Permutation der Unbestimmten Xi , damit auch auf k(X1 , . . . , Xn ). Aus dem Hauptsatz über symmetrische Polynome aus III 4.1 folgt Fix (k(X1 , . . . , Xn ); Sn ) = k(s1 , . . . , sn ) . Nach III 4.4 folgt, dass k(X1 , . . . , Xn ) ⊃ k(s1 , . . . , sn ) galoissch ist, und Gal (g; k(s1 , . . . , sn )) ∼ = Sn . Um daraus die Galoisgruppe von f zu erhalten, betrachten wir das Diagramm von Körpererweiterungen:
k(x1 , . . . , xn ) ∪ k(S1 , . . . , Sn ) ∩ k(S1 , . . . , Sn )[ X ] f
Ψ
←− ϕ
−→ →
k(X1 , . . . , Xn ) ∪ k(s1 , . . . , sn ) ∩ g ∈ k(s1 , . . . , sn )[ X ]
Dabei sind die Homomorphismen ϕ und Ψ durch Einsetzen erklärt, also
ϕ(Si ) = si
und
Ψ(Xi ) = xi .
Zu zeigen ist, dass ϕ und Ψ Isomorphismen sind, und dass Ψ−1 eine Fortsetzung von ϕ ist. Oensichtlich ist ϕ surjektiv. Dass ϕ injektiv ist, wissen wir schon aus dem Hauptsatz in III 4.1; es folgt jedoch noch einmal neu, denn die Beschränkung von Ψ auf k(s1 , . . . , sn ) kehrt ϕ um. Da ϕ die Koezienten von f auf die Koezienten von g abbildet, ist Ψ eine Fortsetzung von ϕ−1 auf die Zerfällungskörper von g und f und somit Isomorphismus; also ist Gal (f ; k(S1 , . . . , Sn )) ∼ = Gal (g; k(s1 , . . . , sn )) ∼ = Sn .
2
Da die symmetrische Gruppe Sn für n ≥ 5 nach I 7.6 nicht auösbar ist, folgt nach III 5.10 das
365
5.12 GLEICHUNGEN FÜNFTEN GRADES UND DAS IKOSAEDER
Korollar Die Gleichung n-ten Grades mit allgemeinen Koezienten ist für n ≥ 5 nicht durch Radikale lösbar. Dieses Ergebnis geht zurück auf Arbeiten von Ruffini (1799), schlieÿlich Galois (1831, veröentlicht 1846, siehe [G]).
Abel (1824) und
5.12 Gleichungen fünften Grades und das Ikosaeder Obwohl die allgemeine Gleichung vom Grad 5 nicht durch Radikale lösbar ist, könnte man zunächst noch hoen, dass die Polynome in verschiedene Klassen zerfallen, für die sich jeweils ein spezielles Lösungsverfahren durch Radikale nden lieÿe. Dass auch dieser Ausweg verbaut ist, zeigen spezielle Polynome vom Grad 5
f ∈ Z[ X ]
mit
Gal (f ; Q) ∼ = S5 .
Satz Sei f ∈ Q[ X ] irreduzibel mit deg f = 5. Hat f in seinem Zerfällungskörper genau drei reelle Nullstellen, so ist Gal (f ; Q) ∼ = S5 .
Beispiel
Das Polynom
g := X(X 2 − 2)(X 2 + 2) = X 5 − 4X ∈ Z[ X ] √ √ hat die drei reellen Nullstellen 0, ± 2 und die zwei komplexen Nullstellen ± 2. Die Nullstellen von / 4 4 4 g = 5X − 4 sind ± ≈ ±0.946 , g(±0, 946) ≈ ∓3.026 . 5
i
Also hat auch
f := g + 2 = X 5 − 4X + 2 ∈ Z[ X ]
genau drei Nullstellen; auÿerdem ist f nach Eisenstein irreduzibel.
g(x) = x5 − 4x
f (x) = x5 − 4x + 2
366
III KÖRPERERWEITERUNGEN
Beweis des Satzes
Da f irreduzibel ist, folgt nach Teil b) des Lemmas aus III 4.2, dass ord Gal (f ; Q) durch 5 teilbar ist. Für den Zerfällungskörper K ⊃ Q von f gilt
K = Q(x1 , x2 , x3 , x4 , x5 )
mit
x 1 , x2 , x3 ∈ R , x 4 , x 5 ∈ C R ,
und da f ∈ Q[ X ] ist x4 = x5 . Also ist K invariant unter der komplexen Konjugation τ , die x1 , x2 , x3 fest lässt. In S5 ist τ eine Transposition. Damit folgt der Satz aus dem
Lemma Sei p eine Primzahl und G < Sp eine Untergruppe mit folgenden Eigenschaften:
1) 2)
teilt ord G. G enthält eine Transposition. p
Dann ist G = Sp . Beweis Nach dem Satz von Cauchy aus I 6.11 gibt es ein σ ∈ G mit ord σ = p.
Nach dem Bahn-Lemma aus I 4.3 muss
ord {σ n (1) : n ∈ Z} = p sein, also ist σ ein p-Zyklus und man kann die Nummerierung so wählen, dass σ = (1, . . . , p). Weiter können wir annehmen, dass τ = (1, i) mit i ∈ {2, . . . , p}. Da p Primzahl ist, können wir σ durch σ i−1 ersetzen und wegen σ i−1 (1) = i genügt es den Fall σ = (1, . . . , p) und τ = (1, 2) zu betrachten. Damit kann sich die Transposition ausbreiten:
(2, 3) = (1, . . . , p) · (1, 2) · (1, . . . p)−1 ∈ G , (3, 4) = (1, . . . , p) · (2, 3) · (1, . . . p)−1 ∈ G , u.s.w. (1, 3) = (1, 2) · (2, 3) · (1, 2) ∈ G (1, 4) = (1, 3) · (3, 4) · (1, 3) ∈ G , u.s.w. und schlieÿlich (i, j) = (1, i) · (1, j) · (1, i) ∈ G für i, j ∈ {2, . . . , p} mit i = j . Damit enthält G alle Transpositionen und G = Sp folgt nach dem Korollar aus I 4.5. 2 Das Ergebnis, wonach Polynomgleichungen vom Grad fünf und höher nicht durch Radikale lösbar sind, ist zunächst negativ. Es entsteht aber danach die Frage nach anderen Hilfsmitteln zur Lösung. Damit haben sich im 19. Jahrhundert viele Mathematiker beschäftigt, besonders Felix Klein. Zunächst einmal ist nach III 4.8 klar, dass man für ein f ∈ k[ X ] nach Adjunktion von δ(f ) zu k annehmen kann, dass Gal (f ; k) < An . Für n = 5 hat man die Ikosaedergruppe A5 . Mit Hilfe einer Operation von A5 auf der Riemannschen Zahlenkugel P = C ∪ {∞} konstruiert Klein eine Ikosaedergleichung
5.12 GLEICHUNGEN FÜNFTEN GRADES UND DAS IKOSAEDER
367
3 ga = (Y 20 + 1) − 228(Y 15 − Y 5 ) + 494Y 10 + 1728aY 5 (Y 10 + 11Y 5 − 1)5 ∈ k[ Y ] . Das ist ein Polynom vom Grad 60 = ord A5 mit einem Parameter a ∈ k . Er beweist dann, dass nach eventuellen quadratischen Erweiterungen die Nullstellen von f mit Gal (f ; k) ∼ = A5 durch Adjunktion von Nullstellen y von ga für geeignetes , a ∈ k erhalten werden können. Das Polynom ga ist eine Art von allerdings vom Grad 60, aber von einer sehr speziellen Form und mit nur einem von f abhängigen Parameter a. Und schlieÿlich kann man die Nullstellen y von ga durch erhalten, das sind Potenzreihen der Form
Resolvente
hypergeometrische Reihen 1+
∞
a(a + 1) · . . . · (a + n − 1) b (b + 1) · . . . · (b + n − 1) n z n! c (c + 1) · . . . · (c + n − 1) n=1
mit Parametern a, b, c ∈ C, wobei −c ∈ N.
Klein
Diese Untersuchungen von sind zusammengefasst in [Kl 1 ]; eine sehr schöne Einführung ndet man in [Sl]. Um die Neugier der Leser zu steigern, reproduzieren wir eine Abbildung aus [Kl 1 ], die das Bild eines Ikosaeders unter der stereographischen Projektion von der Zahlenkugel auf die komplexe Ebene zeigt.
Eine Hälfte der Dreiecke ist schraert, damit man die Wirkung der orientierungserhaltenden Symmetrien des Ikosaeders aus A5 besser verfolgen kann (siehe I 5.5).
368
III KÖRPERERWEITERUNGEN
5.13 Darstellung von Einheitswurzeln Das einfachste Beispiel eines reinen Polynoms ist X n − 1, sein Zerfällungskörper ist Q(ζn ) ⊃ Q. Daher ist nach der in III 5.10 gegebenen Denition das Kreisteilungspolynom Φn durch Radikale lösbar, denn ζnn = 1 ∈ Q. Die Darstellung √ n ζn = 1 sagt aber nichts aus über die möglichen Werte von ζn , denn die n-te Wurzel ist eine mehrdeutige Funktion. Um mit ζn zu rechnen, kann man die Darstellung
ζn = exp
2π 2π 2π i = cos + i sin n n n
mit Hilfe von trigonometrischen Funktionen, also von Potenzreihen verwenden. In der klassischen Literatur gibt es schärfere Denitionen von Radikalerweiterungen (vgl. etwa [vdW1 , 62]) durch die das Wurzelziehen eingeschränkt wird. Aber schon bei der Lösung kubischer Gleichungen mit Hilfe der Formeln von Cardano muss man im casus irreducibilis dritte Wurzeln aus komplexen Zahlen ziehen, was im Allgemeinen nur mit Hilfe von Polarkoordinaten geht. Das Ziehen solcher Wurzeln wird eine irrationale Resolvente genannt. Vom praktischen Standpunkt ist das auch nicht aufwändiger als das Ziehen der Wurzel aus einer reellen Zahl. Beides erfordert analytische Methoden, d.h. in diesem Fall Grenzwerte. Wir wollen nicht tiefer in diese Fragen des Purismus einsteigen, sondern etwas zu dem speziellen Problem ausführen, ob und wie man ζn durch Wurzelausdrücke beschreiben kann. Denn diese Frage steht in engem Zusammenhang mit dem Problem der Konstruierbarkeit des regelmäÿigen n-Ecks und wurde von Gauss in Sektion VII seiner Disquisitiones Arithmeticae behandelt. Dass es solche Formeln gibt, weiÿ man für spezielle Werte von n aus der elementaren Trigonometrie:
ζ3 ζ4 ζ6 ζ8 ζ12
= cos = cos = cos = cos = cos
2π 3 π 2 π 3 π 4 π 6
+ i · sin + i · sin + i · sin + i · sin + i · sin
2π 3 π 2 π 3 π 4 π 6
√
= − 12 + i 23 , = i , √ 1 = √2 + i √23 , = √22 + i 22 , = 23 + i 12 .
Etwa für n = 5 oder n = 7 ist die Darstellung schwieriger (vgl. III 5.14, Beispiele 1 und 2). Wir beschränken uns zunächst auf den Fall einer Primzahl p. Ist ζ ∈ C eine primitive p-te Einheitswurzel, so ist nach III 5.6
G := Aut (Q(ζ) : Q) = {ϕ1 , ϕ2 , . . . , ϕp−1 }
mit
ϕi (ζ) = ζ i .
Da G nach II 1.11 zyklisch ist, gibt es mindestens ein l ∈ {2, . . . , p − 1}, so dass
G = {id, ψ, . . . , ψ p−2 }
für
ψ = ϕl .
369
5.13 DARSTELLUNG VON EINHEITSWURZELN
Ein solches l nennt man in der klassischen Literatur eine Primitivzahl mod p. Da G nach dem Lemma aus III 4.2 auf den primitiven Einheitswurzeln einfach transitiv operiert, kann man sie durch ψ in folgende Reihenfolge bringen: 2
ξ0 := ζ , ξ1 := ψ(ζ) = ζ l , ξ2 := ψ 2 (ζ) = ζ l , . . . , ξp−2 := ψ p−2 (ζ) = ζ l
p−2
.
Durch diese Notation ist die Wirkung von ψ einfach in den Indizes auszudrücken:
ψ(ξi ) = ξi+1
und
ψ r (ξi ) = ξi+r , i ∈ {0, . . . , p − 2} ,
wobei in den Exponenten multiplikativ mod p und in den Indizes additiv mod p−1 gerechnet wird. Ist nun p − 1 = d · m, so ist die zu Zd isomorphe Untergruppe von G gleich
H = Erz (ψ m ) = {id, ψ m , . . . , ψ (d−1)m } < G . Für i = {0, . . . , p − 2} ist die Bahn von ξi unter H gleich
H(ξi ) = {ξi , ξi+m , . . . , ξi+(d−1)m } . Für die m disjunkten Bahnen der Länge d bilden wir die
Bahnsummen
ηj := ξj + ξj+m + . . . + ξj+(d−1)m , j = 0, . . . , m − 1 . Man nennt η0 , . . . , ηm−1 auch
Gauss'sche Perioden . Oensichtlich gilt
η0 , . . . , ηm−1 ∈ K = Fix (Q(ζ); H) . Auÿerdem folgt aus ψ(ηj ) = ηj+1 , dass ϕ(ηj ) = ηj für ϕ ∈ G H . Also ist für alle j Aut (Q(ζ); Q(ηj )) = H
und somit
K = Q(ηj ) .
Damit haben wir Folgendes bewiesen:
Satz über die Gauss'schen Perioden Sei p eine Primzahl, ζ ∈ C eine primitive p-te Einheitswurzel und m ein Teiler von p − 1. Für den eindeutig bestimmten Zwischenkörper Q(ζ) ⊃ K ⊃ Q
mit [K : Q] = m gilt K = Q(ηj )
für jede der Gauss'schen Perioden η0 , . . . , ηm−1 .
2
Man kann sogar zeigen, dass (η0 , . . . , ηm−1 ) eine Basis des Q-Vektorraumes K ist.
Korollar Für jede Primzahl p ist eine primitive p-te Einheitswurzel ζp ∈ C durch geschachtelte Wurzeln darstellbar.
Wir haben darauf verzichtet, eine formale Denition von geschachtelten Wurzeln zu geben. Der Beweis und die Beispiele werden das Ergebnis erklären.
370
III KÖRPERERWEITERUNGEN
Da für verschiedene Primzahlen p, q nach I 3.9
ζpq = ζp ζq ist, kann man die Einheitswurzeln auch für alle n mit
n = p1 · . . . · pr , p1 , . . . , pr paarweise verschieden, berechnen. Den Fall n = pr wollen wir hier nicht weiter verfolgen, daraus folgt dann die Darstellbarkeit für alle n (vgl. dazu etwa [Fr, p. 418]). Eine Ausnahme ist der Fall p = 2: Die Einheitswurzeln
ζ2 r ∈ C sind ganz einfach durch geschachtelte Quadratwurzeln darstellbar.
Beweisskizze für das Korollar Primfaktorzerlegung
Wir benutzen die bis auf Reihenfolge eindeutige
p − 1 = q 1 · . . . · qr .
In der zyklischen Gruppe G = Aut (Q(ζp ); Q) der Ordnung p − 1 gibt es eindeutig bestimmte Untergruppen mit
Hi < G
ord Hi = q1 · . . . · qi
für
i = 1, . . . , r .
Damit erhält man eine Normalreihe
{id} H1 . . . Hi−1 . . . Hr = G . Daraus konstruieren wir das folgende Diagramm von Körpererweiterungen:
Q (ζ) ∪ Q(ζ)
⊃ ⊃
K1 ∪ K1
⊃ ... ⊃ ⊃ ... ⊃
Ki−1 ∪ Ki−1
⊃ ⊃
Ki ∪ Ki
⊃ ... ⊃ ⊃ ... ⊃
Kr ∪ Kr
= =
Q ∪ Q
Dabei ist Ki = Fix (Q(η); Hi ), also [Ki−1 : Ki ] = qi . Nach dem Satz über die Gauss'schen Perioden ist
Ki = Q(η (i) ) , wobei η (i) die Länge q1 · . . . · qi = [Q(ζ) : Ki ] hat. Da die qi Teiler von p − 1 sind, ist qi < p. Wir können also annehmen, der Satz sei schon für q1 , . . . , qr bewiesen, und
Ki := Ki (ζq1 , . . . , ζqr )
für
i = 1, . . . , r
setzen. Da [Ki−1 : Ki ] ein Teiler von qi ist (Lemma 2 in III 5.10), genügt es, den : Ki ] = qi zu betrachten. Da ζqi ∈ Ki , gibt es nach dem allgemeinen Fall [Ki−1 Satz über zyklische Erweiterungen aus III 5.9 ein bi ∈ Ki−1
mit
Ki−1 = Ki (bi )
und
bqi i ∈ Ki .
Gauss
In diesem Fall kann man aber mit der Methode von explizit ein Polynom fi ∈ Ki [ X ] angeben, das alle qi+1 · . . . · qr Perioden η (i) als Nullstellen hat. Das wollen wir nicht allgemein aufschreiben, sondern nur in charakteristischen Beispielen vorführen. Damit ist nicht nur die Existenz von Wurzeldarstellungen bewiesen, man kann sie in vielen Fällen auch berechnen. 2
371
5.14 BEISPIELE
5.14 Beispiele
Beispiel 1
Wir berechnen einen Wurzelausdruck für 2π ζ := ζ5 = exp . 5 Die Gruppe G = Aut (Q(ζ); Q) wird erzeugt von
i
mit
ψ
ψ(ζ) = ζ 3 ,
denn 3 ist eine Primitivzahl mod 5. Wir ordnen die vier primitiven Einheitswurzeln nach dem Schema ξ0 ξ1 ξ2 ξ3
ζ
ζ3
ζ4
ζ2
Die einzige Untergruppe vom Index 2 in G ist
H := {id, ψ 2 } und unter der Operation von H gibt es die zwei Bahnsummen
η0 = ξ0 + ξ2 = ζ + ζ 4
und
η 1 = ξ1 + ξ 3 = ζ 3 + ζ 2 .
Sie sind reelle Perioden und Nullstellen des über Q irreduziblen Polynoms
(X − η0 )(X − η1 ) = X 2 + X − 1 . Daraus erhält man die Darstellungen √ √ 1 1 η0 = (−1 + 5) und η1 = (−1 − 5) . 2 2 −1 4 Schlieÿlich sind ζ und ζ = ζ Nullstellen von
(X − ζ)(X − ζ −1 ) = X 2 − η0 X + 1 , also 2 √ √ ζ5 = 14 (−1 + 5) + · 12 12 (5 + 5) ≈ 0.309 + · 0.951 .
i
i
Den letzten Schritt kann man auch direkter sehen: $ η0 = 2 re ζ , also im ζ = 1 − (re ζ)2 .
372
III KÖRPERERWEITERUNGEN
Beispiel 2
Zur Berechnung von ζ := ζ7 benutzt man, dass 3 eine Primitivzahl mod 7 ist (Beispiel 1 in II 2.5).
Daher wird G := Aut (Q(ζ); Q) erzeugt von mit
ψ
ψ(ζ) = ζ 3 .
Dem entsprechend werden die primitiven Einheitswurzeln angeordnet nach folgendem Schema:
ξ0
ξ1
ξ2
ξ3
ξ4
ξ5
ζ
ζ3
ζ2
ζ6
ζ4
ζ5
Da 7 − 1 = 6 = 2 · 3, haben wir zwei Möglichkeiten zur Auswahl einer echten Zwischengruppe H , wir nehmen
H := Erz (ψ 3 ) = {id, ψ 3 } . Dann erhalten wir drei Bahnen der Länge 2 und daraus die reellen Perioden
η0 = ξ0 + ξ3 = ζ + ζ 6 , η1 = ξ1 + ξ4 = ζ 3 + ζ 4 , η2 = ξ2 + ξ5 = ζ 2 + ζ 5 . Diese sind Nullstellen von
f := (X − η0 )(X − η1 )(X − η2 ) = X 3 + X 2 − 2X − 1 . Die gröÿte der drei reellen Nullstellen von f , nämlich x1 = η0 , hatten wir im Beispiel 2 aus III 5.3 schon mit der Methode von Cardano ausgerechnet:
η0 ζ7
= =
1.246 979 2. . . = 2 re ζ = 2 cos 1 2
η0 +
i
1−
1 4
η02
2π 7
, also
≈ 0.623 + 0.782 ·
i
Dieses Ergebnis zeigt zunächst, dass man für ζ7 einen Wurzelausdruck angeben kann. Besonders interessant daran ist aber, dass man neben Quadratwurzeln auch
373
5.14 BEISPIELE
Gauss
dritte Wurzeln ziehen muss. Daran erkannte , dass man ein reguläres 7-Eck nicht mit Zirkel und Lineal konstruieren kann (vgl. III 6.5).
Beispiel 3 Gauss
Zur Berechnung von ζ = ζ17 als Wurzelausdruck nach der Methode von verwenden wir 3 als Primitivzahl mod 17. Dann erhalten die primitiven 17-ten Einheitswurzeln die Reihenfolge:
ξ0 ξ1 ξ2
ξ3
ξ4
ξ5
ξ6
ξ7
ξ8
ξ9
ξ10 ξ11 ξ12 ξ13 ξ14 ξ15
ζ ζ 3 ζ 9 ζ 10 ζ 13 ζ 5 ζ 15 ζ 11 ζ 16 ζ 14 ζ 8
ζ7
ζ 4 ζ 12 ζ 2
ζ6
Die Gruppe G = Aut (Q(ζ); Q) ist erzeugt von ψ mit
ψ(ζ) = ζ 3 , also ψ(ξi ) = ξi+1 , und in G hat man die Untergruppen
Hi := Erz (ψ i )
für
i = 1, 2, 4, 8, 16
und dementsprechend die Körper
Ki := Fix (Q(ζ); Hi )
mit
[Ki : Q] = i .
In dem folgenden Diagramm sind rechts neben den entsprechenden Körpern Ki die darin enthaltenden i Gauss'schen Perioden der Länge 16 i eingetragen. Wie man sich leicht überzeugt, sind die ηi , ηi und ηi reell. Erst in der letzten Erweiterung durch ξ0 = ζ werden die reellen Zahlen verlassen.
374
III KÖRPERERWEITERUNGEN
Q(ζ) ∪
=
K16 ∪
Q(η0 )
=
K8
∪ Q(η0 )
∪ Q
η0 = ξ0 + ξ8 , η1 = ξ1 + ξ9 , η2 = ξ2 + ξ10 , η3 = ξ3 + ξ11 η4 = ξ4 + ξ12 , η5 = ξ5 + ξ13 , η6 = ξ6 + ξ14 , η7 = ξ7 + ξ15
∪ =
∪ Q(η0 )
ξ0 , ξ1 , . . . , ξ15
η0 = ξ0 + ξ4 + ξ8 + ξ12 , η1 = ξ1 + ξ5 + ξ9 + ξ13
K4
η2 = ξ2 + ξ6 + ξ10 + ξ14 , η3 = ξ3 + ξ7 + ξ11 + ξ15
∪ =
K2
=
∪ K1
η0 = ξ0 + ξ2 + ξ4 + ξ6 + ξ8 + ξ12 + ξ14 η1 = ξ1 + ξ3 + ξ5 + ξ7 + ξ9 + ξ13 + ξ15 −1 = ξ0 + ξ1 + . . . + ξ15
Damit sind wir gerüstet für die Berechnung von ζ17 . Im ersten Schritt betrachten wir die Perioden η0 und η1 . Sie sind die Nullstellen von
(X − η0 )(X − η1 ) = X 2 − (η0 + η1 )X + η0 η1 = X 2 + X − 4 , √ also ist η0,1 = − 21 ± 12 17. Im nächsten Schritt wählen wir η0 und η2 , das sind die Nullstellen von
(X − η0 )(X − η2 ) = X 2 − (η0 + η2 )X + η0 η2 = X 2 − η0 X − 1 , $ $ also ist η0,2 = η20 ± 12 η02 + 4 und analog η1,3 = η21 ± 12 η12 + 4. Im vorletzten Schritt wählen wir die Perioden η0 und η4 . Es ist
(X − η0 )(X − η4 ) = X 2 − (η0 + η4 )X + η0 η4 = X 2 − η0 X + η1 , $ η = 20 ± 12 (η0 )2 − 4η1 . also folgt η0,4 Im letzten Schritt ist
also ξ0,8
(X − ξ0 )(X − ξ8 ) = (X − ξ)(X − ξ −1 ) = X 2 − η0 X + 1 , $ η = 20 ± 12 (η0 )2 − 4.
Da η0 = 2 cos 2π 17 , genügt es, diesen Wert auszurechnen. Durch Einsetzen erhält man das Ergebnis von [Ga3 , 365]: $ √ √ 1 − 1 + 17 + 34 − 2 17 = 12 η0 = 16 cos 2π 17 2 $ $ √ √ √ 1 + 8 17 + 3 17 − 34 − 2 17 − 2 34 + 2 17 ≈ 0.932 ,
Gauss
wobei alle Quadratwurzeln positiv gewählt sind. Wer es nachrechnen möchte, benutze in der letzten groÿen Wurzel die Beziehung √ √ √ (1 + 17)2 (17 − 17) = 16 · (17 + 17) . Für sin
2π 17
erhält man noch eine weitere Quadratwurzel.
Zu dieser Rechnung und ihrem Ergebnis sind einige Bemerkungen angebracht.
375
5.15 DAS UMKEHRPROBLEM DER GALOIS-THEORIE
- Die vier Schritte der Rechnung mit der Lösung von quadratischen Gleichungen sind fast identisch. Das ist ein klassisches Beispiel für ein Iterationsverfahren. - Alle Koezienten und alle Lösungen der quadratischen Gleichungen sind reell. Die komplexen Zahlen bleiben im Hintergrund: Sie erklären die Situation und helfen bei der Berechnung der Koezienten der quadratischen Gleichungen. Man bedenke dabei, dass es zur Zeit von die abstrakten Begrie von Körper oder Gruppe noch nicht gab.
Gauss
- Im Ergebnis kommen nur geschachtelte Quadratwurzeln vor. Daher kann man die Berechnungen auch geometrisch realisieren. Dies führt zur Konstruktion des regelmäÿigen 17-Ecks mit Zirkel und Lineal (vgl. III 6.5).
5.15 Das Umkehrproblem der Galois-Theorie Bei der Berechnung von Beispielen für Galoisgruppen hat sich schon gezeigt, dass sehr viele Arten endlicher Gruppen auftreten können. Wenn man beliebige Grundkörper zulässt, ist alles klar:
Bemerkung so dass
Zu jeder endlichen Gruppe G gibt es eine Galoiserweiterung L ⊃ K , Aut (K; L) ∼ =G.
Beweis Nach dem Satz von Cayley aus I 4.2 gibt es ein n, so dass G < Sn . Ist k = Q(S1 , . . . , Sn ) , f = X n − S1 X n−1 + . . . + (−1)n Sn ∈ k[ X ] das Polynom mit allgemeinen Koezienten und K ⊃ k Zerfällungskörper von f , so ist nach III 5.11 Gal (f ; k) = Aut (K; k) = Sn . Ist L := Fix (K; G), so folgt aus III 4.5 Aut (K; L) = G .
2 Weit schwieriger ist die Frage, welche endlichen Gruppen als Galoisgruppe eines Polynoms mit Koezienten aus einem vorgegebenen Körper k , etwa k = Q, auftreten können. Anschlieÿend werden wir zeigen, dass jede endliche abelsche Gruppe als Galoisgruppe eines Polynoms f ∈ Q[ X ] auftritt. bewies 1892 das gleiche Ergebnis für Sn und An und formulierte die allgemeine Frage. Aus der langen Liste von Arbeiten zu diesem Thema ist die positive Antwort von [Sa] aus dem Jahr 1954 für auösbare Gruppen hervorzuheben. Viele Einzelheiten und historische Anmerkungen zu diesem Thema ndet man etwa bei [Ma].
Hilbert
Shafarevic
Wir begnügen uns hier mit dem relativ einfachen Beweis von folgendem
376
III KÖRPERERWEITERUNGEN
Satz Zu jeder endlichen abelschen Gruppe K⊃Q
G
gibt es eine Galoiserweiterung
mit Aut (K; Q) ∼ =G,
wobei K Unterkörper eines Kreisteilungskörpers Q(ζn ) ist.
Das ist eine einfache Folgerung aus dem gruppentheoretischen Lemma
Zu jeder endlichen abelschen Gruppe
Untergruppe
H
der Primrestklassengruppe
Zn× ,
G
gibt es ein
n ∈ N
und eine
so dass
G∼ = Zn× /H .
Sei n wie im Lemma gewählt; nach III 5.6 ist die Erweiterung Q(ζn ) ⊃ Q galoissch mit Aut (Q(ζn ); Q) ∼ = Zn× . Nach dem Hauptsatz der Galois-Theorie aus III 4.5 ist Aut (K; Q) ∼ = Zn× /H ∼ = G für K = Fix (Q(ζn ); H) . Beweis des Satzes
2
Zum Beweis des Lemmas kann man ein Ergebnis aus der analytischen Zahlentheorie über Primzahlen in arithmetischen Progressionen benutzen: Satz von Dirichlet
Sei
n∈N
und
n ≥ 2.
Dann gibt es in der Folge
(kn + 1)k∈N unendlich viele Primzahlen.
Beweis des Satzes von Dirichlet Angenommen wir haben in der gegebenen Folge schon Primzahlen p1 , . . . , pr mit r ≥ 0 gefunden. Wir zeigen die Existenz einer weiteren davon verschiedenen Primzahl p. Dazu betrachten wir x := n · p1 · . . . · pr ≥ 2 (mit x = n für r = 0), das Kreisteilungspolynom Φn ∈ Z[ X ], den Wert Φn (x) ∈ Z {0, +1, −1} und einen Primteiler p von Φn (x) . Es genügt für dieses p zu zeigen, dass p x und n|(p − 1) , d.h. p = kn + 1 für ein k . Da Φn Teiler von X n − 1 ist, folgt p|(xn − 1), also xn ≡ 1 (mod p). Daher kann p kein Teiler von x sein. Zum Beweis der zweiten Behauptung betrachten wir die multiplikative Gruppe Zp× der Ordnung p − 1 und m := ord (x + pZ) in Zp× .
5.15 DAS UMKEHRPROBLEM DER GALOIS-THEORIE
377
Da xn ≡ 1 ( mod p), folgt m|n; es genügt m = n zu zeigen. Angenommen n = d · m mit 1 ≤ m < n. Dann ist auch xm ≡ 1 (mod p) und
xn − 1 = (xm )d−1 + . . . + xm + 1 ≡ d (mod p) . xm − 1 Da Φn nach III 5.6 ein Teiler von (X n − 1)/(X m − 1) ist, folgt
Φn (x)
teilt
xn − 1 , also p teilt d . xm − 1
Das ist ein Widerspruch, denn p ist kein Teiler von x und daher auch kein Teiler von d. 2
Beweis des Lemmas
Wir konstruieren ein Diagramm
ρ → Z q1 ⊕ . . . ⊕ Zqr ∼ Zp×1 ·...·pr ∼ = Zp×1 × . . . × Zp×r ∼ = Zp1 −1 ⊕ . . . ⊕ Zpr −1 − =G
von Isomorphismen und einen Epimorphismus ρ wie folgt. Zunächst gibt es nach I 6.5 Primzahlpotenzen q1 , . . . , qr , so dass G ∼ = Zq1 ⊕ . . . ⊕ Zqr . Zu jedem i gibt es nach dem Satz von unendlich viele Möglichkeiten, eine Primzahl pi so zu wählen, dass qi Teiler von pi − 1 ist, also einen Epimorphismus
Dirichlet
ρi : Zpi −1 → Zqi . Dabei können wir p1 , . . . , pr als paarweise verschieden wählen. Nach I 3.12 ist
Zp×i ∼ = Zpi −1
und
Zp×1 ·...·pr ∼ = Zp×1 × . . . × Zp×r ,
also kann man n := p1 · . . . · pr und H < Zn× als Kern des durch ρ verursachten Homomorphismus erklären. 2 Dass in obigem Satz K als Unterkörper eines Kreisteilungskörpers konstruiert wurde, ist begründet durch den klassischen
Satz von Kronecker und Weber
[We2 ] Ist K ⊃ Q eine Galois-Erweiterung K zu einem Kreisteilungskörper Q(ζn )
mit abelscher Galoisgruppe, so kann man erweitern. Einen Beweis ndet man etwa bei [Ne].
378
III KÖRPERERWEITERUNGEN
6 Geometrische Konstruktionen Gegenstand dieses letzten Paragraphen sind klassische geometrische Probleme, an denen - wie bei der Frage nach der Lösbarkeit von Polynomgleichungen - seit der Antike gearbeitet wurde. Besonders bekannt sind die folgenden Aufgaben:
1. Delisches Problem der Würfelverdoppelung Aus der Kante eines gegebenen Würfels soll die Kante eines Würfels mit doppeltem Volumen konstruiert werden.
2. Winkeldreiteilung Ein gegebener Winkel ist in drei gleiche Teile zu zerlegen.
3. Quadratur des Kreises Zu einer gegebenen Kreisscheibe ist ein Quadrat mit gleichem Flächeninhalt zu konstruieren.
4. Konstruktion regelmäÿiger n-Ecke In einen vorgegebenen Kreis soll ein regelmäÿiges n-Eck einbeschrieben werden.
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9_16, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
6.1 KONSTRUKTIONEN MIT ZIRKEL UND LINEAL
379
Im Folgenden wird präzisiert, welche Hilfsmittel bei der Konstruktion zugelassen sind. Dann können die Probleme in die Algebra übersetzt und gelöst werden. Für die ersten beiden Probleme reichen ganz elementare Techniken der Körpertheorie; für Problem 4 benötigt man die Kreisteilungstheorie aus 5.
6.1 Konstruktionen mit Zirkel und Lineal Zunächst müssen die Spielregeln präzise festgelegt werden; dafür gibt es natürlich viele Alternativen. Nach den klassischen Regeln darf man einen Zirkel und ein Lineal (ohne Markierungen) verwenden. Ausgangspunkt ist die Zeichenebene R2 mit einer vorgegebenen Teilmenge M ⊂ R2 von Konstruktionsdaten. Nun werden drei Arten von elementaren Konstruktionsschritten zur Vergröÿerung von M erklärt. Dabei bezeichnet p ∨ q die mit dem Lineal durch Anlegen gezeichnete Verbindungsgerade von zwei verschiedenen Punkten p, q ∈ R2 . Weiter bezeichnet K(p; ρ) für p ∈ R2 und ρ ∈ R+ den mit dem Zirkel gezeichneten Kreis von Radius ρ mit p als Mittelpunkt.
Typ I Zu p1 , q1 , p2 , q2 ∈ M mit p1 = q1 , p2 = q2 und (p1 ∨ q1 ) = (p2 ∨ q2 ) nehme man den Schnittpunkt p := (p1 ∨ q1 ) ∩ (p2 ∨ q2 ) (falls er existiert) zu M dazu.
Typ II Zu p, p1 , q1 , p2 , q2 ∈ M mit p1 = q1 und p2 = q2 zeichne man die Gerade p1 ∨ q1 und durch Abtragen des Abstandes den Kreis K(p; p2 − q2 ). Falls sie existieren, nehme man die Schnittpunkte (p1 ∨ q1 ) ∩ K(p; p2 − q2 ) zu M dazu.
380
III KÖRPERERWEITERUNGEN
Typ III Zu p, p1 , p2 , q, q1 , q2 mit p = q, p1 = p2 und q1 = q2 zeichne man durch Abtragen der Abstände die Kreise K(p; p1 − p2 ) sowie K(q; q1 − q2 ), und nehme (falls sie existieren), die Schnittpunkte K(p; p1 − p2 ) ∩ K(q; q1 − q2 ) zu M dazu.
Somit wird M in jedem elementaren Konstruktionsschritt um höchstens zwei Punkte erweitert. Nun erklären wir für eine beliebige Teilmenge M ⊂ R2 die Menge Kon (M ) ⊂ R2 als die Menge der aus M mit Zirkel und Lineal konstruierbaren Punkte. Dabei liegt ein Punkt p ∈ R2 genau dann in Kon (M ), wenn es ein n ∈ N und eine Kette
M := M0 ⊂ M1 ⊂ . . . ⊂ Mn ⊂ R2 gibt, so dass jedes Mi aus Mi−1 in einem elementaren Konstruktionsschritt erhalten werden kann, und p in Mn liegt.
6.2 Der Körper der konstruierbaren Punkte Da die meisten der angegebenen geometrischen Probleme unlösbar sind, muss man ein abstraktes Hindernis gegen eine Lösung nden. Da hilft die Algebra: Wir identizieren die Zeichenebene R2 mit der Gauss'schen Zahlenebene C und betrachten die Menge Kon (M ) als Teilmenge des Körpers C. Der Schlüssel zum Erfolg ist der
Satz
Sei M ⊂ C eine Teilmenge, die 0 und 1 enthält und M := {z ∈ C : z ∈ M } .
Dann gilt: a) Kon (M ) ⊂ C ist ein Unterkörper. b) Q(M ∪ M ) ⊂ Kon (M ) ist Unterkörper und Kon (M ) = Kon (M ). c) Ist b ∈ C und b2 ∈ Kon (M ), so gilt auch b ∈ Kon (M ).
6.2 DER KÖRPER DER KONSTRUIERBAREN PUNKTE
381
Anders ausgedrückt: Die Menge der konstruierbaren Punkte ist abgeschlossen unter den Körperoperationen, komplexer Konjugation und dem Ziehen von Quadratwurzeln.
Beweis Zum Nachweis von a) sind zunächst geometrische Konstruktionen für die in einem Körper erforderlichen algebraischen Operationen anzugeben. Summen und Negative Zu a, b ∈ Kon (M ) sind auch a + b und −a in Kon (M ). Hierzu genügen die Punkte a, b und 0 ∈ Kon (M ).
Wie man an der Konstruktion von a + b sieht, sind auch Parallelen zu gegebenen Geraden konstruierbar.
Produkte und Inverse
Sind a, b ∈ Kon (M ), so kann man a · b nach dem Strahlensatz konstruieren, indem man auch 1 und einen weiteren nicht reellen konstruierbaren Punkt p ∈ Kon (M ), etwa p = exp(5π i/3) benutzt.
Ganz analog kann man zu a ∈ Kon (M ) {0} das Inverse a−1 konstruieren. Zum Nachweis von Q(M ∪ M ) ⊂ Kon (M ) bemerken wir zunächst, dass wegen 0, 1 ∈ M auch Z ⊂ Kon (M ). Da Kon (M ) ⊂ C Unterkörper ist, folgt Q(M ) ⊂ Kon (M ). Es gibt eine einfache geometrische Konstruktion für die
Komplexe Konjugation
b).
Mit a ∈ Kon (M ) ist auch a ∈ Kon (M ). Daraus folgt
382
III KÖRPERERWEITERUNGEN
Zum Nachweis von c) muss man zu jedem a ∈ Kon (M ) die komplexen Quadratwurzeln b, b konstruieren. Dazu benutzt man die Darstellungen $ $ ϕ ϕ a = |a| · exp(iϕ) und b = |a| · exp(i ) , b = |a| · exp(i( + π)) . 2 2 Also genügen die folgenden Konstruktionen. √ Für x ∈ R+ konstruiert man x ∈ R+ nach dem Höhensatz mit Hilfe des ThalesKreises:
Für a ∈ C mit |a| = 1 konstruiert man die Quadratwurzeln b, b :
2
6.3 Struktur des Körpers der konstruierbaren Punkte Im einfachsten Fall M = {0, 1} hat man einen Zwischenkörper
Q ⊂ Kon (0, 1) ⊂ C . Die entscheidende Frage ist die Struktur der Körpererweiterung Kon (0, 1) ⊃ Q. Es zeigt sich, dass der Grad zwar unendlich ist, aber sie ist algebraisch von einer sehr speziellen Art. Genauer hat man den folgenden
Struktursatz
Sei M ⊂ C mit 0, 1 ∈ M . Dann gilt:
a) Die Körpererweiterung Kon (M ) ⊃ Q(M ∪ M ) ist algebraisch. b) [Kon (0, 1) : Q] = ∞. c) Ein Punkt z ∈ C liegt genau dann im Unterkörper Kon (M ) ⊂ C, wenn es eine Kette
Q(M ∪ M ) = L0 ⊂ L1 ⊂ . . . ⊂ Lr ⊂ C
von Zwischenkörpern gibt, mit z ∈ Lr und [Li : Li−1 ] ≤ 2 für i = 1, . . . , r .
6.3 STRUKTUR DES KÖRPERS DER KONSTRUIERBAREN PUNKTE
383
Dass nirgendwo in der Kette ein höherer Grad als 2 auftreten kann, ist natürlich durch die Regeln für die geometrische Konstruktion bedingt. Das wird präzisiert durch das
Lemma Sei L ⊂ C ein Unterkörper mit L = L und i ∈ L. Sind dann z, z ∈ C in einem elementaren Schritt aus L konstruierbar, so gibt es ein w ∈ R derart, dass w2 ∈ L und z, z ∈ L(w). Insbesondere ist L(w) = L(w)
und [L(w) : L] ≤ 2 .
Kürzer ausgedrückt: Die von elementar konstruierbaren Punkten verursachten Körpererweiterungen können durch die Adjunktion von Quadratwurzeln erreicht werden.
Beweis des Lemmas Obwohl wir die konstruierbaren Punkte als komplexe Zahlen
ansehen, müssen die Gleichungen für Geraden und Kreise reell im Vektorraum R2 beschrieben werden. Nach den Voraussetzungen L = L und i ∈ L ist mit jedem p ∈ L auch re (p) =
1 (p + p) ∈ L 2
und
im (p) =
1 (p − p) ∈ L . 2i
Das werden wir gleich benutzen. Wir machen nun eine Fallunterscheidung je nach dem Typ des elementaren Konstruktionsschrittes, durch den z und z aus L entstehen.
Typ I:
Dann gibt es λ, μ ∈ R, so dass
z = p1 + λ (q1 − p1 ) = p2 + μ (q2 − p2 ) . Zerlegt man diese Bedingung für λ und μ in Real- und Imaginärteil, so erhält man ein inhomogenes lineares Gleichungssystem für λ und μ mit Koezienten in L ∩ R. Seine Lösung liegt auch in L ∩ R; damit ist sogar z ∈ L und [L(z) : L] = 1.
Typ II:
In diesem Fall ist
z, z ∈ (p1 ∨ q1 ) ∩ K(p; ρ) , wobei ρ2 = p2 − q2 2 ∈ L ∩ R. Mit Hilfe der Zerlegungen
p = a + ib , p1 = a1 + ib1
und
q 1 = c1 + i d 1
erhalten wir für z, z = p1 + λ (q1 − p1 ) die quadratische Gleichung
(a1 + λ(c1 − a1 ) − a)2 + (b1 + λ(d1 − b1 ) − b)2 = ρ2 . Ausmultipliziert ist sie von der Form
αλ2 + βλ + γ = 0 mit
α, β, γ ∈ L ∩ R .
(∗)
384
III KÖRPERERWEITERUNGEN
Da p1 = q1 , ist α = 0; also muss β 2 − 4αγ ≥ 0 sein, weil es nach Voraussetzung (nicht notwendig verschiedene) Schnittpunkte z, z und damit reelle Lösungen λ, λ der Gleichung (∗) gibt. Also ist $ w := β 2 − 4αγ ∈ R die gesuchte Wurzel (vgl. III 5.1).
Typ III:
Sind z, z die Schnittpunkte zweier Kreise mit verschiedenen Mittelpunkten und den Gleichungen
(x − a1 )2 + (y − b1 )2 = ρ21 (x − a2 )2 + (y − b2 )2 = ρ22 , wobei ai , bi , ρ2i ∈ L ∩ R, so erhält man durch Subtraktion eine lineare Gleichung
(a1 − a2 )x + (b1 − b2 )y = c mit Koezienten in L ∩ R. Sie beschreibt eine reelle Gerade G in R2 = C, und da L ein Körper ist, geht sie auch durch zwei verschiedene Punkte p, q ∈ L. Damit sind wir in der gleichen Situation wir bei Typ II, da der Durchschnitt der beiden Kreise gleich dem Durchschnitt von einem der beiden Kreise mit der Geraden G ist.
2 Diese letzte Überlegung ist entscheidend dafür, dass bei den Konstruktionen mit Zirkel und Lineal immer nur quadratische Erweiterungen entstehen: Zwei Kreise schneiden sich in höchstens zwei Punkten. Bei allgemeineren Kegelschnitten (d.h. Kurven vom Grad 2) wie Ellipsen, Parabeln oder Hyperbeln kann man vier Schnittpunkte und damit Körpererweiterungen bis zum Grad 4 erhalten. Allgemeiner haben Kurven vom Grad m und n bis zu m · n Schnittpunkte (vgl. dazu etwa [Fi3 ]).
Beweis des Satzes Zunächst sei bemerkt, dass z ∈ Kon (M ) gibt es nach c) ein Lr mit z ∈ Lr
und
a)
[Lr : Q(M ∪ M )]
aus
c)
folgt, denn für jedes
teilt 2r .
6.3 STRUKTUR DES KÖRPERS DER KONSTRUIERBAREN PUNKTE
385
Ad b)
Aus −1 kann man durch wiederholte Winkelhalbierung iterierte Quadratwurzeln ziehen. Also ist πi wn := exp n ∈ Kon (0, 1) für alle n ∈ N . 2 Minimalpolynom von wn über Q ist X 2 + 1. Daraus folgt die Behauptung. n
Ad c)
Angenommen, es gibt die angegebene Körperkette. Die Schritte mit [Li : Li−1 ] = 1 sind trivial; im Fall [Li : Li−1 ] = 2 ist Li = Li−1 (z), wobei z ∈ C Nullstelle eines irreduziblen Polynoms
X 2 + pX + q ∈ Li−1 [ X ] ist. Dann kann Li über Li−1 auch erzeugt werden von $ p2 − 4q ∈ C . Da Quadratwurzeln konstruierbar sind, ist auch z konstruierbar. Ist z ∈ Kon (M ) gegeben, so konstruieren wir die Körperkette durch wiederholte Anwendung des Lemmas. Nach Voraussetzung gibt es eine Kette
M = M0 ⊂ M1 ⊂ . . . ⊂ Mn ⊂ C von Teilmengen, so dass z ∈ Mn und jedes Mi aus Mi−1 durch einen elementaren Konstruktionsschritt entsteht, also
Mi = Mi−1 ∪ {zi , zi } , wobei zi , zi ∈ C nicht notwendig verschieden sein müssen. Um die Rekursion zum Laufen zu bringen, setzen wir
L0 := Q(M ∪ M )
und
L1 := L0 (i) .
Dann ist L0 = L0 , L1 = L1 und [L1 : L0 ] ≤ 2. Nun betrachten wir die Punkte z1 , z1 ∈ M1 . Nach dem Lemma gibt es ein w1 ∈ R, so dass
z1 , z1 ∈ L1 (w1 ) =: L2
und
[L2 : L1 ] ≤ 2 .
Durch Fortsetzung dieses Verfahrens erhält man die gesuchte Körperkette.
2
Das Ergebnis dieses Abschnitts kann man unter Benutzung der Gradformel aus III 1.2 kurz so zusammenfassen:
Korollar
so gilt
Sei M ⊂ C mit 0, 1 ∈ M und z ∈ Kon (M ). Setzt man L := Q(M ∪M ),
ist eine Potenz von 2 . Insbesondere ist z algebraisch über L. [L(z) : L]
2
Das ist eine sehr starke notwendige Bedingung für die Konstruierbarkeit mit Zirkel und Lineal. In III 6.5 werden wir zeigen, dass sie mit einer kleinen Modikation auch hinreichend ist.
386
III KÖRPERERWEITERUNGEN
6.4 Unlösbarkeit klassischer Konstruktionsaufgaben Mit Hilfe des abschlieÿenden Korollars aus III 6.3 kann man nun zeigen, dass die ersten drei der zu Beginn dieses Paragraphen beschriebenen Aufgaben nicht lösbar sind. Dazu sind bisher nur ganz elementare Eigenschaften von Körpererweiterungen verwendet worden. Erst bei der Frage nach der Konstruierbarkeit regelmäÿiger n-Ecke im folgenden Abschnitt benötigt man stärkere Hilfsmittel. 1.
Das Delische Problem ist unlösbar
Es genügt den Fall zu behandeln, dass der gegebene Würfel die Kantenlänge 1 und damit das Volumen √ 1 hat. Ein Würfel mit doppeltem Volumen hat daher die Kantenlänge b := 3 2. Wir können also M = {0, 1} setzen, und es genügt zu zeigen, dass b ∈ / Kon (0, 1). Das Minimalpolynom von b über Q ist X 3 − 2, also ist
[Q(b) : Q] = 3 , und das ist keine Potenz von 2. 2.
Die Winkeldreiteilung ist im Allgemeinen unmöglich
Hier ist die Antwort etwas dierenzierter, denn oensichtlich können einige Winkel wie etwa 180◦ oder 270◦ dreigeteilt werden. Von einem allgemeinen Verfahren würde man erwarten, dass es unabhängig vom Wert des gegebenen Winkels angewandt werden kann, dass man also den Winkel - so wie die Koezienten eines allgemeinen Polynoms in III 5.11 - als Unbestimmte ansehen kann. Ist der Winkel α ∈ [0, 2π] gegeben, so setzen wir
ζ := exp(iα) ∈ C . Eine Dreiteilung von α ist gleichbedeutend mit der Konstruktion von α z := exp(i ) ∈ C aus M = {0, 1, ζ} . 3 Wegen ζ = ζ −1 ist Q(M ∪ M ) = Q(ζ); also kann ζ dann nicht dreigeteilt werden, wenn X 3 − ζ ∈ Q(ζ)[ X ] irreduzibel und damit Minimalpolynom von z ist. Zunächst betrachten wir ζ als Unbestimmte, dann ist Q(ζ) Quotientenkörper des Polynomrings Q[ ζ ]. Da ζ in Q[ ζ ] Primelement ist, folgt aus dem EisensteinKriterium in II 3.8, dass X 3 − ζ in Q(ζ)[ X ] irreduzibel ist. Daher ist
[Q(ζ, z) : Q(ζ)] = 3 , und z nicht allgemein konstruierbar. Dennoch könnte es sein, dass es je nach dem Wert von ζ unterschiedliche Lösungsverfahren gibt. Um das auszuschlieÿen, muss man einen konkreten Wert von α und damit ζ angeben. Ein Beispiel ist √ 2π i 2π i 3 1 2π α = 120◦ = , ζ = exp =− +i , also z = exp ; 3 3 2 2 9 das heiÿt, 40◦
der Winkel von
ist nicht konstruierbar.
6.4 UNLÖSBARKEIT KLASSISCHER KONSTRUKTIONSAUFGABEN
387
Das kann man sehr schnell sehen, wenn man die Irreduzibilität des Kreisteilungspolynoms Φ9 = X 6 + X 3 + 1 benutzt. Da ζ = z 3 , hat man die Körperkette
Q ⊂ Q(ζ) ⊂ Q(ζ, z) = Q(z) . Wie man an der Darstellung von ζ erkennt, ist [Q(ζ) : Q] = 2. Aus
[Q(z) : Q] = 6 folgt
[Q(ζ)(z) : Q(ζ)] = 3 ,
das ist keine Potenz von 2. Einen elementaren Beweis erhält man mit Hilfe der trigonometrischen Formel
cos 3β = 4 cos3 β − 3 cos β . Wäre
2π 9
aus
2π 3
(∗)
konstruierbar, so wäre auch
x = cos
2π aus 9
c = cos
2π 1 =− 3 2
konstruierbar. Nach (∗) ist x Nullstelle von
f := 8X 3 − 6X + 1 ∈ Z[ X ] . Substituiert man Y = 2X , so erhält man das Polynom
g = Y 3 − 3Y + 1 ∈ Z[ Y ] . Es bleibt zu zeigen, dass g in Z[ Y ] irreduzibel ist. Dann ist g nach den Sätzen von aus II 3.8 auch in Q[ Y ] irreduzibel und somit ist f in Q[ X ] irreduzibel; also ist
Gauss
[Q(x) : Q] = 3 . Die Irreduzibilität von g in Z[ Y ] folgt etwa durch Reduktion modulo 2 (Beispiel 5 in II 3.9) oder nach Beispiel 7 in II 3.9, da g oensichtlich keine ganzzahlige Nullstelle hat (siehe Bild).
388
3.
III KÖRPERERWEITERUNGEN
Die Quadratur des Kreises ist unmöglich
Es genügt, den Fall eines Kreises vom Radius 1 zu betrachten, die Kreisscheibe √ hat dann den Flächeninhalt π . Es ist also ein Quadrat von der Seitenlänge π √ gesucht. Wäre π aus M = {0, 1} konstruierbar, so auch π . Aber π ist über Q transzendent, wie Lindemann [Li] im Jahr 1882 erstmals zeigte. Inzwischen gibt es relativ elementare Beweise dieses tieiegenden Ergebnisses (vgl. etwa [Ku, Aufgabe 10 in 10]). Der Leser möge sich zur Übung klar machen, dass das Problem von Angela Merkel der Kubatur der Kugel aus dem gleichen Grund unlösbar ist.
6.5 Konstruktion von regelmäÿigen n-Ecken∗ Dieses letzte der hier beschriebenen Konstruktionsprobleme erfordert stärkere Hilfsmittel. Es ist oensichtlich gleichwertig mit der Frage der Konstruierbarkeit der primitiven n-ten Einheitswurzel
ζn = exp
2π i aus n
M = {0, 1} .
Für n = 2, 3, 4, 5, 6 sind solche Konstruktionen bekannt, für n = 7 konnte erstmals Gauss im Alter von 19 Jahren begründen, dass es keine Lösung gibt. Er fand auch die höchst überraschende Lösbarkeit für n = 17. Da in diesem Abschnitt auch positive Antworten gegeben werden, müssen wir zunächst eine Umkehrung des Korollars aus III 6.3 bereitstellen.
Lemma Sei M ⊂ C mit 0, 1 ∈ M und L := Q(M ∪ M ). Weiter sei z ∈ C algebraisch über L, f ∈ L[ X ] das Minimalpolynom von z und K ⊃ L der Zerfällungskörper von f . Ist dann [K : L] eine Potenz von 2, so folgt z ∈ Kon (M ).
389
6.5 KONSTRUKTION VON REGELMÄßIGEN N -ECKEN∗
Beweis
Nach III 4.4 ist die Erweiterung K ⊃ L galoissch, also gilt für G := Aut (K; L), dass ord G = [K : L]; daher ist ord G eine Potenz von 2 und somit ist G nach I 7.5 auösbar. Also gibt es eine Normalreihe
G = N0 N1 . . . Nr = {idK } derart, dass ord (Ni−1 /Ni ) = 2 für i = 1, . . . , r. Nach dem Hauptsatz der GaloisTheorie in III 4.5 gehört dazu eine Körperkette
L = L0 ⊂ L1 ⊂ . . . ⊂ Lr = K mit [Li : Li−1 ] = 2. Nach dem Satz aus III 6.3 folgt z ∈ Kon (M ).
2
Da [Q(ζn ) : Q] = ϕ(n), folgt aus dem Korollar in III 6.3 und dem obigen Lemma das auf [Ga3 , 365] zurückgehende
Gauss
Theorem Das regelmäÿige n-Eck ist genau dann mit Zirkel und Lineal konstruierbar, wenn die Eulersche Zahl ϕ(n) eine Potenz von 2 ist. 2 Da ϕ(5) = 4, ϕ(7) = 6 und ϕ(17) = 16, folgt sofort, dass ein 7-Eck nicht konstruierbar, aber ein 5-Eck und ein 17-Eck konstruierbar ist. Wegen ϕ(9) = 6 ist auch das 9-Eck nicht konstruierbar; das hatten wir bei der Dreiteilung des Winkels schon für 40◦ gesehen.
Gauss
Es erscheint bemerkenswert, dass in seinen Disquisitiones die schwierigere positive Antwort genau ausführt, aber die mit den elementaren - damals noch nicht verfügbaren - Methoden der Körpertheorie leicht zu beweisenden negativen Antworten nicht näher begründet. Am Ende von 365 schreibt er (höhere Gleichungen bedeutet Grad gröÿer als 2):
Es bleibt die zahlentheoretische Frage zu klären, wann ϕ(n) eine Potenz von 2 ist. Zunächst betrachten wir den Fall, dass n = p eine Primzahl ist, dann folgt ϕ(p) = p − 1.
Hilfssatz
Ist
p
eine Primzahl mit
p>2
p = 22 + 1 n
und
mit
p−1
eine Potenz von
n∈N.
2,
so ist
390
III KÖRPERERWEITERUNGEN
Beweis
Ist p = 2m + 1, so haben wir zu zeigen, dass m von der Form 2n ist. Hätte m einen ungeraden Teiler k ≥ 3, so wäre m = k · l mit l ∈ N und es wäre
p = 2kl + 1 = (2l + 1)(2(k−1)l − 2(k−2)l + . . . + 22l − 2l + 1) . 2
Da 1 < 2l + 1 < 2kl + 1, wäre p nicht prim. Die Suche nach Primzahlen in der Folge
Fn = 22 + 1 n
ist ein klassisches Problem, man nennt sie hat man
Fermatsche Primzahlen . Für n ≤ 5
n
Fn
0
3
1
5
2
17
3
257
4
65 537
5
4 294 967 297 = 641 · 6 700 417
Den Primfaktor 641 von F5 hatte schon
Euler gefunden.
Für n ≤ 4 erhält man in der Tat Primzahlen, ab n ≥ 5 sind bisher keine weiteren bekannt. Die Konstruierbarkeit des regelmäÿigen n-Ecks wird nun weitgehend geklärt durch den
Satz
ϕ(n)
ist genau dann eine Potenz von 2, wenn n = 2m · p1 · . . . · pr ,
wobei m ∈ N und p1 , . . . , pr paarweise verschiedene Fermatsche Primzahlen sind. Da bisher nur fünf Fermatsche Primzahlen bekannt sind, kann man r ≤ 5 annehmen. Das ergibt 31 mögliche Produkte solcher Primzahlen.
Beweis
Ist n = pl11 · . . . · plrr die Primfaktorzerlegung, so ist nach I 3.11
ϕ(n) = p1l1 −1 · . . . · plrr −1 · (p1 − 1) · . . . · (pr − 1) . Also ist ϕ(n) genau dann eine Potenz von 2, wenn für alle pj = 2 Folgendes gilt:
lj = 1 und
(pj − 1)
ist Potenz von
2.
Damit folgt die Behauptung aus dem Hilfssatz.
2
Nachdem die Existenz von Konstruktionsverfahren für die in obigem Satz angegebenen Werte von n nachgewiesen ist, stellt sich die Frage nach der Ausführung. Dazu betrachtet man zunächst die Fermatschen Primzahlen.
p=3
Die Konstruktion eines gleichseitigen Dreiecks ist aus der Schule bekannt.
p=5
Hier hilft der goldene Schnitt (vgl. Beispiel 1 aus III 5.14).
6.5 KONSTRUKTION VON REGELMÄßIGEN N -ECKEN∗
Ist
x 1−x
= x1 , so folgt x =
1 2
(−1 ±
√
391
5).
Die Einzelheiten überlassen wir dem Leser.
Gauss
p = 17 Hier kann man die von gefundene Formel für cos (2π/17) aus Beispiel 3 in III 5.14 als Grundlage für eine geometrische Konstruktion verwenden. Das wird etwa in [Kl2 , Teil I, Kapitel 4] ausgeführt. p = 257
Richelot [Ri] im Jahre 1832 eine Konstruktion an. An dieser Konstruktion arbeitete J. Hermes zehn Jahre lang. Sein
Hier gab erstmals
p = 65 537 1889 beendetes Diarium bendet sich in der mathematischen Sammlung in Göttingen. Eine kurze Note dazu erschien 1894 (siehe [He]).
Aus den fünf angegebenen Konstruktionsverfahren für die Fermatschen Primzahlen kann man alle anderen ableiten. Sind m und n teilerfremd und kann man sowohl m-Eck und n-Eck konstruieren, so nutzt man aus, dass es nach der Relation von (I 3.8) r, s ∈ Z gibt, so dass 1 = rn + sm. Daraus folgt
Bézout
2π 2π 2π =r +s , m·n m n und daher ist auch das m · n-Eck konstruierbar. Die Potenz von 2 kann man durch wiederholte Winkelhalbierung realisieren.
Gauss all die Zahlen N ≤ 300
Ganz am Ende seiner Disquisitiones [Ga 3 ] gibt an, für die das regelmäÿige N -Eck konstruierbar ist:
392
III KÖRPERERWEITERUNGEN
In der Kuppel der Rotunde der Pinakothek der Moderne in München kann man zahlreiche Kreisteilungen beobachten. Wer Spaÿ daran hat,kann sich überlegen, welche davon mit Zirkel und Lineal ausführbar sind.
6.6 Andere Regeln für Konstruktionsverfahren Welche geometrischen Konstruktionsaufgaben lösbar sind, hängt ganz entscheidend von den vorgegebenen Spielregeln ab; die in III 6.1 beschriebenen Regeln sind die Klassiker. Aber es gibt zahlreiche Varianten, etwa: 1) Mit dem Lineal allein 2) Mit dem Zirkel allein 3) Mit dem Lineal und einem fest vorgegebenen Kreis 4) Mit dem Lineal und einer fest vorgegebenen Parabel 5) Mit Zirkel, Lineal und einer fest vorgegebenen Parabel Es erscheint bemerkenswert, dass mit den Regeln 5) eine Winkeldreiteilung möglich ist. Das liegt daran, dass ein Kreis mit einer Parabel vier Schnittpunkte haben kann.
Noch weit mehr Verfahren ndet man in dem Buch von Bieberbach [Bi]. Weiter gibt es viele Näherungsverfahren; besonders bekannt geworden ist die sehr genaue Winkeldreiteilung des Schneidermeisters Kopf (siehe [Pe])
Anhang
Platonische Körper
In 5 von Kapitel I haben wir die Symmetriegruppen der
Platonischen Körper
bestimmt. Besonders interessant ist die Ikosaedergruppe, sie tritt in vielen anderen Zusammenhängen wieder auf, etwa bei der Lösung von Gleichungen vom Grad 5 in 5 aus Kapitel III. Die fünf Platonischen Körper werden auch schon zur Zeit von
reguläre Polyeder genannt, sie waren
Platon ( ca. 430 - 340 v. Chr.) bekannt. Dennoch erscheint es
nicht ganz überüssig, ihnen hier ein paar Seiten zu widmen. Da der verfügbare Papiervorrat zur Neige geht, müssen wir uns sehr kurz fassen.
1. Analytische Beschreibung der Platonischen Körper Für die Bestimmung der Symmetriegruppen ist es entscheidend, dass man die Platonischen Körper so legen kann, dass alle Ecken in einer
Sphäre
(d.h. einer
Kugeloberäche) enthalten sind. Das führen wir ganz explizit aus. Die dazu nötigen Überlegungen der analytischen Geometrie sind ganz elementar, man benötigt nicht viel mehr als den Satz von
1
Tetraeder
so legen, dass die 4 Ecken p1 , . . . , p4 auf der Sphäre vom liegen, so kann man das wie folgt erreichen:
Will man ein Radius
Pythagoras.
√ √ p1 = (− 13 2, − 13 6, − 13 ) , √ √ p3 = (− 13 2, 13 6, − 13 ) ,
Zum Tetraeder gehören
4
√ p2 = ( 23 2, 0, − 13 ) , p4 = (0, 0, 1) .
gleichseitige Dreiecke und
6
Kanten.
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
ANHANG
394
Würfels gegeben durch
Bei Würfel und Oktaeder muss man gar nicht rechnen. Sind die 8 Ecken eines
(±1, ±1, ±1) ,
wobei die Vorzeichen unabhängig voneinander gewählt werden können, so sind sie √ enthalten in einer Sphäre vom Radius 3. Zum Würfel gehören 6 Quadrate und 12 Kanten. In der Sphäre vom Radius 1 sind die 6 Ecken
(±1, 0, 0) , (0, ±1, 0) und (0, 0, ±1)
des
Oktaeders enthalten. Dazu gehören 8 gleichseitige Dreiecke und 12 Kanten.
Ikosaeders goldenen Schnitts
Sehr schön ist die Beschreibung des von L. Pacioli (etwa 1500 n. Chr.) mit Hilfe des . Dabei ist γ ∈ R festgelegt durch die Bedingung 1 γ−1 = , d.h. γ −1 = γ − 1 . γ 1 √ Das ergibt γ 2 − γ − 1 = 0 und γ = 12 (1 ± 5). Wir wählen
γ :=
Nun betrachtet man drei
√ 1 (1 + 5) ≈ 1.681 . 2
goldene Rechtecke im R
(±1, ±γ, 0) , (±γ, 0, ±1)
und
3
mit den jeweiligen Ecken
(±1, ±γ, 0) .
√ Sie liegen alle auf einer Sphäre vom Radius γ + 2 und sind die 12 Ecken eines Ikosaeders, bestehend aus 20 gleichseitigen Dreiecken und 30 Kanten.
PLATONISCHE KÖRPER
395
Dodekaeder
Auch das kann man mit Hilfe des goldenen Schnitts konstruieren. Auf den Würfel mit den 8 Ecken (±1, ±1, ±1) setzt man 6 Walmdächer mit den zusätzlichen 12 Eckpunkten
(0, ±γ −1 , ±γ) , (±γ, 0, ±γ −1 )
und
(±γ −1 , ±γ, 0) .
Wie man leicht nachrechnet, liegen die 3 Punkte
(0, 0, γ) , (1, 0, 1)
und
(γ, 0, γ −1 )
auf einer Geraden; also liegen die Ecken der eingezeichneten Fünfecke jeweis in einer Ebene. Aus den angegebenen 20 Ecken erhält man insgesamt 12 gleichseitige Fünfecke und 30 Kanten. Die Bilanz von Ecken, Kanten und Flächen fassen wir noch einmal zusammen:
ANHANG
396
Ecken
Kanten
Flächen
Tetraeder
4
6
4
Würfel
8
12
6
Oktaeder
6
12
8
Ikosaeder
12
30
20
Dodekaeder
20
30
12
Bezeichnen wir mit
e := Anzahl der Ecken, k := Anzahl der Kanten und f := Anzahl der Flächen, so gilt für alle Platonischen Körper die
Polyederformel von Euler
e−k+f =2.
2. Dualität An der Tabelle von Ecken, Kanten und Flächen erkennt man deutlich eine schon bei den Konstruktionen bemerkte Beziehung zwischen Würfel und Oktaeder, sowie Ikosaeder und Dodekaeder. Allgemein kann man bei einem Platonischen Körper, dessen Ecken auf einer Kugel liegen, in jeder Ecke die Tangentialebene an die Kugel anlegen. Dadurch entsteht wieder ein Platonischer Körper, dessen Kanten in den Schnittgeraden der Tangentialebenen enthalten sind. Auf diese Weise entsteht etwa aus einem Oktaeder ein Würfel und aus dem Würfel wieder ein Oktaeder. Hierzu reproduzieren wir zwei schöne Zeichnungen aus [H-C]:
Bei den fünf Platonischen Körpern gibt das die folgenden
Dualitäten
PLATONISCHE KÖRPER Tetraeder
←→
Tetraeder
Würfel
←→
Oktaeder
Ikosaeder
←→
Dodekaeder
397
Dabei bleibt jeweils die Zahl der Kanten erhalten, aus Ecken werden Flächen und umgekehrt. Oensichtlich haben duale Platonische Körper die gleichen Symmetriegruppen.
3. Einzigkeit der Platonischen Körper Platonische Körper sind zusammengesetzt aus gleich groÿen gleichseitigen n-Ecken. Dass dafür nur die Zahlen n = 3, 4, 5 und die beschriebenen fünf Körper in Frage kommen, hat schon Euklid am Ende des 13. und letzten Bandes seiner Elemente gezeigt. Wir reproduzieren seinen Beweis aus [Eu]:
4. Ausblick Schon Archimedes hat um 250 v. Chr. als Verallgemeinerung der Platonischen Körper konvexe Polyeder konstruiert, die von mehreren Arten von n-Ecken begrenzt werden. Ein besonders schönes Beispiel ist das gestutzte Ikosaeder . Dabei wird jede der 12 Ecken des Ikosaeders so abgeschlien, dass daraus ein gleichseitiges Fünfeck entsteht. Aus den 20 Dreiecken werden dabei gleichseitige Sechsecke.
ANHANG
398
Insgesamt gilt wieder die Eulersche Formel:
e − k + f = 60 − 90 + 32 = 2 . In der Renaissance hat man sich für diese Polyeder wieder interessiert, eine Abwicklung des gestutzten Ikosaeders ndet man bei .
Albrecht Dürer
Er konnte nicht vorhersehen, dass daraus über 400 Jahre später der Fuÿball Telestar entstehen würde. Wenn man in Platonischen oder Archimedischen Körpern die Ecken leicht verschiebt und den Körper dadurch etwas deformiert, erhält man ein konvexes Polyeder (vgl. etwa [Fi2 ]. Man kann zeigen, dass auch in diesem allgemeinen Fall die Eulersche Formel gültig bleibt; daraus folgt dann eine Verallgemeinerung des Satzes von . All das wird etwa in [H-C, 44] ausgeführt. Eine Darstellung, die auch Grundlage für den Schulunterricht sein kann, ndet man bei [Ho].
Euklid
Literaturverzeichnis Lehrbücher der Algebra [ArE] [ArM] [Bo] [F-S] [Fr] [Ku] [La] [Me] [R-S-V]
Artin, E. Artin, M. Bosch, S. Fischer, G., R. Sacher Fricke, R. Kunz, E. Lang, S. Meyberg, K. Reiffen, H.-J., G. Scheja
: Galoissche Theorie. Harri Deutsch 1965 : Algebra. Birkhäuser 1993
: Algebra. Springer 2006
6
: Einführung in die Algebra. Teubner 1983
3
: Lehrbuch der Algebra I. Vieweg 1924
: Algebra. Vieweg 1994
2
: Algebra. Addison Wesley 1965 : Algebra 1, 2. Hanser 1975, 76 und
U. Vetter
: Algebra. Bibliographi-
sches Institut 1969 [Ro]
Rotman, J.J. 1995
[vdW1 ]
4
: An Introduction to the Theory of Groups. Springer
van der Waerden, B.L.
: Moderne Algebra. Springer 1931; neu auf-
gelegt als Algebra I. Springer 1966 [We1 ] [Wü]
Weber, H. Wüstholz, G.
7
: Lehrbuch der Algebra. 3 Bände. Vieweg 1896 - 1908 : Algebra. Vieweg 2004
399
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
400
LITERATURVERZEICHNIS
Weitere Literatur
[A]
Abel, N.H.: Beweis der Unmöglichkeit, algebraische Gleichungen von
[Ab]
Abhyankar, S.: On Macaulay's Example. In: Springer Lecture Notes
[B-R-K]
Bartholomé, A., J. Rung und H. Kern: Zahlentheorie für Einstei-
[B-E-O'B]
höheren Graden, als dem vierten, allgemein aufzulösen. J. Reine Angew. Math. 1, 65-85 (1826) in Math. 423 (1974), 1-16 ger. Vieweg 20065
Beschke, H.U., B. Eick, E.A. O'Brien
: A millenium project: constructing small groups. Internat. J. Algebra Comput. 12, 623-644 (2002)
[Bi]
Bewersdorff, J.: Algebra für Einsteiger. Vieweg 2007 3 Bieberbach, L.: Theorie der geometrischen Konstruktionen.
[B-O]
Bruinier, J.H., K. Ono: An algebraic formula for the partition func-
[Be]
[C]
häuser 1952
Birk-
tion. Preprint 2011
Cardano, G.:
Nürnberg 1545
Artis magnae sive de regulis algebraicis liber unus.
[Ca]
Carmichael, R.D.: Introduction to the theory of groups of nite
[C-L-O'S]
Cox, D., J. Little, D. O'Shea: Ideals, Varieties and Algorithms.
[De]
Dedekind, R.:
[Eb] [Eu] [F-T] [Fi1 ] [Fi2 ] [Fi3 ] [F-L] [G]
order. Ginn 1937 Springer 1991
Beweis für die Irreduzibilität der Kreisteilungsgleichung. J. Reine Angew. Math. 54, 27-30 (1857)
Ebbinghaus, H.-D.: et al: Zahlen. Springer 1983 Euklid: Die Elemente. Hrsg. C. Thaer, Wiss. Buchgesellschaft 1980 Feit, W., J.G. Thompson: Solvability of groups of odd order. Pac.
J. Math. 13, 775-1029 (1963)
Fischer, G.: Lineare Algebra. Vieweg 200515 Fischer, G.: Analytische Geometrie. Vieweg 2001 7 Fischer, G.: Ebene algebraische Kurven. Vieweg 1994 Fischer, W., I. Lieb: Funktionentheorie. Vieweg 20059 Galois, É.: Écrits et mémoires mathématiques. Gauthier-Villars 1962
LITERATURVERZEICHNIS
401
[Ga1 ]
Gauss, C.F.: Demonstratio nova theorematis omnem functionem al-
[Ga2 ]
Gauss, C.F.: Die vier Gauss'schen Beweise für die Zerlegung ganzer algebraischer Funktionen. Herausgegeben von E. Netto. Oswald's
gebraicam rationalem integram unius variabilis in factores reales primi vel secundi gradus resolvi posse. In: Werke, Band III, 1-30
Klassiker der exakten Wissenschaften Nr. 14. Akademische Verlagsgesellschaft 1913 [Ga3 ]
[Ga4 ]
[Ha] [He]
[Her]
Gauss, C.F.: Disquisitiones arithmeticae, 1801. Gesammelte Werke, Band I. Deutsche Übersetzung: Untersuchungen über höhere Arithmetik, 1889
Gauss, C.F.
: Theoria residorum biquadraticorum, Commentatio secunda 1831. In: Gesammelte Werke, Band II. Deutsche Übersetzung im Anhang zu: Untersuchungen über höhere Arithmetik, 1889
Hasse, H.: Vorlesungen über Zahlentheorie. Springer 1950 Hermes, J.: Über die Teilung des Kreises in 65537 gleiche Teile. Nachrichten von der Königl. Ges. d. Wiss. zu Göttingen, Math.-phys. Kl. 1894, 170-186
Hermite, C.: Sur la fonction exponentielle. C.R.Acad.Sci. Paris 77,
(1873)
[H-C]
Hilbert, D., S. Cohn-Vossen: Anschauliche Geometrie. Springer
[Ho]
Hofacker, K.: Konvexe Polyeder und ihre Behandlung im Unterricht.
1932
http://www-m10.ma.tum.de/twiki/pub/Lehrstuhl/GerdFischer/ KonvexePolyeder.pdf
[Kl1 ]
Hulek, K.: Elementare Algebraische Geometrie. Vieweg 2000 Klein, F.: Vorlesungen über das Ikosaeder und die Auösung von Glei-
[Kl2 ]
Klein, F.: Vorträge über ausgewählte Fragen der Elementargeometrie,
[Hu]
chungen vom fünften Grade. Teubner 1884. Kommentierte Neuauage Birkhäuser 1993 ausgearbeitet von F. Tägert. Teubner 1895
[M]
Knörrer, H.: Geometrie. Vieweg 20062 Lindemann, F.: Über die Zahl π. Math. Ann. 20, 213-225 Macaulay, F.S.: Algebraic Theory of Modular Systems. Cambridge
[Ma]
Matzat, B.H.: Konstruktive Galoistheorie. Lecture Notes in Mathe-
[Kn] [Li]
1916
matics 1284. Springer 1987
LITERATURVERZEICHNIS
402 [Mi]
[M-P] [Ne] [N-S-T] [Os] [Pe]
Michler, G.O.: Vom Hilbertschen Basissatz bis zur Klassikation der endlichen einfachen Gruppen. In: Ein Jahrhundert Mathematik, 1890-1990. Vieweg 1990
Müller-Stach, S., J. Piontkowski: Elementare und algebraische
Zahlentheorie. Vieweg 2007
Neukirch, J.: Algebraische Zahlentheorie. Springer 1992 Neumann, P.M., G.A. Stoy, E.C. Thompson : Groups and geometry. Oxford Univ. Press 1994
Ossa, E.: Topologie. Vieweg 1992 Perron, O.: Eine neue Winkeldreiteilung des Schneidermeisters Kopf. Sitzungsber. bayr. Akad. d. Wiss., math.-nat. Abt. 1933, 439445
[R-U]
Remmert, R. und P. Ullrich: Elementare Zahlentheorie. Birkhäuser
1995
[Ri]
Richelot, F.: De resolutione algebraica aequationis X
[S]
Sarges, H.: Ein Beweis des Hilbertschen Basissatzes. J. Reine Angew.
[Sa]
afarevi£, I.R.: Construction of elds of algebraic numbers with gi-
[Sl]
Slodowy, P.: Das Ikosaeder und die Gleichungen fünften Grades. In:
[St]
Steinitz, E.: Algebraische Theorie der Körper. J. Reine Angew. Math.
[Sy]
Sylow, M.L.: Théorèmes sur les groupes de substitutions. Math. Ann.
[vdW2 ]
van der Waerden, B.L.: A history of Algebra. From al-Khwarizmi
[Wa] [We2 ] [Wu]
257 = 1, sive de divisione circuli per bisectionem anguli septies repetitam in partes 257 inter se aequales commentatio coronata. J, Reine Angew. Math. 9 (1832)
Math. 283/ 284, 436-437 (1976)
ven solvable Galois group. Izv. Akad. Nauk. SSSR. Ser. Math. 18, 525-578 (1954); AMS Translation, Ser. 2, Vol. 4, 185-237 (1956) Mathematische Miniaturen 3. Birkhäuser 1986
137, 167-309 (1910)
5, 584-594 (1872)
to Emmy Noether. Springer 1985
Walker, R.J.: Algebraic Curves. Princeton University Press 1950 Weber, H.: Theorie der Abel'schen Zahlkörper. Acta Math. 8, 193-
263 (1886)
Wussing, H.
: Die Genesis des abstrakten Gruppenbegris. Deutscher Verlag der Wissenschaften, 1969
Index Ableitung, formale, 281 Abschluss algebraischer, 262, 276, 293 ganzer, 229 Absolutbetrag, 150 Addition, 4 adjungiert, 148 Adjunktion, 250 symbolische, 264 Anordnung lexikograsche, 168 Anteil ganzzahliger, 9 homogener, 166 Assoziativgesetz, 4 assoziiert, 206 Auswahlaxiom, 204 Auswertung, 200 Automorphismengruppe, 22, 313 Automorphismus, 21, 149 innerer, 26, 76 Bahn, 75 Bahn-Lemma, 75 Bahnengleichung, 76 Bahnenraum, 75 Bahnsumme, 369 Basis, 115 Basissatz von Hilbert, 189 Berechnung des Inversen, 254 Bild, 21, 149 casus irreducibilis, 335 Cauchy-Produkt, 156 Cayleysche Kubik, 307 Charakter, 359 Charakteristik, 247
Chinesischer Restesatz, 58, 193 Codierung, 72 Delisches Problem, 378 Diedergruppe, 51, 127 Diskriminante, 302, 303, 329 Distributivgesetze, 145 Division mit Rest, 9, 160, 162, 185 Divisionsalgebra, 151 Dodekaeder, 395 Don Giovanni Gruppen, 133 Dreher, 19 Dualitat, 396 Einbettung von Halbgruppen, 171 Einbettungssatz, 279 Einheit, 147, 159, 177, 181, 232 Einheitengruppe, 147 Einheitswurzel, 15, 164, 348, 352 primitive, 15, 348 Einselement, 146 Einsetzungshomomorphismus, 158, 160, 251 Eisenstein-Kriterium, 221 Element algebraisches, 251 irreduzibles, 207 linksinverses, 5 linksneutrales, 2, 4 maximales, 204 neutrales, 2, 4 primitives, 250 rechtsneutrales, 2 reduzibles, 207 transzendentes, 251 Elementarmatrix, 84 Elementarteiler, 111
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
404
INDEX
Endomorphismenring, 152 Endomorphismus, 21, 149 Epimorphismus, 21, 149 Ergänzung quadratische, 333 Erweiterung eines Zahlbereichs, 171 Euklidischer Algorithmus, 65, 216 Eulersche ϕ-Funktion, 61 Eulersche Identität, 170 Eulersche Identität, 63 Exponent einer Gruppe, 112 eines Primfaktors, 215 Faktor, 140 Faktorgruppe, 35 Faktorisierungssatz, 39, 179 Faltung, 156 fast alle, 116 Fehlstand, 24 Fermatkurve, 223 Fixkörper, 315 Formel von Cardano, 335 Fortsetzung von Körperisomorphismen, 265 Frobenius-Homomorphismus, 285 Fundamentalgruppe, 3 Fundamentalsatz der Algebra, 261, 324 Galois-Erweiterung, 317 Galoisgruppe, 314 Ganzheitsring, 229 Gauÿsche Zahlen ganze, 14 Gauÿsche Zahlenebene, 182 Gauss'sche Periode, 369 Gebiet, 152 Gleichung allgemeine, 363, 364 diophantische, 232 Pellsche, 232 Gröbnerbasis, 190 Grad, 159, 166 (totaler), 168 gewichteter, 311 homogen vom, 169
Gradformel für Körper, 249 für Polynome, 159 Gruppe, 4 p-, 107, 123 freie abelsche, 115 abelsche, 4 allgemeine lineare, 13 alternierende, 25 auösbare, 141 der invertierbaren Matrizen, 13 der relativen Automorphismen, 314 einfache, 136 endlich erzeugte, 8, 114 endlich erzeugte abelsche, 120 kommutative, 4 orthogonale, 13 spezielle lineare, 37 spezielle orthogonale, 24 symmetrische, 12, 49 torsionsfreie, 115, 121 triviale, 11 zyklische, 12, 36, 55, 170 Halbgruppe, 2 Halbgruppenring, 167 Halbordnung, 204 Hauptideal, 176, 184 Hauptidealring, 184, 186, 210 Hauptsatz über symmetrische Polynome, 310 der elementaren Zahlentheorie, 212 der Galoistheorie, 319, 332 Hilbertscher Nullstellensatz, 203 Homomorphismus, 21 von Gruppen, 21 von Ringen, 149 Ideal, 176, 196 coprimes, 192 erzeugtes, 184 maximales, 199, 202, 205 primes, 198 triviales, 176 Ikosaeder, 394 gestutztes, 397
INDEX
Ikosaedergleichung, 366 Ikosaedergruppe, 94 Imaginärteil, 227 Index, 29 induktiv geordnet, 204 Inhalt eines Polynoms, 218 Inklusion, 26 Integritätsring, 146 Interpolationsformel von Lagrange, 163 Interpolationspolynom, 164 Inverses, 4 Inversion, 27 Irrationalteil, 227 Irreduzibilitäts-Satz, 219 ISBN-Prüfziern, 18 Isomorphiesatz Dritter, 40 Erster, 40, 179 Zweiter, 48, 192 Isomorphismus, 21, 149 Isotropiegruppe, 75 Kern, 21, 149 Kette, 204 Klassengleichung, 77 der Ikosaedergruppe, 99 Klassikation von endlichen Gruppen, 55 von Gruppen, 39 Kleinsche Vierergruppe, 12, 23, 49 Koezient, 155, 166 Körper, 147 algebraisch abgeschlossener, 260 der meromorphen Funktionen, 175 der rationalen Funktionen, 174 Platonischer, 393 vollkommener, 286 Körpererweiterung, 148, 248, 357 algebraische, 258 biquadratische, 340 einfache, 250 galoissche, 317 normale, 271 transzendente, 258 Körpergrad, 248
Kommutator, 138 Kommutatorgruppe, 138 höhere, 140 Kongruenz, 9, 28, 178 Konjugation, 26, 228 Konjugationsklasse, 82 konstruierbar, 380 Konstruktionsschritte elementare, 379 Korrespondezsatz für Ideale, 179 Kreisteilungspolynom, 349, 352 Kürzungsregeln, 6 Kummerring, 214, 243 Lagrangesche Resolvente, 359 Leitkoezient, 159 Leitterm, 159 Lemma von Artin, 358 von Gauss, 217 von Zorn, 204 Linkstranslation, 5 Matrixdarstellung, 153 Matrizenring, 153 Minimalpolynom, 253 Monom, 155, 166, 167, 277 primitives, 166, 277 Monomorphismus, 21, 149 Multiindex, 166 Multiplikation, 4
n-Eck regelmäÿiges, 85, 378 Nebenklasse, 27 Negatives, 4 Neilsche Parabel, 307 Norm, 150, 228 Normalisator, 46 Normalreihe, 140 Normalteiler, 33 trivialer, 34 Nullelement, 4, 145 Nullring, 146 Nullstelle, 163 allgemeine, 364 einfache, 281
405
406
INDEX
mehrfache, 281 Nullstellenmenge, 196 Nullteiler, 146, 159 Oberkörper, 148 Oktaeder, 91, 394 Oktaven, 151 Operation, 73 eektive, 74 einfach transitive, 74 transitive, 74 Ordnung, 28, 29, 187, 204 Partition, 107, 111 Pentagramm, 15 Permutation gerade, 24 ungerade, 24 Permutationsgruppe, 12 Permutationsmatrix, 83 Polyeder konvexes, 398 reguläres, 393 Polyederformel, 396 Polynom, 155, 166, 167 allgemeines, 363, 364 durch Radikale lösbares, 360 elementarsymmetrisches, 309 normiertes, 159 primitives, 217 reines, 356 separables, 284 symmetrisches, 310 Polynomfunktion, 158 Polynomring, 156, 277 Potenzreihe formale, 158, 166, 187 Prüfzier, 18 Primärkomponente, 106 Primärzerlegung, 106 Primelement, 207 Primitivzahl, 369 Primkörper, 181, 247 Primrestklassengruppe, 64, 181, 351, 353, 354 Primzahl, 211
Fermatsche, 390 Mersennesche, 290 Produkt, 192 äuÿeres direktes, 41 äuÿeres semidirektes, 45 inneres direktes, 43, 44 inneres semidirektes, 48 Produktring, 151 Progression, arithmetische, 376 Punktgitter, 14 Quadratur des Kreises, 378 Quaternionen, 153 Quaternionengruppe, 13, 38, 155 Quersumme, 15 Quotient, 161 Quotientenkörper, 172 Quotientenvektorraum, 36 Radikal, 356 Radikalerweiterung, 360 Rang, 117 Rationalteil, 227 Realteil, 227 Rechteck goldenes, 394 Rechtstranslation, 5 Reduktions-Kriterium, 222 Reihe, hypergeometrische, 367 Relation, 117 von Bézout, 57 Relation von Bézout, 216 Resolvente, 367 irrationale, 368 kubische, 340 Lagrangesche, 359 quadratische, 334 Rest, 9, 161 Restklassen, 9 Restklassenring, 178 Resultante, 297 Ring, 145 der formalen Potenzreihen, 158 der stetigen Funktionen, 189 euklidischer, 185, 235 faktorieller, 214, 217
407
INDEX
noetherscher, 184, 189 nullteilerfreier, 146 RSA-Kryptosystem, 70 Satz
von Caley, 74 von Cauchy, 105, 122 von Dirichlet, 376 von Fermat und Euler, 65, 241 von Fermat, kleiner, 17 von Gauss, 217 von Lagrange, 29, 82 Satz von Sylow, 124 Schiefkörper, 147 der Quaternionen, 155 Schleifenraum, 3 Schnitt goldener, 390, 394 Schranke obere, 204 Sieb des Eratosthenes, 213 Signum, 24 Spaltungslemma, 117 Sphäre, 393 Spur, 228 Stabilisator, 75 Stabilität, 270 Standgruppe, 75 stationär, 185, 209 Struktursatz für endliche abelsche Gruppen, 111 für endlich erzeugte abelsche Gruppen, 120 für endliche Körper, 286 Substitutionshomomorphismus, 158 Summe, 192 (innere) direkte, 43 Sylowgruppe, 124 Symmetrie, 12, 85 Symmetriegruppe, 85 Teiler, 56, 206 gemeinsamer, 56 gröÿter gemeinsamer, 57, 216 gröster gemeinsamer, 283 Teilerkette, 209
Teilerkettensatz, 209 Tetraeder, 89, 393 Tetraedergruppe, 89 Torsionsgruppe, 122 Torsionsuntergruppe, 114 Translationen, 26 Transposition, 25 Tschirnhaus-Transformation, 303 Unbestimmte, 155 Unendlichkeitssatz von Euklid, 212 Untergruppe, 6 p-, 124 erzeugte, 7 triviale, 7 Unterkörper, 148 erzeugter, 250 Unterring, 148 erzeugter, 250 Verknüpfung innere, 1 Verknüpfungstafel, 1 Verknüpfung assoziativ, 1 assoziative, 4 kommutative, 1 Verschlüsselung, 72 Vertretersystem, 76, 215 Vielfaches, 56, 206 gemeinsames, 56 kleinstes gemeinsames, 57, 216 Vielfachheit, 281 Winkeldreiteilung, 378 wohldeniert, 9, 23 Würfel, 91, 394 Würfelgruppe, 91 Wurzel, 356 Wurzelsatz von Vieta, 309 Zahl
ganze, 8, 229 ganze Gauÿsche, 150 ganzrationale, 8, 229 ideale, 244 komplex konjugierte, 150
408 komplexe, 150 quadratfreie, 226 teilerfremde, 57 Zahlenebene, 150, 255 Zahlkörper imaginär-quadratischer, 175 quadratischer, 227 Zahlkörper imaginär-quadratischer, 227 reell-quadratischer, 227 Zahlring quadratischer, 229 Zentralisator, 76 Zentrum, 76, 84 Zerfällungseigenschaft, 270 Zerfällungskörper, 267 Zwischenkörper, 150, 248 Zyklenstruktur, 82 Zyklenzerlegung, 78 Zyklus, 78 elementfremder, 78
INDEX
SYMBOLVERZEICHNIS N Z Q R C H Fq
natürliche Zahlen, 2 ganze Zahlen, 8 rationale Zahlen, 14 reelle Zahlen, 3, 14 komplexe Zahlen, 14 Quaternionen, 153 Körper mit q = pn Elementen, 181, 287
An alternierende Gruppe, 25 Cn n-te Einheitswurzeln, 14, 164 Dn Diedergruppe, 52 (p) Φn , Φn Kreisteilungspolynome, 349 Gp Primärkomponente von G, 106 i imaginäre Einheit, 150 K × Körper ohne Null, 14 K algebraischer Abschluss von K , 262 Od quadratischer Zahlring, 229 Pn reguläres n-Eck, 85 Q Quaternionengruppe, 13 R× Einheitengruppe von R, 147 Sn symmetrische Gruppe, 49 sp Anzahl der p-Sylowgruppen, 125 Sp p-Sylowgruppe, 124 Zn zyklische Gruppe, 36 Zn× Primrestklassengruppe, 63 ζn primitive n-te Einheitswurzel, 14, 164 Aut (G), Aut (K) Automorphismengruppen, 22, 313 Aut (K; k) relative Automorphismen, 313 C(M ; R) stetige Funktionen, 151 char (R) Charakteristik, 247 deg (f ) Grad eines Polynoms, 159, 168 dis (f ), Δ(f ) Diskriminante, 302 Erz (M ) erzeugte Untergruppe, 7 exp(G) Exponent einer Gruppe, 112 Fix (K; G) Fixkörper, 315 ϕ(n) Eulersche Funktion, 62 G/H linke Nebenklassen, 28 H\G rechte Nebenklassen, 28 G/N Faktorgruppe, 35 G(x) Bahn von x, 75 Gal (f, k) Galoisgruppe, 314 ggT gröÿter gemeinsame Teiler, 57, 216
409
GL(n; K) allgemeine lineare Gruppe, 13 Imϕ Bild von ϕ, 21, 149 ind (G : H) Index von H in G, 29 inh(f ) Inhalt eines Polynoms, 218 K(a) Körperadjunktion, 250 K(X) Funktionenkörper, 174 Kerϕ Kern von ϕ, 21, 149 kgV kleinstes gemeinsames Vielfaches, 57, 216 Kom (G) Kommutatorgruppe, 138 Kon (M ) konstruierbare Punkte, 381 M(D) meromorphe Funktionen, 175 M (n × n; K) Matrizenring, 153 μ(f ; x) Vielfachheit einer Nullstelle, 281 NorG Normalisator, 46 νp (a) Exponent von p in a, 215 O(D) holomorphe Funktionen, 152 O(n) orthogonale Gruppe, 13 ord (M ) Anzahl der Elemente, 28 Q(R) Quotientenkörper von R, 173 R/a Restklassenring, 178 R[ a ] Ringadjunktion, 250 R[ X ] Polynomring, 156 res (f, g) Resultante, 297 R[[X]] Potenzreihenring, 158 S(M ) symmetrische Gruppe, 12 signσ Signum einer Permutation, 24 SO(n) spezielle orthogonale Gruppe, 24 StaG (x) Standgruppe, 75 T (G) Torsionsuntergruppe, 114 Z(G) Zentrum, 76 ZenG (x) Zentralisator, 76
(A) erzeugtes Ideal, 184 (x1 , . . . , xn ) n-Zyklus, 78 [a, b] Kommutator, 138 [K : k] Körpergrad, 248 | teilt, 56, 206 teilt nicht, ∼ assoziiert, 206 ≡ kongruent, 9 < Untergruppe, 6
Normalteiler, 33 × direktes Produkt, 41 ⊕ direkte Summe, 43 , ×Φ semidirektes Produkt, 45, 48
G. Fischer, Lehrbuch der Algebra, DOI 10.1007/978-3-8348-8333-9, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011