Mathematisch für fortgeschrittene Anfänger
Martin Wohlgemuth (Hrsg.)
Mathematisch für fortgeschrittene Anfänger Weit...
366 downloads
1516 Views
12MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Mathematisch für fortgeschrittene Anfänger
Martin Wohlgemuth (Hrsg.)
Mathematisch für fortgeschrittene Anfänger Weitere beliebte Beiträge von Matroids Matheplanet
Mit Beiträgen von Johannes Hahn, Florian Weingarten , Florian Modler, Martin Wohlgemuth, Manuel Naumann, Jens Koch , Thorsten Neuschel, Peter Keller, Norbert Engbers, Hans-Jürgen Caspar, Kay Schönberger, Deli Hafner, Reinhard Brünner
'''''+.'.'*1'
Mi'
Herausgeber Martin Wohlgemuth E-M ail : mail @m atro id.de www.mathepl anet.de
Wichtige r Hinweis für den Benutzer Der Verlag , der Herausgeber und die Auto ren haben alle Sorgfalt walten lassen, um voll ständige und akkura te Information en in diesem Buch zu publizieren. Der Verlag übernimmt wed er Garantie noch die juristische Verantwortung oder irgendeine Haftung für die Nutzung dieser Info rmationen, für de ren Wirtschaftlichkeit ode r fehlerfreie Funktion für einen bestimmten Zw eck. Fern er kann der Verl ag für Schäden, die auf einer Fehlfunktion von Programmen oder ähnliches zurückzuführen sind, nicht haftb ar gemacht werden. Auch nicht für die Verlet zung von Patent- und anderen Rechten Dritter, die daraus resultieren . Eine telefonische oder schriftliche Beratung durch den Verlag über den Ein satz der Programme ist nicht möglich. Der Verlag übernimmt keine Gew ähr dafür, da ss die beschri eb enen Verfahren, Programme usw. frei von Schutzrechten Dritter sind. Die Wiedergabe von Gebrauchsnamen. Handelsnamen. Warenbezeichnungen usw. in diesem Buch berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Nam en im Sinne der Warenzeichen - und MarkenschutzGesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag hat sich bemüht, sä mtliche Rechteinhaber von Abbildungen zu ermitteln. Sollte dem Verlag geg enüber dennoch der Nachweis der Rechtsinh aberschaft geführt werden, wird da s branchenübliche Honorar ge zahlt. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deuts chen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http ://dnb.d-nb.de abrufbar. Sp ringer ist ein Unternehmen von Springer Seience-Business Media springer.de © Spektrum Akademischer Verlag Heidel berg 20 I0 Spektrum Akademisch er Verlag ist ein Imprint von Springer 10
ll
12 13 14
54321
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Gren zen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervi elfältigungen, Übersetzungen , M ikroverfilmungen und die Ein speicherung und Verarb eitung in elektro nischen Sy stemen. Planung und Lektorat: Dr. Andreas R üdinger, Barbara L ühke r Herstellung: Cr est Premedia Solutions (P) Ltd , Pun e, Maharashtra, India Sat z: Ma rtin Wohlgem uth und die Autoren Umschlaggestaltung: SpieszDesign, Neu-Ulm Titelbild: © Jo s Ley s ISBN 978 -3-8274-2606-2
Vorwort
Nun liegt das zweite Buch mit Beiträgen von Matroids Matheplanet vor. Alles, was im Vorwort zum ersten Band über den Matheplaneten , seine Mitglied er und die do rtigen Gepflog enheiten gesagt worden ist , gilt weiterhin. Ich muss es nicht wied erholen . Der ers te Band hat den Titel "Mathematisch für Anfänger"; der neu e, hier vorgelegte Band wendet sich a n "fort geschrittene Anfänger". Diese Bezeichnung drückt für uns, die Autoren , zweierle i aus: Zum eine n b ehandelt dieser Band Themen, die a ufb aue nd auf den mathematischen Grundlagen , die im ers ten Band zusammengetragen worden sind , dem Leser abwechslungsreiche und inter essante E inblicke in ver schiedene weiterführende oder fortgeschrit tenere Gebiete der Mathematik geben. Zum zweiten ist es unser Ziel , dass alle s so ver ständlich ist , wie ein Anfänger im jeweiligen neuen Gebiet es sich wünschen wird . Doch so ver schi ed en und weit auseinander die Themen sche ine n, so haben Auswahl und Anordnung der Inhalte eine n roten Fade n. Der Leser wird - so hoffen wir - von Kapitel zu Kapi tel vorw ärts gehen und es wird ihm so vorkommen , al s ob alle s zu sammenhinge, weil nämlich das eine auf dem a nderen a ufbaut und in der Vielfalt de r Themen diese gemeinsamen Grundlagen und wiederkehrenden ma thematis chen Denkweisen gut zu erkennen sind . Am Beginn des Buches steht die Algebra. In sechs umfangreichen Kapiteln wird eine Einführung in die Gruppentheori e gegeb en , die von zyklische n Gruppen , Unterg ru ppe n und Faktorgrupp en üb er Homomorphism en , Isomorphiesätze und die Sylowschen Sätze bi s zur Auflö sbarkeit von Gruppen reicht . Dies entspricht et wa dem St off eine r Algebra I-Vorlesung. Gute Beispi ele und die ric htigen E rk lärungen an der richtigen St elle machen unseren Kurs zur Gruppentheorie zu etwas Besonderem. Daran ansch ließend folgt ein (er stes) Beispiel für die Anwendung von Gruppentheorie im "wirklichen Leben", nämlich be im Rubik 's Cube. De r Algebra-Teil endet mi t einer Darstellung zu endlichen Körpern , welche dann im vierten Tei l, in dem es um Kryp tographie und Fa kt oris ierungs verfa hren geht , ein e Ro lle spielen werden .
VI
Vorwort
Der zweite Teil gibt eine Au swahl von Them en der Diskr et en Mathematik; dazu gehören Beiträge zur Kombinatorik , aus der Graphentheori e und üb er ganzzahlige Optimierung. Es handelt sich hier aber nicht um eine n Grundkurs in elementarer Kombinatorik . Vielmehr erhält der Leser eine n Einblick , wie vielseitig, komplex und ideenreich die fortg eschritten e Kombinatorik sein kann . Wichtige Stichworte sind: Polya-Burnside-Lemma, Partitionszahlen , erzeugen de Funktionen , Heiratsproblem , Bernoulli-Zahlen , Satz von Lagrange, Permanenten und Fixpunkte sowie die Binomialmatrix und das Lemma von Gessel-Viennot. Die behandelten Problem e kann jed er "Anfänger" ver st eh en , denn sie sind an schaulich und auch im Klein en üb erprüfbar. Das ist ein Vorteil der Diskr et en Mathematik. Auch die Geometrie ist anschaulich . Es gibt a be r nicht nur die eleme nt a re Geometrie a us der Schule. Auch Geometrie kann man fortgeschritten be t re ibe n. Das zeigt zunächst ein Beitrag zur Geometrie des Origami , gefolgt von eine r geometrischen Konstruktion des regelmäßigen Sieb zehnecks , für die ganz erhe bliche algebraische Hilfsmittel herangezogen werden mü ssen . In b eid en Beiträgen geht es a uch darum , was man nicht kon struier en kann. Der darauf folgende Beitrag mit eine m Satz üb er ein Dr eieck verallgem ein ert eine n a us der Schule be kannten Sachverhalt. Den geometrischen Teil beschli eßt eine Kon struktion der Kardioide als Hüllkurve eine r Kurvens char. Die Kr yptographie ist das Gebiet der Ma thematik, das in den letz ten Jahrzehnten mi t den mei sten Auft rieb erfahren hat. Ohne Verschlüsselung geh t heute, im onlin e-Zei t alter , nichts mehr , und die Mat hematik liefert die Met hoden zum sicheren Verschlüsseln: die ellipti schen Kurven . In hohem Maße werden in diesem Teil E rgebnisse und Methoden de r Gruppentheorie und der Theorie endlicher Körper benutz t . Wa s der eine ver schlüsselt , das soll der andere nicht (leicht) unerlaubt en t schlüsseln können . Bei der Verschlüsselung spielen seh r große Zahlen mit sehr großen Primfak to ren eine en t scheidende Rolle . Ein a usführlicher Überblick, mi t welchen Methoden man Teiler großer Zahlen finden kann und wie effizient das geh t , schließt sich a n. Im vierten Teil wird damit das Thema Kr yp tographie von "b eiden" Sei ten be t rachte t. Die Sammlung wird im fünften Teil fortgese tz t mi t Beit rägen zur Fouriert ransformation und zu einem klassischen Problem der Vari ationsrechnung, das als Br achist ochronenproblem bekannt ist . Der Schwerpunkt im fünften Teil ist die Zahlentheorie mi t Beiträgen über die bekannte sten t ranszendenten Zah len der Welt , nämlich die Euler sche Zahl e und die Kreiszahl 7r. Zahlen sind t ranszendent , wenn sie eine bes timmte Eigenschaft ni cht haben . Wie beweist man die Nich t-Eigenschaft "Transzendenz"? Das ist t rickreich, also etwas für fortgeschrittene An fänger . In einem weiteren Beitrag a us dem Bereich der elementaren Zahlentheorie laden die repuniis zum Mitdenken ein .
Vorwort
VII
Die Autoren der Beiträge sind junge und alte Mat he mat iker , Physiker ode r Ingeni eure. Sie sch reibe n für die Leser , weil sie ihre p er sönliche Fa szination und Fr eude an der Mat he mat ik teilen und vermitteln wollen . Die Autoren hoffen auf viele Leser , die sich an schli eßend mit Neugi er und voller Begeist erung auf die Mathematik stürzen und den Weg vom mathematischen Anfänger zum Fort geschritten en beginnen und durchhalten . Das wär e ein Erfolg! Man mu ss wissen , was die Mathematik zu biet en hat , damit man sie richtig (ein- )schätzen kann. Matheplanet im Juli 2010
Martin Wohlgemuth {Matroid} aus Witten , Johannes Hahn au s Rostock , Florian Weingarten au s Aa chen , Florian Modl er aus Hannover , Manuel Neumann aus Zürich , Jens Ko ch aus Berlin, Thorsi eti Neusch el aus Tri er , P eier K eller aus Berlin, Norb eri Engbers a us Osn abrück, Hans-Jürgen Caspar aus HenstedtUlzburg, Kay S chönberger aus Berlin, Ueli Hafn er aus Winterthur, Reinhard Briinner a us Rei chert shofen.
D a nks agun gen
Her zlich en Dank an alle Autoren für die sehr gute und erfolgreiche Zusammenarbeit in unser em Team; in sb esonder e mein e ich damit die sachliche und an genehme Durchführung der wech selseitigen Korrekturen . Ganz besonders möchte ich mich b ei Thorsten und J ohannes bedanken , die sich vor allen ander en um die Qualität des ganzen Buchs verdient gem acht haben . Best en Dank den a nde re n Korr ektoren und Probelesern, die mit ihrer Anmerkungen ganz ent sche ide nd zu unser em Buch b eigetrag en haben : buh a us Berlin, Wally au s Dortmund, Curufin. a us Stuttgart, liuepj er au s Münster , xycolon aus Aachen , Mentat aus Heid elb erg, maroinius au s Ro stock, Spock au s Mannheim und Bilbo aus Heid elb erg. Vielen Dank an A ikee und da_bounce, die einze lne Autoren b ei der Er st ellung der t ex-D ateien unter stützt haben. Genau wie die Autoren sind sie alle Mitglied er von Mat ro ids Mat he pla ne t. Vielen Dank an den Sp ektrum Akademi scher Verlag , dort vor allem an den Leiter des mathematischen Programms Herrn Dr. Rüdinger für sein e guten Anregungen und an un sere Lektorin Frau Lühker für die sehr gute Betreuung.
Martin Wohlgemuth
Inhaltsverzeichnis Vorwort. . ... ... . ... .... . ...... . ... .... . .. .... . ... .... ... .... . ..
v
I
1
1 1.1 1.2
1.3
1.4
2 2.1
2.2 2.3 2.4 2.5
3 3.1
3.2
3.3 3.4 3.5 3.6
Algebra Gruppenzwang I - Wir r e chnen mit a llem . . . . . . . . . . . . . . . . Die graue Theorie zu Beginn .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Eine Hie rarchie mathematischer Strukturen Die bunte Praxis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 .1 Beispiele für Gruppen 1.2 .2 Gegenbeispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 .3 Kleingeld- und Uhrenarithrnetik Wieder Theorie: Ein paar Beweise als Grundlage. . . . . . . . . . . . . . . . . 1.3 .1 Einseitig- und Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 .2 Einfache Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 .3 Potenzen .. .... . ...... . ... .... . .. .... . ... .... ... .... . .. Abschluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3 4 4 7 7 10 12 15 15 19 21 24
Gruppenzwang 11 Anonyme M athematiker b ie ten Gruppenthera pie a n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Untergruppen 2.1.1 Das Untergruppenkriterium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.2 Beispiele und Gegenbeispiele 2.1.3 Untergruppen von Z. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2.1.4 Erzeugendensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Nebenklassen und der Satz von Lagrange Normalteiler und Faktorgruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Uhrenarithmetik reloaded . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Abschluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
25 25 27 28 29 29 33 38 41 42
Gruppenzwang 111 - Sensa tion: Homo Morphis m us ist e in Grupp entier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Gruppenhomomorphismen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.1.1 Strukturerhaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.1.2 Kern und Bild. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Mehr Homomorphismen. . .. .. .. . . .. .. . . . .. .. .. . . .. . .. . . .. .. .. 3.2.1 Isomorphismen De r Homomorphiesatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.3.1 Ei nmal mehr zyklische Gruppen. . . . . . . . . . . . . . . . . . . . . . . .. Charakteristische Untergruppen Direkte Produkte und direkte Summen von Gruppen. . . . . . . . . . . .. Abschluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
43 43 45 46 47 48 50 53 54 56 58
x
4
InhaItsverzeich nis
Grupp enzwang IV - Gruppencamp er brauchen Iso( morphie-) matten Hilfssät ze un d Konvent ion en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Der erste Isomor phiesat z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Der zweite Isomor phiesat z Der dr it t e Isomor phiesatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Eine Anwendung der Isom or phiesät ze Absch luss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
59 60 61 63 68 71 74
Grupp enzwang V - Dr, Cauchy und Dr. Sylow bitte zur Grupp en-OP Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Drei grundlegende Au ssagen Da s er ste Teilziel Da s Große Ziel: Die Sylow-Sätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5.4 .1 Der er ste Satz von Sylow , . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5.4 .2 Der zweite Satz von Sylow 5.4 .3 Der drit t e Satz von Sylow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Anwen dungen der Sätze von Sylow , . . . . . . . . . . . . . . . . . . . . . . . . . . . . Abschluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75 75 77 80 81 82 85 86 86 89
6.5 6.6
Grupp enzwang VI - R andal e: Grupp endemo muss t e aufgelöst w erden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Und was hat das nun mi t Gruppen zu tun? 6.1.1 (Su b-)Normalreihen . ... . ... ... . ... . ... . .. . ... . ... . .. . .. 6.1.2 Faktoren von (Sub- )Normalreihen und Auflö sbarkeit . . . . . . . . Erste Schrit t e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2. 1 Isomor phie von Subnormalreihen . . . . . . . . . . . . . . . . . . . . . . . .. 6.2.2 Verfeinerungen.... . . ...... . ...... . . ..... . . ...... . . ..... Die Sät ze von Schreier und Jordan-Hölder Kornmut at oren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.4. 1 Die Kommutator-Reihe 6.4.2 Nützlich es für Gru ppentherapeuten . . . . . . . . . . . . . . . . . . . . . .. Nil potente un d p-G ru pp en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Abschluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
91 91 92 93 94 94 95 97 99 100 102 104 106
7 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8
Ein Spielzeug mit Grupp enstruktur Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Speedcubing. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Notation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Gesetze des Würfels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Cubegruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Konj ugat ion und Kommut atoren Ein paar offene P robleme Weitere Inform a tionen
107 107 108 109 109 110 113 115 115
4.1 4.2 4.3 4.4 4.5 4.6 5
5.1 5.2 5.3 5.4
5.5 5.6 6
6.1
6.2
6.3 6.4
Inhaltsverzeichnis
XI
117 118
8.7 8.8
Endliche Körper Wi ederholung muss sein Kör p er haben Charakt er Frob enius mi scht sich ein Polynomringe Adjunktion Symbolische Adj unkt ion von Nullstellen Existen z und Eindeu tigkeit endliche r Körper Zusammenfassung, Literatur und Au sbli ck
11
D iskret e Mathematik
9 9.1 9.2 9.3
Über die Anzahl von Sitzordnungen am runden Tisch Die Frage Der Weg Ver st eh e das Problem 9.3.1 Beispi el 9.3.2 E rste, aber fal sche Lösung 9.3.3 Syst ematisches Probier en Su ch e Zusammenhänge, ersinne eine n Plan und führe ihn aus 9.4.1 Suche im Internet 9.4.2 Ei ne Wer tet abelle 9.4.3 Ei n Plan Üb erprüfe die Lösung 9.5.1 Das Burnsid e-Lemma 9.5.2 Anw endung des P olya -Burnsid e-L emmas 9.5.3 Die T (n , k) -Formel 9.5.4 Ver st eh e die Formel 9.5.5 Gruppe der Rotati on en 9.5.6 Untersche id ungen b ei der Fragestellung Am Ziel 9.6.1 Zwei verschiede ne Ber echnungsweisen ? 9.6.2 Zusammenfassung und Lösung der Aufgabe 9.6.3 Kon struktiver Algorithmus? 9.6.4 Nachbet rachtung
. . . . . . . . . . . . . . . . . . . . . .
141 141 141 142 142 143 143 144 144 145 146 147 147 147 149 150 152 152 156 156 156 157 157
S ummenzerlegungen Zählen kann doch jeder Äquival ente und verwandte Fragen Die Anzahl der Su mmenzerlegungen von n Rekursive An sätze 10.4.1 Su mmenzerlegungen nach Größe der Su mmanden 10.4 .2 Su mmenzerlegungen nach Anzahl der Summanden
. . . . . . .
159 162 162 163 164 164 166
8
8.1 8.2 8.3 8.4 8.5 8.6
9.4
9.5
9.6
10 10.1 10.2 10.3 10.4
. . . . . . . . .
120 123 125 127 129 135 137
139
InhaItsverzeich nis
XII
10.5 Du ali t ät . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.6 Leere Behälter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.7 Erzeuge nde Funkti on en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.7.1 Die Brüc ke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.7.2 Üb er die Brücke gehe n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.7.3 Der Baupla n ist klar. 10.7.4 Zurück zu Summen zerl egungen 10.8 Au sbli ck und Schluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
168 169 171 172 173 174 175 175
P entagon, Kartenhaus und Summenzerlegung . . . . . . . . . . . .. P en t agon alz ahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Ka rt enh aus-Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Erste s Wunder Verallgem ein erte P entagon alz ahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Euler und Kar t enhäu ser? Zweites Wunder Nachlese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
177 178 178 179 179 180 180 182
I)as II eiratsproblem Klein e mat he matische Hilfe für potenti elle Schwiegermüt t er Ein Dor f will heir aten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die gr aphe nt heoret ische Darst ellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . Graphen theor etischer Algori thmus für das P roblem des gewichtsmaximalen Matchings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 12.4.1 Beispiel: Un ser Dorf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 12.4.2 Su che ein optimale s Mateh ing 12.4.3 Der graphentheore t ische Algo rithmus kurz und knapp 12.5 Lösungsweg mi t lin earer Optimierung 12.5.1 Ein schö ne rer Lösungsweg? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.5.2 An satz mit linearer Opt imi erung . . . . . . . . . . . . . . . . . . . . . . . . . 12.5.3 Formulierung der konkreten linear en Optimierungsaufgabe . . 12.5.4 Ganzzahlige Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.6 Zurück ins Do rf. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
183 183 184 185 188 189 190 194 194 194 194 195 197 200
13
Über die Anzahl surjektiver Abbildungen
203
14
Potenzsummen
211
15 15.1 15.2 15.3 15.4 15.5 15.6 15.7
Berechnung großer Binomialkoeffizienten . . . . . . . . . . . . . . . . . . Rechnen gem äß Definition Rekursive Bere chnung Mult ip liziere in günstiger Reih enfolge Teile und (be-)herrsche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Sat z von Legendre Algorithmische Ber echnung Weiter es Anwendungsb eispiel
215 215 216 216 217 218 218 219
11 11.1 11.2 11.3 11.4 11.5 11.6 11.7 12 12.1 12.2 12.3 12.4
Inhaltsverzeichnis
XIII
16 16.1 16.2 16.3 16.4
Über Permanenten, Permutationen und Fixpunkte . . . . . . . . Einführung Das Prinzip der Inklusion und Ex klusion. . . . . . . . . . . . . . . . . . . . . . . . Perman enten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Ren contre-Problem
221 221 221 223 226
17 17.1 17.2 17.3 17.4 17.5
Zählen mit Permanenten Defini ti onen und Vorb ereitungen Zählen mi t P erman en ten und Det erminant en . . . . . . . . . . . . . . . . . . .. Der Satz Beweis der Au ssagen (17 .1) und (17 .2) Beweis de s Satz es
231 231 233 235 236 237
18 18.1 18.2 18.3 18.4 18.5 18.6
Binomialmatrizen und das Lemma von Gessel-Viennot Die Binomialmatrix Pfade und P fadsyste me . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Lemma von Gessel-Viennot Die Determinante der Binomialmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . LU -Zerl egung der Binomialmatrix Ein weit eres Beispi el - Spinne und Feind . . . . . . . . . . . . . . . . . . . . . . .
239 239 241 243 244 246 249
III 19 19.1 19.2 19.3 19.4
Geometrie und Konstruierbarkeit
253
Mathematik des Faltens Winkeldreiteilung und der Satz von Haga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Winkeldreiteilung Satz von Haga und Verallg emeinerung Kon struktion eines Silb ernen Re chtecks . . . . . . . . . . . . . . . . . . . . . . . . . Schlussb em erkung
255 255 257 261 264
20 Das regelmäßige Siebzehneck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265 265 20.1 Das Problem und die Re chnung 20.2 Die Konstruktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 21 Ein Satz von Carnot 21.1 Satz von Carnot 21.2 Umkehrsatz von Carnot
273 273 275
22
277
IV
Die Kardioide als Hüllkurve
Elliptische Kurven und Kryptographie
23 Das Gruppengesetz elliptischer Kurven 23.1 l'vIot ivat ion 23.2 Definition ellipt ische r Kurven 23.3 Sin gul är e P unkte
281 . . . .
283 283 284 285
XIV
InhaItsverzeich nis
23.4 Das Gruppengeset z 23.4.1 Der un endlich ferne Punkt 23.4.2 Die ander en Fälle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 23.4 .3 Zusammenfassung der Definition . . . . . . . . . . . . . . . . . . . . . . . .. 23.5 Die Asso ziativität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 23.5.1 Vorb ereitung 23.5.2 Ausschluss der einfache n Fälle 23.5.3 Der let zte Fall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 23.6 Andere Ansätze 23.6.1 Projektive Geometrie 23.6.2 Divisoren 23.7 Abs chluss
288 289 291 293 294 294 295 298 301 301 303 303
24 24.1 24.2 24.3 24.4 24.5
. . . . . . . . . .
305 305 306 308 309 310 310 312 313 315
Primzahlen und elliptische Kurven 25 25.1 Mathematisches über elliptische Kurven 25.1.1 Ha sses Satz 25.1.2 Elliptische Kurven mod n 25.2 ECM - Faktorisierung mit ellipt ische n Kurven 25.3 Zertifizierung von Primzahlen 25.3.1 Was ist eigentl ich ein Zertifikat? 25.3.2 Das Goldwasser-Kilian-Zertifikat 25.3.3 Am Beispi el der vierten Fermat-Zahl 25.4 Abschluss . ....... . ...... . ....... ....... . ...... . ....... . .....
317 317 317 318 319 322 322 322 324 325
Primzahlen mit Abstand 26 26.1 Der Abstand zwis chen 2 Primzahlen wird beliebig groß 26.2 In jeder unbegrenzten arithmetischen Progression gibt es unendlich viele Primzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26.3 Es gibt a rit hmet ischen Progressionen beliebiger Länge, die nur a us Primzahlen bestehen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
327 327
ECC - Elliptic Curves Cryptography Einführung Da s Problem de s di skreten Logarithmus Schlüsseltausch nach Diffie-Hellman Public-Key-Verschlüsselung nach ElGamal Signi erung nach ElGamal und mit ECDSA 24.5.1 ElGamal-Signatur-Algorithmus 24.5.2 ECDSA 24.6 Index Ca1culus 24.7 Ab schluss
328 329
27 Faktorisierungsverfahren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 331 331 27.1 Einführung 332 27.2 Probedivision
Inhaltsver zeichnis 27.3 Fermat-Faktorisierung 27.4 Lehman-Algorithmus 27.5 Pollard-Rho-Verfahren 27 .6 (p - 1)-Verfahren 27.7 Elli pti sche-Kurven- Method e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27.8 Quadrat isches Sieb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xv
333 335 337 341 345 352
V
Ausblick auf Weiteres
28 28.1 28.2 28.3
28.5 28.6 28.7
Fouriertransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Motivat ion Zeit und Frequen zb er eich Der Weg zur Fourier tran sformation 28.3.1 Von den Fourierreih en zur Transformation 28.3.2 Tabelle zur Fourier transformation von Zeitsignalen . . . . . . . .. Beispi ele mit dem Oszilloskop 28.4 .1 Die Sinusfunktion 28.4 .2 Die Rechteckfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 28.4 .3 Die Dr eieckfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 28.4.4 Gauß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Die Faltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Systeme. . . . . ... . . . . . ... . . . . ... . . . . . .. . . . . . ... . . . . ... . . . . . .. Was es sonst no ch gibt
363 363 364 365 366 367 368 368 370 371 372 372 375 377
29 29.1 29.2 29.3 29.4 29.5
D as B rachist o ch ronenp ro b lem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einleitung Formalisierung des Problems Ein mächtiges Werkzeug : Variationskalkül . . . . . . . . . . . . . . . . . . . . . . . Bestimmen der optimalen Lösung Ab schluss
379 379 381 382 384 387
30 Repunits, geometrische Summen u nd Quadratzahlen . . . . . . 30.1 Einige Sp ezialfälle 30.2 Hilfsmi t t el . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30.2. 1 Die Pe llsehe Gleichung 30.2.2 Rekursive Folgen 30.3 Der Fa ll q = 3 30.3. 1 m geradzahlig . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30.3.2 m ungeradzah lig 30.4 Au sbli ck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
389 390 392 392 394 395 395 396 404
31 31.1 31.2 31.3
405 405 406 408
28.4
Irrat io n a li t ät von e und 7r Einleitung Die Irrationalität von e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Irrationalität von 7f . • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
361
InhaItsverzeich nis
XVI
32 32.1 32.2 32.3
Transzendenz von e und TI' • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • Ei nleitung Die Transzendenz von e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Tr anszenden z von 7r • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • 32.3.1 Vorb ereit ungen 32.3.2 Konj ugiert e von i . 7r •••••• ••••••• ••••••••••••••• ••••••• • 32.3.3 Zwei konträr e Abschätzu ngen
411 411 412 416 418 421 424
Literaturverzeichnis
429
Index
435
Teil I Algebra
1 Gruppenzwang I -
Wir rechnen mit allem
Übe rsicht 1.1
Die graue Theorie zu Beginn
4
1.2
Die bunte Praxis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.3
'N ieder Theorie: Ein paar Beweise als Grundlage . . . . . . . . . . . . . . . . .
15
1.4
Abschluss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
24
eh st eh e an eine m Bahnhof mitten in Deutschland und muss möglichst schnell ein paar Fahrkarten kaufen, um meinen nächsten Zug zu sch affen . Mein Problem ist, dass ich zwa r genügend Fünfer- und Zehner-Scheine habe, aber wenig Kleingeld . Und der Automat gibt kein Rückgeld! Reicht mein Kleingeld , wenn die Fahrscheine 12,80 € , 18,60 € und 24,50 € kosten, oder muss ich schnell noch zum Sch alter flitzen und dabei zwei Euro Gebühr in Kauf nehmen? Ich rechne kurz nach : 12,80 + 18,60 + 24,50 = 2,80 + 3,60 + 4,50 = 6,40 + 4,50 = 10,90 = 0,90 Ja, 90 Cent habe ich klein , ich nehme also den Automaten und nicht den Schalter. Später. Ich habe die Bahnfahrerei annähernd unbesch adet überstanden und verabrede mich mit Freunden. Es ist 21 Uhr, und in fünf Stunden wollen wir gemeinsam die Clubs unsicher machen . Ich rechne also wieder kurz : 21 + 5
= 26 = 2
Pünktlich um zwei Uhr stehe ich also vor dem Club. Was hab en beid e Rec hnungen gem einsam? Zum eine n, dass sie a ugenscheinlich nicht richt ig sein können , und zum anderen , dass sie t rotzdem ein sinnvolles Ergeb nis liefern. Es ste llt sich die Frage, ob man diesen obs kuren Rech nungen eine sinnvolle mathematische Interpretation geb en kann .
4
Gruppenzwang I
Das m athem atische Geb iet Gruppentheori e gibt uns die Mittel in die Hand , b einahe beliebig defini erte "Re che nvor schriften" zu unter su chen . Zumindest sola nge diese "Rec he nvorschriften" sich weni gsten s in einigen Ec kpunkten ni cht vom uns gewohnt en Zahlenrechnen unt ers cheiden .
1. 1
Die graue Theorie zu Beginn
Diese E ckpunkte, die wir fest halten wollen , sind die soge nannten Gruppen axiome. Sie be schreiben fünf wesentliche Eigenschaften eines Kon zeptes von "Mult iplika tion" od er "Addit ion".
1.1 .1
Eine H ierarchie mathematischer St rukt uren
Wir gehen zunäch st davon au s, dass wir eine Menge G (wie "Grupp e") gegeben haben, de ren Elemente wir mit einer solchen verallgemeinerten Mult iplikation irgendwie verbasteln wollen . Für so eine Menge definier t man nun folgen de Axiome:
D e fin it ion 1. 1 (Gruppenaxiome ) Sei G eine Menge. E Existenz und Wohldefiniertheit einer Verknüpfung
Ei ne Verknüpfung ist eine Abbildung 0 : G x G -+ G . (Zur genauer en Ab gr en zung spri cht man manchmal präziser au ch von eine r inner en , binären Verknüpfung.) Sie ordnet al so einem P a ar von Elementen von G ein weitere s Element von G zu . Die se Verknüpfung soll unsere "Mult iplikat ion" modellieren. Daher schreiben wir sie au ch in einer Nota tion , die an die Multiplika tion erinnert : St att wie bei a nderen Abbildungen üblich o(a , b) zu schreib en, schreib en wir a 0 b für das Bild von (a, b) unter der Abbildung o. A Assoziativität Die Verknüpfung
0
heißt assoziativ , falls Va, b, cE G : a
0
(b
0
c)
=
(a
0
b)
0
c
gilt. Dieses Axiom sagt uns a lso, dass unser e Verknüpfung mit der gewöhnlich en Multi plikat ion von Zahlen die E igens chaft geme in hat , dass wir in komplizierter en Termen umklammern dürfen , wie wir wollen. Und weil wir das dürfen, ist uns die Klammerung so ega l, dass wir sie b ei assoziativen Verknüpfungen in den meist en F äll en gleich gänzlich weglassen .
1.1 Die graue Theorie zu Beginn
5
N Neutrales El em ent Man sagt, e E G sei ein neutrales Element der Verknüpfung, falls 'V gE G :eo g= g= go e
gilt . Auch dies wird von der Multiplikation reeller Zahlen erfüllt, denn für die reelle Zahl e = 1 gilt diese Eigenschaft. Aufgrund dessen heißt ein neutrales Element oft auch .Einselernent" oder kurz "Eins" der Verknüpfung. Dadurch erklären sich auch die üblichen Bezeichnungsweisen wie e oder 1 für solch ein Element . Wir werden vorerst bei der Bezeichnung e bleiben , a ber gebräuchlicher ist 1. Für eine n Einsteiger kann es ungewohnt sein, wenn ver schi ed ene Dinge (wie et wa die reelle Zahl 1 und neutrale El em ente von b eliebigen anderen Verknüpfungen) mit ders elben Bezeichnung vers eh en werden wie hier. Daher ist es zum Eingewöhnen vielleicht nicht die schlechteste Lösung, zunächst bei e zu bleiben und nach der Eingewöhnungsphase zu 1 zu wechseln. Inverse Elemente Eine weitere Forderung, die man an die Verknüpfung stellen kann , ist die, dass jedes Element 9 E G ein sogenanntes inverses Element g' E G besitzt . Darunter ist folgendes zu verstehen: 'Vg EG :3g' EG:g og' =g' og = e
e meint dabei das neutrale Element, dessen Existenz im vorherigen Axiom gefordert wurde . Wir werden spä t er einsehen, dass es nur ein einziges neutrales Element geben kann , daher benötigt man keinen klärenden Zus atz wie ,~nvers e El emente bzgl. e", um zwischen ver schi ed en en neutralen Elementen zu unterscheiden . Hier muss man zum erst en Mal Vorsicht walten lass en beim Vergleich mit der b ekannten Multiplikation von reell en Zahlen , denn nicht all e reellen Zahlen erfüllen diese Forderung. Die (ein zige) Ausnahme ist b ekanntlich die Zahl 9 = 0, denn, ega l welches g' E IR. wie betrachten , es ist stets 0 . 9' = 0 -::p 1. Alle anderen reellen Zahlen erfüllen dies jedoch. K Kommutativität
Die Verknüpfung heißt kommutativ oder auch abelsch , falls
'V g , h E G : g o h = h o 9 gilt . Di es wird von der uns bekannten Multiplikation reelle r Zahlen wied er uneingeschränkt erfüllt.
6
Gruppenzwang I
Ein Paar (C , 0) wird eine Gruppe genannt , falls es EAN1 erfüllt, d . h ., wenn 0 eine Verknüpfung ist (E) , die assoziativ (A) ist , ein neutrales El em ent besitzt (N) und bzgl. der er jed es El em ent ein inverses El em ent hat (I) . Falls (C , 0) zusätz lich auch K erfüllt, spricht man von eine r kommutativen Gruppe bzw. eine r abelschen Gruppe . Je nachdem, welche dieser Axiome erfüllt sind und welche nicht, vergibt man vers chiedene weitere Namen für solche Strukturen : Erfüllt (C , 0) nur E , so nennt man dies Gruppoid oder Magma . Da "G ru ppoid" eine zweite , wichtigere Bedeutung hat , ist der Begriff Magma im Zweifelsfall vorzuziehen. Jedoch ist eine Struktur, die keinerlei nützliche Eigenschaften hat , zu unspannend , um groß artig darüber zu reden , daher tritt das sowieso selten in E rscheinung. Erfüllt (C , 0) EA , so spricht man von eine r Halbgruppe . Erfüllt (C , 0) EAN, so spricht man von eine m Monoid. Sowohl Halbgruppen als auch Monoide können natürlich zusätz lich auch K erfüllen . Man nennt das ggf. dann eine kornmutative /abelsche Halbgruppe bzw. eine n kommutativen /abelsch en Monoid. Am Ende der Fahnenstange steht dann , wie schon gesagt, mit EAN1 bzw. EAN1K die (kommutative) Gruppe. • Noch ein Wort zur Notation: Mathematiker sind notorische Faulpelze und schreiben daher meist nichts mit auf, was sich vermeiden lässt . 'Wenn man sich an die Definitionen und Konzepte , die durch die Gruppenaxiome gegeben sind, erst einmal gewöhnt hat , geht man in der Regel schnell zu abkürzenden Notationen über. So ist es üblich , bis auf begründete Ausnahmen jed e Gruppenverknüpfung entwed er mit dem gewohnten Multiplikationspunkt (d . h . in der Form a . b) od er - was b esonder s bei abelschen Gruppen üblich ist - mit ein em Plus (d . h . in der Form a + b) zu schreib en . Man sagt auch, dass die Gruppe .multiplikativ" bzw. "addit iv geschrieben" sei . Bei multiplikativer Notation ver zichtet man dann sogar darauf, üb erhaupt ein Verknüpfungssymbol zu benutzen und schreibt nur noch ab für die Verknüpfung von a mit b. Es ist ab er wichtig, dass das ein rein kosm etischer Unterschied ist , denn wie immer sind Namen nur Schall und Rauch. Es kommt einzig und allein darauf an , was unsere Verknüpfung für Eigenschaften hat od er nicht hat , und nicht darauf, ob wir sie mit 0, " +, * od er irg endwie anders bezeichnen .
1.2 Die bu nte P raxis
7
1.2
Die bunte Praxis
1.2.1
Beispiele für Gruppen
B ei s p iel 1.2 (EANIK - gewöh n liche Zahlen) Wir haben bereits während der Definition der Gruppenaxiome gesehen, dass die Menge der von Null verschiedenen reellen Zahlen a lle fünf Axiome erfüllt, d . h. , (JE. \ { Ü} , ·) ist eine a belsche Gruppe. Das gilt , wie wir wissen , genau so für die Multiplikation komplexer und rat ionaler Zahlen , d . h ., (C \ {ü} , .) und (Ql \ { Ü } , .) sind ebenfalls abelsche Gruppen. Man schreibt a bkürzend a uch Ql x ,JE. x und C x für diese Gruppen. (M anchmal wird a uch ein Stern st at t eines Kreuzes benutzt .) E s muss jedoch nicht immer die Multiplikation sein. Wir können uns ganz leicht klarmachen , dass a uch die Addition Gruppen a us Ql, JE. und C macht , denn ...
E A
die Ad dition ist eine Abbildung JE. X JE. -+ JE. , ... die assoziativ ist, denn dass fü r reelle Zahlen
V a , b, c E JE. : a + (b + c) = (a
+ b) + c
gilt, ist uns schon a us der Schule und noch davor be stens bekannt, ... N ... die m it der reellen Zahl Ü ein neutrales Element hat , da
V aEJE.: a+ Ü= a= Ü+ a gilt, ... ... die zu jed er reellen Zahl a mit der reellen Zahl - a ein Inv erses ber eithält, da V a E JE. : a + (-a) = Ü = (-a) + a ist und ... K ... die b ekanntlich a uch kommutativ ist, den n auch
V a, b E JE. : a + b = b + a ken nen und b enut zen wir alle be reits seit vielen Jahren . Im Wesentlich en dasselb e Argument funktioniert nat ürlich auch für (Ql, + ), für (C , + ) und au ch für (Z , + ). Bei let zterem klappt das analoge Vorg eh en mit der • Mult iplika t ion j edoch nicht (siehe weiter unt en) .
B e ispiel 1. 3 (EANI - A ffine Abbildung en) Ei n sehr einfaches Beisp iel eine r Grupp e, die jedoch nicht kommutativ ist, sind sogenannte affi n e A bbildu ngen JE. -+ JE., d . h . Abbildungen der Form X H
ax +b,
Gruppenzwang I
8 wob ei a , b reelle Zahlen sind und a
i-
0 ist.
Wir setzen al so als zug ru nde liegende Men ge G := Aff(III?) := {
f : III? -+ III? I f
ist affin } .
Als Verknüpfun g b enut zen wir die Hintereinande rausfü hru ng von Ab bild unge n, d. h ., für zwei Ab bildungen f , 9 : III? -+ III? definier en wir f o g als die Abbild ung III? -+ III?
f o g := { x
I----t
f (g(x))
Wi r prüfen nach , dass es sich dab ei um eine G ruppe handelt : E Die Verknüpfung ist so defini ert , dass a us zwei affinen Abbildungen
i, 9
III? -+ III? (etwa mi t f (x) = ax + bund g(x) = cx + d) wieder eine Abbildung f og : III? -+ III? wird . Ist f og jedoch wieder eine affin e Abbildung? W ir überprüfen das: Für alle x E III? gilt :
(f 0 g) (x) = f (g(x))
nach Definition
+ d) = a(cx + d) + b = (ac) x + (ad + b) = f (cx
in 9 einges etzt f eingeset zt
Da nun a und c nach Vorau sset zung i- 0 sind, ist au ch ac i- 0, d . h ., f og hat ebe nfa lls die Gestalt , die affine Abbildungen defini eren . A Es gilt a llge mei n für all e Abbildungen f , g , h, die man überhaupt hintereinander au sführen kann, dass diese Hinter ein ander ausführung assoziati v ist:
((f og ) oh )(x ) = (f o g)(h( x)) = f (g(h(x))) = f((g oh )(x )) = (f o(g o h)) (x ) Dabei wurde in jedem Sch rit t nur die De fini t ion der Hintereinanderausführung benutzt. N Wenn m an irgendei nen Au sd ruck in die Abbildung III? -+ III? , e(x ) := x einsetz t , dann kommt der selbe Ausdruck wieder he raus , d . h ., es gilt
f( e(x)) = f (x)
===}
f
e(f( x )) = f( x)
===}
e
0
e= f
und 0
f = f.
Also ist die Abbildung e, die auch identische Abbildung od er kurz Identität genannt und als id IR gesc hriebe n wird , ein neutral es Eleme nt für die Hintereinande raus fü hru ng von Abbildungen .
1.2 Die bunte Praxis
9
Um zu b estimmen , ob alle affinen Abbildungen f : :IR --+ :IR inver se affine Abbildungen haben , schreib en wir uns zunäch st auf, was das heißt : Wenn 9 eine inver se Abbildung wäre, so mü sst en f og = e und also au ch
\/ x E:IR: x = e(x ) = (f
0
g)(x) = f(g(x))
wahr sein. Wenn wir also g(x) mit y abkürzen, dann mü ssen wir x = f(y) nach y auflösen , um herauszufinden , wie 9 denn au ssähe, falls es tatsächlich ein Inv er ses zu f gä be. Das Auflö sen ist einfach:
x= ay+ b
{==}
1 1 b y = -(x -b) = - x - a a a
Wenn es überhaupt eine inverse Abbildung 9 von
f
gäbe , dann mü sste sie
1 b g(x) = - x - a a
erfüllen . Das ist bis jetzt aber nur ein Verdacht , denn wir haben ja angenommen , das s 9 ein Inver ses von f ist, um dieses Resultat zu er halten. Um jet zt nachzuprüfen , dass f wirklich ein Inv er ses hat , gehe n wir den Weg rü ckwärts: Wir definieren 9 : :IR --+ :IR durch die obige Gleichung (und erken ne n jet zt, weshalb wir eingangs a -::P 0 gefordert haben, nämlich damit diese Definition eine n Sinn ergibt ) und prüfen nach , ob die Eigen schaft, die inver se El em ent definiert , wahr ist :
(f
0
g)( x ) = f(g( x))
= f (~X- ~) =
a(~x - ~) +
b
= (x- b)+ b = x=e(x )
===}
f og = e
===}
g of = e
(g 0 f)( x) = g(f( x)) = g(ax+ b) 1 a
= - (ax
+ b) -
b a
= (x+ ~)- ~ = x
= e(x )
Also ist 9 tats ächlich das Inverse von
f.
10
Gruppenzwang I
Damit hab en wir festgestellt, dass (Aff( JR) , 0) tatsächlich eine Gruppe definiert . W ir überz eugen un s jetzt noch davon , dass dies eine nic htabelsche Gruppe ist : Dazu mü ssen wir zwei affine Abbildungen h ,12 finde n, sodass h oh i- h oh ist . Es ist b einahe egal, welch e Abbildungen man da nun tatsäch lich wählt, fast alle Paare werden funk t ionier en und wen n man zufällig eines a uswählt , hat m an gute Chancen , dass es klappt . Ich wähle zufällig he x) = 2x + 1 und h ex) = 3x - 4 und rec hne nach , dass dieses Paa r tatsächlich zu der Ungleichhe it führt :
(h
0
h)(x) = h (3x - 4) = 2(3x - 4) + 1 = 6x -7
(12 0 h)(x ) = h (2x + 1) = 3(2x+ 1)- 4 = 6x - 1
Set zt man nun x = 0 in b eid e Gleichungen ein , sieht man , dass (h 0 12)(0) = - 7 i- - 1 = (12 012)(0) ist , d .h. , h oh und 12012 sind ver schied en e Abbild ungen . (Man b ea chte, dass m an tats ächlich eine Zahl einsetzen mu ss, denn nur weil zwei Abbi ldungs vorschrifte n verschieden sin d, heißt das nicht , dass die Abbildungen a uch verschieden sind, denn man kann ja ein und dieselb e Funkti on durchaus auch m it ver sch iedenen Abbildun gsvorschriften beschreib en .) • Beispiel 1.4 (EANI - Symmetrische Gruppen) Völlig analog lässt sich b eweisen , dass Sym (M ) :=
{I : M
-+ M I I ist bijekt iv }
für jed e Men ge NI zusamme n mit der Hin t ereinander au sführung von Abbildungen eine Gruppe ist. Die Arg ume nte für E , A und N sind dieselb en wie ebe n. Das neu t rale Element ist wie eben die Id entität , d . h .: idM: =
{M-+ M m >-t m
Jede bijekt ive Abbi ldung I die hier als Inverses dien t . Ist sp eziell M
1.2.2
:M
-+ M hat eine Umkehrabbildung 1 - 1 : M -+ M,
= { 1,2, .. . , n }, so schreibt m an auc h Sn statt Sym(M) .
•
Gegenbeispiele
Beispiel 1.5 (EAN - Monoide, die keine Gruppen sind) W ir haben festgeste llt , dass Mult iplikation und Addition b ei un s beka nn t en Zahlen sich oft wie (kommut at ive) Gruppen verhalt en. Das gilt jed och ni cht un ein geschrän kt . Die Tatsache, dass m an ni cht durch 0 te ilen darf, ist un s schon a ufgefallen . Es geht je doch auc h schlim mer:
1.2 Die bunte Praxis
11
So ist (Z \ {O} , ·) im Gegen satz zu ( 0 ist n - a das Inver se. Das prüfen wir nach: Wenn 0 < a < n ist , dann ist natürlich n > n - a > 0, d . h . n - a E G n . Damit haben wir also schon einm a l keinerlei Problem e. Auch di e Rechnung macht uns kein e Schwierigkeiten :
a EBn(n -a) =a +n -a -n la +~ -a J = n- l~J
= n- n· l= O
Aufgrund der Kommutativität ist a uch (n - a) EBn a = o. A Der letzte Punkt a uf unserer Agenda ist nun die Assozi ativität . Dafür müssen wir eine win zige Vorüberlegung über di e Abrundungsfunktion l·J machen: Egal, welche reelle Zahl x man dort einsetzt , da l·J immer auf di e nächstkleiner e ganze Zahl abrundet, ändert sich nicht viel , wenn wir um eine ganze Zahl vers chi eb en , d . h .:
Vx E IE.V k E Z : lk+xJ = k + lxJ Das b enutzen wir j et zt, um di e Asso ziativität nachzurechnen : Für all e a , b, c E G« gilt :
(a EBn b) EBn c = (a + b MO D n) EBn c
'Wertet man a EBn (b EBn c) genauso aus, so erhält man dasselb e Ergebnis . Das zeigt, dass a EBn (b EBn c) = (a EBn b) EBn e ist, d . h. , EBn ist ass oz iativ. Damit ist also bewiesen , dass (Gn , EBn) eine a belsche Gruppe ist . Ich möchte a nm er ken , dass di e Notation , die ich für die se Gruppe und ihre Ver knüpfung verwendet habe , weit weg davon ist , irgendwie verbreitet, m anchmal üblich oder außerhalb di eses Beispi els nur ein einzi ges Mal verwendet worden zu sein. Wir werden in eine m später en Kapitel no ch eine alternative Konstruktion kennenl ernen , di e uns im Wesentlichen di eselbe Gruppe liefert und mit Z/nZ b ezeichnet wird . Dies ist di e Standardb ezeichnung.
1.3 Wieder T heorie: Ein paar Beweise als Grundlage
15
Um dies e b eiden Konstruktionen aber nicht zu vermischen , solange wir noch nicht wissen , dass sie im Wesentlich en identisch sind, habe ich mich hier ent schi eden , eine ander e Bezeichnung zu wählen .
1.3
W ieder T heorie: Ein paar Bewe ise als Grundlage
E s lohnt sich , einen gen aueren Bli ck auf die Axiome zu werfen . Wenn man ein paar Übungsa ufgab en macht und öfter einmal nachweist , dass dieses oder jenes eine Gruppe ist , dann fällt einem vielleicht auf, dass viel Arbeit dabei ist , die zwa r in den Axiomen gefordert wird , aber in den Beispi elen für Gruppen eigent lich nicht no tw endig ersche int.
1.3.1
Einseitig- und Eindeutigkeit
Nun ist es so, dass man sehr oft doppelten Aufwand hat , um zu zeigen , dass das (vermutet e) neutrale Element e wirklich e· x = x und x . e = x für all e x E G erfüllt. E s sche int, als würde dort immer nur ein und dieselbe Rechnung auf zwei verschiedene Wei sen a ufgeschrieben . De rselbe Verdacht dr ängt sich einem beim Nachprüfen der Definition eines inve rsen E lem ents a uf. Es st ellt sich al so die Frage, ob es wirklich sein muss, dass man immer b eide Varianten der jeweiligen Gl eichung überprüfen mu ss. Gibt es vielleicht eine Gruppe, wo die eine Variante st ets funktioniert, die ander e jedoch nicht? Außerdem fällt auf, dass in den Axiomen nur geforde rt wurde, dass es ein (was ja a uf Mat he m at isch st ets "m indes tens ein" meint) neutrales Element gibt und pro Gruppen elem ent ein Inv er ses. Hier stellt sich die Frage, ob es vielleicht der Fall sein könnte, dass es genau ein neutrales E leme nt und für Gruppen elemente genau ein Invers es gibt . Beide Fragen wollen wir in diesem Abschnitt beantworten und dabei gleich den Umgang mit den Gruppenaxiomen in Beweisen einübe n .
D efinit ion 1.9 Seien X eine Menge und definieren dann :
X x X -+ X eine Verknüpfung a uf die ser . W ir
E in E lem ent e E X heiß t linksneutml , fall s
V xE X:e·x= x gilt , und rechtsneutml , fall s gilt :
VxE X: x ·e=x
16
Gruppenzwa ng I
Sei e E X ein rechts- oder linksneutral es E leme nt. Ein y E X heißt linksinvers zu x, falls y. x = e gilt, und ents pre che nd rechts invers zu x, falls
x· y
=e
gilt. Korrekterweise müsste m an eigentli ch sa gen, dass es sich um ein Linksbzw. Re chtsinverses bzgl. e handelt, sola nge wir no ch nicht bewiesen haben, dass neutrale Elemente eindeutig bestimmt sind . • Ein neutrales Element (ohne Seitenangabe) ist nach dieser Definition ein Ele ment , das links- und rechtsneutral ist , ein inverses El em ent von x ist eine s, das links- und rechtsinver s zu x ist . Man spricht deshalb zur Klarst ellung auch manchmal von "bei dse it ig" neutralen bzw. inv er sen Elementen. L e m m a 1.1 0 (Ein d eutigke it von neu tralen E lementen) Sei X eine Menge und· : X X X -+ X eine Verknüpfung auf X. Ist en ezn rechts - und et. ein linksneutrales El em ent, so gilt bereits en = et. . B eweis : Wir wer ten dazu ei. . en auf zwei ver schiedene Weisen aus: Es gilt
d enn e t. ist linksneutral. Es gilt j edoch auch
o
denn en ist rechtsneutral.
Wie folgt aus die sem Lemma nun die Eindeutigkeit von neutralen Elementen? Ein neutrales Element ist st ets von beiden Seiten neutral. Wenn also e und e l neutral sind , ist e rechts- und e l linksneutral (und a uch umgekehrt natürlich) und laut Lemma deshalb e = e' , Wichtig ist aber, dass es überhaupt ein rechts- und ein linksn eutrales E lem ent gib t . Man betrachte d afür folgendes Bei spiel: B eis piel 1.11 Betrachte eine beliebige Menge X mit mehr a ls einem Element und definiere d arauf eine Verknüpfung durch I;j a , b
E X :a
* b :=
b.
Diese Verknüpfung ist st ets asso ziativ, denn es gilt: I;j a , b, cE
X : (a
* b) * c =
c = b *c = a
* (b * c)
1.3 Wieder Theorie: Ein paar Beweise als Grundlage
17
Die Definition ist so gewählt , dass tats ächlich j edes E leme nt von X linksneu tral ist . Es kann also durchaus viele ver schi ed ene linksn eutrale Eleme nte gebe n . Das Lemm a sagt un s nur, dass dieser ob skure Fa ll höchst en s dann eintreten kann , wen n gleichze it ig kein E leme nt re chtsne ut ral ist . Ind em man umgekehrt a
* b := a
de finie rt , erhäl t man ein Bei spiel einer St rukt ur, die zwar ass oziativ ist , aber viele rec htsneutrale und kein linksneut rale s E lement be sitzt . • Lemma 1.12 (Eindeutigkeit von Inversen) S ei (X ,·) ein Monoid und x E X ein beliebiges El em ent . Ist a n ein rechts- und ai. ein linksinv erses Elem ent zu x , dann gilt o.« = a.t. . Beweis: Der Trick ist erneut , ein P rodukt au f zwei verschiedene Weisen a us zuwerten . Diesm al ist das das Produkt at. . x · a R. Bezei chne das neu t rale E lement (je tz t wirkli ch "das" neut rale Elemen t , weil wir jetz t wissen , dass es eindeutig be stimmt ist) mi t e. Zum einen gilt weil o n re cht sinvers zu x und e recht sneut ral ist . Zum anderen gilt jedoch a uch
weil at. linksinv er s zu x und e linksn eutral ist . Weil (X ,·) das Assoziativgesetz erfüllt, ist ab er c t.: (x· aR) = (a L ' x )· a R, d. h . an = ai.. D Weil das inverse Element zu einem festen x also eindeutig b estimmt ist, kann man sich dafür eine Bezeichnung einfallen lassen , die nur von x abhängt. Üblich ist dafür X- I bei multiplikativ geschriebenen und -x bei addit iv geschriebenen Verknüp fungen . Man beachte a ber , dass wir in die sem Beweis (im Gegensatz zu vorher) a usdrücklich die Assoziativität un d die Eigen schaften des neut ralen Element s benu tz t haben . Wenn m an au f Asso zia t ivität verzicht et und/oder nur ein ein seitig neut rales E lement fordert , dann gilt die E indeutigkeit inve rser Elemente i. A. nicht mehr . (Gleich wird es ein Beispiel dafür geben .) Was ist nun mit der Fr age, ob man den Beweisaufwand reduzieren kann? Folgender Satz zeigt un s, dass man das sehr wohl kann , solange man vorsi chtig ist :
18
Gruppenzwang I
Satz 1.13 (Abgeschwächte Gruppenaxiome) Sei G eine Menge. Folgend e drei A ussagen sin d äquivalent: 1. (G ,·) ist eine Grupp e, d. h. erfü llt EANJ. 2. (G , ·) erfüllt E . ist eine Abbildung G x G --+ G . A . ist assoziativ. NL Es existiert ein linksneutral es Elem ent e L E G . IL Jedes 9 E G hat ein linksinverses Elem ent g' E G .
3. (G , ·) erfüllt E . ist eine Abbildung G x G --+ G . A . ist asso ziat iv. NR Es existiert ein rechtsne utrales Element e L E G. IR Jedes 9 E G hat ein rechtsinverses El em ent g' E G .
B e w e is : Wi r zeigen nur, dass die er sten beiden Au ssagen äquivalent sind , dass die er ste und die dri t te äquivalent sind, beweist man völlig a nalog. Natürlich ist in jeder Gruppe NL und IL erfüllt , das sagen un s schon die Defini tionen . Wir mü ssen also nur die Umkehrung zeigen. Zunäch st überzeugen wir uns jet zt davon , dass jedes zu x E G linksinverse Element x ' au ch rechtsinvers ist . W ähle dafür ein linksinverse s Element x " von x ' (!). Da nn gilt für alle x E G :
x . x'
= et. . (x · x ')
da et. linksneut ral ist
= (x " . x') . (x · x ')
da x " linksinver s zu x '
= x " . ((x' . x) . x ' ) = x 11 . ( et. : x ' )
mehrmals Assozi ativgesetz
=
X
11
·x
I
da x ' linksinvers zu x da e t. linksneutral da x " linksinver s zu x'
Also folgt au s E, A , NL und IL die volle Stärke von 1. Das nutzen wir jet zt wied erum , um au ch N in voller Form zu zeigen : Für alle x E G gibt es ein (jetzt b eid seitiges!) Inv er ses x' und es gilt somit: x · et. = x · (x' . x )
da x' linksinver s zu x
= (x· x ' ) . x
Assoziati vgesetz da x ' au ch rechtsinvers zu x
=x
da et. linksneutral D
1.3 Wieder Theor ie: Ein paar Beweise als Grundlage
19
Unse re Antwortet lautet also : Ja, man kann die Beweisarbeit um die Hälfte reduzier en b eim Exi st en znachweis von neutralen und inver sen E leme nten, sola nge man sich auf eine Seit e (Rechts od er Links) festlegt. An folgendem Beispiel sehen wir , dass eine Struktur mit E , A , NL und IR (und wied er völlig analog a uch E , A , NR und IL) keine Gruppe zu sein braucht . Die Seiten mi schen darf man also nicht . Beispiel 1.14 Wi r be trachten wie vorhin eine beliebige Menge X mi t mindestens zwei Elementen und der Verknüpfung
Ya, b E X : a
* b := b
darauf. W ählen wir nun ein fest es e E X, so ist dieses linksn eutral, wie vorhin festgestellt . Die Defini tion de r Verknüpfung sagt un s, dass a * e = e ist , d . h ., dass jedes E lem ent von X ein Re chtsinverses bzgl. e hat . •
1.3.2
Einfache Rechenregeln
Mit den Axiomen und der Eindeutigkeit von neutralen und inver sen El em enten kann man nun sehr einfache Re chenregeln beweisen , die völlig einleuchtend sind und daher immer ohne Kommentar verw endet werden : Lemma 1.15 S ei G eine Gruppe. Wi r bezeichn en wie üblich das neutrale Elem ent mit 1 und das Inv ers e von x E G mit X- I. Mit diesen B ezeichnungen gilt: 1. 2. 3.
1- 1 =1
YXE G : (x- 1)-I=x Y x, Y E G : (xy) -1 = y - l x -l
Man beachte, dass im drit ten Punkt die Reihenfolge der Fak to ren ver t auscht wird beim Invertieren. Das ist wichtig und sollte stets beachte t werden. Da die gewöhnlichen Rechenoperationen für reelle Zahlen kommutativ sind , kann man die Gleichung für reell e Zahlen ohne schlechtes Gewi ssen a uch als (xy) - 1 = x- 1 y- l sch reiben. Da wir jedoch wissen , dass Gruppen au ch ni chtkommut at iv sein können , muss in allen allgem eine n Beweisen st ets die Reihenfolge de r Faktoren beachtet werden . B eweis: Da 1 neutral ist , gilt 1 . 1 = 1. Dies ist nun ab er a uch die Gleichung, die das Inv er se von 1 charakteri siert und wir wissen , dass es nur ein einz iges E leme nt von G gibt, das diese Gleichung erfüllt (nämlich ebe n das Inv ers e von 1). Also mu ss 1-1 = 1 sein.
20
Gruppenzwang I
Das Inv er se von x erfü llt nach Defini ti on die b eid en Gleichungen x x - 1 = 1 = x-l x. Dies sind nun jedoch a uch genau die b eid en Gleichungen , die das Inv er se von x - I zu erfüllen hat. Wi ed er au fgrund der Einde ut igkeit inver ser Elem ente muss also (x - 1)- 1 = x sein. Au ch hier wenden wir erneut die Eindeutigkeit des Inv ers en a n. (xy) - 1 ist dasjeni ge E leme nt von C , welch es 1 erg ibt, wenn man es mit xy multipliziert. Wir prüfen also, ob y- l x-l diese Eig enschaft hat : ( x y )( y - 1x - 1)
Also st im mt es: (xy) -1
= x (yy- 1) x - 1 = x 1x - 1 =
xx - 1 = 1
= y -1 X- 1.
o
Man beachte, dass m an , wollte man denselben Bewei s für x- 1 y-l führen , in dieser Rechnung die Reihenfolge von Fak toren ver tauschen müsste. In einer nichtkommutativen Gruppe ist das i. A . nicht mögli ch , also wü rde ein solcher Bewei s nicht funktionieren . In der Tat ist es so, dass kommutative Gruppen die einz igen sind, die diese andere Inv ers engleichung erfüllen : Satz 1. 1 6 Sei C ein e Gruppe. Es gilt:
C ist kommutativ {::::::} V x , y E C : (xy) -l = x- 1y- l. Dies zu beweisen ist au ch immer eine beliebte Übungsaufgabe zur Gruppen theorie . Fast jeder Student , der Gruppentheorie hatte, mu sste die se Aufgabe oder eine ähnliche mindestens einmal lösen.
Beweis: ,, ===?": Ist C kommutativ , so wissen wir b ereits, dass (xy) - l = y -l x -l = x- 1 y-l gilt. " {== " :
Ist umgekehrt die se Eigenschaft gegeben, so benutzen wir obiges Lemma und sch reiben x y = ( X - l )- l (Y - 1)- 1. Wenden wir jetzt die gegeb en e Eigens chaft für Inv erse an, so er halten wir ( X - 1)- 1(Y -1 )- 1 = (x -1 Y -1 )- 1,
was sich mit dem Lemma erneut umformen lässt zu ( X - 1Y - 1)- 1 = (Y -1) -1( x - 1)- 1 = yx .
Also gilt wie beh auptet x y = yx für alle x , y E C .
o
1.3 Wieder T heorie: Ein paar Beweise als Grundlage
1.3.3
21
Potenzen
E ine weitere Gelegenheit , den Umgang mi t den Gruppenaxiomen zu üben , ist die Beschäftigung mit Poten zen. Wir können in einer Gruppe ja nicht nur zwei Elemente multiplizieren, sondern beliebig viele Elemente: gl . g2 . g3 . g4 ist ohne Problem e mög lich . (Da wir das Assozia tivgesetz haben , ist es un s sogar egal, wie wir dies klammern.) Um sp eziell für Produkte der Form 9 . 9 . 9 . . .. , die recht häufig vor kom me n, abkürzende Schreib enweisen b enutzen zu können , führen wir Pot en zen ein nach dem Mus t er der schon b ekannt en Poten zen gewöhnlicher Zahlen : D efin it io n 1. 17 (Potenzen mit ganzzahligem Exponenten) Sei (X , ·) eine Gruppe und x E X b eliebig. W ir definieren für alle
ti
E
N. Für neg ative Exponenten definieren wir: X
- n- 1
:=
x
- n-1
·x
für alle n E N.
•
Die Definition folgt dem gewohnten Muster der Poten zgesetze, die wir kennen . Das folgende Lemma zeigt, dass auch die meisten ander en un s bekannten Pot en zgesetze erfüllt sind: Satz 1. 18 S ei (X,· ) eine Gruppe und x E X beliebig. Es gilt : 1. 2.
Vn , m E Z : V n ,m E Z :
x n +m = x n . x m x nm = (x n) m
Insb esondere schließt die zwei te Aussage X
-n
=
( X n) -l
=
( X -l)n
m it ein .
Der Bewei s kann sehr einfach sein , wenn man sich "Pünktchen-Beweise" erl aubt . Ein form eller Beweis wartet jedoch mit win zigen Fall en auf, in die man leicht tappen kann : B e we is : Der Beweis wird , wie gesagt, durch Induktion geführt. Wi r ent scheiden uns fü r Induktion nach m .
Der Induktionsanfang ist sehr einfach, denn
22
Gruppenzwang I
ist nach Defini t ion wahr. Für den Induktionsschrit t zeige n wir zunächs t , dass die Behauptung für alle n E Z und m = 1 wahr ist . Die Gleichung x n+ 1 = x n . x ist zwar für n ;::: 0, ab er ni cht für n < 0 durch die Definition gesiche rt. Es gilt dann jed och für n ;::: 0
J etz t üb erzeu gen wir un s genauso, dass die Beh auptung für m = - 1 wahr ist . F ür n :::; 0 ist das wied er per Definiti on gegeb en und für n > 0 gilt :
Also gilt :
(*) Neh me n wir nun an , dass
wah r ist. Dann folgt für alle n E Z: xn+(m±l)
=
x (n+m )±l
= x n +m . x±l = (x n . x m ) . X±l = x n . (x m . x ±l ) n
=x ·x
(*) LV . Assoziativität
m ±l
Also ist die Au ssage a uch für m m E Z wahr ist .
(*)
± 1 wah r . P er Induktion folgt , dass sie für alle
Auc h für die zweite Au ssage üb er zeu gen wir uns zue rst von der Gültigkeit des Induktionsanfangs m = 0:
Gu t , bis dahin kein e P robleme . Gen au wie vorher prüfen wir die F älle m = 1 und m = - 1. F ü r m = 1 ist das sofor t klar, denn nach Definition ist
Für m = - 1 wenden wir die Definition des Inver sen und die schon bewiesen e Gleichung a n:
0 1 ===} x - n =X (n) - l X - n · x n = x - n+n =X=
1.3 Wieder T heorie: Ein paar Beweise als Grundlage
23
Zusammenfassend gilt also schon einm al:
(*) Und das nutzen wir jet zt für den Induktionsschluss. Fall s
bereits gilt, folgt für alle n E Z: x n( m±l) = x nm ±n
siehe ob en
= (x "r" ·x ±n = (x n)m . (Xn) ±l = (x n)m ±l
LV .
(*) siehe ob en
Also folgt p er Induktion die Gültigkeit der zu zeigende n Gleichung Vm E Z. D Der Beweis ist natürlich nicht auf Gruppen beschränkt . Die Definitionen und P oten zgesetze gelten au ch unter geringeren Vorausset zungen , wenn man die Exponenten ent spreche nd einsc hränkt . So ist etwa die Definition
allen Monoide n sinnvoll. Selb st auf die neutralen El em ente kann man verzichte n , wenn man
In
definiert. Auch dann gelten die b eid en Poten zgeset ze
immer no ch für alle Exp on enten , für die die Au sdrücke sinnvoll sind, d . h . für n , m E N b ei Monoiden und n , m E N>o bei Halbgruppen . Die Beweise sind jeweils exakt dieselb en wie ob en skizziert , nur dass man ebe n auf die Verw endung von Inv ers en ver zichtet und ggf. den Induktionsanfang auf m = 1 stat t m = 0 festlegt .
24
1.4
Grupp enz wang I
Abschluss
Das soll es bis hierher zur Definition und zum Umgang mit Gruppen gewesen sein. Es ist nur ein winziger Einblick in die Gruppentheorie gewesen, aber ich hoffe , trotzdem den einen oder anderen für mehr interessiert zu haben , denn mehr wird es geben. (m jg) -l . Gockel
Johannes Hahn ( Gockel) ist Dipl.-Math. und promoviert in Jena.
2 Gruppenzwang 11 - Anonyme Mathematiker bieten Gruppentherapie an
Übersicht 2.1
Untergruppen
25
2.2
Nebenklassen und der Satz von Lagrange
33
2.3
Normalt eiler und Faktorgruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
2.4
Uhrenarithmetik reloaded . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
2.5
Abschluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
Hallo, G ru ppentheori e-Fans un d solch e, die es einmal werden wollen ! In diesem Kapitel der Gruppenzwang-Reihe soll es darum gehen, verschiedene Grundkonzepte de r Gruppentheorie einzuführen .
2.1
Untergruppen
D efinit ion 2. 1 (Untergrupp en) Sei G eine G ruppe. Eine Teilmenge U ~ G heißt Unte rgruppe von G, falls U zusammen mit der auf U eingeschränkten Verknüpfung selbst eine Gruppe ist . Ei ne übliche, abkürzende Notation für "U ist Untergruppe von G" ist U ::; G .
•
Zunächst übe rleg en wir uns ein paar elementare Dinge üb er Untergruppen. Was sagt uns b eispielsweise das erste Gruppenaxiom? Wi r erinne rn uns: E Existenz und Woh ldefiniertheit: Die Verknüpfung ist ein e Abbild ung U
X
U ---+ U.
26
Gruppenzwang 11
Die Verknüpfung hier ist laut Definition , d . h ., das das auch schon in G war. dieses Produkt wieder in unter der Multiplikation .
die Einschränkung der Gruppenverknüpfung von G Produkt zweier Elem ente von U ist dasselb e, wie es Die wesentliche Forderung b esteht jet zt darin , dass U landen muss . Man sagt dazu U sei abgeschlossen
Was sagt uns das zweite Gruppenaxiom? A Assoziativität : V a, b, cE U : (ab)c
= a(bc) .
Hier ist nichts passiert , denn das Assoziativitätsgesetz gilt ja schon für G und wenn die Gleichung für alle El em ente von G richtig ist , dann ist sie erst recht auch für alle El em ente von U richtig. Weiter zum nächsten Axiom: N Neutrales El em ent: :3 eu E U V u E U: eu . u = u. Jetzt wird es sch on spannender : Wir wissen , dass G ebe nfalls ein neutrales Elem ent besitzt . Aber sind das jetzt zwei verschied en e Elem ente od er ist es ein und dasselbe? Wir prüfen das nach: Es muss ja
eu eu = eu gelten. Wenn wir nun das Inv ers e (in G) von
e t]
benutzen, erhalten wir
- 1eu = eo. eu = (eu- 1eu ) eu = eu- I (eu eu ) = eu Also unterscheiden sich das neutrale Element von U und von G nicht voneinander. Das liefert eine weitere Begründung dafür, weshalb man neutrale Elemente meist ohne Unterscheidung für alle Gruppen als 1 (bzw. 0, falls es sich um additiv geschrieb en e Gruppen handelt) b ezeichnet. Was sagt uns das letzte der vier Gruppenaxiome? Inv ers e El em ente: V u E U :3 u' E U: u' u =
et] :
Auch hier stellt sich die naheliegende Frage: Ist das in G b erechnete Inverse von u dasselb e, wie das in U berechnete? Ja, das ist der Fall , denn
,
u u = eu = eo, wie wir uns eben überlegt haben. Das Inverse in der Gruppe G ist nun eindeutig durch diese Glei chung bestimmt, d . h., u' ist auch das Inverse von u bzgl. G . Dies wird auch als Abgeschlossenheit unter Inversenbildung bezeichnet. Dies liefert uns eine Rechtfertigung, alle Inv ers en stets mit X - I (bzw. ebe n - x b ei additiv geschrieb enen Gruppen) zu notier en, ungeachtet der Gruppe, auf die wir uns b ezieh en. Ab jetzt werden wir das auch tun.
27
2.1 Untergruppen
2.1.1
D as Untergruppenkriterium
Unsere Überlegungen fassen wir in folgendem Lemma zu sammen , das un s zugleich a uch eine Met hode in die Hand gibt , Teilmen gen darauf zu unter suchen , ob sie denn wirklich Untergru ppe n sind: Lemma 2.2 (Untergruppenkriterium) S ei C eine Gruppe und U 0 die Abbildung
ein Homomorphismus zwischen die sen Gruppen , denn es gilt ja bekanntlich:
(Die Gruppenverknüpfung in JR ist die Addition!) Mit demselben Argument zeig t man , das s exp : C --t C x ein Homomorphismus i ~. •
B e isp iel 3.3 (Noch einmal P ot e n z ie r en) Ist G eine Gruppe und 9 E G ein beliebiges El em ent , so ist ja
d.h .,
ist ein Homomorphismus von Z nach G . Da wir für allgemeine Gruppen keine Definition über Potenzen gX mi t x t/:. Z getroffen haben (das ist au ch nur in Sp ezialfällen auf sinnvolle Weise möglich) , mü ssen wir uns hier im Gegen satz zum vorheri gen Beispi el auf ganzzahlige Ex ponenten b eschränken . •
B e isp iel 3.4 (D eter m ina nt e) Für quadratische Matrizen üb er dem Körper K gilt bekanntlich die Determinantenmultiplikationsformel : V A, B E
«r> :
:
det(A . B) = det(A) . det(B)
d . h ., die Determinante ist ein Homomorphismus GLn(K) --t K
X
•
•
3.1 Gruppenhomomorphismen
3.1.1
45
Strukturerhaltung
Da Homomorphismen mit der Gruppenverknüpfung verträglich sind , erhalten sie auch viele Strukturen , die von der Multiplikation abgeleitet sind. Wir wollen uns genauer ansehen, welche das sind: Lemma 3.5
Seien C und H Gruppen und f : C -+ H ein Homomorphismus. Dann gilt: 1.
f(l) = 1
2.
v o E C : f(g -I)
= f(g) -I
Man acht e wieder darauf, was gemeint ist : In der ersten Au ssage ist die 1 linker Hand das neutrale Element in C , die rechts das neutrale Element von H. Nur so ergibt die Aussage auch eine n Sinn. Beweis: Es gilt f(l) = f(1 ·1) = f(I) · f(1) . Wenn wir jetzt f(l) kürzen (d. h. mit dem Inversen multiplizieren), dann bleibt nur die gewünschte Gleichung f(l) = 1 übrig. Die zweite Glei chung geht genauso einfac h: 1 = f(l) = f(g ·g-I) = f(g) · f(g -I) . Also muss f (g -I ) das Inverse von f (g) sein. D Lemma 3.6 (Bilder und Urbilder)
Seien C und H Gruppen und f : C -+ H ein Homomorphismus . Dann gilt: 1.
2.
Ist U Ist V
< c , so ist f(U) < H . < H, so ist f -I(V) < C . Ist sogar V
~ H, so ist auch f -I(V) ~ C .
Man beachte die Asymmetrie zwischen Bildern und Urbildern: Urbilder erhalten auch Normalteiler, nicht nur Untergruppen. Für Bilder ist das i. A . fal sch . Beweis: Wir benutzen natürlich das Untergruppenkriterium . Wegen 1 f(l) E f( U) ist f( U) i= 0. Sind XI ,X2 E f(U) , so gibt es UI ,U2 E U mit XI = f(uI), X2 = f(U2) . Es gilt dann:
XI' X2 1 = f(uI) . f(U2 1 ) = f(ul . U2 1 ) E f(U) Genauso funktioniert der zweite Beweis. Es ist 1 E f -I(V) , da f(l) Sind XI, X2 E (V) beliebig, so gilt:
r:
=1
E V.
Ist nun V ein Normalteiler von H , so gilt weiter für a lle X E f -I(V) und a lle g E C: f(g xg - I) = f(g)f( x)f(g) -I E V ===} gxg - I E f -I(V) Also ist
r ' (V) ein Normalteiler.
D
46
Gruppenzwang 1I1
Das Lemma ist ganz b esonders nützlich, weil diese Situation sehr häufig auftritt. Die meisten Untergruppen und Normalte iler, die eine m so üb er den Weg laufen, sind Bilder od er Urbilde r unter bestimmten Homomorphism en . Man muss dann nur erkenne n, ob diese Situation vorli egt, wendet das Lemma an und hat auf eine n Schlag nachg ewiesen, dass es sich um eine Untergruppe od er ggf. soga r um eine n Normalteiler handelt.
3.1.2
Kern und Bild
Zwei Sp ezialfälle dieses Lemmas sind b esonders wichtig.
D efi n it io n 3.7 (Kern und B il d) Seien G und H Gruppen und f : G -+ H ein Homomorphismus . Wir defini eren das Bild von f als im(f) ker(f) := f -I({ 1 }).
f (G) und den Kern von f als
•
Mit obigem Lemma ist das Bild st ets eine Untergru ppe der Zielgruppe Hund der Kern ein Normalteiler von G , da { 1 } ein Normalteiler von H ist .
B e isp iel 3.8 (Kanonische H o m o m o rphism e n auf Fak t org ru p p e n ) Sei G eine Gruppe und N :'Sl G . Dann ist G -+ G IN { g HgN
ein Gruppenhomomorphismus. Das gilt einfach , weil WIr die Verknüpfung in G I N genauso defini ert hatten :
Dies er Homomorphismus wird als der kanonische Homomorphismus von G auf G I N be zeichnet. Dabei bedeutet ,,kanonisch" soviel wie ,,natürlich , naheliegend". Eben weil er so naheliegend ist , wird oft kein e eigene Bezeichnung für dies en Homomorphismus vergeb en. Wenn ein Homomorphismus G -+ G IN irg endwo auftaucht , handelt es sich in fast allen Fällen um den kanonischen Homomorphismus. Falls doch eine Bezeichnung gewählt wird, so ist es oftmals p od er 7r od er et was Ähnliches. Das kommt daher , dass ein alte rnat iver Name für dies en Homomorphismus Projektion von G auf GI N ist. Die dritte Bezeichnungsalternative ist die sogenannte Strich-Konvention, die oftmals dann angewandt wird, wenn man es mit nur eine m ein zigen Normalteiler N zu tun hat (der dann aus dem Kontext klar ist), aber dafür sehr viel in G IN arbeitet. Man b ezeichnet dann gN als 9, G IN als G et c.
47
3.2 Mehr Homomorphismen
Untersuc he n wir nun den Kern des kanonischen Homomorphismus. Es gilt nach Defin iti on , dass 9 E G genau dann im Kern liegt , wenn gN = I N {::::::::} 1- 1 g E N {::::::::} g E N , d . h ., der Kern ist genau N. Damit haben wir erkannt, dass jed er Normalteiler Kern mindest en s eines Homomorphismus und jed er Kern ein Normalteiler ist. • E ine äußerst an genehme E igenschaft des Kerns ist folgen de: Satz 3 .9 S eien G und H Gruppen und äquivalent:
f
G ---+ H ein Homomorphismus. Dann sind
f ist injektiv. ker(f) = {1 }.
1.
2.
B ewe is : ,,1. ===} 2 ". Ist f inj ektiv , so gilt : V x , y E G : f( x) = f(y) ===} x = y . Daraus erg ibt sich: x E ker(f) ===} f(x) = 1 = f(l) ===} x = 1. Da die 1 jedoch sowieso immer im Kern ent halten ist , mu ss also ker(f) = { 1 } sein . 1.": Ist a nde re rse its ker(f) = 1 b ekannt, so sieht man die Inj ektivität wie folgt: f(x) = f(y) ===} 1 = f(x)f(y) - l = f(xy - 1) ===} x y-1 E ker(J) ===} xy - 1 =
,,2.
1
===}
===}
3.2
x
=
y.
D
Mehr Homomorphismen
Weil Homomorphismen ein so wichtiges Konzept sind, gib t es ver schiedene Spezial isierungen des Begriffes: D efin it io n 3.1 0 Seien G und H Gruppen und
f : G ---+
H ein Homomorphismus.
f heißt Epimorphismus / Monomorphismus / Isomo rphi smus , falls / inj ektiv / bij ektiv ist. f
f
surje kt iv
heißt Endomorphismus, falls G = H ist .
f
heiß t Automorphismus , falls f ein Endomorphismus und ein Isomorphismus • ist , d . h . ein bijektiver Homomorphismus G ---+ G . Man spric ht im Falle eines Monomorphismus au ch manchmal von einer Einb ettung von G in H . Das basi er t dar auf, das s - da solch ein f ja inj ektiv ist G mit eine r bestimmten Teilm eng e von H identifiziert werden kann , nämlich mit im(J) . Da b ei dieser Id entifizierung die Mult iplikat ion erhalten bleibt (f ist ja ein Homomorphismus) , ide nt ifizieren wir G dabei nicht nur mit eine r bloß en Teilmenge, sonde rn soga r mit eine r Untergru ppe von H.
48
Gruppenzwang 1I1
Beispiel 3.11 (Einbettungen) Umgekehrt er hält man a us jeder Unt ergruppe U ::; G einen Monornorphismus, der von der ech ten Einbet tung von U in G herkommt , das ist die sogenannt e Inklusion sabbildung: i :=
{u
-+ G
U MU
•
Die se Abbildung ist offenbar ein Mo nomor phism us.
Beispiel 3.12 (Projektionen) Sei G eine Gruppe und N:::J G . Die Projektion G -+ G/ N ist nach Konst ruktion ein surjekt iver Homomorphismus. Wir werden im Zuge de s Homomorphiesatzes sehen , dass das au ch umgekeh rt richt ig ist und jeder E pimorphis mus im Wesentlichen eine solche Projektion ist .
•
3.2 .1
Isomorphismen
Von be sonderem In tere sse sind die Isomorphismen. Greifen wir die Überlegung von oben no ch einmal auf, so können wir einen Isomorphismus G -+ H als eine Id entifizierung von G mit ga nz H (da 1 surjekt iv ist) auffassen, b ei der die Mult iplikat ion res pekt iert wird. Etwas umformuliert : Wenn wir mit 1 von G nach H übergeh en , dann verpassen wir zwa r a llen E leme nten von G eine n neu en Name n (J (g) stat t g), ab er die Mult iplikat ion bleibt dieselbe. Da Na men bekanntlich nur Schall und Rauch sind , können wir daher zusa mmenfassen : Fall s ein Isomorphismus G -+ H exist iert, so sind G und H vom gruppentheoretischen Standpunkt a us b etracht et (d . h . in a llen Punkten , die die Mult iplikati on b etreffen) im Wesentlichen gleich . Formal ger echtfertigt wird dies durch folgendes Lemma:
Le m m a und Definition 3.13 (Isomorphie) Seien G und H Grupp en . G und H heiß en isomorph , geschri eben G es eine n Isomorphismus 1 : G -+ H gibt.
~
H , falls
E s gilt: 1.
2.
idc : G -+ G ist ein Isomorph ismus. In sbesondere ist G
~
G , d. li., die
R elation "isom orph zu" ist reflexiv. Ist 1 : G -+ H ein Isomorph ismus, so ist auch 1- 1: H -+ G (das existie rt, weil 1 nach Definition bijekt iv ist) ein Isomorphi smus. In sbesondere ist G ~ H ===? H ~ G , d. h., die Relation "is om orph zu" ist sym me trisch.
49
3.2 Mehr Homomorphismen
3.
Sind I : G --t H , 9 : H --t J Isomorphismen, so ist auch s v l : G --t J ein Isomorphismus. Es ist demnach G ~ H 1\ H ~ J ===} G ~ I , d. h., die R elation "isom orph zu" ist transitiv.
Beweis: Alle drei Behauptungen sind sehr einfach einz use he n . Dass die Id en t ität bijektiv und ein Homomorphismus ist , ist trivial.
r:'
bijektiv ist , wenn I es ist , ist au ch t ri vial. Da ss es ein HomomorphisDass mu s ist , wen n f eine r ist , wollen wir nachprüfen : Da f surje kt iv ist , lassen sich alle Eleme nte Yl ,Y2 E Hals u: = I( xl) , Y2 = f(X2 ) mit Xl ,X2 E G darstellen . Es gilt daher :
Also ist
I- I
wirklich ein Isomorphismus.
Sind fund 9 bijektiv, so trifft das natürlich a uch a uf go f zu . Nac hzu prüfen , dass dies ein Homomorphismus ist , falls fund 9 solche sind, ist auc h völlig problemlos:
(g 0 f)(Xl . X2) = g(f(Xl . X2)) = g(f(xI) . f( X2))
= g(f( x I)) . g(f (X2)) = (g
0
f)(xI) . (g 0 f)( xI) D
Also ist di e Relation ~ eine Äquivalenz relat ion. Das trifft un sere Erwartungen , denn wenn wir isomorphe Gruppen als "im Wesentli chen gleich" beschreiben , dann sollte die se Rel ation a uch die grundlegenden Eigenschaften der Gleichheit t eilen . Beispiel 3.14 (Potenzieren ) Der Homomorphismus
f .-
lR --t lR >o { x M ex px
von der additiven Gruppe lR in die Gruppe lR >o zusam me n mit der Multiplikation , den wir so ä hnlich schon zuvor betrachtet haben , ist bij ektiv. Sein e Umkehrabbil dung ist der natürliche Logarithmus In : lR >o --t lR. Das zeigt, dass die se beiden Gruppen isomorph sind.
-
B e is p ie l 3.15 (Z yklisch e G rupp en) Ber eit s im let zt en Kapitel haben wir nachger echnet, dass {0,1, ... , n - 1 } zusammen mit der Addition modulo n isomorph ist zur Gruppe Z/ nZ. Wir hatten nur da die BegrifHichkeiten no ch ni cht zur Verfügung, die wir jetzt haben . _
50
Gruppenzwang
1I1
Eine weit er e int eressante Beo bachtung ist , dass die Aut omorphis me n eine r Gruppe G, d . h . die Isomorphism en G --t G, eine Gruppe bilden :
Lemma und Definition 3 .16 (Automorphismengruppen) Sei G eine Gruppe. Dann ist die Au tomorphism en gruppe von G als Aut (G ) := {f : G --t G I fi st Automorphismus }
mit der Komposition
0
von Abbildungen als Verknüpfung defini ert.
B e w e is : Es muss gezeigt werden , dass die s wirkli ch eine Gruppe ist . Eine Verknüpfung haben wir gegeben , denn im eben bewiesenen Lemma haben wir uns davon überzeugt , dass die Komposition zweier Isomorphismen G --t G wieder ein Isomorphismus G --t G ist. Die Komposition von Abbildungen ist immer ass oziativ, auch das haben wir b erei t s früher na chgeprüft . Das neut rale Element ist uns ebenfall s schon einmal in dem obigen Lemma begegnet : id c ist ein Element von Aut(G) und wie immer gilt id 0 f = f fü r alle Abbildungen f : G --t G . Das inv er se El em ent wird uns ga nz gen auso vom obi gen Lemma geschenkt : Zu jedem f E Aut (G ) ist E Aut(G) , und natürlich gilt 0 f = id . D
r:'
r:'
Automorphism engruppen beschreiben in eine m gewissem Sinne die , ~ n ne re Symmetrie" der Gruppe G .
3.3
Der Homomorphiesatz
Es ist für die Theorie der Gruppen natürlich von Interesse, entscheiden zu können, ob zwei Gruppen isomorph sind oder nicht . Während das in die ser Allgemeinheit ein sehr schwieriges Problem ist (sogar so schwierig, dass es a lgor it hmis ch unlösbar ist ), gib t es do ch viele Sätze , die uns in speziellen Situa tionen die Sache wesentli ch erleicht ern . Der ers te und wichtigst e dieser Sätze ist der Homomorphiesat z: Sat z 3. 17 ( Homomorp hiesatz ) Sei en G und H Grupp en und f : G --t H ein Homomorphismus. Es gilt dann: 1.
Ist N ~ G ein No rmalteiler und 'iT : G --t G IN der kanonische Homomorphismus, so gibt es genau dann einen Homomorphi smus 1 : G IN --t H mit f = 1 0 it , fall s N --+ x N , d . h. der Projektion von G a uf ker(J) .
53
3.3 Der Homomorph iesatz
3.3.1
Einmal mehr zyklische Gruppen
Der Homomorphiesatz erla ubt uns, eine Behauptung zu beweisen , die ich bereit s im let zt en Kapitel in den Raum gestellt hatte:
Lemma und Definition 3.18 S ei G eine zyklische Grupp e, etwa G 1.
= (g). Es gilt:
Durch
f .·-
2.
und den Homomo rphie sat z wird ein Isomorphi smus 1 : Z j nZ -+ G fü r genau ein n E N bestimmt. Dies es n heißt auch Ordnung von g, wird m eist ens als ord (g) notiert und hat folg end e Eigenschaft:
Vk E Z: l
3.
Z -+ G { k H gk
= l ~ n lk
Im Falle n = 0 ist die Be zeichnung j edoch uneindeutig. Man schreibt statt ord(g) = 0 auch oft ord (g) = 00 . Mit dieser Symbolik wäre ord(g) = I(g) I die charakterisierende Eig enschaft der Ordnung von g. Es gibt bis auf Isomorphie gen au eine un endlich e, zyklische Grupp e (nämlich Z) und gen au eine zyklische Grupp e der Ordnung n für alle n E N> o (nämli ch Z j nZ).
B e we is : Dank de s Homomorphiesa tzes müssen wir gar nicht mehr viel machen , um die se Aussagen zu beweisen. Die Potenzgesetze fü r Gruppen sagen uns, dass f( k + m ) = gk+m = gm = f (k )· f(m)
l .
ist , d . h ., dass
f
ein Homomorphismus ist . Weil G
= (g) ist , ist f surj ekt iv .
Außerdem wissen wir , dass jede Unt ergru ppe von Z (al so in sbesondere ker(f)) die For m n Z für genau ein passendes n E N hat . Dami t ist dank de s Homomorphiesatzes die erst e Au ssage be rei t s vollständig bewiesen. Fall s G endlich war , so folg t IGI = IZjnZI = n , und falls G unendlich war, so folg t IGI = IZjOZI = IZI = 00 , d . h. , mi t der zwei ten Konvention ist t atsächlich ord(g) = l(g)l . Die Charakteri sierung der Ordnung durch die Teilbarkeitseigen sch aft (hi er mü ssen wir die Konvention b emühen, die ord(g) = 0 erla ubt ), folgt au ch völlig a us ber eit s bekannt en Tatsachen : 1=
l
= f (k ) ~ k E ker(f) = n Z ~ k in
54
Gruppenzwang 1I1
Die dritte Aussage ist eine Zusammenfassung der ersten. Wenn GI = (gI) und G2 = (g2) zwei zyklische Gruppen ders elben Ordnung ord(91) = ord(g2) = n E N>o U { 00 } sind , dann ist GI ~ Z/nZ ~ G2 (im endlichen Fall) bzw . GI ~ Z ~ G2 (im unendlichen Fall) . D Eine wichtige Konsequen z aus der Beobachtung l(g)1 = ord(g) für endliche Ordnungen ist , dass für endliche Gruppen st ets ord(g) ein Teiler von IGI ist , denn nach dem Satz von Lagrange ist l(g)1 ein Teiler von IGI. Wenn man jetzt das Lemma a uf diese Erkenntnis a nwende t , er hält man , dass in endliche n Gruppen stet s g lGI = 1 ist. Ebenfalls eine sehr einfache, a be r unschätzbar wertvolle Information.
3.4
Charakteristische Untergruppen
Mit Homomorphism en kann man sich in der Gruppentheori e vieles erle ichtern . Sie tret en oft genug auf, um viel Arbeitser sparnis zu bed euten. Eine Möglichkeit haben wir b ereits geseh en: K erne von Homomorphism en sind immer Norma lteiler , Bilder sind stet s Untergru ppe n. Eine weiter e, von Zeit zu Zeit nützliche Methode, sich Normalteiler zu b eschaffen , sind charakteristische Untergruppen:
D efin it io n 3. 19 Sei G eine Gruppe und U ::; G eine Untergruppe. U heißt charakteristische Untergruppe von G , fall s für alle f E Aut(G) stets f( U) ~ U gilt.
U heißt voll charakteristisch, fall s dies sogar für a lle Endomorphismen f : G gilt.
--t
Ganz allgem ein defini ert man entspreche nd fü r beliebige Teilmengen X E nd (G), dass U X -inuariant heißt, falls V f EX : f(U) ~ U ist .
G C
•
Wi e kommen da die Normalteiler ins Spiel? So:
Le m m a u n d D e fin it ion 3. 20 (Innere Automorphismen) Sei G eine Gruppe. Dann gilt: 1.
Sei 9 E G. Die Konjugation mit g, d. h.,
«« >
2.
{~:~q-'
ist ein Automorphismus von G. Automorphism en dieser Form heißen innere Automorphismen . Inn(G) := {/'l,g I 9 E G} ist ein Normalteiler von Aut(G) .
55
3.4 Charakteristische Untergruppen
3.
Eine Untergruppe N ::; G ist gen au dann eui Normalt eiler , wenn si e Inn( G) -invariant ist . In sbesondere sin d charakteristische und voll charakteristi sch e Untergruppen stets auch Normalt eiler.
Beweis: Die ersten beiden Punkte b eweisen wir geme insa m In mehrer en Schritten. Erster Schri t t : "' g ist ein Homomorphismus G --+ G . Das sieht man wie folg t ein:
Zweiter Schrit t: W ir schauen uns an , wie die inneren Automorphismen zueinander in Verbindung stehen. Für alle g , h , xE G gilt :
Also ist
"' g
0
"' h
=
"' g h.
Dritter Schritt : Weil offenbar "'1 = id c ist , ist "'g 0 "'g- 1 = idc = "'g-1 0 "'g, d . h ., alle "'g sind tats ächlich Automorphismen von G . Weiterhin zeig t uns die Glei chung a us Schrit t 2, das s r: :=
{G--+ Aut( G) 9
H
"'g
ein Homomorphismus von Gruppen ist . Also ist In n (G ) = im(",) schon einma l mindesten s eine Unterg ru ppe von Au t(G). Vierter Schritt: Inn(G) ist ab er sogar ein Normalteiler , denn es gilt für all e a E Aut(G) ,g,x E G:
d .h. a
0
"'g
0
a-
1
E Inn(G) . Also ist tatsächlich Inn(G) ~ Au t(G) .
Die dritte Au ssage ist nur eine Umformulierung des uns schon bekannten Krit eriums N ~G {::::::::} \l gE G: gN g-l~ N, denn gN g-1 ist natürlich nichts anderes a ls "'g(N) .
D
B eis piel 3. 21 (Das Z entr um) Ein be sonders in teressantes Beispiel, das zugleich eine nette Anwendung des Homomorphiesatzes bereithä lt , ist folgendes: Definiere das Zentrum der Grupp e G a ls Z(G) := {g E G I \Ix E G: gxg -
1
=
x },
Gruppenzwang
56
1I1
m an könnt e natürlich a uch umst ellen und
Z (G) = { 9 E G I \I x E G : gx = x g } sch reibe n . Das Zentrum b est eht also a us allen E leme nten von G, die mit allen a nde re n Elemente n von G kommut ier en. Ich behaupte nun , dass Z (G) eine charakterist ische Untergruppe von G ist, mithin also sogar ein Normalteiler. J et zt könnte man natürlich mit dem Untergru ppenkriterium anfangen und sich dann Schri tt für Schrit t alle s zus ammensa mmeln , was man braucht . Der wesentlich elegantere Weg ist a ber , sich einen geeigneten Homomorphismus zu besorgen und die se Arbeit von den Lemmata , die bereits bewiesen wurden , erle digen zu lassen . Wir benut zen dafür den Homomorphismus au s dem Lemma: I', : G --+ Au t(G) . Es gilt nämlich
g E ker(K,) {::::::::} K,g = id {::::::::} \I x E G : x = K,g(x ) = gxg - 1
{::::::::}
g E Z(G) ,
d. h . Z (G) = ker (1', ). Damit haben wir in nur einer Zeile bewiesen, dass Z (G) mindestens ein Normalteiler von G ist . Der Homomorphiesatz gibt un s direkt noch die schöne Zusatzaussag e, dass G jZ (G) ~ Inn( G) ist. Das einz ige, was jetzt no ch zu tun ist, ist zu b eweisen, dass Z(G) nicht nur no rm al (d . h . Inn( G) -invariant) , sondern sogar charakte rist isch (d . h . Aut( G)invariant) in G ist . Das sieht man wie folgt : Wenn a E Au t( G) ist, dann ist a insb esondere ein surje kt iver Homomorphismus, d.h ., jed es x E G lässt sich als a(y) schreibe n . Dann gilt für alle 9 E Z(G):
xa(g) = a(y)a(g) = a(yg) = a(gy) = a(g)a(y) = a(g)x Da x E G b elieb ig war , folgt , dass a(g) E Z( G) ist , d . h . a(Z(G))
2 und kein e Primzahl , so be sitzt p eine Darstellung p
= t . s mit 1 < t , s < p .
Es ergib t sich dann
o=
p . 1 = (ts) . 1 =
Da ein Körper aber nullteilerfrei ist, folgt t ·l de r Minimali t ät von p.
(t . 1) (s . 1).
= 0 oder s -I = O. Die s widerspricht 0
B e is p iel 8.8 Schauen wir uns ein paa r einfache Bei spiele an: • • •
Der Körper JF2 besitzt die Charakteri stik char(JF2 ) = 2, denn hier gilt 2 ·1 = 1 + 1 = O. Allgemeiner haben die Körper JF p die Charakteri stik p . Un ser e "gewohnten" Körper Q, IR od er C haben die Ch arakteri stik O.
•
Der kommende Satz ist be sonders wich tig und zeigt, dass es im Wesentlichen nur zwei F älle für Primkörper gibt. Zuvor geben wir ab er eine Bemerkung, die für den Bew eis entscheidend sein wird. Wenn ein Körper die Charakt er ist ik 0 besit zt , dann ist der Homomorphismus Z -+ K , der durch n H n . 1 gege be n ist , inj ektiv . Da es (für j ed en Ring) nur eine n Ringhomomorphismus dieser Art gibt, können wir in diesem Fall das Bild von Z in K ganz natürlich wied er mit Z identifizier en .
122
8 Endliche Körper
Satz 8.9 (Satz über Prirnkörper) S ei K ein beliebig er Körper und F sein P rimkorper . Dann tret en zwei F älle auf: a) cha r( K ) = 0 {::::::::} F ~ Q b) char( K ) = p -::p 0 {::::::::} F ~ Z/ pZ . Beweis: In beiden F ällen wird nur die Richtung " ===? " bewiesen . Die Umkeh rungen sind t rival. Zunächs t zu a .) Da für n -::P 0 auc h n· 1 ein von Null ver schi edenes E lement von F ist , liegt au ch (n · 1) -1 in F. Somi t ist
p i := {(m ' l)(n . 1)-1 : m, n E Z, n -::p O}
O.
Beweis: W är e char (K ) = 0, dann besäß e K den Teilkörper Q. Dieser ist jedoch ni cht endlich . D Es sei jedoch a ngemerkt , dass es au ch unendliche Körper der Charak teristik p gib t , et wa den algebraischen Ab schluss von Z/ pZ. Die se Körper sind jedoch
ni cht Gegenst and die ses Kapitels und sollen daher nicht ein gehender be sprochen werden . Das folgende Lemma ist der er ste Sch ritt zur Klassifikation endlicher Körper. Satz 8.11 Ist K ein en dlicher Körper, so ist IKI
=
pn mit p
= char (K ) > 0
und n ?: 1.
Beweis: Sei F 0 prim. Es liegt nun eine Körpererweiterung K / F vor . Die se mu ss eine endliche Erweit erung sein, denn jed e Basis des F- Vektorraums K mu ss eine Teilmenge von K und daher endlich sein . Es folgt nun mit lin earer Algebra , dass K aIs Vektorraum zu F" isomorph ist für n = dimj- K = [K : F ], also IKI = IFln = pn . D
123
8.3 Frobenius mischt sich ein
Wir wissen nun über die Anzahl der Elemente von endlichen Körpern, dass sie immer eine Primzahlpotenz ist . Beispiel 8.12 Man kan n a uf einer 6-elementigen Men ge kein e Addition und Mult iplikation defini eren , sodass die Menge mi t den Verknüpfungen einen Körper bildet . Wi r haben ja gerade gezeigt , dass ein endlicher Körper P rimzahlpotenzordnung hat .
•
W ir können a be r noch mehr a us der Betrachtung de s Primkörpers he rausfinden:
Satz 8.13 (Körper mit Primzahlordnung) Ist K ein Körp er und IKI = p eine Primzahl, so ist K
~
Z/pZ.
Beweis: Wi r haben bereits eingeseh en , dass K ein en zu Z/pZ isomorphen Primkörper haben mu ss. Da nun a ber K und die ser Teilkörper die selbe Ordnung haben, mü ssen sie berei ts gleich sein. Also ist K selbs t zu Z/pZ isomorph. 0 Es gibt bis auf Isomorphie also nur einen Körper de r Ordnung p für jede Primzahl p . Es wird sich am Ende des Kapitel s sogar herausstellen , dass die Ordnung eines endlichen Körpers die sen bis a uf Isomorphie be stimmt . Es ist daher üblich , den endliche n Körper mit q Elem enten als JF q zu b ezeichnen . Das JF steht dabei für das englische Wort .fi eld", das im E nglische n für Körper verw endet wird (und nicht et wa "body"), und wurde von E. H. Moore einge führt, der die endliche n Körper als Erst er klassifizierte.
8.3
Frobenius mischt sich ein
Viel e Besonderheiten von Körpern der Charakteristik p =I- 0 lassen sich durch das Verhalten der sogenannten Frobenius-Abbildung b eschreib en . Wir defini eren diese Abbildung wie folgt:
Definition 8.14 (Frobenius-Abbildung) Die Abbildung x f-t x P wird als Frobenius-Abbildung bezeichnet .
•
Der folgende Satz zeigt, dass die Frobenius-Abbildung ein Körperhomomorphismu s ist .
Satz 8.15 S ei K ein K örper der Charakt eristik p =I- O. Dann gilt für alle x, y E Kund
n EN
8 Endliche Körper
124
Im Englischen heißt dies er Satz .Freshmarr's dr eam", da einige Leute so rechnen , als ob das in jed em Körper gelte (sprich : Leute, die die binomischen Form eln nicht können) . Die erste Au ssage ist klar, da Körper kommut ative Ringe sind. Zum Bewei s der zweiten Au ssage wenden wir den binomischen Lehrsatz an . In jedem Körper K gilt :
Beweis:
Für die Binomialko effizienten, welch e ganze Zahlen sind, gilt definitionsgem äß , dass
p! =
(~) . k! . (p -
k)!.
Da aber für 1 :s: k :s: p - 1 wed er k ! noch (p - k)! den Fak tor p enthält , dieser ab er a uf der linken Seit e vorkommt , mu ss (~) durch p t eilbar sein . Wegen char(K) = p sind all diese Terme ide nt isch O. Es bleib t daher (x +y)P = x P+ yP übrig. Induktiv folgt daraus a uch (x + y)P" = x P" + yP" für alle n E N wie behauptet . D Der folgende Satz zeigt , dass die Frobeniusabbildung sogar ein Körper automorphismus ist .
Satz 8.16 In ein em endlichen Körper der Charakteristik p x M x P ein Automorphismus.
-::P 0
ist die Frobeniu sabbildung
Der Satz 8.1 5 liefert die Homomorphieeigenschaft der Frobeniusabbildung. Da diese ni cht die Nullabbildung ist , ist sie als Körperhomomorphismus b ereits inj ektiv. Nun ist ab er eine inj ektive Abbildung einer endliche n Menge in D sich surjekt iv, zusam me n also bij ektiv , sprich ein Automorphismus. Beweis:
Treiben wir das Spielchen no ch ein wen ig weite r :
Satz 8.17 Sei K ein K örper der Charakteristik p prim. Dann gilt a llFp K örperautomorphismus a : K --+ K .
id lFp für je den
Jeder Körperautomorphismus a : K --+ K ist die Identi t ät a uf dem P rimkörper, denn für a E JF p gilt
Beweis:
a(a) = a(l
+ ... + 1) =
'----v-----' a -m a l
Also folgt die Behauptung.
a( l)
'
+ ... + a(l), =
a.
a- ~a l
D
125
8.4 Polynomr inge
Satz 8.18 (Der k leine Satz von Fermat) S ei p eine Primzahl und ggT (a, p) = 1, das heißt, p teilt ni cht a , Dan n ist aP -
1
== 1 mod
p.
B ewe is: Der kleine Fermat folgt sofort a us dem obigen Satz 8.17, denn CiP liefert CiP-l = 1 in lF p , falls Ci =I- 0 ist .
8.4
= Ci D
Polynomringe
Wir werd en un s im Folgenden einige nützlich e Eigen schaften von P olynomringen üb er Körpern zu Nutze machen , die in diesem Ab schnitt zusamme ngefass t werden sollen. Dafür wied erholen wir zunächs t eine Definition, die in allen Ringen anwendbar ist :
Definition 8.19 (Einheiten und irreduzible Elemente) E ine Einheit de s Rings R ist ein invertie rbare s E leme nt 1 E R , d . h ., 1 ist genau dann eine Einheit , wenn ein g ER ex ist iert mit 1 = i o = g f . Die Men ge aller Einhe iten von R wird als Einh eit engruppe von R und mit dem Symbol R X bezeichnet (bzgl. der Multi plikation von R ist das tatsächlich eine Gruppe) . Ei n E leme nt f E R heißt irreduzibel , falls f nicht Null und kein e E inhe it ist und fall s gilt: vg, h ER : f = gh ===} 9 E R X V h E R X
•
Zentral für die Untersuchung von Polynomringen üb er Körpern ist die Mögli chkeit , die Division mit Rest durchführen zu können :
Satz 8. 20 (Polynomdivision) S eien g, u e K [X ] gegeben und h =I- o. Dann existi eren Polynome q, r E K [X ]' sodass 9 = qh + rund deg(r) < deg(h) . Der Algorithmus, um q und r für gege be ne s 9 und h zu find en, ist sogar schon au s dem Schulunterricht bekannt . Er funktioniert un abhängig von K stets auf dieselb e Weise. Hat man diesen Satz erst einm al verinnerlicht, kann man mit seine r Hilfe weitere wichtige Aussagen üb er P olynomringe herleiten , wie etwa diese beiden:
126
8 Endliche Körper
Satz 8 .21 (Größter g e m e in sa mer T e il e r ) Zu j e zwei Polynom en g, h E K [X ] exis tie rt ein größt er gem ein sam er Teiler ggT (g, h) , welcher bis auf Multiplikation mit Einh eit en eindeutig bestimmt ist. Satz 8.22 (Lemma von Bezout) Zu je zwei Polynomen g, h E K [X ] und j edem größt en gem einsamen Teiler d = ggT (f, g) gibt es Polynome s, t E K [X ] mit
d = sg + t h. Beide Au ssagen sind mi t einem Algori thmus verbunden: ggT (g , h) lässt sich mi t Hilfe des euklidischen Algori thmu s ermit teln. ggT(g , h), sund t zugleich kann der erweiterte euklidische Algorithmus berechnen. Beide sind ganz allgemein funktionstüchtig und wied er in ihrer Anw endung für alle Koeffizientenkörper gleich . In der Tat kann m an sie in jed em sogenannte n euklidische n Ring a uf dieselb e Weise anwenden . Ein Ri ng ist dabei euklidisch , falls er eine Divi sion m it Rest nach obi gem Sch em a erlaubt, wenn die Grad-Funktion dabei durch ein geeign et es P endant erse tz t wird . (Ein Beisp iel für so einen Ring ist Z mit dem Abso lut be t rag als Ersatz für die Grad-Funktion. Das liefert die bekannten Variationen der beiden obigen Sätze für Z. ) B e w e is : Beide Sätze b eweist man kon struktiv, indem man den erweite rten euklidi schen Algori thmus a ufschreibt und bewei st , dass die ser Algorithmus nach endlich vielen Schritten beendet ist und die Elemente, die dabei he rauskommen , die geforde rten Eigenschafte n haben . Das wird üblicherw eise induktiv b ewiesen und zwar mit den selb en Met hode n, die für die analog en Sätze für Z verw endet wurden . 0 Wa s ebe nfalls in jed em euklidische n Ring funktioniert , hier aber wie zuvor nur für den un s inter essierenden Fall der Polynomringe formuliert sein soll, ist Folgendes: Le m m a 8. 23 (Z e rleg u n ge n in irreduzible Elemente) Sei K ein Körper und f E K [X ] ein Polynom, das nicht null und kein e Einheit ist. Dann exis tie ren irreduzible Polynome [s , ... , !k, sodass k
f = II h i= 1
und die Zerlegung ist ein deutig bis auf Einh eit en und R eih enfolg e in dem Sinne, dass für jed e weitere Zerlegung in irreduzible Faktoren m
gilt, dass k = m ist und nach geeign eter Umnumm eri erunq der Faktoren Einheiten Ui E R X mit Ji = Uigi existieren.
127
8.5 Adjunktion
Beweis: Auch hier ist der Beweis nur eine beinahe wortwörtliche Üb ertragung des Beweisprinzips von z::. auf den allgemeinen Fall. 0
8.5
Adjunktion
Wir wissen nun einiges über die Eige ns chaften von Körpererweiterungen und kennen die en dliche n Körper lFp . Wir haben jedoch noch keine Möglichkeit kennengelernt , Körper erw eiterungen zu konstruier en , um aus lFp größere, endliche Körper zu bekommen . Gibt es et wa eine n Körper mit 2 2 = 4 El ementen ? B e is p iel 8.24 (Körper mit vier E lementen) Übe rle gen wir zunächst, welche Eigen schaften solch ein hypothetischer Körper J{ = { 0,1, a , b } mi t vier El em enten haben müsste. Weil 4 eine Poten z von 2 ist, wissen wir , dass die Charakteri stik dieses Körper s 2 und sein Primkörper lF2 = { 0,1 } sein müsste. Überlegen wir , wie die Addition in die sem Körper fu nkt ionier en mü sste. Was ist etwa a + 1 ? Dafü r gibt es nur vier Mögli chkeiten : • •
•
+ 1 = O. Das führt a + 1 = 1. Das führt a + 1 = a. Das führt a
zu a zu a zu 1
= a + 1 + 1 = 0 + 1 und zum Wider spruch a = 1. = 0, was ebenfall s ein Widerspruch ist . = 0, worin au ch ein Widerspruch zu erkennen ist .
Also bleibt al s einzige Option a+ 1 = b übrig. Ganz a nalog mu ss b+ 1 = a gel ten. Daraus sch lussfolgern wir a uch me sser scharf, dass a + b = a + a + 1 = 0 + 1 = 1 ist . Damit können wir die Verknüpfungst abelle für die Addition a ufsch reiben:
+
0
1
a
b
o
0
1
a
b
1
lOb
a
a
abO
1
b
b
0
a
1
Wi e sieht es a be r mit der Mult iplikat ion au s? Wi e mü sste J{ beschaffen sein? Was die Multiplikation mit 0 und 1 b ewirkt, sagen uns die Körperaxiome. Wir müssen a lso fragen , was a . a sowie a . b ergeb en. Wi eder gibt es nur wenige Mögli chkeiten dafür: • • •
a - a = O. Dann wä re a = 0, da Körper nullteilerfrei sind. Ein W ider spruch . a· a = 1. Dann ergä be sich 0 = 1 + 1 = a 2 + 1 = (a + 1)2 ===} a + 1 = 0, was wir ber eits als Wider spruch erkannt hatten. a- a = a. Das hieße a = 1, was der selb e Widerspruch wie zuvor ist.
8 Endliche Körper
128
Also bleibt nur a 2 = b = a + 1 als einzige Option übrig. Völlig analog muss b2 = a sein . Daraus schlussfolgern wir auch zugleich , dass a- b = a- (a + 1) = a 2 + a = (a + 1) + a = 1 gelten muss . Die Verknüpfungstabelle für die Multiplikation in K sähe also wie folgt aus: 0
1
a
b
0
0
0
0
0
1
0
1
a
b
a
0
a
b
1
b
0
b
1
a
Die Fr age, ob ein Körper mi t vier Elementen existiert, ist damit immer noch nicht beantwortet, aber wir wissen jetzt genau, wie er aussehen müsste, wenn es ihn denn gäbe. Nun könnten wir einfach nachprüfen, dass die beid en Verknüpfungen , wenn man sie wie in den Tabellen angegeb en defini ert, wirklich die Körperaxiome erfüllen .
•
Eine interessante Beobachtung an diesem Körp er ist, dass das Elem ent a (und völlig analog auch b) die Gleichung a 2 + a + 1 = 0 erfüllt, d . h. eine Nullstelle des Polynoms X 2 + X + 1 E lF2[X] ist. Dieses Polynom hat in lF2 kein e Nullstellen , wie man leicht durch Einsetzen von 0 und 1 einsieht . Dieser Effekt ist uns auch schon bei anderen Körpererweiterungen a ufgefallen. So hat X 2 + 1 E !E.[X] keine Nullstellen in !E., sehr wohl jedoch in der Körpererweiterung 1 eine
Zerl egung
f =!I·!2 ···· ·ik
J = 4J(f ) = 4J(!I ) . 4J(h ) . .. . ·4J(ik )
==?
mi t irreduziblen f i E K [X ]. Da 4J : K [X ] --+ K [X ] j a ein Isomorphismus ist , sind au ch die 4J(fi) irreduzible Element e von K [X ]. Sind nun L und L Zerfällungskörper für das jeweilige Pol yn om , so zerfallen !I und 4J(!I ) über L vollst ändig in Linea rfak to ren , weil f bzw . 4J(f ) das tut und !I bzw . 4J (fI) ein Teiler davon ist . Es gibt a lso Nullstellen 0:1 E L und 0:1 E L. Dann liefert uns der erste Teil des Satzes eine Fortset zung 'lj; : K(O:I) --+ K( iii) von 4J, die 0:1 a uf iii schickt. Um nun die Indukt ion svor aussetzung anwenden zu können , betrachten wir das Polynom
g: = X
f
- 0:1
E
K( O: I) [X ].
Dass dieses Pol yn om wirklich in K( O: I) [X ] lieg t , erkennt man , wenn man es sich als das Ergebnis de s Polynomdivisionsalgorithmus vergegenwärti gt . De r Algorit hmus benutzt nur die vie r Grundre chenarten und die Koeffizienten von fund X - 0:1 und bleibt daher in K(o:I) [X]. Weil L j a ein Zerfällungskörper von f über K ist, exist ier t eine Zerlegung
f = u(X für gewi sse O:i E L , u E K
X
- 0:I) . (X - 0:2 ) . . .. . (X - O:d)
und L
= K( O: I , 0:2, ... , O:n ).
Daher gilt g = u(X - 0:2) . .. . . (X - O:d)
und L = K( 0:1,0:2, ... ,O:n ) p er für 9 über K(O:I) .
= K (0:1)(0:2,. . . , O:n). Also ist Lein Zerfällungskör-
Es gilt ganz an alog
f und
L ist
ein Zerfällungskörper für
9 über K(O:I).
Weil wir schon einen Isomorphismus 'lj; : K(o:I) --+ K(O:I) haben und deg(g) = de g(g) = d -I < d ist , können wir 'lj; induktiv fortsetzen zu einem Isomorphismus \V : L --+ L wie gew ünscht . Die letzt e Au ssage des Satzes ist j et zt ein einfac he r Sp ezialfall der zweiten, denn sind L und L zwei Zerfällungskörper von f über K, so kön nen wir 4J := id K : K --+ K wählen , den zweiten Teil a nwende n und erhalten eine n Isomorphismus : L --+ L . D Wir können - und werden - a lso ab jetzt ohne schlechtes Gewissen von "de m" Zerfällungskörper eines P olynoms spre che n.
8.7 Existe nz und Eindeutig keit e ndlicher Körper
8.7
135
Existenz und Eindeutigkei t endlicher Körper
Das war ein ganz schönes Stück Arbeit , nicht wahr? Aber jetzt können wir endlich d ie endlichen Körper kon struieren, die wir uns schon die ganze Zeit gewünscht haben . 'Nenn wir einen Körper K mi t q = pn E lement en kons truieren wollten , wie würde die ser a uss ehen? Nun , zum Bei spiel wä re seine Einheitengruppe K X = K \ { 0 } eine Gruppe mit q - 1 El em enten . Der Satz von Lagrange sagt uns als o, dass v x E K \ { O} : x q - 1 = 1 sein mü sste. Multiplizier en wir beide Seiten mit x , so erhalten wir eine Gl eichung , die auc h für x = 0 wahr ist: Vx E K: x
q
=x
Mit anderen Worten: Die q Elemente von K müssen gen au die Nullstellen von X " - X sein. Insbesondere mü sste K der Zerfällungskörper von X " - X über jedem Teilkörper sein. Unser An satz wird al so sein , K aIs Zerfällungskörper von X'! - X zu kons truieren . Welchen Grundkörper sollten wir dabei benutzen ? Natürlich den einz igen, den wir mit Sich erheit in K haben , den Primkörper lF p . W ir wissen , dass es einen Zerfällungskörper von X" - X E lFp[X ] gibt und dass er bis auf Isomorphie eindeuti g be stimmt ist . Dami t sind wir schon fas t am Ziel, die Eindeutigkeit de s Körpers mi t q Elementen folg t a us unseren Überlegungen bis hierhin schon : Jeder Körper mi t q E lem ent en ist ein Zerfällungskörper von X" - X über lF p , und die ser Zerfällungskörper ist bis auf Isomorphie eindeutig . Es st ellt sich jetzt die Frage, ob der Zerfällungskörper von X" - X wirklich die Umkehrung liefert, d . h. ob er wirklich genau q E lem ente hat . Überlegen wir uns zunächst , dass er nicht mehr a ls die a ngepeilten q Elemente haben kann :
Lemma 8.30 S ei p prim und q := pn mit n E N> o. D er' Zerjällungskörper K von X " - X über lFp hat höchstens q El em ente. B e we is : Seien (x, ß E K zwei Nullstellen von X " - X. Weil q = pn ist , gilt dann (siehe de r Ab schnitt über den Frobenius-Homomorphismus) :
und
8 Endliche Körper
136
Also sind a + ß und aß ebenfalls Nullstellen von X" - X . Wa s bringt un s das? Nun , die Nullstellenme nge von X" - X bildet auf Grund dessen einen Teilk örper von K, und weil K der von allen Nullst ellen erzeugt e Teilkörper ist , mu ss die Nullste llenme nge sogar mit K üb er ein stimmen . J etzt sind wir am Ziel: X" - X ist ein P olynom vom Grad q , kann also höch st en s q Nullstellen in jed em Körper D haben . Daher mu ss IKI ::; q sein . J et zt fra gt sich , ob a uch IKI ~ q gilt , denn das fehlt un s ja no ch zu un ser em Glück. Dann hät te n wir eine n Kör per mit q Elem enten für jed e Primzahlpoten z q kon struiert und seine Eindeutigkeit sicher gest ellt. Das war un ser Ziel. F ür die se Ab sch ätzung geb rauchen wir das nun folgende Lemma : Le m m a und D efin it ion 8 .3 1 S ei K ein Körper. D efin iere die for m ale Ableitung eine s Polynoms aus K [X ] durch :
E s gilt : K [X ] -+ K [X ] ist K -linear, d. h. für alle [i , 12 E K [X ] und alle a1 , a 2 E K gilt : (al' h + a 2 . 12)' = a l . f{ + a2 . f~
1.
1 :
2.
1
ist ein e Derivation, d. h. für alle
t, g E
(f . g)' =
K [X ] gilt die Produktregel:
J' . g + f · 9'
Allgem ein er gilt die Leibni z-Regel, d. h. für alle k
(!I . ... . fk )' =
L f: i= l
3 . Falls ggT(f, 1' ) = 1 ist , hat Nullst ellen .
f
h ,.. . ,fk E
rr
K [X ] gilt :
fj
j =l... k
N i
in sein em Zerfällungskörper kein e m ehrfachen
B e w eis : Die Punkte 1. und 2. sind einfache s Nachrech ne n mittels der Definition und werden daher hier nicht vorgeführt . Die Leibnizr egel folgt induktiv durch mehrfache s Anwenden de r P roduktregel für zwei Fak to ren (und zwar wor t wörtlich mi t demselben Induktionsb eweis wie für gewöhnliche Ableitungen a us der An al ysis) .
Kümmern wir un s also um Punkt 3. Ist L der Zerfällungskörp er von f üb er K , so seien a 1, . . . ,ak E L die paarweise ver schi ed en en (!) Nullst ellen von f und ei E N>o die dazug ehörigen Vielfachheiten , d . h ., es gibt eine Kon stante u E K X mit
rr k
f(X)
=u
i= l
(X -
air
i
•
8.8 Zusammenfassung, Literatur und Ausblick
wr- b erechnen
daraus
137
l' zu k
!'(X) =U2..: ei (X - a i) ei -1 i= l
TI
(X -aj) ej
Ni
Angenommen , es gäbe eine mehrfache Nullstelle von d . h . e r > 1. Dann gilt: k
f' (aI) = u 2..: ei (al - a i) ei-l i=l
= U . el ( al -
al ) e , - l
•
j =l...k
TI
f . O . B . d . A.
ist das o i
,
(al - a j) ej
j=l.. . k
Ni
TI (al -
aj )e·.1
j = 2 ... k
k
TI
+ u 2..:ei (a l- ai )ei- 1 (a l -aj) ej i=2 j= l.. .k Ni
= 0 Das wird null, weil im ersten Summanden «i - «i = 0 mit dem positiven Exp one nte n e i - 1 poten zier t wird (man b ea chte, dass 0 0 = 1 gewesen wär e) , während in allen folgenden Summanden das Produkt den Faktor al - a l = 0 mi t po sitivem Exponenten ei enthält . So sind alle Summanden null und somit j'(aI) = O. Damit ist also X - al ein Teiler von j'(X). Das wiederum heiß t, das s X -al ein Teiler von ggT (f, j') sein mu ss. Dann kann der ggT aber unmöglich 1 sein .
o Wenden wir das nun auf K = JF p und f = X" - X a n , so erhalten wir = qXq -1 - 1 = -1, da q ein Vielfach es der Charakteri stik char ( K) = p ist und daher der erste Summand null wird . Die einzigen Teiler von J', also insbesondere au ch alle gem ein samen Teiler mit I , sind a be r Einheit en , d . h . ggT (f, J') = 1. Das Lemma sagt un s desh alb , dass die Null st ellen von f im Zerfällungskörper paarweise ver schi ed en sind , insbes onde re gibt es gen au q Nu llstellen im Zerfällungskörper.
r
8.8
Zusammenfassung, literatur und Ausblick
Das war je tzt eine Menge neuer Stoff. Ich denke, es ist ganz gu t , wenn wir die wichtigsten Dinge, also das , was man auf jeden Fall wissen sollt e, no ch einmal zusammenfas sen.
138
8 Endliche Körper
Satz 8.32 (Endliche Körper - Zusammenfassung) • Ist K ein endlicher Körper mit q Elementen, so ist char (K ) zahl. • • •
•
lFp ist der Primkörper von K . q ist ein e Potenz von p, gen au er q
= p ein e Prim-
= IKI = p [K: lF p ] .
Die Frobenius-Abbildunq K -+ K , x >--+ x P ist ein Kiirperauiomorphismus von K. Für j ede Primzahlpotenz q = pn existiert bis auf Isomorphie qenau ein Körper der Ordnung q. Es ist der Zerfällungskörper von X" - X E lFp[X].
Endliche Körper haben viele interessante Anwendungen , etwa in der Kryptographie. Der 4. Teil dieses Buches bes chäftigt sich mit solchen Anwendungen.
Florion Modl er studiert Mathematik in Hannover, Johannes Hahn ist Dipl.-Math. und promoviert in J ena.
Teil 11 Diskrete Mathematik
9 Über die Anzahl von Sitzordnungen am runden Tisch
(Eine Recherche)
Übersicht 9.1
Die Frage
9.2
Der \iVeg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
9.3
Verstehe das Problem
142
9.4
Su che Zusammenhänge, ersinne eine n P la n un d führe ihn aus
144
9.5
Überprüfe die Lösung
147
9.6
Am Ziel
156
9.1
141
Die Frage
Um einen K reis solle n m Elemente der ein en Art un d f Elemente der and eren Art angeordn et werd en . Kom binationen, die durch Drehung auf sich selbst abgebildet werd en kön n en, werd en nur einm al gezählt. Wie viele Möglichkeiten gibt es ? Für diese Frage mache ich mich a uf die Suche nach eine r Antwort . Ich möchte hier b erichten, wie ich vorgegangen bin und die Lösung angeb en und erklä ren .
9.2
Der Weg
George Polya (1887- 1985) hat in seinem Buch .How to solve it" [22] einige Regeln a ufgestellt, die beim plausiblen Schli eßen eine groß e Hilfe sein können . Kurz gefasst lauten diese Rege ln :
142
• • • •
9 Über die Anzahl von Sitzordnungen am runde n Tisch
Versteh e das Problem . Suche Zusam menhänge un d ersinne eine n P lan. F ühre den Plan aus . Üb erprüfe die gefunden e Lösu ng.
Das ist ein seh r allgem einer Weg. Aber wie es so ist , ist der Weg das Ziel und ich b egeb e m ich a uf den Weg.
9.3
Verstehe das Problem
9.3.1
Beispiel
Für 3 Männer und 3 Frauen probiere ich einige mög liche Sitzordnungen a us. Einige Beispiele für Sitzordnungen zeigt Abbildung 9.1. Ich stelle schnell fest , dass ich leicht die eine oder a ndere Drehungsmöglichkeit übersehen kann , wenn ich nicht ein sicheres Unterscheidungsmerkmal für die Anordnungen finde . m
In
f
f
Beispi ell
Beispiel 2
f
f
f
f
Beispiel 3
Beispi el 4
Abb. 9.1: Beispiele für Sitzordnungen mit 3 Männern und 3 Frauen
W ir sehen, die Anordnung a us Beispi el 2 kann durch eine Drehung um 60" (im Uh rzeiger sinn) in die Ano rdnung des Beispiels 4 üb erführt werden. Für unser e
143
9.3 Verstehe das Problem
AufgabensteIlung dürfen also nicht alle Anordnungen gezählt werden . Wir dürfen nur die Anordnungen zä hlen, die nicht durch Drehungen deckungsgleich mit ber eits gezählten Anordnungen gemacht werden können .
9.3. 2
Erste, aber falsche lösu ng
Folgender vielleicht naheliegender Gedankengang zur Zählung im vorigen Beispi el ist falsch : Zähle alle Anordnungen von 3 + 3 El ementen und t eile diese An zahl durch 6, denn 6 ist die An zahl der Drehungen (nämlich: 60°, 120", 180°, 240", 300" und 360" oder 0" als identische Abbildung) . Im Fall e m =
f
= 3 ergibt sich so:
- 6!_ . -1 3!·3!
6
20 6
Aber das ist keine ganze Zahl. Etwas stimmt ni cht bzw . so einfach ist es nicht.
9.3.3
Systematisches Probieren
Die Gleichheit von Anordnungen bis a uf Dr ehungen kann als Äquivalen zr elation beschrieb en werden : Zwei Anordnungen a und b sind äquivalent, wenn es eine Drehung gib t , die die eine in die andere überführt. In dieser Äquivalen zrelation ist m m m f f f ein Repräsentant für die Äqui valenzklasse mi t den folgenden 6 Anordnungen:
mmmf f f mmf f f m mf f f mm f f f mmm f f mmmf f mmmf f Diese 6 Anordnungen können durch Dr ehungen aufeinander abgebildet werden . Der Repräsentant m f m f m f repräsentiert 2 Anordnungen (inkl. sich selbst ), nämlich:
mf mf mf f mf mf m
144
9 Über die Anzahl von Sitzord nungen am runden Tisch
Tab. 9.1: Alle Möglich keiten für m =
f
= 3
Äquiva lenzkla sse / Anordnung N r .
R eprä sent a nt
A nzahl versch ie dene r R epräsentanten
1
m m m f f f
2
m m f f m f
3
m m f m f f
6 6 6
4
m f m f m f
2
Durch systematisches Probieren finde ich für m = f = 3 die in der Ta be lle 9.1 a ufgeführten Äquivalenzklassen . Für jede Äquivalenzklasse nennt die Tabelle einen Repräsentanten und die Anz a hl der Repräsentanten in der Klasse. Das sind alle Anordnu ngen mit m = f = 3, den n ent wede r sitzen die drei Frauen zusammen (Anordnung 1) oder Männer un d Frauen sit zen abwechseln d (An ord nu ng 4) oder es sitz en 2 Frauen neben eina nd er und die drit t e sitz t zwisch en Männern . Im let zt eren Fa ll mu ss ma n die Fälle unt erscheid en , dass hint er zwei Frauen ein Ma nn (Anordnung 3) oder zwei Mä nn er (An ord nu ng 2) sit zen . In sgesamt 4 Möglich keiten . Nun versteht man auch , warum die erst e Lösungsidee (Abschnitt 9.3.2) nic ht funktioniert: Die ges uchte Anz a hl ist 4, a ber nicht jed e Klass e ent hält genau 6 An ordnungen.
9.4
Suche Zusammenhänge, ersinne einen Plan und führe ihn aus
9.4.1
Suche im Internet
Bei der Suche im Int ernet sti eß ich auf [191. Dor t war die gleiche Frage gestellt. Die Antwort ent sprach genau meiner falsche n Lösungsidee. Der Fragen de hat t e das auch b em erk t und ein ige Nachfragen gestellt . Schließlich war nur so viel klar : • •
Man kann nic ht die Sitzordnungen a n einem geraden Tisch zählen und durch die Anzahl der Pe rsonen t eilen . Wenn man statt eine r nicht ga nzzahligen Lösung die nächst größ ere ganze Za hl als Lösung vermutet, dann st im mt das zwa r für m = f = 3, ab er nicht allg emein.
Auf m an chen Seit en im Int ernet konnte ich die Frage noc h als Rät sel finden, et wa mit den Zahlen m = f = 3. Prinzip ielles üb er das Lösungsv erfa hren od er eine Formel zur Anzahlb erechn ung wurden da ab er nicht gegeb en .
9.4 Suche Zusamm enhänge, ersinne einen Plan und füh re ihn aus
9.4.2
145
Eine Wertetabelle
Die Anzahl der Anordnungen von m Mä nnern und f Frauen um einen runden Tisch , bei der d ur ch Drehungen aufeinander a bbild bare Anordnung en als gleich angeseh en wer den , b ezeichne ich im Folgen den m it A(m , f) . Für verschi ed en e Wert e von m und f habe ich eine Wertetab elle aufgestellt, vor allem , um meh r üb er das Problem zu lernen . Das Problem ist offensichtlich sy mmetrisch , d . h . A(m , f) = AU, m). Darum kann man die Tab elle lesen , wie man möcht e. Ich selbst halt e es so, in den Zeilen die Anzahl der Männer zu suche n und in den Spalten die Anzahl der Frauen . Tabe lle 9.2 zeigt die Wer t e A( m, f) für alle Gesellschaft en au s bis zu 8 P ersone n . Tab. 9.2: A( m, f)
A (m, J)
0
1
2
3
4
5
6
0
1
1
1
1
1
1
1
7 1
1
1
1
1
1
1
1
1
1
2
1
1
2
3
3
4
3
1
1
2 2
4
5
7
4
1
1
5
10
5
1
1
3 3
6
1
1
4
7
1
1
8
1
8 1
7
Es ist A(5,0) = 1, denn es gibt nur eine Möglichkeit 5 Männer an eine n ru nden Tisch zu set zen. Es ist A(3,3) = 4, wie ob en gezeigt . Die Anzahl A( O, 0) dacht e ich mir a us Gewohnheit als 1, weil es in der Mathem atik i. d . R. eine Möglichkeit gib t, die leer e Menge zu bilden . (Man den ke a n O! .) Die 10 Anord nung en für A(4 ,4) ha ben Repräsen t ant en :
f f f f f f m f f m f f m f f f m f m f m f m m f m f f m
m m m m m m m m m m m m
f
f f m
m m m m m m m m m
f
m m
f m
f
f f m f m f m f m f f f f f f f f f m f
9 Über die Anzahl von Sitzordnungen am runden Tisch
146
Wer möchte, soll die Vollst ändigkeit und Richtigkeit dieser 10 Anordnungen üb er prüfen .
9.4.3
Ein Plan
Durch eigene Bemühungen fand ich kein e schlüss ige Zählweise. Da erinne rte ich mi ch an eine wunderbare Int ernet seit e, nämlich Th e On-Lin e Encyclopedia of In teger S equenc es [20]. Das ist eine Reposit or y mi t Suchmaschine für Int egerFolgen . Ich habe nach der Folge ges ucht. Quadratisch ange ordne te Zahlen wer t e sucht man dort durch Ane inande rre ihung der Werte der Gegendiagon alen . Ich suchte also nach 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 2, 2, 1, 1, 1, 1, 3, 4, 3, 1, 1, 1, 1, 3, 5, 5, 3, 1, 1, 1, 1, 4, 7, 10, 7, 4, 1, 1, 1, 1 und wurde fündig: Die do rt als A047996 [21] verzeichnete Folge passt e genau . Der Name der Folge ist dort
"Tr i angl e of circular binomial coefficients T(n,k), O 0, Vi> 0, n i > 0, i = 1, . . . , r.
•
Die Meng e aller Summ enzerlegungen einer natürlichen Zahl n ist eine Menge , de ren Elemente Multimengen sind. Wir wollen die Anz ahl der Elemente der Menge der Summenzerlegungen von n be stimmen.
Beispiel 10.5 Bei spiel für eine Summenzerlegung der Zahl 9: {(1 ,5) , (1 ,2) , (2,1)} Zu lesen: ,,I-mal 5, I-mal 2, 2-mal 1". Dies ist eine Summen zerl egung der natürlich en Zahl 9, weil 1 ·5 + 1 ·2 + 2 · 1 = 9 ist . Eine a nde re Summen zerl egung der 9 ist {( 1,5) , (2,2)} • Wenn man weiß , was man mein t , dann kann man auch gerne wied er mit weniger form alem Aufwand schreibe n. Die ver schi ed en en Summen zerl egungen der 9 sind: 9 =9 9 = 8 +1 9 =7 +2 9 =7 +1 +1 9 =6 +3 9 = 6 +2 +1 9 =6 +1 +1 +1 9 = 5 +4 9 =5 + 3 +1 usw . Die Fr age , die wir beantworten wollen , lautet also:
Frage 1: Wi e viele verschiede ne Summen zerl egungen gibt es für eine natürliche Zahl n?
162
10.1
10 Summenze rlegungen
Zählen kann doch jeder
Das sagt man so leicht! Es ist aber kein Kinderspiel , die Kombinatorik. Bei der ersten Bekanntschaft mit der Kombinatorik lern t man Permutationen , Kombinationen und Variationen. Dafür werden Formeln gelehrt , die Potenzen, Fakultäten und Binomialkoeffizienten enthalten. Das ist die elementare Kombinatorik. Das hier gestellte Problem kann man damit nicht lösen . Was ist das Ziel der Kombinatorik? Nun , Formeln für An zahlen zu geben, ist die falsch e Antwort . Richtig ist : Ziel der Kombinatorik ist die Lösung von Abzä hl problem en . Alle rdings ist eine Lösung nicht notwendig eine Formel, sondern allg emeiner , eine Lösung ist eine Methode, mit der Ab zählungen vorg enommen werden können. Das ist allgemein ein Algorithmus , denn a uch eine Formel mit Fakultäten ist nic ht s anderes als die komprimierte Fassung eines Algorithmus. Die Kombinatorik ist die Wissenschaft von diesen Methoden , von den Denkweisen und Wegen , auf denen man zu einer Lösung gelangt . Manche glauben , dass Kombinat orik kein wesentliches Feld der Mathematik sei. Meiner Meinung nach ist Kombinatorik eine Methode des mathematischen Den kens , die sich als unsagbar pr oduktiv erwiesen hat und dab ei häufig höc hst intuitive und vom ästhetischen Standpunkt (des Mathematikers ) schöne E rgebnisse hervorbringt - Ergebniss e, die a ußerdem für die Ber echnung m it Computern unmittelbar einsetzbar sind. J ede Beschäftigung mit eine m Abzählproblem b eginnt dam it , die Aufgab ensteIlu ng zu versteh en, nöt igenfalls zu präzisieren un d präzise auszudrücken (sieh e ob en) . Es macht sch ließlich eine n wesentlich en Unterschied , ob man die Reihenfolge der Summand en in eine r Summen zerl egung un t erscheidet od er nicht.
10.2
Äquivalente und verwandte Fragen
Die Fr age 1 ist äquivalent zur Frage 2 (d . h ., wenn man das eine zählen kann, dann kann man a uch das andere zählen) : Frage 2: Auf wie viele verschied ene Weisen lassen sich n nicht unt er scheidbar e
Kugeln in nicht unterscheidbare Behälter vert eilen, so dass kein Behälte r leer bleibt ? Dieses Problem ist wiederum nahe verwandt mi t dem Folgenden: Frage 3: Auf wie viele verschieden e Weisen las sen sich n nicht un t er scheidba-
re Kugeln in k nicht unterscheidbare Behälter verteilen , so dass kein Behälter leer bleibt? Äq uival ent zu Frage 3 ist:
10.3 Die Anzahl de r Summenzerlegungen von n
163
Frage 4: Wi e viele Summenzerl egungen m it genau k El em enten hat eine natürliche Zahl n ? Und eine n aheliegende Variation von Frage 3 ist diese: Frage 5: Auf wie viele verschiedene Weisen lassen sich n nicht unterscheidbare Kugeln in k nicht unterscheidbare Behälter verteilen? (Behälter dürfen also leer bleib en .)
Die Anzahl der Summenzerlegungen von n
10.3
Die Anzahl der Summenzerlegungen einer natürlichen Zahl n wird mit p(n) bezeichnet. Man nennt die p(n) die P artitionszahlen. Dieser Name geht zurück auf Euler [29]. Wir wollen nun unsere Frage 1 a ngehen. Das Angenehme bei den kombinatorischen Problemen ist , dass man zum Warmwerden das P ro blem mi t kleinen Zahlen für n oder k betrachten kann . Nach einigem Probieren und Nachdenken hat man schnell eine kleine Wertetab elle und bereits etwas von der Struktur des Problems begriffen. Bei manchen Proble men findet man nun schnell eine Vermutung für eine Anzahlformel (als geschlossener Ausdruck unter Verwendung von elementaren An zahlbegriffen) . Bei den Summenzerlegungen bzw . numerischen Partitionen ist aber keine geschlossene Formel be kannt . Hier ist eine Wertetabelle (Tabe lle 10.1) für die Anzahl der Sum menz erlegungen p(n) bis n = 29: Tab. 10.1: Wertetabelle für die Anzahl der Summenzerlegungen p(n) für n :::; 29
n 0 1 2
p(n ) 1 1 2
n 10 11 12
3 4
3
13 14 15
5
5 7 11
p(n ) 42 56 77 101 135 176
16
231
17 18
297
8
15 22
9
30
19
6 7
385 490
n 20 21 22 23 24 25 26 27 28 29
p(n) 627 792 1002 1255 1575 1958 2436 3010 3718 4565
Um diese Tabelle so weit und a uch noch weit er zu füllen , muss es eine genügen d einfache Ber echnu ngs met hode geb en . Um unterschied lich e Berechnungsmethoden soll es im Folgend en gehen . Wi r b eginnen mit rekursiven Ans ätzen .
164
10 Summenze rlegungen
10.4
Rekursive Ansätze
Der Grundgedanke für die Su che nach rekursiven Beziehungen ist : Finde geeignete disjunkte Auft eil ungen der zu zä hlende n Gesamtheit und versuche, die Mächtigkeit der Teilmengen zu bestimmen . (Zwei Mengen heißen disjunkt, wenn sie keine gemeinsamen Elemente haben .] Für die Summenzerlegungen bie ten sich zwei mögliche Ansätze an. Gruppier e die Summenzerl egungen
I. 11.
nach ih rem größten Summanden , nach der An zahl der Summanden .
Beide werden zum Ziel führen .
10.4.1
Summenzerlegungen nach GröBe der Summanden
Ich b ezeichne die An zahl der Summenzerl egungen von n , in denen der größte vorkommende Summand gleich m ist , mit b(n,m) . Die Aufteilung der Summenzerlegungen für n nach dem größten vorkommenden Summanden ist disjunkt . In Tabelle 10.2 sind a lle Summenzerlegungen der 7 und der jeweils größte Summand dargestellt. Es ist
p(n) = b(n,l)
+ b(n,2) + ... + b(n, n) .
Weiter muss man nicht gehen , denn b(n, n + 1) , b(n, n führt auf die Fr age nach der Berechnung der b(n, m) .
+ 2)
(10.1 ) usw . sind O. Das
Wi e man sich leicht überzeugt, gelten die Anfangsbedingungen :
= 0, wenn m > n ~ O. b(n,O) = 0 fü r all e n > O. b(n,l) = 1 für a lle n > O. b(O ,O) = 1, allein a us logis chen Erwägungen .
b(n ,m)
'Wenn eine Summenzerlegung einen maxima len Summanden m hat , dann ergibt sich daraus durch Weg lassen dieses Summanden eine Summenzerlegung von n - m , in der der größte vorkommende Summand m' höchstens gleich mist . Hat man zwei verschiedene solche Summenzerlegungen von n , dann erhäl t man nach die sem Verfahren verschiedene Summenzerlegungen von n - m (mit maximalem Element kleiner oder gleich m). Es ist somit
b(n ,m) :::; b(n - m , 1) + ... + b(n - m ,m - 1) + b(n - m ,m) .
(10.2)
165
10.4 Rekursive Ansä tze
Tab. 10.2: Summenzerlegungen der 7 und grö ßter Summ and Größter Summand
Ifd. Nr. 1 2
3 4 5
6 7 8 9 10
11 12
13 14 15
••••••• •••••• ••••• ••••• •••• •••• •••• ••• ••• ••• ••• •• •• ••
•
7
•
••
•
• •• ••
6 5
•
• • • • •• • •• ••
•
•• ••
• •
5 4 4
•
4
3
••
• •
• • •• • • • • • • •
3 3
• • • • • • •
3 2 2 2 1
Umgekehrt: Ausgehend von einer Summenzerlegung von n - m mit maximalem Summanden kleiner od er gleich m bildet man eine Summen zerl egung von n mit maximalem Summanden m, indem man eine n Summanden m hinzufügt. Hat man zwei ver schi ed en e solche Summen zerl egungen von n - m , dann erhält man nach diesem Verfahren verschiedene Summenzerlegungen von n (mit maximalem Element m) . Es gilt :
:s: b(n ,m)
(10.3)
b(n - m , 1) + .. .+ b(n - m ,m - 1) + b(n - m ,m)
(10.4)
b(n - m , 1) + ... + b(n - m ,m - 1) + b(n - m ,m)
Aus (10 .2) und (10.3) folgt Gleichheit: b(n ,m)
=
Dieses erste Ergebnis ermöglicht schon die Ber echnung der b(n , m) mit eine m Computer. Unschön ist hierbei all erdings die variable Länge der Rekursion. Wir b et racht en das Problem nun von einer ander en Seite. Wesentlich ist folgende Übe rle gung: Die Summenzerlegungen von n in Summanden kleiner m kann man disjunkt aufteilen nach der Häufigkeit des Summanden m. Wenn der Summand m genau einma l vorkommt , dann kann man eine Summenzerlegung von n - 1 mit größtem Summanden m - 1 konstruier en , indem man von dem Summanden m eins wegnimmt. Wenn der Summand m aber mehrfach vorkommt, dann ergibt das Streichen dieses Summanden eine Summen zerl egung von n - m , in der der größte vorkommende Summand immer noch mist.
166
10 Summenzerleg ungen
Somit gelangt man zu der Gleichung:
b(n,m)
= b(n - l, m - 1) + b(n - m ,m)
(10. 5)
Gleichung (10 .5) ist das Erkennungsmerkmal vieler Varianten von Summenzerlegungen . Wir werden dieser Identität noch mehrmals begegnen. Anmerkung: Gleichungen wie (10.5) werden a ls DijJerenzengleichungen be zeichnet. Für bestimmte T ypen von Differenzengleichungen sind Verfahren b eka nnt , eine explizite Form der durch die Differenzengleichung und die Anfangswerte implizit gegebenen Funktion zu be stimmen. Diese Verfahren ä hneln oft den Methoden zur Lösung von Different ial gleichungen . Wa s für stetige Funktionen die Differentialgleichungen, sind in der Kombi nat orik die Differenzengleichungen! Und genau wie nich t jede Differentia lgleichung eine explizit b ekannt e Lösung ha t , ist es auch hier : F ür die Differenzengleichung (10.5) ist keine explizite Form der Lös ung b ekan nt .
10.4.2
Summenzerlegungen nach Anzahl der Summanden
Ich verwende weiter die Bezeich nung p( n) für die An za hl der Summenzerlegungen und b ezeichne die An zahl der Summenzerlegungen von n in genau k Summanden mit a(n , k). Tab. 10.3: Summenzerlegungen der 7 und Anzahl der Summanden Ifd. Nr.
Anzahl Summanden
1 2
•••••••
3 4
••••• •••••
5
6 7 8 9 10
11 12 13 14 15
•••••• •••• •••• •••• ••• ••• ••• ••• •• •• ••
•
1
•
••
•
• •• ••
2 2
•
• • • • •• • •• ••
•
•• ••
• •
2 3 3 3
•
3 4 4
••
• •
• • •• • • • • • • •
•
4
• • • • • •
6 7
5 5
Die Auft eilung der Summen zerl egungen für n nach der An zahl der Summanden ist disjunkt .
167
10.4 Rekursive Ansätze
In Tabelle 10.3 sind alle Summen zerl egungen der 7 und jeweils die Anz ahl der Summanden dar gest ellt . Es gilt: p(n)
=
a(n ,l ) + a(n ,2)
+ ... + a(n ,n)
(10.6)
Mit der Erfahru ng au s dem vori gen Abs chnitt wag e ich sogleich folgenden Ansatz : Die Summen zerl egungen von n in genau k Summanden kann man di sjunkt a uft eilen nach dem klein st en Summa nd en . Der klein st e Summand ist ent wede r eine 1, oder er ist größer als 1. Wenn der kleinste Summand größer als 1 ist , dann kann man von jedem Summanden eins wegn ehmen und es ergibt sich eine Summen zerl egung von n - k mi t genau k Summanden . 'Wenn der klein st e Summand 1 ist , dann kann man eine n Summanden 1 weglassen und es verbleibt eine Summen zerl egung von n - 1 in k - 1 Summanden . Das bed eutet: a(n , k) = a(n - 1, k - 1) + a(n - k , k)
(10.7)
Für die Berechnung de r a(n , k) nach Beziehung (10.7) benötig en wir die Anfangswer te : a(O,O) = l.
o.
a(n ,O)
0 für n >
a(n ,l)
1 für n > O.
a(n , k) = 0, wenn k
>n
~
o.
Es ist st ets a(n , k) = b(n , k) , denn die Rekursion en (10.5) und (10.7) sind gleich und die Anfangswerte ebe nfalls. E ine Tabelle der a(n , k) ist zugleich eine Tabelle der b(n ,m) (Tabelle 10.3): Tab. 10.4: Tabelle der a(n , k) bzw. b(n, m ) k (m)
n 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 3 1 1 2 3 4 5 7 8 10 12 14 16 19 21 24 27 4 1 1 2 3 5 6 9 11 15 18 23 27 34 39 47 5 1 1 2 3 5 7 10 13 18 23 30 37 47 57 6 1 1 2 3 5 7 11 14 20 26 35 44 58 7 1 1 2 3 5 7 11 15 21 28 38 49 8 1 1 2 3 5 7 11 15 22 29 40 9 1 1 2 3 5 7 11 15 22 30 10 1 1 2 3 5 7 11 15 22
Mit (10.1) und (10.5) bzw. (10.7) lassen sich die p(n) ber echnen .
19 20 1 9 30 54 70 71
65 52 41 30
1 10 33 64 84 90 82 70 54 42
168
10 Summenzerlegungen
10.5
Dualität
Die Beziehung a(n , k) = b( n , k) signalisiert eine Dualität der beiden Probleme. Es gibt einen einfachen und a nschaulichen Weg , die zueinander dua len Summenzerlegungen gemäß I. oder 11. (aus Abschnitt 10.4) zu bestimmen. Ab bi ldung 10.1 zeigt eine Summenzerlegung der 7 im sog . Ferrers -Diaqramm. Die Zerlegung 7 = 4 + 2 + 1 wurde in den Zeilen eingetragen. Dreht man das Diagramm um 90' od er liest die Anzahl der gefü llten Kästchen in den Spalten, dann erhä lt m an 7 = 3 + 2 + 1 + 1. 4 2
1 3
2
1
Abb. 10.1: Ferrers-Diagramm zu r Verdeutlichung der Dualität der Probleme I und 11
Die eine Zerlegung hat das maxima le Element 4 und die andere hat 4 Summanden . Zwei Summen zerl egungen, die durch diese Oper at ion aus einander hervo rgehen, nennt man konjugiert. Summenzerlegungen sind eelbetkonjuqiert, wenn das Konjugierte einer Summenzerlegung mit der Summenzerlegung übereinstimmt. Mit Hilfe der Duali t ä t lässt sich die Anza hl der "Summenzerlegungen in lauter verschiedene ungerade Summanden" a ngeben . Sie ist nämlich gleich der An za hl der selbstkonjugierten Summenzerlegungen. Man ka nn nämlich eine Bijektion zwischen beiden herstellen , die a uf der in Abbildung 10 .2 gezeigt en Idee beruht. 4
7
2
1
1 1
Abb. 10.2: Aus dem Ferrers-Diagramm einer selbstkonjugierten Summenzerlegung von
n = 8 entsteht eine Summenzerlegung mit verschiedenen ungeraden Summanden.
Ge zeigt werden Ferrers-Diagramme einer selbstkonjugierten Summenzerleg ung von n = 8 und einer Summenzerlegung von 8 in vers chiedene ungerade Summanden. Das rechte Diagra mm entsteht a us dem link en , indem man die Käst chen
169
10.6 Leere Behälter
aus Zeilen und Spalten mit eine m gem ein samen Diagon alfeld in Zeilen a nordne t. Das linke Diagramm ents teht aus dem rechten , indem man die Zeilen 'ze nt riert' und dann ent la ng der Mittellinie zum rechten 'W inkel 'knickt'. E rwähne n möchte ich auch asymptotische Formeln für die An zahl der Summen zerl egungen p(n) und die An zahl P( n) der Summen zerl egungen in lauter ver schi ed en e Summanden:
Sie stammen von Hardy und Ramanujan [31] und sind Beispi ele für viele b eachtliche und zugleich ungeheure E rgebnisse, die der geniale indische Mathem atiker Srinivasa Ramanuj an (1887-1920) gefunden hat. In [30] find et sich der Beweis.
" A symptotis che Formel" bed eutet, dass für wach sende n die prozentuale Abw eichung der Nähe ru ng vom tatsächlichen Wert gegen 0 geht. So ist z. B . p(lO) = 42 und die Nähe ru ng ergibt 48,1. Es ist p(lOO) = 190569292 und die Näherung liefert 199280893 .
10.6
Leere Behälter
Die bish erigen Üb erl egungen ga lte n Summen zerl egungen mit po sitiven Summanden . Nun noch ein Blick auf Zerl egungen in nichtnegative Summanden . Zur genauen Unte rsche idung nenne ich diese Surnmen zerlegungen" . Nun macht es keinen Sinn, nach de r Anz ahl der Sumrnenzerlegungen" einer natürlichen Zahl n zu fragen , denn schließlich kann m an durch Hinzufügen von weiteren Nu llen beliebig viele a ndere Summenzerlegungen" erzeugen . Ich will a b er die Anzahl de r Sumrnenzerlegungen" betrachten , die eine natürliche Zahl n in gen au k ni chtnegative Summanden zerlegt . Die se Anzahl nenne ich c(n, k) . Es ist
c(n , k) = a(n
+ k , k) ,
(10.8)
denn a us einer Sumrnenzerlegung" von n mi t k nicht negativen Summanden wird eine Summenzerlegung von n + k mi t k po sitiven Summanden, wenn man zu jedem Summanden 1 addiert und vice ver sa . Unmit telba r haben wir damit die Rekursion :
c(n, k) = c(n, k - 1) + c(n - k , k)
(10.9)
170
10 Summen zerlegungen
Diese Bezi ehung lässt sich nach dem ob en schon vorgeführten Muster auch direkt zeigen: Eine Sumrnenzerlegung" von n in k Summanden enthält eine Null oder enthält keine Null . Die Anzahl der Sumrnenzerlegungen" von n ohne eine Null ist gleich der Anzahl der Sumrnenzerlegungen" von n - k in k Summanden. Die Anzahl der Sumrnenzerlegungen" mit einer Null ist gleich der Anzahl der Sumrnenzerlegungen" von n in k - 1 Summanden . Die Anfangswerte für c( n , k) sind:
c(O ,k) = 1
(k
c(n,O) = 0
(n > 0)
c(l, k) = 1
(k > 0)
c(n ,l) = 1
(n > 0)
~
0)
Die erst en Werte für c(n , k) zeigt Tabelle 10.5. Tab. 10.5: Tabelle c(n,k) k
n 0 1 2 3 4 5
0
1
2
3
4
5
6
7
8
1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1 1 1 1 1 1
2 2 3 3 4 4
2 3 4 5 7 8 10
2 3 4 6 9 11 14
2 3 4 7 10 13 17
3 3 4 7 11 14 19
3 3 4 7 11 15 20
3 3 4 7 11 15 21
6 7 8
5
Aus jed er Summen zerl egung von n in weniger als k Summanden erhält man eine Summen zerlegung" von n in k Summanden, indem man die erforde rliche An zahl Nullen hinzufügt . Darum gilt
k
c(n, k) =
L a(n , i).
(10 .10)
i= l
Mit (10 .8) wird daraus k
c(n, k) =
L c(n -
i, i) .
(10 .11)
i= l
Interessanter ist nun , dass man a uch mit den c(n , k) die p(n) berechnen kann . Es gilt:
p(m) =
L n +k =m
c(n, k)
(10 .12)
171
10.7 Erzeugende Funktionen Beweis : Zur Übung überlassen .
Das b ed eutet: Die Summe der m-ten Gegendiagonalen in der Tabelle der c(n, k) (Tabelle 10.5) ist gleich der An zahl der Summenzerl egungen von m . Die Beziehung (10.8) zwische n den a(n , k) und den c(n, k) ist aufschlussreich , denn sie zeigt , wie m an et wa die Frage nach den Summenzerlegungerr' angehen kann . Mit Summenzer legung' meine ich Zerlegungen von n in Summanden, die all e mindestens 2 sind. Im nächsten Abschnitt werde ich über die erzeugenden Funktionen für die Summenzerlegungen berichten und erklären , welche zusätzlichen Aufschlüsse man durch erzeugende Funktionen über die Struktur des Problems erhält . Wer mag , kann sich vor ab selbst mit folgender Frage beschäftigen: Frage 6: Wi e viele Möglichkeiten gibt es, eine n Betrag von 1 Euro in Münzen
zu zahlen ?
10.7
Erzeugende Funktionen
D efin it io n 1 0 .6 (Erzeugende Funkt io n ) Als erzeugende Funktion eine r reellen Zahlenfolge an be zeichnet man die formale Potenzreih e 00
2..::: a n x n
(10 .13)
n =O
bzw . die durch diese Reihe in ihrem Konvergenzintervall dargestellte Funktion (falls Konvergenzradius r > 0). •
Wir wollen nun die erzeugende Funktion der p( n) und einiger a nderer Folgen bestimmen und sehen , was wir davon haben.
Sat z 1 0 .7 Die erzeugende Funktion der Anzahl der Summenzerlegungen p(n) lautet: 00
TI 1 -
i=O
1 xi
(10.14)
172
10 Summenzerlegungen
Der Herkunft, Relevanz und Nützlichkeit dieses Ergebnisses werden wir nun nachgeh en . Beim Um gang mit Poten zreih en ist es zweckmäßig, die alg ebraischen Rech enregeln von Konv erg en zfragen zu trennen . Für zwei form ale Poten zreih en
2:: 00
P :=
n
anx
und
n =O 00
definiert man eine Addition und eine Mul tiplikation: P
+ Q :=
2:: 00
(a n n=O
2::
+ bn) x n
(10.15)
2::
00
p . Q :=
c nx
n
mit
Cn
n=O
=
a ibj
(10.16)
i+j=n
Die derart defini erte Addition und die Multiplikation st imme n im Fall e konv ergenter Poten zr eih en mit den dort beweisbaren Rech enregeln üb er ein . Eine formale Poten zreih e ist eine Schreibw eise, die man ohne Rücksicht auf mögliche Konvergen z verw endet. Die formalen Poten zreih en sind nicht mehr als eine Wäscheleine, an der die Folgenglieder aufgehängt , platziert werden. In formalen Potenzreihen wird niemals ein x eingesetzt . In der form alen Potenzreihe der Folge p(n) ist der Koeffizient der n-ten Potenz der Unbestimmten x das Folgenglied p(n), d .h., der Platz von p(n) ist bei z ".
10.7.1
Die Brücke
Um eine Brücke zum Verständnis der erze ugende n Funktionen zu bauen , b etrachte ich für ein fest es m die Folge
g( n , m) := An zahl der Summen zerl egungen von n in Summanden gleich m. Für m = 1 ist für alle n g(n ,I) = 1, denn ist nur der Summand 1 erla ubt , so gibt es nur eine Möglichkeit die Zahl n als Summe (von Einse n ) darzu st ellen . Die Poten zr eih e
2:: g(n ,l)x 00
P :=
n=O
2:: x 00
n
=
n
n =O
ist für lxi< 1 konv ergent und ste llt die Funktion l~ X dar. (Hinweis: L: ~=o x n ist eine geome t rische Reih e, deren Konvergen zverhalten und Gren zwert l~ X bekannt sind. )
10.7 Erzeugende Funktionen
173
g(n ,l) hat som it die erzeugende Funktion _ 1_ . I - x
Für m = 2 ist g(n ,2) = 0 für un ger ade n und g(n ,2) = 1 für gerade n , denn es gibt kein e Möglichkeit , eine un gerade Zahl als Summe von Zweien dar zust ellen , und es gibt genau eine Möglichkeit , eine ger ade Zahl als Summe von Zweien zu schre ibe n. Die P otenzreihe
L
CXJ
P :=
n=ü
ist für
lxi
0: >0:
2
45 45 ~ 43 >0: 45
)( 0
>0: 57 62 71 )( 6 >0: 50 9 32 44 25 X 44 >0: 14 >0: :;W::;W::ßQ:;W: )( :;w: 15 15 15 >0: 10 ';J( 11 >0: >0: >0: >0: >0: >0: >0: >0: >0: >0: >0: >0: >0: >0: 3
60 60
Das kleinste unbedeckte Element ist
w=
W26
= 1.
Graphenth eoret ischer Algorith mus
193
Durch Subtraktion der 1 von allen unbedeckten Zeilen und Addition zu allen bedeckten Spalten erhält man eine neu e Matrix:
32
1
44 44 32 42
0
44
59
2
59 59 21
0
0
56
10
8
61 70 71
,5
0
49
43 31 43 24 24 43
0
13
43 43 31 43 10 43
1,5
0
1
14 14 14
0
9
7
10
0
0
0
0
1
0
1
0
0
0
0
0
1
0
1
0
Im nächsten Schrit t kann man nun zusätzlich die zweite Zeile oder die sechste Spalte a b decken. Anders gesagt, man hat nun schon eine O-Diagonale der Länge 6 innerhalb der Matrix. Man kommt nach zwei weiteren It erationen zum Ziel, falls man die Spalten 2, 5 un d 6 und die Zeilen 6, 7 und 8 abdeckt und w = W 31 = 10 wählt . Im let zten Schritt lass en sich die Spalt en 1, 2, 5, 6, 7 und die Zeilen 7 un d 8 abdecken und w = W48 = 3 wäh len . Man erhäl t :
@
31
0
43
,5
0
36
33 31 30 11 14 43
@
5
@
0
30 30 21 43
10
30
1
24
17
7
3
13
@
19
4
13 14
0
3
13
0
4
13 14
0
22
1
31 31 22 42
49
2
46 46 11
@
8
48 57 61
@
11 11 0
@
@
Das Problem ist gelöst , und wir geb en hie rmit folgende Vermählungen bekannt : Edith und Bernd (60 Punkte) Moni und Fred (43 Punkte) Ut a und Hugo (15 Punkte) Brit und Kar! (59 Punkte) Anna und O tto (45 Punkte) Fr anzi und Peter (30 Punkte) Die Gesamtpunktzahl b eträgt 252. Ha ns un d Horst geh en leider leer aus . Sie werden J unggesellen bleib en .
194
12.4.3
Das Heirat sproblem
Der graphentheoretische Algorithmus kurz und knapp
Gegeben sei eine n x n-M atrix der Gewichte
W ij E
No.
Erstens
Subtrahiere für i = 1, . . . , n von allen Elemente n der i-t en Zeile das kleinste Elemen t P i = min(j , W i j ) dieser Zeile . Subtrahiere für j = 1, . . . , n von allen E lement en de r j-ten Sp al te das kleinste Element qj = min (i , W ij ) dieser Sp al te.
Zweitens
Su che eine minimale Üb erdeckung der Nu llen, das ist eine Ausw ahl der Zeilen und Spalten , so dass alle Nullen der Matrix darin ent halte n sind. Hat die Üb erdeckung weniger als n Zeilen und Sp alten, gehe zu Dritten s, sons t zu Viert en s.
D rittens
Sei 11) der klein st e unbed eckte Eint rag. Subtrahier e 11) von allen unbedeckten Einträg en , addiere 11) zu Einträgen , die von eine r Zeile und eine r Spalte bed eckt werden . Geh e zu Zweitens .
Viertens
Bestimme O-Diagon ale der Länge n .
12.5
Lösungsweg mit linearer Optimierung
12 .5 .1
Ein schönerer Lösungsweg?
Schönheit ist rela t iv. Vie lleicht ist dieser Lösu ngsweg nicht schöner, a be r es ist inter essant und für den einen od er a nde ren sogar übe rrasche nd , dass es üb erhaupt so funkti oni ert . Un ser Hei ratsproblem ist op t im ierungst echnisch gesehen ein Maximie rungsproblem. W ir mö chte n schließlich das Gl ück des Dorfes maximieren . Vielleicht geling t es uns ja, das Ganze als 0815-0ptimierungsaufgabe darzust ellen, d . h. eine schön e Zielfunkti on , ein paar nette Neb enbedingungen , alles möglichst lin ear. Wenn uns das gelingt , haben wir die Hilfsmittel der linearen Optimierung zur Verfügung , um das Problem zu lösen . Und es geht tatsächli ch , ist sogar recht unkompliziert, wie wir im Folgenden sehe n werden .
12 .5.2
Ansatz mit linearer Optimierung
Die übli che Form einer linear en Optimi erungsaufgab e (LP ) lautet: max w T x
(LP)
x
A x ::; b,
x ~ 0
195
12.5 Lösungsweg mit linearer Optimierung
W ir werde n unser e Aufgaben st ellung nun als solches (LP) formulier en und erklären dafür , wie A, bund w sich a us dem Problem heraus ergebe n . Das so formulierte (LP) können wir dann mi t dem a us der Optimierung bekannten Sim plexalgorit hm us lösen . Wir stellen uns vor , wir hab en a lle Kanten des biparti ten Graphen , der a us der Koschwi hervor geh t , von 1 bis m nummeri ert. Das heißt, jed e potentiell denkbar e E heschließung b ekommt eine Num me r zwische n 1 und m . x ist nun ein m-dimen sionale r Vekt or , de ssen Komponenten nur die Werte oder 1 annehmen sollen , a lso x E {O,l}In. Der Wert wird a ngenom me n, wenn wir die entsprechende Kante nicht in unser Ma tehing aufnehmen , der Wer t 1, wenn dieses P aa r den Segen der Kos chwi erhäl t.
°
°
Mom ent , das geh t doch nicht! Wir sch ränken unsere zul ässigen Lösungen von vornherein nur a uf ganzzahlige Werte ein . Das ist etwas, was der Simplex algorithmus nicht ver sp richt . Wir können uns zwar wünschen , dass unsere Optimallö sung ganzzahlig sein soll, ab er der Simplexalgorithmus liefert uns i. A . irgendeine reelle, nicht notwendig ganzzahlige Lösung. Das Optimum unter den ganzzah ligen zulässigen Lösungen zu find en , könnte darum schwieriger sein und nicht so billig, wie wir es uns er hofft haben . Ver schi eb en wir dieses Problem auf sp äter. Ich versprech e (und das ist das Übe rraschende an diesem Weg) , alle s wir d sich in Wohlgefallen auflösen. Modellieren wir also weiter.
12.5.3
Formulierung der konkreten linearen Optimierungsaufgabe
Der Vektor w E IRIn ver sammelt die Kantengewi chte, d . h . die Punktzahlen , die die Koschwi vergeben hat . Die oben geforderten E igensc haft en unseres Lösungsvektors x vorausgesetzt , be schreibt die Zielfunktion das Gewicht de s Matchings - eben die Summe der Gewichte der Kanten , die das Matehing bilden. Angenommen unser bipartiter Graph be steht a us n Knoten, d . h ., wir haben n Unverheiratet e im Dorf. Die n x m- Matrix Knoten i gehört zu Kante j son st heißt Knot en-Kanten-Inzidenzmatrix des Graphen . Dabei geh en wir davon aus , dass wied erum all e Knoten von 1 bi s n durchnummeri ert sind. Übe rle gen wir uns, was passiert , wenn wir nun A und x multiplizier en . Es wird ein n-elementiger Sp al tenvektor en ts tehen. Bei spielsweise ist das erste E lem ent die ses Vektors das Produkt a us er st er Zeile de r Matrix A und dem
196
Das Heiratsproblem
Vektor x . Die erste Zeile von A "gehört" zum ersten Knoten , dies e Zeile besteht aus Einsen und Nullen , je nachdem ob der erste Knoten zur ent spreche nde n Kante gehört od er nicht . Machen wir ein einfaches Beispiel für das Produkt ein er Matrixzeile mit dem Vektor x :
1
(1
0 1 0) .
1 0
= 1+ 0+ 0+ 0= 1
0 Wir erhalten einen Summanden 1, falls der Knoten zur akt uellen Kante gehört und die Kante ins Mate hing aufgenommen wird ; eine Null erhält man in allen ander en Fällen , d . h ., falls die Kante au sgewählt wird , ab er der Knoten gar nicht zur aktuellen Kante gehört, od er falls zwar der Knoten zur Kante gehört , ab er diese Kante kommt nicht in s Matching, od er falls die Kante nicht ausgewählt wird und der Knoten ihr au ch nicht angehört. Da wir ein Matehing su chen , heißt das ab er au ch, dass unser Produkt aus Matrixzeile und x-Vektor nur 0 od er 1 ergebe n darf. Ist das Ergebnis größer , b efind en sich mehrer e Kanten in der Au swahl, die von ein und demselb en Knoten a usgehen, damit liegt a ber kein Matehing mehr vor . Folglich ist b ein Vektor, der komplett a us Einsen besteht. Damit sind alle Komponenten des linearen Programms erklä rt. Die Neb enbedingungen ste llen sich er , dass ein Matehing vorli egt, falls x a ußerde m ganzzahlig ist ; die Zielfunktion beschreibt das zu maximierende Gewicht des Matchings.
Das lin eare Optimierungsproblem (LPH) zur Bestimmung eines gewichtsmaximalen Matchings für das Heiratsproblem lautet: max w T x x
Ax
:s;
(LPH)
e
x ~o
Es ist A die Knot en-Kanten-Inzidenzmatrix des bipartiten Graphen C, der n Knoten und m Kanten hat , welch e jeweils von 1, ... , n bzw. 1, ... , m nummeri ert sind . w ist der Vektor der m Kantengewichte. e ist ein Vektor der genau n Einsen ent hält .
Es bleibt die Frage, warum die Simplexmethode nur ganzzahlige Lösungen für die Optimierungsaufgabe (LP H) erzeugt .
197
12.5 Lösungsweg mit linearer Optimierung
Das ist ni cht sofort einz usehe n, hängt ab er damit zusam me n , dass die Knoten Kanten-Inzid en zm atrix eines bipartiten Graphen eine sehr spez ielle Struktur hat . Wir mü ssen dazu etwas weiter au shol en .
12.5.4
Ganzzahlige Lösungen
Unimodularität
D e fin it io n 12.1 (unimodular) Eine Matrix A E Z m x n mit vollem Zeilenrang heißt unimodular , fall s die Determinante jeder a us m linear un abhän gigen Sp al ten be stehenden Submat rix be tragsm äßig glei ch 1 ist . •
Anmerkung: Unimodula r wird oft nur für qu adrati sche Matrizen de finie rt , so z. B. in Schrij ver [40]. Hier erfolgt die Definition für m x n-Matrizen.
Satz 12 .2 Sei A E Z m x m regulär. Dann ist A - 1 b für alle b E Z m ganzzahlig gen au dann , wenn A unimodular ist .
B eweis:
,,::::}": Zu zeigen ist , dass die Determinante von A b etragsm äßi g 1 ist.
Sei e; ein m -dimensionaler Vektor , de ssen i-te Komponente 1, alle anderen Komponenten 0 sind. A - lei liefer t die i-te Sp al te von A - I und ist laut Voraussetzung ganzzahlig, som it ist A - I eine ganzzahlige Matrix. Des Weiter en gilt 1 = det I = det A -det A - 1 . Da die Determinanten ganzzahliger Matrizen ganzzahlig sind , mu ss die Det erminante von A (und a uch die von A - I ) betragsmäßig 1 sein . ,,~" :
Die Cramer sche Regel liefert sofort die Ganzzahligkeit .
Satz 12.3 A E Zm x n habe vollen Zeilenrang und es sei b E Z m . Alle zulässigen Ba sislösung en von {x ?: 0 : A x dann , wenn A unim odular ist .
= b} sind ganzzahlig gen au
o
198
Das Heiratsproblem ,,=?" : Wir mü ssen zeigen , dass A unimodular ist.
Beweis:
Sei B eine beliebige Basis von A , dann genügt es wegen Satz 12.2 zu zeigen , dass AB - 1 b für a lle ga nzz ahligen b ganzzahlig ist . Dabei ist AB die quadratische Matrix, die au s den Spalten , die in B sind, b est eh t. Sei a lso
s « zm. Wir wählen c E zm so , dass c +
Dann ist
b=
A B(c + (A B) -lb)
=
(A B ) - l b ?: O.
A BC + b E Zm .
Setzen wir XB := c + (A B) -lb und XN = 0, dann ist ii: = (XB , XN ) zulässige Basislösung von { x ?: 0 : A x = b}. Also ist
x nach
Vorau ssetzung ganzzahlig und damit auc h (A B) -lb
x eine mi t x =
=
XB -
C.
,,{=": Ist A unimodular , b E Z m und
zul äs sige Basislösung von {x ?: 0 :
A x = b} , dann gibt es ein e Basis B
(XB , XN ) = ( (A B) -lb ,O).
Nach Sa tz 12.2 ist XB ganzzahlig. Daraus folgt
xE
Zn .
o
Wir haben nachgewiesen , dass, falls A unimodular ist, die Basislösungen de s Systems A x = b für ganzzahlige b ganzzahlig sind . Das ist ja schon etwas. Es gib t aber noch zwei klein e Haken . Zum einen wissen wir noch nicht , ob unsere Knoten-Kanten-Inzidenzmatrix irgendetw as mit Unimodularität zu tun hat , zum a ndere n t reten in unser em Matehing-Problern al s Ne be nbe dingunge n keine Gleichungen , sonde rn Ung leichungen auf. Wenden wir uns dem zwei ten Haken zuerst zu .
Schlupfvariablen De r Simplexalgorithmus verl angt Gleichungsnebenbedingungen oder einfache Ungleichungsbedingungen in Form von Vorzeichenbesch ränkungen der Variablen. Au s allgemeinen Ungleichungen werden Gleichungen durch Einführen von Schlupfvariablen s. Au s A x
~
b entsteht a lso ein neues System
mit der Vorzeichenbeschränkung s ?: O.
199
12.5 Lösungsweg mit linearer Optimierung
Totale Unimodularität Na ch Satz 12.3 muss (A ,1) unimodular sein, damit die ses System nur ganzzahlige Basislösungen hat. Wa s bedeutet nun die Unimodularität der erweiterten Matrix (A ,1)7 Mit Hilfe des Laplaceschen Entwicklungssatzes kann man leicht zeigen , dass die Determinante jeder qu adratischen Untermatrix von A, gleich welch er Dimen sion , den Wert 0, 1 od er - 1 haben mu ss. Das ist offensichtlich eine stärker e Forderung und Anlass für eine weit ere Defin ition.
D efin it io n 12.4 (total unimodular) Eine Matrix A E Z m x n heißt total unimodular , wenn jede quadratische Untermatrix die Determinante 0, 1 oder - 1 hat . •
Eine leicht einzusehe nde Folgerung ist, dass eine total unimodulare Matrix A E {0,1, _ l }m x n sein muss . Des Weiteren gilt auch: A ist total uni modular genau dann , wenn (A, 1) uni modular ist . Diese Folgerung unter Verwendung des Entwicklungssatzes und mi t Induktion zu bewiesen, wird dem Leser überlassen . J etzt kommt der Knackpunkt Nummer 1:
Satz 12.5 (Satz von Hoffman und Kruskal) Sei A E Z m x n total unimodular und b E Z m. Dann sind alle (optimalen) Basislösungen von max c'» unter den Nebenbedingungen Ax ::; b, x ~ x ganzzahlig.
°
~b
Beweis:
Die Neb enbedingungen sind äquivalent zu (A , I). ( :)
mit x , s
0. (A , I) ist aufgrund der vorangegangen en Bem erkungen unimodular.
~
Wegen Satz 12.3 sind die Basislösungen des neu en Optimierungsproblem s mit den Variablen x und s ganzzahlig, und der x-Anteil ist optimal für das Ausgangsproblem . D Wir sind fast fertig . Uns fehlt noch ein einfacher Weg , um herauszufinden, ob unsere Inzidenzmatrix total unimodular ist. Es ist nämlich unpraktisch, für eine Matrix die Determinanten aller qu adratischen Submatrizen nachzuprüfen . Abhilfe schafft folgender Satz , der hier unbewiesen bleiben soll.
200
Das Heiratsproblem
Satz 12.6 (Satz von Heller und Tompkins) Sei A E {O,1, - 1}mX n mit höchst ens zwei von Null verschieden en Einträgen pro Spalt e.
A ist genau dann total unimodular. wenn sich die Zeilen von A in zwei Kla ssen einteilen lassen, so dass zwei Zeilen, die in einer Spalt e beide eine +1 oder beide eine - 1 haben, zur gleichen Kla sse gehören und zwei Zeilen, von denen die eine in einer Spalt e eine +1 und die and ere in der' gleichen Spalt e eine - 1 hat, zu versc hiedenen Kla ssen gehören,
Man üb er zeugt sich leicht , das s unsere Inzidenzma trix die se Bedingung erfüllt . Die Spalten de r Ma t rix sym bolisier en j eweils eine Kante . An gen au zwei Stellen jeder Sp al te steht eine 1, sonst Nullen. Alle Zeilen lassen sich a lso in die er ste Klasse einordnen.
12.6
Zurück ins Dorf
Wenden wir die ses Verfahren auf unser Beispieldorf a n. Wir nummerieren zunächst die Knoten (=die Unverheirateten) von 1 bis 14 und die Kanten (=potentielle P aarungen) von 1 bi s 30 (wie in Tabelle 12.3) :
Tab. 12.3: Präferenzentabelle mit Nummerierung der ' Knoten' und ' Kanten'
Anna
Bernd
Fred
Hans
Horst
Hugo
Kar!
OUo
Pet er
7
8
9
10
11
12
13
14
12
43
-
-
13
2
45
-
3
4
5
-
-
39
59
60
3
7
8
9
10
-
-
65
71
21
14
15
16
-
44
30
20
21
34
-
1
1
2
Brit
-
57
2
6
Edith
60
62
9
3
11
12
13
-
12
-
Franzi
17
4
Moni
28
43
5
22
23
Uta
13
-
6
26
-
19
20
18
19
-
13
-
25
24 -
-
15
5
8
4
27
28
29
30
Damit erg ibt sich die folgende ganz au sführlich a ufgesc hriebe ne Gest alt für das lin eare Programm:
201
12.6 Zurück ins Dorf
+ 43x 2 + 13 x 3 + 2X4 + 45 x5 + .57x 6 + 39x 7 + 59x8 + 60 X9 + 3X lO + 60xl1 + 62x12 + 9X13 + 6 5x14 + 71 x1 5 + 21 x16 + 12x17 + 19x18 + 20X19 + 44 x2 0 + 30 X21 + 28 x 22 + 43x23 + 13x 24 + 34x25 + 13x26 + 1.5X27 + 5X28 + 8X29 + 4 X30
max 12 x l
1 0 0 0 0 0 1 0 0 0 0 0 0 0
1 0 0 0 0 0 0 1 0 0 0 0 0 0
1 0 0 0 0 0 0 0 0 0 1 0 0 0
1 0 0 0 0 0 0 0 0 0 0 1 0 0
1 0 0 0 0 0 0 0 0 0 0 0 1 0
0 1 0 0 0 0 0 1 0 0 0 0 0 0
0 1 0 0 0 0 0 0 0 0 1 0 0 0
0 1 0 0 0 0 0 0 0 0 0 1 0 0
0 1 0 0 0 0 0 0 0 0 0 0 1 0
0 1 0 0 0 0 0 0 0 0 0 0 0 1
0 0 1 0 0 0 1 0 0 0 0 0 0 0
0 0 1 0 0 0 0 1 0 0 0 0 0 0
0 0 1 0 0 0 0 0 1 0 0 0 0 0
0 0 1 0 0 0 0 0 0 0 0 1 0 0
0 0 1 0 0 0 0 0 0 0 0 0 1 0
0 0 1 0 0 0 0 0 0 0 0 0 0 1
0 0 0 1 0 0 0 1 0 0 0 0 0 0
0 0 0 1 0 0 0 0 0 1 0 0 0 0
0 0 0 1 0 0 0 0 0 0 1 0 0 0
0 0 0 1 0 0 0 0 0 0 0 0 1 0
0 0 0 1 0 0 0 0 0 0 0 0 0 1
0 0 0 0 1 0 1 0 0 0 0 0 0 0
0 0 0 0 1 0 0 1 0 0 0 0 0 0
0 0 0 0 1 0 0 0 0 0 1 0 0 0
0 0 0 0 1 0 0 0 0 0 0 0 1 0
0 0 0 0 0 1 1 0 0 0 0 0 0 0
0 0 0 0 0 1 0 0 0 0 1 0 0 0
0 0 0 0 0 1 0 0 0 0 0 1 0 0
0 0 0 0 0 1 0 0 0 0 0 0 1 0
0 0 0 0 0 1 0 0 0 0 0 0 0 1
·x :::; e
x ?: O Dieses lineare Problem ist nun also mittels Simplexmethod e zu lösen . Wer schon einmal die Simplexmethode von Hand ger echnet hat , wird zusam me nz uc ken : Das sieht nach einer verdammt mühsamen und langwierigen Re chnung aus. Aber a uch h ier gibt es E nt warnung . Die Uni modularität der Systemmatrix bewirk t , dass alle s immer schön ga nzzahlig bleibt . Und die vielen Nu llen in de r Mat rix sor gen a ußerdem dafür , dass in jeder Iteration nur ganz wenige Zeilen neu b ere chnet wer den mü ssen. Nichtsde stotrotz , die K oschwi wartet ungeduldig auf die Best ä tigung der mi t de r ersten Method e gefundenen Lösung. Desh alb sollten viellei cht doch lieber ein Computer und geeignete Software zum Eins atz kommen . Mit welch en Mit te ln a uch immer , der Simplexalgorithmus liefert die einde ut ig bestimmte optimale Lösung:
x =( 0
0
0
0
1
0
0
1
0
0
1
0
0
0
0
0
0
0
0
0
1
0
1
0
0
0
1
0
0
0)
Die zur Erzeugung der Normalform eingefüg ten Schlupfvariablen haben im Op timum die Werte: s
=( 0
0
0
0
0
0
0
0
1
1
0
0
0
0 )
Der optimale Wert der Zielfunktion ist 252. Die beid en positiven Schlupfvariablen gehören zu den zu Hans und Horst geh örenden Zeilen im Ungleichungssys te m Ax :::; e. Sie zeigen an , dass das Produkt Ax in diesen beid en Zeilen den Wer t 0 hat. Diese b eid en bleib en ohne Partner.
202
Das Heiratsproblem
Die Einsen im x-Vekt or geb en die Kant en bzw. Paarungen a n , die in s op t imale Matehing aufzunehmen sind . Schli eßlich kann die K oschwi also das Resultat ihrer Bem ühungen verkünden .
Sehr geehrte potentielle Schwiegermütter! Wi ssenschaftl iche Untersuchu ngen haben ergeben, dass fü r eine bestmöglich e Weit erentwicklung un serer Dorfgem eins chaft die Eh eschließ ungen A nn a + Otto Brit -s- Kar!
Ed ith + B errul Franzi + P eier Moni + Fred Uta + Hugo zu erf olgen haben . Wir dank en allen B etroffen en für" die un verzügliche Um setzung dieses Beschlusses. Un d Sie, liebe potentielle Schwiegermüt te r aus allen a ndere n Dörfern , werden mit dem hier neu erwo rbe ne n Wi ssen für sich und Ihr Dorf hoffentlich ebe nso zielst re big die opt imalen P aar e zusam me nstellen können . Viel Erfolg!
Manuel N aum ann ist Dipl. -M athematiker und arbe ite t in Züri ch .
13 Über die Anzahl surjektiver Abbildungen
Im Folgenden zeige ich m it dem Prin zip von Inklusion-Exklusion , dass für die Anza hl T( n , k) surjekt iver Abbildunge n aus ein er Menge mit n E lementen in eine Menge m it k E leme nt en gilt: T (n, k ) =
L
0-::; i-::; k
(-I r·
(~) . (k -
it
(13 .1)
Zu diesem Ergebnis gelangen wir in me hre ren Schritten . Wir beginnen mit der Wi ed erholung der folgenden Definition .
Definition 13.1 (surjektiv) Eine Abbildung f einer Men ge M in eine Men ge N heißt surje ktiv, wenn jed es Eleme nt n E N in der Menge der Bilder von Eleme nte n a us NI unter dieser Abbildung vorkommt . Kurz geschriebe n : f : M =} N heißt surjektiv :q Vn E N :3 m E M:f( m) = n
•
Wie viele verschiedene surjektive Abbildungen gibt es, wenn Mund N endliche Mengen sind?
Was wir suc he n, ist das Bildungsgesetz ode r eine Rekursion für die Folge T( n , k) . Wer öfte r nach Folgen sucht , kennt Sloan e's On-Line Encyclopedia 01 Int eger S equen ces (www . research . att. com/r nj as/ sequences / ). Dort , in Sloan e 's On-Line E nc yclopedia 01 Integer Sequenc es find et man die gesuchte Folge als A019538 (http : / /www . research . att . com/r nj as / sequences / A019538) .
Über die Anzahl surjektiver Abbildungen
204
Da heißt es u . a.: A019538 Triangle of numbers T( n,k)
= k! *Stirling2(n,k) read by rows
Number of onto fun ct ions from an n- element set to a k-element s et .
r o., k ) T(n , k) wi th - Hen ry
= Sum_{ j=O . . k} (-1)-j* c o., j)*(k- j)-n . = k*(T(n-1, k-1)+T(n-1, k)) T (O , 0) = 1 [or TU, 1) = 1] Bottoml e y , Ma r 02 2001
See also the two closely related trian gles A008277(n, k) = T(n, k) /k! Anmerkung : C( n , k) st eht für den Binomialkoeffizienten "n üb er k". Die im Zitat zuerst gen annte Summenformel ist das Gleiche wie (13.1). Diese wollen wir zuerst erklären und beweisen . Der Beweis der als zweites a ngegebenen Rekursionsgleichung folgt danach . Die erste, bereit s in der Überschrift genannte Ident it ät sagt, dass die gesuchte Anz ahl surje ktiver Abbildung von M --+ N eng verw andt ist mit den kP artitionen.
D efinit ion 13 .2 Ei ne P artition ist eine Äq uivalen zr elation a uf eine r Men ge 111 . Eine k- Pa rtit ion ist eine Partition m it der Mächt igkeit k , also m it genau k Äquivalen zklass en.
•
Die Anz a hlen der k-P artitionen einer n-elementigen Menge werden StirlingZa hlen zweiter Art gen annt und üb licherweise mit S(n , k ) abgekürzt (und bei Sloan e's mit Stirling2(n, k ) be zeichnet). Das ist für das Folgende nic ht wichtig, es sei aber erwähnt . Für die Stirling-Za hlen zweiter Art gilt :
S(n ,k) =
~! . I:
(_1)i.
(~) . (k -
i )n
(13.2)
O ~ i ~k
Die For meln (13.1) und (13.2) un t er scheiden sich durch eine n Faktor 1/k!. Bei der Zähl ung von k-P ar ti t ion en kommt es nämlich nicht a uf die Reihenfolge der k
Über die Anzahl surjektiver Abbildungen
205
Äquivalenzklass en an. Bei der Frage nach verschiede nen surj ektiven Abbi ldungen macht es a ber schon einen Untersch ied , welch e Äquivalen zklass e auf welches E lement a us 1, ... , n a bgebil det wird . Das (-1) i deu t et a uf den Urs prung der For mel (13.1) hin . Sie wur de mit dem P rinzip von In klusion und Exklusi on gefun den . Dieses möcht e ich nun erklären .
Das Prinzip von Inklusion und Exklusion Mit dem P rin zip von Inklusion und Exklusi on lassen sich diejenigen E lem ente eine r gegebe ne n Menge zählen , die mi ndestens eine von meh reren vorgegebene n E igensc haft en a ufweisen.
A
Abb. 13.1: Drei sich schneidende Mengen
B eispiel 13.3 Wie viele natürliche Zahlen zwischen 1 und 1000 werden von mindestens einer de r Zahlen 2, 3 oder 5 geteilt? Sei A die Menge der durch zwei te ilbaren Zahlen , B die der durch 3 tei lbaren und C die der durch 5 tei lbar en Zahlen . Es gilt (vgl. Ab bild ung 13.1) :
IA u B u CI = lAI + IBI + ICI - IA n BI - IA n CI - IB n CI + IA n B n CI Dieses elementare und de nnoch starke P rinz ip wird in der Kombinatorik oft angewendet, nämlich immer dann, wen n ein Ab zä hlproblem unü bersicht lich wird . Es beruht darauf, dass die Elem ente des Dur chsch nit t s von A und B bzw. A und C usw . zun ächst doppelt gezählt werden und dann dieser Fehler wied er ausg eglichen wir d , indem die doppelt addierten E lemente einfach subtrahiert werd en . Man mu ss a ber b eachten , dass dadurch wiederu m Elem ente meh rfach subtrahiert werd en , nämlich die E lement e des gem einsamen Durchschnit t s der Men gen A , B un d C . Das muss durch ent sprechende Ad dition ausg eglic he n wer den . _
206
Über die Anzahl surjektiver Abbildungen
Was für drei Mengen gilt , kann man all gemein a uch für n Men gen formulier en : D a s Prinzip von Inklusion und Exklusion lautet:
2..:
1
1
(_1) 1 1+ I
O# 11
214
Pote nzsumme n
Beweis:
Es gilt für x
> 0:
f ~ (t ki) xi t f i=ü
7.
(k~)i
=
k =ü
=
7.
k= ü i= ü
t
ek x
k= ü
e ( n +l )x - 1
eX - 1 - 1
x
e(n+l )x
x
e - 1 X
(~ ~~: ~~~ (~ ~~ ~ (~(i + 1) ~(i + l )! t:a k k
= =
Es folgt für i
~
x
)
1
k
x
B ( k
)
n+
l) i +l - k)
xi
1 durch Koeffizientenvergleich
D
Damit haben wir einen üb er sichtlichen Weg kennengelernt , um weitere Formeln zur Bere chnung von Pot enz summen zu finden . Zum Ab schluss sei erwähnt, dass die Berechnung solcher Po tenzsummen ein Spezialfall der Frage st ellung nach de r Au swertung von Summen der allgem einen Ges talt ~~=ü f(k) ist , wob ei f eine geeigne te Funktion darstellt . Die Unt ers uchung dieser Frage führt auf die sogenannt e Eulereche Summenform el. J ens Koch, Physiker , Berlin
15 Berechnung großer Binomialkoeffizienten
Übersicht 15.1 Rechnen gemäß Definition
215
15.2 Rekursive Berechnung
216
15.3 Mul tipliziere in günstiger Reihenfolge
216
15.4 Teile und (b e-)herrsche
217
15.5 Der Satz von Legendre
218
15.6 Algorithmische Berechnung
218
15.7 Weiter es Anw endungsb eispi el
219
Wi e ber echnet man
(~) , sprich "n üb er k"? Das ist doch einfach, könnte man
sagen.
15.1
Rechnen gemäß Definition
Die bekannte Definition lautet:
D efinition 15.1 (Binom ialkoeffizie nt ) Für n , k E No, n >= k , definiert man den Binomialkoeffizienten als:
n) n! ( k .- k!·(n -k)! Dabei ist n!
= n - (n - 1) . (n - 2) .... ·2 ·1 für n
Also muss man nur diese Formel ausrechnen.
E
N und O!
=
1.
•
216 Für
15 Berechnung großer Binomialkoeff izient en
C3 0
)
ergibt sich : 10 ·9·8·7 ·6 ·5 · 4 ·3 ·2 · 1 3 ·2·1 · 7 ·6 · 5·4·3· 2·1
(Ta sch enrechn er)
120
Man hätte vorher au ch kürzen können: 10 ·9·8·7·6·5 ·4 · 3 ·2 · 1 3· 2· 1· 7 ·6· 5 ·4 · 3 ·2·1
10 . 9 . 8 = 5 . 3 . 8 = 120 3·2
Diese Rechung ist kein Problem. Aber wie ist es mit e~9\O) ? Wie riesig ist 2010! ? Mein Taschenrechner kann das nicht mehr .
15.2
Reku rsive Berechnung
Binomialkoeffizienten kann man rekursiv b er echnen . Es gilt
(n) (n -1) + (n -1) k
k -l
k
.
(15.1)
Also beispielsweise 2010) = (2009) 890 ( 891
+
(2009) . 891
Diese Rekursionsformel ist für viele formale Re chnungen der Schlüssel, für unsere Ber echnung t aug t sie a ber nicht , denn der Sp eicherb ed arf eine s Programms nach diesem Rekursionsverfahren ist groß und außerdem gibt es besser e Möglichkeiten .
15.3
Multipliziere in günstiger Reihenfolge
Zwar ist 201O! sehr groß, zu groß für den Taschenrechner, ab er die se Zahl mü ssen wir a uch ga r nicht berechnen. Vie l günstiger und schon um einiges gen auer re chnen wir in folgender Weise :
2010) ( 891
= 2010 . 2009 . . .. . 2010 - 891 + 1 891
890
1
15.4 Teile und (be-)herrsche
217
Man fass t jeweils eine n Faktor im Zähler und eine n im Nenne r zu eine m Bruch zusamme n und multipliziert die Qu otienten . Damit erreicht m an , dass die Zah len, mit den en man rechnet (hier sind das die Quotient en) alle eine ä hnliche Größenordnung haben . Für manche Zahlen ist das noch ein beherrschbarer Ausdruck. Führen wir diese Re chnung nun für große n wie 2010 durch , so ist au ch die se Re chnung zwecklos. Das Ergebnis liegt ganz grob in de r Größenordnung von Unendlich (sagt mein Taschenrechner) . Ein prinzipi eller Nachteil dieses Verfahren s ist zude m, dass die Zwischen ergeb nisse Dezimalbrüche sind , obwohl wir eine ganze natürliche Zahl als Gesamtergebnis erwarte n. Wir handeln un s somit unnötig Abbruch- und Rundungsfehl er ein .
15.4
Teile und (be- )herrsche
Es gibt ein ander es, exaktes und von der Rech en zeit schnelles Verfahren . Dabei ber echn et man die Primfaktorzerl egung von n !, k! und (n - k)! und kürzt die Exp one nte n. B e is pie l 15.2
27! 15! ·12!
-:-=-----,--,:-;-
= 22 ·3 2 ·5· 13 · 17 · 19 ·23
denn
= 223 .3 13 . 56 . 73 . 112 . 13 2 . 17· 19·23 15! = 2 11 . 36 . 53 . 72 . 11 . 13
27!
12! = 2 10 . 3 5 . 52 . 7 . 11
•
Es bleibt die Frage, wie man zu den Primzahlexponenten in der Zerl egung der Fakultäten kommt . Zum Glück gibt es dafür eine Formel aus der Zahlentheori e, die auf Leg endre zur ückgeht. Wi r wissen , das s jede positive ganze Zahl eine eindeutige Primfaktorzerlegung hat. Das bedeutet : Es gibt zu einer po sitiven ganzen Zahl m P rimzahlen P1, P2, ... , Pk und Exponenten e(pi ), i = 1, . . . , k, für eine (bi s auf die Reihenfolge der P i) eindeutige Darstellung der Form
TI k
m =
P i e (P;) .
i= 1
Die Faktorisierung groß er Zah len ist im Allg em ein en nicht leicht zu find en . Ab er die Primfak toren von n! sind leicht zu b erechnen .
218
15.5
15 Berechnun g großer Binomialkoeffiziente n
Der Satz von legendre
Sat z 15.3 (Le g endre) In der Primjaktorzerlequnq von m
e(p) =
[~] + [;
= n! (n
E
N) gilt für alle Primzahlen p:
] + [; ] + [; ] + ...
Hier ist [ ] die Gaußklammer; diese steht für " die größte ganze Zahl kleiner gleich ".
Anmerkung: Von den Summanden [ ~] sind nur endlich viele ungleich 0, nämlich die für i E No mit pi ::; n . Wir pro bieren diese Form el an Beispielen mit kleinen n un d paus: B eispiel 1 5 .4 Die 2 hat in der P rimfaktorzerlegung von 27! den Exponenten :
e(2)= [2;] + [2 :] + [2n + [ ~~] = 13 + 6 + 3 + 1 = 23 Die 3 hat in der Primfaktorzerlegung von 27! den Exponenten:
e(3) =
[2;] + [2;] + [ ~~] •
= 9 + 3 + 1 = 13
B eweis : (L egendr e) Kein Primteiler von n ! ist größer als n . Von den n Faktoren in n! sind [ ~] Faktoren einmal durch p t eilbar. Durch p2 sind Faktoren
[?]
teilbar, durch p3 sind [;; ] Faktoren tei lbar usw . Die Anz ahl der Faktoren p in der Primfaktorzerlegung ist also gleich der (endlichen) Summe dieser Anzahlen. D
15.6
Algorithmische Berechnung
Für ein Verfahren, das den Satz von Legendre ben utzt, ist es erforde rlich , die Primzahlen bis n zu kennen.
15.7 Weiteres Anwendungsbeispiel
219
Ein Programm zur Faktorisi erung von n! muss darum zuerst eine Primzahltabelle erstellen , et wa mit dem (b ekannten) Si eb des Eratosthenes. Dann durchläuft man die Liste der Primzahlen und ber echnet die e(p) für alle p klein er oder gleich n. Berechne weiter die Primzahlpoten zen pk und die Quotienten [;] solange, bis pk > n wird. Die Summe der Quotienten ist der Exponent der Primzahl p in der Faktorisierung von n! . Gleichwertig dazu , jedoch mit weniger Rechenoperationen, teilt man n zunächst durch p und dann den jeweils ganzzahlig a bgeru ndet en Quotienten wiederum durch p und bricht a b, wenn der Quotient kleiner 1 ist . Die Summe der ganzzahlig abgerundeten Quotienten ist e(p). Man vermeidet auf diese Weise die explizite Berechnung der Potenzen pk , denn hat man bis zum Abbruch k-fach durch p dividier en können, dann ist pk ::; n und pk+l > n . Diese zul etzt b eschriebene, optimierte Variante des Algorithmus lautet also :
Algorithmus zur Faktorisierung von n! 1:
2: 3: 4:
5: 6: 7: 8: 9: 10: 11: 12: 13: 14:
Eingabe: n Bestimme die Menge P(n) aller Primzahlen j; n . for all p E P(n) do quotient := Abrunden(njp) sum := quotient while do quotient := Abrunden(quotient jp) if quotient < 1 then Abbruch end if sum := sum + quotient end while Ausgabe: p "~,, sum end for
Den beschrieb en en Algorithmus kann der Leser im Internet ausprobieren , siehe [51]. Die Funktion "Abrunden" realisiert für positive Argumente die Gaußklammer .
15.7
Weiteres Anwendungsbeispiel
Gelegentlich werden Aufgaben wie diese gestellt: Auf wie viele Nullen endet 2010!?
220
15 Berechnung großer Binomialkoeffizienten
Antwort: E ine Null am E nde b edeutet , dass die Zahl durch 10 t eilbar ist . Wi e oft ist 2010! durch 10 t eilb ar ? Sie ist so oft durch 10 t eilb ar, wie in der P rimfaktorzerl egung genügend Zweien und Fünfen vorkommen , um den Faktor 10 zu bilden . Weil es häufiger den P rimfak tor 2 als den Fa kt or 5 gibt , ist diese Anza hl allein durch die An zahl der Fünfen b estimmt . Wi e viele F ünfen sind in der Primfaktorzerl egung von 2010! ? Es sind 2010 ] [ 5
+
[ 2010] 25
+ [ 2010] 125 +
[ 2010] 625
= 501
Fünfen . Also endet 2010! au f 501 Nullen.
Martin Wohlgemuth aka Matroid.
16 Über Permanenten, Permutationen und Fixpunkte
Übersicht 16.1 Einführung
221
16.2 Das Prinzip der Ink lusion und Exklusion . . . . . . . . . . . . . . . . . . . . . . .. 221 16.3 Permanenten . ... . . . . . .. . ... . . ... . . . . . . . .. . . . .. . . .. .. . . .. . . .. 223 16.4 Das Rencontre-Problem
16.1
226
Einführung
In diesem Kapitel wollen wir den Begriff der Permanente und eine Verbindung zu einer speziellen kombinatorischen Fragestellung namens "Renc ont re-P roblem" vorstellen . Unter dem Rencontre-Problem versteht man die folgende klas sische Frage: n Ehepaare veranstalten einen gemeinsamen Tan zabend. Wie viele Tanzpaarungen aller 2n Pe rsonen sin d möglich, bei den en keine Frau mit ihrem Mann tanzt '? (Frauen tanzen nur mit Männernf) Zur Untersuchung dieser Frage ste llen wir vorber eitend das sogena nnte Prinzip der Inklusion und Exklusion vor , welch es sich hier und au ch im Allg em ein en oft als nützliches Hilfsmittel er weist. Anschließend führen wir den Begriff der Permanente eine r Matrix ein und b eleuchten einige allgem ein e Eigens chaften , um sch ließlich auf die Ver bindung zum Rencontre-Problem einz ugehe n.
16.2
Das Prinzip der Inklusion und Exklusion
Sind A und B endliche Mengen , so gilt beka nntlich die Anzahlformel:
IAU BI = lAI + IBI-IAn BI
222
16 Über Permanenten. Permutationen und Fixpunkte
Diese Formel find et im Prinzip der Inklusion und Exklusion eine wesentliche Ver allgem ein erung. Zur Formulierung ben ötigen wir einige Definitionen : Sei N eine endliche nichtleere Menge. Eine Funktion w : N --t ce nennen wir Gewichts/ unktion und w( x) heiß t Gewicht von xE N. Sind NI, . .. , N; Teilmengen von N, so set zen wir
n k
NV1" ..,Vk :=
NVi
i =1
und w V l""
für Indizes 1 ::; VI
.-
w(x)
,Vk . -
< V2 < ... < vk
::; r (mi t k ::; r) . Weiter setzen wir
W(O) :=
L
w( x)
x EN
und W(k) :=
für 1
< k < r, Ist 1 < k < r , so definieren wir l\!h := {x
E N I x ist in genau k der Menge n N I, ... , N; ent halte n}
und schließlich sei V(O) := und
\/(k) :=
w (x )
L
w(x)
« e t«;
für 1
< k < r,
Damit können wir das Prinzip formuliere n:
Satz 16.1 (Prinzip der I n klu s io n und Exklusion ) Unter den obigen Vorau ssetzungen gilt
für 0 ::; s ::; r .
Der Beweis, auf dessen Dar st ellung wir hier ver zichten , kann geführt werden , indem für alle x E N das Gewicht w(x ) au f b eid en Seiten gezählt wird . In den nächst en Ab schnitten wird dieses wichtige Prinzip Anwendung find en .
223
16.3 Permanenten
16.3
Permanenten
Im Folgende n füh ren wir den Begriff der P erm ane nte eine r Matrix ein. Man könnte die Permane nte als die klein e kombinatorische Schwest er der Det erminante bezeichnen , wob ei b eid e Begriffe ihrerse its einen Spez ialfall der soge nannt en Immanen t e darst ellen . Obwohl P erm ane nten ni cht den St ellenwer t von Det erminanten b esit zen , spielen sie zum Beispi el eine wicht ige Roll e in der kombinatorischen Theori e der Repräsentanten syst em e (dazu sei zum Be ispiel das Buch "Co mbi natorial Mathe matics" von H . J . Ryser em pfohlen [52]) , und sie t reten sogar in der Quant enmech anik zur Besch reibung bo soni scher Teilchen zust ände a uf [53].
D e fin it io n 1 6 .2 (Permanente) Es sei n eine natürliche Zahl und M (n , lE.) bezeichne die Menge aller (n , n)Matrizen mi t Ei nträgen aus den reellen Zahlen. Für ein e Matrix A = (ai,k) a us M (n , lE.) hei ßt die Zahl n
per(A) :=
2..: TI ai ,o- (i) = 2..:
o- ESn
a l ,o-( l )a2,o-(2)' " an ,o- (n)
o-ES n
i= 1
die P ermanente von A , wob ei S n wie üblich die Menge aller P ermutationen der Men ge {I , ... , n} b ezeichnet. •
Zunächst b etrachten wir einige element are E igensc haft en :
Satz 1 6 .3 E s sei A = (a i,k) eine Ma tri » aus M( n , lE.). Dann gilt : 1. Di e Abb ildung per : M (n , lE.) --+ lE., A M per (A) ist lin ear in j eder Spalt e. 2. E s gilt per(A) = per(A T ) . 3. Fü r 1 :::; j :::; n lässt die P erman ente eine Entwicklung na ch der j -t en Sp alt e zu: n
per(A) =
2..: ai ,j per(Ai,j) , i =1
wobei die Matrix A i,j E M(n - 1, lE.) aus der' Matrix A en ts te ht, indem die i-te Z eile und die j -t e Spalt e weggelassen we rden.
224
16 Über Permanenten, Permutationen und Fixpunkte
Beweis: Der Nachweis der ersten b eid en Ei gen schaften verl äuft ga nz an alo g zu den Beweisen der ents prec hende n E igensc haften bei Det erminanten . Für den Nachweis der dritten Eig en schaft defini eren wir zunächs t für i , j E {I, . . . , n} die Menge n M i ,j :=
{f : {I , .. . , n} \ {j} --+ {I , . .. , n} \ {i} I fi st bijektive Abbildung} .
Für j E {l , ... ,n } gilt dann: per(A)
=
L
al ,o-(l )a 2 ,o-(2 ) ' " an, o-(n )
a ESn
=
L
ao- (I ) ,l ao- (2 ) ,2' " ao- ( n ), n
a ESn
n
=
n
L L TI
ao- (v ) ,v
i = 1 o-E S " v = 1
O-(j) =i
n
n
=L
ai ,j
i= 1
=
L TI
ao- (v ) ,v
o-EMi,j v =1
v of-]
n
~ L....J a 2,' ) . per(A2, ) .) i= 1
Damit ist die dritte Eigenschaft gezeigt .
D
Definition 16.2 und die Aus sagen von Satz 16.3 zeigen eine enge Verwandtschaft zwischen Permanente und Determinante a uf. Die Abbildung det : J\;I( n , JR) --+ JR, A >--+ det(A) ist bekanntlich durch die folgenden drei Eigenschaften vollst ändig be stimmt : 1. det(En ) = 1, wob ei E n E l\!I (n , JR) die Einheitsmatrix b ezeichnet , 2. Die Abbildung det : M(n , JR) --+ JR, A >--+ det(A) ist line ar in jeder Sp al te , 3. det ist altern ier end .
Da die P ermanente die erst en beid en Eigenschaften b esitzt , kann die dritte Eigen schaft folgli ch nicht für Permanenten gelten . Ferner gibt es a uch kein Analogon zum Det erminantenmultiplikationssatz, was sich am Beisp iel der Matrizen
und
:)
R ~(:
schnell einsehen lässt : per(A) per(B) = 10
i-
18 = per(AB)
225
16.3 Permanenten
Es gibt j edoch eine weiter e Formel zur Ber echnung von P ermanenten, welche wir mit Hilfe des Prinzip s der In - und Exklusion b eweisen werd en . Zur Formulierung benötigen wir einige Bezeichnungen : Sind eine Matrix A = (a i,k) a us M(n , lE.) und Spaltenindizes 1 ::::; kl < .. . < k v ::::; n vorgegeben, so verstehen wir unter A (kl , . .. , k v) diejenige Matrix, welche aus A entsteht , indem die Spalten mit den Indizes k» , . . . , k v durch Nullspalten ersetzt werden . Ferner definieren wir
T(A) :=
TI (~ ai'k)
,
sowie
1'0 := T(A) und für 1 ::::; v ::::; n
1'v
'[ ' (A (k l , .. . , k v)) .
:=
Mit diesen Bezeichnungen gilt der folgende Satz:
Satz 16.4 Für A = (ai ,k) E M(n , lE.) gilt : n
per(A) = I: (- 1t 1'v v=o
B ewe is : Wir wollen Satz 16.1 a nwenden. Dafür setzen wir N := {1, . . . , n} n , W(j l , . .. , j n ) := al,j l" 'a n,j" fü r (jl , .. . , j n ) E N , und für 1 ::::; v ::::; n sei
Dann gilt Sn
= N\ U ~= I N v, und es folgt a us Satz 16.1 n
per(A ) = V(O) =
I:(-1t W(v)
v=o mit
W(O) = (Ji ,... ,j ,, ) E N
=
(t
)1 =1
n
al ,jl ) . ..
(I:. an, j,,) ) ,, =1
226
16 Über Permanenten. Permutationen und Fixpunkte
= 1'0, und für 1
~
v
W( v)
~
n
~ 0 betrachte man Permutationen mit genau k Fixpunkten . Unte r den n El em enten der Grundmenge kann man auf Weisen genau k El em ente aussuchen , die auf sich selbst a bgebilde t werden.
G)
Die übrigen n - k Elemente dürfen nicht a uf sich selbst abgebildet werden, d . h ., eingeschränkt a uf die se n - k Elemente liegt ein Derangement vor . Die folgende Matrix be schreibt die Permutationen mit genau k (ausgewählten) F ixpunkten (0. B . d . A. seien die Elemente 1,2, ... ,k fix) :
A( n,k )
=
1
0
0
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
1
1
1
1
0
1
1
1
1
0
1
1
1
1
0
Die Determinante die ser Matrix ist gleich det(A n - k ) , und wenn man in die zuvor schon bewiesenen Gleichung (17.6) nun n - k für n einsetzt, finde t man:
f +(n - k , 0) - f -(n - k , 0) =
( _l) n -k -l .
(n - k - 1) = det(A n _ k ) .
Mit dem Faktor G), der die verschied en en Möglichkeiten angibt, genau k EleD mente fix zu halten , folgt die Behauptung.
17.3
Der Satz
Die bisherigen Vorbereitungen dienen dem Ziel, folgenden Satz dig te Hauptergebnis - zu bewei sen :
das a ngekün-
Satz 17.3 Für n E N gilt
r (n, 0) = f(n, 2) , d. h., die Anzahl der P ermutationen mit genau zwei Fixpunkten ist gleich der Anzahl der ung eraden P ermutationen ohn e Fixpunkt.
17 Zählen mit Permanent en
236
17.4
Beweis der Aussagen (17.1) und (17.2)
Als Hilfsmittel für den Beweis des Satzes 17.3 zeige ich nun (17.1) und (17.2). B e w e is (1 7. 1 ): Behauptung: D.; = (n - 1) . (D n-l
+ D n - 2)
Nach (17.5) ist D n = per(A n ) . Die Permanente kann man - ähnlich wie von der Det erminante bekannt - nach eine r Zeile od er Spalte ent wickeln . Ab er die Determinante 'alt ern iert ' , das tut die P ermanente nicht: Alle Vorzeich en b ei der En twicklung sind positiv. Bei Entwicklung nach der ersten Zeile ergibt sich : 1
1
1
1
1
0
1
1
0
1
1
0
1
D n = (n - 1) . per
1
1
(n - l) x( n -l)
Nun steckt hinter dieser Permanente ein kombinatorisches Problem. Es geht um Permutationen, und in der ersten Spalte stehen nur Einsen , d . h. , diese P ermanente zählt die Möglichkeiten, das Elem ent 1 b elieb ig und kein es der Elem ente 2 bis n auf sich selbst abzu bilden . Die hier auftretenden P ermutationen kann man disjunkt aufteilen auf die Fälle
a.
P ermutationen , die 1 auf 1 abzubilden, und
b. P ermutationen , die 1 nicht auf 1 abzubilden. Ausgedrückt in P ermanenten b ed eutet das:
per
1
1
1
1
1
0
0
0
0
1
1
1
1
0
1
1
0
0
1
1
1
0
1
1
1
1
0
1
0
1
0
1
1
1
0
1
1
1
1
0
0
1
1
1
1
0
= per
Die erste P ermanente hat den Wert D n Dn - 1•
+ per
0 2.
Die zweit e Pe rmanente hat den Wert
Eingesetzt in (17.4) ist das die Behauptung: D n
= (n - 1) · (D n - 2 + D n -
B eweis (17.2) : Aus (17.1) folgt durch Umordnen
D n = n.- D n -
1
+ n.- D n - 2 -
Dn-
1 -
D n- 2 ,
l)
D
237
17.5 Beweis des Satzes und weiter D n - n · D n - 1 = - D n - 1 + (n - 1) . D n - 2 .
(17.8)
bn :=D n - n ·D n - 1,
(17.9)
Set zt man
dann laut et (17 .8) nun
b«
=
(17.10)
- s .;. «.
Es ist b1
= D 1 - 1 . Da = 0 - 1 = - 1,
(17.11)
und som it (17.12)
o
Aus (17.9) und (17.12) folgt die Behauptung.
17.5
Beweis des Satzes
W ir kommen nun zum Beweis des Satzes 17.3:
j -(n , 0) = j (n , 2) Es geh en all e zuvor bewiesen en Aus sag en in den Beweis ein. B e w eis : W ir schreib en gemäß (17.4) un ter Verwendung von (17 .3) sowie (17 .6) un terein ander :
j +(n , 0) + r (n , 0) = D n
(17.13)
f +(n , 0) - r (n , 0) = ( _1)n - 1. (n - 1)
(17.14)
Subtrahiert man (17 .14) von (17 .13) , erhält man:
2 · r ( n , 0) = D n - ( _1) n- 1 . (n - 1)
= Dn
- ( _I) n - n. ( _l) n-l
(17.15) (17.16)
E inse tzen von (17 .2) in (17.16) ergibt: (17.17) Nochmaliges Einsetzen von (17.2) erg ibt :
=
Tt :
(n - 1) . D n -
2
(17.18)
238
17 Zählen mit Permanenten
Zusammenfassend:
Arg ume nt iert man wie im Beweis von (17 .7) , find et man :
G). D n - 2 ist gleich der An zahl der P ermutati on en m it gen au zwei Fi xpunkt en . D
Der Beweis ist st rec kenweise t echnisch, hat ab er au ch a usgep rägte kombinatorischen Argument e. Es mag andere Beweise gebe n, ab er ich wollt e das verwende n, was zuletzt im Forum von Matroid s Mat he pla ne t eine Roll e ges pielt hat . Fall s sich jemand fra gt, wozu P ermanenten gut sind, hier hat er ein Beispi el. Mar tin Wohlgemuth , Dipl.-Ma th . au s Wi t ten a n der Ruhr .
18 Binomialmatrizen und das lemma von Gessel-Viennot
Übersicht 18.1 Die Binomialmatrix
239
18.2 Pfade und Pfadsysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 241 18.3 Das Lemma von Gessel-Viennot
243
18.4 Die Determinante der Binomialmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . 244
18.5 L U -Zerlegung der Binomialmatrix 18.6 Ein weiteres Beispiel -
246
Spinne und Feind . . . . . . . . . . . . . . . . . . . . . . . 249
Was haben Determinanten und gerichtete Graphen gem einsam? Auf den erst en Blick scheinen beide Obj ekte nur wenig miteinander zu tun zu ha ben . Das Lemma von Gessel-Viennot st ellt jedoch ein e interessante Ver bindung her , die auf der Interpretation einer Matrix als gewichtete Inzidenzmatrix beruht . Es wird sich herausstellen, dass die Determinante einer Matrix durch Au szählen bestimmter gewichteter Pfade berechnet werden kann .
18.1
Die Binomialmatrix
Mit Hilfe des Lemmas wird gezeigt, dass für b eliebig es n E N die sogenannte Binomialmatrix (od er Pascal -Matrix) Pn = (Pij) ij mit n X nEinträgen
.._(i+ 2)
P'J -
j -
J. - 1
die Eig ens chaft
det(Pn ) = 1 hat .
240
18 Binomi alm atrizen und das Lemm a von Gessel-Viennot
Anmerkung: W ir verwenden es hier nic ht , aber es sei erwäh nt: Die Bi nomialmatrix ist unimodular. Die Matrix Pn ent h ält di e Zeilen des Pascalseh en Dreiecks in den Gegendiagona len . 1 2
CD
Zum Beispiel ist P4 =
4
1
CD
CD 4
6
10
10
10
Die eingekreisten Zahlen stehen im P ascal sehen Dreieck in der vierten Zeile . Die Determinante einer Binomialmatrix auf naive Weise zu berechnen ist für große n recht aufwändig. Für n = 3 ist es dank der Regel von Sarrus noch einfach:
m ) (~ ~ ~) m = det
136
= 1 · 2· 6+ 1 · 3 · 1+ 1· 1· 3- 1 · 3 ·3- 1 · 1 · 6- 1 · 2· 1 = 12 + 3 + 3 - 9 - 6 = 1 Den Beweis , dass det Pn = 1 fü r alle n E N, kan n man mit einigem Aufwand m it dem Gaußschen Algo rithmus schaffen . Das ist aber hi er nicht unser Ziel. Das Lemma von Gessel-Viennot bietet einen ganz unerwarteten und vie l einfacheren Weg zu diesem Ergebnis . Ma n kann nämlich Eintrag P ij der Binomia lm a t rix a ls die Anzahl gerichteter Pfade von A i na ch B i in einem gerichteten Graphen ident ifizieren. Wir er klären das a nhand von P3 und dem folgenden Graphen 18.1.
A3
~---~~---~
Abb. 18.1: Gerichteter Graph !h zum P3
Von A l na ch B j gibt es stets nur eine n P fa d . Auch von A i nach B I gibt es stets nur eine n Pfad. Die Anzahl der möglich en Pfade von A i nach B j kann
18.2 Pfade und Pfadsysteme
241
man rekursiv zä hlen. Nennen wir die An zahl der Wege von A i nach B j für den Moment c(i,j) . Von A i kann man zunächst eine n Schritt nach ob en , also nach A i - l , geh en oder man geht eine n Schritt nach rechts. Die An zahl der Weg e von A i - l nach B j ist c(i - 1,j) . Ist man aber einen Schritt nach rechts gegangen, so hat man von dort c(i ,j - 1) Möglichkeiten, denn es gibt von dem erre icht en Knoten nach B j eb enso viele Möglichkeiten wie von A i nach B j - l ; das Problem wird als o einfach ein Kästchen nach links verschoben . Somit ist : c(i, j )
= c(i - 1,j) + c(i, j - 1) c(l , j ) = c(i,l) = 1
(18.1)
Diese Rekursion gilt a uch für die Matrixelemente, denn dort stehen die Binomialkoeffizienten des Pascalsehen Dreiecks in den Gegendiagonalen. Bezogen auf die se Indizierung ist die gefundene Rekursion identisch mit der des Pascalsehen Dreiecks. Da a uch die Anfangswerte, nämlich Einsen an den Außenseiten des Dreiecks bzw. der Matrix, übereinstimmen, ist klar, dass die Matrixelemente P ij und die Wegezahl von A i nach B j in einem solchen Graphen gleich sind. Jetzt wollen wir aber erfahren , auf welche Weise das Lemma von Gessel-Viennot aussagt , dass die Determinante der Matrix Pn gleich eins ist. Auf dem Weg zu di esem Ergebnis brauchen wir einige Definitionen , die im folgenden Abschnitt gegeben werden .
18.2
Pfade und Pfadsyst eme
Wir betrachten von jetzt a n einen endlichen , gerichteten , azyklischen, gewichteten Graphen 9 = (V, E) mit der Eckenmenge V (engl: vertices) und der Kantenmenge E (engl: edges) . Außerdem seien noch zwei Mengen A , ß (ifi5 + 1)2, sodass es eine Zahl m = k . q gibt mit m· P = 00 und k· P = (u : v : w) mit w E (Z /nZ) X , eine m weiteren Zertifikat, welch es b eweist, dass q prim ist.
Das Goldwasser-Kilian-Zertifikat ist also ein rekursives Zertifikat, das eine Folge von immer kleiner werdenden (q kann immer kleiner als n gewählt werden) Primzahlen und den entsprechenden Daten enthält . Die Folge endet selbstverständlich, sobald die Zahlen klein genug sind, um sie sofort als Primzahlen zu erkennen . Die natürliche Frage ist nun, warum das Zertifikat funktioniert. Das ist ab er schnell zu beantworten:
Satz 25.2 Liegt ein gültiges Goldwasser-Kilian-Zertifikat für n vor, so ist n eine Primzahl. Beweis: Aus dem Zertifikat wissen wir, dass es eine n Punkt der Ordnung q in E( Z /n Z) gibt , nämlich den Punkt k· P (Es ist ja kP -::J 00 = (0 : 1 : 0) und q(kP) = mP = 00).
vn,
Gäbe es nun einen Primteiler p :::; so können wir E(Z /n Z) modulo p reduzieren. Da die dritte Koordinate von k · P teilerfremd zu n ist , ist sie a uch teilerfremd zu p und insbesondere modulo p von Null verschieden. Auch in E( Z /pZ) ist also kP -::J 00. Daher mus s kP mod p a uch die Ordnung q haben . Nun wissen wir a ber aus Hasses Theorem, dass E(Z /pZ) maximal die Ordnung
hat. Das ist ein Widerspruch, denn wenn kP die Ordnung q hat, dann müsste q ein Teiler von IE (Z / pZ )1 sein . Also kann n keine zus ammengesetzte Zahl sein.
D
Goldwasser und Kilian haben neben der Idee für die ses Zertifikat auch gleich no ch einen Algorithmus angegeben, der in einer erwarteten Laufzeit von 0(1og12 n) ein solches Zertifikat für eine Primzahl n generiert (Diese Laufzeit gilt - sofern einige Vermutungen wahr sind, die man a ber heutzutage für richtig hält - für fast alle Eingaben) : Gegeb en sei eine natürliche Zahl n , die höchstwahrscheinlich prim ist (also z. B . eine n Mill er-Rabin-Test mit 10 bis 20 Basen b estanden hat). 1.
2.
W ähle zufällig eine elliptische Kurve E(Z /nZ ) und berechne mit Schoofs Algorithmus die Ordnung m, die E( Z /n Z) haben mü sste , wenn n prim ist . Tritt in Schoofs Algorithmus ein Fehl er a uf, so ist n nicht prim. Spalte klein e Primfaktoren von m durch Probedivision ab und prüfe, ob der Rest eine wahrscheinliche Primzahl (~ + 1)2 < q :::; ~ ist. Ist er das nicht , b eginne mit eine r neu en Kurve von vorn.
324 3.
4.
25 Primzahlen und elliptische Kurven
Wähle eine n zufä lligen Punkt P E E( Z /n Z) und t este, ob !!J . P -::p 00 und m · P = 00 ist . Wenn erstere s nicht gilt, dann wähle eine n ander en Punkt, wenn zweiteres nicht gilt , dann kann m nicht die Ordnung IE (Z/nZ )1 sein, also kann n nicht prim sein. Wi ed erhole den Test mit q. Ist q nicht prim, so b eginne von vorn , ist q prim , so haben wir ein gültiges Zertifikat für n erstellt.
Dieser Algorithmus hat im Gegensatz zu anderen Primzahltests entscheidende Vorteile. Zum einen ist seine Laufzeit für fast alle Eingaben effizient. Zum a nderen ist das Überprüfen des entstehenden Zertifikats no ch einmal deutlich schneller möglich , nämlich in O(log4 n). Die s ist deutlich schneller, a ls es selbst der AKS-Primzahltest sein könnte. Da AKS im Moment sowieso noch unpraktikabel ist, ist der Goldwasser-KilianTest noch immer verbreitet, meistens a llerdings in der verbesserten Version von Atkin und Morain , die das Zertifikat noch einmal ein paar Größenordnungen schneller erzeugen kann , nämlich in erwarteten O(log6 n) . Ihr Vorgehen wandelt den ersten Schritt ab , indem nicht mehr a us der Kurve die Ordnung berechnet wird , sondern stattdessen ein m vorgegeben wird, zu dem eine passende Kurve konstruiert wird . Der Beweis der Primeigenschaft ist mit der Methode nach Goldwasser-Kilian sogar so effizient , dass damit schon für über 20000-stellige Primzahlen Zertifikate erstellt werden konnten . Das Programm PRIMO , welches diesen Test implementiert, ist eines der meistgenutzten Tools für das Testen auf Primalität allgemeiner Zahlen .
25.3.3
Am Beispiel der vierten Fermat-Zahl
Ich möchte das Goldwasser -Kilian-Verfahren nun direkt am Beispiel der vierten 24 Fermat-Zahl 2 + 1 demonstrier en . Wer ein bi sschen programmieren kann od er geduldig mit dem Taschenrechner durch 54 Primzahlen dividier en will, der kann sich natürlich einfach davon über zeugen , dass diese Zahl prim ist . Ab er das ist ja viel weniger spannend als der Weg über die ellipt ische n Kurven . Sei also p = 2 + 1 = 65537. Wenn man ein wenig Glück (oder wahlweise mehr Hintergrundwissen) hat, dann find et man schnell die Kurve EI, die durch die Gleichung y2 = x 3 + 2 über JF p gegeben ist und m = p + 1 Punkte hat (sofern p wirklich prim ist). Durch Probedivision mit den Primzahlen unterhalb von 20 findet man: m = 2.3 2 . 11 ·331 24
331 kommt a lso für das gesuchte q in Frage, denn 331 > (~ + 1)2 ~ 289. Fehlt uns also noch ein Punkt P , der m . P = 00 und !!J P -::P 00 erfüllt. Man sieht sofort , dass P = (-1 : 1 : 1) ein Punkt auf der Kurve ist . Man kann jetzt
325
25.4 Abschluss
überprüfen, ob (2 .3 2 . l1)P i- 00 ist. Nach eine r langwierigen Rechnung, für die man sich am besten Computerunterstützung besorgt , er hält man 198P = (11137 : - 19443 : 1) . Jetzt nehmen wir dies en Punkt und multiplizier en ihn mit 331. Das ergibt in der Tat (0 : 1 : 0) = 00 . P ist also für unser Zertifikat geeignet . Was jetzt noch zu tun bleibt, ist ein Zertifikat find et man schnell die Kurve E2 , die durch y2 = m = q + 1 = 332 Elemente hat , wenn q wirklich
für q = 331 auszustellen. Hier x 3 +x über lF q gegeb en ist und prim ist .
Durch Probedivision erhalten wir m = 22.83 und mit ein wenig Probieren findet man heraus , dass P = (3: 19 : 1) ein Punkt der Kurve ist , der 4P = (14: 21 : 1) und 332P = (0 : 1 : 0) = 00 erfüllt. Da wir 83 ohne Probleme direkt als Primzahl erkennen können und 83 > (~331 + 1)2 ~ 27 ,7 gilt, ist damit bewiesen, dass 331 prim ist, und damit wissen wir wied erum, dass 65537 prim ist.
25.4
Abschluss So , das war dann das letzte K apitel über elliptische Kurven und ihre Anwendungen . Ich hoffe, er hat euch gefallen. Es gäbe noch unendlich viel mehr über ellipt ische Kurven zu erzählen und wer weiterhin Interesse an diesem spannenden Thema zeigt , dem sei ein weiteres Mal das Buch Washington [67] em pfohlen. E(lFmjg) --+ E(lFcockez) Johannes Hahn (Gockel) ist Dipl.-Math. und promoviert in J ena.
26 Primzahlen mit Abstand
Übersicht 26.1 Der Ab st and zwischen 2 Primzahlen wird beliebig groß
327
26.2 In jed er unbegren zt en arithmetischen Progr ession gibt es unend lich viele Prim zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328 26.3 Es gib t ar it hmetischen Progression en beliebiger Länge, die nur a us P rim zahlen b est eh en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
26.1
Der Abstand zwischen 2 Primzahlen wird beliebig groß
Die Anzahl der Primzahlen ist unendlich , das hat schon Euklid , de r vor 2300 J ahren lebt e, bewiesen . Dennoch bilden die P rimzahlen kein Mu ster . Das B ertrandsehe Po stulat sagt zwar , dass es zwischen einer nat ürlichen Zahl n und 2n eine Primzahl geben mu ss (siehe Aigner [68]) . Do ch wenn man die natürlichen Zah len durchgeh t und P rimzahlen sucht, dann weiß man nicht , wie viele Zahlen man prüfen mu ss, bis man die nächste P rimzahl findet . Zu Anfang findet man recht häufi g Primzahlen, die 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37 usw . Abe r in höh eren (und sehr hohen) Ber eichen der Zahlen wird der Ab stand von der einen zur nächst en Primzahl beliebig gro ß.
Was heißt das? Denk dir eine Zahl , z. B . 1.000 .000 (ein e Million), und man kann irgendwo in den nat ürlichen Zahlen zwei Primza hlen Pl und P2 find en , zwische n den en keine anderen P rimz ahlen liegen und der en Abstand größer ist als 1.000 .000. Und für je de n ander en gewünschten Abst and, z. B. 1.000 .000.000.000.000, gilt das Gleiche.
Warum stimmt das? Warum kann m an das so sagen , obwohl es kein e Formel für die P rimzahlberechnung gibt? Man b eweist es so:
328
26 Primzahlen mit Abstand
Beweis: Sei m eine beliebi ge natürliche Zahl. F ür das, was wir zeigen wollen , ist es kein e E insc hränkung, wenn wir m > 3 vor aussetzen . Betrachte die Zahlen :
m! +2 m!+ 3 m! + 4 m! + m- 1
m!+ m Alle die se Zahlen sind keine Primzahlen , denn m ! ist durch 2 teilbar und also auch m ! + 2. m! ist au ch durch 3 t eilb ar und darum ist a uch m! + 3 durch 3 t eilbar. Und sch ließlich ist m! + m durch m t eilb ar. J ed e dieser aufeinander 0 folgenden m Zahlen hat eine n echten Teiler.
Was hat man da mit gezeigt ? Es gibt in den na türlichen Zahlen für jed e be liebige Zahl m (den Ab st and) einen Berei ch mit (mindest en s) m - 1 aufeinander folgenden Zahlen , die alle kein e Primzahlen sind. Das b edeutet : Der Ab st and zwische n 2 Primzahlen wird b eliebig groß.
26.2
In jeder unbegrenzt en arithmet ischen Progression gibt es unendlich viele Pri mzahlen
Sie liegen also beliebi g weit au sein ander , machen sich rar unter den groß en Zahlen , dennoch kann man es fast nicht vermeid en, üb er sie zu stolpe rn, wenn man mit eine r fest en Schrittweite durch die Zeilen schreite t . Eine arithmetische Progression ist eine Folge a + n . d, n E N, a und d sind natürliche Zahlen . Es ist t rivial , dass es arithmetischen Progr ession en , wie 2+n · 2, gibt , in den en nicht un endlich viele Primzahlen vorkomme n. Es ist ab er nicht trivial , was Dirichlet b ewies, nämlich dass in jed er a rit hme t ische n Progr ession , bei der a und d rela t iv prim sind, immer unendlich viele Primzahlen vorkommen . Demzufolge gib t es unendlich viele Primzahlen der Form 2+n ·3, unendlich viele der Gest al t 4 + n . 1, auch 4 + n . 3 usw. Die ses Ergebnis sag t ni cht , dass alle Zahlen in ein er solchen a rit hmetischen Progression P rimzahlen sein mü ssen, es sag t , dass - schr eitet man weiter und weiter - man immer wieder a uf eine P rimzahl st oßen wird .
329
Arithmetische Progressionen beliebiger Länge
Dieses Erge bnis int erpretier e ich so: Die P rimzahlen sind zwar im Einzeln en unvorher sagbar , a be r um das zu sein , darf es auf der anderen Seite auc h keine Bereich e in den natürlichen Zahlen gebe n, die au s nicht trivialen Gründen primzahlfrei sind . So geseh en ist das E rgebnis von Dirichlet notwendig.
26.3
Es gibt arithmetischen Progressionen beliebiger l änge, die nur aus Primzahl en best ehen
Die Primzahlforschung geht zurück bis in s Alte rt um, a be r sie ist a uch heute noch ein lebendiges und sehr produktives Arbeit sgebiet in de r Mathematik. Der Leser denkt da siche r sogleich an die populär en Bemühungen groß e und immer größer e Primzahlen zu find en , wenn gleich dies schon nicht mehr mathematisch , sonde rn vielm ehr algorithmisch, t echnisch und logistisch die größere n Herausforderungen bed eutet. E in neu eres E rgebnis a nde re r Art mö chte ich zum Schluss noch nennen ; es wurde von Green und Tao [70] 2008 bewiesen :
Satz 26.1 (Green-Tao-Theorem) Es gibt arithmetis che Progression en beliebiger Läng e, die nur aus Primzahlen best ehen. Das ist eine Existenzaussage . Mittlerweise hat man au ch schon einige Bei spiele für solche Progressionen gefunden .
Beispiel 26.2 Die arithmetisch e Progression 468395662504 823 liefert für n = 0 bis 23 Primzahlen .
+ n · 205 619 ·223092 870
•
Man kann also eine b eliebige natürliche Zahl vorg eb en , z. B . 83843 , und siche r sein, dass es irgendwo in den natürlichen Zahlen eine a rit hmetische Progression der geforderten Länge (z. B. 83843) gibt, in der nur Primzahlen vorkommen . Das find e ich üb errasch end.
Mortin Wohlgemuth aka Mairoid.
27 Faktorisierungsverfahren
Übe rsicht 27.1 Einführung
331
27.2 Probedivision
332
27.3 Fermat-Faktorisierung
333
27.4 Lehman-Algorithmus
335
27.5 Po llard-R ho-Verfahren
337
27.6 (p - 1)-Verfahren
341
27.7 Elli ptische-Kurven-Met hode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 27.8 Qu adra tisches Sieb
2
27
+1 =
352
596495891 2 7497 217 . 5 7046 8920 0 6 8 5 129054 7 2 1
(Morrison & Brillhart, 1970) Bekannterweise ist das klas sische Problem , die Primzahlen von den zus ammen gesetzten Zahlen zu unterscheiden , nach heutigem Kenntnisstand sehr effizient lösbar . Als viel schwieriger erweist es sich aber , die komplet t e Faktorzerlegung einer natürlichen Zahl anzugeben . Obwohl dieses Problem seh r alt und grundlegen d ist , muss man tief in die ma thematische Tri ckkiste greifen , um selbst Primfaktoren moderater Länge bestimmen zu können. Das Kapitel be leuchte t klassische und akt uelle Verfahren zur Faktorisierung. Neben de n Verfahren selb st st ehen Laufzeitanal yse und Hinweise zur effizienten Realisierung au f dem Comput er im Mittelpunkt.
27.1
Einführung
Dass eine natürliche Zah l eine (bis auf die Reih enfolge der Faktoren) einde ut ige Primfaktorzerl egung besitzt, hat t e schon E uk lid et wa 300 v. Chr. gezeigt. La nge Zeit haben sich die meisten Mat hem at iker auch mit diesem Wis sen b egnügt ; die
332
27 Faktorisierungsverfah ren
konkreten Faktoren zu best immen war meist die damit verbunden e Arbeit nicht wer t . Da s ä nde rte sich schlagart ig Mitte der 60er-J ahre des vori gen Jahrhunderts, als leistungsfähige Computer verfügbar wurden und - et was späte r das RSA -K ryptosyst em erfunde n wurde. Daraufhin wurde viel E ne rgie in die Erforschung der Problematik und die E nt wicklung "gut er" Faktorisierungsalgorithmen gesteckt - mit mäßig em Erfolg. Bis heute ist es niemandem gelungen , das Faktorisierungsproblem als effizient lösbar nachzuweisen . Dennoch sollen einige der Ergebnisse bzw. Verfahren in den nachfolgenden Abschnitten besprochen werden .
27.2
Probedivision
Die Probedivision ist die naiv e Methode, Primfaktoren zu erhalte n. Man fängt an, durch 2, 3, usw. zu dividieren , und schaut , ob die Division aufgeht . Wenn ja , hat man eine n Primfaktor gefunden . Das Verfahren hat seine Berechtigung, da das Vorhandens ein klein er Faktoren sehr viel wahrscheinlicher ist als das gro ßer ; eine Divi sion ist auch sehr schnell ausgeführt . Ist N die zu faktorisierende Zahl und gibt es eine n Teiler a > VN von N , so ist der Komplem entärteiler b = N'[o. klein er als VN . Es reicht also, die Probedivisionen bis VN a uszuführen.
A lgorit hm us (Pro b e d ivisi o n) 1:
2: 3:
4: 5: 6:
7:
Eingabe: N for a ll 2 :::; p < if p I N t he n Abbruch end if e nd for Au sgabe: p
VN
do
An dieser St elle soll au sdrücklich darauf hingewiesen werden , dass man sich erst vergewissern sollte, ob N a uch wirklich zusam me ngesetz t ist . Das ist leicht möglich (z. B. mit dem Miller-Ra bin-Test ) und soll hier nicht weiter erläute rt werden .
Ve rb esse ru nge n Eigentlich genügt es, nur Primzahlen p zu te sten. Ist a = p . q zusammengeset zt, so te stet man ja p bzw . q viel früher als a. Dazu mü sste m an vorher eine P rimzahltabelle erst ellen, was sich a ber nicht immer lohnt .
333
27.3 Fermat-Faktorisierung
Man kann sich aber mit folgender Überle gung beh elfen : Hat man b er eits durch 2 getestet, so kann man sich a lle ander en durch 2 teilbare n Zahlen spare n, indem man nur di e ungeraden Zahlen t est et. Will man a uch den Vielfachen von 3 a us dem Weg gehe n, so t estet man nur a lle zu 2 · 3 = 6 t eilerfremden Zahlen (welche von der Form 6k ± 1 sind ). Um zus ätzlich die 5 zu b erücksichtigen , t estet man nur all e zu 30 t eilerfremden Zahlen (di ese sind von der For m 30k ± 1, ± 7, ± ll , ± 13). Das kann man zwar b eliebig weiter treib en, wird a be r schnell ziem lich mühsam. Mit de r P robedivision kann man sehr schnell alle "Trivia lt eiler" erkennen . Bei einer Laufzeit von O(p) für einen Primfaktor p ist sie a ber a b einer gewissen Größe der Fak toren ni cht mehr prak tikabel.
27.3
Fermat- Faktorisierung
Eines der klassisch en Verfahren hat Fermat 1643 in eine m Bri ef er wä hnt . Darin st ellt er die zu zerlegende Zahl al s Differ en z zweier Quadrate dar. Dann gilt N
=
2 x - y2
=
(x
+ y)( x
- y)
und man bekommt eine Faktorzerlegung von N . Au sgehend von der umgestellten Glei chung x 2 - N = y2 kam Ferm at a uf die Idee , zu prüfen , ob die Differenz x 2 _ N (für verschied en gewählte x) ein Quadrat darstellt. Die Wahrsch einlichkeit dafür ist am größt en, wenn x 2 in der Nähe von N lieg t. Das Verfahren definiert also eine Folge X k mi t X o :=
und t estet , ob
Zk :=
x% -
r.JNl
und
X k :=
Xo
+k
N ein Quadrat ist.
Algor ithmus (Fe rmat-Ver fahren) 1:
2:
Eingabe: N (ungerade) for x := to (N + 9)/6 do
r.JNl
2
z := x - N if Z = y 2, y E N t hen 5: Abbruch 6: end if 7: end for 8: Au sgabe: x - y 3:
4:
E ine ob ere Gren ze für x ist der Wer t x = (N + 9) /6. Dann ist y = (N - 9) /6 und wir b ekommen den Faktor p = x - y = 3, fall s dieser existiert. Es macht ab er keinen Sinn, so weit zu geh en , da wir dann b ereits mehr Aufwand als die Probedivision b etrieb en hät t en .
334
27 Faktorisierungsverfahren
Beispiel Am Beispiel von N = 314731 soll das einmal demonstriert werden . Wir beginnen bei Xo := ffi = 562 und bekommen die folgenden Werte:
I 1
k
Xk
o
562
1113
1
563
2238
2
564
3365
3
565
4494
4
566
5625
Zk
= x~ - N = 3·7 ·53 = 2·3·373 = 5·673 = 2·3 ·7 · 107 = 752
Bereits nach vier It erationen haben wir ein Quadrat und bekommen die Zerl egung N = 5662 - 75 2 = (566 - 75)(566 + 75) = 491·641. Man prüft leicht nach, dass es sich um Primfaktoren handelt.
Verbesserungen Überlegen wir uns, wie wir die ses Verfahren effizient umsetzen können. St att jedes Mal eine Quadrierung durchzuführen , nutzen wir die Beziehung
es folgt was sich schneller berechnen lässt. Auch Wurzelziehen ist t euer; wir versuchen daher schon im Vorfeld zu entscheid en , ob Zk üb erhaupt ein Quadrat sein kann . Dazu bestimmen wir den Rest r == Z k modulo einer geeigneten kleinen Zahl m. Ist r kein quadratischer Rest mod m (d . h. , die Gleichung x 2 == r besitzt modulo m kein e Lösung) , so kann Zk auch keine Quadratzahl sein . Für m = 10 gibt es beispielsweise nur die qu adratischen Reste [D, 1,4,5,6, 9}, die beiden ersten berechneten Werte für Z k scheiden also schon aus (diese enden auf 3 und 8) . Noch besser sieht es bei m = 16 aus , dort haben wir nur [O, 1, 4, 9} als mögliche Reste . Man kann also anhand der letzten vier Bit sofort 75 % der Nichtquadrate identifizieren.
La ufzeit J et zt kann man sich fragen, ob der Fermat-Algorithmus eigent lich alle Faktoren findet - und wenn ja, wie lange er dafür braucht. Sei zunächst N ungerade und N = v -q (wob ei p ~ q). Dann sind p , q ungerade und X ·-
.-
p +q 2-
-
und
p -q Y ·.- - 2 -
335
27.4 Lehman-Algorithmus
sind ganze Zahlen und es gilt die geforderte Eigenschaft N = x 2 - y2 . Da alle x get estet werden , werden p und q in jed em Fall gefunden. Weiterhin sieht man leicht, dass der Algorithmus versagt, falls N gerade und nicht durch 4 teilbar ist . Potenzen von 2 sollten also vorher herausdividiert werden .
Satz 2 7. 1 Ist N = P: q ungerade und Ip q in O(c 2 ) Schritten gefunden .
ql S; c · m
mit c
> 0, dann werden p und
Sei o. B. d. A . p :::0: q und N = (x +y)(x -y) die gefundene Lösung (also y = 9 ), welche in Schritt k gefunden wird . Wir benutzen die Ungleichungen x o S; vN + 1 (also x 6 S; N + 2vN + 1) und Zk = y2 S; %-vN und die explizite Darstellung Zk = Zo + 2k xo + k 2 • Für k gilt dann: B ewe is :
Jx6 + Zk - Zo - xo JN + 2vN + 1 + ~ vN - 1 - vN = JN + (2 + %-)vN - vN = VN ( J1+ :~ - 1)
k=
S;
< --
VN (1 + 8+c 8VN 1 + .c 8 2
-
1)
D
m
'Nenn sich die Faktoren p und q also nur um unterscheiden , werden sie quasi sofort gefunden . Je weiter sie a ber auseinanderliegen , desto schlechter wird das Verfahren. Im schlimmsten Fall werden (N + 9) /6 Operationen gebraucht , weil erst dann ein Trivialfaktor wie 3 gefunden wird.
27.4
Lehman-Algorithmus
Eine interessante Kombination von Probedivision und Fermat-Verfahren mit verbesserter Laufzeit wurde von R. S. Lehman [72] vorgestellt. Er b enut zt den folgenden Satz:
336
27 Faktorisierungsverfahren
Satz 27.2 (von Lehman) Ist N = p . q ungerade m it Primzahlen p, q und ist 1 S; r
J
bei r~l S; p S; Eig enschaften:
VN, so
==
1 (mod 2), falls k gerade und x
3. V 4k N S; x S; V 4k N
VN,
wo-
gibt es natürliche Zahl en x , y und k mit den
1. x 2 - y2 = 4k N
2. x
B I , b := a qo (mod N ) fo r a ll qo < qk ::; B 2 , qk Primzahl , k = 1,2, . .. do b := b · a q k - q k - l (mod N ) ggT (b - 1, N ) if P I N then Abbruch end if e nd for Au sgabe: P P :=
(Die Werte a 2 , a 4 , . . . , die re chnet und gespeichert .)
a
qk
-q k - l
an nehmen kann , werden vor Zeile 11 b e-
Der Wermutstropfen : Ne be n der Bedingung a us Ver sion 1 (PI ::; B2) mu ss zusätz lich P2 ::; BI gelte n, da sonst der Algori t hmus ver sagt. Unter su chungen haben a be r erge be n, dass im Normalfall P2 « PI gilt, so dass es i. A. kein e Problem e geb en sollte. Weitere Verb esserungen An alog zum Rho-Verfahren sind wir bestrebt , die Zahl der ggT -Bere chnunge n ger ing zu hal ten. Daher werden zu nächst n Stück (z. B. n = 100) de r erzeugten Werte (b - 1) modulo N a ufmult ipliziert und er st dann de r ggT gebildet. Pollard hat in seine r Originalarbeit ein e Methode a ngegeben, Phase 2 (Zeile 11 bis 17) spürbar zu beschl eunigen . Die Id ee ist folgende: Die gesu chte P rimund zahl PI lässt sich einde ut ig darst ellen als PI = V W - u , wenn w := P 1 U < w , v ::; w sind. Ist jet zt P ein Teiler von b 1, so a uch von bV W - b" : Pollard defini er t nun ein Polynom h(x) = ITu<w(x - bU ) (mod N ) und ber echnet
IVB2l
27.7 Elliptische-Kurven-Methode
345
p = ggT ([1v::;w h(b V W ) , N ). Benutzt wird dabei ein schneller Multi plikationsalgorit hmus für P olynome, der das Produkt zweier Po lynome vom Grad n in O( n ln( n)) b erechnet. Auf Kost en von Spei che rplatz kann dadurch die Laufzeit deutlich reduziert werden . Weit ere Verb esserungen hat Peter L. Montgomery a usge ar be itet [731 .
Laufzeit Wi e man sieht, werden O(pI) Op erati on en benötigt. Die Größe des größte n Primfaktors von p - 1 entschei de t also üb er die Laufzeit . Da man diesen ab er nicht kennt, ist das Verfahren wiederum ein Glücksspi el. Um wenigst en s herauszufinde n , was wir so im Mittel zu erwarte n haben , benutzen wir den folgenden Satz:
Satz 27. 7 (vo n H a r d y / R a m a n uj a n ) Ist D( N) die Anzahl aller Primteiler von N, dann gilt im Mittel die Abschätzung D( N) ~ Inln( N) .
Für p - 1 = Pl . .. .. Pk können wir k
k- 1
~ lnln
(:J
~
In ln(p) anne hme n und den Ansatz
= In(1n(p) - ln (p I) ) = In (ln(p). ( 1 -
l~((;/))
= ln ln(p)+ ln (1- 1~(~/ ) ~k +ln(1 -1~~;/) mach en . Als Ab schätzung für Pl b ekommen wir daraus In(pI) ~
(1 -
~ ) ln(p) ~ 0,632 · ln(p).
Die Laufzeit hat dann also einen "Erwart ungswert" von O(pO,632). Die Varianz ist a ber sehr ho ch , so dass man mit diesem Verfahren a uch recht große Fak toren finden kann (auch wenn m an in 90 % der F älle Pech hat). Darüber hin aus gib t es no ch ein Verfah ren (von H . C . Williams) , das sich die Glattheit von p + 1 zu Nu tze macht , was die E rfolgsaussichten erhöht .
27.7
Elliptische-Kurven- Methode
Wie ger ade geseh en , hat das (p - 1)-Verfahren den unschönen Nachteil , dass die Laufzeit von der Glat theit de r Gruppenordnung - a uf die man keinerlei E influss hat - abhängt. Das nachfolgend vorgest ellte (1985 von H. W . Lenstra jr. er funde ne ) Verfahren funktioniert nach dem selb en Prinzip, biet et a be r die Möglichkeit der E influssna hme . Die Chance, einen Primfaktor p zu find en, kann dadurch erhö ht werden .
346
27 Faktorisierungsverfahren
Wir benötigen dazu den Begriff der ellipt ische n Kurve, den wir für unser e Zwecke et was einschränken .
D efin it io n 27.8 (Elliptische Kurve) Seien a , b E lK für eine n Körper lK und sei x 3 + ax + b ein Polynom ohne mehrfache Nullstelle. Die Menge JE der Punkte (x, y) , die die Gleichung y2 = x 3 + ax + b erfüllt, zuz üglich eine s El em ents 0 heißt ellipt ische Kurve • üb er lK.
Eine typische Kurve üb er lK = lR zeigt die unten st ehende Abbildung 27.2. :
i:
2.
i
3
y = x -
13 16 X
ir-
3 16
'JJ.
:
:
1
1x
1
1···················1··················· :-2
:2
i
1..".
I
-1
1•• ••••• •• • •• • • ••• . 2 . .. . . . . . . . ... . . . . .. :
1
1
Abb. 27.2: Beispiel für eine ellipt ische Kurve über lR Wir interessieren uns hier a ber für den Restklassenkörper JFp für eine Primzahl p . Elliptische Kurven üb er JF p spi elen auch eine wichtige Roll e in der Krypto-
graphie. Die für uns wesentliche Eigenschaft ist die Tatsache, dass eine solche Kurve eine a belsche Gruppe darstellt. Punkte P , Q auf einer elliptischen Kurve las sen sich beliebig addieren bzw. invertieren, wobei der in der Definition erwähnte Punkt o die Rolle des neutralen Elementes übernimmt . Im Einzelnen gelten für zwei Punkte P = ( Xl , yl), Q = (X2, Y2) und deren Summe P + Q = (X3, Y3) folgende Rechenregeln: 1. Invertierung: - P
=
( Xl ,
- y l) und - 0 = O. Aus Q - X l - X2 bzw . Y3 = - Yl
2. Addition: Es gilt X3 = m 2
Y2 - Yl X2 - Xl m =
1
3XI
+a
2Yl
= - P folgt P + Q = O.
+ m(xl
, wenn P =I- Q,
, wenn P = Q.
- X3), wobei
27.7 Elliptische-Kurven-Methode
347
Wi e in jed er Gruppe ist die Ordnung ord(P) eine s Punktes P E JE das kleinste n E N, für das n · P = 0 ist ; wir haben ja hier eine additiv geschrieb en e Gruppe vor uns . ord(JE) ents pricht dab ei der An zahl aller Punkte auf JE. Es gilt der folgende wichtige Satz:
Satz 27.9 (v o n Hasse) Sei JE eine elliptische Kurve über 1F p - Dann gilt für die Ordnung die Schranke 10rd (JE) - p - 11 < 2,fP.
Das bedeutet , dass bei zufälli ger Wahl de r Kurvenparameter a und b die Gruppenordnung innerhalb eines Intervalls um p vari iert . Man kann ungefähr von eine r Gleichverteilung ausgeh en ; an den Rändern des Hasse-Intervalls scheint die Dichte etwas geringer zu sein . Wa s hat das alles nun mit dem Faktori sierungsproblem zu tun? Gegeb en sei wied er eine natürliche Zahl N und ein zu find ender Primfaktor p von N. Wir würden nun gern Punktadditionen auf einer ellipt ische n Kurve JE üb er 1F p an st ellen . Da wir p leid er nicht kennen , werden wir die ob en genannten Op eration en (Addition , Mu ltiplikation , Invertierung der x /y-Werte) modulo N a usführe n. Da N ein Vielfaches von p ist , sind diese konform zu den jeweiligen Berechnungen modulo p - wir rechnen damit nur mit deutlich größ eren Vertretern der "echte n" Wert e modulo p . Unser Ziel ist es, eine Addition P +Q = 0 herbeizuführen. Ist P Q = (xz ,Yz) , so folgt P = - Q und damit : 1. Xl 2 . Yl
= (Xl ,Yl) und
== Xz (mod p) == - yz (mod p)
Wollten wir nun die Punkte P und Q addieren, so mü ssten wir nach den obigen Re chenregeln das Inverse (xz - xI)- 1 (mod N) und (im Falle P = Q) (2Yl) -1 = (Yl + YZ)- l (mod N ) bilden . Aufgrund de r Kongruenzen (1.) und (2.) exist iere n diese nicht und wir bekommen durch Ber echnung von ggT (Xz - z i , N ) und ggT(2Y l , N ) mit hoher Wahrsch einlichkeit un seren Primfaktor p . Das funktioniert natürlich nicht , wenn die Kongruen zen (1.) und (2.) a uch modulo an der er Primfaktoren q von N gelten . Um die gewünschte Addition zu bekommen, bedienen wir un s derselben Methodik wie das (p - l)-Verfahren . Dort sind wir von einem E leme nt a E 1F; und einem geeigneten m E N a usgega ngen. War ord(a) 1m , so gal t a'" == 1 (mod p), und wir hatten un ser Ziel erreicht. Analog ber echnen wir nun das Vielfache m · P . Ist ord(P) 1m , so gilt m- P = O . Da s Vielfa che m - P ber echnen wir mit dem b ereits vor gest ellten "Square & Multiply"-Verfahren , nur auf eine additive Gruppe angewandt (es mü sst e demzufolge "Double & Add" heißen).
348
27 Faktorisierungsverfahren
Bis hierhin haben wir gege nüber dem (p- 1)-Verfahren ni chts gewonne n. Ist ab er nun m · P i- 0 , so mü ssen wir nicht das Handtuch werfen , sonde rn können durch Variation der Kurvenparamet er a und b im me r wied er neu e Ku rven erze uge n. Da deren Ordnung eine n Zufallswert im Hasse-Int erv all a nnim mt , können wir irgendwann doch no ch Glü ck haben und es gilt ord(P) Im. Mit dem Unterschied , dass wir au f eine r a nde ren Gruppe arbeit en , ent spricht das Vorg eh en also gen au dem des (p - 1)-Verfahre ns. Daher wird im Folgenden gleich die erwei terte Fassung a ngegeben.
A lgorit hmus (ECM ) 1: 2:
3: 4: 5:
6: 7:
8: 9: 10:
11: 12: 13: 14: 15:
16: 17: 18: 19:
Eingabe: N W ähle eine elliptische Kurve JE und einen Punkt P E JE; eb enfall s Sch ranken B I , B 2 E N , BI < B 2 for a B q :::; B I , q Primzahl , kleine q mehrfach do P: = q. P if eine Addition (bzw. Verdopplung) ni cht möglich then p: =ggT( X2 - XI , N ) (bzw.p :=ggT(2Y I , N» Abbru ch end if end for qo := klein st e Primzahl > BI, Q := qo . P fo r a ll qo < a» :::; B2 , a» Primzahl , k = 1,2, ... do Q := Q + (qk - qk-I) . P if Addition (bzw. Verdopplung) nicht möglich t hen p := ggT(X 2 - z i , N) (b zw. p := ggT(2YI , N » Abbruch end if end for Bei Misserfolg: Geh e zu 2. Ausgabe: p
(Vor Zeile 11 werden die möglichen Werte von (qk - qk-I) ' P vorbere chnet und gespeiche rt .) An alog zum (p - 1)-Verfahren gilt a uch hie r : Ist ord(P) = PI Primfaktorzerlegung der Ordnung des Startpunktes (wobei PI ?: P2 ?: so haben wir nur dann Erfolg, falls PI :::; B 2 und P2 :::; BI ist .
Pk die ?: Pk) ,
Ein (klein er) Vorteil ergibt sich hier no ch aus der Tatsache, dass wir a uf versch iede ne n ellipt ische n Kurven parallel rechnen ; mit jed em weiteren Primfaktor q von N korresp ondier t ja eine ents p rec he nde Kurve. Die Erfolgsa ussichten wer-
349
27.7 Elliptische-Kurven-Methode
den ab er im Wesentlichen durch den klein st en Primfaktor b estimmt , so dass dieser Vorteil ehe r vern ac hläs sigbar ist.
B eispiel Versu chen wir das an einem Beispiel nachzuv ollz iehen. Die Ei ngab eza hl ist N = 373935877 613. Als elliptische Kurve wählen wir JE : y 2 = x 3 + 11x - 11 und als St artpunkt P = (1, 1) E JE. Au s G ründen der Ei nfac hhe it ver zichten wir a uf die 2. Phase und wählen nur die Schranke BI = 15. E ine gee igne te Zahl, die all e Prim zahlen j; BI a ls Teiler ent hält, ist z. B. rn = 360360 = 2 3 . 3 2 . 5 . 7 . 11 . 13. Für das "Double & Add"Verfahren müssen wir rn als Summe von Zweierpoten zen da rst ellen , d . h .:
Um uns un nötige Additionen zu erspare n, nehmen wir die kürze re Da rstellung
Durch sukzessi ve Punktverdopplung erhalt en wir nun: 2 1 P = (47,373935877290) 2 P
= (227972965300, 183442291117) = (61805727327, 11053Ei328079)
2 17 P
= (280318713435, 342677737184)
22 P 3
2
18
P = (268323296538, 16670570674)
Nun sind wir in der Lage, rn· P durch Additi on der en t sprechenden Zweierpot enzen zu be stimmen : 23 P 3
2 P 3
2 P 3
2 P
+2
5
+2
P _
+2
5
+ 25 P
= (70097302030, 311003332604)
P - 2 P = (346 690843 31, 321123021245 ) 7
+ 2 15 P = 27 P + 2 15 P + 2 16 P = 5
7
P- 2 P
(317161257334 ,1 888429 75469) (120.533742333, 164980145 780)
Nun müssen wir no ch 2 18 P addiere n und stellen fest , dass wir die P unktaddi tion (120 533742 333,164980145780) + (268323296 538,1 6670 570674) ni cht au sführen können , da 26832329 6.538 - 120.533742333 = 147789 55420 5 modulo N nicht inve r tierb a r ist . Wi r bekommen m it p = ggT( 1477895.5420.5, N ) = 157.559 also einen Primfaktor von N. F ür die Kurve JE über lF 1 5 7 5 59 gilt or d ( P ) = 182 = 2 · 7 · 13 und für die Gruppenordnung or d(JE) = 157976 = 23. 72.13 .31. Diese lässt sich übrigen s effizient mit Schoof's Algorithmus bestimmen. Das Beispie l zeigt auch gut, dass für den E rfolg die Ordnung des Startpunktes (und nicht der Gruppe) ent sche ide nd ist.
350
27 Faktorisierungsverfahren
Erweiterungen/Verbesserungen Ein gro ßer Vorteil dieser Met hode ist ihre un ein geschränkte Parallelisierbarkeit . Sämtliche Kurven sind von einander unabhängig, so dass man die Ber echnungen ent sprec he nd verteilen kann. Es hat sich he rausgestellt , dass man B l/ B z so wählen sollt e, dass sich ein Verhältnis von etwa 2:1 zwischen den Laufzeiten von Phase 1 bzw . 2 ergibt . De s Weiteren gibt es noch einige Tricks, mit denen man die Effizienz no ch et was weiter steigern kann . Im Folgenden eine Au swahl: 1) Einsparung von Punkt additionen In Phase 2 be rechnen wir a ufst eigend Punkte q . P für alle Primzahlen q im Int ervall (BI , Bz]. Da s kost et et wa Bz / In(Bz) Punktadditionen. Punktadditionen sind sehr teuer, da sie eine Inv er tierung beinhalten (dazu muss man den Erweiterten Euklidischen Algorithmus aufrufen) . Man kann die Zahl de r Additionen a ber mi t folgendem Trick a uf etw a Vlh verringern: Gegeben sei ein w E N. Mit natürlichen Zahlen u (eindeutige) Darstellung
< w und v ergibt sich die
q = vw -u q 'P = vw 'P -u 'P Fixiert man je tzt w in der G rößenordnung Vlh, so gilt ebenfall s u , v ~ Vlh, Wir können jetzt die Werte v w · P und u - P berechnen und sp eichern , was 2Vlh Punktadditionen kostet . Statt nun die Differenzen vw· P - u · P auszurechnen, be stimmen wir nur den ggT (xz - X l, N) de r x-Koor dinaten von vw· P bzw . u . P und schauen, ob wir den gesu chten Faktor p bekommen. Weiter kann man Re chenzeit sparen , wenn man mehrere Werte (x z - X l ) vor der ggT -Bildung a ufmult ipliziert . 2) Einsparung von Inve rtierungen Unter Verwendung einer anderen Kurvenparametrisierung kann man soga r ganz a uf die Inve rtierungen verzi chten . Die von uns eingeführten Kurven haben die Form JE : yZ = x 3 + ax + b, welch e a uch als Weierstrais-Parametrisierung bekannt ist . Eine Kurve der Form
mit Kurvenpunkten (x , y , z) liegt in der sog. Montgomery-Parametrisierung vor. Eine Addition von Punkten dieser Form kommt ohne Inv ertierung au s; sie wird gern für P hase 1 verw endet . Details zu dieser Parametrisierung kann man in Montgomer y [741 nachlesen .
351
27.7 Elli ptische-Kurven-Methode
3) Erhö hung der Glattheit der Gruppenordnung Man kann d afür sor gen , dass b ei geeigne te r Wahl der Kurvenparamet er gewährleist et ist , dass die Ordnung or d( JE) immer durch bestimmte (klein e) Zahlen t eilb ar ist . Man kann damit also ,,kün stlich" die Gl attheit der Ordnung erhö he n. Besorgen t ut dies ein sogenannter K urvengenerato r. E in solcher liefert zu einem Zufall szahlenwert a E Z Kurvenparameter a, b für eine ellipti sche Kurve JE mit be sag te r E igensch aft . Daneben wird no ch ein gül tiger Star tpunkt P E JE generie rt . Als Beispiel wird kurz ein Generato r für eine Ku rve JE in der oben genannt en Montgomeryform a ngegeben . Sei a E Z zufällig gewählt . Dann bekommen wir mi t 6a u· = - 2 (mod N ) . a +6
a 'P: =
- 3u 4
-
6u 2
4u3
(~~ , - ,1)
+1
(mod N )
(mod N )
den Parameter a und ein en Kurvenpunkt P a uf JE, wobei ord(JE) immer durch 12 teilbar ist . Der P arameter b wird (analog zur Weierstraßform) für Punktaddition en in Montgomeryform nicht benötigt, a uch wird die y-Koordinate des St art punkts P für die Berechnung nicht benötigt (darum der Strich). E inige ander e Erweiterungen werden in [741 b esch rieb en . La ufze it Die Laufzeit hängt en ts cheidend davon ab , wie viele Kurven wir durchprobieren mü ssen , bis ord(P) die erforde rliche Glattheit seigen schaft erfüllt. Wenn wir einerseit s die Schranken BI / B 2 klein er wählen, so sind wir mit der Berechnung einer Kurve schneller fertig und können somit mehr Kurven t esten . Anderer seits könnten wir sie größ er wäh len , um die Wahrsch einlichkeit für die Glattheit zu erhöhen . Für eine An two rt brauchen wir ein e Aussage über die Häufigkeit glat ter Zahlen .
S atz 2 7 .10 ( Can fie ld, E r dös, P omerance) Fü r die " Glattheitsfunktion "
'ljJ (x, y) := I{n E N : n ::; x , n be sitzt keinen Primteilert gilt 'ljJ (x , y) = x · u -u (l +o(I», wobei u := ln(x) / ln(y) .
> y} 1
352
27 Fakt orisierungsverfahren
In Kurzform: F ür eine zufällig gewählte Zahl n ::; x b eträgt die Wahrschein lichkeit , y-glatt zu sein , et wa «» . Für un s bed eutet das, dass wir ungefähr U U Kurven zu t est en haben , um eine n Primteiler p zu find en, wob ei hier u := In(p) jln(B2) ist (man kann u als das Längenverhältnis der Zahlen p und B 2 auffassen) . Da die "Double & Add"-Methode pro Kurve et wa B2 Op erationen b enöti gt , können wir eine Gesamtlaufzeit von L(p) = U U • B2 = U U • v' !" an set zen . Um die Laufzeit zu minimieren, machen wir den An satz dL j du = 0, also:
_ pl / Uu U-2 (ln(p) - u 2I n(u) - u 2) = =}
°
ln (p) = u 2(1
+ ln (u ))
Umste llen liefert uns eine asymptotische obere Sch ranke für die Lösung U opt
U opt :
~ yl 2 ln (p)j ln (ln (p )),
woraus wir mi t
B 2 ~ exp ( ~ yl2 ln(p) ln(ln(p)) ) die ents pre che n de Wahl für B2 er halten. Darüber hinaus ist au ch die Bestimmung der asymptotischen Laufzeit mögli ch . Zur Übe rsicht lichkeit setzen wir q := ln(p) und bekommen nach Einsetzen:
L() p
q = e U ln (u )+ l.. " = e V2 q/ In (q ).~(ln ( 2q ) -ln(ln (q ) ) )+Vln (q ) /2q.q
= e~ v2q / l n (q ) .l n (q ) ( 1 +o (1 ) )+ ~v2q In (q ) =
e h~·(l + o( 1))+~ v2 q l n( q)
= e V q 1n (q ) (2+o ( 1) ) = e V 1n(p) ln(l n(p) ) (2+o( 1) )
Die Laufzeit ist som it su bexponent ieller Natur. Leider gib t es zu wenige glat te Zahlen , um daraus eine n effizienten Algorithmus zu erhalte n. J et zt kommt mögli cherw eise der Einwand , dass man die optimalen Werte für B 2 und die Kurvenanzahl nicht kennt, da ja auch p nicht bekannt ist . In der Praxis geht man von eine r b est im mt en Gr öße von p au s und macht die ents p rec he nden Test s. Sch lag en diese fehl , so wech selt man zur näch st en Größenordnung. Gegenüber dieser ist der Aufwand der ersten Tests vernachl ässigbar klein.
27.8
Quadratisches Sieb
Wir rufen un s no ch mal die Fermatmethode ins Ged ächtnis: Die gegeb en e Zahl N als Differen z zweier (ni chttrivialer) Quadrate dargest ellt liefert uns wegen
353
27.8 Quadratisches Sieb N = X2 - y2 = (x - y)(x
+ y) zwei eb enso nichttriviale Faktoren von N . Wir verallgem ein ern jetzt diese Id ee: Gegeb en sei eine Kongruen z 2
x ==
dann gilt
l
(mod N) ,
(x - y)(x + y) == 0 (mod N) .
Wenn die se Kongruenz nichttrivial ist , d. h ., es gilt weder x - y == 0 (mod N ) noch x + y == 0 (mod N ), so bekommen wir ebenfalls mi t ggT (x - y , N ) und ggT (x + y , N ) zwei Faktoren von N geliefert . Die Idee des Qu adratischen Siebes besteht darin, nicht direkt solche kongruenten Quadrate zu bestimmen, sondern sie aus betragskleinen quadratischen Resten zu kombinieren . Das läss t sich am bes ten durch ein Beispiel demonstrieren: Sei N = 517631, VN = 719 ,4... . Das Fermatverfahren würde jetzt bei Xo = 720 aufsteigend te sten, ob die Differenz N ein Qu adrat ist . Wi r bekommen dabei u . a .: 724 2 == 5 ·7 ·11 . 17 (mod N )
x; -
2 739 == 2 ·5 ·7 ·11 ·37 (mod N) 2 2 741 ==2·5 .17 ·37(mod N ) Bei Ferm at würden wir noch bis 816 2 geh en , b evor wir ein echt es Quadrat erhalte n. Man sieht aber sehr leicht, dass b ereits die drei obigen Zahlen zusammenmultipliziert au ch auf der rechten Seite ein Quadrat ergebe n, nämlich (724 .739 .741) 2 == (2 . 52 .7 .11 .1 7 .37)2 (mod N) 2 2 =} 473961 == 351126 (mod N) und damit ggT (473961 - 351126, N ) = 431 sowie ggT (473961 + 351126, N ) = 1201. Wenn man es also geschi ckt anstellt, kann man sich viel Arbeit er sparen. Die Idee der Kombination quadratische r Reste gab es schon vor 80 Jahren. Eines der ersten darauf basierenden Verfahren war die Kettenbruchmethode, die in den 60er-Jahren recht populär war. Abgelöst wurde sie aber durch das seit 1981 entwickelte Quadratische-Sieb-Verfahren (Pomerance [75]). Dieses a rbe it et in zwei Stufen: Im Siebschritt werden einerseits hinreichend viele qu adratische Kongruenzen (Relationen) erzeugt , im Auswahlsch rit t wird andererseits versucht , diese zu einem Quadrat x 2 == y2 (mod N) zu kombinieren. Haben wir eine solche Kongruen z gefund en, so ist sie mit Wahrsch einlichkeit 1 - (~)k nichttrivial, wenn k die An zahl der Primteiler von N ist - da jed er Primfaktor p von N theor etisch mit gleich er Wahrscheinlichkeit in x - y wie in x + y ent halt en sein kann .
354
27 Faktorisierungsverfahren
Si ebschritt Aus dem Beispiel ist vielleicht schon die Methode ersicht lich , mittels derer wir an die b egehrten Relationen gela nge n können . Wir erze ugen betragsklein e qu adratische Rest e ri , die nur klein e Primteiler ent halt en. Diese kann man mit hoher 'Wa hrsche inlich keit mit a nde ren Rest en kombinier en, die dieselb en P rimt eiler aufweisen . Kombinieren b ed eutet hier multiplizier en , so dass die jeweiligen Primteiler in gerade r Poten z ent halt en sind. Klar ist dabei : J e größer ein Primteiler, de sto weniger Relationen werden wir finden , die die sen en thalten . Wi r sind also a n "glat t en" quadratischen Re sten inte re ssiert . Die P rimteiler, die wir zul assen , fassen wir in einer Faktorb asis zu sammen.
D e fin itio n 27. 11 (Fa k t o r b a sis ) Sei B E N. E ine Faktorbasis zu B ist eine Menge F = { -1 ,P2 , ... Primzahlen P2, ... .t» ::; B.
,pd
mit •
Negative Reste sind eb enso gewollt , weswegen wir PI := -1 mit aufnehmen . Daneben brauchen wir no ch ein Siebpolynom , das die qu adratis chen Re ste erzeugt . Die ses ist von der Form
Q(i) =
(i+ lv'NJf -N.
Wir können ber eits jet zt die Faktorbasis auf b estimmte Primzahlen Pi einschränken , da in von eine m Siebpolynom Q( i) erzeugt en Rest en r i nicht b eliebi ge Primt eiler vorkommen können . Welche das sind, bekommen wir üb er die Ber echnung de s Legendresymbols heraus.
D efinit ion 27. 1 2 (Legen d resymbol) Sei a E Z und P eine Primzahl. Unter dem Legendresymbol versteht man die Sch reibweise
(~)
, wenn P I a , , wenn a qu adratischer Rest modulo P ist , , wenn a quadratischer Nichtrest modulo P ist.
•
27.8 Quadratisches Sieb
355
Eine Primzahl P kann nur dann ein Teiler von Q (i) sein, fall s (i
l
+ VNJ)2 ==
N (mod p) gilt, was sofort (~) = 1 impliziert . Bei Erst ellung der Faktorbasis wird daher zu j ed er Primzahl das Legendresymbol a usgewertet . Das geht a uch für große Primzahlen seh r schnell, da es einige einfache Rech enregeln für das Legendresymbol gibt .
Sieht man von der 0 ab, so gibt es modulo eine r ungeraden Primzahl genauso viele qu adratische Reste wie Nichtreste; im Endeffekt fall en dadurch ca. die Hälfte a ller Primzahlen durchs Raster. Als näch st es b enötigen wir das Siebintervall. Dieses defini ert diejenigen i E Z, für die wir die Werte Q(i) verw enden . Es ist von der Form
wob ei 0 ~ E: ~ ~ gilt . Das b ewirkt , dass die damit gewonnen en quadratischen Reste von der Größenordnung Q(i) E O(N~ +E:) sind. Wir erze uge n uns also fortlaufend Werte Q(i) und sch auen , ob diese über der Faktorbasis F zerfallen , d . h. , Q(i) besitzt nur Primfaktoren aus der Faktorbasis . Die naive Method e, dazu eine Probedivision durch all e Faktoren paus F durch zuführen, ist uns dabei viel zu langsam. Stattdessen bedi en en wir uns eines deutlich schne ller en Siebverfahrens , das a uf der Äquivalenz
mit l E Z , sEN b eruht . Dabei lösen wir zunäch st die Kongruen z Q(i)
== 0
(mod
pj)
für a lle Primzahlen Pj E F und in Fr age kommenden Exponenten s , Man beachte, dass Q ein qu adrati sches Pol ynom ist . Modulo einer Primzahl haben solche Polynome höchstens zwei Nullstellen (wir mü ssen demzufolge au ch alle Lösungen betrachten) . Die Nullst ellen lassen sich au ch für große Primzahlen schnell be stimmen ; das gilt ebenfalls für die Nullstellen modulo einer Primzahlpotenz. Haben wir nun zwei Lösungen il und i2 erhalten , so bekommen wir alle weiteren einfach durch Addition ganzzahliger Vielfache r l . pj zu i l bzw. i2 . Die Ergebnisse wer den in eine r Siebtabelle festgehalten. Die Zeilen markier en den Index i und die Spalten die Primzahlen Pj der Faktorbasis . Die Einträge sind die Vi elfachheiten s des Vorkommens der Pj in der Faktorzerl egung von Q(i) . Untensteh end zu seh en ist die Siebtabelle (Tabelle 27.1) für unser Eingangsb eispi el N = 517631 und das Siebintervall I = [- 24, 24].
356
27 Fa kt orisier ungsverfa hren
Tab. 27.1: Siebtabelle für N = 517631 - 1
2
5
7
11
13
17
1
-
-
3
1
- 22015
1 1
-
1
1
-
-
- 14950
1
1
2
-
-
1
717 721
- 3542
1
1
1
-
1 1
-
2210
1
-
-
724 734
6545 21125
-
-
1
1
1
-
-
3
-
-
i
Xi
Q (i )
- 24 - 15
695 704
- 34606
- 10 - 2
709
2 5 15
23
37
-
-
-
1
-
1
-
1
-
-
-
1
-
1
1
-
-
-
1
-
-
2
-
-
-
20
739
28490
-
1
1
1
1
-
-
-
1
22
741
31450
-
1
2
-
-
-
1
-
1
In die ,,finale" Siebtabelle kommen natürlich nur die Q(i) , die über der Faktorbasi s F zerfall en . Um festzustellen , ob das der Fall ist, müssen wir während des Siebvorgangs Q (i ) durch gefundene Faktoren pj dividieren . Wird dadurch am Ende Q(i) zu 1 reduziert, so ist Q (i ) über F vollständig zerlegbar. Auswahls chr itt Nachdem wir im ersten Teil des Ver fah rens hi nr eichend viele - was "hinreichen d" b ed eutet , werd en wir gleich seh en - Relationen der Form xl == Q(i ) (mod N) gefunden haben, werden diese nun im zweiten Tei l zur gesuchten Lösung kombiniert . W ir haben also insgesamt l qu adratische Reste Q( i I), . . . , Q ( id gegeben und su chen jetzt eine Auswahl {i m u . . . , im,, } k sogar eine Lösung garantiert ist . Falls sich als Lösung eine triviale Kongruen z ergibt, muss wenigstens ein e weiter e Kongruen z gefunden werden.
B e is p ie l Bleiben wir bei unserem Beispiel N = .517631. Die Siebtabelle haben wir schon gesehen, im zugehörigen Gleichungssystem A z == 0 (mod 2) ist dann
A=
1
1
1
1
0
0
0
0
0
0
1
0
1
1
1
0
0
1
1
0
0
1
0
0
1
1
1
1
0
0
0
1
0
1
0
1
0
1
0
0
1
0
0
1
0
1
0
1
0
1
0
1
0
1
0
0
0
0
1
0
1
0
0
1
1
0
0
1
0
0
0
1
1
0
0
0
0
0
1
0
1
0
0
0
0
0
1
1
1
und z =
0
Um zwei kongruente Quadrate zu erzeugen , müssen also die Relationen 6, 8 und 9 kombiniert werden (entspricht den Werten i = 5, 20 und 22) .
Erweiterungen j Ve r b e ss e r u n ge n Der Siebschritt ist natürlich parallelisi erbar, da man unabhängig von einander verschied ene Werte Q( i) berechnen und über verschied enen p E F sieben kann . Man kann aber noch weiter e interessante Erweiterungen einba uen. 1) Verwendung von partiellen Re lationen Man kann die Forderung, dass ein quadratischer Rest über F zerlegbar sein muss , etwas abschwächen. Man lässt in der Faktorzerlegung einen Primfaktor q außerhalb von F zu, der aber eine bestimmte (nicht zu hohe) Schranke nicht überschreiten darf. Findet man zwei solche sogenannten partiellen Relationen mi t demselben Faktor q, so lässt sich q durch Kombination beider Relationen eliminieren. Damit man eine Chance auf solche P aare hat, darf q aber nicht zu groß geraten. 2) Verwendung von Heuristiken Weiterhin hat man herausgefunden , dass sich das Sieben nach großen Primpot enzen v' nur für kleine p lohnt und schränkt sich hier ent sprechend ein - auch wenn dadurch möglicherw eise Relationen übersehen werden.
358
27 Faktorisierungsverfahren
Eine weit ere brauchbare Modifikation ist das logarithmische Sieb en . St at t die Wer t e Q(i ) durch gefunde ne Faktor en pS zu dividieren , hält man sich eine Tabelle mit den Logarithmen der v' bzw. der Q(i ). Eine Di vision erse tzt man dann durch eine Subt rak ti on des ent sprechen de n Logarithmus. Dahint er steckt die Tats ache, dass eine Subt rakt ion schneller a usge führt wird als eine Div ision . Die Logarithmen werden mit einer hinreich end groß en Gen auigkeit gespeichert. Ein Rest zerfällt übe r F , fall s die Subtrakt ione n einen Wert sehr dicht b ei 0 ergeb en. Nachteil: die Rundungsfehl er st ellen eine (theor et ische) Fehl erquelle dar. 3) Verw endung von Mehrfachpolyn om en Wi r be nu tz ten bis je t zt ein ein ziges Siebpolynom der Ge st al t Q (x) = x 2 - N . Nur für weni ge x sind die so erzeugte n Re ste wirkli ch klein ; und m an ist nat ürlich a n mögli chst klein en Re sten inte re ssier t , da diese mi t höherer Wahrscheinli chkei t üb er der Faktorbasis zerfallen. Daher gibt es eine erweit ert e Variante, die vari able P olynome der Form
Q( x ) = (ax
+ b)2 -
N
verw endet . W ählt m an hier a und b so, dass a ein Teiler von b2
Q( x) = (ax
+ b)2 -
N = a 2x 2 + 2abx
+ b2 -
-
N ist , so gilt
N = a - (ax 2 + 2bx
+ c)
für eine ganze Zahl c. Das bedeu te t : Q (x) ist immer durch a teilbar , so dass man nur die Wert e Q (x) / a bet rach t en mu ss. Man kann sich also ein a wählen un d erhäl t dadurch meh rere Siebpolynome. Ei n zu groß es a füh rt ab er leider dazu , dass die Wert e Q( x) schneller anwachsen. Um ein zugeh öriges b zu bekommen , löst man die Kon gruen z b2 == N (mod a). Au ch hier kann man tricksen, da die Zahl de r Lösungen dieser Kon gruenz umso größ er ist , je mehr P rimfaktoren a besi t zt . Man wählt daher gern solch e a m it vielen verschiedenen kleinen P rimfak toren und erh äl t entsprechend viele Siebpolynome. 4) Eine Weiter entwicklung: Das Zahlkörper sieb Ende der 80er-Jahre gelang eine deutliche Verbesserung durch E rfindung des Zahlkörper sieb es. Das Verfahren benutzt algebraische Zahlkörper und erzeugt viel glattere Relationen als das ori ginale QS . Wer sich für die ses Verfahren inte ressiert , lese z. B. in Lens t ra [76] weit er. Laufzeit
W ählen wir die Faktorbasis sehr groß , so find en wir a uch schnell geeigne t e Relati onen , benötigen ab er a uch viele davon und mü ssen an schli eßend no ch ein Riesen gleichungssyst em lösen . Ist die Faktorbasis dagegen klein, suchen wir mitunter sehr lange. Gesu cht ist also wied er einm al der gold en e Mittelweg.
359
27.8 Quadratisches Sieb
Fangen wir mit dem Siebverfahren an . F ent hält alle Primzahlen p ::; B . Hat man mit dem Siebpolynom n quadratische Rest e gewonnen , so werden zu jed er Primzahl p E F in sgesamt n lp Eintragungen in der Siebtabelle vorgenommen . F ür den Gesamtaufwand ergibt sich daraus
L ~ ~ n · Jkl~(k) B
pE F p
2
dk
~ n · ln (ln (B )).
Die Integr alabschätzung bekommt man aus dem Primzahlsatz, aus dem man die Größenordnung k ln(k) für die k-te Primzahl folgern kann. Pro berechnetem quadrati schen Re st b enötigen wir also gerade einmal ln(1n(B)) Operationen für das Sieben. Jetzt müssen wir un s natürlich überlegen , wie viele quadratische Reste wir durchprobieren müssen , bis uns eine der gewünschten Relationen üb er den Weg läuft . Für diese muss der Rest üb er F zerlegbar, also B -glatt sein . Dazu b enötigen wir wied er die in Kapitel 6 vorgest ellte Glattheitsfunktion 'ljJ und den Satz von Canfield , Erdös und Pomerance. Nehmen wir an , alle vom Siebpolynom erzeugten Re ste sind im Betrag durch x bes chränkt . Es ist dann x . 'ljJ (x, B )-l die zu erwartende Anz ahl a n benötigten Versuchen, um einen B -glatten Res t zu bekommen. Um im Au swahlsch ritt das Gleichungssystem lösen zu können , benötigen wir etwa Jr(B) Rel ationen . Wir können also eine Gesamtlaufzeit von
L( x) = In(1n(B)) . Jr(B) . x · 'ljJ (x, B) -l an setzen. Der P rimzahlsatz sagt uns Jr (B) ~ B I ln(B) , wir können In (ln( B )) . Jr (B) also mit B großzügig nach oben ab schätzen. Um den Satz von Canfield , E rdös und Pomerance a nzuwenden, set zen wir B := x l / u , also L(x) = x l / u . x· 'ljJ (x,X l /U )- l. Anwenden des Satzes ergibt
Um die Laufzeit zu m inimier en, machen wir wied er den An satz dL I du = 0, was uns a uf 2(1n(u) ln(x) = u + 1) füh rt . Man be ach te die Ähnlichkei t zur Laufzeitanaly se in Kapite l 6. An alog zu dieser bekommen wir U opt ~ J2In( x )1 In(1n(x)) . Fehl t nur noch das Einsetzen und Vereinfachen: L(x) = et In (x )+u In (u ) = e 1n( x) · V ln (l n( x» /2 1n( x)+! In (21 n (x ) / ln(ln (x » )·v21n (x ) / ln t ln fz ) = e V ! In (x ) In(l n (x »+ ! ln(ln (x »·v21n (x ) / ln (l n (x » = e V 2 1n (x )ln(ln (x »
360
27 Faktorisierungsverfahren
W ie scho n erwähnt , sind die qu adrati sch en Reste im Bet rag durch N ~ +E: b esch ränkt , wob ei man mit e --t 0 (für N --t (0 ) a us kommt, al so:
L( N) =
e
\/2 ln (N ! + O(l )
In (ln ( N !+O(l ) )
= e V (l+o( l» ln (N ) ln (ln (N »
Man kann jetzt no ch nachrechnen , dass die optimale Wahl von B in der Größenordnung B
~
~e
(~ +o(l» · vln( N) ln (l n ( N »
liegt. Soweit der Sieb schritt . Das Ganze würde natürlich gar kein en Sinn machen , wenn die eigentliche Komplexität im Auswahlschrit t läge . Dort haben wir ein Gleichungssystem mit einer (I x I)-Mat rix (wobei 1 :":::i B) zu lösen . Die GaußElimina tion hat zwar allgemein eine Laufzeit von O(z3), doch handelt es sich hier um ext re m dünn b esetzt e Matrizen . Man kann j a leicht nachrechnen , dass die An zahl der auf 1 geset zten St ellen in eine r Spalte durch et wa In( N) b esch ränkt ist . In der Praxi s er gibt sich daher eine Laufzeit von B 2 +o ( 1 ) für den Au swahlsch ritt, wob ei man ehe r speziell a uf solche Mat rize n zuges chnit tene Algorithmen verwende t , z. B . das "Block Lanczos"-Verfahren. Der Au swahlschritt ist gegenübe r dem Sieb schritt fast vernachlässigba r. Das ist a uch gut , da sich ersterer - im Gegensatz zu letz terem - schlecht parallelisieren lässt . Die Laufzeit hat starke Ähnlichkeit mi t der Lau fzeit de r Elliptische-Kurven-Methode. Das ist ab er kein Zufall, da die Komplexität beider Verfahren durch glat te Zahlen be stimmt wird . Das QS unterscheidet sich von ECM dadurch , dass de r Aufwand a usschließlich von der Länge der Eingabe N a bhängt und unabhängig von der Größe der Primteiler von N ist. In der Praxis läuft es meist auf eine Arbeitsteilung hinaus. Faktoren bis et wa ifN werden mit ECM schne ller gefunden . Bleiben dagegen genau zwei Faktoren größer al s ifN übrig, so gibt man dem QS den Vor zug, welches in diesem Fall seine St ärken ausspi elen kann .
N a ch t r a g Ein klein es Konsolenprogramm , das auf dem Mathep lanet en verfügbar ist [77], hat einige der vorgestellten Verfahren implementiert , so das s man das Ganze auch einm al ausprobi er en kann. Die Verfahren und die ihne n zugrunde liegenden Id een sollten dem Leser ein Gefühl für die Problematik und die damit verbunden en Schwieri gkeiten gebe n . Wi e schwer Faktorisier en wirklich ist , ist eine noch ungekl ärte Frage. Möglicherweise wird ja doch noch ein "sch ne ller" Algorithmus gefunden . Kay Schönberger ist Dipl.-Informatiker und lebt in Berlin.
Teil V Ausblick auf Weiteres
28 Fouriertransformation
Übersicht 28.1 Motivation
363
28.2 Zeit und Frequenzbereich
364
28.3 Der Weg zur Fouri ertransformation
365
28.4 Beispiele mit dem Oszilloskop
368
28.5 Die Faltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372 28.6 Systeme ........ . .... ......... ...... ... ..... ....... . ........ 375 28.7 Was es sonst noch gibt
28.1
377
Motivation
Gegen das mathematische Ende des E lektrotechnik-Studiums wird man zu den Funktionaltransformationen (oder Int egraltransform at ion en) gelangen. Es ist ein wichtiges Ziel der Ausbildung, diese Transformationen anwenden zu können . Sie sind sozusagen das Schwei zer Sackmesser des Elektroingenie urs. Dieser Beitrag zielt in erster Linie auf die praktische Anwendung ab. Dazu mag es manchem schon genügen, etwas über komplexe Zahlen zu wissen und alge braische Gleichungen lösen zu können . Das ist natürlich komfortabel , denn es ist gut möglich , solchermaßen ausgerüstet Prüfungen zu best ehen und a uch praktische Probleme zu lösen . Wer es ab er genauer wisse n will , kommt nic ht darum herum, sich mit Fu nktionentheorie zu beschäftigen. Auch von linearen Differentialgleichungen sollte man etwas verstehen. Hier geht es vor allem um die Motivation: Wieso und wozu ist das gut? Und die Antwort kann ich zusammengefasst gleich vorw egnehmen : Für nahezu jede Form der Signalvera rbeit ung, seien es optische, akustische od er a nde re Signale.
364
28.2
28 Fouriertransformat ion
Zeit und Frequenzbereich
Die meisten Menschen sind es gewohnt , in zeitlichen Abl äufen zu denken , das ist unsere a llt ägliche Erfahrung. Nahezu jeder wissenschaftlich interessierte Mensch kennt die Signaldarstellungen auf dem Oszilloskop. Was wir a ls Ton hören , wird zu einer Linie der Intensität über die Zeit . Aber wie hören wir diesen Ton? Unser Ohr zerlegt das Signal keineswegs in kleinste Zeiteinheiten , wie es dies das Oszilloskop t ut , sondern es filtert die einzelnen Frequenzen hera us, wie in der Abbildung 28.1 veranschaulicht ist . E
Abb. 28.1: Signalweg im Ohr Im Schallverlauf E(t) , also im Zeitbereich , sieht man die einze lnen Frequenzen nur sch lecht . Im Ohr muss also eine Transformation in den Fr equenzbe reich stattfinden . Umgekehrt, wie in Abbildung 28.2 gezeigt , geht es a uch . Spielt man Töne a uf einer Orgel, so ad dieren sich die Schwingungen und können mit dem Os zillographen b et racht et werden. Aus Signalen verschiedener Frequen z setzt sich also wieder ein Zeit signa l zusammen. E
t Abb. 28.2: Von der Klaviatur zum Zeit signal Man sieht sofort: Die zeitliche Darstellung lässt kaum erkennen , welche Tas ten gedrückt wurden. Das Frequenzgemisch sieht ziemlich chaotisch aus . Wie kann der Mensch aus diesem Tongemisch wieder etwas Sinnvolles hera ushören? Einerseits zerlegt unser Gehör das Signal wieder in seine Frequenzen. Aber das Gehör und seine Nervenzellen tun noch viel mehr. Störgeräusche (z. B. das Blut rauschen ) müssen hera usgefiltert wer den. Tonfolgen müssen er kannt werden usw. Früher hat man versucht , diesen Geh eimnissen durch Ti erversuche a uf die Spur zu kommen. Wichtige Durchbrüche hat man j edoch erst erzielt , als man neue mathematische Methoden auch mit schnellen, logischen , programmier baren Baustein en aus probier en konnte (FPGA, DSP).
365
28.3 Der Weg zur Fouriert ransformat ion
Di e Folgerung: Mathematik rettet Katzenleben! Heute sind di e Funktionaltransformationen und a bge leitete Berechnungen daraus zu einem wichtigen Wirtschaftfaktor geworden . Das Handy ist nur das naheli egendste Beispiel für moderne Signalverarbeitung. Der Röntgentomograph m acht di e Bildgebung auch ni cht m ehr mit Fotoplatten.
28.3
Der Weg zur Fouriertransformation
Nach de r Einleitung jetzt ein wenig Mathematik: Ich habe von Transforma tionen vom Zeit - in den Frequenzbereich gesp ro chen . Man kann nun versu chen , eine solche Transformation m athematisch zu beschreiben . Eine Sinusfunktion mit der Zeit als Parameter lä sst sich a uch folg endermaßen sch re ib en: sin ( t ) =
e i .t
-
e - i-t
---,::-...,--2·i
Anschaulich ist dies die Differenz zweier gegenläufig ro tierender Zeiger auf dem Einheitskreis. Da die Differenz im aginär wird , muss sie mi t der Di vi sion durch 2i no ch um - 90 0 auf die re elle Achse gedreht werden . M an kön nte diese Schwingung a uch a llein durch die beiden Frequenzen +w und -w und die Amplitude
A definieren . Somit ist b er eits so et was wie eine Transformation definiert. Di ese einfa che "Tra ns form at ion" hat all erdings zwei Na chteile: 1. Ist das Signal im Zeitbereich aus Schwingungen verschied en er Fr equen zen zusam menge setzt , so lä sst sich di ese Zusammensetzung nicht erm it teln. 2. Wirkliche Sign a le sind nicht unendlich lang. Außer der Amplitude muss a uch no ch ih re Zeitdauer berücksichtigt werden. Diese Na chteile lassen sich durch eine b essere Methode beseitigen . Zu 1. Durch M ult iplikation mit eine r Testfunktion können di e einzelne n Fr equ en zen er m it telt werden . Di e Testfunktion lautet b ei der Fouriertransformation e- iw t . M an nennt di ese Funktion den Kern d er Transformation . Um zu seh en, wie gut ein Signal auf den Kern passt , wird das Produkt über di e Zeit integriert. Zu 2. Im einfachen Beispiel nahm ich eine unendliche Sinusfunktion a n. Um die sem Umstand gerecht zu werden , könnte m an eine weitere Zahl einführen für die Zeitdauer oder (u nd so wird es gemacht) m an verschmilzt Amplitude und Dauer mittels Integration , wa s j a bereits in der Besprechung zu Punkt 1 nahegelegt wird . Nach diesen prakti schen Überlegungen mag die Fouriertransformation ni cht mehr so fremd erscheinen:
Y(w) =
~ ./ 271"
-0000 y(t) . e-
iw t
.
dt
(28.1)
366
28 Fouriertransformation
Dazu no ch einige E rklä ru ng en: Hier wird die Kreisfrequen z w = 2·7r·f ver wendet . Man kann ebe nso gut f verwenden , mu ss abe r die Vorfak toren anpassen : fällt dann weg. Dies handhabt jedes Bu ch ode r Skript et was ander s.
2\.
28 .3.1
Vo n den Fourierreihen zur Transformation
Eine n weit er en Eins t ieg bilden die Fourierreih en . Damit kann m an das ers te Problem lösen und ein Signal in seine Fr equen zb estandteile zerlegen. Die Ei nsch ränkung aus P unkt 2 (Fourierreih en b eschreib en unendliche p eriodische Signale) muss a be r noch beseiti gt werden . Ein Zr-pe riodisches Signal sei auf [- T, T ] ab solut int egri erbar (J : :IR --+ C). Die Fourierkoeffizient en lauten :
Ck(J ) =:
2~"JT
-T
Die Fourierreihe ist dann:
L CXJ
f(t ) . e- i.\'.' .t dt
Ck(J) . e i . k~rr -t:
k = -CXJ
Der Gren zwert dieser Reihe (fall s sie konv er gier t) ist wied er die ursp rüngliche Funkt ion f . (Dazu muss die Funkt ion a n Un st eti gkeitsstellen das Mittel der links- und re chtsseit ige n Gren zwer t e sein . An Stet igkeitspunkten ist das automatisch erfüllt. ) Dann gibt es eine Bij ekti on zwisc he n f und der Folge Ck (J) der Fourier koeffizienten . Um a uch nichtperiodische Funkt ione n zu b ehandeln , kann man die P eri od e in eine m Gren züber gang unendlich wach sen lassen . Wir haben al so eine a uf :IR ab solut integri erbare Funktion f : :IR --+ : >: >:
;j
05
-
I
lI
[:l.
tI)
0
-
-
I
- 20
I
o
l.
40 ~
'"(j
-
I
(j
v
I
""'"s,
"co
.;1
20 -
:
Cl
-
I
20
tIl
o-
I
0
200
400
F r e qu e n z ( k H z)
Abb. 28.5 : Rechteckpul s t ransformieren Die Funktion im Bild rechts ist von der Form Isinc (a· f) 1Nun machen wir das Gegenteil von vorhin. Die Fouriertransformation und die Rü cktransformation
28.4 Beispiele mit dem Oszilloskop
371
sehe n sehr ähnlich au s. Was passiert also, wen n man die sinc (t ) Funkti on in den Fre que nz bereich t ransform iert? Die Antwort soll die Messung in Abbildung 28.6 gebe n . Bis auf die erwarteten Feh ler ergibt sich b ei dieser Messu ng wied er ein Recht eck. Frequ en zb er eich
Zeitbereich 1
-
Il:l
::.
c:; >: >: >:
;j
3
"'.8"
.:,e
05 -
'"
Cl
[:l,
t.r)
<J
'"ij
o-
>:
tIl""
- 500
0
o
500
Z e i t(fl s )
50
100
F r e qu e n z ( kH z )
Ab b. 28.6: Sinc tra nsformieren
28.4.3
Die Dreieckfun ktion
In Abbi ldu ng 28.7 erkennt man die Koeffizient en der Fourier re ihe. Dank der Tatsache, dass nur ein endliches Signal t ransform iert wurde, sind diese Spi t zen auc h nicht unendlich hoch . Die Fre que nze n liegen b ei der Grundfrequenz, dem 3, 5, 7-fachen usw. Frequ en zb ereich
Zeitbereich Il:l
::.
60 -
3
>: >:
"'.8"
[:l,
'"ij
<J
tIl""
"">:
;j
Cl
.:,e
40
'"
20
>:
t.r)
- 1
0
1
Z e i t (m s )
0 0
10
20
F r e qu e n z ( kH z )
Abb. 28.7: Dreiecksignal t ransformieren
Bei dem gefensterten Dreieck (Abbildung 28.8 ) tauc ht wieder dieser ,,\Terschmiereffekt" auf. Dieser trägt die nic ht ga nz offensichtliche Bezeichnu ng Leck effekt.
372
28 Fouriertransformation
Fr equen zb ereich
Zeitbereich
1
:::.
§""
0
>:: >::
es
[:l.
t1)
1 und m (q, m ) gibt es ein N E N mit qm - 1 2 -- = N
> 2. F ür
welche Paare
q -1
Vorbemerkungen:
(1) 0 ist bei mir keine natürliche Za hl , No := NU { O} (2) a == b(m) b edeut et a == b mo d m (3) Es sei stet s d E N , d > 2, d · (d - 1) quadratfrei (4) pT 11 n : p , mit ganzzahligen Koeffizienten st eh en , sind alle Summanden durch p! t eilbar (ein Vielfaches jed es Faktors aus p! find et sich in der Folge der Exponenten von x , die vor den Koeffizienten au s Z mu ltipliziert werden) . Der erst e Summand der Einzelsumme ist immerhin noch mit der gleichen Begründung durch (p - I )! t eilbar. Beim Bestimmen der (p - l )-t en Abl eitung des Terms für f an der St elle x = 0 fehlt nur in eine m der vielen Summanden der Fa kt or x , und nur dieser liefert daher eine n nichtver schwindenden Te rm : Es ist derj eni ge, in dem x p-l( p - l j-mal abgeleitet wird und die (x - k)P gar nicht. Also ist
J j ist eine ganze Zahl und wegen oo < P und r (p - I)! , aber kein Vielfaches von p . Daraus folgt 1
IJjl =
Cl '
1
(p - I)! ,
Cl
E Z,
k' x k, grad 9 ~ 2. T
g E
Q[X ]' g(x) =
k =ü
De r Hauptnen ner aller Koeffizien ten von 9 sei B. Na ch Satz 32.7 ist damit B · i- 7r eine ga nz-algebraische Zahl. Nach dem Fundamen t alsatz der Algebra zerfällt 9 üb er Q in r versch iede ne Lin earfaktoren :
g(z) = (z - 6)' (z - 6 )· ... · (z -
~T )
Dabei sind 6 ,... , ~ T die Konjugierten von i . 7r , also sämt liche Nullst ellen des Minimalpolyn om s von i . tt . Unt er diesen Konjugierten b efindet sich , da die Koeffizienten von 9 alle reell sind , a uch das konjugiert-komplexe - i . tt . Gen au wie B · i . 7r sind a uch die üb rigen B . ~j ga nz-algebraisch , also Nullst ellen des normierten Polynoms d au s Z[ X], welches man gemäß dem Verfah ren au s Lemma 32.7 au s 9 gewinnt . Demnach ist d das Minimalpolynom sämt liche r Konjugierter von B· i· tt . Mit der Ganzzahligkeit der Koeffizienten im Minimalpolynom d von B . i . 7r können wir b ei der algebraische n Abs chätzung von Funktionalausd rü cken deren Ganzzahligkeit nachweisen . Man bildet dazu den Au sd ru ck
Da i . null .
7r
un te r den Konjugierten ist und e i
' 7[
= - 1, ist dieses Produkt gleich
Man multipliziert das Produkt au s und erhält : T
1 + L e~j + j =l
L
e~j Hk
+ ... + e~l+ ...H , .
l ~j < k ~T
Sei c k = (c1k , ... , c Tk ) E {O,IY, k ein Index, der die 2 T El em ente von {O,IY durchläuft , dann ist das Produkt 2' >
(1 + e~ l ) . (1 + e6 ) . . .. . (1 + e~' ) =
L
k= l
eE: l k >~ l + » >+E:, k ' ~r
32 Tra nsze ndenz von e und tt
422
eine Summe aus 2 r Exponen tialtermen , unt er der en Exponen t en all e Summen a us den ~j vorkommen , die möglich sind, wenn jed es ~j ent wede r hineingenommen wird ode r nicht. Diese 2 r Summen werden zur Ver einfachung nun 'Pk geschrieb en : r
'Pk = L:>Sj k . j =l
~j ,
1 ::;
< 2r .
k
Wichtige Konsequen z: P ermutiert man die Indizes der ~j irge nd wie, so steht der zu dieser Oper ation gehöre nde Term wied er unter den Summanden . Zu j ed em 'Pk = c1k .
6 + ... + Crk
. ~r
ist a lso auch die ga nze Bahn bzgl. der symmetrischen Gruppe S r unter den 2 r Faktoren, al so ex ist iert zu j ed em (J' E S r ein l E {I , ... , 2 r } mit 'PI = c 1k . ~O'(l)
+ ... + Crk . ~a( r ) '
Mi ndes tens zwei von diesen Summen sind null - nämlich die zu 'Pnl = 0 und 1r + (-i· 1r) gehöre nde n. Sei q die An zahl der er , die null ergebe n; diese tragen zum Produkt
'Pn2 = i·
(1 + eel ) . (1 + e6 ) ..... (1 + e!;n ), wenn man es zur Summe a usm ult ipliziert, jeweils den Summanden 1 bei. Dieses Produkt kann d ann als Summe folgendermaßen geschrieben werden : q
+
n
I: e'Pk
=
mi t n
r
2 - q
k =l
Ein en ts cheidender Tri ck bei der a lgebraischen Ab schätzung wird sein , die Summe über 1, ... , n mi t - q ident ifizieren zu können , um daraus eine Teilba rkeitsa uss age zu gewinnen. Wir wählen eine Primzahl p - die groß genug sein muss , denn über deren Größe wird sp äter der Widerspruch geführt - und de finieren das Polynom f vom Grad n - p + p - 1:
f (x) = B n·P . x p - 1 .
n
TI (x -
'Pk )P
k= l
Das Polynom f ist in den Ausdrücken 'Pk sym me t risch, d. h. gegenüber jed er P ermutation der 6 ,... , ~r invariant , und sein e Koeffizienten sind , wie man durch Au smultiplizier en des Produktes er kennt , ganzzahlig. Der Hauptsatz über' elementarsymmetrische Funktion en (32.8) garantiert nun , dass das au smultiplizierte P olynom eine pol ynomiale Darstellung in Sl ,n('Pl , .. " 'Pn ), S2,n('Pl , ... , 'Pn ),
32 .3 Die Tra nszendenz von
423
7r
. .. , Sn ,n('Pl , . . . , 'Pn)
besitz t , die a ufgru nd der Ganzzahligkeit de r Koeffizient en von f (x) wiederum ga nzza hlige Koeffizien ten hat . Au ßerdem gilt , dass das P roduk t 21'
TI (x -
'Pk ) = x
2r
n
-n.
k= l
TI (x -
'Pk)
k=l
m den Konjugier t en 6 ,... , ~r von i . 7r wied er symmetrisch ist . Let zt er es ist darin b egründet , dass zu j ed em (J" E S r ein l E {I , .. . ,2 r} exist iert m it 'PI = c l . ~CT ( l )
+ .. .+ Cr
. ~CT ( r ) ,
also die P rodukte auch de ssen Line arfak to r en thal t en. Also läs st sich - wied erum nach dem Satz über eleme nt arsymme t rische Funktionen - d ieses Produkt als P olynom mi t ganzzahligen Koeffizienten in den elementarsy mmetrischen Funkti on en s l , r(6 , · · · ,~r) ,
s2,r( 6 , · ·· , ~r ),
... ,
schre ib en. Di e eleme ntarsy m metrische n Funkt ione n in aufs Vorzei chen) die rati on alen Koeffizi enten
6, .. . , ~r sind ab er (bis
l ,br -l , .. . , bo
des normier t en Minimalp olyno ms g . Das ergibt sich au s der Id entit ät r
I)k' x
k
= (x -
6)' (x
-
6 ) · · · · · (x
- ~r )
k =O
nach Au smultiplizier en der rech t en Seit e. Es gib t also ein Pol ynom F E Z [X, X r r
x2 - n o
l , . . . ,
X o], so dass
n
TI (x -
'Pk) =F(x ,br- l , . . . , bo) .
k= l
Die Koeffizient en von n ~~~q (x - 'Pk ) sind die gleichen wie die des Produkt s über a lle 2 r Linearfak t oren , a lso rationale Zahlen , ebenso diejenigen von de ssen p-ter P ot enz . Der Vorfakt or B st eht in f (x) n 'p-mal vor der p-ten Potenz dieses Produkts und damit a us reiche n d oft , um die Koeffizient en von f a lle zu ganzen Zah len zu ma chen. Die D arstellung von f mi t Koeffizi enten sei n·p+p- l
f (x) =
2..:
j =O
«s x
j
mi t Y j : aj E Z .
32 Tra nszende nz von e und
424
32.3.3
tt
Zwei konträre Abschätzungen
Nun bedienen wir uns wieder des bereits aus dem Beweis der Transzendenz von e b ekannt en Funktionals
Man beachte, dass Integrale dieser Art auch für t E C woh ldefini ert sind, sofern der Integrand eine auf ganz C holomor phe Funktion ist, also eine Stammfunktion besitzt . Also gilt die Standardabschätzung für Int egrale, "Betrag eines Integrals ist kleiner oder gleich der Länge des Integrationsweges mal dem Maximum des Betrages auf diesem Weg" insbesondere für den kürzestmöglichen Weg in C , den geradlinigen Weg von u = 0 nach u = t .
Algebraische Abschätzung eines Funktionals Von Ij leit en wir das Funktional
ab, welches - wie im Beweis der Transzendenz von e gration ausgewertet wird zu
J!
mittels partieller Inte-
(~ e") . (~ /j)(O)) -~~/j)(~,)
C%-'/j) (0)) - ~ n%-, !u, (~k)
(~' e").
Wegen der Herleitung aus der partiellen Int egrat ion kann apriori keine andere Obergrenze für die Summe über j angegeben werden; deshalb geht die Summe bis unendlich. Höhere als (n . p + p - l)-te Ab leitungen sind aber allesamt 0, können also ignoriert werden . Wir setzen
m := n - p
+p
-
1.
Damit ist
Wegen q + L-~'=~q e 'P h.
= 0 ist die erste Summe
L m
i, = - q.
j =O
n
LL m
j(j )(O) -
- q:
j =Ok=l
j(j )(j ' ~j .
j = 1
Also lässt sich J j als ganzzahliges P olynom in den elementa rsym me t rische n Funkt ione n
sl ,r(B · 6 , ... , B · ~r) , s2,r (B · 6, ... , B· ~r ),
,
. ..
sr,r (B · 6 , ... ,
B'~r)
schre ibe n . Diese sind gleich den Koeffizienten im Minimalpolynom d von B · i . 7r, also ganzzahlig, so dass wir folgern können , dass Jj eine ga nze Zahl ist. Ist der Ableitungsgrad j echt klein er als p, so ist j (j ) ('Pk) = 0 für alle k E {I, ... , n} , da die 'Pk als p-fache Nullste llen kon struier t sind. Zu der Doppelsumme tragen also nur die p-t e und höher e Abl eitungen bei, deshalb ist die Doppelsumme ein Vielfach es von p! . Ist j < p -l, so ist au ch j (j ) (0) = O. Ferner ist a uch j (j ) (0) ein Vielfach es von p!, falls j :::0: p. Die interess antest e Ableitung ist also j (p-I ) (O):
'PI . 'P2 . . .. .'Pn ist symmet risch in den Konjugierten ~j von i- 7r: Zu jedem Fak tor 'Pk = C l . ~ I + ... + Cr . ~r ist auch die ga nze Bahn bzgl. der symmetrische n Gruppe S r un te r den n = 2 r - p Fak to ren . Also ex istiert zu jedem (J" E Sr ein l E{1 , . .. , 2 r - p} m it
'PI
= Cl
.
~CT( I)
+ ... + C l
.
~CT (r)'
Demzufolge ist , wieder nach dem Haupt satz über elementar symmet rische Funkt ionen , tr: . 'PI . 'P2 .. . .. 'Pn ein ganzzahliges Pol ynom in den element a rsymmetrischen Funktionen der B · ~j . Diese sind als die Koeffizienten des Min imalpolynoms d von ganz-alg ebraischen Zah len ganzzahlig, also ist B ": 'PI' 'P2 · .. . · 'Pn ganzzahlig. j( p- I) (O) ist folglich ein Vielfaches von (p - I)! .
426
32 Trans zenden z von e und rr
Die Primfaktoren in Bund 'f/I . 'f/2 ..... 'f/n sind fest und unabhängig von der Wahl der Primzahl p . p kann also so groß gewählt werden , dass es wed er in B noch in 'f/I . 'f/2 .... . 'f/n vorkommt . So ist gewährleist et, dass j (p - I ) (0) nicht Vielfaches von p! ist. Wir gewinnen die Darstellung:
- q . a- (p - I)! - b· p! mit a , b E Z, p kein Teiler von a
JI {=}
I (P ~l)!1 = Iq ·a+ b , pl
Ist zude m noch p t eilerfremd zu q, so t eilt p wed er q noch a , und der Betrag ist eine natürliche Zahl echt größer null. Damit folgt IJ I I
=
C3 •
(p - I)! ,
E
C3
Z,
C3
:::0:
1.
Soweit die algebraische Ab sch ätzung des Funktionals.
Die analytische Abschä tzung Die analytische Abschätzung gewinnt man nun durch die Standardabsch ätzung. Dabei ist wieder j(z) dasjenige Polynom vom Grad m = n.- p + p - 1, dessen Koeffizienten betragsmäßi g gleich den en von j( z), jedoch alle nichtnegativ sind: m
f( z )
= L a j ' z j,
j =
j =O
m
L
lajl· z j.
j =o
IJ(u)1 auf der Kr eissch eib e
So ist gewährleist et , dass das Maximum von
o mit dem Radius l'Pkl bei
J(
um
l'Pkl angenom men wird , da dort alle z j und a uch alle laj I . zj bei reell-positivem z das gleich e Ar gument annehmen . Berücksichtigt man die Wirkung der gewichtenden Exponentialterme, ände rt sich am Prinzip nichts, außer dass aus Polynomen un endliche Poten zreih en werden . Aus dem selb en Grund ist das reelle Integral von el'Pkl- u .j (u) von 0 bis I'f/kl eine Majorante für den Betrag des komplexen Integr als von e'Pk- U ·f (u ) von 0 bis 'f/ k.
Damit wird der Betrag des Funktionals JI - ganz grob , da es im Wesentlichen a uf die Wachstumsordnung bezüglich pankommt - nach ob en abgeschätzt . Die Integration kann dabei aufgrund der Holomorphie des Integranden wied er üb er den geradlinigen Weg von 0 nach 'f/ k vollzogen werden:
I~l
1111