Elemente der Linearen Algebra und der Analysis
Harald Scheid / Wolfgang Schwarz
Elemente der Linearen Algebra und der Analysis
Autoren Prof. Dr. Harald Scheid und Prof. Dr. Wolfgang Schwarz Bergische Universität Wuppertal Fachbereich Mathematik Gaußstr. 20 42097 Wuppertal E-Mail:
[email protected] [email protected] Wichtiger Hinweis für den Benutzer Der Verlag und die Autoren haben alle Sorgfalt walten lassen, um vollständige und akkurate Informationen in diesem Buch zu publizieren. Der Verlag übernimmt weder Garantie noch die juristische Verantwortung oder irgendeine Haftung für die Nutzung dieser Informationen, für deren Wirtschaftlichkeit oder fehlerfreie Funktion für einen bestimmten Zweck. Ferner kann der Verlag für Schäden, die auf einer Fehlfunktion von Programmen oder ähnliches zurückzuführen sind, nicht haftbar gemacht werden. Auch nicht für die Verletzung von Patent- und anderen Rechten Dritter, die daraus resultieren. Eine telefonische oder schriftliche Beratung durch den Verlag über den Einsatz der Programme ist nicht möglich. Der Verlag übernimmt keine Gewähr dafür, dass die beschriebenen Verfahren, Programme usw. frei von Schutzrechten Dritter sind. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Buch berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag hat sich bemüht, sämtliche Rechteinhaber von Abbildungen zu ermitteln. Sollte dem Verlag gegenüber dennoch der Nachweis der Rechtsinhaberschaft geführt werden, wird das branchenübliche Honorar gezahlt. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer ist ein Unternehmen von Springer Science+Business Media springer.de © Spektrum Akademischer Verlag Heidelberg 2009 Spektrum Akademischer Verlag ist ein Imprint von Springer 09 10 11 12 13
5 4 3 2 1
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Planung und Lektorat: Dr. Andreas Rüdinger, Barbara Lühker Herstellung: Crest Premedia Solutions (P) Ltd, Pune, Maharashtra, India Umschlaggestaltung: SpieszDesign, Neu–Ulm Satz: Autorensatz ISBN 978-3-8274-1971-2
Vorwort Von den aktuellen Reformbem¨ uhungen um die Verbesserung der Qualit¨at und der Inhalte universit¨arer Ausbildung ist die Lehrerausbildung in besonderem Maße betroffen. Die Abl¨osung der grundst¨andigen Lehrerausbildung durch konsekutiv strukturierte Modelle, in denen ein (polyvalent angelegtes) Bachelorstudium durch einen passend gestalteten Masterstudiengang zu einem Hochschulabschluss komplettiert werden kann, welcher nach den Bestimmungen der Lehramtspr¨ ufungsordnungen als erste Staatspr¨ ufung anerkannt wird, ist an den meisten Universit¨aten bereits erfolgt. Dabei nutzen die Hochschulen ihre Gestaltungsspielr¨aume f¨ ur individuell konzipierte Bachelor-Master-Modelle, deren Vielfalt sich nur schwer u ¨berschauen l¨asst. Ordnend wirkt aber der Leitgedanke der Polyvalenz der Bachelorphase, welche eine breitere fachwissenschaftliche Ausbildung erfordert, die – insbesondere im Bereich der Lehr¨amter f¨ ur die Klassen 5 bis 13 (bzw. 12) – zum Teil deutlich u ¨ber die Standards einer grundst¨andigen Lehrerausbildung hinausgeht. Derzeit gilt dies auch noch f¨ ur das Lehramt an Grundschulen, allerdings ist zu erwarten, dass hier eine Verselbst¨andigung erfolgen wird, infolge derer dann die Inhalte der Studieng¨ange f¨ ur die Klassen 5 bis 10 n¨aher an die Inhalte der Studieng¨ange f¨ ur die gymnasiale Oberstufe und das Berufskolleg heranr¨ ucken – entsprechende Entw¨ urfe liegen im Land NRW bereits vor. Der Mathematikunterricht in der Oberstufe besteht haupts¨achlich aus den beiden Gebieten Lineare Algebra“ und Analysis“, so dass man zu Beginn eines ” ” Studiums schon einige Vorkenntnise zu diesen Themen mitbringt. Diese beiden Gebiete sind von zentraler Bedeutung f¨ ur die weiterf¨ uhrenden Themenbereiche, ebenso aber f¨ ur fast alle Anwendungsfelder der Mathematik. Es ist also sinnvoll und auch Tradition, der Linearen Algebra und der Analysis einen breiten Raum im Grundstudium eines jeden mit Mathematik befassten Studiengangs bereitzustellen, womit gleichzeitig auch unsere Zielgruppe definiert w¨are. Im vorliegenden Buch sind beide Gebiete in zwei unabh¨angigen Teilen dargestellt, so dass man entweder mit der Analysis oder mit der Linearen Algebra beginnen kann. Nat¨ urlich gibt es zahlreiche Bez¨ uge zwischen diesen beiden Gebieten, denn vielfach stammen Motivationen und Beispiele f¨ ur Begiffsbildungen der Linearen Algebra aus der Analysis, und diese Begriffsbildungen und damit verbundenen Theorieentwicklungen wiederum erweisen sich als n¨ utzlich in der Analysis. Trotzdem sind die beiden Teile des Buchs mit den notwendigsten Grundkenntnissen aus dem Mathematikunterricht in der Oberstufe unabh¨angig voneinander zu bearbeiten. Treten trotzdem ohne weitere Erkl¨arung Begriffe auf, die den Studierenden
Vorwort
VI
weder in der Schule noch in anderen einf¨ uhrenden Lehrveranstaltungen an der Hochschule bereits begegnet oder aber in Vergessenheit geraten sind (z. B. der Begriff des K¨orpers der reellen Zahlen, die trigonometrischen Additionstheoreme oder das Rechnen mit Logarithmen), dann kann man solche Begriffe leicht in einem (mathematischen) Lexikon nachschlagen. Man k¨onnte auch die beiden folgenden einf¨ uhrenden B¨ ucher der gleichen Autoren zu Rate ziehen: • Elemente der Arithmetik und Algebra, Spektrum Akad. Verlag Heidelberg 20085 • Elemente der Geometrie, Spektrum Akad. Verlag Heidelberg 20074 Die noch relativ junge mathematische Disziplin Lineare Algebra“ ist dadurch ” besonders ausgezeichnet, dass sie mit ihren universellen Begriffsbildungen und Methoden als Werkzeug in vielen anderen mathematischen Teilgebieten verankert ist. Allerdings mangelt es vielen Kursen zur Linearen Algebra daran, die außergew¨ohnliche Beziehungshaltigkeit dieser Disziplin aufzuzeigen. Das vorliegende Buch ist gepr¨agt von dem Bem¨ uhen, nicht nur die Grundlagen des Fachs zu vermitteln, sondern die entwickelten Begriffsgef¨ uge und Theorien mit anderen mathematischen Gebieten zu vernetzen; dies geschieht in umfangreichen Anwendungsbeispielen aus der Arithmetik, der Geometrie, der Zahlentheorie, der Statistik, der Linearen Optimierung und nat¨ urlich der Analysis. Damit bietet das Buch ein breites Spektrum m¨oglicher Vertiefungsinhalte der Linearen Algebra, die Gegenstand von Lehrveranstaltungen einer polyvalenten mathematischen Aubildung sein k¨onnten. Gleiches gilt auch f¨ ur den Teil zur Analysis, der neben dem Standardprogramm der meisten Einf¨ uhrungsveranstaltungen auch einen vorsichtigen Einstieg in die Analysis von Funktionen mehrerer Variabler einschließlich (differenzial-)geometrischer Anwendungen enth¨alt. Die Darstellung des Lehrstoffs im vorliegenden Buch orientiert sich an der Zielsetzung, die Studierenden insbesondere auch beim Selbststudium zu unterst¨ utzen, da die konsekutiven Bachelor- und Masterstudieng¨ange entsprechende Studienanteile in nicht geringem Umfang vorsehen. Nat¨ urlich soll nicht auf den n¨otigen Formalismus in der mathematischen Argumentation verzichtet werden, wo immer es sich aber anbietet, steht die Vermittlung von Einsichten im Vordergrund, auch wenn dies stellenweise l¨angere Erkl¨arungstexte und Veranschaulichungen erfordert. Am Ende eines jeden Abschnitts bieten einige in der Regel sehr einfache Aufgaben die Gelegenheit, mit dem entwickelten Begriffsgef¨ uge vertraut zu werden. Mit etwas anspruchsvolleren Aufgaben soll dann auch das kreative, fantasievolle Verhalten beim Probleml¨osen gef¨ordert werden, welches seit jeher unabdingbare Voraussetzung f¨ ur die erfolgreiche Bew¨altigung eines Mathematikstudiums ist. L¨osungen und L¨osungshinweise zu allen Aufgaben findet man am Ende des Buches, wobei diese aus Platzgr¨ unden sehr knapp gehalten werden m¨ ussen. Wuppertal, im M¨arz 2009
Harald Scheid Wolfgang Schwarz
Inhaltsverzeichnis Lineare Algebra I Lineare Gleichungssysteme und Vektorr¨ aume I.1 Beispiele f¨ ur lineare Gleichungssysteme 3 I.2 L¨osungsverfahren 7 I.3 Der Begriff des Vektorraums 12 I.4 Lineare Mannigfaltigkeiten 21 I.5 Geometrische Interpretation 26 I.6 Konvexe Mengen 28 II Lineare Abbildungen II.1 Lineare Abbildungen und Matrizen 32 II.2 Verkettung linearer Abbildungen 40 II.3 Anwendungen der Matrizenrechnung 50 III Das Skalarprodukt III.1 Skalarproduktr¨aume 64 III.2 Anwendungen in der Statistik 70 III.3 Anwendungen in der Geometrie 73 III.4 Vektorprodukt und Spatprodukt 80 IV Determinanten IV.1 Die Determinante einer Matrix 85 IV.2 Explizite Darstellung und Berechnung 91 V Affine Abbildungen V.1 Darstellung affiner Abbildungen 97 V.2 Eigenwerte und Eigenr¨aume einer Matrix 105 V.3 Klassifikation der affinen Abbildungen 108 VI Kurven und Fl¨ achen zweiter Ordnung VI.1 Die Kegelschnittkurven 116 VI.2 Fl¨achen zweiter Ordnung 123 VI.3 Regelfl¨achen 129 VI.4 Kreisschnittebenen 132 VII Projektive Geometrie VII.1 Homogene Koordinaten 134 VII.2 Projektive Abbildungen 140 VII.3 Kegelschnitte in der projektiven Ebene 151 VIII Lineare Optimierung VIII.1 Problemstellung und Grundbegriffe 155 VIII.2 Das Simplexverfahren 166
Inhaltsverzeichnis
VIII
Analysis IX Folgen reeller Zahlen IX.1 Grundlegende Beispiele und Begriffe 181 IX.2 Summen- und Differenzenfolgen 188 IX.3 Das Prinzip der vollst¨andigen Induktion 191 IX.4 Arithmetische, geometrische und harmonische Folgen 195 IX.5 Arithmetische Folgen h¨oherer Ordnung 198 IX.6 Konvergente Folgen 203 IX.7 Die reellen Zahlen 211 IX.8 Potenzen mit reellen Exponenten 219 IX.9 Unendliche Reihen 221 IX.10 Die eulersche Zahl 225 IX.11 Unendliche Produkte 226 IX.12 Abz¨ahlen von unendlichen Mengen 228 X Differenzial- und Integralrechnung X.1 Stetige Funktionen 231 X.2 Die Ableitung einer Funktion 241 X.3 Die Mittelwerts¨atze der Differenzialrechnung 250 X.4 Iterationsverfahren 254 X.5 Stammfunktionen und Fl¨acheninhalte 260 X.6 Das Riemann-Integral 266 X.7 N¨aherungsverfahren zur Integration 278 X.8 Uneigentliche Integrale 281 XI Potenzreihen XI.1 Konvergenz von Potenzreihen 289 XI.2 Taylor-Entwicklung 297 IX.3 Numerische Berechnungen 302 XI.4 Weitere Reihenentwicklungen 307 XII Kurven und Fl¨ achen XII.1 Kurvendiskussion 316 XII.2 Implizite Differenziation 323 XII.3 Parameterdarstellung von Kurven, Darstellung mit Polarkoordinaten 331 XII.4 Evoluten und Evolventen 340 XII.5 Kurven und Fl¨achen im Raum 347 L¨osungen der Aufgaben Index 373
352
Lineare Algebra
I Lineare Gleichungssysteme und Vektorr¨ aume I.1 Beispiele fu ¨ r lineare Gleichungssysteme In vielen Gebieten der Mathematik und ihrer Anwendungen muss man sich mit linearen Gleichungssystemen besch¨aftigen. Eine algebraische Gleichung heißt linear, wenn die Variablen x1 , x2 , . . . , xn nur in der ersten Potenz und nicht als Produkte vorkommen, wenn die Gleichung also die Form a1 x1 + a2 x2 + . . . + an xn = a hat. Die Koeffizienten a1 , a2 , . . . , an , a stammen dabei aus einem Zahlenbereich K, welcher wie die Menge IR der reellen Zahlen einen K¨orper bildet, in welchem man also wie mit reellen Zahlen rechnen kann. Die L¨osungen der Gleichung sind n-Tupel mit Elementen aus K, geh¨oren also zu K n . In den meisten Anwendungen ist K der K¨orper IR der reellen Zahlen oder der K¨orper C der komplexen Zahlen (vgl. II.3). Sollen mehrere solche Gleichungen gleichzeitig erf¨ ullt sein, dann liegt ein lineares Gleichungssystem vor. Da im Folgenden der Ausdruck lineares Glei” chungssystem“ sehr h¨aufig vorkommt, wollen wir ihn mit LGS“ abk¨ urzen. Ein ” LGS mit n Variablen und m Gleichungen hat die Form a11 x1 a21 x1
+ a12 x2 + a22 x2
+ . . . + a1n xn + . . . + a2n xn
= a1 = a2 .. .
am1 x1 + am2 x2 + . . . + amn xn = am Bei den Koeffizienten aij gibt der erste Index i die Nummer der Gleichung und der zweite Index j die Nummer der Variablen an. Ein LGS hat entweder keine L¨osung, genau eine L¨osung oder unendlich viele L¨osungen, wie wir im Folgenden sehen werden. Die L¨osungsmenge eines LGS ¨andert sich offensichtlich nicht, wenn man zwei Gleichungen vertauscht, eine Gleichung mit einer von 0 verschiedenen Zahl multipliziert oder das Vielfache einer Gleichung zu einer anderen addiert. Beispiel 1 : Edelstahl ist eine Legierung aus Eisen, Chrom und Nickel; beispielsweise besteht V2A-Stahl aus 74% Eisen, 18% Chrom und 8% Nickel. Aus den in nebenstehender Tabelle angegebenen Legierungen (1) bis (4) soll 1000 kg V2A(1) (2) (3) (4) Stahl gemischt werden. Um die notwenEisen 70% 72% 80% 85% digen Anteile x1 , x2 , x3 , x4 von (1) bis (4) Chrom 22% 20% 10% 12% (in kg) zu bestimmen, muss man folgendes Nickel 8% 8% 10% 3% LGS l¨osen: 0,70x1 + 0,72x2 + 0,80x3 + 0,85x4 = 740 0,22x1 + 0,20x2 + 0,10x3 + 0,12x4 = 180 0,08x1 + 0,08x2 + 0,10x3 + 0,03x4 = 80
I Lineare Gleichungssysteme und Vektorr¨aume
4
Multipliziert man alle Gleichungen mit 100, um Kommazahlen zu vermeiden, dann ergibt sich das LGS 70x1 + 72x2 + 80x3 + 85x4 = 74 000 22x1 + 20x2 + 10x3 + 12x4 = 18 000 8x1 + 8x2 + 10x3 + 3x4 = 8 000 Subtrahiert man die dritte Gleichung von der zweiten und das 8fache der dritten Gleichung von der ersten, so erh¨alt man das LGS 6x1 + 8x2 + 0x3 + 61x4 = 10 000 14x1 + 12x2 + 0x3 + 9x4 = 10 000 8x1 + 8x2 + 10x3 + 3x4 = 8 000 Multipliziert man die erste Gleichung mit 3 und subtrahiert dann von ihr das 2fache der zweiten Gleichung, so ergibt sich −10x1 + 0x2 + 0x3 + 165x4 = 10 000 14x1 + 12x2 + 0x3 + 9x4 = 10 000 8x1 + 8x2 + 10x3 + 3x4 = 8 000 W¨ahlt man nun f¨ ur x4 einen beliebigen Wert r, dann liefert die erste Gleichung 33 x1 = r − 1000. Aus der zweiten Gleichung folgt damit x2 = −20r + 2000. Aus 2
der dritten Gleichung folgt schließlich x3 = x1 = 33s − 1000,
5 r. Mit r = 2s ist 2
x2 = −40s + 2000,
x3 = 5s,
x4 = 2s.
Aufgrund des Sachzusammenhangs d¨ urfen diese Werte nicht negativ sein, es muss 1000 also ≤ s ≤ 50 gelten; f¨ ur jeden Wert von s in diesem Bereich ergibt sich eine 33 L¨osung des gestellten Problems. Beispielsweise ergibt sich mit s = 40 : x1 = 320,
x2 = 400,
x3 = 200,
x4 = 80.
Beispiel 2 : Kennt man in einem Gleichstromnetz die Spannungen und die Widerst¨ande, dann kann man die Stromst¨arken in den Widerst¨anden mit Hilfe der beiden kirchhoffschen Regeln berechnen: • In jedem Knotenpunkt des Netzes ist die Summe der Stromst¨arken der ankommenden Str¨ome gleich der Summe der Stromst¨arken der abfließenden Str¨ome. • In jeder Masche des Netzes ist die Summe der Spannungen gleich der Summe der Produkte aus den (gerichteten) Stromst¨arken und den Widerst¨anden. Es sollen die Stromst¨arken I1 , I2 , . . . , I5 (gemessen in Amp`ere) in dem Netz in Fig. 1 bestimmt werden.
I.1 Beispiele f¨ur lineare Gleichungssysteme
5
........................................................................................................................................................................................................ ... ... ... .. ... ... ... .......................... .................... 2 ... ... Ω.... ↓ I4 ... I2 ↓ .....20 Ω... ...10 ... ... I . . ................... 5 ................ ... ← . ... ... + . . . . . . . . . . . . . . . . . . . .. . . ... ............. . . . . . . . . . . . . . . . y .y2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 420 V .................. 10 Ω 1 . . . . .... ... — .................... .. .. ... . ....................... ... ..................... . ... ...20 Ω.... ↓ I3 I1 ↓ ..10 Ω.. ... ........................ . . .................. .... 1 ... . ... .. .. ... . ............................................................................................................................................................................................................................... Fig. 1: Gleichstromnetz Knoten Knoten Masche Masche Masche
I2 1: I1 − 2: − I3 + I4 1: 10I1 − 20I3 2: 20I2 − 10I4 3: 10I1 + 20I2
− I5 − I5 + 10I5 − 10I5
= 0 = 0 = 0 = 0 = 420
Zun¨achst dividiert man die dritte, vierte und f¨ unfte Gleichung durch 10. Subtrahiert man dann die erste Gleichung von der dritten und f¨ unften, dann erh¨alt man das LGS I1 − I2 − I5 = 0 − I3 + I4 − I5 = 0 I2 − 2I3 + 2I5 = 0 2I2 − I4 − I5 = 0 3I2 + I5 = 42 Nun subtrahiert man das 2fache bzw. 3fache der dritten Gleichung von der vierten bzw. f¨ unften und vertauscht dann noch die die zweite mit der dritten Gleichung: I 1 − I2 I2 − 2I3 − I3 + I4 4I3 − I4 6I3
− I5 + 2I5 − I5 − 5I5 − 5I5
= 0 = 0 = 0 = 0 = 42
Nun addiert man das 4fache bzw. 6fache der dritten Gleichung zur vierten bzw. f¨ unften Gleichung: I 1 − I2 I2 − 2I3 − I3 +
I4 3I4 6I4
− I5 + 2I5 − I5 − 9I5 − 11I5
= 0 = 0 = 0 = 0 = 42
I Lineare Gleichungssysteme und Vektorr¨aume
6
Weitere derartige Umformungen (Multiplikation der dritten Gleichung mit −1, Division der vierten Gleichung durch 3, Subtraktion des 6fachen der vierten Gleichung von der f¨ unften, Division der f¨ unften Gleichung durch 7) f¨ uhren auf das LGS I1 − I2 − I5 = 0 I2 − 2I3 + 2I5 = 0 I3 − I4 + I5 = 0 I4 − 3I5 = 0 I5 = 6 Jetzt erh¨alt man der Reihe nach aus der f¨ unften, vierten, dritten, . . . Gleichung I5 = 6, I4 = 3I5 = 18, I3 = I4 − I5 = 12, I2 = 2I3 − 2I5 = 12, I1 = I2 + I5 = 18. Beispiel 3: Aus SiO2 (Quarz) und NaOH (Natronlauge) entsteht Na2 SiO3 (Natriumsilikat) und H2 O (Wasser). Die nat¨ urlichen Zahlen x1 , x2 , x3 , x4 in der Reaktionsgleichung x1 SiO2 + x2 NaOH −→ x3 Na2 SiO3 + x4 H2 O bestimmt man aus der Bedingung, dass jedes chemische Element Si, Na, O, H auf beiden Seiten der Reaktionsgleichung gleich oft auftreten muss; diese Zahlen sollen dabei so klein wie m¨oglich sein. Es muss das LGS x1 2x1
− x3 x2 − 2x3 + x2 − 3x3 − x4 x2 − 2x4
= = = =
0 0 0 0
gel¨ost werden. Wegen x1 = x3 (erste Gleichung) und 2x3 = x2 = 2x4 (zweite und vierte Gleichung) ergibt sich x3 = x4 , womit auch die dritte Gleichung erf¨ ullt ist: 2x4 + 2x4 − 3x4 − x4 = 0. Mit x4 = r ist also x1 = r, x2 = 2r, x3 = r, x4 = r. Die L¨osung mit den kleinsten nat¨ urlichen Zahlen erh¨alt man f¨ ur r = 1.
Aufgaben 1. Die Koeffizienten a0 , a1 , a2 , . . . , an einer Polynomfunktion f : x → an xn + . . . + a2 x2 + a1 x + a0 vom Grad n sind eindeutig bestimmt, wenn man n + 1 Wertepaare (u, f (u)) kennt. Man bestimme die Polynomfunktion f vom Grad 4 mit den Wertepaaren (−2, 73), (−1, 22), (1, 10), (2, 37), (3, 158).
2. Man bestimme die Koeffizienten in der chemischen Reaktionsgleichung x1 KMnO4 + x2 KBr + x3 H2 SO4 −→ x4 K2 SO4 + x5 MnSO4 + x6 Br2 + x7 H2 O.
I.2 L¨osungsverfahren
7
3. Zwei Grundstoffe S1 , S2 sind in den Mischungen A, B, C, D mit den in der Tabelle angegebenen Anteilen enthalten. Es soll aus A, B, C, D eine Mischung hergestellt werden, welche S1 mit 4% und S2 mit 12% enth¨alt. Man bestimme die m¨oglichen Mischungsverh¨altnisse.
A B C D S1 6% 6% 3% 2% S2 15% 10% 15% 10%
4. Fig. 2 zeigt ein Einbahnstraßennetz mit der Anzahl von Fahrzeugen, die pro Zeiteinheit die einzelnen Straßenabschnitte passieren. .. Ist die Anzahl der an ... .. . ... 100 . . . 200 100 einer Kreuzung ankom... 6 ... ? ... ? ... ... ... menden Fahrzeuge gleich ... ... .... der Anzahl der wegfah... .. ... x-7 400 ... . ..u x-3 renden, dann tritt kein ...........................................................................u........................................u.........................600 .......... . . ..... D Stau auf. Auf den Teil... F ... E . .... ... ... strecken DC und CB sol...... ?x6 ... ?x4 ... 6x2 len Ausbesserungsarbei..... ... ... x x ... 200 ... .. 1 5 ten vorgenommen wer.......................................u....................................u..................................................u.........................800 .......... . .. C . den. Wie viele Fahrzeu.. A ... B . . ... .. ... ge m¨ ussen trotzdem die.. .... .. ... ... .. se Teilstrecken passie.. 1000 6 . . . . . 400 800 ren? Was ist wohl die ? .? g¨ unstigste L¨osung des Fig. 2: Einbahnstraßennetz Problems?
I.2 Lo ¨sungsverfahren Wie in den Beispielen 1 und 2 in I.1 kann man jedes LGS durch Vertauschen der Gleichungen, Multiplikation einer Gleichung mit einer Zahl = 0 und Addition einer Gleichung zu einer anderen auf Stufenform bringen, d. h. auf eine Form, in der jede Gleichung mindestens eine Variable enth¨alt, die in den folgenden Gleichungen nicht mehr vorkommt. Genauer soll dabei gelten: Sind in einer Gleichung der Stufenform die ersten k Koeffizienten gleich 0, dann sind in der n¨achsten Gleichung (mindestens) die k + 1 ersten Koeffizienten gleich 0 (Fig. 1).
$ ∗ ∗ ∗ ∗ ∗ ∗ ... 0 0 0 $ ∗ ∗ ∗ ... 0 0 0 0 $ ∗ ∗ ... 0 0 0 0 0 0 $ ... $: Koeffizient = 0 0: Koeffizient 0 *: Koeffizient beliebig Fig. 1: Koeffizientenschema der Stufenform eines LGS
Die Umformungen, die zur Stufenform f¨ uhren, ¨andern nichts an der L¨osungsmenge ¨ des LGS. Man nennt sie daher Aquivalenzumformungen.
I Lineare Gleichungssysteme und Vektorr¨aume
8
Die L¨osungen eines LGS in Stufenform kann man, beginnend mit der letzten Gleichung, folgendermaßen bestimmen: Ist xk + bk+1 xk+1 + bk+2 xk+2 + . . . + bn xn = b die letzte Gleichung, so setzt man im Fall k < n f¨ ur xk+1 , xk+2 , . . . , xn die Parameter r1 , r2 , . . . , rn−k und erh¨alt xk = b − bk+1 r1 − bk+2 r2 − . . . − bn rn−k . (Im Fall k = n erh¨alt man bereits xn = b.) Ist xm + cm+1 xm+1 + cm+2 xm+2 + . . . + cn xn = c (m < k) die vorletzte Gleichung, so setzt man im Fall m < k−1 f¨ ur xm+1 , . . . , xk−1 die Parameter rn−k+1 , rn−k+2 , . . . , rn+m+1 und kann dann xm durch die Parameter r1 , r2 , . . . rn−k , rn−k+1 , . . . , rn+m+1 ausdr¨ ucken. So f¨ahrt man fort, bis man schließlich die Variablen x1 , x2 , . . . , xn durch die frei w¨ahlbaren Parameter r1 , r2 , r3 , . . . ausgedr¨ uckt hat. Dieses L¨osungsverfahren, also Umformung des LGS in Stufenform und anschließendes Vorgehen wie soeben beschrieben, nennt man Gauß-Verfahren (nach Carl Friedrich Gauß, 1777–1855). Besitzt ein LGS keine L¨osung, dann zeigt sich das in der Stufenform dadurch, dass mindestens eine der letzten Gleichungen die Form 0 = a“ mit a = 0 hat. ” Beispiel 1: Das LGS x1 + x2 − 3x3 + 4x4 − 7x6 + 8x7 − x8 = 12 x4 + 3x5 − 2x6 + 5x7 − 11x8 = 30 x7 + 2x8 = 10 ist in Stufenform. Setzt man x8 = r1 , x6 = r2 , x5 = r3 , x3 = r4 , x2 = r5 , dann ergibt sich x7 = 10 − 2r1 x4 = 30 − 3r3 + 2r2 − 5(10 − 2r1 ) + 11r1 = −20 + r1 + 2r2 − 3r3 x1 = 12 − r5 + 3r4 − 4(−20 + r1 + 2r2 − 3r3 ) − 7r2 − 8(10 − 2r1 ) − r1 = 12 + 11r1 − 15r2 + 12r3 + 3r4 − r5 oder u ¨bersichtlicher geschrieben: x1 x2 x3 x4 x5 x6 x7 x8
= 12 + 11r1 − 15r2 + 12x3 + 3r4 − r5 = r5 = r4 = −20 + r1 + 2r2 − 3r3 = r3 = r2 = 10 − 2r1 = r1
I.2 L¨osungsverfahren
9
Die L¨osungen eines LGS mit n Variablen sind n-Tupel. Um die L¨osungen eines LGS u ¨bersichtlich darstellen zu k¨onnen, schreiben wir n-Tupel als Zahlenspalten in Klammern und definieren eine Vervielfachung und eine Addition f¨ ur n-Tupel: ⎛ ⎜ ⎜
r⎜ ⎜ ⎝
a1 a2 .. .
⎞
⎛
⎟ ⎜ ⎟ ⎜ ⎟=⎜ ⎟ ⎜ ⎠ ⎝
an
ra1 ra2 .. .
⎞
⎛
⎟ ⎟ ⎟, ⎟ ⎠
⎜ ⎜ ⎜ ⎜ ⎝
ran
a1 a2 .. .
⎞
⎛
b1 b2 .. .
⎟ ⎜ ⎟ ⎜ ⎟+⎜ ⎟ ⎜ ⎠ ⎝
an
⎞
⎛
⎟ ⎜ ⎟ ⎜ ⎟=⎜ ⎟ ⎜ ⎠ ⎝
bn
a1 + b 1 a2 + b 2 .. .
⎞ ⎟ ⎟ ⎟ ⎟ ⎠
a n + bn
Damit l¨asst sich die Menge der L¨osungen des LGS in Beispiel 1 folgendermaßen schreiben: ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
x1 x2 x3 x4 x5 x6 x7 x8
⎞
⎛
12 ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ −20 ⎟=⎜ ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ ⎠ ⎝ 10 0
⎞
⎛
⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ + r1 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎠ ⎝
11 0 0 1 0 0 −2 1
⎞
⎛
−15 ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ −2 ⎟ + r2 ⎜ ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ 1 ⎟ ⎜ ⎟ ⎜ ⎠ ⎝ 0 0
⎞
⎛
⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ + r3 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎠ ⎝
12 0 0 −3 1 0 0 0
⎞
⎛
⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ + r4 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎠ ⎝
3 0 1 0 0 0 0 0
⎞
⎛
⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ + r5 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎠ ⎝
−1 1 0 0 0 0 0 0
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
(r1 , r2 , r3 , r4 , r5 ∈ IR). ¨ Die Ausf¨ uhrung von Aquivalenzumformungen wird u ¨bersichtlicher, wenn man sie statt an dem LGS nur an der Koeffizientenmatrix bzw. der erweiterten Koeffizientenmatrix ⎛ ⎜ ⎜ ⎜ ⎜ ⎝
a11 a21 .. .
a12 a22 .. .
. . . a1n . . . a2n .. .
⎞ ⎟ ⎟ ⎟ ⎟ ⎠
⎛
bzw.
am1 am2 . . . amn
⎜ ⎜ ⎜ ⎜ ⎝
a11 a21 .. .
a12 a22 .. .
. . . a1n . . . a2n .. .
a1 a2 .. .
⎞ ⎟ ⎟ ⎟ ⎟ ⎠
am1 am2 . . . amn am
des LGS durchf¨ uhrt. Kommt dabei eine Variable in einer Gleichung nicht vor, so hat sie den Koeffizient 0. Beispiel 2: Die erweiterte Koeffizentenmatrix des LGS in Beispiel 2 aus I.1 lautet anfangs bzw. nach Herstellung der Stufenform ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
1 −1 0 0 −1 0 0 0 −1 1 −1 0 10 0 −20 0 10 0 0 20 0 −10 −10 0 10 20 0 0 0 420
⎞
⎛
⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
bzw.
1 −1 0 0 −1 0 0 1 −2 0 2 0 0 0 1 −1 1 0 0 0 0 1 −3 0 0 0 0 0 1 6
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
Hier lassen sich auch die Zahlen oberhalb der Diagonalen zu 0 machen (Addition eines geeigneten Vielfachen der letzten Zeile zu den anderen, dann der vorletzten
I Lineare Gleichungssysteme und Vektorr¨aume
10
Zeile zu den anderen usw.). Es ergibt sich ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
1 0 0 0 0
0 1 0 0 0
0 0 1 0 0
0 0 0 1 0
0 0 0 0 1
18 12 12 18 6
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
und damit
x1 x2 x3 x4 x5
= = = = =
18 12 12 . 18 6
Wir haben also gesehen, dass sich die erweiterte Koeffizientenmatrix eines LGS ¨ durch Aquivalenzumformungen stets auf die folgende Stufenform bringen l¨asst: n
......................................................................................................................................................................................................................... ... ... = 0 0 ∗ ∗ 0 0 ∗ 0 ∗ ∗ ∗ ∗ ... 0 ∗ ... 0 = 0 0 ∗ ∗ 0 0 ∗ 0 ∗ ∗ ∗ ∗ ... 0 ... ... 0 0 0 = 0 ∗ ∗ 0 0 ∗ 0 ∗ ∗ ∗ ∗ r .. ... ... 0 0 0 0 0 0 = 0 0 ∗ 0 ∗ ∗ ∗ ∗ ... ... 0 0 0 0 0 0 = 0 ∗ 0 ∗ ∗ ∗ ∗ ... 0 ... .. 0 0 0 0 0 0 0 0 0 = 0 ∗ ∗ ∗ ∗ ... ... 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ... ... 0 0 0 0 0 0 0 0 0 0 0 0 0 ... 0 n − r .... ... 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ... ... 0 0 0 0 0 0 0 0 0 0 0 0 0 0 .
∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗
In dem LGS in Beispiel 1, das schon in Stufenform gegeben war, ist n = 8 und r = 3, in Beispiel 2 ist n = r = 6. Das LGS besitzt genau dann L¨osungen, wenn in den letzten n − r Gleichungen der Stufenform, in denen die Koeffizienten der Variablen alle 0 sind, auch in der Konstantenspalte 0 steht. Dann kann man die letzten n−r Gleichungen ( 0 = 0“) ” weglassen. Verbleiben noch r Gleichungen, dann haben die L¨osungen des LGS die Gestalt ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ c1 u1 v1 w1 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ c2 ⎟ ⎜ u2 ⎟ ⎜ v2 ⎟ ⎜ w2 ⎟ ⎜ . ⎟ + t1 ⎜ . ⎟ + t2 ⎜ . ⎟ + . . . + tn−r ⎜ . ⎟ ⎜ . ⎟ ⎜ . ⎟ ⎜ . ⎟ ⎜ . ⎟ ⎝ . ⎠ ⎝ . ⎠ ⎝ . ⎠ ⎝ . ⎠ cn
un
vn
wn
mit n − r frei w¨ahlbaren Parametern t1 , t2 , . . . , tn−r ∈ IR. Das alles l¨asst sich viel pr¨aziser darstellen, wenn wir im n¨achsten Abschnitt den Begriff des Vektorraums eingef¨ uhrt haben.
I.2 L¨osungsverfahren
11
Ein LGS in der in I.1 angegebenen Form heißt homogen, wenn a1 = a2 = . . . = am = 0 ist, wenn es also folgendermaßen aussieht: a11 x1 a21 x1
+ a12 x2 + a22 x2
= 0 = 0 .. .
+ . . . + a1n xn + . . . + a2n xn
am1 x1 + am2 x2 + . . . + amn xn = 0 Andernfalls nennt man das LGS inhomogen. F¨ ur ein homogenes LGS gilt offensichtlich: Jedes Vielfache einer L¨osung ist wieder eine L¨osung, und die Summe zweier L¨osungen ist ebenfalls eine L¨osung. Aus einem inhomogenen LGS entsteht das zugeh¨orige homogene LGS, indem man die Konstanten rechts vom Gleichheitszeichen durch 0 ersetzt. Die Differenz zweier L¨osungen des inhomogenen LGS ist eine L¨osung des zugeh¨origen homogenen LGS, wie man durch Einsetzen sofort sieht. Addiert man zu einer L¨osung des inhomogenen Systems eine L¨osung des homogenen Systems, so erh¨alt man wieder eine L¨osung des inhomogenen Systems. Kennt man also eine spezielle L¨osung des inhomogenen Systems, dann erh¨alt man alle L¨osungen als Summe dieser speziellen L¨osung und einer L¨osung des homogenen LGS.
Aufgaben 1. a) Man zeige, dass ein LGS entweder keine, genau eine oder unendlich viele L¨osungen besitzt.
2x1 + rx2 = 3 4x1 + 5x2 = s keine L¨osung, genau eine L¨osung, unendlich viele L¨osungen? b) F¨ ur welche Parameterwerte r, s hat das LGS
2. Man stelle ein LGS mit den drei Variablen x1 , x2 , x3 auf, welches die L¨osungen (1 + 3r, 2 − r, 5 − 4r) (r ∈ IR) besitzt.
3. Die L¨osungsmenge eines LGS kann auf verschiedene Arten dargestellt werden. Man zeige, dass {(r + 2s, r − s, 1 + 5s) | r, s ∈ IR} = {(p + 11q, 3p + 2q, −p + 20q) | p, q ∈ IR}.
4. Man berechne die L¨osungsmenge: a)
x 1 + x5 x 2 + x5 x 3 + x5 x 4 + x5
= = = =
2(x2 + x3 ) 3(x3 + x4 ) 4(x4 + x1 ) 5(x1 + x2 )
b)
x2 + x3 + x4 + x5 x 1 + x3 + x4 + x5 x 1 + x2 + x4 + x5 x 1 + x2 + x3 + x5 x 1 + x2 + x3 + x4
=1 =2 =3 =4 =5
I Lineare Gleichungssysteme und Vektorr¨aume
12
I.3 Der Begriff des Vektorraums Zur Darstellung der L¨osungen eines LGS haben wir in I.2 die Vervielfachung von n-Tupeln reeller Zahlen mit einer reellen Zahl und die Addition von n-Tupeln benutzt. Die n-Tupel bilden damit eine algebraische Struktur, welche ein Vektorraum im Sinn der folgenden Definition ist. Definition 1: Es sei V eine nicht-leere Menge; als Variable f¨ ur Elemente aus V benutzen wir die Bezeichnungen a, b, c, . . .. In V sei eine Verkn¨ upfung + definiert, so dass (V, +) eine kommutative Gruppe ist, d.h. es gelten das Assoziativgesetz ((a +b) +c = a + (b +c) f¨ ur alle a, b, c ∈ V ) und das Kommutativgesetz (a + b = b + a f¨ ur alle a, b ∈ V ), es gibt ein neutrales Element o (a + o = o + a = a f¨ ur alle a ∈ V ) und jedes Element a ∈ V besitzt ein inverses Element (bezeichnet mit −a). Ferner sei in V die Vervielfachung mit Elementen aus einem K¨orper K definiert; f¨ ur r ∈ K bezeichnet man das r-fache von a mit ra. (Das Nullelement und das Einselement von K bezeichnen wir wie in Zahlenk¨orpern mit 0 bzw. 1.) Dabei soll f¨ ur alle r, s ∈ K und alle a, b ∈ V gelten: r(a + b) = ra + rb, (r + s)a = ra + sa, r(sa) = (rs)a, 1a = a. (Dabei bedeutet in a + b das Pluszeichen die Verkn¨ upfung in V , in r + s aber die Addition im K¨orper K.) Dann nennt man V einen K-Vektorraum. Die Elemente von V nennt man Vektoren. Das neutrale Element o nennt man den Nullvektor, der Vektor −a heißt der Gegenvektor von a. Statt a + (−b) schreibt man a − b. Zur Unterscheidung von den Vektoren nennt man die Elemente aus K Skalare. Beispiel 1: Den IR-Vektorraum IRn der n-Tupel reeller Zahlen haben wir schon in I.2 ben¨otigt, um die L¨osungen eines LGS darzustellen. Beispiel 2: Die Folgen reeller Zahlen bilden ebenfalls einen IR-Vektorraum IRIN (Menge aller Abbildungen der Menge IN der nat¨ urlichen Zahlen in die Menge IR der reellen Zahlen), wobei die Addition und Vervielfachung von Folgen durch (an ) + (bn ) = (an + bn ) und r(an ) = (ran ) definiert ist. Beispiel 3: Die Matrizen
⎛ ⎜ ⎜ ⎜ ⎜ ⎝
a11 a21 .. .
a12 a22 .. .
... ...
a1n a2n .. .
am1 am2 . . . amn
⎞ ⎟ ⎟ ⎟ = (aij )m,n ⎟ ⎠
mit m Zeilen und n Spalten (m, n-Matrizen) mit Elementen aus IR bilden einen IR-Vektorraum, wenn man die Addition und Vervielfachung in Anlehnung an die entsprechenden Operationen bei n-Tupeln folgendermaßen definiert: (aij )m,n + (bij )m,n = (aij + bij )m,n ,
r(aij )m,n = (raij )m,n .
I.3 Der Begriff des Vektorraums
13
Beispiel 4: Die Menge aller Funktionen auf einem reellen Intervall [a; b] mit Werten in IR bildet einen IR-Vektorraum, wobei man f¨ ur Funktionen f, g und r ∈ IR definiert: (f + g)(x) = f (x) + g(x) und (rf )(x) = rf (x) f¨ ur alle x ∈ [a; b]. Vektoren treten in der Geometrie in Gestalt von Verschiebungen (in der Ebene oder im Raum) auf. Solche Verschiebungen kann man hintereinanderausf¨ uhren ( addieren“) und mit reellen Faktoren vervielfachen, womit ein IR-Vektorraum ” entsteht. Vektoren treten auch in der Physik auf, etwa in Gestalt von Kr¨aften, Beschleunigungen oder Geschwindigkeiten ( gerichtete Gr¨oßen“). Daraus erkl¨art ” sich die Bezeichnung Vektor“ (lat. Tr¨ager, Fahrer). ” Satz 1: In einem K-Vektorraum V gilt: (1) ro = o f¨ ur alle r ∈ K. (2) 0v = o f¨ ur alle v ∈ V. (3) (−r)v = −(rv ) f¨ ur alle r ∈ K, v ∈ V. (4) Ist rv = o, dann ist r = 0 oder v = o. Beweis: (1) In ro = r(o + o) = ro + ro addiere man −ro. (2) In 0v = (0 + 0)v = 0v + 0v addiere man −0v . (3) Aus o = (r + (−r))v = rv + (−r)v folgt, dass (−r)v der Gegenvektor von rv ist, also (−r)v = −rv . (Es gilt also −a = (−1)a.) (4) Ist rv = o und r = 0, dann ist o = r−1o = r−1 (rv ) = (r−1 r)v = 1v = v .
2
Definition 2: Ist V ein K-Vektorraum und U eine Teilmenge von V , welche bez¨ uglich der Addition und Vervielfachung in V wieder ein K-Vektorraum ist, dann nennt man U einen Untervektorraum oder Unterraum von V. Ein Unterraum eines Vektorraums V ist nicht leer, denn er muss den Nullvektor o enthalten. Genau dann ist U ein Unterraum von V , wenn mit a, b ∈ U und r ∈ K stets a + b ∈ U und ra ∈ U gilt (Unterraumkriterium). Beispiel 5: Die Menge der L¨osungen eines homogenen LGS mit n Variablen und Koeffizienten aus dem K¨orper K bildet einen Unterraum von K n , denn die Summe zweier L¨osungen und jedes Vielfache einer L¨osung sind wieder L¨osungen. Beispiel 6: Die Menge der konvergenten Folgen reeller Zahlen (vgl. IX.4) bildet einen Unterraum des IR-Vektorraums aller Folgen reeller Zahlen, denn die Summe zweier konvergenter Folgen und jedes Vielfache einer konvergenten Folge sind wieder konvergent. Beispiel 7: Die Menge der 3,3-Matrizen mit reellen Eintr¨agen, bei denen die Summen der Elemente in den Zeilen und Spalten alle den gleichen Wert haben, bildet einen Unterraum des IR- Vektorraums IR3,3 aller 3,3-Matrizen mit reellen
I Lineare Gleichungssysteme und Vektorr¨aume
14
Eintr¨agen. Denn diese Eigenschaft u ¨bertr¨agt sich auf die Summen und Vielfachen solcher Matrizen. Ein Beispiel f¨ ur eine Matrix mit dieser Eigenschaft ist
4 3 8
9 5 1
2 7 6
; hier hat die Summe der Zahlen in den Zeilen und Spalten immer
den Wert 15. (Dies ist ein besonders sch¨ones Exemplar aus dem Unterraum, denn die Eintr¨age sind die nat¨ urlichen Zahlen von 1 bis 9 und auch die Diagonalen ergeben die Summe 15; es handelt sich um ein so genanntes magisches Quadrat.) Beispiel 8: Die Menge der auf einem reellen Intervall I differenzierbaren Funktionen mit Werten in IR (vgl. X.2) bildet einen Unterraum aller auf I definierten Funktionen mit reellen Werten, denn die Summen und die Vielfachen differenzierbarer Funktionen sind wieder differenzierbar, wie man in der Analysis lernt. Definition 3: F¨ ur Vektoren a1 , a2 , . . . , an eines K-Vektorraums V nennt man die Summe r1a1 + r2a2 + . . . + rnan mit r1 , r2 , . . . , rn ∈ K eine Linearkombination der Vektoren a1 , a2 , . . . , an . Eine Teilmenge U eines Vektorraums V ist offensichtlich genau dann ein Unterraum von V , wenn alle Linearkombinationen von Elementen aus U wieder zu U geh¨oren. Definition 4: Die Menge aller Linearkombinationen von Vektoren a1 , a2 , . . . , an aus einem Vektorraum V nennt man das Erzeugnis von a1 , a2 , . . . , an und bezeichnet es mit a1 , a2 , . . . , an . Das Erzeugnis a1 , a2 , . . . , an ist ein Unterraum U von V , denn Summen und Vielfache von Linearkombinationen von a1 , a2 , . . . , an sind wieder Linearkombinationen von a1 , a2 , . . . , an . Man nennt dann die Menge {a1 , a2 , . . . , an } ein Erzeugendensystem von U . Beispiel 9: Die homogene Gleichung x1 +x2 +x3 = 0 hat in IR3 den L¨osungsraum ⎧ ⎨
r
⎩
1 0 −1
+s
0 1 −1
| r, s ∈ IR
⎫ ⎬ ⎭
=
1 0 −1
,
0 1 −1
Beispiel 10: Das homogene LGS mit der Koeffizientenmatrix
in IR3 nur die eine L¨osung
0 0 0
.
1 1 0 1 0 0
1 1 1
hat
, also den nur aus dem Nullvektor bestehenden
L¨osungsraum o (Nullraum). Definition 5: Eine Menge A von Vektoren aus einem Vektorraum V heißt linear unabh¨angig, wenn eine Gleichung der Form r1a1 + r2a2 + . . . + rnan = o mit {a1 , a2 , . . . , an } ⊆ A nur mit r1 = r2 = . . . = rn = 0 bestehen kann. Andernfalls heißt die Vektormenge linear abh¨angig.
I.3 Der Begriff des Vektorraums
15
Man sagt oft auch kurz (aber etwas ungenau), die Vektoren a1 , a2 , . . . , an seien linear unabh¨angig bzw. abh¨angig, obwohl das ja keine Eigenschaft der einzelnen Vektoren ist, sondern eine Eigenschaft der Menge dieser Vektoren. Ist {a1 , a2 , . . . , an } linear abh¨angig, dann kann man mindestens einen der Vektoren ai als Linearkombination der anderen darstellen. Ist aber {a1 , a2 , . . . , an } linear unabh¨angig, dann ist das nicht m¨oglich.
1 0 0 , 1 aus IR3 ist linear unabh¨angig, Beispiel 11: Die Vektormenge −1 −1
1 0 0 0 1 denn aus r +s = 0 folgt r = s = 0. −1 −1 0
Beispiel 12: Die auf IR definierten Funktionen x → sin x und x → cos x sind π linear unabh¨angig, denn aus r sin x + s cos x = 0 (Nullfunktion) folgt f¨ ur x = 2 bzw. x = 0 die Beziehung r = s = 0.
1 2 3 0 2 , 0 , 1 , 2 aus IR3 ist linear Beispiel 13: Die Vektormenge 3 5 1 7
1 2 3 0 0 abh¨angig: r1 2 + r2 0 + r3 1 + r4 2 = 0 bedeutet dasselbe wie 3 5 1 7 0
r1 + 2r2 + 3r3 = 0 2r1 + r3 + 2r4 = 0 . 3r1 + 5r2 + r3 + 7r4 = 0 Die Koeffizientenmatrix LGS mit den vier Variablen r1 , r2 , r3 , r4 dieses homogenen
1 0 0
hat die Stufenform
2 1 0
3 8 27
0 −7 –26
aßigerweise setzt man x4 = 27t . Zweckm¨
(t ∈ IR) und erh¨alt die L¨osungen ⎛ ⎜ ⎜ ⎜ ⎝
Es gilt also −40
1 2 3
⎞
r1 r2 r3 r4
⎛
⎟ ⎜ ⎟ ⎜ ⎟ = t⎜ ⎠ ⎝
− 19
2 0 5
−40 −19 26 27
+ 26
⎞ ⎟ ⎟ ⎟ ⎠
3 1 1
(t ∈ IR).
+ 27
0 2 7
=
0 0 0
.
Beispiel 14: Die Polynome u ¨ber IR vom Grad ≤ n bilden einen Vektorraum. Die Menge {1, x, x2 , . . . , xn } ist linear unabh¨angig: Ist p(x) = a0 + a1 x + a2 x2 + . . . + an xn das Nullpolynom, dann ist p(0) = 0, also a0 = 0 und p(x) = xq(x) mit q(x) = a1 + a2 x + a3 x2 + . . . + an xn−1 . Auch q(x) muss das Nullpolynom sein, also ist a1 = 0. So fortfahrend findet man a0 = a1 = a2 = . . . = an = 0.
16
I Lineare Gleichungssysteme und Vektorr¨aume
Definition 6: Es sei V ein Vektorraum und B eine linear unabh¨angige Teilmenge von V . Ist jeder Vektor aus V als Linearkombination von Vektoren aus B darstellbar, dann nennt man B eine Basis von V . Ist V ein K-Vektorraum mit der Basis B = {b1 , b2 , . . . , bn }, dann schreibt man auch ⎛ ⎞ ⎛ ⎞ v1 v1 ⎜ ⎟ ⎜ ⎟ ⎜ v2 ⎟ ⎜ v2 ⎟ n ⎜ ⎟ ⎜ v = v1 b1 + v2 b2 + . . . + vn bn = ⎜ .. ⎟ oder kurz ⎜ .. ⎟ ⎟∈K ⎝ . ⎠ ⎝ . ⎠ vn
vn B und nennt diese Zahlenspalte aus K den Koordinatenvektor von v bez¨ uglich der Basis B. Die Vektoren vibi sind die Komponenten, die Zahlen vi die Koordinaten des Vektors v bez¨ uglich der Basis B. Diese sind eindeutig durch v bestimmt, denn die Basisdarstellung ist eindeutig: Aus n
v1b1 + v2b2 + . . . + vnbn = w1b1 + w2b2 + . . . + wnbn folgt (v1 − w1 )b1 + (v2 − w2 )b2 + . . . + (vn − wn )bn = o, wegen der linearen Unabh¨angigkeit der Basisvektoren also v1 − w1 = 0, v2 − w2 = 0, . . . , vn − wn = 0. Bei gegebener Basis wird das Rechnen in einem Vektorraum mit Hilfe der Koordinatenvektoren durchgef¨ uhrt. Bei der Darstellung von Vektoren durch ihre Koordinatenvektoren muss man also wissen, auf welchem Platz die Koordinate zu einem gegebenen Basisvektor steht, man muss die Basivektoren also anordnen (1. Basisvektor, 2. Basisvektor usw.). Man muss dann die Basis nicht als Menge, sondern als Tupel ( geordnete Menge“) von Vektoren ansehen. ” Ist V endlich erzeugt, d.h. existieren endlich viele Vektoren, deren Erzeugnis V ergibt, dann besitzt V auch eine Basis: Man w¨ahle einfach unter den Erzeugendensystemen eines mit einer minimalen Anzahl von Vektoren. Ein solches ist linear unabh¨angig, denn w¨are einer der Vektoren als Linearkombination der anderen darstellbar, dann k¨onnte man ihn aus dem Erzeugendensystem streichen und erhielte eines mit einer kleineren Anzahl von Vektoren. Aus jedem Erzeugendensystem ergibt sich also eine Basis, indem man Vektoren aus ihm entfernt, welche von den u ¨brigen linear abh¨angig sind. Vektorr¨aume, die nicht endlich erzeugt sind, k¨onnen aber auch eine Basis besitzen. Beispielsweise bilden die Funktionen fi mit fi (x) = xi (i = 0, 1, 2, . . .) eine Basis des Vektorraums aller ganzrationalen Funktionen auf IR. Der folgende Satz enth¨alt Eigenschaften von Basen eines endlich-erzeugten Vektorraums V , welche h¨aufig ben¨otigt werden. Teil (1) des Satzes besagt, dass man aus einer Basis B von V wieder eine Basis von V erh¨alt, wenn man einen Vektor b ∈ B gegen eine Linearkombination von Vektoren aus B austauscht, falls der Koeffizient von b in dieser Linearkombination nicht 0 ist. Aus (1) folgt Teil (2) des Satzes, dieser tr¨agt den Namen Austauschsatz.
I.3 Der Begriff des Vektorraums
17
Satz 2: Der K-Vektorraum V habe die Basis B = {b1 , b2 , . . . , bn }. (1) Aus einer Basis von V ergibt sich wieder eine Basis, wenn man zu einem der Basisvektoren eine Linearkombination der u ¨brigen addiert. (2) Ist {u1 , u2 , . . . , um } eine lineare unabh¨angige Teilmenge von V , dann gibt es m Vektoren in B, die man durch u1 , u2 , . . . , um ersetzen kann. Insbesondere ist also jede n-elementige linear unabh¨angige Teilmenge von V eine Basis von V . (3) Jede linear unabh¨angige Teilmenge von V kann man durch weitere Elemente aus V zu einer Basis erg¨anzen. (4) Jede Basis von V enth¨alt gleich viele Vektoren. Beweis: (1) Ersetzt man b1 durch rb1 mit r = 0, dann ist v v = v1b1 + v2b2 + . . . + vnbn = 1 (rb1 ) + v2b2 + . . . + vnbn r
und {rb1 , b2 , . . . , bn } ist linear unabh¨angig. Ersetzt man b1 durch b1 + b2 , dann ist v = v1b1 + v2b2 + . . . + vnbn = v1 (b1 + b2 ) + (v2 − v1 )b2 + . . . + vnbn und {b1 +b2 , b2 , . . . , bn } ist linear unabh¨angig. Daraus ergibt sich die Behauptung. (2) In der Darstellung von u = o in der Basis B sei der Koeffizient ui von bi von 0 verschieden. Dann ersetze man bi durch uibi und addiere dann die Linearkom bination uj bj hinzu. Dann hat man bi durch u ersetzt. Nach (1) ergibt sich j=i
wieder eine Basis. Diese Ersetzungen wiederhole man f¨ ur die weiteren Vektoren u ∈ {u1 , u2 , . . . , um }. Dabei findet man immer ein bi , dessen Koeffizient in der Darstellung von u von 0 verschieden ist, weil andernfalls {u1 , u2 , . . . , um } linear abh¨angig w¨are. (3) Man ersetze gem¨aß (2) m Vektoren in einer Basis B durch die Vektoren der gegebenen linear unabh¨angigen Teilmenge. (4) Als minimales Erzeugendensystem ist die Anzahl der Vektoren in einer Basis eindeutig festgelegt. Man entnimmt das aber auch der Aussage (1): W¨aren {b1 , b2 , . . . , bn } und {u1 , u2 , . . . , um } Basen mit m < n, dann h¨atte man bei Ersetzung von m der Vektoren der ersten Basis durch die m Vektoren der zweiten Basis noch n − m Vektoren in der ersten Basis, welche Linearkombinationen der anderen Vektoren in der Basis sein m¨ ussten, was einen Widerspruch ergibt. 2 Da nach Satz 2 (4) zwei verschiedene Basen eines endlich-erzeugten Vektorraums gleich viele Elemente besitzen, ist folgende Definition erlaubt: Definition 7: Die Anzahl der Elemente einer Basis eines endlich-erzeugten Vektorraums V nennt man die Dimension von V und bezeichnet sie mit dim V. Die Dimension des Vektorraums {o} ist 0.
I Lineare Gleichungssysteme und Vektorr¨aume
18
Beispiel 15: Der Vektorraum IRn der n-Tupel reeller Zahlen hat die Dimension n. Eine Basis bilden z.B. die n-Tupel, deren Koordinaten alle den Wert 0 haben, bis auf eine, die den Wert 1 hat. Dies nennt man die Standardbasis von IRn . Die Standardbasis von IRn besteht also aus den Vektoren ⎛
1 0 0 0 .. . 0
⎜ ⎜ e1 = ⎜ ⎜ ⎜ ⎝
⎞
⎛
⎟ ⎟ ⎟ ⎟, ⎟ ⎠
⎜ ⎜ e2 = ⎜ ⎜ ⎜ ⎝
0 1 0 0 .. . 0
⎞
⎛
⎟ ⎟ ⎟ ⎟, ⎟ ⎠
⎜ ⎜ e3 = ⎜ ⎜ ⎜ ⎝
0 0 1 0 .. . 0
⎞
⎛
⎟ ⎟ ⎟ ⎟, ⎟ ⎠
⎜ ⎜ e4 = ⎜ ⎜ ⎜ ⎝
0 0 0 1 .. . 0
⎞
⎟ ⎟ ⎟ ⎟, ⎟ ⎠
⎛
...,
⎜ ⎜ en = ⎜ ⎜ ⎜ ⎝
0 0 0 0 .. . 1
⎞
⎟ ⎟ ⎟ ⎟. ⎟ ⎠
Beispiel 16: Der Vektorraum IRm,n der m, n-Matrizen reeller Zahlen hat die Dimension m · n. Eine Basis ist beispielsweise die Menge aller m, n-Matrizen, deren Eintr¨age alle den Wert 0 haben, bis auf einen, der den Wert 1 hat. Beispiel 17: Der Vektorraum IR3,3 hat die Dimension 9. Diejenigen Matrizen aus IR3,3 , bei denen die Summen der Zahlen in den einzelnen Zeilen und Spalten den gleichen Wert haben, bilden einen Unterraum U . Dieser hat die Dimension 3, denn eine Basis von U ist z.B. (Aufgabe 6) ⎧⎛ ⎪ ⎨ 1 ⎜ ⎝ 1 ⎪ ⎩
⎞ ⎛
⎞⎫
⎞ ⎛
1 1 0 2 1 1 2 0 ⎪ ⎬ ⎜ ⎟ ⎜ ⎟ 1 1 ⎟ ⎠,⎝ 2 1 0 ⎠,⎝ 0 1 2 ⎠ . ⎪ 1 1 1 1 0 2 2 0 1 ⎭
Beispiel 18: Die arithmetischen Folgen (a + dn), also die Folgen der Form a, a + d, a + 2d, a + 3d, . . . , bilden einen 2-dimensionalen Unterraum des Vektorraums aller Folgen reeller Zahlen; eine Basis ist {(1), (n)}, wobei (1) die konstante Folge 1, 1, 1, . . . und (n) die Folge 1, 2, 3, . . . der nat¨ urlichen Zahlen ist. Beispiel 19: Das homogene LGS 2x1 + 3x2 − 5x3 + 4x4 − x5 = 0 x1 + x2 − 2x3 + 7x4 − 2x5 = 0 bzw.
2x1 + 3x2 = 5x3 − x1 + x2 = 2x3 − l¨asst sich umformen zu x1 = x3 − 17x4 x2 = x3 + 10x4
4x4 + x5 7x4 + 2x5 + 5x5 . − 3x5
Die L¨osungsmenge ist ⎧ ⎪ ⎪ ⎪ ⎨
⎛
⎪ ⎪ ⎪ ⎩
⎝
⎜
x3 ⎜ ⎜
1 1 1 0 0
⎞
⎛
⎟ ⎜ ⎟ ⎜ ⎟ + x4 ⎜ ⎠ ⎝
−17 10 0 1 0
⎞
⎛
⎟ ⎜ ⎟ ⎜ ⎟ + x5 ⎜ ⎠ ⎝
5 −3 0 0 1
⎞ ⎟ ⎟ ⎟ ⎠
|
⎫ ⎪ ⎪ ⎪ ⎬
x3 , x4 , x5 ∈ IR , ⎪ ⎪ ⎪ ⎭
also der von den drei genannten L¨osungsvektoren erzeugte Unterraum U von IR5 .
I.3 Der Begriff des Vektorraums
19
Die Vektoren in diesem Erzeugendensystem sind linear unabh¨angig, also hat der L¨osungsraum U die Dimension 3. Ist umgekehrt U mit obigem Erzeugendensystem gegeben, dann kann man U als L¨osungsraum eines LGS verstehen, n¨amlich eines LGS mit 5 Variablen, dessen Koeffizientenvektoren sich als L¨osungen des folgenden homogenen LGS mit den Variablen a1 , a2 , . . . , a5 ergeben: a2 + a3 = 0 a1 + −17a1 + 10a2 + a4 = 0 5a1 − 3a2 + a5 = 0 Der L¨osungsraum hat die Dimension 2, linear unabh¨angige L¨osungen werden z. B. durch die Quintupel (2, 3, −5, 4, −1) und (1, 1, −2, 7, −2) gegeben. Es ergibt sich also ein homogenes LGS mit 5 Variablen und 2 Gleichungen, welches ¨aquivalent zu dem eingangs betrachteten LGS ist. (Mit den angegebenen Quintupeln erh¨alt man genau das eingangs gegebene LGS.) Satz 3: Jeder Unterraum U der Dimension m von IRn ist der L¨osungsraum eines homogenen LGS mit n − m Gleichungen. Beweis: Es sei {u1 , u2 , . . . , um } eine Basis von U und ui habe die Koordinaten ui1 , ui2 , . . . , uin (i = 1, . . . , m). Der L¨osungsraum W des homogenen LGS u11 y1 + u21 y1 +
u12 y2 + . . . + u22 y2 + . . . +
u1n yn = 0 u2n yn = 0 .. .
um1 y1 + um2 y2 + . . . + umn yn = 0 mit den Variablen y1 , y2 , . . . , yn ¨andert sich nicht, wenn man das LGS durch Zeilenumformungen auf Stufengestalt bringt, man kann also uij = 0 f¨ ur j < i annehmen. Außerdem kann man durch Vertauschung der Variablen (also Vertauschung der Basisvektoren) erreichen, dass uii = 0, da {u1 , u2 , . . . , um } linear unabh¨angig ist. Schließlich k¨onnen wir noch uii = 1 setzen und durch weitere Zeilenumformungen erreichen, dass uij = 0 f¨ ur i < j ≤ m. Das LGS hat dann folgende Form: y1 y2 y3 y4
+ + + +
u1,m+1 ym+1 u2,m+1 ym+1 u3,m+1 ym+1 u4,m+1 ym+1
+ + + +
... ... ... ...
+ + + +
u1n yn u2n yn u3n yn u4n yn
= = = = .. .
0 0 0 0
ym + um,m+1 ym+1 + . . . + umn yn = 0 Der L¨osungsraum wird also erzeugt von den n − m linear unabh¨angigen Vektoren cm+j + em+j (j = 1, . . . , n − m), wobei cm+j die Koordinaten −u1,m+j , −u2,m+j , . . . , −um,m+j , 0, 0, . . . , 0 hat. Der L¨osungsraum hat also die Dimension n − m. Hat nun der L¨osungsraum des eingangs gegebenen LGS die
I Lineare Gleichungssysteme und Vektorr¨aume
20
Basis {w 1, w 2, . . . , w n−m } und hat w j die Koordinaten wj1 , wj2 , . . . , wjn (j = 1, . . . , n − m) dann sind die Vektoren ui L¨osungen von w11 x1 + w21 x1 +
w12 x2 + . . . + w22 x2 + . . . +
w1n xn = w2n xn = .. .
0 0
.
wn−m,1 x1 + wn−m,2 x2 + . . . + wn−m,n xn = 0, Der L¨osungsraum dieses LGS hat die Dimension n − (n − m) = m, also ist U der L¨osungsraum dieses LGS. 2 Bez¨ uglich einer gegebenen Basis des n-dimensionalen Vektorraums V l¨asst sich dieser mit IRn identifizieren, indem man jedem Vektor aus V seinen Koordinatenvektor bez¨ uglich der Basis zuordnet. Also gilt auch allgemeiner als in Satz 3: Jeder Unterraum U eines endlich-dimensionalen K-Vektorraums V l¨asst sich als L¨osungsraum eines homogenen LGS mit Koeffizienten aus K verstehen. Sollen dabei die Vektoren aus den Koeffizienten der Gleichungen linear unabh¨angig sein, dann besteht das LGS aus dim V − dim U Gleichungen.
Aufgaben 1. Es sei {a, b, c} eine linear unabh¨angige Menge von Vektoren aus einem Vektorraum V . Man zeige, dass dann auch {a + 2b, a + b + c, a − b − c} linear unabh¨angig ist.
2. Es sei Pn der Vektorraum der Polynome u¨ber IR vom Grad ≤ n. Zeige, dass {1, 1 + x, (1 + x)2 , . . . , (1 + x)n } eine Basis von Pn ist.
3. Es sei Q die Menge der rationalen Zahlen. Man zeige, dass die Zahlen √ √ a + b 2 + c 3 mit a, b, c ∈ Q
einen Q-Vektorraum der Dimension 3 bilden.
4. a) Man beweise, dass die Schnittmenge zweier Unterr¨aume eines Vektorraums V wieder ein Unterraum von V ist. b) Man beweise, dass die Vereinigungsmenge zweier Unterr¨aume U1 , U2 eines Vektorraums V nur dann wieder ein Unterraum von V ist, wenn U1 ⊆ U2 oder U2 ⊆ U1 gilt. c) Es seien U1 , U2 zwei Unterr¨aume des Vektorraums V . Man zeige, dass {u1 + u2 | u1 ∈ U1 , u2 ∈ U2 } einen Untervektorraum W von V bildet. Unter welcher Voraussetzung ist f¨ ur jeden Vektor w ∈ W die Darstellung w = u1 + u2 mit u1 ∈ U1 , u2 ∈ U2 eindeutig?
I.4 Lineare Mannigfaltigkeiten
5. Bildet die Menge der Matrizen
21
a b
−b a
mit a, b ∈ IR einen IR-Vektorraum?
Welche Dimension hat dieser?
6. Man bestimme eine Basis des L¨osungsraums des homogenen LGS x 1 + x2 + x3 = = = = = = =
x 4 + x 5 + x6 x 7 + x 8 + x9 x 1 + x 4 + x7 x 2 + x 5 + x8 x 3 + x 6 + x9 x 1 + x 5 + x9 x 3 + x 5 + x7
Eine L¨osung bestimmt ein Zahlenquadrat, bei welchem die Summen der Zahlen in den Zeilen, Spalten und Diagonalen alle den gleichen Wert haben (Fig. 1).
................................................................................ .. ... .. x .... .. 2 ... x3 ........... S ... x.1 .... . . . . . . . . .. ......................................................................................... . . ... x .... ... x ........... ... 4 ... x5 .... S . 6 ..... . ... ... .... ... ..... ... .. ................................................................. .. x7 .... . .... ........... S ..... . ... x.8 .... x.9 ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. ... . ... ........ ... ..... ... . ... ... . .. ... ... .. .. S S S S S Fig. 1: Zahlenquadrat
I.4 Lineare Mannigfaltigkeiten Die doch sehr abstrakten Begriffe aus I.3 und dem vorliegenden Abschnitt I.4 werden in I.5 geometrisch interpretiert, so dass man den Zusammenhang der linearen Algebra mit der analytischen Geometrie besser erkennt. Die hier behandelten linearen Mannigfaltigkeiten sind dann nicht anderes als Geraden in der Ebene bzw. Geraden und Ebenen im Raum. Definition 1: Es sei V ein Vektorraum, a ∈ V und ferner U ein Unterraum von V . Die Menge aller Vektoren der Form a + u mit u ∈ U bezeichnet man mit a + U und nennt sie eine lineare Mannigfaltigkeit. Hat U die Dimension d, dann spricht man von einer d-dimensionalen linearen Mannigfaltigkeit. Ist a ∈ U , dann ist a + U = U , denn dann gilt a + u ∈ U f¨ ur alle u ∈ U . Ein Unterraum ist also eine spezielle lineare Mannigfaltigkeit. Beispiel 1: Die L¨osungsmenge eines inhomogenen LGS ist eine lineare Mannigfaltigkeit a + U , wobei a eine spezielle L¨osung des inhomogenen LGS und U der L¨osungsraum des zugeh¨origen homogenen LGS ist.
I Lineare Gleichungssysteme und Vektorr¨aume
22
Satz 1: Es sei V ein n-dimensionaler K-Vektorraum. Jede m-dimensionale lineare Mannigfaltigkeit a +U aus V l¨asst sich als L¨osungsmenge eines LGS u ¨ber K mit n − m Gleichungen verstehen. Beweis: In V sei eine Basis B gegeben. Ferner sei {u1 , u2 , . . . , um } eine Basis von U und ⎛ ⎞ ⎛ ⎞ ui1 ⎜ ui2 ⎜ ui = ⎜ .. ⎝ . uin
⎟ ⎟ ⎟ ⎠
(i = 1, . . . , m), B
a1 ⎜ a2 ⎟ ⎜ a = ⎜ .. ⎟ ⎟ . ⎝ . ⎠ an B
Der Unterraum U sei der L¨osungsraum des homogenen LGS a11 x1 + a21 x1 +
a12 x2 + . . . + a22 x2 + . . . +
a1n xn = 0 a2n xn = 0 .. .
an−m,1 x1 + an−m,2 x2 + . . . + an−m,n xn = 0 (vgl. Satz 3 in I.3) und es sei a11 a1 + a21 a1 +
a12 a2 + . . . + a22 a2 + . . . +
a1n an = a2n an = .. .
b1 b2
.
an−m,1 a1 + an−m,2 a2 + . . . + an−m,n an = bn−m Dann ist a + U die L¨osungsmannigfaltigkeit des LGS a11 x1 + a21 x1 +
a12 x2 + . . . + a22 x2 + . . . +
a1n xn = a2n xn = .. .
b1 b2
.
2
an−m,1 x1 + an−m,2 x2 + . . . + an−m,n xn = bn−m Satz 2: Ist U ein Unterraum des K-Vektorraums V , dann bildet die Menge {a + U | a ∈ V } mit den Operationen (a + U ) + (b + U ) = (a + b) + U
und r(a + U ) = ra + U
f¨ ur a, b ∈ V und r ∈ K einen K-Vektorraum. Beweis: Die Operationen in {a + U | a ∈ V } sind wohldefiniert, d. h. sie f¨ uhren unabh¨angig von den gew¨ahlten Vertretern a, b der linearen Mannigfaltigkeiten zum gleichen Ergebnis. Ist n¨amlich a + U = a + U und b + U = b + U , also a − a ∈ U und b − b ∈ U , dann ist (a + b ) + U = (a + b + (a − a + b − b)) + U = (a + b) + U. Ist ferner a + U = a + U , also a − a ∈ U , dann ist
I.4 Lineare Mannigfaltigkeiten
23
ra + U = (ra + r(a − a)) + U = a + U. Man rechnet leicht nach, dass die Vektorraumaxiome in {a + U | a ∈ V } erf¨ ullt sind (Aufgabe 1). 2 Definition 2: Den Vektorraum aus Satz 2 bezeichnet man mit V /U (sprich V nach U“) und nennt ihn den Quotientenraum von V nach U. ” Sind U1 , U2 zwei Unterr¨aume des Vektorraums V , dann bildet auch die Schnittmenge U1 ∩ U2 einen Unterraum von V . F¨ ur die Vereinigungsmenge gilt das nicht: Mit u1 ∈ U1 und u2 ∈ U2 muss nicht u1 + u2 ∈ U1 ∪ U2 gelten. Der kleinste Unterraum, der U1 und U2 enth¨alt, ist der im Folgenden definierte Unterraum U1 + U2 von V : Definition 3: F¨ ur zwei Unterr¨aume U1 , U2 des Vektorraums V sei U1 + U2 = {u1 + u2 | u1 ∈ U1 , u2 ∈ U2 }. Offensichtlich ist U1 + U2 ein Unterraum von V , welcher U1 und U2 enth¨alt, und es gibt keinen kleineren Unterraum von V mit dieser Eigenschaft.
3 5 1 , 7 Beispiel 2: U1 = 2 1 ur v ∈ U1 ∩ U2 gilt von IR3 . F¨ ⎛
⎞
und U2 = ⎛
⎞
⎛
2 0 1
,
0 3 1
⎞
⎛
sind Unterr¨aume ⎞
3 5 2 0 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ v = x1 ⎝ 1 ⎠ + x2 ⎝ 1 ⎠ = y1 ⎝ 0 ⎠ + y2 ⎝ 3 ⎠ 2 1 1 1 mit x1 , x2 , y1 , y2 ∈ IR. Das homogene LGS = 0 3x1 + 5x2 − 2y1 x1 + x 2 − 3y2 = 0 2x1 + x2 − y1 − y2 = 0 hat die L¨osungen x1 = 11r, x2 = r, y1 = 19r, y2 = 4r (r ∈ IR), die Vektoren in U1 ∩ U2 sind also ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 3
5
38
2
1
23
11r⎝ 1 ⎠ + r⎝ 1 ⎠ = r⎝ 12 ⎠ (r ∈ IR). Die in Beispiel 2 angegebenen erzeugenden Vektoren von U1 und U2 erzeugen gemeinsam IR3 , denn je drei von ihnen sind linear unabh¨angig. Also ist U1 + U2 = IR3 . Hier gilt also dim(U1 + U2 ) = dim U1 + dim U2 − dim(U1 ∩ U2 ). Dies gilt auch allgemein (Aufgabe 3).
I Lineare Gleichungssysteme und Vektorr¨aume
24
Analog zur Schnittmenge zweier Unterr¨aume kann man die Schnittmenge zweier linearer Mannigfaltigkeiten aus einem Vektorraum V betrachten. Die Schnittmenge zweier Unterr¨aume ist nie leer, da sie mindestens den Nullvektor enth¨alt, die Schnittmenge zweier linearer Mannigfaltigkeiten kann aber leer sein. Satz 3: Die Schnittmenge zweier linearer Mannigfaltigkeiten eines Vektorraums V ist leer oder selbst wieder eine lineare Mannigfaltigkeit von V . Beweis: Sind zwei lineare Mannigfaltigkeiten jeweils als L¨osungsmenge eines LGS gegeben, dann ist ihre Schnittmenge die L¨osungsmenge desjenigen LGS, das durch Zusammenf¨ ugen der beiden gegebenen LGS entsteht. 2 In Verallgemeinerung der in Definition 3 gegebenen Summe von Unterr¨aumen k¨onnte man auch die Summe von linearen Mannigfaltigkeiten aus einem gegebenen Vektorraum V definieren: (a + U1 ) + (b + U2 ) = (a + b) + (U1 + U2 ). Diese Summe enth¨alt aber im Allgemeinen nicht die Summanden, es gilt also in der Regel (a + U1 ), (b + U2 ) ⊆ (a + b) + (U1 + U2 ). Denn aus a + U1 ⊆ (a + b) + (U1 + U2 ) folgt U1 ⊆ b + (U1 + U2 ) und daraus b ∈ U1 + U2 (wegen o ∈ b + (U1 + U2 )), was aber nicht der Fall sein muss. Definition 4: Es seien U1 , U2 Unterr¨aume eines Vektorraums V und a, b ∈ V . Die kleinste lineare Mannigfaltigkeit, welche (a + U1 ) und (b + U2 ) enth¨alt, nennt man die lineare H¨ ulle der beiden Mannigfaltigkeiten und bezeichnet sie mit (a + U1 ) ∨ (b + U2 ). Satz 4: F¨ ur Unterr¨aume U1 , U2 eines Vektorraums V und a, b ∈ V gilt (a + U1 ) ∨ (b + U2 ) = a + ( b − a + U1 + U2 .) Beweis: F¨ ur u1 ∈ U1 , u2 ∈ U2 gilt a + u1 = a + o + u1 + o ∈ a + ( b − a + U1 + U2 ), b + u2 = a + (b − a) + o + u2 ∈ a + ( b − a + U1 + U2 ), also a + U1 , b + U2 ⊆ a + ( b − a + U1 + U2 ). Ist umgekehrt (a + U1 ) ∨ (b + U2 ) = c + W , dann ist und b − c + U2 ⊆ W, also a − c, b − c ∈ W und damit b − a ∈ W , also auch b − a ⊆ W. Weil auch 2 U1 , U2 ⊆ W gilt, ist insgesamt b − a + U1 + U2 ⊆ W . a − c + U1 ⊆ W
Ist {a, b} linear abh¨angig, dann ist (a + U1 ) ∨ (b + U2 ) der Unterraum a + U1 + U2 (Aufgabe 6).
I.4 Lineare Mannigfaltigkeiten
25
Beispiel 3: Im IR3 kann man a + u und b + v mit u, v = o als Geraden deuten (vgl. I.5). Die lineare H¨ ulle a + ( b − a + u + v ) ist dann • IR3 , falls {b − a, u, v } linear unabh¨angig ist, • die Ebene a + u, v , falls {u, v } linear unabh¨angig und b − a ∈ u, v ist (Ebene durch zwei sich schneidende Geraden), • die Ebene a + b − a, v , falls {u, v } linear abh¨angig und {b − a, v } linear unabh¨angig ist (Ebene durch parallele Geraden), • die Gerade a + u, falls {u, v } linear abh¨angig und b − a ∈ u ist. In I.5 werden diese geometrischen Aspekte weiter behandelt.
Aufgaben 1. Man zeige, dass in V /U (vgl. Satz 2) die Vektorraumaxiome erf¨ullt sind. 2.
⎛ ⎞ ⎛ 0 1 ⎜ 0 ⎟ ⎜ 1 ⎜ ⎜ ⎟ Es sei U = ⎝ 2 ⎠, ⎝ 3 2 1
⎞ ⎛ ⎞ 3 ⎟ ⎜ −1 ⎟ ⎟ und ⎟ a=⎜ ⎠ ⎝ 5 ⎠. 7
Man stelle a + U als L¨osungsmannigfaltigkeit eines LGS dar.
3. Man zeige, dass f¨ur alle Unterr¨aume U1 , U2 eines endlichdimensionalen Vektorraus V gilt: dim(U1 + U2 ) = dim U1 + dim U2 − dim(U1 ∩ U2 )
4. Man zeige, dass die Schnittmenge zweier verschiedener 2-dimensionaler linearer Mannigfaltigkeiten aus IR3 entweder leer oder eine eindimensionale lineare Mannigfaltigkeit ist.
5. Man zeige, dass f¨ur a, b, c, u, v ∈ V genau dann (a + u) ∨ (b + v ) = c + u, v gilt, wenn (a + u) ∩ (b + v ) = ∅ ist.
6. Man beweise: Ist {a, b} linear abh¨angig, dann ist (a + U1 ) ∨ (b + U2 ) der Unterraum a + U1 + U2 .
I Lineare Gleichungssysteme und Vektorr¨aume
26
I.5 Geometrische Interpretation In einem ebenen Koordinatensystem, das wir uns ohne Beschr¨ankung der Allgemeinheit als ein kartesisches Koordinatensystem vorstellen d¨ urfen, kann man 3 jeden Punkt (p1 , p2 ) durch seinen Ortsvektor x2 a
−→
OP = p =
p1 p2
darstellen und so dem Punktraum“, der aus ” allen Zahlenpaaren besteht, die Vektorraumstruktur von IR2 aufpr¨agen. Allgemeiner ordnet man einem Punktepaar A(a1 , a2 ), B(b1 , b2 ) den Vektor
−→ b1 − a1 AB= = b − a b2 − a2
.
....
....... B @ a + b
I b @
@............... b b − a
@ 3A a
6
O
x1
Fig. 1: Vektorpfeile
zu. Vektoren stellt man bildlich als Pfeile ( Vektorpfeile“) dar, wobei alle gleich ” langen und gleich gerichteten Pfeile den gleichen Vektor darstellen (Fig. 1). So wird es m¨oglich, geometrische Sachverhalte in der Ebene mit Hilfe von Vektoren aus IR2 zu beschreiben. Ist u = o, dann ist die Menge aller Punkte mit den Ortsvektoren x = p + tu (t ∈ IR) die Gerade durch den Punkt P (mit dem Ortsvektor p) und dem Richtungsvektor u (Fig. 2). Diese Gerade ist also die eindimensionale lineare Mannigfaltigkeit p + u aus IR2 . In gleicher Weise kann man in einem r¨aumlichen Koordinatensystem geometrische Sachverhalte mit Hilfe von Vektoren aus IR3 beschreiben. Ist p ∈ IR3 und U ein Unterraum von IR3 , dann ist p + U eine Gerade durch den Punkt P (mit dem Ortsvektor p) oder eine Ebene durch den Punkt P , wenn U die Dimension 1 oder 2 hat. Im ersten Fall Ist U = u mit u = o und u heißt der Richtungsvektor der Geraden, im zweiten Fall ist U = u, v , wobei {u, v } linear unabh¨angig ist, und u, v heißen Spannvektoren der Ebene (Fig. 3).
x2
6
........ u. : ................g ...... .. . . Pt . . . . . . . . . . . . ............. ................ p
O
-
x1
Fig. 2: Geradengleichung
x3
.......... ........ ......... . . . . . . . ..... ........v. ..... * ........ . . . . . . . P . . E ...... . . . t . . . ..... . . .......... . . . . . @ . ...... ........ ..... u @ R............. @ ..... . . . ...... ........... O ....... x2 x1 6
Fig. 3: Ebenengleichung
I.5 Geometrische Interpretation
27
Die Berechnung des Schnittpunkts zweier Geraden, des Durchstoßpunktes einer Geraden durch eine Ebene oder der Schnittgeraden zweier Ebenen bedeutet nun die Bestimmung der Schnittmengen zweier linearer Mannigfaltigkeiten. Die Berechnung einer Ebene durch zwei Geraden oder einer Ebene durch einen Punkt und eine Gerade bedeutet die Bestimmung der linearen H¨ ulle zweier linearer Mannigfaltigkeiten. In den folgenden Beispielen sind p, p + u, p + u, v lineare Mannigfaltigkeiten der Dimension 0 bzw. 1 bzw. 2 aus IR3 . Beispiel 1 (Durchstoßpunkt einer Geraden durch eine Ebene): Es soll der Schnittpunkt der Geraden g und der Ebene E bestimmt werden:
⎞ ⎞ ⎛ ⎞ ⎞ ⎛ ⎛ ⎞ ⎛ 1 2 −1 2 1 g : ⎝ 2 ⎠ + ⎝ −1 ⎠ , E : ⎝ 1 ⎠ + ⎝ 0 ⎠ , ⎝ −1 ⎠ . 1 1 3 1 5 ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 2 1 1 2 −1 Dazu muss man die Gleichung ⎝ 2 ⎠ + r⎝ −1 ⎠ = ⎝ 1 ⎠ + s⎝ 0 ⎠ + t ⎝ −1 ⎠ 1 1 5 1 3 ⎧ ⎫ ⎪ ⎨ 2 + r = 1 + 2s − t ⎪ ⎬ 1 1 4 bzw. das LGS ⎪ 2 − r = 1 − t l¨osen: r = − , s = − , t = − ⎪ 3 3 3 ⎩ ⎭ ⎛
1 + r = 5 + s + 3t
⎛ ⎞ ⎛ ⎞ ⎞ 1 5 2 1 1 Der Durchstoßpunkt hat den Ortsvektor ⎝ 2 ⎠ − ⎝ −1 ⎠ = ⎝ 7 ⎠ , welcher 3 3 ⎛1 ⎞ ⎛ 1 ⎞ ⎛2 ⎞ ⎛ ⎞ 2 −1 5 1 4 1 1 sich nat¨ urlich auch in der Form ⎝ 1 ⎠ − ⎝ 0 ⎠ − ⎝ −1 ⎠ = ⎝ 7 ⎠ ergibt. 3 3 3 1 3 2 5 ⎛
Beispiel 2 (Schnittgerade zweier Ebenen): Es soll die Schnittgerade der Ebenen E1 und E2 bestimmt werden: ⎞ ⎞ ⎛ ⎞ ⎛ 1 1 1 E1 : ⎝ 0 ⎠ + ⎝ 0 ⎠ , ⎝ 1 ⎠ , 0 0 3 ⎛
⎞ ⎛ ⎞ ⎞ ⎛ 0 2 2 E2 : ⎝ 3 ⎠ + ⎝ 1 ⎠ , ⎝ 0 ⎠ . 1 1 2 ⎛
Dazu muss man die Gleichung ⎛
⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 1 1 2 0 2 ⎝ 0 ⎠ + r ⎝ 0 ⎠ + s⎝ 1 ⎠ = ⎝ 3 ⎠ + t⎝ 1 ⎠ + u⎝ 0 ⎠ 3 0 0 2 1 1 ⎧ ⎫ ⎪ ⎪ ⎨ 1 + r + s = 2 + 2u ⎬
s = 3+t l¨osen: t = 1 − u, s = 4 − u, ⎪ 3 = 2+t+u ⎭ r = −3 − 3u. Die Schnittgerade ist also die lineare Mannigfaltigkeit bzw. das LGS ⎪ ⎩ ⎛
⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 2 2 2 2 0 0 ⎝ 3 ⎠ + ⎝ 1 ⎠ + ⎝ 0 ⎠ − ⎝ 1 ⎠ =⎝ 4 ⎠ + ⎝ −1 ⎠ . 2 1 1 1 3 0
I Lineare Gleichungssysteme und Vektorr¨aume
28
Beispiel 3 (Ebene durch Punkt und Gerade): Die lineare H¨ ulle von p = p + o (Punkt) und q + u mit u = o (Gerade) ist p + q − p, u (Ebene), falls q − p ∈ u (falls also der Punkt nicht auf der Geraden liegt). Beispielsweise ist ⎛
⎞ ⎛⎛ ⎞ ⎛ ⎞⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 3 5 1 3 2 1 ⎝ −1 ⎠ ∨ ⎝⎝ 9 ⎠ + ⎝ −1 ⎠ ⎠ = ⎝ −1 ⎠ + ⎝ 10 ⎠ , ⎝ −1 ⎠ . 2 7 4 2 5 4
Aufgaben 1. Man zeige in Erg¨anzung zu Beispiel 3, dass der dort angegebene Punkt nicht auf der angegebenen Geraden liegt.
2. Es seien zwei Geraden p + u und q + v in IR3 gegeben. Man zeige: (p + u) ∩ (q + v ) = ∅ ⇐⇒ (p + u) ∨ (q + v ) = IR3 (Im vorliegenden Fall nennt man die Geraden windschief.)
3. a) Auf zwei windschiefen Geraden (vgl. Aufgabe 2) seien jeweils zwei verschiedene Punkte A, B bzw. C, D gegeben. Man zeige, dass dann auch die Geraden durch A, C und durch B, D windschief sind. b) Besitzt das Viereck mit den Ecken A(1, 2, −1), B(5, −3, 0), C(0, 4, 1), D(1, 0, 1) einen Diagonalenschnittpunkt?
I.6 Konvexe Mengen Sind zwei Punkte A, B durch ihre Ortsvektoren a, b gegeben, dann beschreiben die Ortsvektoren
A ..u........ .......... .......... P . .......................... a ... . .......... B . . . . . ... ...u ....... . * . . . . . . . . ... ... ... b .
ra + sb mit r, s ≥ 0 und r + s = 1 die Punkte der Strecke AB (Fig. 1), denn ra + sb = (1 − s)a + sb = a + s(b − a). Jedem Zahlenpaar (r, s) mit r, s ≥ 0 und r + s = 1 ist eindeutig ein Punkt P der Strecke AB zugeordnet und umgekehrt bestimmt ein Punkt der Strecke eindeutig ein solches Zahlenpaar.
u
O Fig. 1: Strecke AB
I.6 Konvexe Mengen
29
Sind drei Punkte A, B, C durch ihre Ortsvektoren a, b, c gegeben, dann beschreiben die Ortsvektoren ra + sb + tc mit r, s, t ≥ 0 und r + s + t = 1 die Punkte der Dreiecksfl¨ache ABC (Fig. 2), denn ra + sb + tc = (1 − s − t)a + sb + tc = a + s(b − a) + t(c − a). F¨ ur r = 0 ergeben sich die Punkte der Seite BC, f¨ ur s = 0 bzw. t = 0 die der Seite AC bzw. AB. Ein Punkt der Dreiecksfl¨ache und das Zahlentripel (r, s, t) mit obigen Eigenschaften bestimmen sich gegenseitig eindeutig. C ...u.... . .. AK .......... .. . A ............ ....... ...u................ A ...... A @ I .....A.................................. ........u @ A @
A
B A c a@ A b @A @Au
@
Fig. 2: Dreieck ABC
C ...u.....................................u D . ... .. AK.......... .. .. .. .. 6 . .. . . ..A.. .. .............. .... ....... ... ...u........... . A ..... .. ........ I .......A..................................... A @ ..........u @ A @ A d B @ A c a@ A b @A @Au
Fig. 3: Tetraeder ABCD
Sind vier Punkte A, B, C, D im Raum durch ihre Ortsvektoren a, b, c, d gegeben, dann beschreiben die Ortsvektoren ra + sb + tc + uc mit r, s, t, u ≥ 0 und r + s + t + u = 1 die Punkte eines Tetraeders ABCD (Fig. 3), denn a). ra +sb+tc +ud = (1−s−t−u)a +sb+tc +ud = a +s(b−a)+t(c −a)+u(d− F¨ ur r = 0 ergeben sich die Punkte der Dreiecksfl¨ache BCD, f¨ ur r = s = 0 die Punkte der Strecke CD. Definition 1: Eine Punktmenge M heißt konvex, wenn f¨ ur alle P, Q ∈ M auch die Punkte der Strecke P Q zu M geh¨oren. Die Strecke AB, die Dreiecksfl¨ache ABC und das Tetraeder ABCD sind Beispiele f¨ ur konvexe Punktmengen. Geraden, Halbgeraden, Ebenen und Halbebenen sind ebenfalls Beispiele f¨ ur konvexe Punktmengen. Satz 1: Die Schnittmenge von konvexen Mengen ist wieder konvex. Beweis: Sind M1 , M2 konvexe Mengen, dann gilt f¨ ur P, Q ∈ M1 ∩ M2 sowohl P Q ⊆ M1 als auch P Q ⊆ M2 , also P Q ⊆ M1 ∩ M2 . 2
I Lineare Gleichungssysteme und Vektorr¨aume
30
Definition 2: F¨ ur a1 , a2 , . . . , ak ∈ IRn nennt man die Linearkombination r1a1 + r2a2 + . . . + rkak
mit r1 , r2 , . . . , rk ≥ 0 und r1 + r2 + . . . + rn = 1
eine Konvexkombination von a1 , a2 , . . . , ak . Die Menge aller Konvexkombinationen von a1 , a2 , . . . , ak nennt man die konvexe H¨ ulle der Menge dieser Vektoren. F¨ ur k Punkte mit den Ortsvektoren a1 , a2 , . . . , ak nennt man die Menge der Punkte mit Ortsvektoren aus der konvexen H¨ ulle von a1 , a2 , . . . , ak die konvexe H¨ ulle dieser Punktmenge. Satz 2: Die konvexe H¨ ulle einer endlichen Menge von Punkten aus IRn ist konvex. Beweis: Es gilt r(r1a1 + r2a2 + . . . + rkak ) + s(s1a1 + s2a2 + . . . + skak ) = (rr1 + ss1 )a + (rr2 + ss2 )a + . . . + (rrk + ssk )ak . Aus r, s, ri , si ≥ 0 folgt rri + ssi ≥ 0 (i = 1, 2, . . . , k), und aus r + s = 1 und r1 + r2 + . . . + rk = s1 + s2 + . . . + sk = 1 folgt (rr1 + ss2 ) + (rr2 + ss2 ) + . . . + (rrk + ssk ) = r(r1 + r2 + . . . + rk ) + s(s1 + s2 + . . . + sk ) = r · 1 + s · 1 = 1.
2
Die konvexe H¨ ulle von k Punkten der Ebene ist ein konvexes Polygon mit k Ecken. Die konvexe H¨ ulle von k Punkten im Raum ist ein konvexes Polyeder mit k Ecken. Dabei k¨onnen Ecken auch entartet“ sein, wenn sie z.B. auf der Verbindungsstre” cke zweier Nachbarecken liegen. Die konvexe H¨ ulle von k Punkten des IRn mit den Ortsvektoren a1 , a2 , . . . , ak nennt man einen (k − 1)-dimensionalen Simplex, wenn {a2 − a1 , a3 − a1 , . . . , ak − a1 } linear unabh¨angig ist. Simplexe im Raum sind Strecken, Dreiecksfl¨achen und Tetraederk¨orper. Der Simplexbegriff ist f¨ ur die lineare Optimierung (Kapitel VIII) von Bedeutung (Simplexmethode). Dort untersucht man Simplexe bzw. allgemeiner konvexe k-dimensionale Polyeder, die sich als L¨osungsmenge linearer Ungleichungssysteme ergeben. Satz 3: Die L¨osungsmenge des linearen Ungleichungssystems a11 x1 + a12 x2 + . . . + a1n xn a21 x1 + a22 x2 + . . . + a2n xn
≤ b1 ≤ b2 .. .
am1 x1 + am2 x2 + . . . + amn xn ≤ bm bildet eine konvexe Teilmenge von IRn . Beweis: Die L¨osungsmenge des Ungleichungssystems ist die Schnittmenge der L¨osungsmengen der einzelnen Gleichungen. Nach Satz 1 muss also nur gezeigt werden, dass die L¨osungsmenge einer einzelnen Ungleichung konvex ist. Dies folgt f¨ ur zwei L¨osungen x, y aus
I.6 Konvexe Mengen
31
a1 (rx1 + sy1 ) + a2 (rx2 + sy2 ) + . . . + an (rxn + syn ) = r(a1 x1 + a2 x2 + . . . + an rn ) + s(a1 x1 + a2 x2 + . . . + an rn ) ≤ (r + s)b = b, falls r, s ≥ 0 und r + s = 1.
2
Satz 3 gilt nat¨ urlich auch, wenn statt der ≤ -Zeichen bei einigen oder allen der Ungleichungen ≥, =, < oder > steht. Beispiel 1: Die L¨osungsmenge des Ungleichungssystems 3x1 x1 4x1 x1 x1
+ − − + −
2x2 4x2 3x2 6x2 x2
≥ 14 ≤ 0 ≤ 26 ≤ 47 ≥ −2
kann in der Ebene als Schnittmenge von f¨ unf Halbebenen gedeutet werden. Die L¨osungsmenge bildet ein F¨ unfeck (Fig. 4).
x2 ... ... 6 .... ... .. .... ......................q.tq........... ... . q . q q . q q . . q . q . q q . q q . . q . ... . q . . q q . q q . q . q q . q . . . q q.q.q..........q.qqqqq.q.qq.q.q..qq.q.q.q.q.qq.q.q..... . ... ... .q.qq.q..q.qq..q.q..q.........................................q..qqq..qq..q..q..qqqq..qq.qqq.qq.t................... ... q.q.qq.q.q.............................q.qq ...q.q.q...................... . ...qqq ...qt.qq.q.q.qq..q...................................................q.q.q.qqq . . . .. q.q.q.qq.............................q.q.qq.q..................... .... qq.q.q...................qq.q.q...qq..q.qq.tq..q. . . . q.qq........q.q.q.qq.q.q.qqq.qqqqqqqq .. .. .... ..............q.qt..q.q.qq.q.qqqq ...... ... .. ...... x1 .. ...... Fig. 4: Zu Beispiel 1
Aufgaben 1. Es seien A, B, C, D Punkte der Ebene mit den Ortsvektoren a, b, c, d. Welche geometrische Bedeutung haben die Punkte mit den Ortsvektoren 1 1 a + b, 2 2
1 1 1 a + b + c, 3 3 3
1 1 1 1 a + b + c + d ? 4 4 4 4
2. In der Ebene sei ein konvexes Viereck ABCD durch die Ortsvektoren der Ecken gegeben. Man zeige, dass die Darstellung des Ortsvektors eines Punktes der Vierecks߬ache als Konvexkombination der Ortsvektoren der Ecken i. Allg. nicht eindeutig ist.
3. Man beschreibe die Vierecksfl¨ache mit den Ecken A(1, 1), B(7, 2), C(5, 5), D(2, 6) als L¨osungsmenge eines Ungleichungssystems.
4. Man zeige, dass die Punkte (x1 , x2 , x3 ) mit x1 , x2 , x3 ≥ 0 und x1 + x2 + x3 x3 2x1 + x2 − x3 3x1 − x2 + x3
≤ 12 ≤ 2 ≤ 7 ≤ 5
einen Polyederk¨orper beschreiben und berechne dessen Ecken.
II Lineare Abbildungen II.1 Lineare Abbildungen und Matrizen Definition 1: Sind V, W zwei K-Vektorr¨aume, dann nennt man eine Abbildung α : V −→ W mit α(v1 + v2 ) = α(v1 ) + α(v2 ) und α(rv ) = rα(v ) f¨ ur alle v1 , v2 ∈ V bzw. alle v ∈ V, r ∈ K eine lineare Abbildung oder einen Vektorraumhomomorphismus oder kurz Homomorphismus von V in W . Ist die Abbildung bijektiv (umkehrbar), ist also jedes Element von W Bild von genau einem Element von V , dann nennt man sie einen Vektorraumisomorphismus oder kurz einen Isomorphismus. Existiert ein Isomorphismus α : V −→ W , dann nennt man die Vektorr¨aume isomorph. Ist bei der Abbildung α : V −→ W dem Element v ∈ V das Element w ∈W zugeordnet, so schreibt man α(v ) = w oder α : v → w. Oft bezeichnet man das Bildelement von v einfach mit v , wenn klar ist, um welche Abbildung es sich handelt. Beispiel 1: Die konvergenten Folgen reeller Zahlen, welche wir in Kapitel IX ausf¨ uhrlich behandeln, bilden einen (unendlichdimensionalen) IR-Vektorraum. Mit lim(an ) bezeichnen wir den Grenzwert der Folge (an ). Wegen lim((an ) + (bn )) = lim(an + bn ) = lim(an )+ lim(bn ), lim r(an ) = lim(ran ) = r lim(an ) (r ∈ IR) ist lim eine lineare Abbildung des IR-Vektorraums der konvergenten Folgen in den (eindimensionalen) IR-Vektorraum IR. Beispiel 2: Durch die Abbildungsgleichungen x1 = 2x1 − 3x2 , x2 = 4x1 + 7x2 , x3 = 3x1 − 9x2 ist eine lineare Abbildung (x1 , x2 ) → (x1 , x2 , x3 ) des IR-Vektorraums IR2 in den IR-Vektorraum IR3 gegeben. Dabei ist beispielsweise (4, 1) → (5, 23, 3). Zur Vorbereitung des n¨achsten Beispiels wollen wir die Anwendung einer Matrix A = (aij )m,n aus K m,n auf einen Vektor b ∈ K n definieren, was man auch die Multiplikation der Matrix A mit dem Vektor b nennt. Man definiert das Produkt A b durch ⎛ ⎜ ⎜
A b = ⎜ ⎜ ⎝
a11 a21 .. .
a12 a22 .. .
. . . a1n . . . a2n .. .
am1 am2 . . . amn
⎞⎛
⎞
⎛
b1 a11 b1 + a12 b2 + . . . + a1n bn ⎟⎜ ⎟ ⎜ ⎟ ⎜ b2 ⎟ ⎜ a21 b1 + a22 b2 + . . . + a2n bn ⎟⎜ . ⎟ = ⎜ .. ⎟⎜ . ⎟ ⎜ ⎠⎝ . ⎠ ⎝ . bn
am1 b1 + am2 b2 + . . . + amn bn
⎞ ⎟ ⎟ ⎟. ⎟ ⎠
II.1 Lineare Abbildungen und Matrizen
33
Die i-te Koordinate des Vektors A b ist also das Produkt der i-ten Zeile von A mit dem Vektor b in folgendem Sinn: ⎛
(ai1 ai2
⎜ ⎜ . . . ain ) ⎜ ⎜ ⎝
b1 b2 .. .
⎞
⎟ ⎟ ⎟ = ai1 b1 + ai2 b2 + . . . + ain bn ⎟ ⎠
(i = 1, 2, . . . , m)
bn Wir werden k¨ unftig f¨ ur gr¨oßere Summen das Summenzeichen Σ benutzen, also etwa statt ai1 b1 + ai2 b2 + . . . + ain bn k¨ urzer
n
j=1
aij bj schreiben.
Beispiel 3: Ist A = (aij )m,n eine Matrix aus K m,n , dann ist x → Ax eine lineare Abbildung von K n in K m , denn A(x + y ) = Ax + Ay und A(rx) = rAx f¨ ur alle x, y ∈ K n und alle r ∈ K. Jede lineare Abbildung von K n in K m l¨asst sich auch so darstellen; w¨ahlt man in K n und K m jeweils die Standardbasis, dann sind die Spalten der Matrix die Bilder der Basisvektoren von K n : ⎛ ⎜ ⎜
Aej = ⎜ ⎜ ⎝
a1j a2j .. .
⎞ ⎟ ⎟ ⎟ ⎟ ⎠
(j = 1, 2, . . . , n)
amj Satz 1: Endlich-erzeugte K-Vektorr¨aume gleicher Dimension sind isomorph. Beweis: Sind {a1 , a2 , . . . , an } und {b1 , b2 , . . . , bn } Basen der n-dimensionalen K-Vektorr¨aume V bzw. W , dann wird durch die Zuordnung offensichtlich ein Isomorphismus von V auf W definiert.
n i=1
riai →
n i=1
ribi 2
Wir haben hier f¨ ur eine Summe von Vektoren wie beim Rechnen mit Zahlen das n Summenzeichen Σ benutzt; es ist also
i=1
riai = r1a1 + r2a2 + . . . + rnan .
Eine Folge von Satz 1 ist, dass alle n-dimensionalen K-Vektorr¨aume isomorph zum Vektorraum K n sind, dass es also bis auf Isomorphie nur einen einzigen n-dimensionalen K- Vektorraum gibt. Ist V ein K-Vektorraum mit der Basis B = {b1 , b2 , . . . , bn }, dann ist durch die Zuordnung ⎛ ⎞ r1 n ⎜ r2 ⎟ ⎟ v = ribi → ⎜ ⎝ ... ⎠ i=1 rn B ein Isomorphismus von V auf K n definiert. Den Vektor aus K n haben wir schon fr¨ uher Koordinatenvektor von v bez¨ uglich der Basis B genannt. Den Index B“ ” l¨asst man fort, wenn klar ist, auf welche Basis sich der Koordinatenvektor bezieht. Die Elemente r1 , r2 , . . . , rn sind die Koordinaten, die Vektoren r1b1 , r2b2 , . . . , rnbn die Komponenten von v bez¨ uglich der Basis B.
II Lineare Abbildungen
34
Im Folgenden ben¨otigen wir den Begriff der injektiven Abbildung und der surjektiven Abbildung: Eine Abbildung der Menge A in die Menge B heißt injektiv, wenn verschiedene Elemente aus A stets auch verschiedene Bilder in B haben. Sie heißt surjektiv, wenn jedes Element von B als Bild eines Elementes von A auftritt; man spricht dann von einer Abbildung von A auf B. Eine Abbildung, die injektiv und surjektiv ist, nennt man bijektiv; eine solche Abbildung besitzt eine Umkehrabbildung, weshalb man sie statt bijektiv auch umkehrbar nennt. Den Begriff der Bijektivit¨at haben wir schon zu Beginn des Abschnitts verwendet. W¨ahlt man in V statt der Basis B = {b1 , b2 , . . . , bn } die Basis C = {c1 , c2 , . . . , cn }, dann wird der Vektor v mit n
ribi = v =
n
⎛
sici
⎞
s1 ⎜ s2 ⎟ ⎟ auf das n-Tupel mit den Koordinaten s1 , s2 , . . . , sn abgebildet, also auf ⎜ ⎝ ... ⎠ . sn C i=1
i=1
Eine bijektive lineare Abbildung α von V auf sich bewirkt einen Basiswechsel: Die Basis B = {b1 , b2 , . . . , bn } wird auf die Basis C = {c1 , c2 , . . . , cn } abgebildet, wobei ci = α(bi ) (i = 1, 2, . . . , n). Wir wollen untersuchen, wie dabei die Koordinatenvektoren von v ∈ V bez¨ uglich B und bez¨ uglich C aufeinander abgebildet werden. Ist ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ t11 t12 t1n ⎜ t21 ⎟ ⎜ t22 ⎟ ⎜ t2n ⎟ ⎟ ⎟ ⎟ c1 = ⎜ c2 = ⎜ cn = ⎜ ⎝ ... ⎠ , ⎝ ... ⎠ , . . . , ⎝ ... ⎠ tn1 B tn2 B tnn B und ⎛ ⎞ ⎛ ⎞ r1 s1 ⎜ r2 ⎟ ⎜ s2 ⎟ ⎜ . ⎟ = ⎜ v = ⎝ .. ⎟ , ⎝ .. ⎠ . ⎠ rn B sn C dann ist ⎛
⎞
⎛
s1 n n ⎜ s2 ⎟ ⎜ ⎜ . ⎟ = sjcj = sj ⎜ ⎝ .. ⎠ ⎝ j=1 j=1 sn C also
⎛
⎞
⎛
t1j t2j .. . tnj
⎞
⎛⎛
⎞⎛
⎞⎞
t11 t12 . . . t1n s1 ⎟ ⎜⎜ t21 t22 . . . t2n ⎟ ⎜ s2 ⎟⎟ ⎟ = ⎜⎜ . ⎜ . ⎟⎟ , .. .. ⎟ ⎠ ⎝⎝ .. . . ⎠ ⎝ .. ⎠⎠ sn tn1 tn2 . . . tnn B B ⎞⎛
t11 t12 . . . t1n r1 ⎜ r2 ⎟ ⎜ t21 t22 . . . t2n ⎟ ⎜ ⎜ . ⎟=⎜ . ⎜ .. .. ⎟ ⎝ .. ⎠ ⎝ .. . . ⎠⎝ rn tn1 tn2 . . . tnn
⎞
s1 s2 ⎟ . .. ⎟ . ⎠ sn
Die Spaltenvektoren der quadratischen Matrix (tij ), welche die Koordinatenvektoren bez¨ uglich der Basis C auf die Koordinatenvektoren bez¨ uglich der Basis B abbildet, sind also die Koordinatenvektoren von c1 , c2 , . . . , cn bez¨ uglich B.
II.1 Lineare Abbildungen und Matrizen
35
Wir betrachten nun allgemeiner eine lineare Abbildung α des n-dimensionalen K- Vektorraums V mit der Basis {v1 , v2 , . . . , vn } in den m-dimensionalen K-Vektorraum W mit der Basis {w 1, w 2, . . . , w m }. Diese ist eindeutig bestimmt, wenn die Bilder der Basisvektoren von V bestimmt sind: Ist α(vj ) =
m i=1
α(x) =
aij w i (j = 1, 2, . . . , n), dann gilt f¨ ur x =
n j=1
⎧ ⎪ ⎪ ⎪ ⎪ ⎨
xj α(vj ) =
⎪ ⎪ ⎪ ⎪ ⎩
+ .. .
n j=1
xj vj ∈ V :
(a11 x1 + a12 x2 + . . . + a1n xn ) w 1 (a21 x1 + a22 x2 + . . . + a2n xn ) w 2
+ (am1 x1 + am2 x2 + . . . + amn xn ) w m
Die lineare Abbildung α wird also durch die m, n-Matrix A = (aij )m,n vermittelt, welche dem Koordinatenvektor x eines Vektors aus V den Koordinatenvektor y = Ax seines Bildvektors in W zuordnet. Die Matrix A h¨angt nat¨ urlich davon ab, welche Basen in V und W gegeben sind. Definition 2: Es sei α : V −→ W eine lineare Abbildung des K-Vektorraums V in den K-Vektorraum W . Die Menge alle v ∈ V , welche auf den Nullvektor o von W abgebildet werden, nennt man den Kern von α. Beispiel 2: Eine lineare Abbildung von K n in K m werde durch die Matrix A ∈ K m,n gegeben. Der Kern dieser Abbildung ist dann der L¨osungsraum des homogenen LGS Ax = o. Satz 2: Der Kern der linearen Abbildung α : V −→ W ist ein Unterraum von V . Beweis: Mit α(v1 ) = α(v2 ) = o ist auch α(v1 + v2 ) = o, und mit α(v ) = o ist auch α(rv ) = o f¨ ur alle r ∈ K. 2 Satz 3: a) Ist U ein Unterraum von V , dann gibt es eine surjektive lineare Abbildung von V auf den Quotientenraum V /U . b) Ist die lineare Abbildung α : V −→ W surjektiv und ist U der Kern von α, dann ist W isomorph zu V /U. Beweis: a) v → v + U ist eine surjektive lineare Abbildung von V auf V /U . b) Durch v +U → α(v ) ist eine lineare Abbildung von V /U auf W definiert. Diese ist injektiv (und damit ein Isomorphismus), weil aus v1 + U = v2 + U folgt, dass v1 − v2 ∈ U , also α(v1 − v2 ) = o bzw. α(v1 ) = α(v2 ). 2 Beispiel 3: Die Matrix A ∈ K m,n vermittelt eine lineare Abbildung α : x → Ax von K n in K m . Diese ist surjektiv, wenn das LGS Ax = y f¨ ur jedes y ∈ K m eine n L¨osung x ∈ K besitzt. Der Kern U von α ist der L¨osungsraum des homogenen LGS Ax = o. Nach Satz 3 ist dann K n /U isomorph zu K m .
II Lineare Abbildungen
36
Satz 4: a) Ist V ein endlich-dimensionaler Vektorraum und U ein Unterraum von V , dann gilt dim V /U = dim V − dim U . b) Ist V ein endlich-dimensionaler Vektorraum und sind U1 , U2 Unterr¨aume von V , dann gilt dim (U1 + U2 ) = dim U1 + dim U2 − dim (U1 ∩ U2 ). Beweis: a) Es sei dim U = m und {u1 , u2 , . . . , um } eine Basis von U . Diese erg¨anze man durch Elemente v1 , v2 , . . . , vr ∈ V zu einer Basis von V , wobei m+r = dim V . Ist v = dann ist v + U =
r j=1
m i=1
aiui +
r j=1
bj vj ∈ V,
bj (vj + U ), also
V /U = v1 + U, v2 + U, . . . , vr + U . Die Menge {v1 + U, v2 + U, . . . , vr + U } ist linear unabh¨angig. Ist n¨amlich r j=1
dann ist
r j=1
cj (vj + U ) = o + U = U,
cj vj ∈ U , also r j=1
cj vj =
m i=1
diui
mit d1 , d2 , . . . , dm ∈ K,
was nur f¨ ur c1 = c2 = . . . = cr = d1 = d2 = . . . = dm = 0 m¨oglich ist. Also ist dim V /U = r. b) (U1 + U2 )/U2 ist isomorph zu U1 /(U1 ∩ U2 ), denn die lineare Abbildung α : (a + b) + U2 → a + (U1 ∩ U2 ) (a ∈ U1 , b ∈ U2 ) ist bijektiv. Genau dann ist n¨amlich ur a, a ∗ ∈ U1 , a + (U1 ∩ U2 ) = a ∗ + (U1 ∩ U2 ) f¨ wenn a − a ∗ ∈ U2 , wenn also (a + b) + U2 = (a ∗ + b) + U2 . Daher gilt dim(U1 + U2 ) − dim U2 = dim((U1 + U2 )/U2 ) = dim(U1 /(U1 ∩ U2 )) = dim U1 − dim(U1 ∩ U2 ).
2
Definition 3: Mit Hom(V, W ) bezeichnen wir die Menge aller Homomorphismen (lineare Abbildungen) des K-Vektorraums V in den K-Vektorraum W . F¨ ur α, β ∈ Hom(V, W ) definieren wir die Summe α + β durch (α + β)(v ) = α(v ) + β(v ) (v ∈ V ) und die Vervielfachung durch (rα)(v ) = rα(v ) (v ∈ V, r ∈ K).
II.1 Lineare Abbildungen und Matrizen
37
Satz 5: Mit den in Definition 3 angegeben Verkn¨ upfungen ist Hom(V, W ) ein K-Vektorraum. Beweis: F¨ ur α, β ∈ Hom(V, W ) und v1 , v2 ∈ V sowie v ∈ V, r ∈ K gilt (α + β)(v1 + v2 ) = = = (α + β)(rv ) = =
α(v1 + v2 ) + β(v1 + v2 ) α(v1 ) + α(v2 ) + β(v1 ) + β(v2 ) α(v1 ) + β(v1 ) + α(v2 ) + β(v2 ) = (α + β)(v1 ) + (α + β)(v2 ), α(rv ) + β(rv ) rα(v ) + rβ(v ) = r(α(v ) + β(v ) = r(α + β)(v ).
Ebenso rechnet man die Homomorphismus-Eigenschaften von rα nach.
2
Satz 6: Sind die K-Vektorrr¨aume V, W endlich-dimensional, dann gilt dim Hom(V, W ) = dim V · dim W. 1, w 2, . . . , w n } eine Basis Beweis: Es sei {v1 , v2 , . . . , vm } eine Basis von V und {w von W . Wir definieren mn lineare Abbildungen λij ∈ Hom(V, W ) durch j und λij (vk ) = o f¨ ur k = i (i = 1, 2, . . . m, j = 1, 2, . . . , n). λij (vi ) = w F¨ ur λ ∈ Hom(V, W ) ist λ(vi ) =
n j=1
aij w j
mit ai1 , ai2 , . . . , ain ∈ K (i = 1, 2, . . . , m). Nun sei λ0 =
m
n
j=1
i=1
aij λij .
Dann ergibt sich λ0 (vk ) = λ(vk ) (k = 1, 2, . . . , m), also λ0 = λ, weil eine lineare Abbildung eindeutig durch die Bildvektoren aller Basisvektoren bestimmt ist. Also ist λ eine Linearkombination der mn linearen Abbildungen λij . Diese sind linear unabh¨angig: Ist
m
n
j=1
i=1
bij λij
die Nullabbildung V → o, dann ergibt
sich bei Anwendung auf vk die Beziehung und j.
n i=1
bkj w j = o, also bkj = 0 f¨ ur alle k 2
In der folgenden Definition muss man daran denken, dass der K¨orper K selbst ein K-Vektorraum (der Dimension 1) ist. Definition 4: Ist V ein K-Vektorraum, dann nennt man eine lineare Abbildung von V in K ein lineares Funktional. Den K-Vektorraum Hom(V, K) der linearen Funktionale auf V nennt man den zu V dualen Vektorraum.
II Lineare Abbildungen
38
Der Vektorraum Hom(V, K) der linearen Funktionale auf dem m-dimensionalen K-Vektorraum V mit der Basis {v1 , v2 , . . . , vm } hat gem¨aß der Konstruktion im Beweis von Satz 6 die Basis {λ11 , λ21 , . . . , λm1 }. Diese nennt man die duale Basis zur Basis {v1 , v2 , . . . , vm } von V . W¨ahlt man f¨ ur K die Basis {1}, dann ist f¨ ur x = m i=1
ai λi1 (x) =
m i=1
m i=1
xivi ∈ V
ai x i .
Ein lineares Funktional ist als nichts anderes als eine Linearform u ¨ber K und kann als Vektor aus K n (mit den Koordinaten a1 , a2 , . . . , am ) interpretiert werden. Diese Linearform wird sp¨ater im Zusammenhang mit dem Skalarprodukt in IRm eine besondere Rolle spielen. Beispiel 4: In IRm betrachten wir die Standardbasis {e1 , e2 , . . . , em }, ebenfalls im 1-dimensionalen Vektorraum IR (also {1}). Dann ist {λ1 , λ2 , . . . , λm } mit λi (ei ) = 1 und λi (ek ) = 0 f¨ ur k = i eine zu {e1 , e2 , . . . , em } duale Basis von IRm . Ist λ ∈ Hom(IRm , IR) und λ(ei ) = ai (i = 1, 2, . . . , m), dann ist λ = λ(x) =
m i=1
m
i=1
ai λi . F¨ ur x =
m
i=1
xiei ∈ IRm ist dann
ai xi . Man kann den Vektor mit den Koordinaten a1 , a2 , . . . , an also
als ein lineares Funktional deuten, welches dem Vektor mit den Koordinaten x1 , x2 , . . . , xn die Linearform a1 x1 + a2 x2 + . . . + an xn zuordnet. Definition 5: Ist U ein Unterraum von V , dann nennt man A(U ) = {λ ∈ Hom(V, K) | λ(u) = 0 f¨ ur alle u ∈ U } den Annihilator von U . Der Annihilator von U besteht im Fall V = K n also aus allen Linearformen n ai xi , welche auf U den Wert 0 haben, f¨ ur welche also i=1
n i=1
ai ui = 0 f¨ ur alle u ∈ U
gilt. Offensichtlich ist A(U ) ein Unterraum von Hom(V, K). Satz 7: Ist U ein Unterraum des endlich-dimensionalen K-Vektorraums V , dann ist dim A(U ) = dim V − dim U. Beweis: Die Restriktion der linearen Funktionale auf V auf den Unterraum U ist eine lineare Abbildung von Hom(V, K) in Hom(U, K), welche jedem linearen Funktional auf V dasjenige lineare Funktional auf U zuordnet, das nur die
II.1 Lineare Abbildungen und Matrizen
39
Wirkung auf die Elemente von U beachtet. Der Kern von besteht aus allen λ ∈ Hom(V, K) mit λ(u) = 0 f¨ ur alle u ∈ U , er ist also A(U ). Wir zeigen nun, dass diese lineare Abbildung surjektiv ist. Dazu sei dim U = m und {u1 , u2 , . . . , um } eine Basis von U sowie dim V = n und {u1 , u2 , . . . , um } ∪ {v1 , v2 , . . . , vr } eine Basis von V , wobei m + r = n. F¨ ur v ∈ V ist dann v = u + u mit u ∈ U und u ∈ v1 , v2 , . . . , vr , ur μ ∈ Hom(U, K) definiere wobei u und u durch v eindeutig bestimmt sind. F¨ man λ ∈ Hom(V, K) durch λ(v ) = μ(u), die Abbildung μ ist also die Restriktion von λ auf U . Durch obige Zuordnung λ → μ ist also eine surjektive lineare Abbildung von Hom(V, K) auf Hom(U, K) mit dem Kern A(U ) gegeben. Nach Satz 3 ist Hom(V, K)/A(U ) isomorph zu Hom(U, K). Aus dim Hom(V, K) = n und dim Hom(U, K) = m folgt damit n − r = m. 2 Definition 6: Unter dem Rang einer Matrix A = (aij ) ∈ K m,n versteht man die Dimension des von den Zeilenvektoren der Matrix erzeugten Unterraums von K n , also die maximale Anzahl linear unabh¨angiger Zeilenvektoren von A. (Genauer spricht man vom Zeilenrang der Matrix; vgl. hierzu II.2 Satz 1.) Unter dem Rang eines homogenen LGS versteht man den Rang der Koeffizientenmatrix. ¨ Ein homogenes LGS l¨asst sich durch elementare Aquivalenzumformungen stets in ein LGS umformen, bei welchem die Anzahl der Gleichungen gleich dem Rang des LGS ist. Satz 8: Hat das homogene LGS mit der Matrix A = (aij ) ∈ K m,n den Rang r, dann hat sein L¨osungsraum die Dimension n − r. Beweis: Man w¨ahle in IRn die Standardbasis {e1 , e2 , . . . en }. Ihre duale Basis in Hom(IRn , IR) sei {λ1 , λ2 , . . . , λn }. F¨ ur λ ∈ Hom(IRn , IR) ist λ = x1 , x2 , . . . , xn ∈ K, also ⎛
λ⎝
n
j=1
⎞
aij ej ⎠ =
n i=1
n
i=1
xi λi mit
⎞ ⎛ n n xi λi ⎝ aij ej ⎠ = xj aij j=1
j=1
f¨ ur i = 1, 2, . . . , m, denn λj (ej ) = 1 und λi (ej ) = 0 f¨ ur j = i. Also ist (x1 , x2 , . . . , xn ) genau dann eine L¨osung des homogenen LGS, wenn λ zu A(U ) geh¨ort, wobei U der von den Zeilenvektoren der Matrix A erzeugte Unterraum von IRn ist. Der L¨osungsraum des homogenen LGS hat also dieselbe Dimension wie A(U ), und diese ist n − r nach Satz 7. 2 Mit Satz 8 sind die in I.2 anschaulich begr¨ undeten Aussagen u ¨ber die L¨osungsmenge eines LGS auf einem abstrakteren Niveau bewiesen.
II Lineare Abbildungen
40
Aufgaben 1. Es sei {v1 , v2 , . . . , vn } eine Basis des K- Vektorraums V , ferner sei {w 1, w 2, . . . , w n } ⊆ V . Eine Abbildung α von V in V sei definiert durch
1 + r2 w 2 + . . . + rn w n (r1 , r2 , . . . , rn ∈ K). α(r1v1 + r2v2 + . . . + rnvn ) = r1 w Man zeige, dass α ∈ Hom(V, V ). Wann ist α ein Isomorphismus?
2. Es sei V ein endlichdimensionaler K-Vektorraum und α ∈ Hom(V, V ). a) Man zeige: Ist α injektiv, dann ist α auch surjektiv (also bijektiv). b) Man zeige: Ist α surjektiv, dann ist α auch injektiv (also bijektiv).
3. Man zeige: Sind λ, μ lineare Funktionale auf dem K-Vektorraum V und folgt f¨ ur v ∈ V aus λ(v ) = 0 stets μ(v ) = 0, dann ist μ = rλ mit r ∈ K.
4. Es sei V ein endlichdimensionaler K-Vektorraum und v1 , v2 ∈ V mit v1 = v2 . Man zeige, dass ein α ∈ Hom(V, K) mit α(v1 ) = α(v2 ) existiert.
5. Man beweise: F¨ur jeden Untervektorraum U eines Vektorraums V gilt f¨ur den Annihilator A(A(U )) = U .
6. Der K-Vektorraum V sei endlichdimensional und U1 , U2 seien Unterr¨aume von V . Man beweise folgende Eigenschaften des Annihilators: A(U1 + U2 ) = A(U1 ) ∩ A(U2 ),
A(U1 ∩ U2 ) = A(U1 ) + A(U2 ).
II.2 Verkettung linearer Abbildungen Definition 1: U, V, W seien K-Vektorr¨aume. Ist β ∈ Hom(U, V ) und α ∈ Hom(V, W ), dann bezeichnet man mit α ◦β die Verkettung dieser Abbildungen (gelesen α nach ” β“; Fig. 1). Dies ist also eine Abbildung aus Hom(U, W ). F¨ ur u ∈ U ist
α . β . U ................................... V ................................... W ... .. ....................................................................................................... α◦β Fig 1: Verkettung
(α ◦ β)(u) = α(β(u)). Die Verkettung ergibt wieder eine lineare Abbildung, denn (α ◦ β)(u1 + u2 ) = = (α ◦ β)(ru) = =
α(β(u1 + u2 )) = α(β(u1 )) + α(β(u2 )) (α ◦ β)(u1 ) + (α ◦ β)(u2 ) f¨ ur u1 , u2 ∈ U, α(β(ru)) = α(rβ(u)) rα(β(u)) = r(α ◦ β)(u) f¨ ur u ∈ U und r ∈ K.
II.2 Verkettung linearer Abbildungen
41
Sind die Vektorr¨aume U, V, W endlich-dimensional und ist dim U = k,
dim V = m,
dim W = n,
dann kann man bez¨ uglich gegebener Basen von U, V, W obige Abbildungen durch Matrizen aus K n,m bzw. aus K m,k darstellen, welche die Koordinatenvektoren ineinander u uhren. ¨berf¨ Definition 2: Es sei A ∈ K n,m und B ∈ K m,k . Ist y = Bx und z = Ay , dann ist z = A(Bx) = Cx mit C ∈ K n,k . Die Matrix C nennt man das Produkt von A und B und schreibt C = AB. Wir wollen nun zeigen, wie man dieses Matrizenprodukt berechnet: Es seien {u1 , u2 , . . . , uk },
{v1 , v2 , . . . , vm },
Basen von U, V, W und es sei x =
k h=1
{w 1, w 2, . . . , w n}
xhuh ∈ U . Dann gilt f¨ ur y =
m i=1
yivi = Bx :
y1 = b11 x1 + b12 x2 + . . . + b1k xk y2 = b21 x1 + b22 x2 + . . . + b2k xk .. . ym = bm1 x1 + bm2 x2 + . . . + bmk xk F¨ ur z =
n j=1
zj w j = Ay ist dann
z1 = a11 =
k
h=1 m i=1
b1h xh + a12
a1i bi1 x1 +
k
h=1 m i=1
b2h xh + . . . + a1m
a1i bi2 x2 + . . . +
k
bmh xh h=1 m i=1
a1i bik xk
= c11 x1 + c12 x2 + . . . + c1k xk Ebenso ergibt sich f¨ ur j = 2, 3, . . . , n zj = aj1 =
k
h=1 m i=1
b1h xh + aj2
aji bi1 x1 +
k
h=1 m i=1
b2h xh + . . . + ajm
aji bj2 x2 + . . . +
k
bmh xh h=1 m i=1
aji bik xk
= cj1 x1 + cj2 x2 + . . . + cjk xk Das Element cjh der Matrix C = AB ist also das Produkt“ der j-ten Zeile von ” A mit der h-ten Spalte von B (vgl. Fig. 2). Dieses Produkt einer Zeile und einer Spalte von Elementen aus K werden wir sp¨ater als Skalarprodukt“ kennenlernen. ”
II Lineare Abbildungen
42 ⎛ ⎛ ⎜ ⎝ a j1
aj2 . . . ajm
n Zeilen m Spalten
⎞
b1h b2h .. . .. . bmh
⎞⎜ ⎜ ⎜ ⎟⎜ ⎠⎜ ⎜ ⎜ ⎝
⎟ ⎛ ⎟ ⎟ ⎜ ⎟ ⎟=⎝ ⎟ ⎟ ⎠
m Zeilen k Spalten
cjh = aj1 b1h + aj2 b2h + . . . + ajm bmh
⎞
cjh
⎟ ⎠
n Zeilen k Spalten
(j = 1, 2, . . . , n, h = 1, 2, . . . , k)
Fig. 2: Matrizenmultiplikation Man beachte: Das Matrizenprodukt AB existiert nur, wenn die Anzahl der Spalten von A gleich der Anzahl der Zeilen von B ist. Weil das Verketten von Abbildungen eine assoziative Verkn¨ upfung ist, gilt dies auch f¨ ur die Multiplikation von Matrizen, d.h. es gilt (AB)C = A(BC), falls diese Produkte definiert sind. Ferner gilt (rA)B = A(rB) = r(AB) f¨ ur r ∈ K, falls das Produkt AB definiert ist. Dabei ist rA die Matrix, die aus A durch Multiplikation aller Eintr¨age mit r entsteht, denn dann ist (rA)x = A(rx). Beispiel 1: Nebenstehend ist das Produkt AB einer 2,5Matrix A mit einer 5,3-Matrix B berechnet; es ergibt sich eine 2,3-Matrix.
A
AB
1 −1 −2
3
7 5
11
18
98
0 11 −1 6 −27
13
53
9 −3
1
0
2
In diesem Schema haben wir die runden Matrizenklammern weggelasen. Dieses u ¨bersichtliche Schema l¨asst sich leicht zur Berechnung von Produkten von drei und mehr Matrizen fortsetzen.
10
1
1 −1
2
4
−3
0
6 12 B
Matrizen vom gleichen Typ (gleiche Zeilenzahl und gleiche Spaltenzahl) kann man auch addieren: Sind A, B beides m, n-Matrizen, dann ist Ax + Bx = (A + B)x f¨ ur x ∈ K n , wenn man die Addition von A und B elementweise definiert, also (aij ) + (bij ) = (aij + bij ). Matrizen, deren Zeilenanzahl gleich ihrer Spaltenanzahl ist, nennt man quadratisch. Quadratische n, n-Matrizen kann man addieren und multiplizieren, wobei folgende Regeln gelten:
II.2 Verkettung linearer Abbildungen
43
(1) (A + B) + C = A + (B + C) f¨ ur alle A, B, C ∈ K n,n (Assoziativgesetz der Addition) (2) A + B = B + A f¨ ur alle A, B ∈ K n,n (Kommutativgesetz der Addition) (3) A + O = A f¨ ur alle A ∈ K n,n , wobei O die Nullmatrix ist (Fig. 3) (Existenz eines neutralen Elements bez¨ uglich der Addition) (4) A + (−A) = O f¨ ur alle A ∈ K n,n , wobei −A = (−1)A (Invertierbarkeit bez¨ uglich der Addition) (5) (AB)C = A(BC) f¨ ur alle A, B, C ∈ K n,n (Assoziativgesetz der Multiplikation) (6) AE = EA = A f¨ ur alle A ∈ K n,n , wobei E die Einheitsmatrix ist (Fig. 3) (Existenz eines neutralen Elements bzgl. der Multiplikation) (7) A(B + C) = AB + AC; (A + B)C = AC + BC f¨ ur alle A, B, C ∈ K n,n (Distributivgesetz) ⎛ ⎜ ⎜ ⎜ O=⎜ ⎜ ⎜ ⎝
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
⎞
⎛
⎟ ⎟ ⎟ ⎟, ⎟ ⎟ ⎠
⎜ ⎜ ⎜ E=⎜ ⎜ ⎜ ⎝
1 0 0 0 0 0 0
0 1 0 0 0 0 0
0 0 1 0 0 0 0
0 0 0 1 0 0 0
0 0 0 0 1 0 0
0 0 0 0 0 1 0
0 0 0 0 0 0 1
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
Fig. 3: Nullmatrix und Einheitsmatrix uglich der Addition und der MultiplikatiDie Matrizen aus K n,n bilden also bez¨ on eine algebraische Struktur, welche man in der Algebra einen Ring (genauer Ring mit Einselement) nennt. Die Matrizenmultiplikation in K n,n ist (wie auch allgemein das Verketten von Abbildungen) nicht kommutativ. Beispiel 2: Es gilt
1 2 2 3
0 2 1 4
=
2 10 3 16
und
0 2 1 4
Beispiel 3: F¨ ur alle a, b, c, d ∈ IR gilt
a −b b a
c −d d c
=
ac − bd −(ad + bc) ad + bc ac − bd
1 2 2 3
=
=
c −d d c
4 6 9 14
a −b b a
.
.
In diesem Fall sind die Faktoren in dem Matrizenprodukt vertauschbar. Das Pro a −b dukt von je zwei Matrizen der betrachteten Form b a (a, b ∈ IR) ist wieder von der gleichen Form, diese Matrizen bilden also eine algebraische Struktur. Diese ist isomorph zum K¨orper C der komplexen Zahlen; das werden wir in II.3 noch n¨aher darstellen.
II Lineare Abbildungen
44
In K n,n gibt es Matrizen, welche von der Nullmatrix O verschieden sind, deren Produkt aber O ergibt. Solche Matrizen (allgemein solche Elemente eines Rings) nennt man Nullteiler. Beispiel 4: Es gilt
1 0 1 0
0 0 1 1
=
0 0 0 0
.
¨ Bei Anderung der Reihenfolge sind die Faktoren aber keine Nullteiler, so dass man zwischen Rechts- und Linksnullteilern unterscheiden muss. Es gilt
0 0 1 1
1 0 1 0
=
0 0 2 0
.
Existiert zu einer Matrix A ∈ K n,n eine Matrix B ∈ K n,n mit AB = E sowie eine Matrix C ∈ K n,n mit CA = E , dann ist B = C; denn B = EB = CAB = CE = C. In diesem Fall nennt man die Matrix B bzw. C die zu A inverse Matrix und bezeichnet sie mit A−1 . Zur Nullmatrix kann keine inverse Matrix existieren, denn f¨ ur alle A ∈ K n,n ist AO = O = E. Auch zu einer von O verschiedenen Matrix existiert nicht immer eine Inverse. Beispielweise sind Nullteiler nicht invertierbar: Ist AB = O und A invertierbar, dann ist B = EB = (A−1 A)B = A−1 (AB) = A−1 O = O. Beispiel 5: Die Gleichung
1 2 2 4
x11 x12 x21 x22
=
1 0 0 1
ist gleichbedeutend mit den beiden linearen Gleichungssystemen x11 + 2x21 = 1 2x11 + 4x21 = 0
und
x12 + 2x22 = 0 , 2x12 + 4x22 = 1
und diese besitzen keine L¨osung. Zwischen der L¨osbarkeit linearer Gleichungssysteme und den Eigenschaften linearer Abbildungen besteht also folgender Zusammenhang: Genau dann ist die Matrix A ∈ K n,n invertierbar, wenn die lineare Abbildung x → Ax von K n in sich umkehrbar (bijektiv) ist, wenn also das Gleichungssystem Ax = a f¨ ur jedes n a ∈ K eindeutig l¨osbar ist. Dies ist der Fall, wenn die homogene Gleichung Ax = o nur die L¨osung o hat, wenn also der Rang von A gleich der Dimension n von K n ist.
II.2 Verkettung linearer Abbildungen Die Berechnung der Inversen einer Matrix aus K n,n kann man leicht mit dem Gauß-Verfahren zum L¨osen eines LGS bewerkstelligen, indem man die n durch die Matrizengleichung AX = E gegebenen Systeme simultan l¨ost. Beispiel 6: In nebenstehendem Schema wird die Inverse von ⎛
⎞
2 1 −3 0 4 ⎟ A=⎜ ⎝ 1 ⎠ −3 −2 1 berechnet. Es ergibt sich ⎛
A−1
⎞
8 5 4 1 ⎟ = ⎜ ⎝ −13 −7 −11 ⎠ 9 −2 1 −1
45 2 1 −3 1 0 0 1 0 4 0 1 0 −3 −2 1 0 0 1 0 1 −11 1 −2 0 1 0 4 0 1 0 0 −2 13 0 3 1 1 0 4 0 1 0 0 1 −11 1 −2 0 0 0 −9 2 −1 1 9 0 36 0 9 0 0 9 −99 9 −18 0 0 0 9 −2 1 −1 9 0 0 8 5 4 0 9 0 −13 −7 −11 0 0 9 −2 1 −1
Als Rang der Matrix A ∈ K m,n haben wir die Dimension des von den Zeilenvektoren erzeugten Unterraums von K n bezeichnet. Genauer nennt man dies den Zeilenrang von A. Die Dimension des von den Spaltenvektoren erzeugten Unterraums nennt man dann den Spaltenrang von A. Ist A ∈ K n,n und hat Ax = o nur die L¨osung o, dann hat A den Spaltenrang n, denn dann sind die Spaltenvektoren von A linear unabh¨angig. Genau dann ist also A ∈ K n,n invertierbar, wenn A den Spaltenrang n hat. Der folgende Satz besagt, dass man auch im allgemeinen Fall nicht zwischen Zeilenrang und Spaltenrang unterscheiden muss. Satz 1: F¨ ur A ∈ K m,n hat der von den m Zeilenvektoren erzeugte Unterraum von K n dieselbe Dimension wie der von den n Spaltenvektoren erzeugte Unterraum von K m ( Spaltenrang=Zeilenrang“). ” Beweis: Ist U der L¨osungsraum von Ax = o (also der Kern der durch A vermittelten linearen Abbildung von K n in K m ), dann besteht der Quotientenraum K n /U aus allen linearen Mannigfaltigkeiten a + U , wobei a eine Linearkombination der Spaltenvektoren von A ist. Der Spaltenrang von A ist also die Dimension von K n /U . Es ist daher nach Satz 3 aus II.1 Spaltenrang von A = dim K n /U = dim K n − dim U = n − dim U. Andererseits ist nach Satz 8 aus II.1 dim U = n − Zeilenrang von A, woraus sich die Behauptung ergibt.
2
II Lineare Abbildungen
46
Elementare Spaltenumformungen (Multiplikation mit einem r ∈ K mit r = 0, Addition einer Spalte zu einer anderen, Vertauschung zweier Spalten) ¨andern also den Rang einer Matrix ebenso wenig wie elementare Zeilenumformungen. Durch elementare Zeilenunformungen kann man die Matrix auf Stufenform bringen (vgl. Stufenform eines LGS), wobei die Anzahl der von der Nullzeile verschiedenen Zeilen der Zeilenrang ist. Durch Vertauschung der Spalten, welche den Spaltenrang fest l¨asst, kann man die Matrix schließlich auf die spezielle Stufenform in Fig. 4 bringen, an welcher man sowohl den Spaltenrang als auch den Zeilenrang ablesen kann. ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
= 0 0 0 0 0 0 0 0 0 0
0 = 0 0 0 0 0 0 0 0 0
0 0 = 0 0 0 0 0 0 0 0
0 0 0 = 0 0 0 0 0 0 0
0 0 0 0 = 0 0 0 0 0 0
0 0 0 0 0 = 0 0 0 0 0
∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0
∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0
∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0
∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0
∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0
∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0
∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0
∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
Fig. 4: Spezielle Stufenform Benutzt man zum L¨osen eines LGS Spaltenumformungen, so muss man daran denken, dass dabei auch die Variablen vertauscht werden! Elementare Zeilen- und Spaltenumformungen einer Matrix A kann man durch Multiplikation mit geeigneten Matrizen ausdr¨ ucken. Dies ist allgemein leicht zu begr¨ unden, wir begn¨ ugen uns aber mit Beispielen: Beispiel 7 (elementare Umformungen): F¨ ur A ∈ K 3,n bedeutet ⎛
⎞
⎛
1 0 0 ⎜ ⎟ ⎝ 0 r 0 ⎠A 0 0 1 Vervielfachung der 2. Zeile mit r F¨ ur A ∈ K n,4 bedeutet ⎛ 1 0 0 0 ⎜ 0 1 0 0 ⎜ A⎜ ⎝ 0 0 r 0 0 0 0 1
⎞
1 0 0 ⎜ ⎟ ⎝ 0 1 1 ⎠A 0 0 1 Addition der 3. zur 2. Zeile
⎞
⎛
⎟ ⎟ ⎟ ⎠
⎜ 0 A⎜ ⎜ ⎝ 0
Vervielfachung der 3. Spalte mit r
1 0 1 0 0 0
0 0 1 0
1 0 0 1
⎛
⎞
0 0 1 ⎜ ⎟ ⎝ 0 1 0 ⎠A 1 0 0 Vertauschung der 1. und 3. Zeile
⎞
⎛
⎟ ⎟ ⎟ ⎠
⎜ 0 A⎜ ⎜ ⎝ 0
Addition der 1. zur 4. Spalte
1 0 0 0 0 1
0 0 1 0
0 1 0 0
⎞ ⎟ ⎟ ⎟ ⎠
Vertauschung der 2. und 4. Spalte
II.2 Verkettung linearer Abbildungen
47
Fasst man die von links bzw. von rechts an die gegebene Matrix A heranmultiplizierten Matrizen zu einem Produkt B bzw. C zusammen, so kann man festhalten: Ist A ∈ K m,n , dann gibt es invertierbare Matrizen B ∈ K m,m und C ∈ K n,n , so dass die Matrix BAC die in Fig. 4 beschriebene Stufenform hat. Ist A ∈ K n,n quadratisch und vom Rang n, dann ist BAC eine Diagonalmatrix. Durch weitere Vervielfachungen der Zeilen oder Spalten kann man diese zu E machen, es gibt also invertierbare Matrizen B, C ∈ K n,n mit BAC = E. Bei obigen Aussagen haben wir stillschweigend benutzt, dass das Produkt invertierbarer Matrizen aus K n,n wieder invertierbar ist. Dies ist aber selbstverst¨andlich, denn (AB)(B −1 A−1 ) = A(BB −1 )A−1 = AEA−1 = AA−1 = E, und ebenso findet man (B −1 A−1 )(AB) = E. Also ist (AB)−1 = B −1 A−1 . Hat man zu einer Matrix A ∈ K n,n vom Rang n zwei Matrizen B, C ∈ K n,n gefunden, so dass BAC = E gilt, dann kann man formal A−1 berechnen: Aus BAC = E folgt A = B −1 C −1 , also A−1 = CB. Die konkrete Rechnung ist aber in der Praxis bei großen Matrizen sehr m¨ uhsam. Beispiel 8: Aus A ergibt sich folgendermaßen unter Beachtung der Reihenfolge der Operationen die Einheitsmatrix E: 1. 3. 4. 5. 2. 1 1 1 3 −3 0 1 1 − 31 0 1 0 0 1 −1 4 0 1 0 1 0 1 0 17 Addition der 1. zur 2. Zeile
A−1 =
−3 0 0 1
A
1 1 0 1
1. Spalte mal (−3)
Addition der 1. zur 2. Spalte
− 13 0 0 1
1 0 0 17
1. Spalte mal (− 13 )
1 1 0 1
=
1 7
1. Spalte mal 17 4 −3 1 1
F¨ ur invertierbare Matrizen aus K 2,2 rechnet man leicht nach (Aufgabe 4):
a b c d
−1
1 = ad − bc
d −b −c a
Einen Vektor aus K n kann man als eine Matrix aus K n,1 verstehen ( Spalten” vektor“). Eine Matrix aus K 1,n ( Zeilenvektor“) kann man als transponierten“ ” ” Vektor deuten, wenn man das Transponieren (hochgestelltes Symbol T ) folgendermaßen deutet: ⎛
⎞
a1 T ⎜ a2 ⎟ ⎜ . ⎟ = (a1 a2 . . . an ), ⎝ .. ⎠ an
⎛
⎞
a1 a2 ⎟ ⎜ ⎟ (a1 a2 . . . an )T = ⎜ ⎝ ... ⎠ an
II Lineare Abbildungen
48 Damit kann man die Linearformen einfacher schreiben: a1 x1 + a2 x2 + . . . + an xn = aT x
Das Transponieren einer Matrix definiert man auch im allgemeinen Fall: Definition 3: F¨ ur A ∈ K m,n versteht man unter der Matrix AT diejenige Matrix n,m aus K , die aus A durch Vertauschen der Zeilen mit den Spalten hervorgeht, bei der also das Element aij mit dem Element aji vertauscht wird. Man nennt AT die Transponierte von A. Nach Satz 1 haben die Matrizen A und AT den gleichen Rang. Beispiel 9: ⎛
1 2 5 8 1 3 4
⎜ 4 ⎜ ⎜ 7 ⎝ 0
3 6 9 2 5
⎞T ⎟ ⎟ ⎟ = ⎠
1 4 7 0 3 2 5 8 1 4 3 6 9 2 5
,
1 4 7 0 3 2 5 8 1 4 3 6 9 2 5
T
⎛
1 2 5 8 1 3 4
⎜ 4 =⎜ ⎜ 7 ⎝ 0
3 6 9 2 5
⎞ ⎟ ⎟ ⎟ ⎠
Satz 2: F¨ ur das Transponieren von Matrizen gelten die folgenden Regeln: ur alle A, B ∈ K m,n ; (1) (A + B)T = AT + B T f¨ ur alle A ∈ K m,n und r ∈ K; (2) (rA)T = rAT f¨ ur alle A ∈ K k,m und B ∈ K m,n ; (3) (AB)T = B T AT f¨ ur alle invertierbaren A ∈ K n,n . (4) (AT )−1 = (A−1 )T f¨ Beweis: Nur die Regeln (3) und (4) sind nicht unmittelbar einsichtig. Sind aT1 , aT2 , . . . , aTk ∈ K m die Zeilenvektoren von A und b1 , b2 , . . . , bn ∈ K m die Spaltenvektoren von B, dann ist AB = (aTibj )k,n . Wegen aTibj = bTj ai ergibt sich (AB)T = (bTj ai )n,k = B T AT . Ist A eine invertierbare Matrix aus K n,n , dann ist AA−1 = E = E T = (A−1 )T AT . Weil die Inverse einer Matrix eindeutig bestimmt ist, folgt (AT )−1 = (A−1 )T (vgl. Aufgabe 1). 2 Beispiel 10: Ein Homomorphismus von V = K n in W = K m sei durch die Matrix A ∈ K m,n gegeben. Ist dann aT y eine Linearform u ¨ber W und y = Ax (x ∈ V ), dann ist aT Ax = (AT a)x, also (AT a)x die zugeh¨orige Linearform u ¨ber V . Dem Homomorphismus von V in W mit der Matrix A entspricht also der Homomorphismus von Hom(W, K) in Hom(V, K) mit der Matrix AT .
II.2 Verkettung linearer Abbildungen
49
Aufgaben 1. a) Man zeige, dass man bei der Matrizenmultiplikation in K n,n nicht zwischen links- und rechtsneutralem Element unterscheiden muss und dass das neutrale Element eindeutig bestimmt ist. b) Man zeige, dass die inverse Matrix zu A ∈ K n,n , falls sie existiert, eindeutig bestimmt ist.
2. Eine Matrix A ∈ K n,n heißt symmetrisch, wenn AT = A gilt; sie heißt schiefsymmetrisch , wenn AT = −A gilt. Man zeige, dass man jede Matrix aus K m,m als Summe einer symmetrischen und einer schiefsymmetrischen Matrix schreiben kann.
3. Es seien a, b von o verschiedene Vektoren aus K n . Dann ist a bT eine Matrix aus K n,n . Welchen Rang hat diese Matrix?
4. Man zeige, dass f¨ur invertierbare Matrizen aus K 2,2 gilt:
a b c d
−1
=
1 ad − bc
d −b −c a
5. Man bestimme den Rang der Matrizen ⎛
⎜ ⎜ ⎜ A=⎜ ⎜ ⎜ ⎝
1 5 1 2 3
2 4 1 0 2
3 3 1 2 5
4 2 1 0 4
5 1 1 2 7
⎞
⎛
0 ⎟ ⎟ ⎜ 1 ⎟ ⎜ ⎟, B = ⎜ ⎟ ⎝ 0 ⎟ ⎠
1 0 0 1 2
0 1 0 1
1 0 0 2
0 1 0 1
⎞
⎛
⎜ ⎜ ⎟ ⎜ ⎟ ⎟, C = ⎜ ⎜ ⎠ ⎜ ⎝
2 3 1 1 3
7 0 1 4 0
1 1 1 7 1
0 1 0 1 2
⎞ ⎟ ⎟ ⎟ ⎟. ⎟ ⎟ ⎠
6. Man bestimme eine Matrix A ∈ K 2,5 vom Rang 2 und eine Matrix B ∈ K 5,3 vom Rang 3, so dass AB die Nullmatrix ist.
7. a) Man zeige f¨ur A, B ∈ K n,n : Ist der Rang von AB kleiner als n, dann ist der Rang von A oder der Rang von B kleiner als n. b) Man konstruiere A, B ∈ K n,n so, dass die R¨ange von A und B positiv sind und der Rang von AB und BA jeweils gleich 0 ist.
8. Unter dem Bild von A ∈ K m,n versteht man den Unterraum Bild A = {Ax | x ∈ K n } von K m . Seine Dimension ist die maximale Anzahl linear unabh¨angiger Spaltenvektoren von A, also der Rang von A. Man zeige, dass f¨ ur A ∈ K k,m , m,n B∈K gilt: Rang AB ≤ min(Rang A, Rang B)
II Lineare Abbildungen
50
II.3 Anwendungen der Matrizenrechnung Einfu orpers der komplexen Zahlen ¨ hrung des K¨ Der K¨orper C der komplexen Zahlen ist in Kapitel I schon erw¨ahnt worden, er kann einer der K¨orper K sein, welche beim Begriff des K-Vektorraums auftreten. Die komplexen Zahlen erkl¨art man oft√ kurz und b¨ undig“ als die Menge aller ” Terme a + bi mit a, b ∈ IR, wobei i = −1 sein soll. Eine solche Zahl“ i gibt ” es in IR nat¨ urlich nicht, sie ist eine komplexe Zahl. Man erkl¨art also den Begriff der komplexen Zahl mit sich selbst, was nat¨ urlich etwas paradox ist. Man k¨onnte C auch als zweidimensionalen IR-Vektorraum mit der Basis {1, i} einf¨ uhren, in welchem zus¨atzlich die merkw¨ urdige Multiplikation
a c ac − bd · = b d ad + bc
6
definiert ist; man rechnet also mit den Termen a + bi nach den u ¨blichen Regeln der Arithmetik, wobei i2 durch −1 zu ersetzen ist. Man kann dann in einem kartesischen Koordinatensystem die komplexe Zahl α = a + bi durch den √ Punkt (a, b) darstellen (Fig. 1), die L¨ange a2 + b2 als den Betrag |α| der komplexen Zahl und den Winkel zwischen der reellen“ Achse und der Stre” cke von O nach α als den Winkel (das Ar” gument“) arg α von α deuten. Dann gilt f¨ ur zwei komplexe Zahlen mit den Betr¨agen r, s und den Argumenten ϕ, ψ aufgrund der Additionstheoreme der Trigonometrie
cos ϕ cos ψ cos(ϕ + ψ) r ·s = rs . sin ϕ sin ψ sin(ϕ + ψ)
imagin¨ are Achse
. .....u α b ........................................ ...... .... . . . . .. ... ...... .... |α|........... ... . . . . . ... ........ . . . . ... .... .... . . . . ... ... .... . . . . .. arg α .. .. . ...... .. a O reelle Achse Fig. 1: Komplexe Zahl 6
..u α · β ... . . ... ... . . ... rs ..... ... ... . . .......u β . ... ............. . . ........ r....... ...ϕ............. ......u α . . .. ....... s ........ .......... ........... .. .......... ψ ... ϕ .... -
Dies erinnert an die Verkettung zweier Drehstreckungen (Fig. 2), und dies gibt einen Hinweis auf eine etwas durchsichtigere O Einf¨ uhrung der komplexen Zahlen, n¨amlich als Abbildungen der Ebene, welche durch Fig. 2: Multiplikation Matrizen dargestellt werden. Dieses Vorgehen w¨ urde z.B. auch dem u ¨blichen Vorgehen bei der Konstruktion der 3 rationalen Zahlen aus den ganzen Zahlen entsprechen: Die Bruchzahl versteht man zun¨achst als den Operator
3 von . . .“ auf einem Gr¨oßenbereich. ”7
7
II.3 Anwendungen der Matrizenrechnung
51
Eine Drehung in der Ebene um den Ursprung eines kartesischen Koordinatensystems mit dem Winkel ϕ ist durch
cos ϕ − sin ϕ sin ϕ cos ϕ
x →
x2
P (p , p ) ...t. . . 1 2 . . .. . .... .. .. ... .. . r ... . .. . . .. .. .. . .t .. .......... .. . . ϕ ... ......................r................ P (p1 , p2 ) . . ...... .. .................... ..α ...
x
gegeben (Fig. 3). Verkettet man diese noch mit einer Streckung am Zentrum O mit dem Faktor r, dann hat diese Drehstreckung die Matrix
a −b b a
=r
cos ϕ − sin ϕ sin ϕ cos ϕ
x1
p1 = = = p2 = = =
.
Wir betrachten nun die Menge
C=
a −b b a
6
r cos(α + ϕ) r cos α cos ϕ − r sin α sin ϕ p1 cos ϕ − p2 sin ϕ r sin(α + ϕ) r sin α cos ϕ + r cos α sin ϕ p1 sin ϕ + p2 cos ϕ
Fig. 3: Drehung
| a, b ∈ IR
mit den u ¨blichen Matrizenoperationen (Addition, Multiplikation). Dann bildet C einen K¨orper, d. h. C ist abgeschlossen bez¨ uglich der Addition und der Multiplikation, es gelten die Assoziativ- und Kommutativgesetze sowie das Distributivgesetz, es gibt neutrale Elemente (O Nullmatrix, E Einheitsmatrix) und es existieren inverse Elemente bez¨ uglich der Addition und der Multiplikation. Das folgt alles aus dem Rechnen mit Matrizen. Insbesondere gilt
a −b b a
a −b b a
−1
·
c −d d c
=
1 a2 + b2
=
a b −b a
ac − bd −(ad + bc) ad + bc ac − bd
,
falls
a −b b a
,
=
0 0 0 0
.
Damit ist der K¨orper C der komplexen Zahlen definiert. Ersetzen wir zur Ver1 0 einfachung der Schreibweise (und aus keinem anderen Grund!) 0 1 durch
1 und
0 1
−1 0
durch i, dann ist
a −b b a
= a + bi, man kann also wieder
in gewohnter Weise“ mit den komplexen Zahlen rechnen. Ist α = a + bi, dann ” nennt man α = a − bi die zu α konjugierte Zahl. Es gilt α · α = a2 + b2 = |α|2 , 1 also α−1 = 2 α. Die Definition der komplexen Zahlen als Matrizen ¨andert also |α|
nichts am Umgang mit diesen Zahlen, sie dient nur zur Kl¨arung des Begriffs der komplexen Zahlen. Man nennt a den Realteil und b den Imagin¨arteil der komplexen Zahl a + bi. Eine komplexe Zahl α ist genau dann reell, wenn α = α, wenn also ihr Imagin¨arteil 0 ist. Eine reelle Zahl ist ein spezielle komplexe Zahl, die Menge IR ist also eine Teilmenge (ein Teilk¨orper) von C.
II Lineare Abbildungen
52 Quaternionen F¨ ur komplexe Zahlen α, β ∈ C nennt man die Matrizen
α −β β α
Quaternionen. Der Name r¨ uhrt daher, dass f¨ ur α = a1 + ia2 , β = b1 + ib2 mit a1 , a2 , b1 , b2 ∈ IR die Quaternion von den vier reellen Zahlen a1 , a2 , b1 , b2 abh¨angt. Die Quaternionen bilden einen 4-dimensionalen IR-Vektorraum mit der Basis
1 0 0 1
,
0 −1 1 0
,
i 0 0 −i
,
0 i i 0
.
Das Produkt zweier Quaternionen ergibt wieder eine Quaternion, jedoch ist die Quaternionenmultiplikation nicht kommutativ:
α −β β α
γ −δ δ γ
=
αγ − βδ −αδ − βγ βγ + αδ −βδ + α γ
=
αγ − βδ −βγ + αδ βγ + αδ αγ − βδ
(Man beachte, dass im Allgemeinen αγ − βδ = γα − δβ ist, dies gilt nur, wenn δβ reell ist.) Außer dem Kommutativgesetz der Multiplikation erf¨ ullt die Menge der Quaternionen alle K¨orpergesetze; man spricht von einem Schiefk¨orper. Dieser enth¨alt den K¨orper der komplexen Zahlen bzw. ein isomorphes Bild desselben: α 0 man identifiziere die komplexe Zahl α mit der Quaternion 0 α . Mit Hilfe des Multiplikationssatzes f¨ ur Determinanten (s. unten) ergibt sich aus dem Quaternionenprodukt eine f¨ ur die Zahlentheorie interessante Beziehung: Es gilt zun¨achst (αα + ββ)(γγ + δδ) = (αγ − βδ)(αγ − βδ) + (βγ + αδ)(βγ + αδ). Nun sei wieder α = a1 + ib1 usw. mit a1 , a2 , . . . ∈ IR. Wegen αγ − βδ = (a1 c1 − a2 c2 − b1 d1 − b2 d2 ) + i(a1 c2 + a2 c1 − b1 d2 + b2 d1 ), βγ + αδ) = (b1 c1 − b2 c2 + a1 d1 + a2 d2 ) + i(b1 c2 + b2 c1 + a1 d2 − a2 d1 ) ergibt sich die Formel (a21 + a22 + b21 + b22 )(c21 + c22 + d21 + d22 ) = (a1 c1 − a2 c2 − b1 d1 − b2 d2 )2 + (a1 c2 + a2 c1 − b1 d2 + b2 d1 )2 +(b1 c1 − b2 c2 + a1 d1 + a2 d2 )2 + (b1 c2 + b2 c1 + a1 d2 − a2 d1 )2 . In der Zahlentheorie gewinnt man daraus die folgende Erkenntnis: Sind zwei nat¨ urliche Zahlen als Summe von vier Quadratzahlen darstellbar, dann gilt dies auch f¨ ur ihr Produkt. Der Vierquadratesatz, wonach jede nat¨ urliche Zahl als Summe von vier Quadraten darzustellen ist, muss also nur f¨ ur Primzahlen bewiesen werden.
II.3 Anwendungen der Matrizenrechnung
53
Wir haben oben den Begriff der Determinante f¨ ur eine Matrix benutzt; auf diesen Begriff werden wir in IV.1 allgemein eingehen. Die Determinante einer Matrix a b A= ∈ K 2,2 ist det A = ad − bc ∈ K. Es gilt der Determinantenmultic d plikationsssatz det (AB) =det A· det B f¨ ur A, B ∈ K 2,2 :
a b e f ae + bg af + bh = det c d g h ce + dg cf + dh = (ae + bg)(cf + dh) − (af + bh)(ce + dg) = adeh − adf g + bcf g − bceh = (ad − bc) · (eh − f g) a b e f = det · det c d g h
det
Diesen werden wir auch in den n¨achsten Anwendungsbeispielen ben¨otigen. Beispiel: Die Zahl 9675 soll als Summe von vier Quadraten geschrieben werden. Es ist 9675 = 75 · 129 und 75 = 12 + 32 + 42 + 72 , 129 = 22 + 52 + 62 + 82 . Nun ist
1 + 3i −4 + 7i 4 + 7i 1 − 3i
2 + 5i −6 + 8i 6 + 8i 2 − 5i
=
α −β β α
mit α = −93 + 21i, β = 3 + 24i, also αα = 932 + 212 und ββ = 32 + 242 . Es ergibt sich also 9675 = 32 + 212 + 242 + 932 . Fibonacci-Zahlen Die Folge der Fibonacci-Zahlen (nach Leonardo Pisano, gen. Fibonacci, ca 1170– 1240) F0 = 0, F1 = 1, F2 = 1, F3 = 2, F4 = 3, F5 = 5, . . . und allgemein ur n ≥ 1 Fn+1 = Fn + Fn−1 f¨ kann man durch
Fn+1 Fn Fn Fn−1
n
= A (n ∈ IN) mit A =
1 1 1 0
¨ definieren, wie man durch Ubergang von An zu An+1 feststellt. Viele Eigenschaften der Fibonacci-Zahlen gewinnt man aus dieser Matrizendarstellung: Bildet man in der Matrizendarstellung die Determinante, so ergibt sich die Formel Fn+1 Fn−1 − Fn2 = (−1)n (n ∈ IN). Aus
Fm+n+1 Fm+n Fm+n Fm+n−1
folgt
= Am+n = Am An =
Fm+1 Fm Fm Fm−1
Fn+1 Fn Fn Fn−1
II Lineare Abbildungen
54
Fm+n = Fm+1 Fn + Fm Fn−1 = Fm Fn+1 + Fm−1 Fn und insbesondere 2 + Fn2 . F2n = Fn (Fn+1 + Fn−1 ) sowie F2n+1 = Fn+1
Es gilt mit A0 = E (Einheitsmatrix) (A − E)
n
Ai = An+1 − E
i=0
(vgl. Summenformel der geometrischen Reihe), wegen A − E = A−1 also E+
n i=1
Fi+1 Fi Fi Fi−1
n+2
=A
−A=
Fn+3 − 1 Fn+2 − 1 Fn+2 − 1 Fn+1
.
Man erh¨alt die (allerdings auch einfacher zu gewinnende) Formel n i=0
Fi = Fn+2 − 1 (n ∈ IN0 ).
Pellsche Gleichungen Es sei d eine quadratfreie nat¨ urliche Zahl > 1, also eine nat¨ urliche Zahl > 1, die durch keine Quadratzahl > 1 teilbar ist. Die Gleichung x2 − dy 2 = 1 besitzt dann stets außer der trivialen L¨osung (1, 0) noch weitere L¨osungen in √ IN2 , wie man mit Hilfe der Kettenbruchentwickung von d beweisen kann. Man nennt x2 − dy 2 = 1 eine pellsche Gleichung, wenn man nach ganzzahligen L¨osungen sucht. (Leonhard Euler (1707–1783) hat die Behandlung solcher Gleichungen irrt¨ umlich John Pell (1610–1685) zugeschrieben.) Wir wollen durch Rechnen mit Matrizen zeigen, wie man aus einer minimalen L¨osung (x, y mit y = 0 kleinstm¨oglich) die (unendliche) Menge aller L¨osungen der pellschen Gleichung gewinnt. Wie betrachten die Menge M der Matrizen
x dy y x
mit x ∈ IN, y ∈ IN0
und x2 − dy 2 = 1.
M bildet bez¨ uglich der Matrizenmultiplikation eine kommutative Gruppe mit 1 0 dem neutralen Element E = 0 1 und der Inversenbildung
x dy y x
−1
=
x −dy −y x
.
II.3 Anwendungen der Matrizenrechnung
55
In M l¨asst sich folgendermaßen eine lineare Ordnung < definieren:
F¨ ur X1 =
x1 dy1 y1 x 1
, X2 =
x2 dy2 y2 x2
sei X1 < X2 ⇐⇒ y1 < y2 .
Es sei U die (eindeutig bestimmte) Matrix aus M mit dem kleinstm¨oglichen positiven Wert von y. Dann ist . . . < U −2 < U −1 < E < U < U 2 < . . . . F¨ ur jedes X ∈ M mit E < X existiert ein n ∈ IN mit U n ≤ X < U n+1 ,
also E ≤ U −n X < U ;
W¨are E < U −n X, dann w¨are U nicht die Matrix aus M mit dem kleinsten positiven Wert y. Daher ist U −n X = E, also X = U n . Die Gruppe M ist daher eine unendliche zyklische Gruppe mit dem erzeugenden Element U . F¨ ur die Folge der L¨osungen (xn , yn ) der pellschen Gleichungen mit yn ∈ IN gilt somit xn dyn = U n. yn x n Zur rekursiven Berechnung der L¨osungen (xn , yn ) aus (x0 , y0 ) = (1, 0) und der Grundl¨osung“ (x1 , y1 ) kann man die Beziehung ” (U n+1 + U n )U −(n+1) = U + U −1 = 2x1 E (n ∈ IN0 ) benutzen; sie liefert f¨ ur n ∈ IN0 : xn+2 = 2x1 xn+1 − xn ,
yn+2 = 2x1 yn+1 − yn
Beispiel 1: Die Gleichung x2 − 2y 2 = 1 hat die kleinste nichttriviale L¨osung (x1 , y1 ) = (3, 2). Man erh¨alt x2 = 6 · 3 − 1 = 17, y2 = 6 · 2 − 0 = 12, x3 = 6 · 17 − 3 = 99, y3 = 6 · 12 − 2 = 70, x4 = 6 · 99 − 17 = 577, y4 = 6 · 70 − 12 = 408 usw. Die L¨osungen (3, 2), (17, 12), (99, 70), (577, 408), . . . liefern gute rationale Ap√ √ 577 mit einem proximationen f¨ ur die irrationale Zahl 2; beispielsweise ist 2 = 408 relativen Fehler von etwa 0,000015%. Beispiel 2: Die Gleichung x2 − 5y 2 = 1 hat die kleinste nichttriviale L¨osung (x1 , y1 ) = (9, 4). Man erh¨alt y2 = 18 · 4 − 0 = 72, x2 = 18 · 9 − 1 = 161, x3 = 18 · 161 − 9 = 2889, y3 = 18 · 72 − 4 = 1292, x4 = 18 · 2889 − 161 = 51841, y4 = 18 · 1292 − 72 = 23184 usw. Die L¨osungen liefern gute rationale Approximationen f¨ ur die irrationale Zahl √ √ 51841 5; beispielsweise ist auf 7 Nachkommastellen genau 5 = . 23184
II Lineare Abbildungen
56 Pythagor¨ aische Tripel und Quadrupel
Im Folgenden wollen wir aus Platzgr¨ unden Tripel und Quadrupel stets in transponierter Form schreiben. Ein Tripel ganzer Zahlen, also (a b c)T ∈ ZZ3 , heißt pythagor¨aisches Tripel, wenn c = 0 und a2 + b2 = c2 . Es heißt primitives pythagor¨aisches Tripel, wenn dabei ggT(a, b, c) = 1 gilt. Die linearen Abbildungen mit den Matrizen ⎛
⎞
⎛
⎞
⎛
⎞
−1 0 0 1 0 0 1 0 0 ⎟ ⎜ ⎟ ⎜ 0 ⎟ V1 = ⎜ ⎝ 0 1 0 ⎠ , V2 = ⎝ 0 −1 0 ⎠ , V3 = ⎝ 0 1 ⎠ 0 0 1 0 0 1 0 0 −1 bewirken bei Anwendung auf ein Tripel lediglich eine Vorzeichen¨anderung der 1., 2. bzw. 3. Koordinate, bilden also ein primitives pythagor¨aisches Tripel wieder auf ein ebensolches ab. Offensichtlich gilt Vi2 = E, also Vi−1 = Vi f¨ ur i = 1, 2, 3. Auch die lineare Abbildung mit der Matrix ⎛
⎞
2 1 2 ⎟ A=⎜ ⎝ 1 2 2 ⎠ 2 2 3 bildet ein primitives pythagor¨aisches Tripel wieder auf ein ebensolches ab: Gilt a2 + b2 = c2 und ggT(a, b, c) = 1, dann gilt auch (2a + b + 2c)2 + (a + 2b + 2c)2 = 5a2 + 5b2 + 8c2 + 8ab + 12ac + 12bc = 4a2 + 4b2 + 9c2 + 8ab + 12ac + 12bc = (2a + 2b + 3c)2 und ggT(2a + b + 2c, a + 2b + 2c, 2a + 2b + 3c) = ggT(2a + b + 2c, a + 2b + 2c, a + c) = ggT(b, b + c, a + c) = ggT(b, c, a) = 1. Dasselbe gilt wegen A−1 = V3 AV3 f¨ ur die Matrix ⎛
A
−1
⎜ =⎝
⎞
2 1 −2 1 2 −2 ⎟ ⎠. −2 −2 3
Behauptung: Jedes primitive pythagor¨aische Tripel (a b c)T entsteht aus (0 1 1)T durch Anwenden einer linearen Abbildung, deren Matrix eine Verkettung von Matrizen aus {A, V1 , V2 , V3 } ist.
II.3 Anwendungen der Matrizenrechnung
57
Dies kann man folgendermaßen beweisen: Wir betrachten das primitive pythagor¨aische Tripel (a b c) und setzen dabei a, b, c als positiv voraus; andernfalls multipliziere man zun¨achst mit Matrizen aus {V1 , V2 , V3 }. Anwenden von A−1 = V3 AV3 liefert das primitive pythagor¨aische Tripel − 2a − 2b + 3c)T .
(2a + b − 2c a + 2b − 2c Dabei gilt
0 < −2a − 2b + 3c < c, denn dies ist ¨aquivalent mit c 0 f¨ ur alle i = 1, 2, . . . , n. ur die Beweis: Ist {b1 , b2 , . . . , bn } eine Basis von V , dann gilt wegen (3) und (3)∗ f¨ n n Vektoren x = xibi und y = yjbj i=1
j=1
(x; y ) =
n i,j=1
xi yj (bi ; bj ).
Aus (1) und (2) ergibt sich die Aussage des Satzes mit aij = (bi ; bj ).
2
Mit der n, n-Matrix A = (aij )n,n und den Koordinatenvektoren x, y ist also (x; y ) = xT A y , wobei AT = A gilt und die Diagonalelemente von A positive reelle Zahlen sind. (Das Konjugieren eines Vektors bzw. einer Matrix ist dabei koordinatenweise zu verstehen.) Aber nicht f¨ ur jede Matrix A mit diesen Eigenschaften ergibt sich ein Skalarprodukt, es muss eine weitere Eigenschaft von A hinzukommen, wie das folgende Beispiel zeigt. Vgl. auch Aufgabe 5. Beispiel 1: In IR2 soll durch (x; y ) = ax1 y1 + b(x1 y2 + x2 y1 ) + cx2 y2 mit a, c > 0 (a, b, c ∈ IR) ein Skalarprodukt definiert sein. F¨ ur x1 = y1 = r und x2 = y2 = 1 (r ∈ IR) ergibt sich aus (2) die Forderung ur alle r ∈ IR, ar2 + 2br + c > 0 f¨ 1 a
wegen ar2 + 2br + c = (ar + b)2 + c −
b2 a
also c >
haben kann) und damit ac > b2 . Dann ist
b a
(x; x) = ax21 + 2bx1 x2 + cx22 = a x1 + x2
2
b2 (weil ar + b den Wert 0 a
+ c−
b2 a
x22 = 0
genau dann, wenn x1 = x2 = 0. Beispiel 2: Wir betrachten ein Skalarprodukt in einem unendlichdimensionalen Vektorraum, welcher aus einer speziellen Art von Zahlenfolgen besteht. Dabei wird (wie schon fr¨ uher) der Begriff der Konvergenz einer Zahlenfolge ben¨otigt, welcher im Analysis-Teil ausf¨ uhrlich behandelt wird; er m¨ usste aber aus dem Mathematikunterricht schon bekannt sein.
III Das Skalarprodukt
66
Die Folgen (an ) reeller Zahlen, f¨ ur welche die Folge
n
j=1
a2j
(Folge der Quadrat-
summen) konvergiert, bilden einen IR-Vektorraum. Zum Nachweis dieser Behaup tung muss man u. a. zeigen, dass mit
n
j=1
a2j und
n
j=1
b2j auch
n
(aj + bj )2 j=1 2(a2n + b2n ) bzw.
konvergiert. Dies ergibt sich aber aus (an + bn )2 + (an − bn )2 = der daraus folgenden Ungleichung (an + bn )2 ≤ 2(a2n + b2n ). Ein Skalarprodukt in diesem Vektorraum ist dann beispielsweise definiert durch ((an ); (bn )) =
wobei
∞ j=1
∞ j=1
aj bj f¨ ur den Grenzwert der Folge
aj b j ,
n
j=1
aj b j
steht; dass dieser existiert,
wird durch den unten folgenden Satz 2 garantiert. Definition3: Ist im Vektorraum V ein Skalarprodukt ( ; ) definiert, dann nennt man |x| = (x; x) die L¨ange, die Norm oder den Betrag des Vektors x ∈ V. Die geometrischen Bezeichnungen L¨ange und Orthogonalit¨at (siehe Definition 4) sind durch die geometrische Bedeutung des Standardskalarprodukts in IR2 und IR3 gerechtfertigt (vgl. III.3). Aus (2) folgt |x| ≥ 0 f¨ ur alle x ∈ V und |x| = 0 genau dann, wenn x = o. Aus (3) folgt |rx| = |r||x| f¨ ur alle r ∈ K (= IR oder = C) und alle x ∈ V. Satz 2: Im K-Vektorraum V sei ein Skalarprodukt ( ; ) definiert. Dann gilt f¨ ur alle x, y ∈ V |(x; y )| ≤ |x||y | |x + y | ≤ |x| + |y |
(Cauchy-Schwarzsche Ungleichung), (Dreiecksungleichung).
Beweis: F¨ ur y = o ist die erste Ungleichung korrekt. F¨ ur y = o folgt sie aus 0 ≤ (x − ry ; x − ry ) = (x; x) − (r(x; y ) + r(x; y )) + rr(y ; y ), wenn man r so w¨ahlt, dass r|y |2 = (x; y ). Denn dann ergibt die rechte Seite obiger Gleichung nach Multiplikation mit |y |2 (x; y )(x; y ) (x; x) − , |y |2 wie man leicht nachrechnet. Die zweite Ungleichung folgt aus der ersten: |x + y |2 = (x + y ; x + y ) = (x; x) + (x; y ) + (y ; x) + (y ; y ) ≤ |x|2 + 2|x||y | + |y |2 = (|x| + |y |)2
2
III.1 Skalarproduktr¨aume
67
Die Cauchy-Schwarzsche Ungleichung ist benannt nach Augustin Louis Cauchy (1789–1857) und Hermann Amandus Schwarz (1843–1921). Definition 4: Ist im Vektorraum V ein Skalarprodukt ( ; ) definiert, dann nennt man zwei Vektoren x, y orthogonal zueinander, wenn (x; y ) = 0. Der Nullvektor ist zu jedem anderen Vektor orthogonal. Ist x orthogonal zu y , dann schreibt man daf¨ ur x ⊥ y . Von o verschiedene orthogonale Vektoren sind linear unabh¨angig, denn sind k b1 , b2 , . . . , bk paarweise orthogonal und alle = o, dann folgt aus xibi = o durch i=1
Bildung des Skalarprodukts mit bj (j = 1, 2, . . . , k) 0 = (o; bj ) =
k i=1
xibi ; bj
= (xjbj ; bj ) = xj |bj |2 ,
also xj = 0.
Definition 5: Eine Basis eines Vektorraums mit Skalarprodukt heißt orthogonal oder eine Orthogonalbasis, wenn die Basisvektoren paarweise orthogonal sind. Sie heißt orthonormal oder eine Orthonormalbasis, wenn die Basisvektoren außerdem alle die L¨ange 1 haben. Bez¨ uglich einer Orthonormalbasis C = {c1 , c2 , . . . , cn } gewinnt man leicht die Basisdarstellung eines Vektors v : Ist v = f¨ ur i = 1, 2, . . . , n, also
n
i=1
⎛
v =
n i=1
⎜ ⎜
(v ; ci ) ci = ⎜ ⎜ ⎝
xici , dann ist (v ; ci ) = xi (ci ; ci ) = xi (v ; c1 ) (v ; c2 ) .. . (v ; cn )
⎞ ⎟ ⎟ ⎟ . ⎟ ⎠ C
Satz 3: Ist U ein endlich erzeugter Unterraum des Skalarproduktraums V , dann hat jeder Vektor a ∈ V eine eindeutige Darstellung a = a⊥ + a
mit a⊥ ⊥ u f¨ ur alle u ∈ U und a ∈ U.
Beweis: Ist {u1 , u2 , . . . , uk } eine Basis von U , dann bestimme man Zahlen x1 , x2 , . . . , xk aus der Bedingung
a −
k i=1
xiui ⊥ uj = 0 bzw.
k i=1
xiui ; uj
= (a; uj ) (j = 1, 2, . . . , k).
Man muss also ein LGS mit der Koeffizientenmatrix ((ui ; uj )) ∈ K k,k l¨osen. Die Koeffizientenmatrix ist vom Rang k, denn w¨are ⎛
k i=1
⎜ ⎜
si ⎜ ⎜ ⎝
(ui ; u1 ) (ui ; u2 ) .. . (ui ; uk )
⎞
⎟ ⎟ ⎟= o, ⎟ ⎠
III Das Skalarprodukt
68 so w¨are
k i=1
(siui ; uj ) = 0 f¨ ur j = 1, 2, . . . , k. Der einzige Vektor aus U , der zu jedem
Vektor aus U orthogonal ist, ist aber der Nullvektor o; es folgt also
k i=1
siui = o
und damit s1 = s2 = . . . = sk = 0. Die obigen Koeffizienten x1 , x2 , . . . , xk sind also eindeutig bestimmt, und es ergibt sich die Behauptung mit a = a⊥ = a − a .
k
j=1
xj uj und 2
Den Vektor a nennt man die orthogonale Projektion von a in den Unterraum U . Ist die in Satz 3 benutzte Basis von U eine Orthonormalbasis, dann ist xi = (a; ui ) (i = 1, 2, . . . , k), also a =
k
i=1
(a; ui ) ui .
Satz 4: Jeder endlichdimensionale K-Vektorraum V mit Skalarprodukt besitzt eine Orthonormalbasis. Beweis: Es sei {a1 , a2 , . . . , an } eine Basis von V . Man setze b1 = a1
und
c1 =
b2 = a2 − (a2 ; c1 ) c1
b1 , |b1 |
und
c2 =
b3 = a3 − (a3 ; c1 ) c1 − (a3 ; c2 ) c2
b2 , |b2 |
und
c3 =
b3 , |b3 |
.. . bn = an − (an ; c1 ) c1 − (an ; c2 ) c2 − . . . − (an ; cn−1 ) cn−1
und
Dann ist {c1 , c2 , . . . , cn } eine Orthonormalbasis von V .
cn =
bn . |bn |
2
Das im Beweis von Satz 4 benutzte Verfahren nennt man schmidtsches Orthonormierungsverfahren (nach Erhard Schmidt, 1876–1959). Bez¨ uglich einer Orthonormalbasis ist die obige Matrix A, welche das Skalarprodukt festlegt, die Einheitsmatrix E. In einem Skalarproduktraum der Dimension n lautet das Skalarprodukt bez¨ uglich einer Orthonormalbasis daher (x; y ) = x T y = x1 y1 + x2 y2 + . . . + xn yn , es ist also das Standardskalarprodukt. Definition 6: Ist U ein Unterraum des n-dimensionalen Skalarproduktraums V , dann ist ur alle u ∈ U } U⊥ = {v ∈ V | (u; v ) = 0 f¨ ebenfalls ein Unterraum von V ist. Dieser heißt der Lotraum von U . Es gilt dim U + dim U⊥ = dim V (Aufgabe 8).
III.1 Skalarproduktr¨aume
69
Aufgaben 1. Man beweise die Behauptung unter (3)∗ in Definition 1. 2. a) Man zeige: F¨ur x ⊥ y gilt |x + y|2 = |x|2 + |y|2 . b) Man zeige, dass in der Cauchy-Schwarzschen Ungleichung |(x, y )| ≤ |x||y | genau dann das Gleichheitszeichen gilt, wenn x, y linear abh¨angig sind.
3. Man beweise, dass in einem K-Vektorraum V mit Skalarprodukt gilt: ||x| − |y || ≤ |x − y | f¨ ur alle x, y ∈ V
4. Die Spur einer Matrix (aij ) ∈ IRn,n ist die Summe ihrer Diagonalelemente, also Spur(aij ) =
n
i=1
aii . Man zeige, dass im IR-Vektorraum IRm,n der m, n-
Matrizen durch (A; B) = Spur(B T A) ein Skalarprodukt definiert wird.
5. Im Skalarprodukt (x; y) = xT Ay in IRn muss f¨ur die symmetrische Matrix A ∈ IRn,n gelten: xT Ax > 0 f¨ ur alle x ∈ IRn mit x = o. Eine solche Matrix ⎛ ⎞ nennt man positiv definit. 1
a) Man zeige, dass die Matrix A = ⎝ −1 2
−1 2 2 −3 ⎠ positiv definit ist. −3 6
b) Die Matrix A ∈ IRn,n habe den Rang n, sei also invertierbar. Man zeige, dass AT A positiv definit ist. c) A = (aij ) ∈ IRn,n sei positiv definit. Man zeige, dass aii > 0 und aii ajj > a2ij (i = j) (i, j = 1, 2, . . . , n). Beachte dabei Beispiel 1.
6. Es sei U ein Unterraum des Skalarproduktraums V und v die orthogonale Projektion von v in U . Man zeige, dass v → v eine lineare Abbildung von V in U ist. Man beschreibe den Kern dieser linearen Abbildung. −→
−→
7. In IRn seien Punkte P und A durch ihre Ortsvektoren p =OP und a =OA
festgelegt, ferner sei U ein Unterraum des Vektorraums IRn . In IRn sei ein Skalarprodukt gegeben. Unter dem Abstand d des Punktes P von der linearen Mannigfaltigkeit a + U versteht man das Minimum der L¨angen von p −u f¨ ur u ∈ a + U . Man zeige, dass d = |(p −a) − (p −a) |, wobei allgemein x die orthogonale Projektion von x in den Unterraum U bedeutet.
8. Es sei U ein Unterraum des n-dimensionalen Skalarproduktraums V . Man zeige, dass der Lotraum U⊥ = {v ∈ V | (u; v ) = 0 f¨ ur alle u ∈ U } ein Unterraum von V ist, und dass dim U + dim U⊥ = dim V.
9. Man bestimme eine Orthonormalbasis f¨ur den von (1 0 0 1 1)T ,
(1 − 1 1 0 0)T ,
erzeugten Unterraum von IR5 .
(0 1 2 1 0)T
III Das Skalarprodukt
70
III.2 Anwendungen in der Statistik Es sei Ω = {ω1 , ω2 , . . . , ωn } die Menge der m¨oglichen Ausf¨alle eines Zufallsversuchs und X : Ω → IR eine Zufallsgr¨oße auf diesem Zufallsversuch, also auf Ω. (Zufallsgr¨oßen pflegt man in der Wahrscheinlichkeitsrechnung stets mit großen lateinischen Buchstaben zu bezeichnen.) Diese Zufallsgr¨oße kann als Vektor aus IRn mit den Koordinaten xi = X(ωi ) (i = 1, 2, . . . , n) verstanden werden; die Menge der Zufallsgr¨oßen auf Ω ist ein Vektorraum, n¨amlich bis auf Isomorphie der Vektorraum IRn . Ist pi = P (ωi ) die Wahrscheinlichkeit des Ausfalls ωi , dann ist durch (X; Y ) =
n i=1
pi x i y i
ein Skalarprodukt im Vektorraum der Zufallsgr¨oßen auf Ω definiert. Man beachte, dass man pi > 0 annehmen kann, denn w¨are pi = 0, dann w¨are ωi kein m¨oglicher“ ” n pi = 1. F¨ ur Zufallsgr¨oßen auf Ω Ausfall. F¨ ur die Wahrscheinlichkeiten pi gilt i=1
sind mit diesem Skalarprodukt die Begriffe Betrag (|X|), Abstand (|X − Y |) und Orthogonalit¨at ((X; Y ) = 0) zu definieren. Zufallsgr¨oßen kann man auch in folgendem Sinn multiplizieren: (XY )(ωi ) = X(ωi )Y (ωi ) (i = 1, 2, . . . , n). Offensichtlich gilt (XY ; Z) = (X; Y Z) f¨ ur je drei Zufallsgr¨oßen X, Y, Z auf Ω. Die Zufallsgr¨oße I sei definiert durch I(ωi ) = 1 f¨ ur i = 1, 2, . . . , n, so dass XI = X f¨ ur alle X gilt. F¨ ur c ∈ IR ist cI die konstante Zufallsgr¨oße mit dem Wert c. Der Wert c, f¨ ur welchen |X−cI| f¨ ur ein gegebenes X minimal ist, heißt Erwartungswert von X und wird mit E(X) bezeichnet. Wegen |X − cI|2 = (X − cI; X − cI) = (X; X) − 2(X; cI) + (cI; cI) = (X; X) − (X; I)2 + c2 − 2c(X; I) + (X; I)2 = (X 2 ; I) − (X; I)2 + (c − (X; I))2 ist E(X) = (X; I), also E(X) =
n i=1
pi xi .
Hat man f¨ ur die Werte x1 , x2 , . . . , xn einer Zufallsgr¨oße im Rahmen einer statistischen Erhebung relative H¨aufigkeiten h1 , h2 , . . . , hn gefunden, dann ist n hi xi der Mittelwert von X bei der durchgef¨ uhrten Erhebung. Man erx∗ = i=1
wartet, dass der Mittelwert x∗ bei hinreichend großem Umfang der Stichprobe gut durch den Erwartungswert E(X) angen¨ahert wird. Es ist eine wichtige Aufgabe der beurteilenden Statistik, die Qualit¨at dieser Ann¨aherung abzusch¨atzen, indem man z.B. die Wahrscheinlichkeit f¨ ur gr¨oßere Abweichungen berechnet.
III.2 Anwendungen in der Statistik
71
Die Vektoren E(X)I und X − E(X)I sind orthogonal zueinander, denn (X − E(X)I ; I) = (X; I) − E(X)(I; I) = E(X) − E(X) = 0. Mit X = E(X)I und X⊥ = X − E(X)I wird X in zueinander orthogonale Komponenten zerlegt: X = X + X⊥ (Fig.1). Der Vektor X⊥ beschreibt die Abweichung der Zufallsgr¨oße X von der konstanten Zufallsgr¨oße X , es ist also naheliegend, den Betrag des Abweichungsvektors“ X⊥ als Abweichungsmaß zu ” benutzen. Man nennt σ(X) = |X⊥ | = |X − E(X)I| die Standardabweichung von X. Aus Obigem folgt, dass σ 2 (X) = E((X − E(X)I)2 ) = E(X 2 ) − E(X)2 . I ...... ................ . . . . . . . . . . . : . . . . . X ... ..C.C ..... ... ....... ... ...... ....... .. . . . . C..C . . . . . . . . . . . .C..C X⊥ .. ........... XXXX XXX . XX .C...C X X z.CW.CW X
X = X + X⊥ |X | = E(X) |X⊥ | = σ(X)
Fig. 1: Erwartungswert und Standardabweichung
Ist A ein Ereignis, also eine Teilmenge von Ω, dann bezeichnet man mit IA die Zufallsgr¨oße mit den Werten IA (ω) = 1 f¨ ur ω ∈ A und IA (ω) = 0 f¨ ur ω ∈ A. Ist A = Ω \ A die Komplement¨armenge von A, dann ist IA + IA = I. Es ist E(IA ) =
P (ω) = P (A),
ω∈A
der Erwartungswert von IA ist also die Wahrscheinlichkeit des Ereignisses A. Ist ξ > 0, Y eine Zufallsgr¨oße und A = {ω ∈ Ω | |Y (ω)| ≥ ξ}, dann gilt E(Y 2 ) = E(Y 2 IA + Y 2 IA ) ≥ E(Y 2 IA ) ≥ E(ξ 2 IA ) = ξ 2 P (A). (Die Ungleichungen gelten, weil die Wahrscheinlichkeiten nicht negativ sein k¨onnen.) F¨ ur Y = X − E(X)I ergibt sich daraus die f¨ ur die Wahrscheinlichkeitsrechnung wichtige Ungleichung von Tschebyscheff (nach Pafnuti Lwowitsch Tschebyscheff, 1821–1894) P ({ω ∈ Ω | |X − E(X)I| ≥ ξ}) ≤
σ 2 (X) , ξ2
welche die Wahrscheinlichkeit f¨ ur große Abweichungen vom Erwartungswert durch einen in der Regel kleinen Wert absch¨atzt. F¨ ur ξ = 3σ(X) erh¨alt man beispielsweise, dass die Wahrscheinlichkeit f¨ ur das Abweichen des Wertes von X 1 vom Erwartungswert um das 3-fache der Standardabweichung h¨ochstens ist. 9
III Das Skalarprodukt
72
In der Statistik ergibt sich oft die Frage, ob zwischen zwei Zufallsgr¨oßen X, Y auf Ω ein linearer Zusammenhang besteht. Man sucht dann reelle Zahlen a, b, so dass |Y − (aX + bI)| minimal ist. Dies ist der Fall, wenn Y − (aX + bI) zu X und zu I orthogonal ist, wenn also aX + bI die orthogonale Projektion von X in den von X und I erzeugten Unterraum des Raums der Zufallsgr¨oßen ist. Daraus ergeben sich f¨ ur a, b die Bedingungen a=
(X⊥ ; Y⊥ ) , |X⊥ |2
b = −aE(X) + E(Y ).
Ebenso ergibt sich, dass |X − (cY + dI)| minimal ist, wenn c=
(X⊥ ; Y⊥ ) , d = −cE(Y ) + E(X). |Y⊥ |2
Besteht nun ein strenger linearer Zusammenhang, ist also Y = aX +bI und damit 1 a
b a
X = Y − I, dann ist ac = 1, also
(X⊥ ; Y⊥ ) |X⊥ ||Y⊥ |
(X, Y ) =
2
= 1. Die Zahl
(X⊥ ; Y⊥ ) |X⊥ ||Y⊥ |
liegt nach Satz 1 zwischen −1 und 1. Man nennt (X, Y ) den Korrelationskoeffizient der Zufallsgr¨oßen X, Y . Dieser dient in der Statistik als Maß daf¨ ur, wie stark die Zufallsgr¨oßen X, Y korrelieren, d.h. wie gut ein n¨aherungsweiser linearer Zusammenhang zwischen ihnen besteht. Die Zufallsgr¨oßen X, Y heißen unkorreliert, wenn (X, Y ) = 0 gilt. Genau dann sind X, Y unkorreliert, wenn E(XY ) = E(X)E(Y ), denn E(XY ) = (XY ; I) = (X; Y ) = (X + X⊥ ; Y + Y⊥ ) = (X ; Y ) + (X⊥ ; Y⊥ ) = E(X)E(Y )(I; I) + (X⊥ ; Y⊥ ). Viele weitere Konzepte der Wahrscheinlichkeitsrechnung und Statistik lassen sich mit den Begriffen der linearen Algebra u ¨bersichtlich darstellen.
Aufgaben 1. a) Man berechne die Erwartungswerte und
ω1 ω2 ω3 ω4 ω5 die Standardabweichungen f¨ ur die in der Ta1 1 1 1 1 P 20 5 2 5 20 belle angegebenen Zufallsgr¨oßen X und Y . X 2 1 3 4 0 b) Man berechne Y 3 0 1 2 4 P ({ω ∈ Ω | |X − E(X)I| ≥ 2}), P ({ω ∈ Ω | |Y − E(Y )I| ≥ 3}) und vergleiche mit den Werten in der Ungleichung von Tschebyscheff.
2. Man berechne f¨ur X, Y aus Aufgabe 1 den Korrelationskoeffizient.
III.3 Anwendungen in der Geometrie
73
III.3 Anwendungen in der Geometrie Ist in der Ebene ein kartesisches Koordinatensysten gegeben, dann kann man v den Vektor v = v1 ∈ IR2 als die Verschiebung deuten, welche jedem Punkt 2
(p1 , p2 ) den Punkt (p1 + v1 , p2 + v2 ) zuordnet (Fig. 1). Die Verschiebung wird durch einen Verschiebungspfeil oder Vektorpfeil dargestellt. Die L¨ange des Ver schiebungspfeils ist v12 + v22 , also der Betrag |v | des Vektors v bez¨ uglich des 2 Standardskalarprodukts in IR . Ist α der Winkel zwischen der Verschiebung v und der x1 -Achse (Fig. 2), dann ist v1 = |v | cos α und v2 = |v | sin α. Gilt f¨ ur einen weiteren Vektor w entsprechend w1 = |v | cos β und w2 = |v | sin β, dann gilt f¨ ur das Standardskalarprodukt (v ; w) = |v ||w|(cos α cos β + sin α sin β). Aufgrund des Additionstheorems der Kosinusfunktion ist also (v ; w) = |v ||w| cos(α − β). Genau dann ist (v ; w) = 0 f¨ ur v , w = o, wenn cos(α − β) = 0, also α − β = ±90o , wenn die beiden Verschiebungsvektoren also orthogonal zueinander sind. x2 ... ..6 (p1 + v1 , p2 + v2 ) ... ...........t ... .............. ... 2 2 .......... . .. v1 + v2........ .. .. v ........v .... . . . . . . .. 2 . . ..... ... . . . . . . . . . .. ...t............ .... .... .... .... .... .... .... .... .. ... v1 ... (p1 , p2 ) ... . ..........................................................................................................x.. 1 .. Fig. 1: L¨ange einer Verschiebung
x2 ... ..6 ... . .... ............ ... ... .... ... v... .. .. ......... .... ..... ... w ......................... . . ... ... .... ........ .............................. .. .... .. .. ...α ................. .... . . . . . . . . ... ........................... ............... β.... ....... .... .... .... ........ ..... . ... .. . ..........................................................................................................x.. 1 .. Fig. 2: Winkel zwischen Verschiebungen
Ist ϕ der Winkel zwischen den Verschiebungen v und w, dann folgt aus obiger Darstellung des Skalarprodukts 2 − 2(v ; w) = |v |2 + |w| 2 − 2|v ||w| cos ϕ. |v − w| 2 = |v |2 + |w| Dies ist der bekannte Kosinussatz aus der Trigonometrie. Bez¨ uglich eines kartesischen Koordinatensystems im Raum hat ein Verschie bungsvektor v ∈ IR3 die L¨ange |v | = v12 + v22 + v32 (Fig. 3). F¨ ur den Winkel ϕ zwischen zwei Verschiebungsvektoren v , w gilt aufgrund des Kosinussatzes |v − w| 2 = |v |2 + |w| 2 − 2|v ||w| cos ϕ (Fig. 4), wegen |v − w| 2 = |v |2 + |w| 2 − 2(v ; w) also wie in der Ebene (v ; w) = |v ||w| cos ϕ.
III Das Skalarprodukt
74
v12 + v22 .. .... .... .... ................................. x3 .. @ ..6 . .... ..... ..... .. . ........... . .......... .. . ... @ .. . . . R @ . . . . . . . .. ... ................... . . .... .. .. ................... .... ...... .... .... ... .......... .. . ....... .. .. .... .. ... ... ... .... . . . v . .. ...... .. .. .... .. ... .... .. .. .. .... . . .. .... .. .. ....v3 .. . . .. . .... .. .... . . . .. ..... .......... .... ..... .... .... .... ..... . . . . .. . ................................................................................................................x ...2 . . . . . . . . . . . . . . . . . . . . . . . . . . . ....... . .. ... .... ............. .... .... .... .... ...... .... . . . x1. ... Fig. 3: L¨ ange einer Verschiebung
x3
6
.............. .............................. . . . . . . . . . . . .. v.................... .... . . . . . . . . . . . . . . ... ... ................ .................ϕ ... . . . ....... . .. ......... ... ...... ..... v − w . . . . . . w ...... . ...... ... ...... ..... .......... ... ........
x2 -
x1 Fig. 4: Zum Kosinussatz
Im Folgenden verstehen wir wie schon in I.5 f¨ ur n = 2, 3 die Menge IRn einerseits als Menge aller Punkte und andererseits als den IR-Vektorrraum der Verschiebungen der Ebene bzw. des Raums. Diese beiden Bedeutungen von Zahlenpaaren bzw. Zahlentripeln sind u ¨ber den Begriff des Ortsvektors miteinander verbunden: −→ Der Punkt P ist festgelegt durch seinen Ortsvektor p =OP , der Vektor a ist −→ festgelegt durch den Punkt A mit OA= a. Definition 1: Es sei a + U eine k-dimensionale lineare Mannigfaltigkeit aus IRn mit 1 ≤ k ≤ n − 1. Dann nennt man b + U⊥ die Lotmannigfaltigkeit zu a + U durch den Punkt B mit dem Ortsvektor b. Beispiel 1: F¨ ur n = 2 (also in der Ebene) kann man zu einer Geraden die Lotgerade durch einen gegebenen Punkt betrachten und z.B. den Lotfußpunkt berechnen: Die Lotgerade zu a + u mit u = o durch den Punkt mit dem Ortsvektor b ist b + v mit v ⊥ u. Zur Berechnung des Lotfußpunkts l¨ost man die Gleichung a + ru = b + sv , welche eindeutig l¨osbar ist, weil {u, v } linear unabh¨angig ist. Beispiel 2: F¨ ur n = 3 (also im Raum) kann man zu einer Ebene die Lotgerade durch einen gegebenen Punkt betrachten und z.B. den Lotfußpunkt berechnen: Die Lotgerade zu a + u, v ({u, v } linear unabh¨angig) durch den Punkt mit dem Ortsvektor b ist b + w mit w ∈ u, v ⊥ . Zur Berechnung des Lotfußpunkts l¨ost man die Gleichung a + ru + sv = b + tw, welche eindeutig l¨osbar ist, weil {u, v , w} linear unabh¨angig ist. Beispiel 3: F¨ ur n = 3 (also im Raum) kann man zu einer Geraden die Lotebene durch einen gegebenen Punkt betrachten und z.B. den Schnittpunkt von Gerade und Lotebene berechnen: Die Lotebene zu a + u ({u = o}) durch den Punkt mit dem Ortsvektor b ist b + v , w, wobei v , w ∈ u⊥ und {u, v } linear unabh¨angig ist. Zur Berechnung des Lotfußpunkts l¨ost man die Gleichung a +ru = b+sv +tw, welche eindeutig l¨osbar ist, weil {u, v , w} linear unabh¨angig ist.
III.3 Anwendungen in der Geometrie
75
Es sei U ein echter Unterraum von IRn und {b1 , b2 , . . . , bk } eine Basis des Lotraums U⊥ . F¨ ur alle x ∈ a + U gilt dann (x − a; bi ) = 0 f¨ ur i = 1, 2, . . . , k. Dies ist ein LGS mit k Gleichungen f¨ ur die n Variablen x1 , x2 , . . . , xn . Die lineare Mannigfaltigkeit a + U kann also als L¨osungsmannigfaltigkeit eines LGS gedeutet werden, wie wir schon fr¨ uher gesehen haben. Im Fall n = 2 (also in der Ebene) hat die Gerade a + u die Gleichung (x − a; n) = 0 mit n ⊥ u, n = o. Im Fall n = 3 (also im Raum) hat die Ebene a + u, v ebenfalls die Gleichung (x − a; n) = 0 mit n ⊥ u, n ⊥ v , n = o. Man nennt n einen Normalenvektor von u bzw. von u, v und diese Gleichung eine Normalengleichung der Geraden bzw. der Ebene. Hat der Normalenvektor dabei den Betrag 1, dann spricht man von der hesseschen Normalenform der Geraden- bzw. der Ebenengleichung (nach Ludwig Otto Hesse, 1811–1874). Ist eine Gerade in der Ebene zun¨achst durch die Gleichung a1 x1 + a2 x2 = b bzw. a1 x1 + a2 x2 − b = 0 gegeben, dann lautet ihre Gleichung in der hesseschen Normalenform a1 a2 b x1 + x2 − = 0. 2 2 2 2 2 a1 + a2 a1 + a2 a1 + a22 Entsprechend lautet die a1 x1 + a2 x2 + a3 x3 = b
a21
a1 +
a22
+
a23
hessesche
Normalenform
der
Ebenengleichung
a2 a3 b x1 + x2 + x3 − = 0. 2 2 2 2 2 2 2 a1 + a2 + a3 a1 + a2 + a3 a1 + a22 + a23
Satz 1: Ist (x − a; n) = 0 die hessesche Normalenform einer Geraden- oder einer Ebenengleichung, dann hat der Punkt mit dem Ortsvektor p von der Geraden bzw. von der Ebene den Abstand d = |(p − a; n)|. Beweis (vgl. Fig. 5): Ist d der gesuchte Abstand, dann ist p −a ±dn orthogonal zu n, es ist also 0 = (p − a ± dn; n) = (p − a; n) ± d(n; n) = (p − a; n) ± d, wobei das Vorzeichen von d von der Richtung von n abh¨angt. 2
p − a
tP CO n C d C C......q.... ................. ............ ................C..
........... .................. . . . . . t . . . . . . . . . . . . ................ A
Fig. 5: Abstandsberechnung
III Das Skalarprodukt
76
Setzt man also in der hesseschen Normalenform die Koordinaten eines Punktes ein, der nicht zur Geraden bzw. zur Ebene geh¨ort, dann ergibt sich auf der rechten Seite nicht 0, sondern der Abstand (positiv oder negativ) dieses Punktes von der Geraden bzw. der Ebene. Eine Gerade in der Ebene mit der Steigung m und dem x2 -Achsenabschnitt c hat c die Gleichung x2 = mx1 + c. Ihr Abstand von O ist ± √ . Diese Gerade ist 2 1+m
also genau dann eine Tangente an den Kreis um O mit dem Radius r, wenn r diesen Wert hat, wenn also die Gleichung c2 = r2 (1 + m2 ) gilt. Diese Gleichung heißt Tangentenbedingung (f¨ ur eine Gerade und einen Ursprungskreis). Bei der allgemeiner Geradengleichung a1 x1 + a2 x2 − c = 0 lautet diese Tangentenbedingung c2 = r2 (a21 + a22 ). Entsprechend ist c2 = r2 (a21 + a22 + a23 ) die Bedingung daf¨ ur, dass die Ebene mit der Gleichung a1 x1 + a2 x2 + a3 x3 − c = 0 die Kugel um O mit dem Radius r ber¨ uhrt. Im Folgenden wollen wir das Skalarprodukt eines Vektors mit sich selbst als Quadrat schreiben, also x 2 = (x; x) = |x|2 . Es soll also vor¨ ubergehend x 2 dasselbe T bedeuten wie x x. Die Gleichung
(x − m) 2 = r2
ist in der Ebene die Gleichung eines Kreises und im Raum die Gleichung einer Kugel mit dem Mittelpunkt M (Ortsvektor m) und dem Radius r. Satz 2: Die Tangente bzw. die Tangentialebene an einen Kreis bzw. an eine Kugel um M (Ortsvektor m) mit dem Radius r im Punkt P (Ortsvektor p) hat die Gleichung ..... (x − m; p − m) = r2 . ..... ..... X .....t ..... Beweis (vgl. Fig. 6): F¨ ur den Ortsvektor x ei..... nes Punktes der Tangente bzw. der Tangen...................................... . . . . . . . .. P ... tialebene im Punkt P gilt (x − p; p − m) = 0. .... q..........t.. .... ... . . . . .. . ............ Dies ist bereits eine Gleichung f¨ ur die Tan... .... .. ..... . . . . ... ...... . gente bzw. die Tangentialebene, man formt . ..... .t.... .... ... .. sie aber in der Regel noch mit Hilfe der Kreis. M ... . ... bzw. Kugelgleichung um: ... .... . . .. ...... ..... ......... ............................. 0 = ((x − m) − (p − m); p − m) = (x − m; p − m) − (p − m) 2 = (x − m; p − m) − r2
2
Fig. 6: Tangente an Kreis
III.3 Anwendungen in der Geometrie
77
Liegt der Punkt P außerhalb des Kreises um M mit dem Radius r, ist also |p − m| > r, dann gibt es zwei Kreistangenten durch P (Fig. 7). F¨ ur deren 2 Ber¨ uhrpunkte bzw. ihre Ortsvektoren b1 und b2 gilt (bi − m; p − m) = r (i = 1, 2), sie liegen also auf der Geraden mit der Gleichung (x − m; p − m) = r2 . Liegt der Punkt P außerhalb der Kugel um M mit dem Radius r, ist also |p − m| > r, dann bilden die Kugeltangenten durch P den Tangentialkegel mit der Spitze P (Fig. 8). F¨ ur die Ber¨ uhrpunkte bzw. ihre Ortsvektoren b gilt 2 (b − m; p − m) = r , sie liegen also in der Ebene mit der Gleichung (x − m; p − m) = r2 . ... .. .........................u ..... ......... ................................................... ..... ..................u............ ... .... . ..... ... ... ..... ........ . ... ... ....... P . . . . . . .... . p .... .. .... ... ... .. ............ ... . ... ......... .... .. .u... ....... ................................. . .... .... ....... ...... Fig. 7: Pol und Polare
....... ....... ..... . . . . . ... . ....... p .... ......... ... ...................... . . . . . . . . . . . . . . . . . . . . . . . ....... . .. ........... ... ....................................................................................................................................................u................................. ... ... .. ................................. .... . ... .. .. .. .. ................... ........ ..... P ... ............................................ ................................. ... .. ........... .. ........ .................. .. ........... . . ........ ... ..... ........................ ............... ..... ....... . ... .... ..... ......... .................................................. .. . ...... ....... ....... ........
Fig. 8: Pol und Polarebene
Definition 2: Es sei ein Kreis bzw. eine Kugel mit der Gleichung (x − m) 2 = r2 gegeben. Es sei P ein Punkt mit dem Ortsvektor p und p die Gerade bzw. die Ebene mit der Gleichung (x − m; p − m) = r2 . Dann heißt p die Polare bzw. die Polarebene zu P und P der Pol zu p. Liegt dabei P außerhalb des Kreises bzw. der Kugel, dann schneidet p den Kreis bzw. die Kugel. Liegt P auf dem Kreis bzw. der Kugel, dann ist p die Tangente bzw. die Tangentialebene in P . Liegt P innerhalb des Kreises oder der Kugel, dann verl¨auft p ganz außerhalb des Kreises bzw. der Kugel. Ist P = M , dann existiert p nicht, weil (x − m; o) = 0 = r2 ist. Satz 3 (Fig 9): Es sei ein Kreis bzw. eine Kugel gegeben. Liegt der Punkt Q auf der Polaren bzw. Polarebene p von P , dann liegt der Punkt P auf der Polaren bzw. Polarebene q von Q. Geht die Gerade bzw. die Ebene q durch den Pol P von p, dann geht die Gerade p durch den Pol Q von q. Beweis: Aus der Polarengleichung folgt, dass alle Voraussetzungen und Behauptungen im Satz dasselbe bedeuten, n¨amlich (p − m; q − m) = r2 . 2
III Das Skalarprodukt
78
.... ... .... .... .... p ... ....... .. ... ............ .......................... . . . . ... . .. ..............q.................. .. . . . ..... . . . . . . . . . . . . r.... .... ... ............. .... . . . ... . . . . ... .. ... . .................................t....................t...q...........................................t........... . . ... M P .... ... ........ .... P ... ... . . . . .... ... ....... ..... ... ......... ........ ... ............................ ... .. .. ... . . . .. .. p ....
.... ...Q. .....u.. . . .. ............................ .. .......................................................................... .. .. .. .... ................................................... .. .. ...... .... . . . . . . . . . ... . ........u.................. ... ...... .... .. q ....... ... ... .... ... . . . . ... P . . . . . . . . . . . . . . . . . . p ... . ...... ... .... ... .. ..... .... ... .... ... ....... ... .... ..... ...... ........ . .... . . . ....................... .... . . . . .. .. .. ... Fig. 9: Pol-Polare-Beziehung
Fig. 10: Lagebeziehung von Pol und Polare
Unmittelbar aus dem Kathetensatz ergibt sich eine interessante Lagebeziehung zwischen Pol und Polare bzw. Polarebene (Fig. 10): Ist p die Polare oder die Polarebene zu P bez¨ uglich eines Kreises bzw. einer Kugel und ist P der Schnittpunkt von p mit der Geraden durch M und P , dann gilt M P · M P = r2 .
Aufgaben 1. Zwei Geraden im Raum heißen windschief, wenn sie nicht parallel sind und
sich nicht schneiden. Man zeige: Sind p + u und q + v zwei windschiefe Geraden, dann ist ihr Abstand d = |(q − p; n)|, wobei n ∈ u, v ⊥ und |n| = 1.
2. Unter welcher Bedingung ist x21 + x22 + x33 + a1 x + a2 x + a3 x + c = 0 die Gleichung einer Kugel ?
3. Man zeige, dass A
2 1 2 , , 3 3 3
und B
3 6 2 , , 7 7 7
auf der Einheitskugel liegen
und berechne die L¨ange des (k¨ urzeren) Großkreisbogens durch A und B.
4. Welcher Kreis mit dem Mittelpunkt M (15, 5) ber¨uhrt die Gerade mit der Gleichung 7x1 + 24x2 = 100 ?
5. Man bestimme die Steigungen der vier gemeinsamen Tangenten der Kreise mit den Gleichungen x2 = 4 und x −
6 9
2
= 9.
6. Die Ebene mit der Gleichung 4x1 + 7x2 + 4x3 = 20 schneidet die Kugel mit dem Mittelpunkt M (5, 2, 1) und dem Radius 7 in einem Kreis. Man bestimme den Mittelpunkt M und den Radius r des Schnittkreises.
7. Es sei k1 die Kugel um M1 (−1, 3, 1) mit dem Radius r1 = 6, ferner k2 die Kugel um M2 (3, 9, 7) mit dem Radius r2 = 5. In welcher Ebene liegt der Schnittkreis der Kugeln? Welchen Radius hat er?
III.3 Anwendungen in der Geometrie
79
8. Wie bestimmt man die gemeinsamen Tangentialebenen von drei Kugeln? 9. Es seien p, q die Polaren zu den Punkten P, Q bez¨uglich eines Kreises. Man zeige: Liegt der Punkt R auf der Geraden durch P und Q, dann geht die Polare r zu R durch den Schnittpunkt von p und q.
10. Legt man von einem Punkt der Schnittkreisebene zweier sich schneidender Kugeln jeweils eine Tangente an jede der Kugeln, dann sind die Tangentenabschnitte gleich lang. Man beweise dies.
11. Man zeige, dass f¨ur je zwei Kreise mit verschiedenen Mittelpunkten M1 und M2 die Punkte, von denen aus die Tangentenabschnitte an die beiden Kreise gleich lang sind, auf einer zu M1 M2 orthogonalen Geraden liegen (Fig. 11).
12. Die Tangenten von einem Punkt P aus an eine Kugel um M mit dem Radius r bilden den Tangentialkegel mit der Spitze P an die Kugel, falls P außerhalb der Kugel liegt. Der Ber¨ uhrkreis liegt in der Polarebene zum Pol P . a) Wie bestimmt man den Mittelpunkt M und des Radius r des Ber¨ uhrkreises, wenn man die Spitze P des Tangentialkegels kennt? b) Wie bestimmt man die Spitze P des Tangentialkegels, wenn man den Mittelpunkt M des Ber¨ uhrkreises kennt? c) Wie bestimmt man die Spitze P des Tangentialkegels, wenn man den Radius r und die Ebene des Ber¨ uhrkreises kennt? d) Unter welcher Bedingung haben zwei Kugeln keinen, genau einen oder genau zwei gemeinsame Tangentialkegel? Wie bestimmt man die Kegelspitzen? (Man betrachte zun¨achst ein Schnittbild.)
... ...uX . . ............... . . . . . . . . . . . ..... .. ......... ..... .................. . . . . . . ....... ... . ...... ... ................. ....... ..... ... ........ .................. ......u.................... . . . . . . . ..... ... .... ......u..... ........... . .. .. ... .. ..........r..... ..... ......... .... ........ ...... ....r2 .... . . . . . .. . ... .. 1 ....u... . ... ... .... . . .. . . . .. .. .. ....u ... .... M1 .......u .... .......u.... .. M2 ... ........ ....... .. ....... ... .......... ... ..... .......... ............. .. ........... ... .. Fig. 11: Zu Aufgabe 11
P ....v . .. ...... . . ... .. ... ... ... .... . . ... . .. ... .... ..... . . .. .... ... ... .. ... . . . . ... ... ..................... . .. . . . . . . . . . . . . . . . . . . . . ........... ..... .......... . . . . ..... .. . . .... ...... ...M .... .. ....v....... .. ..r.. . . v . . . . . . .. .... .. .. ... .. .. .. .. .... . . . . . . . . . ..............v r ..... .. d .. .. . . . . ... . . . . . v . ........ .. .. .. .... ....... ... . M . .. ... .. .... ... . . .... ... . ...... ..... . ........ . . . . . .............................. Fig. 12: Tangentialkegel
III Das Skalarprodukt
80
III.4 Vektorprodukt und Spatprodukt M¨ochte man die Ebene p + a, b aus IR3 als L¨osungsmenge eines LGS uT x = c schreiben, dann ben¨otigt man dazu einen Vektor u ∈ a, b⊥ . Im Vektorraum IR3 kann man also nach einem Vektor x fragen, der zu zwei gegebenen linear unabh¨angigen Vektoren a, b bez¨ uglich des Standardskalarprodukts orthogonal ist.
Es muss dann das homogene LGS a1 x1 + a2 x2 = −a3 x3 | · b2 b1 x1 + b2 x2 = −b3 x3 | · (−a2 ) (a1 b2 − a2 b1 )x1 = (a2 b3 − a3 b2 )x3
a1 x1 + a2 x2 + a3 x3 b1 x1 + b2 x2 + b3 x3
+
= =
0 0
gel¨ost werden:
a1 x1 + a2 x2 = −a3 x3 | · (−b1 ) b1 x1 + b2 x2 = −b3 x3 | · a1
+
(a1 b2 − a2 b1 )x2 = (a3 b1 − a1 b3 )x3
Eine L¨osung ist (x1 , x2 , x3 ) = (a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 ). ⎛
⎞ ⎛ ⎞ a1 b1 ⎝ ⎠ ⎝ Definition 1: F¨ ur a = a2 , b = b2 ⎠ ∈ IR3 nennt man den Vektor a3 b3 ⎛ ⎞ ⎛ ⎞ ⎞ ⎛
a2 b3 − a3 b2
⎜ ⎟ ⎝ a3 b1 − a1 b3 ⎠
a1 b2 − a2 b1
das Vektorprodukt oder das ¨außere Produkt von a und b. Man schreibt daf¨ ur a × b (lies a kreuz b“). ”
a1
⎜ ⎟ ⎜ ⎝ a2 ⎠H ⎝ HH a3 H ⎞ ⎛ HH⎛ a1 H ⎟ H⎜ ⎜ ⎝ a2 ⎠ H⎝
a3
b1 b2 b3 b1 b2 b3
⎟ ⎠
⎞ ⎟ ⎠
⎛
⎞
x1 + − ⎟ ⎜ ⎝ x2 ⎠ H HH x3
Fig. 1: Vektorprodukt
Zur Berechnung des Vektorprodukts kann man das Schema in Fig. 1 benutzen. ur Vektoren Das Vektorprodukt ist nur f¨ ur Vektoren aus IR3 definiert, nicht f¨ 2 4 5 aus IR oder IR , IR , . . . Das Vektorprodukt ist wieder ein Vektor; darin unterscheidet es sich wesentlich vom Skalarprodukt. Das Vektorprodukt hat folgende Eigenschaften, welche leicht nachzurechnen sind: (1) Genau dann ist a × b = o, wenn {a, b} linear abh¨angig ist. (2) b × a = −a × b f¨ ur alle a, b ∈ IR3 . (3) a × (b + c) = (a × b) + (a × c) f¨ ur alle a, b, c ∈ IR3 . (4) a × (rb) = r(a × b) f¨ ur alle a, b ∈ IR3 und alle r ∈ IR. (5) (a × b; a) = 0 und (a × b; b) = 0 f¨ ur alle a, b ∈ IR3 . Das Vektorprodukt ist nicht kommutativ, stattdessen gilt Regel (2). Es gilt auch nicht das Assoziativgesetz, i. Allg. ist a × (b × c) = (a × b) × c.
III.4 Vektorprodukt und Spatprodukt
81
Satz 1: Schließen a, b ∈ IR3 den Winkel ϕ (0o ≤ ϕ ≤ 180o ) ein, dann gilt: |a × b| =
(a; a)(b; b) − (a; b)2 = |a| · |b| · sin ϕ
Beweis: Es gilt (a × b; a × b) = (a2 b3 − a3 b2 )2 + (a1 b3 − a3 b1 )2 + (a1 b2 − a2 b1 )2 = (a21 + a22 + a23 )(b21 + b22 + b23 ) − (a1 b1 + a2 b2 + a3 b3 )2 = (a, a)(b, b) − (a, b)2 = |a|2 · |b|2 · (1 − cos2 ϕ) = |a|2 · |b|2 · sin2 ϕ Wegen |a × b | = |a | · |b | · sin < ) (a, b) ist |a × b | der Fl¨acheninhalt des von a und b aufgespannten Parallelogramms (Fig. 2). Sind die Vektoren a, b, c paarweise orthogonal, dann ist |(a × b; c)| = |a| · |b| · |c|. Dies ist das Volumen des von a, b, c aufgespannten Quaders. Satz 2: Der von den Vektoren a, b, c im Raum aufgespannte Spat (Fig. 3) hat das Volumen V = |(a × b; c) |. Beweis: Ist ϕ der Winkel zwischen a × b und c, dann hat der Spat den Grundfl¨acheninhalt |a × b | und die H¨ohe ||c | · cos ϕ|. Es ist also
2
C C b C |b| · sin ϕ C C : C ϕ C a
Fig. 2: Zum Vektorprodukt
a × b 6
c h 3 ϕ b -
a
V = |a × b | · |c | · | cos ϕ| = |(a × b; c) |. 2
Fig. 3: Zum Spatprodukt
Definition 2: F¨ ur drei Vektoren a, b, c ∈ IR3 nennt man die Zahl (a × b; c) das Spatprodukt dieser Vektoren. Genau dann ist (a × b; c) = 0, wenn {a, b, c} linear abh¨angig ist. Satz 3: Bei Vertauschung der Vektoren a¨ndert ein Spatprodukt h¨ochstens sein Vorzeichen, nicht aber seinen Betrag. F¨ ur alle a, b, c ∈ IR3 gilt (a ×b; c) = (b × c; a) = (c × a; b). Bei zyklischer Vertauschung der Vektoren ¨andert sich also das Vorzeichen nicht. Bei jeder anderen Vertauschung ¨andert der Term sein Vorzeichen.
III Das Skalarprodukt
82
Beweis: Die Aussage des Satzes best¨atigt man sofort an dem Term (a × b; c) = a1 b2 c3 + a2 b3 c1 + a3 b1 c2 − a3 b2 c1 − a1 b3 c2 − a2 b1 c3 .
2
Man schreibt diesen Term aus Satz 3 f¨ ur das Vektorprodukt auch in der Form a 1 a2 a3
b1 c1 b2 c2 b3 c 3
⎛
⎞
a1 b1 c1 ⎟ oder det ⎜ a, b, c) ⎝ a2 b2 c2 ⎠ = det ( a3 b3 c3
und nennt ihn die Determinante der Vektoren a, b, c. (Mit Determinanten besch¨aftigen wir uns allgemeiner in Kapitel IV.) Zur Berechnung obiger Determinante dient das Schema in Fig. 4 (Regel von Sarrus, nach P. F. Sarrus, 1798–1861). Determinanten kann man zum L¨osen eines LGS mit drei Variablen und drei Gleichungen verwenden: Das LGS
@ @ @ @ @ a@ @ c @ a b1 1 @ 1 @ b1 @ 1 @ @ @ @ a2@ b2@ c2@ a@ b2 2 @ @ @ @ @ @ @ a3 b@ 3 @ c 3 @ a3 @ b 3 @ @ @ @ @ − @ +@ +@+ − − @ @ @
a1 x1 + b1 x2 + c1 x3 = d1 a2 x1 + b2 x2 + c2 x3 = d2 a3 x1 + b3 x2 + c3 x3 = d3
Fig. 4: Regel von Sarrus
⎛
⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ a1 b1 c1 d1 kann man mit a = ⎝ a2 ⎠, b = ⎝ b2 ⎠, c = ⎝ c2 ⎠, d = ⎝ d2 ⎠ in der Form a3 b3 c3 d3
x1a + x2b + x3c = d schreiben. Das LGS und damit diese Vektorgleichung sind eindeutig l¨osbar, wenn {a, b, c} linear unabh¨angig ist, wenn also (a × b; c) = 0 gilt. Bildet man in der Vektorgleichung der Reihe nach das Skalarprodukt mit b × c, c × a, a × b, dann ergeben sich die Gleichungen x1 · (b × c; a) = (b × c; d), x2 · (c × a; b) = (c × a; d), x3 · (a × b; c) = (a × b; d). Wegen der zyklischen Vertauschbarkeit der Vektoren im Spatprodukt folgt x1 =
(d × b; c) (a × b; c)
x2 =
(a × d; c) (a × b; c)
x3 =
(a × b; d) . (a × b; c)
Schreibt man die Spatprodukte als Determinanten, so ergibt sich die u ¨bliche Form der cramerschen Regel (nach Gabriel Cramer, 1704–1752):
III.4 Vektorprodukt und Spatprodukt
83
Satz 4: Ist {a, b, c} linear unabh¨angig, dann ist das LGS x1a + x2b + x3c = d eindeutig l¨osbar und die L¨osung lautet x1 =
det(d, b, c) , det(a, b, c)
x2 =
det(a, d, c) , det(a, b, c)
x3 =
det(a, b, d) . det(a, b, c)
Ist c1 = c2 = a3 = b3 = d3 = 0 und c3 = 1, so ergibt sich die cramersche Regel f¨ ur ein lineares Gleichungssystem mit zwei Gleichungen und zwei Variablen: Ist a1 x1 + b1 x1 = d1 a1 b2 − a2 b1 = 0, dann ist eindeutig l¨osbar und hat die a2 x1 + b2 x2 = d2 L¨osung d b a d 1 1 1 1 a b d2 b 2 a2 d2 1 , x2 = mit 1 = a1 b2 − a2 b1 usw. x1 = a b a2 b 2 a1 b 1 1 1 a2 b 2 a2 b2 Die folgenden Eigenschaften der Determinante ergeben sich aus ihrer Darstellung als Spatprodukt (Aufgabe 4): uglich a2 , a3 (λ ∈ IR); (1) det(λ a1 , a2 , a3 ) = λ det(a1 , a2 , a3 ) und ebenso bez¨ ersetzt man also eine Spalte durch das λ-fache, dann ¨andert sich auch die Determinante um das λ-fache. (2) det (a1 + a2 , a2 , a3 ) = det (a1 , a2 , a3 ) usw.; die Determinante ¨andert sich also nicht, wenn man eine Spalte zu einer anderen addiert. (3) det (s1 , s2 , s3 ) = 1 f¨ ur die Standardbasis {s1 , s2 , s3 }. Aus diesen Eigenschaften oder direkt aus der Darstellung als Spatprodukt gewinnt man noch die folgenden Eigenschaften: (4) Genau dann ist det (a1 , a2 , a3 ) = 0, wenn {a1 , a2 , a3 } linear abh¨angig ist. (5) det (u + v , a2 , a3 ) = det (u, a2 , a3 ) + det (v , a2 , a3 ) usw. (6) Die Determinante ¨andert ihren Wert nicht, wenn man zu einer Spalte eine Linearkombination der anderen Spalten addiert. ⎛
a11 Berechnet man die Determinante von A = ⎝ a21 a31 Sarrus (Fig. 4), dann ergibt sich
a12 a22 a32
⎞ a13 a23 ⎠ nach der Regel von a33
detA = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a11 a23 a32 − a12 a21 a33 . Die Summanden sind von der Form (−1)σ a1i a2j a3k , wobei σ = 1, falls das Tripel (i, j, k) durch eine gerade Anzahl von Nachbar-Vertauschungen (Transpositionen) aus (1, 2, 3) hervorgeht, andernfalls σ = −1. Hieran erkennt man u.a., dass det AT = det A. (Vgl. hierzu IV.3.)
III Das Skalarprodukt
84
Aufgaben 1. Ein Dreieck auf einer Kugel heißt
....................... ................................C........................... . . . . . . ......t....... ... .... ...............t....... ............ .................. ........... ............... ....... . . . . ... .. ......... ...A ... ..... ........t....B.. .. ............ ... ...... .. ...... ...... . ... .. ... ... ... ... ...... .. ...... . .... .. ...... .... . ...... ....... ......t ....... ......... . ..... . ...... O ........ . . .. ..... ... ... . ... . . . . . . . . . . ... ... . ..... .. ... ....... ... ..... .. ... ..... . ..... .... ....... . . . . ..... ............. ...... .......... ..................... ........ .................................................... .............. ..........................................
ein sph¨arisches Dreieck (Fig. 5). Seine Seiten sind Großkreisb¨ogen, liegen also auf einem Kreis, der von einer Ebene durch den Mittelpunkt aus der Kugel ausgeschnitten wird. Die Winkel in einem solchen Dreieck sind die Winkel zwischen den Normalenvektoren der Großkreisebenen, in Fig. 5: Sph¨ arisches Dreieck denen die Seiten liegen. Sind a, b, c die Ortsvektoren eines sph¨arischen Dreiecks ABC, dann ist der Winkel α bei A der Winkel, den die Normalenvektoren der Ebenen durch O, A, B und durch O, A, C einschließen. Wie berechnet man diesen Winkel?
2. a) Man zeige, dass (a × b) × c eine Linearkombination von a und b ist. als Linearkombination von a, b und als b) Man stelle (a × b) × (c × d) Linearkombination von c, d dar und leite daraus die L¨osungsformel f¨ ur ein 3,3-LGS her.
3. Man berechne das Volumen der Dreieckspyramide mit den Ecken A(1, 1, 0), B(2, −4, 5), C(−2, 1, 4), D(3, 1, 2). Man beachte dabei, dass ein Spat in sechs volumengleiche Dreieckspyramiden zerlegt werden kann.
4. Man beweise die angegebenen Determinanteneigenschaften (1) bis (6). a b = ad − bc. Man zeige, dass c d ⎞ a13 a22 a23 a12 a23 ⎠ = a11 det − a21 det a32 a33 a32 a33
5. a) Es sei det ⎛
a11 ⎝ a21 a31
a12 a22 a32
a13 a33
+ a31 det
a12 a22
a13 . a23
b) Man pr¨ Determinante, f¨ ur welche Werte von a die ⎛ufe mit ⎞ ⎛Hilfe ⎞ einer ⎛ ⎞ 1
4
2
a2
a
a
Vektoren ⎝ a ⎠ , ⎝ 1 ⎠ , ⎝ 7 ⎠ linear unabh¨angig sind. c) Unter welcher Voraussetzung u ¨ber a, b, c hat das folgende homogene LGS nur die triviale L¨osung? x1 + ax2 + a2 x3 = 0 x1 + bx2 + b2 x3 = 0 x1 + cx2 + c2 x3 = 0
IV Determinanten IV.1 Die Determinante einer Matrix Definition 1: Es sei det eine Funktion auf der Menge aller n-Tupel von Vektoren aus K n mit Werten in K (also det: (K n )n −→ K) mit folgenden Eigenschaften: (1) det (a1 , a2 , . . . , an ) geht u ¨ber in r det (a1 , a2 , . . . , an ), wenn ein Vektor ai ersetzt wird durch rai (r ∈ K); (2) det (a1 , a2 , . . . , an ) ¨andert sich nicht, wenn ein Vektor ai ersetzt wird durch ai + ak mit k = i; (3) det (e1 , e2 , . . . , en ) = 1 ({e1 , e2 , . . . , en } Standardbasis von K n ). Dann nennt man det (a1 , a2 , . . . , an ) eine Determinante von (a1 , a2 , . . . , an ). Aus (1) und (2) ergeben sich unmittelbar weitere Eigenschaften der Determinante: (4) det(a1 , a2 , . . . , an ) a¨ndert sich nicht nicht, wenn man zu einem der Vektoren eine Linearkombination der anderen addiert; (5) det (a1 , a2 , . . . , an ) = 0, wenn einer der Vektoren der Nullvektor ist. (6) det (a1 , a2 , . . . , an ) = 0, wenn {a1 , a2 , . . . , an } linear abh¨angig ist. Wir werden sp¨ater sehen, dass eine Funktion det: (K n )n −→ K mit den Eigenschaften (1) bis (3) existiert und durch (1) bis (3) eindeutig bestimmt ist. Zun¨achst wollen wir aber noch weitere Folgerungen aus (1) bis (3) ziehen. Satz 1: Vertauscht man in det (a1 , a2 , . . . , an ) zwei Vektoren, dann ¨andert sich das Vorzeichen der Determinante. Beweis: Die Vertauschung von ai und ak mit i = k kann man in folgenden Schritten vornehmen: ai zu ak addieren; an der k-ten Stelle steht jetzt ak + ai ; ak + ai von ai subtrahieren; an der i-ten Stelle steht jetzt −ak ; ai von ak + ai subtrahieren; an der k-ten Stelle steht jetzt ai . Jetzt sind ai und ak vertauscht und auf der i-ten Stelle ist ein Minuszeichen aufgetaucht. 2 Satz 2 (Additionstheorem): Ersetzt man einen der Vektoren in det (a1 , a2 , . . . , an ) durch eine Linearkombination beliebiger Vektoren aus K n , dann ergibt sich die entsprechende Summe von Determinanten: det (a1 , . . . , ai−1 , m j=1
m j=1
rjbj , ai+1 , . . . an ) =
rj det (a1 , . . . , ai−1 , bj , ai+1 , . . . an )
IV Determinanten
86 Beweis: Es gen¨ ugt der Nachweis, dass f¨ ur alle v , w ∈ K n gilt:
det (v + w, a2 , . . . , an ) = det (v , a2 , . . . , an ) + det (w, a2 , . . . , an ) Wegen (6) kann man sich auf den Fall beschr¨anken, dass {a2 , a3 , . . . , an } linear unabh¨angig ist. Diese Menge erg¨anze man zu einer Basis {b, a2 , a3 , . . . , an } von K n . Dann ist v = rb + c und v = sb + d mit r, s ∈ K und c, d ∈ a2 , a3 , . . . , an . Wegen (4) gilt dann det (v , a2 , . . . , an ) = r det (b, a2 , . . . , an ), det (w, a2 , . . . , an ) = s det (b, a2 , . . . , an ) und det (v + w, a2 , . . . , an ) = (r + s) det(b, a2 , . . . , an ).
2
Satz 3: Ist det (a1 , a2 , . . . , an ) = 0 und {b1 , b2 , . . . , bn } ⊆ a1 , a2 , . . . , an , dann ist auch det (b1 , b2 , . . . , bn ) = 0. Beweis: Ersetzt man die bi durch Linearkombinationen aus {a1 , a2 , . . . , an }, dann ist nach Satz 2 die Determinante det (b1 , b2 , . . . , bn ) eine Summe von Determinanten, deren Spaltenvektoren aus {a1 , a2 , . . . , an } stammen. 2 Satz 4: Ist {a1 , a2 , . . . , an } linear unabh¨angig, dann ist det(a1 , a2 , . . . , an ) = 0. Beweis: Die Vektoren der Standarbasis lassen sich als Linearkombinationen der 2 Vektoren a1 , a2 , . . . , an schreiben. Aus (3) und Satz 3 folgt daher Satz 4. Eigenschaft (6) und Satz 4 besagen also zusammen, dass {a1 , a2 , . . . , an } genau dann linear unabh¨angig ist, wenn det (a1 , a2 , . . . , an ) = 0. Satz 5: Die Determinante (also die Abbildung det: (K n )n −→ K) ist durch die Eigenschaften (1), (2) und (3) eindeutig bestimmt. Beweis: Besitzen det1 und det2 beide die Eigenschaften (1) und (2), dann besitzt auch f = det1 − det2 die Eigenschaften (1) und (2). Nach (3) gilt f (e1 , e2 , . . . , en ) = 0. Nach Satz 3 ist also f (a1 , a2 , . . . , an ) = 0 f¨ ur alle a1 , a2 , . . . , an ∈ K n und daher ur alle a1 , a2 , . . . , an ∈ K n . det1 (a1 , a2 , . . . , an ) = det2 (a1 , a2 , . . . , an ) f¨
2
Die Existenz der Abbildung det: (K n )n −→ K mit (1), (2) und (3) ist nun leicht einzusehen, da man mit (1), (2) und (3) und den weiteren daraus hergeleiteten Eigenschaften den Wert von det (a1 , a2 , . . . , an ) f¨ ur alle a1 , a2 , . . . , an berechnen kann. Analog zu den elementaren Umformungen eines LGS kann man Umformungen mit den Vektoren der Determinante ausf¨ uhren, bei denen sich die Determinante nicht ¨andert oder nur ihr Vorzeichen wechselt. Diesen im Folgenden dargestellten Prozess benutzt man (in modifizierter Form) auch in der Praxis eher als die systematischen Verfahren zur Berechnung der Determinanten, die wir im n¨achsten Abschnitt vorstellen werden:
IV.1 Die Determinante einer Matrix
87
• Ist die 1. Koordinate des 1. Vektors 0, dann vertausche man ihn gegen einen Vektor, dessen 1. Koordinate nicht 0 ist, falls ein solcher existiert. Durch Subtraktion eines Vielfachen des 1. Vektors vom 2., 3., . . . n. Vektor erreicht man dann, dass diese die erste Koordinate 0 haben. • Ist die 2. Koordinate des 2. Vektors 0, dann vertausche man ihn gegen einen vom 1. verschiedenen Vektor, dessen 2. Koordinate nicht 0 ist, falls ein solcher existiert. Durch Subtraktion eines Vielfachen des 2. Vektors vom 3., 4.,. . . ,n. Vektor erreicht man dann, dass diese die 2. Koordinate 0 haben. • Ist die 3. Koordinate des 3. Vektors 0, dann vertausche man ihn gegen einen vom 1. und 2. verschiedenen Vektor, dessen 3. Koordinate nicht 0 ist, falls ein solcher existiert. Durch Subtraktion eines Vielfachen des 3. Vektors vom 4., 5.,. . . ,n. Vektor erreicht man dann, dass diese die 3. Koordinate 0 haben. • So fortfahrend erh¨alt man eine Determinante aus Vektoren, bei denen die ersten i − 1 Koordinaten des i. Vektors 0 sind; diese Determinante unterscheidet sich von der Ausgangsdeterminante wegen der Vertauschungen m¨oglicherweise durch das Vorzeichen. Ist die i. Koordinate des i. Vektors 0, dann sind die letzten n − i + 1 Vektoren linear abh¨angig und der Wert der Determinante ist 0. • Ist die i. Koordinate des i. Vektors von 0 verschieden, dann kann man durch Subtraktion eines Vielfachen des i. Vektors von allen vorangehenden erreichen, dass diese die i. Koordinate 0 haben (i = 2, 3, . . . n). Ist nun aii die i. Koordinate des i. Vektors (also seine einzige von 0 verschiedene Koordinate), dann hat die Determinante den Wert a11 a22 · . . . · ann · det (e1 , e2 , . . . , en ) = a11 a22 · . . . · ann . ⎛⎛
Beispiel 1: ⎛⎛
1
det⎝⎝ 0 0
⎞ ⎛ ⎞ ⎛ ⎞⎞ ⎛⎛ ⎞ ⎛ 1 5 2 1 0 det⎝⎝ 2 ⎠ , ⎝ 7 ⎠ , ⎝ 4 ⎠⎠= det⎝⎝ 2 ⎠ , ⎝ −3 1 2 1 1 −3 ⎞ ⎛ ⎞ ⎛ ⎞⎞ ⎛⎛ ⎞ ⎛ 1 0 0 ⎠ , ⎝ −3 ⎠ , ⎝ 0 ⎠⎠= (−3)(−1) det⎝⎝ 0 ⎠ , ⎝ 0 −1 0
⎞ ⎛
⎞⎞ 0 ⎠ , ⎝ 0 ⎠⎠= −1 ⎞ ⎛ ⎞⎞ 0 0 ⎠ ⎝ 1 0 ⎠⎠ = 3 , 0 1
Unter der Determinante der Matrix A ∈ K n,n versteht man die Determinante aus ihren Spaltenvektoren, versteht A also als Element aus (K n )n , und verwendet daf¨ ur verschiedene Schreibweisen: ⎛ ⎜ ⎜ det ⎜ ⎝
a11 a21 .. .
a12 a22 .. .
... ...
a1n a2n .. .
an1
an2
...
ann
⎞ a11 ⎟ a21 ⎟ = ⎟ .. ⎠ . an1
a12 a22 .. .
... ...
a1n a2n .. .
an2
...
ann
⎛ ⎞⎞ ⎛⎛ ⎞ ⎛ ⎞ a12 a1n a11 ⎜a2n⎟⎟ ⎜⎜a21 ⎟ ⎜a22 ⎟ ⎜ ⎟⎟ ⎜⎜ ⎟ ⎜ ⎟ = det ⎜⎜ .. ⎟ , ⎜ .. ⎟ , . . . , ⎜ .. ⎟⎟ ⎝ . ⎠⎠ ⎝⎝ . ⎠ ⎝ . ⎠ an1 an2 ann
IV Determinanten
88
1 oT Satz 6: Die Matrix A = ∈ K n+1,n+1 entsteht aus A ∈ K n,n o A durch Hinzuf¨ ugen einer ersten Zeile und einer ersten Spalte mit den Elementen 1, 0, 0, . . . , 0. Dann gilt detA = detA.
Beweis: detA hat in Abh¨angigkeit von den Spaltenvektoren von A die gleichen Eigenschaften (1), (2), (3) wie detA, so dass die Behauptung aus Satz 5 folgt.2 Steht in Satz 6 in der ersten Zeile von A statt oT ein beliebiger Vektor aus K n , dann gilt ebenfalls detA = detA, denn man kann diese erste Zeile mit Hilfe der ersten Spalte in 1, 0, 0, . . . , 0 verwandeln. Analoges gilt f¨ ur den Fall, dass in der ersten Spalte von A statt o ein beliebiger Vektor steht. Beispiel 2: =
a11 = 0 0 0 a21 a11 0 0 a22 a23 − 0 0 a32 a33 0 a a a23 = a11 22 − a21 12 a32 a33 a32 a11 a21 a31
a12 a22 a32
a13 a23 a33
a12 a22 a32
0 + a21 0 0 a31 a13 + 0 a33 0 + a31 a12 a22 a13 a23 a33
0 a12 a32 a13 a33
a12 a22 a32 0 a12 a22
0 + 0 a31 0 a13 a23
a13 a23 a33
a12 a22 a32
a13 a23 a33
a13 (vgl. Satz 6) a23
= a11 (a22 a32 − a23 a32 ) − a21 (a12 a33 − a13 a32 ) + a31 (a12 a23 − a13 a22 ) = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a12 a21 a33 − a13 a22 a31 − a11 a23 a32 Hier stehen alle Produkte a1i a2j a3k , und zwar mit dem Minuszeichen, wenn das Tripel (i, j, k) aus (1, 2, 3) durch eine einzige Nachbarvertauschung hervorgeht, und mit dem Pluszeichen, wenn es durch keine oder eine zweifache Vertauschung aus (1, 2, 3) hervorgeht. Der folgende Satz besagt, dass die Determinante eines Produktes zweier Matrizen gleich dem Produkt der einzelnen Determinanten ist. Satz 7 (Multiplikationstheorem): F¨ ur zwei Matrizen A, B ∈ K n,n gilt det AB = det A · det B. Beweis: Ist det B = 0, dann ist der Rang von B kleiner als n, das LGS Bx = o hat also eine nichttriviale L¨osung. Dann hat auch das LGS (AB)x = o wegen (AB)x = A(Bx) eine nichttriviale L¨osung, also ist der Rang von AB kleiner als n und somit det AB = 0. Ist det B = 0, dann betrachten wir den Ausdruck D(A) =
det (AB) det(B)
bei festem B in Abh¨angigkeit von den Spaltenvektoren von A. Er hat dann die Eigenschaften (1), (2) und (3), nach Satz 5 gilt also D(A) = det (A).
2
IV.1 Die Determinante einer Matrix
89
Die Matrix A ∈ K n,n ist genau dann invertierbar, wenn det(A) = 0, denn genau dann sind ihre Spaltenvektoren linear unabh¨angig. In diesem Fall gilt det(A−1 ) = (det A)−1 , wie unmittelbar aus Satz 7 folgt. Satz 8: F¨ ur A ∈ K n,n hat die transponierte Matrix AT die gleiche Determinante wie A, es gilt also det AT = det A f¨ ur alle A ∈ K n,n . Beweis: Aufgrund von Satz 5 muss man nur zeigen, dass die Eigenschaften (1), (2) und (3) auch f¨ ur die Zeilenvektoren einer Matrix gelten. Bei (3) ist dies unmittelbar klar. (1) Die Multiplikation der i. Zeile einer Matrix aus K n,n mit r ∈ K bewerkstelligt man durch linksseitige Multiplikation mit der Diagonalmatrix ur j = i und dii = r sowie dij = 0 sonst. D = (dij ) mit djj = 1 f¨ Es gilt det D = r, wegen Satz 7 geht det A also in r det A u ¨ber, wenn man einen Zeilenvektor durch sein r-faches ersetzt. (2) Die Addition der k. Zeile zur i. Zeile (k = i) bewerkstelligt man durch linksseitige Multiplikation mit der Matrix M = (mij ) mit mjj = 1 und mik = 1 sowie mij = 0 sonst. Wegen det M = 1 ist det M A = det A, der Wert von det A ¨andert sich also nicht, wenn man eine Zeile zu einer anderen addiert (Fig. 1). 2 ⎛ ⎜ ⎜ ⎜ ⎜ D=⎜ ⎜ ⎜ ⎜ ⎝
1 0 0 0 0 0
0 1 0 0 0 0
0 0 r 0 0 0 ↑ i
0 0 0 1 0 0
0 0 0 0 1 0
0 0 0 0 0 1
⎞
⎛
⎟ ⎟ ⎟ ⎟← i ⎟ ⎟ ⎟ ⎟ ⎠
⎜ ⎜ ⎜ ⎜ M =⎜ ⎜ ⎜ ⎜ ⎝
1 0 0 0 0 0
0 1 0 0 0 0
0 0 1 0 0 0
0 0 0 1 0 0
0 1 0 0 1 0 ↑ k
0 0 0 0 0 1
⎞ ⎟← i ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
Fig. 1: Zum Beweis von Satz 8
Zum Berechnen einer Determinante k¨onnen wir also sowohl Spaltenumformungen als auch Zeilenumformungen benutzen. Beispiel 3 (Zur¨ uckf¨ uhrung einer vierreihigen auf eine dreireihige Determinante):
1 2 7 2
1 5 6 6
1 9 1 8
1 3 9 1
=
1 0 0 0
1 3 −1 4
1 1 7 1 −6 2 6 −1
=
1 0 0 0
0 3 −1 4
0 0 7 1 −6 2 6 −1
3 = −1 4
7 1 −6 2 6 −1
IV Determinanten
90
Beispiel 4:
2 7 −1
5 9 2
3 5 1
1 4 = (−1) 5 3
2 9 5
−1 7 2
1 = 0 0
2 −1 −1
−1 12 5
(zwei Zeilenvertauschungen und zwei Spaltenvertauschungen, 5-faches der ersten Zeile von der zweiten subtrahieren, 3-faches der ersten Zeile von der dritten Zeile subtrahieren)
1 = − 0 0
0 1 1
0 12 5
1 = − 0 0
0 1 1
0 0 −7
1 = 7 0 0
0 1 1
0 0 1
1 = 7 0 0
0 1 0
0 0 1
=7
(2-faches der ersten Spalte von zweiter subtrahieren, erste Spalte zu dritter Spalte addieren, aus zweiter Spalte Faktor −1 herausziehen, 12-faches der zweiten Spalte von der dritten subtrahieren, Faktor −7 aus der dritten Spalte herausziehen, dritte Spalte von zweiter subtrahieren)
Mit Hilfe von Determinanten kann man die L¨osung eines eindeutig l¨osbaren LGS mit n Gleichungen f¨ ur n Variable sehr einfach allgemein angeben. F¨ ur die Praxis ist dies von geringer Bedeutung, da das Berechnen von Determinanten in der Regel sehr aufw¨andig ist: Satz 9 (cramersche Regel, nach Gabriel Cramer, 1709–1752): Es sei {a1 , a2 , . . . , an } eine linear unabh¨angige Teilmenge von K n . Dann hat die Vektorgleichung bzw. das LGS x1a1 + x2a2 + . . . + xnan = b die (eindeutige) L¨osung xj =
det (a1 , a2 , . . . , aj−1 , b, aj+1 , . . . , an ) det (a1 , a2 , . . . , aj−1 , aj , aj+1 , . . . , an )
(j = 1, 2, . . . , n).
Beweis: Man ersetze in det (a1 , a2 , . . . , aj−1 , b, aj+1 , . . . , an ) den Vektor b durch die Linearkombination
n
j=1
xjaj und wende Satz 2 an.
2
Aufgaben 1. Man zeige, dass f¨ur eine Matrix aus IR2,2 mit den Spaltenvektoren a1 , a2 die Gleichung |a1 |2 |a2 |2 sin2 α = (det A)2 gilt, wobei α der Winkel zwischen a1 und a2 ist. (Dabei sind a1 , a2 als Verschiebungsvektoren in einem kartesischen Koordinatensystem gedeutet.)
IV.2 Explizite Darstellung und Berechnung
91
2. Eine Matrix aus IRn,n heißt Orthonormalmatrix, wenn ihre Spaltenvektoren bez¨ uglich des Standardskalarprodukts paarweise orthogonale Einheitsvektoren sind. Warum kann die Determinante einer Orthonormalmatrix nur die Werte 1 oder −1 annehmen?
3. Es sei A = (ij−1 )n,n . Man zeige, dass det A = 0!1!2! · . . . · (n − 1)!, wobei 0! = 1 und k! = 1 · 2 · 3 · . . . · k ( k Fakult¨at“) f¨ ur k ∈ IN. ” 4. Man zeige, dass
a1 a2 a3 a4 a5
1 1 1 1 1
a21 a22 a23 a24 a25
a31 a32 a33 a34 a35
a41 a42 a43 a44 a45
= (a2 − a1 )(a3 − a1 )(a3 − a2 )(a4 − a1 )(a4 − a2 )· ·(a4 − a3 )(a5 − a1 )(a5 − a2 )(a5 − a3 )(a5 − a4 )
5. Aus einer Matrix A ∈ Rk,k und einer Matrix B ∈ IRm,m bilde man die Matrix
M=
A Ok,m Om,k B
aus IRn mit n = k + m, wobei Om,k bzw. Ok,m die Nullmatrix aus IRm,k bzw. aus IRk,m ist. Man zeige, dass det M = det A · det B ist. Man zeige ferner, dass diese Beziehung auch gilt, wenn man Om,k durch eine beliebige Matrix aus IRm,k ersetzt.
IV.2 Explizite Darstellung und Berechnung Zur Vorbereitung des n¨achsten Satzes (explizite Darstellung der Determinante) besch¨aftigen wir uns zun¨achst mit Permutationen. Eine Permutation der Menge {1, 2, . . . , n} ist eine bijektive Abbildung dieser Menge auf sich; wird dabei k auf ak abgebildet (k = 1, 2, . . . , n), so schreibt man diese Permutation in der Form
1 2 3 ... n a1 a2 a3 . . . an
oder einfacher (a1 a2 a3 . . . an ).
Die Anzahl der Permutationen von {1, 2, . . . , n} ist n! = 1 · 2 · . . . · n (n Fakult¨at), denn f¨ ur den 1. Platz gibt es n M¨oglichkeiten, f¨ ur den 2. Platz noch n − 1 M¨oglichkeiten, f¨ ur den 3. Platz dann noch n − 2 M¨oglichkeiten usw. In einer gegebenen Permutation nennt man ein Paar (i, j) eine Inversion, wenn i<j
und ai > aj .
Eine Permutation heißt gerade oder ungerade, je nachdem, ob sie eine gerade oder eine ungerade Anzahl von Inversionen enth¨alt.
IV Determinanten
92
Es gibt gleich viele gerade wie ungerade Permutationen, denn vertauscht man in einer Permutation zwei Elemente, dann ergibt sich aus einer geraden eine ungerade Permutation und umgekehrt, wie man folgendermaßen einsieht: Vertauscht man zwei benachbarte Elemente in (a1 a2 a3 . . . an ), dann ¨andert sich die Anzahl der Inversionen um ±1. M¨ochte man in (a1 a2 . . . ar . . . as . . . an ) mit r + 1 < s die Zahlen ar und as vertauschen, so erh¨alt man zun¨achst durch s − r Nachbarvertauschungen (Transpositionen) (a1 a2 . . . ar+1 . . . as ar . . . an ), so dass jetzt ar an der fr¨ uheren Stelle von as steht und as unmittelbar davor. Durch weitere s − r − 1 Vertauschungen benachbarter Elemente kommt as schließlich an die fr¨ uhere Stelle von ar . Man hat also 2(s − r) − 1 Nachbarvertauschungen vorgenommen, und dies ist eine ungerade Zahl. Eine Permutation ist also gerade oder ungerade, je nachdem ob sie aus (1 2 3 . . . n) durch eine gerade oder eine ungerade Anzahl von Nachbarvertauschungen (Transpositionen) hervorgeht. Satz 1 (Explizite Darstellung der Determinante): Es gilt a11 a21 . . . an1
a12 . . . a1n a22 . . . a2n σ(π) · a1π(1) a2π(2) . . . anπ(n) , .. .. = . . π an2 . . . ann
wobei u ¨ber alle n! Permutationen π von (1, 2, . . . , n) summiert wird und σ(π) = +1, falls die Permutation π gerade ist, und σ(π) = −1, falls sie ungerade ist. Beweis: F¨ ur i = 1, 2, . . . , n sei ai der i-te Spaltenvektor. Es ist also ai = wobei {e1 , e2 , . . . , en } die Standardbasis von K n ist: ⎛
det (a1 , a2 , . . . , an ) = det ⎝
n
j=1
aj1ej ,
n j=1
aj2ej , . . . ,
n j=1
n j=1
ajiej ,
⎞
ajnej ⎠
Aufl¨osung der Determinante nach den Regeln und S¨atzen aus IV.1 liefert Summanden der Form det (aj1 1ej1 , aj2 2ej2 , . . . , ajn nejn ) = aj1 1 aj2 2 · . . . · ajn n det (ej1 , ej2 , . . . , ejn ), wobei (j1 j2 . . . jn ) eine Permutation π von (1 2 . . . n) ist. Die Matrix (ej1 , ej2 , . . . , ejn ) entsteht aus der Einheitsmatrix durch die Permutation π, ihre Determinante ist also σ(π). Es ergibt sich die im Satz angegebene Formel, aller¨ dings mit anderer Reihenfolge der Indizes; dies l¨asst sich aber durch Ubergang zur Umkehrpermutation π −1 beheben, wobei sich wegen σ(π −1 ) = σ(π) nichts 2 ¨andert.
IV.2 Explizite Darstellung und Berechnung
93
Man k¨onnte die Formel aus Satz 1 auch zur Definition der Determinante verwenden. Die in IV.1 benutzten definierenden Eigenschaften der Determinante muss man dann aus dieser Formel ablesen, was aber kein großes Problem ist. Weitere Eigenschaften wie etwa det AT = det A erkennt man auch sofort an der Formel in Satz 1. Diese Formel ist aber zur Berechnung einer Determinante in der Regel weniger brauchbar als die in IV.1 benutzten Verfahren. F¨ ur n = 3 ergibt Satz 1 die Formel von Sarrus (siehe III.4). Der folgende Satz 3 ist auch zur Berechnung einer Determinante manchmal n¨ utzlich; Satz 2 dient zur Vorbereitung von Satz 3. Satz 2: Die Matrix Aij ∈ K n−1,n−1 entstehe aus der Matrix A ∈ K n,n , indem man die i-te Zeile und j-te Spalte streicht (i, j = 1, 2, . . . , n). Die Matrix A∗ij ∈ K n,n entstehe aus der Matrix A ∈ K n,n , indem man aij durch 1 und alle u ¨brigen Elemente der i-ten Zeile und j-ten Spalte durch 0 ersetzt (i, j = 1, 2, . . . , n): ⎛
A∗ij
⎜ ⎜ ⎜ ⎜ ⎜ ⎜ =⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
a11 a21 .. .
a12 a22 .. .
... ...
ai−1,1 0 ai+1,1 .. .
ai−1,2 0 ai+1,2 .. .
an1
an2
Dann ist
a1,j−1 a2,j−1 .. .
... ...
. . . ai−1,j−1 ... 0 . . . ai+1,j−1 .. .
0 a1,j+1 0 a2,j+1 .. .. . . 0 ai−1,j+1 1 0 0 ai+1,j+1 .. .. . .
...
0
...
an,j−1
an,j+1
a1n a2n .. .
. . . ai−1,n ... 0 . . . ai+1,n .. .
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
ann
det A∗ij = (−1)i+j det Aij .
Beweis: Durch j − 1 Nachbarvertauschungen bringe man die j-te Spalte von A∗ij an die erste Stelle und dann durch i − 1 Nachbarvertauschungen die i-te Zeile an die erste Stelle. Der Wert von detA∗ij hat dadurch (i − 1 + j − 1)-mal das Vorzeichen gewechselt, er hat sich also um den Faktor (−1)i−1+j−1 = (−1)i+j ge¨andert. Nun gilt aufgrund von Satz 6 aus IV.1 allgemein
1 0 0 0 v11 v12 0 v21 v22 .. .. ... . . 0 vk1 vk2
... 0 . . . v1k . . . v2k .. . . . . vkk
v11 v21 = . .. vk1
v12 . . . v1k v22 . . . v2k .. . .. . . vk2 . . . vkk
2
Im folgenden Satz beziehen wir uns auf die oben eingef¨ uhrten Bezeichnungen. Satz 3 (Entwicklungssatz): F¨ ur j = 1, 2, . . . , n gilt det A =
n i=1
(−1)i+j aij det Aij
(Entwicklung nach der j-ten Spalte).
IV Determinanten
94 Beweis: Den j-ten Spaltenvektor aj zerlegen wir in die Standardbasis ist. Dann gilt det A = det (a1 , a2 , . . . , an ) =
n i=1
n i=1
aij ei , wobei {e1 , e2 , . . . , en }
det (a1 , . . . , aj−1 , aij ei , aj+1 , . . . , an ).
Ist aij = 0, dann hat die entsprechende Determinante in der Summe den Wert 0. Ist aij = 0, dann kann man in der entsprechenden Determinante alle anderen Elemente in der i-ten Zeile gleich 0 setzen. Man erh¨alt also det A = woraus mit Satz 2 die Behauptung folgt.
n
i=1
aij det A∗ij , 2
Wegen det AT = det A gilt auch f¨ ur i = 1, 2, . . . , n det A =
n j=1
(−1)i+j aij det Aij
(Entwicklung nach der i-ten Zeile).
Eine Matrix A ∈ K n,n ist genau dann invertierbar, wenn det A = 0 gilt. Der folgende Satz enth¨alt eine Formel zur Berechnung der inversen Matrix A−1 . Satz 4: Ist det A = 0 f¨ ur eine Matrix A ∈ K n,n , dann ist ⎛
A−1 =
⎜
1 ⎜ ⎜ det A ⎜ ⎝
α11 α21 . . . αn1 α12 α22 . . . αn2 .. .. .. . . . α1n α2n . . . αnn
⎞ ⎟ ⎟ ⎟ ⎟ ⎠
mit αji = (−1)j+i det Aji ,
wobei die Aji die in Satz 2 definierten Matrizen sind. Beweis: Die Matrix X = A−1 habe die Spaltenvektoren x1 , x2 , . . . , xn . Die Gleichung AX = E ist gleichbedeutend mit den n Gleichungen Axi = ei (i = 1, 2, . . . , n), wobei {e1 , e2 , . . . , en } die Standardbasis ist. Nach der cramerschen Regel (IV.1) hat Axi = ei die L¨osung xTi = (x1i x2i . . . xni ) mit xji =
det (a1 , a2 , . . . , aj−1 , ei , aj+1 , . . . , an ) (−1)i+j det Aji = det (a1 , a2 , . . . , aj−1 , aj , aj+1 , . . . , an ) det A
mit den in Satz 2 definierten Matrizen Aij .
(j = 1, 2, . . . , n) 2
Das Ergebnis in Satz 4 ist zwar von theoretischem Interesse, in der Praxis ist es aber meistens einfacher, die Inverse folgendermaßen zu berechnen: Man l¨ose f¨ ur i = 1, 2, . . . , n die Gleichungen Axi = ei durch elementare Zeilenumformungen, bilde also xi = A−1ei , woraus sich X = A−1 E = A−1 ergibt. Die L¨osung obiger Gleichungen kann dabei simultan erfolgen. Ein Beispiel hierf¨ ur haben wir schon
IV.2 Explizite Darstellung und Berechnung
95
in II.2 vorgerechnet, wir betrachten hier ein weiteres Beispiel f¨ ur das genannte Verfahren. ⎛
⎞ 1 −2 0 Beispiel: Es soll die Inverse der Matrix A = ⎝ 3 −4 7 ⎠ berechnet werden. 2 3 4
Dazu nehme man Zeilenumformungen an der um E erweiterten Matrix vor: ⎞ ⎛ 1 0 ⎠ 0 →⎝ 0 1 0 ⎞ ⎛ 1 0 0 1 0 ⎠→⎝ 0 0 2 0 ⎛ ⎞ ⎛ 1 −2 0 1 0 0 ⎝ ⎠ 41 0 0 82 287 −123 → →⎝ 119 −49 14 0 0 −287 ⎛ ⎞ ⎛ 41 −82 0 41 0 0 −8 14 ⎠ → ⎝ 82 0 −4 →⎝ 0 0 0 −287 119 −49 14 ⎛ 41 0 0 37 0 −2 → ⎝ 0 41 0 0 41 −17 ⎛
1 −2 0 1 ⎝ 3 −4 7 0 2 3 4 0 ⎛ 1 −2 0 1 2 7 −3 →⎝ 0 0 14 8 −4
0 1 0
⎞ −2 0 1 0 0 2 7 −3 1 0 ⎠ 7 4 −2 0 1 ⎞ −2 0 1 0 0 1 0 ⎠ 2 7 −3 0 −41 17 −7 2
⎞ 1 −2 0 1 0 0 0 82 0 −4 −8 14 ⎠ 0 0 −287 119 −49 14 ⎞ 41 0 0 37 −8 14 −8 14 ⎠ 0 82 0 −4 0 0 −287 119 −49 14 ⎞ −8 14 −4 7 ⎠ 7 −2
Links steht jetzt 41 E, rechts also das 41-fache von A−1 . Die gesuchte Inverse ist daher ⎛ ⎞ 37 −8 14 1 ⎜ 7 ⎟ A−1 = ⎝ −2 −4 ⎠. 41 −17 7 −2
Aufgaben 1. Man berechne die Determinanten a)
1+a 1 1 1+b 1 1 1 1
1 1 1 1 1+c 1 1 1+d
b)
a −1 0 0
2. Man berechne die Inverse der Matrix ⎛
1 ⎜ 1 ⎜ ⎝ 1 1
1 2 1 1
1 1 3 1
⎞ 1 1 ⎟ ⎟. 1 ⎠ 4
1 0 b 1 −1 c 0 −1
0 0 1 d
IV Determinanten
96
3. Man zeige, dass 1 a 1 1 b1 1 x1
a2 b3 x2
=0
bzw.
1 1 1 1
a1 b1 c1 x1
a2 b3 c2 x2
a3 b3 c3 x3
=0
die Gleichung einer Geraden in der Ebene durch die Punkte A(a1 , a2 ) und B(b1 , b2 ) bzw. die Gleichung einer Ebene im Raum durch die Punkte A(a1 , a2 , a3 ), B(b1 , b2 , b3 ), C(c1 , c2 , c3 ) ist.
4. a) Die Zeilenvektoren der Matrix An ∈ K n,n seien (1 xi x2i . . . xn−1 ) (1 = 1, 2, . . . , n). i Man berechne det An f¨ ur n = 2, 3, 4, 5. Man zeige dann durch vollst¨andige Induktion, dass f¨ ur alle n ∈ IN gilt: det An ist das Produkt aller Terme xi − xj mit j < i. b) Man beweise mit Hilfe einer Determinante, dass ein Polynom vom Grad n durch seine Werte an n + 1 verschiedenen Stellen eindeutig bestimmt ist.
5. Man zeige, dass die Determinante Dn =
a1 1 −1 a2 0 −1 .. .. . . 0 0 0 0
0 1 a3 .. .
... ... ...
0 0 0 .. .
0 0
... ...
an−1 −1
1 an 0 0 0 .. .
der Rekursion Dn = an Dn−1 + Dn−2 gen¨ ugt.
6. a) Man berechne die Determinanten 1 (1) 2
2 1
1 (2) 2 3
2 3 3 1 1 2
(3)
1 2 3 4
2 3 4 1
3 4 1 2
4 1 2 3
b) Man zeige, dass f¨ ur alle n ∈ IN
1 2 .. .
2 3 .. .
3 4 .. .
... ...
n
1
2
...
n(n−1) n(n + 1) nn−2 . = (−1) 2 2 n−1 n 1 .. .
7. Eine Matrix A = (aij ) ∈ K n,n heißt Linksdreiecksmatrix, wenn aij = 0 f¨ur i < j; sie heißt Rechtsdreiecksmatrix, wenn aij = 0 f¨ ur i > j. Man zeige, dass die Inverse einer invertierbaren Linksdreiecksmatrix wieder einen solche und dass die Inverse einer invertierbaren Rechtsdreiecksmatrix ebenfalls wieder eine solche ist.
V Affine Abbildungen V.1 Darstellung affiner Abbildungen Definition 1: Eine bijektive (umkehrbare) Abbildung der Ebene oder des Raums auf sich nennt man eine affine Abbildung oder Affinit¨at, wenn sie geradentreu ist, wenn sie also jede Gerade wieder auf eine Gerade abbildet. Satz 1: Jede affine Abbildung ist parallelentreu und teilverh¨altnistreu. Beweis: Haben die Geraden g, h keinen Punkt gemeinsam, dann gilt dies auch f¨ ur die Bildgeraden g , h , denn w¨are P ein gemeinsamer Punkt von g , h , dann w¨are der Urbildpunkt P von P ein gemeinsamer Punkt von g und h. Ein Parallelogramm wird daher wie................ A................................................. .... ..... ............................... . . der auf ein solches abgebildet. Al. . . . . . . . . . . . . . . . . . . . . A......................................r....................................B → ..... ........r......................... so wird der Mittelpunkt einer Stre......... ... ................................................. ... B cke AB auf den Mittelpunkt der Bildstrecke A B abgebildet (Fig. 1). Fig. 1: Mitte bleibt Mitte −→
−→
Ist allgemeiner AT = t AB, dann ist −→
−→
auch A T = t A B , wie man mit Hilfe der Strahlens¨atze sieht (Fig. 2). 2 Nun sei in der Ebene ein kartesisches Koordinatensystem gegeben. Die Bildpunkte von E1 (1, 0), E2 (0, 1) und O(0, 0) bei der affinen Abbildung α seien E1 (a1 , a2 ), E2 (b1 , b2 ) und O (c1 , c2 ).
A ....s . . . . A. .. .... .. ......... . . . s . . . . . . . . . .. . .s..... .. .. .... .... .......c...............s..T.. . . . . . . ... ... .. . .. .. .. ... ... .. .. .. .. .. .. .. .. ...T ... ... ..r......................... .. . . . ... ... .. .. ..... .. . . ... . ...s.. .. .. .. .. ... .. .. ..c.. .... . . . . . .. .. .. .. .. ....... B . ...s B Fig. 2: Teilverh¨ altnistreue
−→ 1 0 und OE2 = werden also auf die Vektoren 0 1 −→ −→ a −c u b −c v O E1 = 1 1 = 1 und O E2 = 1 1 = 1 abgebildet. a2 − c2 u2 b2 − c2 v2 −→
Die beiden Vektoren OE1 =
Wegen der Geradentreue und der Teilverh¨altnistreue von α wird dann der Punkt X(x1 , x2 ) auf den Punkt X (x1 , x2 ) mit dem Ortsvektor
u1 u2
v1 v2
x1 u1 v1 c1 = x1 + x2 + x2 u2 v2 c2
=
abgebildet (Fig. 3).
x1 c1 + x2 c2
6 AK. . . A ...... .... A .... . .X A .. A E .. .. AK 2 .. . . . . .X . .. A .. A 7. . .. AP P E2 .. P .. O A PP 6 . . . E P 1 qP .. P P P. P O E1 q P −→
−→
−→
−→
Fig. 3: OX =OO +x1 O E1 +x2 O E2
V Affine Abbildungen
98
Das kartesische Koordinatensystem wird dabei auf ein affines Koordinatensystem abgebildet. (Bei einem affinen Koordinatensystem sind die Achsen nicht notwendigerweise rechtwinklig und die Einheiten auf den Achsen nicht notwendigerweise gleich.) Ein Punkt mit den Koordinaten x1 , x2 im kartesischen Koordinatensystem wird auf den Punkt mit denselben Koordinaten x1 , x2 in diesem affinen Koordinatensystem abgebildet: −→
−→
−→
−→
−→
−→
Ist OX= x1 OE1 +x2 OE2 , dann ist O X = x1 O E1 +x2 O E2 . Entsprechendes gilt f¨ ur affine Abbildungen im Raum. Eine affine Abbildung α von IR2 bzw. IR3 auf sich wird also durch die Abbildungsgleichung x = α(x) = Ax + c gegeben, wobei die Matrix A invertierbar sein muss, damit α umkehrbar ist. Durch jede solche Abbildungsgleichung ist auch eine affine Abbildung gegeben, denn das Bild einer Geraden ist wieder eine Gerade: Die lineare Mannigfaltigkeit {a + tb | t ∈ IR} = a + b wird auf die lineare Mannigfaltigkeit {A(a + tb) + c | t ∈ IR} = {(Aa + c) + tAb | t ∈ IR} = (Aa + c) + Ab abgebildet. Damit ist folgender Satz bewiesen: Satz 2: Die affinen Abbildungen von IR2 auf sich bzw. IR3 auf sich sind genau die Abbildungen x → Ax + c mit A ∈ IR2,2 bzw. A ∈ IR3,3 und c ∈ IR2 bzw. c ∈ IR3 , wobei die Matrix A invertierbar ist. uglich der Satz 3: Die affinen Abbildungen von IRi auf sich (i = 2, 3) bilden bez¨ Verkettung eine Gruppe. Beweis: F¨ ur α : x → Ax + c und β : x → Bx + d gilt + c = (AB)x + (Ad + c), α ◦ β : x → A(Bx + d) und AB ist invertierbar, wenn A und B invertierbar sind. Die Umkehrabbildung der affinen Abbildung x → Ax + c ist die affine Abbildung x → A−1x − A−1c. 2 Satz 4: a) Eine affine Abbildung von IR2 auf sich ist durch drei nichtkollineare (nicht auf einer Geraden liegende) Punkte und ihre Bildpunkte eindeutig bestimmt. b) Eine affine Abbildung von IR3 auf sich ist durch vier nichtkomplanare (nicht in einer Ebenen liegende) Punkte und ihre Bildpunkte eindeutig bestimmt. Beweis: a) Die Behauptung l¨asst sich elementargeometrisch beweisen: Ist P Q R das Bild des Dreiecks P QR, dann liegt das Bild S eines weiteren Punktes S
V.1 Darstellung affiner Abbildungen
99
eindeutig fest: Die Gerade durch P und S schneide die Gerade durch Q und R in einem Punkt T . Aufgrund der Teilverh¨altnistreue liegt der Bildpunkt T von T auf der Geraden durch Q und S eindeutig fest. Ebenfalls aufgrund der ... Teilverh¨altnistreue liegt dann auch der Bild... . . R ....t S punkt S von S auf der Geraden durch P . ...t..... ... und T eindeutig fest (Fig. 4). .. . .......t.....T . ... ....... Man kann dies aber auch mit Hilfe ei..... ....... . ner Rechnung beweisen: F¨ ur die linear un. .....t ...t................................... Q −→ −→ P abh¨angigen Vektoren u =P Q und v =P R und und ihre Bildvektoren u , v ist die Matrix A mit Au = u und Av = v eindeutig bestimmt: Es gilt A = (u v )(u v )−1 ,
R
wobei (u v ) die Matrix mit den Spaltenvektoren u, v bedeutet. Mit
P ...t................. .. . ...........................t ..... ....... Q ...t... .. ...... ........ .. . . . . . . . ..t ... .. .......... T ........ S .. .. ............. ..t..
Fig. 4: Affine Abbildung
c = p − Ap = q − Aq = . . . (p, q, . . . Ortsvektoren von P,Q,. . . ) ist die lineare Abbildung x → Ax +c eindeutig bestimmt. b) Der Beweis f¨ ur affine Abbildungen im Raum verl¨auft analog. 2 Beispiel 1: Die affine Abbildung der Ebene, welche (0,0), (1,0), (0,1) (in dieser Reihenfolge) auf (1,2), (5,3), (3,9) abbildet, ist
4 2 1 α : x → . x + 1 7 2 Die affine Abbildung der Ebene, welche (0,0), (1,0), (0,1) (in dieser Reihenfolge) auf (3, −5), (11,1), (7, −2) abbildet, ist
8 4 3 x + . β : x → 6 3 −5 Die affine Abbildung der Ebene, welche (1,2), (5,3), (3,9) (in dieser Reihenfolge) auf (3, −5), (11,1), (7, −2) abbildet, ist dann also
β ◦ α−1 : x →
8 4 6 3
−1
4 2 1 7
x −
1 2
+
3 . −5
¨ Definition 2: Eine affine Abbildung heißt eine Ahnlichkeitsabbildung, wenn sie winkeltreu ist, wenn also jeder Winkel auf einen gleichgroßen Winkel abgebildet wird. Sie heißt eine Kongruenzabbildung, wenn sie l¨angentreu ist, wenn also jede Strecke auf eine gleichlange Strecke abgebildet wird.
V Affine Abbildungen
100
¨ Nat¨ urlich ist eine Kongruenzabbildung ein Sonderfall einer Ahnlichkeitsabbil¨ dung. Aquivalent mit der Winkeltreue ist die Forderung, dass sich alle L¨angen um ¨ den gleichen Faktor (Ahnlichkeitsfaktor) a¨ndern, wie man elementargeometrisch einsieht. Eine Matrix A ∈ IRn,n haben wir Orthonormalmatrix genannt, wenn AT A = E, wenn also ihre Spaltenvektoren paarweise orthogonale Einheitsvektoren bez¨ uglich des Standardskalarprodukts in IRn sind. Auch die Zeilenvektoren einer Orthonormalmatrix sind paarweise orthogonale Einheitsvektoren, d.h. mit AT A = E gilt auch AAT = E (Aufgabe 2). Im folgenden Satz beachte man, dass mit A auch −A orthogonal bzw. orthonormal ist, der in Satz 5 auftretende Faktor k kann also stets als positiv angenommen werden. ¨ Satz 5: Die Matrix einer Ahnlichkeitsabbildung hat die Form kA, wobei k ∈ IR+ und A eine Orthonormalmatrix ist. Die Matrix einer Kongruenzabbildung ist eine Orthnormalmatrix. Beweis: Die Bilder orthogonaler Einheitsvektoren m¨ ussen orthogonale Vektoren gleicher L¨ange k sein; im Fall der Kongruenzabbildung ist dabei k = 1. 2 ¨ Satz 6: Jede Ahnlichkeitsabbildung ist die Verkettung einer Kongruenzabbildung mit einer zentrischen Streckung mit dem Zentrum O. Beweis: Ist A eine Orthonormalmatrix, c ∈ IRn und k ∈ IR mit k = 0, dann ist kE die Matrix der zentrischen Streckung an O und kA = (kE)A, also
1 2 ur alle x ∈ IRn . c = A(kEx) + c f¨ k Es werden nun zwei wichtige Beispiele f¨ ur Kongruenzabbildungen vorgestellt. kA x + c = (kE) Ax +
Beispiel 2: Wir betrachten bez¨ uglich eines kartesischen Koordinatensystems die Spiegelung an der Geraden mit der Gleichung x2 = ax1 (Fig. 5). Zwischen einem Punkt P (p1 , p2 ) und seinem Bildpunkt P (p1 , p2 ) bestehen die Beziehungen p2 + p2 p + p1 =a 1 , 2 2 (p1 − p1 ) + a(p2 − p2 ) = 0,
x2
.u..P (p1 , p2 ) ... .......q...... ......... . ..... ......u....... . . . . . . . . . ... ........ ... .......... . . . . ..uP (p , p ) . . . ..... .. . 1 2 . . . . . . . . . a . . . . . . . O............ ϕ ... . . ....... x1 1 6
Fig. 5: Spiegelung an einer Geraden
denn der Mittelpunkt der Strecke P P liegt auf der Spiegelgeraden, und der Vektor −→
P P ist orthogonal zu
1 . Es ergibt sich f¨ ur p1 , p2 das LGS a
ap1 − p2 = −ap1 + p2 p1 + ap2 = p1 + ap2
bzw.
a −1 1 a
p1 = p2
−a 1 1 a
p1 . p2
V.1 Darstellung affiner Abbildungen Also ist
p1 = p2
101
a −1 1 a
−1
−a 1 1 a
p1 . p2
Die Abbildungsmatrix der Spiegelung ist daher
a −1 1 a
−1
−a 1 1 a
1 = 1 + a2
1 = 1 + a2
a 1 −1 a
1 − a2 2a 2a −(1 − a2 )
−a 1 1 a
.
Ist ϕ der Steigungswinkel der Spiegelgeraden, also a = tan ϕ, dann ergibt sich f¨ ur diese Matrix
cos2 ϕ − sin2 ϕ 2 sin ϕ cos ϕ 2 sin ϕ cos ϕ −(cos2 ϕ − sin2 ϕ)
=
cos 2ϕ sin 2ϕ sin 2ϕ − cos 2ϕ
.
Wir haben dabei die trigonometrischen Beziehungen 1 + tan2 ϕ =
1 , cos2 ϕ − sin2 ϕ = cos 2ϕ und 2 sin ϕ cos ϕ = sin 2ϕ cos2 ϕ
benutzt. Eine Spiegelung an einer Ursprungsgeraden hat also die Abbildungsmatrix r s mit r2 + s2 = 1. s −r Die Spiegelung an einer Geraden, die nicht durch O geht, kann dann mit Hilfe einer geeigneten Verschiebung c durch x = A(x −c) +c beschrieben werden: Man verschiebe die Gerade und den zu spiegelnden Punkt so, dass die Gerade durch O geht, spiegele und mache dann die Verschiebung r¨ uckg¨angig. Beispiel 3: Die Verkettung zweier Spiegelungen an zwei sich schneidenden Geraden ist eine Drehung um den Schnittpunkt der Geraden, wobei der Drehwinkel doppelt so groß ist wie der Schnittwinkel der Geraden. Der Drehsinn h¨angt dabei von der Reihenfolge der Spiegelungen ab. Das ist elementargeometrisch zu erkennen (Fig. 6). Die Multiplikation zweier Spiegelungsmatrizen ergibt eine Drehmatrix:
r s s −r
u v v −u
=
ru + sv −(su − rv) su − rv ru + sv
Dabei ist ru + sv das Skalarprodukt der beiden Einheitsvektoren
r cos 2ϕ = s sin 2ϕ
und
u cos 2ψ = , v sin 2ψ
V Affine Abbildungen
102 also gleich dem Kosinus des Winkels zwischen diesen Vektoren, n¨amlich cos 2(ψ − ϕ). Ferner ist su − rv = sin 2(ψ − ϕ). Die Drehung um O mit dem Winkel δ hat also die Abbildungsmatrix
cos δ − sin δ sin δ cos δ
,
wie schon in II.3 bei der Betrachtung der komplexen Zahlen gezeigt wurde. Die Verkettung zweier Spiegelungen an parallelen Geraden ergibt offensichtlich eine Verschiebung.
. .........P ... .....u......... ..... . .......... . ... ... ..... ...... .........e. . . .. .. ... ... .... ........... ..... ...... ...... ...... .............. . .... .... ...... ........... ........ .......... . . . . ..... ..... ...... . . . .... . . ...... ... ... .......... .......... ..u P .. .. .............ψ......................... .. .. .. .. .. ............. ..................................ϕ .. .. . O..................... .. .. ............. x1 . x2
6
Fig. 6: Drehung als Doppelspiegelung
Auf Grundlage von Satz 4 a) kann man zeigen, dass jede Kongruenzabbildung als Verkettung von drei Spiegelungen geschrieben werden kann (Dreispiegelungssatz). Ein Dreifachspiegelung l¨asst sich stets als Verkettung einer Spiegelung mit einer Verschiebung parallel zur Spiegelachse (Schubspiegelung) schreiben (Aufgabe 7). Nun werden noch zwei Beispiele f¨ ur affine Abbildungen der Ebene angegeben, ¨ welche i. Allg. keine Ahnlichkeitsabbildungen sind. Beispiel 4: Bei einer Scherung an einer Geraden g liegen ein Punkt P und sein Bildpunkt P auf einer Parallelen zu g. Ist ferner L der Lotfußpunkt von P auf g, dann ist der Winkel ϕ zwischen P L und P L fest gegeben. Die Scherung an der x1 -Geraden mit dem Winkel 1 k ϕ hat die Abbildungsmatrix 0 1 mit k = tan ϕ (Fig. 7). Beispiel 5: Bei einer Parallelstreckung an einer Geraden g parallel zur Geraden h liegen ein Punkt P und sein Bildpunkt P auf einer Parallelen zu h und f¨ ur den Schnittpunkt S von g mit der Geraden durch P und P gilt −→
−→
SP = k SP (Fig. 8). F¨ ur k = −1 liegt eine Schr¨agspiegelung vor.
x2
6
....p2
kp2 Pt Pt . ... ............................................. . . . . . . . . . . . . . . . . . . . . . . ..................... . . ..... ...... . . . . . . . . . . . . . . . . . .. . ............................. .............. .. ... ......... ............. . ... ... .......................... .............................. . . . . . . ... .. ... ...... ............ .... ................................... .... .........t.. x1 L Fig. 7: Scherung
. .. ..... h... ............................. ....s............. . .. P .. .. .. . . . .... ... . ..... ..... ........ ..... .. . ... ..... ... . ... ..... ........................................... .. . . .. P.....s................. ................. ..... .. ..... .. .... .. . . . S ..s . ... ... x1 ... x2
6
Fig. 8: Parallelstreckung
V.1 Darstellung affiner Abbildungen
103
Die Parallestreckung an der x1 -Achse parallel zur Geraden mit der Gleichung x2 = ax1 und dem Streckfaktor k hat die Abbildungsmatrix
1 m 0 k
mit m =
k−1 , a
denn f¨ ur einen Punkt (p1 , p2 ) und seinen Bildpunkt (p1 , p2 ) gilt x2 − x2 = a und x2 = kx2 . x1 − x1
Aufgaben 1. Man bestimme die affine Abbildung des Raumes, welche die Punkte A(1, 2, 1), B(0, 3, 4), C(5, −1, 0), D(−1, 9, 1) der Reihe nach abbildet auf die Punkte A (7, 9, 6), B (15, 27, 5), C (8, −7, 12), D (5, 20, 14).
2. Man zeige, dass die Determinante einer Orthonormalmatrix die Werte 1 oder −1 hat.
3. Es sei A ∈ K n,n und AT die Transponierte von A.
a) Man zeige, dass AAT symmetrisch ist. b) Man zeige, dass mit AT A = E auch stets AAT = E gilt.
4. Man beweise, dass sich bei einer affinen Abbildung der Ebene mit der Matrix A der Fl¨acheninhalt einer jeden Figur mit dem Faktor |det(A)| ¨andert.
5. Es seien zwei Punkte A(a1 , a2 ) und B(b1 , b2 ) in der Ebene gegeben. Wie lautet die Abbildungsgleichung der Spiegelung, die A auf B abbildet?
6. Man zeige elementargeometrisch: Sind die Dreiecke ABC und A B C kon¨ gruent (in Ubereinstimmung mit den Eckenbezeichnungen), dann gibt es eine Dreifachspiegelung, welche A auf A , B auf B und C auf C abbildet.
7. Man zeige elementargeometrisch: Jede Dreifachspiegelung l¨asst sich als Schubspiegelung darstellen. Man betrachte dazu die Bilderfolge in Fig. 9. ... . ....... ... ..g. ....... g ... . . ...... g . . . ... ........ . . ....... E ..... ...h ... .. ....... ..E...... ......t...q .. ... ... . . . . . . . . . . ... .... h. ... ............t........q... . .. ........... . .... . . . . ........ .......................... . ... .. ..... h ................k ........... .............q... k ..... . .............. . . . . . . . . . . . ... . ..... ...t.. k ....t ... ........... D ... ....D . . Fig. 9: Dreifachspiegelung
V Affine Abbildungen
104
8. Beim Verketten affiner Abbildungen kommt es auf die Reihenfolge an, die Gruppe der affinen Abbildungen (der Ebene oder des Raumes) ist nicht kommutativ. In welchen F¨allen sind a) zwei Spiegelungen b) zwei Drehungen c) zwei Verschiebungen d) eine Spiegelung und eine Verschiebung e) eine Drehung und eine Verschiebung miteinander vertauschbar? ¨ 9. Bei einer Ahnlichkeitsabbildung der Ebene werde A(1, 1) auf A (2, −3) und B(−1, 4) auf B (3, 0) abgebildet. Man bestimme den Bildpunkt von C(7, 2).
10. Eine Kongruenzabbildung heißt eine eigentliche Bewegung, wenn sie den Umlaufsinn einer Figur (z.B. eines Dreiecks) erh¨alt; ¨andert sie den Umlaufsinn, dann heißt sie eine uneigentliche Bewegung. Welchen Wert hat die Determinante der Matrix einer eigentlichen bzw. einer uneigentlichen Bewegung?
11. Es sei A die Matrix einer affinen Abbildung der Ebene. F¨ur welche Abbildungen gilt
a) A = A−1
b) A = AT
c) A−1 = AT
?
12. Die Verkettung einer Verschiebung c mit einer zentrischen Streckung am Zentrum Z mit dem Faktor k (in dieser Reihenfolge) ist eine zentrische Streckung am Zentrum Z ∗ mit demselben Faktor k; man bestimme Z ∗ .
13. Man bestimme die Matrix der Spiegelung im Raum an der Ebene mit der Gleichung x1 + x2 + x3 = 0.
14. Im Raum seien drei Abbildungen α, β, γ gegeben, und zwar sei α die zentrische Streckung an Z(1, 2, −1) mit dem Faktor 3, β die Verschiebung mit dem Vektor (3 7 5)T , γ die Spiegelung an der Ebene mit der Gleichung x2 + x3 = 0. Man bestimme die Abbildungsgleichungen von α ◦ β ◦ γ, α ◦ γ ◦ β, β ◦ α ◦ γ, β ◦ γ ◦ α, γ ◦ α ◦ β und γ ◦ β ◦ α.
15. Man untersuche, ob die affine Abbildung ⎛
des Raums Fixpunkte besitzt.
⎞
⎛
⎞
1 0 3 −1 ⎜ ⎟ 5 0 ⎟ x+⎝ 4 ⎠ ⎠ 1 1 −1 2
α : x → ⎜ ⎝ 2
V.2 Eigenwerte und Eigenr¨aume einer Matrix
105
V.2 Eigenwerte und Eigenr¨ aume einer Matrix Ist α : x → Ax + c eine affine Abbildung von IRi auf sich (i ∈ {2, 3}), sind ferner P, Q Punkte aus IRi mit den Ortsvektoren p, q und P = α(P ), Q = α(Q) −→
(P, Q ∈ IRi ), dann wird der Vektor v =P Q= q − p auf den Vektor −→
α(v ) = α(P Q) = (Aq + c) − (Ap + c) = A(q − p) = Av abgebildet. Wird dabei ein Vektor f = o auf ein Vielfaches von f abgebildet, dann beschreibt er eine Fixrichtung: Jede Gerade mit dem Richtungsvektor f wird auf eine dazu parallele Gerade abgebildet. Die Gleichung Af = λf bzw. (A − λE)f = o mit λ ∈ IR hat nur dann nicht-triviale L¨osungen f, wenn det(A − λE) = 0. Dies ist eine algebraische Gleichung f¨ ur λ. Hat man eine reelle L¨osung λ gefunden, dann kann man aus (A − λE)f = o einen Vektor f = o berechnen, welcher eine Fixrichtung der affinen Abbildung angibt. Definition 1: F¨ ur A ∈ IRn,n nennt man die algebraische Gleichung det(A − λE) = 0 die charakteristische Gleichung von A; das Polynom det(A − λE) heißt charakteristisches Polynom. Die L¨osungen dieser Gleichung nennt man die Eigenwerte von A. Ist λ ein Eigenwert von A, dann nennt man einen Vektor f = o mit (A − λE)f = o bzw. Af = λf einen Eigenvektor von A zum Eigenwert λ. Die Menge aller Eigenvektoren von A zum Eigenwert λ einschließlich o bildet den Eigenraum von A zum Eigenwert λ. Man beachte, dass ein Eigenraum als L¨osungsmenge eines homogenen LGS ein Vektorraum ist. Da Eigenvektoren von o verschieden sein sollen, ist ein Eigenraum nie der Nullraum. Eine Matrix A ∈ IRn,n muss f¨ ur gerades n keine reellen Eigenwerte besitzen, denn ein Polynom von geradem Grad besitzt nicht immer reelle Nullstellen. Ist aber n ungerade, dann besitzt A mindestens eine reelle Nullstelle: Ist p(x) = xn + an−1 xn−1 + . . . + a2 x2 + a1 x + a0 ein Polynom u ¨ber IR von ungeradem Grad n, dann hat p(x) f¨ ur negative Werte von x von hinreichend großem Betrag negative Werte, f¨ ur positive Werte von x von hinreichend großem Betrag positive Werte. Weil die Funktion x → p(x) stetig ist, muss sie also an mindestens einer Stelle x den Wert 0 annehmen, wie man in der Analysis lernt.
V Affine Abbildungen
106
Satz 1: Beschreiben A, B ∈ IRn,n die gleiche lineare Abbildung von IRn in IRn , aber bez¨ uglich verschiedener Basen, dann haben A und B das gleiche charakteristische Polynom, also auch die gleichen Eigenwerte. (In diesem Sinne sagt man, das charakteristische Polynom und damit die Eigenwerte einer Matrix seien invariant gegen¨ uber Basistransformationen.) Beweis: Eine lineare Abbildung von IRn in IRn sei bez¨ uglich der Basis {u1 , u2 , . . . , un } von IRn durch die Matrix A dargestellt, bez¨ uglich der Basis {v1 , v2 , . . . , vn } durch die Matrix B. Die Matrix T bilde nun die erste Basis auf die zweite Basis ab, wobei T ui = vi (i = 1, 2, . . . , n). Dann ist B = T AT −1 (Fig. 1). Es gilt daher aufgrund des Multiplikationssatzes f¨ ur Determinanten det(B − λE) = = = =
det(T AT −1 − λT T −1 ) det(T (A − λE)T −1 ) detT · detT −1 · det(A − λE) det(A − λE). 2
(v1 v2 . . . vn ) ............ ... ... −1 ... T ... ↓ ... .. (u1 u2 . . . un ) ... ... .. T AT −1 A ... ↓ ... A(u1 u2 . . . un ) ..... ... ... ... T ... ↓ . ......... B(v1 v2 . . . vn ) Fig. 1: Basistransformation
Satz 2: Eigenvektoren zu verschiedenen Eigenwerten sind linear unabh¨angig. Beweis: Es seien f1 , f2 Eigenvektoren von A zu λ1 bzw. λ2 . Ist rf1 + sf2 = o (r, s ∈ IR), dann ist auch A(rf1 + sf2 ) = o, also r(λ1 f1 ) + s(λ2 f2 ) = λ1 (rf1 ) − λ2 (rf1 ) = (λ1 − λ2 )rf1 = o. Wegen λ1 = λ2 und f = o ist daher r = 0 und somit auch s = 0, also sind f1 , f2 linear unabh¨angig. Es sei f3 ein Eigenvektor zu einem weiteren Eigenwert λ3 . Aus rf1 + sf2 + tf3 = o (r, s, t ∈ IR) folgt A(rf1 + sf2 + tf3 ) = o, also r(λ1 f1 ) + s(λ2 f2 ) + t(λ3 f3 ) = (λ1 − λ3 )rf1 + (λ2 − λ3 )sf2 = o. Wegen λ1 = λ3 und λ2 = λ3 und der linearen Unabh¨angigkeit von f1 , f2 folgt r = s = 0 und somit auch t = 0. So fortfahrend zeigt man die lineare Unabh¨angigkeit von Eigenvektoren zu einer beliebigen Anzahl von paarweise verschiedenen Eigenwerten. 2 Die Begriffe aus Definition 1 ben¨otigen wir hier nur f¨ ur Matrizen aus IR2,2 oder 3,3 IR , wir m¨ochten mit ihrer Hilfe n¨amlich zun¨achst die affinen Abbildungen der Ebene oder des Raums klassifizieren (Abschnitt V.3), in Kapitel VI benutzen wir diese Begriffe dann zur Klassifikation der Kurven und Fl¨achen zweiter Ordnung.
V.2 Eigenwerte und Eigenr¨aume einer Matrix
107
Aufgaben 1. Man bestimme die reellen Eigenwerte und die zugeh¨origen Eigenr¨aume der affinen Abbildungen von IR3 in sich mit den Matrizen ⎛
1 A=⎝ 1 −3
−1 2 1
⎞ 1 0 ⎠, −3
⎛
1 B=⎝ 2 3
⎞ 2 −2 ⎠, 0
−1 2 1
⎛
4 C = ⎝ −2 1
⎞ −1 1 3 2 ⎠. 5 3
2. Wie kann man die Eigenwerte einer Diagonalmatrix bzw. einer Dreiecksmatrix sofort an der Matrix ablesen?
3. Man zeige, dass die Drehmatrix
cos α sin α
− sin α cos α
keine reellen Eigenwerte
besitzt. Welche Eigenwerte besitzt die Spiegelmatrix
cos α sin α
sin α − cos α
?
4. Man zeige, dass f¨ur die Eigenwerte λ der Matrix ⎛
0 ⎜ 0 ⎜ A=⎝ 0 1
1 0 0 0
0 1 0 0
⎞ 0 0 ⎟ ⎟ 1 ⎠ 0
λ4 = 1 gilt, und dass auch A4 = E gilt.
5. Man bestimme das charakteristische Polynom der Matrix ⎛ ⎜ ⎜
F =⎜ ⎜ ⎝
0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 −a0 −a1 −a2 −a3 −a4
⎞
⎟ ⎟ ⎟. ⎟ ⎠
Man zeige: Ist λ ein Eigenwert von F , dann ist (1 λ λ2 λ3 λ4 )T ein zugeh¨origer Eigenvektor, und jeder Eigenraum von F hat die Dimension 1.
6. a) Man bestimme die Eigenwerte der Matrix A = (aij ) ∈ IRn,n mit aij = 1 f¨ ur alle i, j = 1, 2 . . . , n. b) Man bestimme die Eigenwerte der Matrix B = (bij ) ∈ IRn,n mit aij = 1 f¨ ur alle i, j = 1, 2 . . . , n mit i = j und aii = 0 f¨ ur i = 1, 2, . . . , n.
7.
⎛ 1 ⎝ Man bestimme f¨ ur A = 2
⎞ 0 −3 6 0 ⎠ eine Matrix T derart, dass 0 1 ⎛ ⎞ 0 λ1 0 T −1 AT = ⎝ 0 λ2 0 ⎠, 0 0 λ3 1 0 −3
wobei λ1 , λ2 , λ3 die Eigenwerte von A sind.
V Affine Abbildungen
108
V.3 Klassifikation der affinen Abbildungen Eine affine Abbildung x → Ax + c ist die Verkettung der Abbildung x → Ax (mit dem Fixpunkt O) und der Verschiebung x → x + c (in dieser Reihenfolge). F¨ ur A ∈ IR2,2 betrachten wir zun¨achst nur die Abbildung x → Ax und unterscheiden drei F¨alle, je nach Anzahl der reellen Eigenwerte von A. Man beachte dabei, dass wegen det(A) = 0 die Zahl 0 kein Eigenwert sein kann. Fall 1: Die Matrix A hat zwei verschiedene reelle Eigenwerte λ1 , λ2 . Sind f1 , f2 zugeh¨orige Eigenvektoren und w¨ahlt man {f1 , f2 } als Basis eines (affinen) Koordinatensystems, dann hat der Punkt mit dem Ortsvektor
x1 = x1 f1 + x2 f2 x = x2 den Bildpunkt mit dem Ortsvektor
x =
x1 λ1 x 1 = A(x1 f1 + x2 f2 ) = λ1 x1 f1 + λ2 x2 f2 = . λ2 x 2 x2
Die Abbildungsmatrix bez¨ uglich des durch {f1 , f2 } gegebenen Koordinatensys tems ist also die Diagonalmatrix
λ1 0 . 0 λ2
In Fig. 1 ist die durch A vermittelte Abbildung durch eine Zeichnung veranschaulicht. Sie besteht aus zwei Parallelstreckungen an den durch die Fixrichtungen gegebenen Geraden. Eine solche affine Abbildung nennt man eine Euler-Affinit¨at (nach Leonhard Euler, 1707–1783).
Streckung an g2 in Richtung g1 g1 mit dem Faktor λ1 = 0, 5 .. ........ ..... ..... P .. Q ................................t........ . ..... . ..... . t . . . . . ... .. . ..... ..... ... ....... .. ..... ..... f1 . ..... ..... .......... . . ..... . . . . . 3 . . . . . . . . . . . . . . . . . d... d.... .. . ..... . HH .... ..... .. .......... . ..... .... ... ........ .... . . HH . . . . t . . . . . . . . . R . O . ..... HH .... ... .... ... . . . . jH . . . . . . . . . . . . . . . . . . . .d .. .. .t................ ....... f2 HH .... . . HH Q ................................................... ........ .. . ........ H HH ........ .........t.....P ..... . . . . HH .. ........... .......... . . . . . ........ ...... Streckung an g1 in Richtung g2 HH ... ........ ..... HH ...... ........ ..... mit dem Faktor λ2 = 3 ........ ...... HH g ........ ..... 2 HH ............. .............. H HH ........ .t. Fig. 1: Euler-Affinit¨ at R
V.3 Klassifikation der affinen Abbildungen Ist ein Eigenwert 1, dann ist die Parallelstreckung in Richtung des entsprechenden Eigenvektors die identische Abbildung und es handelt sich um einen einfache Parallelstreckung in Richtung des anderen Eigenvektors (Fig. 2).
109
. . . . ...s..... . . . . . . . . . . . . .......s.......... ............ . ... ... ............ .... .. ........ . .......... . . . ..s .. ..s . .............s......................................s.............................................................................
-
Fig. 2: Parallelstreckung
Ist ein Eigenwert 1 und der andere Eigenwert −1, dann liegt eine Schr¨agspiegelung vor (Fig. 3). Die Verkettung zweier Parallelstreckungen mit gleichen Streckfaktoren geh¨ort zun¨achst nicht zu Fall 1, wo ja verschiedene Eigenwerte vorliegen sollten, sondern zu Fall 2 (s. unten), wird in der Regel aber auch als eine Euler-Affinit¨at betrachtet; es handelt sich dabei um eine zentrische Streckung (Fig. 4). Hier ist der Eigenraum zum (einzigen) Eigenwert zweidimensional, denn jeder Vektor = o aus IR2 ist ein Eigenvektor.
s ................................... ...... .. ........................................s . . . . . . ..... .. ..s......................... ... .. ... s................. . .. .... ....................... .................s. .... . ..... ............................. .. .s......
-
Fig. 3: Schr¨ agspiegelung 1 .......s . . . . . . . . . .. . ..
. . . . ..... . .....s. . . . . . . ..s.......... ... . . . . . . . . .. . . .. .. .. ......... .. .. ..s.........s... .. .. .. . . . . . . . . .......s. . .. . . . .
-
Fig. 4: Zentrische Streckung
Fall 2: Die Matrix A hat genau einen reellen Eigenwert λ. Es sei f ein Eigenvektor zum Eigenwert λ, ferner g ein Vektor so, dass {f, g } eine Basis von IR2 ist. Der Vektor x = x1 f + x2g wird dann durch die Matrix A auf x = λx1 f + x2 Ag abgebildet. Ist Ag = rf + sg , dann ist x = (λx1 + rx2 )f + sx2g ,
λ r . Da die Abbildungsmatrix hat also bez¨ uglich der Basis {f, g } die Gestalt 0
s
außer λ kein weiterer Eigenwert existiert, ist s = λ. Ist der Eigenraum von λ eindimensional, dann kann man f so w¨ahlen, dass r = 1 gilt. Ist der Eigenraum von λ zweidimensional, dann ist auch g ein Eigenvektor zu λ, also Ag = λg und somit r = 0. Bez¨ uglich der Basis {f, g } hat die Abbildungsmatrix also die Gestalt
λ 1 0 λ
oder
λ 0 . 0 λ
V Affine Abbildungen
110 Im ersten Fall liegt eine Streckscherung vor, also die Verkettung einer zentrischen Streckung mit dem Zentrum O und dem Streckfaktor λ und einer Scherung an der Geraden durch O mit dem Richtungsvektor f (Fig. 5).
.................t R P.. ....t................................. ... .... .... ..... ... ... ... . .. ....................................d........................ . . . . . . ..... ......... .... ..d.............................. . . . . ..... ........ .... ................ .. .. ... . .. ................ .. . ........................... .............t Q . . . . . . .. ......d.... ......t . . . ................... .....R .. P ..t............................. ... ........ . . . . . . .. ........................... .. .. .. ..t. Q . .. .. .. . @ .. .. .. @ . . I @ .. .. .. @ . * g@@@ ... ... ... @ .... @ . f @ O@
Im zweiten Fall liegt eine zentrische Streckung mit dem Zentrum O und dem Streckfaktor λ vor. Fall 3: Die Matrix A hat keinen reellen Eigenwert. Mit Hilfe einer Drehung kann man diesen Fall auf einen der F¨alle 1 oder 2 zur¨ uckf¨ uhren. Die Drehung um O um
den Winkel ϕ hat die Matrix D =
Mit A =
a11 a21
a12 a22
−v u
mit u = cos ϕ und v = sin ϕ.
a11 u − a21 v a12 u − a22 v . a11 v + a21 u a12 v + a22 u
ist DA =
u v
Fig. 5: Streckscherung
Man w¨ahle ϕ so, dass a11 v + a21 u = 0, also tan ϕ =
v a21 =− u a11
(mit ϕ = 90o im Fall a11 = 0). Dann besitzt DA Eigenwerte und A = D−1 (DA) ist die Matrix einer Verkettung einer Abbildung aus Fall 1 oder 2 mit einer Drehung.
1
−1
hat keinen Eigenwert. Aus tan ϕ = −1 Beispiel 1: Die Matrix A = 1 1 √ 1 1√ 1 √ −1 − 1 folgt ϕ = 135o , also sin ϕ = 2, cos ϕ = − 2 und somit D = 2 . 1 −1 2 2 2 √ 1 0 beschreibt eine zentrische Streckung mit dem Die Matrix DA = − 2 0 1 √ Streckfaktor − 2. Die Matrix A = D−1 (DA) beschreibt also diese zentrische Streckung, gefolgt von einer Drehung um 225o . Eine affine Abbildung der Ebene mit dem Fixpunkt O ist also • eine Euler-Affinit¨at mit den Sonderf¨allen Parallelstreckung (ein Eigenwert 1) und Schr¨agspiegelung (Eigenwerte 1 und −1), • eine Streckscherung mit den Sonderf¨allen Scherung (Eigenwert 1, Eigenraumdimension 1) und zentrische Streckung (Eigenraumdimension 2), • die Verkettung einer Euler-Affinit¨at oder einer Streckscherung mit einer Drehung mit dem Sonderfall einer reinen Drehung.
V.3 Klassifikation der affinen Abbildungen
111
Hat die affine Abbildung x → Ax + c den Fixpunkt mit dem Ortsvektor p, gilt also Ap + c = p, dann kann man die Abbildung nach der Substitution y = x − p bzw. x = y + p wieder als eine Abbildung mit dem Fixpunkt O betrachten: Die Abbildung y + p → A(y + p) + c hat den Fixpunkt O. Existiert ein weiterer Fixpunkt mit dem Ortsvektor q, dann sind alle Punkte der Geraden durch die beiden Fixpunkte ebenfalls Fixpunkte, es gibt also eine Fixpunktgerade; denn es gilt dann f¨ ur α : x → Ax + c α(p + tq) = p + tq f¨ ur alle t ∈ IR. Hat die affine Abbildung x → Ax + c keinen Fixpunkt, ist also die Gleichung (A − E)x + c = o nicht l¨osbar, dann ist det(A − E) = 0 und somit 1 ein Eigenwert von A. Es handelt sich also um die Verkettung einer Parallelstreckung oder Scherung mit einer Verschiebung. Die Gerade {a + tb | t ∈ IR} ist genau dann eine Fixgerade der affinen Abbildung x → Ax + c, wenn b ein Eigenvektor von A und Aa + c − a ein Vielfaches von b ist. Die letzte Bedingung ist stets erf¨ ullt, wenn der Punkt mit dem Ortsvektor a ein Fixpunkt ist, weil Aa + c − a = o ein Vielfaches von b ist. Eine Gerade durch einen Fixpunkt ist also genau dann eine Fixgerade einer affinen Abbildung, wenn ihr Richtungsvektor ein Eigenvektor der Matrix der affinen Abbildung ist. Dies beachte man im folgenden Beispiel. Beispiel 2: Die affine Abbildung α : x →
F (3, 2), denn das LGS
−4x1 + 6x2 + 0 = 2x2 − 4 =
−3 6 0 hat den Fixpunkt x + 0 3 −4
0 hat die (einzige) L¨osung (3, 2). 0
Die Matrix Eigenwerte orige
zugeh¨
sind Eigenvektoren von α hat die 3 und −3, 1 1 1 1 3 3 und . Die Geraden +t | t ∈ IR und +t | t ∈ IR sind 2 2 1 0 1 0 3 0 −3 6 −1 2 also Fixgeraden. Wegen = ist α die Verkettung einer 0 3 0 3 0 1 zentrischen Streckung, einer Schr¨agspiegelung und einer Verschiebung (Fig. 6). . .... ................................................................................ .... . ........ . . . . .. .. ..... ................. . . . . . . Fixgerade . . . . . . . . .... ..... ........ .... ..... ........... ........ ... .... ... . .... . . . . . . . . . . . . . .. .... .... ............. .... ... .. .... ................ ............. . . . ............................................................................ . . . . . . . . . . . . . . .. . .. .. ... .. .. .. . ... .. ............ ..................... .... ... . .. ...... .. .... .......................................................... . . ... . .. ...................... . ... ........ .. .. ... ... .... ....... ............................. . ... .... ...... ....... ...... ... ................................ . .. . . . .. . .. ........................... ................. ...... ..................................... . . . . . . ....... . . . . 6 ... ... ............. . ... .......... .......................u................................................................................................................................................................................................ .. Fixpunkt Fixgerade -
Fig. 6: Zu Beispiel 3
V Affine Abbildungen
112
¨ ¨ Als Eigenwerte einer Ahnlichkeitsabbildung mit dem Ahnlichkeitsfaktor k kommen nur die Zahlen k oder −k in Frage, da die L¨ange von Vektoren um den Faktor k w¨achst; bei Kongruenzabbildungen k¨onnen also nur die Eigenwerte 1 oder −1 ¨ auftreten. Sind k und −k beides Eigenwerte der Ahnlichkeitsabbildung mit der Matrix A, dann sind die zugeh¨origen Eigenvektoren orthogonal: Aus Af1 = k f1 und Af2 = −k f2 folgt f1 T f2 = 0, denn −k 2 (f1 T f2 ) = (Af1 )T (Af2 ) = f1 T (AT A)f2 = k 2 (f1 T f2 ). Beispiel 3: Die Spaltenvektoren der 1 −5 12 Matrix A = sind ortho13
12
5
gonale Einheitsvektoren; man beachte 52 + 122 = 132 . Die Eigenwerte sind 1 und −1, zu2 −3 , . geh¨orige Eigenvektoren sind 3
2
Die Gerade g durch O und P (2, 3) ist eine Fixpunktgerade, alle zu ihr orthogonalen Geraden sind Fixgeraden. Es handelt sich bei dieser Abbildung um die Spiegelung an der Fixpunktgeraden g (Fig. 7).
x2
6
Fixpunktgerade
.t. .. .. .. . . .. ...... . .. ......t.... .... .... ............. ........... . ....... ..t.. .. ... .. ... . . ... ......... ...... ..t...... . . . ... .. . .... .. .... ... .. ...........t ...... . . ....... . .. ... ....................... . . t. −3 ... ... 2 . . . 2 ...
k Q Q ..... 3 Q...
... . .. . . ...
-
x1
Fig. 7: Spiegelung
Nun betrachten wir affine Abbildungen im Raum. Das charakteristische Polynom der Abbildungsmatrix A hat (unter Ber¨ ucksichtigung der Vielfachheit) drei reelle Nullstellen (Fall 1) oder genau eine reelle Nullstelle (Fall 2). Fall 1 (drei reelle Nullstellen): (1) Hat A drei verschiedene Eigenwerte λ1 , λ2 , λ3 und sind f1 , f2 , f3 zugeh¨orige Eigenvektoren, dann ist die Abbildungsmatrix bez¨ uglich des durch die Eigenvektoren gebildeten Koordinatensystems die Diagonalmatrix mit den Eintr¨agen λ1 , λ2 , λ3 . Es handelt sich bei der Abbildung x → Ax um ein r¨aumliches Analogon einer Euler-Affit¨at, also um die Verkettung von drei Parallelstreckungen. (2) Ist λ1 eine einfache und λ2 eine doppelte Nullstelle des charakteristischen Polynoms und sind ferner f1 , f2 Eigenvektoren zu λ1 , λ2 , dann w¨ahle man einen Vektor g so, dass {f1 , f2 , g } eine Basis von IR3 ist. Mit Ag = rf1 + sf2 + tg ist A(x1 f1 + x2 f2 + x3g ) = (λ1 x1 + rx3 )f1 + (λ2 x2 + sx3 )f2 + tx3g . Die Matrix dieser Abbildung ist
⎛
⎞
λ1 0 r ⎜ ⎟ ⎝ 0 λ2 s ⎠ . 0 0 t
V.3 Klassifikation der affinen Abbildungen
113
Das charakteristische Polynom dieser Matrix hat die Nullstelle t, also ist t = λ2 . Der Eigenraum von λ1 ist eindimensional, denn die Gleichung ⎛
⎞
0 0 r ⎜ ⎟ s x = o ⎝ 0 λ2 − λ 1 ⎠ 0 0 λ 2 − λ1 hat f¨ ur λ1 = λ2 nur die L¨osungen (k 0 0)T mit k ∈ IR. Der Eigenraum von λ2 kann ein- oder zweidimensional sein. a) Ist der Eigenraum von λ2 zweidimensional, dann ist auch g ein Eigenvektor zu uglich der Basis {f1 , f2 , g } lautet die λ2 , also Ag = λ2g und ⎛ somit r =⎞s = 0. Bez¨ λ1
Abbildungsmatrix ⎝ 0 0
0 λ2 0
0 0 ⎠ (spezielle Euler-Affinit¨ at). λ2
b) Ist der Eigenraum dann ist s = 0, da andernfalls der ⎛ von λ2 eindimensional, ⎞ L¨osungsraum von ⎝
λ1 − λ 2 0 0
0 r 0 s ⎠ x = o zweidimensional w¨are. Die Abbildung 0 0
ist die Verkettung zweier Streckscherungen mit einer Parallelstreckung (Fig. 8).
x3
6
O x1
. ...... ........... .. .. ... .... ... ..... .... . .. ..... ....... ...... .................. ... .. ... ...... .........................
........ ................... . . . . . . . . x2 → 3x2 + 2x3 .............. .... 6 .................... ........ . . . . . . . . . . .. .... ................ ............................................. ...................... . x3 → 3x3 . . .................... -
x1 → −4x1 + x3
-
........ .... .... ............... . . . ........ . .... .... . .... ................. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ............................ ... ......... .........
x2
Fig. 8: Verkettung einer Parallelstreckung mit zwei Streckscherungen
In Fig. 8 handelt es sich um die Abbildung mit der Matrix ⎛
⎞
⎛
⎞⎛
⎞⎛
⎞
−4 0 3 −4 0 1 1 0 0 1 0 0 ⎜ ⎟ ⎜ ⎟⎜ ⎟⎜ ⎟ ⎝ 0 3 6 ⎠ = ⎝ 0 1 0 ⎠⎝ 0 3 2 ⎠⎝ 0 1 0 ⎠. 0 0 3 0 0 1 0 0 1 0 0 3 (3) Ist λ dreifache Nullstelle des charakteristischen Polynoms und f ein Eigenvektor zu λ, ferner {f, g , h} eine Basis von IR3 , dann wird x1 f + x2g + x3h durch x → Ax abgebildet auf x1 λf + x2 Ag + x3 Ah, wobei zun¨achst Ag = rf + sg + th und Ah = uf + vg + wh.
V Affine Abbildungen
114
a) Ist der Eigenraum von λ dreidimensional, dann ist g = λ g und Ah = λh, ⎛ A ⎞ λ 0 0 die Abbildungsmatrix bez¨ uglich {f, g , h} lautet also ⎝ 0 λ 0 ⎠ und es handelt 0
0
λ
sich um eine zentrische Streckung. b) Ist der Eigenraum von λ zweidimensional, dann kann man g als weiteren Eigenvektor⎛w¨ahlen, also g = λg . Die Abbildungsmatrix bez¨ uglich {f, g , h} ⎞ A λ
0
u
0
0
w
lautet also ⎝ 0 λ v ⎠. Es ist dann auch w = λ, die Matrix beschreibt daher eine Streckscherung: ⎛
⎞
⎛
⎞⎛
⎞
λ 0 u λ 0 0 1 0 u ⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎝ 0 λ v ⎠ = ⎝ 0 λ 0 ⎠ ⎝ 0 1 v ⎠ 0 0 λ 0 0 λ 0 0 1
mit u =
u v , v = . λ λ
c) Der Eigenraum von λ sei eindimensional, ein Eigenvektor sei f. Es sei {f, g , h} eine Basis von IR3 und Ag = rf + sg + th sowie Ah = uf + vg + wh. Dann hat die Abbildungsmatrix die Gestalt ⎛
⎞
⎛
⎞⎛
⎞
λ r u λ 0 0 1 r u ⎟ ⎜ ⎟⎜ s v ⎠ = ⎝ 0 s v ⎠⎝ 0 1 0 ⎟ ⎠ 0 t w 0 t w 0 0 1
⎜ ⎝ 0
Dabei muss das charakteristische Polynom von
mit r =
s v t w
r u , u = . λ λ
die doppelte Nullstelle λ
2
haben, esmuss also s + w = 2λ und sw − tv = λ gelten. In diesem Fall ist aber (s − λ)x2 + vx3 = 0 nichttrivial l¨osbar, so dass rv = (s − λ)u ist. das LGS tx2 + (w − λ)x3 = 0 Fall 2 (genau eine reelle Nullstelle): Der Eigenraum ist eindimensional, sonst l¨age die Situation a) oder b) aus Fall 1 (3) vor. Die Matrix hat also die Gestalt wie in c) aus Fall 1 (3), wobei aber s v 2 (s+w) < 4(sw −tv) gelten muss, weil das charakteristische Polynom von t w
keine reellen Nullstellen hat. Man kann dabei r = u = 0 erreichen, wenn man g und h um ein geeignetes Vielfaches von f ab¨andert, so dass die Abbildungsmatrix die Gestalt ⎛ ⎞ λ 0 0 ⎜ ⎟ ⎝ 0 s v ⎠ 0 t w erh¨alt: Man ersetze g durch g + xf und h durch h + y f, wobei (x, y) die L¨osung des LGS (λ − s)x − ty + r = 0 −vx + (λ − w)y + u = 0
V.3 Klassifikation der affinen Abbildungen
115
ist. Man beachte, dass dieses LGS die Determinante (λ − s)(λ − w) − vt = λ2 − (s + w)λ + (sw − vt) = 0 hat. Mit Ag = rf + sg + th und Ah = uf + vg + wh ist dann n¨amlich A(g + xf) = (r − sx − ty + xλ)f + s(g + xf) + t(h + y f) = s(g + xf) + t(h + y f), A(h + y f) = (u − vx − wy + yλ)f + v(g + xf) + w(h + y f) = v(g + xf) + w(h + y f).
Aufgaben 1. In V.1 Beispiel 1 haben wir die affine Abbildung betrachtet, welche (1, 2), (5, 3), (3, 9) der Reihe nach auf (3, −5), (11, 1), (7, −2) abbildet. Bestimme die Eigenwerte und die Eigenr¨aume. Von welchem Typ ist diese Abbildung?
2. Eine Euler-Affinit¨at von IR2 habe die Fixgeraden a : x1 + x2 = 1 und b : 3x1 − x2 = 7. Der Streckfaktor bez¨ uglich a sei 2, derjenige bez¨ uglich b sei −3. Welche Gestalt hat die Abbildungsgleichung bez¨ uglich des urspr¨ unglich gegebenen kartesischen Koordinatensystems?
3. Man beschreibe f¨ur t ∈ IR die Abbildung α : x →
2t + 1 2t t x + t t+1 0
von IR2 in IR2 .
4. Im kartesischen Koordinatensystem im Raum sei g die Gerade durch A(1, 1, 0) mit dem Richtungsvektor (2 0 1)T . Man bestimme die Abbildungsmatrix f¨ ur die Drehung um g mit einem Winkel von 30o .
5. Bez¨uglich des kartesischen Koordinatensystems habe eine affine Abbildung ⎛ ⎞ die Matrix A = ⎝
1 −1 1 1 2 0 ⎠. Gibt es eine Basis des Vektoraums IR3 , −3 1 −3
bez¨ uglich welcher die Matrix dieser affinen Abbildung eine Diagonalmatrix ist? (Vgl. Aufgabe 1 in V.2.)
6. Man zeige: Sind alle reellen Eigenwerte von A von 0 verschieden, dann ist A invertierbar und die reellen Eigenwerte von A−1 sind die Kehrwerte der reellen Eigenwerte von A.
VI Kurven und Fl¨ achen zweiter Ordnung VI.1 Die Kegelschnittkurven Die bekannten Kegelschnittkurven in der Ebene haben Gleichungen, in denen die Variablen x1 , x2 quadratisch und linear vorkommen, insbesondere kann das Produkt x1 x2 in einer solchen Gleichung auftreten (Fig. 1). ELLIPSEN
HYPERBELN
x2 6 ...... ..... ....... ... ... ... . .... .. ... .. x1 . ... .... .... .......... 4x21 + x22 = 4
x2
6
-
x1
+
9x22
x2 6 .... .. ..... .... . . . ...... . . ............ .............. .......
− 16x1 − 54x2 = −61
x2 6............. ....... ... . . . . . .... .... ... . ..... . ... x1 . .... .... ............. .......... 29x21 − 42x1 x2 + 29x22 = 100
...x2 6 .. ... . . ... .. ... ... ... ... ... .. x1 .... ..... .......
-
................................ ...... ..... . . . . .... . .. ....
x1
x21 − x22 + 3 = 0
............................. ......... ..... ...... ... . ... s ... .. . ...... . ............. ................. ........ 4x21
PARABELN
x21 − 2x1 − x2 = 1
... x2 6 ... ... ... ... ........ ..................... ......................... x1 ...... ... ... ... ... .
........ ........ . . . . . . . . ...... ..... . . . . .. .... x1 ... ..... ...... ....... ......... ......... .....
x2 6
x21 − 7x2 = 0
x1 x2 = 5
x2 ........ ...... .... .. .. . . ...... .......
6
....... ...... ..... ... .... x1 ...... .......
x21 − x22 + 2x1 = 0
x2 6 ......................... ........ x1 ..... . .... ... ... ... ... ... . x21 + 2x1 x2 + x22 − 3x1 + 3x2 = 0
Fig. 1: Ellipsen, Hyperbeln und Parabeln
Diese Kurven nennt man Kegelschnittkurven oder kurz Kegelschnitte, weil sie als Schnittkurven eines Kegels mit einer Ebene entstehen (Fig. 2). Das wird in VI.2 gezeigt. Einige geometrische Eigenschaften der Kegelschnitte werden in den Aufgaben behandelt.
VI.1 Die Kegelschnittkurven
117
....................................... ......... ... A ............................... A
A
A
A
A A
P P A PP.....................A.. PP .A.. P .P PP ...... PPP..A... .........................P . P . . . . P . ... ..A... ..... PP...P ....... .........
......................
....................................... ......... ... A ............................... A
A A
A A A A A A .... AA A A.... ......AA A ....A ....A. A A .... A ...A. A ....A.........A.......A.A . . . ....... A .... AA ..A.....A.. ...................A.................. A
.............. ... ......... ........ . ... .... ............ . ..... . . . . . . A............C........................... C .... C ... C A.... C ... C A.... C ... C C A.....C.. C
AC C C AC C AC C C C CA C ..C..A...... C C .. C A.. C ....C .........C.. A.... C . . ....... C ... C..A.....C ...............C.. . . . . .......... ..... C C
C
Fig. 2: Kegelschnitte
Definition: Die Punktmenge {(x1 , x2 ) ∈ IR2 | a11 x21 + 2a12 x1 x2 + a22 x22 + a1 x1 + a2 x2 + a = 0} (a11 , a12 , a22 , a, a1 , a2 ∈ IR) nennt man eine Kurve zweiter Ordnung.
Setzt man A =
a11 a12
a x a12 , a = 1 und x = 1 , dann kann man die Gleichung a22 a2 x2
einer Kurve zweiter Ordnung folgendermaßen schreiben: xT A x + aT x + a = 0. F¨ ur die weitere Untersuchung der Kurven zweiter Ordnung (und auch der Fl¨achen zweiter Ordnung in VI.2) wollen wir die Eigenwerte von A betrachten. Die Matrix A ist symmetrisch, d.h. es gilt AT = A. Reelle symmetrische Matrizen haben bez¨ uglich der Eigenwerte und Eigenr¨aume besondere Eigenschaften, welche wir zun¨achst allgemein untersuchen wollen. Im Folgenden gelten auch die komplexen Nullstellen des charakteristischen Polynoms als Eigenwerte, so dass man zwischen reellen und komplexen Eigenwerten unterscheiden muss. Satz 1: Ist die Matrix A ∈ IRn,n symmetrisch, dann sind alle Eigenwerte von A reell und Eigenvektoren zu verschiedenen Eigenwerten sind orthogonal. Ist dabei λ ein r-facher Eigenwert von A, dann hat der zugeh¨orige Eigenraum die Dimension r und besitzt eine Orthonormalbasis aus Eigenvektoren von A. Beweis: Mit a, a bzw. A bezeichnen wir die zu a ∈ C, a ∈ Cn bzw. A ∈ Cn,n komplex-konjugierten Elemente, wobei das Konjugieren von Vektoren und Matrizen elementweise zu verstehen ist. Der Fundamentalsatz der Algebra besagt, dass eine algebraische Gleichung (Polynomgleichung) vom Grad n im K¨orper C der komplexen Zahlen genau n L¨osungen hat, wenn man mehrfache L¨osungen mit ihrer Vielfachheit z¨ahlt. Also hat A in C genau n Eigenwerte, wenn man
VI Kurven und Fl¨achen zweiter Ordnung
118
mehrfache Eigenwerte mit ihrer Vielfachheit z¨ahlt. Ist λ ein Eigenwert mit dem Eigenvektor u ∈ Cn , so gilt wegen A = A mit Au = λu auch Au = λ u. Also ist λ (u T u) = u T (λu) = u T A u = (A u)T u = (λ u)T u = λ (u T u). 0 ist daher λ = λ, also λ ∈ IR. Sind λ, μ verschiedene Wegen u T u = |u|2 = Eigenwerte und u, v zugeh¨orige Eigenvektoren, dann ist μ(u T v ) = u T (Av ) = u T A v = (A u)T v = λ(u T v ), wegen μ = λ also u T v = 0. Nun sei λ ein r-facher Eigenwert und u1 ein normierter Eigenvektor zu λ, ferner {u1 , v2 , . . . , vn } eine Orthonormalbasis von IRn . Wegen uT1 Au1 = uT1 (λu1 ) = λuT1 u1 = λ und viT Au1 = viT (λu1 ) = λviT u1 = 0 (i = 2, 3, . . . , n) ⎛
ist dann (u1 v2 . . . vn )T A (u1 v2
⎜ . . . vn ) = ⎜ ⎜ ⎝
λ 0 .. .
...
0
A
0
⎞ ⎟ ⎟ ⎟, ⎠
0
wobei A ∈ IRn−1,n−1 wieder symmetrisch ist und eine lineare Abbildung von v2 , . . . , vn in sich beschreibt. Ist E bzw. E die Einheitsmatrix aus IRn,n bzw. IRn−1,n−1 , dann gilt det(A − xE) = (x − λ)det(A − xE ). Ist r > 1, dann ist λ auch ein Eigenwert von A ; ein zugeh¨origer Eigenvektor u2 ∈ IRn−1 kann als normiert angenommen werden. Durch Hinzuf¨ ugen einer ersten Koordinate 0 erg¨anzen wir ihn zu einem normierten Vektor u2 ∈ IRn . Wegen u2 ∈ v2 , . . . , vn ist dabei u2 orthogonal zu u1 . Wir erg¨anzen {u1 , u2 } zu einer Orthonormalbasis {u1 , u2 , w 3 , . . . , wn } von IRn . Es ist dann ⎞ ⎛ 3 . . . w n )T A (u1 u2 w 3 (u1 u2 w
⎜ ⎜ ... w n) = ⎜ ⎜ ⎜ ⎝
λ 0 0 .. .
0 λ 0 .. .
0
0
0 0
... ...
A
0 0 ⎟ ⎟ ⎟ ⎟, ⎟ ⎠
n−2,n−2
wobei A ∈ IR wieder symmetrisch ist. F¨ uhrt man dieses Verfahren r-mal aus, dann ergibt sich det(A − xE) = (x − λ)r det(A(r) − xE (r) ) mit A(r) , E (r) ∈ IRn−r,n−r , wobei A(r) symmetrisch ist. Die r orthonormierten Eigenvektoren spannen den gesamten Eigenraum von λ auf, da die Summe der Dimensionen der Eigenr¨aume nicht gr¨oßer als n sein kann. 2 Folgerung aus Satz 1: Zu jeder symmetrischen Matrix A ∈ IRn,n gibt es eine Orthonormalmatrix U ∈ IRn,n , so dass ⎛
⎜ U T AU = ⎜ ⎜ ⎝
λ1 0 .. .
0 λ2 .. .
... ...
0 0 .. .
0
0
...
λn
⎞
⎟ ⎟ ⎟. ⎠
VI.1 Die Kegelschnittkurven
119
In dieser Diagonalmatrix sind λ1 , λ2 , . . . , λn die Eigenwerte von A entsprechend ihrer Vielfachheit (also λ1 = λ2 = . . . = λr , falls λ1 Eigenwert der Vielfachheit r ist) und die Spaltenvektoren von U sind zugeh¨orige Eigenvektoren gem¨aß der Konstruktion im Beweis von Satz 1. Nun kehren wir zur Untersuchung der Kurven zweiter Ordnung zur¨ uck, wobei das Ziel ist, durch eine Koordinatentransformation mit einer Orthonormalmatrix den quadratischen Term x T A x zu vereinfachen, indem man A in eine Diagonalmatrix verwandelt. Die Orthonormalmatrix vermittelt eine Kongruenzabbildung, bildet also die gegebene Kurve auf eine zu ihr kongruente Kurve ab. Besitzt A genau einen (also doppelten) Eigenwert λ, dann hat die Diskriminante der quadratischen Gleichung det(A − xE) = 0 bzw. x2 − (a11 + a22 )x + (a11 a22 − a212 ) = 0 den Wert 0, es ist also (a11 + a22 )2 − 4(a11 a22 − a212 ) = (a11 − a22 )2 + 4a212 = 0, also a12 = 0 und a11 = a22 = λ. Die Kurvengleichung l¨asst sich im Fall λ = 0 damit umformen zu (x1 − b1 )2 + (x2 − b2 )2 = b. Dabei wurde das Verfahren der quadratischen Erg¨anzung benutzt, welches auf der binomischen Formel beruht: x2 − 2bx = (x − b)2 − b2 . Diese Umformung wird im Folgenden h¨aufiger verwendet. √ F¨ ur b > 0 ist die Kurve ein Kreis um (b1 , b2 ) mit dem Radius b; f¨ ur b = 0 wird nur der Punkt (b1 , b2 ) dargestellt, f¨ ur b < 0 die leere Menge. Im Fall λ = 0 wird eine Gerade (falls a = o), die leere Menge (falls a = o und a = 0) oder die gesamte Ebene (falls a = o und a = 0) dargestellt. Besitzt A zwei verschiedene Eigenwerte λ1 , λ2 , sind ferner u1 , u2 zugeh¨orige orthonormierte Eigenvektoren und ist U = (u1 u2 ) , dann liefert die Kongruenzabbildung x = U T x bzw. x = Ux (beachte U T U = E)
T
x Ax = x
T
T
U AUx = x
T
λ1 0 2 x = λ1 x2 1 + λ2 x2 . 0 λ2
Die Gleichung der Fl¨ache zweiter Ordnung ist dann
λ1 x21
+
λ2 x22
+ b1 x1 + b2 x2 + a = 0 mit
b1 = U T a, b2
wobei wir zur Vereinfachung wieder x1 , x2 statt x1 , x2 geschrieben haben.
VI Kurven und Fl¨achen zweiter Ordnung
120
Ist ein Eigenwert 0, etwa λ1 = 0, λ2 = 0, dann lautet im Fall b1 = 0 die Gleichung (x2 − c2 )2 = c1 (x1 − c3 ). Diese stellt eine Parabel mit dem Scheitelpunkt (c3 , c2 ) dar, deren Achse parallel zur x1 - Achse ist. Im Fall b1 = 0 lautet die Gleichung (x2 − c2 )2 = c und stellt ein Geradenpaar, eine Gerade oder die leere Menge dar, je nachdem ob c > 0, c = 0 oder c < 0 ist. Sind beide Eigenwerte λ1 , λ2 von 0 verschieden, dann kann man die Gleichung umformen zu λ1 (x1 − c1 )2 + λ2 (x2 − c2 )2 = c. Ist c = 0, dann wird ein Punkt oder ein Geradenpaar dargestellt, je nachdem ob λ1 , λ2 gleiche oder verschiedene Vorzeichen haben. Ist c = 0, dann wird je nach Vorzeichen von λ1 , λ2 und c eine Ellipse, eine Hyperbel oder die leere Menge dargestellt. Abgesehen von den Entartungsf¨allen (leere Menge, Punkt, Gerade, Geradenpaar, ganze Ebene) ist eine Kurve zweiter Ordnung also eine Kegelschnittkurve (Ellipse, Hyperbel, Parabel). In einem geeigneten Koordinatensystem haben diese Kegelschnittkurven die in Fig. 3 angegebenen Standardgleichungen; die Bedeutung der Parameter a, b bzw. p entnehme man den Zeichnungen. Ist der Mittelpunkt der Ellipse bzw. der Hyperbel und der Scheitel der Parabel nicht (0, 0), sondern (m1 , m2 ), dann ersetze man in den Standardgleichungen x1 durch x1 − m1 und x2 durch x2 − m2 . ELLIPSE
HYPERBEL
PARABEL
x21 x22 + 2 =1 a2 b
x21 x22 − 2 =1 a2 b
x22 = 2px1
x2
6
............................................ ....... b ......... . .... ...... a ..... ....................................... ... ... . x ..... .... 1 . . ......... . . . . ............................
x2 ... . ........... ..... ....... .. .. .. .......6 .... ..... ........ .. .. ............ ..... ... .. .... ..... .... b ..... .... ... ...... .... ..... .. . a ... ................................ ..... ... .... . .. ... ..... . ...... ....... x1 . . . . . . . . . .. .. . .... ..... .. .. .. .. .. .. .............................. ............ ... .
x2
....... ........ . . . . . . 6 .... . .. .......... .... .... p ... .. ... Q k .... Q p ..... 2 ...... ........ ........ .......
-
x1
Fig. 3: Standardgleichungen der Kegelschnitte
Alle Ellipsen, alle Hyperbeln bzw. alle Parabeln sind jeweils zueinander affin: Man setze x1 = ax1 , x2 = bx2 bzw. x1 = px1 , x2 = x2 . Bis auf Affinit¨at lauten die Standardgleichungen der nicht-ausgearteten Kegelschnitte also x21 + x22 = 1,
x21 − x22 = 1,
x22 = 2x1 .
Zur Klassifizierung der Kegelschnitte ist die Theorie der Eigenwerte nicht unbedingt notwendig, es wird eigentlich mit Kanonen auf Spatzen geschossen. Man
VI.1 Die Kegelschnittkurven
121
k¨onnte einfach mit quadratischen Erg¨anzungen arbeiten: Beispielsweise k¨onnte man f¨ ur a11 = 0 mit der Umformung a11 x21
+ 2a12 x1 x2 +
a22 x22
= a11
a12 x1 + x2 a11
2
a2 + a22 − 12 x22 a11
a
beginnen und dann die neuen Koordinaten x1 = x1 + 12 , x2 = x2 einf¨ uhren usw. a11 Andererseits ist die Verwendung der Eigenwerttheorie als Vorbereitung auf die Untersuchungen im n¨achsten Abschnitt n¨ utzlich.
Aufgaben 1. Es sei eine affine Abbildung x → Cx der Ebene gegeben. Man bestimme
Vektoren u, v = o mit u ⊥ v und Cu ⊥ Cv . ( Man findet genau ein solches invariantes Rechtwinkelpaar. Wird ein Kreis um O durch die affine Abbildung x → Cx auf eine Ellipse abgebildet, welche kein Kreis ist, dann findet man stets genau zwei orthogonale Kreisdurchmesser, die auf zwei orthogonale Ellipsendurchmesser abgebildet werden; diese Ellipsendurchmesser sind die Hauptachsen der Ellipse. Vgl. hierzu Aufgabe 2.)
2. Eine Ellipse ist das affine Bild eines Kreises. Die Bilder von zwei rechtwinkligen Durchmessern eines Kreises nennt man konjugierte Durchmesser der Ellipse. Fig. 4 zeigt eine Hauptachsenkonstruktion f¨ ur eine Ellipse mit zwei gegebenen konjugierten Durchmessern. Man erl¨autere diese Konstruktion.
3. Die Ellipse mit dem Mittelpunkt O und den Halbachsenl¨angen a, b entsteht aus dem Kreis um O mit dem Radius a durch Streckung an der x1 -Achse parb allel zur x2 -Achse mit dem Faktor .
....... ............................ .. ....... ....... ......... ..... ..........r........ .....r... ... .. .. ... .. ... .. .. ... ....... ........ .................................... .... . . .....................................................s.......................................................... . .......... . .. ..... .. .. . . . . . .... ... ... ...... ... ..........r........... ..... ..... .... .................. .r............. . .. . ... .r ... ......... .. ........ .. ......................................................r...r..............................................................r...........................................................r........ . ........ ... ......... ............r............. ... .... ............ ... ............ .. .. . ...........................................................s........................................................ .. ......r.................. ....... .......r......................... ... .................. .. .................... ... ... Fig. 4: Hauptachsenkonstruktion
a
Zwei Ellipsendurchmesser heißen konjugiert, wenn sie als Bilder orthogonaler Kreisdurchmesser entstehen; sie bestimmen konjugierte Richtungen. Man beweise: a) Die Mittelpunkte der Sehnen, welche eine Ellipse aus einer Parallelenschar ausschneidet, liegen auf dem zu ihrer Richtung konjugierten Durchmesser der Ellipse. b) Das Produkt der Steigungen konjugierter Richtungen ist −
2 b . a
VI Kurven und Fl¨achen zweiter Ordnung
122
4. Ellipsen, Hyperbeln und Parabeln lassen sich als Ortskurven definieren. Man zeige: a) Eine Ellipse ist der geometrische Ort aller Punkte, die zu zwei gegebenen Punkten die gleiche Abstandssumme haben (Fig. 5). b) Eine Hyperbel ist der geometrische Ort aller Punkte, die zu zwei gegebenen Punkten die gleiche Abstandsdifferenz haben (Fig. 6). c) Eine Parabel ist der geometrische Ort aller Punkte, die zu einem gegebenen Punkt und einer gegebenen Geraden den gleichen Abstand haben (Fig. 7). P . .. ...... P P ..... .....................................................t............ .... ...t ...................................t.................. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .... ........ ... ............. .. . .... ....... .. .......... ...... ..... ... . .. ...... ........... ........... . ... ..... . . . .t .. . . . . t t . ..... ..t......... . . . F1 . ... F2 l ... ..... ..tF . ...... F . . . . . F .. .... .........1. .. .......... .. ..................................................2.... ..... .......... ... .. .... ........... ...... .. ......... Fig. 5: Ellipse
Fig. 6: Hyperbel
Fig. 7: Parabel
5. Die Tangente an den Kreis um O mit dem Radius a im Kreispunkt P (p1 , p2 )
hat offensichtlich die Gleichung p1 x1 + p2 x2 = a2 . Wieso folgt daraus un-
mittelbar, dass die Tangente an die Ellipse mit der Gleichung p x
p x
x21 x2 + 22 = 1 2 a b
im Ellipsenpunkt P (p1 , p2 ) die Gleichung 1 2 1 + 2 2 2 = 1 hat? Wie lautet a b die Gleichung der Polaren bez¨ uglich obiger Ellipse zum Pol P (p1 , p2 )?
6. Die Punkte F1 , F2 bzw. F der Ellipse, Hyperbel bzw. Parabel in Aufgabe
4 (vgl. Fig. 5, 6, 7) heißen Brennpunkte der betreffenden Kurve. Man zeige: Ein von einem Brennpunkt ausgehender Strahl wird an der Kurve so reflektiert, dass er durch den anderen Brennpunkt bzw. bei der Parabel parallel zur Achse verl¨auft. ........................................................ . .. ......... .................................................................................. 7. Die Scheitelkr¨ummungskreise ei........ .... ... ....................... ......... .. . . . . . . . . . ........... ... . ........ .. ... ner Kegelschnittkurve approxi......... ... ............... .................... . . . ............ ... ... .... .......... .....r.. mieren die Kurve in den Scheiteln . . . . . ... ...............................s................................................................................... ..... .. bestm¨oglich. . . . . ... .. ..... .... ... ... ... ......... ... .... a) Man bestimme diese Kreise . . . . ... .. ... .............. .... .. . f¨ ur die Kegelschnittkurven, wel....... .... .... ................... ...... .... . . . . . . . ........................................................................................... che durch ihre Standardgleichung ..... ..s gegeben sind. b) Man begr¨ unde die Konstruktion der Scheitelkr¨ ummungskreise der Ellipse in Fig. 8.
Fig. 8: Scheitelkr¨ ummungskreise
VI.2 Fl¨achen zweiter Ordnung
123
VI.2 Fl¨ achen zweiter Ordnung Definition 1: Die Punktmenge {(x1 , x2 , x3 ) ∈ IR3 | a11 x21 + a22 x22 + a33 x23 + 2a12 x1 x2 + 2a13 x1 x3 + 2a23 x2 x3 +a1 x1 + a2 x2 + a3 x3 + a = 0} (a11 , a22 , a33 , a12 , a13 , a23 , a1 , a2 , a3 , a ∈ IR) heißt eine Fl¨ache zweiter Ordnung. ⎛
a11 Setzt man A = ⎝ a12 a13
a12 a22 a23
⎞ ⎛ ⎞ ⎛ ⎞ a13 a1 x1 a23 ⎠, a = ⎝ a2 ⎠ und x = ⎝ x2 ⎠, dann kann man a33 a3 x3
die Gleichung einer Fl¨ache zweiter Ordnung folgendermaßen schreiben: xT A x + aT x + a = 0 Da A symmetrisch ist, existiert eine Orthonormalmatrix U mit ⎛
⎞
λ1 0 0 ⎟ U T AU = ⎜ ⎝ 0 λ2 0 ⎠ , 0 0 λ3 wobei λ1 , λ2 , λ3 die Eigenwerte von A und die Spaltenvektoren von U zugeh¨orige Eigenvektoren sind (vgl. Folgerung aus Satz 1 in VI.1). Die Orthonormalmatrix U vermittelt eine Kongruenzabbildung. Mit x = U T x bzw. x = Ux ist 2 2 xT Ax = x T U T AU x = λ1 x2 1 + λ2 x2 + λ3 x3 .
Mit b = U T a lautet die Gleichung der Fl¨ache dann λ1 x21 + λ2 x22 + λ3 x23 + b1 x1 + b2 x2 + b3 x3 + a = 0, wenn man statt x1 , x2 , x3 zur Vereinfachung wieder x1 , x2 , x3 schreibt. Wir klassifizieren nun die Fl¨achen zweiter Ordnung nach der Anzahl der Eigenwerte, welche 0 sind. Sind alle Eigenwerte 0, dann beschreibt die Gleichung eine Ebene (falls b = o), die leere Menge (falls b = o, a = 0) oder den gesamten Raum (falls b = o, a = 0). Sind genau zwei der Eigenwerte 0, etwa λ1 = 0, λ2 = λ3 = 0, dann l¨asst sich die Gleichung umformen zu (x1 − c1 )2 = c2 x2 + c3 x3 + c. Ist (c2 , c3 ) = (0, 0), dann beschreibt die Gleichung ein Paar paralleler Ebenen (falls c > 0), eine Ebene (falls c = 0) oder die leere Menge (falls c < 0). Ist
VI Kurven und Fl¨achen zweiter Ordnung
124
(c2 , c3 ) = (0, 0), etwa c2 = 0, dann erh¨alt die Gleichung mit der Koordinatenc transformation x1 = x1 − c1 , x2 = x2 + , x3 = x3 (Verschiebung) die Form c2
ur wir wieder ohne Striche x2 1 = d2 x2 + d3 x3 , wof¨
x21 = d2 x2 + d3 x3 schreiben. Die Kongruenzabbildung x → x mit
x1 = x1 ,
x2 1 = x3 d
d2 −d3 d3 d2
x2 x3
mit d =
d22 + d23
(Drehung der x2 x3 -Ebene um die x1 -Achse) ergibt x2 ur wir wieder 1 +dx2 = 0, wof¨
x21 + dx2 = 0 schreiben. Diese Gleichung beschreibt einen parabolischen Zylinder. Ist genau ein Eigenwert 0, etwa λ1 λ2 = 0, λ3 = 0, dann erh¨alt die Gleichung nach einer Verschiebung des Koordinatensystems die Form λ1 x21 + λ2 x22 + c3 x3 + c = 0. Ist c3 = 0, dann beschreibt diese Gleichung • eine Gerade, falls c = 0 und λ1 λ2 > 0, • ein Ebenenpaar, falls c = 0 und λ1 λ2 < 0, • die leere Menge, falls cλ1 > 0 und cλ2 > 0, • einen elliptischen Zylinder, falls cλ1 < 0 und cλ2 < 0 • einen hyperbolischen Zylinder, falls cλ1 · cλ2 < 0. Ist c3 = 0, dann ergibt sich nach einer geeigneten Verschiebung des Koordinatensystems die Gleichung λ1 x21 + λ2 x22 + c3 x3 = 0. Sie beschreibt ein elliptisches Paraboloid (falls λ1 λ2 > 0) oder ein hyperbolisches Paraboloid (falls λ1 λ2 < 0). Ist kein Eigenwert 0, dann ergibt sich nach einer geeigneten Verschiebung die Gleichung λ1 x21 + λ2 x22 + λ3 x23 + c = 0. Ist c = 0, dann beschreibt die Gleichung einen Punkt, falls alle Eigenwerte das gleiche Vorzeichen haben, oder einen Kegel (genauer einen elliptischen Doppelkegel) in den anderen F¨allen. Ist c = 0, dann kann man die Gleichung auf die Form μ1 x21 + μ2 x22 + μ3 x23 = 1 bringen. Diese Gleichung beschreibt die leere Menge (falls alle Koeffizienten μ ≤ 0 sind), ein zweischaliges Hyperboloid (falls genau ein Koeffizient μ positiv ist),
VI.2 Fl¨achen zweiter Ordnung
125
ein einschaliges Hyperboloid (falls genau zwei Koeffizienten μ positiv sind) oder ein Ellipsoid (falls alle Koeffizienten μ positiv sind). Mit den ausgef¨ uhrten Transformationen des Koordinatensystems hat man erreicht, dass m¨oglichst viele Koordinatenachsen und -ebenen Symmetrieachsen und -ebenen der Fl¨achen zweiter Ordnung werden. Man spricht daher bei diesen Transformationen auch von Hauptachsentransformationen. Eine Fl¨ache zweiter Ordnung nennt man auch eine Quadrik. In Fig. 3 sind die neun interessanten Quadriken bez¨ uglich ihrer Standardgleichungen dargestellt. Das Ellipsoid, die Paraboloide (elliptisch oder hyperbolisch) und die Hyperboloide (einschalig oder zweischalig) nennt man nicht-ausgeartete Quadriken, den Kegel und die Zylinder (elliptisch, parabolisch oder hyperbolisch) nennt man ausgeartete Quadriken. Die ausgearteten Quadriken, aber auch das hyperbolische Paraboloid und das einschalige Hyperboloid enthalten Geradenscharen; man nennt solche Fl¨achen Regelfl¨achen. Vgl. VI.3. Die Schnittkurve einer Ebene mit einer Fl¨ache zweiter Ordnung ist stets eine Kurve zweiter Ordnung: Durch eine geeignete Transformation des Koordinatensystems kann man die Schnittebene stets als die x1 x2 -Ebene ansehen (Gleichung x3 = 0); setzt man in der allgemeinen Gleichung f¨ ur eine Fl¨ache zweiter Ordnung f¨ ur x3 die Zahl 0 ein, dann ergibt sich die Gleichung einer Kurve zweiter Ordnung in der x1 x2 -Ebene. Die Schnittkurven paralleler Ebenen mit einer Quadrik sind ¨ahnlich zueinander (Aufgabe 12). Die Bezeichnungen elliptisch, hyperbolisch, parabolisch kennzeichnen die Art der Schnittkurven der entsprechenden Fl¨ache mit einer Ebene. Die Hyperboloide in Fig. 3 sind beide elliptisch und k¨onnen zusammen mit dem Doppelkegel als verwandt betrachtet werden (Aufgabe 8). Ellipsen treten auf als Schnittlinien einer Ebene mit einem Ellipsoid, einem elliptischen Paraboloid, einem (einschaligen oder zweischaligen) Hyperboloid, einem Kegel und einem elliptischen Zylinder. Hyperbeln treten auch als Schnittlinien einer Ebene mit einem hyperbolischen Paraboloid, einem (einschaligen oder zweischaligen) Hyperboloid, einem Kegel und einem hyperbolischen Zylinder auf. Parabeln treten auf als Schnittlinien einer Ebene mit einem (elliptischen oder hyperbolischen) Paraboloid, einem Kegel und einem parabolischen Zylinder. Die einzige Quadrik, bei der alle drei Kegelschnitte Ellipse, Parabel und Hyperbel auftreten, ist in der Tat der Kegel. Mit Hilfe einer affinen Abbildung lassen sich die Gleichungen der Quadriken weiter vereinfachen. Bis auf Affinit¨at gibt es also folgende nicht-ausgeartete Quadriken: x21 + x22 + x23 = 1,
x21 + x22 − x23 = 1,
x21 + x22 − x3 = 0,
x21 − x22 − x23 = 1,
x21 − x22 − x3 = 0.
VI Kurven und Fl¨achen zweiter Ordnung
126
Elliptisches Paraboloid
Ellipsoid ... x3 ............................... ...... .............. ................s...... .................... ... . . ... .. . .............s... ........... ......... ....... ... ..... ...... ...... ............................ ........c ..... ........................s............... . . . . . . .... ....................................................................................................................................................... ............s............................ ... .................. ....... ..... .......... ... . ........... a .. . ).. ......... ...... ... ... ......... ...... ... ...b..........................s................ . . . . . . . ..... x1 ............. ... ... ... .....s....... ............ ... .......................... .....s ................ x2 ..
Hyperbolisches Paraboloid
x3 ..................... .....................6 . . ...... . . . . .. ......... ........................ ........................... .... ... .. ... . . ... .. ... ... .... . . ..... .... .....H ....... ... ....H j x2 H x1
... x .... ...... 63 ... ...... ......... .... .. ....... .... ....... . . . . . ... . .. q........... . .. . .. x1 ... .. . .. ....... x2 .................................. .......... ... ......
x21 x22 + 2 − x3 = 0 a2 b
x21 x22 − 2 − x3 = 0 a2 b
Einschaliges Hyperboloid
Zweischaliges Hyperboloid
Doppelkegel
x3 6 ...................................................... ........ .. ..... ..... . .................. . . . . . . . . . . . . . .... ....................... ... ... . .................................. ..... H ..... ....... ..... ... .........H . ......H .. x2 H .. x1 ... ................................................H j . ........H . . . . ..... .. . ...... .......... .... . . . .......................................... . x21 x22 x23 + 2 − 2 =1 a2 b c
x3 6......................... ......... ...... .... .. ... ... ... ... ... .. .. . .................................... . . . . .... ..................... @ ....................... ........... @ .... ..... .. @ .... .. @ R ... x2 ... . .... ... .. ..... . . ...... .. x 1 .................. x21 x22 x23 − 2 − 2 =1 a2 b c
x3 6 ...................................................... ........ ... ....... ..... . .................... . . . . . . . . . . . . . ....... ..................... ...... ....... .. ....... ........... . . . ...... H. ....H ...... .H .......H ... . . . . . x1 .... x2 . H ......................................................H .......j .. ...... ....... .. ...... ..... . ................. . . . . . . . . . . . . .................... x21 x22 x23 + 2 − 2 =0 a2 b c
Elliptischer Zylinder
Parabolischer Zylinder
Hyperbolischer Zylinder
x21 x22 x23 + 2 + 2 =1 a2 b c
x .......3................ ..................6 . . . . . . . ....... . . . ... ... ....... ... .............................................................. ... .. ............................................................... .... .. ..... ......... HHH ........... . . . . . . . . . x2 x1 ................................H H
j H
x21 a2
+
x22 b2
=1
x3 6
........................... ..... ... ... ... ... ... .... .. ... ..................... .... . .. H ...H .... ..... ...H ....... HHx2 x1 j H x21
− 2px2 = 0
x3 6....... ............................... ... ... ... . .. ...................... ... . . . ........... . .. .... ........ ... ... .... ... .. . ... ... ...................... ... .................... ... .... H ......... HH ..... ...... H x2 ... HH x1 j x21 x22 − 2 =1 a2 b
Fig. 1: Quadriken und ihre Standardgleichungen
VI.2 Fl¨achen zweiter Ordnung
127
Beispiel 1: Es soll die Fl¨ache mit der Gleichung 4x21 + 2x22 + 3x23 + 4x1 x3 − 4x2 x3 + 12x1 + 30x2 + 36x3 + 2 = 0 untersucht werden. Die Matrix ⎛
⎞
4 0 2 2 −2 ⎟ A=⎜ ⎝ 0 ⎠ 2 −2 3 hat das charakteristische Polynom det(A − xE) = −x3 + 9x2 − 18x mit den Nullstellen λ1 = 0, λ2 = 3, λ3 = 6, dies sind also die Eigenwerte von A. Normierte Eigenvektoren dazu sind ⎛
1 u1 = ⎜ ⎝ 3
⎞
⎛
⎞
⎛
⎞
−1 2 2 1 1 ⎟ ⎟ 2 ⎟ u2 = ⎜ u3 = ⎜ ⎠, ⎝ 2 ⎠, ⎝ −1 ⎠ . 3 3 2 −1 2
Mit der Matrix U = (u1 u2 u3 ) ergibt sich ⎛
⎞
0 0 0 ⎜ ⎟ U T AU = ⎝ 0 3 0 ⎠ 0 0 6
⎛
⎞
⎛
⎞
12 40 ⎜ ⎟ ⎜ ⎟ und U T ⎝ 30 ⎠ = ⎝ 16 ⎠ . 36 22
Es ergibt sich die Gleichung 3x32 + 6x23 + 40x1 + 16x2 + 22x3 + 2 = 0 bzw.
8 2 11 2 79 + 6 x3 + + 40 x1 − = 0. 3 6 80 Bis auf eine Verschiebung des Koordinatensystems handelt es sich also um die Fl¨ache mit der Gleichung 3 x2 +
x22 + 2x23 +
40 x1 = 0. 3
Dies ist die Gleichung eines elliptischen Paraboloids. Die Standardgleichung aus Fig. 1 ergibt sich durch Ersetzung von x1 durch −x1 (Spiegeln an der x2 x3 -Ebene), 40 Division der Gleichung durch , 3 Vertauschung der Variablen (x1 , x2 , x3 ) → (x3 , x1 , x2 ).
VI Kurven und Fl¨achen zweiter Ordnung
128
Aufgaben 1. Man bestimme a, b so, dass 2x21 + 2ax1 x2 + 2y22 − 7x1 + bx2 + 3 = 0 ein Paar paralleler Ebenen darstellt.
2. Beweise, dass das einschalige Hyperboloid aus Fig. 1 die beiden folgenden Geradenscharen enth¨alt:
√ ⎞ ⎛ ⎞ at −a 1 − t2 ⎜ √ ⎟ ⎜ ⎟ gt : x = ⎝ b 1 − t2 ⎠ + r ⎝ bt ⎠ ⎛
c ⎛ ⎞ ⎛ √ ⎞ at a 1 − t2 √ ⎟ ⎜ ⎟ ht : x = ⎜ bt ⎝ −b 1 − t2 ⎠ + r ⎝ ⎠ c 0
(r ∈ IR, −1 ≤ t ≤ 1),
0
(r ∈ IR, −1 ≤ t ≤ 1).
3. Es sei P (p1 , p2 , p3 ) ein Punkt des in Fig. 1 angegebenen hyperbolischen Paraboloids (Sattelfl¨ache). Beweise, dass die Gerade durch P mit dem Richtungsvektor (a2 b ab2 2(bp1 − ap2 ))T auf dieser Sattelfl¨ache liegt.
4. Die Gleichung
x21 x2 x2 + 22 − 23 = 0 beschreibt eine Kegelfl¨ ache (Fig. 1). a2 b c
Welche Geraden liegen auf ihr?
5. Die Gerade durch die Punkte A(0, 2, 0) und B(2, 2, 3) rotiere um die x1 -Achse. Man zeige, dass dadurch ein einschaliges Hyperboloid entsteht.
6. Die Tangentialebene an das Ellipsoid mit der Gleichung im Punkt B(b1 , b2 , b3 ) hat die Gleichung
x21 x2 x2 + 22 + 23 = 1 a2 b c
b1 x1 b2 x2 b3 x3 + 2 + 2 = 1. a2 b c
Beweise dies mit Hilfe einer geeigneten affinen Abbildung des Raumes.
7. a) Unter welchen Bedingungen f¨ur die Parameter a, b, c handelt es sich bei den einzelnen Quadriken in Fig. 1 um einen Rotationsk¨orper? b) Man bestimme c so, dass der Kegel mit der Gleichung x21 −2x1 x2 +cx23 = 0 ein Rotationskegel (Kreiskegel) ist, und gebe die Rotationsachse an.
8. Welche Fl¨ache wird durch x21 + x22 − x23 = ε f¨ur ε ∈ {−1, 0, 1} dargestellt? 9. Man bestimme den Typ der Quadrik mit der Gleichung a) x21 + x22 + x23 − 2x1 x2 + 2x2 x3 + 2x1 x3 − 1 = 0, b) x21 + x22 + x23 + 2x1 x3 + 2x2 + 1 = 0, c) 3x21 + 3x22 + 3x23 + 2x1 x2 + 2x1 x3 − 2x2 x3 + 2x1 − 2x2 − 2x3 + 3 = 0, d) 7x21 + 6x22 + 5x23 − 4x12 − 4x23 − 6 = 0.
VI.3 Regel߬achen
129
10. Welche Gestalt hat die Fl¨ache mit der Gleichung x21 + (2m2 + 1)(x22 + x23 ) − 2x1 x2 − 2x1 x3 − 2x2 x3 = 2m2 − 3m + 1 in Abh¨angigkeit vom Parameter m ∈ IR ?
11. Die Ebene mit der Gleichung 3x1 +3x2 −x3 = 7 schneidet das hyperbolische Paraboloid mit der Gleichung 2x21 − 5x22 − 10x3 = 0 in einer Kurve zweiter Ordnung. Man beschreibe diese Kurve. (Bestimme zun¨achst eine Gleichung f¨ ur die Projektion dieser Schnittkurve in die x1 x2 -Ebene.)
12. Man zeige, dass die Schnittkurven paralleler Ebenen mit einer Quadrik zueinander ¨ahnlich sind. Warum gen¨ ugt es, die Schnittebenen parallel zur x1 x2 -Ebene zu betrachten?
VII.3 Regelfl¨ achen Eine von einer Geradenschar (lat. regulus) erzeugte Fl¨ache heißt Regelfl¨ache. Einfache Beispiele daf¨ ur sind die Zylinder und die Kegel. Aber auch die hyperbolischen Paraboloide und die einschaligen Hyperboloide sind Regelfl¨achen, wie wir nun zeigen wollen. Da eine Geradenschar bei einer affinen Abbildung wieder in eine Geradenschar u ¨bergeht und auch eine Fl¨ache zweiter Ordnung wieder in eine solche vom gleichen Typ abgebildet wird, gen¨ ugt es, die Fl¨achengleichungen in ihrer affinen Standardform zu betrachten. (Dass sich der Typ einer Quadrik bei einer affine Abbildung nicht ¨andert, erkennt man durch Betrachtung der verschiedenen affinen Abbildungen, vgl. VI.) Wir betrachten das hyperbolische Paraboloid (Sattelfl¨ache) mit der Gleichung x21 − x22 − x3 = 0. Die Gerade a + u liegt genau dann auf der Fl¨ache, wenn ur alle t ∈ IR, (a1 + tu1 )2 − (a2 + tu2 )2 − (a3 + tu3 ) = 0 f¨ wenn also a21 − a22 − a3 = 0, 2a1 u1 − 2a2 u2 − u3 = 0, u21 − u22 = 0. (Ein Polynom ist genau dann das Nullpolynom, wenn alle Koeffizienten 0 sind!)
VI Kurven und Fl¨achen zweiter Ordnung
130
Es ist keine Beschr¨ankung der Allgemeinheit, u1 = 1 zu setzen. Dann ist u2 = ±1 und u3 = 2a1 ∓2a2 . W¨ahlt man a1 , a2 als Parameter und setzt a1 = r, a2 = s, a3 = r2 − s2 , dann ergeben sich die beiden Geradenscharen ⎛
⎞ ⎛ ⎞ r 1 ⎝ ⎠ + t⎝ ⎠ (t ∈ IR), s 1 r2 − s2 2(r − s)
bzw.
⎛
⎞
⎛
⎞
1 1 r−s ⎝ s − r ⎠ + t⎝ ⎠ (t ∈ IR), 1 2 0 2(r − s)
⎛
⎞ ⎛ ⎞ r 1 ⎝ ⎠ + t⎝ ⎠ (t ∈ IR) s −1 r2 − s2 2(r + s) ⎛
⎞
⎛
⎞
1 1 r+s ⎝ r + s ⎠ + t⎝ ⎠ (t ∈ IR) −1 2 0 2(r + s)
bzw. mit den neuen Parametern u = r − s und v = r + s ⎛
⎞
⎛
⎞
1 1 u ⎝ −1 ⎠ + t⎝ 1 ⎠ (t ∈ IR), 2 0 2u
⎛
⎞
⎛
⎞
1 v 1 ⎝ 1 ⎠ + t⎝ −1 ⎠ (t ∈ IR). 2 0 2v
Die Parameter u, v durchlaufen dabei die Menge IR. Man kann leicht verifizieren, dass diese Geradenscharen auf der Sattelfl¨ache liegen; beispielsweise ist bei der ersten Schar x1 −x2 = u, x1 +x2 = 2t, x3 = 2ut und damit (x1 −x2 )(x1 +x2 ) = x3 , also x21 − x22 − x3 = 0. Vgl. Aufgabe 4. Je zwei Geraden einer Schar sind windschief, was wir an der ersten der beiden Scharen zeigen: Die Geraden sind f¨ ur u = u∗ nicht parallel. H¨atten die Geraden zum Parameter u bzw. zum Parameter u∗ f¨ ur den Wert t bzw. den Wert t∗ einen gemeinsamen Punkt, dann w¨are t − t∗ =
u∗ u − 2 2
und t − t∗ =
u u∗ − , 2 2
also u = u∗ .
Jede Gerade der einen Schar schneidet jede Gerade der anderen Schar, denn die Gleichung ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 1 1 u v 1 ⎝ −1 ⎠ + t⎝ 1 ⎠ = ⎝ 1 ⎠ + t∗ ⎝ −1 ⎠ 2 2 0 0 2u 2v hat die L¨osung 2t = v, 2t∗ = u. Wir betrachten nun das einschalige Hyperboloid mit einer Gleichung in affiner Standardform, also x21 + x22 − x23 = 1. Die Gerade a + u liegt genau dann auf der Fl¨ache, wenn ur alle t ∈ IR, (a1 + tu1 )2 + (a2 + tu2 )2 − (a3 + tu3 )2 = 1 f¨
VI.3 Regel߬achen
131
wenn also
Eine Gerade der Regelschar kann nicht parallel zur x1 x2 -Ebene sein, wir setzen daher u3 = 1 und
x3 ...................... .....................6 . . . . . ......... . . . . . ..... ...... ... .... .. ... .. .... . . . ...... . . ........ ................... ... . ........................................................................................................... ............................................ .......... ........... .............................. .... ........... .............................. ...................... ......................................................... ............ .... .... ............... . .................. ............ .................. ........ ..................................................................................H . ........................... ...... ................................HH . . . . . . . . . . . jx ...................................................................................... H x1 2 ....................................................................................... ........................... . . . . . ..................... ........... .......... .............. ............................ ............................... . . . . . . ............ .... ...... ........ ... ... .... ... .. .. ......... ........................ .................. .... ......... ... ............................ ........ .... ........................... ................................ ........ ........ ....................... ......... ....................... .......... ........................................... ............. ....... ........... ...... ...... ...... ..... ...... ...... ........... ....... ......... .......... ...... ... ... ...... ... ...... ...... ..... ... ...... ..... .......... ................. ... ...... ...... ...... ..... ................. ...............................................
u1 = cos ϕ, u2 = ± sin ϕ (0 ≤ ϕ < 2π).
Fig. 1: Einschaliges Hyperboloid
a21 + a22 − a23 = 1, a1 u1 + a2 u2 − a3 u3 = 0, u21 + u22 − u23 = 0. Jede Gerade einer Regelschar muss durch einen Punkt der x1 x2 -Ebene gehen, und zwar durch einen G¨ urtelpunkt“ des Hyperboloids ” (Fig. 1). Wir setzen daher a3 = 0 und a1 = cos α, a2 = sin α (0 ≤ α < 2π).
Wegen a1 u1 + a2 u2 = 0 gilt dann cos α cos ϕ ± sin α sin ϕ = cos(α ∓ ϕ) = 0, also α ∓ ϕ = ± π2 . Damit ergeben sich zwei Geradenscharen: ⎛
⎞ ⎛ ⎞ sin ϕ cos ϕ ⎝ cos ϕ ⎠ + t⎝ sin ϕ ⎠ 0 1
⎛
(t ∈ IR),
⎞ ⎛ ⎞ sin ϕ cos ϕ ⎝ cos ϕ ⎠ + t⎝ − sin ϕ ⎠ 0 1
(t ∈ IR)
Man beachte dabei cos(ϕ ± π2 ) = ± sin ϕ usw. Diese Geradenscharen werden erzeugt, wenn die beiden Geraden ⎛
⎞ ⎛ ⎞ 1 0 ⎝ 0 ⎠ + t⎝ ±1 ⎠ (t ∈ IR) 0 1
um die x3 -Achse rotieren. Wie bei der Sattel߬ache gilt: Zwei Geraden einer Schar sind windschief, zwei Geraden aus verschiedenen Scharen schneiden sich.
Aufgaben 1. Welche Geraden liegen auf dem Doppelkegel mit der Gleichung x21 + x22 − x23 = 0 ? √
√
1 1 2. Es sei g1 die Gerade durch (√ , 3, 0) mit dem Richtungsvektor ( 3 1 2)T 2 2 √
und g1 die Gerade durch ( 12 3, 12 , 0) mit dem Richtungsvektor (1
3 2)T .
VI Kurven und Fl¨achen zweiter Ordnung
132
Man weise nach, dass g1 und g2 zu verschiedenen Regelscharen des im Text behandelten einschaligen Hyperboloids geh¨oren und berechne ihren Schnittpunkt.
⎛
3. Es seien Geraden g :
⎞ ⎞ ⎛ ⎞
⎛ 0 1 0 ⎝ 0 ⎠ und h : ⎝ 1 ⎠ + ⎝ 0 ⎠ gegeben. Diese 1 0 0
sind offensichtlich windschief. Man zeige, dass die Verbindungsgeraden je eines Punktes von g mit dem Punkt von h mit demselben Parameterwert ein hyperbolisches Paraboloid erzeugen.
4. a) Die Gleichung x21 − x22 − x3 = 0 bzw. (x1 + x2 )(x1 − x2 ) = x3 einer Sattelfl¨ache wird jeweils von allen L¨osungen der beiden LGS x1 + x2 = rx3 r(x1 − x2 ) = 1
x 1 + x2 = s s(x1 − x2 ) = x3
erf¨ ullt, wobei r, s Parameter sind. Man zeige, dass diese LGS die Regelscharen der Sattelfl¨ache darstellen. b) Man stelle auf a¨hnliche Art die Regelscharen des einschaligen Hyperboloids als L¨osungsmengen von Gleichungssystemen dar.
VI.4 Kreisschnittebenen In der Gleichung x21 x22 x23 + 2 + 2 =1 a2 b c
x3 6 ............................. ........ ... ......................... . . . . . . ............ . ......... .. .. ...... ........................ ...... ...... .. . . . . ...... ..... .... . . . . ..... .. ..... ... .... . . ..... ... ..... ...... ......... ... ... ... .. . . . . . . . . . . . . x2 . . . . . . ...... . ... . ... ... ........ ... .................................................. ... ............. .................. .. ................... . ....... ...................................... x1
eines Ellipsoids sei c < a < b. Dann schneidet die Kugel um O mit dem Radius a aus dem Ellipsoid zwei Kreise mit dem Mittelpunkt O und dem Radius a aus (Fig. 1). Die Ebenen, in denen diese Kreise liegen, sind Beispiele Fig. 1: Kreisschnitte des Ellipsoids f¨ ur Kreisschnittebenen des Ellipsoids. Parallele Ebenen schneiden eine Quadrik in zueinander ¨ahnlichen Kurven zweiter Ordnung (vgl. VI.1 Aufgabe 12). Also sind die zu den beiden oben angegebenen Ebenen parallelen Ebenen ebenfalls Kreisschnittebenen des Ellipsoids. Um die Kreisschnittebenen einer Quadrik mit dem Mittelpunkt O (Ellipsoid, einschaliges Hyperboloid, zweischaliges Hyperboloid) zu finden, schneidet man also die Quadrik mit einer Kugel um O mit geeignet zu w¨ahlendem Radius r: Quadrik: Ax21 + Bx22 + Cx23 − 1 = 0
VI.4 Kreisschnittebenen
133
Kugel:
x21 + x22 + x23 − r2 = 0
Man betrachtet nun die Gleichung (Ax21 + Bx22 + Cx23 − 1) − μ(x21 + x22 + x23 − r2 ) = 0, welche zun¨achst wieder eine Quadrik beschreibt. Durch geeignete Wahl von r und μ soll diese in zwei Ebenen (durch O) zerfallen. Es muss also μ ∈ {A, B, C} und μr2 = 1 gelten. Wir nehmen A < B < C an. Mit μ = A oder μ = C und μr2 = 1 ergeben sich die Gleichungen (B − A)x22 + (C − A)x23 = 0 bzw (C − A)x21 + (C − B)x22 = 0, welche nur den Punkt O darstellen. Man muss also μ = B w¨ahlen und erh¨alt die Gleichung (B − A)x21 − (C − B)x22 = 0, welche ein Ebenenpaar darstellt:
x1 ± sx3 = 0 mit s =
C −B B−A
Bei den Paraboloiden, die ja keinen Mittelpunkt besitzen, geht man ¨ahnlich vor: Man schneidet das Paraboloid mit der Gleichung Ax21 + Bx22 − 2x3 = 0 mit einer Kugel durch O, deren Mittelpunkt auf der x3 -Achse liegt, welche also die Gleichung x21 + x22 + x23 − 2rx3 = 0 hat. Man untersucht, wann die Quadrik mit der Gleichung (Ax21 + Bx22 − 2x3 ) − μ(x21 + x22 + x23 − 2rx3 ) = 0 in ein Ebenenpaar zerf¨allt. Dazu muss μ ∈ {A, B} und μr = 1 gelten. F¨ ur das elliptische Paraboloid mit 0 < A < B erh¨alt man mit μ = A das Ebenenpaar mit der Gleichung (B − A)x22 − Ax23 = 0. F¨ ur das hyperbolische Paraboloid mit A < 0 < B gibt es keine Kreisschnittebenen, weil f¨ ur μ ∈ {A, B} und μr = 1 nur ein Punkt dargestellt wird.
Aufgaben 1. Man bestimme die Kreisschnittebenen der Quadrik mit der Gleichung 2x21 + 5x22 − 4x3 = 0.
2. Man bestimme in Fig. 1 die Kreisschnittebenen durch O durch Berechnung der Schnittpunkte von Ellipsoid und Kugel in der x2 x3 -Ebene.
3. Die parallelen Ebenen mit den Gleichungen x2 − 2x3 = c schneiden den
Kegel mit der Gleichung x21 + x22 − x23 = 0 in zueinander ¨ahnlichen Ellipsen. Man bestimme das Achsenverh¨altnis dieser Ellipsen.
VII Projektive Geometrie VII.1 Homogene Koordinaten Viele Begriffe, S¨atze und Beweise der analytischen Geometrie erlauben elegantere Formulierungen, wenn man statt der bekannten affinen Koordinaten die in folgender Definition beschriebenen homogenen“ Koordinaten benutzt. Im Gegensatz ” zur u ¨blichen ( affinen“) Geometrie haben dann je zwei Geraden in der Ebene und ” je zwei Ebenen im Raum auch dann einen Schnittpunkt bzw. eine Schnittgerade, wenn sie als affine Gebilde parallel sind. Die Einf¨ uhrung homogener Koordinaten wird dadurch motiviert, dass in den Grundlagen der Geometrie Punkte und Geraden eine auffallende duale“ Rolle spielen: Zwei verschiedene Punkte inzidieren ” mit genau einer Geraden, und zwei verschiedene Geraden inzidieren mit genau einem Punkt (falls sie nicht parallel sind). Eine Gerade wird bez¨ uglich eines affinen Koordinatensystems durch eine Gleichung der Form a0 +a1 x1 +a2 x2 = 0 beschrieben, also durch ein Tripel (a0 , a1 , a2 ) = (0, 0, 0), wobei ein Vielfaches dieses Tripels die gleiche Gerade beschreibt. M¨ochten wir nun Punkte in der Ebene ebenfalls durch Zahlentripel beschreiben, so orientieren wir uns an der Beschreibung von Geraden und kommen so auf die Idee der Einf¨ uhrung homogener Koordinaten. Definition: Ist in der Ebene bzw. im Raum ein affines Koordinatensystem gegeben, dann ordnet man dem Tripel (x0 , x1 , x2 ) ∈ IR3 bzw. demQuadrupel
(x0 , x1 , x2 , x3 ) ∈ IR4 den Punkt
x1 x2 , x0 x0
bzw. den Punkt
x1 x2 x3 , , x0 x0 x0
im affinen
Koordinatensystem zu, wobei x0 = 0 sein muss. Wir erweitern die affine Ebene bzw. den affinen Raum um die Punkte mit x0 = 0, nennen diese Punkte uneigentlich oder unendlich fern und sprechen dann von der projektiven Ebene bzw. vom projektiven Raum. Dem Tripel (0, 0, 0) bzw. dem Quadrupel (0, 0, 0, 0) ist jedoch kein Punkt zugeordnet. Die Tripel (x0 , x1 , x2 ) bzw. Quadrupel (x0 , x1 , x2 , x3 ) heißen homogene oder projektive Koordinaten, besser Koordinatentripel“ bzw. ” Koordinatenquadrupel“ des betreffenden Punktes. ” Es ist zweckm¨aßig, diese Tripel bzw. Quadrupel aus IR3 bzw. IR4 als Vektoren aufzufassen, obwohl sie keinen Vektorraum bilden, da der Nullvektor nicht dazu geh¨ort. Man beachte, dass das Tripel bzw. Quadrupel x denselben Punkt beschreibt wie das Tripel bzw. Quadrupel rx mir r ∈ IR, r = 0. Auch eine Gerade mit einem affinen Koordinatensystem (Skala) l¨asst sich zu einer projektiven Geraden machen, indem man ihre Punkte durch Paare (x0 , x1 ) mit x x0 = 0 kennzeichnet, diesen Paaren die Skalenpunkte 1 zuordnet und schließlich x0
(0, 1) als einen uneigentlichen Punkt hinzunimmt. Im Folgenden wird die projektive Gerade selten vorkommen, da sie ¨außerst langweilig ist: Auf ihr lassen sich nur Punkte (keine Geraden usw.) betrachten. Trotzdem ist der Begriff der projektiven Abbildung auf einer projektiven Geraden von Interesse (vgl. VII.2).
VII.1 Homogene Koordinaten
135
Zwei Tripel bzw. Quadrupel definieren den gleichen Punkt der projektiven Ebene bzw. des projektiven Raums, wenn sie sich nur um einen gemeinsamen Faktor unterscheiden, wie wir schon oben festgehalten haben. F¨ ur x ∈ IR3 bzw. x ∈ IR4 mit x = o bezeichnen wir mit [x] den Punkt der projektiven Ebene bzw. des projektiven Raums mit dem homogenen Koordinatenvektor x. (Im Folgenden werden die Koordinaten von x f¨ ur jeden Buchstaben x immer mit x0 , x1 , x2 bzw. mit x0 , x1 , x2 , x3 bezeichnet.) Es gilt [x] = [y ] genau dann, wenn x = ry mit r ∈ IR, r = 0. Die Gleichung einer Geraden in der affinen Ebene bzw. einer Ebene im affinen Raum hat die Form a0 + a1 x1 + a2 x2 = 0 bzw. a0 + a1 x1 + a2 x2 + a3 x3 = 0, wobei (a1 , a2 ) = (0, 0) bzw. (a1 , a2 , a3 ) = (0, 0, 0) ist. Ersetzt man x1 , x2 bzw. x1 , x2 , x3 x x x x x durch 1 , 2 bzw. 1 , 2 , 3 , so lautet die Gleichung in homogenen Koordinaten x0 x0
x0 x0 x0
a0 x0 + a1 x1 + a2 x2 = 0 bzw. a0 x0 + a1 x1 + a2 x2 + a3 x3 = 0. Ist jetzt (a1 , a2 ) = (0, 0) bzw. (a1 , a2 , a3 ) = (0, 0, 0) und a0 = 0, dann definiert diese Gleichung die uneigentliche oder unendlich ferne Gerade bzw. Ebene mit der Gleichung x0 = 0. Auf der projektiven Geraden ist a0 x0 + a1 x1 = 0 nat¨ urlich nur die Gleichung eines einzigen Punktes. F¨ ur a ∈ IR3 bzw. a ∈ IR4 mit a = o sei a die Gerade der projektiven Ebene bzw. die Ebene des projektiven Raums mit dem Koeffizientenvektor a. Es gilt a = b genau dann, wenn a = rb mit r ∈ IR, r = 0. Spitze Klammern haben wir fr¨ uher zur Bezeichnung des Erzeugnisses einer Vektormenge benutzt, a war also die Menge aller Vielfachen des Vektors a. Jetzt hat dieses Symbol eine etwas andere Bedeutung, da jetzt der Nullvektor nicht zu a geh¨ort. Genau dann liegt der Punkt [u] auf der Geraden bzw. der Ebene v , wenn u T v = 0. Wegen u T v = v T u ist dies genau dann der Fall, wenn der Punkt [v ] auf der Geraden bzw. der Ebene u liegt. Gilt a T u = 0 und b T u = 0 und ist a kein Vielfaches von b, dann bedeutet dies in der projektiven Ebene: [u] ist der Schnittpunkt der Geraden a und b, u ist die Verbindungsgerade der Punkte [a] und [b]. Gilt a T u = 0, b T u = 0, c T u = 0 und ist {a, b, c} linear unabh¨angig, dann bedeutet dies im projektiven Raum: [u] ist der Schnittpunkt der Ebenen a, b, c, u ist die Ebene durch die Punkte [a], [b], [c].
VII Projektive Geometrie
136
In der projektiven Ebene besitzen (im Gegensatz zur affinen Ebene) je zwei verschiedene Geraden einen Schnittpunkt, denn ist {a, b} linear unabh¨angig, a0 x0 + a1 x1 + a2 x2 = 0 dann besitzt das homogene LGS einen eindimenb 0 x 0 + b 1 x 1 + b2 x 2 = 0 sionalen L¨osungsraum. F¨ ur die L¨osungen gilt genau dann x0 = 0, wenn auch a1 x1 + a2 x2 = 0 einen eindimensionalen L¨osungsraum besitzt, wenn also die b1 x 1 + b 2 x 2 = 0 Geraden parallel sind. Diese und alle anderen dazu parallelen Geraden gehen durch den uneigentlichen Punkt mit den Koordinaten 0, a2 , −a1 . Ein uneigentlicher Punkt kann also durch einen Parallelenschar beschrieben werden (Fig. 1). Die uneigentlichen Punkte zweier nicht paralleler Geraden sind verschieden. a x + a2 x2 = 0
1 1 ........................................................................... . . . . . . . . . . . . . . . ........ ........ ........ ........ ........ ......... ........ ...................................................................................... ............................ . . ⎡⎛ ⎞⎤ . . . . . ... .. ... ... ... ... ... ... 0 ........ ........ ........ ........ ........ .......... ........ ......... ⎢⎜ ⎟⎥ ................................................................................ .......................... * ⎣⎝ a2 ⎠⎦ ... ... ... ... ... ... .......... ........................................................... .................. .. a2 −a1 ........................................................ ........................... −a1 ..... ................... ......... ......... .......................... .............................. ..... ........................ x1 ...... ......
x2
6
Fig. 1: Parallelenschar und ihr uneigentlicher Punkt
Im projektiven Raum m¨ ussen zwei Geraden nicht stets einen Schnittpunkt haben. Zwei Ebenen schneiden sich aber stets in einer Geraden, wobei die Schnittgerade von parallelen Ebenen eine uneigentliche Gerade ist. In der projektiven Ebene bedeutet (falls {a, b} linear unabh¨angig ist) {[ra + sb] | r, s ∈ IR, (r, s) = (0, 0)} die Menge aller Punkte der Geraden durch [a] und [b], und {ra + sb | r, s ∈ IR, (r, s) = (0, 0)} die Menge aller Geraden durch den Schnittpunkt von a und b. Eine Gerade wird dabei als Punktreihe“ und ein Punkt als Geradenb¨ uschel“ verstanden ” ” (Fig. 2). .. ..... a . . . . . . ............... .. . ........ [b] ..d.......... . ............. ... ... .... ... . . . . . . . . v . . . . ........ .. ....... .. .. .. d......... . . . . . . . . . . . .. d . . . . .... .. .. .. ......................w ........................ .. .. ...... [a] ..........d............d......... . . . . . . . . . . . d . . . . . . . . .. . ..... . .......................... .......... ...v .......d......... ... . . ...... .....b .... . .. . . Gerade durch [a] und [b] .... Schnittpunkt von a und b .... Fig. 2: Gerade als Punktreihe und Punkt als Geradenb¨ uschel
VII.1 Homogene Koordinaten
137
Im projektiven Raum bedeutet (falls {a, b, c} linear unabh¨angig ist) {[ra + sb + tc] | r, s, t ∈ IR, (r, s, t) = (0, 0, 0)} die Menge aller Punkte der Ebene durch [a], [b], [c], und {ra + sb + tc | r, s, t ∈ IR, (r, s, t) = (0, 0, 0)} die Menge aller Ebenen durch den Schnittpunkt von a, b, c (Punkt als Ebe” nenb¨ uschel“). Ferner bedeutet wieder {[ra + sb] | r, s ∈ IR, (r, s) = (0, 0)} die Gerade durch [a] und [b] und {ra + sb | r, s ∈ IR, (r, s) = (0, 0)} die Menge aller Ebenen durch die Schnittgerade von a und b (Gerade als Ebenenb¨ undel“). ” ¨ Diese Uberlegungen zeigen, dass in der projektiven Ebene bzw. im projektiven Raum das folgende Dualit¨atsprinzip gilt: Ein Satz (eine wahre Aussage) u ¨ber Inzidenzen von Punkten und Geraden in der Ebene geht wieder in einen Satz u ¨ber, wenn man Punkt liegt auf Gerade Gerade geht durch Punkt Geraden schneiden Punkte verbinden
ersetzt durch
Gerade geht durch Punkt Punkt liegt auf Gerade Punkte verbinden Geraden schneiden
Ein Satz (eine wahre Aussage) u ¨ber Inzidenzen von Punkten und Geraden im projektiven Raum geht wieder in einen Satz u ¨ber, wenn man Punkt liegt auf Ebene Ebene geht durch Punkt Punkt liegt auf Gerade Ebene geht durch Gerade Gerade geht durch Punkt Gerade liegt auf Ebene Ebenen schneiden Punkte verbinden
ersetzt durch
Ebene geht durch Punkt Punkt liegt auf Ebene Ebene geht durch Gerade Punkt liegt auf Gerade Gerade liegt auf Ebene Gerade geht durch Punkt Punkte verbinden Ebenen schneiden
Geraden oder Ebenen mit genau einem gemeinsamen Punkt nennt man kopunktal; Punkte, die auf einer gemeinsamen Geraden liegen, nennt man kollinear; Punkte, die in einer gemeinsamen Ebene liegen, heißen komplanar.
VII Projektive Geometrie
138
In der projektiven Ebene gilt: Genau dann sind die Punkte [a], [b], [c] kollinear, wenn die Geraden a, b, c kopunktal sind, und dies ist genau dann der Fall, wenn {a, b, c} linear abh¨angig ist, also wenn det(a, b, c) = 0. Eine Gleichung f¨ ur die Gerade durch die Punkte [a], [b] ist also det(a, b, x) = 0. Analoges gilt im projektiven Raum: Eine Gleichung f¨ ur die Ebene durch die Punkte [a], [b], [c] ist also det(a, b, c, x) = 0. Die Tangente an den Kreis mit der (projektiven) Gleichung x21 + x22 = r2 x20 im Kreispunkt [b] hat die Gleichung b1 x1 + b2 x2 = r2 b0 x0 , also (−r2 b0 b1 b2 )x = 0. Ist also die Gerade y eine Tangente an den Kreis, dann ist ⎛
y =
⎜ ⎝
⎞
−r2 b0 b1 ⎟ ⎠ , b2
wegen b21 + b22 = r2 b20 also y12 + y22 =
y02 . r2
Man kann daher den Kreis um O mit dem Radius r (und analog jede andere Kurve) einerseits als die Menge aller Punkte [x] betrachten, welche der Gleichung x21 + x22 = r2 x20 gen¨ ugen, andererseits als die Menge aller Geraden y , welche der Gleichung y12 + y22 =
s s s s
y02 gen¨ ugen (Fig. 3). r2
s s s s s s s s s
s
s
s s s s s s
s
s s s s s
.. .. . ... ...................................................................... ........... . . . .. ......... .............. .. .............. ........... . ......... . . . . . . . . ..... .... ..... ... ..... .... .. ..... ..... .......... ........ . ...... ................. ................ . ......... . . . . . . . . ............................................................................. ..... ........ .... .
Fig. 3: Kreis als Punktmenge und Geradenmenge
Aufgaben ⎛
1.
⎞ ⎛ ⎞ 1 0 ⎝ ⎠ ⎝ Es sei a = 0 und b = 1 ⎠. Man bestimme den Schnittpunkt von a 0 0
und b sowie die Verbindungsgerade von [a] und [b].
2. Man zeige, dass folgende Determinantengleichung eine Gerade in der affinen Ebene beschreibt:
1 a 1 1 b1 1 x1
a2 b2 x2
=0
VII.1 Homogene Koordinaten
139
3. a) Welche Koordinaten hat der uneigentliche Punkt der Geraden mit der Gleichung 3x0 + x1 − 4x2 = 0 in der projektiven Ebene? b) Bestimme die uneigentliche Gerade im projektiven Raum, welche zu der Ebene mit der Gleichung 2x0 − x1 − x2 + 5x3 = 0 geh¨ort. c) Welche Koordinaten hat der uneigentliche Punkt, der zu den beiden Ebenen mit den Gleichungen x0 + x1 + x2 + 2x3 = 0 und 3x0 − 5x2 + x3 = 0 geh¨ort?
4. Wir betrachten folgende bijektive der Punkte ⎡⎛ Abbildung ⎞⎤ ⎡⎛ auf die ⎞Geraden ⎤ p0
der projektiven Ebene: P = ⎣⎝ p1 ⎠⎦ werde auf p = ⎣⎝ p2
−r2 p0 p1 ⎠⎦ abgep2
bildet, wobei r = 0 (Pol-Polare-Beziehung). Mit großen lateinischen Buchstaben bezeichnen wir Punkte, mit den entsprechenden kleinen Buchstaben die ihnen zugeordneten Geraden. Man zeige: a) Liegt Q auf p, dann liegt P auf q. b) Liegt B auf dem Kreis um O mit dem Radius r, dann ist b die Tangente an den Kreis mit dem Ber¨ uhrpunkt B. c) Sind A, B zwei Punkte auf dem Kreis um O mit dem Radius r und ist P der Schnittpunkt von a und b, dann ist die Polare p zu P die Verbindungsgerade von A und B (Fig. 4).
5. Die folgenden Vektoren a, b, c, d sind linear unabh¨angig: ⎛
⎞ ⎛ 1 1 ⎜ 1 ⎟ ⎜ 1 ⎜ ⎟ ⎜ ⎝ 1 ⎠, ⎝ 0 0 1
⎞ ⎛
⎞ ⎛ 1 1 ⎟ ⎜ 0 ⎟ ⎜ 1 ⎟, ⎜ ⎟ ⎜ ⎠ ⎝ 1 ⎠, ⎝ 2 1 3
⎞ ⎟ ⎟. ⎠
Man betrachte f¨ ur jedes Paar (r, s) ∈ IR2 mit (r, s) = (0, 0) die Gerade u(ra + sb) + v(rc + sd) und zeige, dass je zwei dieser Geraden windschief sind. Man zeige dann, dass diese Geraden ein hyperbolisches Paraboloid (Sattelfl¨ache) erzeugen (Fig. 5). Vgl. hierzu VI.3.
.. .... ....B .................t................................... b . ...........................t.................. . ... ........ . . . . . . . ... ..... ... .... ... ... ... .... P . ... . ... . ... ... ....... p ... . ... a .... ... ... ... ... ........ ... ... ....... .... ...... ...... ............ ..................t... ....... A Fig. 4: Pol-Polare-Beziehung
... ...s... ... ....s. .. .. .. .... ... ... ....s... .. . .. .. .. ....s. ....... ... ... .... .................. .. .. s .. .. .. ......................... ... ...........s.................... ...........s.. .. ... ..... . .. .............s.......s.................................................................s .............. ... ..........s.....s..s. .................. ... ....s..s ....... .....s. . s ....... .. . . .. .......... .... .s.. Fig. 5: Sattel߬ ache
VII Projektive Geometrie
140
VII.2 Projektive Abbildungen Definition 1: Es sei A eine invertierbare Matrix aus IR2,2 , IR3,3 bzw. aus IR4,4 , es sei also det A = 0. Dann nennt man die Abbildung [x] → [Ax] eine projektive Abbildung der projektiven Geraden, der projektiven Ebene bzw. des projektiven Raums auf sich. Zwei Matrizen bestimmen also die gleiche projektive Abbildung, wenn sie sich nur um einen reellen Faktor unterscheiden. Beispiel 1: Die projektive Abbildung der projektiven Geraden 1 2 auf sich mit der Matrix 3 −1
0.. ................................................................................1. ....................... .. ........... ........... . . . .. ................................. .......... ................................................................................ ............................................................................................................................................. 2 3 3
bildet das Intervall [0, 1] auf das 2 , 3 ab, und zwar un3
Intervall
Fig. 1: Projektives Bild einer Strecke
ter Umkehrung der Anordnung (Fig. 1). Denn
1 2 3 −1
r
1 0
+s
1 1
=r
1 3
+s
3 2
f¨ ur r, s ∈ IR.
u −u + 3v aus dem Intervall [0, 1] wird auf die Bruchzahl abgebilv 2u + v 2 det, welche zwischen 3 (f¨ ur u = 0) und (f¨ ur u = v) liegt. 3
Die Bruchzahl
Beispiel 2: Fig. 2 zeigt, auf welches Viereck A B C D das Quadrat ABCD bei der projektiven Abbildung mit der Matrix ⎛
2 ⎝ 0 1
D
⎞
−1 −1 3 1 ⎠ 2 1
D
abgebildet wird. Dabei ist C der uneigentliche Punkt auf der Geraden mit der Gleichung x0 + x1 − x2 = 0.
A A
.. .... ..... . . . .... ... ... C ..... . . .. .. ... 6..... ... . 1 . . ....u...........................................................................uh C = B ... .. .... . ... ...... .... .. . . . . .. . ... .. . .. ....... .... . . . .. .. ...... .....h .... ..... ..1 ...h .. .. ..... . .. ....u........................................................................u B
Fig. 2: Projektives Bild eines Quadrats
Denn ⎛
⎞⎛
⎞
⎛
⎞
2 −1 −1 1 1 1 1 4 2 0 2 ⎜ ⎜ ⎜ ⎟ 3 1 ⎟ 1 1 −1 ⎟ ⎝ 0 ⎠ ⎝ −1 ⎠ = ⎝ −4 2 4 −2 ⎠ , 1 2 1 −1 −1 1 1 −2 2 4 0 die Bildpunkte A , B , C , D sind also der Reihe nach
VII.2 Projektive Abbildungen ⎡⎛
141
⎞⎤ ⎡⎛
⎞⎤ ⎡⎛
⎞⎤ ⎡⎛
⎞⎤
1 1 0 1 ⎢⎜ ⎟⎥ ⎢⎜ ⎟⎥ ⎢⎜ ⎟⎥ ⎢⎜ ⎟⎥ ⎣⎝ −1 ⎠⎦ , ⎣⎝ 1 ⎠⎦ , ⎣⎝ 1 ⎠⎦ , ⎣⎝ −1 ⎠⎦ . 1 −2 1 1 0 In der affinen Ebene bzw. im affinen Raum ist die affine Abbildung, die ein gegebenes Dreieck bzw. Vierflach (allgemeines Tetraeder) auf ein ebenfalls gegebenes Dreieck bzw. Vierflach abbildet, eindeutig bestimmt. Dies gilt f¨ ur eine projektive Abbildung der projektiven Ebene oder des projektiven Raums aber nicht. Dies gilt auch nicht f¨ ur eine projektive Abbildung der projektiven Geraden, wie folgendes Beispiel zeigt. Beispiel 3: Bei einer projektiven Abbildung der projektiven Geraden werde
1 1 1 1 a auf und auf abgebildet. Mit A = 00 0 2 1 4 a10 1 1 A =r 0 2
und
1 1 A =s , 1 4
also
a01 a11
gilt
a00 = r, a01 = s − r, a10 = 2r, a11 = 4s − 2r
mit r, s = 0. Durch geeignete Wahl von r, s findet man zwei Matrizen A, von denen die eine kein Vielfaches der anderen ist, die also zu verschiedenen projektiven Abbidungen geh¨oren:
1 2
F¨ ur r = 1, s = 1 erh¨alt man A =
f¨ ur r = 1, s = 2 erh¨alt man A =
1 2
0 , 2 1 . 7
0 1 =t , 1 3
Kennt man aber einen weiteren Punkt und seinen Bildpunkt, etwa A dann ist A bis auf einen Faktor aus IR eindeutig bestimmt:
r s−r 2r 4s − 2r
0 r−s 1 = =t 1 4r − 2s 3
und damit A=
t 2
1 2
−2 −6
t t liefert r = , s = − 2 2
.
Der folgende Satz 1 wird Hauptsatz der projektiven Geometrie genannt. Er garantiert z. B., dass es genau eine projektive Abbildung der projektiven Ebene von denen je drei nicht kolligibt, welche vier gegebene Punkte [a], [b], [c], [d], near sind, auf vier gegebenen Punkte [a ], [b ], [c ], [d ] abbildet, von denen ebenfalls je drei nicht kollinear sind. Dual dazu gilt nat¨ urlich, dass es genau eine projektive Abbildung der projektiven Ebene gibt, welche vier gegebene Geraden von denen je drei nicht kopunktal sind, auf vier gegebene Geraden a, b, c, d, a , b , c , d abbildet, von denen ebenfalls je drei nicht kopunktal sind. Der Hauptsatz der projektiven Geometrie ist eine allgemeine Aussage u ¨ber linean re Abbildungen in IR und gewinnt erst durch Interpretation der Vektoren als
VII Projektive Geometrie
142
Repr¨asentanten von Punkten, Geraden oder Ebenen in der projektiven Ebene oder im projektiven Raum eine geometrische Bedeutung. Satz 1 (Hauptsatz der projektiven Geometrie): Sind je n der n + 1 Vektoren x1 , x2 , . . . , xn+1 ∈ IRn linear unabh¨angig und sind auch je n der n + 1 Vektoren y1 , y2 , . . . , yn+1 ∈ IRn+1 linear unabh¨angig, dann ist eine Matrix A mit [Axi ] = [yi ] (i = 1, 2, . . . , n + 1) bis auf einen konstanten Faktor eindeutig bestimmt. Dabei bedeutet allgemein [x] die Menge der von o verschiedenen Vielfachen von x. Beweis: Es gibt eindeutig bestimmte Zahlen ri , si = 0, so dass xn+1 = r1x1 + r2x2 + . . . + rnxn
und yn+1 = s1 y1 + s2 y2 + . . . + sn yn .
ur i = 1, 2, . . . , n mit noch unbestimmtem Definiert man λi durch ri λi = si λn+1 f¨ λn+1 , dann ist λn+1 yn+1 = r1 λ1 y1 + r2 λ2 y2 + . . . + rn λnxn . Mit der Matrix A = (λ1 y1 λ2 y2 . . . λn yn )(x1 x2 . . . xn )−1 (und nur mit dieser!) gilt Axi = λi yi (i = 1, 2, . . . , n). Ferner ist λn+1 yn+1 = r1 Ax1 + r2 Ax2 + . . . + rn Axn = A(r1x1 + r2x2 + . . . + rnxn ) = Axn+1 . Die Matrix A ist also bis auf den Faktor λn+1 eindeutig bestimmt.
2
Satz 2: Ist [x] → [Ax] eine projektive Abbildung, dann ist x → (A−1 )T x. Wird also der Punkt [x] auf den Punkt [Ax] abgebildet, dann wird die Gerade bzw. die Ebene x auf die Gerade bzw. die Ebene (A−1 )T x abgebildet. Beweis: Ist x T y = 0, dann ist x T y = x T (A−1 A) y = ((A−1 )T x)T Ay = 0. Liegt also [y ] auf x, dann liegt der Bildpunkt [Ay ] auf der Geraden (A−1 )T x, welche somit die Bildgerade ist. 2 Das n¨achste Beispiel soll erkl¨aren, woher die projektiven Abbildungen“ ihren ” Namen haben. Beispiel 4: Zwei sich in einer Geraden a schneidende Ebenen werden als zwei Exemplare E1 , E2 der projektiven Ebene aufgefasst. Eine Zentralprojektion mit dem Zentrum Z (außerhalb von E1 und E2 ) definiert dann eine projektive Abbildung der projektiven Ebene. Die Gerade g aus dem Exemplar E1 , durch welche die Projektionsstrahlen parallel zu E2 verlaufen, heißt Verschwindungsgerade; sie wird auf die uneigentliche Gerade abgebildet. Die Gerade h aus dem Exemplar E2 ,
VII.2 Projektive Abbildungen
143
durch welche die Projektionsstrahlen parallel zu E1 verlaufen, heißt Fluchtgerade; sie ist das Bild der uneigentlichen Geraden. @ Z R. ..... @ ...t.......*...... ... . . ... . ........ g ...... ..... ........t........... ... .t....... .......a........... h . . . . . . . ..... .... ..... E....2.......... ...E .. ....1
.................................................................................................................... ... .. g.. a.. h.. ... .. .. .. .. ... .. .. Z .. .. ... .. .. t .. .. ... .. .. ... .. ... .. .. . .. . .. .. .. .. .. E ..................................................................................................
Fig. 3: Zentralprojektion
Bringt man die Exemplare E1 und E2 durch Drehen um a zur Deckung, dann liegt eine projektive Abbildung in der projektiven Ebene vor (Fig. 3). Eine solche Abbildung mit Z = [(1 0 0)T ], a = (1 − 1 − 1)T und h = (1 1 1)T ⎛
1 wird durch die Matrix A = ⎝ 0 0
1 2 0
⎞ 1 0 ⎠ beschrieben (Aufgabe 1). 2
Genau dann ist eine projektive Abbildung eine affine Abbildung, wenn uneigentliche Punkte wieder auf uneigentliche Punkte abgebildet werden, wenn also z.B. im Fall der Ebene ⎛
a00 A = ⎝ a10 a20
0 a11 a21
⎞ 0 a12 ⎠ a22
mit a00
a 0 und 11 = a21
a12 a22
= 0.
Beispiel 5: Die projektive Abbildung der projektiven Ebene mit der Matrix ⎛
3 A=⎝ 0 1
0 1 1
⎞ −1 0 ⎠ 1
bildet die affinen Punkte (c, 3) mit c ∈ IR auf die uneigentlichen Punkte [(0 c 4 + c)T ] ab. Die Gerade mit der affinen Gleichung x2 = 3 ist also eine “Verschwindungsgerade“ im Sinn von Beispiel 4, und zwar die einzige. Das Bild der uneigentlichen Geraden ist die Fluchtgerade“ mit der affinen Gleichung ” x2 = x1 + 1, denn ein uneigentlicher Punkt [(0 a b)T ] wird auf den eigentlichen a affinen Punkt (u, u + 1) (mit u = − ) abgebildet. Die Eigenwerte von A sind b 1 und 2, zugeh¨orige Eigenvektoren sind (1 − 1 2)T und (1 0 1)T . Also sind die affinen Punkte (−1, 2) und (0, 1) Fixpunkte. Die Gerade durch diese Fixpunkte hat die affine Gleichung x1 + x2 = 1, also die projektive Gleichung x1 + x2 = x0 . Dies ist eine Fixgerade (aber keine Fixpunktgerade), denn die Matrix ⎛
⎞
1 0 −1 1 (A ) = ⎝ −1 4 −3 ⎠ 4 1 0 3 −1 T
VII Projektive Geometrie
144 1
bildet (1 − 1 − 1)T auf (1 − 1 − 1)T 2 ab. In Fig. 4 sind die Fixgerade, die Verschwindungsgerade und die Fluchtgerade in einem kartesischen Koordinatensystem eingezeichnet. Die Halbgerade V U + der Fixgeraden (von V u ¨ber U , siehe Fig. 4) wird auf die Halbgerade U V + abgebildet, die andere Halbgerade V U − wird auf U V − abgebildet. Das erkennt man alles an der Zuordnung x → Ax bzw.
x2 .... .... 6 .... ... . .... . .. .... ... Verschwindungsgerade .. . . . .. .. .. .. .. .. .. .. .. ...d.... .. .. .. .. ..... .. .. .. ..... .. .. .. .. .. .. .. .. . . . V ..... t .... . . . . F1 .... ... ... . . F2......t... . . x .... .....d. -1 . . . . . . U ..... ... ... .
(1 x 1 − x)T → (2 + x x 2)T .
Fluchtgerade
Fixgerade
Fig. 4: Zu Beispiel 5
Es ist unmittelbar klar, dass alle Aussagen u ¨ber Inzidenzen von Punkten, Geraden und Ebenen bei einer projektiven Abbildung erhalten bleiben: Schneiden sich drei Geraden in einem Punkt, dann gilt das auch f¨ ur die Bildgeraden usw. Die (triviale) Begr¨ undung daf¨ ur folgt aus Satz 1: xT y = xT (A−1 A)y = ((A−1 )T x)T (Ay ) Dies benutzt man beim Beweis geometrischer S¨atze, indem man die zu untersuchende Konfiguration zun¨achst mit einer projektiven Abbildung auf eine einfachere abbildet (in der Regel eine allgemeine auf eine spezielle), wobei man nur beachten muss, dass alle auftretenden Begriffe projektiv invariant“ sind. Dies ist ” ein wichtiges Beweisprinzip der so genannten Abbildungsgeometrie. Wir betrachten ein Beispiel hierf¨ ur: Satz 3 (Satz von Desargues, nach Girard Desargues, 1593–1662): Gegeben seien zwei Dreiecke ABC und A B C . Sind die Geraden durch einander zugeordnete Ecken kopunktal, dann sind die Schnittpunkte der Geraden durch einander zugeordnete Seiten kollinear (Fig. 5). Beweis: Es sei A = [(a0 a1 a2 )T ], B = [(b0 b1 b2 )T ], C = [(c0 c1 c2 )T ]. Es gen¨ ugt, f¨ ur die Punkte A , B , C folgenden Sonderfall zu betrachten: A = [(1 0 0)T ],
B = [(0 1 0)T ],
C = [(0 0 1)T ]
Die Geraden durch einander zugeordnete Ecken haben die Gleichungen a2 x1 − a1 x2 = 0, b 2 x0 − b0 x2 = 0, c 1 x0 − c 0 x1 = 0.
VII.2 Projektive Abbildungen
145
....... .... .... ...... .. ... ..... ... ...u...C ...... A ............. ............... ..... . .....u..................................................... . . ..... ... . . . . . . ... ...........................................B .. ..... . .....u........... . . . ... . 0 . .. a2 −a1 ........................ .. ... ....... . . .. ... .... . . . . . 0 −b0 = 0. ...................................................................................................................................................u...................................... D = b2 . . . . . . . . . . . . . . . . . . . . . . . . . . . ........ ... c1 −c0 . 0 ........ .............................................. .... B ....u...... .... ... . . . ........ . ... . Die Geraden durch B C , A C , A ................ ..... ........ . ........ .. ... ..........u... A B haben die Gleichungen C x0 = 0, x1 = 0, x2 = 0. Sie schneiden sich genau dann in einem Punkt, wenn dieses homogene LGS eine nichttriviale L¨osung hat, wenn also
Fig. 5: Satz von Desargues
Die Geraden durch BC, AC, AB haben die Gleichungen x 0 x1 x2
b0 c0 b1 c1 = 0, b2 c 2
x 0 x1 x2
x 0 x1 x2
= 0,
x a 0 0 x1 a1 0 a2
a0 c0 a1 c1 = 0, a2 c 2
a0 b0 a1 b1 = 0. a2 b2
F¨ ur die Schnittpunktkoordinaten gilt daher 0 b 0 x 1 b1 x 2 b2
bzw.
c0 c1 c2
= 0,
x a 0 0 0 a1 x2 a2
c0 c1 c2
b0 b1 b2
=0
−(b0 c2 − b2 c0 )x1 + (b0 c1 − b1 c0 )x2 = 0, (c1 a2 − c2 a1 )x0 + (c0 a1 − c1 a0 )x2 = 0, (a1 b2 − a2 b1 )x0 − (a0 b2 − a2 b0 )x1 = 0.
Die Matrix dieses LGS hat bis auf das Vorzeichen dieselbe Determinante Δ wie die Matrix ⎛ ⎞ 0 a2 b1 − a1 b2 c1 a2 − c2 a1 ⎜ 0 b2 c 0 − b0 c 2 ⎟ ⎝ a0 b2 − a2 b0 ⎠, c1 a0 − c0 a1 b0 c1 − b1 c0 0 0 e denn allgemein gilt a 0 c b ⎛
0
⎜ ⎝ a0 b2 − a2 b0
c1 a0 − c0 a1
f g 0
= abf + ceg. Es gilt ⎞ ⎛
⎞⎛
⎞
a2 b1 − a1 b2 c1 a2 − c2 a1 0 a2 −a1 a0 b0 c0 ⎟ ⎜ ⎟⎜ ⎟ 0 b2 c0 − b0 c2 ⎠ = ⎝ b2 0 −b0 ⎠ ⎝ a1 b1 c1 ⎠ . b0 c1 − b1 c0 0 c1 −c0 0 a2 b2 c2
Es existiert ein Schnittpunkt, wenn Δ = 0. Die Behauptung des Satzes folgt nun daraus, dass genau dann D = 0 ist, wenn Δ = 0 ist. 2
VII Projektive Geometrie
146
Der zu Satz 3 duale Satz ist die Umkehrung von Satz 3. Man kann in Satz 3 also dann“ durch genau dann“ ersetzen. Der Satz von Desargues wird durch Fig. 4 ” ” plausibel, wenn man sie als Zentralprojektion einer Ebene auf eine andere deutet. . .. ....s. ... .... .........C .... . . . . . ... .... ... ..... .. .. ....... . . . . ... ...... .. .... .... . . . ... ... A........s.............. .. . ............. ... . . . . .............. ....... ... .. . . . . . . . . .. ... .................s...B ... .... . . . . . . .......s...........................................................................................................s......................................s...... s . ....... ... . . . . . . . . ............. ... ....... .. ......s.................................. ..... .. B . . . . .. .... .. A ... ........... .. .. .. ....... ... ....... .. .... .. ....... ..... .. . ....s ... ... C ... . ..
Der Beweis des Satzes von Desargues mit Methoden der projektiven Geometrie hat gegen¨ uber den Methoden der affinen Geometrie den Vorteil, dass man den Fall, dass die Geraden durch A, A , durch B, B und durch C, C parallel sind, nicht als Sonderfall behandeln muss, dass also mit Satz 3 auch der folgende Satz aus der affinen Geometrie bewiesen ist: Gegeben seien zwei Dreiecke ABC und A B C . Sind die Geraden durch einander zugeordnete Ecken parallel, dann sind die Geraden durch einander zugeordnete Seiten kollinear (Fig. 6).
Fig. 6: Satz von Desargues (Sonderfall)
Definition 2: Auf einer Geraden r1u1 + r2u2 (r1 , r2 ∈ IR) seien vier Punkte A, B, P, Q durch die Vektoren
r1 ∈ r2
a1 b1 p1 q1 , , , a2 b2 p2 q2
(jeweils bis auf einen skalaren Faktor) gegeben. Dann nennt man die Zahl DV(A, B, P, Q) =
p1 p2 p1 p2
a1 a2 b1 b2
a1 a : 2 b1 b2
q1 q2 q1 q2
das Doppelverh¨altnis des kollinearen Punktequadrupels (A, B, C, D). Diese Bezeichnung wird in dem unten folgenden Satz 6 verst¨andlich. Satz 4: Das Doppelverh¨altnis in Definition 2 h¨angt nicht von der Wahl der Grundvektoren u1 , u2 ab. Beweis: Sind v1 , v2 andere Grundvektoren der Geraden r1u1 + r2u2 , dann ist u1 = t11v1 + t12v2 u2 = t21v1 + t22v2
t 11 t21
mit
t12 t22
= 0.
Es folgt r1u1 + r2u2 = (t11 r1 + t21 r2 )v1 + (t21 r1 + t22 r2 )v2 = r1∗v1 + r2∗v2 mit
r1∗ t11 = r2∗ t21
t12 t22
r1 . r2
VII.2 Projektive Abbildungen
147
Daher ist r 1 r2
s1 s2
t 11 = t21
t12 t22
r1∗ s∗1 r2∗ s∗2
t 11 = t21
t12 t22
r∗ 1 · ∗ r2
s∗1 s∗2
.
Also multiplizieren sich die Determinanten in der Definition des Doppelverh¨altnisses alle mit der Determinante von (tij ), was sich aber wieder herausk¨ urzt. 2 Satz 5: Das Doppelverh¨altnis ist invariant gegen¨ uber projektiven Abbildungen. Beweis: Ist A die Matrix einer projektiven Abbildung und x = r1u1 + r2u2 , dann ist Ax = r1 Au1 + r2 Au2 . Nun sind aber Au1 , Au2 Grundvektoren der Bildgeraden, bez¨ uglich welcher die Bildpunkte die gleichen Koordinatenvektoren wie die Urbildpunkte haben. 2 Satz 6: Sind A, B, P, Q eigentliche kollineare Punkte, dann gilt DV(A, B, P, Q) =
AP AQ : , BP AQ
wobei allgemein U V die L¨ange der Strecke U V bedeutet. Beweis: Wegen der projektiven Invarianz des Doppelverh¨altnisses gen¨ ugt es, die Gerade mit den Grundvektoren u1 = (1 0 0)T und u2 = (0 1 0)T zu betrachten. Dann ist r1u1 + r2u2 = (r1 r2 0)T , und im Fall r1 = 0 ist dies der Punkt auf der r x1 -Achse an der Stelle 2 . Es ist also
a1 a2 b1 b2
p1 p2 p1 p2
a1 a : 2 b1 b2
r1 p2 q2 a2 a2 q1 − − a1 p2 − a2 p1 a1 p2 − a2 q1 q2 p1 a1 q1 a1 = : = p : q . b2 b2 2 2 q1 b 1 p 2 − b 2 p 1 b 1 q2 − b 2 q1 − − p1 b1 q1 b1 q2
2
Definition 3: Das Doppelverh¨altnis von vier kopunktalen Geraden wird definiert durch = DV([a], [b], [c], [d]). DV(a, b, c, d) Auch hierf¨ ur gelten nat¨ urlich die S¨atze 4 und 5. Satz 7: Werden vier Geraden eines B¨ uschels in der projektiven Ebene (kopunktale Geraden) von einer nicht zum B¨ uschel geh¨orenden Geraden geschnitten, dann ist das Doppelverh¨altnis der Geraden gleich dem Doppelverh¨altnis der Schnittpunkte. Beweis: Die Gerade r1u1 + r2u2 soll nicht zum B¨ uschel {s1v1 + s2v2 | s1 , s2 ∈ IR, (s1 , s2 ) = (0, 0)}
VII Projektive Geometrie
148
geh¨oren. Die Schnittbedingung (r1u1 + r2u2 )T (s1v1 + s2v2 ) = 0 bzw. r1 (s1uT1 v1 + s2uT1 v2 ) = r2 (−s1uT2 v1 − s2uT2 v2 ) ist erf¨ ullt, wenn der Vektor ⎛ ⎜ ⎝
−s1uT2 v1 − s2uT2 v2
ein Vielfaches von
s1uT1 v1 + s2uT1 v2
⎞ ⎟ ⎠=
−uT2 v1 −uT2 v2 uT1 v1 uT1 v2
s1 s2
r1 ist. Die dabei aufgetretene Matrix M ist das Produkt von r2
−uT2 (v1 v2 ). uT1 Wie im Beweis von Satz 2 folgt daraus, dass sich altnisse vom die Doppelverh¨ r1 s1 u =M Geradenb¨ uschel auf die Schnittgerade verm¨oge ¨bertragen bzw. zwei Matrizen vom Rang 2 (und somit regul¨ar), n¨amlich M =
umgekehrt. Satz 7 findet Anwendung bei der Konstruktion von Bildpunkten und Bildgeraden bei einer projektiven Abbildung: Kennt man zu drei von vier kollinearen Punkten die Bildpunkte, dann kann man den vierten Bildpunkt konstruieren. Kennt man zu drei von vier kopunktalen Geraden die Bildgeraden, dann kann man die vierte Bildgerade konstruieren (Fig. 7). Der folgende Satz beinhaltet eine interessante Anwendung des Begriff des Doppelverh¨alnisses. Satz 8 (Satz von Ceva, nach Giovanni Ceva, 1648–1737): In einem Dreieck ABC seien A1 , A2 bzw. B1 , B2 bzw. C1 , C2 zwei Punkte auf der Geraden durch die dem Punkt A bzw. B bzw. C gegen¨ uberliegende Seite (Fig. 8). Dann folgt aus je zwei der folgenden Aussagen die dritte:
r2
s2
2 s . . ............ ......... .... ..... . ........ . . ...... ...s............s................... . . . .... .s.............. .. .......s.............. ..... ..... . . ......... . . . . . . . . . . . . . ... .. .. ...........s.............. ..... .. ... .. ... .......... ........................s.. .. .....s... . .. .......s... ... . .. .. .. ........s. .. ........s....... ........ ..... .. .. .. ..........s.. . ... .. .... .. .. .. .... ............s........ e ...................... .. .. ............................................................ Hilfsgerade ......... .. .... ......... ...s..................... ......... .... Fig. 7: Anwendung von Satz 7
...... ...... ......t A2 .......... ... ...... t ... ..... B2 C...........t.. ............ . . .. B1....t..... .... ...... ........... . ...... .. ... tA1 ....... . . . . .. ...... .... .......t......... ...... ...... .... .............................. ...... . . . ...... . . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . ......... ... ........... .. . . . . . t t t . . .. .................................................... .......................................t...... C1 C2 .......... A B . Fig. 8: Zum Satz von Ceva
• Die Transversalen AA1 , BB1 , CC1 sind kopunktal. • Die Punkte A2 , B2 , C2 sind kollinear. • DV(A, B, C1 , C2 ) · DV(B, C, A1 , A2 ) · DV(C, A, B1 , B2 ) = −1.
VII.2 Projektive Abbildungen
149
Oft versteht man unter dem Satz von Ceva nur, dass aus der ersten und zweiten die dritte Aussage folgt. Die vorliegende Form des Satzes besagt auch, dass aus jeder der drei Aussagen folgt, dass sich die beiden anderen gegenseitig bedingen. Beweis: Die Punkte A, B, C, A1 , B1 , C2 , A2 , B2 , C2 sollen der Reihe nach folgende Koordinatenvektoren haben: a, b, c, a + λ1b, b + μ1c, c + ν1a, a + λ2b, b + μ2c, c + ν2a Die Punkte A2 , B2 , C2 sind genau dann kollinear, wenn ihre Koordinatenvektoren linear abh¨angig sind, wenn also die Gleichung x(a + λ2b) + y(b + μ2c) + z(c + ν2a) = (x + ν2 z)a + (λ2 x + y)b + (μ2 y + z)c = o eine nichttriviale L¨osung (x, y, z) hat, wenn also (wegen der linearen Unabh¨angigkeit von a, b, c) gilt: 1 λ2 0
0 ν2 1 0 = 1 + λ2 μ2 ν2 = 0 μ2 1
Wegen der Invarianz des Doppelverh¨altnisses k¨onnen wir f¨ ur die weitere Untersuchung die Punkte A, B, C mit den Koordinatenvektoren (1 0 0)T , (1 1 0)T , (1 0 1)T w¨ahlen. Dann gilt: Die Gerade durch A und A1 hat den Koordinatenvektor (0 μ1 − 1)T ; die Gerade durch B und B1 hat den Koordinatenvektor (−1 1 1 + ν1 )T ; die Gerade durch C und C1 hat den Koordinatenvektor (−λ1 1 + λ1 λ1 )T . Diese Geraden sind genau dann kopunktal, wenn gilt: 0 μ1 −1
−1 −λ1 1 1 + λ1 1 + ν1 λ1
= 1 − λ1 μ1 ν1 = 0
Wegen λ1 , λ2 μ d2 = DV(B, C, A1 , A2 ) = 1 , μ2 ν1 d3 = DV(C, A, B1 , B2 ) = ν2
d1 = DV(A, B, C1 , C2 ) =
ist λ2 μ2 ν2 = (d1 d2 d3 ) λ1 μ1 ν1 . Also folgt aus zwei der Aussagen • 1 − λ1 μ1 ν1 = 0 stets die dritte.
•
1 + λ2 μ2 ν2 = 0
•
d1 d2 d3 = −1 2
VII Projektive Geometrie
150
Aufgaben 1. Beweise die Behauptung am Ende von Beispiel 4. 2. Das kollineare Punktequadrupel (A, B, C, D) heißt harmonisch, wenn DV(A, B, C, D) = −1. Man bestimme zu
A = [(1 0 2)T ], B = [(1 2 1)T ], C = [(5 4 8)T ] einen Punkt C so, dass (A, B, C, D) harmonisch ist.
3. Man zeige, dass auf der projektiven Geraden die Punkte A = [a], B = [b], C = [a + tb], D = [a − tb] f¨ ur t = 0 ein harmonisches Quadrupel bilden.
4. Bei einer projektiven Abbildung der projektiven Ebene seien die Bilder von [(1 2 1)T ], [(2 3 7)T ], [(1 − 1 0)T ], [(3 1 − 4)T ] der Reihe nach [(0 3 2)T ], [(−1 0 2)T ], [(1 1 1)T ], [(4 7 − 1)T ]. Man bestimme die Matrix der Abbildung.
5. In einem r¨aumlichen kartesischen Koordinatensystem denke man sich die x2 x3 -Ebene durch eine Zentralprojektion mit dem Zentrum Z(−1, 0, 1) auf die x1 x2 -Ebene projiziert. Dann drehe man die x1 x2 -Ebene um die x2 -Achse in die x2 x3 -Ebene, wobei der Punkt (1, 0, 0) auf den Punkt (0, 0, 1) f¨allt. Auf diese Art ergibt sich eine projektive Abbildung der x2 x3 -Ebene, verstanden als projektive Ebene. Man bestimme die Abbildungsmatrix.
6. Gegeben sei die Abbildung des projektiven Raums auf sich mit der Matrix ⎛
1 ⎜ 2 A=⎜ ⎝ 1 0
⎞ 1 −1 0 0 1 0 ⎟ ⎟. −1 4 0 ⎠ 3 2 1
a) Welche Ebene wird auf die uneigentliche Ebene abgebildet? b) Auf welche Ebene wird die uneigentliche Ebene abgebildet? c) Auf welche Gerade wird die Schnittgerade der Ebenen mit den Gleichungen x0 − 2x1 + x2 − 5x3 = 0 und 2x0 + x1 + 3x2 + 3x3 = 0 abgebildet? d) Welche Geraden werden auf uneigentliche Geraden abgebildet?
7. Zum Beweis des Satzes von Desargues betrachte man drei Punkte und ihre Bildpunkte mit den Koordinatenvektoren a, b, c und a , b , c , ferner einen Punkt mit mit dem Koordinatenvektor z. Es sei z eine Linearkombination von a und a , von b und b und von c und c . Man zeige: Ist u Linearkombination von a, b und von a , b , v Linearkombination von b, c und von b , c , w Linearkombination von c, a und von c , a , dann ist {u, v , w} linear abh¨angig.
VII.3 Kegelschnitte in der projektiven Ebene
151
VII.3 Kegelschnitte in der projektiven Ebene Die Gleichung einer Kurve zweiter Ordnung in homogenen Koordinaten lautet a00 x20 + a11 x21 + a22 x22 + 2a01 x0 x1 + 2a02 x0 x2 + 2a12 x1 x2 = 0 ⎛
a00 mit A = ⎝ a01 a02
T
bzw. x Ax = 0
⎞ a02 a12 ⎠. a22
a01 a11 a12
Die Matrix A ist dabei symmetrisch, es gilt also AT = A. (Die Koeffizienten a01 , a02 , a03 werden dabei mit einem Faktor 2 notiert, damit die Matrix diese einfache Form erh¨alt.) Die Gleichung des Einheitskreises lautet in homogenen Koordinaten ⎛
−x20
+
x21
+
x22
−1 0 mit K = ⎝ 0 1 0 0
T
= 0 bzw. x Kx
⎞ 0 0 ⎠. 1
Wird durch die regul¨are Matrix B ∈ IR3,3 eine projektive Abbildung x → x der Ebene auf sich definiert, ist also x = Bx bzw. x = Cx mit C = B −1 , dann wird der Einheitskreis auf die Kegelschnittkurve mit der Gleichung x T C T KC x = 0 abgebildet. Jeder nicht-ausgeartete Kegelschnitt (Ellipse, Hyperbel, Parabel) ist das Bild des Einheitskreises bei einer geeigneten projektiven Abbildung der Ebene: Die Ellipse erh¨alt man bereits mit einer affinen Abbildung, bei der affinen Normalform der Hyperbel bzw. Parabel mit den Matrizen ⎛
1 A=⎝ 0 0
0 −1 0
⎞ 0 0 ⎠ 1
⎛
bzw.
0 A = ⎝ −1 0
⎞ −1 0 0 0 ⎠ 0 1
(also x20 − x21 + x22 = 0 bzw. x22 − 2x0 x1 = 0) verwende man ⎛
0 C=⎝ 1 0
1 0 0
⎞ 0 0 ⎠ 1
⎛
bzw.
1 1 C=⎝ 1 0 0 1
⎞ 1 1 ⎠. 1
Beispiel 1: Folgende Transformation bildet den Einheitskreis auf die Hyperbel mit der Gleichung 5x21 + 2x1 x2 − 2x2 − 1 = 0 (im kartesischen x1 x2 Koordinatensystem) ab: ⎛
1 ⎝ 0 1
0 2 0
⎞⎛ 0 −1 1 ⎠⎝ 0 1 0
0 1 0
⎞⎛ 0 1 0 ⎠⎝ 0 1 0
0 2 1
⎞ ⎛ 1 1 0 0 ⎠ = ⎝ 0 −5 1 1 −1
⎞ 1 −1 ⎠ 0
VII Projektive Geometrie
152
Die Entstehung der Kegelschnitte als projektive Bilder eines Kreises kann man anschaulich darstellen, wenn man die Mantellinien eines Kreiskegels als Projektionsstrahlen deutet, wobei die Kegelspitze das Projektionszentrum ist und die Schnittebene als Projektionsebene dient. In Fig. 1 sind die Kegelschnitte nochmals als Zentralprojektionen eines Kreises beschrieben. ... H *..H . H
.... ... ...H *........ ........... ....... .... ... .. .... H . . . . .. ... .. .. ... .. ... HH .. ... .. .. j H ......... ..... ... ... .. .. ..* . ..... . . . .. . ... ..... .. . . . .... .. . ........... . .... .... .... ....................... .... ..... .... . ...................... ...... ....... ... Hyperbel ...... . . ........... . Parabel . . . . ... . . . Ellipse . . ......... . . . . . .. . . . ................... .. . . . ....
Fig. 1: Kegelschnitte als Zentralprojektionen eines Kreises
Satz 1: Es sei r1u1 + r2u2 ((r1 , r2 ) = (0, 0)) ein Geradenb¨ uschel und C die Matrix einer projektiven Abbildung der Ebene. Dann bilden die Schnittpunkte jeweils einer B¨ uschelgeraden mit ihrer Bildgeraden eine Kurve zweiter Ordnung. Beweis: Das Bild der Geraden r1u1 + r2u2 ist r1v1 + r2v2 mit vi = (C −1 )T ui . F¨ ur den Schnittpunkt [x] der Geraden und ihrer Bildgeraden gilt r1 (x T u1 ) + r2 (x T u2 ) = 0
r1 (x T v1 ) + r2 (x T v2 ) = 0.
und
Dieses homogene LGS f¨ ur r1 , r2 muss eine von (0, 0) verschiedene L¨osung haben, es gilt also (x T u1 )(x T v2 ) − (x T u2 )(x T v1 ) = 0 bzw.
x T (u1v2 T − u2v1 T )x = 0.
Mit der Matrix B = u1v2 T − u2v1 T bilde man A = B + B T . Dann gilt xT A x = 0 mit AT = A.
2
Beispiel 2: Auf das Geradenb¨ uschel r1 (1 1 1)T + r2 (2 − 1 5)T wende man die projektive Abbildung mit der Matrix ⎛
1 C =⎝ 0 1
0 2 3
⎞ 1 −1 ⎠ 0
⎛
bzw.
3 (C −1 )T = ⎝ 3 −2
−1 −1 1
⎞ −2 −3 ⎠ 2
an. Es ist (C −1 )T (1 1 1)T = (0 − 1 1)T und (C −1 )T (2 − 1 5)T = (−3 − 8 5)T . F¨ ur obige Matrix B (siehe Beweis von Satz 1) ergibt sich ⎛
T
T
B = (1 1 1) (−3 − 8 5) − (2 − 1 5) (0 − 1
−1 1) = 3⎝ −1 −1
⎞ −2 1 −3 2 ⎠ −1 0
VII.3 Kegelschnitte in der projektiven Ebene
153
und damit unter Weglassung des Faktors 3 ⎛
A = B + BT
⎞ −2 −3 0 = ⎝ −3 −6 1 ⎠. 0 1 0
Die Gleichung der Kurve lautet x20 +3x21 +3x0 x1 −x1 x2 = 0, in affinen Koordinaten also 3x21 −x1 x2 + 3x1 = −1 bzw. x1 (3x1 −x2 + 3) = −1. Mit der affinen Abbildung x1 = x1 , x2 = −3x1 + x2 − 3 l¨asst sich dies in x1 x2 = 1 u uhren, es handelt sich also ¨berf¨ um eine Hyperbel. Beispiel 3: In Fig. 2 ist gem¨aß Satz 1 eine Parabel mit Hilfe zweier Geradenb¨ uschel definiert; vgl. hierzu Aufgabe 3.
..t............. ........t ... .................. ............. ... . . . . . . . . . . . . . . ..... ....t........... ..... ....t ... ............................................................................................................... ...t................... ................................................................. . . ... ......................................................................................................................................t . ......................................................................................................................................................................w P ...w .............................................................................................................................................................................................. P ...t..................................................................................................................................................t. .......t........................................................................................................................................................t... ........................................................................................................................ ...t.................................................................................................t. .....t.............................................................................................t.. ......t.............................................................................t.... . ......t.........................................................t............ .....t............................................t.. ..........g . ...t....t...t.....t..t .... g Fig. 2: Beispiel zu Satz 1
Viele interessante S¨atze u ¨ber Kegelschnitte lassen sich sehr einfach beweisen, wenn die im Satz auftretenden Begriffe projektive Invarianten sind (z.B. Schnittpunkt zweier Geraden, Verbindungsgerade zweier Punkte, nicht-ausgeartete Kurve zweiter Ordnung usw.). Satz 2 (Satz von Pascal, nach Blaise Pascal, 1623–1662): F¨ ur ein Sehnensechseck eines nicht-ausgearteten Kegelschnitts gilt (Fig. 3): Die drei Schnittpunkte je zweier Gegenseiten sind kollinear. . .. ...........................t..................................................t.................. ...........s.. . . s . . . . . . . . . . . . . . . .. ....... ............ . .... ......... ..................................... . . . . . . . . . . . . . . . . . . . . . . . ...... .... ............... ...s....... . .. . .....t. .. .... ...... ....s.......... .... . .. ................................. .............................. .... ..... . . .....v . ..... ....s.................. ... ... ... . . . . . . . . . . . . ............................. ... . . . . . . . . ..... .... .....................s .... ...... ... ............ . . . . .............. .... . . . . . . . . . . . . . ....... . .... ... .... . ........ ... .....s..........s. ....... ... . .... . . . . . . . . . . . . . .... . .... ... ..........t.. .... .. ...............t .... .... ... ........ . . . . . . . . . . . . . . ..... .. .... .. . ............ .. .... ... . .............. ... ................. ... .... .. .. . . . . . .......................... .... .. . .. .t. ........ ............ .....s .... .. Fig. 3: Satz von Pascal
Fig. 4: Satz von Brianchon
Satz 3 (Satz von Brianchon, nach Charles Brianchon, 1783–1864): F¨ ur ein Tangentensechseck eines nicht-ausgearteten Kegelschnitts gilt (Fig. 4): Die drei Verbindungsgeraden je zweier Gegenecken sind kopunktal.
VII Projektive Geometrie
154
Da jede Kegelschnittkurve das projektive Bild des Einheitskreises ist, gen¨ ugt es, die beiden S¨atze f¨ ur den Einheitskreis zu beweisen. Von diesen beiden S¨atzen u ¨ber den Einheitskreis muss nur einer bewiesen werden, da die S¨atze zueinander dual sind. Den Satz von Pascal f¨ ur den Einheitskreis kann man nun elementargeometrisch beweisen, wie es Fig. 5 f¨ ur den Fall eines konvexen (nicht-¨ uberschlagenen) Sehnensechsecks zeigt. Mit Hilfe des Satzes u ¨ber das Sehnenviereck im Kreis, wonach sich einander gegen¨ uberliegende Winkel zu 180o erg¨anzen, weist man nach, dass die Dreiecke S2 U V und S1 A3 A6 paarweise parallele Seiten haben und daher zentrisch ¨ahnlich bez¨ uglich des Streckzentrums S3 sind. Daher liegt S1 auf der Geraden durch S2 und S3 . A6 ....................u........... . . . . . . . . . ....... ......... .... ....... ..... ...... .................. ........ . . . . . . ... ... .. ...... ... ... .. .. .......... ... .. . . ... ... .. A1 .. ........ ... .. ....u...... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... .. . . . . . . . . .... .... .... ......... .. ................................u.....A . . . . .... 5 ... .............................. .. . .... ............. ...... ....u............... . . . . . . . . ... . A2. ................. .. ...............u ...... ... .. .. .....................................................................A ..... ...... . . . . . u......................... . . .... 4 . . . . . . . . . . . . . . . . . . . . ... . . . . . . . . . . . . . . ....... .... A3 ......... . . . . .... . . . . . . . . . . . . . . . .......e.....V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ... ... ... ... ............... .. ...... .............. ... .............. .......... ... .. ...... .. ..u................... . ... ...... ..... ... .. .. ... .. ... .. ............. ...... . ... . S1 . . . . . . . .. . ... . . . . . . . . . . . ........ ... . ..... ... ... ...e...... ... ... .. ...... ..... .. .. .. . .. . .. ... ..... .. . ...... .............. ...... ........ ... ...... ...................... . . . . ... .... U ......... ......u.......... . . . . . . . ... ...... ................... ... ...... .. . . ...... S2 ...... ...... ...... ... ...... ... ...... ... ...... ... ...... ... Fig. 5: Satz von Pascal ........ .u.. S3
Aufgaben
1. Welche projektive Abbildung bildet die Scheitel der Ellipse mit der affinen Gleichung 4x21 +9x22 = 36 auf die Punkte [(1 −1 −1)T ], [(1 1 1)T ], [(0 1 0)T ], [(0 0 1)T ] der Hyperbel mit der affinen Gleichung x1 x2 = 1 ab? Man pr¨ ufe, ob die Ellipse auf die Hyperbel abgebildet wird.
2. Die Geraden durch die Punkte (r, 0, 0) und (0, r, 1) (r ∈ IR) des affinen Raums erzeugen eine Quadrik. Man bestimme ihre Gleichung.
3. In Beispiel 3 soll mit P (−1, 0) und P (1, 0) gem¨aß Satz 1 die Parabel mit der Gleichung x2 = x21 − 1 im kartesischen Koordinatensystem entstehen. Man bestimme die Matrix C der zugeh¨origen projektiven Abbildung.
VIII Lineare Optimierung VIII.1 Problemstellung und Grundbegriffe Beispiel 1: Ein Landwirt hat 40 ha Anbaufl¨ache, 12 000,– Kapital und 240 Arbeitstage zur Verf¨ ugung. Er m¨ochte Weizen und Zuckerr¨ uben anbauen. Der Zeitaufwand, der Kapitalaufwand und der Netto-Verkaufserl¨os pro ha sind in nebenstehender Tabelle angegeben.
Weizen
Zuckerr¨ uben
Kosten/ha
200,–
600,–
Tage/ha
5
10
Erl¨os/ha
1000,–
1200,–
Wie muss er die Anzahlen x1 und x2 der f¨ ur Weizen bzw. Zuckerr¨ uben zu verwendenden ha festlegen, um einen m¨oglichst großen Gewinn zu erzielen? Zun¨achst muss ein System von 5 linearen Ungleichungen betrachtet werden: x1 ≥ 0,
x2 ≥ 0,
x1 + x2 ≤ 40,
200x1 + 600x2 ≤ 12 000,
5x1 + 10x2 ≤ 240
Die L¨osungsmenge des Ungleichungssystems ist ein F¨ unfeck im x1 x2 Koordinatensystem, das Planungsvieleck der gestellten Aufgabe. Die Ecken des Planungsvielecks ergeben sich als Schnittpunkte der Geraden, welche die durch die Ungleichungen gegebenen Halbebenen begrenzen. Der Verkaufserl¨os betr¨agt Z = 1000x1 + 1200x2 . Dies ist die Zielfunktion des Problems. Unter den zu der Geraden mit der Gleichung 1000x1 + 1200x2 = 0 parallelen Geraden, welche mindestens einen Punkt mit dem Planungsvieleck gemeinsam haben, ist diejenige mit dem gr¨oßten Wert der Zielfunktion zu bestimmen. Dieser optimale Wert wird in der Ecke (32,8) des Planungsvielecks angenommen (Fig. 1) und betr¨agt Zmax = 1000 · 32 + 1200 · 8 = 41 600. .... x2 .... .... ... 6 ......... .... . . .... .... ............... ... ... .... .... .... ............................ . .... .. ... .... ... ... . ... ............ . .. .... .....u.... .... ... .... .... . ... .......................... .. .... . .... .... . ... ............... .. .... .. . ............ ... . ... .... . ........ .... .................................... ... .... ......................... ... .... . .... ... (32,8) .... .... ... .. . .... .... . . .... ..................... ... ................ .... .. .... . .. . .. . . . . Z = 0.. .... ... ... .... 10............. .... .... .. .... .. .... .... ... ... ..........u.................................. . .... ... .... .... .. .. .... ... .. . ... .... .. .. .... ... . ......................u... . .. .. .... .... . . ... .... . .. .... ... . ...................... .... ... .... .... .. .. .... . ... . . ... .... .. .. .... ... . .... .................. . ... .... .. .. ... ... . . ... .... .. .. .... ... . ..................... . ... .... .. .. .. .... ... . . ... ... .. .. ... ... . ..................... . ... .... .. ... .... ... . . . ... .... .. . .... ... .................... . ... .... x1 ..u...................................................................................................................................u ............ . ... .... .. .. ... .. . . ... .... .. .. .... .. . ... ............. . ... .... . . .. .. 10 . . . .. .. .... .... ... .... . .... ... .... .... . ... .. .... .... .. .... . .... ... ................... .... .... .. .. .... ... . . ... .... .. .. ... .. .. .. .... ... . . . .. .. Fig. 1: Planungsvieleck und Zielfunktion
VIII Lineare Optimierung
156
In diesem einf¨ uhrenden Beispiel ist anschaulich klar, dass die L¨osung eine Ecke des Planungsvielecks ist. Es ist nat¨ urlich auch denkbar, dass zwei benachbarte Ecken und damit alle Punkte der Vielecksseite zwischen diesen Ecken L¨osungen sind, n¨amlich dann, wenn die Zielfunktion eine zu eiEcke Z ner Vielecksseite parallele Gerade beschreibt. Ohne Be(0, 0) 0 zug auf die Zeichnung in Fig. 1 zu nehmen kann man (40, 0) 40 000 das Problem l¨osen, indem man die Ecken berechnet (als (32, 8) 41 600 Schnittpunkte von Geraden), dann die Werte von Z in (24, 12) 38 400 den Ecken bestimmt und pr¨ uft, f¨ ur welche Ecke sich da(0, 20) 24 000 bei der gr¨oßte Wert ergibt (vgl. nebenstehende Tabelle). Man kann obige Aufgabe durch Einf¨ uhrung weiterer Variabler (Schlupfvariable) so umgestalten, dass außer den Positivit¨atsbedingungen xi ≥ 0 nur Gleichungen (statt Ungleichungen) auftreten: Setzt man x3 , x4 , x5 f¨ ur die u ¨brigbleibende Fl¨ache, das u ¨brigbleibende Kapital und die u ¨brigbleibende Zeit, dann erh¨alt man abgesehen von den f¨ unf Positivit¨atsbedingungen drei Gleichungen mit f¨ unf Variablen: x1 + x2 + x 3 = 40 200x1 + 600x2 +x4 = 12 000 5x1 + 10x2 + x5 = 240
(x1 , x2 , x3 , x4 , x5 ≥ 0).
Die Au߬osung des LGS nach x1 , x2 , x3 (mit den Parametern x4 , x5 ) ist x1 = 24 +
1 3 x 4 − x5 , 100 5
x2 = 12 −
1 1 x 4 + x5 , 200 5
x3 = 4 −
1 2 x 4 + x5 . 200 5
Damit ergibt sich Z = 4x4 − 360x5 + 38 400. Damit Z m¨oglichst groß wird w¨ahle man x5 = 0 und x4 gr¨oßtm¨oglich so, dass x3 ≥ 0 (also x4 ≤ 800) und x2 ≥ 0 (also x4 ≤ 2400) und somit x4 = 800. Damit erh¨alt man x1 = 32, x2 = 8 und Zmax = 3200 + 38 400 = 41 600. Durch Einf¨ uhrung der Schlupfvariablen haben wir (zumindest bei dieser Aufgabe) erreicht, dass wir uns nicht mehr auf geometrische Konzepte (Ecken des Planungsvielecks) st¨ utzen m¨ ussen, sondern rein algebraisch vorgehen k¨onnen. Trotzdem werden wir weiterhin den Bereich der m¨oglichen L¨osungen als Polyeder (Planungspolyeder) auffassen und uns f¨ ur dessen Ecken interessieren. Die Ecken des hier vorliegenden f¨ unfdimensionalen Planungspolyeders ergeben sich, indem man von den acht Gleichungen (einschließlich der Gleichungen x1 = 0, . . . , x5 = 0) der Begrenzungsebe” nen“ des Planungspolyeders f¨ unf ausw¨ahlt und deren Schnittpunkte mit nichtnegativen Koordinaten berechnet. Es ergeben sich die Ecken in nebenstehender Tabelle, an denen man wieder die oben angegebenen Ecken in der x1 x2 -Ebene erkennt.
(0, 0, 40, 12 000, 240) (40, 0, 0, 4000, 40) (32, 8, 0, 800, 0) (24, 12, 4, 0, 0) (0, 20, 20, 0, 40)
VIII.1 Problemstellung und Grundbegriffe
157
Projiziert man den betrachteten f¨ unfdimensionalen Planungsbereich in die x1 x2 Ebene (indem man die x3 -, x4 - und x5 - Koordinaten gleich 0 setzt), dann ergibt sich der urspr¨ ungliche zweidimensionale Planungsbereich. Beispiel 2: Wir betrachten die Optimierungsaufgabe ⎧ ⎪ ⎨
⎫
x 1 + x2 + x3 ≤ 7 ⎪ ⎬ 2x1 + x2 + x3 ≤ 8 , x1 , x2 , x3 ≥ 0, Z = 2x1 + 3x2 + 5x3 maximal! ⎪ ⎪ ⎩ ⎭ 4x1 + x2 + 2x2 ≤ 12 Die Ungleichungen definieren Halbebenen, welche ein Polyeder mit acht Ecken begrenzen (Fig. 2). Die Ebene mit der Gleichung 2x1 + 3x2 + 5x3 = 0 wird parallel in Richtung wachsender Werte von x1 , x2 , x3 verschoben, bis sie gerade noch einen Punkt mit dem Polyeder gemeinsam hat, und dieser Punkt ist (offenbar?) eine Ecke des Polyeders. In dieser Ecke ist dann 2x1 + 3x2 + 5x3 maximal. Zur Berechnung der Ecken muss man Schnittpunkte ⎧ von Ebenen bestimmen, ⎫ z.B. muss man zur Berechnung der Ecke (1,4,2) das LGS x3
x1
x1 + x2 + x3 = 7 ⎬ 2x1 + x2 + x3 = 8 l¨osen. ⎭ ⎩ 4x1 + x2 + 2x3 = 12 ⎨
6
Ecke des Maximums von Z .. ... ...... . ................ .r.rrrr.r.rrr ... .... ......r.rrrqqqqqrrv .. rq .. .rr.rrr.r.rrr.r.r m r.r. ... ...rrrrr.qqqqq.. ..rr.r.rr.rrr.v rrrrr.r.rr..r..rr.r.......... .....rrrr..qqq rrr r.rr.r.rr ........ ...rrr ..qqq rrr r.r.rr.rr. ..... .. .. rrr rr.r.rr.r ... .. .. . ......rrrrr.... qqqqqq r.rr.r.r ... . .. . rrr r . rr.r.rr ... rrr .........rrrrr... qqqqqq .rr.rr.r.r ... .. .. .. .. . r rrr r . .. .. . r . r .. ..rrrr.... qqqq . .rr.r.rrr ... rrv .. .. .. .r.rr.rr. ... r q rrr rrrrrrrrr r .. .. r . .... ...rrrrr... qqqqqqqv r r . r r v q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q r r . r r r r r . r r r . r r . r . r rr rrrrrrr.rr.rr.r...... .. . r . qq .. .. .. .. .. .... . . . . . . . . . . . . rrrrrrrrrrrrr.rr.rrr.r.rrrr.r..r.rr.r..r.r.rv . . . . . . . ..... ...rrrrr..q..qqqqqqqqq . . r . r........ ....... .... .. qrq.rq.rrr.rr.rrr.r.rrrr.r.r.rr.r.r.r.rr.r.rr.r.r.rr.r.r.r.r.r.rr.r.r.r.r.r..rr.rr....v . . rrqrv .. ... .... ..... .. ...... .. .. .. ... .. . .. .. .. ........ .. ... .
-
x2
Fig. 2: Planungspolyeder
Wir k¨onnen aber auch folgendermaßen argumentieren: Mit den Schlupfvariablen x4 , x5 , x6 betrachten wir das Gleichungssystem x1 + x 2 + x 3 + x 4 = 7 2x1 + x2 + x3 + x5 = 8 4x1 + x2 + 2x3 + x6 = 12 mit den Positivit¨atsbedingungen x1 , x2 , x3 , x4 , x5 , x6 ≥ 0. Die Aufl¨osung des LGS nach x1 , x2 , x3 (mit den Parametern x4 , x5 , x6 ) ist x1 = 1 + x4 − x5 , x2 = 4 − 2x5 + x6 , x3 = 2 − 2x4 + 3x5 − x6 .
VIII Lineare Optimierung
158 Damit ergibt sich Z = 24 − 8x4 + 7x5 − 2x6 . Wegen x1 ≥ 0 ist x5 ≤ x4 + 1 und damit Z ≤ 31 − x4 − 2x6 .
Mit x4 = x6 = 0 und damit x5 = 1 ergibt sich Zmax = 31, und zwar in der Ecke (0, 2, 5). ¨ Das sind alles keine sehr systematischen und weittragenden Uberlegungen, sie deuten aber schon den Weg zu einer systematischen L¨osung solcher Optimierungsprobleme an. Die Grundaufgabe der linearen Optimierung lautet zun¨achst: Gegeben sei eine Matrix A = (aij ) ∈ IRm,n , ein Vektor b = (bi ) ∈ IRm und ein Vektor u = (uj ) ∈ IRn . Gesucht sind alle x = (xj ) ∈ IRn mit x1 , x2 , . . . , xn ≥ 0 und a11 x1 + a12 x2 + . . . + a1n xn a21 x1 + a22 x2 + . . . + a2n xn .. .
(≤, =, ≥) b1 , (≤, =, ≥) b2 ,
am1 x1 + am2 x2 + . . . + amn xn (≤, =, ≥) bm , f¨ ur welche die Linearform (Zielfunktion) Z(x) = uT x = u1 x1 + u2 x2 + . . . + un xn einen minimalen oder maximalen Wert annimmt. In den obigen m Gleichungen oder Ungleichungen kann man die Beziehungen ≥ durch ≤ ersetzen, indem man die betreffenden Ungleichungen mit −1 multipliziert. Ferner kann man durch Einf¨ uhrung von m weiteren Variablen xn+1 , xn+2 , . . . xn+m (Schlupfvariable) und Erg¨anzung der i-ten Gleichung durch +xn+i alle Ungleichungen in Gleichungen verwandeln, wobei die weiteren Positivit¨atsbedingungen xn+1 , xn+2 , . . . xn+m ≥ 0 gelten sollen. Ferner soll dann stets b1 , b2 , . . . , bm ≥ 0 gelten, was man durch eventuelle Multiplikation einer Gleichung mit −1 erreicht. Statt b1 , b2 , . . . , bm ≥ 0 schreiben wir k¨ unftig kurz b ≥ o. Weiterhin fragen wir immer nach einem Minimum der Zielfunktion Z, was man durch Ersetzung von u durch −u erreichen kann. Die derart standardisierte Grundaufgabe der linearen Optimierung nennt man auch Standardaufgabe der linearen Optimierung. Wir behalten die obigen Bezeichnungen bei (auch wenn es jetzt mehr Variable sind) und formulieren die Standardaufgabe folgendermaßen: Gegeben sei eine Matrix A = (aij ) ∈ IRm,n , ein Vektor b = (bi ) ∈ IRm mit b ≥ o und ein Vektor u = (uj ) ∈ IRn . Gesucht sind alle x = (xj ) ∈ IRn mit Ax = b und x ≥ o,
VIII.1 Problemstellung und Grundbegriffe
159
f¨ ur welche die Linearform (Zielfunktion) Z(x) = uT x einen minimalen Wert annimmt. Dabei steht x ≥ o f¨ ur x1 , x2 , . . . , xn ≥ 0. Die Menge
M = {x ∈ IRn | Ax = b, x ≥ o}
heißt die zul¨assige Menge der Optimierungsaufgabe. Die Elemente von M nennen wir im Folgenden Punkte aus M . Ist M = ∅, dann gibt es nat¨ urlich keine L¨osung der Aufgabe. Notwendige Bedingung f¨ ur M = ∅ ist, dass der Rang der Matrix A gleich dem Rang der erweiterten Matrix (A, b) ist. Ist dabei der Rang r von A und (A, b) kleiner als die Anzahl m der Gleichungen, dann kann man m − r Gleichungen weglassen, weil sie Linearkombinationen der u ¨brigen sind. Daher ist es keine Beschr¨ankung der Allgemeinheit, r = m anzunehmen. Im Folgenden ist also stets vorausgesetzt, dass Rang von A = m = Anzahl der Zeilen von A. Nat¨ urlich ist m < n (= Anzahl der Variablen) anzunehmen, weil andernfalls die zul¨assige Menge aus h¨ochstens einem Punkt best¨ande. Die Menge M ist offensichtlich konvex, d.h. zu je k Punkten x1 , x2 , . . . , xk und k nichtnegativen Zahlen r1 , r2 , . . . , rk mit nation
k i=1
k
i=1
ri = 1 geh¨ort auch die Konvexkombi-
rixi zu M .
Ist M = ∅ und beschr¨ankt, existiert also ein K ∈ IR mit |x| ≤ K f¨ ur alle x ∈ M , dann existiert auch ein x(0) ∈ M mit Z(x(0) ) = Zmin . Das folgt aus dem bekannten Satz aus der Analysis, dass jede auf einer abgeschlossenen und beschr¨ankten Teilmenge von IRn definierte stetige Funktion dort ein Maximum und ein Minimum annimmt. Ein Punkt aus M , in welchem Z sein Minimum Zmin annimmt, heißt ein Minimalpunkt der Aufgabe. Sind x1 , x2 zwei Minimalpunkte, dann ist auch r1x1 + r2x2 mit r1 , r2 ≥ 0 und r1 + r2 = 1 ein Minimalpunkt, denn A(r1x1 + r2x2 ) = r1 Ax1 + r2 Ax2 = r1b + r2b = b, Z(r1x1 + r2x2 ) = r1 Z(x1 ) + r2 Z(x2 ) = r1 Zmin + r2 Zmin = Zmin . Ebenso folgt f¨ ur jede endliche Menge x1 , x2 , . . . , xk von Minimalpunkten, dass auch jede Konvexkombination k
i=1
rixi (r1 , r2 , . . . , rk ≥ 0, r1 + r2 + . . . + rk = 1)
ein Minimalpunkt ist. Die konvexe H¨ ulle (Menge aller Konvexkombinationen) gegebener Minimalpunkte besteht also aus Minimalpunkten.
VIII Lineare Optimierung
160
Von entscheidender Bedeutung f¨ ur ein allgemeines L¨osungsverfahren der Optimierungsaufgabe wird sich Satz 5 herausstellen. Dazu ben¨otigt man den Begriff der Ecke der zul¨assigen Menge M . ............ ......... Eine Punkt aus M heißt eine Ecke von M , wenn ...... .... er keine echte Konvexkombination x1 ..s... ............ ... ....... ... ..u Ecke r1x1 + r2x2 , (r1 , r2 > 0, r1 + r2 = 1) . x2 .s ... M . von zwei verschiedenen Punkten x1 , x2 aus M ......... . . . . . . . . . . . . . .. ist, wenn er also nicht im Inneren einer einer ............... zu M geh¨orenden Strecke“ liegt (Fig. 3). Der ” Fig. 3: Begriff der Ecke von M Punkt o ist, falls er zu M geh¨ort, stets eine Ecke von M (Aufgabe 5). Die Spaltenvektoren von A bezeichnen wir im Folgenden mit a1 , a2 , . . . , an . F¨ ur (0) x(0) ∈ M mit den Koordinaten xj (j = 1, 2, . . . , n) sei (0)
P (x(0) ) = {j | xj > 0}
und
S(x(0) ) = {aj | j ∈ P (x(0) )}.
Satz 1: Ein Punkt x(0) ∈ M ist genau dann eine Ecke von M , wenn S(x(0) ) linear unabh¨angig ist. Beweis: 1) Der Punkt x(0) sei eine Ecke von M . Ist x(0) = o, dann ist S(x(0) ) = ∅ und daher definitionsgem¨aß linear unabh¨angig. Ist x(0) = o, dann ist p = |P (x(0) )| > 0. Wir w¨ahlen die Nummerierung der Spaltenvektoren von A und der Koordinaten von x(0) so, dass (0)
(0)
(0)
(0) x1 > 0, x2 > 0, . . . , x(0) p > 0, xp+1 = 0, . . . , xn = 0.
Dann ist
p
(0)
i=1
xi ai = b. W¨are S(x(0) ) = {a1 , a2 , . . . , ap } linear abh¨angig, g¨abe es
also ein p-Tupel (k1 , k2 , . . . , kp ) = (0, 0, . . . , 0) mit ε ∈ IR mit ε > 0 auch p
i=1
(0)
(xi + εki )ai = b und
p
i=1
p i=1
kiai = o, dann w¨are f¨ ur alle
(0)
(xi − εki )ai = b.
W¨ahlt man ε so klein, dass (1)
(0)
(2)
(0)
xi = xi + εki > 0 und xi = xi − εki > 0 f¨ ur i = 1, 2, . . . , p, (0)
was wegen xi > 0 f¨ ur i = 1, 2, . . . , p m¨oglich ist, dann hat man zwei verschiedene 1 1 Punkte x(1) und x(2) aus M gefunden, so dass x(0) = x(1) + x(2) . Dann ist aber 2
2
x(0) keine Ecke. Daher ist die Annahme, {a1 , a2 , . . . , ap } w¨are linear abh¨angig, auf einen Widerspruch gef¨ uhrt.
VIII.1 Problemstellung und Grundbegriffe
161
2) S(x(0) ) sei linear unabh¨angig. Ist x(0) = o, dann ist x(0) eine Ecke. Andernfalls ist p = |P (x(0) )| > 0. Wir w¨ahlen die Nummerierung der Spaltenvektoren von A und der Koordinaten von x(0) wieder wie oben. W¨are x(0) keine Ecke, dann g¨abe es zwei verschiedene Punkte x1 , x2 ∈ M und r1 , r2 ∈ IR mit x(0) = r1x1 + r2x2 ,
r1 > 0, r2 > 0, r1 + r2 = 1.
Die (p + 1)-te bis n-te Koordinate von x1 und von x2 muss dabei 0 sein (weil sie nicht negativ sein kann). Aus Ax1 = b = Ax2 folgt A(x1 − x2 ) = o, wegen der linearen Unabh¨angigkeit von S(x(0) ) ergibt sich also x1 = x2 , im Widerspruch zu der Annahme, x(0) w¨are keine Ecke. 2 Der Rang von A soll, wie oben vereinbart, gleich der Anzahl m der Gleichungen, also gleich der Anzahl der Zeilen von A sein. Also ist in obigen Bezeichnungen |S(x(0) )| ≤ m f¨ ur alle x(0) ∈ M . Aus Satz 1 folgt daher, dass eine Ecke von M h¨ochstens m positive Koordinaten besitzt. Ist |S(x(0) )| = m, dann ist die Ecke x(0) eindeutig bestimmt, es gibt keine andere Ecke x(∗) mit |S(x(∗) )| = |S(x(0) )|. Beispiel 3: In Beispiel 2 sind z.B. der zweite, dritte und f¨ unfte Spaltenvektor linear unabh¨angig. Die zugeh¨orige Ecke ergibt sich aus x1 = x4 = x6 = 0 und dem LGS x2 + x 3 = 7 x2 + x 3 + x 5 = 8 x2 + 2x3 = 12 zu (0 2 5 0 1 0)T , man erh¨alt also die in Beispiel 2 berechnete Maximalecke (0,2,5) des Polyeders. Auch (2,4,0) tritt in Beispiel 2 als Ecke des Polyeders auf. Sie entspricht der L¨osung (2 4 0 1 0 0)T des Gleichungssystems. Also weiß man aufgrund von Satz 1, dass der erste, zweite und vierte Spaltenvektor linear unabh¨angig sind (was man nat¨ urlich im Beispiel sofort nachpr¨ ufen kann). Satz 2: Ist die zul¨assige Menge M nicht leer, dann besitzt sie eine Ecke. Beweis: Geh¨ort o zu M , dann hat M die Ecke o. Es sei nun p > 0 die kleinste Anzahl positiver Koordinaten, die unter den Punkten von M auftritt, und es sei x∗ ein Punkt mit genau p positiven Koordinaten sowie I die Indexmenge dieser Koordinaten. Dann sind die Spaltenvektoren ai f¨ ur i ∈ I linear unabh¨angig, und ∗ x ist damit nach Satz 1 eine Ecke. W¨are n¨amlich
i∈I
x∗i , i∈I,ri =0 ri
riai = o und ε = min
dann k¨onnte man einen Punkt x∗∗ ∈ M mit weniger als p positiven Koordinaten ∗ konstruieren: x∗∗ ur i ∈ I und x∗∗ ur i ∈ I. 2 i = xi − εri f¨ i = 0 f¨
VIII Lineare Optimierung
162
Satz 3: Die zul¨assige Menge M besitzt h¨ochstens endlich viele Ecken. Beweis: Aus der Menge der Spaltenvektoren von A w¨ahlen wir m linear unabh¨angige Vektoren aus und nummerieren diese mit a1 , a2 , . . . , am . Das LGS x1a1 + x2a2 + . . . + xmam = b − (xm+1am+1 + . . . + xnan ) mit den Variablen x1 , x2 , . . . , xm und den Parametern xm+1 , . . . , xn besitzt f¨ ur jede Wahl der Parameterwerte, also auch f¨ ur xm+1 = . . . = xn = 0 , genau eine (0) (0) x(0) mit diesen Koordinaten, erg¨anzt um L¨osung (x1 , x2 , . . . , x(0) m ). Der Punkt (0) xi = 0 f¨ ur i = m+1, . . . , n, ist L¨osung von Ax = b. Gilt außerdem x(0) ≥ o, dann (0) geh¨ort x zu M und ist nach Satz 1 eine Ecke von M . Jeder linear unabh¨angigen Menge von m der Spaltenvektoren von A ist also h¨ochstens eine Ecke von M zugeordnet. Jede Ecke x(0) l¨asst sich aber auch auf diese Art gewinnen: Man ordne ihren positiven Koordinaten die Spaltenvektoren von A mit dem gleichen Index zu, erg¨anze diese durch weitere Spaltenvektoren von A zu einer Basis von IRm und wende obiges Verfahren zur Gewinnung einer Ecke an. Dabei ergibt sich die Ecke x(0) . Die Anzahl der Ecken von M ist also h¨ochstens gleich der Anzahl der verschiedenen m-Teilmengen der Menge der n Spaltenvektoren von A, also n h¨ochstens gleich dem Binomialkoeffizient . 2 m
Beispiel 4: In Beispiel 2 kann man auf h¨ochstens 20 Arten drei linear unabh¨angige Spaltenvektoren ausw¨ahlen, es gibt also h¨ochstens 20 Ecken. Im Folgenden sind einige F¨alle durchgerechnet. Ob eine Ecke vorliegt, erkennt man am Vorzeichen der Koordinatenwerte. Ecke? ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 ⎝ 2 4 ⎛ 1 ⎝ 2 4 ⎛ 1 ⎝ 1 1 ⎛ 1 ⎝ 2 4 ⎛ 1 ⎝ 1 2 ⎛ 1 ⎝ 0 0
1 ⎠, ⎝ 1 1 ⎞ ⎛ 1 ⎠, ⎝ 1 1 ⎞ ⎛ 0 ⎠, ⎝ 1 0 ⎞ ⎛ 1 ⎠, ⎝ 0 0 ⎞ ⎛ 0 ⎠, ⎝ 1 0 ⎞ ⎛ 0 ⎠, ⎝ 1 0
1 ⎠, ⎝ 1 2 ⎞ ⎛ 1 ⎠, ⎝ 0 0 ⎞ ⎛ 0 ⎠, ⎝ 0 1 ⎞ ⎛ 0 ⎠, ⎝ 0 1 ⎞ ⎛ 0 ⎠, ⎝ 0 1 ⎞ ⎛ 0 ⎠, ⎝ 0 1
⎠
x4 = x5 = x6 = 0, x1 = 1, x2 = 4, x3 = 2
ja
x3 = x5 = x6 = 0, x1 = 2, x2 = 4, x4 = 1
ja
x1 = x3 = x4 = 0, x2 = 7, x5 = 1, x6 = 5
ja
⎞ ⎠ ⎞ ⎠ ⎞ ⎠
x1 = 4, x4 = 3, x6 = −4
nein
x1 = x2 = x4 = 0, x3 = 7, x5 = 1, x6 = −2
nein
x1 = x2 = x3 = 0, x4 = 7, x5 = 8, x6 = 12
ja
x2 = x3 = x5 = 0,
⎞ ⎠ ⎞ ⎠
VIII.1 Problemstellung und Grundbegriffe
163
Die zul¨assige Menge M in Beispiel 2 ist beschr¨ankt: x1 , x2 , x2 , x4 ≤ 7, x5 ≤ 8, x6 ≤ 12. Die zul¨assige Menge einer Optimierungsaufgabe muss aber nicht beschr¨ankt sein; beispielsweise geh¨oren bei der Aufgabe mit x 1 − x 2 + x3 = 2 −2x1 + x2 + x4 = 1 alle Quadrupel (t, t, 2, t + 1) mit t ∈ IR, t ≥ 0 zur zul¨assigen Menge. Satz 4: Ist die zul¨assige Menge M nicht leer und beschr¨ankt, dann ist sie die konvexe H¨ ulle ihrer Ecken, sie ist also ein Polyeder. Beweis: Da die konvexe H¨ ulle der Menge der Ecken von M offensichtlich zu M geh¨ort, ist nur zu zeigen, dass jeder Punkt von M eine Konvexkombination der (nach Satz 3 h¨ochstens endlich vielen) Ecken ist. Ist m = n, dann besitzt Ax = b genau eine L¨osung x(0) , wegen M = ∅ ist also M = {x(0) }, die zul¨assige Menge besteht also nur aus einer Ecke. Ist m < n und b = o, dann ist die L¨osungsmenge von Ax = b bzw. Ax = o ein (n − m)-dimensionaler Unterraum von IRn . Da M beschr¨ankt ist und da mit x auch kx (k ∈ IR) zu M geh¨oren m¨ usste, besteht M nur aus dem Punkt o. Wir nehmen nun m < n und b = o an. Dann ist o ∈ M , jeder Punkt aus M besitzt also mindestens eine positive Koordinate. Es sei x(0) ein Punkt aus M mit genau r positiven Koordinaten (r ≥ 1) und I die Indexmenge dieser positiven Koordinaten. Ist {ai | i ∈ I} linear unabh¨angig, dann ist x(0) nach Satz 1 eine Ecke von M und als solche eine (triviale) Konvexkombination von Ecken aus M . Sei {ai | i ∈ I} linear abh¨angig, also
i∈I
kiai = o, wobei mindestens einer der
Koeffizienten ki als positiv angenommen werden kann. Setzt man mit δ ∈ IR (0)
x∗i (δ) = xi + δki f¨ ur i ∈ I
und x∗i (δ) = 0 sonst,
ur jedes δ ∈ IR eine L¨osung von Ax = b. W¨are keiner der Koeffidann ist x∗ (δ) f¨ zienten ki negativ, dann w¨are x∗ (δ) ∈ M f¨ ur alle δ ∈ IR mit δ > 0 und somit M nicht beschr¨ankt. Daher ist mindestens einer der Koeffizienten ki negativ. Setzt man (0) (0) x(0) x(0) x x δ1 = − min i = − p und δ2 = min i = q , i∈I,ki >0 ki i∈I,ki 0 und x1 = x2 = 0 f¨ Die Punkte x1 , x2 sind L¨osungen von Ax = b. Setzen wir ε gleich dem Minimum (i)
aller Werte
xo i mit ki = 0, dann sind x1 , x2 zul¨assige Punkte. Es gilt ki
Z(x1 ) = Z(x0 ) − ε
p
i=1
ui k i
und Z(x2 ) = Z(x0 ) + ε
p
i=1
u i ki .
ur alle x ∈ M ist Wegen Z(x0 ) ≤ Z(x) f¨ p
i=1
ui ki ≥ 0 und
p
i=1
ui ki ≤ 0,
also
p
i=1
u i ki = 0
und damit Z(x1 ) = Z(x2 ) = Z(x0 ). Demnach sind x1 und x2 Minimalpunkte; von diesen hat mindestens einer aufgrund der Wahl von ε eine positive Koordinate weniger als x0 . Ist x1 ein solcher, dann definiere man S(x1 ) analog zu S(x0 ) und wiederhole die gesamte Argumentation. Schließlich erreicht man den Fall, dass S(xj ) linear unabh¨angig ist, und zwar sp¨atestens dann, wenn diese Menge leer ist. 2
VIII.1 Problemstellung und Grundbegriffe
165
Aufgaben 1. Die Werkst¨ucke A, B durchlaufen die Maschinen M1 , M2 , M3 . Die Bearbeitungszeit von A, B in den einzelnen Maschinen, die wartungsfreie Laufzeit der Maschinen pro Tag und die Gewinne pro Werkst¨ uck (drei M¨oglichkeiten) entnehme man untenstehender Tabelle. F¨ ur welche St¨ uckzahlen ist der Gesamtgewinn pro Tag jeweils maximal? M1 min/Stck M2 min/Stck M3 min/Stck Gewinn/Stck Gewinn/Stck Gewinn/Stck
A B Laufzeit 2 6 12 h 4 4 10 h 40 m 7 2 12 h 50 m 90,– 30,– ← Fall 1 60,– 60,– ← Fall 2 40,– 80,– ← Fall 3
2. Das Planungspolyeder in Beispiel 2 hat u.a. die Ecken A(2, 4, 0), B(1, 4, 2), C(1, 6, 0). F¨ ur welche Zielfunktionen sind alle Punkte der Strecke AB Maximalpunkte? F¨ ur welche Zielfunktion sind alle Punkte der Dreiecksfl¨ache ABC Maximalpunkte?
3. Das Planungspolyeder in Beispiel 2 ist ein konvexer K¨orper, d.h. mit je zwei Punkten geh¨ort auch die Verbindungsstrecke zu diesem K¨orper. Das Planungspolyeder ist die Schnittmenge von Halbr¨aumen, und solche sind konvex. Man zeige allgemein: Die Schnittmenge von konvexen Mengen ist konvex.
4. Man l¨ose das Optimierungsproblem x1 + 2x2 + x3 ≤ 5 x 1 − x2 + x 3 ≤ 4 , x1 + x2 + 3x3 ≤ 6
x1 , x2 , x3 ≥ 0, Z = 6x1 + 4x2 + 2x2 max.
5. Man zeige: Geh¨ort der Nullvektor o zur zul¨assigen Menge M einer linearen Optimierungaufgabe in Standardform, dann ist er eine Ecke von M .
6. Man betrachte die Standardaufgabe der linearen Optimierung mit ⎛
1 A = ⎝ −2 1
−2 1 1
1 0 0
0 1 0
⎞ 0 0 ⎠, 1
⎛
⎞ 2 b = ⎝ 2 ⎠, 1
u = (2 2 − 3 1 5)T .
a) Man gebe alle Ecken der zul¨assigen Menge an. b) Man bestimme alle Minimalpunkte von uT x.
VIII Lineare Optimierung
166
VIII.2 Das Simplexverfahren Beim Simplexverfahren wird zun¨achst eine Ecke der zul¨assigen Menge ermittelt (Startecke, Basisl¨osung) und von dieser ausgehend eine Folge von Ecken mit abnehmenden Werten der Zielfunktion konstruiert. Nach Satz 5 aus VIII.1 nimmt n¨amlich die Zielfunktion, falls sie ein Minimum besitzt, ihren minimalen Wert in einer Ecke an. Man hat dabei die Vorstellung, Ecken eines mehrdimensionalen Polyeders zu durchwandern. Solche Polyeder kann man sich aus einfachen Polyedern zusammengesetzt denken, welche den Namen Simplex tragen: Ein Simplex der Dimension r im Punktraum IRn ist die Menge aller Punkte, deren Ortsvektoren eine Konvexkombination von r + 1 linear unabh¨angigen Vektoren des Vektorraums IRn sind. Im IR3 ist ein Punkt ein 0- dimensionaler Simplex, eine Strecke ein 1-dimensionaler Simplex, ein Dreieck ein 2-dimensionaler Simplex und ein Tetraeder ein 3-dimensionaler Simplex. Obwohl wir es im Folgenden nicht mit Simplexen, sondern mit allgemeineren Polyedern zu tun haben, spricht man vom Simplexverfahren. Wir formulieren hier nochmals die Standardaufgabe der linearen Optimierung und wiederholen einige Definitionen und Bezeichnungen: Standardaufgabe: Es sei A = (aij ) ∈ IRm,n eine Matrix vom Rang m mit den Spaltenvektoren aj (j = 1, 2, . . . , n) und b ∈ IRm mit b ≥ o, ferner u ∈ IRn und Z(x) = uT x. Gesucht sind die Punkte aus M = {x | Ax = b, x ≥ o} mit einem minimalen Wert von Z(x). Die Menge M = {x | Ax = b, x ≥ o} heißt zul¨assige Menge der Standardaufgabe. Eine Punkt x(0) ∈ M heißt eine Ecke von M , wenn er keine echte Konvexkombination von zwei anderen Punkten aus M ist. Zun¨achst untersuchen wir, wie man eine Startecke (Basisl¨osung) x(0) ermittelt und ob u ¨berhaupt eine solche existiert. Geht man von der Nichtstandardform mit M = {x ∈ IRn | Ax ≤ b, x ≥ o} (A ∈ IRm,n , b ∈ IRm ) durch Einf¨ uhrung von m Schlupfvariablen xn+1 , . . . , xn+m zur Standardform mit M = {x ∈ IRn+m | Ax = b , x ≥ o} (A ∈ IRm,n+m , b ∈ IRm , b ≥ o) u ¨ber, dann ist (0 0 . . . 0 b1 b2 . . . bm )T = (oT bT )T eine Ecke von M , denn die zu den von 0 verschiedenen Koordinaten dieses Punktes geh¨orenden Spalten ¨ sind Spalten der beim Ubergang von A zu A hinzugef¨ ugten Einheitsmatrix, also linear unabh¨angig. (Dies ist der in der Praxis am h¨aufigsten auftretende Fall, so dass man sich u ¨ber das Auffinden einer Startecke in der Regel keine Gedanken machen muss.)
VIII.2 Das Simplexverfahren
167
Ist aber die Aufgabe bereits in Standardform (mit A ∈ IRm,n , b ∈ IRm ) gegeben, wobei keineswegs m der Spaltenvektoren von A die verschiedenen Einheitsvektoren sein m¨ ussen, dann geht man folgendermaßen vor: Man f¨ ugt m Schlupfvariable y1 , y2 , . . . , ym mit den Bedingungen yi ≥ 0 hinzu, erg¨anzt also A um die Spalten der Einheitsmatrix aus IRm zu A = (A E), setzt x = (x1 . . . xn y1 . . . ym )T = (xT y T )T und sucht das Minimum von Z (x ) = y1 + y2 + . . . + ym auf der wie u ¨blich T T T definierten zul¨assigen Menge M . Der Punkt (o b ) ist eine Ecke von M . Wegen Z(x ) ≥ 0 f¨ ur alle x ∈ M besitzt Z ein Minimum auf M . Zur Bestimmung dieses Minimums kann man (oT bT )T als Startecke verwenden. Es sei (x(0) T y (0) T )T ein Minimalpunkt dieser Aufgabe (den man mit den im Folgenden dargestellten Methoden finden kann). Ist Z ((x(0) T y (0) T )T ) > 0, dann ist die zul¨assige Menge M des Ausgangsproblems leer: W¨are z ∈ M , dann w¨are Az + Eo = b und (zT oT )T ≥ o, also (zT oT )T ∈ M und Z ((zT oT )T ) = 0, das Minimum von Z w¨are also nicht positiv. Ist Z ((x(0) T y (0) T )T ) = 0, dann ist y (0) = o und damit x(0) ∈ M. Die zul¨assige Menge des Ausgangsproblems ist also nicht leer. Da (x(0) T oT )T als Minimalpunkt eine Ecke von M ist, besitzt diese h¨ochstens m positive Koordinaten und die zugeh¨origen Spaltenvektoren von A sind linear unabh¨angig. Also ist x(0) eine Ecke von M und damit eine m¨ogliche Startecke des Ausgangsproblems. Im Folgenden k¨onnen wir also stets davon ausgehen, dass wir eine Startecke x(0) der Standardaufgabe kennen. Wir wollen nun untersuchen, ob und wie man von einer gegebenen Ecke x(0) zu einer Ecke x(1) mit Z(x(1) ) < Z(x(0) ) gelangt. F¨ ur eine Ecke x(0) ∈ M sei (0)
ur welche xj > 0 ist, P (x(0) ) die Menge aller Indizes j, f¨ S(x(0) ) die Menge aller Spaltenvektoren aj von A mit j ∈ P (x(0) ). Man beachte, dass eine Ecke von M h¨ochstens m positive Koordinaten hat, wie wir in VIII.1 gesehen haben, dass also |P (x(0) )| = |S(x(0) )| ≤ m. Definition 1: Eine Ecke x(0) von M heißt entartet, wenn sie weniger als m positive Koordinaten besitzt; andernfalls heißt sie nicht-entartet. Definition 2: Es sei x(0) eine Ecke von M . Eine Menge B von m linear unabh¨angigen Spaltenvektoren von A mit S(x(0) ) ⊆ B heißt eine Basis von x(0) . Die zu B geh¨orenden Variablen heißen Basisvariable, die anderen Nichtbasisvariable von x(0) zur Basis B. Die Basis einer nicht-entarteten Ecke x(0) ist eindeutig bestimmt (n¨amlich als S(x(0) )), eine entartete Ecke hat in der Regel verschiedene Basen.
VIII Lineare Optimierung
168 Im Folgenden sei B = {ai1 , ai2 , . . . , aim } eine Basis der Ecke x(0) , I = {i1 , i2 , . . . , im } die zugeh¨orige Indexmenge, I = {1, 2, . . . , n} \ I = {im+1 , im+2 , . . . , in }.
Die Darstellung der Nichtbasisvektoren und des Vektors b in der Basis B sei
b = cikai f¨ ur k ∈ I und ciai (cik , ci ∈ IR). ak = i∈I
i∈I
Dann ist Ax =
i∈I
xiai +
xk
k∈I
i∈I
cikai =
i∈I
⎛ ⎝x i +
⎞
cik xk ⎠ ai .
k∈I
Das Gleichungssystem Ax = b ist daher ¨aquivalent mit
i∈I
⎛ ⎝xi +
⎞
cik xk ⎠ ai =
k∈I
i∈I
ciai .
Wegen der linearen Unabh¨angigkeit von B gilt also f¨ ur alle x ∈ M xi +
f¨ ur alle i ∈ I.
cik xk = ci
k∈I (0)
ur welche ja xk = 0 f¨ ur k ∈ I gilt, also Dies gilt insbesondere f¨ ur die Ecke x(0) , f¨ (0) (0) ist ci = xi und damit ci ≥ 0 f¨ ur alle i ∈ I. Ferner ist wegen xi = xi − cik xk k∈I
Z(x) =
i∈I
ui x i +
k∈I
Die Koeffizienten fk = uk −
i∈I
uk xk =
i∈I
(0)
ui x i +
(uk −
k∈I
i∈I
ui cik )xk .
ui cik f¨ ur k ∈ I heißen Formkoeffizienten (von x(0)
bez¨ uglich der Basis B). Mit ihnen gilt also Z(x) = Z(x(0) ) +
fk xk .
k∈I
Beispiel 1: Wir betrachten die Aufgabe aus Beispiel 2 in VIII.1: = 7 x1 + x2 + x 3 + x 4 2x1 + x2 + x3 + x5 = 8 4x1 + x2 + 2x3 + x6 = 12 mit den Positivit¨atsbedingungen x1 , x2 , x3 , x4 , x5 , x6 ≥ 0. Die zu minimierende Zielfunktion sei Z = −2x1 − 3x2 − 5x3 . (In VIII.1 haben wir das Maximum
VIII.2 Das Simplexverfahren
169
der Zielfunktion Z = 2x1 + 3x2 + 5x3 gesucht.) Eine nicht-entartete Ecke ist (1 4 2 0 0 0)T . Die Spaltenvektoren a1 , a2 , a3 bilden die Basis dieser Ecke. Es ist + 2a3 a4 = −a1 a5 = a1 + 2a2 − 3a3 a6 = −a2 + a3
und b = a1 + 4a2 + 2a3 .
Bezogen auf die Basis {a1 , a2 , a3 } lautet das Gleichungssystem also −
x1 x2 x3
x4 + x 5 = 1 + 2x5 − x6 = 4 . + 2x4 − 3x5 + x6 = 2
Die Zielfunktion ist Z(x) = −2(1 + x4 − x5 ) − 3(4 − 2x5 + x6 ) − 5(2 − 2x4 + 3x5 − x6 ) = −24 + 8x4 − 7x5 + 2x6 F¨ ur die Ecke x(0) = (1 4 2 0 0 0)T ist x4 = x5 = x6 = 0, in dieser Ecke hat die Zielfunktion also den Wert −24. Alle berechneten Daten sind in Tab. 1 zusammengefasst. In der letzten Zeile stehen die Koeffizienten der Zielfunktion ( Formkoeffizienten“) und der ” Wert der Zielfunktion in der betrachteten Ecke.
b x 1 x2 x3 x4 x5 x6 1 0 0 −1 1 0 1 0 1 0 0 2 −1 4 0 0 1 2 −3 1 2 8 −7 2 −24 Zielfunktion Tab. 1
x1 x2 x3 b 1 1 1 7 2 1 1 8 4 1 2 12 −2 −3 −5 0 Zielfunktion
x4 x5 x6 1 0 0 0 1 0 0 0 1
F¨ ur die Ecke x(0) = (0 0 0 7 8 12)T ( triviale“ Ecke) ist x1 = x2 = x3 = ” 0, in dieser Ecke hat die Zielfunktion also den Wert 0 (Tab. 2). Diese Ecke kann man beim Optimierungsverfahren Tab. 2 (Satz 3) als Startecke w¨ahlen, wenn man keine g¨ unstigere“ Ecke kennt. ” Zum Auffinden von Tabelle 1 f¨ uhrt man mit dem gegebenen LGS bzw. seiner Koeffizentenmatrix die Zeilenumformungen durch, die man schon beim L¨osen eines LGS verwendet hat: ⎛
Aus ⎛
⎞
1 1 1 1 0 0 7 1 1 0 1 0 8 ⎟ ⎠ 4 1 2 0 0 1 12
⎜ ⎝ 2
⎛
folgt
⎞
1 1 1 1 0 0 7 ⎜ ⎟ ⎝ 0 1 1 2 −1 0 6 ⎠ 0 0 1 2 −3 1 2
1
1
1
⎞
1 0 0 7 1 0 −6 ⎟ ⎠, 0 −3 −2 −4 0 1 −16
⎜ ⎝ 0 −1 −1 −2 ⎛
und schließlich
⎞
1 0 0 −1 1 0 1 ⎜ 0 2 −1 4 ⎟ ⎝ 0 1 0 ⎠. 0 0 1 2 −3 1 2
VIII Lineare Optimierung
170
Im Folgenden sei x(0) stets eine gegebene Ecke der Standardaufgabe. ur k ∈ I in der Darstellung Satz 1: a) Sind die Formkoeffizienten fk f¨ Z(x) = Z(x(0) ) +
fk xk
k∈I
von Z(x) bez¨ uglich der Basis von x(0) alle positiv, dann ist x(0) der einzige Minimalpunkt. b) Ist kein Formkoeffizient negativ, dann existieren Minimalpunkte. Es sei I0 die Menge der Indizes k ∈ I mit fk = 0. Dann sind die Minimalpunkte genau die Punkte x mit xi ≥ 0 (i = 1, 2, . . . , n) und (0)
xi = xi −
cik xk , falls i ∈ I und xk = 0, falls k ∈ I \ I0 .
k∈I0
F¨ ur die Koordinaten mit Indizes aus I0 sind außer xi ≥ 0 keine Bedingungen festgelegt, sie sind freie Parameter. Beweis: a) Aus der angegebenen Bedingung folgt Z(x) ≥
i∈I
(0)
ui xi = Z(x(0) ) f¨ ur alle x ∈ M. (0)
F¨ ur x = x(0) ist mindestens ein xk mit k ∈ I positiv, sonst w¨are xi = xi (0) i ∈ I (wegen xi + cik xk = xi f¨ ur i ∈ I). Also ist Z(x) > Z(x(0) ).
f¨ ur alle
k∈I
b) Wie in a) sieht man, dass x(0) Minimalpunkt ist. Die weitere Behauptung folgt aus obiger Gleichung Z(x) = Z(x(0) ) + fk xk . Ist n¨amlich fk = 0 (also k ∈ I0 ), k∈I
so kann man xk ≥ 0 beliebig w¨ahlen; ist fk > 0 (also k ∈ I \ I0 ), so muss man zur Erreichung eines Minimums xk = 0 setzen. 2 F¨ ur die Minimalpunkte x gilt also nach Satz 1b) xi = 0 f¨ ur i ∈ I \ I0 , xi ≥ 0 beliebig f¨ ur i ∈ I0 , (0)
xi = x i − bzw. x = x(0) −
k∈I0
k∈I0
xk cik f¨ ur i ∈ I
tkck
mit tk ≥ 0,
wobei wir f¨ ur xk die Parameterbezeichnung tk gew¨ahlt haben. Die Vektoren ck haben dabei |I \ I0 | Koordinaten 0, und zwar an den Stellen i, an denen (0) xi = 0 und fi > 0 gilt.
.. .. .... . . . . ...... .. .... .... .. ... :.. −c.1. . . * . . ......... . . . . . ..... s..... .. . . .. P x(0) ..P P .. ..P ......... . q P −c2 . .. .. .. .. .. .. .. .. .. . . .. Fig. 1: Kegel mit der Spitze x(0)
Diese Punkte bilden einen r-dimensionalen Kegel mit der Spitze x(0) , wobei r = |I0 | (Fig. 1). Die Menge der Minimalpunkte in Satz 1b) ist die Schnittmenge dieses Kegels mit der Menge {x | x ≥ o}. Die Menge dieser Minimalpunkte kann unbeschr¨ankt sein.
VIII.2 Das Simplexverfahren
171
⎛
⎞ ⎛ ⎞ 1 −2 1 0 0 2 Beispiel 2: Es sei A = ⎝ −2 1 0 1 0 ⎠, b = ⎝ 2 ⎠ und Z(x) = −x1 +4x2 . 1 1 0 0 −1 1
Der Punkt x(0) = (1 0 0 6 1)T ∈ M ist eine (nicht-entartete) Ecke, denn die zu den positiven Koordinaten geh¨orenden Spaltenvektoren a1 , a4 , a5 von A sind linear unabh¨angig. Bezogen auf die Basis {a1 , a4 , a5 } von x(0) lautet das Gleichungssystem x1 − 2x2 + x3 = 2 x4 − x2 + 2x3 = 6 x5 − 3x2 + x3 = 1 und die Zielfunktion Z(x) = −2 + 2x2 + 2x3 . Die Koeffizienten von x2 , x3 in der Zielfunktion sind positiv, also ist nach Satz 1 die Ecke (1 0 0 6 1)T der einzige Minimalpunkt und der minimale Wert von Z ist −2. Beispiel 3: Eine Aufgabe habe mit dem Eckpunkt (0 5 0 0 10 7 3 0 0)T die Werte in der folgenden Tabelle ergeben (vgl. Beispiel 1). Dieser Eckpunkt ist aufgrund der Werte von fk ein Minimalpunkt. x2 x 5 x 6 x 7 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
x1 x3 x4 x8 x9 1 0 1 3 5 25 3 5 1 −1 7 80 −1 1 0 2 −3 75 2 3 −2 3 0 40 fk = 3 0 11 4 0
Minimalpunkte sind dann nach Satz 1b) alle Punkte der folgenden Form mit nichtnegativen Parameterwerten und nichtnegativen Koordinaten: ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
0 25 0 0 80 75 40 0 0
⎞
⎛
⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ − t3 ⎜ ⎟ ⎜ ⎟ ⎜ ⎜ ⎟ ⎟ ⎜ ⎠ ⎝
0 0 −1 0 5 1 3 0 0
⎞
⎛
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎟ − t9 ⎜ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠
Es gibt unendlich viele Minimalpunkte, denn f¨ ur alle Punkte (t3 , t9 ) aus dem in Fig. 2 dargestellten Viereck ABCD ergibt sich ein Minimalpunkt der gegebenen Aufgabe.
0 5 0 0 7 −3 0 0 −1
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
mit
t3 ≥ 0 t9 ≥ 0 25 − 5t9 ≥ 0 80 − 5t3 − 7t9 ≥ 0 75 − t3 + 3t9 ≥ 0 40 − 3t3 ≥ 0
.. ... 40 ..... .......... . . . . D( 120 , ) . u . . . . . . . 11 11 ......... ..... ....... .... ..... .......u 40 40 ............ . . . . . . . . . ..... C( 3 , 21 ) . ...... . . . . . . . . . . ... ..... . . . . . . . . . . ... ...u..................................................................................................................................u - t 3 B( 40 , 0) A(0, 0) 3 t9
6
Fig. 2: Parameterbereich in Beispiel 3
VIII Lineare Optimierung
172
Zur Formulierung des n¨achsten Satzes ben¨otigen wir wieder die obige Darstellung von Ax = b in der Form xi +
(0)
cik xk = xi
f¨ ur i ∈ I,
k∈I
welche sich auf eine Basis einer gegebenen Ecke x(0) bezieht. Den aus den Koeffizienten cik bei festem k gebildeten Vektor aus IRm bezeichnen wir (wie schon oben) mit ck . (Die Vektoren ck bilden die Spalten in der zweiten Abteilung der Tabellen in Beispiel 1 und Beispiel 3.). Satz 2: Gibt es bez¨ uglich einer Basis einer Ecke von M einen negativen Formkoeffizient fh und hat der zugeh¨orige Vektor ch keinen einzigen positiven Koeffizient, dann existiert kein Minimalpunkt. Beweis: F¨ ur die Punkte x mit (0)
xi = xi + |cih |t f¨ ur i ∈ I, xh = t und xk = 0 f¨ ur k ∈ I, k = h mit t ≥ 0 gilt x ≥ o und xi +
k∈I
(0)
(0)
cik xk = xi + |cih |t + cih t = xi
f¨ ur i ∈ I
und damit x ∈ M. F¨ ur diese Punkte gilt Z(x) = Z(x(0) ) +
k∈I
fk xk = Z(x(0) ) − |fh |t.
Da t beliebig große Werte annehmen kann, ist M nicht beschr¨ankt und Z(x) nimmt auf M kein Minimum an. 2 Es verbleibt der Fall, dass ein negativer Formkoeffizient existiert und jeder Vektor ck f¨ ur k ∈ I mindestens eine positive Koordinate besitzt. Hier betrachten wir zun¨achst den Fall, dass die Startecke x(0) nicht entartet ist, dass x(0) also genau (0) m positive Koordinaten besitzt und damit xi > 0 f¨ ur alle i ∈ I gilt. Ist fh ein negativer Formkoeffizient und wird der Index μ definiert durch (0) x(0) x μ = min i , cih >0 cih cμh
dann geh¨oren alle x mit (0)
ur i ∈ I, xi = xi − cih t f¨ mit 0 ≤ t ≤
(0) xμ
cμh
xh = t,
xk = 0 f¨ ur k ∈ I, k = h
zu M , denn dann ist x ≥ o und
xi +
k∈I
(0)
(0)
cik xk = xi − cih t + cih t = xi
ur t = Es gilt Z(x) = Z(x(0) ) − |fh |t. F¨
(0)
f¨ ur i ∈ I.
xμ ergibt sich der Punkt x(1) mit cμh
VIII.2 Das Simplexverfahren
173
Z(x(1) ) = Z(x(0) ) − |fh |
(0)
xμ . cμh
Es gilt (0) x(1) μ = xμ − cμh
(0)
xμ (1) = 0 und xh = t > 0; cμh
der Punkt x(1) hat also mindestens eine und h¨ochstens m positive Koordinaten. F¨ ur die Spaltenvektoren von A gilt ah =
i∈I
cihai =
cihai + cμhaμ
mit cμh > 0.
i∈I,i=μ
Nun tauschen wir den Vektor aμ in der Basis B gegen den Vektor ah aus und erhalten wieder eine linear unabh¨angige Menge B (1) von m Spaltenvektoren. Sie enth¨alt als Teilmenge die Spaltenvektoren, die zu den (h¨ochstens m) positiven Koordinaten von x(1) geh¨oren. Folglich ist x(1) eine Ecke von M mit der Basis B (1) und es gilt Z(x(1) ) < Z(x(0) ). Die beschriebene Austauschung von Basisvektoren hat also, ausgehend von einer Ecke x(0) , eine Ecke x(1) geliefert, f¨ ur welche der Wert der Zielfunktion kleiner ist als f¨ ur die Ausgangsecke. Ist die Ausgangsecke x(0) entartet, hat sie also auch Koordinaten mit dem Wert (0)
0, dann kann es passieren, dass obige Zahl
xμ den Wert 0 hat. In diesem Fall cμh
f¨ uhrt obige Austauschung wieder zu x(0) zur¨ uck. Insgesamt ist damit folgender Satz bewiesen:
Satz 3: Ist mindestens einer der Formkoeffizienten fk negativ und besitzt der zugeh¨orige Vektor ck mindestens eine positive Koordinate, dann f¨ uhrt die oben beschriebene Austauschung von der Ausgangsecke x0 auf eine Ecke x(1) mit Z(x(1) ) < Z (x(0) ), falls x(0) nicht entartet ist. Wenn aber x(0) entartet ist, f¨ uhrt die Austauschung auf eine solche Ecke x(1) oder wieder auf x(0) zur¨ uck. Beispiel 4: Wir betrachten nochmals die Situation in Beispiel 2, es sei also ⎛
⎞
⎛
⎞
1 −2 1 0 0 2 ⎜ ⎟ 1 0 1 0 ⎟ x) = −x1 + 4x2 . ⎠, b = ⎝ 2 ⎠ und Z( 1 1 0 0 −1 1
⎜ A = ⎝ −2
Der Punkt x(0) = (0 1 4 1 0)T ∈ M ist eine (nicht-entartete) Ecke, denn die zu den positiven Koordinaten geh¨orenden Spaltenvektoren a2 , a3 , a4 von A sind
VIII Lineare Optimierung
174
linear unabh¨angig. Es ist Z(x(0) ) = 4. Bezogen auf die Basis {a2 , a3 , a4 } von x(0) lautet das Gleichungssystem x2 x3 x4
+ x 1 − x5 = 1 + 3x1 − 2x5 = 4 − 3x1 + x5 = 1
und die Zielfunktion Z(x) = −x1 + 4(1 − x1 + x5 ) = 4 − 5x1 + 4x5 . Die Formkoeffizienten sind −5 und 4. Es gibt also einen negativen Formkoeffizient, n¨amlich f1 = −5. Also ist in obigen Bezeichnungen h = 1 und (0)
(0)
(0)
x2 x3 x4 1 4 1 . = , = , = c21 1 c31 3 c41 −3 Das Minimum unter diesen Werten mit positivem Nenner ist 1, also ist μ = 2. Man tauscht daher in dem neuen Gleichungssystem die Spaltenvektoren zu x1 und x2 aus. Bezogen auf die neue Basis {b1 , b3 , b4 } von x(0) lautet das Gleichungssystem x1 x3 x4
+ x 2 − x5 = 1 − 3x2 + x5 = 1 + 3x2 − 2x5 = 4
und die Zielfunktion Z(x) = 4 − 5(1 − x2 + x5 ) + 4x5 = −1 + 5x2 − x5 . F¨ ur die neue Ecke x(1) = (1 0 1 4 0)T ist Z(x(1) ) = −1, der Wert von Z ist also gesunken. Bez¨ uglich der neuen Basis gibt es wieder einen negativen Formkoeffizienten, n¨amlich f5 = −1. Also ist in obigen Bezeichnungen h = 5 und (1)
(1)
(1)
x1 1 1 4 x3 x4 = = , = , . c15 −1 c35 1 c45 −2 Das Minimum unter diesen Werten mit positivem Nenner ist 1, also ist μ = 3. Man tauscht daher in dem neuen Gleichungssystem die Spaltenvektoren zu x3 und x5 aus. Bezogen auf die neue Basis von x(1) lautet das Gleichungssystem x1 x5 x4
− 2x2 + x3 = 2 − 3x2 + x3 = 1 − 3x2 + 2x3 = 6
und die Zielfunktion Z(x) = −1 + 5x2 − (1 + 2x2 − x3 ) = −2 + 3x2 + x3 . Jetzt sind alle Formkoeffizienten positiv. Es ergibt sich somit die L¨osung der Optimierungsaufgabe: Z nimmt das Minimum −2 in der Ecke (2 0 0 6 1)T (also f¨ ur x1 = 2, x2 = 0) an. ¨ Ein Argernis in Satz 3 ist die Tatsache, dass eine Basis von x(0) erneut auftauchen kann, wenn x(0) entartet ist. Solche Zyklen kann man durch geeignete Zusatzvorschriften vermeiden, worauf wir aber nicht eingehen wollen. Zum Abschluss f¨ uhren wir die Basisaustauschung noch an einem etwas umfangreicheren Beispiel vor.
VIII.2 Das Simplexverfahren
175
Beispiel 5: Die 6 Artikel eines FertigungssortiM 1 M 2 M3 M4 ments sollen mit den St¨ uckzahlen x1 , x2 , . . . , x6 a 4 9 6 2 hergestellt werden. Der Gewinn pro Artikel bei1 a 8 17 12 5 tr¨agt 2, 4, 1, 5, 4, bzw. 1 (Geldeinheiten). An der i2 ai3 2 5 7 1 Fertigung sind 4 Maschinen beteiligt, die t¨aglich ai4 10 25 12 6 h¨ochstens 8 Stunden laufen. Die Bearbeitungszeit ai5 6 12 7 3 des j-ten Artikels in der i-ten Maschine betr¨agt aij ai6 4 7 5 1 Sekunden und ist in nebenstehender Tabelle angegeben. Bei welchen St¨ uckzahlen ist der Gewinn maximal? Es ist Z(x) = −(2x1 + 4x2 + x3 + 5x4 + 4x5 + x6 ) zu minimieren, wobei die zul¨assige Menge durch 4x1 + 8x2 + 2x3 + 10x4 + 6x5 + 4x6 + x7 + x8 9x1 + 17x2 + 5x3 + 25x4 + 12x5 + 7x6 6x1 + 12x2 + 7x3 + 12x4 + 7x5 + 5x6 + x9 + x10 2x1 + 5x2 + x3 + 6x4 + 3x5 + x6
= = = =
a a a a
mit x1 , x2 , . . . , x10 ≥ 0 und a = 28 800 (8 h=28800 s) gegeben ist. Eine Ecke der zul¨assigen Menge ist (0, 0, 0, 0, 0, 0, a, a, a, a), die zugeh¨origen Basisvariablen sind x7 , x8 , x9 , x10 . Zum gegebenen LGS geh¨ort folgendes Schema: x7 x8 x9 x10 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
x1 x2 x3 x 4 x5 x6 4 8 2 10 6 4 9 17 5 25 12 7 6 12 7 12 7 5 2 5 1 6 3 1 −2 −4 −1 −5 −4 −1
a a a a 0
Alle Formkoeffizienten sind negativ und in den zugeh¨origen Spalten stehen nur positive Zahlen, so dass man eine beliebige der letzten 6 Spalten (x1 bis x6 ) gegen eine geeignete der ersten 4 Spalten (x7 bis x10 ) austauschen kann. Die gr¨oßte (positive) Zahl der x1 -Spalte steht an der zweiten Stelle, so dass man die x1 -Spalte gegen die x8 -Spalte austauschen muss: x7 x1 x9 x10 x8 x2 x3 1 4 0 0 0 8 2 0 9 0 0 1 17 5 0 6 1 0 0 12 7 0 2 0 1 0 5 1
x4 x 5 x6 10 6 4 25 12 7 12 7 5 6 3 1
a a a a
Multiplikation der ersten, dritten und vierten Zeile mit 9 bzw. 3 liefert x7 9 0 0 0
x1 x9 x10 x8 36 0 0 0 9 0 0 1 18 3 0 0 18 0 9 0
x2 x3 72 18 17 5 36 21 45 9
x4 90 25 36 54
x5 x 6 54 36 9a 12 7 a 21 15 3a 27 9 9a
VIII Lineare Optimierung
176
Subtraktion des 4-fachen bzw. 2-fachen der zweiten Zeile von der ersten bzw. dritten und vierten Zeile ergibt x7 x1 x9 x10 x8 x2 x3 x4 x5 x6 9 0 0 0 −4 4 −2 −10 6 8 5a 0 9 0 0 1 17 5 25 12 7 a 0 0 3 0 −2 2 11 −14 −3 1 a 0 0 0 9 −2 11 −1 4 3 −5 7a Mit x1 = (a − x8 − 17x2 − 5x3 − 25x4 − 12x5 − 7x6 ) : 9 ist Z = (−2a − 2x2 + x3 + 5x4 − 12x5 + 5x6 + 2x8 ) : 9. Damit hat sich das Schema x7 x1 x9 x10 9 0 0 0 0 9 0 0 0 0 3 0 0 0 0 9
x8 x2 x3 x4 x5 x6 −4 4 −2 −10 6 8 5a 1 17 5 25 12 7 a −2 2 11 −14 −3 1 a −2 11 −1 4 3 −5 7a 2/9 −2/9 1/9 5/9 −4/3 5/9 −2a/9
ergeben. Jetzt sind nur noch zwei Formkoeffizienten negativ. F¨ ur die neue Ecke x(1) gilt x2 = x3 = x4 = x5 = x6 = x8 = 0 und (1)
1 9
(1)
4 9
(1)
6 9
(1)
2 9
x1 = a, x7 = a − a, x9 = a − a, x10 = a − a, sie ist also
1 5 3 7 a, 0, 0, 0, 0, 0, a, 0, a, a , 9 9 9 9 2 9
und Z hat in dieser Ecke den Wert − a. Nun muss man die x2 -Spalte oder die x5 -Spalte gegen die x1 -Spalte austauschen; wir betrachten die zweite M¨oglichkeit. Es ergibt sich: x7 x5 x9 x10 x8 x2 x3 x4 x1 x6 18 0 0 0 −9 −11 −9 −45 −9 9 9a 0 12 0 0 1 17 5 25 9 7 a 0 0 12 0 −7 25 49 −31 9 11 5a 0 0 0 36 −9 27 −9 −9 −9 −27 −21a Mit x5 = (a − x8 − 17x2 − 5x3 − 25x4 − 9x1 − 7x6 ) : 12 ist Z = (−3a + 9x1 + 15x2 + 6x3 + 29x4 + 12x6 + 3x8 ) : 9. 1
Jetzt sind alle Formkoeffizienten positiv und wir haben das Minimum − a 3 von Z erreicht. Der maximale Gewinn (vgl. Aufgabenstellung) ist also 9600,–. F¨ ur die Ecke x(2) , in welcher das Minimum von Z angenommen wird, gilt
VIII.2 Das Simplexverfahren (2)
(2)
(2)
177
(2)
(2)
(2)
x1 = x2 = x3 = x4 = x6 = x8 = 0. Man wird also nur Artikel 5 hera stellen, und zwar = 2400 St¨ uck. (Maschine M2 l¨auft t¨aglich 8 Std, Maschinen 12 M1 , M3 , M4 laufen t¨aglich 4 Std., 4 Std.40 min bzw. 2 Std.) Dieses Resultat h¨atte man vielleicht auch ohne große Rechnung an der Tabelle bei der Aufgabenstellung ablesen k¨onnen, es kam hier aber nur darauf an, die Systematik des Eckenaustauschens an einem rechnerisch einfachen Beispiel darzustellen. In der Praxis sind solche Aufgaben in der Regel derart rechenaufwendig, dass man sie sinnvollerweise auf einem elektronischen Rechner programmiert.
Aufgaben 1. a) Man bestimme die Ecken der zul¨assigen Menge M f¨ur ⎛
⎞
⎛
⎞
1 −2 1 0 0 2 ⎜ ⎜ ⎟ 1 0 1 0 ⎟ A = ⎝ −2 ⎠, b = ⎝ 2 ⎠ 1 1 0 0 −1 1 b) Man bestimme in a) die Menge der Minimalpunkte f¨ ur (1) Z = −x1 +4x2
(2) Z = x1 +x2
(3) Z = −x1 +2x2
(4) Z = −x1 +x2 .
2. Man zeige, dass die lineare Optimierungsaufgabe mit ⎛
1 A=⎝ 0 0
0 1 0
0 0 1
−2 −1 1
1 1 0
⎞ ⎛ ⎞ 2 3 ⎠ −2 , b = ⎝ 3 ⎠, −1 0
−x4 + x5 − x6 − 3 minimal!
keine L¨osung hat. Man bestimme Z = ax4 + bx5 + cx6 so, dass genau eine bzw. unendlich viele L¨osungen existieren.
3. Man behandele die Optimierungsaufgabe ⎧ ⎪ ⎨
⎫
⎪ x1 + x2 + x3 ≤ 7 ⎬ 2x1 + x2 + x3 ≤ 8 , x1 , x2 , x3 ≥ 0, Z = 2x1 + 3x2 + 5x3 maximal! ⎪ ⎪ ⎩ 4x1 + x2 + 2x2 ≤ 12 ⎭
(vgl. Beispiel 2 in VIII.1) jeweils mit den Startecken (1,4,2,0,0,0), (0,2,5,0,1,0), (0,0,6,1,2,0), (0,0,0,7,8,12).
4. Ein Rohstoff (z.B. Heiz¨ol) werde in m Hauptlagern mit den Kapazit¨aten ai (i = 1, 2, . . . , m) vorgehalten und von n Zwischenlagern mit den Bedarfsmengen bj (j = 1, 2, . . . , n) nachgefragt. Die Transportkosten vom Hauptlager i zum Zwischenlager j betragen cij pro Mengeneinheit. Es ergibt sich die Frage, wie man die vom Hauptlager i zum Zwischenlager j zu transportierenden Mengen xij w¨ahlen muss, damit die Gesamttransportkosten minimal sind. Man schreibe dieses lineare Transportproblem in der Standardform einer linearen Optimierungsaufgabe.
Analysis
IX Folgen reeller Zahlen IX.1 Grundlegende Begriffe und Beispiele Wir setzen den Umgang mit reellen Zahlen zun¨achst als bekannt voraus. Dass der Begriff der reellen Zahl durchaus Probleme birgt, werden wir erst in Abschnitt IX.5 genauer untersuchen. Die Menge der reellen Zahlen bezeichnen wir, wie u ¨blich, mit IR. Die darin enthaltene Menge der rationalen Zahlen (Quotienten aus ganzen Zahlen) bezeichnet man u ¨blicherweise mit Q. Diese enth¨alt die Menge ZZ der ganzen Zahlen {0, 1, −1, 2, −2, . . .} und diese wiederum die Menge IN der nat¨ urlichen Zahlen {1, 2, 3, . . .}. Die Menge IN ∪ {0} = {0, 1, 2, 3, . . .} bezeichnen wir mit IN0 . Eine Abbildung, die jeder Zahl aus IN oder IN0 eine reelle Zahl zuordnet, nennt man eine Folge reeller Zahlen. Man schreibt n → an , wenn der Zahl n aus IN oder aus IN0 die reelle Zahl an zugeordnet ist. Wir wollen die Folge dann kurz in der Form (an )IN bzw. (an )IN0 schreiben, bzw. noch k¨ urzer in der Form (an ), wenn klar oder irrelevant ist, ob der Index n ab 0 oder ab 1 l¨auft. Die Folgen (an )IN und (an+1 )IN0 muss man nicht unterscheiden, beide beginnen mit a1 , a2 , . . . . Ebenso muss man (an )IN0 und (an−1 )IN nicht unterscheiden, beide beginnen mit a0 , a1 , . . .. Es ist also kein Problem, bei einer Folge vom Anfangsindex 0 zum Anfangsindex 1u ¨berzugehen oder umgekehrt. Eine Beschreibung der Folge durch Angabe der ersten Glieder, also a1 , a2 , a3 , . . . bzw. a0 , a1 , a2 , a3 , . . . ist nat¨ urlich nur m¨oglich, wenn klar oder ohne Bedeutung ist, wie es bei den P¨ unktchen weitergeht“. ” Besonders u ¨bersichtlich sind Folgen (an ), deren Glieder an explizit durch einen Term mit der Variablen n gegeben sind, etwa an = n2 + 1 (n ∈ IN). Sehr oft sind Folgen rekursiv definiert, d.h., ein Glied der Folge wird mit Hilfe der vorangehenden Glieder berechnet, wenn man das erste Glied oder die ersten Glieder kennt. Viele wichtige Folgen k¨onnen weder durch einen Term noch durch ein Rekursion definiert werden, z. B. die Folge (an ) mit an = nte Primzahl. Die Menge aller Folgen reeller Zahlen bezeichnen wir je nach Anfangsindex mit F oder mit F0 . Beispiel 1: Leonardo von Pisa (etwa 1170–1240), der auch Fibonacci genannt wurde, hat im Jahr 1225 ein Buch mit dem Titel liber quadratorum ver¨offentlicht, in welchem allerlei interessante Beziehungen zwischen Quadratzahlen untersucht werden. Dabei berechnet er eine Quadratzahl n2 nicht durch Multiplizieren als n mal n“, sondern in der Form 1 + 3 + 5 + 7 + . . . + (2n − 1) = n2 . Er nutzt also ” aus, dass man die n-te Quadratzahl Qn aus der (n − 1)-ten Quadratzahl Qn−1 durch Addition der ungeraden Zahl 2n − 1 gewinnt, also (1)
Qn = Qn−1 + (2n − 1).
Das folgt nat¨ urlich sofort aus der binomischen Formel. Auf diese Art kann man sehr schnell eine Tafel der Quadratzahlen gewinnen, ohne komplizierte Multipli-
IX Folgen reeller Zahlen
182 kationen durchf¨ uhren zu m¨ ussen: - 4
1 +3
- 9
+5
- 16
+7
- 25
+9
- 36
...
+11
Formel (1) beschreibt eine Rekursion f¨ ur die Berechnung der Folge 1, 4, 9, 16, 25, 36, 49, 64, . . . der Quadratzahlen: Kennt man das (n − 1)te Glied dieser Folge, so kann man nach (1) das nte Glied berechnen. Beispiel 2: Ber¨ uhmter als der liber quadratorum ist Fibonaccis liber abbaci aus dem Jahr 1202. Dies ist wohl das großartigste Mathematikbuch des Mittelalters. Die Probleme in den Beispielen 2 und 3 stammen aus diesem Buch. In beiden Aufgaben handelt es sich darum, die Glieder einer Folge rekursiv zu bestimmen. Es geht hier um eine Frage, die in ¨ahnlicher Form schon in Rechenb¨ uchern der Antike gestellt wird: 7 Leute gehen nach Rom. Jeder hat 7 Maultiere, jedes Maultier tr¨agt 7 S¨acke, in jedem Sack befinden sich 7 Brote, jedes Brot hat 7 Messer und jedes Messer 7 Scheiden. Gesucht ist die Gesamtzahl an Leuten, Maultieren usw. Man kann nun die Summe 7 + 72 + 73 + 74 + 75 + 76 (= 137 256) durch Addition der Potenzen berechnen, wie es auch Fibonacci zun¨achst tut. Man kann sie aber auch (mit Fibonacci) folgendermaßen bestimmen, wobei man von rechts nach links rechnet: 7(1 + 7(1 + 7(1 + 7(1 + 7(1 + 7))))). Man rechnet also wie in nebenstehender Tabelle. Die Glieder dieser Folge (bis auf das letzte) ergeben sich nach der Rekursionsvorschrift (2)
an = 7an−1 + 1,
wobei man als Startwert a0 = 1 setzt.
a0 a1 a2 a3 a4 a5 a6
= = = = = = =
1 7a0 + 1 = 7 · 1 + 1 = 8 7a1 + 1 = 7 · 8 + 1 = 57 7a2 + 1 = 7 · 57 + 1 = 400 7a3 + 1 = 7 · 400 + 1 = 2801 7a4 + 1 = 7 · 2801 + 1 = 19 608 7a5 = 7 · 19 608 = 137 256
Beispiel 3: Die zweite Aufgabe aus dem liber abbaci von Fibonacci ist die ber¨ uhmte Kaninchenaufgabe: Wie viele Kaninchenpaare stammen am Ende eines Jahres von einem Kaninchenpaar ab, wenn jedes Paar, beginnend am Ende des zweiten Lebensmonats, jeden Monat ein neues Paar gebiert? Bezeichnen wir zu Ehren Fibonaccis mit Fn die Anzahl der Kaninchenpaare nach n Monaten, so ist F0 = F1 = 1 und (3)
Fn = Fn−1 + Fn−2
f¨ ur n = 2, 3, . . . . Die Rekursion (3) mit den genannten Startwerten beschreibt die Folge der Fibonacci-Zahlen. Hier ben¨otigt man zur Berechnung eines Folgenglieds die beiden vorangehenden Folgenglieder:
IX.1 Grundlegende Begriffe und Beispiele
183
n 0 1 2 3 4 5 6 7 8 9 10 11 12 13 . . . Fn 1 1 2 3 5 8 13 21 34 55 89 144 233 377 . . . Um das Wachstum der Fibonacci-Folge beurteilen zu k¨onnen, betrachten wir f¨ ur n ≥ 1 die Quotienten aufeinanderfolgender Glieder, also an = Es ist a0 = 1 und
Fn+1 Fn + Fn−1 Fn−1 1 = =1+ =1+ . Fn Fn Fn Fn Fn−1 an = 1 +
(4)
1 an−1
f¨ ur n ater sehen, dass sich diese Zahlen immer mehr der Zahl √ ≥ 1. Wir werden sp¨
1+ 5 n¨ahern, welche als Verh¨altnis des Goldenen Schnitts eine große Rolle in 2
der Geometrie und in der Kunst spielt.
Beispiel 4: In der √ bekannten wird mit Hilfe des Satzes von Py√ √ Wurzelschnecke √ √ thagoras die Folge 1, 2, 3, 4, 5, . . . konstruiert (Fig. 1). Auch hier liegt eine Rekursion vor; diese k¨onnte man folgendermaßen arithmetisch beschreiben: a1 = 1 und (5) an = a2n−1 + 1 f¨ ur n ≥ 2. Selbstverst¨andlich ist an =
√ n,
die Glieder dieser Folge lassen sich also explizit“ in Abh¨angigkeit vom Folgenin” dex n angeben. .......................1...........................1 .......... ....1......... ... . . . . . . . ........ .√ .. ....... . . . . . . 1..... ... √ .. 7 ..√ .... ........1. . . . . . ..... . . 8 . . . . . . . .. √ ..... . .... √ ... 6 .. ....9 . . .. ... .......... ... ........ 5 .... . . . . . . . . . . ..... . . .... ..... . . . . . . .... .... ... ... ........ 1... . √.... .1... .... .. √ ....... .... .. .. ...... ............... 10 .............. 4 ...... ... .. . ...... ........... ....... . . . . . . . . . . . . . . ... ................ ..... ... . . ..... ........... ... ............ √ . . . . . . . . . . . . . . . . . . . . . . . . . . . ... 1 √ ................................................................................ 11 1 ..... .. 3.................................... .. ............................................. ... √.................................... .... .......................√ √ ...... ....... . . . . ... . . ...... 12 ...... ..2...... ........ 1 .. ...... ... . . 1 .............................. 1 Fig. 1: Wurzelschnecke
IX Folgen reeller Zahlen
184 Beispiel 5: Bekanntlich ist
√
a
2 keine rationale Zahl, d.h., es existiert kein Bruch b √ √ a (a, b nat¨ urliche Zahlen) mit 2 = . Nun kann man aber versuchen, 2 m¨oglichst b √ √ gut durch Bruchzahlen anzun¨ahern. Wegen ( 2 + 1)( 2 − 1) = 1 ist √
√ 1 1 √ =1+ 2 = 1 + ( 2 − 1) = 1 + √ 2+1 2 + ( 2 − 1) 1 = 1+ =1+ 1 √ 2+ 2+ 2 + ( 2 − 1) 2+
1 1 1 √ 2 + ( 2 − 1)
usw. Die Folge (an ) mit a0 = 1 und der Rekursionsvorschrift an = 1 +
(6)
1 1 + an−1
√ 3 7 17 41 99 , , , . . .. Sie schachtelt die Zahl 2 ein: 2 5 12 29 70
f¨ ur n = 1, 2, 3, . . . beginnt mit 1, , ,
√ 41 17 3 99 7 < < ... 2... < < < . 5 29 70 12 2 √ Der Abstand der Folgenglieder zu 2 kann beliebig klein gemacht werden, wenn man nur in der Folge hinreichend weit geht. Dieses Beispiel l¨asst schon erkennen, wie man irrationale Zahlen durch Folgen rationaler Zahlen bestimmen kann. √ Beispiel 6: Weitaus komplizierter als bei 2 liegt der Fall bei der Kreiszahl π, ¨ welche den Inhalt eines Kreises vom Radius 1 angibt. Im alten Agypten benutzte 1
1 + nx f¨ ur alle x ∈ IR mit x > −1, x = 0 f¨ ur alle n ∈ IN mit n ≥ 2 gilt. F¨ ur n = 2 ist die Behauptung richtig, denn wegen x = 0 ist x2 > 0 und daher (1 + x)2 = 1 + 2x + x2 > 1 + 2x. Nun folgt der Induktionsschritt: (1 + x)n+1 = > = >
(1 + x)(1 + x)n (1 + x)(1 + nx) 1 + (n + 1)x + nx2 1 + (n + 1)x.
In dieser Rechnung folgt die zweite Zeile aufgrund der Induktionsvoraussetzung (1 + x)n > 1 + nx, weil 1 + x > 0 gilt. Die letzte Ungleichung folgt aus x = 0. Beispiel 3: Wir betrachten die Folge (an ), die rekursiv durch
a1 = 1 und an =
an−1 + 5 f¨ ur n ≥ 2
ur alle n ∈ IN gilt: Es definiert ist. Wir wollen zun¨achst beweisen, dass an < 3 f¨ ist a1 < 3, und aus an < 3 folgt √ √ √ an+1 = an + 5 < 3 + 5 = 8 < 3. √ ur alle n ∈ IN gilt: Es ist a2 = 1 + 5 = Nun √ wollen wir zeigen, dass an+1 > an f¨ 6 > a1 = 1, und aus an+1 > an folgt
an+2 =
an+1 + 5 >
√
an + 5 = an+1 .
IX.3 Das Prinzip der vollst¨andigen Induktion
193
Beispiel 4: Im Spiel Turm von Hanoi soll ein der Gr¨oße nach geordneter Stapel von n paarweise verschieden großen Scheiben mit m¨oglichst wenig Z¨ ugen von einer Stange auf eine andere Stange umgesetzt werden, wobei eine dritte Stange als Zwischenstation benutzt werden darf (Fig. 1).
Fig. 1: Turm von Hanoi
Dabei d¨ urfen die Scheiben nur einzeln umgelegt werden, und nie darf eine gr¨oßere Scheibe auf eine kleinere gelegt werden. Versuche mit 1, 2 oder 3 Scheiben lassen vermuten, dass f¨ ur die Anzahl an der ben¨otigten Z¨ uge gilt: an = 2n − 1. Wir nehmen an, dies sei f¨ ur n Scheiben richtig (Induktionsvoraussetzung) und wollen nun an+1 bestimmen. Zun¨achst muss man die oberen n Scheiben auf eine andere Stange umsetzen, um die unterste (gr¨oßte) Scheibe dann auf die dritte Stange legen zu k¨onnen. Das erfordert an + 1 Z¨ uge. Dann muss man den Turm aus den n kleineren Scheiben auf diese dritte Stange setzen, was wieder an Z¨ uge erfordert. Es ist also an+1 = 2an + 1 und somit an+1 = 2(2n − 1) + 1 = 2n+1 − 1. Die Induktionsbehauptung ist damit bewiesen, es gilt also an = 2n − 1 f¨ ur alle n ∈ IN. (Dies h¨atte man auch sofort aus der Rekursion a1 = 1 und an+1 = 2an + 1 gewinnen k¨onnen.) Beispiel 5: Wir wollen zwei Eigenschaften der Folge (Fn ) der Fibonacci-Zahlen beweisen. Diese ist definiert durch F0 = F1 = 1 und Fn = Fn−1 + Fn−2 f¨ ur n ≥ 2. a) Es gilt Σ(Fn ) = (Fn+2 − 1). Beweis: Es ist F0 = 1 = F2 −1 (Induktionsanfang). Aus F0 +F1 +. . .+Fn = Fn+2 −1 folgt F0 + F1 + . . . + Fn + Fn+1 = Fn+2 − 1 + Fn+1 = Fn+3 − 1. Damit ist die Behauptung induktiv bewiesen. 2 b) F¨ ur alle n ∈ IN0 gilt Fn Fn+2 = Fn+1 + (−1)n . 2 + (−1)n folgt Beweis: Es gilt F0 F2 = 2 = F12 + (−1)0 . Aus Fn Fn+2 = Fn+1 2 Fn+1 Fn+3 = Fn+1 (Fn+2 + Fn+1 ) = Fn+1 Fn+2 + Fn+1 n = Fn+1 Fn+2 + Fn Fn+2 − (−1) = (Fn+1 + Fn )Fn+2 + (−1)n+1 2 = Fn+2 + (−1)n+1 .
Damit ist die Behautung induktiv bewiesen.
IX Folgen reeller Zahlen
194
Aufgaben 1. Man beweise mit vollst¨andiger Induktion: a) F¨ ur alle n ∈ IN mit n ≥ 3 gilt 2n + 1 < 2n . b) F¨ ur alle n ∈ IN mit n ≥ 4 gilt n3 < 3n . c) F¨ ur alle n ∈ IN gilt: 23n − 1 ist durch 7 teilbar. d) F¨ ur alle n ∈ IN gilt: 10n + 3 · 4n+2 + 5 ist durch 9 teilbar. √
2. Man beweise: F¨ur die Folge (an ) mit a0 = 3 und an = an−1 + 5 gilt an > 2 und an+1 < an
f¨ ur alle n ∈ IN0 .
3. Man suche eine explizite Darstellung f¨ur (an ) und beweise die Richtigkeit mit vollst¨andiger Induktion: a) a1 = 1, an+1 = an + 4n;
b) a1 = 1, a2 = 3, an+2 = 3an−1 + 2.
4. Man beweise, dass eine Kreisscheibe durch n geradlinige Schnitte in h¨ochs1
tens 1 + n(n + 1) Teile zerlegt werden kann ( Pfannkuchenproblem“). 2 ”
5. In dieser Aufgabe handelt es sich um Folgen aus F. Man beweise einmal mit vollst¨andiger Induktion und einmal mit Hilfe des Operators Δ:
a) Σ
1 (2n − 1)(2n + 1)
2
c) Σ((2n − 1) ) =
=
n ; 2n + 1
n
b) Σ n
1 2
= 2−
n+2 ; 2n
n(4n2 − 1) . 3
6. In dieser Aufgabe handelt es sich um Folgen aus F0 . Man beweise einmal mit vollst¨andiger Induktion und einmal mit Hilfe des Operators Δ: n
a) Σ(q ) =
1 − q n+1 1−q
n
b) Σ(nq ) =
f¨ ur q = 1;
q − (1 + n(1 − q))q n+1 (1 − q)2
f¨ ur q = 1.
7. Man beweise die folgenden Eigenschaften der Folge der Fibonacci-Zahlen: a) ggT(Fn , Fn+1 ) = 1
8. Man zeige, dass durch Fn =
b) Σ(Fn2 ) = (Fn Fn+1 ) 1 √ 5
√ n+1 √ n+1 1− 5 1+ 5 − eine ex2 2
plizite Darstellung der Folge der Fibonacci-Zahlen gegeben ist. (Hinweis: Man zeige, dass die angegebene Folge der Fibonacci-Rekursion gen¨ ugt.)
IX.4 Arithmetische, geometrische und harmonische Folgen
195
IX.4 Arithmetische, geometrische und harmonische Folgen Von besonderem Interesse sind Folgen reeller Zahlen, bei denen sich die einzelnen Glieder als Mittelwert ihrer beiden Nachbarglieder ergeben. Nun benutzt man im t¨aglichen Leben verschiedene Mittelwertbildungen, welche verschiedenen Sachzusammenh¨angen angepasst sind (mittleres Gewicht, mittlerer Zinsfaktor, mittlere Geschwindigkiet usw.). Am bekanntesten sind das arithmetische, das geometrische und das harmonische Mittel. • Das arithmetische Mittel der Zahlen a, b ist die Zahl A(a, b) =
a+b . 2
• Das geometrische Mittel der positiven Zahlen a, b ist die Zahl G(a, b) =
√
• Das harmonische Mittel der positiven Zahlen a, b ist die Zahl H(a, b) = 1 a
Das harmonische Mittel ist also der Kehrwert des arithmetischen Mittels der Kehrwerte der beiden Zahlen. F¨ ur zwei verschiedene positive Zahlen a, b gilt H(a, b) < G(a, b) < A(a, b), wie man leicht nachrechnet und mit Hilfe des H¨ohensatzes und des Kathetensatzes veranschaulichen kann (Fig. 1).
H(a, b) H SH
ab . 2 +
1. b
A(a, b)
S H H jS HH HH S G(a, b) HH . S . PP HH .. qSS q P . .. HH S HH ......... S q . H S a - b
Fig. 1: Mittelwerte
Eine Folge heißt eine arithmetische, geometrische bzw. harmonische Folge, wenn jedes Glied außer dem ersten das arithmetische, geometrische bzw. harmonische Mittel seiner beiden Nachbarglieder ist. Bei geometrischen und harmonischen Folgen m¨ ussen dabei die Glieder positiv sein. Ist (an ) eine arithmetische Folge und d = a1 − a0 , dann ist an = an−1 + d und an = a0 + nd f¨ ur alle n ∈ IN. Dies beweist man durch vollst¨andige Induktion. Der Induktionsschritt sieht bei der ersten Behauptung folgendermaßen aus: a + an−1 Wegen n+1 = an und an−1 = an − d gilt an+1 = 2an − (an − d) = an + d. 2 Die zweite Behauptung folgt aus an+1 = an + d = (a0 + nd) + d = a0 + (n + 1)d. Eine arithmetische Folge hat also eine besonders einfache Differenzenfolge: Δ(a0 + nd) = (d). Jetzt sei (gn ) eine geometrische Folge und q =
g1 , also g1 = g0 · q. Dann ist g0
gn = gn−1 · q und gn = g0 · q n f¨ ur alle n ∈ IN (vollst¨andige Induktion). Definiert man die geometrische Folge in dieser Form anstatt mit Hilfe des geometrischen Mittels, dann d¨ urfen g0 und q auch negative Zahlen sein.
IX Folgen reeller Zahlen
196 Ist (hn ) eine harmonische Folge und D =
gilt hn =
1 hn−1
−1
+D
und hn =
eine arithmetische Folge ist.
1 1 − , also h1 = h1 h0 −1
1 + Dn h0
1 +D h0
−1
, dann
. Dies folgt daraus, dass
1 hn
Das einfachste Beispiel einer arithmetischen Folge ist (n), also die Folge der nat¨ urlichen Zahlen selbst. Das einfachste Beispiel einer harmonischen Folge ist 1 . die Folge der Kehrwerte der nat¨ urlichen Zahlen, also n
Die konstante Folge (c) mit c = 0 ist ein Sonderfall einer arithmetischen, geometrischen und harmonischen Folge. Es sei (an ) eine arithmetische Folge, also an = a0 +nd. Ist d > 0, dann u ¨bertreffen S − a0 ist die Folgenglieder jede vorgegebene positive Schranke S, denn f¨ ur n > d a0 + dn > S. Ist d < 0, dann unterschreiten die Folgenglieder jede vorgegebene negative Schranke. Die Glieder der Summenfolge sind einfach zu berechnen:
Σ(an ) = a0 Σ(1) + d Σ(n) = a0 (n + 1) + d
n(n + 1) . 2
Man nennt die Folge Σ(an ) zuweilen auch eine arithmetische Reihe. Ist (gn ) eine geometrische Folge, also gn = g0 · q n , und ist g0 = 0 und |q| > 1, dann wachsen die Zahlen |gn | mit wachsendem Index u ¨ber jede vorgegebene Schranke S > 0 hinaus: log S − log |g0 | |g0 · q n | > S ⇐⇒ n > . log |q| (Wir nehmen an, dass der Leser mit der Logarithmusfunktion vertraut ist; trotzdem wird diese sp¨ater noch Gegenstand unserer Betrachtungen sein. Wer sich daran st¨ort, dass hier die Basis des Logarithmus nicht angegeben worden ist, beachte, dass sich diese in obigem Zusammenhang herausk¨ urzt: Es gilt loga x = logb x·loga b f¨ ur je zwei Basen a, b.) Ist 0 < |q| < 1, dann n¨ahern sich die Glieder der Folge (gn ) mit wachsendem n immer st¨arker der Zahl 0, d.h., |gn | wird kleiner als jede (noch so kleine) vorgegebene positive Zahl ε, wenn n hinreichend groß wird: |g0 · q n | < ε ⇐⇒ n >
log ε − log |g0 | . log |q|
(Man beachte dabei, dass log x < 0 f¨ ur 0 < x < 1 gilt.) Zur Berechnung der Glieder der Summenfolge von (gn ) gen¨ ugt es wegen Σ(gn ) = g0 Σ(q n ), die Folge n (q ) zu betrachten. F¨ ur q = 1 ist das Problem trivial, so dass wir q = 1 annehmen. F¨ ur sn = 1 + q + q 2 + . . . + q n gilt qsn = q + q 2 + q 3 . . . + q n+1 = sn − 1 + q n+1 , also (q − 1)sn = q n+1 − 1
und somit
sn =
q n+1 − 1 . q−1
IX.4 Arithmetische, geometrische und harmonische Folgen Wir erhalten also f¨ ur q = 1 das Ergebnis
n
Σ(q ) =
197
q n+1 − 1 . q−1
F¨ ur |q| > 1 wachsen die Glieder dieser Folge betragsm¨aßig u ¨ber jede Schranke 1 . Man nennt die Folge Σ(gn ) hinaus, f¨ ur |q| < 1 n¨ahern sie sich dem Wert 1−q
zuweilen eine geometrische Reihe.
Nun betrachten wir die die Summenfolge einer harmonischen Folge (hn ), wobei 1 wir uns aber auf den Fall h0 = 0, D = 1 beschr¨anken, also auf den Fall hn = f¨ ur n n ∈ IN. Offensichtlich unterscheiden sich die Glieder mit wachsendem n immer 1 weniger von 0. Interessant ist das Wachstum der Summenfolge Σ . Diese n
spezielle Folge heißt harmonische Reihe. Es gilt 1 1 + 3 4 1 1 1 1 + + + 5 6 7 8 1 1 1 1 1 1 1 1 + + + + + + + 9 10 11 12 13 14 15 16
1 4 1 > 4· 8 1 > 8· 16 > 2·
= = =
1 2 1 2 1 2
und allgemein f¨ ur k ∈ IN 1 1 1 1 1 + + . . . + k+1 > 2k · k+1 = . 2k + 1 2k + 2 2 2 2 Daher gilt f¨ ur k ∈ IN 1+
1 1 1 1 1 k+3 + + . . . + k+1 > 1 + + k · = . 2 3 2 2 2 2
Daran erkennt man, dass die Folge Σ
1 unbeschr¨ankt w¨achst. n
In obigen Betrachtungen traten h¨aufig Summen von aufeinanderfolgenden Gliedern einer Folge (xn ) auf. Hierf¨ ur wollen wir eine Bezeichnung unter Verwendung des Summenzeichens Σ benutzen: F¨ ur m ≤ k sei k i=m
xi = xm + xm+1 + . . . + xk
(gelesen Summe xi von i = m bis k“). Dann ist ” n (xn )IN0 = xi i=0
Man findet hierf¨ ur auch die Bezeichnung
∞
i=0
.
IN0
xi , diese wollen wir aber hier noch
vermeiden; sie wird sp¨ater f¨ ur den Grenzwert der Folge
(xn ) benutzt.
IX Folgen reeller Zahlen
198
Aufgaben 1. Man zeige, dass keine nicht-konstante Folge existiert, welche zwei der Eigenschaften arithmetisch, geometrisch, harmonisch besitzt.
2. Man bestimme jeweils eine Funktion f , so dass gilt: 1) 2) 3) 4) 5) 6)
(an ) (an ) (an ) (an ) (an ) (an )
arithmetisch ⇒ (f (an )) geometrisch geometrisch ⇒ (f (an )) arithmetisch arithmetisch ⇒ (f (an )) harmonisch harmonisch ⇒ (f (an )) arithmetisch geometrisch ⇒ (f (an )) harmonisch harmonisch ⇒ (f (an )) geometrisch
3. Man bestimme s ∈ IR, n0 ∈ IN so, dass |s − sn | < 10−6 f¨ur alle n > n0 gilt: a) sn =
n i 2 i=0
3
b) sn =
n
12 · 0,95i
i=0
IX.5 Arithmetische Folgen h¨ oherer Ordnung Genau dann ist (an ) eine arithmetische Folge, wenn Δ(an ) eine konstante Folge ist. Bei der Folge (n2 ) der Quadratzahlen ist Δ(n2 ) nicht konstant, aber Δ(Δ(n2 )) ist konstant: Δ(Δ(n2 )) = Δ(2n + 1) = (2). Die k-fache Anwendung des Differenzenoperators schreiben wir abk¨ urzend in der Form Δk ; es also Δ2 (n2 ) = (2). Ist f¨ ur eine Folge (an ) Δk (an ) konstant und k kleinstm¨oglich mit dieser Eigenschaft, so nennt man (an ) eine arithmetische Folge der Ordnung k . Die Folge der Quadratzahlen ist also eine arithmetische Folge zweiter Ordnung. Die Folge der Kubikzahlen ist eine arithmetische Folge dritter Ordnung, denn Δ3 (n3 ) = Δ2 (3n2 + 3n + 1) = Δ(6n + 6) = (6). Eine konstante Folge k¨onnen wir als eine arithmetische Folge der Ordnung 0 ansehen. Allgemein gilt f¨ ur jedes k ∈ IN Δk (nk ) = (k!) (und damit Δi (nk ) = (0) f¨ ur i > k.) (Dabei ist k! (gelesen k Fakult¨at“) das ” Produkt der ersten k nat¨ urlichen Zahlen.) Dies beweist man induktiv. Der Induktionsanfang ist klar. Im Induktionsschritt schließen wir von der G¨ ultigkeit f¨ ur
IX.5 Arithmetische Folgen h¨oherer Ordnung
199
ein k ∈ IN auf die G¨ ultigkeit f¨ ur k + 1: Δk+1 (nk+1 ) = Δk (Δ(nk+1 )) = Δk ((n + 1)k+1 − nk+1 ) = Δk ((k + 1)nk + ck−1 nk−1 + . . . + c2 n2 + c1 n + c0 ) mit ganzen Zahlen c0 , c1 , c2 , . . . , ck−1 . (Mit dem binomischen Lehrsatz, den wir weiter unten betrachten werden, kann man diese Zahlen leicht ausrechnen; das ist hier aber nicht notwendig.) Es folgt k−1
Δk+1 (nk+1 ) = (k + 1)Δk (nk ) + Δk (
j=0
cj nj ) = (k + 1)Δk (nk ) +
k−1 j=0
Δk (cj nj ).
ur j < k folgt Aus Δk (nk ) = (k!) (Induktionsvoraussetzung) und Δk (nj ) = (0) f¨ nun Δk+1 (nk+1 ) = ((k + 1)!) (Induktionsbehauptung). Bei diesem Induktionsbeweis treten zwei Fragen auf: 1) Gilt wirklich allgemein Δk ((an ) + (bn )) = Δk (an ) + Δk (bn ) ? 2) Wie stellt man (n + 1)k als Summe von Potenzen von n dar? Die erste Frage ist zu bejahen: Die Verkettung linearer Abbildungen eines Vektorraums in sich ergibt stets wieder eine solche Abbildung. Die zweite Frage f¨ uhrt auf den binomischen Lehrsatz, zu dessen Vorbereitung wir aber erst den Begriff des Binomialkoeffizienten erkl¨aren m¨ ussen. F¨ ur i, m ∈ IN0 mit i ≤ m sei
m = Anzahl der i-elementigen Teilmengen einer m-elementigen Menge. i
Man liest dieses Symbol mu ¨ber i“ und nennt es einen Binomialkoeffizient. als m” m = Offensichtlich ist = 1, denn eine m-elementige Menge M enth¨alt m
0
genau eine 0-elementige Teilmenge (n¨amlich die leere Menge ∅) und genau eine m-elementige Teilmenge (n¨amlich die Menge M selbst). F¨ ur 0 < i < m gilt
m m m−1 = , i i i−1
wie man folgendermaßen einsieht: Man betrachte alle i-elementigen Teilmengen A von M und pr¨ ufe jeweils f¨ ur alle x ∈ M , ob x ∈ A gilt. Dabei z¨ahle man, wie oft dies geschieht, auf zwei verschiedene Arten:
m M¨oglichkeiten, bei jeder solchen gibt es dann i m i M¨oglichkeiten f¨ ur die Wahl von x; insgesamt gibt es also i · M¨oglichkeiten. i
(1) F¨ ur die Wahl von A gibt es
(2) F¨ ur die Wahl von x gibt es zun¨achst m M¨oglichkeiten, f¨ ur jede solche Wahl m−1 m¨ogliche Erg¨anzungen zu einer i-elementigen Teilmenge A; insgedann i−1
samt gibt es also m ·
m−1 i−1
M¨oglichkeiten.
IX Folgen reeller Zahlen
200 Aus i ·
m m−1 =m· ergibt sich die oben behauptete Formel. Aus ihr folgt i i−1
m m−1 m−2 m−i+1 · · · ... · i i−1 i−2 1 m! m(m − 1)(m − 2) · . . . · (m − i + 1) = . = i(i − 1)(i − 2) · . . . · 1 i!(m − i)!
m i
=
Nun wollen wir den Term (a + b)m durch Aufl¨osen der Klammern in eine Summe von Potenzprodukten am−i bi (i = 0, 1, . . . , m) verwandeln. seien a, b (Dabei Variable f¨ ur reelle Zahlen.) Der Summand am−i bi tritt genau
m -mal auf. Denn i
er entsteht, wenn man in dem Produkt (a + b)(a + b) · . . . · (a + b) mit m Faktoren aus i der Klammern den Faktor b und aus den ¨brigen den Faktor a w¨ahlt, und u m aus den m Klammern kann man auf genau verschiedene Arten i Klammern i
ausw¨ahlen. Die Formel
m m m m−1 m m−2 2 m m (a + b) = a + a b+ a b + ... + b 0 1 2 m m
bzw. (a + b)m =
m m
am−i bi
i
i=0
heißt binomischer Lehrsatz . Mit seiner Hilfe k¨onnen wir nun die Glieder der Differenzenfolge von (nk ) sch¨on beschreiben: k
Δ(n ) =
k k i=1
(nk−i ).
i
Man beachte, dass dabei die Summation erst mit dem Index 1 beginnt. Die Berechnung der Binomi1 alkoeffizienten kann man auch 1 1 im sogenannten pascalschen 2 1 1 Dreieck in Fig. 1 vornehmen 3 3 1 1 (nach Blaise Pascal, 1623– 1662): In der m-ten Zeile (m 4 6 4 1 1 = 0, 1, 2, . . . ) stehen der Reihe 5 10 10 5 1 1 q q q q q q q nach die Binomialkoeffizienten m (i = 0, 1, 2, . . . , m). Diese i
Fig. 1: Pascalsches Dreieck
sind so angeordnet, dass in der Mitte unter
m m m+1 und der Binomialkoeffizient steht. Dieser ist die i i+1 i+1
Summe der beiden dar¨ uberstehenden, denn es gilt allgemein (Aufgabe 3)
m+1 m m = + i+1 i i+1
f¨ ur 0 ≤ i < m.
IX.5 Arithmetische Folgen h¨oherer Ordnung
201
Die 5-te Reihe des pascalschen Dreiecks besagt, dass (a + b)5 = a5 + 5a4 b + 10a3 b2 + 10a2 b3 + 5ab4 + b5 . Die arithmetischen Folgen, deren Ordnung h¨ochstens k ist, bilden mit der Addition und der Vervielfachung mit reellen Zahlen einen Vektorraum Ak , und zwar einen Untervektorraum des Vektorraums F0 aller Folgen, denn es gilt Δk ((an ) + (bn )) = Δk (an ) + Δk (bn ), Δk (c(an )) = cΔk (an ) f¨ ur alle Folgen (an ) und alle Zahlen c. Wegen (ni ) ∈ Ak f¨ ur i ≤ k geh¨ort auch jede Linearkombination dieser Folgen zu Ak , also
k
i=0
ci (ni ) ∈ Ak f¨ ur alle
c0 , c1 , c2 , . . . , cn ∈ IR. Jede arithmetische Folge einer Ordnung ≤ k ist auch von dieser Form. Dies folgt f¨ ur i ≤ k durch i-fache Anwendung des Summenoperators auf Δi (an ) = (c) (c ∈ IR). In der Darstellung einer arithmetischen Folge der Ordnung k als Linearkombination der Folgen (1), (n), (n2 ), . . . , (nk ) sind die Koeffizienten eindeutig durch die Folge bestimmt (Aufgabe 5), diese Folgen bilden also eine Basis des Vektorraums Ak . Beispiel 1: Die Summenformel f¨ ur die Quadratzahlen kann man folgendermaßen gewinnen: Weil (n2 ) eine arithmetische Folge der Ordnung 2 ist, ist Σ(n2 ) eine solche der Ordnung 3. Also ist f¨ ur alle n ∈ IN n
i2 = an3 + bn2 + cn + d
d a+b+c+d 8a + 4b + 2c + d 27a + 9b + 3c + d
i=1
mit gewissen Zahlen a, b, c, d. Diese bestimmt man aus dem nebenstehenden linearen Gleichungssystem, welches man f¨ ur n = 0, 1, 2, 3 erh¨alt. 1
1
= 0 = 1 = 5 = 14
1
Dieses Gleichungssystem hat die L¨osung a = , b = , c = , d = 0, womit sich 3 2 6 die bekannte Summenformel ergibt. Beispiel 2: Besonders interessante arithmetische Folgen h¨oherer Ordnung sind die Folgen der Polygonalzahlen (k-Ecks-Zahlen), von denen schon die Philosophen im alten Griechenland fasziniert waren. Polygonalzahlen sind nat¨ urliche Zahlen, die sich durch besonders regelm¨aßige Punktmuster darstellen lassen (Aufgabe 7). Die Folge (Pn(k) ) der k-Eckszahlen (k = 3, 4, 5, . . .) ist definiert durch (k)
P1
= 1,
(k)
P2
=k
und Δ2 (Pn(k) ) = (k − 2).
Setzt man Pn(k) = an2 + bn + c, dann erh¨alt man f¨ ur n = 0, 1, 2 die Gleichungen k k − 2 . Es c = 0 und a + b = 1, 4a + 2b = k und daraus a = − 1 und b = − ist also
Pn(k)
=
k k − 1 n2 − − 2 n. 2 2
2
2
IX Folgen reeller Zahlen
202
F¨ ur die Pythagor¨aer (Anh¨anger der Philosophie des Pythagoras) stellten die Polygonalzahlen ein Bindeglied zwischen Geometrie und Arithmetik dar, und sie machten sie zum Mittelpunkt einer kosmischen Philosophie“, die alle Beziehun” gen durch Zahlen“ ausdr¨ ucken will ( Alles ist Zahl“). Auf Pierre de Fermat ” ” (1601–1665) geht die Vermutung zur¨ uck, dass man jede nat¨ urliche Zahl als Summe von h¨ochstens drei Dreickszahlen, h¨ochstens vier Viereckszahlen, h¨ochstens f¨ unf F¨ unfeckszahlen und allgemein als Summe von h¨ochstens k k-Eckszahlen darstellen kann. Erst Augustin Louis Cauchy (1789–1857) konnte dies beweisen.
Aufgaben 1. Man berechne mit Hilfe des binomischen Lehrsatzes 1034 und 9983 . 2. Man beweise: Jede endliche nichtleere Menge besitzt ebenso viele Teilmengen mit gerader wie mit ungerader Elementeanzahl.
3. Man beweise:
m m = , i m−i
m+1 m m = + i+1 i i+1
f¨ ur i < m.
4. Man zeige, dass die Darstellung einer arithmetischen Folge der Ordnung k als Linearkombination der Folgen (1), (n), (n2 ), . . . , (nk ) eindeutig ist.
5. Es sei (Dn ) die Folge der Dreieckszahlen. Man beweise: Σ(Dn ) = 6. Man beweise, dass f¨ur k = 1, 2, 3 gilt: Σk (1) = Man beweise dann mit vollst¨andiger Induktion, dass dies f¨ ur alle k ∈ IN gilt.
7. Fig. 2 zeigt den Anfang der Folge (Dn ) der Dreieckszahlen, Folge (Qn ) der Viereckszahlen, Folge (Fn ) der F¨ unfeckszahlen
(Dn ),
(Qn ),
(Fn )
jeweils eine explizite Darstellung durch einen Term mit der Variablen n an.
n+k k
n+2 . 3
.
u
u u u
u u u u u u
u
u u u u
u u u u u u u u u
u u u u u
u u u u u u u u u u u u
(vgl. Beispiel 2) als Punktmuster. Man gebe f¨ ur die Summenfolgen
u
Fig. 2: 3-, 4- und 5-Ecks-Zahlen
8. Man zeige, dass man die k-Eckszahlen folgendermaßen darstellen kann: Pn(k) = (k − 2)Dn − (k − 3)n =
n ((k − 2)n − k + 4) 2
IX.6 Konvergente Folgen
203
IX.6 Konvergente Folgen Die Definition einer Folge (an ) als eine Abbildung von IN0 in IR ist derart allgemein, dass man nicht sehr viele tiefsinnige Aussagen u ¨ber Folgen machen kann, wenn man nicht Folgen mit besonderen Eigenschaften betrachtet. Solche besonderen Eigenschaften, mit denen wir uns nun besch¨aftigen wollen, sind die Beschr¨anktheit, die Monotonie und vor allem die Konvergenz. Definition 1: Eine Folge (an ) heißt beschr¨ankt, wenn es eine Zahl R > 0 mit ur alle n ∈ IN0 |an | ≤ R f¨ gibt. Gilt f¨ ur eine Zahl S bzw. f¨ ur eine Zahl T an ≤ S
f¨ ur alle n ∈ IN0
an ≥ T
bzw.
f¨ ur alle n ∈ IN0 ,
so heißt die Folge nach oben beschr¨ankt bzw. nach unten beschr¨ankt. Eine beschr¨ankte Folge ist sowohl nach oben als auch nach unten beschr¨ankt, ur alle n ∈ IN0 folgt −R ≤ an ≤ R f¨ ur alle n ∈ IN0 . denn aus |an | ≤ R f¨ Sind die Folgen (an ) und (bn ) beschr¨ankt, dann gilt dies auch f¨ ur die Folgen (an ) + (bn ), (an ) · (bn ), c(an ) (c ∈IR) (Aufgabe 1). Definition 2: Eine Folge (an ) heißt monoton wachsend bzw. fallend , wenn an ≤ an+1
f¨ ur alle n ∈ IN0
an ≥ an+1
bzw.
f¨ ur alle n ∈ IN0 .
Gilt dabei nie das Gleichheitszeichen, dann heißt die Folge streng monoton wachsend bzw. fallend. n n 4 4 ist beschr¨ankt: Es gilt 0 < N1 folgt a − 1 < an < a + 1 f¨ ur n > N1 , also |an | ≤ max(|a0 |, |a1 |, . . . , |aN1 |, |a| + 1).
hier h¨ochstens endlich viele Glieder @ R @ .......s.......s.......s......s.....s.....s[....s....s....s...s...s..s..s...s..s.ssssssss ......................].....s.....s......s.......s.......s....
a−
6
a
a+
6
hier fast alle Glieder
Fig. 1: Zum Begriff der Konvergenz
Satz 1: Sind die Folgen (an ) und (bn ) konvergent, dann sind auch die Folgen (an ) + (bn ) und (an ) · (bn ) konvergent und es gilt lim((an ) + (bn )) = lim(an ) + lim(bn ), lim((an ) · (bn )) = lim(an ) · lim(bn ). ur jedes ε > 0 existieren also Beweis: Es sei lim(an ) = a und lim(bn ) = b. F¨ nat¨ urliche Zahlen Nε(1) , Nε(2) mit ur n ≥ Nε(1) |an − a| < ε f¨
und |bn − b| < ε f¨ ur n ≥ Nε(2) .
F¨ ur n ≥ max(Nε(1) , Nε(2) ) gilt dann |(an + bn ) − (a + b)| = |(an − a) + (bn − b)| ≤ |an − a| + |bn − b| < ε + ε = 2ε und |an bn − ab| = ≤ = ≤
|an bn − abn + abn − ab| |an bn − abn | + |abn − ab| |bn ||an − a| + |a||bn − b| |bn |ε + |a|ε = (|bn | + |a|)ε ≤ Kε,
wobei K eine obere Schranke f¨ ur |bn | + |a| ist. Da die Zahlen 2ε und Kε mit ε ebenfalls beliebig kleine Werte annehmen k¨onnen, ergibt sich die Behauptung. 2 Die Menge C der konvergenten Folgen aus F0 bildet bez¨ uglich der Addition und der Multiplikation einen Ring, also einen Teilring von (F0 , +, ·). Wegen lim(c(an )) = c lim(an ) f¨ ur alle c ∈ IR und alle (an ) ∈ C bildet C bez¨ uglich der Addition und der Vervielfachung mit reellen Faktoren einen Vektorraum, also einen Untervektorraum des Vektorraums aller Folgen. Hat kein Glied der Folge (an ) den Wert 0, dann kann man die Kehrfolge
1 an
bilden. Ist dabei die Folge (an ) konvergent und ist a := lim(a n ) = 0, dann gilt lim
1 an
=
1 ; dies ergibt sich sofort aus der Beziehung lim(an )
1 |a − an | 1 a − a = |aa | . n n
IX Folgen reeller Zahlen
206
Beispiel 5: F¨ ur |q| < 1 gilt offensichtlich (vgl. Beispiel 1): lim (q n ) = 0 und
lim
qn =
1 . 1−q
Beispiel 6: Es gilt
(n + 1)(2n + 1) lim n2
Beispiel 7: Die Folge
(−1)n−1 n
1 1 · 2+ n n 1 1 = 1 + lim · 2 + lim n n = (1 + 0) · (2 + 0) = 2. = lim
1+
ist konvergent, was wir aber erst im folgenden
Abschnitt beweisen. Man sieht leicht, dass sie beschr¨ankt ist: F¨ ur n ≥ 2k gilt n (−1)i−1 i=1
i
1 1 1 1 1 − − + + ... + 2 3 4 2k − 1 2k 1 1 1 1 1 1 ≤ 1− + + ... + = 1 − < 1. − − 2 2 3 k−1 k k ≤
1−
Eine Folge mit dem Grenzwert 0 nennt man eine Nullfolge. Die Menge N der Nullfolgen bildet einen Teilring des Rings der konvergenten Folgen und einen Untervektorraum des Vektorraums der konvergenten Folgen. Ferner gilt: Satz 2: Das Produkt einer Nullfolge mit einer beschr¨ankten Folge ist wieder eine Nullfolge. Beweis: Es sei (an ) eine Nullfolge und (bn ) eine beschr¨ankte Folge mit der Schranke S. F¨ ur eine gegebenes positives ε existiert ein Nε ∈ IN mit |an | < ε f¨ ur n ≥ Nε . Dann ist |an bn | < Sε f¨ ur n ≥ Nε . 2 Ist Σ(an ) konvergent, dann ist (an ) eine Nullfolge (Aufgabe 3). Ist jedoch (an ) eine Nullfolge, dann muss Σ(an ) nicht konvergent sein, wie man am Beispiel der harmonischen Reihe Σ
1 n
erkennt (vgl. Beispiel 4).
Ist (an ) konvergent, dann ist auch die Folge der Betr¨age (also (|an |)) konvergent. F¨ ur Nullfolgen ist dies unmittelbar klar, f¨ ur eine Folge (an ) mit dem Grenzwert a argumentiert man folgendermaßen: Ist a > 0, dann existiert ein N ∈ IN mit a |an − a| < f¨ ur n ≥ N . Die Glieder der Folge sind daher ab dem Index N positiv, 2 also |an | = an f¨ ur n ≥ N. F¨ ur einen negativen Grenzwert argumentiert man analog. Ist aber umgekehrt (|an |) konvergent, dann muss (an ) nicht konvergent sein; ein Beispiel hierf¨ ur ist die Folge ((−1)n ). Aus der Konvergenz n ) folgt nicht die Konvergenz von Σ(|an |). Beispiels von Σ(a weise wird sich Σ
(−1)n−1 n
in Abschnitt IX.7 als konvergent erweisen (vgl. auch
IX.6 Konvergente Folgen
207
1 ist divergent. Umgekehrt folgt aber aus der Konvergenz n
Beispiel 7), aber Σ
von Σ(|an |) diejenige von Σ(an ); dies werden wir in IX.9 beweisen.
Beispiel 8: Die Differenzenfolge Δ(an ) der Folge (an ) aus Beispiel 3 (Quotienten aufeinanderfolgender Fibonacci-Zahlen) ist eine Nullfolge: Es gilt f¨ ur n ≥ 1
und an an−1
1 1 |an − an−1 | |an+1 − an | = − = an an−1 an an−1 1 1 = 1+ · an−1 = an−1 + 1 ≥ 2, also |an+1 − an | ≤ |an − an−1 |. an−1 2
Daraus folgt induktiv
|an+1 − an | ≤ Weil
n
1 2
|a1 − a0 | =
n
1 2
.
n 1 eine Nullfolge ist, gilt dasselbe f¨ ur (an+1 − an ). 2
Die Folge (an ) ist ein Beispiel f¨ ur eine Fundamentalfolge (siehe IX.7), denn f¨ ur jedes ε > 0 gilt |am − an | < ε f¨ ur hinreichend große m, n. F¨ ur m > n gilt n¨amlich |am − an | = |am − am−1 | + |am−1 − am−2 | + . . . + |an+1 − an | ≤
n
1 2
1+
1 1 + . . . + m−n−1 2 2
≤2·
n
1 2
n−1
=
1 2
.
In Beispiel 8 haben wir zwei Selbstverst¨andlichkeiten benutzt, auf welche wir aber nochmals ausdr¨ ucklich hinweisen wollen: • Ist |an | ≤ |bn | und ist (bn ) eine Nullfolge, dann ist auch (an ) eine Nullfolge. • Die geometrische Folge (q n ) ist f¨ ur |q| < 1 eine Nullfolge. Im n¨achsten Beispiel werden wir eine weitere Trivialit¨at benutzen: • Das Konvergenzverhalten und der Grenzwert einer Folge a¨ndern sich nicht, wenn man endlich viele ihrer Glieder ¨andert oder außer Betracht l¨asst. n eine Nullfolge ist. F¨ ur jedes n ∈ IN 2n k+1 n 2 1 ≤ n < 2k+1 . Damit gilt n < 2k ≤ k . Nun ist 2 2 2
Beispiel 9: Es soll gezeigt werden, dass existiert ein k ∈ IN0 mit 2k
2k − k − 1 ≥ k bzw. 2k ≥ 2k + 1 f¨ ur k ≥ 3, wie man z. B. mit vollst¨andiger n 1 Induktion beweisen kann. Also gilt f¨ ur n ≥ 23 = 8 die Beziehung n < k . Weil
nun
1 2n
eine Nullfolge ist, gilt dasselbe f¨ ur
n . 2n
2
2
In obigen Beispielen 8 und 9 haben wir aus |an | ≤ bn und lim(bn ) = 0 auf lim(an ) = 0 geschlossen. Allgemeiner gilt offensichtlich folgendes Einschließungskriterium: Ist bn ≤ an ≤ bn f¨ ur alle n ∈ IN0 und lim(bn ) = lim(bn ) = b, dann gilt auch lim(an ) = b.
IX Folgen reeller Zahlen
208 Beispiel 10: Wir wollen zeigen, dass
√ lim( n n) = 1
gilt. Dazu untersuchen wir die Folge mit den Gliedern xn := gilt aufgrund des binomischen Lehrsatzes
n = (1 + xn )n = 1 + und daher x2n
1
n n 2 n n n 2 n(n − 1) 2 xn + x + ... + x > x = xn 1 2 n n n 2 n 2
2 . Es folgt 0 < xn < n−1
ßungskriterium lim(xn ) = 0.
2 und daraus nach dem Einschlien−1
Nullfolgen sind aufgrund der folgenden Tatsache von besonderer Bedeutung: Genau dann ist lim(an ) = a, wenn (an − a) eine Nullfolge ist. Hat man also eine Vermutung u ¨ber den Grenzwert einer Folge, so kann man ihre Konvergenz gegen diesen Grenzwert beweisen, indem man von einer anderen Folge nachweist, dass sie eine Nullfolge ist. So sind wir in Beispiel 10 vorgegangen. Ist (an ) eine beliebige Folge und τ eine injektive Abbildung von IN in sich mit τ (i) < τ (j) f¨ ur i < j (i, j ∈ IN), dann nennt man (aτ (n) ) eine Teilfolge von (an ). Genau dann ist eine Folge konvergent, wenn jede ihrer Teilfolgen konvergiert. Dabei konvergiert jede Teilfolge gegen den Grenzwert der gegebenen Folge. Eine nicht-konvergente Folge kann aber konvergente Teilfolgen enthalten. Ist (an ) beschr¨ankt, dann bezeichnet man mit lim inf(an )
bzw.
lim sup(an )
(Limes inferior bzw. Limes superior) die kleinste bzw. die gr¨oßte Zahl, die Grenzwert einer Teilfolge von (an ) ist. Genau dann ist (an ) konvergent, wenn lim inf(an ) = lim sup(an ) (= lim(an )). √ √ Beispiel 11: Wir betrachten die Folge ( n − [ n]), √ wobei√[x] die kleinste ganze Zahl ≤ x sein soll (Ganzteilfunktion). Es gilt 0 ≤ n − [ n] < 1. Die Teilfolge mit τ (n) = n2 ist konstant 0, konvergiert also gegen 0. Andererseits ergibt sich f¨ ur τ (n) = n2 + 2n eine Folge mit dem Grenzwert 1 (Aufgabe 5). Es ist also √ √ √ √ und lim sup( n − [ n]) = 1. lim inf( n − [ n]) = 0 Satz 3: Die durch (an ) ∼ (bn ) ⇐⇒ (an ) − (bn ) ∈ N ¨ definierte Relation ist eine Aquivalenzrelation in F0 , d.h., es gilt (1) (an ) ∼ (an ) f¨ ur alle (an ) ∈ F0 ; (2) ist (an ) ∼ (bn ), dann ist auch (bn ) ∼ (an ); (3) ist (an ) ∼ (bn ) und (bn ) ∼ (cn ), dann ist auch (an ) ∼ (cn ). Die Relation ∼ ist also (1) reflexiv , (2) symmetrisch und (3) transitiv .
IX.6 Konvergente Folgen
209
Beweis: (1)und (2) verstehen sich von selbst; (3) folgt daraus, dass mit den Folgen (an ) − (bn ) und (bn ) − (cn ) auch deren Summe (an ) − (cn ) eine Nullfolge ist. 2 Ist (an ) eine konvergente Folge mit dem Grenzwert a, dann besteht die Menge aller zu (an ) ¨aquivalenten Folgen aus allen Folgen mit dem Grenzwert a, also aus allen zu der konstanten Folge (a) ¨aquivalenten Folgen. ¨ Wir betrachten nun noch eine andere Aquivalenzrelation in der Menge aller Folgen, welche es insbesondere erm¨oglicht, unbegrenzt wachsende Folgen miteinander zu vergleichen und ihr Wachstumsverhalten zu beschreiben. Satz 4: In der Menge aller Folgen, deren Glieder alle von 0 verschieden sind, wird durch 1 (an ) ≈ (bn ) ⇐⇒ (an ) · ∼ (1) bn ¨ eine Aquivalenzrelation definiert. Beweis: Die Reflexivit¨at und die Symmetrie der Relation ≈ verstehen sich von 1 1 und (bn ) · selbst. Die Transitivit¨at ergibt sich daraus, dass mit (an ) · auch das Produkt (an ) ·
1 cn
bn
1 3
sowie lim
2
dieser Folgen den Grenzwert 1 hat.
Beispiel 12: Es gilt Σ(n2 ) ≈ (n3 ), denn Σ(n2 ) =
cn
1 3 1 1 n + n2 + n 3 2 6
und
1 3 1 2 1 3 3 1 1 1 n + n + n · 3 =1+ · + · 2 3 2 6 n 2 n 2 n
2 1 1 1 = 0 und lim 2 = lim = 0. n n n
¨ Wie in Beispiel 12 dient die Aquivalenzrelation ≈ dazu, bei divergenten wachsenden Folgen das Wachstum durch Folgen mit u ¨bersichtlichen Termen zu beschreiben. F¨ ur viele Gebiete der Mathematik ist z. B. die folgende Beschreibung des Wachstums der harmonischen Reihe mit Hilfe der Logarithmusfunktion von Bedeutung, welche wir in X.8 begr¨ unden werden: Σ
1 n
≈ (ln n). Dabei ist ln
der Logarithmus zur Basis e und Zahl (vgl. IX.10). F¨ ur die Fol√e die eulersche n n ge der Fakult¨aten gilt (n!) ≈ 2πn , wie wir in XI.4 beweisen werden e (stirlingsche Formel).
Aufgaben 1. Man zeige, dass Summe und Produkt beschr¨ankter Folgen beschr¨ankt sind. 2. Man beweise die Behauptung u¨ber die Folge der Quotienten der FibonacciZahlen aus Beispiel 3.
IX Folgen reeller Zahlen
210
3. Man zeige: Ist Σ(an ) konvergent, dann ist (an ) eine Nullfolge. √
4. Man beweise: lim( n2 + 2n − n) = 1. 5. Man beweise f¨ur k = 1, 2, 3 die Beziehung Σ(nk ) ≈ 6. Es sei lim(an + bn ) = u und lim(an − bn ) = v.
1 (nk+1 ). k+1
1 4
Man zeige, dass die Produktfolge (an bn ) gegen (u2 − v2 ) konvergiert.
7. Es seien (an ), (bn ) Nullfolgen mit positiven Gliedern.
Man zeige, dass dann auch die Folge
8. Es sei lim(an ) = a und An :=
a2n + b2n an + bn
eine Nullfolge ist.
n 1 ai (arithmetisches Mittel der ersten n n i=1
Glieder von (an )). Man zeige, dass dann auch lim(An ) = a gilt.
9. In einem gleichseitigen Dreieck der Seitenl¨ange 1 denke man sich die mitt1
leren Drittel der Seiten durch zwei Strecken der L¨ange so ersetzt, dass 3 eine Sternfigur entsteht (Fig. 2). Auf jede der 12 Seiten dieser Sternfigur denke man sich dieselbe Ersetzung angewendet, man ersetze also das mittlere Drittel jeder Seite, wie in Fig. 2 gezeigt, durch zwei Strecken der L¨ange 1 . Auf die nunmehr 48 Seiten der enstandenen Sternfigur wende man die9 selbe Prozedur an. Diese Ersetzungen denke man sich nun unendlich oft“ ” wiederholt. Es entsteht eine Grenzfigur, die man nat¨ urlich nicht zeichnen .. .... ............... ... ...... . ... ..... . kann. Mn berechne den Um. . . . . . . . . ............. ...... ...... ................ ............... . .... . . ... ....... ... ... fang und den Fl¨acheninhalt die. . .... ......... ... . . . . .. . . . .. . . . . . . . . . . . . ser Grenzfigur. (Solche Grenzfigu.................................... .................. .................. ................. ............... . . . . . . . . . ............. ..... ren einer Figurenfolge betrachtet man in der Geometrie der FrakFig. 2: Zu Aufgabe 9 tale.)
10. Craps ist ein in den Vereinigten Staaten beliebtes W¨urfelspiel. Man wirft
zwei W¨ urfel und bestimmt die Augensumme S. Bei S ∈ {7, 11} gewinnt man sofort, bei S ∈ {2, 3, 12} verliert man sofort. In den u ¨brigen F¨allen wirft man so lange weiter, bis entweder die Augensumme 7 kommt (dann hat man verloren) oder wieder die Augensumme S erscheint (dann hat man gewonnen). Man berechne die Gewinnwahrscheinlichkeit. Die Wahrscheinlichkeiten p der einzelnen Werte von S entnehme man folgender Tabelle: S 2 3 4 5 6 7 8 9 10 11 12 36p 1 2 3 4 5 6 5 4 3 2 1
IX.7 Die reellen Zahlen
211
IX.7 Die reellen Zahlen Eine Zahl heißt rational , wenn sie als Quotient zweier ganzer Zahlen ( Bruch“) ” geschrieben werden kann. Eine reelle Zahl, die nicht rational ist, heißt irrational . √ √ u mit u, v ∈ IN und Beispiel 1: 3 14 ist eine irrationale Zahl: Aus 3 14 = v
ggT(u, v) = 1 ( voll gek¨ urzt“) folgt u3 = 14v 3 . Eine solche Gleichung kann aber ” nicht gelten, weil sie zur Folge h¨atte, dass u durch 7 und damit u3 durch 73 teilbar w¨are, was wiederum die Teilbarkeit von v durch 7 zur Folge h¨atte, im Widerspruch zur vorausgesetzten Teilerfremdheit von u, v. Den Umgang mit reellen Zahlen haben wir bisher als bekannt vorausgesetzt. Nun wollen wir die Unterschiede zwischen den rationalen Zahlen und den reellen Zahlen n¨aher untersuchen und dabei mehr u ¨ber die Natur der reellen Zahlen erfahren. F¨ ur a, b ∈ IR nennt man [a; b] ]a; b[ [a; b[ ]a; b]
= = = =
{x ∈ IR | a ≤ x ≤ b} ein abgeschlossenes Intervall, {x ∈ IR | a < x < b} ein offenes Intervall, {x ∈ IR | a ≤ x < b} ein halboffenes Intervall, {x ∈ IR | a < x ≤ b} ein halboffenes Intervall.
Wir wollen auch die Mengen ] − ∞; a] = {x ∈ IR | x ≤ a}, ] − ∞; a[ = {x ∈ IR | x < a},
[b; ∞[= {x ∈ IR | x ≥ b}, ]b; ∞[= {x ∈ IR | x > b}
Intervalle nennen; im Gegensatz zu diesen unendlichen Intervallen heißen die zuvor definierten endlich. Schließlich soll auch die Menge IR selbst als ein (unendliches) Intervall verstanden werden. Sind a, b rationale Zahlen mit a < b und ersetzt man in obigen Definitionen IR durch Q, so spricht man von rationalen Intervallen. Im Gegensatz dazu heißen die oben beschriebenen Intervalle reell . Wir erinnern an die Bestimmung einer reellen schen zwei Folgen rationaler Zahlen, etwa √ 1 < √2 < 1, 4 < √2 < 1, 41 < √2 < 2 < 1, 414
S. Alle diese Eigenschaften besitzt auch Q. Da in IR aber außerdem das Vollst¨andigkeitsaxiom gilt, sagt man, der K¨orper der reellen Zahlen sei ein vollst¨andiger archimedisch angeordneter K¨orper. Wir wollen nun aus dem Vollst¨andigkeitsaxiom einige S¨atze herleiten, welche in IR, nicht aber in Q gelten. Wir betrachten also nun stets Folgen (an ) von reellen Zahlen. Satz 1 (Cauchy-Kriterium): Genau dann ist die Folge (an ) konvergent, wenn zu jedem ε > 0 ein Nε ∈ IN derart existiert, dass ur alle m, n ≥ Nε . |am − an | < ε f¨ Beweis: a) Die Folge (an ) sei konvergent zum Grenzwert a. Dann existiert zu jedem ε > 0 ein Nε ∈ IN mit |an − a| < ε f¨ ur alle n ≥ Nε . F¨ ur m, n ≥ Nε ist dann |am − an | = |(am − a) − (an − a)| ≤ |am − a| + |an − a| < ε + ε = 2ε. Da mit ε auch 2ε beliebig klein gemacht werden kann, folgt die Bedingung des Cauchy-Kriteriums. b) Es gelte die im Satz angegebene Bedingung. Dann existiert f¨ ur alle i ∈ IN ein Index Ni , so dass 1 ur alle n ≥ Ni . |an − aNi | < i f¨ 2 ur n ≥ Ni liegt also an im Dabei k¨onnen wir N1 < N2 < N3 < . . . annehmen. F¨ Intervall
1 1 Ii := aNi − i ; aNi + i . 2 2 Wegen N2 > N1 liegt aN2 im Innern des Intervalls I1 , so dass I1 ∩I2 ein nichtleeres abgeschlossenes Intervall ist. Wegen N3 > N2 liegt aN3 im Innern von I1 ∩ I2 ∩ I3 ,
IX Folgen reeller Zahlen
214
so dass I1 ∩ I2 ∩ I3 ein nichtleeres abgeschlossenes Intervall ist. So findet man eine Folge von ineinandergeschachtelten nichtleeren abgeschlossenen Intervallen I1 , I1 ∩ I2 , I1 ∩ I2 ∩ I3 , . . . , deren L¨angen eine Nullfolge bilden, die also eine Intervallschachtelung darstellen. Diese besitzt nach dem Vollst¨andigkeitsaxiom einen Kern a, und es gilt wegen a ∈ I1 ∩ I2 ∩ . . . ∩ Ik ⊆ Ik |an − a| < 2 ·
1 2k
f¨ ur alle n ≥ Nk .
Da dies f¨ ur jedes k ∈ IN gilt, folgt lim(an ) = a.
2
Das Cauchy-Kriterium ist notwendig und hinreichend f¨ ur die Konvergenz einer Folge: Ist die Folge konvergent, dann gilt die Cauchy-Bedingung, gilt die CauchyBedingung, dann ist die Folge konvergent. Das wird in Satz 1 durch die Worte genau dann“ ausgedr¨ uckt. ” Eine Folge, welche das Cauchy-Kriterium erf¨ ullt, heißt eine Cauchy-Folge oder eine Fundamentalfolge. Man kann Satz 1 also folgendermaßen ausdr¨ ucken: Eine Folge ist in IR genau dann konvergent, wenn sie eine Cauchy-Folge ist. Eine Cauchy-Folge rationaler Zahlen muss keinen rationalen Grenzwert haben (wohl aber einen reellen), wie folgende Beispiele zeigen. Beispiel 2: Die Folge (an ) mit a1 := 1 und 1 1 an := an−1 + 2 an−1
f¨ ur n ≥ 2
ist eine Cauchy-Folge (rationaler Zahlen), hat aber keinen Grenzwert in Q. Zun¨achst kl¨aren wir die zweite Behauptung. W¨are a = lim(an ), so w¨ urde aus √ 1 1 2 der Rekursionsformel a = a + , also a = 2 folgen. Weil aber 2 keine rationa2 a le Zahl ist, hat (an ) keinen rationalen Grenzwert. Nun zeigen wir, dass die Folge (a2n ) der Quadrate der Folgenglieder konvergent ist. Es gilt f¨ ur n ≥ 2
a2n
−2=
1 1 an−1 + 2 an−1
2
1 1 − 4 · an−1 · = 2 an−1
also a2n ≥ 2. Ferner gilt a2n ≤ 2 +
1 1 an−1 − 2 an−1
2
≥ 0,
1 (vollst¨andige Induktion). Damit ergibt sich 2n
lim(a2n ) = 2. Nach Satz 1 ist also (a2n ) eine Cauchy-Folge. Daraus wollen wir herleiten, dass auch (an ) eine solche Folge ist: Zu ε > 0 existiert ein Nε ∈ IN mit |a2m − a2n | < ε f¨ ur alle m, n ≥ Nε , also wegen an ≥ 1 f¨ ur alle n ∈ IN auch |am − an | ≤ 2|am − an | ≤ (am + an )|am − an | = |(am + an )(am − an )| = |a2m − a2n | < ε.
IX.7 Die reellen Zahlen
215
Beispiel 3: Die Folge Σ rational: F¨ ur m > n gilt 0
1; man zeige, dass Σ
c) Man zeige, dass Σ
n2 2n
konvergiert.
3. Man bestimme die H¨aufungspunkte, das Infimum und das Supremum von
a) M =
1 1 + m, n ∈ IN m n
b) M =
m − n m, n ∈ IN m+n
4. Fig. 1 zeigt den Anfang des leibnizschen Dreiecks. Hier steht in der Mitte u ¨ber zwei Zahlen deren Summe; beispielsweise ist 1 1 1 + = . 20 30 12 a) Wie lautet die n¨achste Zeile? b) In den nach links unten laufenden Schr¨agen stehen Nullfolgen, und zwar der Reihe nach
1 6
1 5
1 3
1 2
1 1 1 6
1 2
1 3
1 1 1 1 12 1 12 1 4 1 1 20 1 30 1 20 1 5 30 60 60 30 1 4
1 6
Fig. 1: Leibnizsches Dreieck
1 2 1 , , usw. Man bestimme den allgemeinen n n(n + 1) n(n + 1)(n + 2)
Term der Folgenglieder in den beiden n¨achsten Schr¨aglinien. c) Man untersuche, ob die Summenfolgen der Folgen in den ersten drei Schr¨aglinien konvergieren und berechne im Fall der Konvergenz den Grenzwert.
IX.8 Potenzen mit reellen Exponenten
219
IX.8 Potenzen mit reellen Exponenten F¨ ur eine reelle Zahl x und eine nat¨ urliche Zahl n versteht man unter der Potenz xn das n-fache Produkt x · x · . . . · x mit n Faktoren x. Man kann dies folgendermaßen rekursiv definieren: x1 = x, xn = xn−1 · x f¨ ur n ∈ IN. In der Potenz xn nennt man x die Basis und n den Exponent. Die G¨ ultigkeit der bekannten Potenzregeln xm · xn = xm+n , (xm )n = xmn , xn · y n = (xy)n f¨ ur Potenzen mit nat¨ urlichen Exponenten beweist man dann mit vollst¨andiger Induktion. Nun m¨ochten wir als Exponenten auch andere als nur nat¨ urliche Zahlen zulassen. F¨ ur x = 0 setzen wir x0 = 1. Damit sind obige Potenzregeln auch f¨ ur Exponenten aus IN0 g¨ ultig. Die Basis 0 sollte man dabei aber ausschließen, also 00 weder gleich 0 noch gleich 1 setzen. Der Term 00 ist ein unbestimmter Ausdruck . F¨ ur x = 0 und n ∈ IN setzen wir 1 x−n = n . x Damit haben wir Potenzen f¨ ur ganzzahlige Exponenten (und Basen = 0) definiert. Man kann leicht nachrechnen, dass obige Potenzregeln dabei weiterhin gelten. Nun setzen wir f¨ ur x ≥ 0 und m, n ∈ IN 1 m √ 1 m x n = n x sowie x n = x n . Auch hier sind wieder alle Potenzregeln erf¨ ullt, wobei es aber wichtig ist, dass negative Basen ausgeschlossen sind. Dies zeigt folgendes Beispiel: Geht man von √ 3 −8 = −2 aus, so erh¨alt man bei Anwenden der Potenzregeln den Widerspruch √ 1 2 1 1 −2 = 3 −8 = (−8) 3 = (−8) 6 = ((−8)2 ) 6 = 64 6 = +2. Damit ist f¨ ur x ≥ 0 und alle positiven rationalen Zahlen r die Potenz xr definiert. 1 Ist x = 0, dann erkl¨art man wieder x−r durch r und rechnet leicht nach, dass x auch hier wieder alle Potenzregeln erf¨ ullt sind. Nun erhebt sich das Problem, f¨ ur einen beliebigen reellen Exponenten a die Potenz xa zu definieren. Wir wollen es mit folgender Definition versuchen: Ist a der Grenzwert der rationalen Zahlenfolge (an ), dann ist xa der Grenzwert von (xan ). Zun¨achst ist zu beachten, dass jede reelle Zahl Grenzwert einer Folge rationaler Zahlen ist. Wir m¨ ussen nun zeigen, dass mit (an ) auch (xan ) konvergiert, und dass f¨ ur jede andere rationale Folge (bn ) mit dem Grenzwert a die Folgen (xan ) und (xbn ) denselben Grenzwert haben. Es gilt xam − xan = xan (xam −an − 1). Da (an ) eine Cauchy-Folge ist und da (xan ) beschr¨ankt ist, ist auch (xan ) eine Cauchy-Folge und somit konvergent (Aufgabe 1). Da weiterhin (an − bn ) eine Nullfolge ist, gilt lim(xan −bn ) = 1. Es folgt lim(xan − xbn ) = lim(xbn (xan −bn − 1)) = 0.
IX Folgen reeller Zahlen
220 Wir k¨onnen nun also definieren: xlim(an ) = lim(xan ).
F¨ ur reelle Exponenten gelten wieder die bekannten Potenzregeln, was sich aus den Grenzwerts¨atzen f¨ ur Folgengrenzwerte ergibt. Ist b > 1, dann nennt man die L¨osung x der Gleichung bx = a den Logarithmus von a zur Basis b und schreibt daf¨ ur logb a. Es ist also x = logb a ⇐⇒ bx = a. (Es ist u ussig, Logarithmen zur Basis b mit 0 < b < 1 zu betrachten, denn ¨berfl¨ logb x = − log 1 x.) Es gelten die folgenden Logarithmenregeln, welche man sofort b aus den entsprechenden Potenzregeln gewinnt: logb (a1 · a2 ) = logb a1 + logb a2 ,
logb (ar ) = r logb a (r ∈ IR).
Aus diesen ergeben sich die Sonderf¨alle √ 1 a logb 1 = logb a1 − logb a2 . logb n a = logb a, n
a2
F¨ ur die Umrechnung eines Logarithmus zur Basis b in einen zur Basis c gilt logc a = logc b · logb a, denn a = clogc a und a = blogb a = (clogc b )logb a . Von besonderer Bedeutung f¨ ur das numerische Rechnen sind die Logarithmen zur Basis 10 (lg-Taste auf dem Taschenrechner). F¨ ur die meisten Gebiete der Mathematik spielt aber der Logarithmus zur Basis e (nat¨ urlicher Logarithmus, ln-Taste auf dem Taschenrechner) die gr¨oßte Rolle. Dabei ist e die eulersche Zahl (vgl. Abschnitt IX.10).
Aufgaben 1. Es sei x eine positive reelle Zahl und (an ) eine Cauchy-Folge. Man zeige, dass dann auch (xan ) eine Cauchy-Folge ist.
2. Man l¨ose mit Hilfe des lg-Taste des Taschenrechners (Logarithmus zur Basis 10) die Exponentialgleichung 4x+2 = 5x−1 .
3. Man bestimme a, b, c so, dass lg(a + bx + cx2 ) f¨ur x = 0, 1, 2 die Werte 0, 1 bzw. 2 annimmt.
4. Man berechne ohne Taschenrechner einen N¨aherungswert von mit Hilfe der folgenden Werte aus einer Logarithmentafel:
5
2417 · 393 1072
lg 39 = 1,5911; lg 107 = 2,0294; lg 241 = 2,3820; lg 3004=3,4777
IX.9 Unendliche Reihen
221
IX.9 Unendliche Reihen Die Summenfolge Σ(an ) einer Folge (an ) nennen wir aus historischen Gr¨ unden hier eine unendliche Reihe oder auch kurz eine Reihe mit den Gliedern a0 , a1 , a2 , . . . . Existiert der Grenzwert der Summenfolge, so schreiben wir auch ∞ n=0
an
f¨ ur
lim Σ(an )
ur alle n ∈ IN0 , so sprechen und nennen dies den Wert der Reihe. Gilt an > 0 f¨ wir von einer Reihe mit positiven Gliedern. Nach dem Hauptsatz u ¨ber monotone Folgen ist eine Reihe mit positiven Gliedern konvergent, wenn sie beschr¨ankt ist. Sind Σ(an ) und Σ(bn ) Reihen mit positiven Gliedern, wobei an ≤ bn f¨ ur alle n ∈ IN gilt, dann folgt aus der Konvergenz von Σ(bn ) die Konvergenz von Σ(an ) und aus der Divergenz von Σ(an ) diejenige von Σ(bn ) (Vergleichskriterium). Satz 1: Es sei Σ(an ) eine Reihe mit positiven Gliedern, ferner n0 eine feste nat¨ urliche Zahl. a) Quotientenkriterium: Gibt es ein q ∈ IR mit 0 < q < 1 und an+1 ≤ q f¨ ur alle n > n0 , an dann ist die Reihe konvergent. b) Wurzelkriterium: Gibt es ein q ∈ IR mit 0 < q < 1 und √ n an ≤ q f¨ ur alle n > n0 , dann ist die Reihe konvergent. Beweis: Es ist jeweils nur die Beschr¨anktheit der Reihe nachzuweisen. a) Aus der Bedingung folgt f¨ ur i > n0 die Absch¨atzung ai ≤ an0 · q i−n0 , also f¨ ur n > n0 n0 n0 n 1 − q n−n0 +1 1 ai ≤ ai + an0 · ai + an0 · ≤ . 1−q 1−q i=0 i=0 i=0 ur n > n0 b) Aus der Bedingung folgt f¨ ur i > n0 die Absch¨atzung ai ≤ q i , also f¨ n i=0
ai ≤
n0 i=0
ai + q n0 +1 ·
n0 1 − q n−n0 1 ai + q n0 +1 · ≤ . 1−q 1−q i=0
a
Gilt im Gegensatz zu den Bedingungen in diesem Satz n+1 ≥ 1 oder an einem gewissen Index, dann ist die Reihe offensichtlich divergent. Beispiel 1: Die Reihe Σ
an+1 an
=
xn n!
ist f¨ ur jedes x ∈ IR konvergent, denn
x n+1
und
lim
x = 0. n+1
2 √ n
an ≥ 1 ab
IX Folgen reeller Zahlen
222
Beispiel 2: Die Reihe Σ(nxn ) ist f¨ ur jedes x mit 0 ≤ x < 1 konvergent, denn √ √ √ n nxn = x · n n und lim( n n) = 1.
1 f¨ ur α > 0 kann man mit Hilfe der α n α √ n = 1 und lim( n n) = 1. Kriterien in Satz 1 nicht feststellen, denn lim n+1
Das Konvergenzverhalten der Reihen Σ
Wir werden in X.8 zeigen, dass diese Reihe f¨ ur α > 1 konvergiert und f¨ ur α ≤ 1 divergiert (vgl. auch Aufgabe 4). Wir wissen dies bereits f¨ ur α = 1. F¨ ur α = 2 haben wir die Konvergenz in IX.6 gezeigt, f¨ ur α = 1, 5 zeigen wir sie im folgenden Beispiel, woraus sich dann die Konvergenz auch f¨ ur alle α ≥ 1, 5 ergibt. Beispiel 3: Es gilt f¨ ur alle n ∈ IN √ √ n n 1 i+1− i 1 1 √ −√ √√ = 1− √ = n+1 i+1 i i i+1 i=1 i=1 n 1 = √ √ i(i + 1)( i + i + 1) i=1 ≥ also
n
1 √ < 3. Da i=1 i i
1 √
n
n 1 1 1 √ −1 , √ > 2 (i + 1) · 2 i + 1 i i i=1 i=1
n n
eine Reihe mit positiven Gliedern ist, folgt aus
ihrer Beschr¨anktheit die Konvergenz.
n
Beispiel 4: Die Reihe ist konver2n gent, denn die Folge der Quotienten aufeinanderfolgender Glieder konvergiert ge1 gen . Argumentiert man wie in neben2 stehender Rechnung, dann ergibt sich der Wert s dieser Reihe zu 2. Eine solche Umordnung der Summanden ist hier erlaubt, weil alle Summanden positiv sind (vgl. den folgenden Satz 2).
s =
1 2 3 4 5 + + + + + ... 2 4 8 16 32
=
1 1 1 1 1 + + + + + ... 2 4 8 16 32 3 4 1 2 + + ... + + + 4 8 16 32
1 = 1+ s 2
Beispiel 5: Christian Huygens (1629–1695) stellte Leibniz die Aufgabe, die Summe“ ” 1 1 1 1 1 + + + + + ... 1 3 6 10 15 zu berechnen, wobei in den Nennern die Folge (Dn ) der Dreieckszahlen auftritt. Wegen Dn n n und lim = =1 Dn+1 n+2 n+2
IX.9 Unendliche Reihen
223
kann man die Konvergenz nicht mit dem√Quotientenkriterium beweisen. Auch das Wurzelkriterium versagt (wegen lim( n n) = 1). Man kann die Konvergenz und den Grenzwert aber sofort folgendermaßen erhalten: 1 2 2 2 = = − Dn n(n + 1) n n+1
Beispiel 6: Die leibnizsche Reihe Σ n (−1)i−1
σk =
=
i
i=1
⇒
⎧ ⎨ σk
lim Σ (−1)n−1 n
1 Dn
1 n
2 = 2. n+1
konvergiert: Es gilt
f¨ ur n = 2k,
⎩ σ + k
= lim 2 −
⎫ ⎬
f¨ ur n = 2k + 1 ⎭
mit
k
1 1 1 1 1 = + + + ... + . 2 12 30 (2k − 1)2k i=1 (2i − 1)2i
1 2 n
Aus der Konvergenz von Σ
Konvergenz von Σ
n−1
(−1) n
folgt die Konvergenz von (σn ) und daraus die
.
Eine Reihe Σ(an ) heißt absolut konvergent, wenn die Reihe Σ(|an |) konvergiert. Eine konvergente Reihe mit positiven Gliedern ist also auch absolut konvergent. Eine absolut konvergente Reihe ist stets auch konvergent (Aufgabe 2). Die Reihe in Beispiel 6 ist konvergent, aber nicht absolut konvergent. Eine Reihe, deren Glieder abwechselnd positiv und negativ sind, heißt alternierend. Satz 2 (Leibniz-Kriterium): Eine alternierende Reihe, bei welcher die Betr¨age der Glieder eine monotone Nullfolge bilden, konvergiert. Beweis: Es sei (an ) eine monotone Nullfolge mit positiven Gliedern und sn :=
n i=1
(−1)i−1 ai .
Dann ist (s2n ) monoton wachsend und nach oben beschr¨ankt (durch a1 ) und (s2n+1 ) monoton fallend und nach unten beschr¨ankt (durch a1 − a2 ). Diese beiden Folgen sind also konvergent. Wegen s2n+1 − s2n = a2n+1 haben sie den gleichen Grenzwert. 2 Hat eine alternierende Reihe, welche das Leibniz-Kriterium erf¨ ullt, den Reihenwert s, dann gilt in obigen Bezeichnungen |s−sn | ≤ an+1 , wie man leicht einsieht. Die Konvergenz der leibnizschen Reihe in Beispiel 6 folgt aus Satz 2. Dass man in Satz 2 nicht auf die Monotonie der Folge (an ) verzichten kann, wird durch das Beispiel in Aufgabe 3 belegt. In der leibnizschen Reihe (Beispiel 6) kann man durch Umordnung der Glieder jeden beliebigen Wert S als Reihenwert erhalten. Wir zeigen dies f¨ ur S > 0, die
IX Folgen reeller Zahlen
224
Argumentation ist aber analog f¨ ur negative Werte von S: Man summiere zun¨achst so viele positiveGlieder, bis deren Summe erstmals > S ist, was wegen der 1 Divergenz von Σ m¨oglich ist; dann addiere man so viele negative Glieder 2n + 1
hinzu, bis die Summe erstmals < S ist. Dann addiere man wieder positive Glieder usw. Auf diese Art kann man nat¨ urlich auch erreichen, dass die Reihe divergiert, also unbeschr¨ankt w¨achst oder f¨allt. Wie dieses Beispiel zeigt, ist die Umordnung der Glieder einer Reihe nicht immer erlaubt. Dies ist aber der Fall bei absolut konvergenten Reihen. Satz 3 (Umordnungssatz ): Die Reihe Σ(an ) sei absolut konvergent und der Reihenwert sei S; ferner sei γ eine bijektive (umkehrbar eindeutige) Abbildung von IN auf sich. Dann ist auch die Reihe Σ(aγ(n) ) konvergent und besitzt denselben Reihenwert S. Beweis: Da mit Σ(|an |) auch Σ(|aγ(n) |) nach oben beschr¨ankt ist, ergibt sich die Konvergenz aus dem Hauptsatz u ¨ber monotone Folgen. Es bleibt aber die Frage zu beantworten, ob beide Reihen den gleichen Wert besitzen, ob also die Differenz n n
der konvergenten Folgen (sn ) und (tn ) mit sn := ai und tn := aγ(i) eine i=1
i=1
Nullfolge ist: Zu jedem k ∈ IN existiert ein Nk ∈ IN mit γ(n) > k f¨ ur n > Nk . Dann ist |sn − tn | ≤ |ak+1 | + |ak+2 | + . . . + |an | f¨ ur n > Nk . Aus der absoluten Konvergenz von Σ(an ) folgt, dass (sn − tn ) eine Nullfolge ist. 2
Aufgaben 1. Man untersuche die folgenden Reihen mit Hilfe des Quotientenkriteriums, des Wurzelkriteriums oder des Vergleichskriteriums auf Konvergenz: √ 1 2n n! b) Σ c) Σ d) Σ(nα q n ) (α, q > 0) a) Σ √ n! nn n!
2. Man zeige, dass eine absolut konvergente Reihe auch konvergent ist. 3. Man zeige, dass die Reihe Σ((−1)n an+1 ) mit a2i =
1 2 und a2i−1 = nicht i i
konvergiert. Warum ist das Leibniz-Kriterium nicht anwendbar?
4. Man zeige
n
n
1 1 √ √ < 2r + 1 f¨ < 5 und allgemein ur r ∈ IN (vgl. 4 2r i i i=1 i=1 i i
Beispiel 4). Man beweise damit, dass
5. Man zeige, dass
∞ n=1
6. Zeige, dass lim
n2
1 nα
f¨ ur α > 1 konvergiert.
a 1 1 1 = 1 + + + ... + + an 2 3 a
n 1 1 √ √ n i=1 i
= 2.
f¨ ur a ∈ IN.
IX.10 Die eulersche Zahl
225
IX.10 Die eulersche Zahl
Die Reihe Σ
1 n!
konvergiert; ihr Wert liegt zwischen 2,5 und 3, denn 1+1+
Die Zahl
∞ ∞ 1 1 1 = 3. < 1
xn 1 = 1− 2 xn−1 n
n
·
n , n−1
und die bernoullische Ungleichung (Abschnitt IX.2) liefert 1 − insgesamt also
1 n2
n
> 1−n·
1 , n2
1 n xn > 1− · = 1. xn−1 n n−1 Die Folge (xn ) ist daher konvergent. Die Behauptung des Satzes folgt nun aus lim(xn ) ≥
k 1 i=0
i!
f¨ ur jedes k ∈ IN.
2
Satz 2: F¨ ur jedes a ∈ IN gilt
lim
1+
a n
n
= ea = lim Σ
an . n!
Beweis: Zun¨achst gilt
lim
1+
a n
n
= lim
1+
a an
an
= lim
1+
1 n
n a
.
IX Folgen reeller Zahlen
226
Umformung mit dem binomischen Lehrsatz wie zu Anfang n des Beweises von Satz 1 a ¨ . 2 liefert die Aquivalenz dieses Grenzwerts mit lim Σ n!
Die Aussage von Satz 2 gilt auch f¨ ur beliebige reelle Zahlen a, was wir aber erst sp¨ater beweisen k¨onnen. F¨ ur rationale Werte von a ist die Aussage von Satz 2 aber leicht einzusehen (Aufgabe 3).
Aufgaben 1. Man zeige, dass
1 1+ n
n
1 1+ n
,
n+1
eine Intervallschachtelung
f¨ ur die eulersche Zahl e ist.
2. Man bestimme die Grenzwerte der Folgen
1+
1 n
2n−1
,
1+
1 2n
6n
,
1−
1 n
n
,
1−
3. Man zeige, dass f¨ur alle rationalen Zahlen a gilt: lim 1 + na 4. Man zeige, dass lim
n
1 n2
n
.
= ea .
n 1 1 + 2 = e. Man zeige dann, dass n n √ n
1+ lim
2 + 3 + 9n2 3n − 1
= e.
Diese Darstellung von e stammt von Thomas Simpson (1710–1761). In X.7 wird gezeigt, wie Simpson dies gefunden hat. Die Glieder dieser Folgen n¨ahern sich dem√Wert e sehr schnell, das erste Glied hat schon den sehr guten Wert 1 + 3 ≈ 2,732. Zum Beweis obiger Grenzwertbeziehung zeige √ 3+9n2 man zun¨achst, dass 2+3n−1 zwischen 1 + n1 und 1 + n1 + n12 liegt.
IX.11 Unendliche Produkte Zu einer Zahlenfolge (an ) definieren wir die Produktfolge Π(an ) durch wobei
n i=1
n
i=1
ai ,
ai = a1 · a2 · . . . · an das Produkt der ersten n Glieder der Folge (an )
bedeutet. Wir betrachten dabei aber nur Folgen, deren Glieder alle von 0 verschieden sind, weil sonst die Frage nach der Konvergenz der Produktfolge trivial w¨are. Ferner wollen wir eine Produktfolge genau dann konvergent nennen, wenn 1 ihr Grenzwert existiert und von 0 verschieden ist. Mit Π(an ) ist dann auch Π konvergent. Im Fall der Konvergenz schreibt man f¨ ur den Grenzwert
∞ i=1
an
ai . Manch-
mal bezeichnet man auch die Produktfolge selbst mit diesem Symbol und nennt
IX.11 Unendliche Produkte
227
dies dann ein unendliches Produkt. Notwendig f¨ ur die Konvergenz von Π(an ) ist offensichtlich lim(an ) = 1. Daher schreibt man die Faktoren einer Produktfolge, f¨ ur deren Konvergenz man sich interessiert, meistens in der Form 1 + un .
1 Beispiel 1: Die Produktfolge Π 1 + n
der ersten n Faktoren ist n + 1.
Beispiel 2: Die Produktfolge Π 1 − n i=2
1−
1 i2
=
n (i − 1)(i + 1)
i2
i=2
ist nicht konvergent, denn das Produkt
1 n2
=
ist konvergent, denn
1 n+1 · , 2 n
also
∞
1−
i=2
1 i2
1 = . 2
Satz 1: Die Produktfolge Π(1 + un ) mit un ≥ 0 f¨ ur alle n ∈ IN ist genau dann konvergent, wenn die Summenfolge Σ(un ) konvergent ist. Beweis: Die Produktfolge ist monoton wachsend. Sie ist genau dann nach oben beschr¨ankt, wenn die genannte Summenfolge beschr¨ankt ist, denn wegen 1 + ui ≤ eui f¨ ur alle i ∈ IN ist (1 + u1 )(1 + u2 ) · . . . · (1 + un ) ≤ eu1 +u2 +...+un . 2 ur alle n ∈ IN ist genau Satz 2: Die Produktfolge Π(1 − un ) mit 0 ≤ un < 1 f¨ dann konvergent, wenn die Summenfolge Σ(un ) konvergent ist. 1 un mit vn = , so dass Satz 2 aus Satz 1 folgt.2 1 + vn 1 − un 1 1 Aus den S¨atzen 1 und 2 folgt, dass die Produktfolgen Π 1 + α und Π 1 − α n n
1 genau dann konvergieren, wenn konvergiert, also f¨ ur α > 1 (vgl. XI.3). nα 2n − 1 2n + 1 1 1− 2 = · konvergiert. Ihr GrenzBeispiel 3: Die Folge 4n 2n 2n 2 wert ist , wie wir in Abschnitt XI.4 sehen werden. Es gilt also π
Beweis: Es ist 1 − un =
π 2 2 4 4 6 6 8 8 = · · · · · · · · ... 2 1 3 3 5 5 7 7 9 (wallissches Produkt, nach John Wallis, 1616–1703). also p1 = 2, p2 = 3, p3 = 5, . . .. Beispiel 4: Es sei (pn ) die Folge der Primzahlen, F¨ ur x > 1 ist die Produktfolge n
1 1 − p−x n
konvergent. F¨ ur n ∈ IN gilt
n ∗ 1 1 1 1 = 1 + + + . . . = , −x x 2x x 1 − p p p k i i i i=1 i=1
wobei die Summe ∗ u ¨ber alle k ∈ IN zu erstrecken ist, in deren Primfaktorzerlegung nur die Primzahlen p1 , p2 , . . . , pn vorkommen. Der Grenz¨ ubergang n → ∞ liefert dann die Beziehung
IX Folgen reeller Zahlen
228 ∞
∞ 1 1 . −x = x 1 − p k i i=1 k=1
Beim Grenz¨ ubergang x → 1+ strebt der Ausdruck rechts wegen der Divergenz der harmonischen Reihe gegen unendlich. Folglich kann das Produkt links nicht nur aus endlich vielen Faktoren bestehen. Damit ist bewiesen, dass es unendlich viele Primzahlen gibt. (F¨ ur diese Tatsache existieren nat¨ urlich einfachere Beweise.) Dieser Zusammenhang der riemannschen Zetafunktion (nach Bernhard Riemann, 1826–1866) ζ : x →
∞ 1
mit der Folge der Primzahlen erkl¨art, warum diese x k=1 k
Funktion f¨ ur die Theorie der Primzahlverteilung von so großer Bedeutung ist.
Aufgaben 1. Man beweise, dass
∞
log 1 +
i=2
1 = log 2. i2 − 1
2. Man zeige, dass folgende Produktfolgen konvergieren:
n3 + 1 a) Π n3 + 2
n
1 b) Π 1 + 2
2n + 1 c) Π 1 + 2 (n − 1)(n + 1)2
n4 + n2 3. Man berechne lim Π 4 . n −1
IX.12 Abz¨ ahlen von unendlichen Mengen Wir werden in diesem Abschnitt sehen, dass man die Menge der rationalen Zahlen in einer Folge anordnen kann, dass man sie also nummerieren kann. Es wird sich zeigen, dass dies bei der Menge der reellen Zahlen nicht m¨oglich ist, dass es also in diesem Sinne sehr viel mehr“ irrationale als rationale Zahlen gibt. ” Eine Abz¨ahlung oder Nummerierung einer endlichen Menge M mit genau n Elementen bedeutet, dass jeder der Nummern oder Pl¨atze 1, 2, 3, . . . , n genau ein Element zugeordnet wird und dass verschiedene Elemente verschiedene Nummern erhalten. Die Menge M besitzt dann genau n! = 1 · 2 · 3 · . . . · n verschiedene Nummerierungen. Denn f¨ ur Platz 1 gibt es n M¨oglichkeiten, f¨ ur Platz 2 gibt es dann noch n − 1 M¨oglichkeiten, f¨ ur Platz 3 gibt es dann noch n − 2 M¨oglichkeiten usw., f¨ ur Platz n − 1 gibt es dann noch 2 M¨oglichkeiten, f¨ ur Platz n gibt es dann nur noch eine M¨oglichkeit. Eine Nummerierung oder Abz¨ahlung der n-elementigen Menge M ist eine bijektive (umkehrbare) Abbildung der Menge {1, 2, 3, . . . , n} auf die Menge M . Die
IX.12 Abz¨ahlen von unendlichen Mengen
229
Elemente von M tragen hierbei ihre Nummer als Index. Nun kann man fragen, ob f¨ ur eine vorgelegte unendliche Menge M eine bijektive Abbildung von IN auf M existiert. Dann k¨onnte man n¨amlich jedem Element von M eine Nummer erteilen, und die Elemente von M w¨aren eindeutig anhand ihrer Nummer zu identifizieren. Dies bedeutet, dass die Elemente von M eine Folge bilden. Beispiel: Wir betrachten die Menge IN2 , also die Menge aller Gitterpunkte im Koordinatensystem, deren Koordinaten nat¨ urliche Zahlen sind. Dann kann man gem¨aß Fig. 1 eine Nummerierung von IN2 vornehmen, IN2 ist also nummerierbar. 6 r r r r r r r Die Folge der Paare nat¨ urlicher Zahlen be7 ginnt bei dieser Nummerierung mit (1,1), r r r r r r r 6 (2,1), (2,2), (1,2), (1,3), (2,3), (3,3), (3,2), r r r r r r r 5 (3,1), (4,1), . . . r r r r r r r 4 r r r r r r r Mit der Nummerierung von IN2 in Fig. 1 3 r r r r r r r erh¨alt man auch eine Nummerierung der po2 r r r r r r r sitiven rationalen Zahlen, indem man der 1 a Bruchzahl mit ggT(a, b) = 1 das Zahlenb 1 2 3 4 5 6 7 ¨ paar (a, b) zuordnet. Ahnlich kann man auch Fig. 1: Nummerierung von IN2 Q nummerieren (Satz 1). Eine unendliche Menge M heißt abz¨ahlbar oder nummerierbar, wenn eine bijektive Abbildung von IN auf M existiert. Satz 1: Die Menge Q der rationalen Zahlen ist abz¨ahlbar.
r r r r r r r r
r r r r r r r r
r r r r r r r r
r4 r3 r r r r r r
6 r r r r r r r r r r r r r r r r
r r r r r r r r
r r r r r r r r
r r r r r 4r r r
r r r r r 5r r r
r r r r r6r r r
Beweis: Wir schreiben die rationalen Zahlen als Quotient zweier ganzer Zahlen, wobei der Nenner positiv ist und Z¨ahler und Nenner Fig. 2: Nummerierung von ZZ2 teilerfremd sind. Eine Nummerierung von Q erh¨alt man aus einer Nummerierung von ZZ2 , wie es in Fig. 2 angedeutet ist. 2 Mit P(M ) bezeichnet man allgemein die Menge aller Teilmengen der Menge M und nennt P(M ) die Potenzmenge von M . Insbesondere ist P(IN) die Menge aller Mengen, die aus nat¨ urlichen Zahlen bestehen, zuz¨ uglich der leeren Menge. Satz 2: Die Menge P(IN) ist nicht abz¨ahlbar. Beweis: Wir f¨ uhren die Annahme, die Menge aller Teilmengen von IN w¨are abz¨ahlbar, auf einen Widerspruch zur¨ uck: G¨abe es eine Nummerierung von P(IN), dann g¨abe es eine Folge A1 , A2 , A3 , . . . , in der jede Teilmenge von IN vorkommt. Wir betrachten nun die Teilmenge A von IN, die aus allen nat¨ urlichen Zahlen n mit n ∈ An besteht. Dann gilt A = An f¨ ur alle n ∈ IN. Dies widerspricht der Annahme, in der Folge A1 , A2 , A3 , . . . k¨ame jede Teilmenge von IN vor. 2
IX Folgen reeller Zahlen
230
Die Menge der endlichen Teilmengen von IN ist abz¨ahlbar (Aufgabe 3), also folgt aus Satz 2, dass schon die Menge der unendlichen Teilmengen von IN nicht abz¨ahlbar ist. Dies wollen wir im Beweis des folgenden Satzes verwenden. Satz 3: Die Menge IR der reellen Zahlen ist nicht abz¨ahlbar. Beweis: Wir k¨onnen uns auf den Nachweis beschr¨anken, dass die reellen Zahlen x mit 0 ≤ x < 1 eine nicht-abz¨ahlbare Menge bilden, weil dies dann erst recht f¨ ur IR gilt. Jede solche Zahl denken wir uns in ihrer 2-Bruchentwicklung geschrieben, also etwa x = (0, 01101010111101001 . . .)2 , wobei wir der Eindeutigkeit wegen abbrechende 2-Br¨ uche mit der Periode . . . 1 schreiben. Zu jeder solchen Zahl x bilden wir die (unendliche) Menge Ax ∈ P(IN), welche genau dann die Zahl n enth¨alt, wenn auf der n-ten Nachkommastelle von x die Ziffer 1 steht. Damit ist eine bijektive Abbildung von {x ∈ IR | 0 ≤ x < 1} auf die Menge der unendlichen Teilmengen von IN gegeben. Da diese Menge nach der vorangehenden Bemerkung nicht abz¨ahlbar ist, ist auch die Menge aller x ∈ IR mit 0 ≤ x < 1 nicht abz¨ahlbar. 2
Aufgaben 1. Auf wie viele Arten kann man 8 T¨urme so auf ein Schachbrett stellen, dass kein Turm einen anderen bedroht“, dass also in jeder Zeile“ und jeder ” ” Spalte“ genau ein Turm steht ? ” 2. Fig. 3 zeigt eine Nummerierung von Nenner 6 IN2 . Diese erzeugt eine Nummerierung r r r r r r r 7 @ der Menge aller positiven rationalen r@ r r r r r r 6 Zahlen. Wie heißt die Zahl mit der @@ 4 r @r @r r r r r 5 Nummer 20? Welche Nummer tr¨agt ? @ @ @ 5 r @r @r @r r r r 4 @ @ @ @ @ 3. Man zeige, dass die Menge der endlir @r @r @r @r r r 3 @ chen Teilmengen von IN abz¨ahlbar ist. r@ r@ r@ r@ r@ r r 2 @ @ @ @ @ @ Man beachte dabei, dass jede endliche r @r @ r @ r @ r @ r @ r 1 Teilmenge von IN eine gr¨oßte nat¨ urliche
Z¨ ahler
Zahl enth¨alt. ¨ 4. Man beweise die Uberabz¨ ahlbarkeit der
-
1 2 3 4 5 6 7 Fig. 3: Nummerierung von IN2
Menge der reellen Zahlen zwischen 0 und 1 anhand ihrer Dezimalbruchdarstellung (vgl. Satz 3).
5. Es sei {M1 , M2 , M3 , . . .} eine abz¨ahlbare Menge von Mengen, und jede dieser Mengen Mi sei abz¨ahlbar. Man zeige, dass dann auch die Vereinigungsmenge M1 ∪ M2 ∪ M3 ∪ . . . abz¨ahlbar ist.
X Differenzial- und Integralrechnung X.1 Stetige Funktionen Folgen reeller Zahlen sind definiert als Abbildungen von IN oder IN0 in IR. Nun wollen wir Abbildungen von IR in IR bzw. von Teilmengen von IR in IR betrachten, die man auch Abbildungen aus IR in IR nennt. Dabei treten v¨ollig neue Fragestel¨ lungen auf. Beispielsweise kann man fragen, wie sich eine geringf¨ ugige Anderung der abzubildenden Zahl auf die Bildzahl auswirkt. Abbildungen aus IR in IR nennt man Funktionen, genauer Funktionen einer reellen Variablen mit reellen Werten. Mit den Methoden der in diesem Kapitel zu behandelnden Differenzialund Integralrechnung werden wir dann in Kapitel XI erneut Folgen und Reihen untersuchen, wobei die Glieder dieser Folgen oder Reihen Funktionen sind. Es sei f eine Abbildung einer Teilmenge Df von IR in IR. Jedem x ∈ Df ist dann eine reelle Zahl zugeordnet, die wir allgemein mit f (x) bezeichnen. Man schreibt f : Df −→ IR
und
f : x → f (x) f¨ ur x ∈ Df .
Ist Df = IN, dann ist f eine Zahlenfolge. Wir richten unser Augenmerk jetzt aber auf solche Abbildungen f , bei denen Df eine beliebige Teilmenge von IR ist, z. B. aus einem Intervall aus IR besteht. Dann heißt f eine Funktion mit der Definitionsmenge Df . Die Menge aller Bildelemente von f , also die Menge {y ∈ IR | es gibt ein x ∈ Df mit y = f (x)}, nennen wir die Bildmenge von f und bezeichnen sie mit f (Df ) oder auch mit Bf . Man nennt f (x) den Funktionsterm von f , die Gleichung y = f (x) zwischen x ∈ Df und dem jeweils zugeordneten Wert y ∈ Bf heißt Funktionsgleichung. Die Funktionen mit einer gemeinsamen Definitionsmenge D bilden bez¨ uglich der Addition (f + g)(x) = f (x) + g(x) und der Vervielfachung (rf )(x) = rf (x) (r ∈ IR) offensichtlich einen Vektorraum. Funktionen auf der Definitionsmenge D kann man auch multiplizieren: (f g)(x) = (x)g(x). Ist f (x) = 0 f¨ ur alle x ∈ Df , f
dann ist die Kehrfunktion von f durch
1 f
(x) =
1 (x ∈ Df ) definiert. f (x)
Diese algebraischen Aussagen u ¨ber Funktionen verallgemeinern die entsprechenden Aussagen u ¨ber Folgen, da Zahlenfolgen ja Funktionen mit einer speziellen Definitionsmenge (n¨amlich INoder IN0 ) sind. Auch viele weitere bei Folgen n¨ utzliche Begriffsbildungen lassen sich in naheliegender Weise auf Funktionen u ¨bertragen, z. B. Beschr¨anktheit und Monotonie, so dass wir diese Begriffe hier nicht erneut formulieren m¨ ussen. Es seien nun f : Df −→ IR und g : Dg −→ IR zwei Funktionen mit Bg ⊆ Df . Dann kann man die Funktionen f und g hintereinanderschalten bzw. verketten.
X Differenzial- und Integralrechnung
232
Die Verkettung f nach g“ bezeichnet man mit f ◦ g. F¨ ur x ∈ Dg ist also ” (f ◦ g)(x) = f (g(x)). Das Verketten ist assoziativ: Sind f, g, h Funktionen mit Bh ⊆ Dg und Bg◦h ⊆ Df , dann gilt f¨ ur alle x ∈ Dh ((f ◦ g) ◦ h)(x) = (f ◦ g)(h(x)) = f (g(h(x))) = f ((g ◦ h)(x)) = (f ◦ (g ◦ h))(x). Das Verketten ist nicht kommutativ, wie schon das einfache Beispiel f (x) = x + 1, g(x) = x2 mit Df = Dg = IR zeigt: Es ist (f ◦ g)(x) = f (g(x)) = x2 + 1 und (g ◦ f )(x) = g(f (x)) = (x + 1)2 . ur alle x ∈ D die identische F¨ ur D ⊆ IR heißt die Funktion idD mit idD (x) = x f¨ Funktion auf D. Es gilt f ◦ idDf = idBf ◦ f = f f¨ ur jede Funktion f . Sind f, g zwei Funktionen mit Df = Bg und Dg = Bf sowie f ◦ g = idDg
und g ◦ f = idDf ,
dann heißen die Funktionen f und g invers zueinander und man schreibt f = g −1
bzw. g = f −1 .
Die Funktion f heißt dann auf Df umkehrbar, und f −1 heißt die Umkehrfunktion oder inverse Funktion zu f . (Man verwechsele die Umkehrfunktion f −1 nicht 1 mit der oben definierten Kehrfunktion .) Genau dann ist f umkehrbar, wenn f
f : Df −→ Bf bijektiv ist, wenn also zu jedem Element y ∈ Bf genau ein Element x ∈ Df existiert mit y = f (x). Beispiel 1: Die Quadratfunktion f : x → x2 ist nicht umkehrbar auf IR; es existiert n¨amlich f¨ ur a > 0 nicht genau eine Zahl b mit f (b) = a (also b2 = a); es existieren vielmehr stets zwei solche Zahlen. Schr¨ankt man die Quadratfunktion aber auf die Definitionsmenge IR+ 0 der nichtnegativen reellen Zahlen ein, dann ist sie umkehrbar (Fig. 1). Ihre Umkehrfunktion ist die Quadratwurzelfunktion √ 3 f −1 : x → x mit der Definitionsmenge IR+ 0 . Die Funktion x → x ist√ebenfalls + auf IR0 umkehrbar; ihre Umkehrfunktion ist die Wurzelfunktion x → 3 x. Beispiel 2: Die auf IR \ {1} definierte Funktion x →
1 mit der Bildmenge 1−x
x−1 . Den Funktionsx 1 vertausche term der Umkehrfunktion gewinnt man folgendermaßen: In y = 1−x 1 x−1 man x und y und l¨ose die Gleichung nach y auf: x = ⇒y= . 1−y x
IR\{0} ist umkehrbar (Fig. 2); ihre Umkehrfunktion ist x →
Beispiel 3: Die Funktion f : x →
1 ist auf IR+ 0 umkehrbar (Fig. 3); den 1 + x2
Term der Umkehrfunktion findet man durch Aufl¨osen von x = f (y) nach y:
f −1 : x →
1−x x
mit Df −1 = Bf =]0; 1].
X.1 Stetige Funktionen
233
Beispiel 4: Die Umkehrfunktion der auf ihrer Definitionsmenge IR umkehrbaren Exponentialfunktion x → 2x ist die Logarithmusfunktion x → log2 x (Fig. 4), welche auf IR+ definiert ist. .. ... ...... . ... y = x2 .. ....... . .... .. ..... .. .... ... ......... .. ........ . 1... . . . . . √ .............. . ................ y = x . . . .. .. . .. ..... ... .. ................ ............. .. ......... . x . . 1 .. y6
Fig. 1
. y 6 ... . .... .. 1−x .... . . ..y = . x ...... .. .... .. .... . . . . . . . . . 1 ................ .. ..... ......... .... 1 .. . ....................y = 1 + x2 . . . . .. ................. .... .................. .... ... . . . . ... . . . . . . . . . x 1 .... Fig. 3
..y .. ...... ... . x − 1 .. 6.... .... . . . y= .. ... .... x .. .. .... ........ . . . .. ........................... . .. .... ..................................................................1........................................................................ ... .... ..... . ...x .... ......1 ... ... .... .... . . . . . . . . . . . . . . .. . 1 .... .. .... ... y = .... . . . . . 1 − x . . . . . . .. . .. ... ... .. Fig. 2
... y = 2x .... .... .... . . ... . . .... ... ....... y = log2 x . . ... ... ..... 1.......... ....... .. .... .... .... . . . . . . . . . . ............... ........ .. ... ... . x .... ...1 . . . . ... . . . . . . .... .. y6
Fig. 4
In Fig. 1 bis 4 sind die oben betrachteten Funktionen durch ihren Graph veranschaulicht. Dies ist die Darstellung der Punktmenge {(x, y) | x ∈ Df , y = f (x)} in einem kartesischen Koordinatensystem. In der Regel kann man nur einen Ausschnitt aus diesem Graph zeichnen. Den Graph nennt man auch ein Schaubild der Funktion. Die Graphen von f und f −1 liegen spiegelbildlich bez¨ uglich der Winkelhalbierenden des ersten Quadranten des Koordinatensystems. Satz 1: Eine auf einem Intervall streng monotone Funktion ist dort umkehrbar. Beweis: Die Funktion f sei auf dem Intervall Df = [a; b] streng monoton wachsend. Dann sind verschiedenen Werten aus [a; b] auch verschiedene Funktionswerte zugeordnet, denn aus a ≤ x1 < x2 ≤ b folgt f (a) ≤ f (x1 ) < f (x2 ) ≤ f (b). Die Funktion f : Df −→ Bf ist also bijektiv. (F¨ ur eine streng monoton fallende Funktion verl¨auft der Beweis analog.) 2 Man erkennt ebenso einfach, dass die Umkehrfunktion einer streng monoton wachsenden (fallenden) Funktion wieder streng monoton wachsend (fallend) ist.
X Differenzial- und Integralrechnung
234
Beispiel 5: Auf dem Einheitskreis (Kreis um den Ursprung des Koordinatensystems mit dem Radius 1) sei t die vom Punkt (1,0) aus gemessene Bogenl¨ange bis zu einem Punkt P des Kreises (Fig. 5). Dann bezeichnet man die Koordinaten des Punktes P mit cos t ( Kosinus t“) und sin t ( Sinus t“). Es ist also ” ” y
P = (cos t, sin t).
6
Zun¨achst liegt dabei t zwischen 0 und 2π. Wir erweitern die Definition von sin und cos auf alle reellen Zahlen durch die Festsetzung sin(t + z · 2π) = sin t cos(t + z · 2π) = cos t (z ∈ ZZ). Dann sind sin und cos auf IR definierte Funktionen mit der Periode 2π (Fig. 6, 7).
P...u.............................................. ...... t ......... ..... ...... .... .... ..... .... ... ... sin t ....... ..... ... ..... ... ... ... x ..... .. .................................... 1 cos t Fig. 5: Sinus und Kosinus
y
y
6
6
1 ... y = sin x.....................s..................... ... . ..... ... ....... . . . . . .. .... . . . .... sin t .... . . . .. ... x .... ....s . . . . t .... Fig. 6: Sinusfunktion
F¨ ur alle x ∈ IR gilt sin x +
.....1......s.......................y = cos x ...... ...... ...... ..... ..... ..... ..... ..s... . -x ..... -.... t ..... ...cos t ..... .. ...... ... Fig. 7: Kosinusfunktion
π 2
= cos x und cos x + π π
π 2
= − sin x.
Beschr¨ankt man die Sinusfunktion auf das Intervall − ; , dann ist sie dort um2 2 kehrbar, weil sie dort streng monoton w¨achst; ihre Umkehrfunktion ist die Arkussinusfunktion arcsin, welche auf [−1; 1] definiert ist (Fig. 8). Die Kosinusfunktion ist auf [0; π] streng monoton fallend und daher umkehrbar. Ihre Umkehrfunktion ist die auf [−1; 1] definierte Arkuskosinusfunktion arccos (Fig. 9). Die Tangensfunktion
sin x 1 π | z ∈ ZZ mit Dtan = IR \ z + cos x 2 π π ist auf dem offenen Intervall − ; streng monoton wachsend und daher um2 2 kehrbar (Fig. 10). Ihre Umkehrfunktion auf diesem offenen Intervall ist die auf IR definierte Arkustangensfunktion arctan (Fig. 11). tan : x →
X.1 Stetige Funktionen
235
y6 ... π2
y 6 ... π .. ... y = arccos x ... ... .... ..... ...... .. π........ . 2 ....... .... ... ... ... ... x .. .−1 1
.. y = arcsin x ... . ... . . ..... ....... . . . . . -x . . −1 .......... 1 . ... .. . .. .. ...− π2 Fig. 8: Arkussinus
.. . .. .. . .. .. .. .. . .. . ... .. ....... . .. ....... ....... − π2 . .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. ..
Fig. 9: Arkuskosinus
y
. .. y = tan x .... . .. . . 1.. .... . .... ..... . . . . . π ..... 2 .... .. . . . . .... −1 .. ... .. 6
.. . .. .. .. ... .. .. . .. .. .. .. ..
y
.. .. .. .. .. .. .... ..... . . . . . . ... x .... . .. .. ... . .. .. .. ... . ... .. . ..
π 2
6
..... .... .... .... .... . ..... .......... y = arctan x ........... ..... .... . . -x . . −1 ....... 1 ... ....... . . . . . . . . ....... .. ..... ..... ..... ..... ..... − π2
Fig. 10: Tangens
Fig. 11: Arkustangens
Definition 1: Eine Funktion f sei auf dem halboffenen Intervall [a; b[ definiert, und f¨ ur jede Folge (xn ) mit Gliedern aus diesem Intervall und lim(xn ) = b sei lim(f (xn )) = r. Dann schreibt man lim f (x) = r
x→b−
und nennt dies den linksseitigen Grenzwert von f an der Stelle b. Analog definiert man den rechtsseitigen Grenzwert lim+ f (x) an der Stelle b, wenn f auf einem x→b
Intervall ]b; c] definiert ist. Ist die Funktion f auf [a; c] \ {b} definiert, wobei b ∈]a; c[, und gilt lim(f (xn )) = r f¨ ur jede Folge (xn ) aus [a; c] \ {b} mit dem Grenzwert b, dann spricht man vom Grenzwert von f an der Stelle b und schreibt lim f (x) = r.
x→b
(Man beachte, dass dabei b nicht zur Definitionsmenge geh¨oren muss, aber Grenzwert einer Folge aus dieser sein muss.) Existiert der Grenzwert von f an der Stelle b, dann gilt nat¨ urlich lim− f (x) = lim f (x) = lim+ f (x). x→b
x→b
x→b
X Differenzial- und Integralrechnung
236
Beispiel 6: Es gilt lim+ xx = 1 : Ist (xn ) eine Folge positiver Zahlen mit dem x→0
Grenzwert 0, dann gibt es zu jedem n ∈ IN ein k ∈ IN mit
k k+1
1
k
·
1
1 k
k
=
1 k+1
1
k
< xxnn
0 die Funktion x → xα auf IR+ 0 streng monoton w¨achst, und dass √ f¨ ur 0 < β < 1 die Funktion x → β x auf IR+ 0 streng monoton f¨allt.) Wegen lim( n n) = 1 (vgl. Beispiel 10 in IX.4) folgt die Behauptung. Beispiel 7: Es gilt lim t→0
π sin t = 1. Denn an Fig. 12 erkennt man f¨ ur 0 < t < t 2
cos t sin t < t
0 ist stetig auf IR, wie man wegen bx = bx0 · bx−x0 sofort aus lim bh = 1 ersieht. Die Exponentialfunktionen sind h→0 also stetig auf IR. Damit sind auch die Logarithmusfunktionen stetig auf ihrer Definitionsmenge IR+ . Wegen xα = eα ln x ergibt sich damit auch die Stetigkeit aller Potenzfunktionen x → xα (α ∈ IR) auf IR+ . Die Funktionen, die aus den rationalen Funktionen, der Sinusfunktion, der Exponentialfunktion und ihren Umkehrfunktionen durch Addition, Multiplikation, Division und Verkettung (evtl. mit geeigneter Einschr¨ankung der Definitionsbereiche) gewonnen werden k¨onnen, nennen wir elementare Funktionen. Die obigen Beispiele besagen also, dass die elementaren Funktionen auf ihren Definitionsmengen stetig sind. (Der Begriff der elementaren Funktion“ ist hier nur sehr ” vage erkl¨art, eine pr¨azise Definition ist aber sehr kompliziert.)
X.1 Stetige Funktionen
239
Die Stetigkeit einer Funktion an einer Stelle x0 besagt, dass sich bei einer ge¨ ringf¨ ugigen Anderung des Arguments x auch der Funktionswert f (x) nur geringf¨ ugig a¨ndert: |x − x0 | klein“ =⇒ |f (x) − f (x0 )| klein“. Man kann also ” ” |f (x) − f (x0 )| beliebig klein machen, wenn man nur |x − x0 | hinreichend klein w¨ahlt. Zu jedem ε > 0 kann man also ein δ > 0 finden, so dass gilt: |x − x0 | < δ =⇒ |f (x) − f (x0 )| < ε. Dabei h¨angt die Wahl von δ nat¨ urlich außer von ε noch von f und x0 ab. √ ur ein ε > 0 Beispiel 18: Die Funktion x → x ist an der Stelle 7 stetig. Es gilt f¨ √ √ |x − 7| √ < ε, | x − 7| = √ x+ 7 √ √ wenn |x − 7| < ε · ( x + 7) ist. wir die Funktion nur im Intervall √ Betrachten √ [6; 8], dann k¨onnen wir δ = ε · ( 8 + 7) w¨ahlen. Stetige Funktionen haben zwei wichtige Eigenschaften, die wir in den beiden nun folgenden S¨atzen behandeln wollen. Satz 4 (Zwischenwertsatz ): Die Funktion f sei auf dem Intervall I stetig und nehme dort die Werte α und β an. Dann nimmt f auf dem Intervall I auch jedem Wert γ zwischen α und β an. Beweis: Es sei α = f (a) und β = f (b). Es ist keine Beschr¨ankung der Allgemeinheit, a < b und α < β anzunehmen. Wir betrachten die Intervallschachtelung mit [a0 , b0 ] = [a; b] und ⎧ an + bn a +b ⎪ ⎪ ⎪ , falls f n n ≥ γ, ⎨ an ; 2 2 [an+1 ; bn+1 ] = ⎪ a +b ⎪ an + bn ⎪ ; bn , falls f n n < γ. ⎩ 2 2
f¨ ur n ∈ IN0 . Diese Intervallschachtelung besitzt einen Kern c ∈ [a, b]. Es gilt wegen der Stetigkeit von f an der Stelle c lim(f (an )) = f (lim(an )) = f (c) und
lim(f (bn )) = f (lim(bn )) = f (c),
wegen f (an ) ≤ γ ≤ f (bn ) f¨ ur alle n ∈ IN folgt also f (c) = γ.
2
Beispiel 19: Die Gleichung x4 + 2x3 − x2 + 7x = 19 besitzt mindestens eine L¨osung zwischen 1 und 2, denn f¨ ur f (x) = x4 + 2x3 − x2 + 7x gilt f (1) = 9 < 19 < 42 = f (2). Satz 5 (Satz vom Minimum und Maximum): Ist f auf dem abgeschlossenen Intervall [a; b] stetig, dann existieren u, v ∈ [a; b] mit f (u) ≤ f (x) ≤ f (v) f¨ ur alle x ∈ [a; b].
X Differenzial- und Integralrechnung
240
Beweis: Wir betrachten eine Intervallschachtelung mit [a0 ; b0 ] = [a; b] und ⎧ an + bn ⎪ ⎪ ⎪ a ; , falls ein x ∈ n ⎪ ⎪ 2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ f (x) ≤ f (ξ) ⎨ [an+1 ; bn+1 ] = ⎪ an + bn ⎪ ⎪ ; bn , falls ein x ∈ ⎪ ⎪ ⎪ 2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ f (x) ≤ f (ξ) ⎩
an ;
an + bn 2
existiert mit
f¨ ur alle ξ ∈
an + bn ; bn 2
an + bn ; bn , 2
existiert mit
f¨ ur alle ξ ∈ an ;
an + bn 2
f¨ ur n ∈ IN0 . (Sind dabei beide Bedingungen erf¨ ullt, so entscheide man sich willk¨ urlich f¨ ur eines der Intervalle. Mindestens eine der Bedingungen ist erf¨ ullt, weil abgeschlossene Intervalle vorliegen.) Ist u der Kern dieser Intervallschachtelung, dann gilt aufgrund der Stetigkeit von f (vgl. Beweis von Satz 4) f (u) ≤ f (ξ) f¨ ur alle ξ ∈ [a; b]. Damit ist bewiesen, dass f auf [a; b] ein Minimum annimmt; ebenso zeigt man, dass f auf [a; b] ein Maximum annimmt. 2 Definition 2: Es sei f definiert auf dem offenen Intervall ]a; b[ und a eine Definitionsl¨ ucke von f . Wenn f (x) unbeschr¨ankt w¨achst, falls x sich der Stelle a von rechts n¨ahert, wenn also zu jedem M ∈ IR ein ε > 0 existiert, so dass f (x) > M f¨ ur alle x mit 0 < x − a < ε, dann schreiben wir lim+ f (x) = +∞ und nennen x→a
die Gerade mit der Gleichung x = a eine (senkrechte) Asymptote von f . Analog ist lim+ f (x) = −∞, lim− f (x) = +∞ und lim+ f (x) = −∞ zu verstehen. x→a
x→b
x→b
Beispiel 20: Die rationale Funktion f mit f (x) =
1 hat Definiti(x − 1)(x − 2)
onsl¨ ucken an den Stellen 1 und 2. Es gilt lim f (x) = +∞,
x→1−
lim f (x) = −∞,
x→1+
lim f (x) = −∞,
x→2−
lim f (x) = +∞.
x→2+
Definition 3: Es sei f definiert auf dem unbeschr¨ankten Intervall ]a; +∞[. Wenn lim f (x) existiert und den Wert c hat, dann nennen wir die Gerade mit der
x→+∞
Gleichung y = c eine (waagerechte) Asymptote von f f¨ ur x → +∞. Analog ist eine waagerechte Asymptote f¨ ur x → −∞ erkl¨art. 2x2 + 1
Beispiel 21: Die Funktion f mit f (x) = 2 hat sowohl f¨ ur x → +∞ als x +7 auch f¨ ur x → −∞ die Asymptote mit der Gleichung y = 2. Definition 4: Es sei f definiert auf dem unbeschr¨ankten Intervall ]a; +∞[. Existieren u, v ∈ IR mit lim (f (x) − (ux + v)) = 0, dann nenen wir die Gerade mit x→+∞
der Gleichung y = ux + v eine (schr¨age) Asymptote von f f¨ ur x → +∞. Analog ist eine schr¨age Asymptote f¨ ur x → −∞ erkl¨art.
X.1 Stetige Funktionen
241
Beispiel 22: Die Funktion f mit f (x) =
2x3 + x2 + 3x + 1 hat sowohl f¨ ur x → +∞ x2 + 1
als auch f¨ ur x → −∞ die Asymptote mit der Gleichung y = 2x + 1. Dies erkennt man an der Termumformung
2x3 + x2 + 3x + 1 x = 2x + 1 + 2 . x2 + 1 x +1
Definition 5: Sind f und g auf dem unbeschr¨ankten Intervall ]a; +∞[ definiert und gilt lim (f (x) − g(x)) = 0, dann sagt man, f und g haben f¨ ur x → +∞ das x→+∞ gleiche asymptotische Verhalten bzw. f ist asymptotisch gleich g bzw. umgekehrt. Beispiel 23: Die Funktion f mit f (x) =
x4 + 4x3 + 3x2 verh¨alt sich asymptotisch x+1
f¨ ur x → +∞ wie die Funktion g mit g(x) = x2 + 3x2 . Dies erkennt man an der Termumformung
x4 + 4x3 + 3x2 1 = x3 + 3x2 + . x+1 x+1
Aufgaben 1. a) Die Funktion f sei auf einem Intervall I definiert. Man beweise: Existiert eine Konstante L mit |f (x1 ) − f (x2 )| ≤ L|x1 − x2 | f¨ ur alle x1 , x2 ∈ I, dann ist f auf I stetig. b) Man bestimme eine m¨oglichst kleine Konstante gem¨aß a): 1 , I = [3; 4] x(x − 2) √ (3) f (x) = x x, I = [1; 2] (1) f (x) =
x2 + 1 , I = [−1; 1] x2 − 2 √ 3 (4) f (x) = x2 , I = [1; 2]
(2) f (x) =
2. Man zeige, dass die Funktion f : x → x5 +4x4 −7x3 −9x2 −5x+7 mindestens eine Nullstelle besitzt. Zeige, dass eine solche zwischen 0 und 1 liegt.
3. Man bestimme die Unstetigkeitsstellen der Funktion f auf dem Intervall I: 1 (1) f (x) = x + 1 , I =]0; 1[ x
(2) f (x) =
5[x2 ] , I = IR+ [x] + 1
√
4. Man bestimme δ > 0 so, dass | x − 1 − 2| < 10−6 f¨ur alle x mit |x − 5| < δ.
5. Die Funktion f sei auf IR definiert durch f (x) =
x, falls x ∈ Q, x2 , falls x ∈ Q.
An welchen Stellen ist diese Funktion stetig?
6. Man bestimme die Asymptoten von f : x → tion, die sich asymptotisch wie f verh¨alt.
x4 + 1 und eine Polynomfunkx2 − 1
X Differenzial- und Integralrechnung
242
X.2 Die Ableitung einer Funktion Es sei — wie man in Anwendungsbereichen der Mathematik oft sagt — ein funktionaler Zusammenhang y = f (x) zwischen zwei Gr¨oßen gegeben, f¨ ur deren Werte die Variablen x, y stehen. Ist die Funktion f stetig, so kann man sagen, dass klei¨ ¨ ne Anderungen von x auch nur kleine Anderungen von y bewirken, dass sich y ¨ also nicht sprunghaft“ ¨andern kann. Nun wollen wir die relative Anderung von ” y bez¨ uglich x an einer Stelle x0 des Definitionsbereichs von f n¨aher untersuchen, also den Quotient y6 y = f (x) f (x) − f (x0 ) f¨ ur x = x0 . .... x − x0 ... . . ... Dieser Differenzenquotient hat, als ... Tangente . . y .. Funktion von x betrachtet, an der Stel ... . . Sekante . . le x0 eine Definitionsl¨ ucke. Wenn nun . . . . .... ................... der Grenzwert ..... f (x) − f (x0 ) ..... . . . . . ........ ......tr. .. y0 f (x) − f (x0 ) ...... ...... x − x0 lim =A x→x0 x − x0 existiert, dann k¨onnen wir sagen, dass in einer hinreichend kleinen Umgebung von x0 die N¨aherung f (x) − f (x0 ) ≈ x A · (x − x0 ) bzw. x0 x f (x) ≈ f (x0 ) + A · (x − x0 ) Fig. 1: Definition der Ableitung hinreichend gut ist. Unter einer Umgebung von x0 verstehen wir dabei ein Intervall mit dem Mittelpunkt x0 ; ist die L¨ange diese Intervalls hinreichend klein“, dann nennen wir ” die Umgebung hinreichend klein“. Am Graph der Funktion f kann man den f (x) −”f (x0 ) Quotient als Steigung der Sekante durch die Punkte (x, f (x)) und x − x0
(x0 , f (x0 )) deuten. Wandert der Punkt (x, f (x)) auf den Punkt (x0 , f (x0 )) zu, dann wird diese Sekante zur Tangente an den Graph im Punkt (x0 , f (x0 )). Die Zahl f (x0 ) ist also die Tangentensteigung an der Stelle x0 (vgl. Fig. 1). Definition 1: Die Funktion f sei in dem offenen Intervall ]a; b[ definiert und es sei x0 ∈ ]a; b[. Existiert der Grenzwert f (x) − f (x0 ) , x − x0 dann nennt man ihn die Ableitung von f an der Stelle x0 und bezeichnet ihn mit f (x0 ). Man nennt dann die Funktion differenzierbar an der Stelle x0 . lim
x→x0
Ist f an der Stelle x0 differenzierbar, so bedeutet dies, dass der Graph von f im Punkt (x0 , f (x0 )) eine Tangente besitzt und dass diese nicht parallel zur y-Achse ist (Steigung unendlich“). ”
X.2 Die Ableitung einer Funktion
243
Existiert nur der rechtsseitige oder nur der linksseitige Grenzwert des Differenzenquotienten an einer Stelle x0 , dann nennt man diese einseitigen Grenzwerte die entsprechenden einseitigen Ableitungen der Funktion an dieser Stelle und spricht von einseitiger Differenzierbarkeit. Ist f an der Stelle x0 differenzierbar, dann ist f dort auch stetig, denn der Grenzf (x) − f (x0 ) f¨ ur x → x0 kann nur existieren, wenn x→x lim f (x) = f (x0 ) wert von x − x0
0
gilt. Die Umkehrung ist falsch: Die Betragsfunktion x → |x| ist an der Stelle 0 stetig, aber nicht differenzierbar: lim+
x→0
|x| − |0| x = lim+ = +1 und x→0 x x−0
lim−
x→0
|x| − |0| −x = lim− = −1. x→0 x−0 x
Definition 2: Das Berechnen der Ableitung oder der Ableitungsfunktion nennt man auch Differenzieren oder Differenziation der Funktion. Man nennt die auf Df \ {x0 } definierte Funktion x →
f (x) − f (x0 ) x − x0
den Differenzenquotient von f an der Stelle x0 und schreibt daf¨ ur x →
Δf (x0 , x). Δx
Die Ableitung f (x0 ) von f an der Stelle x0 — also den Grenzwert des Differenzenquotienten von f an der Stelle x0 — nennt man auch den Differenzialquotient df von f an der Stelle x0 und schreibt f¨ ur diese Zahl auch (x0 ). dx
df
Die lineare Funktion x → (x0 ) · (x − x0 ) nennt man das Differenzial von f an dx der Stelle x0 . Ist die Funktion f an jeder Stelle ihrer Definitionsmenge Df differenzierbar, dann nennt man die Funktion auf Df differenzierbar. Die Funktion x → f (x) nennt man die Ableitungsfunktion von f . Ist die Ableitungsfunktion von f stetig, dann heißt f stetig differenzierbar (an einer Stelle bzw. auf der Definitionsmenge). Beispiel 1: Jede konstante Funktion ist auf IR differenzierbar, ihre Ableitungsfunktion ist die Nullfunktion. Beispiel 2: Die identische Funktion x → x ist u ¨berall auf IR differenzierbar; ihre Ableitungsfunktion ist die konstante Funktion mit dem Wert 1. Beispiel 3: Wir wollen die Ableitung der Sinusfunktion an der Stelle x0 ∈ IR berechnen. Zu diesem Zweck setzen wir x = x0 + h und betrachten in dem Differenzenquotient sin(x0 + h) − sin x0 h den Grenz¨ ubergang h → 0. Wegen sin(x0 + h) = sin x0 cos h + cos x0 sin h l¨asst cos h − 1 sin h + cos x0 · . Es gilt sich der Differenzenquotient umformen zu sin x0 · h
h
X Differenzial- und Integralrechnung
244 1 − cos h
sin h
= 0 und lim = 1 (vgl. X.1). Daher ergibt sich als Ableitung von lim h h→0 h sin an der Stelle x0 der Wert cos x0 . Die Ableitungsfunktion der Sinusfunktion ist somit die Kosinusfunktion. h→0
Beispiel 4: Es soll die Ableitungsfunktion der Exponentialfunktion x → ex bestimmt werden, wobei e die eulersche Zahl sein soll. Dabei wollen wir uns hier mit einer heuristischen Argumentation begn¨ ugen, ein exakter Beweis soll in Aufgabe 9 gef¨ uhrt werden (vgl. auch X.5). Es ist ex+h − ex eh − 1 = ex · . h h
n 1 1 mit einem hinreichend großen n und setzen h = , n n −1 eh − 1 = 1. Dies zeigt, dass lim = 1 ist. Also ist h h→0
Ersetzen wir e durch 1 + dann ist
1+ eh − 1 ≈ h
1 n 1 n
(ex ) = ex , die Exponentialfunktion ist also gleich ihrer Ableitungsfunktion.
Aufgrund der Ableitungsregeln, die wir nun behandeln, k¨onnen wir die meisten Funktionen, die uns in der Analysis begegnen, mit Hilfe der vier in diesen Beispielen behandelten Funktionen differenzieren. Zur Vereinfachung der Formeln sprechen wir in Satz 1 einfach von der Stelle x“, im Beweis werden wir die ins ” Auge gefasste Stelle aber wieder x0 nennen. Satz 1: Die Funktionen f, g seien an der Stelle x ∈ ]a; b[ ⊆ Df ∩Dg differenzierbar. Dann gelten die folgenden Regeln: Summenregel : f + g ist an der Stelle x differenzierbar, und es ist (f + g) (x) = f (x) + g (x). Produktregel : f · g ist an der Stelle x differenzierbar, und es ist (f · g) (x) = f (x) · g(x) + f (x) · g (x). Kehrwertregel : Ist f (x) = 0, dann ist und es ist
1 ist an der Stelle x differenzierbar f
1 f
(x) = −
f (x) . (f (x))2
Kettenregel : Ist f an der Stelle g(x) ∈ ]c; d[ ⊆ Df differenzierbar, dann ist f ◦ g an der Stelle x differenzierbar und (f ◦ g) (x) = f (g(x)) · g (x). Umkehrregel : Ist f auf ]a; b[ ⊆ Df umkehrbar und f (x) = 0, dann ist f −1 ist an der Stelle f (x) differenzierbar und es ist 1 (f −1 ) (f (x)) = . f (x)
X.2 Die Ableitung einer Funktion
245
Beweis: Die Summenregel folgt aus der entsprechenden Grenzwertregel: lim
x→x0
(f (x) + g(x)) − (f (x0 ) + g(x0 )) f (x) − f (x0 ) g(x) − g(x0 ) = x→x lim + x→x lim . 0 0 x − x0 x − x0 x − x0
Zum Beweis der Produktregel macht man den Ansatz (f (x) − f (x0 ))g(x0 ) + (g(x) − g(x0 )f (x)) f (x)g(x) − f (x0 )g(x0 ) = x − x0 x − x0 f (x) − f (x0 ) g(x) − g(x0 ) = g(x0 ) + f (x), x − x0 x − x0 der durch die Skizze in Fig. 2 nahegelegt wird. Der Grenz¨ ubergang x → x0 liefert aufgrund der Grenzwertregeln die Produktregel. Die Kehrwertregel ergibt sich aus der Umformung 1 1 − f (x) − f (x0 ) f (x) f (x0 ) =− . x − x0 f (x)f (x0 )(x − x0 )
-
g(x)
6 6
f (x)
g(x0 )
-
f (x0 )
? ?
Fig. 2: Herleitung der Produktregel
Dabei muss man beachten, dass eine an der Stelle x0 stetige Funktion mit f (x0 ) = 0 in einem geeigneten offenen Intervall um x0 nicht den Wert 0 annimmt. Der Beweis der Kettenregel beruht auf der Umformung f (g(x)) − f (g(x0 )) f (g(x)) − f (g(x0 )) g(x) − g(x0 ) · = . x − x0 g(x) − g(x0 ) x − x0 Man muss dabei aber voraussetzen, dass ein offenes Intervall um x0 existiert, in welchem g(x) = g(x0 ) gilt; unter dieser Voraussetzung ergibt sich die Kettenregel sofort durch den Grenz¨ ubergang x → x0 . Ist diese Voraussetzung aber nicht erf¨ ullt, dann ist sowohl g (x0 ) = 0 als auch f (g(x0 )) = 0, so dass auch in diesem Fall die Kettenregel gilt. Die Umkehrregel ergibt sich schließlich durch Grenz¨ ubergang in der Formel f −1 (f (x)) − f −1 (f (x0 )) x − x0 1 = = . f (x) − f (x0 ) f (x) − f (x0 ) f (x) − f (x0 ) x − x0 Aus den Regeln in Satz 1 ergeben sich weitere n¨ utzliche Ableitungsregeln: Die Faktorregel (cf ) (x) = cf (x) f¨ ur c ∈ IR folgt aus der Produktregel, ist aber auch unmittelbar einsichtig. Die Quotientenregel
f g
(x) =
f (x)g(x) − f (x)g (x) (g(x))2
X Differenzial- und Integralrechnung
246
folgt aus der Produktregel und der Kehrwertregel. In der folgenden Tabelle sind alle Regeln nochmals in Kurzform zusammengestellt.
(f + g) = f + g (f g) = f g + f g (cf ) = cf
1 f
f g
= −
f f2
f g − f g = g2
(f ◦ g) = (f ◦ g) · g (f −1 ) =
f
1 ◦ f −1
Beispiel 5 (Differenziation der rationalen Funktionen ): Die Potenzfunktionen x → xn mit n ∈ IN, n = 1 lassen sich mit Hilfe der Produktregel differenzieren: Aus (xn ) = (xn−1 · x) = (xn−1 ) · x + xn−1 · 1 ergibt sich mit vollst¨andiger Induktion (xn ) = n · xn−1 . Aufgrund der Summenregel und der Faktorregel l¨asst sich nun jede ganzrationale Funktion (Polynomfunktion) differenzieren: (an xn + . . . + ai xi + . . . a1 x + a0 ) = nan xn−1 + . . . + iai xi−1 + . . . + a1 . Die Quotientenregel erlaubt dann die Differenziation jeder rationalen Funktion, also jeder Funktion, die Quotient zweier ganzrationaler Funktionen ist. Die spe1 zielle rationale Funktion x → n mit n ∈ IN differenziert man mit Hilfe der x Kehrwertregel: nxn−1 n 1 = − n 2 = − n+1 . n x (x ) x Es gilt also (xz ) = z · xz−1
f¨ ur alle z ∈ ZZ.
Beispiel 6 (Differenziation der allgemeinen Potenzfunktion ): Die in Beispiel 5 gewonnene Regel f¨ ur die Differenziation der Potenzfunktionen mit ganzzahligen Exponenten gilt auch f¨ ur reelle Exponenten, wie man mit Hilfe der Kettenregel erkennt: 1 1 (xα ) = (eα ln x ) = eα ln x · α · = α · xα · = α · xα−1 . x x Dabei haben wir die Ableitung der Umkehrfunktion ln von x → ex benutzt, welche man mit Hilfe der Umkehrregel gewinnt: (ln x) =
1 1 = . eln x x
X.2 Die Ableitung einer Funktion
247
Beispiel 7 (Differenziation der trigonometrischen Funktionen ): Die Kosinusfunktion differenziert man mit Hilfe der Sinusfunktion und der Kettenregel:
(cos x) = sin x +
π 2
= cos x +
π 2
= − sin x.
Die Ableitung der Tangensfunktion gewinnt man dann aus der Quotientenregel: (tan x) =
sin x cos x
=
cos x · cos x − (− sin x) · sin x 1 = 2 (cos x) cos2 x
Ferner gilt auf den jeweiligen Definitionsmengen wegen (f −1 ) =
1 f ◦ f −1
1 , denn cos(arcsin x) = 1 − sin2 (arcsin x) 1 − x2 1 , denn − sin(arccos x) = − 1 − cos2 (arccos x) (arccos x) = − √ 1 − x2 1 1 , denn cos2 (arctan x) = (arctan x) = 1 + x2 1 + tan2 (arctan x)
(arcsin x) = √
Ist die Ableitungsfunktion f einer Funktion f selbst wieder differenzierbar, so kann man ihre Ableitungsfunktion (f ) bilden; diese bezeichnet man mit f und nennt sie die zweite Ableitungsfunktion bzw. zweite Ableitung von f . Analog kann man die dritte, vierte, . . . Ableitung definieren. Allgemein bezeichnet man die nte Ableitung von f mit f (n) . Existiert die nte Ableitung einer Funktion, dann nennt man sie n-mal differenzierbar.
Aufgaben 1. Man berechne die Ableitungsfunktion der folgenden Funktionen: x a) x → 1 + x2
b) x →
5
1 1+x
c) x → x7 ex
2
d) x → (x2 +1)x
2 +1
2. a) Man zeige, dass die Funktion
f : x →
x2 x3
f¨ ur x ≥ 0 f¨ ur x < 0
an der Stelle 0 stetig differenzierbar, aber nicht zweimal differenzierbar ist. b) Man konstruiere eine Funktion, die an der Stelle 1 zwar n-mal, aber nicht (n + 1)-mal differenzierbar ist.
X Differenzial- und Integralrechnung
248
3. Man zeige, dass die Funktion f : x → ae−x + be−2x f¨ur alle a, b ∈ IR der Differenzialgleichung
f + 3f + 2f = 0
gen¨ ugt. Man bestimme Funktionen f , die folgender Differenzialgleichung gen¨ ugen: f − 2f − f + 2f = 0
4. Es seien vier Punkte A(−7, 24), B(2, 6), C(4, −1), D(6, −11) gegeben. Man bestimme eine ganzrationale Funktion f vom Grad 3 so, dass der Graph von f die Strecken AB und CD zwischen B und C glatt verbindet.
5. Beim Straßenbau ist es wichtig, dass sich an den Nahtstellen zweier Kurvenst¨ ucke der Kr¨ ummungsradius nicht unstetig ¨andert, damit sich die Zentrifugalkr¨afte nicht unstetig ¨andern (vgl. Kapitel XII). Sind die Kurvenst¨ ucke Teile von zwei Funktionsgraphen, dann m¨ ussen an der Nahtstelle neben den Funktionswerten und den Werten der Ableitungen auch die Werte der zweiten Ableitungen u ¨bereinstimmen. y 6 Man verbinde die Endpunkte der 1.... .... ....u...................... beiden Halbgeraden .. .. .. .. .. . {(x, y) | x ≤ −1, y = −1}, x −1 .. .. 1 . . . {(x, y) | x ≥ 1, y = 1} . . .........................u.. −1.... in diesem Sinne mit Hilfe einer Polynomfunktion von m¨oglichst kleinem Grad (Fig. 3).
Fig. 3: Zu Aufgabe 5
6. Die Funktionen f, g, h seien auf einem Intervall ]a; b[ differenzierbar und sollen dort keine Nullstelle haben. Man zeige, dass (f gh) f g h = + + f gh f g h auf ]a; b[ gilt. Man verallgemeinere diese Regel.
7. Die Funktionen f und g seien n-mal differenzierbar. Man beweise die leibnizsche Regel
(n)
(f · g)
=
n n i=0
i
· f (i) · g (n−i) .
8. Man bestimme alle Funktionen f auf IR mit a) f (x) · f (x) = x
b)
f (x) = x2 f (x)
c)
f (x) − f (x)
f (x) f (x)
2
= x3
X.2 Die Ableitung einer Funktion
249 h
9. In dieser Aufgabe soll gezeigt werden, dass lim e h→0
−1 = 1. h
n n+1 1 1 <e< 1+ f¨ ur alle n ∈ IN. a) Man zeige, dass 1 + n n 1 1 ur alle n ≥ 2. b) Man zeige, dass n 1 + < 1 + 2 f¨ n n 1 n 1 1 + − 1 = 1. c) Man zeige, dass n→∞ lim n 1 + n n
d) Man beweise die eingangs genannte Grenzwertbeziehung.
10. Die auf IR definierten Funktionen sinh : x →
.. ...6 ... . ... ... .... 1 ... ..... .. .. .. .......... .. ..-x 1 .. ... ... ..... ... ... ... ... .. y
ex − e−x , 2
ex + e−x 2 haben ¨ahnliche Eigenschaften wie die trigonometrischen Funktionen sin und cos. Man nennt sie hyperbolische Funktionen (Sinushyperbolicus, Cosinushyperbolicus), vgl. Fig. 4, 5. Der Graph von cosh heißt Kettenlinie. a) Man zeige, dass cosh : x →
sinh = cosh
und
Fig. 4: Sinushyperbolicus y6 ... .. ... . . . . . ... ... ... .... ... .... ..... ..... ..............
cosh = sinh .
b) Man zeige, dass f¨ ur alle x ∈ IR gilt:
..
cosh2 x − sinh2 x = 1
..
1
..
1
..-x
c) Welche Kurve wird durch
x a cosh t (x, y) | = , t ∈ IR y b sinh t
mit a, b > 0 dargestellt? d) Die Funktion tanh mit tanh =
sinh cosh
heißt Tangenshyperbolicus (Fig. 6). Man bestimme die Ableitungsfunktion.
Fig. 5: Cosinushyperbolicus y
6
1 .... ............................. ....
. ...... .. ......... .. ..... 1 ....... .... ...................... .... .... −1 ..
..-
x
Fig. 6: Tangenshyperbolicus
X Differenzial- und Integralrechnung
250
X.3 Die Mittelwerts¨ atze der Differenzialrechnung Wir beweisen nun eine Reihe von S¨atzen u ¨ber differenzierbare Funktionen, welche f¨ ur die Anwendungen der Differenzialrechnung von großer Bedeutung sind. Satz 1 (Satz u ¨ber das lokale Extremum): Die Funktion f sei differenzierbar an der Stelle x0 ∈ ]a; b[ ⊆ Df und es gelte ur alle x ∈ ]a; b[ oder f (x) ≥ f (x0 ) f¨ ur alle x ∈ ]a; b[ f (x) ≤ f (x0 ) f¨ (f hat an Stelle x0 ein lokales Maximum oder ein lokales Minimum). Dann gilt f (x0 ) = 0. Beweis: Es gen¨ ugt, den Fall zu betrachten, dass an der Stelle x0 ein lokales Maximum vorliegt, andernfalls untersuche man die Funktion −f . Die Behauptung folgt dann aus 0 ≤ lim
n→∞
f x0 −
1 n
−
− f (x0 )
1 n
f x0 +
= f (x0 ) = lim
n→∞
1 − f (x0 ) n ≤ 0. 1 n
2
Satz 2 (Satz von Rolle (nach Michel Rolle, 1652–1719)): Die Funktion f sei stetig auf dem abgeschlossenen Intervall [a; b] ⊆ Df und differenzierbar auf dem offenen Intervall ]a; b[. Ist f (a) = f (b), dann existiert eine Zahl ξ ∈ ]a; b[ mit f (ξ) = 0. ur alle x ∈ ]a; b[. Andernfalls Beweis: Ist f konstant auf [a; b], dann ist f (x) = 0 f¨ existiert nach Satz 5 aus X.1 eine Stelle ξ ∈ ]a; b[, an welcher f ein Extremum (Maximum, Minimum) annimmt. Nach Satz 1 gilt dann f (ξ) = 0. 2 Satz 3 (1. Mittelwertsatz der Differenzialrechnung): Die Funktion f sei stetig auf [a; b] ⊆ Df und differenzierbar auf ]a; b[. Dann existiert ein ξ ∈ ]a; b[ mit f (b) − f (a) = f (ξ). b−a Beweis: Man wende auf die Funktion
y
f (b) − f (a) · (x − a) x → f (x) − b−a den Satz von Rolle an.
6
2
Der 1. Mittelwertsatz besagt anschaulich, dass zu jeder Sekante eines Funktionsgraphen eine zu ihr parallele Tangente existiert, falls die Funktion im betrachteten Bereich differenzierbar ist (Fig. 1).
...........................y.q....= f (x) ....... . . . q . . . . . .. ..... .. . . . . ... .. .. .q .. -
a
ξ
b
Fig. 1: 1. Mittelwertsatz
x
X.3 Die Mittelwerts¨atze der Differenzialrechnung
251
Aus dem 1. Mittelwertsatz folgen weitere interessante S¨atze u ¨ber differenzierbare Funktionen. Diese sind oft ebenso evident“ wie der Mittelwertsatz selbst. ” Satz 4: Die Funktion f sei stetig auf [a; b] ⊆ Df und differenzierbar auf ]a; b[. Gilt f (x) = 0 f¨ ur alle x ∈ ]a; b[, dann ist f konstant auf [a; b]. Beweis: F¨ ur jedes x0 ∈ ]a; b[ existiert nach Satz 3 ein ξ0 ∈ ]a; x0 [ mit f (x0 ) − f (a) = f (ξ0 ). x0 − a Aus f (ξ0 ) = 0 folgt f (x0 ) = f (a).
2
Satz 5: Die Funktionen f und g seien stetig auf [a; b] ⊆ Df ∩ Dg und differenzierbar auf ]a; b[. Gilt f (x) = g (x) f¨ ur alle x ∈ ]a; b[, dann unterscheiden sich f und g nur durch eine additive Konstante. Beweis: Man wende Satz 4 auf die Funktion f − g an.
2
Satz 6 (Monotoniekriterium): Die Funktion f sei stetig auf [a; b] ⊆ Df und differenzierbar auf ]a; b[. Nimmt f auf ]a; b[ nur positive (nur negative) Werte an, dann ist f auf [a; b] streng monoton wachsend (fallend). Beweis: Wir nehmen an, f habe nur positive Werte auf ]a; b[ (im anderen Fall betrachte man −f ). F¨ ur a ≤ x1 < x2 ≤ b existiert nach dem 1. Mittelwertsatz ein ξ ∈]x1 ; x2 [ mit f (x2 ) − f (x1 ) = f (ξ)(x2 − x1 ), und diese Zahl ist positiv. 2 Satz 7 (2. Mittelwertsatz der Differenzialrechnung): Die Funktionen f und g seien ur stetig auf [a; b] ⊆ Df ∩ Dg und differenzierbar auf ]a; b[. Ist g (x) = 0 f¨ alle x ∈ ]a; b[, dann gibt es ein ξ ∈ ]a; b[ mit f (ξ) f (b) − f (a) = . g(b) − g(a) g (ξ) Beweis: Zun¨achst beachte man, dass aufgrund des Satzes von Rolle g(a) = g(b). Nun wende man auf die Funktion x → f (x) −
f (b) − f (a) · (g(x) − g(a)) g(b) − g(a) 2
den Satz von Rolle an.
Satz 8 (1. Regel von de L’Hospital): Die Funktionen f und g seien stetig auf ur [a; b] ⊆ Df ∩ Dg und differenzierbar auf ]a; b[, und es sei g (x) = 0 f¨ alle x ∈ ]a; b[. Ist f (b) = g(b) = 0 und existiert der linksseitige Grenzwert von
f (x) an der Stelle b, dann ist g (x)
lim−
x→b
f (x) f (x) = lim− . g(x) x→b g (x)
X Differenzial- und Integralrechnung
252
Beweis: F¨ ur x ∈]a; b[ existiert nach dem 2. Mittelwertsatz ein ξ ∈]x; b[ mit f (x) − f (b) f (ξ) f (x) = = . g(x) g(x) − g(b) g (ξ) Aus x < ξ < b folgt die Behauptung Man beachte dabei, dass wegen g(b) = 0 und g (x) = 0 auch g(x) = 0 f¨ ur alle x ∈]a; b[ gilt. 2 Die Regeln in Satz 8 und dem unten folgenden Satz 9 sind benannt nach Marquis Guillaume Francois Antoine de L’Hospital (1661–1704); er verfasste basierend auf Vorlesungen von Johann Bernoulli das erste Lehrbuch zur Differenzialrechnung. Die Regel in Satz 8 gilt nat¨ urlich auch f¨ ur rechtsseitige Grenzwerte und f¨ ur beidseitige Grenzwerte, sofern diese existieren. Ferner gilt sie f¨ ur die Grenz¨ uberg¨ange x → ∞ und x → −∞ (Aufgabe 5). Beispiel 1:
ex − x − 1 ex − 1 ex 1 = lim = = lim 2 x→0 x→0 x→0 2 x 2x 2 lim
√ ln(1 − x2 ) −2x · 2 −4 x √ √ = lim Beispiel 2: lim = lim =0 x→0 x→0 (1 − x2 ) · 3 x x→0 3(1 − x2 ) x x Satz 9 (2. Regel von de L’Hospital ): Die Funktionen f und g seien auf dem offenen Intervall ]a; b[ ⊆ Df ∩ Dg differenzierbar und es sei f (x), g(x), g (x) = 0 f¨ ur alle x ∈ ]a; b[. Ist dann lim− f (x) = lim− g(x) = ∞ und x→b f (x)
existiert der linksseitige Grenzwert von lim−
x→b
g (x)
x→b
an der Stelle b, dann ist
f (x) f (x) = lim− . g(x) x→b g (x)
Beweis: F¨ ur a < x1 < x < b gibt es nach Satz 7 ein x2 ∈]x1 , x[ mit f (x )
1 f (x) − f (x1 ) f (x) 1 − f (x) f (x2 ) = · . = g(x) − g(x1 ) g(x) 1 − g(x1 ) g (x2 )
g(x)
Bezeichnen wir mit A den linksseitigen Grenzwert von
f (x) an der Stelle b, dann g (x)
k¨onnen wir x1 zu einem vorgegebenen ε > 0 so w¨ahlen, dass f (x) − A < ε g (x)
also
f¨ ur alle x ∈ ]x1 , b[, f (x )
1 f (x) 1 − f (x) · < A + ε. A−ε< g(x) 1 − g(x1 )
g(x)
X.3 Die Mittelwerts¨atze der Differenzialrechnung Wegen lim− x→b
253
f (x1 ) g(x1 ) = lim− = 0 (bei festem x1 ) gibt es ein x3 ∈ ]x1 , b[ mit f (x) x→b g(x)
A−ε
0 monoton w¨achst. x
2. a) Man beweise, dass x →
Hinweis: Man ben¨otigt die Ungleichungen aus Aufgabe 1 b).
c) Man bestimme die Grenzwerte von x → 1 +
1 x
x
f¨ ur x → 0 und x → ∞.
X Differenzial- und Integralrechnung
254
3. Wie oft ist h : x → 3x2 − x3 sgn x an der Stelle 0 differenzierbar? (Dabei ist sgn x = −1, 0 oder 1 f¨ ur x < 0, x = 0 bzw. x > 0.)
4. Die Funktionen f und g seien auf ]a;b[ differenzierbar und es gelte dort a+b 2
f = g und g = f . Ferner sei f
= 1 und g
a+b 2
= 0.
ur alle x ∈ ]a; b[. Man zeige, dass f 2 (x) − g 2 (x) = 1 f¨
5. Man zeige, dass die Regeln von de l’Hospital auch f¨ur den Grenz¨ubergang x → ∞ gelten.
6. Man bestimme folgende Grenzwerte: 3x − 2x x→0 x ln(1 − x2 ) c) lim+ x→0 xr
xx − x x→1 1 − x + ln x
a) lim
b) lim
1
d) lim x 1−x x→1
7. Man berechne mit Hilfe der 1. Regel von de l’Hospital: a) lim
√ 2n
5n
(ln n)10 √ b) lim 10 n
√
n
c) lim
n−1 ln n n
(n ≥ 2)
8. Man berechne ln(1 + x + x2 ) + ln(1 − x + x2 ) x→0 x2 lim
und
lim x2 (ln(1 + x + x4 ) − ln x4 ).
x→∞
X.4 Iterationsverfahren Eine Folge (xn ) reeller Zahlen sei durch einen Startwert x0 und eine Funktion f rekursiv definiert: xn+1 = f (xn ) (n ∈ IN0 ). Wir wollen untersuchen, unter welchen Voraussetzungen u ¨ber x0 und f diese Folge konvergiert. Ist dies der Fall, dann ist es naheliegend, dass sich der Grenzwert x∗ aus der Gleichung x = f (x) ergibt. √ Beispiel 1: Es sei x0 = 1 und xn+1 = 7xn . Diese Folge beginnt also mit 1,
√
7,
√
7 7,
√
7 7 7, . . . .
√ Ihr Grenzwert ergibt sich (vermutlich) aus der Gleichung x = 7x zu x∗ = 7. √ √ √ Dies ist einleuchtend, denn 7 = 7 · 7 = 7 7 · 7 = 7 7 7 · 7 = . . . .
X.4 Iterationsverfahren
255
Beispiel 2: Es sei x0 = 1 und xn+1 = 1,
√
2,
2+
√
√
2 + xn . Diese Folge beginnt mit
2,
2+
2+
√ 2, . . . .
√ Ihr Grenzwert ergibt sich (vermutlich) ausder Gleichung x = 2 + x zu x∗ = 2. √ √ Dies ist einleuchtend, denn 2 = 2 + 2 = 2 + 2 + 2 = . . . . Beispiel 3: Es sei x0 = 1 und xn+1 = 1 +
1 2 + xn = . 1 + xn 1 + xn
Diese Folge ist konvergent (Aufgabe 1). Ihr Grenzwert ergibt sich (vermutlich) √ 2+x bzw. x2 = 2 zu x∗ = 2. aus der Gleichung x = 1+x
Im folgenden Satz soll die Funktion f auf einem abgeschlossenen Intervall differenzierbar sein. Die Differenzierbarkeit auf einem abgeschlossenen Intervall beinhaltet auch die einseitige Differenzierbarkeit an den Intervallgrenzen. Satz 1: Die Funktion f sei differenzierbar auf [a; b], es sei f (x) ∈ [a; b] f¨ ur alle x ∈ [a; b], und es existiere eine positive Konstante L < 1 mit |f (x)| ≤ L f¨ ur alle x ∈ [a; b]. Dann hat x = f (x) genau eine L¨osung x∗ in [a; b], und die Folge (xn ) mit xn+1 = f (xn ) (n ∈ IN0 ) konvergiert f¨ ur jeden Startwert x0 ∈ [a; b] gegen x∗ . Beweis: Wegen a ≤ f (x) ≤ b f¨ ur alle x mit a ≤ x ≤ b gilt f¨ ur die Funktion g : x → x − f (x) einerseits g(a) ≤ 0 und andererseits g(b) ≥ 0. Nach dem Zwischenwertsatz existiert also ein s ∈ [a; b] mit g(s) = 0, also s = f (s). Hat die Gleichung x = f (x) die L¨osungen s1 , s2 in [a; b], dann folgt nach dem 1. Mittelwertsatz |s1 − s2 | = |f (s1 ) − f (s2 )| = |f (σ) · (s1 − s2 )| ≤ L|s1 − s2 | ur s1 = s2 m¨oglich ist. Also besitzt die (mit s1 ≤ σ ≤ s2 ), was wegen L < 1 nur f¨ Gleichung x = f (x) genau eine L¨osung in [a; b], welche wir mit x∗ bezeichnen. F¨ ur alle x1 , x2 ∈ [a; b] gilt nun nach dem 1. Mittelwertsatz |f (x1 ) − f (x2 )| = |f (ξ)||x1 − x2 | ≤ L|x1 − x2 | ur n ∈ IN0 und mit ξ ∈ [a; b]. Also ist |xn+1 − x∗ | = |f (xn ) − f (x∗ )| ≤ L|xn − x∗ | f¨ somit |xn+1 − x∗ | ≤ Ln+1 |x0 − x∗ |. Wegen L < 1 ergibt sich lim(xn ) = x∗ .
2
X Differenzial- und Integralrechnung
256 In Beispiel 1 ist f (x) =
√
7x und f (x) ∈ [2; 8] f¨ ur x ∈ [2; 8], ferner
1 7 7 |f (x)| = x0 ≥ a (x − x0 ) · fmin ≤ Fa (x) − Fa (x0 ) ≤ (x − x0 ) · fmax , wobei fmin und fmax das Minimum bzw. das Maximum von f im Intervall [x0 , x] ist. Analoges gilt f¨ ur a ≤ x < x0 . Die Existenz von fmin und fmax wird durch die Stetigkeit von f gesichert (vgl. Satz 5 in Abschnitt X.1). Nun gilt aufgrund der Stetigkeit von f lim fmin = lim fmax = f (x0 ), x→x0
x→x0
also ist
Fa (x) − Fa (x0 ) = f (x0 ). x − x0 Das bedeutet, dass Fa an der Stelle x0 differenzierbar ist und dass lim
x→x0
Fa (x0 ) = f (x0 ) gilt. Dies gilt an jeder Stelle x0 ∈ I, also ist Fa eine auf I differenzierbare Funktion mit der Ableitungsfunktion f . Definition 1: Ist F eine auf dem offenen Intervall I differenzierbare Funktion und gilt F = f , dann nennt man F eine Stammfunktion von f auf I. Die Menge aller Stammfunktionen von f auf einem gegebenen offenen Intervall I bezeichnen wir mit f und nennen diese Menge das unbestimmte Integral von f . Zwei Stammfunktionen von F unterscheiden sich nur um eine additive Konstante: Ist F1 = f und F2 = f , dann ist (F1 − F2 ) = 0 (Nullfunktion), also ist F1 − F2 konstant. Umgekehrt ist mit F auch F + c f¨ ur jedes c ∈ IR eine Stammfunktion von f .
X.5 Stammfunktionen und Fl¨acheninhalte
261
Das Integralzeichen ist ein stilisiertes S“; es ist von Leibniz eingef¨ uhrt worden. ” Eigentlich m¨ usste man noch das Intervall I in die Bezeichnung aufnehmen. Ist Fa die oben betrachtete Fl¨acheninhaltsfunktion von f und F eine beliebige Stammfunktion von f , dann ist Fa = F + c mit einer Konstanten c. Wegen Fa (a) = 0 ist c = −F (a), also Fa (x) = F (x) − F (a). Der Fl¨acheninhalt, der u ¨ber dem Intervall [a; b] von der x-Achse und dem Graph von f eingeschlossen wird, ist also Fa (b) = F (b) − F (a). Diesen Fl¨acheninhalt F (b) − F (a) bezeichnet man traditionsgem¨aß mit b
f (x) dx a
und nennt dies das bestimmte Integral von f von a bis b. In X.6 wird dieser Begriff etwas allgemeiner definiert. Beispiel 1: Es soll der Fl¨acheninhalt A unter der Parabel mit der Gleichung
y = x2 zwischen den Stellen 1 und 4 berechnet werden. Wegen
1 3 x 3
= x2 ist
1 3
x → x3 eine Stammfunktion von x → x2 . Es gilt also 4
x2 dx =
1
1 3 1 3 · 4 − · 1 = 21. 3 3
Bei obigem bestimmtem Integral darf auch b ≤ a sein, denn man vereinbart a
a
f (x) dx = 0 a
und
f (x) dx = −
b
f (x) dx. a
b
L¨asst man nun die Beschr¨ankung auf Funktionen mit nichtnegativen Werten fallen, so vereinbart man, Fl¨acheninhalte unter der x-Achse negativ zu z¨ahlen; man benutzt also die Regel b a
(−f (x)) dx = −
b
f (x) dx. a
Diese Vereinbarungen sind vertr¨aglich mit der Intervalladditivit¨at des bestimmten Integrals: y . b c c 6 ..... . f (x) dx + f (x) dx = f (x) dx y = x3 .. .. a a .. . b ...+.. . . . . x ..... .............................. . . . . . . . . . . . . . Beispiel 2 (Fig. 2): .. −..... .. ... . .. 1 1 4 1 .... 3 4 x dx = · 1 − · (−1) = 0. ... 4 4 Fig.2: Zu Beispiel 2 −1
X Differenzial- und Integralrechnung
262
Auf den Integralbegriff f¨ ur Funktionen, die nicht notwendigerweise stetig sind, gehen wir erst im n¨achsten Abschnitt ein. Hier wollen wir uns nur noch mit der Frage besch¨aftigen, wie man zu einer gegebenen stetigen Funktion das unbestimmte Integral bzw. eine Stammfunktion findet. Dazu muss man im Wesentlichen nur die Differenziationsregeln umgekehrt lesen“. Im Folgenden bedeutet ein Rechenzei” chen zwischen zwei unbestimmten Integralen, die ja Mengen von Funktionen sind, dass je ein Element der einen Menge mit je einem Element der anderen Menge verkn¨ upft wird. (In der Algebra nennt man das eine Komplexverkn¨ upfung.) Satz 1: F¨ ur auf einem offenen Intervall I stetige Funktionen f, g gilt dort:
(f + g) =
f+
(cf ) = c
g (c ∈ IR)
f
Sind f und g auf I stetig differenzierbar, dann gilt
(f · g ) = f · g −
(f · g).
Es sei ϕ auf I stetig differenzierbar und f auf ϕ(I) stetig. Dann gilt
(f ◦ ϕ) · ϕ =
f ◦ ϕ.
Ist ferner ϕ (t) = 0 f¨ ur alle t ∈ I (also ϕ auf I umkehrbar), dann gilt
f=
(f ◦ ϕ) · ϕ ◦ ϕ−1 .
Man verifiziert die Behauptungen von Satz 1 durch Differenzieren. Die dritte Formel beinhaltet die partielle Integration oder Produktintegration. Bei den beiden im Fall der Invertierbarkeit von ϕ gleichwertigen letzten Formeln spricht man von der Integration durch Substitution bzw. von den Substitutionsregeln. In Beispielen mit konkreten Funktionstermen f (x) schreibt man auch
f (x) dx Ist F ∈
statt
f.
f , dann schreibt man meistens
f (x) dx = F (x) + const., wir wollen hier aber auf + const.“ verzichten, da diese Schreibweise ohnehin ” interpretationsbed¨ urftig ist.
X.5 Stammfunktionen und Fl¨acheninhalte
263
Beispiel 3 (zur partiellen Integration):
a)
xex dx = xex −
ln x dx =
b)
ex dx = xex − ex
1 · ln x dx = x ln x −
x dx = x ln x − x x
Beispiel 4 (zur Integration durch Substitution):
a)
f (x) dx = ln f (x) f (x)
b)
1 f (x) · f (x) dx = (f (x))2 2
F¨ ur alle α ∈ IR mit α = −1 gilt
xα dx =
1 xα+1 , α+1
wie man sofort durch Differenziation findet. Der Ausnahmefall α = −1 kann benutzt werden, um die nat¨ urliche Logarithmusfunktion ln zu definieren. Man kann damit also einen neuen Zugang zu den Exponential- und Logarithmusfunktionen finden: F¨ ur x > 0 sei x y ... 1 1 6... y = ln x := dt x . ... t ... 1 ln a ... + ... (Fig. 3). Dann ist ln eine auf IR diffe .... ........ renzierbare Funktion mit 1.. ............................... ............... ............................................................ 1 .. . . . . . . . . . . . . . .. (ln x) = > 0, x x a 1 + also ist ln umkehrbar auf IR . Die UmFig. 3: Nat¨ urlicher Logarithmus kehrfunktion von ln nennen wir exp (Fig 4). Ihre Definitionsmenge ist die Bildmenge von ln (also IR, wie wir so. y x .. gleich sehen werden). Nach der Um6 ... y = e ..... kehrregel der Differenziation gilt . .... .. .... . . . e ...................... ... 1 .. ... exp = = exp, ..... .... ..... y = ln x ln ◦ exp . . ... ......... ............. . . . . . 1........................................................................ ...... . . . die Funktion exp stimmt also mit ihrer ... .. ....... .... ........ ... ................ ....... ............ Ableitungsfunktion u ¨berein. . ... . e x . . . . . 1 . . F¨ ur x > 0 und ein festes a > 0 gilt ... . . . . . ln ax = ln a + ln x, denn .. .... .. 1 1 (ln ax) = · a = = (ln x) . Fig. 4: Die Funktionen ln und exp ax x
X Differenzial- und Integralrechnung
264
Es ist also ln ax = ln x + c, und die Konstante c ergibt sich f¨ ur x = 1 zu ln a. Es gilt also ln x1 x2 = ln x1 + ln x2 f¨ ur alle x1 , x2 > 0. Aus dieser Beziehung folgt 1 ur alle x > 0. Daraus ergibt sich, dass ln die Bildmenge IR hat. ln = − ln x f¨ x Mit y1 = ln x1 und y2 = ln x2 erh¨alt man exp(y1 + y2 ) = exp(ln x1 x2 ) = x1 x2 = exp y1 · exp y2 . F¨ ur x > 0 und festes a ∈ IR gilt ln xa = a ln x, denn (ln xa ) =
1 a · axa−1 = = (a ln x) , a x x
also ln xa = a ln x + c, wobei sich die Konstante c als 0 ergibt (x = 1 setzen). Dies bedeutet f¨ ur die Funktion exp, dass exp ay = (exp y)a f¨ ur alle a, y ∈ IR gilt. Es folgt f¨ ur alle a ∈ IR exp a = (exp 1)a . Setzen wir e := exp 1, also ln e = 1, dann ergibt sich exp a = ea . Damit haben wir einen v¨ollig neuen Zugang zur Exponentialfunktion gefunden. Die oben definierte Zahl e ist tats¨achlich die eulersche Zahl, denn nach obiger Definition der Funktion ln als Integral ist n·
1 1 1 < n ln 1 + 0, so ist also s(x + h) − s(x) ≈
h2 + (f (x + h) − f (x))2 .
(Der Fehler Δ(h) ist dabei so klein, dass lim
h→0
Δ(h) h
= 0; das soll hier aber nicht
n¨aher begr¨ undet werden.) Dividiert man durch h und betrachtet den Grenzwert
X.6 Das Riemann-Integral
271
f¨ ur h → 0, dann ergibt sich s (x) =
y 6
........q........... ... y = f (x)................ ... . . . . . . ... f (x + h) − f (x) ...... ... . . . . ....q .... h .... x
1 + f (x)2 .
Der Hauptsatz der Differenzial- und Integralrechnung liefert dann f¨ ur s(b) den Wert b
Lf (a, b) =
-
x 1 + f (x)2 dx.
x+h
Fig. 3: Berechnung der L¨ ange einer Kurve
a
Beispiel 3 (neilsche Parabel, nach W. Neil, 1637–1670): Der Graph der Funktion √ 3 mit der Gleichung y = x x = x 2 hat u ¨ber dem Intervall [0; a] die L¨ange a 0
2 4 9 9 1 + x dx = · · 1 + x 4 3 9 4
⎛ ⎞ 3 a 3 2 8 ⎝ 9 2 = 1 + a − 1⎠ . 27 4 0
Die neilsche Parabel ist neben der Kettenlinie (Beispiel 4) eine der wenigen Kurven, deren L¨angenberechnung auf ein elementar zu berechnendes Integral f¨ uhrt. Beispiel 4 (Kettenlinie, vgl. Aufgabe 9 in X.1): Der Graph der Kosinushyperbolicus-Funktion, also der Graph der Funktion mit der Gleichung 1 y = cosh x = (ex + e−x ), 2 hat u ¨ber dem Intervall [0; a] die L¨ange a
1+ 0
2
1 x (e − e−x ) 2
a
dx = 0
a 1 x 1 1 (e + e−x ) dx = (ex − e−x ) = (ea − e−a ). 2 2 2 0
Die L¨angenfunktion des Kosinushyperbolicus ist also der Sinushyperbolicus mit 1 der Gleichung y = sinh x = (ex − e−x ). 2
Um den Schwerpunkt eines Kurvenst¨ ucks zu berechnen, ben¨otigen wir sein Drehmoment ( Kraft mal Kraftarm”) bez¨ uglich der beiden Koordinatenachsen. Wir ” denken uns ein Kurvenst¨ uck K, welches als Graph einer stetig differenzierbaren Funktion f mit positiven Werten u ¨ber dem Intervall [a; b] gegeben ist, homogen mit Masse belegt, so dass das Gewicht eines Kurvenst¨ ucks proportional zu seiner L¨ange ist. Das Drehmoment des Kurvenst¨ ucks zwischen den Stellen x und x + h mit h > 0 bez¨ uglich der x-Achse liegt dann zwischen min f (t) · (s(x + h) − s(x)) und
x≤t≤x+h
max f (t) · (s(x + h) − s(x))
x≤t≤x+h
X Differenzial- und Integralrechnung
272
(vgl. Fig. 4), ist also f (ξ) · (s(x + h) − s(x)) mit x ≤ ξ ≤ x + h. Die DrehmomentFunktion M hat daher an der Stelle x die Ableitung M (x) = lim f (ξ) h→0
s(x + h) − s(x) = f (x)s (x). h
Das gesamte Drehmoment ist somit b
f (x)s (x) dx =
a
b
6Drehmoment
f (x) 1 + (f (x))2 dx.
a
Entsprechend ergibt sich das Drehmoment bez¨ uglich der y-Achse zu b
b
x 1 + (f (x))2 dx.
xs (x) dx = a
x · Δs f (x)......................................................Δs .. ... Drehmoment .. .. f (x) · Δs .. .. .. x Fig. 4: Drehmomente
a
Ist andererseits L die L¨ange der Kurve u ¨ber [a; b] und (xS , yS ) ihr Schwerpunkt, so ergibt sich f¨ ur dieses Drehmoment yS · L bzw. xS · L. (Dies ist eigentlich die Definition des Schwerpunkts!) Also ist b
yS =
1 f (x) 1 + (f (x))2 dx, La
b
xS =
1 x 1 + (f (x))2 dx. La
Beispiel 5: F¨ ur den Schwerpunkt der Kettenlinie (Beispiel 4) zwischen den Stellen −a und a gilt xS = 0 und a 1 yS = cosh x 1 + sinh2 x dx 2 sinh a −a a
=
1 2 sinh a
−a
cosh h2 x dx =
a 1 1 (1 + cosh 2x) dx 2 sinh a 2 −a
1 a ea + e−a 1 . a + sinh 2a = a + = −a 2 sinh a 2 e −e 4 Um den Schwerpunkt eines Fl¨achenst¨ ucks zu berechnen ben¨otigen wir sein Drehmoment bez¨ uglich der beiden Koordinatenachsen. Wir denken uns ein Fl¨achenst¨ uck mit dem Inhalt A, welches vom Graph einer stetigen Funktion f mit f (x) ≥ 0 u ¨ber dem Intervall [a; b] eingeschlossen wird, homogen mit Masse belegt, so dass das Gewicht eines Fl¨achenst¨ ucks proportional zu seinem Inhalt ist. Das Drehmoment eines homogen mit Masse belegten Streifens vom Gewicht F und der L¨ange l bez¨ uglich einer zu ihm rechtwinkligen Achse durch seinen 1 Endpunkt ist F · l (Fig. 5). 2
X.6 Das Riemann-Integral
273
Das Drehmoment des Streifens des Fl¨achenst¨ ucks zwischen den Stellen x und x + h mit h > 0 bez¨ uglich der xAchse ist dann 1 f (ξ1 )h · f (ξ2 ) 2 mit geeigneten ξ1 , ξ2 zwischen x und x + h (Fig. 6). Die DrehmomentFunktion M hat also die Ableitung M (x) = lim
h→0
1 1 f (ξ1 )f (ξ2 ) = (f (x))2 . 2 2
Das gesamte Drehmoment ist daher 1 2
b
f (x)2 dx. Entsprechend ergibt sich
a
das Drehmoment des Fl¨achenst¨ ucks b
xf (x) dx
bez¨ uglich der y-Achse zu a
(Fig. 7). Ist A der Inhalt und (xS , yS ) der Schwerpunkt des Fl¨achenst¨ ucks, dann ist also
Achse .......
..... ..... 12 l ..... l ..............................................................................................................................................s......F . . . . . . . . ........... .......................................................................................................................... ..... Schwerpunkt ..... .....
Fig. 5: Drehmoment eines Streifens
y
.............................. y = f (x) ................... 6 .................. . . . ....... ... .. . . ...... ... ................ ......... .. . ........... .. ........v..... f (x) 6 ........... ........... 1 .......... 2 f (x) -....h .............. ? ? x .................................................................................................... x 6
Fig. 6: Drehmoment eines Fl¨ achenst¨ ucks
b
xS =
yS =
1 xf (x) dx, Aa 1 2A
b
f (x)2 dx.
a
Als Anwendung obiger Schwerpunktsberechnungen betrachten wir nun die guldinschen Regeln (nach Paul Guldin, 1577–1643). Diese dienen zur Berechnung des Mantelfl¨acheninhalts und des Volumens von Rotationsk¨orpern.
...6y .. .. .. .. ... .. .. .. .. .. ..
............................... y = f (x) ..................... 6 ................. . . . ....... ... ...... ..... ... .............. ......... .. . . ......... x -.........v...... f (x) ........... .............. ...... -.....h ............. -x ... . . ? x
Fig. 7: Drehmoment eines Fl¨ achenst¨ ucks
Erste guldinsche Regel: Der Mantelfl¨acheninhalt eines Rotationsk¨orpers ist das Produkt aus der L¨ange der erzeugenden Kurve und der L¨ange des von ihrem Schwerpunkt zur¨ uckgelegten Weges. Zweite guldinsche Regel: Das Volumen eines Rotationsk¨orpers ist das Produkt aus dem Inhalt der erzeugenden Fl¨ache und der L¨ange des von ihrem Schwerpunkt zur¨ uckgelegten Weges.
X Differenzial- und Integralrechnung
274
Zur Begr¨ undung der ersten guldinschen Regel berechnen wir zun¨achst die Mantelfl¨ache des Rotationsk¨orpers, der vom Graph der stetig differenzierbaren Funktion f mit f (x) ≥ 0 auf [a; b] bei Rotation um die x-Achse erzeugt wird. Bei Zerlegung des Intervalls in Teilintervalle der L¨ange h entstehen Scheiben, die an der Stelle x n¨aherungsweise Kegelst¨ umpfe mit dem Mantelfl¨acheninhalt 2πf (x)s (x)h sind (Fig. 8). F¨ ur den Mantelinhalt M als Funktion von x gilt also M (x) = 2πf (x)s (x). Daraus ergibt sich f¨ ur den Mantelinhalt b
M = 2π
y
Δs ΔM ≈ 2πf (x)Δs BB...B.B..... . . . . . 6 .. .. M (x) = 2πf (x)s (x) .. ... f (x) ...... .... ... .. ? ...... .. .. ... ...... @ x @.. ...... I ...... ..@ ...... .. @ ....... .. h ....
6
f (x) 1 + f (x)2 dx.
Fig. 8: Mantel߬ acheninhalt
a
Es ist also M = 2πyS · L, wobei yS die y-Koordinate des Schwerpunkts und L die L¨ange des Kurvenst¨ ucks ist. Vgl. hierzu obige Berechnung der L¨ange und des Schwerpunkts einer Kurve. Man beachte, dass hier f stetig differenzierbar sein soll, w¨ahrend bei der zweiten guldinschen Regel nur die Stetigkeit von f gefordert wird. Zur Begr¨ undung der zweiten guldinschen Regel berechnen wir das Volumen des Rotationsk¨orpers, der vom Graph der stetigen Funktion f mit f (x) ≥ 0 auf [a; b] bei Rotation um die x-Achse erzeugt wird. Bei Zerlegung des Intervalls in Teilintervalle der L¨ange h entstehen Scheiy ΔV ≈ π(f (x))2 h 6 . . ben, die an der Stelle x n¨aherungsweise . . . .. .. 2 6 .... ... Kegelst¨ umpfe mit dem Rauminhalt ... ... V (x) = π(f (x)) . . . . ... f (x) .. πf (x)2 h sind. Daraus ergibt sich f¨ ur das ... ... . .. . . . . Volumen ? . . b ...... .. x I @ . . @ 2 . . . . . ..... .@ V = π f (x) dx. ..... .. . a ...... . @ .......... h Es ist also V = πyS · A, wobei yS der Schwerpunkt und A der Inhalt des Fig. 9: Volumen Fl¨achenst¨ ucks ist. Beispiel 6: 1) Wir betrachten den oberen Halbkreis des Kreises um O mit dem Radius r. Bei Rotation um die x-Achse entsteht eine Kugel mit dem Oberfl¨acheninhalt 4πr2 . Die L¨ange des Halbkreises ist πr. F¨ ur die y-Koordinate yS des 2r Schwerpunkts der Halbkreislinie gilt daher 2πyS · πr = 4πr2 , also yS = . 2) Die in 1) erzeugte Kugel hat das Volumen 1 2
π 4 3 πr ; die erzeugende Halbkreis3
ur die y-Koordinate yS des Schwerpunkts der Halbfl¨ache hat den Inhalt πr2 . F¨ 1 2
4 3
kreisfl¨ache gilt daher 2πyS · πr2 = πr3 , also yS =
4r . 3π
X.6 Das Riemann-Integral
275
Berechnet man in 1) und 2) die Schwerpunktkoordinaten mit den oben angegebenen Integralen, dann kann man auf diese Weise die Formeln f¨ ur den Oberfl¨acheninhalt und das Volumen der Kugel gewinnen. Beispiel 7: Rotiert ein Kreis um eine Achse, welche in derselben Ebene wie der Kreis liegt, dann entsteht ein Torus (Fig. 10). Dabei sei r der Radius des rotierenden Kreises und R mit R > r der Abstand des Kreismittelpunktes von der Rotationsachse. Nach der ersten guldinschen Regel hat der Torus den Oberfl¨acheninhalt
....................... .... . ... r ..... ... .. ... .. . . ..... ........................ R ?
... .... .... ... .. .. .. .. .. .. .. . ... . ... ... ... .... .
M = 2πr · 2πR = 4π 2 rR. Nach der zweiten guldinschen Regel ist sein Volumen
...................... ..... .... ..... ... ... .. ... .. ... ... ... . ... ..... .. ... . .... .... .... .. ... ... ... .. ... .... . . ... .... .. . ... . ... .. ... . . ... .. .... ... ...... . . . ................
Fig. 10: Torus
V = πr2 · 2πR = 2π 2 r2 R.
Nun soll das Volumen eines K¨orpers berechnet werden, der in ein r¨aumliches kartesisches Koordinatensystem (xyz-Koordinatensystem) eingebettet ist. Die zur yz-Ebene parallele Ebene durch den Punkt (x, 0, 0) schneidet den K¨orper in einer Fl¨ache. Wir nehmen an, dass f¨ ur jeden Wert von x der Inhalt q(x) dieser Fl¨ache existiert und dass dabei q eine stetige Funktion auf dem Intervall [a; b] ist, ferner sei q(x) = 0 f¨ ur x < a und y > b. Dann gilt f¨ ur das Volumen V des K¨orpers b
V =
q(x) dx. a
Dies ist eine moderne Fassung des Prinzips von Cavalieri (nach Bonaventura Cavalieri 1598–1647). Entsteht ein K¨orper durch Rotation des Graphs der stetigen Funktion f u ¨ber dem 2 Intervall [a; b] um die x-Achse, dann ist q(x) = πf (x) . Das Volumen des Rotatib
onsk¨orpers ist also V = π f (x)2 dx, wie wir schon oben bei der Betrachtung der a
zweiten guldinschen Regel gesehen haben. Beispiel 8: Das Volumen einer Kugel vom Radius r ist r
V
= π
2
(r − x ) dx = 2π
−r
=
2
r 0
(r2 − x2 ) dx
r 1 4 1 2π r x − x3 = 2π r3 − r3 = πr3 . 3 3 3 0 2
X Differenzial- und Integralrechnung
276
Beispiel 9: Ein allgemeiner Kegel (Kreiskegel, schiefer Kegel, Pyramide, . . . ) mit dem Grundfl¨acheninhalt G und der H¨ohe h wird im Abstand x von der Grundfl¨ache (0 ≤ x ≤ h) in einer zur Grundfl¨ache parallelen Fl¨ache mit dem Inhalt q(x) geschnitten. 2 h−x ........... ¨ Weil sich bei einer Ahnlich·G q(x) = ... ................... h ... ........ keitsabbildung mit dem Faktor . ... . ........ .. ........ k der Fl¨acheninhalt einer Figur .... G .... ........ . . . .... 2 . . ... mit dem Faktor k andert, gilt .. .................. . . . ... . ........ . q(x) ... ... (Fig. 11) ........ ... ... . ... .. ............................ ........................................... .............. .............................. 2 2 q(x) : G = (h − x) : h . .. .. .. x 0 h Also gilt f¨ ur das Volumen V des Fig. 11: Volumen eines Kegels Kegels h
V =
G·
0
h−x h
2
dx =
h G G 1 1 (h − x)2 dx = 2 · h3 = G h. h2 h 3 3 0
Aufgaben 1. Man berechne
10 1
2. Man zeige, dass
(−1)[x] dx. Dabei bedeutet [ x x
sgn t dt = |x| und
0
x
] die Ganzteilfunktion.
|t| dt = 12 x2 · sgn x.
0
3. Jede reelle Zahl aus [0;1] sei als Dezimalbruch dargestellt, wobei der Eindeutigkeit zuliebe die Periode . . . 9999 . . . nicht vorkommen soll. Ist a(x) die erste von 0 verschiedene Ziffer in der Dezimalbruchdarstellung von x, so setzen 1 wir f (0) := 0 und f (x) = f¨ ur x ∈ ]0; 1]. Man zeige, dass f nur abz¨ahlbar a(x)
9
1
f (x) dx =
viele Unstetigkeitsstellen besitzt und dass 0
11 ≈ 0, 314. 9 i=1 i
4. Die Funktion f sei auf [0; 1] definiert durch f (0) = 1, f (x) = 0 f¨ur irrationales x und f (x) =
p p , falls x = mit p, q ∈ IN und ggT(p, q) = 1. q q
Man zeige zun¨achst, dass f stetig an den irrationalen und unstetig an den rationalen Stellen ist. Man zeige dann, dass das Integral von f u ¨ber [0; 1] existiert und den Wert 0 hat.
5. Die Funktion f sei integrierbar auf1 [0;1] und es gelte lim− f (x) = α.
Man zeige, dass dann gilt: n→∞ lim n xn f (x) dx = α. 0
x→1
X.6 Das Riemann-Integral
277
6. Man bestimme die Schwerpunkte √ der Halbkreislinie und der Halbkreisfl¨ache, wenn der Halbkreis durch y =
r2 − x2 mit −r ≤ x ≤ r gegeben ist.
7. Ein Fl¨achenst¨uck im xy-Koordinatensystem werde begrenzt durch die Kurven mit den Gleichungen y = 0, y = x2 + 2, x = 1, x = 2. Man berechne den Fl¨acheninhalt, die Koordinaten des Schwerpunkts und das Volumen der Rotationsk¨orper bei Rotation um die x-Achse und um die y-Achse.
8. Die Gleichung einer Ellipse mit den Halbachsenl¨angen a und b lautet x2 y2 + 2 = 1. Ihr Fl¨ acheninhalt ist πab (also das geometrische Mittel von 2 a b
πa2 und πb2 ). Warum? Der Umfang der Ellipse ist aber nicht so einfach zu berechnen. Man stelle den Umfang als Integral dar.
9. Der 1. Mittelwertsatz der Integralrechnung besagt (vgl. Fig. 12): Ist f stetig auf [a; b], dann existiert ein ξ ∈ ]a; b[ mit b
y
6
f (x) dx = f (ξ) · (b − a).
a
.......... y = f (x) ... ..... .. . . ......................................................................... .. ............. .. ... ... . ... .. ..f (ξ) ... .. .. ... x .. .. .a ξ b
a) Man beweise diesen Satz mit Hilfe des 1.Mittelwertsatzes der Differenzialrechnung. b) F¨ ur welche ξ ∈ ] − 1, 1[ hat das Integral Fig. 12: 1. Mittelwertsatz von f u ¨ber [−1; 1] den Wert 2f (ξ)? 1 x (1) f (x) = x2 (2) f (x) = (3) f (x) = 2 x+2 x +1
10. In Erweiterung des 1. Mittelwertsatzes der Integralrechnung (s. oben) gilt: Ist f stetig, g integrierbar und g(x) ≥ 0 auf [a; b], dann gibt es ein ξ ∈ [a; b] mit b b f (x)g(x) dx = f (ξ) g(x) dx. a
a
Man beweise dies mit Hilfe des Zwischenwertsatzes. Man zeige zun¨achst, dass der Quotient
b a
b
f (x)g(x) dx :
a
g(x) dx zwischen dem Minimum und
dem Maximum von f auf [a, b] liegt. Man bestimme dann f¨ ur f (x) = 1 , g(x) = x ein ξ ∈ ]0, 1[, f¨ u r welches das Integral von f ·g u ¨ber 2 x +1
1
[0; 1] den Wert f (ξ) g(x) dx hat. 0
11. Der 2. Mittelwertsatz der Integralrechnung besagt: Ist f monoton und stetig differenzierbar und g stetig auf [a; b], dann existiert ein ξ ∈ ]a; b[ mit
b
a
f (x)g(x) dx = f (a)
ξ
a
g(x) dx + f (b)
ξ
Man beweise dies mit Hilfe des Satzes in Aufgabe 10.
b
g(x) dx.
X Differenzial- und Integralrechnung
278
X.7 N¨ aherungsverfahren zur Integration In vielen F¨allen l¨asst sich das Integral einer stetigen Funktion f u ¨ber einem (nicht zu großen) Intervall [a; b] n¨aherungsweise durch (b − a) · η angeben, wobei
f (a) + f (b) η = f (a) oder η = 2
oder η = f
a+b 2
ist. Diese Absch¨atzung wird wesentlich besser, wenn man das Intervall in n Teilb−a intervalle [xi−1 ; xi ] der L¨ange h := zerlegt und in jedem dieser Teilintervalle n diese N¨aherung verwendet. Man gelangt so zu folgenden Regeln: b
f (x) dx hat n¨aherungweise den Wert
Das Integral a
h·
n−1 i=0
oder
h· oder h·
f (xi )
f (a) + f (b) n−1 f (xi ) + 2 i=1
n
f
i=1
xi−1 + xi 2
y = f (x)
................. ................ ... ...... .......... . . . . . . . .............................................................. . . . . . . . ..... .. . .. . .. . .. . .. . .. . .... .. . . . . . . .. .. . . . . . . . . . . . ... f (xi ) .. . . . . . . . . . . . .... .. . . . . . . . . . . . ... . . . . . . . . . . . . ... ................... ................................................................. xi
h
(Rechtecksregel, Fig. 1)
xi+1
Fig. 1: Zur Rechtecksregel
(Trapezregel, Fig. 2)
(Tangentenregel, Fig. 3). y = f (x)
.......................... ..................................... .... ... . . . . . . . . . . . . . ............... . . . .. ........ . . . .. . . . .. ...... ... . . . . . .... . . . . . .... .. . . . . . .. . . . . . .... .. . . . . . .. . . . . . ..f (xi+1 ) f (xi ) .. . . . . . .... . . . . . .... .. . . . . . .. . . . . . ... . . . . . . ... . . . . . ... ................... .................................................................. xi
h
xi+1
Fig. 2: Zur Trapezregel
y = f (x)
.......................... .......................................................................... ... . . . . . . . . . . . . . ....... . . . .. . . . .. .. ..... ... . . . . . .... . . . . . .... .. . . . . . .. . . . . . .... .. . . . . . ... . . . . . .. f (xi ) .. . . . . . .. . . . . . .... .. . . . . . ... . . . . . ... . . . . . . ... . . . . . ... ................... ................................................................. xi
h
xi+1
Fig. 3: Zur Tangentenregel
Die Approximation eines Integrals wird i. Allg. besser, wenn man die Funktion f u ur ¨ber [a; b] durch eine Polynomfunktion p vom Grad 2 (Parabel) ann¨ahert, f¨ welche
a+b a+b p(a) = f (a), p =f , p(b) = f (b) 2 2 gilt und dann das Integral u ¨ber f durch das Integral u ¨ber p ann¨ahert (Fig. 4). a+b b−a und h := und gehen von Zur Bestimmung von p(x) setzen wir m = 2 2 dem Ansatz p(x) = r + s(x − a) + t(x − a)(x − m) aus. Mit p(a) = f (a), p(m) = f (m), p(b) = f (b) erh¨alt man f¨ ur p(x) den Term
X.7 N¨aherungsverfahren zur Integration
279
. ....... y = p(x) ............. y = f (x) .......v .......... .... . . . . .... ... . .. ........... . .. . .... . . . ........ . . . .. ............. .. . .. . .. . .... .... . . . . ....... .. ..........v.......... ....... . . . . . . . . . .. ..... ...................................................................v ... . . . . . .... . . . . . . . . . . . . .... .... . . . . . . . . . . . ..... . . . . . . . . . . . . ... ... . . . . . . .... . . . . . . ... a+b a x b
y
6
2
Fig. 4: Zur Simpson-Formel
f (a) +
f (a + 2h) − 2f (a + h) + f (a) f (a + h) − f (a) (x − a)(x − a − h). (x − a) + h 2h2
a+2h
p(x) dx ergibt sich dann
F¨ ur a
f (a) · 2h + Also ist
f (a + h) − f (a) f (a + 2h) − 2f (a + h) + f (a) 2 3 · h. · 2h2 + h 2h2 3 a+2h
f (x) dx ≈
a
h (f (a) + 4f (a + h) + f (a + 2h)). 3
Die damit gewonnene Approximationsformel b
f (x) dx ≈
a
b−a f (a) + 4f 6
heißt Simpson-Formel (nach Thomas Simpson, 1716–1761). Diese Regel heißt auch keplersche Fassregel (nach Johannes Kepler, 1571–1630). Kepler gab den Inhalt eines Fasses der H¨ohe H mit H (A + 4M + B) 6
an (Fig. 5), wobei A und B die Fl¨acheninhalte des Grund- bzw. Deckkreises sind und M der Inhalt des Schnittkreises in halber H¨ohe ist.
y
6
a+b + f (b) 2
M ......s............. .. ............................. ........... .. . . . . . . . ........... .... ... ... . B A........ ....s. ......................................................... ..........s...... . . . . . . . . . .............. ........... . . . . . ..... .. ... ................ .. . .. ........... ..... .......... .... ..... ...... ... ........ y = f (x) ...... .. ... .. .... ... ... ......... .... ........ . ............ ... ... ........ .. ... .... ........ .. ....... ......... m ... ...... a .. ......... b ... x . . . ......... ...... ... ......... .. . ...... ... ......... ... ........ ...... ............ .. ............... ............ ... .......................... ........................................................................................................................ H Fig. 5: Keplersche Fassregel
X Differenzial- und Integralrechnung
280
Durch Einteilung von [a; b] in eine gerade Anzahl von Teilintervallen und Anwendung der Simpson-Formel auf immer zwei benachbarte Teilintervalle kann man sehr genaue Formeln zur n¨aherungsweisen Integration gewinnen. 2
1 dx mit Hilfe der Simpson-Formel x 1 1 1 1 25 bestimmen. Es ergibt sich 1+4· + = = 0,69¯4. Dies ist eine gute 6 1, 5 2 36
Beispiel 1: Wir wollen den Wert ln 2 =
N¨aherung f¨ ur ln 2 = 0,693147 . . . ; der relative Fehler betr¨agt weniger als 0,2%. Beispiel 2: Die L¨ange des Bogens der Sinusfunktion zwischen 0 und π
L=
2 √
π ist 2
1 + cos2 x dx. Eine Absch¨atzung mit der Simpson-Formel ergibt
0
L≈
π √ 2 + 4 1, 5 + 1 ≈ 1,9146. 12
π und zweimaliger Anwendung der 4 1 + cos α Simpson-Formel erh¨alt man unter Beachtung der Formel cos2 α = 2 √ √ √ π π
Bei Aufteilung in zwei Intervalle der L¨ange
L≈
2+2 6+
24
2+
1, 5 +
1, 5 + 2 6 −
24
ex dx ≈
δ −δ e + 4 + eδ . 3
ex dx = eδ − e−δ . Aus eδ − e−δ ≈
δ −δ e + 4 + eδ 3
Beispiel 3: F¨ ur δ > 0 ist nach der Simpson-Formel δ
Andererseits ist
δ
2 + 1 ≈ 1,9101.
−δ
−δ
ergibt sich durch L¨osen einer quadratischen Gleichung f¨ ur eδ die Absch¨atzung eδ ≈
2δ +
√
9 + 3δ 2 1 . Mit δ = erh¨alt man schließlich e ≈ 3−δ n
2+
√
3 + 9n2 3n − 1
n
.
Die Folge mit diesem Term konvergiert in der Tat gegen e (Aufgabe 4 in IX.10).
Aufgaben 1. Man berechne N¨aherungswerte f¨ur 1
π 0
1 sin x 2 dx und f¨ ur ex dx. x 0
dx π 2. Es gilt = arctan 1 = . Man berechne daraus einen N¨aherungs1 + x2 4 0 wert von π und sch¨atze den relativen Fehler ab.
X.8 Uneigentliche Integrale
281
X.8 Uneigentliche Integrale Das Riemann-Integral ist nur definiert f¨ ur beschr¨ankte Funktionen auf einem beschr¨ankten Integrationsintervall. Machen wir uns von diesen Voraussetzungen frei, dann erhalten wir den Begriff des uneigentlichen Integrals, dem wir uns nun widmen wollen. Die Funktion f sei auf dem halboffenen Intervall [a; b[ definiert und f¨ ur jedes x ∈ [a; b[ auf [a; x] Riemannintegrierbar. Wenn der Grenzwert x
lim−
x→b
f (t) dt a
existiert, dann bezeichnen wir ihn als das uneigentliche Integral von f u ¨ber [a; b] und bezeichnen ihn wie das Riemann-Integral mit b
f (x) dx. a
y
6
. .... ... ..... ... .. .. .......... ....... y = f (x) .................... ............ ......................... . . . . . ................. ........................................... . . . . ....................... ..................................................... . . . . . . . ............................................. .................................................................................... x . a b . 6 ....
Fig. 1: Uneigentliches Integral
Entsprechend definiert man das uneigentliche Integral f¨ ur den Fall, dass f an der Stelle a nicht definiert ist, durch einen rechtsseitigen Grenzwert. Ist die Funktion an einer inneren Stelle von [a; b] nicht definiert, dann erkl¨art man das uneigentliche Integral als eine Summe eines links- und eines rechtsseitigen Grenzwerts. Ist f auf [a; b] Riemann-integrierbar, dann existieren alle betrachteten Grenzwerte, und das uneigentliche Integral stimmt mit dem Riemann-Integral u ¨berein. Das uneigentliche Integral ist also eine Verallgemeinerung des Riemann-Integrals. Beispiel 1: Die Funktion x → x−α ist f¨ ur α > 0 an der Stelle 0 nicht definiert; in der Umgebung von 0 w¨achst sie unbeschr¨ankt. F¨ ur α = 1 und ε > 0 ist 1 1 1 (1 − ε1−α ). dx = α x 1 − α ε ur ε → 0+ existiert nicht f¨ ur α > 1; er existiert und ist Der Grenzwert von ε1−α f¨ gleich 0 f¨ ur α < 1. Also gilt 1 1 1 f¨ ur 0 ≤ α < 1. dx = α x 1−α 0
Die Funktion f sei auf [a; ∞[ definiert und f¨ ur jedes x ∈ [a; ∞[ auf [a; x] Riemannintegrierbar. Wenn der Grenzwert
X Differenzial- und Integralrechnung
282 x
y
f (t) dt
lim
x→∞
6
.......................... ....................................................... y = f (x) ............................. ....... ..................................................................... ..................................................................................... ................................................................................................................. . . . . . . . . . . . . . . . . . . . . ............ x a
a
existiert (Fig. 2), dann bezeichnen wir ihn als das uneigentliche Integral von f u ¨ber [a; ∞[ und bezeichnen ihn mit ∞
f (x) dx.
Fig. 2: Uneigentliches Integral
a
Entsprechend definiert man das uneigentliche Integral f¨ ur den Fall, dass der Integrationsbereich nach unten unbeschr¨ankt ist, und schließlich definiert man ein uneigentliches Integral u ¨ber den Integrationsbereich IR als Summe zweier uneigentlicher Integrale: Es ist ∞
0
f (x) dx := −∞
∞
f (x) dx + −∞
f (x) dx, 0
falls die beiden rechts stehenden Integrale existieren. ur α > 0 auf [1; ∞[. F¨ ur Beispiel 2: Wir betrachten die Funktion f : x → x−α f¨ α = 1 und K ∈ [1; ∞[ ist K 1
1 1 (K 1−α − 1). dx = xα 1−α
1−α
Der Grenzwert von K f¨ ur K → ∞ existiert nicht f¨ ur α < 1; er existiert und ist gleich 0 f¨ ur α > 1. Also gilt ∞ 1
1 1 dx = α x α−1
f¨ ur α > 1.
Mit Hilfe uneigentlicher Integrale mit dem Integrationsbereich [1; ∞[ kann man das Konvergenzverhalten von Reihen untersuchen. In folgendem Beispiel wird die ∞ ∞ 1 1 Verwandtschaft von und dx ausgenutzt. α α i x i=1 1
Beispiel 3 : Es sei α > 0 und f : x → x Da f streng monoton f¨allt, gilt i
f (i)
0, so dass die Reihe f¨ ur |x| < r absolut konvergiert und f¨ ur |x| > r divergiert. ur alle x mit Beweis: Ist die Reihe f¨ ur x = x0 = 0 konvergent, dann ist sie auch f¨ |x| < |x0 | absolut konvergent, denn f¨ ur ein solches x ist n x ≤ Kq n ,
|an xn | = |an xn0 | ·
x0
ur wobei K eine Schranke f¨ ur die Glieder |an xn0 | ist und q < 1 gilt. Ist die Reihe f¨ x = x0 divergent, dann ist sie auch f¨ ur jedes x mit |x| > |x0 | divergent, da sie sonst nach obigem f¨ ur x = x0 konvergent sein m¨ usste. Es gilt also Satz 1 mit r := sup{x ∈ IR |
∞ n=0
an xn konvergiert an der Stelle x.}
2
Die in Satz 1 betrachtete Zahl r nennt man den Konvergenzradius der Potenzreihe. Das Intervall ] − r; r[ nennt man das Konvergenzintervall der Potenzreihe. Ist die Reihe nirgends konvergent, dann setzen wir r = 0; ist sie u ¨berall konvergent, dann setzen wir r = ∞. Entsprechend soll die Aussage des folgenden Satzes interpretiert werden. Die Behauptungen dieses Satzes ergeben sich sofort aus dem Quotientenkriterium bzw. aus dem Wurzelkriterium (Abschnitt IX.9). Satz 2: a) F¨ ur den Konvergenzradius r der Potenzreihe
n=0
⎧ ⎪ ⎪ ⎪ ⎪ 0, ⎪ ⎪ ⎪ ⎪ ⎨
r=
⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩
an xn gilt
an+1 ankt w¨achst, a unbeschr¨ n a 1 , falls lim n+1 = μ > 0, an μ an+1 = 0. ∞, falls lim a
falls
n
b) F¨ ur den Konvergenzradius r der Potenzreihe
r=
∞
⎧ ⎪ ⎪ ⎪ 0, ⎪ ⎪ ⎪ ⎪ ⎨ 1
∞ n=0
an xn gilt
falls ( n |an |) unbeschr¨ankt w¨achst,
,
falls lim( n |an |) = μ > 0,
⎪ ⎪ μ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ ∞, falls lim( n |an |) = 0.
1 , wobei μ der gr¨oßte H¨aufungspunkt (Limes μ a superior) der Glieder der Folge | n+1 | bzw. der Folge ( n |an |) ist. In dieser an
Allgemeiner als in Satz 2 gilt r =
XI.1 Konvergenz von Potenzreihen
291
¨ Allgemeinheit werden wir diesen Satz hier aber nicht ben¨otigen. Uber das Konvergenzverhalten an den Stellen ±r sagen obige S¨atze nichts aus. ∞
∞ xn
∞ xn
Beispiel 1: Die Potenzreihen xn , , haben alle den Kon2 n=0 n=0 n n=0 n √ n vergenzradius 1, denn lim( n) = 1. Die erste konvergiert weder an der Stelle −1 noch an der Stelle 1, die zweite konvergiert zwar nicht an der Stelle 1 (harmonische Reihe!), aber an der Stelle −1 (leibnizsche Reihe!), die dritte konvergiert sowohl an der Stelle −1 als auch an der Stelle 1. Satz 3 (abelscher Grenzwertsatz, benannt nach Niels Hendrik Abel, 1802–1829): Gilt f¨ ur die Funktion f auf dem Intervall ] − r; r[ mit r ∈ IR+ f (x) =
∞ n=0
an xn ,
und konvergiert die Reihe noch f¨ ur x = r, dann existiert der linksseitige Grenzwert von f an der Stelle r, und es gilt lim− f (x) =
x→r
∞ n=0
an rn .
Eine entsprechende Aussage gilt f¨ ur die Stelle −r. Beweis: Man kann r = 1 annehmen, andernfalls ersetze man die Koeffizienten an durch an rn . Die Potenzreihe habe also den Konvergenzradius 1, und die Reihe (sn ) := Σ(an ) sei konvergent zum Grenzwert s. Nun gilt f¨ ur |x| < 1 f (x) =
∞ n=0
(sn − sn−1 )xn = (1 − x)
da (sn ) konvergiert. Wegen (1 − x)
∞
∞ n=0
sn x n ,
xn = 1 folgt f¨ ur |x| < 1
n=0
s − f (x) = (1 − x)
∞ n=0
(s − sn )xn .
ur Nun w¨ahlen wir zu einem gegebenen ε > 0 ein N0 ∈ IN so, dass |s − sn | < ε f¨ n > N0 . Dann ist f¨ ur 0 ≤ x < 1 N0 ∞ n |s − f (x)| ≤ (1 − x) (s − sn )x + ε(1 − x) xn . n=0 n=N0 +1
W¨ahlen wir K gr¨oßer als
N0 n=0
|s − sn |, dann folgt |s − f (x)| ≤ K(1 − x) + ε.
W¨ahlt man nun x so, dass 1 − x
0 derart, dass die Potenzreihen ∞ ∞
n=0
an x n
und
n=0
bn xn
f¨ ur |x| < konvergieren und f¨ ur jedes solche x den gleichen Wert haben, dann gilt an = bn f¨ ur alle n ∈ IN0 . Beweis: Wir beweisen diesen Satz mit vollst¨andiger Induktion. Setzt man x = 0, so ergibt sich a0 = b0 . Es sei schon gezeigt, dass ai = bi f¨ ur i = 0, 1, . . . , n. Dann ist f¨ ur x = 0 ∞
i=n+1
ai xi−(n+1) =
∞
i=n+1
bi xi−(n+1) . 2
F¨ ur x = 0 ergibt sich daraus an+1 = bn+1 .
Satz 5: a) Jede Potenzreihe ist in ihrem Konvergenzintervall I stetig und daher integrierbar; eine Stammfunktion gewinnt man durch gliedweises Integrieren: ∞ ∞ an n+1 an xn = x . n +1 n=0 n=0 b) Jede Potenzreihe ist in ihrem Konvergenzintervall I differenzierbar; die Ableitung gewinnt man durch gliedweises Differenzieren:
∞
n=0
an x
n
=
∞ n=1
nan xn−1 .
Beweis: a) Wir setzen f¨ ur x ∈ I und N ∈ IN fN (x) :=
N n=0
an xn
und
f (x) := lim fN (x). N →∞
Die ganzrationale Funktion fN ist stetig. Die Funktion RN := f − fN ist ebenfalls stetig in I. Denn f¨ ur x ∈ I mit |x| ≤ < r ist |RN (x)| ≤
∞ n=N +1
|an |n < ε
f¨ ur ein gegebenes ε > 0, falls N hinreichend groß ist, f¨ ur x, x + h ∈ I also |RN (x + h) − RN (x)| < 2ε.
XI.1 Konvergenz von Potenzreihen Nun setze man
FN (x) :=
x
0
293
fN (t) dt
F (x) :=
und
x
0
f (t) dt.
Zu gegebenem ε > 0 und einem festen x = 0 aus dem Konvergenzintervall existiert ein N0 ∈ IN so, dass ε |f (t) − fN (t)| < |x| ur diese Werte gilt dann f¨ ur alle t mit |t| ≤ |x| und alle N > N0 . F¨
|F (x) − FN (x)| ≤
x 0
|f (t) − fN (t)| dt ≤ ε. x
Also ist
lim FN (x) = F (x) bzw.
N →∞
N →∞
x
fN (t) dt =
lim
0
lim fN (t) dt.
0
N →∞
Die hier erlaubte Vertauschung von Grenzwertbildung und Integration ben¨otigen wir auch im n¨achsten Beweisschritt. b) Die Behauptung folgt aus a) und aus dem Hauptsatz der Differenzial- und Integralrechung: F (x) − F (0) = = = Beispiel 2: Auf ] − 1; 1[ gilt man die Formel
lim (FN (x) − FN (0))
N →∞
lim
x
N →∞ 0 x
FN (t) dt =
lim fN (t) dt =
0 N →∞ ∞
n=0 ∞
xn =
1 und 1−x
nxn−1 =
n=1
x
lim FN (t) dt
N →∞ 0x 0 ∞
n=0
2
f (t) dt
xn
=
∞ n=1
nxn−1 , woraus
1 (1 − x)2
1 1 1 1 1 gewinnt. F¨ ur x = erh¨alt man 1 + 2 · + 3 · + 4 · + 5 · + . . . = 4 (vgl. IX.9). 2 2 4 8 16 ∞ ∞ xn+1 n Auf ] − 1; 1[ gilt x = , woraus man folgende Formel gewinnt: n=0 n=0 n + 1 ∞ xn n=1
F¨ ur x =
n
= − ln(1 − x)
1 1 1 1 1 1 erh¨alt man + + + + + . . . = ln 2. Satz 3 erlaubt es, oben 2 2 8 24 64 160
x = −1 zu setzen; dies liefert den Wert der leibnizschen Reihe: 1−
1 1 1 1 + − + − + . . . = ln 2. 2 3 4 5
XI Potenzreihen
294 ∞
Beispiel 3: Auf ] − 1; 1[ gilt
1 . 1 + x2
(−1)n x2n =
n=0
Differenziation liefert die Formel
∞
(−1)n−1 2nx2n−1 =
n=1
2x . (1 + x2 )2
1 2 3 4 An der Stelle x = ergibt dies 1 − + − + − . . . = 0,64. 2 4 16 64 ∞
Integration liefert die interessantere Formel
(−1)n
n=0
x2n+1 = arctan x. 2n + 1
Satz 3 erlaubt es, hier x = 1 zu setzen; man erh¨alt (vgl. X.8) π 1 1 1 1 + − + − +... = . 3 5 7 9 4
1−
∞ xn konvergiert u ¨berall auf IR. Differenziation n! n=0
Beispiel 4: Die Potenzreihe
f¨ uhrt diese Reihe in sich selbst u ur die durch diese Reihe dargestellte Funk¨ber. F¨ f tion f gilt also f = f bzw. (ln f ) = = 1. Es folgt ln f (x) = x + c, wegen f
f (0) = 1 also ln f (x) = x bzw. f (x) = ex . Es gilt daher (wie wir schon wissen) ex =
∞ xn n=0
n!
.
Wir wenden uns nun dem Rechnen mit Potenzreihen zu. Selbstverst¨andlich werden Potenzreihen im Innern ihres gemeinsamen Konvergenzintervalls durch gliedweise Addition und Vervielfachung addiert und vervielfacht:
∞
n=0
an x
n
+ c
∞
n=0
∞ n=0
bn x
n
=
an x n
=
∞ n=0 ∞ n=0
(an + bn )xn , can xn .
Die Multiplikation von Potenzreihen ist etwas komplizierter (Satz 6). Man denke dabei an die Multiplikation von Polynomen: (a0 + a1 x + a2 x2 + a3 x3 + . . . + an xn ) · (b0 + b1 x + b2 x2 + b3 x3 + . . . + bn xn ) = a0 b0 + (a0 b1 + a1 b0 )x + (a0 b2 + a1 b1 + a2 b0 )x2 + (a0 b3 + a1 b2 + a2 b1 + a3 b0 )x3 + . . . Satz 6: Zwei Potenzreihen werden im Innern ihrer Konvergenzintervalle folgendermaßen multipliziert:
∞
n=0
an x
n
·
∞
n=0
bn x
n
=
∞ n=0
cn xn
mit cn = a0 bn + a1 bn−1 + . . . + an b0 (n ∈ IN0 ).
XI.1 Konvergenz von Potenzreihen
295
Beweis: Da Potenzreihen im Innern ihrer Konvergenzintervalle absolut konvergieren, k¨onnen wir annehmen, dass die Summanden der Potenzreihen nichtnegativ sind. F¨ ur N ∈ IN sei AN =
N n=0
an xn ,
BN =
N n=0
bn x n ,
CN =
N n=0
cn xn
mit der oben definierten Folge (cn ). Dann ist 0 ≤ A2N B2N − C2N ≤ A2N (B2N − BN ) + (A2N − AN )B2N . Daraus ergibt sich wegen der Konvergenz der Folgen (An ) und (Bn ) aufgrund des Cauchy-Kriteriums lim C2N = A · B. 2 N →∞
Die oben definierte Folge (cn ) heißt Cauchy-Produkt der Folgen (an ) und (bn ). Beispiel 5: Hat ∞ n=0
an xn ·
∞ n=0
∞
an xn den Konvergenzradius r, dann gilt f¨ ur |x| < min(1, r)
xn =
n=0
∞ n=0
sn x n
∞
bzw.
n=0
an xn = (1 − x)
∞ n=0
sn x n
mit sn = a0 + a1 + a2 + . . . + an (n ∈ IN0 ). Ist etwa an = 1 und damit sn = n + 1 f¨ ur alle n ∈ IN0 , so erh¨alt man die schon oben gefundene Formel ∞
(n + 1)xn =
n=0
Beispiel 6: Die Folge (Bn ) sei rekursiv definiert durch B0 = 1 und n−1 i=0
1 . (1 − x)2
1 + 2B1 1 + 3B1 + 3B2 1 + 4B1 + 6B2 + 4B3 1 + 5B1 + 10B2 + 10B3 + 5B4
n Bi = 0 f¨ ur n > 1 i
(vgl. Tabelle). Dies ist die Folge der
= = = = .. .
0 0 0 0
bernoullischen Zahlen (Jakob Bernoulli, 1654–1705), welche in der Kombinatorik eine große Rolle spielen. F¨ ur alle x ∈ IR gilt ∞ Bn n=0
n!
xn =
ex
x , −1
denn die Koeffizienten cn des Produktes
x
(e − 1)
∞ Bn
n=0
n!
x
n
x B1 x2 B2 2 = x+ + + . . . · B0 + x+ x + ... 2! 3! 1! 2!
sind 1 f¨ ur n = 1 und 0 sonst.
XI Potenzreihen
296 Im n¨achsten Abschnitt betrachten wir Reihen der Form ∞ i=0
ai (x − x0 )i .
Auch diese heißen Potenzreihen, und zwar Potenzreihen mit der Entwicklungsmitte x0 .
Aufgaben 1. Man zeige, dass die Reihen
∞ n=0
an xn ,
chen Konvergenzradius haben.
∞
∞ an n nan xn den gleix und n=0 n + 1 n=0
2. Man bestimme den Konvergenzradius von
∞ n=0
an xn ; man untersuche in a)
und b) auch die Konvergenz auf dem Rand des Konvergenzintervalls. √ √ √ n! b) an = n + 1 − n c) an = 2n n d) an = n a) an = na n
3. Man bestimme den Konvergenzradius von αn =
∞
αn xn mit n=2 n log n
⎧ ⎪ ⎪ ⎨ +1
f¨ ur
⎪ ⎪ ⎩ −1
f¨ ur 22k+1 ≤ n < 22k+2
22k ≤ n < 22k+1
(k = 0, 1, 2, . . .)
Man zeige, dass die Reihe an beiden Enden des Konvergenzintervalls konvergiert, aber nicht absolut.
4. Man berechne die Bernoulli-Zahlen B1 , B2 , . . . , B10 . Man zeige, dass B2n+1 = 0 f¨ ur n ≥ 1.
5. Es sei C(x) =
∞
(−1)n
n=0
∞ x2n x2n+1 (−1)n und S(x) = . (2n)! (2n + 1)! n=0
Man zeige, dass die beiden Potenzreihen u ¨berall konvergieren, dass C = −S und S = C und dass f¨ ur alle x1 , x2 ∈ IR gilt: C(x1 )C(x2 ) − S(x1 )S(x2 ) = C(x1 + x2 ) ur alle x ∈ IR. Man leite daraus her, dass S(x)2 + C(x)2 = 1 f¨
6. Man erkl¨are die merkw¨urdige Formel
2 6 12 20 30 + + + + + . . . = 16. 1 2 4 8 16
XI.2 Taylor-Entwicklung
297
XI.2 Taylor-Entwicklung M¨ochte man eine (hinreichend oft) differenzierbare Funktion f in einer Umgebung einer Stelle x0 ∈ Df n¨aher untersuchen, so ist es hilfreich, sie durch einfache Funktionen gut zu approximieren. Als einfach“ soll dabei eine Polynomfunktion ” von m¨oglichst kleinem Grad gelten, als gut“ soll die Approximation gelten, wenn ” f und die approximierende Funktion im Wert und in m¨oglichst vielen Ableitungen an der Stelle x0 u ¨bereinstimmen. Die beste konstante Approximation ist p0 : x → f (x0 ), da p0 (x0 ) = f (x0 ). Die beste lineare Approximation ist p1 : x → f (x0 ) + f (x0 )(x − x0 ), da p1 (x0 ) = f (x0 ) und p1 (x0 ) = f (x0 ). Die beste quadratische Approximation ist f (x0 ) (x − x0 )2 , 2 da p2 (x0 ) = f (x0 ), p2 (x0 ) = f (x0 ) und p2 (x0 ) = f (x0 ) (Fig. 1). p2 : x → f (x0 ) + f (x0 )(x − x0 ) +
Man wird also nach Funktionen der Art pn : x →
n i=0
y
ai (x − x0 )i
suchen, welche in den ersten n Ableitungen mit den Ableitungen von f an der Stelle x0 u ¨bereinstimmen. Um die Gestalt der Koeffizienten ai zu finden, betrachten wir zun¨achst den einfachen Fall einer Polynomfunktion f vom Grad n, also n f (x) =
i=0
ci xi .
Man macht also den Ansatz f (x) =
n i=0
ai (x − x0 )i .
6
p1 . . . . .... ..... ... ... f . . . . . .... ... .. ........................... p2 . . . . . ............... ........... . . . . . ... .... .........................................u.............................................. p0 ..... ...... . . . . . ......... ............. . . . . ... .... ..... .......... x x0 .. .. .... ..
Fig. 1: Approximationspolynome
Setzt man x = x0 , so ergibt sich f (x0 ) = a0 . Differenziert man einmal und setzt dann x = x0 , so ergibt sich f (x0 ) = a1 . Differenziert man i-mal und setzt dann x = x0 , so erh¨alt man f (i) (x0 ) = i!ai . Schreibt man die Koeffizienten ai mit Hilfe dieser Beziehungen, so ist f (x) =
n f (i) (x0 ) i=0
i!
(x − x0 )i .
XI Potenzreihen
298
Diese sehr triviale Umformung gibt nun Anlass zu der Frage, ob man auch andere als nur Polynomfunktionen in dieser Weise darstellen kann, wobei nat¨ urlich anstelle der Summe eine Potenzreihe stehen m¨ usste. Betrachten wir zwei einfache Beispiele mit x0 = 0: Beispiel 1: F¨ ur
1 f (x) = 1−x gilt f (i) (x) =
=
∞
x
i
(x ∈] − 1; 1[)
i=0
i! , also f (i) (0) = i! (1 − x)i+1
und damit f (x) =
∞ f (i) (0) i=0
i!
xi .
Beispiel 2: F¨ ur f (x) = ex gilt f (i) (0) = 1 f¨ ur alle i. Damit ergibt sich die bekannte Reihe f¨ ur die e-Funktion (vgl. X.10 und XI.2): ex =
∞ f (i) (0) i=0
i!
xi =
∞ xi i=0
i!
.
Satz 1 (Taylor-Entwicklung, nach Brook Taylor, 1685–1731): Es sei f eine auf dem Intervall I (n + 1)-mal stetig differenzierbare Funktion und x0 ein innerer Punkt von I. Dann gilt f¨ ur x ∈ I die taylorsche Formel f (x) =
n f (i) (x0 ) i=0
i!
(x − x0 )i + Rn (x, x0 )
mit dem taylorschen Restglied x
Rn (x, x0 ) =
1 (x − t)n f (n+1) (t) dt. n! x 0
Beweis: Wir f¨ uhren den Beweis induktiv. Der Fall n = 0 ist klar, denn es gilt x
f (x) = f (x0 ) +
f (t) dt. Der Induktionsschritt besteht in folgender Umformung
x0
des Restglieds mit Hilfe partieller Integration: x
Rk (x, x0 ) =
1 (x − t)k f (k+1) (t) dt k! x 0
⎛
x
⎞
x
(x − t)k+1 (k+2) 1 ⎝ −(x − t)k+1 (k+1) = (t) + (t) dt⎠ f f k! k+1 k + 1 x0 x 0
x
(x0 ) f 1 = (x − t)k+1 f (k+2) (t) dt. (x − x0 )k+1 + (k + 1)! (k + 1)! x (k+1)
0
2
XI.2 Taylor-Entwicklung
299
Ist f auf I beliebig oft differenzierbar, dann konvergiert die Folge der Taylor-
n f (i) (x ) ∞ f (i) (x ) 0 0 (x − x0 )i auf I gegen die Potenzreihe (x − x0 )i , i! i! i=0 i=0 ∞ f (i) (x ) 0 (x − x0 )i . Dies falls n→∞ lim Rn (x, x0 ) = 0 auf I gilt. Dort ist dann f (x) = i! i=0
Polynome
ist die Taylor-Reihe von f bez¨ uglich der Entwicklungsmitte x0 .
Satz 2 (Hinreichendes Kriterium f¨ ur die Konvergenz der Taylor-Reihe): Die Funktion f sei auf I beliebig oft differenzierbar, ferner seien x, x0 ∈ I. Existieren dann ein K > 0 und ein c > 0 mit |f (i) (t)| ≤ Kci f¨ ur alle t zwischen x und x0 und alle i ∈ IN, dann ist lim(Rn (x, x0 )) = 0, also f (x) =
∞ f (i) (x0 ) i=0
i!
(x − x0 )i .
Beweis: Wir ben¨otigen den folgenden Mittelwertsatz der Integralrechnung, der in XI.6 Aufgabe 10 bewiesen werden sollte, aber auch anschaulich klar ist: Sind f und g stetig auf [a; b], dann gibt es ein ξ ∈]a; b[ mit
b
b
f (x)g(x) dx = f (ξ) g(x) dx. a
Aus diesem Satz folgt, dass eine Zahl θ ∈]0; 1[ existiert mit 1 x Rn (x, x0 ) = (x − t)n f (n+1) (t)dt n! x0 f (n+1) (x0 + θ(x − x0 )) x (x − t)n dt = n! x0 f (n+1) (x0 + θ(x − x0 )) = (x − x0 )n+1 . (n + 1)! Die Behauptung folgt nun aus |Rn (x, x0 )| ≤ K f¨ ur a ∈ IR.
|c(x − x0 )|n und lim n→∞ (n + 1)!
a
an (n + 1)!
=0 2
Beispiel 3: Die Funktion f : x → ex l¨asst sich an jeder Stelle x0 ∈ IR als Entwicklungsmitte als Taylor-Reihe darstellen. F¨ ur x0 = 0 ist die Darstellung in Beispiel 2 angegeben; hier beachte man, dass |f (i) (t)| ≤ e|x| f¨ ur alle t ≤ |x|. Wegen ex−x0 = ex e−x0 gilt damit ∞ x0 e ur jedes x0 ∈ IR. (x − x0 )i f¨ ex = i! i=0 Beispiel 4 (vgl. Aufgabe 5 in XI.1): F¨ ur die Sinusfunktion f : x → sin x gilt f (2i) (0) = 0 und f (2i+1) (0) = (−1)i f¨ ur alle i ∈ IN0 . Also ist sin x =
∞
(−1)i
i=0
Entsprechend ergibt sich cos x =
∞ i=0
x2i+1 f¨ ur alle x ∈ IR. (2i + 1)! (−1)i
x2i f¨ ur alle x ∈ IR. (2i)!
300
XI Potenzreihen
Beispiel 5: Die Funktion f mit
1 y = e x2 −
y
6
1 − f (x) = e x2
..................................... .... .... .... .... .... ....1.... .... .... .... .... .... .... .................................... ............ ....... ......... .......... . . . . ........ . . . ..... ....... ..................................... -
f¨ ur x = 0 und f (0) = 0 (Fig. 2) x ist zwar u ¨berall unendlich oft differenzierbar, aber nicht als Fig. 2: Zu Beispiel 5 Taylor-Reihe mit der Entwicklungsmitte 0 darstellbar. Es gilt n¨amlich f (i) (0) = 0 f¨ ur alle i ∈ IN, alle Taylorpolynome sind also das Nullpolynom, und die Funktion stimmt immer mit ihrem Restglied u ¨berein. Beispiel 6: Wir wollen die Funktion f : x → ln(1 + x) mit der Entwicklungsmitte 0 im Intervall ] − 1; 1] betrachten. Es gilt dort f (i) (x) = (−1)i+1 also
(i − 1)! , (1 + x)i
f (0) (0) f (i) (0) (−1)i+1 = 0 und = f¨ ur alle i ∈ IN. 0! i! i
Zur Absch¨atzung des Restglieds Rn (x, 0) der Taylor-Entwicklung im Intervall ] − 1; 1] ist Satz 2 nicht geeignet, wir verfahren vielmehr folgendermaßen: Der schon oben benutzte Mittelwertsatz der Integralrechnung liefert Rn (x, 0) =
x x x 1 (−1)n n! (t − x)n (θx − x)n (x − t)n dt dt = dt = n! (1 + t)n+1 (1 + t)n+1 (1 + θx)n+1 0
0
0
mit 0 < θ < 1, also gilt f¨ ur |x| < 1 |Rn (x, 0)| = |x|
n+1
(1 − θ)n |x|n+1 < |1 + θx|n+1 1 − |x|
1−θ 1 − θ|x|
n
0, Maximum, falls f (n) (x0 ) < 0. ur f (n) (x0 ) < 0 verl¨auft der Beweis analog), also Beweis: Es sei f (n) (x0 ) > 0 (f¨ f (n) (x0 ) = lim
x→x0
f (n−1) (x) − f (n−1) (x0 ) > 0. x − x0
Wegen der Stetigkeit von f (n−1) und wegen f (n−1) (x0 ) = 0 existiert ein δ > 0 mit f (n−1) (x) > 0 f¨ ur x0 − δ < x < x0 + δ, x − x0 ur x0 < x < x0 + δ und f (n−1) (x) < 0 f¨ ur x0 − δ < x < x0 . also f (n−1) (x) > 0 f¨ Aus der taylorschen Formel f (x) = f (x0 ) +
f (n−1) (x0 + θ(x − x0 )) (x − x0 )n−1 (n − 1)!
mit 0 < θ < 1 folgt f¨ ur gerades n: ur x0 − δ < x < x0 + δ, f (x) > f (x0 ) f¨ ur ungerades n folgt dagegen f hat also ein lokales Minimum an der Stelle x0 . F¨ ur x0 − δ < x < x0 f (x) < f (x0 ) f¨
und f (x) > f (x0 ) f¨ ur x0 < x < x0 + δ, 2
f hat also kein Extremum an der Stelle x0 .
Da die Extrempunkte der Ableitungsfunktion f die Wendepunkte von f sind, hat man damit auch ein notwendiges und hinreichendes Kriterium f¨ ur die Wendepunkte von f . Hier muss die erste nichtverschwindende Ableitung von f (abgesehen von f (x0 )) von ungerader Ordnung sein. Ist außerdem noch f (x0 ) = 0, dann liegt ein Sattelpunkt vor (Fig. 3).
y ..... y = f (x) 6 ...
... Maximalpunkt ... s .................................................. ... .... .....Sattelpunkt . . s ... . . . ..... ..... Wendepunkt .......................s.................. .................s.................. ....... ..... Minimalpunkt ..... .. x Fig. 3: Extremal- und Wendepunkte
XI Potenzreihen
302
Aufgaben 1. Man bestimme die Taylorreihe f¨ur die Funktion mit dem angegebenen Funktionsterm und der angegebenen Entwicklungsmitte. Man untersuche auch die Konvergenz auf dem Rand des Konvergenzintervalls. 1 x 1 1 a) ; x0 = 0 b) ; x0 = ; x0 = 0 c) 1+x 1−x (1 − x)2 2 d)
1 ; x0 = 1 x3
e)
1−x ; x0 = 0 1+x
f) ln
1−x ; x0 = 0 1+x
2. Man beweise, dass eine auf IR definierte Funktion genau dann ganzrational vom Grad ≤ n ist, wenn f (n+1) (x) = 0 f¨ ur alle x ∈ IR gilt.
3. Man bestimme die Extrema der Funktionen mit dem angegebenen Funktionsterm in der jeweils gr¨oßtm¨oglichen Definitionsmenge. a) x4 − 3x2 e)
n i=1
ai (x − bi )2
b) x5 − 16x2 2
f) xex +
c) xx 0
x
d)
ax + b cx + d
2
(1 + 4t)et dt
XI.3 Numerische Berechnungen Funktionswerte von nichtrationalen Funktionen, wie es etwa die Wurzelfunktionen, Exponentialfunktionen und trigonometrischen Funktionen sind, berechnet man in der Regel mit Iterationsverfahren (vgl. X.4) oder mit Reihenentwicklungen, also mit Hilfe von elementaren Rechenoperationen. Ebenso geschieht es auch in einem elektronischen Rechner, wenn wir etwa die Wurzeltaste benutzen. Berechnung der eulerschen Zahl: Die Zahl e kann man mit Hilfe der Reihe ∞ 1 n 1 e = berechnen. F¨ ur sn = gilt i=0
i!
sn < e < sn + e − sn < =
1 , denn n!n ∞ 1
i=0
i!
1 (n + 1)! i=0 (n + 1)i n+1 1 1 · = . (n + 1)! n n!n
sn ≈ + + + + + + + + + + +
1,000000000000 1,000000000000 0,500000000000 0,166666666666 0,041666666666 0,008333333333 0,001388888888 0,000198412690 0,000024801587 0,000002755732 0,000000275573 0,000000025052
Ein achtstelliger Taschenrechner liefert e = 2, 7182818. Um diese Genauigkeit aus e ≈ 2,718281826 der Reihendarstellung zu gewinnen, muss ullt. man n so w¨ahlen, dass n!n > 5 · 108 ist. Mit n = 11 ist diese Bedingung erf¨ Man erh¨alt damit 2,718281826 < e < 2,718281830 (vgl. obige Tabelle).
XI.3 Numerische Berechnungen
303
Berechnung der Kreiszahl: Zur Berechnung der Zahl π kann man die TaylorEntwicklung von arctan in ] − 1; 1] benutzen. Es ist dort arctan x =
∞
(−1)i
i=0
denn (arctan x) =
x2i+1 , 2i + 1
∞ 1 = (−1)i x2i , 1 + x2 i=0
woraus durch Integration obige Reihendarstellung folgt (vgl. XI.1). F¨ ur x = 1 folgt aufgrund des abelschen Grenzwertsatzes π 1 1 1 = 1 − + − + −... . 4 3 5 7 Diese Reihe konvergiert aber sehr langsam; man m¨ usste mehr als 1000 Glieder aufsummieren, um π auf drei Nachkommastellen genau zu berechnen. Schon etwas 1 besser konvergiert die arctan-Reihe f¨ ur x = √ : 3
π 1 1 1 1 = √ 1− + − + −... . 6 9 45 567 3 1 5
Wesentlich besser ist folgendes Verfahren: Ist α := arctan , dann ist tan 2α =
5 2 tan α = 2 1 − tan α 12
und
Also ist 4α nur geringf¨ ugig gr¨oßer als tan β =
tan 4α =
2 tan 2α 120 = . 2 1 − tan 2α 119
π π . Wir setzen β := 4α− ; dann ist 4 4
120 −1 tan 4α − tan π4 1 119 = . π = 1 + tan 4α · tan 4 239 1 + 120 119
Jetzt berechnen wir π = 4(4α − β) = 16α − 4β mit Hilfe der arctan-Reihe:
π = 16
1 1 1 1 1 + − +... − 4 + −... . − − 5 3 · 53 5 · 55 239 3 · 2393
Schon die ersten Glieder liefern gute N¨aherungen; beispielsweise ist
1 1 1184 4 12601 1 − = − =3 = 3,14059693 . . . . −4· 16 5 3 · 53 239 375 239 89625
XI Potenzreihen
304 Berechnung der Logarithmen: Es gilt
ln
1+x 1−x
= (ln(1 + x)) − (ln(1 − x)) =
1 1 + 1+x 1−x
und f¨ ur i ∈ IN
ln
1+x 1−x
(i)
= (−1)i−1
(i − 1)! (i − 1)! + . (1 + x)i (1 − x)i
Damit erh¨alt man in ] − 1; 1[ die Taylor-Entwicklung ln F¨ ur x =
∞ 1+x x2i+1 =2 . 1−x i=0 2i + 1
1 ergibt sich 3
ln 2 = 2
∞
1 . 2i+1 (2i + 1)3 i=0
Bezeichnet man das i-te Glied dieser Reihe mit ai und setzt sn := rn = ln 2 − sn , dann ist
0 < rn < an+1 1 +
n i=0
ai sowie
1 1 1 9 1 + + . . . < an · 2 · = an . 3 9 3 8 8
Summiert man die ersten 8 Glieder auf, so ergibt sich 0,6931471 < ln 2 < 0,6931472. Nun kann man die Werte ln k der Reihe nach f¨ ur k = 3, 4, 5, . . . berechnen, wenn man die Reihe ln(k + 1) = ln k + 2
∞
1 (2i + 1)(2k + 1)2i+1 i=0
benutzt, welche sich aus obiger Taylor-Reihe f¨ ur x = ist wegen ln 10 = ln 2 + ln 5
ln 11 = ln 2 + ln 5 + 2
1 ergibt. Beispielsweise 2k + 1
1 1 1 + + + ... . 21 3 · 213 5 · 215
Bricht man die Summe nach dem dritten Summanden ab, dann ist der Fehler kleiner als 1 1 21 2· · 7 · < 2 · 10−10 . 7 21 20
XI.3 Numerische Berechnungen
305
Berechnung von Wurzeln: Wurzeln kann man mit Hilfe von Iterationsverfahren (vgl. X.4) oder mit Hilfe der Logarithmen berechnen, man kann sie aber auch mit Hilfe von Reihenentwicklungen gewinnen. Dazu ben¨otigen wir die binomische Reihe
∞ α i α (1 + x) = x, i i=0 wobei α eine beliebige reelle Zahl ist und
α α(α − 1)(α − 2) · . . . · (α − i + 1) := i i!
α := 1 vereinbart wird. Der Konvergenzradius der binomischen Reihe 0 ist 1. Man beachte, dass auf ] − 1; 1[ sowie
((1 + x)α )(i) = α(α − 1)(α − 2) · . . . · (α − i + 1)(1 + x)α−i gilt. Wegen
− 12 (−1) i i
=
1 · 3 · 5 · . . . · (2i − 1) 2 · 4 · 6 · . . . · (2i)
ist also f¨ ur |x| < 1 √
15 3 1 1 = 1 + x + x2 + x 3 + . . . . 2 8 48 1−x
Damit kann man Quadratwurzeln berechnen, wenn man sie geschickt mit Hilfe 1 des Terms √ und m¨oglichst kleinem x darstellt. Beispielsweise ist 1−x √ 7 2= · 5 und daher
√
50 7 1 = · 49 5 1−
1 50
7 1 1 15 1 3 1 1+ · + + ... . + · · 5 2 50 8 502 48 503 Schon die vier ersten Summanden liefern den sehr guten Wert 1,4142135; der Taschenrechner liefert dieselben sieben Nachkommastellen. √ Allgemein kann man p n berechnen, indem man dies umformt zu 2=
1
r(1 ± δ)± p mit einer geschickt gew¨ahlten rationalen Zahl r und einem m¨oglichst kleinen Wert 1 von δ und die binomische Reihe mit α = ± verwendet. p
XI Potenzreihen
306
Berechnung von Sinuswerten: Grunds¨atzlich kann man die Werte der Sinusfunktion aus ∞ x2n+1 sin x = (−1)n (2n + 1)! n=0 berechnen, wobei die Qualit¨at der Konvergenz nat¨ urlich von der Gr¨oße von x π abh¨angt. F¨ ur x = α := (= 1o ) ergibt sich bei Abbrechen der Reihe nach dem 180 Summand mit dem Index n ein Fehler, der kleiner als der Betrag des n¨achsten Gliedes ist, da es sich um eine alternierende Reihe mit monoton fallenden Betr¨agen der Glieder handelt. Wegen α7 < 2,5 · 10−16 7! α3
α5
ergibt sich f¨ ur sin 1o schon mit α − + ein Wert von h¨oherer Genauigkeit 3! 5! als mit dem Taschenrechner, wenn man π mit einer entsprechenden Genauigkeit einsetzt.
Aufgaben 1. a) Man berechne
10 1 25 4 81 1 = − ln 1 − = − ln 1 − = ln 1 + , ln , ln 9 10 24 100 80 80 m¨oglichst genau, stelle dann ln 2, ln 3, ln 5 als ganzzahlige Linearkombination dieser Zahlen dar und bestimme diese m¨oglichst genau. ¨ b) Beim Ubergang von den briggschen Logarithmen (Zehnerlogarithmen) zu den nat¨ urlichen Logarithmen muss man die briggschen Logarithmen mit einer festen Zahl M multiplizieren. Man bestimme diese Zahl M mit Hilfe der Ergebnisse aus a) m¨oglichst genau. √ 2. a) Man bestimme N¨aherungen von 2 mit Hilfe des Ansatzes ln
√
1
141 119 − 2 2= 1− . 100 20 000 √ b) Man bestimme N¨aherungen von 3 mit Hilfe des Ansatzes √
1 732 176 3= 1− 1 000 3 000 000
− 1 2
√
.
3. Man bestimme N¨aherungen von 3 3 mit Hilfe des Ansatzes √ 3
10 29 3= 1+ 7 1 000
1 3
.
XI.4 Weitere Reihenentwicklungen
307
XI.4 Weitere Reihenentwicklungen Bei der Taylor-Entwicklung in XI.2 haben wir Funktionen betrachtet, die sich — im Fall der Entwicklungsmitte 0 — in einem geeigneten Intervall eindeutig als unendliche Linearkombination“ der Funktionen mit den Termen x0 , x1 , x2 , x3 , . . . ” darstellen lassen. Diese Terme bilden also eine (unendliche) Basis des Vektorraums der betrachteten Funktionen. Sind a0 , a1 , a2 , a3 , . . . die Entwicklungskoeffizien” ∞ ten“ von f , ist also f (x) = ai xi in einem gewissen Intervall, dann kann man i=0
aufgrund des Identit¨atssatzes f¨ ur Potenzreihen die Funktion f auch eindeutig durch die Folge (an ) kennzeichnen. Eine andere Basis f¨ ur diesen Raum bilden die x0 x1 x2 x3
Funktionen mit den Termen , , , , . . . (Aufgabe 1). W¨ahlt man als Basis 0! 1! 2! 3! die Funktionen mit den Termen x x3 x2 , ,..., , 1 − x 1 − x 2 1 − x3 dann erh¨alt man die sogenannten Lambert-Reihen (nach Johann Heinrich Lambert, 1728–1777). Die Lambert-Reihe ∞ i=1
ai
xi 1 − xi
konvergiert nat¨ urlich nicht f¨ ur |x| = 1. Diese Reihe konvergiert f¨ ur |x| = 1 aber stets dann, wenn Σ(an ) konvergiert. Ist dagegen Σ(an ) nicht konvergent, dann konvergiert die Lambert-Reihe genau dort, wo die Potenzreihe
∞ i=1
ai xi konvergiert,
wobei aber die Stellen ±1 auszuschließen sind. F¨ ur |x| < 1 besteht zwischen Lambert-Reihen und Potenzreihen der Zusammenhang ∞ i=1
ai
∞ xi = Ai x i , i 1−x i=1
ur welche d ein Teiler von n ist (Aufgabe 2). wobei An die Summe aller ad ist, f¨ Von wesentlich anderem Typ sind die Dirichlet-Reihen (nach Peter Gustav Lejeune-Dirichlet, 1805–1859), welche wir nun kurz vorstellen wollen. Die Basis bilden hier die Funktionen mit den Termen 1 1 1 , , , ... . 1x 2x 3x Die Funktion mit der Koeffizientenfolge (1) haben wir schon in X.7 Aufgabe 4 als riemannsche Zetafunktion kennengelernt: ζ(x) =
∞ 1 i=1
ix
XI Potenzreihen
308
Wir wissen, dass diese spezielle Dirichlet-Reihe f¨ ur x > 1 konvergiert und f¨ ur x ≤ 1 divergiert. Der Konvergenzbereich ist also ]1; ∞[. Die Dirichlet-Reihe ∞ (−1)i−1
ix
i=1
ist divergent f¨ ur x ≤ 0, konvergent, aber nicht absolut konvergent f¨ ur 0 < x ≤ 1 und absolut konvergent f¨ ur 1 < x. Dieses Konvergenzverhalten ist typisch f¨ ur Dirichlet-Reihen: Es gibt eine Abszisse x0 , welche den Divergenzbereich vom Konvergenzbereich trennt, und es gibt eine Abszisse x1 , ab welcher absolute Konvergenz herrscht. Dies ist anders als bei Potenzreihen, wo ja der Konvergenzradius gleichzeitig die Grenze der absoluten Konvergenz angibt. Die Abszissen der Konvergenz und der absoluten Konvergenz k¨onnen zusammenfallen, wie es bei der die Zetafunktion definierenden Reihe der Fall ist; sie k¨onnen aber auch verschieden sein, wie obiges Beispiel zeigt. Wir werden zeigen, dass sie aber h¨ochstens den Abstand 1 haben k¨onnen, sofern die Reihe u ¨berhaupt konvergiert. Die Reihe ∞ 1 i=1
∞ i i
bzw.
ii ix
i=1
ix
konvergiert u ¨berall bzw. nirgends. Diese langweiligen F¨alle wollen wir im folgenden Satz ausschließen. Satz 1: Die Dirichlet-Reihe
∞ ai i=1
ix
sei weder nirgends noch u ¨berall konvergent. Dann existieren Zahlen λ, l, so dass die Reihe f¨ ur x < λ divergiert, f¨ ur x > λ konvergiert, f¨ ur x < l nicht absolut konvergiert und f¨ ur x > l absolut konvergiert. Dabei gilt 0 ≤ l − λ ≤ 1. Beweis: Die Reihe sei an der Stelle ξ absolut konvergent. Dann ist sie auch an jeder Stelle x > ξ absolut konvergent, denn dann ist n n a a i ≤ i. x ξ i=1
i
i
i=1
Die Menge der Stellen absoluter Konvergenz ist nach unten beschr¨ankt, da die Reihe nicht u ¨berall konvergiert. Setzen wir l gleich dem Infimum dieser Stellen, dann gilt die Behauptung des Satzes f¨ ur l. Nun sei die Reihe an der Stelle η 1 konvergent (nicht notwendig absolut konvergent). F¨ ur x > η ist eine x−η Nullfolge mit positiven Gliedern, so dass mit
∞ ai i=1
∞ ai i=1
ix
=
∞ ai i=1
iη
·
iη
1 ix−η
n
auch
XI.4 Weitere Reihenentwicklungen
309
konvergiert. Ist λ das Infimum der Konvergenzstellen, dann folgt die Behauptung des Satzes u ¨ber λ. Ist schließlich
∞ ai i=1
ix
konvergent, dann ist
δ > 1 absolut konvergent, woraus l − λ ≤ 1 folgt.
∞ ai f¨ ur jedes x+δ i i=1
2
Periodische Funktionen mit nicht allzu schlimmen“ Unstetigkeiten kann man ” ¨ durch Uberlagerung“ von Sinus- und Kosinuskurven ( Schwingungen“) darstel” ” len. Zun¨achst wollen wir anhand einer heuristischen Betrachtung herausfinden, ¨ wie eine solche Uberlagerung aussehen k¨onnte. Die Funktion f sei zun¨achst auf dem Intervall [−π; π] definiert und dann periodisch fortgesetzt mit der Periode 2π. Die Kosinus- und Sinusfunktionen mit den Termen cos nx, sin nx (n ∈ IN) sind periodisch mit der Periode 2π. Wir nehmen an, es g¨abe eine Darstellung von f der Form f (x) = c +
∞
n=1
an cos nx + bn sin nx.
Wir nehmen weiterhin an, man d¨ urfe diese Gleichung gliedweise u ¨ber [−π; π] π π cos nx dx = sin nx dx = 0 ergibt sich zun¨achst integrieren. Wegen π
−π
−π
f (x) dx = 2πc und damit der Wert von c. Multipliziert man obige Gleichung −π
mit cos kx oder sin kx (k ∈ IN0 ) und integriert sie u ¨ber [−π; π], dann ergeben sich wegen π
cos kx sin nx dx = 0 −π
und
π
π
cos kx cos nx dx = −π
sin kx sin nx dx = −π
0 f¨ ur k = n, π f¨ ur k = n
(Produktintegration!) die Koeffizienten π 1 an = f (t) cos nt dt, π −π
π 1 bn = f (t) sin nt dt. π −π
¨ Diese Uberlegungen werden im nun folgenden Satz pr¨azisiert. Den Beweis dieses Satzes wollen wir aber, obwohl er nicht u ¨berm¨aßig kompliziert ist, hier u ¨bergehen. Die auftretende Reihe nennt man eine Fourier-Reihe (nach Jean Baptiste Joseph Fourier, 1768–1830) und spricht von der Fourier-Entwicklung der Funktion f . Satz 2: Die auf IR definierte Funktion f habe folgende Eigenschaften: • f (x + 2π) = f (x) f¨ ur alle x ∈ IR; • f ist in ] − π; π[ bis auf endlich viele Sprungstellen stetig;
XI Potenzreihen
310 • ist s eine Sprungstelle von f , dann ist 1 f (s) = lim− f (x) + lim+ f (x) ; x→s 2 x→s
• f ist in ] − π; π[ st¨ uckweise stetig differenzierbar, ist also insbesondere nur an endlich viele Stellen in ] − π; π[ nicht differenzierbar. Dann konvergiert die Reihe ∞ a0 + an cos nx + bn sin nx 2 n=1 mit a0 =
π π π 1 1 1 f (t) dt, an = f (t) cos nt dt, bn = f (t) sin nt dt π π π −π
−π
−π
(n ∈ IN) an jeder Stelle x ∈ IR und stellt auf IR die Funktion f dar. In den folgenden Beispielen geben wir stets f (x) in ] − π; π[ an und denken uns dies gem¨aß den Bedingungen in obigem Satz periodisch fortgesetzt. Ist f eine ungerade Funktion, ist also f (−x) = −f (x), dann sind die Koeffizienten an alle gleich 0, weil dann auch x → f (x) cos nx eine ungerade Funktion ist. Ist f eine gerade Funktion, ist also f (−x) = f (x), dann sind die Koeffizienten bn alle gleich 0, weil dann auch x → f (x) sin nx eine ungerade Funktion ist. Beispiel 1 (Fig. 1): Es sei f (x) = x. Weil diese Funktion f ungerade ist, gilt an = 0 f¨ ur alle n ∈ IN0 . Ferner ist ⎛
⎞
π π 2 1 1 −t cos nt π 1 t sin nt dt = ⎝ − + cos nt dt⎠ = (−1)n+1 . bn = π π n n n −π −π
−π
Es ergibt sich
f (x) = 2 y6 q
−π
sin x sin 2x sin 3x − + − +... . 1 2 3 y
y=x q
π
q -
2π x
Fig. 1: Zu Beispiel 1
In Fig. 2 sind die Graphen der ersten N¨aherungsfunktionen im Intervall [0; π] skizziert, und zwar
(3) (2).... .......... ..... (1) .. .... .... ................................... ..... . . . . ... .. .... ... .. . ... ... .......... ... ... .. .. ..... ......... ..... .... .... . . ...... .... .. ... ........ ...... ... .. . ............... ...... .. ...... ... .. ............. .... . . .. . ......... ....................... ..... ...... ... -x ................. π 6
Fig. 2: Zu Beispiel 1
XI.4 Weitere Reihenentwicklungen
311
(2) x → 2 sin x −
(1) x → 2 sin x,
sin 2x 2
,
(3) x → 2 sin x −
sin 2x sin 3x + 2 x
π
Setzt man x = in der Fourier-Entwicklung von f , so ergibt sich die leibnizsche 2 Reihe: π 1 1 = 1 − + − +... 4 3 5 Beispiel 2: Es sei f (x) = x2 . Die Funktion f ist gerade. Es ergibt sich 2 a0 = π 2 , 3 also
π 4 2 2 an = t cos nt dt = (−1)n 2 , π n 0
cos x cos 2x cos 3x π2 f (x) = − + − +... . −4 3 12 22 32
(Aus dieser Reihe ergibt sich durch gliedweise Differenziation die Reihe in Beispiel 1; man m¨ usste aber zun¨achst kl¨aren, ob diese Operation zul¨assig ist.) In Fig. 3 ist der Graph der Funktion f und der ersten (nicht-konstanten) Approximation x →
π2 − 4 cos x dargestellt. 3
2
y =π3 − 4 cos x .. ....... ....... ....... ....... ....... ... ..... ... ... ..... ... ..... ... ..... ... ..... ... ... .. ... .. ... .. ... .. ... .. ... . ... . x ... . . ... . ... . . ... .. ... .... .. .. ... .. ... .. ... ... ... π ... ...
y = f (x) . y . . . .... .. ........ 6 ........ ........ ........ .. ... ..... ... .... ... ..... .. .... .. ... .. ... .. ... .. . ... . . ... ... .... ... ..... ... .... ... .... .... ... .. ... .. ... .. . .... ... .... .. ....... ....... .. ...... ....... ...... -x π
y6
Fig.3: Zu Beispiel 2
Setzen wir x = 0, so erhalten wir 1 1 1 π2 . − + − + . . . = 12 22 32 12 Addieren wir die (ebenfalls absolut konvergente) Reihe
1 1 1 1 1 1 1 + 2 + 2 + ... = 2 2 + 2 + 2 + ... , 2 2 1 2 3 2 4 6 so erhalten wir das schon fr¨ uher angek¨ undigte Resultat ∞ 1 n=1
n2
=
π2 . 6
.
XI Potenzreihen
312 Beispiel 3: Es sei f (x) = cos αx mit α ∈ ZZ. Wegen π
π
cos αt cos nt dt = 0
1 (cos(α + n)t + cos(α − n)t) dt 2 0
1 sin(α + n)π sin(α − n)π + 2 α+n α−n 1 1 1 α sin απ = = (−1)n 2 sin απ cos nπ − 2 α+n α−n α − n2 =
erh¨alt man cos αx =
2α sin απ π
1 cos 2x cos x + 2 − +... . − 2 2 2 2α α −1 α − 22
An den Stellen ±π ist diese Funktion stetig. Setzt man x = π ein und schreibt dann x f¨ ur α, dann ergibt sich π cot πx −
1 1 1 1 + 2 + 2 + ... . = −2x 2 2 2 x x −n x −2 x − 32
Es ist erlaubt, diese Reihe gliedweise u ¨ber ein Intervall [0; x] mit 0 ≤ x < 1 zu integrieren, wobei auf der linken Seite ein uneigentliches Integral steht; man erh¨alt
∞ sin πx x2 ln = ln 1 − 2 . πx n n=1 ¨ Ubergang zur Exponentialfunktion liefert
∞ sin πx x2 1− 2 . = πx n n=1
An dieser Zerlegung des Sinus in ein unendliches Produkt (vgl. IX.11) erkennt 1 man unmittelbar die Nullstellen der Sinusfunktion. F¨ ur x = erh¨alt man 2
1=
π 2
∞
(2n − 1) · (2n + 1) 2n · 2n n=1
und damit das wallissche Produkt (vgl. Abschnitt IX.11) π 2 2 4 4 6 6 8 8 = · · · · · · · · ... . 2 1 3 3 5 5 7 7 9 Als Anwendung der wallisschen Formel wollen wir nun die stirlingsche Formel (nach James Stirling, 1692–1770) beweisen, welche wir schon in IX.5 erw¨ahnt haben. Dazu untersuchen wir zun¨achst den Zusammenhang zwischen ln n! =
n i=1
n
ln i
ln x dx.
und 1
XI.4 Weitere Reihenentwicklungen
313 n
Eine gute N¨aherung f¨ ur das Integral
ln x dx = n ln n − n + 1 ist
1 n−1 i=1
n 1 1 ln i − ln n, (ln i + ln(i + 1)) = 2 2 i=1
wie man erkennt, wenn man das Integral u ¨ber dem Intervall [i; i + 1] durch den Fl¨acheninhalt eines Trapezes ersetzt. Es ergibt sich also n
ln i = n +
i=1
wobei die Zahlen Rn :=
n−1 i=1
1 ln n − n + 1 − Rn , 2
ri mit i+1
ri := i
1 ln x dx − (ln i + ln(i + 1)) 2
eine konvergente Folge bilden. Denn 1 ri = (i + 1) ln(i + 1) − i ln i − 1 − (ln i + ln(i + 1)) 2 1 1 = i+ ln 1 + −1 2 i 1 1 1 1 1 = i+ − 2 + 3 − 4 + −... − 1 2 i 2i 3i 4i 1 1 1 1 < i+ − 2 + 3 −1 2 i 2i 3i 1 1 = + . 12i2 6i3 ¨ Ubergang zur Exponentialfunktion liefert nun √ n! = nn ne−n e1−Rn . Der Grenzwert
n!en lim e1−Rn β := n→∞ lim √ n = n→∞ nn existiert, weil lim Rn existiert. Um ihn mit der wallisschen Formel zu berechnen, n→∞ formen wir diese zun¨achst geschickt um: π 2 · 4 · 6 · . . . · (2n − 2) √ 2n = lim n→∞ 3 · 5 · 7 · . . . · (2n − 1) 2 22 42 62 · . . . · (2n − 2)2 √ = lim 2n n→∞ (2n − 1)! 22 42 62 · . . . · (2n)2 √ = lim , n→∞ (2n)! 2n
XI Potenzreihen
314 also
√ (n!)2 22n √ = π. n→∞ (2n)! n lim
Damit ergibt sich √
Also ist β =
√
√ (n!)2 22n 2n en en n2n π = n→∞ lim √ · · √ √ · 2n · n n n (2n)! n n n 2 e √
2 n!en (2n)2n 2n 1 √ √ = n→∞ lim n n n (2n)!e2n 2 β 1 1 = β2 · · √ = √ β 2 2
2π und damit √
n
n e in dem Sinne, dass der Quotient dieser beiden Ausdr¨ ucke f¨ ur n → ∞ den Grenzwert 1 hat. Schon f¨ ur kleine Werte liefert die stirlingsche Formel gute N¨aherungen; es ergibt sich beispielsweise 10! ≈ 3,6 · 106 mit einem relativen Fehler von weniger als 1%. n! ≈
Aufgaben
1. Reihen mit der Basis multiplizieren:
2πn
xi i ∈ IN0 kann man in ihrem Konvergenzbereich i!
∞ n=0
an
∞ ∞ xn xn xn bn cn . · = n! n=0 n! n! n=0
Wie gewinnt man die Folge (cn ) aus den Folgen (an ) und (bn )? Man beweise die Formel
n = 2n mit Hilfe der Entwicklung von e2x . i=1 i n
2. a) Man beweise: Es sei |x| < 1, ferner (an ) eine Zahlenfolge und An =
d|n
ad
(Summation u ¨ber alle Indizes, die Teiler von n sind). Dann ist ∞ n=1
an
∞ xn = An x n . 1 − xn n=1
b) F¨ ur n ∈ IN sei ϕ(n) die Anzahl der zu n teilerfremden nat¨ urlichen Zahlen zwischen 1 und n (Euler-Funktion). Es gilt ϕ(d) = n f¨ ur alle n ∈ IN. Man zeige, dass
∞
n=1
d|n
ϕ(n)xn f¨ ur |x| < 1 konvergiert und dass ∞ n=1
ϕ(n)
xn x = . n 1−x (1 − x)2
XI.4 Weitere Reihenentwicklungen
315
3. Innerhalb ihres Bereichs der absoluten Konvergenz kann man DirichletReihen multiplizieren: ∞ an n=1
nx
·
∞ bn n=1
nx
=
∞ cn n=1
nx
.
a) Wie gewinnt man die Folge (cn ) aus den Folgen (an ) und (bn )? b) Welche arithmetische Bedeutung haben die Koeffizienten der DirichletReihe von (ζ(x))2 ?
4. Man bestimme die Fourier-Entwicklung f¨ur f (x) = |x| in ] − π; π[. In Fig. 4 ist der Graph von f und der Graph der ersten nicht-konstanten N¨aherung zu sehen. y
6
......... ........... .... ....... @........... ....... @..@ .... @ ... .... ... ..... . . . . . . . . . @ @..... . . .... .... . . . ... . .... . .... .... @ @ @ ..... .... .... . . .... .@ . . ...... . . . . . . . . . . . . . .................. @ @........ ....... ................ .. .. @ @. @.... x π −π Fig. 4: Zu Aufgabe 4
Man bestimme damit den Wert von
∞
∞ 1 1 und von . 2 2 (2n − 1) n n=1 n=1
5. Man bestimme die Fourier-Entwicklung f¨ur f (x) = sgn x in ]−π; π[ (Fig. 5). Man bestimme damit den Wert der leibnizschen Reihe
∞ (−1)n−1 n=1
y
2n − 1
.
6
........... ......... .......... .......... .......... .... .. ... ......... ..... ... ........ ..... ... ... .. .. .. .. .. . .u.. ..u. .u .u .. ... ... .. x . . .. π −π . . . . . . . . .... ......... .. .... ......... .. .... ... ....... ........ ....... ........ ........
Fig. 5: Graph von y =
sin 3x 4 sin x + π 3
6. Man bestimme die Fourier-Entwicklung f¨ur f (x) = | sin x| in ] − π; π[. Man zeige damit, dass
∞ π (−1)n−1 1 = + . 4 2 n=1 4n2 − 1
XII Kurven und Fl¨ achen XII.1 Kurvendiskussion Die Differenzialrechnung findet eine wichtige Anwendung in der Diskussion von Kurven, die als Graph einer Funktion x → f (x) gegeben sind. Eine bedeutende Rolle spielen dabei die Extremalpunkte dieser Kurven ( Extremwertaufgaben“). ” Diese geometrischen“ Anwendungen der Differenzialrechnung sollen hier weiter ” ausgebaut werden, wobei ebene Kurven auch anders als durch eine Funktion einer Variablen beschrieben werden k¨onnen (Abschnitte XII.2 und XII.3). Schließlich werden auch Kurven und Fl¨achen im Raum mit den Mitteln der Analysis untersucht (Abschnitt XII.5). Es sei f eine in einem Intervall I beliebig oft differenzierbare Funktion und x0 ein innerer Punkt von I. Der Wert von f (x0 ) gibt die Steigung von f bzw. des Graphen von f im Punkt (x0 , f (x0 )) an: f (x0 ) < 0 : f ist in einer Umgebung von x0 streng monoton fallend f (x0 ) = 0 : f hat an der Stelle x0 eine waagerechte Tangente f (x0 ) > 0 : f ist in einer Umgebung von x0 streng monoton steigend ummung von f bzw. des Der Wert von f (x0 ) macht eine Aussage u ¨ber die Kr¨ Graphen von f im Punkt (x0 , f (x0 )), denn f (x) gibt als Steigung der Steigung“ ” an, ob die Steigung zunimmt oder abnimmt: f (x0 ) < 0 : f ist in einer Umgebung von x0 eine Rechtskurve f (x0 ) = 0 : f hat an der Stelle x0 eine waagerechte Tangente f (x0 ) > 0 : f ist in einer Umgebung von x0 eine Linkskurve Die anschaulichen Bezeichnungen Rechtskurve“und Linkskurve“ beziehen sich ” ” auf die Durchlaufung des Graphen in Richtung der x-Achse ( von links nach ” rechts“). In einer Rechtskurve verl¨auft der Graph unterhalb, in einer Linkskurve oberhalb der Tangente (Fig. 1). Man nennt f in einer Rechtskurve konvex , in einer Linkskurve konkav . y6
y6
..................... . . . . . . . . . . . . . . s..... ......... ....
..... y = f (x) . .. .... f (x0 ) < 0: Rechtskurve . .. .....
x0
-
x
Fig. 1: Kr¨ ummungssinn
y = f (x) ........ ... .... . . . . .... ...... .s..... ................ ....... f (x0 ) > 0: Linkskurve x0
-
x
XII.1 Kurvendiskussion
317
Im Fall f (x0 ) = 0 kann zun¨achst nicht u ¨ber das Steigungsverhalten in der Umgebung von x0 entschieden werden. Ist aber f (x0 ) = 0, dann sind die Verh¨altnisse klar, dann weiß man n¨amlich, ob die Steigung in einer Umgebung von x0 zunimmt oder abnimmt: f (x0 ) = 0, f (x0 ) < 0 : f hat an der Stelle x0 ein relatives Maximum f (x0 ) = 0, f (x0 ) > 0 : f hat an der Stelle x0 ein relatives Minimum Ein relatives Maximum ist n¨amlich dadurch gekennzeichnet, dass an dieser Stelle die Steigung von positiven zu negativen Werten wechselt, an der Stelle eines relativen Minimums wechselt sie von negativen zu positiven Werten. Im Fall f (x0 ) = 0 kann zun¨achst nicht u ummungsverhalten in der ¨ber das Kr¨ Umgebung von x0 entschieden werden. Ist aber f (x0 ) = 0, dann sind die Verh¨altnisse klar, dann weiß man n¨amlich, ob an der Stelle x0 eine Links- in eine Rechtskurve u ¨bergeht oder umgekehrt: f (x0 ) = 0, f (x0 ) < 0 : Linkskurve geht in eine Rechtskurve u ¨ber f (x0 ) = 0, f (x0 ) > 0 : Rechtskurve geht in eine Linkskurve u ¨ber Es handelt sich dann bei (x0 , f (x0 )) um einen Wendepunkt von f . Ist f (x0 ) = f (x0 ) = 0 und f (x0 ) = 0, dann liegt an der Stelle x0 ein Wendepunkt mit waagerechter Tangente vor, ein Sattelpunkt. Das ergibt sich alles aus dem folgenden Resultat, welches wir in XI.2 mit Hilfe der Taylor-Entwicklung erhalten haben: Die erste an der Stelle x0 nicht-verschwindende Ableitung von f sei von der Ordnung n. Ist n gerade, dann besitzt f an der Stelle x0 ein Extremum, und zwar — ein Maximum, wenn f (n) (x0 ) < 0, — ein Minimum, wenn f (n) (x0 ) > 0. Ist n ungerade und n > 1, dann besitzt f an der Stelle x0 einen Sattelpunkt. Wir wollen hier den Begriff der Kr¨ ummung pr¨azisieren, indem wir denjenigen Kreis betrachten, welcher sich der Kurve an der Stelle x0 am besten anschmiegt“, ” der also durch den Punkt (x0 , f (x0 )) geht, dort die Steigung f (x0 ) hat (also die Kurventangente ber¨ uhrt) und — nahe x0 als Funktionsgraph betrachtet — ¨ an der Stelle x0 die zweite Ableitung f (x0 ) hat. Wegen der Ubereinstimmung der Funktionswerte und der beiden ersten Ableitungen spricht man von einer Ber¨ uhrung zweiter Ordnung. Diesen Kreis nennt man den Kr¨ ummungskreis von f an der Stelle x0 . Hat er die Gleichung (x − xM )2 + (y − yM )2 = r2 , dann ist (xM , yM ) der Kr¨ ummungsmittelpunkt und r der Kr¨ ummungsradius von 1 f an der Stelle x0 . Den Wert nennt man die Kr¨ ummung von f an der Stelle x0 . r
XII Kurven und Fl¨achen
318
In einer Umgebung von x0 l¨asst sich ein Bogen des gesuchten Kreises als Graph einer Funktion mit der Gleichung
y = k(x) = yM +
r2 − (x − xM )2
oder y = k(x) = yM −
r2 − (x − xM )2
darstellen. Zusammen mit der Kreisgleichung ergeben sich dann durch Differenzieren die drei Gleichungen (x − xM )2 + (k(x) − yM )2 = r2 (x − xM ) + (k(x) − yM )k (x) = 0 1 + (k (x))2 + (k(x) − yM )k (x) = 0 Aus den Bedingungen k(x0 ) = f (x0 ), k (x0 ) = f (x0 ), k (x0 ) = f (x0 ) erh¨alt man folgende Gleichungen: (x0 − xM )2 + (f (x0 ) − yM )2 = r2 (x0 − xM ) + (f (x0 ) − yM )f (x0 ) = 0 1 + (f (x0 ))2 + (f (x0 ) − yM )f (x0 ) = 0 Die dritte Gleichung liefert f (x0 ) − yM = −
1 + (f (x0 ))2 . f (x0 )
Damit folgt aus der zweiten Gleichung x0 − xM = f (x0 )
1 + (f (x0 ))2 . f (x0 )
Setzt man dies in die erste Gleichung ein, so folgt r2 =
(1 + (f (x0 ))2 )3 . (f (x0 ))2
¨ Bei diesen Uberlegungen darf nat¨ urlich nicht f (x0 ) = 0 gelten; in diesem Fall w¨are die Kr¨ ummung 0, der Kr¨ ummungsradius also unendlich groß. Wir haben damit folgenden Satz bewiesen: Satz 1: Ist f (x0 ) = 0, so existiert ein Kreis mit dem Mittelpunkt (xM , yM ) und dem Radius r, der den Graph von f an der Stelle x0 von zweiter Ordnung ber¨ uhrt (Kr¨ ummungskreis). Dabei ist xM = x0 − f (x0 ) und
1 + (f (x0 ))2 , f (x0 )
yM = f (x0 ) + 3
(1 + (f (x0 ))2 ) 2 . r= |f (x0 )|
1 + (f (x0 ))2 f (x0 )
XII.1 Kurvendiskussion
319
Bei einer Kurvendiskussion versucht man, m¨oglichst viele Informationen u ¨ber den Graph einer Funktion f zu gewinnen, um damit ein m¨oglichst genaues Schaubild anfertigen zu k¨onnen. Die m¨oglichen Punkte einer solchen Diskussion sind im Folgenden zusammengestellt: • • • • • • • • • • •
Definitionsmenge Stetige Erg¨anzbarkeit an Definitionsl¨ ucken Asymptotisches Verhalten an L¨ ucken und R¨andern der Definitionsmenge Symmetrie (Achsensymmetrie, Punktsymmetrie) Berechnung der ersten, zweiten und dritten Ableitung Nullstellen und Steigung in den Nullstellen Extremalpunkte (Hochpunkte, Tiefpunkte) Wendepunkte und Steigung der Wendetangenten Kr¨ ummungskreise in einigen Punkten, z.B. in den Extremalpunkten Maßstab des Koordinatensystem zur Zeichnung des Schaubilds Zeichnen des Schaubilds
Wenn der Term der zu untersuchenden Funktion nicht sehr einfach ist, kann man nicht alle diese Punkte m¨ uhelos behandeln. Insbesondere kann es sein, dass die L¨osungen der Gleichungen f (x) = 0, f (x) = 0 und f (x) = 0 nur n¨aherungsweise mit numerischen Verfahren zu bestimmen sind. Beispiel 1: Der Graph der auf IR definierten Funktion f mit f (x) = x3 − x ist punktsymmetrisch zum Ursprung. Es gilt f (x) = 3x2 − 1, f (x) = 6x, f (x) = 6. Die Nullstellen sind 0 (Steigung −1) und ±1 (Steigung 2). Extremstellen sind 1√ 1√ 2√ 2√ 1√ ± 3. Es ist − 3, 3 Maximalpunkt, 3, − 3 Minimalpunkt. 3
3
9
Der Ursprung ist Wendepunkt (Steigung −1). Der Kr¨ ummungsradius in den Extremalpunkten ist 3 (1 + 02 ) 2 1√ √ r= = 3. 1 6 6· 3 3 In Fig. 2 ist der Graph mit Hilfe der Kr¨ ummungskreise in den Extremalstellen gezeichnet.
3
9
y 6 .. ........................ . . . . . .. . . . . . . . . ..... .. . .... ....... ... 0,2 .............. ................ ... . . . . . ........ . . q . .. ... . x . ... . ... ......... .... . ... . . . . .. . . . . . . q . . −1. ... . . . . . . ....... 1 . . ........ .......... ......... .. . .......... ..... . ....... ..... ........................... ... . Fig. 2: Graph von y = x3 − x
XII Kurven und Fl¨achen
320 Beispiel 2: Die rationale Funktion f mit f (x) =
x2
1 − 10x + 24
hat Definitionsl¨ ucken an den Stellen 5 ± 1, denn dies sind die Nullstellen des Nennerpolynoms. Die Gerade mit der Gleichung x = 5 ist eine Symmetrieachse, denn wegen x2 − 10x + 24 = (x − 5)2 − 1 ist f (10 − x) = f (x) f¨ ur alle x ∈ Df . Wir betrachten also die einfachere (zur y-Achse symmetrische) Funktion g mit g(x) = f (x + 5) =
1 x2 − 1
und der Definitionsmenge IR \ {−1, 1}. Es ist g (x) = −
2x , (x2 − 1)2
g (x) =
6x2 + 2 . (x2 − 1)3
Es gilt lim g(x) = lim+ g(x) = +∞,
x→−1−
x→1
lim g(x) = lim− g(x) = −∞,
x→−1+
x→1
lim g(x) = lim g(x) = 0.
x→−∞
x→+∞
Es gibt keine Nullstellen, einen Maximalpunkt (0, −1) und keine Wendepunkte. Der Kr¨ ummungsradius im 1 Punkt (0, −1) ist . Mit Hilfe der 2 1 5 3 ±2, und ± , 3 4 2
Kurvenpunkte
ist in Fig. 3 das Schaubild von g gezeichnet. Verschiebt man das Koordinatensystem um 5 Einheiten nach links, dann ergibt sich das Schaubild der urspr¨ unglich gegebenen Funktion f .
.. ... .. ... .. .. . . .... .................... −1
y6
... ... ... ... ... ... .... ... .... ....... ................. x 1
................... ... ... ... ... ... .. ... .. ... ... .... ... . ... .... Fig. 3: Graph von y =
1 x2 − 1
¨berall auf IR definiert und beliebig Beispiel 3: Die Funktion f : x → x2 e−x ist u oft differenzierbar. Es ist f (x) = (2x − x2 )e−x , f (x) = (2 − 4x + x2 )e−x , f (x) = (−6 + 6x − x2 )e−x . Einzige Nullstelle ist 0 (Steigung 0). Stellen mit waagerechter Tangente sind 0 und 2 (L¨osungen von 2x − x2 = 0). Wegen f (0) = 2 > 0 und f (2) = −2 < 0 ist T (0, 0) ein Tiefpunkt und H(2, 4e−2 ) ein Hochpunkt. Der Kr¨ ummungsradius 1 1 2 im Tiefpunkt ist , im Hochpunkt e . Die L¨osungen von f (x) = 0 (also von 2
2
XII.1 Kurvendiskussion
321
√ √ −(2±√2) x2 − 4x + 2 = 0) sind 2 ± 2. An diesen Stellen ist f (x) = ±2 2e = 0, √ √ √ −(2± 2) es liegen also Wendepunkte W1/2 (2 ± 2, (6 ± 4 2)e ) vor. Die Steigungen √ √ dort sind (−2∓2 2)e−(2± 2) . Zum Zeichnen des Graphen ben¨otigt man die Werte √ √ √ √ √ 2 + 2 ≈ 3,41; (6 + 4 2)e−(2+ 2) ≈ 0,38; (−2 − 2 2)e−(2+ 2) ≈ −0,16 √ √ √ √ √ 2 − 2 ≈ 0,59; (6 − 4 2)e−(2− 2) ≈ 0,20; (−2 + 2 2)e−(2− 2) ≈ 0,45 In Fig. 4 sind noch die Kurvenpunkte an den Stellen −0,75 und 5 mit ihren Steigungen eingezeichnet. Ansonsten sind nur die oben berechneten Daten in der Zeichnung eingetragen, aus welchen man den Kurvenverlauf aber schon sehr klar entnehmen kann. Dabei ist die Einheit auf der y-Achse dreimal gr¨oßer als auf der x-Achse gew¨ahlt worden. Die Kr¨ ummungskreise werden dadurch zu Ellipsen. Die unterschiedlichen Einheiten auf den Koordinatenachsen muss man auch beim Eintragen der Steigungen beachten.
... y ... 6 ... ... ... ... y = x2 e−x ... ...u ... ... ..... ..... 1 ... ... .. ... . .. ... .. .. ... .. .. ........................H .. . . .....u......................................... W1 .. .. ...... .... ... .......u.. . ... .......... . ...... .. ... ......................u .. ......u....W2 .................. .. . . . . . .. .. . ................u................. .. . . . .. x T . ... 1 .. . . . . Fig. 4: Zu Beispiel 3
Beispiel 4: Die Funktion f : x → sin x + sin 2x ist periodisch mit der Periode 2π und punktsymmetrisch mit dem Symmetriezentrum O, denn f¨ ur alle x ∈ IR gilt f (−x) = −f (x). Es gen¨ ugt daher, sie f¨ ur 0 ≤ x ≤ π zu untersuchen. Es gilt f (x) f (x) f (x) f (x)
= sin x + sin 2x = cos x + 2 cos 2x = − sin x − 4 sin 2x = − cos x − 8 cos 2x
= sin x(1 + 2 cos x), = 4 cos2 x + cos x − 2, = − sin x(1 + 8 cos x), = −16 cos2 x − cos x + 8.
In [0; π] hat f die Nullstellen 0, arccos (−0,5) ≈ 2,1 und π; die Steigungen sind dort 3 bzw. −1,5 bzw. 1. Stellen mit waagerechter Tangente in [0; π] ergeben sich 1√ 1 aus 4 cos2 x + cos x − 2 = 0 bzw. cos x = − ± 33 zu 8 8 1 1√ 1 1√ arccos − + 33 ≈ 0,94 und arccos − − 33 ≈ 2,57. 8 8 8 8
Wegen f (0,94) < 0 liegt an der der Stelle 0,94 ein Hochpunkt vor, wegen f (2,57) > 0 liegt an der Stelle 2,57 ein Tiefpunkt vor.
XII Kurven und Fl¨achen
322
Zwischen diesen beiden Stellen liegt eine Wendestelle, welche sich aus der Glei1 ≈ 1,7 ergibt. Auch die Nullstellen 0 chung 1 + 8 cos x = 0 zu x = arccos − 8
und π sind Wendestellen. Fig. 5 zeigt eine volle Periode von f . y
y = sin x + sin 2x
6
............ .................v .. ....... ....... ... . ... . . . . . 1 ...... .... .....v ... ........ ... .. . . . . ... ..... .................v ................... . . .... π........ . ... . . . . . . . . . . ..... ... v v v ...v ....v -x ... ....... .... ....................v.................... ... ....... .... −π . ... .v.. .. . ... ... ... . . ... . . .... ... . ...... . ................v ............... Fig. 5: Zu Beispiel 4
Aufgaben 1. a) Man beweise, dass der Graph einer auf IR definierten Funktion f genau dann achsensymmetrisch zu der Geraden mit der Gleichung x = a ist, wenn f (2a − x) = f (x) f¨ ur alle x ∈ D(f ). b) Man beweise, dass der Graph einer auf IR definierten Funktion f genau dann punktsymmetrisch zum Punkt (a, b) ist, wenn f (2a − x) = 2b − f (x)
f¨ ur alle x ∈ D(f ).
2. Man beweise: Jede Parabel dritter Ordnung, also jede Kurve mit der Gleichung y = ax3 + bx2 + cx + d, ist punktsymmetrisch zu ihrem Wendepunkt.
3. Man berechne die Steigung in den Nullstellen und die Kr¨ummungsradien in den Extremalpunkten; man zeichne dann ein Schaubild von f . x4 x x5 − b) f (x) = c) f (x) = (x ln x)2 a) f (x) = 160 64 1 + x2
4. Man diskutiere die durch folgenden Term gegebene Funktion: a) f (x) =
1 4 (x + 15x) 30 1
d) f (x) = e x
x2 − 2x + 1 x2 + 1 1 e) f (x) = x2 sin x b) f (x) =
c) f (x) = x +
1 x2
f) f (x) = ln x · sin x
XII.2 Implizite Differenziation
323
XII.2 Implizite Differenziation In einem kartesichen Koordinatensystem wird durch die Gleichung x2 + y 2 = r2 ein Kreis um den Ursprung mit dem Radius r beschrieben. Der Kreis ist kein Funktionsgraph, da zu jedem x-Wert √ y mit |x| < r zwei verschiedene y-Werte ............... y = r2 − x2 ..............6 . . . . . . . geh¨oren. Wir k¨onnen den Kreis aber in . . ...... .... .... ¨ .... zwei Aste (Halbkreise) zerlegen, welche ... .... ... . als Graphen der Funktionen ... . . ..√ ... 2 2 .. x f1 : x → r − x , .. . . √ .. .. f2 : x → − r2 − x2 ... ... ... . . . .... .... √ mit der Definitionsmenge [−r; r] anzu.... .... ... ... y = − r 2 − x2 sehen sind (Fig. 1). Auch die Gleichung (x2 + y 2 )3 − 27x2 y 2 = 0
Fig. 1: Kreis mit zwei Funktions¨ asten
beschreibt eine Kurve“ im kartesischen Koordinatensystem, hier ist es aber schon ” ¨ wesentlich schwerer, einzelne Aste zu erkennen, welche als Graph einer Funktion zu deuten sind. Nehmen wir an, es g¨abe eine differenzierbare Funktion f derart, dass die Punkte mit y = f (x) obiger Gleichung gen¨ ugen. Dann w¨are (x2 + f (x)2 )3 − 27x2 f (x)2 = 0
f¨ ur alle x ∈ Df .
Die Ableitung dieses Terms muss dann ebenfalls auf Df verschwinden; denn gilt T1 (x) = T2 (x) f¨ ur alle x ∈ D ⊆ IR und sind T1 , T2 differenzierbar auf D, dann gilt auch T1 (x) = T2 (x) f¨ ur alle x ∈ D ⊆ IR. Es ist also 3(x2 + f (x)2 )2 · (2x + 2f (x)f (x)) − 27(2xf (x)2 + x2 · 2f (x)f (x)) = 0. L¨osen wir dies nach f (x) auf und setzen wieder y f¨ ur f (x), dann ergibt sich f (x) =
x(9y 2 − (x2 + y 2 )2 ) . y((x2 + y 2 )2 − 9x2 )
Kennt man nun einen Punkt der Kurve, dann kann man in ihm die Steigung berechnen. Die Kurve ist offensichtlich symmetrisch zu den Koordinatenachsen und auch symmetrisch zu den Winkelhalbierenden des Koordinatensystems, so dass wir uns zun¨achst auf den Bereich x ≥ y ≥ 0 beschr¨anken k¨onnen. F¨ ur x = y ergibt sich außer O(0, 0) der Punkt 3 3 3 3 P , mit der Steigung −1. 2 2 2 2
y
6
@ @ P @.u .... @ ... .@ ..u@
.. Q ... . 1 .... .. .... ... .... . . . . . . ....... ............. ..u................................. .. .. -x 1 2 Fig. 2: Kurvenst¨ uck zu x ≥ y ≥ 0
XII Kurven und Fl¨achen
324 Eine senkrechte Tangente existiert f¨ ur x2 + y 2 = 3x; setzt man dies in die Gleichung der Kurve √ ein, so findet man x = √2 und damit y = 2, also den Punkt Q(2, 2) mit einer senkrechten Tangente. Zwischen P und Q ist die Steigung negativ, nach Durchlaufen von Q (also f¨ ur 0 < x < 2, √ 0 < y < 2) ist sie positiv. Offensichtlich geht die Kurve durch den Ursprung, der Term f¨ ur f (x) ist dort aber nicht definiert. Fig. 2 zeigt das analysierte Kurvenst¨ uck. Weitere Teile der durch obige Gleichung definierten Kurve ergeben sich aufgrund der Symmetrie (Kleeblattkurve, Fig. 3).
y 6 . . . . . . . . . . . . . . . . . . . . ...... ......................... .... ... .... ....... ...@ . ... .. ... @ .. . . ... @ ... . .. . .... . . ...... @ ...... ... ......... @ .. ...... . . . . . . . . ......................@ ................................... .... ....... x .... @ ....... . . . . . . . . .... .. ... .... ........ @ ... .. .. @ .... ... ........ @ .... . .... . . ........... .@ ... ......................... ...........@
Fig. 3: Kleeblattkurve
Die erste Schwierigkeit bei der Analyse der durch eine Gleichung F (x, y) = 0 gegebenen Funktionen ( Funktions¨aste“) besteht in der Bestimmung der Defini” tionsmenge dieser Funktionen. Dies ist in der Regel nur dann einfach, wenn die Gleichung F (x, y) = 0 wie die obige Kreisgleichung einfach nach y aufl¨osbar ist. Um hierzu einen allgemeinen Satz zu formulieren, ben¨otigen wir den Begriff der Stetigkeit und der partiellen Ableitungen einer Funktion von zwei Variablen. Ist F eine Abbildung von IR2 in IR, dann beschreibt die Gleichung z = F (x, y) eine Fl¨ache in einem dreidimensionalen kartesischen Koordinatensystem. Die Punkte mit z = 0, also F (x, y) = 0, bilden dann die Schnittkurve dieser Fl¨ache mit der xy-Ebene. Definition 1: Die Funktion F : (x, y) → F (x, y) mit dem Definitionsbereich DF ⊆ IR2 und dem Bildbereich Bf ⊆ IR heißt stetig an der Stelle (x0 , y0 ) ∈ DF , wenn f¨ ur jedes ε > 0 ein δ > 0 derart existiert, dass f¨ ur alle (x, y) ∈ DF mit 2 2 (x − x0 ) + (y − y0 ) < δ gilt: |F (x, y) − F (x0 , y0 )| < ε. Definition 2: Denkt man sich y als Konstante und differenziert den Term F (x, y) nach x, dann nennt man den so erhaltenen Ausdruck die partielle Ableitung von F nach x . Entsprechend ist die partielle Ableitung von F nach y erkl¨art. Dabei sei vorausgesetzt, dass die Stelle (x, y) im Inneren eines ganz in DF enthaltenen achsenparallelen Rechtecks liegt und die genannten Ableitungen existieren. Man bezeichnet die partiellen Ableitungen mit ∂ ∂ F (x, y) bzw. F (x, y) ∂x ∂y (lies: F partiell nach x (nach y) differenziert“.) F¨ ur die partiellen Ableitungen ” von F benutzt man auch die abk¨ urzenden Schreibweisen Fx , Fy .
XII.2 Implizite Differenziation
325
Beispiel 1: F¨ ur F (x, y) = (x2 + y 2 )3 − 27x2 y 2 ist ∂ F (x, y) = 3(x2 + y 2 )2 · 2x − 27 · 2x · y 2 = 6x((x2 + y 2 )2 − 9y 2 ), ∂x ∂ F (x, y) = 3(x2 + y 2 )2 · 2y − 27 · x2 · 2y = 6y((x2 + y 2 )2 − 9x2 ). Fy (x, y) = ∂y Nochmaliges partielles Differenzieren nach der jeweils anderen Variablen ergibt Fxy (x, y) = Fyx (x, y) = 12xy(x2 + y 2 − 9). (Bei jeder anst¨andigen“ Funktion F ” gilt Fxy = Fyx , das wollen wir hier aber nicht n¨aher untersuchen.) Fx (x, y) =
Besitzt F partielle Ableitungen in einem offenen Rechteck R =]x1 ; x2 [×]y1 ; y2 [⊆ D(F ), dann gilt f¨ ur (x, y), (x0 , y0 ) ∈ R F (x, y) − F (x0 , y0 ) = F (x, y) − F (x0 , y) + F (x0 , y) − F (x0 , y0 ) = Fx (x0 , y)(x − x0 ) + δ1 (x, y) + Fy (x0 , y0 )(y − y0 ) + δ2 (x0 , y) mit
δ1 (x, y) δ2 (x0 , y) = 0 und y→y lim = 0. 0 x − x0 y − y0 Sind die partiellen Ableitungen stetig in R, dann ist also lim
x→x0
F (x, y) = F (x0 , y0 ) + Fx (x0 , y0 )(x − x0 ) + Fy (x0 , y0 )(y − y0 ) + (x, y) mit
(x, y) lim = 0. (x − x0 )2 + (y − y0 )2
x→x0 y→y0
(Bei diesem Grenzwert ist es gleichg¨ ultig, auf welchem Weg sich der Punkt (x, y) dem Punkt (x0 , y0 ) n¨ahert.) Es ergibt sich also wie bei Funktionen von nur einer Variablen eine lineare Approximation an der Stelle (x0 , y0 ). Satz 1: Ist F eine Funktion von zwei Variablen x, y mit stetigen partiellen Ableitungen in einem achsenparallelen Rechteck R, gilt ferner an einer Stelle (x0 , y0 ) ∈ R die Gleichung F (x0 , y0 ) = 0 und ist Fy (x0 , y0 ) = 0, dann existiert ein Intervall I =]a; b[ mit x0 ∈ I, so dass genau eine stetige Funktion f mit F (x, f (x)) = 0 auf I existiert. F¨ ur diese Funktion gilt y0 = f (x0 ). Die Funktion f ist differenzierbar auf I, und es gilt dort f (x) = −
Fx (x, y) Fy (x, y)
mit y = f (x).
Beweis: Es ist keine Beschr¨ankung der Allgemeinheit, die partielle Ableitung Fy (x0 , y0 ) als positiv anzunehmen. Wegen der Stetigkeit von Fy (x, y) existiert
XII Kurven und Fl¨achen
326 dann ein achsenparalleles Rechteck R um den Punkt (x0 , y0 ), in welchem u ¨berall Fy (x, y) > 0 gilt (Fig. 4). Es ist daher
y
β y0
F (x0 , u) < 0 < F (x0 , v) f¨ ur alle u, v mit u < y0 < v und (x0 , u), (x0 , v) ∈ R. Wegen der Stetigkeit von F existiert also ein Rechteck ]a; b[×]α; β[⊆ R mit
6
R
...... ............ . . . . . . t . . . . . . . . . . . ..
α -
a x0
b
x
Fig. 4: Zum Beweis von Satz 1
F (x, α) < 0 < F (x, β)
f¨ ur alle x ∈ [a; b]. Es gibt also nach dem Zwischenwertsatz f¨ ur jedes x ∈]a; b[ genau ein y ∈]α; β[ mit F (x, y) = 0. Die Funktion, die diesem x dieses y zuordnet, nennen wir f . Die Stetigkeit der so konstruierten Funktion f auf ]a; b[ liegt auf der Hand. Die Differenzierbarkeit ergibt sich folgendermaßen: F¨ ur zwei Punkte (x, y), (x + h, y + k) ∈]a; b[×]α; β[ gilt aufgrund der Stetigkeit der partiellen Ableitungen von F F (x + h, y + k) = F (x, y) + hFx + kFy + ε1 h + ε2 k, √ wobei ε1 , ε2 mit h2 + k 2 → 0 gegen 0 streben. Mit F (x, y) = 0, F (x + h, y + k) = 0, y = f (x), y + k = f (x + h) ergibt sich hFx + kFy + ε1 h + ε2 k = 0. Wegen der Stetigkeit von f strebt mit h auch k gegen 0. Aus
ε2 1+ Fy
h Fx ε1 + + =0 k Fy Fy
ergibt sich beim Grenz¨ ubergang h → 0 lim
h→0
f (x + h) − f (x) k Fx = lim = − . h→0 h h Fy
2
Die Differenziationsregel in Satz 1 gewinnt man sofort mit Hilfe der Kettenregel aus F (x, f (x)) = 0, wenn man schon weiß, dass die Funktion f differenzierbar ist. Im Beweis zu Satz 1 musste aber vor allem die Differenzierbarkeit von f nachgewiesen werden.
XII.2 Implizite Differenziation
327
Beispiel 2: Das Folium Cartesii oder descartessche Blatt (nach Ren´e Descartes, 1596–1650) ist durch die Gleichung F (x, y) = x3 + y 3 − 3xy = 0 gegeben (Fig. 5). Die Kurve ist wegen F (x, y) = F (y, x) symmetrisch zur Winkelhalbierenden des 1. Quadranten. F¨ ur jeden Funktionsast f gilt f (x) = −
x2 − y . y2 − x
2 falls y 2 = x. Aus y√ = x folgt aber aus der Kurvengleichung (x, y) = (0, 0) √ 3 3 oder (x, y) = ( 4, 2). Im ersten Fall versagt die Ableitungsformel. Weil im Kurvenpunkt (0, 0) die Ableitung nicht eindeutig bestimmt ist, nennt man dies einen singul¨aren Punkt der Kurve. Im zweiten Fall ergibt sich ein Punkt mit √ √ 3 3 einer senkrechten Tangente. Wegen der Symmetrie ist dann ( 2, 4) ein Punkt
3 3 , 2 2
mit einer waagerechten Tangente. Im Punkt
ist die Steigung −1. Die
Gerade mit der Gleichung y = −x − 1 ist eine Asymptote der Kurve. (Setzt man y = −x − 1 in dem Term F (x, y), dann ergibt sich der konstante Wert 1.)
y6 ...........s.....s.s ....... @@ . . . . .. 1 .... .. @ @......... . ... @............ .. ...... @ ...................................... ... -1@ 1 . @ .... . @ .. -1 @...... . @....... .
x − 12
@
Fig. 5: Folium Cartesii
η ... 1 6 ... ... f1 ... ... ... ............................................. ..... .... ..... @ . ξ ...... . . .. . @....... 1 .............. 3 ............ .... @ ....................... 2 . ... f2 .. .. -1 Fig. 6: Folium Cartesii
Weiteren Aufschluss kann man u ¨ber das Folium Cartesii erhalten, wenn man die aufgrund der Symmetrie naheliegende Koordinatentransformation x = ξ−η y = ξ+η
bzw.
ξ = 0,5 · (x + y) η = 0,5 · (−x + y)
ausf¨ uhrt, welche eine Drehstreckung darstellt. Es ergibt sich die Gleichung 1 3 − 2ξ 2ξ 3 + 6ξη 2 − 3ξ 2 + 3η 2 = 0 bzw. η 2 = ξ 2 · 3 1 + 2ξ mit den beiden Funktions¨asten
3 − 2ξ 1 f1 : ξ → +√ ξ 1 + 2ξ 3
und
3 − 2ξ 1 −√ ξ f2 : ξ → . 1 + 2ξ 3
XII Kurven und Fl¨achen
328
1 3 2 2
Man erkennt sofort die Definitionsmenge − ;
und die Asymptote mit der
1 Gleichung ξ = − (Fig. 6). Diese geht bei obiger Transformation in die Gerade 2
mit der Gleichung y = −x − 1 u ¨ber.
Beispiel 3: Die Kurve mit der Gleichung F (x, y) = x5 + 5x4 − 16y 2 = 0 ¨ zerf¨allt in die Aste 1 √ 1 √ f1 : x → + x2 5 + x und f2 : x → − x2 5 + x. 4 4 Es ist aber bequemer, die Kurve in der impliziten anstatt in der expliziten Form zu diskutieren. F¨ ur jeden Funktionsast gilt f (x) = −
5 5x4 + 20x3 x+4 = x3 · . −32y 32 y
Hier erkennt man sofort (−4, ±4) als Punkte mit waagerechten Tangenten und (−5, 0) als einen Punkt mit senkrechter Tangente. An der expliziten Form ist aber andererseits die Definitionsmenge [−5, ∞[ der Funktions¨aste leichter zu erkennen. In Fig. 7 ist die Kurve dargestellt.
y6 ......s...... f1. ... .... . ... .. ... ... . . . .... .. ... .... .. .... ...... . . . . −5 ..s ...................... .... ........ ............ . . . ... .... ... .... ... ... ... ... ..... ... ... ... .... .......s.... f2
x -
Fig. 7: x5 + 5x4 − 16y 2 = 0
Beispiel 4: Die Kurve mit der Gleichung (x2 + y 2 )2 − 2a2 (x2 − y 2 ) = 0 (Fig. 8) heißt Lemniskate (von griech. l¯emnikos = wollenes Band). Die Kurve ist symmetrisch zu beiden Koordinatenachsen. Sie geht durch den Ursprung; dort haben beide partiellen Ableitungen den Wert 0, so dass ein singul¨arer Punkt vorliegt. F¨ ur alle anderen Punkte der Funktions¨aste f gilt x(x2 + y 2 ) − a2 x f (x) = − . y(x2 + y 2 ) + a2 y
y6 . . . . .. ... .... .... .... . .. . ... .. . .. ..... r . . . . . . . . ...... . ............... .............r................ .. ... ...... ............ ...... .. .... .... .r ..r ..r ...r - x . . . . .. √ ....... √ ... −a.. . . . . . . a .... a 2 ... ........... −a 2 ..... .. . . . . . . . .................r.......... ...............r............. . ... .. . . .... . . . ... .... .... .... ... . Fig. 8: Lemniskate
XII.2 Implizite Differenziation
329
√ Senkrechte Tangenten liegen in den Punkten (±a 2, 0) vor, waagerechte Tangen a√ a 2 2 2 ten in den Punkten mit x + y = a , also in den vier Punkten ± 3, ± . Die 2 2 Lemniskate ist der geometrische Ort aller Punkte, f¨ ur welche das Produkt der Entfernungen von den Punkten (−a, 0) und (a, 0) den konstanten Wert a2 hat (Aufgabe 3). Beispiel 5: Die Gleichung 2
x a
3
2
+
y b
3
y
= 1 (a, b > 0)
beschreibt eine Asteroide (Fig. 9). Sie ist symmetrisch zu den Koordinatenachsen, weshalb es gen¨ ugt, den Teil der Kurve mit x, y ≥ 0 zu analysieren und damit die in diesem Bereich gegebene Funktion f . Es gilt
.s6 ............b...... . . . . . . . .......... ...... .............. ........... ................sx ..s.................................... ............ .................. a . . . . . . . . . . .......... . ....... ............... ..s. Fig. 9: Asteroide
1
2 x − 3 1 1 · b ay 3 f (x) = − 3 a 1 a = − a bx 2 y − 3 1 · 3 b b
f¨ ur x > 0.
Daran erkennt man sofort, dass die Kurve im Punkt (a, 0) die x-Achse ber¨ uhrt und im Punkt (0, b) die y-Achse ber¨ uhrt, dass in diesen Punkten also Spitzen“ ” vorliegen. Beispiel 6: Die durch die Gleichung (x2 + y 2 − 4x)2 = 16(x2 + y 2 ) gegebene Kurve ist eine Kardioide (Fig. 10). Sie ist symmetrisch zur x-Achse. Hier ¨ ist es ratsam, die Gestalt der Kurve anhand der einzelnen Aste zu untersuchen. Aufl¨osen nach y ergibt √ y = f1/2 (x) = ± −(x2 − 4x − 8) − 8 x + 1 f¨ ur −1 ≤ x ≤ 0, √ y = f3/4 (x) = ± −(x2 − 4x − 8) + 8 x + 1 f¨ ur −1 ≤ x ≤ 8. √ unden Die Graphen von f1/2 gehen durch die Punkte (−1, ± 3)√und (0, 0). Sie m¨ mit einer vertikalen Tangente in die Punkte (−1, ± 3). Bei (linksseitiger) Ann¨aherung an (0, 0) kann man f1/2 (x) wegen der Taylor-Entwicklung √ 1 1 1 1 1 1 + x = 1 + x − x2 + x3 − . . . = 8 + 4x − x2 + x3 − . . . 2 8 24 8 3
1 3
durch ± − x3 absch¨atzen. Daher m¨ unden die Graphen von f1/2 mit einer waagerechten Tangente in den Punkt (0, 0).
XII Kurven und Fl¨achen
330 Die Graphen von √ f3/4 gehen durch die Punkte (−1, ± 3) (mit vertikaler Tangente), durch die Punkte (0, ±4) mit der Steigung ±1 und durch den Punkt (8, 0) mit einer vertikalen Tangente.
6
................s...................... ...... ............... . . . . ..... ...s . ..... . . .. .... ....... .... .... ... .. ....s ...... ... .... ...... ....s. s . ... ... . . . .... .. ...s .. .... . . ...... ... ...... .... . . . ..... ... ...s... ..... ........... . ............... ................... ... ...s. ......
Genau dann ist f3/4 (x) = 0, wenn
2−x+ √
2 = 0. x+1
Diese Gleichung f¨ uhrt auf (x + 1)(x − 2)2 = 4 mit der einzigen √ reellen L¨osung 3. Die Punkte (3, ±3 3) sind Extremalpunkte. Beispiel 7: Fig. 11 zeigt die Kurve mit der Gleichung 5
5
2
F (x, y) = x + y − xy = 0. ¨ Hier ist eine Darstellung einzelner Aste durch eine Funktion nur schwer m¨oglich. Die Kurve ist punktsymmetrisch zum Ursprung, denn mit einem Punkt (x, y) ist auch (−x, −y) ein Kurvenpunkt. Es gen¨ ugt also, x ≥ 0 zu betrachten. Die Gerade mit der Gleichung x + y = 0 ist eine Asymptote. Dieses asymptotische Verhalten kann man folgendermaßen feststellen: F¨ ur hinreichend großes x > 0 ist −x < y < 0. Wir betrachten einen Kury venpunkt (x, y) und setzen = −α, so dass x 0 < α < 1.
Fig. 10: Kardioide
... y ... ... 6 ... ... ... ... ... .. ... . .. ... . . ... .. ... ... ... s .... ... ... ......................s ..... .. . . . . .......... ... .. ....... ....... ......s............. -x ............. ... ........................ .. ... .... . ... ....... ....s..... s.... ... ....... . . ... ..... ... .... ... ... ... .... ... ... ... .... ... . . Fig. 11: x5 + y 5 − xy 2 = 0
α2
Die Kurvengleichung ergibt (1 − α5 )x5 − α2 x3 = 0 und damit x2 = . F¨ ur 1 − α5 x → ∞ strebt α gegen 1 und damit
α2 1−α =α x + y = (1 − α)x = (1 − α) 1 − α5 1 + α + α2 + α3 + α4 gegen 0. Es gilt ferner −
Fx (x, y) 5x4 − y 2 =− 4 . Fy (x, y) 5y − 2xy
XII.3 Parameterdarstellung von Kurven
331
Stellen = 0 mit vertikaler Tangente ergeben sich aus 5y 4 − 2xy = 0. Dies liefert 5 3 zun¨achst xy 2 = y 5 , damit ergibt die Kurvengleichung x5 = y 5 und damit wie2 2 5 5 1√ 1√ 5 5 3 3 2 derum y − y , also y = 48. F¨ ur diese y-Werte erh¨alt man x2 = 5 108. 2
2
5
5 √ √ 10 48 10 108 . Stellen = 0 mit horizontaler Man findet f¨ ur x > 0 den Punkt V √ , √ 5 5
2 − y = 0 und der Kurvengleichung. F¨ ur x > 0 Tangente ergeben sich aus 5x4 √ √ 5 9 5 81 findet man den Punkt H √ , √ . In O hat die Kurve die Steigungen 0 bzw.
5
5
∞, auf den etwas schwierigen Nachweis wollen wir hier aber verzichten. Denn f¨ ur die Untersuchung derartiger singul¨arer Punkte“ ben¨otigt man den Begriff der ” Taylor-Entwicklung f¨ ur Funktionen mehrerer Variabler.
Aufgaben 1. Man bestimme die Steigung der Tangente im Punkt (x0 , y0 ) der Ellipse mit der Gleichung
x2 y2 + 2 = 1. 2 a b
2. Man diskutiere die Kurve mit der Gleichung x(x + 1)(x + 2) − y2 = 0. 3. Man beweise die angegebene Kennzeichnung der Lemniskate als Ortskurve. 4. Man diskutiere die durch folgende Gleichung beschriebene Kurve: a) y 2 − x3 (2 − x) = 0
b) x4 + y 4 = 2xy 2
d) x3 − 2x2 − y 2 + x = 0
c) x2 y 2 + y = 1
e) (x2 + y 2 − 2)2 = x2
f) y 3 + xy + x3 = 0
XII.3 Parameterdarstellung von Kurven, Darstellung mit Polarkoordinaten Die Funktionen ϕ, ψ seien stetig auf dem Intervall I. Dann ist die Punktmenge C := {(x, y) | x = ϕ(t), y = ψ(t), t ∈ I} eine Kurve. Um pathologische F¨alle von Kurven auszuschließen, verlangt man bei dieser Beschreibung einer Kurve meistens noch, dass die durch ϕ, ψ definierte Abbildung von I auf C bijektiv ist und die Umkehrabbildung ebenfalls stetig ist. Wir schreiben diese Parameterdarstellung der Kurve in der Vektorform
x ϕ(t) = y ψ(t)
(t ∈ I).
Beispielsweise hat der Kreis mit dem Radius r um den eines kartesi Ursprung r cos t x = (t ∈ [0; 2π[). schen Koordinatensystems die Parameterdarstellung y
r sin t
XII Kurven und Fl¨achen
332
Die Gerade durch den Punkt P (a, b) mit dem Richtungsvektor
u hat die Pav
a + tu x = (t ∈ IR). Der Graph der Funktion f u ¨ber dem y b +tv t x = (t ∈ I) beschrieben werden. Intervall I kann durch f (t) y
rameterdarstellung
Wir setzen nun voraus, dass die Funktionen ϕ, ψ in I stetig differenzierbar sind; ¨ ist hier auch — vor allem in der wir bezeichnen die Ableitungen mit ϕ , ψ . (Ublich Physik, wenn der Parameter t die Zeit angibt — die Bezeichnung der Ableitungen ˙ diese Bezeichnung geht auf Newton zur¨ mit ϕ, ˙ ψ; uck.) Ein Tangentenvektor im Kurvenpunkt zum Parameterwert t ist
ϕ (t) . ψ (t)
y 6 .. C ..... ϕ . . . .. ψ ....... .... ... ............ . . .. s ..... s (ϕ, ψ) ...P . P.P P .... PP P ... PP q −ψ .... ...... ϕ
Dies erkennt man anhand der Kettenregel: Ist y = f (x) eine Funktionsdarstellung eines Kurvenst¨ ucks, dann folgt aus ψ(t) = f (ϕ(t)) ψ (t) =
d f (ϕ(t)) · ϕ (t). dx
Ein Normalenvektor im Kurvenpunkt zum Parameterwert t ist dann (Fig. 1)
-
x
Fig. 1: Tangentenvektor, Normalenvektor
−ψ (t) . ϕ (t)
Der Graph einer Funktion f u ¨ber [a; b] sei in einer Parameterdarstellung
ϕ(t) , ψ(t)
(t ∈ [α; β]),
ϕ(α) = a, ϕ(β) = b
gegeben. Dann gilt aufgrund der Substitutionsregel β
b
f (x) dx = a
f (ϕ(t))ϕ (t) dt =
α
β
ψ(t)ϕ (t) dt.
α
Wir betrachten nun eine geschlossene Kurve
ϕ(t) , ψ(t)
(t ∈ [α; β]),
ϕ(α) = ϕ(β), ψ(α) = ψ(β)
und wollen den von ihr eingeschlossenen Fl¨acheninhalt A berechnen. Wir nehmen an, die Kurve lasse sich in zwei Bogen C1 , C2 zerlegen, welche als Graphen von Funktionen f1 , f2 zu deuten sind (Fig. 2):
XII.3 Parameterdarstellung von Kurven C1 : t ∈ [α; γ]; ϕ (t) > 0 auf ]α; γ[;
333 C2 : t ∈ [γ; β]; ϕ (t) < 0 auf ]γ; β].
Dann ist A die Differenz der Fl¨acheninhalte unter den beiden Kurvenst¨ ucken C1 und C2 , also γ
A =
ψ(t)ϕ (t) dt −
γ
α
β
γ
β
=
ψ(t)ϕ (t) dt +
α
β
=
ψ(t)ϕ (t) dt
y6
ψ(t)ϕ (t) dt
γ
ψ(t)ϕ (t) dt.
....................X ......X ....X z ........C ............ ......1.. ...r.. ..... A ..... ... ........ .......X ...r y . ....X . ......X ...........C .....2................ a b
x -
Fig. 2: Inhalt einer geschlossenen Kurve
α
Kann man die geschlossene Kurve in zwei Funktionsgraphen bez¨ uglich der y-Achse zerlegen (x = g1 (y), x = g2 (y)), dann erh¨alt man in gleicher Weise A = −
β
ϕ(t)ψ (t) dt. Das Minuszeichen ergibt sich aus dem Umlaufsinn der
α
Kurve; der obere“ Bogen der Kurve wird n¨amlich in Richtung abnehmender y” Werte durchlaufen, wenn wir an der eingangs gew¨ahlten Durchlaufungsrichtung festhalten. Schließlich kann man A noch als arithmetisches Mittel der beiden f¨ ur A gefundenen Ausdr¨ ucke darstellen. Der Fl¨acheninhalt ergibt sich mit einem Vorzeichen, welches dem Umlaufsinn der Kurve entspricht. Damit erhalten wir folgenden Satz: Satz 1: Ist eine geschlossene Kurve wie oben in Parameterdarstellung gegeben, dann hat die eingeschlossene Fl¨ache den Inhalt β
A=
ψ(t)ϕ (t) dt = −
α
Der Fl¨acheninhalt ergibt sich bei negativem Umlaufsinn der Kurve als negativ, bei positiven Umlaufsinn als positiv (Fig. 3). Der Fl¨acheninhalt ¨andert sich nicht bei einer Verschiebung des Koordinatensystems, weil die Integrale u ¨ber cϕ und dψ ((c, d ∈ IR)) den Wert 0 haben.
β
β
ϕ(t)ψ (t) dt =
α
y6
1 (ψ(t)ϕ (t) − ϕ(t)ψ (t)) dt. 2α
z .....X ...................X .......... ...... ...... ...... A . .......X y .....X ......................... x
Negativer Umlaufsinn (Uhrzeigersinn): Fl¨ acheninhalt negativ
y6
y X
........................X .......... ...... ...... ...... A .. .........X z .....X ..... ..................x
Positiver Umlaufsinn (Gegenuhrzeigersinn): Fl¨ acheninhalt positiv
Fig. 3: Orientierung des Fl¨ acheninhalts
XII Kurven und Fl¨achen
334 Beispiel 1: Die durch
a cos t (0 ≤ t ≤ 2π) b sin t gegebene Kurve ist eine Ellipse mit den Halbachsenl¨angen a, b. Die Kurve wird im Gegenuhrzeigersinn durchlaufen, wenn t von 0 bis 2π l¨auft, der Inhalt ist also negativ. Zur Berechnung des Betrags A des Fl¨acheninhalts ist es g¨ unstig, die dritte der Formeln in Satz 1 zu benutzen: 2π
2π
1 ab ab sin2 t + ab cos2 t dt = sin2 t + cos2 t dt 2 2
A=
0
=
ab 2
0
2π
1 dt = 0
Beispiel 2: Die durch
y
6 ..... b ...... ............... . . . . . . . .......... ....... .............. x ............. ........... .......................................... ........................ . . ............. . . . . . . . . . .......... .... a ........ ............... .......... .
a cos3 t b sin3 t
ab · 2π = πab. 2
(0 ≤ t ≤ 2π)
gegebene Kurve ist eine Asteroide (Fig. 4; vgl. auch Beispiel 5 in XII.2). Die von ihr eingeschlossene Fl¨ache hat den Inhaltsbetrag
Fig. 4: Asteroide
2π
1 A= b sin3 t · 3a cos2 t sin t + a cos3 t · 3b sin2 t cos t dt 2 0
=
3ab 2
2π 0
3ab 8
=
2π
(sin2 t cos2 t)(sin2 t + cos2 t) dt =
0
2π
(sin 2t)2 dt =
0
3ab 16
F¨ ur die Ableitung der Bogenl¨angenfunktion s(t) einer wie oben in Parameterdarstellung gegebenen Kurve ist offensichtlich s (t) =
3ab (sin t cos t)2 dt 2
(ϕ (t))2 + (ψ (t))2 ,
4π
(sin x)2 dx =
0
y
6
3ab 3 · 2π = a b π. 16 8
Δϕ .... ................................................................................. . . ... ................. Δψ .... .......Δs ............................. . . . . ... .... ........................................... Δs = (Δϕ)2 + (Δψ)2 -
x
(Fig. 5), also gilt:
Fig. 5: Berechnung der Bogenl¨ ange
XII.3 Parameterdarstellung von Kurven
335
Satz 2: Ist eine Kurve wie oben in Parameterdarstellung gegeben, dann hat sie die L¨ange β
(ϕ (t))2 + (ψ (t))2 dt,
L= α
falls dieses Integral existiert. Beispiel 3: Die L¨ange der Ellipse aus Beispiel 1 ist 2π
(−a sin t)2
L=
+
(b cos t)2
π
b2 + (a2 − b2 ) sin2 t dt.
dt = 2
0
0
Außer f¨ ur b = 0 oder a2 − b2 = 0 ist dieses Integral nicht elementar zu berechnen ( elliptisches Integral“). Approximiert man das Integral mit Hilfe der Simpson” Formel aus Abschnitt X.7, dann ergibt sich der N¨aherungswert L≈2·
π 2a + b · (b + 4a + b) = 2π · . 6 6
Beispiel 4: Die L¨ange der Asteroiden aus Beispiel 2 ist π
L = 4·
2
(3a cos2 t sin t)2 + (3b sin2 cos t)2 dt
0 π
2
=
3 sin t cos t a2 + (b2 − a2 ) sin2 t dt.
0
Mit der Substitution sin2 t =: u und 2 sin t cos t = L = 4·
1 3 2 a + (b2 − a2 )u du 2 0
=
du ergibt sich dt
1 3 b 3 − a3 a2 + ab + b2 4 (b2 + (b2 − a2 )u) 2
= 4 · 2 =4· . 2 2 2 b −a b −a a+b 0
Den Kr¨ ummungsradius r = r(t) einer in Parameterdarstellung gegebenen Kurve erhalten wir aus der entsprechenden Formel f¨ ur Funktionsgraphen, wenn wir f (x) durch den Quotient ψ (t) : ϕ (t) ersetzen, da die Kurve st¨ uckweise als Funktionsgraph zu deuten ist. Der Kr¨ ummungsmittelpunkt M ist dann gegeben durch
xM (t) ϕ(t) n(t) , = + r(t) · yM (t) ψ(t) |n(t)|
−ψ (t) ein Normalenvektor ist. Es gilt also folgender Satz: ϕ (t)
wobei n(t) =
XII Kurven und Fl¨achen
336
Satz 3: Ist eine Kurve wie oben in Parameterdarstellung gegeben, dann ist ihr Kr¨ ummungsradius an der Stelle t 3
((ϕ )2 + (ψ )2 ) 2 r= , |ϕ ψ − ψ ϕ | und der Kr¨ ummungsmittelpunkt hat die Koordinaten rψ xM = ϕ − , (ϕ )2 + (ψ )2
rϕ yM = ϕ + . (ϕ )2 + (ψ )2
(Wir schreiben dabei r, ϕ, . . . anstelle von r(t), ϕ(t), . . ., damit die Formeln nicht zu un¨ ubersichtlich werden.) Beispiel 5: Als Beispiel zu den S¨atzen 1, 2 und 3 betrachten wir eine Zykloide. Eine solche entsteht, wenn ein Kreis vom Radius a auf einer Geraden abrollt; sie ist dabei die Bahn eines Punktes der Kreisperipherie (Fig. 6). Ein Bogen der Zykloide kann durch x = ϕ(t) = a(t − sin t), y = ψ(t) = a(1 − cos t)
y6 ............. . ......................... ....................................................... . . . . ....... ... ......... ..... ... a ...... .... .... ... ... . . ...... .. ....... ... x ........u..... 2aπ
mit 0 ≤ t ≤ 2π beschrieben werden. Man kann den Zykloidenbogen zwischen 0 und aπ auch als Graph einer Funktion (x als Funktion von y) darstellen:
Fig. 6: Zykloide
a−y x = a arccos − (2a − y)y. a
An dieser Gleichung sind aber die Eigenschaften der Zykloide wesentlich schwerer zu erkennen als an der Parameterdarstellung. Der Fl¨acheninhalt des Zykloidenbogens zwischen 0 und 2aπ ist 2
2π
2
2
(1 − cos t) dt = a
A=a
0
2π
(1 − 2 cos t + cos2 t) dt
0
= a2 (2π − 0 + π) = 3a2 π.
Die L¨ange des Zykloidenbogens ist 2π
2a2 (1
L=
− cos t) dt = 2a
0
2π
sin 0
t dt = 8a. 2
Der Kr¨ ummungsradius an der Stelle t ist 3
√
(2a2 (1 − cos t)) 2 t
sin . r= = 2 2a |1 − cos t| = 4a
a2 (1 − cos t) 2
XII.3 Parameterdarstellung von Kurven Ein Punkt P = O in einem kartesischen Koordinatensystem kann auch eindeutig durch seine Entfernung r vom Ursprung und den Winkel θ zwischen der positiven x-Achse und dem Strahl OP + beschrieben werden, wobei der Winkel im Gegenuhrzeigersinn zu messen ist (Fig. 7). Man nennt (r, θ) die Polarkoordinaten von P . Die Umrechnung zwischen kartesischen Koordinaten und Polarkoordinaten erfolgt nach den Formeln x = r cos θ, y = sin θ bzw. r=
√
y 6 x
tP
r ..r...... . . .. .. θ ... .
y -
x
O x = r cos θ y = r sin θ Fig. 7: Polarkoordinaten
y x
x2 + y 2 , θ = arctan .
Beispiel 6: Die Lemniskate mit der Gleichung (x2 + y 2 )2 − 2a2 (x2 − y 2 ) = 0 (Fig. 8; vgl. auch Beispiel 3 in XII.2) hat in Polarkoordinaten die Gleichung r4 − 2a2 r2 (cos2 θ − sin2 θ) = 0, also
337
2
@
6
...................@ ......................... ....... ...... ....... ... ...... . . . . .... @ . ..... ..... ... . . . .. . @...... .. . . . ... . . . . .. ... @......... ... . . . . . . @ . . . ..... . . . . . .. . .......................... @........................... @ @
2
r = 2a cos 2θ
mit −
π π ≤ θ ≤ 4 4
f¨ ur den rechten Teil
und
3 5 π≤θ≤ π 4 4
f¨ ur den linken Teil.
Fig. 8: Lemniskate
Damit gewinnt man auch eine Parameterdarstellung:
x ϕ(θ) cos θ = = 2a2 cos 2θ y ψ(θ) sin θ
Ist eine Kurve in Polarkoordinaten durch die Gleichung r = r(θ) gegeben, dann hat sie die Parameterdarstellung x = ϕ(θ) = r(θ) cos θ,
y = ψ(θ) = r(θ) sin θ.
F¨ ur ihre Steigung m (= m(θ)) bez¨ uglich des kartesischen Koordinatensystems gilt also wegen m(θ) =
ψ (θ) : ϕ (θ)
m=
r sin θ + r cos θ r tan θ + r = r cos θ − r sin θ r − r tan θ
XII Kurven und Fl¨achen
338
Ebenso ergeben sich die Aussagen in den folgenden S¨atzen aus den entsprechenden Aussagen u ¨ber Kurven in Parameterdarstellung. Satz 4: Ist durch r = r(θ) mit einer stetigen Funktion r auf [α; β] eine Kurve C in Polarkoordinaten gegeben, so hat die von den Strahlen OP + mit P ∈ C u ¨berstrichene Fl¨ache den Inhalt β
1 2 A= r dθ. 2α Satz 5: Ist durch r = r(θ) mit einer stetig differenzierbaren Funktion r auf [α; β] eine Kurve C in Polarkoordinaten gegeben, so hat die Kurve die L¨ange β
r2 + (r )2 dθ.
L= α
Satz 6: Ist durch r = r(θ) mit einer zweimal differenzierbaren Funktion r auf [α; β] eine Kurve C in Polarkoordinaten gegeben, so hat diese an der Stelle θ den Kr¨ ummungsradius = (θ) mit 3
(r2 + (r )2 ) 2 = 2 . r + 2(r )2 − rr Beispiel 7: Die Lemniskate in Beispiel 6 umschließt eine Fl¨ache vom Inhalt π
1 A = 2 · · 2a2 2
2
cos 2θ dθ = 2a2 .
− π4
Diese Kurve hat die L¨ange π
√ 4 L = 2·a 2 − π4
π
π
√ 4 √ 4 1 1 sin2 2θ √ dθ = 4 2a √ dθ. cos 2θ + dθ = 2 2a cos 2θ cos 2θ cos 2θ π 0 −4
π = 0 steht hier ein uneigentliches Integral. Dieses existiert, denn f¨ ur 2 π 1 4 π 1 π 2 1 √ dt existiert. Es gilt dθ = 0 < x < ist cos x > 1 − x, und 2 π t 4 4 1− θ 0 0 π
Wegen cos
π
1 4 π π 1 π 1 √ dt = . < √ dθ < t cos 2θ 4 4 2 0
0
XII.3 Parameterdarstellung von Kurven
339
Aufgaben √
1. Man parametrisiere die Kurve mit der Gleichung 2x− y ln y = 0 mit y = t2 (t > 0). Man zeichne f¨ ur t = 1, 2, 3, 4, 5 die Kurvenpunkte mit ihren Tangentenvektoren.
2. Eine Kurve sei in Polarkoordinaten durch die Gleichung r = θ gegeben. n
Man zeichne die Kurvenpunkte einschließlich der Steigungen f¨ ur θ = π 2 (n = 1, 2, 3, 4). Man bestimme auch die Kr¨ ummung in diesen Punkten und zeichne dann die Kurve f¨ ur 0 ≤ θ ≤ 2π.
3. In Fig. 9 ist die Kurve mit der Gleichung (1 − x2 )3 − y 2 = 0 gezeichnet. a) Man zeige, dass die Kurve in Fig. 9 folgende Parameterdarstellung hat: x = cos t, y = sin3 t (0 ≤ t ≤ 2π) b) Man bestimme die Wendepunkte und die Steigungen in diesen. c) Man berechne den Inhalt der eingeschlossenen Fl¨ache. d) Man berechne die L¨ange der Kurve. e) Man berechne den Radius des Kr¨ ummungskreises in den Kurvenpunkten (0, ±1).
4. In Fig. 10 ist eine Zissoide gezeichnet. Sie hat in Polarkoordinaten die Darstellung r=a
sin2 θ cos θ
π 2
− b > 0 voraussetzen wollen) bzw. der Parameterdarstellung
x a cos t = y b sin t
(t ∈ [0; 2π[)
XII Kurven und Fl¨achen
342 hat die Parameterdarstellung
⎛
⎜ x a cos t a2 sin2 t + b2 cos2 t −b cos t = + =⎜ ⎜ ⎝ y b sin t −a sin t ab
⎞ a2 − b2 cos3 t ⎟ a ⎟ ⎟ ⎠ a2 − b2 3 − sin t b
(t ∈ [0; 2π[). Nach Elimination des Parameters t ergibt sich die Gleichung 2
2
2
(ax) 3 + (by) 3 = (a2 − b2 ) 3 bzw.
2
2
ax 3 by 3 + 2 = 1 mit e2 = a2 − b2 . e2 e
Die Evolute ist also eine Asteroide (vgl. Beispiel 5 in XII.2). Die Spitzen der Asteroiden sind die Mittelpunkte der Scheitelkr¨ ummungskreise der Ellipse. Die geometrische Konstruktion dieser Mittelpunkte ist in Fig. 3 angedeutet. ..u ... . .. .... . . ........................................ .. .. ........................ ............. J . .... . .. ............. . . . . . . . . . . . . . . ..... J .......... .. ... .. .. .... ......................... J . ................ .... .... . .... .. . . . . . . . . . . . ..... .. .. . . ..... ... .. .... .. . .. .. . .. J... r....... .. .... ... .. . . . ...... J ... . .. . . . . . ..... ... .. .. .. ... .. J .... ...... ... ... . ... ...... . . ...... . . . . . . J . . .. . . .. . . . . . . . .... u . ..u..... . . .... J ............... ............. . . .. .. ... ..... . . . . . . . .. . . . . . . . . J . . .. . . . .... ... .. .. . .. .. ... .... . . ... .... J .. . . .. . ... . .. ... ... .... . . . J . .. .... .......... ...... .... .. ... .. . . . . . . . . ............. .... .... .. . J ... . .. ............... . . . . .......... .. . . ... . J .... .......... .. . . . . . . . . . . .. . ............... J .. . ...... . .. . . . . . . . ............J . . . . . . . . . . . . . .. . ...................... .. . . .. J .. ... . J.u Fig. 3: Asteroide als Evolute einer Ellipse
In Fig. 4 ist der Kr¨ ummungsradius M P zum Ellipsenpunkt P eingezeichnet. Er liegt auf der Tangente an die Asteroide im Punkt M . Ist σ die Bogenl¨ange des Asteroidenst¨ ucks zwischen M und der Spitze A und r der Kr¨ ummungsradius im Nebenscheitel, dann hat der Kr¨ ummungsradius im Punkt P den Betrag = σ + r, was wir im Folgenden n¨aher begr¨ unden werden. Dies gilt auch f¨ ur den Kr¨ ummungsradius R im Hauptscheitel, ein Viertelbogen der Asteroide hat also die L¨ange R − r =
a2 b2 − . b a
...sB . .............................................. ... ......... ....... ... ..... ... .... ....sM ... ...... .. ......... σ ... .............s r .... ... .. ... A .. ... R . .. .. ... ...... ... ........... ...s... ......... .................................... P Fig. 4: Bogenl¨ ange der Asteroiden
XII.4 Evoluten und Evolventen
343
Man denke sich auf einer Kurve C einen Punkt A gegeben und ordne dem Kurvenpunkt P denjenigen Punkt Q zu, der auf der Tangente an die Kurve in P liegt und dessen Entfernung von P gleich der L¨ange des Kurvenbogens von P nach A ist (Fig. 5). Die Punkte Q liegen auf einer Kurve, die durch Abwicklung“ aus C ent” steht; diese Kurve nennen wir eine Evolvente von C.
k .... .... .... .... ..Q .. ..Q .. ... Q .t. ... ... ...Q Evolvente .Q . .. A ................. ...t . . . . . . . . A ...... A ........ C A .... .. . . .... A s .. . ... . A s .... A ... A . A .... A .. .. P (x, y) AA...t...... ..
Fig. 5: Evolvente
Das lateinische evolvere kann man etwa mit herauswickeln“ u ¨bersetzen. Man ” beachte, dass zu verschieden gew¨ahlten Punkten A auch verschiedene Evolventen von C geh¨oren und dass man die Kurve von A aus in zwei verschiedene Richtungen durchlaufen kann. In obigem Beispiel 2 haben wir als Ausgangspunkt der Evolvente einen Punkt auf der Tangente in A gew¨ahlt. In diesem Fall muss man in der Formel in Satz 2 zu s eine Konstante addieren. Satz 2: Ist eine Kurve C in Parameterdarstellung gegeben, etwa
x ϕ(t) = y ψ(t)
(t ∈ [a; b]),
dann hat ihre Evolvente zum Punkt A = (ϕ(t0 ), ψ(t0 )) die Parameterdarstellung
x ϕ ϕ s = − , y ψ (ϕ )2 + (ψ )2 ψ
wobei wir zur Vereinfachung die Variable t unterdr¨ uckt haben, und wobei
s = s(t) =
t
t0
(ϕ (τ ))2 + (ψ (τ ))2 dτ.
Beweis: Wird die Kurve mit wachsendem t von A nach P durchlaufen und ist t −→ der Tangentenvektor in P , dann ist P Q= −s t. 2 Beispiel 3: Die Evolvente der Kettenlinie mit der Gleichung y = cosh x = ex + e−x (Fig. 6) und dem Anfangspunkt A(0, 0) hat die Parameterdarstellung 2 t 1 + sinh2 τ dτ
x y
=
t − cosh t
2
1 sinh t
1 + sinh t sinh t t 1 t − sinh t/ cosh t − = . cosh t 1/ cosh t cosh t sinh t
=
0
XII Kurven und Fl¨achen
344
√ 1 sinh t 1 = y 2 − 1 = 1 − y 2 und damit Es sei t > 0. Mit cosh t = ist dann y cosh t y √ 1 x = cosh−1 − 1 − y 2 , wobei cosh−1 die Umkehrfunktion von cosh auf IR+ 0 ist. y
Die Kurve mit dieser Gleichung nennt man eine Traktrix oder Schleppkurve: Wird ein Massepunkt in (0, a) an einem Faden der L¨ange a befestigt und das Ende des Fadens dann entlang der x-Achse gezogen, dann bewegt sich der Massepunkt auf einer Schleppkurve mit der Gleichung x = cosh−1
a ± y
a2 − y 2 .
Beispiel 4: Wir wollen die Evolvente des Kreises mit der Parameterdarstellung
x cos t = y sin t
(t ∈ [0; 2π[)
zum Anfangspunkt (1,0) bestimmen. Hier ist s(t) = t, es ergibt sich also als Parameterdarstellung der Evolvente
x cos t + t sin t = . y sin t − t cos t
Die Kreisevolvente ist ein spiralf¨ormiges Kurvenst¨ uck, welches man f¨ ur t ≥ 2π spiralf¨ormig fortsetzen kann (Fig. 7).
... .. y ... ... 6 ... . Kettenlinie . ... .. ... ... .... . . ..... .... ....... ...... . . ........... . . . . . ........................................... ... 1 ............ . . . . . ........ . ......... Traktrix ....... ........ ........... . . . . . . . . . . .................... . . . . . . . . . . ........... ...................... .. x 1 Fig. 6: Traktrix als Evolvente der Kettenlinie
........................................... ......... .. . . . . ..... . ... ......... . ..... ..... . . . . . . . . . . . ..... . .. ................................ ..... ... ..... ............... ....... ... ... .... .. ..... .. . ........ .......u.. ..... . ... . .............................................................................................. . ... ... . . . ... ... π ... ... ... ..... . . . ... . ... . . . ... ... ... . . ... 2π . ... ... . ... . ... . . . . ... ... .... ......... ... .... ...... ... ...... . . . . ....... . ... ...... ........ . ............ ......... .................................................... Fig. 7: Kreisevolvente
Berechnen wir die Evolute der Traktrix in Beispiel 3 oder der Spirale in Beispiel 4, dann ergibt sich wieder die Kettenlinie bzw. die Kreislinie, deren Evolvente die Traktrix bzw. die Spirale ist. Allgemein besteht der im folgenden Satz 3 formulierte Zusammenhang zwischen Evolvente und Evolute, wobei man beachte, dass die Evolute einer Kurve eindeutig bestimmt ist, eine Evolvente aber erst durch Angabe des Anfangspunkts festgelegt ist. Beim Beweis von Satz 3 f¨ uhrt es zur
XII.4 Evoluten und Evolventen
345
Vereinfachung der Rechnungen, wenn man als Parameter t in der Parameterdarstellung der gegebenen Kurve C ihre Bogenl¨ange s (gemessen ab einem festen Punkt) verwendet. Wegen (ϕ (s))2 + (ψ (s))2 = 1 gilt dann:
x ϕ = +r y ψ
Evolute von C:
−ψ ϕ
x ϕ ϕ = −s y ψ ψ
Evolvente von C:
Hier wurde zur Vereinfachung der Schreibweise statt x(s), ϕ(s), r(s) usw. einfach 1 x, ϕ, r usw. geschrieben. Dabei ist r = der Kr¨ ummungsradius von C. ϕψ −ψ ϕ
2
2
Wegen (ϕ ) + (ψ ) = 1 und damit ϕ ϕ + ψ ψ = 0 ist ϕ ψ − ψ ϕ =
1 1 ψ ϕ 2 2 2 ((ϕ ) ψ − ψ ϕ ϕ ) = ((ϕ ) ψ + ψ (ψ ) ) = = − . ϕ ϕ ϕ ψ
Also ist ϕ = rψ und ψ = −rϕ . Satz 3: Jede Kurve ist eine Evolvente ihrer Evolute und die Evolute jeder ihrer Evolventen. Beweis: Es sei die Kurve C mit der Parameterdarstellung
x ϕ(s) = gegeben, y ψ(s)
wobei der Parameter s die Bogenl¨ange auf C bedeutet, gemessen ab einem festen Anfangspunkt. Eine Evolvente der Evolute von C hat die Parameterdarstellung
x ϕ − rψ σ = − y ψ + rϕ ((ϕ − rψ ) )2 + ((ψ + rϕ ) )2
(ϕ − rψ ) , (ψ + rϕ )
wenn σ = σ(s) die Bogenl¨ange auf der Evolute bedeutet und Anfangspunkt und Richtung der Messung von σ zun¨achst beliebig sind. Nun ist (ϕ − rψ ) = ϕ − r ψ − rψ = −r ψ ,
(ψ + rϕ ) = ψ + r ϕ + rϕ = r ϕ
und damit
x ϕ − rψ σ = − y ψ + rϕ (r )2
Weiterhin ist
−r ψ ϕ − rψ σψ = + . +r ϕ ψ + rϕ −σϕ
(σ )2 = (−r ψ )2 + (r ϕ )2 = (r )2 ,
also σ = ±r und damit σ = ±r+c (c ∈ IR). W¨ahlen wir nun diejenige Evolvente, welche sich f¨ ur σ = r ergibt, so erh¨alt man die Parameterdarstellung von C. Damit ist der erste Teil des Satzes bewiesen.
XII Kurven und Fl¨achen
346
Den zweiten Teil beweist man auf ¨ahnliche Art. Man kann ihn auch anschaulich beg¨ unden: Wird die Kurve an einem Kurvenpunkt P mit dem zugeh¨origen Evolventenpunkt Q ein kleines St¨ uck weiter abgewickelt, so liegen die zugeh¨origen Evolventenpunkte n¨aherungsweise auf einem Kreisbogen um P mit dem Radius P Q. Der Kr¨ ummungskreis der Evolvente im Punkt Q hat also den Mittelpunkt P (Fig. 8). 2
.............. ... .......................s. Q ... .. ......s........ ... ... ................s................ . .. .. .. ........ A ... ... ......... . .. .. ....... ........... . ........ .......... .s ..... P ....s .. Fig. 8: Zu Satz 3
Aufgaben 1. Man bestimme ohne Benutzung von Satz 3 die Evolute der Spirale aus Beispiel 4.
2. Man bestimme ohne Benutzung von Satz 3 eine Evolvente der Evolute der Parabel aus Beispiel 1.
3. Durch r = θ (θ ≥ 0) ist eine archimedi-
sche Spirale in Polarkoordinaten gegeben (Fig. 9).
a) Wie lang ist das Kurvenst¨ uck f¨ ur 0 ≤ θ ≤ 2π ? b) Welchen Inhalt hat der Sektor zwischen π π den Radiusvektoren f¨ ur θ = und θ = ? 4
2
c) Man gebe eine Parameterdarstellung an. d) Man bestimme die Evolute.
4. Durch r = eθ mit θ ∈ IR ist eine logarithmi-
sche Spirale in Polarkoordinaten gegeben (Fig. 10). a) Wie lang ist das Kurvenst¨ uck f¨ ur 0 ≤ θ ≤ 2π ?
b) Man gebe eine Parameterdarstellung an. c) Man bestimme die Evolute.
........... ........ ....... ...... ..... .... .... ... ... ... ... .. . . . . . . . . . . . . .. .... ...... . . . . . ..r... .. ... . . .... . 2π . ... ... ... . . ..... ... ....... ..... . . . .......... . . . . ....................... Fig. 9: Archimedische Spirale
......... ........ ....... ....... ...... ..... .... .... ... ... ... ... ... .. . . . . . . . . . . . . . .... . ................ .. . . . . . . . .. ... ........s.1.....s .. ................... .... ... . ... ... .... ... . . ..... . ... ....... ............. ................... .......... Fig. 10: Logarithmische Spirale
XII.5 Kurven und Fl¨achen im Raum
347
XII.5 Kurven und Fl¨ achen im Raum ⎛
⎞ ⎛ ⎞ x p + ta So wie durch ⎝ y ⎠ = ⎝ q + tb ⎠ (t ∈ IR) mit (a, b, c) = (0, 0, 0) eine Gerade im z r + tc ⎛ ⎞ ⎛ ⎞ x ϕ(t) ⎝ ⎠ ⎝ Raum beschrieben wird, ist auch allgemein durch y = ψ(t) ⎠ (t ∈ I) eine z χ(t)
Kurve im Raum gegeben, wenn ϕ, ψ, χ auf dem Intervall I stetige Funktionen sind. Sind diese differenzierbar, dann ist Q ...............u...... . z . . . . . .. . ⎛ ⎞ ...... .... . 6 .... ...... ... ϕ (t) . . . . ... Δχ ⎜ ⎟ .... .... ⎝ ψ (t) ⎠ ⎛ ⎞ ... ... ....... . . Δϕ .. Δs .. −→ .. . χ (t) . . . . . .. ⎟ .. P Q= ⎜ ... .... ⎝Δψ⎠ ... ........ Δψ .. . ein Tangentenvektor an der Stelle t Δχ .. .......................................................... - y (Fig. 1). Ist I = [a; b], dann ist die .................. ....... Δϕ L¨ange der Raumkurve ....... . u . x . P. . b
(ϕ (t))2 + (ψ (t))2 + (χ (t))2 dt.
Fig. 1: L¨ ange einer Raumkurve
a
⎛ ⎞ ⎞ a cos t x a sin t ⎟(0 ≤ t ≤ 2π) wird in einem kartesischen Beispiel 1: Durch ⎝ y ⎠ = ⎜ ⎝ ⎠ b z t 2π ⎛
Koordinatensystem eine Schraubenlinie mit dem Radius a und der H¨ohe b beschrieben (Fig. 2). z 6 . . . . . . . . . ........................... . . . . . . . . . . . . . . . . . . ... ...... .. ........ ........ ................................................................................................................. .......... .. .......... 6 ............... .......... ......... ... . . . . . . ................................................................................................ .... . .. ... ............. . ......... ... .... ... .......... ..... ......... ... . . . . . . . ... ... . ... ......... L............ .. b . . ... ... . .. .... b ..... .. . . . . . . ... ..... . ... ... . ...... . .. . . . . . . . . . ... . . . .................................. ..................... .... ...... .. . . . . . . . . ... ....................... . . ...... . . . ................... ......... ? . . . . . . ... ........ .... . ..... ............................................................................................................................... -... .... . . . . .. ....... .. ... . . . . . . . . . y 2πa .................................... ...a............... .........................
+ x
Fig. 2: Schraubenlinie
Fig. 3: L¨ ange der Schraubenlinie b
, wie man auch Der Tangentenvektor hat die Koordinaten −a sin t, a cos t, 2π leicht der Anschauung entnehmen kann. Ebenfalls der Anschauung kann man die L¨ange L der Schraubenlinie entnehmen (Fig. 3).
XII Kurven und Fl¨achen
348
Beispiel 2: Sind a, b zueinander orthogonale Einheitsvektoren aus IR3 , dann bilden die Punkte mit den Ortsvekoren x = m + r cos t a + r sin t b (0 ≤ t ≤ 2π) einen Kreis auf der Ebene E : x = m + ua + vb (u, v ∈ IR) mit dem Radius r und −→ dem Mittelpunkt M (mit OM = m). Denn wegen |a| = |b| = 1 und a ⊥ b ist |r cos t a + r sin t b|2 = r2 cos2 t|a|2 + r2 sin2 t|b|2 = r2 . Beispiel 3: Wie bei ebenen Kurven f¨ uhrt die Berechnung der L¨ange einer r¨aumlichen Kurve meistens auf unangenehme Integrale. Wir betrachten als Beispiel die Durchdringungskurve zweier Zylinder, die sich rechtwinklig zentral schneiden (Fig. 4). Der Zylinder mit der Gleichung x2 + z 2 = 1 hat die Parameterdarstellung
z 6 . . ................ .................................. . . . . . . . . . .... ..... .. ......... . . . . . . . .............................................. ............ . ..... ............ .... .. ... . .. .... .. .. ... .. . ...... . .... ........... ........... x ... . ......... ... ....................................................
... .. ... ... ... ... ...
x = cos t, y = u, z = sin t
...... .. ... ... ..... y ... .... .. ... .. .....
Fig. 4: Durchdringung zweier Zylinder
(0 ≤ t ≤ 2π, u ∈ IR). Er wird von dem Zylinder mit der Gleichung x2 + y 2 = 4 geschnitten. Die Durchdringung erfolgt in zwei zueinander symmetrischen geschlossenen Kurven. Wir betrachten nur die Kurve C mit y > 0. Aus cos2 t + u2 = 4 ergibt sich eine Parameterdarstellung von C:
x = cos t, y =
4 − sin2 t, z = sin t (0 ≤ t ≤ 2π).
F¨ ur die Bogenl¨ange s = s(t) gilt (s (t))2 = 1 +
sin2 t cos2 t 4 − sin4 t = . 4 − sin2 t 4 − sin2 t
Die L¨ange von C ist also 2π
L= 0
π 2
4 − sin4 t dt = 4 · 4 − sin2 t 0
4 − sin4 t dt. 4 − sin2 t
Das Integral ist nicht elementar auswertbar“. Die Simpson-Regel liefert ” ⎛
⎞
π ⎝ 15 L≈4· + 1⎠ = 1,0234 · 2π. 1+4 12 14
XII.5 Kurven und Fl¨achen im Raum
349
Im Raum, der mit einem affinen Koordinatensystem (x, y, z-Achsen) versehen ist, wird durch die Gleichung z = ax+by+c mit (a, b) = (0, 0) eine Ebene beschrieben (welche nicht parallel zur z-Achse ist). Ist nun allgemeiner f eine Funktion von zwei Variablen, dann wird durch z = f (x, y) eine Fl¨ache beschrieben, welche von allen zur z-Achse parallelen Geraden in h¨ochstens einem Punkt geschnitten wird. Allgemeiner ist ax + by + cz + d = 0 mit (a, b, c) = (0, 0, 0) die Gleichung einer Ebene; entsprechend ist F (x, y, z) = 0 die Gleichung einer Fl¨ache, wobei F eine Funktion von drei Variablen ist. (Die z 6 Funktion F muss gewissen Bedingun...v1 gen gen¨ ugen, damit nicht wie z. B. bei ........ . ....... der Gleichung x2 + y 2 + z 2 + 1 = 0 die ..... .............. .v . leere Menge beschrieben wird.) .. . .. ............... .... ... ................................ . . . . .. .... ........................ Beispiel 4: Bei der geschlossenen ............................ . . . ....... . . . . . . . . . . . ..v ........................ . ........................................v Fl¨ache in Fig. 5 entsteht bei jedem .............. .... . . . . . . . . y . . . . . . ... ....... .......... ..... 1 .. ... ........... . .... Schnitt mit einer Ebene, die zu einer ............... ... .. ... ..v .............. ..... Koordinatenebene parallel ist, eine As1 ....... .. teroide mit gleichlangen Achsen. Die ........ x ....... Fl¨ache hat daher die Gleichung ..v 2
2
2
x 3 + y 3 + z 3 = 1.
Fig. 5: Asteroidenk¨ orper
Schließlich⎛kann⎞man⎛eine Ebene auch in Parameterdarstellung angeben, also in ⎞ x
p + ua + vd
z
r + uc + vf
der Form ⎝ y ⎠ = ⎝ q + ub + ve ⎠ (u, v ∈ IR) mit (a, b, c), (d, e, f ) = (0, 0, 0). Dem die ache im Raum durch ⎛ ⎞entspricht ⎛ ⎞ Beschreibung einer beliebigen Fl¨ x ϕ(u, v) ⎝ y ⎠ = ⎝ ψ(u, v) ⎠ (u ∈ I, v ∈ J), wobei I, J Intervalle aus IR und ϕ, ψ, χ z χ(u, v)
auf I × J stetige Funktionen sind.
Wir wollen die Tangentialebene einer in Parameterdarstellung gegebenen Fl¨ache (s. o.) in dem Punkt mit den Parameterwerten (u, v) ∈ I × J bestimmen, wobei wir nat¨ urlich voraussetzen m¨ ussen, dass die partiellen Ableitungen von ϕ, ψ, χ in einer Umgebung von (u, v) existieren. (u, v +...Δv) Dazu betrachten wir zun¨achst die Ebe..... ......................................... ...... ......... s . . . . . . . ....... ne durch die drei Punkte mit den Pa..... . . . 6 . . s ........... ... . rameterwerten . . ...... * . . . .. .................... ........................................... . . . . . . . ....... (u, v), (u + Δu, v), (u, v + Δv) ∈ I × J ......... .... s .......... (u, v) ......... (u + Δu, v) . (Fig. 6), wobei wir den Grenz¨ ubergang .... ........ ..... Δu, Δv → 0 im Auge haben. Diese Ebene hat die Parameterdarstellung
Fig. 6: Tangentialebene
XII Kurven und Fl¨achen
350 ⎛
⎞
⎛
⎞
⎛
⎞
⎛
⎞
x ϕ(u, v) ϕ(u + Δu, v) − ϕ(u, v) ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ y ⎠ = ⎝ ψ(u, v) ⎠ + r ⎝ ψ(u + Δu, v) − ψ(u, v) ⎠ z χ(u, v) χ(u + Δu, v) − χ(u, v) ϕ(u, v + Δv) − ϕ(u, v) ⎜ ⎟ + s ⎝ ψ(u, v + Δv) − ψ(u, v) ⎠ χ(u, v + Δv) − χ(u, v) Vervielfachen wir den ersten Richtungsvektor mit
(r, s ∈ IR).
1 1 und den zweiten mit , Δu Δv
dann gehen diese Vektoren f¨ ur Δu → 0 bzw. Δv → 0 in Tangentialvektoren u ¨ber. Die Parameterdarstellung der gesuchten Tangentialebene ist also ⎛
x
⎞
⎛
ϕ(u, v)
⎞
⎛
ϕu (u, v)
⎞
⎛
ϕv (u, v)
⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ y ⎠ = ⎝ ψ(u, v) ⎠ + r ⎝ ψu (u, v) ⎠ + s ⎝ ψv (u, v) ⎠
z
χ(u, v)
χu (u, v)
(r, s ∈ IR),
χv (u, v)
wobei der Index u bzw. v die partielle Ableitung nach u bzw. v angibt. ⎛
⎞ ⎛ ⎞ x a cos u cosh v Beispiel 5: Durch ⎝ y ⎠ = ⎝ b sin u cosh v ⎠ (u ∈ [0, 2π[, v ∈ IR) wird ein z c sinh v
einschaliges Hyperboloid beschrieben, denn x2 y 2 z 2 + 2 − 2 = (cos2 u + sin2 u) cosh2 v − sinh2 v = cosh2 v − sinh2 v = 1. a2 b c 1
1
(Dabei ist sinh x := (ex − e−x ) und cosh x := (ex + e−x ); vgl. XII.1, Bsp. 2). 2 2 Die Tangentialebene im Punkt (x0 , y0 , z0 ) mit den Parameterwerten u0 , v0 hat die Richtungsvektoren ⎛
⎞
⎛
⎞
⎛
⎞
⎛
⎞
−a sin u0 cosh v0 −a2 y0 a cos u0 sinh v0 (tanh v0 ) x0 1 ⎜ 2 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = und = b cos u cosh v b x b sin u sinh v ⎝ ⎝ ⎝ ⎝ (tanh v0 ) y0 ⎠ . 0 0 ⎠ 0 ⎠ 0 0⎠ ab 0 0 c cosh v0 (tanh v0 )−1 z0
Die beiden Richtungsvektoren sind orthogonal zu dem Vektor mit den Koordinax y z ten 20 , 20 , − 20 , wie man durch Berechnen der Skalarprodukte feststellen kann. a b c Daraus ergibt sich die aus der Analytischen Geometrie bekannte Gleichung der Tangentialebene an das Hyperboloid im Punkt (x0 , y0 , z0 ): xx0 yy0 zz0 + 2 − 2 = 1. a2 b c Zur tieferen Untersuchung von Kurven und Fl¨achen im Raum ben¨otigt man weitergehende Methoden der Analysis mehrerer reeller Ver¨anderlicher und Methoden der Differenzialgeometrie.
XII.5 Kurven und Fl¨achen im Raum
351
Aufgaben
z
1. Man bestimme eine Parameterdarstellung f¨ ur den Kreis um M (3, 5, 1) mit dem Radius 7, der auf der Ebene mit der Gleichung 2x + y − 3z = 8 liegt.
2. Es sei 0 < a < 1 und h > 0. Durch x = at cos t, y = at sin t, z = h at (t ≥ 0) wird eine Spirale beschrieben, die auf der Kreiskegelfl¨ache mit der z2
Gleichung x2 +y 2 = 2 (z ≥ 0) verl¨auft h (Fig. 7). Wie lang ist die Spirale?
3. a) Man bestimme die gr¨oßte Kugel, die in den Asteroidenk¨orper in Fig. 5 passt. b) Man berechne das Volumen des Asteroidenk¨orpers in Fig. 5.
4. Man zeige, dass ⎛
⎞
⎛
⎞
x r cos u cos v ⎜ ⎟ ⎜ ⎟ ⎝ y ⎠ = ⎝ r sin u cos v ⎠ z r sin v
π π u ∈ [0, 2π[, v ∈ − ; eine Para2 2
meterdarstellung der Kugel mit dem Mittelpunkt (0, 0) und dem Radius r ist (Fig. 8). Man bestimme dann eine Parameterdarstellung eines Ellipsoids mit dem Mittelpunkt (0,0) und den Halbachsenl¨angen a, b, c.
5. Man zeige, dass ⎛
⎞
⎛
⎞
x a cosh v ⎜ ⎟ ⎜ ⎟ ⎝ y ⎠ = ⎝ b cos u sinh v ⎠ z c sin u sinh v (u ∈ [0; 2π[, v ∈ IR) ein zweischaliges Hyperboloid beschreibt (Fig. 9). Dabei sind sinh und cosh die hyperbolischen Funktionen aus X.2 Aufgabe 7. Man bestimme eine Parameterdarstellung und eine Gleichung der Tangentialebene in einem gegebenen Punkt.
6
......................................... .............. ...... ....... ... h ....... .. ...............t....... ..................................... ........................................... ... ...... .. . . . ... ................. . . . . . ................... .. .... ......................................... ........................................ ...... .. ... ... .. . ... ... ... ... .. ... . .
y
x
Fig. 7: Spirale auf Kegel
6z
tP
r
.. ... r sin v ... v HH.. . ...... u ...H ... ..................... HH HH x
y
-
r cos v
Fig. 8: Zu Aufgabe 4
. ............ .... ..... . z 6. . ... . .. ... .... .. ... .. .. .. . . . . ......... . .. .... .............. .... .. ... .... .... ..... .. ... -y ... .. ................. .. ... ... . . .... ... .. .... . . .. .. .. x .... .... ... ..... ......... Fig. 9: Zweischaliges Hyperboloid
Lo ¨sungen der Aufgaben Lineare Algebra I.1 1. f (x) = 2x4 − x3 + 3x2 − 5x + 11 I.1 2. (x1 , x2 , x3 , x4 , x5 , x6 , x7 ) = (2, 10, 8, 6, 2, 5, 8) I.1 3. Ansatz x1 + x2 + x3 + x4 = 1, 6x1 + 6x2 + 3x3 + 2x4 = 4, 15x1 + 10x2 + 15x3 + 10x4 = 12. Mit x1 = t ergibt sich x2 = 25 − 34 t, x3 = 25 − t, x4 = 15 + 34 t; dabei muss 0 ≤ t ≤ 25 sein, damit x3 ≥ 0 ist. I.1 4. (x1 , x2 , x3 , x4 , x5 , x6 , x7 ) = (600 − r, −500 + r + s, 600 − r, r, −700 + s, −500 + s, s); wegen x5 ≥ 0 folgt x7 = s ≥ 700 und daraus x6 ≥ 200. G¨ unstigste L¨ osung x5 = 0 (Abschnitt BC sperren) also x7 = s = 700 und somit (x1 , x2 , x3 , x4 , x5 , x6 , x7 ) = (600 − r, 200 + r, 600 − r, r, 0, 200, 700) mit 0 ≤ r ≤ 600.
I.2 1. a) Hat ein LGS die L¨ osungen (u1 , u2 , . . . , un ) und (v1 , v2 , . . . , vn ), dann hat es auch die L¨osung (u1 + t(v1 − u1 ), u2 + t(v2 − u2 ), . . . , un + t(vn − un )) mit t ∈ IR. osung, f¨ ur r = b) F¨ ur r = 52 genau eine L¨ L¨osungen (s = 6).
5 2
keine L¨ osung (s = 6) oder unendlich viele
I.2 2. x1 + 3x2 = 7, 4x1 + 3x3 = 19; das LGS ist nicht eindeutig bestimmt! I.2 3. Es ist p(1, 3, −1) + q(11, 2, 20) = ( 73 p + 5q)(1, 1, 1) + (− 23 p + 3q)(2, −1, 5), und ebenso kann man r(1, 1, 1) + s(2, −1, 5) als Element der zweiten Menge darstellen. I.2 4. a) r(1, −4, −1, −4, −11) (r ∈ IR) b) L¨osen durch genaues Hinsehen“: Es ist 4(x1 + x2 + x3 + x4 + x5 ) = 15, ” 15 15 also x1 = 15 4 − 1, x2 = 4 − 2, . . . , x5 = 4 − 5 I.3 1. Aus r(a+2b)+s(a+b+c)+t(a−b−c) = o folgt (r+s+t)a+(2r+s−t)b+(s−t)c = o, und das LGS r + s + t = 0, 2r + s − t = 0, s − t = 0 hat nur die L¨ osung r = s = t = 0.
I.3 2. Aus
n
i=0
ai (1 + x)i = 0 folgt durch Einsetzen von x = −1 zun¨ achst a0 = 0, K¨ urzen
von (1 + x) und Einsetzen von x = −1 liefert a1 = 0 usw. √ √ √ √ u angig: Aus a + b 2 + c 3 = 0 mit√a, b, c ∈√Q I.3 3. {1, 2, 3} ist ¨ber Q linear√unabh¨ √ folgt a2 = 2b2 + 2bc 6 + 3c2 . Weil 6 irrational ist, muss bc = 0 sein; weil 2 und 3 irrational sind, muss b = c = 0 und damit auch a = 0 sein. I.3 4. a) Vektorraumaxiome verifizieren, insbesondere geh¨ ort o zur Schnittmenge. b) F¨ ur u1 ∈ U1 \ U2 und u2 ∈ U2 \ U1 ist u1 + u2 ∈ U1 und u1 + u2 ∈ U2 , also u1 + u2 ∈ U1 ∪ U2 . (Dabei ist allgemein A \ B die Menge aller Elemente aus A, die nicht zu B geh¨oren.) c) Die Darstellung ist eindeutig, wenn U1 ∩ U2 = {o}. I.3 5. IR-Vektorraum der Dimension 2. I.3 6. Beispiele f¨ ur Basen sind
2 −2 3
2 1 0
−1 4 , 0
2 1 0
−1 1 3
2 1 , 0
−1 4 0
2 1 0
2 −2 3
,
2 0 1
0 1 2
1 2 , 0
1 2 0
0 1 2
2 0 , 1
0 2 1
2 1 0
1 0 2
I.4 1. Axiome nachrechnen; Nullelement U , −(a + U ) = −a + U usw. I.4 2. Beispiel: LGS aus 3x1 + x2 − x3 − x4 = −4, x1 + 2x2 − x4 = −6 anze man zu einer Basis I.4 3. Eine Basis {u1 , u2 , . . . , ur } von U1 ∩ U2 erg¨
Lineare Algebra
353
{u1 , . . . , ur , v1 , . . . , vm } von U1 und zu einer Basis {u1 , . . . , ur , w 1, . . . , w n } von U2 . Dann ist {u1 , . . . , ur , v1 , . . . , vm , w 1, . . . , w n } eine Basis von U1 + U2 und es gilt r + m + n = (r + m) + (r + n) − r. I.4 4. Ist (a + u1 , u2 ) ∩ (b + v1 , v2 ) = ∅, dann hat das homogene LGS osungsraum. x1 u1 + x2 u2 + x3v1 + x4v2 = o einen eindimensionalen L¨ (Zwei Ebenen sind parallel oder schneiden sich in einer Geraden.) I.4 5. Beide Aussagen sind gleichwertig mit a − b ∈ u, v .
I.4 6. Ist b = ta (oder umgekehrt), dann ist b − a = a und daher (a + U1 ) ∨ (b + U2 ) = a + ( a + U1 + U2 ) = a + U1 + U2 .
I.5 1. Die Vektoren mit den Koordinaten 2, 10, 5 bzw. 1, −1, 4 sind linear unabh¨ angig. I.5 2. Beide Bedingungen sind gleichwertig mit p − q ∈ u, v . I.5 3. a) Auf der einen Geraden seien A, B durch p + ra u und p + rb u gegeben, auf der anderen die Punkte C, D durch q + scv und q + sdv . Die Geraden durch A und D bzw. durch B und C schneiden sich genau dann, wenn die Gleichung p + ra u + x((q + sdv ) − ( p + ra u)) = p + rb u + y((q + scv ) − ( p + rb u)) eine L¨osung (x, y) besitzt. Die Gleichung l¨ asst sich umformen zu (x − y)(q − p) + ((1 − x)ra − (1 − y)rb )u + (xsd − ysc )v = o. Aus der linearen Unabh¨ angigkeit von q − p, u, v folgt x = y, ra = rb , sc = sd . b) Nein, denn die Geraden durch A, D bzw. B, C sind windschief. I.6 1. Schwerpunkt (Mitte der Strecke, Schnitt der Seitenhalbierenden des Dreiecks, Schnitt der Verbindungen gegen¨ uberliegender Seitenmitten des Vierecks). I.6 2. Es gen¨ ugt, dies am Quadrat mit den Ecken (0,0), (0,1), (1,0), (1,1) zu zeigen. I.6 3. 5x1 + x2 ≤ −4,
x1 + 3x2 ≤ 20,
−x + 6y ≤ 5,
3x + 2y ≤ 25
I.6 4. Die Punktmenge ist beschr¨ ankt (wegen x1 , x2 , x2 ≥ 0 und x1 + x2 + x3 ≤ 12) und 31 12 11 nicht leer. Ecken sind (0, 0, 0), ( 53 , 0, 0), (0, 7, 0), (0, 0, 2), ( 17 4 , 4 , 0), ( 5 , 5 , 0) usw. n } linear unabh¨ angig. II.1 1. Isomorphismus, wenn {w 1, . . . , w
II.1 2. Ist α injektiv oder surjektiv, dann wird eine Basis auf eine Basis abgebildet. II.1 3. Ist λ(v ) =
n
i=1
ai vi und μ(v ) =
n
i=1
bi vi , dann muss f¨ ur ai , aj = 0 und bi , bj = 0
gelten: Aus ai + aj = 0 folgt bi + bj = 0, also
ai aj
=
bi bj .
Weitere F¨ alle klar.
II.1 4. Man w¨ahle den Koeffizientenvektor von α mit lauter Nullen und einer 1 an einer Stelle, an der sich v1 und v2 unterscheiden. II.1 5. Man verwende eine Basis von U und beachte dim A(A(U )) = dim Hom(V, K) − dim A(U ) = dim V − (dim V − dim U ) = dim U ur alle u1 ∈ U1 , u2 ∈ U2 , dann ist auch λ(u1 ) = 0 und II.1 6. Ist λ(u1 + u2 ) = 0 f¨ λ(u2 ) = 0 f¨ ur alle u1 ∈ U1 , u2 ∈ U2 . Ist λ(u) = 0 f¨ ur alle u ∈ U1 ∩ U2 , dann ist λ = λ1 + λ2 mit λ(u1 ) = 0 und λ(u2 ) = 0 und umgekehrt. ur alle A, dann ist E2 E1 = E2 und E2 E1 = E1 , II.2 1. a) Ist AE1 = A und E2 A = A f¨ also E1 = E2 . Ist E1 A = AE1 = A und E2 A = AE2 = A f¨ ur alle A, dann ist E1 E2 = E2 und E1 E2 = E1 , also E1 = E2 . b) Aus B1 A = AB1 = E und B2 A = AB2 = E folgt B1 = B1 E = B1 AB2 = EB2 = B2 . II.2 2. A = 12 (A + AT ) + 12 (A − AT )
L¨osungen der Aufgaben
354
II.2 3. Der Rang ist 1. Die Spalten- bzw. Zeilenvektoren sind Vielfache von a bzw. b. II.2 4. Man weise AA−1 = E durch eine einfache Rechnung nach. II.2 5. Der Rang ist jeweils 3. II.2 6. Das Produkt jeder Zeile der ersten mit jeder Spalte der zweiten Matrix muss 0 ergeben. Einfachste Beispiele mit erster Zeile von A: (1,0,0,0,0), zweite Zeile von A: (0, 1 − 1, 1, −1), zwei erste Zeilen von B: (0,0,0). II.2 7. a) Haben die Matrizen A, B beide den Rang n, dann sind sie und damit ihr Produkt invertierbar, dieses hat also Rang n. ur gr¨oßere Dimensionen. b) A = 10 10 , B = 00 −11 und analog f¨
II.2 8. dim(Bild B)=Rang B, dim(Bild AB)≤ Rang A, dim(Bild AB)≤ dim (Bild B). √ II.3 1. a) Eine primitive 8.te Einheitswurzel ist α = 12 2(1 + i), die anderen 8.ten √ Einheitswurzeln sind Potenzen von α. Der K¨ orper K muss neben die Zahlen 2, i √ √ Q√ und i 2 enthalten. Eine√Basis von K√als Q-Vektorraum ist {1, 2, i, i 2};√lineare Unabh¨angigkeit: Aus r + s 2 + i(t + u 2) = 0 mit r,√s, t,√u ∈√Q folgt r + s 2 = 0 und √ b) {1, 2, 3, 6} ist eine Basis. t + u 2 = 0, also r = s = t = u = 0. II.3 2. Aus m = a2 + b2 = αα, n = c2 + d2 = ββ folgt mn = ααββ = αβαβ = u2 + v 2 . 5 = 12 + 22 , 13 = 22 + 33 , 65 = 12 + 82 = 42 + 72 . II.3 3. 19 = 11 + 11 + 12 + 42 , 23 = 12 + 22 + 32 + 32 , 31 = 12 + 12 + 22 + 52 , 19 · 23 = 12 + 62 + 122 + 162 , 19 · 23 · 31 = 212 + 212 + 282 + 1092 II.3 4. Allgemein
α β
−β α
−1
=
α β −β α (−1)n + F
1 αα+ββ
2 n+1 = F II.3 5. (1) Fn2 + Fn+1 = Fn−1 Fn+1 + n Fn+2 + (−1) n+(n+1) 2 (2) wie (1) (3) Man benutze Fn = Fn (Fn+1 − Fn−1 ).
II.3 6. xn = Fn−1 , yn = Fn
2 √ II.3 7. x2 − 7y 2 = 1 hat die kleinste L¨ osung (8, 3); es ist 7 ≈ 83 ; mit 83 218 = √ √ 127 336 2 2 ist 7 ≈ 127 osung (10, 3); es ist 11 ≈ 48 . x − 11y = 1 hat die kleinste L¨ 48 127 2 √ 10 33 199 660 10 199 = ist 11 ≈ 60 . 3 ; mit 3 10 60 199
II.3 8. Aus ak+1 =
1 6
+ 34 ak folgt f¨ ur a = lim(ak ) die Gleichung a =
1 6
+ 34 a, also a = 23 .
III.1 1. (x; uy + vz) = u(y ; x) + v(z; x) = u(y ; x) + v(z; x) = u(x; y ) + v(x; z) III.1 2. a) Ist (x, y ) = 0, dann ist (x + y ; x + y ) = (x; x) + (y ; y ). b) Ist y = rx, dann ist |(x, y )| = |(x, rx)| = |r||(x, x)| = |r||x|2 = |x||rx| = |x||y |. Ist |(x, y )| = |x||y | und y = y⊥ + y mit y⊥ ⊥ x und y x, dann ist |(x, y )| = |x, y | ≤ |x||y | ≤ |x||y | nach a), also |y | = |y | und daher y ∈ x . III.1 3. |x| = |(x − y ) + y | ≤ |x − y | + |y |. III.1 4. (1) Spur(B T A)=Spur(AT B), denn AT B = (B T A)T ; (2) Spur(AT A) = Summe der Betragsquadrate der Spaltenvektoren; (3) Spur((rB + sC)T A) = r Spur(B T A) + s Spur(C T A) III.1 5. a) xT Ax = x21 + 2x22 + 6x23 − 2x1 x2 + 2x1 x3 − 6x2 x3 = (x1 −x2 +2x3 )2 +(x2 −x3 )2 +x23 ≥ 0, = 0 nur f¨ ur x1 = x2 = x3 = 0. b) xT AT Ax = (Ax)T Ax ≥ 0; = 0 genau dann, wenn Ax = o, also wenn x = o.
Lineare Algebra
355
c) Man studiere Beispiel 1 und berechne xT Ax f¨ ur xi = r, xj = 1, xk = 0 f¨ ur k = i, j. III.1 6. Der Kern ist der Lotraum von U , vgl. Aufgabe 8. p − u| ≥ |( p − u)⊥ |, also | p − u| III.1 7. Man beachte |x|2 = |x⊥ |2 + |x |2 , dass also | minimal f¨ ur |( p − u) | = 0. Dabei ist u ∈ a + U , also etwa u = a. anze diese zu einer Basis von V . III.1 8. Man w¨ahle eine Basis von U⊥ und erg¨ III.1 9. Die Anwendung des schmidtschen Orthonormierungsverfahrens f¨ uhrt in der Regel auf große rechnerische Schwierigkeiten. Daher sollte man das Erzeugendensystem durch elementare Umformungen vereinfachen. Eine Orthonormalbasis
ist z.B. √1 (1 0 0 1 1)T , √1 (−2 3 − 3 1 1)T , √1 (−2 5 7 3 − 1)T . 3 24 88 √ √ III.2 1. a) E(X) = 2,6; σ(X) = 1,34 ≈ 1,16; E(Y ) = 1,25; σ(Y ) = 0,9875 ≈ 0,994 b) 0,05 bzw. 0; vgl. mit 0,335 bzw. 0,11. III.2 2. (X⊥ ; Y⊥ ) =
1 1 20 · (−0,6) · 1,75 + 5 · (−1,6) · (−1,25) + . . .
= 0,151; (X, Y ) = 0,131.
III.3 1. Man bilde das Skalarprodukt von n und dn = ( p + ru) − (q + sv ). III.3 2. 4c < a21 + a22 + a23 III.3 3. Summe der Koordinatenquadrate 1; f¨ ur Winkel ϕ zwischen den Ortsvektoren von A und B gilt cos ϕ = 16 = 0,7619, also ϕ = 40,33o ; Bogenl¨ ange 40,33 21 180 π = 0,703. III.3 4. M hat von der Geraden den Abstand d =
15 5
−
4 3
1 ; 25
24 −7
= 10.
mit dem III.3 5. Die Gerade x2 = mx1 + c ist genau dann √ Tangente an den Kreis um O √ Radius r, wenn r2 (1 + m2 ) = c2 . Aus c = ±2 1 + m2 und 6m − 4 + c = ±3 1 + m2 eliminiere man c (vier M¨ oglichkeiten). III.3 6. M hat von der Ebene den Abstand d =√2. Der Mittelpunkt des Schnittkreises √ 4 1 49 − 4 = 45. ist M ( 37 9 , 9 , 9 ). Der Schnittkreisradius ist r =
III.3 7. Die Ebene hat die Gleichung 2x1 + 3x√ 2 + 3x3 = c, die Kreismittelpunkte haben von ihr√die Abst¨ ande d1√ , d2 mit d1 + d2 = 88 und d21 − d22 = r12 − r22 = 11, √ also 9 7 88 und d2 = 16 88, woraus c folgt. Der Schnittkreis hat den Radius 38 58. d1 = 16
III.3 8. Die (gesuchte) Ebene mit der Gleichung a1 x1 + a2 x2 + a3 x3 = c hat den Normaleneinheitsvektor n = (a1 a2 a3 )T mit a21 + a22 + a23 = 1. Haben die Ber¨ uhrpunkte i = ±rin, eine gemeinsame Tangentialebene die Ortsvektoren b1 , b2 , b3 , dann gilt bi − m hat also die Gleichung (x − m i ; ±rin) = ri2 , f¨ ur i = 1, 2, 3 muss das also die gleiche Ebene beschreiben. Es folgt (m i ; n) = ±(c − ri ) (i = 1, 2, 3), woraus sich bei jeder Wahl der Vorzeichen, falls die drei Kugeln geeignet liegen, n bis auf einen Faktor aus IR bestimmen l¨asst. Der Faktor ist dann durch |n| = 1 festgelegt. III.3 9. Die Polare zum Schnittpunkt von p und q geht durch die Punkte P und Q. 1 )2 − r12 , III.3 10. Die Gleichung der Schnittkreisebene ist (x − m 1 )2 − r12 = (x − m denn dieser Gleichung m¨ ussen die gemeinsamen Punkte der beiden Kugeln gen¨ ugen, also auch alle Punkte der Schnittkreisebene. F¨ ur einen solchen Punkt X und die zugeh¨ origen 2 2 Tangentenabschnitte t1 , t2 gilt also t21 = XM1 − r12 = XM2 − r22 = t22 . 2
2
1 )2 − (x − m 2 )2 = r12 − r22 III.3 11. Aus t21 = XM1 − r12 = XM2 − r22 = t22 folgt (x − m 2 2 2 2 2 bzw. (nach Streichung von x ) 2(m 1−m 2 )x = (m 1) − m 2 ) − (r1 − r2 ), und dies ist die Gleichung einer Geraden mit dem Normalenvektor m 1−m 2. III.3 12. a) M ist Durchstoßpunkt der Geraden durch P und M durch die Polarebene
L¨osungen der Aufgaben
356
p zum Pol P . Ferner ist r2 = r2 − d2 , wobei d der Abstand von M zu p ist. 2 b) d = M M , p = m + rd (m − m); man beachte dabei P M · P M = r2 (Kathetensatz). 2 2 c) Man bestimme d aus d = r − r2 und einen Normaleneinheitsvektor n der Ebene; 2 dann ist p = m ± rd n, wobei das Vorzeichen so zu w¨ ahlen ist, dass (n; m) < 0. d) Es gen¨ ugt, ein Schnittbild zu betrachten, also die gemeinsamen Tangenten an zwei Kreise. F¨ ur einen Normaleneinheitsvektor n einer gemeinsamen ¨ außeren/inneren Tan 2 ) + (r1 − r2 )n; n) = 0 bzw. ((m 1 −m 2 ) + (r1 + r2 )n; n) = 0. Daraus gente gilt ((m 1 −m ergibt sich n. Aus dem Abstand der Mittelpunkte von den Geraden ergibt sich die Geradengleichung, die Schnittpunkte P der Geraden sind die Bilder der Kegelspitzen im ¨ Schnittbild. Ubertragung der L¨ angen P M1 , P M2 in den Raum liefert die Spitzen. III.4 1. (a × b; a × c) = |a × b||a × c| cos α usw.
III.4 2. a) Wegen ((a × b) × c; c) = 0 ist (a × b) × c = ra + sb. = ra + sb = −tc + ud (vgl. a)), also ra + sb + tc = ud. b) (a × b) × (c × d) Bildet man in der letzten Gleichung das Skalarprodukt mit b × c, a × c bzw. a × b, dann ergeben sich r, s, t. 1 −3 2 1 0 0 = 70 III.4 3. Das Volumen ist 6 −5 6
5
4
2
III.4 4. Man benutze die Eigenschaften des Vektorprodukts und des Skalarprodukts. III.4 5. a) Im Spatprodukt ersten Vektor in Komponenten zerlegen. c) Die Determinante ist (b − a)(c − a)(c − b); b) a = 0 und a = 14 . sind a, b, c paarweise verschieden, dann hat das LGS nur die triviale L¨ osung. IV.1 1. Mit a1 =
a11
und a2 =
a12
a22 ist 2 2 2 2 2 |a1 | |a2 | (1 − cos α) = |a1 | |a2 | − (a1 , a2 )2 = (a211 + a221 )(a212 + a222 ) − (a11 a12 + a21 a22 )2 = a211 a222 + a221 a212 − 2a11 a12 a21 a22 = (a11 a22 − a21 a12 )2 IV.1 2. Aus AT A = E folgt (det A)2 = 1. a21
IV.1 3. Erste Zeile von u ¨brigen subtrahieren und Faktoren 1, 2, 3, . . . (n − 1) (aus Zeile 2 bis n) rausziehen ergibt detA = (n−1)!
1 1 .. . 1
2+1 3+1
22 + 2 + 1 32 + 3 + 1
... ...
2n−2 + 2n−3 + . . . + 2 + 1 3n−2 + 3n−3 + . . . + 3 + 1
n+1
n2 + n + 1
...
nn−2 + nn−3 + . . . + n + 1
. Subtraktion der ersten
Spalte von den folgenden, dann der zweiten Spalte von den folgenden usw. ergibt detA = (n − 1)!
22 32
2n−2 3n−2
. Wiederholung dieser Schritte, beginnend mit 1 3 32 . . . 3n−3 2 n−2 n n ... n 1 4 42 . . . 4n−3 Subtraktion der ersten Zeile, liefert detA = (n − 1)!(n − 2)! .. . 2 n−3 1 1 .. . 1
2 3
... ...
1
n
n
...
n
usw.
¨ IV.1 4. Ahnlich wie Aufgabe 3 vorgehen: Subtraktion der ersten Zeile von den u ¨brigen, (a2 −a1 )(a3 −a1 )(a4 −a1 )(a5 −a1 ) rausziehen, dann erste Zeile von u ¨brigen subtrahieren usw., (a3 − a2 )(a4 − a2 )(a5 − a2 ) rausziehen usw. IV.1. 5. Die Behauptung wird durch Satz 5 belegt, den det M und det A · det B haben beide die Eigenschaften (1) bis (3). IV.2 1. a) abcd + abc + abd + acd + bcd
b) abcd + ab + ad + cd + 1
Lineare Algebra
357 ⎛
IV.2 2. Man verwende das Verfahren in Beispiel 1:
1 6
⎝
17 −6 −3 −2
−6 6 0 0
−3 0 3 0
−1 0 0 2
⎞ ⎠.
IV.2 3. Man beachte die Geradengleichung x = ra + sb (r + s = 1) bzw. die Ebenengleichung x = ra + sb + tc (r + s + t = 1). IV.2 4. a) Induktionsschritt: In An+1 letzte Zeile von u ¨brigen subtrahieren, nach erster Spalte entwickeln, dann Faktoren (x1 −xn+1 ), (x2 −xn+1 ), . . . , (xn −xn+1 ) herausziehen, dann 1. Spalte von 2. bis n. Spalte subtrahieren, dann 2. Spalte von 3. bis n. Spalte subtrahieren usw. Es ergibt sich detAn+1 = (−1)n (x1 − xn+1 )(x2 − xn+1 ) · . . . · (xn − xn+1 )Dn = (xn+1 − x1 )(xn+1 − x2 ) · . . . · (xn+1 − xn )Dn . b) Ist p(x) = c0 +c1 x+c2 x2 +. . .+cn xn und sind x1 , x2 , . . . , xn+1 paarweise verschiedene Elemente aus K mit p(xi ) = yi , dann sind die Koeffizienten aus dem LGS p(xi ) = yi (i = 1, . . . , n + 1) zu bestimmen, denn nach a) ist seine Matrix invertierbar. IV.2 5. Entwicklung nach der letzten Zeile. IV.2 6. a) (1) −3 (2) −18 (3) 160 herausziehen, erste Spalte von zweiter bis b) 2. bis letzte Zeile zur ersten addieren, n(n+1) 2 letzter Spalte abziehen, nach n-ter Zeile entwickeln (Vozeichen (−1)n−1 ), erste Zeile von anderen subtrahieren, nach erster Spalte entwickeln: Dreiecksdeterminante mit Produkt der Diagonalelemente = (−n)n−2 . IV.2 7. Man kann mit Berechnungschema aus Beispiel im Text argumentieren.
V.1 1. x =
1 −2 3
0 1 2
3 5 0
x +
3 4 −1
V.1 2. Aus AT A = E und det AT = detA folgt (det A)2 = 1. V.1 3. a) (AAT )T = (AT )T AT = AAT
b) Aus AT A = E folgt AT = A−1 .
V.1 4. Das Einheitsquadrat wird von A = (a1 a2 ) auf ein Parallelogramm mit dem Inhalt |a1 ||a2 | sin(a1a2 ) abgebildet, und es ist (|a1 ||a2 | sin(a1a2 )) = (|a1 ||a2 |)2 (1 − cos2 (a1 , a2 )) = a21a22 − (a1 ; a2 )2 = (detA)2 . V.1 5. Ist M die Matrix der Spiegelung an x2 = mx1 und (a1 − b1 ) + m(a2 − b2 ) = 0 (vgl. Text), dann gibt x = Mx + (E − M ) 0c die Spiegelung an der Geraden mit der Gleichung x2 = mx1 + c an, wobei 2c = (a2 + b2 ) − m(a1 + b1 ). V.1 6. Erste Spiegelachse so, dass A auf A abgebildet wird; zweite Spiegelachse durch A so, dass B auf B abgebildet wird, dritte Spiegelachse Gerade durch A und B . V.1 7. Man interpretiere Fig. 9 im Text. V.1 8. a) b) Spiegelungen an rechtwinkligen Achsen = Drehungen um 180o sind vertauschbar (Punktspiegelungen). c) Verschiebungen (Vektoren!) sind stets vertauschbar. d) Eine Spiegelung ist mit einer Verschiebung vertauschbar, wenn die Verschiebung parallel zur Spiegelachse ist. e) Drehung und Verschiebung sind nicht vertauschbar. oglichkeiten, er liegt auf V.1 9. F¨ ur den Bildpunkt C von C gibt es zwei M¨ dem Kreis 10·37 10·68 um A mit der Radius 13 und auf dem Kreis um B mit den Radius 13 .
V.1 10. Eine Bewegeung ist genau dann uneigentlich, wenn sie aus einer ungeraden Anzahl von Spiegelungen besteht, wenn ihre Determinante also den Wert −1 hat. V.1 11. a) Spiegelung, Drehung um 180o b) zwei verschiedene reelle Eigenwerte (siehe Text)
c) Kongruenzabbildung
L¨osungen der Aufgaben
358 −→
V.1 12. Ist v der Verschiebungsvektor, dann ist ZZ ∗ = −kv . V.1 13. Man erh¨ alt drei Gleichungen aus folgenden Bedingungen: Der Mittelpunkt der −→
Strecke XX liegt auf der Ebene, der Vektor XX istorthogonalzu zwei Spannvektoren −1 0 0
der Ebene. Es ergibt sich die Abbildungsmatrix − 13
V.1 14. α ◦ β ◦ γ : x → 3 V.1 15. F
− 23 , − 23 , 31
1 0 0
0 0 −1
0 −1 0
x +
7 17 17
2 1 2
2 2 1
.
usw.
.
ort der von V.2 1. A hat die Eigenwerte λ1 = λ2 = 1 und λ3 = −2; zu λ1 = λ2 geh¨ (−1 1 1)T erzeugte Eigenraum, zu λ3 der von (−4 1 13)T erzeugte Eigenraum. origen Eigenr¨ aume werden von B hat die Eigenwerte λ1 = λ2 = 0 und λ3 = 3; die zugeh¨ (−1 3 0)T bzw. (1 0 1) erzeugt. √ origen Eigenr¨ aume werden C hat die Eigenwerte λ1 = 5 und λ2/3 = 52 ± 32 5. Die zugeh¨ √ √ von (3 1 4) bzw. (21 4 8)T + 5(63 12 − 3)T bzw. (21 4 8)T − 5(63 12 − 3)T erzeugt. V.2 2. Eigenwerte sind die Diagonalelemente. osung; (cos α−x)2 −sin2 α = 0: x = cos α±sin α. V.2 3. (cos α−x)2 +sin2 α = 0: keine L¨ V.2 4. Behauptungen nachrechnen. V.2 5. Das charakteristische Polynom ist −(a4 x4 + a3 x3 + a2 x2 + a1 x + a0 ). V.2 6. a) Char. Pol. (−x)n−1 (n − x), Eigenwerte 0 ((n − 1)-fach) und n (einfach). b) Char. Pol. (−1)n−1 (1 + x)n−1 (n − x); Eigenwerte −1 und n.
V.2 7. T = V.3 1. V.3 2. V.3 3. V.3 4. um die x =
1 0 1
0 1 0
1 0 −1
;
T −1 AT
=
−1 0 0
0 3 0
0 0 2
√ √ 7 − 2 1 T hat die Eigenwerte 11 2 ± 2 17 mit den Eigenvektoren (3 ± 17 − 2) . −1 4 x + 14 −31 x = 14 33 −5 11 |2t + 1| < 13 : kein Ew; |2t + 1| = 13 genau ein Ew; |2t + 1| > 13 : zwei Ew’e. 1 0 2 1 bildet die x3 -Achse auf g ab. Ist δ die Drehung α : x → 0 1 0 x + 1 0 0 1 0 −1 x3 -Achsemit Winkel 30o , dann Abbildung dem ist die gesuchte α ◦ δ◦ α , also √ 1 1 3 − 1 0 2 1 0 −2 1 1 2 √2 0 1 1 0 1 0 0 1 0 x − 1 + 1 3 0 2 2 0 0 1 0 0 1 0 0 0 0 1
V.3 5. Nein; vgl. Fall 1(2) der affinen Abbildungen im Raum. V.3 6. Die Spalten von T seien die normierten Eigenvektoren. Dann ist T −1 AT eine Diagonalmatrix D, deren Diagonalelemente die Eigenwerte sind. Es gilt T −1 A−1 T = D−1 . −→
−→
VI.1 1. Es sei u =OU und v =OV . Die Gleichung (Cu)T (Cv ) = 0 bzw. u T (C T C)v = 0 d12 muss gel¨ost werden. Mit C T C = dd11 ergibt sich c12 u21 − (c11 − c22 )u1 u2 − c12 u22 = 0 12 d22 u1 2 c11 −c22 u1 bzw. i. Allg. ( u2 ) − c12 u2 − 1 = 0. Man erh¨ alt zwei L¨ osungen f¨ ur uu12 , deren Produkt −1 ist, also bis auf einen gemeinsamen Faktor die Ortsvektoren von U, V . VI.1 2. Man stelle sich die Ellipse als Bild des Kreises bei einer Parallelprojektion vor. VI.1 3. a) Mitte bleibt Mitte“ bei einer affinen Abbildung. ”
b) Eine Gerade durch O
Lineare Algebra
359
mit der Steigung m1 wird auf eine solche mit der Steigung m1 = ab m abgebildet, analog mit m2 . Aus m1 m2 = −1 (Orthogonalit¨ atsbedingung) folgt m1 m2 = −( ab )2 .
VI.1 4. a) Mit F1/2 = (±e, 0) folgt aus (x1 + e)2 + x22 + (x1 − e)2 + x22 = 2a und b2 = a2 − e2 (im Fall a > b) die affine Standardform der Ellipsengleichung.
b) Mit F1/2 = (±e, 0) folgt aus | (x1 + e)2 + x22 − (x1 − e)2 + x22 | = 2a und b2 = e2 − a2 (im Fall b> a) die affine Standardform der Hyperbelgleichung. c) Aus x1 + p2 = (x1 − p2 )2 + x22 folgt die affine Standardform der Parabelgleichung. VI.1 5. Stauchung an der x1 -Achse in Richtung der x2 -Achse mit den Faktor Kreistangente anwenden; Polarengleichung lautet ebenso.
b a
auf
VI.1 6. Man zeige z.B. bei der Ellipse: Der Winkel zwischen den Brennstrahlen“ in ” einem Ellipsenpunkt werden von der Normalen der Ellipse in diesem Punkt halbiert. VI.1 7. Ellipse: Der Kreis um (0, −c) mit dem Radius r = b + c geht durch den Scheitel (0, b) der Ellipse; er hat im oberen Teil die Gleichung x2 = −c + r 1 − ( xr1 )2 . Die
Ellipse hat im oberen Teil die Gleichung x2 = b 1 − ( xa1 )2 . Wegen (1 − u2 )2 ≈ 1 − u √ bzw. 1 − u ≈ 1− u2 f¨ ur sehr kleine Werte von u gilt f¨ ur sehr kleine Werte von x1 f¨ ur den x2
x2
Kreis x2 ≈ −c + r(1 + 2r12 ) = und f¨ ur die Ellipse x2 ≈ b(1 − 2a12 ). Diese Approximationen 2 1 also r = ab . Hyperbel, Parabel analog. stimmen u ¨berein, wenn b = r − c und 2ab 2 = 2r VI.2 1. Die Eigenwerte der Koeffizientenmatrix sind 2 ± a, also ist a = 2 oder a = −2. Damit ergibt sich 2(x1 ± x2 )2 − 7(x1 ± x2 ) + (b ∓ 7)x2 + 3 = 0. Es muss nun b = −7 oder
b = 7 sein; die Gleichung lautet dann 2 x1 ± x2 − 25 16 .
7 4
2
7 2 +3− 49 8 = 0 bzw. (x1 ±x2 − 4 ) =
Man erh¨alt dann die Parallelenpaare x1 + x2 = ± 54 und x1 − x2 = √ √ x2 x2 VI.2 2. a21 + b22 − xc23 = (t ∓ r 1 − t2 )2 + (± 1 − t2 + rt)2 − r2 √ √ = t2 ∓ 2rt 1 − t2 + r2 − r2 t2 + 1 − t2 ± 2rt 1 − t2 + r2 t2 = 1 VI.2 3.
(p1 +ra2 b)2 a2
+2rbp1 − 2rap2 +
(p2 +rab2 )2 − (p3 b2 r2 a2 b2 − r2 a2 b2 −
−
7 4
+ 2r(bp1 − ap2 )) = p21 a2
p21 a2
p22 b2
p22 b2
± 54 .
− p3
− p3 = 0 √ VI.2 4. Ursprungsgeraden mit den Richtungsvektoren (au bv c u2 + v 2 )T (u, v ∈ IR). 2rbp1 + 2rap2 =
−
−
7 4
alt man die VI.2 5. Rotiert der Geradenpunkt (2r, 2, 3r) um die x1 -Achse, dann erh¨ √ √ Punkte (2r, 4 + 9r2 cos ϕ, 4 + 9r2 sin ϕ) mit 0 ≤ ϕ < 2π. Es gilt f¨ ur sie also x22 +x23 = 4 + 9r2 = 4 + 94 x21 bzw. −
x21 9 16
+
x22 4
+
x23 4
= 1.
VI.2. 6. Die affine Abbildung (x1 , x2 , x3 ) → ( xa1 , xb2 , xc3 ) bildet das Ellipsoid auf die Einheitskugel mit der Gleichung x21 + x22 + x23 = 1 ab, und die Tangentialebene im Kugelpunkt (p1 , p2 , p3 ) hat die Gleichung p1 x1 + p2 x2 + p3 x3 = 1. VI.2 7. a) Ellipsoid: zwei der Parameter a, b, c gleich; ell. Parabolid, Kegel, Zylinder: a = b; einschaliges Hyperboloid: a = b; zweischaliges Hyperboloid: b = c √
√
√
b) Die Eigenwerte sind c und 1±2 5 . Es muss entweder c = 1+2 5 oder c = 1−2 5 gelten. Die Rotationsachse bez¨ uglich der transformierten Gleichung ist die x1 -Achse oder die x2 -Achse. Bez¨ uglich der √ Ausgangsgleichung sind dies die Geraden in der x3 -Ebene mit den Gleichungen 2x1 − ( 5 ± 1)x2 = 0.
L¨osungen der Aufgaben
360
VI.2 8. Zweischaliges Hyperboloid, Doppelkegel, einschaliges Hyperboloid. VI.2 9. a) Charakteristisches Polynom x3 + 3x2 − 4; Eigenwerte −1, 2, 2; transformierte Gleichung −x21 + 2x22 + 2x23 = 1; einschaliges Hyperboloid. b) Charakteristisches Polynom −x3 + 3x2 − 2x; Eigenwerte 0, 1, 2; transformierte Gleichung x22 + 2x23 = 0; Gerade (x1 -Achse).
c) Charakteristisches Polynom −x3 + 9x2 − 24x + 16; Eigenwerte 1, 4, 4; transformierte Gleichung x21 + 4x22 + 4x23 = 0; Punkt.
d) Charakteristisches Polynom −x3 + 18x2 − 99x + 162; Eigenwerte 3, 6, 9; transformierte Gleichung 3x21 + 6x22 + 9x23 = 6; Ellipsoid.
2 − (2m2 + 1)x + (2m2 − 2)) VI.2 10. Das charakteristische Polynom (2m2 + 2 − x)(x 2 + 2, λ = 1 (2m2 + 1 + = 2m (2m2 − 1)2 + 8) und λ3 = hat die Nullstellen λ 1 2 2 1 2+1− 2 − 1)2 + 8). Der Typ der Fl¨ (2m (2m a che h¨ a ngt vom Vorzeichen von λ3 und 2 von c = 2m2 − 3m + 1 = (m − 1)(2m − 1) ab. F¨ ur |m| > 1 ist λ3 > 0 und c > 0, es liegt ein Ellipsoid vor; f¨ ur |m| = 1 ist λ3 = 0, es liegt ein elliptischer Zylinder (m = −1) oder nur ein Punkt (m = 1) vor. F¨ ur |m| < 1 ist λ3 < 0; es liegt ein einschaliges Hyperboloid (−1 < m < 12 ), ein Kegel (m = 12 ) oder ein zweischaliges Hyperboloid ( 12 < m < 1) vor.
VI.2 11. Der Schatten“ der Kurve in der x1 x2 -Ebene ist die Hyperbel mit der Glei” 2 235 2 chung 2(x1 − 15 alt man, wenn man u ¨ber 2 ) − 5(x2 + 3) + 4 = 0. Die Raumkurve erh¨ ugt. jedem Kurvenpunkt in der x1 x2 -Ebene den x3 -Wert x3 = 3x1 + 3x2 − 7 hinzuf¨
VI.2 12. Die Schnittkurven der Quadrik mit den Ebenen x3 = c haben die Gleichungen a11 x21 + a22 x22 + 2a12 x1 x2 + a1 x1 + a2 x2 + a = 0. VI.3 1. Gerade durch O mit Richtungsvektor (cos ϕ VI.3 2. S
√
√
1+ 3 1+ 3 2 , 2 ,1
± sin ϕ 1)T (0 ≤ ϕ < 2π).
VI.3 3. F¨ ur die durch (0 0 r )T + t(r 1 − r) dargestellten Geraden gilt x1 = tr, x2 = t, x3 = r − tr. Elimination von t, r liefert x1 x2 + x2 x3 − x1 = 0, und dies ist die Gleichung einer Sattelfl¨ ache. VI.3 4. Man bilde jeweils das Produkt der Gleichungen. VI.4 1. In der Gleichung (2x21 + 5x22 − 4x3 ) − μ(x21 + x22 + x23 − 2rx3 ) = 0 muss μ = 2 und μr =√2 sein. √ Es ergeben sich die Kreisschnittebenen mit der Gleichung 3x22 − 2x23 = 0, also 3x2 ± 2x3 = 0. √ √ VI.4 2. c b2 − a2 ± b b2 − a2 = 0 ur die Rechnung ist es VI.4 3. Wir betrachten den Schnitt mit der x2 x3 -Ebene. F¨ g¨ unstig, c = −6 zu w¨ ahlen. Die Gerade mit der Gleichung x2 − 2x3 + 6 = 0 schneidet die Geraden x2 ± x3 = 0 in den Punkten√(0, −2, 2) und √ (0, 6, 6). Die große Halbachse der Schnittellipse hat also die L¨ ange a = 22 + 42 = 2 5, ihr Mittelpunkt ist (0, 2, 4). Die Schnittpunkte der Ellipse mit dem Kreis √ in der Ebene √ x3 = 3 um (0, 0,√3) mit dem Radius 4 bilden eine Strecke der L¨ ange 2 42 − 22 = 4 3, es ist also b = 2 3. VII.1 1. Schnittpunkt [(0 0 1)T ] (uneigentlicher Punkt aus x2 -Achse), Verbindungsgerade (0 0 1)T (x1 = 0, x2 -Achse). VII.1 2. x = ra + sb mit r + s = 1 ist die Gleichung einer Geraden. VII.1 3. a) [(0 4 1)T ]
b) r(0 1 0 5)T + s(0 0 1 5)T
VII.1 4. a) Beides ist gleichwertig mit p1 q1 + p2 q2 =
r2 p
0 q0 .
c) [(0 − 11 1 5)T ] b) Beachte b21 + b22 = r2 b20
Lineare Algebra
361
c) Liegt P auf a1 x1 + a2 x2 = a0 x0 r2 und auf b1 x1 + b2 x2 = b0 x0 r2 , dann liegen A und B auf p1 x1 + p2 x2 = x0 p0 r2 . alt VII.1 5. Aus (u1 r1 − u2 r2 )a + (u1 s2 − u2 s2 )b + (v1 r1 − v2 r2 )c + (v1 s1 − v2 s2 )d = o erh¨
man zwei homogene LGS f¨ ur u1 , u2 bzw. v1 , v2 , welche nur dann nichtrivial l¨ osbar sind, ankung der Allgemeinheit) und r1 = r2 wenn sr11 = sr22 . Mit s1 = s2 = 1 (keine Beschr¨ folgt (u1 − u2 )a + (u1 − u2 )b + (v1 − v2 )c + (v1 − v2 )d = o, also u1 = u2 und v1 = v2 .
Weiter besser affin rechnen: Aus x1 = 1 + rt, x2 = 1 − r + t + rt, x3 = r + t + 2rt folgt 2r = −x1 − x2 + x3 + 2 und 2t = −x1 + x2 + x3 + 2 und rt = x1 − 1, also (−x1 − x2 + x3 + 2)(−x1 + x2 + x3 + 2) = 4(x1 − 1).
VII.2 1. Die Matzrix bildet Z auf Z, die Gerade a punktweise auf sich und die Gerade h auf die uneigentliche Gerade ab. VII.2 2. sa + tb ergibt den Punkt A f¨ ur s = 1, t = 0, den Punkt B f¨ ur s = 0, t = 1, den
Punkt C f¨ ur s = 3, t = 2. F¨ ur die Werte s, t von D muss 2s = −3t gelten, man erh¨ alt ihn also f¨ ur s = 3, t = −2 zu D = [(1 − 4 4)T ]. VII.2 3. Definition des DV durchrechnen.
VII.2 4. In den Bezeichnungen von Satz 1 ist (r1 , r2 , r2 ) = (3, −1, 2) und (s1 , s2 , s3 ) = (2, −3, 1), mit λ4 = 6 (frei w¨ ahlbar) also (λ1 , λ2 , λ3 ) = (4, 18, 3). Damit ist
A=
0 12 8
−18 0 36
3 3 3
1 2 1
2 3 7
1 −1 0
−1
=
1 16
51 117 53
3 69 5
−3 9 5
.
VII.2 5. A = (ai,j )3,3 mit a11 = a22 = a33 = 1, a13 = −1, aij = 0 sonst. b) (A−1 )T bildet (1 0 0 0)T auf (11 3 − 1 0)T ab. VII.2 6. a) x0 + x1 − x2 = 0 T d) Geraden durch zwei Punkte mit x1 = x2 c) r[(19 29 8 59) ] + s[(−5 5 20 11)T ] VII.2 7. Aus z = λ1a + μ1a = λ2b + μ2b = λ3c + μ3c und (λ1a − λ2b) + (λ2b − λ3c) + (λ3c − λ1a) = o (trivial) folgt (μ2b − μ1a ) + (μ3c − μ2b ) + (μ1a − μ3c ) = o. VII.3 1. Man bestimme die Matrix C, die [(1 −3 0)T ], [(1 3 0)T ], [(1 0 2)T ], [(1 0 −2)T ] der Reihe nach abbildet auf [(1 − 1 − 1)T ], [(1 1 1)T ], [(0 1 0)T ], [(0 0 1)T ]. Man erh¨alt (bis auf einen Faktor) C =
0 6 6
2 0 0
0 3 −3
; Hyperbel ←→ Ellipse.
VII.3 2. Aus x1 = sr, x2 = tr, x3 = t und s + t = 1 eliminiere man die Parameter; man erh¨alt x1 x3 + x2 x3 − x2 = 0. VII.3 3. Die Gerade (a−1
a−1
T −1) wird auf die Gerade (a+1
abgebildet. Dies leistet z.B. (C −1 )T =
2 −1 0
2 −3 0
−8 8 −4
−(a+1)
1)T
, woraus sich C ergibt.
VIII.1 1. Das Planungspolygon hat außer (0,0) die Ecken (0,120), (60,100), (90,70), (110,0). Der Wert von Z1 = 90x1 + 30x2 ist in (90,70) maximal (10 200.–), der Wert von Z2 = 60x1 + 60x2 ist in (60,100), (90,70) und allen Werten dazwischen (x1 + x2 = 160) maximal (9 600.–), der Wert von Z3 = 40x1 + 80x2 ist in (60,100) maximal (10 400.–). VIII.1 2. Die Punkte von AB sind Maximalpunkte f¨ ur Z = 2x1 + ux2 + x3 (u > 0); die Punkte von ABC sind Maximalpunkte f¨ ur Z = 2x1 + x2 + x3 . ur Punkte A, B ∈ M1 und A, B ∈ M2 VIII.1 3. Die Mengen M1 , M2 seien konvex. F¨ (also A, B ∈ M1 ∩ M2 ) gilt AB ⊆ M1 und AB ⊆ M2 , also AB ⊆ M1 ∩ M2 . VIII.1 4. x1 =
13 3 , x2
= 13 , x3 = 0,
Zmax =
82 3 .
L¨osungen der Aufgaben
362
VIII.1 5. o kann kein Konvexkombination von anderen Punkten a, b ∈ M sein, denn f¨ ur r ≥ 0 und a ≥ o gilt ra ≥ o und ra = o genau dann, wenn r = 0 oder a = 0. VIII.1 6. a) Spalten 1,2,3: x1 = − 13 : keine E.; Spalten 1,2,4: x2 = − 13 : keine E.; Spalten 1,2,5: x2 = −2: keine E.; Spalten 1,3,4: Ecke (1,0,1,4,0); Spalten 1,3,5: x1 = −1: keine E.e; Spalten 1,4,5: x5 = −1: keine E.e; Spalten 2,3,4: Ecke (0,1,4,1,0); Spalten 2,3,5: x5 = −1: keine E.; Spalten 2,4,5: x2 = −1: keine E.e; Spalten 3,4,5: Ecke (0,0,2,2,1). b) Ecke (1,0,1,4,0): uT x = 3; Ecke (0,1,4,1,0): uT x = −9; Ecke (0,0,2,2,1): uT x = 1; Minimalpunkt (0, 1, 4, 1, 0). VIII.2 1. Ecken E1 (1, 0, 1, 4, 0), E2 (0, 1, 4, 1, 0), E3 (2, 0, 0, 6, 1), E4 (0, 2, 6, 0, 1), E5 (0, 0, 2, 2, 1). Z1 , Z3 , Z4 nehmen Minimum in der Ecke E3 an, Z2 in der Ecke E5 . VIII.2 2. Entartete Ecke (3, 3, 0, 0, 0, 0). Formkoeffizienten f4 , f6 negativ; x4 - Spalte mit x3 -Spalte vertauschen und Schema neu berechnen: x1 1 0 0
x2 0 1 0
x3 0 0 1
x4 −2 −1 1 −1
x5 1 1 0 1
x6 2 −2 −1 −1
x1 1 0 0
3 3 0 −3
x2 0 1 0
x4 0 0 1
x3 2 1 1 1
x5 1 1 0 1
x6 0 −3 −1 −2
3 3 0 −3
Jetzt Formkoeffizient f6 negativ und keine Zahl in x6 -Spalte positiv, es gibt also keine osung, wenn a, b, c > 0, L¨osung. F¨ ur Z = ax4 + bx5 + cx6 existiert z.B. dann genau eine L¨ und es existieren z.B. dann unendlich viele L¨ osungen, wenn a, c > 0 und b = 0. VIII.2 3. Zun¨ achst in Standardform verwandeln; dann Beispiele im Text beachten. VIII.2 4. Gesucht ist das Minimum von Z = m i=1
xij cij = bj (j = 1, 2, . . . , n) sowie
n j=1
m n
i=1 j=1
xij cij mit xij ≥ 0 f¨ ur alle i, j und
xij cij ≤ ai (i = 1, 2, . . . , m).
Analysis
IX.2 1. 6 ((2n + 1)2 ) = 24 (n2 ) + 24 (n) + 6 (1) = 4(n(n + 1)(2n + 1)) + 12(n(n + 1)) + 6(n + 1) = 2(n + 1)(2n(2n + 1) + 6n + 3) = (2n + 2)((2n + 1)(2n + 3)) IX.2 2. a) an = a + dn
b) an = aq n
IX.2 3. a) an+1 bn+1 − an bn = (an+1 − an )bn+1 + an (bn+1 − bn ) n (bn+1 −bn ) n bn+1 n+1 − abnn = an+1bbnnb−a = (an+1 −an )bbnnb−a b) abn+1 n+1 n+1 IX.2 4. a) an = cn2 + dn + e mit c, d, e ∈ IR b) Δ2 (an bn ) = Δ(Δ(an )(bn+1 ) + (an )Δ(bn )) = Δ2 (an )(bn+2 ) + Δ(an )Δ(bn+1 ) + Δ(an )Δ(bn ) + (an )Δ2 (bn ) 2 = n3 folgt mit D0 = 0 : IX.2 5. Aus (Dn − Dn−1 )(Dn + Dn−1 ) = Dn2 − Dn−1 2 ) = (n3 ). (Dn2 ) = Δ(Dn−1
IX.3 1. a) 2n + 1 < 2n ⇒ 2n + 3 = 2n + 1 + 2 < 2n + 2 < 2n + 2n = 2n+1 b) n3 < 3n ⇒ (n + 1)3 = n3 + 3n2 + 3n + 1 < 3n + 3n + 3n = 3n+1 c) 23(n+1) − 1 = 8 · 23n − 1 = 7 · 23n + (23n − 1) d) 10n+1 + 3 · 4n+3 + 5 = 9 · 10n + 9 · 4n+2 + (10n + 3 · 4n+2 + 5) √ √ √ √ IX.3 2. an > 2 ⇒ an + 5 > 7 > 2; an < an+1 ⇒ an + 5 < an+1 + 5 IX.3 3. a) an = 2n2 − 2n + 1
b) an = 3n−1 − 4
Analysis
363
IX.3 4. Der (n + 1)-te Schnitt zerlegt einen Teil in zwei Teile, wenn er zwei Begrenzungslinien dieses Teils schneidet; er kann aber h¨ ochstens n+2 solcher Linien schneiden, die Anzahl der Teile w¨ achst also h¨ ochstens um n + 1. 1 (2n+1)(2n+3)
IX.3 5. a)
n+1 2n+3
=
n 2n+1
−
b) (n + 1)
n+1 1 2
n+2 2n
=
−
n+3 2n+1
2 (n+1)(4(n+1)2 −1) − n(4n3 −1) 3 n+2 1−q n+1 q n+1 = 1−q 1−q − 1−q
c) (2n + 1)2 = IX.3 6. a)
q−(1+(n+1)(1−q))q n+2 (1−q)2
b) (n + 1)q n+1 =
−
q−(1+n(1−q))q n+1 (1−q)2
IX.3 7. a) ggT(Fn , Fn+1 ) = ggT(Fn , Fn + Fn−1 ) =ggT(Fn , Fn−1 ) = ggT(Fn−1 , Fn ) 2 ) = (F b) (Fn+1 n+1 (Fn+2 − Fn )) = (Fn+1 Fn+2 − Fn Fn+1 )
IX.3 8. Man beachte
an−1 +an+1 2
IX.4 1. Aus
√ 2 1± 5 2
√
=
√ 1± 5 2
=
+ 1.
an−1 an+1 folgt durch Quadrieren (an−1 − an+1 )2 = 0.
IX.4 2. Der Reihe nach f (x) = 10x ,
lg x,
1/x,
1/ log x,
1/x,
101/x
IX.4 3. a) s = 3; n > (6 + lg 3)/ lg 1,5 − 1 ≈ 35,8, also n0 ≥ 36. b) s = 240; n > (6 + lg 240)/(− lg 0,95) ≈ 377,2, also n0 ≥ 378. IX.5 1. (100 + 3)4 = 112 550 881;
(1000 − 2)3 = 994 011 992
IX.5 2. Die Anzahl der geradanzahligen bzw. ungeradanzahligen Teilmengen einer nn
Menge ist die Summe aller
mit geradem bzw. ungeradem i. Aus
i
(n > 0) folgt die Behauptung. IX.5 3.
m! i!(m−i)!
m! (i+1)!(m−i−1)!
+
m! i!(m−i−1)!
=
·
n
i=0
(−1)i
n i
m+1 (i+1)(m−i) .
= 0
IX.5 4. Zwei Polynome in der nat¨ urlichen Variablen n liefern genau dann f¨ ur jedes n denselben Wert, wenn ihre Koeffizienten gleich sind: Setzt man n = 0 in der Gleichung a0 + a1 n + a2 n2 + . . . + ak nk = b0 + b1 n + b2 n2 + . . . + ak nk , dann folgt a0 = b0 . Streicht urzt n, dann liefert dasselbe Argument a1 = b1 usw. man a0 , b0 und k¨ IX.5 5. Δ(
n+2 3
)=
n+3
IX.5 6. Man beachte IX.5 7.
(Dn ) =
(k)
IX.5 8. Pn
=
k 2
3 n
−
n+2
n+k
3
=
k i=0 n(n+1)(n+2) ; 6
=
n+2 2
n+k+1 k+1
.
− 1 (n2 + n) −
(Qn ) =
k 2
n(n+1)(2n+1) 6
−1 n−
k 2
;
(Fn ) =
n(n+1)2 4
− 2 n = (k − 2)Dn − (k − 3)n
IX.6 1. Aus |an | ≤ K, |bn | ≤ L folgt |an + bn | ≤ |an | + |bn | ≤ K + L und |an bn | = |an ||bn | ≤ KL. IX.6 2. Aus a2n−2 < a2n folgt a2n+2 = 1 + IX.6 3. F¨ ur n ∈ IN gilt mit s := lim
IX.6 4. IX.6 5.
√
(an )
1 1 >1+ = a2n . 1 1 + a12n 1 + a2n−2
n n−1 n n−1 ai − s − ai ≤ s − ai + s − ai . |an | = s − i=0
n2 + 2n − n =
n(n+1) 2
≈
√
1 2 2 (n ),
2n n2 +2n+n
i=0 2 2 1+ n +1
=
n(n+1)(2n+1) 6
≈
1 3 3 (n ),
i=0
n(n+1) 2 2
i=0
≈ 14 (n4 ).
L¨osungen der Aufgaben
364 IX.6 6. 4(an bn ) = (an + bn )2 − (an − bn )2 IX.6 7. F¨ ur 0 < an , bn < ε gilt
a2n + b2n an ε + bn ε < a n + bn a n + bn
= ε.
n 1 IX.6 8. Ist |an − a| < ε f¨ ur n > Nε , dann gilt f¨ ur diese n: n ai − a ≤ i=0 N ε 1
n. i=1 i=1 i=m+1 i=m+1 i=1 i=1
IX.9 3.
2n i=1
(−1)i−1 ai =
n i=1
(−1)i−1 i
+
n i=1
1 2i−1
>
n i=1
1 2i−1
>
1 2
n i=2
1 i;
(an ) nicht monoton.
Analysis
365
IX.9 4. F¨ ur n > 1 gilt:
√ √ √ √ n 4i+1− 4i n i+1− i 1 √ √ √ = = √ √ √ 4 4 4 4 n + 1 i=1 4 i 4 i + 1 i) i=1 i i + 1( i + 1 + n n 1 1 √ > √ √ √ √ = √ √ √ √ √ 4 4 4 4 i)( i + 1 + i) i=1 4 i 4 i + 1 · 2 4 i + 1 · 2 i + 1 i=1 i i + 1( i + 1 + n n n 1 1 1 1 1 1 √ √ √ > −1 und > = 4 4 4 4 i=1 (i + 1) i 4 i=1 (i + 1) i + 1 4 i=1 i i √ √ r r n 2 i+1− 2 i 1 √ 2√ = ... 1 > 1 − 2√ = r r 2r n + 1 i=1 i i+1 n 1 = √ √ 2√ √ √ √ √ √ r r−1 r r r−1 2r i=1 i i + 1( 2 i + 1 + 2 i)( 2 i+1+ 2 i) . . . ( i + 1 + i) n n 1 1 1 1 √ > r √ −1 > 2r 2r r 2 i=1 (i + 1) i 2 i=1 i i
1>1− √ 4
Ist 1 < α ≤ 1, 5, dann gibt es ein r ∈ IN mit 1 < α < 1 + IX.9 5. F¨ ur n > a ist
n i=1
a i2 +ai
=
n
a i(i+a)
i=1
=
n 1
−
i
i=1
1 i+a
1 2r ,
=
n √ n n √ 1 √ √ 1 √ , ( i + 1 − i) = − IX.9 6. Es ist i i=1 i=1 i+1+ i i=1 n √ √ √ 2 ( i + 1 − i) = 2( n + 1 − 1).
1 nα
also a i=1
√
1 i
≤
−
2 √ i+1+ i
1 √ . r n2 n
a
i=1
1 n+i .
konvergent und
i=1
IX.10 1. Die Folge (xn ) mit xn = (1 + n1 )n+1 ist monoton fallend: IX.10 2.
xn−1 xn = e2 , e3 ,
1+
e−1 ,
1 n2 −1
n
n n+1
1.
IX.10 3. F¨ ur r ∈ ZZ, s ∈ IN gilt 1 +
IX.10 4. 1 +
1 n
+
Benutze dann 3n <
IX.11 1. exp
n i=2
1 n2
√
n
: 1+
1 n
n
r n sn
=
i2 −1
=
=
n+1
1 3 + 9n2 < 3n + . n n 1
log 1 +
n n2 −1
> 1+
i=2
s
1+
1+
n n+1
1+
=
r sn n→∞ −→ sn
1 n(n+1)
1 i2 −1
=
IX.11 2. Die Faktoren haben die Form 1 + an , wobei IX.11 3.
n
i=1
i4 +i2 i4 −1
=
n
i=2
i2 i2 −1
=2·
n n+1 ,
n3 +n2 −n n3 +n2 −n−1
n(n+1)
n i=2
√ s
> 1. er .
n→∞
−→ 1.
i2 (i−1)(i+1)
=
2n n+1
→ 2.
(an ) konvergiert.
der Grenzwert ist 2.
IX.12 1. 8! = 40 320.
IX.12 2. Nr. 20 ist 5/3. Die Zahl 4/5 hat die Nummer 25. IX.12 3. Man nummeriere der Reihe nach die (endlichen) Mengen mit dem gr¨ oßten Element 1 bzw. 2 bzw. 3 usw. IX.12 4. Schon die Teilmenge der Dezimalbr¨ uche, die nur zwei verschiedene Ziffern enthalten, ist u ahlbar (vgl. Satz 3). ¨berabz¨ IX.12 5. Das j-te Element in der Menge Mi ist eindeutig (bijektiv) durch das Paar (i, j) gekennzeichnet, und die Menge IN2 ist abz¨ahlbar. X.1 1. a) F¨ ur |x − x0 |
0 > −9 = f (1).
√ X.1 3. (1) 12 , 13 , 14 , . . . (2) { n | n ∈ IN} √ X.1 4. | x − 1 − 2| < 10−6 gilt f¨ ur |x − 5| < 4 · 10−6 . X.1 5. Genau an den Stellen 0 und 1 ist die Funktion stetig. X.1 6. Senkrechte Asymptoten bei ±1, asymptotisches Verhalten wie g : x → x2 + 2. 1−x2 (1+x2 )2
X.2 1. a)
b) − 15
5
6
1 1+x
c) (7x6 +2x8 )ex
2
2 +1
d) 2x(ln(x2 +1)+1)(x2 +1)x
X.2 2. a) An der Stelle 0 ist die linksseitige Ableitung gleich der rechtsseitigen Ableitung ur x < 0 und f (x) = 2x f¨ ur x ≥ 0. An der Stelle 0 ist f (= 0); es gilt f (x) = 3x2 f¨ nicht differenzierbar: die linksseitige Ableitung von f ist 0, die rechtsseitige 2. ur x < 1, f (x) = (x − 1)n+1 f¨ ur x > 1. b) f (1) = 0, f (x) = (x − 1)n+2 f¨ X.2 3. f (x) = ae−x + bex + ce2x mit a, b, c ∈ IR. X.2 4. f (2) = 6, f (2) = −2, f (4) = −1, f (4) = −5; f (x) = − 34 x2 + x + 7
X.2 5. Mit f (x) = a1 x + a3 x2 + a5 x5 liefern die Bedingungen f (1) = 1, f (1) = 0, f (1) = 0 ( Punktsymmetrie zu O!) das LGS mit den Gleichungen a1 + a2 + a3 = 1, 5 3 a1 + 3a3 + 5a5 = 0, 3a3 + 10a5 = 0 mit der L¨ osung (a1 , a3 , a5 ) = 15 8 , −4, 8 .
X.2 6.
n
i=1
fi
:
n
i=1
fi =
n f i i=1 fi
z.B. mit vollst¨ andiger Induktion beweisen. n n
X.2 7. Induktionsschritt: (f · g)(n+1) = = f (0) g (n+1)
n+1
n j−1
+
ni=0
i
(f (i+1) g (n−i) + f (i) g (n−i+1) )
f (j) g (n+1−j) =
j
n+1
n+1 (j) (n+1−j) g j f
j=1 j=0 √ X.2 8. a) (f 2 (x)) = 2x liefert f 2 (x) = 2x2 + c, also f (x) = ± x2 + c mit c ∈ IR.
b) c)
1 f (x) f f
1 f (x)
= x2 liefert 1 f
=
=
x3 3
+ c, also f (x) =
= x3 liefert f (x) =
X.2 9. a) Vgl. IX.10 Aufgabe 1. c) Folgenterm > 1 und < 1 + X.2 10. b) Hyperbel
x2
−
y2
1 n
+
20 x5 +cx+d
= 1; daher
mit c, d ∈ IR.
mit c, d ∈ IR. 1 n2
n
n
1 1 1 n2 + . . . > 1 + n 1 1 d) Man betrachte n+1 < h ≤ n . 1 der Name! c) (tanh) = cosh 2
b) 1 + 1 . n2
3 x3 +d
=1+
X.3 1. Es gilt f (x) = xf (ξ) > 0 mit 0 < ξ < x f¨ ur a) f (x) = ex − (1 + x) und f (x) = 1 − (1 − x)ex b) f (x) = ln(1 + x) − X.3 2. a) b)
1+
1 x
x−1 x ln x x
x 1+x
und f (x) = x − ln(1 + x)
x = − x−1−ln und x − 1 > ln x f¨ ur x > 1 (vgl. Aufg. 1 b)). (x ln x)2
= 1+
1 x
x
ln 1 +
1 x
−
1 1+x
> 0 (Aufg. 1 b)).
c) 1 bzw. e
Analysis
367
X.3 3. f ist an der Stelle 0 genau dreimal differenzierbar; f (x) = −6 sgnx. X.3 4. f 2 − g 2 ist konstant; Einsetzen der Stelle f ( 1t ) 1 + t→0 g( t )
X.3 5. lim
f ( 1t )(−
1 ) t2 ( 1 )(− 1 ) g + 2 t→0 t t
= lim
f ( 1t ) 1 + t→0 g ( t )
a+b 2
liefert f 2 − g 2 = 1.
= lim
X.3 6. a) ln 3 − ln 2 b) -2 c) 0 f¨ ur r < 2, −1 f¨ ur r = 2, existiert nicht f¨ ur r > 2 d) e−1 X.3 7. a) 0
b) 0
c) 1
X.3 8. Der erste Grenzwert ist 1; der Z¨ ahler l¨ asst sich umformen zu ln(x4 + x2 + 1). Der zweite Grenzwert ist 3; man betrachte die Variable t = x1 . X.4 1. F¨ ur n ≥ 1 ist 1 + 13 ≤ xn ≤ 1 + 12 (Induktion); also ist |xm −xn | 9 ≤ 16 |xm − xn |. |xm+1 − xn+1 | = (1+x m )(1+xn ) X.4 2. a) 0,6823. . . X.4 3. a) xn+1 = b) xn+1 =
b) 0,8767. . .
1+xn 1+lg xn ;
x2n −(xn −1)exn 2xn −exn
x0 = 3;
x = 2,506 . . .
x0 = −0,5;
;
1+xn c) xn+1 = 3+ln x0 = 0,7; xn ; x2n −10 X.4 4. xn+1 = 2xn −7 → 2 bzw.
x1 = −0,722; x2 = −0,704
x1 = 0,643; x2 = 0,642 → 5 f¨ ur x0 = 1 bzw. x0 = 7.
X.4 5. 0; 1; 0,25; 0,183; . . .
b) 13 (x + 1)3
X.5 1. a) ln(x − 1) e)
1 8
ln x −
1 64
· x8
X.5 2. a) X.5 3. a)
2(e2
−2
1 ln 23
·
2x 3x+1
b)
− e)
2(ln 2)3
b)
ee
√
d)
f) (x4 − 4x3 + 12x2 − 24x + 24) · ex
h) −x2 cos x + 2x sin x + 2 cos x 2e2
c)
g)
2x+1 ln 3
x2 ln 2
−
−
1 (ln 3)2
2x (ln 2)2
+
√
·3
2 (ln 2)3
2x+1
· 2x
i) ln(cos x) − 6(ln 2)2 + 12 ln 2 − 6
−e
c) 12 (ln 2)2
X.5 4. a) In = 2n e2 − nIn−1 und I0 = e2 − 1
c) 2 ln 2 − 1
b) In = e − nIn−1 und I0 = e − 1
c) In = 14 e4 − n4 In−1 und I0 = 14 (e4 − 1) X.5 5. Mit u = 1 − x in a) bzw. u = 1·3·5·7·9 63 X.6 1. 2 ln 2·4·6·8·10 = 2 ln 256 ≈ −2,8
1 in b) geht das erste in das zweite Integral u ¨ber. x
X.6 2. Man betrachte die F¨ alle x < 0, x = 0 und x> 0. ∞ i 1 X.6 3. Unstetigkeitsstellen: 10zn (z ∈ IN); Integral: 1 + 12 + . . . + 19 10 . i=1
X.6 4. a) Ist x0 irrational, dann gibt es zu jedem n ∈ IN zwei aufeinanderfolgende Br¨ uche mit dem Nenner n, so dass x0 dazwischen liegt. F¨ ur jedes x zwischen diesen Br¨ uchen gilt |f (x) − f (x0 )| = |f (x)| < n1 . Ist x0 rational, dann liegt in jeder Umgebung b) Nummeriere die rationalen Stellen und schließe die von x0 eine irrationale Zahl. ∞ ε n-te Stelle in ein Intervall der L¨ ange 2εn ein. Damit ist ≤ n 2 = ε. n=1
X.6 5. Zerlege das Integral durch 0 < rn < 1 so, dass die Folge (rnn ) gegen 0 konvergiert, etwa rn = 1 − √1n . Ferner sei K eine Schranke von f (x) in [0; 1] und αn das Infimum
rn n nrn n −→ 0. und βn das Supremum von f (x) in [0; rn ]. Damit gilt n x f (x) dx ≤ K n−1 0 1 n nβn nαn n+1 n+1
Nun beachte man: n
rn
x f (x) dx liegt zwischen
n+1 (1
− rn
) und
n+1 (1
− rn
).
L¨osungen der Aufgaben
368
X.6 6. Halbkreislinie: S 0 X.6 7. a) A = 16/3
2r π
Halbkreis߬ ache: S 0
;
b) xS = 105/64, yS = 169/80
4r 3π
c) Vx = (338/15)π; Vy = (27/2)π b a
X.6 8. Bei einer axialen Streckung an einem Durchmesser mit dem Faktor 2 Kreis mit dem Inhalt ¨ber. πa in eine Ellipse mit dem Inhalt πab u Der Umfang ist 4
a
a2 (a2 −x2 )+b2 x2 a2 (a2 −x2 ) x
0
geht der
dx. Dies ist ein uneigentliches Integral, vgl. X.8.
X.6 9. a) F¨ ur F (x) = f (t) dt gibt es ein ξ ∈]a; b[ mit F (b) − F (a) = F (ξ)(b − a). a (2) ξ = ln23 − 2 (3) ξ = 0 b) (1) ξ = ± √13
X.6 10. Es sei m das Minimum und M das Maximum von f auf [a; b]. Aus mg(x) ≤ b
b
a
a
f (x)g(x) ≤ M g(x) f¨ ur alle x ∈ [a; b] folgt m g(x) dx ≤ Ist
b a
g(x) dx = 0, dann ist auch
ξ ∈ [a; b]. F¨ ur
b a
b a
f (x)g(x) dx ≤ M
b a
g(x) dx.
f (x)g(x) dx = 0, die Behauptung gilt also f¨ ur jedes b
b
a
a
g(x) dx > 0 betrachte man μ = ( f (x)g(x) dx) : ( g(x) dx). Wegen
m ≤ μ ≤ M existiert nach dem Zwischenwertsatz ein ξ ∈ [a; b] mit f (ξ) = μ. Nun sei g stetig. Im Falle m < μ < M existiert nach dem Zwischenwertsatz ein ξ ∈]a; b[ mit b
f (ξ) = μ. Ist m = μ, dann folgt aus (f (x) − μ)g(x) dx = 0 und (f (x) − μ)g(x) ≥ 0 a
aufgrund der Stetigkeit (f (x) − μ)g(x) = 0 auf [a; b]. Aufgrund der Stetigkeit von g gibt es ein x0 ∈]a; b[ mit g(x0 ) > 0, also gilt f (x0 ) = μ. Mit ξ = x0 ist demnach μ = f (ξ). (F¨ ur μ = M wird entsprechend argumentiert). Im Beispiel ergibt sich ξ = X.6 11. Man kann f (a) < f (b) und damit
x a
g(t) dt gilt
b a
b
b a
1 ln 2
−1
≥ 0 auf ]a; b[ annehmen. Mit G(x) =
g(x)g(x) dx = f (b)G(b) − G(x)f (x) dx. Nach dem Satz in Aufgabe 10
existiert ein ξ ∈]a; b[ mit ergibt sich
f (x)
b a
a
b
G(x)f (x) dx = G(ξ) f (x) dx = G(ξ)(f (b) − f (a)). Damit a
f (x)g(x) = f (a)G(ξ) + f (b)(G(b) − G(ξ)).
X.7 1. 4/3 bzw. 1,48 ¯ ¯ X.7 2. π ≈ 47 15 = 3,13; (π − 3,13) : π ≈ 0,00263 (weniger als 0,3%!) √ X.8 1. Das Integral u agt 2 1 − ε. ¨ber [ε; 1] mit ε > 0 betr¨ X.8 2. Man benutze die Substitution x = sin t. Das Integral hat den Wert π. X.8 3. a) −1 < α < β − 1
b) α > 0
X.8 4. Vergleich mit dem Integral X.8 5. Die Reihe l¨ asst sich durch X.8 6. Sch¨atze
n i=1
1 i
durch
n dx 1
x
∞
e ∞ 1
c) α < 1 < β
dx x(ln x)α
t−x dt =
=
∞ 1
1 x−1
t−α dt liefert Konvergenz f¨ ur α > 1. absch¨ atzen; Grenzwert 1.
= ln n ab; beachte ln(n + 1) − ln n
1 etwa wie die neilsche Parabel y 2 = x3 . 2 2 ¨ mit y 2 = 2 + x − x2 sind definiert auf e) Umformung zu y = 2 ± x − x . Die zwei Aste
[−1; 2] und bilden zusammen einen Kreis mit dem Mittelpunkt 12 , 0 und dem Radius 3 2 ¨ x2 sind definiert auf [−2; 1] und bilden zusammen 2 , die zwei Aste mit y = 2 − x − einen Kreis mit dem Mittelpunkt − 12 , 0 und dem Radius 32 .
f) Definitionsberech IR, weil eine algebraischen Gleichung dritten Grades stets eine reelle L¨osung hat. Die Kurve ist symmetrisch zur Winkelhalbierenden y = x, weil mit (u, v) auch (v, u) ein Kurvenpunkt ist; das Produkt der Steigungen in symmetrisch 2 +y gelegenen Punkten ist 1. Ableitung y = − 3x ; f¨ ur y = −3x2 ist x = 0 oder x = 3y 2 +x √ √ √ √ √ 3 3 3 − 13 2. Im Punkt − 13 2, − 13 4 waagerechte Tangente, im Punkt − 13 3 4, − 13 3 2
also senkrechte Tangente. Im Punkt − 12 , − 12 Tangente mit der Steigung −1. Außer (0,0) keine Schnittpunkte mit den Achsen, an dieser Stelle durchkreuzt sich die Kurve (mit den Steigungen 0 bzw ∞). F¨ ur große Werte von |x| ist y ≈ −x, die Kurve n¨ ahert sich asymptotisch der Geraden mit der Gleichung y = −x (von oben“); vgl. Fig. 5,6. ” t XII.3 1. x = t ln t, y = t2 ; Tangentenvektor 1+ln . 2t XII.3 2. Es handelt sich um eine Spirale; der Kr¨ ummungskreis den Radius XII.3 3. a) F¨ ur x = cos t ergibt sich
y2
6
3
3
(θ2 +1) 2 θ2 +2 3
.
= sin t, also y = ± sin t; f¨ ur y = + sin t wird
L¨osungen der Aufgaben
372
die Kurve im Gegenuhrzeigersinn durchlaufen, wenn t von 0 bis 2π l¨ auft. ur 0 ≤ x ≤ 1 b) Es ist am g¨ unstigsten, die explizite Darstellung y = f (x) = (1 − x2 )1,5 f¨ (x) = −3x(1 − x2 )0,5 und (Kurvenast im ersten Quadrant) zu untersuchen. Es ist f √ f (x) = 3x2 (1−x2 )−0,5 −3(1−x2 )0,5 . Es ist f 12 2 = 0; die Steigung im Wendepunkt √ √ 1 1 3 ur die anderen Kurven¨ aste. 2 2, 4 2 ist − 2 . Analoges gilt f¨ 2π
1 √ sin2 t + 9 sin4 t cos2 t dt = 4 1 + 9x2 − 9x4 dx 0 0 0 √ nur n¨aherungsweise zu berechnen, etwa A ≈ 4 · 16 1 + 43 + 1 ≈ 5,7
c) 3
2π
sin2 t cos2 t dt = 34 π
d)
e) Der Kr¨ ummungsradius ist 1/3. XII.3 4. a) x = r(θ) cos θ, y = r(θ) sin θ; F (x, y) = x(x2 + y 2 ) − ay 2 b) Aus F (x, y) = 0 und y ≥ 0 folgt y = x1,5 · Integral
a 0
x1,5 ·
1 a−x
dx existiert und ist ≤ a1,5
1 a−x a o
f¨ ur 0 ≤ x < a. Das uneigentliche 1 a−x
2
c) Ist B = (x, y), also AB = x2 + y 2 , dann ist C = 2
also CD =
ay 2 x2 +y 2
2
+
ay 3 x(x2 +y 2 )
2
dx = a2 .
ax2 , axy x2 +y 2 x2 +y 2
und D = a, ay x ,
2
, mit ay 2 = x(x2 + y 2 ) also CD = x2 + y 2 .
XII.4 1. Es ergibt sich eine Parameterdarstellung des Kreises: x = cos t, y = sin t. XII.4 2.
−4t2 1 +3t2 2
XII.4 3. a) L = L=
1 4
a 0
b) A =
−
3 1 (4t2 +1) 2 12 √ t 4t2 +1
2π √ 0
−12t2 6t
=
t t2
(e2t + 2 + e−2t ) dt mit a = ln(2π + π
1 2
2 π 4
θ2 dθ =
1 6
et −e−t 2
θ2 + 1 dθ; mit der Substitution θ =
π 3 2
c) x = t cos t, y = t sin t XII.4 4. a) 2(e2π − 1)
−
π 3
d)
4
=
√
ergibt sich
4π 2 + 1), also L = 18 (e2a + 4a − e−2a ).
7 3 384 π
t cos t
b) x =
1+t2 − sin t−t cos t t sin t + 2+t2 cos t−t sin t et cos t, y = et sin t c) x
= −et sin t, y = et cos t
XII.5 1. Zwei orthogonale und zum Normalenvektor der Ebene orthogonale Vektoren der L¨ange 7 sind z.B. a =
√7 5
1 −2 0
und b =
√7 70
6 3 5
. Ist m der Ortsvektor von M ,
dann ist x = m + cos t a + sin t b eine Parameterdarstellung des Kreises. XII.5 2. L =
1 + h2 + (ln a)2
XII.5 3. Ein Ber¨ uhrpunkt der Kugel auf der Fl¨ ache ergibt sich f¨ ur x = y = z; der Kugelradius ist dann 13 .
XII.5 4. Es gilt x2 + y 2 + z 2 = r2 . XII.5 5.
x y z
=
x2 2
a
− x0 y0 z0
y2 b2
−
z2 c2
+r
Ellipsoid:
x y z
=
a cos u cos v b sin u cos v c sin v
= 1; Tangentialebene in (x0 , y0 , z0 ) zu Parametern u0 , v0 :
0 −b sin u sinh v c cos u sinh v
+s
a sinh v b cos ucoshv c sin u cosh v
;
x0 x a2
−
y0 y b2
−
z0 z c2
=1
Index Abel 289 abelscher Grenzwertsatz 289 abgeschlossenes Intervall 211 Ableitung 242 Ableitungsfunktion 243 Ableitungsregeln 244 Absch¨atzung von Integralen 278 absolut konvergent 223 Abstandsberechnung 75 abz¨ahlbar 229 Abz¨ahlung 228 Additionstheorem f¨ ur Determinanten 85 Addition 9, 12, 37, 188, 231 affine Abbildung 97, 143 affines Koordinatensystem 98 Affinit¨at 97 ¨ Ahnlichkeitsabbildung 99 alternierende Reihe 223 Annihilator A(U ) 38 a¨quivalente Folgen 209 ¨ Aquivalenzklasse 212 ¨ Aquivalenzrelation 208, 209, 212 ¨ Aquivalenzumformungen eines LGS 7 Archimedes 184 archimedisch angeordnet 213 archimedische Spirale 346 Arkuskosinusfunktion arccos 235 Arkussinusfunktion arcsin 235 Arkustangensfunktion arctan 235, 264 arithmetische Folge 190, 195, 196 arithmetisches Mittel 195 Assoziativgesetz 43, 188 Asteroide 329, 334, 342, 349 Asymptote 240 asymptotisches Verhalten 241 ausgeartete Quadrik 125 ¨außeres Produkt 80 Austauschsatz 16 Basis 16, 167, 219, 220 Basiswechsel 34 Berechnung der Determinante 87, 90 Berechnung der Inversen 45, 95 Bernoulli, Jakob 295
Bernoulli, Johann 192, 252 bernoullische Ungleichung 192 bernoullische Zahlen 295 beschr¨ ankt 203, 217 bestimmtes Integral 261 Betrag eines Vektors 66 Betragsfunktion 237 Beweis durch vollst¨ andige Induktion 191 bijektive Abbildung 34, 232 Bild A 49 Bildmenge 231 Binomialkoeffizient 198 binomische Reihe 305 binomischer Lehrsatz 200 Bogenl¨ ange 270, 334 Bolzano 217 Brennpunkt 122 Brianchon 153 cartesisches Blatt 327 Cauchy 67, 202 Cauchy-Folge 207, 214 Cauchy-Kriterium 213 Cauchy-Produkt 295 Cauchy-Schwarzsche Ungleichung 66 Cavalieri 275 cavalierisches Prinzip 275 Ceva 148 charakteristische Gleichung 105 charakteristisches Polynom 105 Cosinushyperbolicus cosh 249 Cramer 82 cramersche Regel 82, 90 Definitionsl¨ ucke 238 Definitionsmenge 231 Desargues 144 Descartes 327 Determinante det 52, 53, 82, 85 Determinantenmultiplikationssatz 53 Diagonalmatrix 47 Differenzenfolge 188, 191 Differenzenoperator 59 Differenzenquotient 242, 243
374 Differenzial 243 Differenzialgleichung 248 Differenzialquotient 243 Differenziation 243 differenzierbar 242, 326 Dimension dim 17 Dirichlet 307 Dirichlet-Reihe 307 Distributivgesetz 43, 188 divergente Folge 204 Doppelverh¨altnis 146 Drehung 101 Dreiecksfl¨ache 29 Dreiecksmatrix 96 Dreiecksungleichung 66, 204 Dreieckszahlen 202 Dreispiegelungssatz 102 duale Basis 38 dualer Vektorraum 37 Dualit¨atsprinzip 137 Durchstoßpunkt 27
Erwartungswert 70 erweiterte Koeffizientenmatrix 9 Erzeugendensystem 14 Erzeugnis 14 euklidischer Vektorraum 64 Euler 54,108, 225 Euler-Affinit¨ at 108 Euler-Mascheroni-Konstante 284 eulersche Gammafunktion 286 eulersche Zahl e 215, 225, 302 Evolute 340 Evolvente 343 Existenz der Determinante 86 explizite Darstellung der Determinante 92 Exponentialfunktion 233, 263 Extrempunkte 301, 317
Faktorregel 245 Fakult¨ at n! 198, 228, 286 Fermat 202 Fibonacci 53, 181, 182 Fibonacci-Zahlen 53, 63, 183, 191, 204 Fixgerade 111 Ebenenb¨ undel 137 Fixpunktgerade 111 Ebenenb¨ uschel 137 Fixrichtung 105 Ebenengleichung 26 Fl¨ acheninhaltsfunktion 260 eigentliche Bewegung 104 Fl¨ ache zweiter Ordnung 123 Eigenraum 105 Fluchtgerade 143, 144 Eigenvektor 105 Folge 181 Eigenwert 105 Folgengrenzwert 204 Einheitsmatrix 43 einschaliges Hyperboloid 125, 126, 130, Fourier 309 Fourier-Reihe 309 350 Fraktale 210 Einschließungskriterium 207 Fundamentalfolge 207, 214 einseitige Differenzierbarkeit 242 Fundamentalsatz der Algebra 117 elementare Funktion 239, 265 F¨ unfeckszahlen 202 elementare Spaltenumformungen 46 Funktion 231 elementare Zeilenumformungen 46 Funktionsgleichung 231 elementar integrierbar 265 Funktionsterm 231 Ellipse 116 Ellipsoid 125, 126 Gammafunktion 286 elliptischer Doppelkegel 124, 126 ganze Zahlen 181 elliptischer Zylinder 124, 126 ganzrationale Funktion 238 elliptisches Paraboloid 124, 126 Ganzteilfunktion 208, 237 endlich erzeugter Vektorraum 16 Gauß 8 endliches Intervall 211 Gauß-Verfahren 6 Entwicklungssatz f¨ ur Determinanten 93
375 Gegenvektor 12 geometrische Folge 190, 195 geometrische Reihe 197 geometrisches Mittel 195 Geradenb¨ uschel 136 Geradengleichung 26, 135 Geradenspiegelung 100, 112 geradentreu 97 gliedweise Differenziation/Integration 292 goldener Schnitt 183 Graph 234 Grenzwert einer Folge 186, 204 Grenzwert einer Funktion 236 gr¨oßte untere Schranke 217 Grundaufgabe der lin. Optimierung 158 Gruppe der affinen Abbildungen 98 Guldin 273 guldinsche Regeln 273 halboffenes Intervall 211 harmonische Folge 195 harmonische Reihe 197 harmonisches Mittel 195 H¨aufungspunkt 217 Hauptachsen 121 Hauptachsentransformation 125 Hauptsatz der Analysis 268 Hauptsatz der projektiven Geometrie 142 Hauptsatz u ¨ber monotone Folgen 217 hebbare Definitionsl¨ ucke 238 Heron 258 heronsches Verfahren 258 Hesse 75 hessesche Normalenform 75 hinreichendes Kriterium 214, 215 h¨ohere Ableitungen 247 homogene Koordinaten 134 homogenes LGS 11 Homomorphismus 32 Hom(V, W ) 36 Huygens 222 Hyperbel 116 hyperbolische Funktionen 249 hyperbolischer Zylinder 124, 126 hyperbolisches Paraboloid 124, 126, 139 Hyperboloid 124
identische Funktion id 232 Identit¨ atssatz f¨ ur Potenzreihen 292 implizite Differenziation 323 Induktion 191 Infimum 217 inhomogenes LGS 11 injektive Abbildung 34 inneres Produkt 64 Integral 260, 267, 268 Integralzeichen 261 Integrationsregeln 262, 267 integrierbar 267 Intervall 211 Intervalladditivit¨ at 261, 267 Intervallschachtelung 211 inverse Funktion 232 inverse Matrix 44, 45, 94 Invertierbarkeit 43, 44 irrationale Zahl 211 Irrationalit¨ at von e 215 Isomorphismus 32 Iteration 254 Kardioide 329 Kegel 124, 126, 276 Kegelschnitt 116, 151 Kehrfunktion 231 Kehrwertregel 244 Kepler 279 keplersche Fassregel 279 Kern einer Intervallschachtelung 212 Kern einer linearen Abbildung 35 Kettenlinie 244, 271 Kettenregel 244 Kleeblattkurve 324 kleinste obere Schranke 217 Koeffizientenmatrix eines LGS 9 kollinear 137 Kommutativgesetz 43, 188 komplanar 137 komplexe Zahlen 50 Komponente 16, 34 Kongruenzabbildung 99 konjugierte Durchmesser 121 konjugiert komplexe Zahl 51 konvergente Folge 204
376 Konvergenzradius 289 konvex 29, 159, 316 konvexe H¨ ulle 30, 159 Konvexkombination 30, 159 Koordinate 16, 34 Koordinatenvektor 16, 33 kopunktal 137 K¨orper der rationalen Zahlen 213 K¨orper der reellen Zahlen 213 Kosinusfunktion cos 234 Kosinussatz 73 Kreis 138 Kreisschnittebenen 132 Kreiszahl π 184, 303 Kr¨ ummung 317 Kr¨ ummungskreis 317 Kr¨ ummungsradius 317, 335 Kurvendiskussion 319 Kurve zweiter Ordnung 117 K-Vektorraum 12 Lambert 307 Lambert-Reihe 307 L¨ange einer Kurve 270 L¨ange eines Vektors 66, 73 Leibniz 189, 222, 261 Leibniz-Kriterium 223 leibnizsche Regel 248 leibnizsche Reihe 223, 285, 300, 311 leibnizsches Dreieck 218 Lemniskate 328, 337 LGS 3 L’Hospital 252 lim 204, 236 Limes 204 Limes inferior liminf 208 Limes superior limsup 208 linear abh¨angig, unabh¨ angig 14 lineare Abbildung 32 lineare Approximation 325 lineare Gleichung 3 lineare H¨ ulle 24 lineare Mannigfaltigkeit 21 lineare Optimierung 155 lineares Funktional 37 lineares Gleichungssystem 3
Linearform 38 Linearkombination 14 linksseitiger Grenzwert 236 Logarithmenregeln 220 logarithmische Spirale 346 Logarithmus 220, 304 Logarithmusfunktion 233, 263 lokales Extremum 250 L¨ osungsmenge eines LGS 11 L¨ osungsraum eines homogenen LGS 39 L¨ osungsverfahren f¨ ur LGS 7 Lotebene 74 Lotfußpunkt 74 Lotgerade 74 Lotmannigfaltigkeit 74 Lotraum 68 Mantelinhalt 273 Mascheroni-Konstante 284 Matrix 12 Matrizenmultiplikation 32, 41 Minimalpunkt 159 Mittelwerts¨ atze 250, 251, 277 monoton fallend/wachsend 203 Monotoniekriterium 251 Multiplikationstheorem f¨ ur Det. 88 Multiplikation 32, 41, 188, 231 nach oben/unten beschr¨ ankt 203, 217 N¨ aherungsverfahren 257, 278 n¨ aherungsweise L¨ osung 257 nat¨ urlicher Logarithmus 220, 263 nat¨ urliche Zahlen 179 Neil 271 neilsche Parabel 271 neutrales Element 43, 188 Newton 257 Newton-Verfahren 257 nicht-ausgeartete Quadrik 125 nichtkollinear 98 nichtkomplanar 98 Normalengleichung 75 Normalenvektor 75, 332 Norm eines Vektors 66 notwendiges Kriterium 214 Nullfolge 206
377 Nullmatrix 43 Nullteiler 44, 188 Nullvektor 12 nummerierbar 229 Nummerierung 228 obere/untere Grenze 217 obere/untere Schranke 217 Obersummen 267 offenes Intervall 211 Optimierung 155 Orthogonalbasis 67 orthogonale Vektoren 67 Orthonormalbasis 67 Orthonormalmatrix 91, 100 Orthonormierungsverfahren 68 Ortskurve 122 Ortsvektor 26, 74 Parabel 116 parabolischer Zylinder 124, 126 Paraboloid 124 parallelentreu 97 Parallelstreckung 97, 109 Parameterdarstellung 331 partielle Ableitung 324 partielle Integration 272 Pascal 153, 200 pascalsches Dreieck 200 Pell 54 pellsche Gleichungen 54 Permutation 91 Pol 77 Polare 77 Polarebene 77 Polarkoordinaten 337 Pol-Polare-Beziehung 78, 139 Polygonalzahlen 201, 202 Polynomfunktion 238 positiv definite Matrix 69 Potenzen 219 Potenzfunktion 246 Potenzmenge 229 Potenzregeln 219 Potenzreihe 289 Prinzip der vollst¨ andigen Induktion 191
Prinzip von Cavalieri 275 Produktfolge 226 Produktintegration 262 Produktregel 244 Produkt 188, 231 projektive Abbildung 140 projektive Ebene 134 projektive Geometrie 134 projektive Gerade 134 projektive Koordinaten 134 projektiver Raum 134 Punktreihe 136 Pyramidenvolumen 185 quadratische Erg¨ anzung 119 quadratische Matrix 42 Quadratzahlen 181, 202 Quadrik 125 Quaternionen 52 Quotientenkriterium 221 Quotientenraum 23, 35 Quotientenregel 245 Rang A 49 Rang einer Matrix, eines LGS 39, 45 rationale Funktion 238, 246 rationales Intervall 211 rationale Zahlen 181, 211 Rechtecksregel 278 rechtsseitiger Grenzwert 236 reelle Zahlen 181, 211, 212 reflexiv 208 Regelfl¨ ache 125, 129 Regeln von de l’Hospital 251, 252 Regel von Cramer 82, 90 Regel von Sarrus 82 Regula falsi 259 Rekursion 182 rekursiv definierte Folge 181 relatives Extremum 317 Richtungsvektor 26 Riemann 228 Riemann-Integral 267 Riemann-integrierbar 267 riemannsche Zetafunktion 228, 288, 289 Ring 188
378 Ring der quadratischen Matrizen 43 Ring mit Einselement 43, 188 Rolle 250 Rotationsk¨orper 273 Sarrus 82 sarrussche Regel 82 Sattelfl¨ache 129, 139 Sattelpunkt 301, 317 Satz vom Minimum und Maximum 240 Satz von Bolzano-Weierstraß 217 Satz von Brianchon 153 Satz von Ceva 148 Satz von der oberen Grenze 217 Satz von Desargues 144 Satz von Pascal 153 Satz von Rolle 250 Schaubild 234 Scheitelkr¨ ummumgskreis 122 Scherung 102 schiefsymmetrische Matrix 49 Schleppkurve 344 Schlupfvariable 156, 159 Schluss von n auf n + 1 191 Schmidt 68 schmidtsches Orthonormierungsverf. 68 Schnittgerade 27 Schr¨agspiegelung 102, 109 Schraubenlinie 347 Schubspiegelung 102 Schwarz 67 Schwerpunkt 271 Signumfunktion sgn 237 Simplex 30, 166 Simplexverfahren 166 Simpson 226, 279 Simpson-Regel 279 singul¨arer Punkt 327 Sinusfunktion sin 234, 306 Sinushyperbolicus sinh 249 Skalar 12 Skalarprodukt 64 Spaltenrang 45 Spaltenumformungen 89 Spaltenvektor 47 Spannvektoren 26
Spatprodukt 81 sph¨ arisches Dreieck 84 Spiegelung an einer Geraden 100, 112 Spur einer Matrix 69 Stammfunktion 260 Standardaufgabe der lin. Optimierung 158 Standardbasis 18 Standardgleichung eines Kegelschnitts 120 Standardgleichung einer Quadrik 125, 126 Standardskalarprodukt 64 Startecke 166 Statistik 70 Steigung 242, 316 stetig 237, 324 stetig differenzierbar 243 stetig hebbare Definitionsl¨ ucke 238 Stirling 312 stirlingsche Formel 312 Streckscherung 110, 113, 114 streng monoton 203 Strukturs¨ atze der Stetigkeit 238 Strukturs¨ atze f¨ ur Grenzwerte 237 Stufenform 7, 10, 46 Substitutionsregel 262 Summenfolge 188 Summenoperator 59 Summenregel 244 Summenzeichen 33, 197 Supremum 217 surjektive Abbildung 34 symmetrische Relation 208 symmetrische Matrix 49, 117 Tangensfunktion tan 235 Tangenshyperbolicus tanh 249 Tangente 75 Tangentenbedingung 76 Tangentenregel 278 Tangentensteigung 242 Tangentenvektor 332 Tangentialebene 75 Tangentialkegel 77, 79 Taylor 298 Taylor-Entwicklung 298 Taylor-Polynom, –reihe 299 taylorsche Formel 298
379 taylorsches Restglied 298 Teilfolge 208 teilverh¨altnistreu 97 Torus 275 Traktrix 344 transitiv 208 Transponieren 47, 48 transponierte Matrix 48 transponierter Vektor 47 Transportproblem 177 Trapezregel 278 trigonometrische Funktionen 247, 264 Tschebyscheff 71 tschebyscheffsche Ungleichung 71 Turm von Hanoi 193 Umgebung 242 umkehrbare Abbildung 34 Umkehrfunktion 232 Umkehrregel 244 Umordnungssatz 224 unbestimmter Ausdruck 219 unbestimmtes Integral 260 uneigentlich (Punkt, Gerade) 134, 135 uneigentliches Integral 281, 282 unendliche Reihe 221 unendliches Produkt 227 unendlich fern 134, 135 unit¨arer Vektorraum 64 Untersummen 267 Untervektorraum, Unterraum 13
Vektor 12, 13, 26 Vektorprodukt 80 Vektorraum 12 Vergleichskriterium 221 Verkettung 40, 232 Verschwindungsgerade 142, 144 Vervielfachung 9, 12, 37, 188, 231 vollst¨ andig angeordneter K¨ orper 213 vollst¨ andige Induktion 191 Vollst¨ andigkeitsaxiom 213 Volumen 185, 274, 275 Wallis 227 wallissches Produkt 227, 312 Weierstraß 217 Wendepunkt 301, 317 windschief 28, 78 Wurzelberechnung 258, 305 Wurzelkriterium 221 Wurzelschnecke 183 Zeilenrang 39, 45 Zeilenumformungen 89 zentrische Streckung 100, 104, 109, 114 Zetafunktion 228, 288, 289 Zissoide 339 zweischaliges Hyperboloid 124, 126, 351 Zwischenwertsatz 240 Zykloide 336 Zylinder 124