Elemente der Linearen Algebra und der Analysis (German Edition)

Elemente der Linearen Algebra und der Analysis Harald Scheid / Wolfgang Schwarz Elemente der Linearen Algebra und de...

Author: Harald Scheid | Wolfgang Schwarz

341 downloads 1668 Views 3MB Size Report

This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form

DOWNLOAD PDF

Elemente der Linearen Algebra und der Analysis

Harald Scheid / Wolfgang Schwarz

Elemente der Linearen Algebra und der Analysis

Autoren Prof. Dr. Harald Scheid und Prof. Dr. Wolfgang Schwarz Bergische Universität Wuppertal Fachbereich Mathematik Gaußstr. 20 42097 Wuppertal E-Mail: [email protected] [email protected] Wichtiger Hinweis für den Benutzer Der Verlag und die Autoren haben alle Sorgfalt walten lassen, um vollständige und akkurate Informationen in diesem Buch zu publizieren. Der Verlag übernimmt weder Garantie noch die juristische Verantwortung oder irgendeine Haftung für die Nutzung dieser Informationen, für deren Wirtschaftlichkeit oder fehlerfreie Funktion für einen bestimmten Zweck. Ferner kann der Verlag für Schäden, die auf einer Fehlfunktion von Programmen oder ähnliches zurückzuführen sind, nicht haftbar gemacht werden. Auch nicht für die Verletzung von Patent- und anderen Rechten Dritter, die daraus resultieren. Eine telefonische oder schriftliche Beratung durch den Verlag über den Einsatz der Programme ist nicht möglich. Der Verlag übernimmt keine Gewähr dafür, dass die beschriebenen Verfahren, Programme usw. frei von Schutzrechten Dritter sind. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Buch berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag hat sich bemüht, sämtliche Rechteinhaber von Abbildungen zu ermitteln. Sollte dem Verlag gegenüber dennoch der Nachweis der Rechtsinhaberschaft geführt werden, wird das branchenübliche Honorar gezahlt. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer ist ein Unternehmen von Springer Science+Business Media springer.de © Spektrum Akademischer Verlag Heidelberg 2009 Spektrum Akademischer Verlag ist ein Imprint von Springer 09 10 11 12 13

5 4 3 2 1

Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Planung und Lektorat: Dr. Andreas Rüdinger, Barbara Lühker Herstellung: Crest Premedia Solutions (P) Ltd, Pune, Maharashtra, India Umschlaggestaltung: SpieszDesign, Neu–Ulm Satz: Autorensatz ISBN 978-3-8274-1971-2

Vorwort Von den aktuellen Reformbem¨ uhungen um die Verbesserung der Qualität und der Inhalte universitärer Ausbildung ist die Lehrerausbildung in besonderem Maße betroffen. Die Ablösung der grundständigen Lehrerausbildung durch konsekutiv strukturierte Modelle, in denen ein (polyvalent angelegtes) Bachelorstudium durch einen passend gestalteten Masterstudiengang zu einem Hochschulabschluss komplettiert werden kann, welcher nach den Bestimmungen der Lehramtspr¨ ufungsordnungen als erste Staatspr¨ ufung anerkannt wird, ist an den meisten Universitäten bereits erfolgt. Dabei nutzen die Hochschulen ihre Gestaltungsspielräume f¨ ur individuell konzipierte Bachelor-Master-Modelle, deren Vielfalt sich nur schwer u ¨berschauen lässt. Ordnend wirkt aber der Leitgedanke der Polyvalenz der Bachelorphase, welche eine breitere fachwissenschaftliche Ausbildung erfordert, die – insbesondere im Bereich der Lehrämter f¨ ur die Klassen 5 bis 13 (bzw. 12) – zum Teil deutlich u ¨ber die Standards einer grundständigen Lehrerausbildung hinausgeht. Derzeit gilt dies auch noch f¨ ur das Lehramt an Grundschulen, allerdings ist zu erwarten, dass hier eine Verselbständigung erfolgen wird, infolge derer dann die Inhalte der Studiengänge f¨ ur die Klassen 5 bis 10 näher an die Inhalte der Studiengänge f¨ ur die gymnasiale Oberstufe und das Berufskolleg heranr¨ ucken – entsprechende Entw¨ urfe liegen im Land NRW bereits vor. Der Mathematikunterricht in der Oberstufe besteht hauptsächlich aus den beiden Gebieten Lineare Algebra“ und Analysis“, so dass man zu Beginn eines ” ” Studiums schon einige Vorkenntnise zu diesen Themen mitbringt. Diese beiden Gebiete sind von zentraler Bedeutung f¨ ur die weiterf¨ uhrenden Themenbereiche, ebenso aber f¨ ur fast alle Anwendungsfelder der Mathematik. Es ist also sinnvoll und auch Tradition, der Linearen Algebra und der Analysis einen breiten Raum im Grundstudium eines jeden mit Mathematik befassten Studiengangs bereitzustellen, womit gleichzeitig auch unsere Zielgruppe definiert wäre. Im vorliegenden Buch sind beide Gebiete in zwei unabhängigen Teilen dargestellt, so dass man entweder mit der Analysis oder mit der Linearen Algebra beginnen kann. Nat¨ urlich gibt es zahlreiche Bez¨ uge zwischen diesen beiden Gebieten, denn vielfach stammen Motivationen und Beispiele f¨ ur Begiffsbildungen der Linearen Algebra aus der Analysis, und diese Begriffsbildungen und damit verbundenen Theorieentwicklungen wiederum erweisen sich als n¨ utzlich in der Analysis. Trotzdem sind die beiden Teile des Buchs mit den notwendigsten Grundkenntnissen aus dem Mathematikunterricht in der Oberstufe unabhängig voneinander zu bearbeiten. Treten trotzdem ohne weitere Erklärung Begriffe auf, die den Studierenden

Vorwort

VI

weder in der Schule noch in anderen einf¨ uhrenden Lehrveranstaltungen an der Hochschule bereits begegnet oder aber in Vergessenheit geraten sind (z. B. der Begriff des Körpers der reellen Zahlen, die trigonometrischen Additionstheoreme oder das Rechnen mit Logarithmen), dann kann man solche Begriffe leicht in einem (mathematischen) Lexikon nachschlagen. Man könnte auch die beiden folgenden einf¨ uhrenden B¨ ucher der gleichen Autoren zu Rate ziehen: • Elemente der Arithmetik und Algebra, Spektrum Akad. Verlag Heidelberg 20085 • Elemente der Geometrie, Spektrum Akad. Verlag Heidelberg 20074 Die noch relativ junge mathematische Disziplin Lineare Algebra“ ist dadurch ” besonders ausgezeichnet, dass sie mit ihren universellen Begriffsbildungen und Methoden als Werkzeug in vielen anderen mathematischen Teilgebieten verankert ist. Allerdings mangelt es vielen Kursen zur Linearen Algebra daran, die außergewöhnliche Beziehungshaltigkeit dieser Disziplin aufzuzeigen. Das vorliegende Buch ist geprägt von dem Bem¨ uhen, nicht nur die Grundlagen des Fachs zu vermitteln, sondern die entwickelten Begriffsgef¨ uge und Theorien mit anderen mathematischen Gebieten zu vernetzen; dies geschieht in umfangreichen Anwendungsbeispielen aus der Arithmetik, der Geometrie, der Zahlentheorie, der Statistik, der Linearen Optimierung und nat¨ urlich der Analysis. Damit bietet das Buch ein breites Spektrum möglicher Vertiefungsinhalte der Linearen Algebra, die Gegenstand von Lehrveranstaltungen einer polyvalenten mathematischen Aubildung sein könnten. Gleiches gilt auch f¨ ur den Teil zur Analysis, der neben dem Standardprogramm der meisten Einf¨ uhrungsveranstaltungen auch einen vorsichtigen Einstieg in die Analysis von Funktionen mehrerer Variabler einschließlich (differenzial-)geometrischer Anwendungen enthält. Die Darstellung des Lehrstoffs im vorliegenden Buch orientiert sich an der Zielsetzung, die Studierenden insbesondere auch beim Selbststudium zu unterst¨ utzen, da die konsekutiven Bachelor- und Masterstudiengänge entsprechende Studienanteile in nicht geringem Umfang vorsehen. Nat¨ urlich soll nicht auf den nötigen Formalismus in der mathematischen Argumentation verzichtet werden, wo immer es sich aber anbietet, steht die Vermittlung von Einsichten im Vordergrund, auch wenn dies stellenweise längere Erklärungstexte und Veranschaulichungen erfordert. Am Ende eines jeden Abschnitts bieten einige in der Regel sehr einfache Aufgaben die Gelegenheit, mit dem entwickelten Begriffsgef¨ uge vertraut zu werden. Mit etwas anspruchsvolleren Aufgaben soll dann auch das kreative, fantasievolle Verhalten beim Problemlösen gefördert werden, welches seit jeher unabdingbare Voraussetzung f¨ ur die erfolgreiche Bewältigung eines Mathematikstudiums ist. Lösungen und Lösungshinweise zu allen Aufgaben findet man am Ende des Buches, wobei diese aus Platzgr¨ unden sehr knapp gehalten werden m¨ ussen. Wuppertal, im März 2009

Harald Scheid Wolfgang Schwarz

Inhaltsverzeichnis Lineare Algebra I Lineare Gleichungssysteme und Vektorr¨ aume I.1 Beispiele f¨ ur lineare Gleichungssysteme 3 I.2 Lösungsverfahren 7 I.3 Der Begriff des Vektorraums 12 I.4 Lineare Mannigfaltigkeiten 21 I.5 Geometrische Interpretation 26 I.6 Konvexe Mengen 28 II Lineare Abbildungen II.1 Lineare Abbildungen und Matrizen 32 II.2 Verkettung linearer Abbildungen 40 II.3 Anwendungen der Matrizenrechnung 50 III Das Skalarprodukt III.1 Skalarprodukträume 64 III.2 Anwendungen in der Statistik 70 III.3 Anwendungen in der Geometrie 73 III.4 Vektorprodukt und Spatprodukt 80 IV Determinanten IV.1 Die Determinante einer Matrix 85 IV.2 Explizite Darstellung und Berechnung 91 V Affine Abbildungen V.1 Darstellung affiner Abbildungen 97 V.2 Eigenwerte und Eigenräume einer Matrix 105 V.3 Klassifikation der affinen Abbildungen 108 VI Kurven und Fl¨ achen zweiter Ordnung VI.1 Die Kegelschnittkurven 116 VI.2 Flächen zweiter Ordnung 123 VI.3 Regelflächen 129 VI.4 Kreisschnittebenen 132 VII Projektive Geometrie VII.1 Homogene Koordinaten 134 VII.2 Projektive Abbildungen 140 VII.3 Kegelschnitte in der projektiven Ebene 151 VIII Lineare Optimierung VIII.1 Problemstellung und Grundbegriffe 155 VIII.2 Das Simplexverfahren 166

Inhaltsverzeichnis

VIII

Analysis IX Folgen reeller Zahlen IX.1 Grundlegende Beispiele und Begriffe 181 IX.2 Summen- und Differenzenfolgen 188 IX.3 Das Prinzip der vollständigen Induktion 191 IX.4 Arithmetische, geometrische und harmonische Folgen 195 IX.5 Arithmetische Folgen höherer Ordnung 198 IX.6 Konvergente Folgen 203 IX.7 Die reellen Zahlen 211 IX.8 Potenzen mit reellen Exponenten 219 IX.9 Unendliche Reihen 221 IX.10 Die eulersche Zahl 225 IX.11 Unendliche Produkte 226 IX.12 Abzählen von unendlichen Mengen 228 X Differenzial- und Integralrechnung X.1 Stetige Funktionen 231 X.2 Die Ableitung einer Funktion 241 X.3 Die Mittelwertsätze der Differenzialrechnung 250 X.4 Iterationsverfahren 254 X.5 Stammfunktionen und Flächeninhalte 260 X.6 Das Riemann-Integral 266 X.7 Näherungsverfahren zur Integration 278 X.8 Uneigentliche Integrale 281 XI Potenzreihen XI.1 Konvergenz von Potenzreihen 289 XI.2 Taylor-Entwicklung 297 IX.3 Numerische Berechnungen 302 XI.4 Weitere Reihenentwicklungen 307 XII Kurven und Fl¨ achen XII.1 Kurvendiskussion 316 XII.2 Implizite Differenziation 323 XII.3 Parameterdarstellung von Kurven, Darstellung mit Polarkoordinaten 331 XII.4 Evoluten und Evolventen 340 XII.5 Kurven und Flächen im Raum 347 Lösungen der Aufgaben Index 373

352

Lineare Algebra

I Lineare Gleichungssysteme und Vektorr¨ aume I.1 Beispiele fu ¨ r lineare Gleichungssysteme In vielen Gebieten der Mathematik und ihrer Anwendungen muss man sich mit linearen Gleichungssystemen beschäftigen. Eine algebraische Gleichung heißt linear, wenn die Variablen x1 , x2 , . . . , xn nur in der ersten Potenz und nicht als Produkte vorkommen, wenn die Gleichung also die Form a1 x1 + a2 x2 + . . . + an xn = a hat. Die Koeffizienten a1 , a2 , . . . , an , a stammen dabei aus einem Zahlenbereich K, welcher wie die Menge IR der reellen Zahlen einen Körper bildet, in welchem man also wie mit reellen Zahlen rechnen kann. Die Lösungen der Gleichung sind n-Tupel mit Elementen aus K, gehören also zu K n . In den meisten Anwendungen ist K der Körper IR der reellen Zahlen oder der Körper C der komplexen Zahlen (vgl. II.3). Sollen mehrere solche Gleichungen gleichzeitig erf¨ ullt sein, dann liegt ein lineares Gleichungssystem vor. Da im Folgenden der Ausdruck lineares Glei” chungssystem“ sehr häufig vorkommt, wollen wir ihn mit LGS“ abk¨ urzen. Ein ” LGS mit n Variablen und m Gleichungen hat die Form a11 x1 a21 x1

+ a12 x2 + a22 x2

+ . . . + a1n xn + . . . + a2n xn

= a1 = a2 .. .

am1 x1 + am2 x2 + . . . + amn xn = am Bei den Koeffizienten aij gibt der erste Index i die Nummer der Gleichung und der zweite Index j die Nummer der Variablen an. Ein LGS hat entweder keine Lösung, genau eine Lösung oder unendlich viele Lösungen, wie wir im Folgenden sehen werden. Die Lösungsmenge eines LGS ändert sich offensichtlich nicht, wenn man zwei Gleichungen vertauscht, eine Gleichung mit einer von 0 verschiedenen Zahl multipliziert oder das Vielfache einer Gleichung zu einer anderen addiert. Beispiel 1 : Edelstahl ist eine Legierung aus Eisen, Chrom und Nickel; beispielsweise besteht V2A-Stahl aus 74% Eisen, 18% Chrom und 8% Nickel. Aus den in nebenstehender Tabelle angegebenen Legierungen (1) bis (4) soll 1000 kg V2A(1) (2) (3) (4) Stahl gemischt werden. Um die notwenEisen 70% 72% 80% 85% digen Anteile x1 , x2 , x3 , x4 von (1) bis (4) Chrom 22% 20% 10% 12% (in kg) zu bestimmen, muss man folgendes Nickel 8% 8% 10% 3% LGS lösen: 0,70x1 + 0,72x2 + 0,80x3 + 0,85x4 = 740 0,22x1 + 0,20x2 + 0,10x3 + 0,12x4 = 180 0,08x1 + 0,08x2 + 0,10x3 + 0,03x4 = 80

I Lineare Gleichungssysteme und Vektorräume

4

Multipliziert man alle Gleichungen mit 100, um Kommazahlen zu vermeiden, dann ergibt sich das LGS 70x1 + 72x2 + 80x3 + 85x4 = 74 000 22x1 + 20x2 + 10x3 + 12x4 = 18 000 8x1 + 8x2 + 10x3 + 3x4 = 8 000 Subtrahiert man die dritte Gleichung von der zweiten und das 8fache der dritten Gleichung von der ersten, so erhält man das LGS 6x1 + 8x2 + 0x3 + 61x4 = 10 000 14x1 + 12x2 + 0x3 + 9x4 = 10 000 8x1 + 8x2 + 10x3 + 3x4 = 8 000 Multipliziert man die erste Gleichung mit 3 und subtrahiert dann von ihr das 2fache der zweiten Gleichung, so ergibt sich −10x1 + 0x2 + 0x3 + 165x4 = 10 000 14x1 + 12x2 + 0x3 + 9x4 = 10 000 8x1 + 8x2 + 10x3 + 3x4 = 8 000 Wählt man nun f¨ ur x4 einen beliebigen Wert r, dann liefert die erste Gleichung 33 x1 = r − 1000. Aus der zweiten Gleichung folgt damit x2 = −20r + 2000. Aus 2

der dritten Gleichung folgt schließlich x3 = x1 = 33s − 1000,

5 r. Mit r = 2s ist 2

x2 = −40s + 2000,

x3 = 5s,

x4 = 2s.

Aufgrund des Sachzusammenhangs d¨ urfen diese Werte nicht negativ sein, es muss 1000 also ≤ s ≤ 50 gelten; f¨ ur jeden Wert von s in diesem Bereich ergibt sich eine 33 Lösung des gestellten Problems. Beispielsweise ergibt sich mit s = 40 : x1 = 320,

x2 = 400,

x3 = 200,

x4 = 80.

Beispiel 2 : Kennt man in einem Gleichstromnetz die Spannungen und die Widerstände, dann kann man die Stromstärken in den Widerständen mit Hilfe der beiden kirchhoffschen Regeln berechnen: • In jedem Knotenpunkt des Netzes ist die Summe der Stromstärken der ankommenden Ströme gleich der Summe der Stromstärken der abfließenden Ströme. • In jeder Masche des Netzes ist die Summe der Spannungen gleich der Summe der Produkte aus den (gerichteten) Stromstärken und den Widerständen. Es sollen die Stromstärken I1 , I2 , . . . , I5 (gemessen in Ampère) in dem Netz in Fig. 1 bestimmt werden.

I.1 Beispiele für lineare Gleichungssysteme

5

........................................................................................................................................................................................................ ... ... ... .. ... ... ... .......................... .................... 2 ... ... Ω.... ↓ I4 ... I2 ↓ .....20 Ω... ...10 ... ... I . . ................... 5 ................ ... ← . ... ... + . . . . . . . . . . . . . . . . . . . .. . . ... ............. . . . . . . . . . . . . . . . y .y2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 420 V .................. 10 Ω 1 . . . . .... ... — .................... .. .. ... . ....................... ... ..................... . ... ...20 Ω.... ↓ I3 I1 ↓ ..10 Ω.. ... ........................ . . .................. .... 1 ... . ... .. .. ... . ............................................................................................................................................................................................................................... Fig. 1: Gleichstromnetz Knoten Knoten Masche Masche Masche

I2 1: I1 − 2: − I3 + I4 1: 10I1 − 20I3 2: 20I2 − 10I4 3: 10I1 + 20I2

− I5 − I5 + 10I5 − 10I5

= 0 = 0 = 0 = 0 = 420

Zunächst dividiert man die dritte, vierte und f¨ unfte Gleichung durch 10. Subtrahiert man dann die erste Gleichung von der dritten und f¨ unften, dann erhält man das LGS I1 − I2 − I5 = 0 − I3 + I4 − I5 = 0 I2 − 2I3 + 2I5 = 0 2I2 − I4 − I5 = 0 3I2 + I5 = 42 Nun subtrahiert man das 2fache bzw. 3fache der dritten Gleichung von der vierten bzw. f¨ unften und vertauscht dann noch die die zweite mit der dritten Gleichung: I 1 − I2 I2 − 2I3 − I3 + I4 4I3 − I4 6I3

− I5 + 2I5 − I5 − 5I5 − 5I5

= 0 = 0 = 0 = 0 = 42

Nun addiert man das 4fache bzw. 6fache der dritten Gleichung zur vierten bzw. f¨ unften Gleichung: I 1 − I2 I2 − 2I3 − I3 +

I4 3I4 6I4

− I5 + 2I5 − I5 − 9I5 − 11I5

= 0 = 0 = 0 = 0 = 42


6

Weitere derartige Umformungen (Multiplikation der dritten Gleichung mit −1, Division der vierten Gleichung durch 3, Subtraktion des 6fachen der vierten Gleichung von der f¨ unften, Division der f¨ unften Gleichung durch 7) f¨ uhren auf das LGS I1 − I2 − I5 = 0 I2 − 2I3 + 2I5 = 0 I3 − I4 + I5 = 0 I4 − 3I5 = 0 I5 = 6 Jetzt erhält man der Reihe nach aus der f¨ unften, vierten, dritten, . . . Gleichung I5 = 6, I4 = 3I5 = 18, I3 = I4 − I5 = 12, I2 = 2I3 − 2I5 = 12, I1 = I2 + I5 = 18. Beispiel 3: Aus SiO2 (Quarz) und NaOH (Natronlauge) entsteht Na2 SiO3 (Natriumsilikat) und H2 O (Wasser). Die nat¨ urlichen Zahlen x1 , x2 , x3 , x4 in der Reaktionsgleichung x1 SiO2 + x2 NaOH −→ x3 Na2 SiO3 + x4 H2 O bestimmt man aus der Bedingung, dass jedes chemische Element Si, Na, O, H auf beiden Seiten der Reaktionsgleichung gleich oft auftreten muss; diese Zahlen sollen dabei so klein wie möglich sein. Es muss das LGS x1 2x1

− x3 x2 − 2x3 + x2 − 3x3 − x4 x2 − 2x4

= = = =

0 0 0 0

gelöst werden. Wegen x1 = x3 (erste Gleichung) und 2x3 = x2 = 2x4 (zweite und vierte Gleichung) ergibt sich x3 = x4 , womit auch die dritte Gleichung erf¨ ullt ist: 2x4 + 2x4 − 3x4 − x4 = 0. Mit x4 = r ist also x1 = r, x2 = 2r, x3 = r, x4 = r. Die Lösung mit den kleinsten nat¨ urlichen Zahlen erhält man f¨ ur r = 1.

Aufgaben 1. Die Koeffizienten a0 , a1 , a2 , . . . , an einer Polynomfunktion f : x → an xn + . . . + a2 x2 + a1 x + a0 vom Grad n sind eindeutig bestimmt, wenn man n + 1 Wertepaare (u, f (u)) kennt. Man bestimme die Polynomfunktion f vom Grad 4 mit den Wertepaaren (−2, 73), (−1, 22), (1, 10), (2, 37), (3, 158).

2. Man bestimme die Koeffizienten in der chemischen Reaktionsgleichung x1 KMnO4 + x2 KBr + x3 H2 SO4 −→ x4 K2 SO4 + x5 MnSO4 + x6 Br2 + x7 H2 O.

I.2 Lösungsverfahren

7

3. Zwei Grundstoffe S1 , S2 sind in den Mischungen A, B, C, D mit den in der Tabelle angegebenen Anteilen enthalten. Es soll aus A, B, C, D eine Mischung hergestellt werden, welche S1 mit 4% und S2 mit 12% enthält. Man bestimme die möglichen Mischungsverhältnisse.

A B C D S1 6% 6% 3% 2% S2 15% 10% 15% 10%

4. Fig. 2 zeigt ein Einbahnstraßennetz mit der Anzahl von Fahrzeugen, die pro Zeiteinheit die einzelnen Straßenabschnitte passieren. .. Ist die Anzahl der an ... .. . ... 100 . . . 200 100 einer Kreuzung ankom... 6 ... ? ... ? ... ... ... menden Fahrzeuge gleich ... ... .... der Anzahl der wegfah... .. ... x-7 400 ... . ..u x-3 renden, dann tritt kein ...........................................................................u........................................u.........................600 .......... . . ..... D Stau auf. Auf den Teil... F ... E . .... ... ... strecken DC und CB sol...... ?x6 ... ?x4 ... 6x2 len Ausbesserungsarbei..... ... ... x x ... 200 ... .. 1 5 ten vorgenommen wer.......................................u....................................u..................................................u.........................800 .......... . .. C . den. Wie viele Fahrzeu.. A ... B . . ... .. ... ge m¨ ussen trotzdem die.. .... .. ... ... .. se Teilstrecken passie.. 1000 6 . . . . . 400 800 ren? Was ist wohl die ? .? g¨ unstigste Lösung des Fig. 2: Einbahnstraßennetz Problems?

I.2 Lo ¨sungsverfahren Wie in den Beispielen 1 und 2 in I.1 kann man jedes LGS durch Vertauschen der Gleichungen, Multiplikation einer Gleichung mit einer Zahl = 0 und Addition einer Gleichung zu einer anderen auf Stufenform bringen, d. h. auf eine Form, in der jede Gleichung mindestens eine Variable enthält, die in den folgenden Gleichungen nicht mehr vorkommt. Genauer soll dabei gelten: Sind in einer Gleichung der Stufenform die ersten k Koeffizienten gleich 0, dann sind in der nächsten Gleichung (mindestens) die k + 1 ersten Koeffizienten gleich 0 (Fig. 1).

$ ∗ ∗ ∗ ∗ ∗ ∗ ... 0 0 0 $ ∗ ∗ ∗ ... 0 0 0 0 $ ∗ ∗ ... 0 0 0 0 0 0 $ ... $: Koeffizient = 0 0: Koeffizient 0 *: Koeffizient beliebig Fig. 1: Koeffizientenschema der Stufenform eines LGS

Die Umformungen, die zur Stufenform f¨ uhren, ändern nichts an der Lösungsmenge ¨ des LGS. Man nennt sie daher Aquivalenzumformungen.


8

Die Lösungen eines LGS in Stufenform kann man, beginnend mit der letzten Gleichung, folgendermaßen bestimmen: Ist xk + bk+1 xk+1 + bk+2 xk+2 + . . . + bn xn = b die letzte Gleichung, so setzt man im Fall k < n f¨ ur xk+1 , xk+2 , . . . , xn die Parameter r1 , r2 , . . . , rn−k und erhält xk = b − bk+1 r1 − bk+2 r2 − . . . − bn rn−k . (Im Fall k = n erhält man bereits xn = b.) Ist xm + cm+1 xm+1 + cm+2 xm+2 + . . . + cn xn = c (m < k) die vorletzte Gleichung, so setzt man im Fall m < k−1 f¨ ur xm+1 , . . . , xk−1 die Parameter rn−k+1 , rn−k+2 , . . . , rn+m+1 und kann dann xm durch die Parameter r1 , r2 , . . . rn−k , rn−k+1 , . . . , rn+m+1 ausdr¨ ucken. So fährt man fort, bis man schließlich die Variablen x1 , x2 , . . . , xn durch die frei wählbaren Parameter r1 , r2 , r3 , . . . ausgedr¨ uckt hat. Dieses Lösungsverfahren, also Umformung des LGS in Stufenform und anschließendes Vorgehen wie soeben beschrieben, nennt man Gauß-Verfahren (nach Carl Friedrich Gauß, 1777–1855). Besitzt ein LGS keine Lösung, dann zeigt sich das in der Stufenform dadurch, dass mindestens eine der letzten Gleichungen die Form 0 = a“ mit a = 0 hat. ” Beispiel 1: Das LGS x1 + x2 − 3x3 + 4x4 − 7x6 + 8x7 − x8 = 12 x4 + 3x5 − 2x6 + 5x7 − 11x8 = 30 x7 + 2x8 = 10 ist in Stufenform. Setzt man x8 = r1 , x6 = r2 , x5 = r3 , x3 = r4 , x2 = r5 , dann ergibt sich x7 = 10 − 2r1 x4 = 30 − 3r3 + 2r2 − 5(10 − 2r1 ) + 11r1 = −20 + r1 + 2r2 − 3r3 x1 = 12 − r5 + 3r4 − 4(−20 + r1 + 2r2 − 3r3 ) − 7r2 − 8(10 − 2r1 ) − r1 = 12 + 11r1 − 15r2 + 12r3 + 3r4 − r5 oder u ¨bersichtlicher geschrieben: x1 x2 x3 x4 x5 x6 x7 x8

= 12 + 11r1 − 15r2 + 12x3 + 3r4 − r5 = r5 = r4 = −20 + r1 + 2r2 − 3r3 = r3 = r2 = 10 − 2r1 = r1


9

Die Lösungen eines LGS mit n Variablen sind n-Tupel. Um die Lösungen eines LGS u ¨bersichtlich darstellen zu können, schreiben wir n-Tupel als Zahlenspalten in Klammern und definieren eine Vervielfachung und eine Addition f¨ ur n-Tupel: ⎛ ⎜ ⎜

r⎜ ⎜ ⎝

a1 a2 .. .

⎞

⎛

⎟ ⎜ ⎟ ⎜ ⎟=⎜ ⎟ ⎜ ⎠ ⎝

an

ra1 ra2 .. .

⎞

⎛

⎟ ⎟ ⎟, ⎟ ⎠

⎜ ⎜ ⎜ ⎜ ⎝

ran

a1 a2 .. .

⎞

⎛

b1 b2 .. .

⎟ ⎜ ⎟ ⎜ ⎟+⎜ ⎟ ⎜ ⎠ ⎝

an

⎞

⎛

⎟ ⎜ ⎟ ⎜ ⎟=⎜ ⎟ ⎜ ⎠ ⎝

bn

a1 + b 1 a2 + b 2 .. .

⎞ ⎟ ⎟ ⎟ ⎟ ⎠

a n + bn

Damit lässt sich die Menge der Lösungen des LGS in Beispiel 1 folgendermaßen schreiben: ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝

x1 x2 x3 x4 x5 x6 x7 x8

⎞

⎛

12 ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ −20 ⎟=⎜ ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ ⎠ ⎝ 10 0

⎞

⎛

⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ + r1 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎠ ⎝

11 0 0 1 0 0 −2 1

⎞

⎛

−15 ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ −2 ⎟ + r2 ⎜ ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ 1 ⎟ ⎜ ⎟ ⎜ ⎠ ⎝ 0 0

⎞

⎛

⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ + r3 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎠ ⎝

12 0 0 −3 1 0 0 0

⎞

⎛

⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ + r4 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎠ ⎝

3 0 1 0 0 0 0 0

⎞

⎛

⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ + r5 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎠ ⎝

−1 1 0 0 0 0 0 0

⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠

(r1 , r2 , r3 , r4 , r5 ∈ IR). ¨ Die Ausf¨ uhrung von Aquivalenzumformungen wird u ¨bersichtlicher, wenn man sie statt an dem LGS nur an der Koeffizientenmatrix bzw. der erweiterten Koeffizientenmatrix ⎛ ⎜ ⎜ ⎜ ⎜ ⎝

a11 a21 .. .

a12 a22 .. .

. . . a1n . . . a2n .. .

⎞ ⎟ ⎟ ⎟ ⎟ ⎠

⎛

bzw.

am1 am2 . . . amn

⎜ ⎜ ⎜ ⎜ ⎝

a11 a21 .. .

a12 a22 .. .

. . . a1n . . . a2n .. .

a1 a2 .. .

⎞ ⎟ ⎟ ⎟ ⎟ ⎠

am1 am2 . . . amn am

des LGS durchf¨ uhrt. Kommt dabei eine Variable in einer Gleichung nicht vor, so hat sie den Koeffizient 0. Beispiel 2: Die erweiterte Koeffizentenmatrix des LGS in Beispiel 2 aus I.1 lautet anfangs bzw. nach Herstellung der Stufenform ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝

1 −1 0 0 −1 0 0 0 −1 1 −1 0 10 0 −20 0 10 0 0 20 0 −10 −10 0 10 20 0 0 0 420

⎞

⎛

⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠

⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝

bzw.

1 −1 0 0 −1 0 0 1 −2 0 2 0 0 0 1 −1 1 0 0 0 0 1 −3 0 0 0 0 0 1 6

⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠

Hier lassen sich auch die Zahlen oberhalb der Diagonalen zu 0 machen (Addition eines geeigneten Vielfachen der letzten Zeile zu den anderen, dann der vorletzten


10

Zeile zu den anderen usw.). Es ergibt sich ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝

1 0 0 0 0

0 1 0 0 0

0 0 1 0 0

0 0 0 1 0

0 0 0 0 1

18 12 12 18 6

⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠

und damit

x1 x2 x3 x4 x5

= = = = =

18 12 12 . 18 6

Wir haben also gesehen, dass sich die erweiterte Koeffizientenmatrix eines LGS ¨ durch Aquivalenzumformungen stets auf die folgende Stufenform bringen lässt: n

......................................................................................................................................................................................................................... ... ... = 0 0 ∗ ∗ 0 0 ∗ 0 ∗ ∗ ∗ ∗ ... 0 ∗ ... 0 = 0 0 ∗ ∗ 0 0 ∗ 0 ∗ ∗ ∗ ∗ ... 0 ... ... 0 0 0 = 0 ∗ ∗ 0 0 ∗ 0 ∗ ∗ ∗ ∗ r .. ... ... 0 0 0 0 0 0 = 0 0 ∗ 0 ∗ ∗ ∗ ∗ ... ... 0 0 0 0 0 0 = 0 ∗ 0 ∗ ∗ ∗ ∗ ... 0 ... .. 0 0 0 0 0 0 0 0 0 = 0 ∗ ∗ ∗ ∗ ... ... 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ... ... 0 0 0 0 0 0 0 0 0 0 0 0 0 ... 0 n − r .... ... 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ... ... 0 0 0 0 0 0 0 0 0 0 0 0 0 0 .

∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗

In dem LGS in Beispiel 1, das schon in Stufenform gegeben war, ist n = 8 und r = 3, in Beispiel 2 ist n = r = 6. Das LGS besitzt genau dann Lösungen, wenn in den letzten n − r Gleichungen der Stufenform, in denen die Koeffizienten der Variablen alle 0 sind, auch in der Konstantenspalte 0 steht. Dann kann man die letzten n−r Gleichungen ( 0 = 0“) ” weglassen. Verbleiben noch r Gleichungen, dann haben die Lösungen des LGS die Gestalt ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ c1 u1 v1 w1 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ c2 ⎟ ⎜ u2 ⎟ ⎜ v2 ⎟ ⎜ w2 ⎟ ⎜ . ⎟ + t1 ⎜ . ⎟ + t2 ⎜ . ⎟ + . . . + tn−r ⎜ . ⎟ ⎜ . ⎟ ⎜ . ⎟ ⎜ . ⎟ ⎜ . ⎟ ⎝ . ⎠ ⎝ . ⎠ ⎝ . ⎠ ⎝ . ⎠ cn

un

vn

wn

mit n − r frei wählbaren Parametern t1 , t2 , . . . , tn−r ∈ IR. Das alles lässt sich viel präziser darstellen, wenn wir im nächsten Abschnitt den Begriff des Vektorraums eingef¨ uhrt haben.


11

Ein LGS in der in I.1 angegebenen Form heißt homogen, wenn a1 = a2 = . . . = am = 0 ist, wenn es also folgendermaßen aussieht: a11 x1 a21 x1

+ a12 x2 + a22 x2

= 0 = 0 .. .

+ . . . + a1n xn + . . . + a2n xn

am1 x1 + am2 x2 + . . . + amn xn = 0 Andernfalls nennt man das LGS inhomogen. F¨ ur ein homogenes LGS gilt offensichtlich: Jedes Vielfache einer Lösung ist wieder eine Lösung, und die Summe zweier Lösungen ist ebenfalls eine Lösung. Aus einem inhomogenen LGS entsteht das zugehörige homogene LGS, indem man die Konstanten rechts vom Gleichheitszeichen durch 0 ersetzt. Die Differenz zweier Lösungen des inhomogenen LGS ist eine Lösung des zugehörigen homogenen LGS, wie man durch Einsetzen sofort sieht. Addiert man zu einer Lösung des inhomogenen Systems eine Lösung des homogenen Systems, so erhält man wieder eine Lösung des inhomogenen Systems. Kennt man also eine spezielle Lösung des inhomogenen Systems, dann erhält man alle Lösungen als Summe dieser speziellen Lösung und einer Lösung des homogenen LGS.

Aufgaben 1. a) Man zeige, dass ein LGS entweder keine, genau eine oder unendlich viele Lösungen besitzt.

2x1 + rx2 = 3 4x1 + 5x2 = s keine Lösung, genau eine Lösung, unendlich viele Lösungen? b) F¨ ur welche Parameterwerte r, s hat das LGS

2. Man stelle ein LGS mit den drei Variablen x1 , x2 , x3 auf, welches die Lösungen (1 + 3r, 2 − r, 5 − 4r) (r ∈ IR) besitzt.

3. Die Lösungsmenge eines LGS kann auf verschiedene Arten dargestellt werden. Man zeige, dass {(r + 2s, r − s, 1 + 5s) | r, s ∈ IR} = {(p + 11q, 3p + 2q, −p + 20q) | p, q ∈ IR}.

4. Man berechne die Lösungsmenge: a)

x 1 + x5 x 2 + x5 x 3 + x5 x 4 + x5

= = = =

2(x2 + x3 ) 3(x3 + x4 ) 4(x4 + x1 ) 5(x1 + x2 )

b)

x2 + x3 + x4 + x5 x 1 + x3 + x4 + x5 x 1 + x2 + x4 + x5 x 1 + x2 + x3 + x5 x 1 + x2 + x3 + x4

=1 =2 =3 =4 =5


12

I.3 Der Begriff des Vektorraums Zur Darstellung der Lösungen eines LGS haben wir in I.2 die Vervielfachung von n-Tupeln reeller Zahlen mit einer reellen Zahl und die Addition von n-Tupeln benutzt. Die n-Tupel bilden damit eine algebraische Struktur, welche ein Vektorraum im Sinn der folgenden Definition ist. Definition 1: Es sei V eine nicht-leere Menge; als Variable f¨ ur Elemente aus V benutzen wir die Bezeichnungen a, b, c, . . .. In V sei eine Verkn¨ upfung + definiert, so dass (V, +) eine kommutative Gruppe ist, d.h. es gelten das Assoziativgesetz ((a +b) +c = a + (b +c) f¨ ur alle a, b, c ∈ V ) und das Kommutativgesetz (a + b = b + a f¨ ur alle a, b ∈ V ), es gibt ein neutrales Element o (a + o = o + a = a f¨ ur alle a ∈ V ) und jedes Element a ∈ V besitzt ein inverses Element (bezeichnet mit −a). Ferner sei in V die Vervielfachung mit Elementen aus einem Körper K definiert; f¨ ur r ∈ K bezeichnet man das r-fache von a mit ra. (Das Nullelement und das Einselement von K bezeichnen wir wie in Zahlenkörpern mit 0 bzw. 1.) Dabei soll f¨ ur alle r, s ∈ K und alle a, b ∈ V gelten: r(a + b) = ra + rb, (r + s)a = ra + sa, r(sa) = (rs)a, 1a = a. (Dabei bedeutet in a + b das Pluszeichen die Verkn¨ upfung in V , in r + s aber die Addition im Körper K.) Dann nennt man V einen K-Vektorraum. Die Elemente von V nennt man Vektoren. Das neutrale Element o nennt man den Nullvektor, der Vektor −a heißt der Gegenvektor von a. Statt a + (−b) schreibt man a − b. Zur Unterscheidung von den Vektoren nennt man die Elemente aus K Skalare. Beispiel 1: Den IR-Vektorraum IRn der n-Tupel reeller Zahlen haben wir schon in I.2 benötigt, um die Lösungen eines LGS darzustellen. Beispiel 2: Die Folgen reeller Zahlen bilden ebenfalls einen IR-Vektorraum IRIN (Menge aller Abbildungen der Menge IN der nat¨ urlichen Zahlen in die Menge IR der reellen Zahlen), wobei die Addition und Vervielfachung von Folgen durch (an ) + (bn ) = (an + bn ) und r(an ) = (ran ) definiert ist. Beispiel 3: Die Matrizen

⎛ ⎜ ⎜ ⎜ ⎜ ⎝

a11 a21 .. .

a12 a22 .. .

... ...

a1n a2n .. .

am1 am2 . . . amn

⎞ ⎟ ⎟ ⎟ = (aij )m,n ⎟ ⎠

mit m Zeilen und n Spalten (m, n-Matrizen) mit Elementen aus IR bilden einen IR-Vektorraum, wenn man die Addition und Vervielfachung in Anlehnung an die entsprechenden Operationen bei n-Tupeln folgendermaßen definiert: (aij )m,n + (bij )m,n = (aij + bij )m,n ,

r(aij )m,n = (raij )m,n .

I.3 Der Begriff des Vektorraums

13

Beispiel 4: Die Menge aller Funktionen auf einem reellen Intervall [a; b] mit Werten in IR bildet einen IR-Vektorraum, wobei man f¨ ur Funktionen f, g und r ∈ IR definiert: (f + g)(x) = f (x) + g(x) und (rf )(x) = rf (x) f¨ ur alle x ∈ [a; b]. Vektoren treten in der Geometrie in Gestalt von Verschiebungen (in der Ebene oder im Raum) auf. Solche Verschiebungen kann man hintereinanderausf¨ uhren ( addieren“) und mit reellen Faktoren vervielfachen, womit ein IR-Vektorraum ” entsteht. Vektoren treten auch in der Physik auf, etwa in Gestalt von Kräften, Beschleunigungen oder Geschwindigkeiten ( gerichtete Größen“). Daraus erklärt ” sich die Bezeichnung Vektor“ (lat. Träger, Fahrer). ” Satz 1: In einem K-Vektorraum V gilt: (1) ro = o f¨ ur alle r ∈ K. (2) 0v = o f¨ ur alle v ∈ V. (3) (−r)v = −(rv ) f¨ ur alle r ∈ K, v ∈ V. (4) Ist rv = o, dann ist r = 0 oder v = o. Beweis: (1) In ro = r(o + o) = ro + ro addiere man −ro. (2) In 0v = (0 + 0)v = 0v + 0v addiere man −0v . (3) Aus o = (r + (−r))v = rv + (−r)v folgt, dass (−r)v der Gegenvektor von rv ist, also (−r)v = −rv . (Es gilt also −a = (−1)a.) (4) Ist rv = o und r = 0, dann ist o = r−1o = r−1 (rv ) = (r−1 r)v = 1v = v .

2

Definition 2: Ist V ein K-Vektorraum und U eine Teilmenge von V , welche bez¨ uglich der Addition und Vervielfachung in V wieder ein K-Vektorraum ist, dann nennt man U einen Untervektorraum oder Unterraum von V. Ein Unterraum eines Vektorraums V ist nicht leer, denn er muss den Nullvektor o enthalten. Genau dann ist U ein Unterraum von V , wenn mit a, b ∈ U und r ∈ K stets a + b ∈ U und ra ∈ U gilt (Unterraumkriterium). Beispiel 5: Die Menge der Lösungen eines homogenen LGS mit n Variablen und Koeffizienten aus dem Körper K bildet einen Unterraum von K n , denn die Summe zweier Lösungen und jedes Vielfache einer Lösung sind wieder Lösungen. Beispiel 6: Die Menge der konvergenten Folgen reeller Zahlen (vgl. IX.4) bildet einen Unterraum des IR-Vektorraums aller Folgen reeller Zahlen, denn die Summe zweier konvergenter Folgen und jedes Vielfache einer konvergenten Folge sind wieder konvergent. Beispiel 7: Die Menge der 3,3-Matrizen mit reellen Einträgen, bei denen die Summen der Elemente in den Zeilen und Spalten alle den gleichen Wert haben, bildet einen Unterraum des IR- Vektorraums IR3,3 aller 3,3-Matrizen mit reellen


14

Einträgen. Denn diese Eigenschaft u ¨berträgt sich auf die Summen und Vielfachen solcher Matrizen. Ein Beispiel f¨ ur eine Matrix mit dieser Eigenschaft ist

4 3 8

9 5 1

2 7 6

; hier hat die Summe der Zahlen in den Zeilen und Spalten immer

den Wert 15. (Dies ist ein besonders schönes Exemplar aus dem Unterraum, denn die Einträge sind die nat¨ urlichen Zahlen von 1 bis 9 und auch die Diagonalen ergeben die Summe 15; es handelt sich um ein so genanntes magisches Quadrat.) Beispiel 8: Die Menge der auf einem reellen Intervall I differenzierbaren Funktionen mit Werten in IR (vgl. X.2) bildet einen Unterraum aller auf I definierten Funktionen mit reellen Werten, denn die Summen und die Vielfachen differenzierbarer Funktionen sind wieder differenzierbar, wie man in der Analysis lernt. Definition 3: F¨ ur Vektoren a1 , a2 , . . . , an eines K-Vektorraums V nennt man die Summe r1a1 + r2a2 + . . . + rnan mit r1 , r2 , . . . , rn ∈ K eine Linearkombination der Vektoren a1 , a2 , . . . , an . Eine Teilmenge U eines Vektorraums V ist offensichtlich genau dann ein Unterraum von V , wenn alle Linearkombinationen von Elementen aus U wieder zu U gehören. Definition 4: Die Menge aller Linearkombinationen von Vektoren a1 , a2 , . . . , an aus einem Vektorraum V nennt man das Erzeugnis von a1 , a2 , . . . , an und bezeichnet es mit a1 , a2 , . . . , an . Das Erzeugnis a1 , a2 , . . . , an ist ein Unterraum U von V , denn Summen und Vielfache von Linearkombinationen von a1 , a2 , . . . , an sind wieder Linearkombinationen von a1 , a2 , . . . , an . Man nennt dann die Menge {a1 , a2 , . . . , an } ein Erzeugendensystem von U . Beispiel 9: Die homogene Gleichung x1 +x2 +x3 = 0 hat in IR3 den Lösungsraum ⎧ ⎨

r

⎩

1 0 −1

+s

0 1 −1

| r, s ∈ IR

⎫ ⎬ ⎭

=

1 0 −1

,

0 1 −1

Beispiel 10: Das homogene LGS mit der Koeffizientenmatrix

in IR3 nur die eine Lösung

0 0 0

.

1 1 0 1 0 0

1 1 1

hat

, also den nur aus dem Nullvektor bestehenden

Lösungsraum o (Nullraum). Definition 5: Eine Menge A von Vektoren aus einem Vektorraum V heißt linear unabhängig, wenn eine Gleichung der Form r1a1 + r2a2 + . . . + rnan = o mit {a1 , a2 , . . . , an } ⊆ A nur mit r1 = r2 = . . . = rn = 0 bestehen kann. Andernfalls heißt die Vektormenge linear abhängig.


15

Man sagt oft auch kurz (aber etwas ungenau), die Vektoren a1 , a2 , . . . , an seien linear unabhängig bzw. abhängig, obwohl das ja keine Eigenschaft der einzelnen Vektoren ist, sondern eine Eigenschaft der Menge dieser Vektoren. Ist {a1 , a2 , . . . , an } linear abhängig, dann kann man mindestens einen der Vektoren ai als Linearkombination der anderen darstellen. Ist aber {a1 , a2 , . . . , an } linear unabhängig, dann ist das nicht möglich.

1 0 0 , 1 aus IR3 ist linear unabhängig, Beispiel 11: Die Vektormenge −1 −1

1 0 0 0 1 denn aus r +s = 0 folgt r = s = 0. −1 −1 0

Beispiel 12: Die auf IR definierten Funktionen x → sin x und x → cos x sind π linear unabhängig, denn aus r sin x + s cos x = 0 (Nullfunktion) folgt f¨ ur x = 2 bzw. x = 0 die Beziehung r = s = 0.

1 2 3 0 2 , 0 , 1 , 2 aus IR3 ist linear Beispiel 13: Die Vektormenge 3 5 1 7

1 2 3 0 0 abhängig: r1 2 + r2 0 + r3 1 + r4 2 = 0 bedeutet dasselbe wie 3 5 1 7 0

r1 + 2r2 + 3r3 = 0 2r1 + r3 + 2r4 = 0 . 3r1 + 5r2 + r3 + 7r4 = 0 Die Koeffizientenmatrix LGS mit den vier Variablen r1 , r2 , r3 , r4 dieses homogenen

1 0 0

hat die Stufenform

2 1 0

3 8 27

0 −7 –26

aßigerweise setzt man x4 = 27t . Zweckm¨

(t ∈ IR) und erhält die Lösungen ⎛ ⎜ ⎜ ⎜ ⎝

Es gilt also −40

1 2 3

⎞

r1 r2 r3 r4

⎛

⎟ ⎜ ⎟ ⎜ ⎟ = t⎜ ⎠ ⎝

− 19

2 0 5

−40 −19 26 27

+ 26

⎞ ⎟ ⎟ ⎟ ⎠

3 1 1

(t ∈ IR).

+ 27

0 2 7

=

0 0 0

.

Beispiel 14: Die Polynome u ¨ber IR vom Grad ≤ n bilden einen Vektorraum. Die Menge {1, x, x2 , . . . , xn } ist linear unabhängig: Ist p(x) = a0 + a1 x + a2 x2 + . . . + an xn das Nullpolynom, dann ist p(0) = 0, also a0 = 0 und p(x) = xq(x) mit q(x) = a1 + a2 x + a3 x2 + . . . + an xn−1 . Auch q(x) muss das Nullpolynom sein, also ist a1 = 0. So fortfahrend findet man a0 = a1 = a2 = . . . = an = 0.

16


Definition 6: Es sei V ein Vektorraum und B eine linear unabhängige Teilmenge von V . Ist jeder Vektor aus V als Linearkombination von Vektoren aus B darstellbar, dann nennt man B eine Basis von V . Ist V ein K-Vektorraum mit der Basis B = {b1 , b2 , . . . , bn }, dann schreibt man auch ⎛ ⎞ ⎛ ⎞ v1 v1 ⎜ ⎟ ⎜ ⎟ ⎜ v2 ⎟ ⎜ v2 ⎟ n ⎜ ⎟ ⎜ v = v1 b1 + v2 b2 + . . . + vn bn = ⎜ .. ⎟ oder kurz ⎜ .. ⎟ ⎟∈K ⎝ . ⎠ ⎝ . ⎠ vn

vn B und nennt diese Zahlenspalte aus K den Koordinatenvektor von v bez¨ uglich der Basis B. Die Vektoren vibi sind die Komponenten, die Zahlen vi die Koordinaten des Vektors v bez¨ uglich der Basis B. Diese sind eindeutig durch v bestimmt, denn die Basisdarstellung ist eindeutig: Aus n

v1b1 + v2b2 + . . . + vnbn = w1b1 + w2b2 + . . . + wnbn folgt (v1 − w1 )b1 + (v2 − w2 )b2 + . . . + (vn − wn )bn = o, wegen der linearen Unabhängigkeit der Basisvektoren also v1 − w1 = 0, v2 − w2 = 0, . . . , vn − wn = 0. Bei gegebener Basis wird das Rechnen in einem Vektorraum mit Hilfe der Koordinatenvektoren durchgef¨ uhrt. Bei der Darstellung von Vektoren durch ihre Koordinatenvektoren muss man also wissen, auf welchem Platz die Koordinate zu einem gegebenen Basisvektor steht, man muss die Basivektoren also anordnen (1. Basisvektor, 2. Basisvektor usw.). Man muss dann die Basis nicht als Menge, sondern als Tupel ( geordnete Menge“) von Vektoren ansehen. ” Ist V endlich erzeugt, d.h. existieren endlich viele Vektoren, deren Erzeugnis V ergibt, dann besitzt V auch eine Basis: Man wähle einfach unter den Erzeugendensystemen eines mit einer minimalen Anzahl von Vektoren. Ein solches ist linear unabhängig, denn wäre einer der Vektoren als Linearkombination der anderen darstellbar, dann könnte man ihn aus dem Erzeugendensystem streichen und erhielte eines mit einer kleineren Anzahl von Vektoren. Aus jedem Erzeugendensystem ergibt sich also eine Basis, indem man Vektoren aus ihm entfernt, welche von den u ¨brigen linear abhängig sind. Vektorräume, die nicht endlich erzeugt sind, können aber auch eine Basis besitzen. Beispielsweise bilden die Funktionen fi mit fi (x) = xi (i = 0, 1, 2, . . .) eine Basis des Vektorraums aller ganzrationalen Funktionen auf IR. Der folgende Satz enthält Eigenschaften von Basen eines endlich-erzeugten Vektorraums V , welche häufig benötigt werden. Teil (1) des Satzes besagt, dass man aus einer Basis B von V wieder eine Basis von V erhält, wenn man einen Vektor b ∈ B gegen eine Linearkombination von Vektoren aus B austauscht, falls der Koeffizient von b in dieser Linearkombination nicht 0 ist. Aus (1) folgt Teil (2) des Satzes, dieser trägt den Namen Austauschsatz.


17

Satz 2: Der K-Vektorraum V habe die Basis B = {b1 , b2 , . . . , bn }. (1) Aus einer Basis von V ergibt sich wieder eine Basis, wenn man zu einem der Basisvektoren eine Linearkombination der u ¨brigen addiert. (2) Ist {u1 , u2 , . . . , um } eine lineare unabhängige Teilmenge von V , dann gibt es m Vektoren in B, die man durch u1 , u2 , . . . , um ersetzen kann. Insbesondere ist also jede n-elementige linear unabhängige Teilmenge von V eine Basis von V . (3) Jede linear unabhängige Teilmenge von V kann man durch weitere Elemente aus V zu einer Basis ergänzen. (4) Jede Basis von V enthält gleich viele Vektoren. Beweis: (1) Ersetzt man b1 durch rb1 mit r = 0, dann ist v v = v1b1 + v2b2 + . . . + vnbn = 1 (rb1 ) + v2b2 + . . . + vnbn r

und {rb1 , b2 , . . . , bn } ist linear unabhängig. Ersetzt man b1 durch b1 + b2 , dann ist v = v1b1 + v2b2 + . . . + vnbn = v1 (b1 + b2 ) + (v2 − v1 )b2 + . . . + vnbn und {b1 +b2 , b2 , . . . , bn } ist linear unabhängig. Daraus ergibt sich die Behauptung. (2) In der Darstellung von u = o in der Basis B sei der Koeffizient ui von bi von 0 verschieden. Dann ersetze man bi durch uibi und addiere dann die Linearkom bination uj bj hinzu. Dann hat man bi durch u ersetzt. Nach (1) ergibt sich j=i

wieder eine Basis. Diese Ersetzungen wiederhole man f¨ ur die weiteren Vektoren u ∈ {u1 , u2 , . . . , um }. Dabei findet man immer ein bi , dessen Koeffizient in der Darstellung von u von 0 verschieden ist, weil andernfalls {u1 , u2 , . . . , um } linear abhängig wäre. (3) Man ersetze gemäß (2) m Vektoren in einer Basis B durch die Vektoren der gegebenen linear unabhängigen Teilmenge. (4) Als minimales Erzeugendensystem ist die Anzahl der Vektoren in einer Basis eindeutig festgelegt. Man entnimmt das aber auch der Aussage (1): Wären {b1 , b2 , . . . , bn } und {u1 , u2 , . . . , um } Basen mit m < n, dann hätte man bei Ersetzung von m der Vektoren der ersten Basis durch die m Vektoren der zweiten Basis noch n − m Vektoren in der ersten Basis, welche Linearkombinationen der anderen Vektoren in der Basis sein m¨ ussten, was einen Widerspruch ergibt. 2 Da nach Satz 2 (4) zwei verschiedene Basen eines endlich-erzeugten Vektorraums gleich viele Elemente besitzen, ist folgende Definition erlaubt: Definition 7: Die Anzahl der Elemente einer Basis eines endlich-erzeugten Vektorraums V nennt man die Dimension von V und bezeichnet sie mit dim V. Die Dimension des Vektorraums {o} ist 0.


18

Beispiel 15: Der Vektorraum IRn der n-Tupel reeller Zahlen hat die Dimension n. Eine Basis bilden z.B. die n-Tupel, deren Koordinaten alle den Wert 0 haben, bis auf eine, die den Wert 1 hat. Dies nennt man die Standardbasis von IRn . Die Standardbasis von IRn besteht also aus den Vektoren ⎛

1 0 0 0 .. . 0

⎜ ⎜ e1 = ⎜ ⎜ ⎜ ⎝

⎞

⎛

⎟ ⎟ ⎟ ⎟, ⎟ ⎠

⎜ ⎜ e2 = ⎜ ⎜ ⎜ ⎝

0 1 0 0 .. . 0

⎞

⎛

⎟ ⎟ ⎟ ⎟, ⎟ ⎠

⎜ ⎜ e3 = ⎜ ⎜ ⎜ ⎝

0 0 1 0 .. . 0

⎞

⎛

⎟ ⎟ ⎟ ⎟, ⎟ ⎠

⎜ ⎜ e4 = ⎜ ⎜ ⎜ ⎝

0 0 0 1 .. . 0

⎞

⎟ ⎟ ⎟ ⎟, ⎟ ⎠

⎛

...,

⎜ ⎜ en = ⎜ ⎜ ⎜ ⎝

0 0 0 0 .. . 1

⎞

⎟ ⎟ ⎟ ⎟. ⎟ ⎠

Beispiel 16: Der Vektorraum IRm,n der m, n-Matrizen reeller Zahlen hat die Dimension m · n. Eine Basis ist beispielsweise die Menge aller m, n-Matrizen, deren Einträge alle den Wert 0 haben, bis auf einen, der den Wert 1 hat. Beispiel 17: Der Vektorraum IR3,3 hat die Dimension 9. Diejenigen Matrizen aus IR3,3 , bei denen die Summen der Zahlen in den einzelnen Zeilen und Spalten den gleichen Wert haben, bilden einen Unterraum U . Dieser hat die Dimension 3, denn eine Basis von U ist z.B. (Aufgabe 6) ⎧⎛ ⎪ ⎨ 1 ⎜ ⎝ 1 ⎪ ⎩

⎞ ⎛

⎞⎫

⎞ ⎛

1 1 0 2 1 1 2 0 ⎪ ⎬ ⎜ ⎟ ⎜ ⎟ 1 1 ⎟ ⎠,⎝ 2 1 0 ⎠,⎝ 0 1 2 ⎠ . ⎪ 1 1 1 1 0 2 2 0 1 ⎭

Beispiel 18: Die arithmetischen Folgen (a + dn), also die Folgen der Form a, a + d, a + 2d, a + 3d, . . . , bilden einen 2-dimensionalen Unterraum des Vektorraums aller Folgen reeller Zahlen; eine Basis ist {(1), (n)}, wobei (1) die konstante Folge 1, 1, 1, . . . und (n) die Folge 1, 2, 3, . . . der nat¨ urlichen Zahlen ist. Beispiel 19: Das homogene LGS 2x1 + 3x2 − 5x3 + 4x4 − x5 = 0 x1 + x2 − 2x3 + 7x4 − 2x5 = 0 bzw.

2x1 + 3x2 = 5x3 − x1 + x2 = 2x3 − lässt sich umformen zu x1 = x3 − 17x4 x2 = x3 + 10x4

4x4 + x5 7x4 + 2x5 + 5x5 . − 3x5

Die Lösungsmenge ist ⎧ ⎪ ⎪ ⎪ ⎨

⎛

⎪ ⎪ ⎪ ⎩

⎝

⎜

x3 ⎜ ⎜

1 1 1 0 0

⎞

⎛

⎟ ⎜ ⎟ ⎜ ⎟ + x4 ⎜ ⎠ ⎝

−17 10 0 1 0

⎞

⎛

⎟ ⎜ ⎟ ⎜ ⎟ + x5 ⎜ ⎠ ⎝

5 −3 0 0 1

⎞ ⎟ ⎟ ⎟ ⎠

|

⎫ ⎪ ⎪ ⎪ ⎬

x3 , x4 , x5 ∈ IR , ⎪ ⎪ ⎪ ⎭

also der von den drei genannten Lösungsvektoren erzeugte Unterraum U von IR5 .


19

Die Vektoren in diesem Erzeugendensystem sind linear unabhängig, also hat der Lösungsraum U die Dimension 3. Ist umgekehrt U mit obigem Erzeugendensystem gegeben, dann kann man U als Lösungsraum eines LGS verstehen, nämlich eines LGS mit 5 Variablen, dessen Koeffizientenvektoren sich als Lösungen des folgenden homogenen LGS mit den Variablen a1 , a2 , . . . , a5 ergeben: a2 + a3 = 0 a1 + −17a1 + 10a2 + a4 = 0 5a1 − 3a2 + a5 = 0 Der Lösungsraum hat die Dimension 2, linear unabhängige Lösungen werden z. B. durch die Quintupel (2, 3, −5, 4, −1) und (1, 1, −2, 7, −2) gegeben. Es ergibt sich also ein homogenes LGS mit 5 Variablen und 2 Gleichungen, welches äquivalent zu dem eingangs betrachteten LGS ist. (Mit den angegebenen Quintupeln erhält man genau das eingangs gegebene LGS.) Satz 3: Jeder Unterraum U der Dimension m von IRn ist der Lösungsraum eines homogenen LGS mit n − m Gleichungen. Beweis: Es sei {u1 , u2 , . . . , um } eine Basis von U und ui habe die Koordinaten ui1 , ui2 , . . . , uin (i = 1, . . . , m). Der Lösungsraum W des homogenen LGS u11 y1 + u21 y1 +

u12 y2 + . . . + u22 y2 + . . . +

u1n yn = 0 u2n yn = 0 .. .

um1 y1 + um2 y2 + . . . + umn yn = 0 mit den Variablen y1 , y2 , . . . , yn ändert sich nicht, wenn man das LGS durch Zeilenumformungen auf Stufengestalt bringt, man kann also uij = 0 f¨ ur j < i annehmen. Außerdem kann man durch Vertauschung der Variablen (also Vertauschung der Basisvektoren) erreichen, dass uii = 0, da {u1 , u2 , . . . , um } linear unabhängig ist. Schließlich können wir noch uii = 1 setzen und durch weitere Zeilenumformungen erreichen, dass uij = 0 f¨ ur i < j ≤ m. Das LGS hat dann folgende Form: y1 y2 y3 y4

+ + + +

u1,m+1 ym+1 u2,m+1 ym+1 u3,m+1 ym+1 u4,m+1 ym+1

+ + + +

... ... ... ...

+ + + +

u1n yn u2n yn u3n yn u4n yn

= = = = .. .

0 0 0 0

ym + um,m+1 ym+1 + . . . + umn yn = 0 Der Lösungsraum wird also erzeugt von den n − m linear unabhängigen Vektoren cm+j + em+j (j = 1, . . . , n − m), wobei cm+j die Koordinaten −u1,m+j , −u2,m+j , . . . , −um,m+j , 0, 0, . . . , 0 hat. Der Lösungsraum hat also die Dimension n − m. Hat nun der Lösungsraum des eingangs gegebenen LGS die


20

Basis {w 1, w 2, . . . , w n−m } und hat w j die Koordinaten wj1 , wj2 , . . . , wjn (j = 1, . . . , n − m) dann sind die Vektoren ui Lösungen von w11 x1 + w21 x1 +

w12 x2 + . . . + w22 x2 + . . . +

w1n xn = w2n xn = .. .

0 0

.

wn−m,1 x1 + wn−m,2 x2 + . . . + wn−m,n xn = 0, Der Lösungsraum dieses LGS hat die Dimension n − (n − m) = m, also ist U der Lösungsraum dieses LGS. 2 Bez¨ uglich einer gegebenen Basis des n-dimensionalen Vektorraums V lässt sich dieser mit IRn identifizieren, indem man jedem Vektor aus V seinen Koordinatenvektor bez¨ uglich der Basis zuordnet. Also gilt auch allgemeiner als in Satz 3: Jeder Unterraum U eines endlich-dimensionalen K-Vektorraums V lässt sich als Lösungsraum eines homogenen LGS mit Koeffizienten aus K verstehen. Sollen dabei die Vektoren aus den Koeffizienten der Gleichungen linear unabhängig sein, dann besteht das LGS aus dim V − dim U Gleichungen.

Aufgaben 1. Es sei {a, b, c} eine linear unabhängige Menge von Vektoren aus einem Vektorraum V . Man zeige, dass dann auch {a + 2b, a + b + c, a − b − c} linear unabhängig ist.

2. Es sei Pn der Vektorraum der Polynome u¨ber IR vom Grad ≤ n. Zeige, dass {1, 1 + x, (1 + x)2 , . . . , (1 + x)n } eine Basis von Pn ist.

3. Es sei Q die Menge der rationalen Zahlen. Man zeige, dass die Zahlen √ √ a + b 2 + c 3 mit a, b, c ∈ Q

einen Q-Vektorraum der Dimension 3 bilden.

4. a) Man beweise, dass die Schnittmenge zweier Unterräume eines Vektorraums V wieder ein Unterraum von V ist. b) Man beweise, dass die Vereinigungsmenge zweier Unterräume U1 , U2 eines Vektorraums V nur dann wieder ein Unterraum von V ist, wenn U1 ⊆ U2 oder U2 ⊆ U1 gilt. c) Es seien U1 , U2 zwei Unterräume des Vektorraums V . Man zeige, dass {u1 + u2 | u1 ∈ U1 , u2 ∈ U2 } einen Untervektorraum W von V bildet. Unter welcher Voraussetzung ist f¨ ur jeden Vektor w ∈ W die Darstellung w = u1 + u2 mit u1 ∈ U1 , u2 ∈ U2 eindeutig?

I.4 Lineare Mannigfaltigkeiten

5. Bildet die Menge der Matrizen

21

a b

−b a

mit a, b ∈ IR einen IR-Vektorraum?

Welche Dimension hat dieser?

6. Man bestimme eine Basis des Lösungsraums des homogenen LGS x 1 + x2 + x3 = = = = = = =

x 4 + x 5 + x6 x 7 + x 8 + x9 x 1 + x 4 + x7 x 2 + x 5 + x8 x 3 + x 6 + x9 x 1 + x 5 + x9 x 3 + x 5 + x7

Eine Lösung bestimmt ein Zahlenquadrat, bei welchem die Summen der Zahlen in den Zeilen, Spalten und Diagonalen alle den gleichen Wert haben (Fig. 1).

................................................................................ .. ... .. x .... .. 2 ... x3 ........... S ... x.1 .... . . . . . . . . .. ......................................................................................... . . ... x .... ... x ........... ... 4 ... x5 .... S . 6 ..... . ... ... .... ... ..... ... .. ................................................................. .. x7 .... . .... ........... S ..... . ... x.8 .... x.9 ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. ... . ... ........ ... ..... ... . ... ... . .. ... ... .. .. S S S S S Fig. 1: Zahlenquadrat

I.4 Lineare Mannigfaltigkeiten Die doch sehr abstrakten Begriffe aus I.3 und dem vorliegenden Abschnitt I.4 werden in I.5 geometrisch interpretiert, so dass man den Zusammenhang der linearen Algebra mit der analytischen Geometrie besser erkennt. Die hier behandelten linearen Mannigfaltigkeiten sind dann nicht anderes als Geraden in der Ebene bzw. Geraden und Ebenen im Raum. Definition 1: Es sei V ein Vektorraum, a ∈ V und ferner U ein Unterraum von V . Die Menge aller Vektoren der Form a + u mit u ∈ U bezeichnet man mit a + U und nennt sie eine lineare Mannigfaltigkeit. Hat U die Dimension d, dann spricht man von einer d-dimensionalen linearen Mannigfaltigkeit. Ist a ∈ U , dann ist a + U = U , denn dann gilt a + u ∈ U f¨ ur alle u ∈ U . Ein Unterraum ist also eine spezielle lineare Mannigfaltigkeit. Beispiel 1: Die Lösungsmenge eines inhomogenen LGS ist eine lineare Mannigfaltigkeit a + U , wobei a eine spezielle Lösung des inhomogenen LGS und U der Lösungsraum des zugehörigen homogenen LGS ist.


22

Satz 1: Es sei V ein n-dimensionaler K-Vektorraum. Jede m-dimensionale lineare Mannigfaltigkeit a +U aus V lässt sich als Lösungsmenge eines LGS u ¨ber K mit n − m Gleichungen verstehen. Beweis: In V sei eine Basis B gegeben. Ferner sei {u1 , u2 , . . . , um } eine Basis von U und ⎛ ⎞ ⎛ ⎞ ui1 ⎜ ui2 ⎜ ui = ⎜ .. ⎝ . uin

⎟ ⎟ ⎟ ⎠

(i = 1, . . . , m), B

a1 ⎜ a2 ⎟ ⎜ a = ⎜ .. ⎟ ⎟ . ⎝ . ⎠ an B

Der Unterraum U sei der Lösungsraum des homogenen LGS a11 x1 + a21 x1 +

a12 x2 + . . . + a22 x2 + . . . +

a1n xn = 0 a2n xn = 0 .. .

an−m,1 x1 + an−m,2 x2 + . . . + an−m,n xn = 0 (vgl. Satz 3 in I.3) und es sei a11 a1 + a21 a1 +

a12 a2 + . . . + a22 a2 + . . . +

a1n an = a2n an = .. .

b1 b2

.

an−m,1 a1 + an−m,2 a2 + . . . + an−m,n an = bn−m Dann ist a + U die Lösungsmannigfaltigkeit des LGS a11 x1 + a21 x1 +

a12 x2 + . . . + a22 x2 + . . . +

a1n xn = a2n xn = .. .

b1 b2

.

2

an−m,1 x1 + an−m,2 x2 + . . . + an−m,n xn = bn−m Satz 2: Ist U ein Unterraum des K-Vektorraums V , dann bildet die Menge {a + U | a ∈ V } mit den Operationen (a + U ) + (b + U ) = (a + b) + U

und r(a + U ) = ra + U

f¨ ur a, b ∈ V und r ∈ K einen K-Vektorraum. Beweis: Die Operationen in {a + U | a ∈ V } sind wohldefiniert, d. h. sie f¨ uhren unabhängig von den gewählten Vertretern a, b der linearen Mannigfaltigkeiten zum gleichen Ergebnis. Ist nämlich a + U = a + U und b + U = b + U , also a − a ∈ U und b − b ∈ U , dann ist (a + b ) + U = (a + b + (a − a + b − b)) + U = (a + b) + U. Ist ferner a + U = a + U , also a − a ∈ U , dann ist


23

ra + U = (ra + r(a − a)) + U = a + U. Man rechnet leicht nach, dass die Vektorraumaxiome in {a + U | a ∈ V } erf¨ ullt sind (Aufgabe 1). 2 Definition 2: Den Vektorraum aus Satz 2 bezeichnet man mit V /U (sprich V nach U“) und nennt ihn den Quotientenraum von V nach U. ” Sind U1 , U2 zwei Unterräume des Vektorraums V , dann bildet auch die Schnittmenge U1 ∩ U2 einen Unterraum von V . F¨ ur die Vereinigungsmenge gilt das nicht: Mit u1 ∈ U1 und u2 ∈ U2 muss nicht u1 + u2 ∈ U1 ∪ U2 gelten. Der kleinste Unterraum, der U1 und U2 enthält, ist der im Folgenden definierte Unterraum U1 + U2 von V : Definition 3: F¨ ur zwei Unterräume U1 , U2 des Vektorraums V sei U1 + U2 = {u1 + u2 | u1 ∈ U1 , u2 ∈ U2 }. Offensichtlich ist U1 + U2 ein Unterraum von V , welcher U1 und U2 enthält, und es gibt keinen kleineren Unterraum von V mit dieser Eigenschaft.

3 5 1 , 7 Beispiel 2: U1 = 2 1 ur v ∈ U1 ∩ U2 gilt von IR3 . F¨ ⎛

⎞

und U2 = ⎛

⎞

⎛

2 0 1

,

0 3 1

⎞

⎛

sind Unterräume ⎞

3 5 2 0 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ v = x1 ⎝ 1 ⎠ + x2 ⎝ 1 ⎠ = y1 ⎝ 0 ⎠ + y2 ⎝ 3 ⎠ 2 1 1 1 mit x1 , x2 , y1 , y2 ∈ IR. Das homogene LGS = 0 3x1 + 5x2 − 2y1 x1 + x 2 − 3y2 = 0 2x1 + x2 − y1 − y2 = 0 hat die Lösungen x1 = 11r, x2 = r, y1 = 19r, y2 = 4r (r ∈ IR), die Vektoren in U1 ∩ U2 sind also ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 3

5

38

2

1

23

11r⎝ 1 ⎠ + r⎝ 1 ⎠ = r⎝ 12 ⎠ (r ∈ IR). Die in Beispiel 2 angegebenen erzeugenden Vektoren von U1 und U2 erzeugen gemeinsam IR3 , denn je drei von ihnen sind linear unabhängig. Also ist U1 + U2 = IR3 . Hier gilt also dim(U1 + U2 ) = dim U1 + dim U2 − dim(U1 ∩ U2 ). Dies gilt auch allgemein (Aufgabe 3).


24

Analog zur Schnittmenge zweier Unterräume kann man die Schnittmenge zweier linearer Mannigfaltigkeiten aus einem Vektorraum V betrachten. Die Schnittmenge zweier Unterräume ist nie leer, da sie mindestens den Nullvektor enthält, die Schnittmenge zweier linearer Mannigfaltigkeiten kann aber leer sein. Satz 3: Die Schnittmenge zweier linearer Mannigfaltigkeiten eines Vektorraums V ist leer oder selbst wieder eine lineare Mannigfaltigkeit von V . Beweis: Sind zwei lineare Mannigfaltigkeiten jeweils als Lösungsmenge eines LGS gegeben, dann ist ihre Schnittmenge die Lösungsmenge desjenigen LGS, das durch Zusammenf¨ ugen der beiden gegebenen LGS entsteht. 2 In Verallgemeinerung der in Definition 3 gegebenen Summe von Unterräumen könnte man auch die Summe von linearen Mannigfaltigkeiten aus einem gegebenen Vektorraum V definieren: (a + U1 ) + (b + U2 ) = (a + b) + (U1 + U2 ). Diese Summe enthält aber im Allgemeinen nicht die Summanden, es gilt also in der Regel (a + U1 ), (b + U2 ) ⊆ (a + b) + (U1 + U2 ). Denn aus a + U1 ⊆ (a + b) + (U1 + U2 ) folgt U1 ⊆ b + (U1 + U2 ) und daraus b ∈ U1 + U2 (wegen o ∈ b + (U1 + U2 )), was aber nicht der Fall sein muss. Definition 4: Es seien U1 , U2 Unterräume eines Vektorraums V und a, b ∈ V . Die kleinste lineare Mannigfaltigkeit, welche (a + U1 ) und (b + U2 ) enthält, nennt man die lineare H¨ ulle der beiden Mannigfaltigkeiten und bezeichnet sie mit (a + U1 ) ∨ (b + U2 ). Satz 4: F¨ ur Unterräume U1 , U2 eines Vektorraums V und a, b ∈ V gilt (a + U1 ) ∨ (b + U2 ) = a + ( b − a + U1 + U2 .) Beweis: F¨ ur u1 ∈ U1 , u2 ∈ U2 gilt a + u1 = a + o + u1 + o ∈ a + ( b − a + U1 + U2 ), b + u2 = a + (b − a) + o + u2 ∈ a + ( b − a + U1 + U2 ), also a + U1 , b + U2 ⊆ a + ( b − a + U1 + U2 ). Ist umgekehrt (a + U1 ) ∨ (b + U2 ) = c + W , dann ist und b − c + U2 ⊆ W, also a − c, b − c ∈ W und damit b − a ∈ W , also auch b − a ⊆ W. Weil auch 2 U1 , U2 ⊆ W gilt, ist insgesamt b − a + U1 + U2 ⊆ W . a − c + U1 ⊆ W

Ist {a, b} linear abhängig, dann ist (a + U1 ) ∨ (b + U2 ) der Unterraum a + U1 + U2 (Aufgabe 6).


25

Beispiel 3: Im IR3 kann man a + u und b + v mit u, v = o als Geraden deuten (vgl. I.5). Die lineare H¨ ulle a + ( b − a + u + v ) ist dann • IR3 , falls {b − a, u, v } linear unabhängig ist, • die Ebene a + u, v , falls {u, v } linear unabhängig und b − a ∈ u, v ist (Ebene durch zwei sich schneidende Geraden), • die Ebene a + b − a, v , falls {u, v } linear abhängig und {b − a, v } linear unabhängig ist (Ebene durch parallele Geraden), • die Gerade a + u, falls {u, v } linear abhängig und b − a ∈ u ist. In I.5 werden diese geometrischen Aspekte weiter behandelt.

Aufgaben 1. Man zeige, dass in V /U (vgl. Satz 2) die Vektorraumaxiome erfüllt sind. 2.

⎛ ⎞ ⎛ 0 1 ⎜ 0 ⎟ ⎜ 1 ⎜ ⎜ ⎟ Es sei U = ⎝ 2 ⎠, ⎝ 3 2 1

⎞ ⎛ ⎞ 3 ⎟ ⎜ −1 ⎟ ⎟ und ⎟ a=⎜ ⎠ ⎝ 5 ⎠. 7

Man stelle a + U als Lösungsmannigfaltigkeit eines LGS dar.

3. Man zeige, dass für alle Unterräume U1 , U2 eines endlichdimensionalen Vektorraus V gilt: dim(U1 + U2 ) = dim U1 + dim U2 − dim(U1 ∩ U2 )

4. Man zeige, dass die Schnittmenge zweier verschiedener 2-dimensionaler linearer Mannigfaltigkeiten aus IR3 entweder leer oder eine eindimensionale lineare Mannigfaltigkeit ist.

5. Man zeige, dass für a, b, c, u, v ∈ V genau dann (a + u) ∨ (b + v ) = c + u, v gilt, wenn (a + u) ∩ (b + v ) = ∅ ist.

6. Man beweise: Ist {a, b} linear abhängig, dann ist (a + U1 ) ∨ (b + U2 ) der Unterraum a + U1 + U2 .


26

I.5 Geometrische Interpretation In einem ebenen Koordinatensystem, das wir uns ohne Beschränkung der Allgemeinheit als ein kartesisches Koordinatensystem vorstellen d¨ urfen, kann man 3 jeden Punkt (p1 , p2 ) durch seinen Ortsvektor x2 a

−→

OP = p =

p1 p2

darstellen und so dem Punktraum“, der aus ” allen Zahlenpaaren besteht, die Vektorraumstruktur von IR2 aufprägen. Allgemeiner ordnet man einem Punktepaar A(a1 , a2 ), B(b1 , b2 ) den Vektor

−→ b1 − a1 AB= = b − a b2 − a2

.

....

....... B @ a + b

I b @

@............... b b − a

@ 3A a

6

O

x1

Fig. 1: Vektorpfeile

zu. Vektoren stellt man bildlich als Pfeile ( Vektorpfeile“) dar, wobei alle gleich ” langen und gleich gerichteten Pfeile den gleichen Vektor darstellen (Fig. 1). So wird es möglich, geometrische Sachverhalte in der Ebene mit Hilfe von Vektoren aus IR2 zu beschreiben. Ist u = o, dann ist die Menge aller Punkte mit den Ortsvektoren x = p + tu (t ∈ IR) die Gerade durch den Punkt P (mit dem Ortsvektor p) und dem Richtungsvektor u (Fig. 2). Diese Gerade ist also die eindimensionale lineare Mannigfaltigkeit p + u aus IR2 . In gleicher Weise kann man in einem räumlichen Koordinatensystem geometrische Sachverhalte mit Hilfe von Vektoren aus IR3 beschreiben. Ist p ∈ IR3 und U ein Unterraum von IR3 , dann ist p + U eine Gerade durch den Punkt P (mit dem Ortsvektor p) oder eine Ebene durch den Punkt P , wenn U die Dimension 1 oder 2 hat. Im ersten Fall Ist U = u mit u = o und u heißt der Richtungsvektor der Geraden, im zweiten Fall ist U = u, v , wobei {u, v } linear unabhängig ist, und u, v heißen Spannvektoren der Ebene (Fig. 3).

x2

6

........ u. : ................g ...... .. . . Pt . . . . . . . . . . . . ............. ................ p

O

-

x1

Fig. 2: Geradengleichung

x3

.......... ........ ......... . . . . . . . ..... ........v. ..... * ........ . . . . . . . P . . E ...... . . . t . . . ..... . . .......... . . . . . @ . ...... ........ ..... u @ R............. @ ..... . . . ...... ........... O ....... x2 x1 6

Fig. 3: Ebenengleichung

I.5 Geometrische Interpretation

27

Die Berechnung des Schnittpunkts zweier Geraden, des Durchstoßpunktes einer Geraden durch eine Ebene oder der Schnittgeraden zweier Ebenen bedeutet nun die Bestimmung der Schnittmengen zweier linearer Mannigfaltigkeiten. Die Berechnung einer Ebene durch zwei Geraden oder einer Ebene durch einen Punkt und eine Gerade bedeutet die Bestimmung der linearen H¨ ulle zweier linearer Mannigfaltigkeiten. In den folgenden Beispielen sind p, p + u, p + u, v lineare Mannigfaltigkeiten der Dimension 0 bzw. 1 bzw. 2 aus IR3 . Beispiel 1 (Durchstoßpunkt einer Geraden durch eine Ebene): Es soll der Schnittpunkt der Geraden g und der Ebene E bestimmt werden:

⎞ ⎞ ⎛ ⎞ ⎞ ⎛ ⎛ ⎞ ⎛ 1 2 −1 2 1 g : ⎝ 2 ⎠ + ⎝ −1 ⎠ , E : ⎝ 1 ⎠ + ⎝ 0 ⎠ , ⎝ −1 ⎠ . 1 1 3 1 5 ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 2 1 1 2 −1 Dazu muss man die Gleichung ⎝ 2 ⎠ + r⎝ −1 ⎠ = ⎝ 1 ⎠ + s⎝ 0 ⎠ + t ⎝ −1 ⎠ 1 1 5 1 3 ⎧ ⎫ ⎪ ⎨ 2 + r = 1 + 2s − t ⎪ ⎬ 1 1 4 bzw. das LGS ⎪ 2 − r = 1 − t lösen: r = − , s = − , t = − ⎪ 3 3 3 ⎩ ⎭ ⎛

1 + r = 5 + s + 3t

⎛ ⎞ ⎛ ⎞ ⎞ 1 5 2 1 1 Der Durchstoßpunkt hat den Ortsvektor ⎝ 2 ⎠ − ⎝ −1 ⎠ = ⎝ 7 ⎠ , welcher 3 3 ⎛1 ⎞ ⎛ 1 ⎞ ⎛2 ⎞ ⎛ ⎞ 2 −1 5 1 4 1 1 sich nat¨ urlich auch in der Form ⎝ 1 ⎠ − ⎝ 0 ⎠ − ⎝ −1 ⎠ = ⎝ 7 ⎠ ergibt. 3 3 3 1 3 2 5 ⎛

Beispiel 2 (Schnittgerade zweier Ebenen): Es soll die Schnittgerade der Ebenen E1 und E2 bestimmt werden: ⎞ ⎞ ⎛ ⎞ ⎛ 1 1 1 E1 : ⎝ 0 ⎠ + ⎝ 0 ⎠ , ⎝ 1 ⎠ , 0 0 3 ⎛

⎞ ⎛ ⎞ ⎞ ⎛ 0 2 2 E2 : ⎝ 3 ⎠ + ⎝ 1 ⎠ , ⎝ 0 ⎠ . 1 1 2 ⎛

Dazu muss man die Gleichung ⎛

⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 1 1 2 0 2 ⎝ 0 ⎠ + r ⎝ 0 ⎠ + s⎝ 1 ⎠ = ⎝ 3 ⎠ + t⎝ 1 ⎠ + u⎝ 0 ⎠ 3 0 0 2 1 1 ⎧ ⎫ ⎪ ⎪ ⎨ 1 + r + s = 2 + 2u ⎬

s = 3+t lösen: t = 1 − u, s = 4 − u, ⎪ 3 = 2+t+u ⎭ r = −3 − 3u. Die Schnittgerade ist also die lineare Mannigfaltigkeit bzw. das LGS ⎪ ⎩ ⎛

⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 2 2 2 2 0 0 ⎝ 3 ⎠ + ⎝ 1 ⎠ + ⎝ 0 ⎠ − ⎝ 1 ⎠ =⎝ 4 ⎠ + ⎝ −1 ⎠ . 2 1 1 1 3 0


28

Beispiel 3 (Ebene durch Punkt und Gerade): Die lineare H¨ ulle von p = p + o (Punkt) und q + u mit u = o (Gerade) ist p + q − p, u (Ebene), falls q − p ∈ u (falls also der Punkt nicht auf der Geraden liegt). Beispielsweise ist ⎛

⎞ ⎛⎛ ⎞ ⎛ ⎞⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 3 5 1 3 2 1 ⎝ −1 ⎠ ∨ ⎝⎝ 9 ⎠ + ⎝ −1 ⎠ ⎠ = ⎝ −1 ⎠ + ⎝ 10 ⎠ , ⎝ −1 ⎠ . 2 7 4 2 5 4

Aufgaben 1. Man zeige in Ergänzung zu Beispiel 3, dass der dort angegebene Punkt nicht auf der angegebenen Geraden liegt.

2. Es seien zwei Geraden p + u und q + v in IR3 gegeben. Man zeige: (p + u) ∩ (q + v ) = ∅ ⇐⇒ (p + u) ∨ (q + v ) = IR3 (Im vorliegenden Fall nennt man die Geraden windschief.)

3. a) Auf zwei windschiefen Geraden (vgl. Aufgabe 2) seien jeweils zwei verschiedene Punkte A, B bzw. C, D gegeben. Man zeige, dass dann auch die Geraden durch A, C und durch B, D windschief sind. b) Besitzt das Viereck mit den Ecken A(1, 2, −1), B(5, −3, 0), C(0, 4, 1), D(1, 0, 1) einen Diagonalenschnittpunkt?

I.6 Konvexe Mengen Sind zwei Punkte A, B durch ihre Ortsvektoren a, b gegeben, dann beschreiben die Ortsvektoren

A ..u........ .......... .......... P . .......................... a ... . .......... B . . . . . ... ...u ....... . * . . . . . . . . ... ... ... b .

ra + sb mit r, s ≥ 0 und r + s = 1 die Punkte der Strecke AB (Fig. 1), denn ra + sb = (1 − s)a + sb = a + s(b − a). Jedem Zahlenpaar (r, s) mit r, s ≥ 0 und r + s = 1 ist eindeutig ein Punkt P der Strecke AB zugeordnet und umgekehrt bestimmt ein Punkt der Strecke eindeutig ein solches Zahlenpaar.

u

O Fig. 1: Strecke AB

I.6 Konvexe Mengen

29

Sind drei Punkte A, B, C durch ihre Ortsvektoren a, b, c gegeben, dann beschreiben die Ortsvektoren ra + sb + tc mit r, s, t ≥ 0 und r + s + t = 1 die Punkte der Dreiecksfläche ABC (Fig. 2), denn ra + sb + tc = (1 − s − t)a + sb + tc = a + s(b − a) + t(c − a). F¨ ur r = 0 ergeben sich die Punkte der Seite BC, f¨ ur s = 0 bzw. t = 0 die der Seite AC bzw. AB. Ein Punkt der Dreiecksfläche und das Zahlentripel (r, s, t) mit obigen Eigenschaften bestimmen sich gegenseitig eindeutig. C ...u.... . .. AK .......... .. . A ............ ....... ...u................ A ...... A @ I .....A.................................. ........u @ A @

A

B A c a@ A b @A @Au

@

Fig. 2: Dreieck ABC

C ...u.....................................u D . ... .. AK.......... .. .. .. .. 6 . .. . . ..A.. .. .............. .... ....... ... ...u........... . A ..... .. ........ I .......A..................................... A @ ..........u @ A @ A d B @ A c a@ A b @A @Au

Fig. 3: Tetraeder ABCD

Sind vier Punkte A, B, C, D im Raum durch ihre Ortsvektoren a, b, c, d gegeben, dann beschreiben die Ortsvektoren ra + sb + tc + uc mit r, s, t, u ≥ 0 und r + s + t + u = 1 die Punkte eines Tetraeders ABCD (Fig. 3), denn a). ra +sb+tc +ud = (1−s−t−u)a +sb+tc +ud = a +s(b−a)+t(c −a)+u(d− F¨ ur r = 0 ergeben sich die Punkte der Dreiecksfläche BCD, f¨ ur r = s = 0 die Punkte der Strecke CD. Definition 1: Eine Punktmenge M heißt konvex, wenn f¨ ur alle P, Q ∈ M auch die Punkte der Strecke P Q zu M gehören. Die Strecke AB, die Dreiecksfläche ABC und das Tetraeder ABCD sind Beispiele f¨ ur konvexe Punktmengen. Geraden, Halbgeraden, Ebenen und Halbebenen sind ebenfalls Beispiele f¨ ur konvexe Punktmengen. Satz 1: Die Schnittmenge von konvexen Mengen ist wieder konvex. Beweis: Sind M1 , M2 konvexe Mengen, dann gilt f¨ ur P, Q ∈ M1 ∩ M2 sowohl P Q ⊆ M1 als auch P Q ⊆ M2 , also P Q ⊆ M1 ∩ M2 . 2


30

Definition 2: F¨ ur a1 , a2 , . . . , ak ∈ IRn nennt man die Linearkombination r1a1 + r2a2 + . . . + rkak

mit r1 , r2 , . . . , rk ≥ 0 und r1 + r2 + . . . + rn = 1

eine Konvexkombination von a1 , a2 , . . . , ak . Die Menge aller Konvexkombinationen von a1 , a2 , . . . , ak nennt man die konvexe H¨ ulle der Menge dieser Vektoren. F¨ ur k Punkte mit den Ortsvektoren a1 , a2 , . . . , ak nennt man die Menge der Punkte mit Ortsvektoren aus der konvexen H¨ ulle von a1 , a2 , . . . , ak die konvexe H¨ ulle dieser Punktmenge. Satz 2: Die konvexe H¨ ulle einer endlichen Menge von Punkten aus IRn ist konvex. Beweis: Es gilt r(r1a1 + r2a2 + . . . + rkak ) + s(s1a1 + s2a2 + . . . + skak ) = (rr1 + ss1 )a + (rr2 + ss2 )a + . . . + (rrk + ssk )ak . Aus r, s, ri , si ≥ 0 folgt rri + ssi ≥ 0 (i = 1, 2, . . . , k), und aus r + s = 1 und r1 + r2 + . . . + rk = s1 + s2 + . . . + sk = 1 folgt (rr1 + ss2 ) + (rr2 + ss2 ) + . . . + (rrk + ssk ) = r(r1 + r2 + . . . + rk ) + s(s1 + s2 + . . . + sk ) = r · 1 + s · 1 = 1.

2

Die konvexe H¨ ulle von k Punkten der Ebene ist ein konvexes Polygon mit k Ecken. Die konvexe H¨ ulle von k Punkten im Raum ist ein konvexes Polyeder mit k Ecken. Dabei können Ecken auch entartet“ sein, wenn sie z.B. auf der Verbindungsstre” cke zweier Nachbarecken liegen. Die konvexe H¨ ulle von k Punkten des IRn mit den Ortsvektoren a1 , a2 , . . . , ak nennt man einen (k − 1)-dimensionalen Simplex, wenn {a2 − a1 , a3 − a1 , . . . , ak − a1 } linear unabhängig ist. Simplexe im Raum sind Strecken, Dreiecksflächen und Tetraederkörper. Der Simplexbegriff ist f¨ ur die lineare Optimierung (Kapitel VIII) von Bedeutung (Simplexmethode). Dort untersucht man Simplexe bzw. allgemeiner konvexe k-dimensionale Polyeder, die sich als Lösungsmenge linearer Ungleichungssysteme ergeben. Satz 3: Die Lösungsmenge des linearen Ungleichungssystems a11 x1 + a12 x2 + . . . + a1n xn a21 x1 + a22 x2 + . . . + a2n xn

≤ b1 ≤ b2 .. .

am1 x1 + am2 x2 + . . . + amn xn ≤ bm bildet eine konvexe Teilmenge von IRn . Beweis: Die Lösungsmenge des Ungleichungssystems ist die Schnittmenge der Lösungsmengen der einzelnen Gleichungen. Nach Satz 1 muss also nur gezeigt werden, dass die Lösungsmenge einer einzelnen Ungleichung konvex ist. Dies folgt f¨ ur zwei Lösungen x, y aus

I.6 Konvexe Mengen

31

a1 (rx1 + sy1 ) + a2 (rx2 + sy2 ) + . . . + an (rxn + syn ) = r(a1 x1 + a2 x2 + . . . + an rn ) + s(a1 x1 + a2 x2 + . . . + an rn ) ≤ (r + s)b = b, falls r, s ≥ 0 und r + s = 1.

2

Satz 3 gilt nat¨ urlich auch, wenn statt der ≤ -Zeichen bei einigen oder allen der Ungleichungen ≥, =, < oder > steht. Beispiel 1: Die Lösungsmenge des Ungleichungssystems 3x1 x1 4x1 x1 x1

+ − − + −

2x2 4x2 3x2 6x2 x2

≥ 14 ≤ 0 ≤ 26 ≤ 47 ≥ −2

kann in der Ebene als Schnittmenge von f¨ unf Halbebenen gedeutet werden. Die Lösungsmenge bildet ein F¨ unfeck (Fig. 4).

x2 ... ... 6 .... ... .. .... ......................q.tq........... ... . q . q q . q q . . q . q . q q . q q . . q . ... . q . . q q . q q . q . q q . q . . . q q.q.q..........q.qqqqq.q.qq.q.q..qq.q.q.q.q.qq.q.q..... . ... ... .q.qq.q..q.qq..q.q..q.........................................q..qqq..qq..q..q..qqqq..qq.qqq.qq.t................... ... q.q.qq.q.q.............................q.qq ...q.q.q...................... . ...qqq ...qt.qq.q.q.qq..q...................................................q.q.q.qqq . . . .. q.q.q.qq.............................q.q.qq.q..................... .... qq.q.q...................qq.q.q...qq..q.qq.tq..q. . . . q.qq........q.q.q.qq.q.q.qqq.qqqqqqqq .. .. .... ..............q.qt..q.q.qq.q.qqqq ...... ... .. ...... x1 .. ...... Fig. 4: Zu Beispiel 1

Aufgaben 1. Es seien A, B, C, D Punkte der Ebene mit den Ortsvektoren a, b, c, d. Welche geometrische Bedeutung haben die Punkte mit den Ortsvektoren 1 1 a + b, 2 2

1 1 1 a + b + c, 3 3 3

1 1 1 1 a + b + c + d ? 4 4 4 4

2. In der Ebene sei ein konvexes Viereck ABCD durch die Ortsvektoren der Ecken gegeben. Man zeige, dass die Darstellung des Ortsvektors eines Punktes der Vierecksfläche als Konvexkombination der Ortsvektoren der Ecken i. Allg. nicht eindeutig ist.

3. Man beschreibe die Vierecksfläche mit den Ecken A(1, 1), B(7, 2), C(5, 5), D(2, 6) als Lösungsmenge eines Ungleichungssystems.

4. Man zeige, dass die Punkte (x1 , x2 , x3 ) mit x1 , x2 , x3 ≥ 0 und x1 + x2 + x3 x3 2x1 + x2 − x3 3x1 − x2 + x3

≤ 12 ≤ 2 ≤ 7 ≤ 5

einen Polyederkörper beschreiben und berechne dessen Ecken.

II Lineare Abbildungen II.1 Lineare Abbildungen und Matrizen Definition 1: Sind V, W zwei K-Vektorräume, dann nennt man eine Abbildung α : V −→ W mit α(v1 + v2 ) = α(v1 ) + α(v2 ) und α(rv ) = rα(v ) f¨ ur alle v1 , v2 ∈ V bzw. alle v ∈ V, r ∈ K eine lineare Abbildung oder einen Vektorraumhomomorphismus oder kurz Homomorphismus von V in W . Ist die Abbildung bijektiv (umkehrbar), ist also jedes Element von W Bild von genau einem Element von V , dann nennt man sie einen Vektorraumisomorphismus oder kurz einen Isomorphismus. Existiert ein Isomorphismus α : V −→ W , dann nennt man die Vektorräume isomorph. Ist bei der Abbildung α : V −→ W dem Element v ∈ V das Element w ∈W zugeordnet, so schreibt man α(v ) = w oder α : v → w. Oft bezeichnet man das Bildelement von v einfach mit v , wenn klar ist, um welche Abbildung es sich handelt. Beispiel 1: Die konvergenten Folgen reeller Zahlen, welche wir in Kapitel IX ausf¨ uhrlich behandeln, bilden einen (unendlichdimensionalen) IR-Vektorraum. Mit lim(an ) bezeichnen wir den Grenzwert der Folge (an ). Wegen lim((an ) + (bn )) = lim(an + bn ) = lim(an )+ lim(bn ), lim r(an ) = lim(ran ) = r lim(an ) (r ∈ IR) ist lim eine lineare Abbildung des IR-Vektorraums der konvergenten Folgen in den (eindimensionalen) IR-Vektorraum IR. Beispiel 2: Durch die Abbildungsgleichungen x1 = 2x1 − 3x2 , x2 = 4x1 + 7x2 , x3 = 3x1 − 9x2 ist eine lineare Abbildung (x1 , x2 ) → (x1 , x2 , x3 ) des IR-Vektorraums IR2 in den IR-Vektorraum IR3 gegeben. Dabei ist beispielsweise (4, 1) → (5, 23, 3). Zur Vorbereitung des nächsten Beispiels wollen wir die Anwendung einer Matrix A = (aij )m,n aus K m,n auf einen Vektor b ∈ K n definieren, was man auch die Multiplikation der Matrix A mit dem Vektor b nennt. Man definiert das Produkt A b durch ⎛ ⎜ ⎜

A b = ⎜ ⎜ ⎝

a11 a21 .. .

a12 a22 .. .

. . . a1n . . . a2n .. .

am1 am2 . . . amn

⎞⎛

⎞

⎛

b1 a11 b1 + a12 b2 + . . . + a1n bn ⎟⎜ ⎟ ⎜ ⎟ ⎜ b2 ⎟ ⎜ a21 b1 + a22 b2 + . . . + a2n bn ⎟⎜ . ⎟ = ⎜ .. ⎟⎜ . ⎟ ⎜ ⎠⎝ . ⎠ ⎝ . bn

am1 b1 + am2 b2 + . . . + amn bn

⎞ ⎟ ⎟ ⎟. ⎟ ⎠

II.1 Lineare Abbildungen und Matrizen

33

Die i-te Koordinate des Vektors A b ist also das Produkt der i-ten Zeile von A mit dem Vektor b in folgendem Sinn: ⎛

(ai1 ai2

⎜ ⎜ . . . ain ) ⎜ ⎜ ⎝

b1 b2 .. .

⎞

⎟ ⎟ ⎟ = ai1 b1 + ai2 b2 + . . . + ain bn ⎟ ⎠

(i = 1, 2, . . . , m)

bn Wir werden k¨ unftig f¨ ur größere Summen das Summenzeichen Σ benutzen, also etwa statt ai1 b1 + ai2 b2 + . . . + ain bn k¨ urzer

n

j=1

aij bj schreiben.

Beispiel 3: Ist A = (aij )m,n eine Matrix aus K m,n , dann ist x → Ax eine lineare Abbildung von K n in K m , denn A(x + y ) = Ax + Ay und A(rx) = rAx f¨ ur alle x, y ∈ K n und alle r ∈ K. Jede lineare Abbildung von K n in K m lässt sich auch so darstellen; wählt man in K n und K m jeweils die Standardbasis, dann sind die Spalten der Matrix die Bilder der Basisvektoren von K n : ⎛ ⎜ ⎜

Aej = ⎜ ⎜ ⎝

a1j a2j .. .

⎞ ⎟ ⎟ ⎟ ⎟ ⎠

(j = 1, 2, . . . , n)

amj Satz 1: Endlich-erzeugte K-Vektorräume gleicher Dimension sind isomorph. Beweis: Sind {a1 , a2 , . . . , an } und {b1 , b2 , . . . , bn } Basen der n-dimensionalen K-Vektorräume V bzw. W , dann wird durch die Zuordnung offensichtlich ein Isomorphismus von V auf W definiert.

n i=1

riai →

n i=1

ribi 2

Wir haben hier f¨ ur eine Summe von Vektoren wie beim Rechnen mit Zahlen das n Summenzeichen Σ benutzt; es ist also

i=1

riai = r1a1 + r2a2 + . . . + rnan .

Eine Folge von Satz 1 ist, dass alle n-dimensionalen K-Vektorräume isomorph zum Vektorraum K n sind, dass es also bis auf Isomorphie nur einen einzigen n-dimensionalen K- Vektorraum gibt. Ist V ein K-Vektorraum mit der Basis B = {b1 , b2 , . . . , bn }, dann ist durch die Zuordnung ⎛ ⎞ r1 n ⎜ r2 ⎟ ⎟ v = ribi → ⎜ ⎝ ... ⎠ i=1 rn B ein Isomorphismus von V auf K n definiert. Den Vektor aus K n haben wir schon fr¨ uher Koordinatenvektor von v bez¨ uglich der Basis B genannt. Den Index B“ ” lässt man fort, wenn klar ist, auf welche Basis sich der Koordinatenvektor bezieht. Die Elemente r1 , r2 , . . . , rn sind die Koordinaten, die Vektoren r1b1 , r2b2 , . . . , rnbn die Komponenten von v bez¨ uglich der Basis B.

II Lineare Abbildungen

34

Im Folgenden benötigen wir den Begriff der injektiven Abbildung und der surjektiven Abbildung: Eine Abbildung der Menge A in die Menge B heißt injektiv, wenn verschiedene Elemente aus A stets auch verschiedene Bilder in B haben. Sie heißt surjektiv, wenn jedes Element von B als Bild eines Elementes von A auftritt; man spricht dann von einer Abbildung von A auf B. Eine Abbildung, die injektiv und surjektiv ist, nennt man bijektiv; eine solche Abbildung besitzt eine Umkehrabbildung, weshalb man sie statt bijektiv auch umkehrbar nennt. Den Begriff der Bijektivität haben wir schon zu Beginn des Abschnitts verwendet. Wählt man in V statt der Basis B = {b1 , b2 , . . . , bn } die Basis C = {c1 , c2 , . . . , cn }, dann wird der Vektor v mit n

ribi = v =

n

⎛

sici

⎞

s1 ⎜ s2 ⎟ ⎟ auf das n-Tupel mit den Koordinaten s1 , s2 , . . . , sn abgebildet, also auf ⎜ ⎝ ... ⎠ . sn C i=1

i=1

Eine bijektive lineare Abbildung α von V auf sich bewirkt einen Basiswechsel: Die Basis B = {b1 , b2 , . . . , bn } wird auf die Basis C = {c1 , c2 , . . . , cn } abgebildet, wobei ci = α(bi ) (i = 1, 2, . . . , n). Wir wollen untersuchen, wie dabei die Koordinatenvektoren von v ∈ V bez¨ uglich B und bez¨ uglich C aufeinander abgebildet werden. Ist ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ t11 t12 t1n ⎜ t21 ⎟ ⎜ t22 ⎟ ⎜ t2n ⎟ ⎟ ⎟ ⎟ c1 = ⎜ c2 = ⎜ cn = ⎜ ⎝ ... ⎠ , ⎝ ... ⎠ , . . . , ⎝ ... ⎠ tn1 B tn2 B tnn B und ⎛ ⎞ ⎛ ⎞ r1 s1 ⎜ r2 ⎟ ⎜ s2 ⎟ ⎜ . ⎟ = ⎜ v = ⎝ .. ⎟ , ⎝ .. ⎠ . ⎠ rn B sn C dann ist ⎛

⎞

⎛

s1 n n ⎜ s2 ⎟ ⎜ ⎜ . ⎟ = sjcj = sj ⎜ ⎝ .. ⎠ ⎝ j=1 j=1 sn C also

⎛

⎞

⎛

t1j t2j .. . tnj

⎞

⎛⎛

⎞⎛

⎞⎞

t11 t12 . . . t1n s1 ⎟ ⎜⎜ t21 t22 . . . t2n ⎟ ⎜ s2 ⎟⎟ ⎟ = ⎜⎜ . ⎜ . ⎟⎟ , .. .. ⎟ ⎠ ⎝⎝ .. . . ⎠ ⎝ .. ⎠⎠ sn tn1 tn2 . . . tnn B B ⎞⎛

t11 t12 . . . t1n r1 ⎜ r2 ⎟ ⎜ t21 t22 . . . t2n ⎟ ⎜ ⎜ . ⎟=⎜ . ⎜ .. .. ⎟ ⎝ .. ⎠ ⎝ .. . . ⎠⎝ rn tn1 tn2 . . . tnn

⎞

s1 s2 ⎟ . .. ⎟ . ⎠ sn

Die Spaltenvektoren der quadratischen Matrix (tij ), welche die Koordinatenvektoren bez¨ uglich der Basis C auf die Koordinatenvektoren bez¨ uglich der Basis B abbildet, sind also die Koordinatenvektoren von c1 , c2 , . . . , cn bez¨ uglich B.


35

Wir betrachten nun allgemeiner eine lineare Abbildung α des n-dimensionalen K- Vektorraums V mit der Basis {v1 , v2 , . . . , vn } in den m-dimensionalen K-Vektorraum W mit der Basis {w 1, w 2, . . . , w m }. Diese ist eindeutig bestimmt, wenn die Bilder der Basisvektoren von V bestimmt sind: Ist α(vj ) =

m i=1

α(x) =

aij w i (j = 1, 2, . . . , n), dann gilt f¨ ur x =

n j=1

⎧ ⎪ ⎪ ⎪ ⎪ ⎨

xj α(vj ) =

⎪ ⎪ ⎪ ⎪ ⎩

+ .. .

n j=1

xj vj ∈ V :

(a11 x1 + a12 x2 + . . . + a1n xn ) w 1 (a21 x1 + a22 x2 + . . . + a2n xn ) w 2

+ (am1 x1 + am2 x2 + . . . + amn xn ) w m

Die lineare Abbildung α wird also durch die m, n-Matrix A = (aij )m,n vermittelt, welche dem Koordinatenvektor x eines Vektors aus V den Koordinatenvektor y = Ax seines Bildvektors in W zuordnet. Die Matrix A hängt nat¨ urlich davon ab, welche Basen in V und W gegeben sind. Definition 2: Es sei α : V −→ W eine lineare Abbildung des K-Vektorraums V in den K-Vektorraum W . Die Menge alle v ∈ V , welche auf den Nullvektor o von W abgebildet werden, nennt man den Kern von α. Beispiel 2: Eine lineare Abbildung von K n in K m werde durch die Matrix A ∈ K m,n gegeben. Der Kern dieser Abbildung ist dann der Lösungsraum des homogenen LGS Ax = o. Satz 2: Der Kern der linearen Abbildung α : V −→ W ist ein Unterraum von V . Beweis: Mit α(v1 ) = α(v2 ) = o ist auch α(v1 + v2 ) = o, und mit α(v ) = o ist auch α(rv ) = o f¨ ur alle r ∈ K. 2 Satz 3: a) Ist U ein Unterraum von V , dann gibt es eine surjektive lineare Abbildung von V auf den Quotientenraum V /U . b) Ist die lineare Abbildung α : V −→ W surjektiv und ist U der Kern von α, dann ist W isomorph zu V /U. Beweis: a) v → v + U ist eine surjektive lineare Abbildung von V auf V /U . b) Durch v +U → α(v ) ist eine lineare Abbildung von V /U auf W definiert. Diese ist injektiv (und damit ein Isomorphismus), weil aus v1 + U = v2 + U folgt, dass v1 − v2 ∈ U , also α(v1 − v2 ) = o bzw. α(v1 ) = α(v2 ). 2 Beispiel 3: Die Matrix A ∈ K m,n vermittelt eine lineare Abbildung α : x → Ax von K n in K m . Diese ist surjektiv, wenn das LGS Ax = y f¨ ur jedes y ∈ K m eine n Lösung x ∈ K besitzt. Der Kern U von α ist der Lösungsraum des homogenen LGS Ax = o. Nach Satz 3 ist dann K n /U isomorph zu K m .


36

Satz 4: a) Ist V ein endlich-dimensionaler Vektorraum und U ein Unterraum von V , dann gilt dim V /U = dim V − dim U . b) Ist V ein endlich-dimensionaler Vektorraum und sind U1 , U2 Unterräume von V , dann gilt dim (U1 + U2 ) = dim U1 + dim U2 − dim (U1 ∩ U2 ). Beweis: a) Es sei dim U = m und {u1 , u2 , . . . , um } eine Basis von U . Diese ergänze man durch Elemente v1 , v2 , . . . , vr ∈ V zu einer Basis von V , wobei m+r = dim V . Ist v = dann ist v + U =

r j=1

m i=1

aiui +

r j=1

bj vj ∈ V,

bj (vj + U ), also

V /U = v1 + U, v2 + U, . . . , vr + U . Die Menge {v1 + U, v2 + U, . . . , vr + U } ist linear unabhängig. Ist nämlich r j=1

dann ist

r j=1

cj (vj + U ) = o + U = U,

cj vj ∈ U , also r j=1

cj vj =

m i=1

diui

mit d1 , d2 , . . . , dm ∈ K,

was nur f¨ ur c1 = c2 = . . . = cr = d1 = d2 = . . . = dm = 0 möglich ist. Also ist dim V /U = r. b) (U1 + U2 )/U2 ist isomorph zu U1 /(U1 ∩ U2 ), denn die lineare Abbildung α : (a + b) + U2 → a + (U1 ∩ U2 ) (a ∈ U1 , b ∈ U2 ) ist bijektiv. Genau dann ist nämlich ur a, a ∗ ∈ U1 , a + (U1 ∩ U2 ) = a ∗ + (U1 ∩ U2 ) f¨ wenn a − a ∗ ∈ U2 , wenn also (a + b) + U2 = (a ∗ + b) + U2 . Daher gilt dim(U1 + U2 ) − dim U2 = dim((U1 + U2 )/U2 ) = dim(U1 /(U1 ∩ U2 )) = dim U1 − dim(U1 ∩ U2 ).

2

Definition 3: Mit Hom(V, W ) bezeichnen wir die Menge aller Homomorphismen (lineare Abbildungen) des K-Vektorraums V in den K-Vektorraum W . F¨ ur α, β ∈ Hom(V, W ) definieren wir die Summe α + β durch (α + β)(v ) = α(v ) + β(v ) (v ∈ V ) und die Vervielfachung durch (rα)(v ) = rα(v ) (v ∈ V, r ∈ K).


37

Satz 5: Mit den in Definition 3 angegeben Verkn¨ upfungen ist Hom(V, W ) ein K-Vektorraum. Beweis: F¨ ur α, β ∈ Hom(V, W ) und v1 , v2 ∈ V sowie v ∈ V, r ∈ K gilt (α + β)(v1 + v2 ) = = = (α + β)(rv ) = =

α(v1 + v2 ) + β(v1 + v2 ) α(v1 ) + α(v2 ) + β(v1 ) + β(v2 ) α(v1 ) + β(v1 ) + α(v2 ) + β(v2 ) = (α + β)(v1 ) + (α + β)(v2 ), α(rv ) + β(rv ) rα(v ) + rβ(v ) = r(α(v ) + β(v ) = r(α + β)(v ).

Ebenso rechnet man die Homomorphismus-Eigenschaften von rα nach.

2

Satz 6: Sind die K-Vektorrräume V, W endlich-dimensional, dann gilt dim Hom(V, W ) = dim V · dim W. 1, w 2, . . . , w n } eine Basis Beweis: Es sei {v1 , v2 , . . . , vm } eine Basis von V und {w von W . Wir definieren mn lineare Abbildungen λij ∈ Hom(V, W ) durch j und λij (vk ) = o f¨ ur k = i (i = 1, 2, . . . m, j = 1, 2, . . . , n). λij (vi ) = w F¨ ur λ ∈ Hom(V, W ) ist λ(vi ) =

n j=1

aij w j

mit ai1 , ai2 , . . . , ain ∈ K (i = 1, 2, . . . , m). Nun sei λ0 =

m

n

j=1

i=1

aij λij .

Dann ergibt sich λ0 (vk ) = λ(vk ) (k = 1, 2, . . . , m), also λ0 = λ, weil eine lineare Abbildung eindeutig durch die Bildvektoren aller Basisvektoren bestimmt ist. Also ist λ eine Linearkombination der mn linearen Abbildungen λij . Diese sind linear unabhängig: Ist

m

n

j=1

i=1

bij λij

die Nullabbildung V → o, dann ergibt

sich bei Anwendung auf vk die Beziehung und j.

n i=1

bkj w j = o, also bkj = 0 f¨ ur alle k 2

In der folgenden Definition muss man daran denken, dass der Körper K selbst ein K-Vektorraum (der Dimension 1) ist. Definition 4: Ist V ein K-Vektorraum, dann nennt man eine lineare Abbildung von V in K ein lineares Funktional. Den K-Vektorraum Hom(V, K) der linearen Funktionale auf V nennt man den zu V dualen Vektorraum.


38

Der Vektorraum Hom(V, K) der linearen Funktionale auf dem m-dimensionalen K-Vektorraum V mit der Basis {v1 , v2 , . . . , vm } hat gemäß der Konstruktion im Beweis von Satz 6 die Basis {λ11 , λ21 , . . . , λm1 }. Diese nennt man die duale Basis zur Basis {v1 , v2 , . . . , vm } von V . Wählt man f¨ ur K die Basis {1}, dann ist f¨ ur x = m i=1

ai λi1 (x) =

m i=1

m i=1

xivi ∈ V

ai x i .

Ein lineares Funktional ist als nichts anderes als eine Linearform u ¨ber K und kann als Vektor aus K n (mit den Koordinaten a1 , a2 , . . . , am ) interpretiert werden. Diese Linearform wird später im Zusammenhang mit dem Skalarprodukt in IRm eine besondere Rolle spielen. Beispiel 4: In IRm betrachten wir die Standardbasis {e1 , e2 , . . . , em }, ebenfalls im 1-dimensionalen Vektorraum IR (also {1}). Dann ist {λ1 , λ2 , . . . , λm } mit λi (ei ) = 1 und λi (ek ) = 0 f¨ ur k = i eine zu {e1 , e2 , . . . , em } duale Basis von IRm . Ist λ ∈ Hom(IRm , IR) und λ(ei ) = ai (i = 1, 2, . . . , m), dann ist λ = λ(x) =

m i=1

m

i=1

ai λi . F¨ ur x =

m

i=1

xiei ∈ IRm ist dann

ai xi . Man kann den Vektor mit den Koordinaten a1 , a2 , . . . , an also

als ein lineares Funktional deuten, welches dem Vektor mit den Koordinaten x1 , x2 , . . . , xn die Linearform a1 x1 + a2 x2 + . . . + an xn zuordnet. Definition 5: Ist U ein Unterraum von V , dann nennt man A(U ) = {λ ∈ Hom(V, K) | λ(u) = 0 f¨ ur alle u ∈ U } den Annihilator von U . Der Annihilator von U besteht im Fall V = K n also aus allen Linearformen n ai xi , welche auf U den Wert 0 haben, f¨ ur welche also i=1

n i=1

ai ui = 0 f¨ ur alle u ∈ U

gilt. Offensichtlich ist A(U ) ein Unterraum von Hom(V, K). Satz 7: Ist U ein Unterraum des endlich-dimensionalen K-Vektorraums V , dann ist dim A(U ) = dim V − dim U. Beweis: Die Restriktion der linearen Funktionale auf V auf den Unterraum U ist eine lineare Abbildung von Hom(V, K) in Hom(U, K), welche jedem linearen Funktional auf V dasjenige lineare Funktional auf U zuordnet, das nur die


39

Wirkung auf die Elemente von U beachtet. Der Kern von besteht aus allen λ ∈ Hom(V, K) mit λ(u) = 0 f¨ ur alle u ∈ U , er ist also A(U ). Wir zeigen nun, dass diese lineare Abbildung surjektiv ist. Dazu sei dim U = m und {u1 , u2 , . . . , um } eine Basis von U sowie dim V = n und {u1 , u2 , . . . , um } ∪ {v1 , v2 , . . . , vr } eine Basis von V , wobei m + r = n. F¨ ur v ∈ V ist dann v = u + u mit u ∈ U und u ∈ v1 , v2 , . . . , vr , ur μ ∈ Hom(U, K) definiere wobei u und u durch v eindeutig bestimmt sind. F¨ man λ ∈ Hom(V, K) durch λ(v ) = μ(u), die Abbildung μ ist also die Restriktion von λ auf U . Durch obige Zuordnung λ → μ ist also eine surjektive lineare Abbildung von Hom(V, K) auf Hom(U, K) mit dem Kern A(U ) gegeben. Nach Satz 3 ist Hom(V, K)/A(U ) isomorph zu Hom(U, K). Aus dim Hom(V, K) = n und dim Hom(U, K) = m folgt damit n − r = m. 2 Definition 6: Unter dem Rang einer Matrix A = (aij ) ∈ K m,n versteht man die Dimension des von den Zeilenvektoren der Matrix erzeugten Unterraums von K n , also die maximale Anzahl linear unabhängiger Zeilenvektoren von A. (Genauer spricht man vom Zeilenrang der Matrix; vgl. hierzu II.2 Satz 1.) Unter dem Rang eines homogenen LGS versteht man den Rang der Koeffizientenmatrix. ¨ Ein homogenes LGS lässt sich durch elementare Aquivalenzumformungen stets in ein LGS umformen, bei welchem die Anzahl der Gleichungen gleich dem Rang des LGS ist. Satz 8: Hat das homogene LGS mit der Matrix A = (aij ) ∈ K m,n den Rang r, dann hat sein Lösungsraum die Dimension n − r. Beweis: Man wähle in IRn die Standardbasis {e1 , e2 , . . . en }. Ihre duale Basis in Hom(IRn , IR) sei {λ1 , λ2 , . . . , λn }. F¨ ur λ ∈ Hom(IRn , IR) ist λ = x1 , x2 , . . . , xn ∈ K, also ⎛

λ⎝

n

j=1

⎞

aij ej ⎠ =

n i=1

n

i=1

xi λi mit

⎞ ⎛ n n xi λi ⎝ aij ej ⎠ = xj aij j=1

j=1

f¨ ur i = 1, 2, . . . , m, denn λj (ej ) = 1 und λi (ej ) = 0 f¨ ur j = i. Also ist (x1 , x2 , . . . , xn ) genau dann eine Lösung des homogenen LGS, wenn λ zu A(U ) gehört, wobei U der von den Zeilenvektoren der Matrix A erzeugte Unterraum von IRn ist. Der Lösungsraum des homogenen LGS hat also dieselbe Dimension wie A(U ), und diese ist n − r nach Satz 7. 2 Mit Satz 8 sind die in I.2 anschaulich begr¨ undeten Aussagen u ¨ber die Lösungsmenge eines LGS auf einem abstrakteren Niveau bewiesen.


40

Aufgaben 1. Es sei {v1 , v2 , . . . , vn } eine Basis des K- Vektorraums V , ferner sei {w 1, w 2, . . . , w n } ⊆ V . Eine Abbildung α von V in V sei definiert durch

1 + r2 w 2 + . . . + rn w n (r1 , r2 , . . . , rn ∈ K). α(r1v1 + r2v2 + . . . + rnvn ) = r1 w Man zeige, dass α ∈ Hom(V, V ). Wann ist α ein Isomorphismus?

2. Es sei V ein endlichdimensionaler K-Vektorraum und α ∈ Hom(V, V ). a) Man zeige: Ist α injektiv, dann ist α auch surjektiv (also bijektiv). b) Man zeige: Ist α surjektiv, dann ist α auch injektiv (also bijektiv).

3. Man zeige: Sind λ, μ lineare Funktionale auf dem K-Vektorraum V und folgt f¨ ur v ∈ V aus λ(v ) = 0 stets μ(v ) = 0, dann ist μ = rλ mit r ∈ K.

4. Es sei V ein endlichdimensionaler K-Vektorraum und v1 , v2 ∈ V mit v1 = v2 . Man zeige, dass ein α ∈ Hom(V, K) mit α(v1 ) = α(v2 ) existiert.

5. Man beweise: Für jeden Untervektorraum U eines Vektorraums V gilt für den Annihilator A(A(U )) = U .

6. Der K-Vektorraum V sei endlichdimensional und U1 , U2 seien Unterräume von V . Man beweise folgende Eigenschaften des Annihilators: A(U1 + U2 ) = A(U1 ) ∩ A(U2 ),

A(U1 ∩ U2 ) = A(U1 ) + A(U2 ).

II.2 Verkettung linearer Abbildungen Definition 1: U, V, W seien K-Vektorräume. Ist β ∈ Hom(U, V ) und α ∈ Hom(V, W ), dann bezeichnet man mit α ◦β die Verkettung dieser Abbildungen (gelesen α nach ” β“; Fig. 1). Dies ist also eine Abbildung aus Hom(U, W ). F¨ ur u ∈ U ist

α . β . U ................................... V ................................... W ... .. ....................................................................................................... α◦β Fig 1: Verkettung

(α ◦ β)(u) = α(β(u)). Die Verkettung ergibt wieder eine lineare Abbildung, denn (α ◦ β)(u1 + u2 ) = = (α ◦ β)(ru) = =

α(β(u1 + u2 )) = α(β(u1 )) + α(β(u2 )) (α ◦ β)(u1 ) + (α ◦ β)(u2 ) f¨ ur u1 , u2 ∈ U, α(β(ru)) = α(rβ(u)) rα(β(u)) = r(α ◦ β)(u) f¨ ur u ∈ U und r ∈ K.

II.2 Verkettung linearer Abbildungen

41

Sind die Vektorräume U, V, W endlich-dimensional und ist dim U = k,

dim V = m,

dim W = n,

dann kann man bez¨ uglich gegebener Basen von U, V, W obige Abbildungen durch Matrizen aus K n,m bzw. aus K m,k darstellen, welche die Koordinatenvektoren ineinander u uhren. ¨berf¨ Definition 2: Es sei A ∈ K n,m und B ∈ K m,k . Ist y = Bx und z = Ay , dann ist z = A(Bx) = Cx mit C ∈ K n,k . Die Matrix C nennt man das Produkt von A und B und schreibt C = AB. Wir wollen nun zeigen, wie man dieses Matrizenprodukt berechnet: Es seien {u1 , u2 , . . . , uk },

{v1 , v2 , . . . , vm },

Basen von U, V, W und es sei x =

k h=1

{w 1, w 2, . . . , w n}

xhuh ∈ U . Dann gilt f¨ ur y =

m i=1

yivi = Bx :

y1 = b11 x1 + b12 x2 + . . . + b1k xk y2 = b21 x1 + b22 x2 + . . . + b2k xk .. . ym = bm1 x1 + bm2 x2 + . . . + bmk xk F¨ ur z =

n j=1

zj w j = Ay ist dann

z1 = a11 =

k

h=1 m i=1

b1h xh + a12

a1i bi1 x1 +

k

h=1 m i=1

b2h xh + . . . + a1m

a1i bi2 x2 + . . . +

k

bmh xh h=1 m i=1

a1i bik xk

= c11 x1 + c12 x2 + . . . + c1k xk Ebenso ergibt sich f¨ ur j = 2, 3, . . . , n zj = aj1 =

k

h=1 m i=1

b1h xh + aj2

aji bi1 x1 +

k

h=1 m i=1

b2h xh + . . . + ajm

aji bj2 x2 + . . . +

k

bmh xh h=1 m i=1

aji bik xk

= cj1 x1 + cj2 x2 + . . . + cjk xk Das Element cjh der Matrix C = AB ist also das Produkt“ der j-ten Zeile von ” A mit der h-ten Spalte von B (vgl. Fig. 2). Dieses Produkt einer Zeile und einer Spalte von Elementen aus K werden wir später als Skalarprodukt“ kennenlernen. ”


42 ⎛ ⎛ ⎜ ⎝ a j1

aj2 . . . ajm

n Zeilen m Spalten

⎞

b1h b2h .. . .. . bmh

⎞⎜ ⎜ ⎜ ⎟⎜ ⎠⎜ ⎜ ⎜ ⎝

⎟ ⎛ ⎟ ⎟ ⎜ ⎟ ⎟=⎝ ⎟ ⎟ ⎠

m Zeilen k Spalten

cjh = aj1 b1h + aj2 b2h + . . . + ajm bmh

⎞

cjh

⎟ ⎠

n Zeilen k Spalten

(j = 1, 2, . . . , n, h = 1, 2, . . . , k)

Fig. 2: Matrizenmultiplikation Man beachte: Das Matrizenprodukt AB existiert nur, wenn die Anzahl der Spalten von A gleich der Anzahl der Zeilen von B ist. Weil das Verketten von Abbildungen eine assoziative Verkn¨ upfung ist, gilt dies auch f¨ ur die Multiplikation von Matrizen, d.h. es gilt (AB)C = A(BC), falls diese Produkte definiert sind. Ferner gilt (rA)B = A(rB) = r(AB) f¨ ur r ∈ K, falls das Produkt AB definiert ist. Dabei ist rA die Matrix, die aus A durch Multiplikation aller Einträge mit r entsteht, denn dann ist (rA)x = A(rx). Beispiel 1: Nebenstehend ist das Produkt AB einer 2,5Matrix A mit einer 5,3-Matrix B berechnet; es ergibt sich eine 2,3-Matrix.

A

AB

1 −1 −2

3

7 5

11

18

98

0 11 −1 6 −27

13

53

9 −3

1

0

2

In diesem Schema haben wir die runden Matrizenklammern weggelasen. Dieses u ¨bersichtliche Schema lässt sich leicht zur Berechnung von Produkten von drei und mehr Matrizen fortsetzen.

10

1

1 −1

2

4

−3

0

6 12 B

Matrizen vom gleichen Typ (gleiche Zeilenzahl und gleiche Spaltenzahl) kann man auch addieren: Sind A, B beides m, n-Matrizen, dann ist Ax + Bx = (A + B)x f¨ ur x ∈ K n , wenn man die Addition von A und B elementweise definiert, also (aij ) + (bij ) = (aij + bij ). Matrizen, deren Zeilenanzahl gleich ihrer Spaltenanzahl ist, nennt man quadratisch. Quadratische n, n-Matrizen kann man addieren und multiplizieren, wobei folgende Regeln gelten:


43

(1) (A + B) + C = A + (B + C) f¨ ur alle A, B, C ∈ K n,n (Assoziativgesetz der Addition) (2) A + B = B + A f¨ ur alle A, B ∈ K n,n (Kommutativgesetz der Addition) (3) A + O = A f¨ ur alle A ∈ K n,n , wobei O die Nullmatrix ist (Fig. 3) (Existenz eines neutralen Elements bez¨ uglich der Addition) (4) A + (−A) = O f¨ ur alle A ∈ K n,n , wobei −A = (−1)A (Invertierbarkeit bez¨ uglich der Addition) (5) (AB)C = A(BC) f¨ ur alle A, B, C ∈ K n,n (Assoziativgesetz der Multiplikation) (6) AE = EA = A f¨ ur alle A ∈ K n,n , wobei E die Einheitsmatrix ist (Fig. 3) (Existenz eines neutralen Elements bzgl. der Multiplikation) (7) A(B + C) = AB + AC; (A + B)C = AC + BC f¨ ur alle A, B, C ∈ K n,n (Distributivgesetz) ⎛ ⎜ ⎜ ⎜ O=⎜ ⎜ ⎜ ⎝

0 0 0 0 0 0 0

0 0 0 0 0 0 0

0 0 0 0 0 0 0

0 0 0 0 0 0 0

0 0 0 0 0 0 0

0 0 0 0 0 0 0

0 0 0 0 0 0 0

⎞

⎛

⎟ ⎟ ⎟ ⎟, ⎟ ⎟ ⎠

⎜ ⎜ ⎜ E=⎜ ⎜ ⎜ ⎝

1 0 0 0 0 0 0

0 1 0 0 0 0 0

0 0 1 0 0 0 0

0 0 0 1 0 0 0

0 0 0 0 1 0 0

0 0 0 0 0 1 0

0 0 0 0 0 0 1

⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠

Fig. 3: Nullmatrix und Einheitsmatrix uglich der Addition und der MultiplikatiDie Matrizen aus K n,n bilden also bez¨ on eine algebraische Struktur, welche man in der Algebra einen Ring (genauer Ring mit Einselement) nennt. Die Matrizenmultiplikation in K n,n ist (wie auch allgemein das Verketten von Abbildungen) nicht kommutativ. Beispiel 2: Es gilt

1 2 2 3

0 2 1 4

=

2 10 3 16

und

0 2 1 4

Beispiel 3: F¨ ur alle a, b, c, d ∈ IR gilt

a −b b a

c −d d c

=

ac − bd −(ad + bc) ad + bc ac − bd

1 2 2 3

=

=

c −d d c

4 6 9 14

a −b b a

.

.

In diesem Fall sind die Faktoren in dem Matrizenprodukt vertauschbar. Das Pro a −b dukt von je zwei Matrizen der betrachteten Form b a (a, b ∈ IR) ist wieder von der gleichen Form, diese Matrizen bilden also eine algebraische Struktur. Diese ist isomorph zum Körper C der komplexen Zahlen; das werden wir in II.3 noch näher darstellen.


44

In K n,n gibt es Matrizen, welche von der Nullmatrix O verschieden sind, deren Produkt aber O ergibt. Solche Matrizen (allgemein solche Elemente eines Rings) nennt man Nullteiler. Beispiel 4: Es gilt

1 0 1 0

0 0 1 1

=

0 0 0 0

.

¨ Bei Anderung der Reihenfolge sind die Faktoren aber keine Nullteiler, so dass man zwischen Rechts- und Linksnullteilern unterscheiden muss. Es gilt

0 0 1 1

1 0 1 0

=

0 0 2 0

.

Existiert zu einer Matrix A ∈ K n,n eine Matrix B ∈ K n,n mit AB = E sowie eine Matrix C ∈ K n,n mit CA = E , dann ist B = C; denn B = EB = CAB = CE = C. In diesem Fall nennt man die Matrix B bzw. C die zu A inverse Matrix und bezeichnet sie mit A−1 . Zur Nullmatrix kann keine inverse Matrix existieren, denn f¨ ur alle A ∈ K n,n ist AO = O = E. Auch zu einer von O verschiedenen Matrix existiert nicht immer eine Inverse. Beispielweise sind Nullteiler nicht invertierbar: Ist AB = O und A invertierbar, dann ist B = EB = (A−1 A)B = A−1 (AB) = A−1 O = O. Beispiel 5: Die Gleichung

1 2 2 4

x11 x12 x21 x22

=

1 0 0 1

ist gleichbedeutend mit den beiden linearen Gleichungssystemen x11 + 2x21 = 1 2x11 + 4x21 = 0

und

x12 + 2x22 = 0 , 2x12 + 4x22 = 1

und diese besitzen keine Lösung. Zwischen der Lösbarkeit linearer Gleichungssysteme und den Eigenschaften linearer Abbildungen besteht also folgender Zusammenhang: Genau dann ist die Matrix A ∈ K n,n invertierbar, wenn die lineare Abbildung x → Ax von K n in sich umkehrbar (bijektiv) ist, wenn also das Gleichungssystem Ax = a f¨ ur jedes n a ∈ K eindeutig lösbar ist. Dies ist der Fall, wenn die homogene Gleichung Ax = o nur die Lösung o hat, wenn also der Rang von A gleich der Dimension n von K n ist.

II.2 Verkettung linearer Abbildungen Die Berechnung der Inversen einer Matrix aus K n,n kann man leicht mit dem Gauß-Verfahren zum Lösen eines LGS bewerkstelligen, indem man die n durch die Matrizengleichung AX = E gegebenen Systeme simultan löst. Beispiel 6: In nebenstehendem Schema wird die Inverse von ⎛

⎞

2 1 −3 0 4 ⎟ A=⎜ ⎝ 1 ⎠ −3 −2 1 berechnet. Es ergibt sich ⎛

A−1

⎞

8 5 4 1 ⎟ = ⎜ ⎝ −13 −7 −11 ⎠ 9 −2 1 −1

45 2 1 −3 1 0 0 1 0 4 0 1 0 −3 −2 1 0 0 1 0 1 −11 1 −2 0 1 0 4 0 1 0 0 −2 13 0 3 1 1 0 4 0 1 0 0 1 −11 1 −2 0 0 0 −9 2 −1 1 9 0 36 0 9 0 0 9 −99 9 −18 0 0 0 9 −2 1 −1 9 0 0 8 5 4 0 9 0 −13 −7 −11 0 0 9 −2 1 −1

Als Rang der Matrix A ∈ K m,n haben wir die Dimension des von den Zeilenvektoren erzeugten Unterraums von K n bezeichnet. Genauer nennt man dies den Zeilenrang von A. Die Dimension des von den Spaltenvektoren erzeugten Unterraums nennt man dann den Spaltenrang von A. Ist A ∈ K n,n und hat Ax = o nur die Lösung o, dann hat A den Spaltenrang n, denn dann sind die Spaltenvektoren von A linear unabhängig. Genau dann ist also A ∈ K n,n invertierbar, wenn A den Spaltenrang n hat. Der folgende Satz besagt, dass man auch im allgemeinen Fall nicht zwischen Zeilenrang und Spaltenrang unterscheiden muss. Satz 1: F¨ ur A ∈ K m,n hat der von den m Zeilenvektoren erzeugte Unterraum von K n dieselbe Dimension wie der von den n Spaltenvektoren erzeugte Unterraum von K m ( Spaltenrang=Zeilenrang“). ” Beweis: Ist U der Lösungsraum von Ax = o (also der Kern der durch A vermittelten linearen Abbildung von K n in K m ), dann besteht der Quotientenraum K n /U aus allen linearen Mannigfaltigkeiten a + U , wobei a eine Linearkombination der Spaltenvektoren von A ist. Der Spaltenrang von A ist also die Dimension von K n /U . Es ist daher nach Satz 3 aus II.1 Spaltenrang von A = dim K n /U = dim K n − dim U = n − dim U. Andererseits ist nach Satz 8 aus II.1 dim U = n − Zeilenrang von A, woraus sich die Behauptung ergibt.

2


46

Elementare Spaltenumformungen (Multiplikation mit einem r ∈ K mit r = 0, Addition einer Spalte zu einer anderen, Vertauschung zweier Spalten) ändern also den Rang einer Matrix ebenso wenig wie elementare Zeilenumformungen. Durch elementare Zeilenunformungen kann man die Matrix auf Stufenform bringen (vgl. Stufenform eines LGS), wobei die Anzahl der von der Nullzeile verschiedenen Zeilen der Zeilenrang ist. Durch Vertauschung der Spalten, welche den Spaltenrang fest lässt, kann man die Matrix schließlich auf die spezielle Stufenform in Fig. 4 bringen, an welcher man sowohl den Spaltenrang als auch den Zeilenrang ablesen kann. ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝

= 0 0 0 0 0 0 0 0 0 0

0 = 0 0 0 0 0 0 0 0 0

0 0 = 0 0 0 0 0 0 0 0

0 0 0 = 0 0 0 0 0 0 0

0 0 0 0 = 0 0 0 0 0 0

0 0 0 0 0 = 0 0 0 0 0

∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0

∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0

∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0

∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0

∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0

∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0

∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0

∗ ∗ ∗ ∗ ∗ ∗ 0 0 0 0

⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠

Fig. 4: Spezielle Stufenform Benutzt man zum Lösen eines LGS Spaltenumformungen, so muss man daran denken, dass dabei auch die Variablen vertauscht werden! Elementare Zeilen- und Spaltenumformungen einer Matrix A kann man durch Multiplikation mit geeigneten Matrizen ausdr¨ ucken. Dies ist allgemein leicht zu begr¨ unden, wir begn¨ ugen uns aber mit Beispielen: Beispiel 7 (elementare Umformungen): F¨ ur A ∈ K 3,n bedeutet ⎛

⎞

⎛

1 0 0 ⎜ ⎟ ⎝ 0 r 0 ⎠A 0 0 1 Vervielfachung der 2. Zeile mit r F¨ ur A ∈ K n,4 bedeutet ⎛ 1 0 0 0 ⎜ 0 1 0 0 ⎜ A⎜ ⎝ 0 0 r 0 0 0 0 1

⎞

1 0 0 ⎜ ⎟ ⎝ 0 1 1 ⎠A 0 0 1 Addition der 3. zur 2. Zeile

⎞

⎛

⎟ ⎟ ⎟ ⎠

⎜ 0 A⎜ ⎜ ⎝ 0

Vervielfachung der 3. Spalte mit r

1 0 1 0 0 0

0 0 1 0

1 0 0 1

⎛

⎞

0 0 1 ⎜ ⎟ ⎝ 0 1 0 ⎠A 1 0 0 Vertauschung der 1. und 3. Zeile

⎞

⎛

⎟ ⎟ ⎟ ⎠

⎜ 0 A⎜ ⎜ ⎝ 0

Addition der 1. zur 4. Spalte

1 0 0 0 0 1

0 0 1 0

0 1 0 0

⎞ ⎟ ⎟ ⎟ ⎠

Vertauschung der 2. und 4. Spalte


47

Fasst man die von links bzw. von rechts an die gegebene Matrix A heranmultiplizierten Matrizen zu einem Produkt B bzw. C zusammen, so kann man festhalten: Ist A ∈ K m,n , dann gibt es invertierbare Matrizen B ∈ K m,m und C ∈ K n,n , so dass die Matrix BAC die in Fig. 4 beschriebene Stufenform hat. Ist A ∈ K n,n quadratisch und vom Rang n, dann ist BAC eine Diagonalmatrix. Durch weitere Vervielfachungen der Zeilen oder Spalten kann man diese zu E machen, es gibt also invertierbare Matrizen B, C ∈ K n,n mit BAC = E. Bei obigen Aussagen haben wir stillschweigend benutzt, dass das Produkt invertierbarer Matrizen aus K n,n wieder invertierbar ist. Dies ist aber selbstverständlich, denn (AB)(B −1 A−1 ) = A(BB −1 )A−1 = AEA−1 = AA−1 = E, und ebenso findet man (B −1 A−1 )(AB) = E. Also ist (AB)−1 = B −1 A−1 . Hat man zu einer Matrix A ∈ K n,n vom Rang n zwei Matrizen B, C ∈ K n,n gefunden, so dass BAC = E gilt, dann kann man formal A−1 berechnen: Aus BAC = E folgt A = B −1 C −1 , also A−1 = CB. Die konkrete Rechnung ist aber in der Praxis bei großen Matrizen sehr m¨ uhsam. Beispiel 8: Aus A ergibt sich folgendermaßen unter Beachtung der Reihenfolge der Operationen die Einheitsmatrix E: 1. 3. 4. 5. 2. 1 1 1 3 −3 0 1 1 − 31 0 1 0 0 1 −1 4 0 1 0 1 0 1 0 17 Addition der 1. zur 2. Zeile

A−1 =

−3 0 0 1

A

1 1 0 1

1. Spalte mal (−3)

Addition der 1. zur 2. Spalte

− 13 0 0 1

1 0 0 17

1. Spalte mal (− 13 )

1 1 0 1

=

1 7

1. Spalte mal 17 4 −3 1 1

F¨ ur invertierbare Matrizen aus K 2,2 rechnet man leicht nach (Aufgabe 4):

a b c d

−1

1 = ad − bc

d −b −c a

Einen Vektor aus K n kann man als eine Matrix aus K n,1 verstehen ( Spalten” vektor“). Eine Matrix aus K 1,n ( Zeilenvektor“) kann man als transponierten“ ” ” Vektor deuten, wenn man das Transponieren (hochgestelltes Symbol T ) folgendermaßen deutet: ⎛

⎞

a1 T ⎜ a2 ⎟ ⎜ . ⎟ = (a1 a2 . . . an ), ⎝ .. ⎠ an

⎛

⎞

a1 a2 ⎟ ⎜ ⎟ (a1 a2 . . . an )T = ⎜ ⎝ ... ⎠ an


48 Damit kann man die Linearformen einfacher schreiben: a1 x1 + a2 x2 + . . . + an xn = aT x

Das Transponieren einer Matrix definiert man auch im allgemeinen Fall: Definition 3: F¨ ur A ∈ K m,n versteht man unter der Matrix AT diejenige Matrix n,m aus K , die aus A durch Vertauschen der Zeilen mit den Spalten hervorgeht, bei der also das Element aij mit dem Element aji vertauscht wird. Man nennt AT die Transponierte von A. Nach Satz 1 haben die Matrizen A und AT den gleichen Rang. Beispiel 9: ⎛

1 2 5 8 1 3 4

⎜ 4 ⎜ ⎜ 7 ⎝ 0

3 6 9 2 5

⎞T ⎟ ⎟ ⎟ = ⎠

1 4 7 0 3 2 5 8 1 4 3 6 9 2 5

,

1 4 7 0 3 2 5 8 1 4 3 6 9 2 5

T

⎛

1 2 5 8 1 3 4

⎜ 4 =⎜ ⎜ 7 ⎝ 0

3 6 9 2 5

⎞ ⎟ ⎟ ⎟ ⎠

Satz 2: F¨ ur das Transponieren von Matrizen gelten die folgenden Regeln: ur alle A, B ∈ K m,n ; (1) (A + B)T = AT + B T f¨ ur alle A ∈ K m,n und r ∈ K; (2) (rA)T = rAT f¨ ur alle A ∈ K k,m und B ∈ K m,n ; (3) (AB)T = B T AT f¨ ur alle invertierbaren A ∈ K n,n . (4) (AT )−1 = (A−1 )T f¨ Beweis: Nur die Regeln (3) und (4) sind nicht unmittelbar einsichtig. Sind aT1 , aT2 , . . . , aTk ∈ K m die Zeilenvektoren von A und b1 , b2 , . . . , bn ∈ K m die Spaltenvektoren von B, dann ist AB = (aTibj )k,n . Wegen aTibj = bTj ai ergibt sich (AB)T = (bTj ai )n,k = B T AT . Ist A eine invertierbare Matrix aus K n,n , dann ist AA−1 = E = E T = (A−1 )T AT . Weil die Inverse einer Matrix eindeutig bestimmt ist, folgt (AT )−1 = (A−1 )T (vgl. Aufgabe 1). 2 Beispiel 10: Ein Homomorphismus von V = K n in W = K m sei durch die Matrix A ∈ K m,n gegeben. Ist dann aT y eine Linearform u ¨ber W und y = Ax (x ∈ V ), dann ist aT Ax = (AT a)x, also (AT a)x die zugehörige Linearform u ¨ber V . Dem Homomorphismus von V in W mit der Matrix A entspricht also der Homomorphismus von Hom(W, K) in Hom(V, K) mit der Matrix AT .


49

Aufgaben 1. a) Man zeige, dass man bei der Matrizenmultiplikation in K n,n nicht zwischen links- und rechtsneutralem Element unterscheiden muss und dass das neutrale Element eindeutig bestimmt ist. b) Man zeige, dass die inverse Matrix zu A ∈ K n,n , falls sie existiert, eindeutig bestimmt ist.

2. Eine Matrix A ∈ K n,n heißt symmetrisch, wenn AT = A gilt; sie heißt schiefsymmetrisch , wenn AT = −A gilt. Man zeige, dass man jede Matrix aus K m,m als Summe einer symmetrischen und einer schiefsymmetrischen Matrix schreiben kann.

3. Es seien a, b von o verschiedene Vektoren aus K n . Dann ist a bT eine Matrix aus K n,n . Welchen Rang hat diese Matrix?

4. Man zeige, dass für invertierbare Matrizen aus K 2,2 gilt:

a b c d

−1

=

1 ad − bc

d −b −c a

5. Man bestimme den Rang der Matrizen ⎛

⎜ ⎜ ⎜ A=⎜ ⎜ ⎜ ⎝

1 5 1 2 3

2 4 1 0 2

3 3 1 2 5

4 2 1 0 4

5 1 1 2 7

⎞

⎛

0 ⎟ ⎟ ⎜ 1 ⎟ ⎜ ⎟, B = ⎜ ⎟ ⎝ 0 ⎟ ⎠

1 0 0 1 2

0 1 0 1

1 0 0 2

0 1 0 1

⎞

⎛

⎜ ⎜ ⎟ ⎜ ⎟ ⎟, C = ⎜ ⎜ ⎠ ⎜ ⎝

2 3 1 1 3

7 0 1 4 0

1 1 1 7 1

0 1 0 1 2

⎞ ⎟ ⎟ ⎟ ⎟. ⎟ ⎟ ⎠

6. Man bestimme eine Matrix A ∈ K 2,5 vom Rang 2 und eine Matrix B ∈ K 5,3 vom Rang 3, so dass AB die Nullmatrix ist.

7. a) Man zeige für A, B ∈ K n,n : Ist der Rang von AB kleiner als n, dann ist der Rang von A oder der Rang von B kleiner als n. b) Man konstruiere A, B ∈ K n,n so, dass die Ränge von A und B positiv sind und der Rang von AB und BA jeweils gleich 0 ist.

8. Unter dem Bild von A ∈ K m,n versteht man den Unterraum Bild A = {Ax | x ∈ K n } von K m . Seine Dimension ist die maximale Anzahl linear unabhängiger Spaltenvektoren von A, also der Rang von A. Man zeige, dass f¨ ur A ∈ K k,m , m,n B∈K gilt: Rang AB ≤ min(Rang A, Rang B)


50

II.3 Anwendungen der Matrizenrechnung Einfu orpers der komplexen Zahlen ¨ hrung des K¨ Der Körper C der komplexen Zahlen ist in Kapitel I schon erwähnt worden, er kann einer der Körper K sein, welche beim Begriff des K-Vektorraums auftreten. Die komplexen Zahlen erklärt man oft√ kurz und b¨ undig“ als die Menge aller ” Terme a + bi mit a, b ∈ IR, wobei i = −1 sein soll. Eine solche Zahl“ i gibt ” es in IR nat¨ urlich nicht, sie ist eine komplexe Zahl. Man erklärt also den Begriff der komplexen Zahl mit sich selbst, was nat¨ urlich etwas paradox ist. Man könnte C auch als zweidimensionalen IR-Vektorraum mit der Basis {1, i} einf¨ uhren, in welchem zusätzlich die merkw¨ urdige Multiplikation

a c ac − bd · = b d ad + bc

6

definiert ist; man rechnet also mit den Termen a + bi nach den u ¨blichen Regeln der Arithmetik, wobei i2 durch −1 zu ersetzen ist. Man kann dann in einem kartesischen Koordinatensystem die komplexe Zahl α = a + bi durch den √ Punkt (a, b) darstellen (Fig. 1), die Länge a2 + b2 als den Betrag |α| der komplexen Zahl und den Winkel zwischen der reellen“ Achse und der Stre” cke von O nach α als den Winkel (das Ar” gument“) arg α von α deuten. Dann gilt f¨ ur zwei komplexe Zahlen mit den Beträgen r, s und den Argumenten ϕ, ψ aufgrund der Additionstheoreme der Trigonometrie

cos ϕ cos ψ cos(ϕ + ψ) r ·s = rs . sin ϕ sin ψ sin(ϕ + ψ)

imagin¨ are Achse

. .....u α b ........................................ ...... .... . . . . .. ... ...... .... |α|........... ... . . . . . ... ........ . . . . ... .... .... . . . . ... ... .... . . . . .. arg α .. .. . ...... .. a O reelle Achse Fig. 1: Komplexe Zahl 6

..u α · β ... . . ... ... . . ... rs ..... ... ... . . .......u β . ... ............. . . ........ r....... ...ϕ............. ......u α . . .. ....... s ........ .......... ........... .. .......... ψ ... ϕ .... -

Dies erinnert an die Verkettung zweier Drehstreckungen (Fig. 2), und dies gibt einen Hinweis auf eine etwas durchsichtigere O Einf¨ uhrung der komplexen Zahlen, nämlich als Abbildungen der Ebene, welche durch Fig. 2: Multiplikation Matrizen dargestellt werden. Dieses Vorgehen w¨ urde z.B. auch dem u ¨blichen Vorgehen bei der Konstruktion der 3 rationalen Zahlen aus den ganzen Zahlen entsprechen: Die Bruchzahl versteht man zunächst als den Operator

3 von . . .“ auf einem Größenbereich. ”7

7

II.3 Anwendungen der Matrizenrechnung

51

Eine Drehung in der Ebene um den Ursprung eines kartesischen Koordinatensystems mit dem Winkel ϕ ist durch

cos ϕ − sin ϕ sin ϕ cos ϕ

x →

x2

P (p , p ) ...t. . . 1 2 . . .. . .... .. .. ... .. . r ... . .. . . .. .. .. . .t .. .......... .. . . ϕ ... ......................r................ P (p1 , p2 ) . . ...... .. .................... ..α ...

x

gegeben (Fig. 3). Verkettet man diese noch mit einer Streckung am Zentrum O mit dem Faktor r, dann hat diese Drehstreckung die Matrix

a −b b a

=r

cos ϕ − sin ϕ sin ϕ cos ϕ

x1

p1 = = = p2 = = =

.

Wir betrachten nun die Menge

C=

a −b b a

6

r cos(α + ϕ) r cos α cos ϕ − r sin α sin ϕ p1 cos ϕ − p2 sin ϕ r sin(α + ϕ) r sin α cos ϕ + r cos α sin ϕ p1 sin ϕ + p2 cos ϕ

Fig. 3: Drehung

| a, b ∈ IR

mit den u ¨blichen Matrizenoperationen (Addition, Multiplikation). Dann bildet C einen Körper, d. h. C ist abgeschlossen bez¨ uglich der Addition und der Multiplikation, es gelten die Assoziativ- und Kommutativgesetze sowie das Distributivgesetz, es gibt neutrale Elemente (O Nullmatrix, E Einheitsmatrix) und es existieren inverse Elemente bez¨ uglich der Addition und der Multiplikation. Das folgt alles aus dem Rechnen mit Matrizen. Insbesondere gilt

a −b b a

a −b b a

−1

·

c −d d c

=

1 a2 + b2

=

a b −b a

ac − bd −(ad + bc) ad + bc ac − bd

,

falls

a −b b a

,

=

0 0 0 0

.

Damit ist der Körper C der komplexen Zahlen definiert. Ersetzen wir zur Ver1 0 einfachung der Schreibweise (und aus keinem anderen Grund!) 0 1 durch

1 und

0 1

−1 0

durch i, dann ist

a −b b a

= a + bi, man kann also wieder

in gewohnter Weise“ mit den komplexen Zahlen rechnen. Ist α = a + bi, dann ” nennt man α = a − bi die zu α konjugierte Zahl. Es gilt α · α = a2 + b2 = |α|2 , 1 also α−1 = 2 α. Die Definition der komplexen Zahlen als Matrizen ändert also |α|

nichts am Umgang mit diesen Zahlen, sie dient nur zur Klärung des Begriffs der komplexen Zahlen. Man nennt a den Realteil und b den Imaginärteil der komplexen Zahl a + bi. Eine komplexe Zahl α ist genau dann reell, wenn α = α, wenn also ihr Imaginärteil 0 ist. Eine reelle Zahl ist ein spezielle komplexe Zahl, die Menge IR ist also eine Teilmenge (ein Teilkörper) von C.


52 Quaternionen F¨ ur komplexe Zahlen α, β ∈ C nennt man die Matrizen

α −β β α

Quaternionen. Der Name r¨ uhrt daher, dass f¨ ur α = a1 + ia2 , β = b1 + ib2 mit a1 , a2 , b1 , b2 ∈ IR die Quaternion von den vier reellen Zahlen a1 , a2 , b1 , b2 abhängt. Die Quaternionen bilden einen 4-dimensionalen IR-Vektorraum mit der Basis

1 0 0 1

,

0 −1 1 0

,

i 0 0 −i

,

0 i i 0

.

Das Produkt zweier Quaternionen ergibt wieder eine Quaternion, jedoch ist die Quaternionenmultiplikation nicht kommutativ:

α −β β α

γ −δ δ γ

=

αγ − βδ −αδ − βγ βγ + αδ −βδ + α γ

=

αγ − βδ −βγ + αδ βγ + αδ αγ − βδ

(Man beachte, dass im Allgemeinen αγ − βδ = γα − δβ ist, dies gilt nur, wenn δβ reell ist.) Außer dem Kommutativgesetz der Multiplikation erf¨ ullt die Menge der Quaternionen alle Körpergesetze; man spricht von einem Schiefkörper. Dieser enthält den Körper der komplexen Zahlen bzw. ein isomorphes Bild desselben: α 0 man identifiziere die komplexe Zahl α mit der Quaternion 0 α . Mit Hilfe des Multiplikationssatzes f¨ ur Determinanten (s. unten) ergibt sich aus dem Quaternionenprodukt eine f¨ ur die Zahlentheorie interessante Beziehung: Es gilt zunächst (αα + ββ)(γγ + δδ) = (αγ − βδ)(αγ − βδ) + (βγ + αδ)(βγ + αδ). Nun sei wieder α = a1 + ib1 usw. mit a1 , a2 , . . . ∈ IR. Wegen αγ − βδ = (a1 c1 − a2 c2 − b1 d1 − b2 d2 ) + i(a1 c2 + a2 c1 − b1 d2 + b2 d1 ), βγ + αδ) = (b1 c1 − b2 c2 + a1 d1 + a2 d2 ) + i(b1 c2 + b2 c1 + a1 d2 − a2 d1 ) ergibt sich die Formel (a21 + a22 + b21 + b22 )(c21 + c22 + d21 + d22 ) = (a1 c1 − a2 c2 − b1 d1 − b2 d2 )2 + (a1 c2 + a2 c1 − b1 d2 + b2 d1 )2 +(b1 c1 − b2 c2 + a1 d1 + a2 d2 )2 + (b1 c2 + b2 c1 + a1 d2 − a2 d1 )2 . In der Zahlentheorie gewinnt man daraus die folgende Erkenntnis: Sind zwei nat¨ urliche Zahlen als Summe von vier Quadratzahlen darstellbar, dann gilt dies auch f¨ ur ihr Produkt. Der Vierquadratesatz, wonach jede nat¨ urliche Zahl als Summe von vier Quadraten darzustellen ist, muss also nur f¨ ur Primzahlen bewiesen werden.


53

Wir haben oben den Begriff der Determinante f¨ ur eine Matrix benutzt; auf diesen Begriff werden wir in IV.1 allgemein eingehen. Die Determinante einer Matrix a b A= ∈ K 2,2 ist det A = ad − bc ∈ K. Es gilt der Determinantenmultic d plikationsssatz det (AB) =det A· det B f¨ ur A, B ∈ K 2,2 :

a b e f ae + bg af + bh = det c d g h ce + dg cf + dh = (ae + bg)(cf + dh) − (af + bh)(ce + dg) = adeh − adf g + bcf g − bceh = (ad − bc) · (eh − f g) a b e f = det · det c d g h

det

Diesen werden wir auch in den nächsten Anwendungsbeispielen benötigen. Beispiel: Die Zahl 9675 soll als Summe von vier Quadraten geschrieben werden. Es ist 9675 = 75 · 129 und 75 = 12 + 32 + 42 + 72 , 129 = 22 + 52 + 62 + 82 . Nun ist

1 + 3i −4 + 7i 4 + 7i 1 − 3i

2 + 5i −6 + 8i 6 + 8i 2 − 5i

=

α −β β α

mit α = −93 + 21i, β = 3 + 24i, also αα = 932 + 212 und ββ = 32 + 242 . Es ergibt sich also 9675 = 32 + 212 + 242 + 932 . Fibonacci-Zahlen Die Folge der Fibonacci-Zahlen (nach Leonardo Pisano, gen. Fibonacci, ca 1170– 1240) F0 = 0, F1 = 1, F2 = 1, F3 = 2, F4 = 3, F5 = 5, . . . und allgemein ur n ≥ 1 Fn+1 = Fn + Fn−1 f¨ kann man durch

Fn+1 Fn Fn Fn−1

n

= A (n ∈ IN) mit A =

1 1 1 0

¨ definieren, wie man durch Ubergang von An zu An+1 feststellt. Viele Eigenschaften der Fibonacci-Zahlen gewinnt man aus dieser Matrizendarstellung: Bildet man in der Matrizendarstellung die Determinante, so ergibt sich die Formel Fn+1 Fn−1 − Fn2 = (−1)n (n ∈ IN). Aus

Fm+n+1 Fm+n Fm+n Fm+n−1

folgt

= Am+n = Am An =

Fm+1 Fm Fm Fm−1

Fn+1 Fn Fn Fn−1


54

Fm+n = Fm+1 Fn + Fm Fn−1 = Fm Fn+1 + Fm−1 Fn und insbesondere 2 + Fn2 . F2n = Fn (Fn+1 + Fn−1 ) sowie F2n+1 = Fn+1

Es gilt mit A0 = E (Einheitsmatrix) (A − E)

n

Ai = An+1 − E

i=0

(vgl. Summenformel der geometrischen Reihe), wegen A − E = A−1 also E+

n i=1

Fi+1 Fi Fi Fi−1

n+2

=A

−A=

Fn+3 − 1 Fn+2 − 1 Fn+2 − 1 Fn+1

.

Man erhält die (allerdings auch einfacher zu gewinnende) Formel n i=0

Fi = Fn+2 − 1 (n ∈ IN0 ).

Pellsche Gleichungen Es sei d eine quadratfreie nat¨ urliche Zahl > 1, also eine nat¨ urliche Zahl > 1, die durch keine Quadratzahl > 1 teilbar ist. Die Gleichung x2 − dy 2 = 1 besitzt dann stets außer der trivialen Lösung (1, 0) noch weitere Lösungen in √ IN2 , wie man mit Hilfe der Kettenbruchentwickung von d beweisen kann. Man nennt x2 − dy 2 = 1 eine pellsche Gleichung, wenn man nach ganzzahligen Lösungen sucht. (Leonhard Euler (1707–1783) hat die Behandlung solcher Gleichungen irrt¨ umlich John Pell (1610–1685) zugeschrieben.) Wir wollen durch Rechnen mit Matrizen zeigen, wie man aus einer minimalen Lösung (x, y mit y = 0 kleinstmöglich) die (unendliche) Menge aller Lösungen der pellschen Gleichung gewinnt. Wie betrachten die Menge M der Matrizen

x dy y x

mit x ∈ IN, y ∈ IN0

und x2 − dy 2 = 1.

M bildet bez¨ uglich der Matrizenmultiplikation eine kommutative Gruppe mit 1 0 dem neutralen Element E = 0 1 und der Inversenbildung

x dy y x

−1

=

x −dy −y x

.


55

In M lässt sich folgendermaßen eine lineare Ordnung < definieren:

F¨ ur X1 =

x1 dy1 y1 x 1

, X2 =

x2 dy2 y2 x2

sei X1 < X2 ⇐⇒ y1 < y2 .

Es sei U die (eindeutig bestimmte) Matrix aus M mit dem kleinstmöglichen positiven Wert von y. Dann ist . . . < U −2 < U −1 < E < U < U 2 < . . . . F¨ ur jedes X ∈ M mit E < X existiert ein n ∈ IN mit U n ≤ X < U n+1 ,

also E ≤ U −n X < U ;

Wäre E < U −n X, dann wäre U nicht die Matrix aus M mit dem kleinsten positiven Wert y. Daher ist U −n X = E, also X = U n . Die Gruppe M ist daher eine unendliche zyklische Gruppe mit dem erzeugenden Element U . F¨ ur die Folge der Lösungen (xn , yn ) der pellschen Gleichungen mit yn ∈ IN gilt somit xn dyn = U n. yn x n Zur rekursiven Berechnung der Lösungen (xn , yn ) aus (x0 , y0 ) = (1, 0) und der Grundlösung“ (x1 , y1 ) kann man die Beziehung ” (U n+1 + U n )U −(n+1) = U + U −1 = 2x1 E (n ∈ IN0 ) benutzen; sie liefert f¨ ur n ∈ IN0 : xn+2 = 2x1 xn+1 − xn ,

yn+2 = 2x1 yn+1 − yn

Beispiel 1: Die Gleichung x2 − 2y 2 = 1 hat die kleinste nichttriviale Lösung (x1 , y1 ) = (3, 2). Man erhält x2 = 6 · 3 − 1 = 17, y2 = 6 · 2 − 0 = 12, x3 = 6 · 17 − 3 = 99, y3 = 6 · 12 − 2 = 70, x4 = 6 · 99 − 17 = 577, y4 = 6 · 70 − 12 = 408 usw. Die Lösungen (3, 2), (17, 12), (99, 70), (577, 408), . . . liefern gute rationale Ap√ √ 577 mit einem proximationen f¨ ur die irrationale Zahl 2; beispielsweise ist 2 = 408 relativen Fehler von etwa 0,000015%. Beispiel 2: Die Gleichung x2 − 5y 2 = 1 hat die kleinste nichttriviale Lösung (x1 , y1 ) = (9, 4). Man erhält y2 = 18 · 4 − 0 = 72, x2 = 18 · 9 − 1 = 161, x3 = 18 · 161 − 9 = 2889, y3 = 18 · 72 − 4 = 1292, x4 = 18 · 2889 − 161 = 51841, y4 = 18 · 1292 − 72 = 23184 usw. Die Lösungen liefern gute rationale Approximationen f¨ ur die irrationale Zahl √ √ 51841 5; beispielsweise ist auf 7 Nachkommastellen genau 5 = . 23184


56 Pythagor¨ aische Tripel und Quadrupel

Im Folgenden wollen wir aus Platzgr¨ unden Tripel und Quadrupel stets in transponierter Form schreiben. Ein Tripel ganzer Zahlen, also (a b c)T ∈ ZZ3 , heißt pythagoräisches Tripel, wenn c = 0 und a2 + b2 = c2 . Es heißt primitives pythagoräisches Tripel, wenn dabei ggT(a, b, c) = 1 gilt. Die linearen Abbildungen mit den Matrizen ⎛

⎞

⎛

⎞

⎛

⎞

−1 0 0 1 0 0 1 0 0 ⎟ ⎜ ⎟ ⎜ 0 ⎟ V1 = ⎜ ⎝ 0 1 0 ⎠ , V2 = ⎝ 0 −1 0 ⎠ , V3 = ⎝ 0 1 ⎠ 0 0 1 0 0 1 0 0 −1 bewirken bei Anwendung auf ein Tripel lediglich eine Vorzeichenänderung der 1., 2. bzw. 3. Koordinate, bilden also ein primitives pythagoräisches Tripel wieder auf ein ebensolches ab. Offensichtlich gilt Vi2 = E, also Vi−1 = Vi f¨ ur i = 1, 2, 3. Auch die lineare Abbildung mit der Matrix ⎛

⎞

2 1 2 ⎟ A=⎜ ⎝ 1 2 2 ⎠ 2 2 3 bildet ein primitives pythagoräisches Tripel wieder auf ein ebensolches ab: Gilt a2 + b2 = c2 und ggT(a, b, c) = 1, dann gilt auch (2a + b + 2c)2 + (a + 2b + 2c)2 = 5a2 + 5b2 + 8c2 + 8ab + 12ac + 12bc = 4a2 + 4b2 + 9c2 + 8ab + 12ac + 12bc = (2a + 2b + 3c)2 und ggT(2a + b + 2c, a + 2b + 2c, 2a + 2b + 3c) = ggT(2a + b + 2c, a + 2b + 2c, a + c) = ggT(b, b + c, a + c) = ggT(b, c, a) = 1. Dasselbe gilt wegen A−1 = V3 AV3 f¨ ur die Matrix ⎛

A

−1

⎜ =⎝

⎞

2 1 −2 1 2 −2 ⎟ ⎠. −2 −2 3

Behauptung: Jedes primitive pythagoräische Tripel (a b c)T entsteht aus (0 1 1)T durch Anwenden einer linearen Abbildung, deren Matrix eine Verkettung von Matrizen aus {A, V1 , V2 , V3 } ist.


57

Dies kann man folgendermaßen beweisen: Wir betrachten das primitive pythagoräische Tripel (a b c) und setzen dabei a, b, c als positiv voraus; andernfalls multipliziere man zunächst mit Matrizen aus {V1 , V2 , V3 }. Anwenden von A−1 = V3 AV3 liefert das primitive pythagoräische Tripel − 2a − 2b + 3c)T .

(2a + b − 2c a + 2b − 2c Dabei gilt

0 < −2a − 2b + 3c < c, denn dies ist äquivalent mit c 0 f¨ ur alle i = 1, 2, . . . , n. ur die Beweis: Ist {b1 , b2 , . . . , bn } eine Basis von V , dann gilt wegen (3) und (3)∗ f¨ n n Vektoren x = xibi und y = yjbj i=1

j=1

(x; y ) =

n i,j=1

xi yj (bi ; bj ).

Aus (1) und (2) ergibt sich die Aussage des Satzes mit aij = (bi ; bj ).

2

Mit der n, n-Matrix A = (aij )n,n und den Koordinatenvektoren x, y ist also (x; y ) = xT A y , wobei AT = A gilt und die Diagonalelemente von A positive reelle Zahlen sind. (Das Konjugieren eines Vektors bzw. einer Matrix ist dabei koordinatenweise zu verstehen.) Aber nicht f¨ ur jede Matrix A mit diesen Eigenschaften ergibt sich ein Skalarprodukt, es muss eine weitere Eigenschaft von A hinzukommen, wie das folgende Beispiel zeigt. Vgl. auch Aufgabe 5. Beispiel 1: In IR2 soll durch (x; y ) = ax1 y1 + b(x1 y2 + x2 y1 ) + cx2 y2 mit a, c > 0 (a, b, c ∈ IR) ein Skalarprodukt definiert sein. F¨ ur x1 = y1 = r und x2 = y2 = 1 (r ∈ IR) ergibt sich aus (2) die Forderung ur alle r ∈ IR, ar2 + 2br + c > 0 f¨ 1 a

wegen ar2 + 2br + c = (ar + b)2 + c −

b2 a

also c >

haben kann) und damit ac > b2 . Dann ist

b a

(x; x) = ax21 + 2bx1 x2 + cx22 = a x1 + x2

2

b2 (weil ar + b den Wert 0 a

+ c−

b2 a

x22 = 0

genau dann, wenn x1 = x2 = 0. Beispiel 2: Wir betrachten ein Skalarprodukt in einem unendlichdimensionalen Vektorraum, welcher aus einer speziellen Art von Zahlenfolgen besteht. Dabei wird (wie schon fr¨ uher) der Begriff der Konvergenz einer Zahlenfolge benötigt, welcher im Analysis-Teil ausf¨ uhrlich behandelt wird; er m¨ usste aber aus dem Mathematikunterricht schon bekannt sein.

III Das Skalarprodukt

66

Die Folgen (an ) reeller Zahlen, f¨ ur welche die Folge

n

j=1

a2j

(Folge der Quadrat-

summen) konvergiert, bilden einen IR-Vektorraum. Zum Nachweis dieser Behaup tung muss man u. a. zeigen, dass mit

n

j=1

a2j und

n

j=1

b2j auch

n

(aj + bj )2 j=1 2(a2n + b2n ) bzw.

konvergiert. Dies ergibt sich aber aus (an + bn )2 + (an − bn )2 = der daraus folgenden Ungleichung (an + bn )2 ≤ 2(a2n + b2n ). Ein Skalarprodukt in diesem Vektorraum ist dann beispielsweise definiert durch ((an ); (bn )) =

wobei

∞ j=1

∞ j=1

aj bj f¨ ur den Grenzwert der Folge

aj b j ,

n

j=1

aj b j

steht; dass dieser existiert,

wird durch den unten folgenden Satz 2 garantiert. Definition3: Ist im Vektorraum V ein Skalarprodukt ( ; ) definiert, dann nennt man |x| = (x; x) die Länge, die Norm oder den Betrag des Vektors x ∈ V. Die geometrischen Bezeichnungen Länge und Orthogonalität (siehe Definition 4) sind durch die geometrische Bedeutung des Standardskalarprodukts in IR2 und IR3 gerechtfertigt (vgl. III.3). Aus (2) folgt |x| ≥ 0 f¨ ur alle x ∈ V und |x| = 0 genau dann, wenn x = o. Aus (3) folgt |rx| = |r||x| f¨ ur alle r ∈ K (= IR oder = C) und alle x ∈ V. Satz 2: Im K-Vektorraum V sei ein Skalarprodukt ( ; ) definiert. Dann gilt f¨ ur alle x, y ∈ V |(x; y )| ≤ |x||y | |x + y | ≤ |x| + |y |

(Cauchy-Schwarzsche Ungleichung), (Dreiecksungleichung).

Beweis: F¨ ur y = o ist die erste Ungleichung korrekt. F¨ ur y = o folgt sie aus 0 ≤ (x − ry ; x − ry ) = (x; x) − (r(x; y ) + r(x; y )) + rr(y ; y ), wenn man r so wählt, dass r|y |2 = (x; y ). Denn dann ergibt die rechte Seite obiger Gleichung nach Multiplikation mit |y |2 (x; y )(x; y ) (x; x) − , |y |2 wie man leicht nachrechnet. Die zweite Ungleichung folgt aus der ersten: |x + y |2 = (x + y ; x + y ) = (x; x) + (x; y ) + (y ; x) + (y ; y ) ≤ |x|2 + 2|x||y | + |y |2 = (|x| + |y |)2

2

III.1 Skalarprodukträume

67

Die Cauchy-Schwarzsche Ungleichung ist benannt nach Augustin Louis Cauchy (1789–1857) und Hermann Amandus Schwarz (1843–1921). Definition 4: Ist im Vektorraum V ein Skalarprodukt ( ; ) definiert, dann nennt man zwei Vektoren x, y orthogonal zueinander, wenn (x; y ) = 0. Der Nullvektor ist zu jedem anderen Vektor orthogonal. Ist x orthogonal zu y , dann schreibt man daf¨ ur x ⊥ y . Von o verschiedene orthogonale Vektoren sind linear unabhängig, denn sind k b1 , b2 , . . . , bk paarweise orthogonal und alle = o, dann folgt aus xibi = o durch i=1

Bildung des Skalarprodukts mit bj (j = 1, 2, . . . , k) 0 = (o; bj ) =

k i=1

xibi ; bj

= (xjbj ; bj ) = xj |bj |2 ,

also xj = 0.

Definition 5: Eine Basis eines Vektorraums mit Skalarprodukt heißt orthogonal oder eine Orthogonalbasis, wenn die Basisvektoren paarweise orthogonal sind. Sie heißt orthonormal oder eine Orthonormalbasis, wenn die Basisvektoren außerdem alle die Länge 1 haben. Bez¨ uglich einer Orthonormalbasis C = {c1 , c2 , . . . , cn } gewinnt man leicht die Basisdarstellung eines Vektors v : Ist v = f¨ ur i = 1, 2, . . . , n, also

n

i=1

⎛

v =

n i=1

⎜ ⎜

(v ; ci ) ci = ⎜ ⎜ ⎝

xici , dann ist (v ; ci ) = xi (ci ; ci ) = xi (v ; c1 ) (v ; c2 ) .. . (v ; cn )

⎞ ⎟ ⎟ ⎟ . ⎟ ⎠ C

Satz 3: Ist U ein endlich erzeugter Unterraum des Skalarproduktraums V , dann hat jeder Vektor a ∈ V eine eindeutige Darstellung a = a⊥ + a

mit a⊥ ⊥ u f¨ ur alle u ∈ U und a ∈ U.

Beweis: Ist {u1 , u2 , . . . , uk } eine Basis von U , dann bestimme man Zahlen x1 , x2 , . . . , xk aus der Bedingung

a −

k i=1

xiui ⊥ uj = 0 bzw.

k i=1

xiui ; uj

= (a; uj ) (j = 1, 2, . . . , k).

Man muss also ein LGS mit der Koeffizientenmatrix ((ui ; uj )) ∈ K k,k lösen. Die Koeffizientenmatrix ist vom Rang k, denn wäre ⎛

k i=1

⎜ ⎜

si ⎜ ⎜ ⎝

(ui ; u1 ) (ui ; u2 ) .. . (ui ; uk )

⎞

⎟ ⎟ ⎟= o, ⎟ ⎠


68 so wäre

k i=1

(siui ; uj ) = 0 f¨ ur j = 1, 2, . . . , k. Der einzige Vektor aus U , der zu jedem

Vektor aus U orthogonal ist, ist aber der Nullvektor o; es folgt also

k i=1

siui = o

und damit s1 = s2 = . . . = sk = 0. Die obigen Koeffizienten x1 , x2 , . . . , xk sind also eindeutig bestimmt, und es ergibt sich die Behauptung mit a = a⊥ = a − a .

k

j=1

xj uj und 2

Den Vektor a nennt man die orthogonale Projektion von a in den Unterraum U . Ist die in Satz 3 benutzte Basis von U eine Orthonormalbasis, dann ist xi = (a; ui ) (i = 1, 2, . . . , k), also a =

k

i=1

(a; ui ) ui .

Satz 4: Jeder endlichdimensionale K-Vektorraum V mit Skalarprodukt besitzt eine Orthonormalbasis. Beweis: Es sei {a1 , a2 , . . . , an } eine Basis von V . Man setze b1 = a1

und

c1 =

b2 = a2 − (a2 ; c1 ) c1

b1 , |b1 |

und

c2 =

b3 = a3 − (a3 ; c1 ) c1 − (a3 ; c2 ) c2

b2 , |b2 |

und

c3 =

b3 , |b3 |

.. . bn = an − (an ; c1 ) c1 − (an ; c2 ) c2 − . . . − (an ; cn−1 ) cn−1

und

Dann ist {c1 , c2 , . . . , cn } eine Orthonormalbasis von V .

cn =

bn . |bn |

2

Das im Beweis von Satz 4 benutzte Verfahren nennt man schmidtsches Orthonormierungsverfahren (nach Erhard Schmidt, 1876–1959). Bez¨ uglich einer Orthonormalbasis ist die obige Matrix A, welche das Skalarprodukt festlegt, die Einheitsmatrix E. In einem Skalarproduktraum der Dimension n lautet das Skalarprodukt bez¨ uglich einer Orthonormalbasis daher (x; y ) = x T y = x1 y1 + x2 y2 + . . . + xn yn , es ist also das Standardskalarprodukt. Definition 6: Ist U ein Unterraum des n-dimensionalen Skalarproduktraums V , dann ist ur alle u ∈ U } U⊥ = {v ∈ V | (u; v ) = 0 f¨ ebenfalls ein Unterraum von V ist. Dieser heißt der Lotraum von U . Es gilt dim U + dim U⊥ = dim V (Aufgabe 8).

III.1 Skalarprodukträume

69

Aufgaben 1. Man beweise die Behauptung unter (3)∗ in Definition 1. 2. a) Man zeige: Für x ⊥ y gilt |x + y|2 = |x|2 + |y|2 . b) Man zeige, dass in der Cauchy-Schwarzschen Ungleichung |(x, y )| ≤ |x||y | genau dann das Gleichheitszeichen gilt, wenn x, y linear abhängig sind.

3. Man beweise, dass in einem K-Vektorraum V mit Skalarprodukt gilt: ||x| − |y || ≤ |x − y | f¨ ur alle x, y ∈ V

4. Die Spur einer Matrix (aij ) ∈ IRn,n ist die Summe ihrer Diagonalelemente, also Spur(aij ) =

n

i=1

aii . Man zeige, dass im IR-Vektorraum IRm,n der m, n-

Matrizen durch (A; B) = Spur(B T A) ein Skalarprodukt definiert wird.

5. Im Skalarprodukt (x; y) = xT Ay in IRn muss für die symmetrische Matrix A ∈ IRn,n gelten: xT Ax > 0 f¨ ur alle x ∈ IRn mit x = o. Eine solche Matrix ⎛ ⎞ nennt man positiv definit. 1

a) Man zeige, dass die Matrix A = ⎝ −1 2

−1 2 2 −3 ⎠ positiv definit ist. −3 6

b) Die Matrix A ∈ IRn,n habe den Rang n, sei also invertierbar. Man zeige, dass AT A positiv definit ist. c) A = (aij ) ∈ IRn,n sei positiv definit. Man zeige, dass aii > 0 und aii ajj > a2ij (i = j) (i, j = 1, 2, . . . , n). Beachte dabei Beispiel 1.

6. Es sei U ein Unterraum des Skalarproduktraums V und v die orthogonale Projektion von v in U . Man zeige, dass v → v eine lineare Abbildung von V in U ist. Man beschreibe den Kern dieser linearen Abbildung. −→

−→

7. In IRn seien Punkte P und A durch ihre Ortsvektoren p =OP und a =OA

festgelegt, ferner sei U ein Unterraum des Vektorraums IRn . In IRn sei ein Skalarprodukt gegeben. Unter dem Abstand d des Punktes P von der linearen Mannigfaltigkeit a + U versteht man das Minimum der Längen von p −u f¨ ur u ∈ a + U . Man zeige, dass d = |(p −a) − (p −a) |, wobei allgemein x die orthogonale Projektion von x in den Unterraum U bedeutet.

8. Es sei U ein Unterraum des n-dimensionalen Skalarproduktraums V . Man zeige, dass der Lotraum U⊥ = {v ∈ V | (u; v ) = 0 f¨ ur alle u ∈ U } ein Unterraum von V ist, und dass dim U + dim U⊥ = dim V.

9. Man bestimme eine Orthonormalbasis für den von (1 0 0 1 1)T ,

(1 − 1 1 0 0)T ,

erzeugten Unterraum von IR5 .

(0 1 2 1 0)T


70

III.2 Anwendungen in der Statistik Es sei Ω = {ω1 , ω2 , . . . , ωn } die Menge der möglichen Ausfälle eines Zufallsversuchs und X : Ω → IR eine Zufallsgröße auf diesem Zufallsversuch, also auf Ω. (Zufallsgrößen pflegt man in der Wahrscheinlichkeitsrechnung stets mit großen lateinischen Buchstaben zu bezeichnen.) Diese Zufallsgröße kann als Vektor aus IRn mit den Koordinaten xi = X(ωi ) (i = 1, 2, . . . , n) verstanden werden; die Menge der Zufallsgrößen auf Ω ist ein Vektorraum, nämlich bis auf Isomorphie der Vektorraum IRn . Ist pi = P (ωi ) die Wahrscheinlichkeit des Ausfalls ωi , dann ist durch (X; Y ) =

n i=1

pi x i y i

ein Skalarprodukt im Vektorraum der Zufallsgrößen auf Ω definiert. Man beachte, dass man pi > 0 annehmen kann, denn wäre pi = 0, dann wäre ωi kein möglicher“ ” n pi = 1. F¨ ur Zufallsgrößen auf Ω Ausfall. F¨ ur die Wahrscheinlichkeiten pi gilt i=1

sind mit diesem Skalarprodukt die Begriffe Betrag (|X|), Abstand (|X − Y |) und Orthogonalität ((X; Y ) = 0) zu definieren. Zufallsgrößen kann man auch in folgendem Sinn multiplizieren: (XY )(ωi ) = X(ωi )Y (ωi ) (i = 1, 2, . . . , n). Offensichtlich gilt (XY ; Z) = (X; Y Z) f¨ ur je drei Zufallsgrößen X, Y, Z auf Ω. Die Zufallsgröße I sei definiert durch I(ωi ) = 1 f¨ ur i = 1, 2, . . . , n, so dass XI = X f¨ ur alle X gilt. F¨ ur c ∈ IR ist cI die konstante Zufallsgröße mit dem Wert c. Der Wert c, f¨ ur welchen |X−cI| f¨ ur ein gegebenes X minimal ist, heißt Erwartungswert von X und wird mit E(X) bezeichnet. Wegen |X − cI|2 = (X − cI; X − cI) = (X; X) − 2(X; cI) + (cI; cI) = (X; X) − (X; I)2 + c2 − 2c(X; I) + (X; I)2 = (X 2 ; I) − (X; I)2 + (c − (X; I))2 ist E(X) = (X; I), also E(X) =

n i=1

pi xi .

Hat man f¨ ur die Werte x1 , x2 , . . . , xn einer Zufallsgröße im Rahmen einer statistischen Erhebung relative Häufigkeiten h1 , h2 , . . . , hn gefunden, dann ist n hi xi der Mittelwert von X bei der durchgef¨ uhrten Erhebung. Man erx∗ = i=1

wartet, dass der Mittelwert x∗ bei hinreichend großem Umfang der Stichprobe gut durch den Erwartungswert E(X) angenähert wird. Es ist eine wichtige Aufgabe der beurteilenden Statistik, die Qualität dieser Annäherung abzuschätzen, indem man z.B. die Wahrscheinlichkeit f¨ ur größere Abweichungen berechnet.

III.2 Anwendungen in der Statistik

71

Die Vektoren E(X)I und X − E(X)I sind orthogonal zueinander, denn (X − E(X)I ; I) = (X; I) − E(X)(I; I) = E(X) − E(X) = 0. Mit X = E(X)I und X⊥ = X − E(X)I wird X in zueinander orthogonale Komponenten zerlegt: X = X + X⊥ (Fig.1). Der Vektor X⊥ beschreibt die Abweichung der Zufallsgröße X von der konstanten Zufallsgröße X , es ist also naheliegend, den Betrag des Abweichungsvektors“ X⊥ als Abweichungsmaß zu ” benutzen. Man nennt σ(X) = |X⊥ | = |X − E(X)I| die Standardabweichung von X. Aus Obigem folgt, dass σ 2 (X) = E((X − E(X)I)2 ) = E(X 2 ) − E(X)2 . I ...... ................ . . . . . . . . . . . : . . . . . X ... ..C.C ..... ... ....... ... ...... ....... .. . . . . C..C . . . . . . . . . . . .C..C X⊥ .. ........... XXXX XXX . XX .C...C X X z.CW.CW X

X = X + X⊥ |X | = E(X) |X⊥ | = σ(X)

Fig. 1: Erwartungswert und Standardabweichung

Ist A ein Ereignis, also eine Teilmenge von Ω, dann bezeichnet man mit IA die Zufallsgröße mit den Werten IA (ω) = 1 f¨ ur ω ∈ A und IA (ω) = 0 f¨ ur ω ∈ A. Ist A = Ω \ A die Komplementärmenge von A, dann ist IA + IA = I. Es ist E(IA ) =

P (ω) = P (A),

ω∈A

der Erwartungswert von IA ist also die Wahrscheinlichkeit des Ereignisses A. Ist ξ > 0, Y eine Zufallsgröße und A = {ω ∈ Ω | |Y (ω)| ≥ ξ}, dann gilt E(Y 2 ) = E(Y 2 IA + Y 2 IA ) ≥ E(Y 2 IA ) ≥ E(ξ 2 IA ) = ξ 2 P (A). (Die Ungleichungen gelten, weil die Wahrscheinlichkeiten nicht negativ sein können.) F¨ ur Y = X − E(X)I ergibt sich daraus die f¨ ur die Wahrscheinlichkeitsrechnung wichtige Ungleichung von Tschebyscheff (nach Pafnuti Lwowitsch Tschebyscheff, 1821–1894) P ({ω ∈ Ω | |X − E(X)I| ≥ ξ}) ≤

σ 2 (X) , ξ2

welche die Wahrscheinlichkeit f¨ ur große Abweichungen vom Erwartungswert durch einen in der Regel kleinen Wert abschätzt. F¨ ur ξ = 3σ(X) erhält man beispielsweise, dass die Wahrscheinlichkeit f¨ ur das Abweichen des Wertes von X 1 vom Erwartungswert um das 3-fache der Standardabweichung höchstens ist. 9


72

In der Statistik ergibt sich oft die Frage, ob zwischen zwei Zufallsgrößen X, Y auf Ω ein linearer Zusammenhang besteht. Man sucht dann reelle Zahlen a, b, so dass |Y − (aX + bI)| minimal ist. Dies ist der Fall, wenn Y − (aX + bI) zu X und zu I orthogonal ist, wenn also aX + bI die orthogonale Projektion von X in den von X und I erzeugten Unterraum des Raums der Zufallsgrößen ist. Daraus ergeben sich f¨ ur a, b die Bedingungen a=

(X⊥ ; Y⊥ ) , |X⊥ |2

b = −aE(X) + E(Y ).

Ebenso ergibt sich, dass |X − (cY + dI)| minimal ist, wenn c=

(X⊥ ; Y⊥ ) , d = −cE(Y ) + E(X). |Y⊥ |2

Besteht nun ein strenger linearer Zusammenhang, ist also Y = aX +bI und damit 1 a

b a

X = Y − I, dann ist ac = 1, also

(X⊥ ; Y⊥ ) |X⊥ ||Y⊥ |

(X, Y ) =

2

= 1. Die Zahl

(X⊥ ; Y⊥ ) |X⊥ ||Y⊥ |

liegt nach Satz 1 zwischen −1 und 1. Man nennt (X, Y ) den Korrelationskoeffizient der Zufallsgrößen X, Y . Dieser dient in der Statistik als Maß daf¨ ur, wie stark die Zufallsgrößen X, Y korrelieren, d.h. wie gut ein näherungsweiser linearer Zusammenhang zwischen ihnen besteht. Die Zufallsgrößen X, Y heißen unkorreliert, wenn (X, Y ) = 0 gilt. Genau dann sind X, Y unkorreliert, wenn E(XY ) = E(X)E(Y ), denn E(XY ) = (XY ; I) = (X; Y ) = (X + X⊥ ; Y + Y⊥ ) = (X ; Y ) + (X⊥ ; Y⊥ ) = E(X)E(Y )(I; I) + (X⊥ ; Y⊥ ). Viele weitere Konzepte der Wahrscheinlichkeitsrechnung und Statistik lassen sich mit den Begriffen der linearen Algebra u ¨bersichtlich darstellen.

Aufgaben 1. a) Man berechne die Erwartungswerte und

ω1 ω2 ω3 ω4 ω5 die Standardabweichungen f¨ ur die in der Ta1 1 1 1 1 P 20 5 2 5 20 belle angegebenen Zufallsgrößen X und Y . X 2 1 3 4 0 b) Man berechne Y 3 0 1 2 4 P ({ω ∈ Ω | |X − E(X)I| ≥ 2}), P ({ω ∈ Ω | |Y − E(Y )I| ≥ 3}) und vergleiche mit den Werten in der Ungleichung von Tschebyscheff.

2. Man berechne für X, Y aus Aufgabe 1 den Korrelationskoeffizient.

III.3 Anwendungen in der Geometrie

73

III.3 Anwendungen in der Geometrie Ist in der Ebene ein kartesisches Koordinatensysten gegeben, dann kann man v den Vektor v = v1 ∈ IR2 als die Verschiebung deuten, welche jedem Punkt 2

(p1 , p2 ) den Punkt (p1 + v1 , p2 + v2 ) zuordnet (Fig. 1). Die Verschiebung wird durch einen Verschiebungspfeil oder Vektorpfeil dargestellt. Die Länge des Ver schiebungspfeils ist v12 + v22 , also der Betrag |v | des Vektors v bez¨ uglich des 2 Standardskalarprodukts in IR . Ist α der Winkel zwischen der Verschiebung v und der x1 -Achse (Fig. 2), dann ist v1 = |v | cos α und v2 = |v | sin α. Gilt f¨ ur einen weiteren Vektor w entsprechend w1 = |v | cos β und w2 = |v | sin β, dann gilt f¨ ur das Standardskalarprodukt (v ; w) = |v ||w|(cos α cos β + sin α sin β). Aufgrund des Additionstheorems der Kosinusfunktion ist also (v ; w) = |v ||w| cos(α − β). Genau dann ist (v ; w) = 0 f¨ ur v , w = o, wenn cos(α − β) = 0, also α − β = ±90o , wenn die beiden Verschiebungsvektoren also orthogonal zueinander sind. x2 ... ..6 (p1 + v1 , p2 + v2 ) ... ...........t ... .............. ... 2 2 .......... . .. v1 + v2........ .. .. v ........v .... . . . . . . .. 2 . . ..... ... . . . . . . . . . .. ...t............ .... .... .... .... .... .... .... .... .. ... v1 ... (p1 , p2 ) ... . ..........................................................................................................x.. 1 .. Fig. 1: Länge einer Verschiebung

x2 ... ..6 ... . .... ............ ... ... .... ... v... .. .. ......... .... ..... ... w ......................... . . ... ... .... ........ .............................. .. .... .. .. ...α ................. .... . . . . . . . . ... ........................... ............... β.... ....... .... .... .... ........ ..... . ... .. . ..........................................................................................................x.. 1 .. Fig. 2: Winkel zwischen Verschiebungen

Ist ϕ der Winkel zwischen den Verschiebungen v und w, dann folgt aus obiger Darstellung des Skalarprodukts 2 − 2(v ; w) = |v |2 + |w| 2 − 2|v ||w| cos ϕ. |v − w| 2 = |v |2 + |w| Dies ist der bekannte Kosinussatz aus der Trigonometrie. Bez¨ uglich eines kartesischen Koordinatensystems im Raum hat ein Verschie bungsvektor v ∈ IR3 die Länge |v | = v12 + v22 + v32 (Fig. 3). F¨ ur den Winkel ϕ zwischen zwei Verschiebungsvektoren v , w gilt aufgrund des Kosinussatzes |v − w| 2 = |v |2 + |w| 2 − 2|v ||w| cos ϕ (Fig. 4), wegen |v − w| 2 = |v |2 + |w| 2 − 2(v ; w) also wie in der Ebene (v ; w) = |v ||w| cos ϕ.


74

v12 + v22 .. .... .... .... ................................. x3 .. @ ..6 . .... ..... ..... .. . ........... . .......... .. . ... @ .. . . . R @ . . . . . . . .. ... ................... . . .... .. .. ................... .... ...... .... .... ... .......... .. . ....... .. .. .... .. ... ... ... .... . . . v . .. ...... .. .. .... .. ... .... .. .. .. .... . . .. .... .. .. ....v3 .. . . .. . .... .. .... . . . .. ..... .......... .... ..... .... .... .... ..... . . . . .. . ................................................................................................................x ...2 . . . . . . . . . . . . . . . . . . . . . . . . . . . ....... . .. ... .... ............. .... .... .... .... ...... .... . . . x1. ... Fig. 3: L¨ ange einer Verschiebung

x3

6

.............. .............................. . . . . . . . . . . . .. v.................... .... . . . . . . . . . . . . . . ... ... ................ .................ϕ ... . . . ....... . .. ......... ... ...... ..... v − w . . . . . . w ...... . ...... ... ...... ..... .......... ... ........

x2 -

x1 Fig. 4: Zum Kosinussatz

Im Folgenden verstehen wir wie schon in I.5 f¨ ur n = 2, 3 die Menge IRn einerseits als Menge aller Punkte und andererseits als den IR-Vektorrraum der Verschiebungen der Ebene bzw. des Raums. Diese beiden Bedeutungen von Zahlenpaaren bzw. Zahlentripeln sind u ¨ber den Begriff des Ortsvektors miteinander verbunden: −→ Der Punkt P ist festgelegt durch seinen Ortsvektor p =OP , der Vektor a ist −→ festgelegt durch den Punkt A mit OA= a. Definition 1: Es sei a + U eine k-dimensionale lineare Mannigfaltigkeit aus IRn mit 1 ≤ k ≤ n − 1. Dann nennt man b + U⊥ die Lotmannigfaltigkeit zu a + U durch den Punkt B mit dem Ortsvektor b. Beispiel 1: F¨ ur n = 2 (also in der Ebene) kann man zu einer Geraden die Lotgerade durch einen gegebenen Punkt betrachten und z.B. den Lotfußpunkt berechnen: Die Lotgerade zu a + u mit u = o durch den Punkt mit dem Ortsvektor b ist b + v mit v ⊥ u. Zur Berechnung des Lotfußpunkts löst man die Gleichung a + ru = b + sv , welche eindeutig lösbar ist, weil {u, v } linear unabhängig ist. Beispiel 2: F¨ ur n = 3 (also im Raum) kann man zu einer Ebene die Lotgerade durch einen gegebenen Punkt betrachten und z.B. den Lotfußpunkt berechnen: Die Lotgerade zu a + u, v ({u, v } linear unabhängig) durch den Punkt mit dem Ortsvektor b ist b + w mit w ∈ u, v ⊥ . Zur Berechnung des Lotfußpunkts löst man die Gleichung a + ru + sv = b + tw, welche eindeutig lösbar ist, weil {u, v , w} linear unabhängig ist. Beispiel 3: F¨ ur n = 3 (also im Raum) kann man zu einer Geraden die Lotebene durch einen gegebenen Punkt betrachten und z.B. den Schnittpunkt von Gerade und Lotebene berechnen: Die Lotebene zu a + u ({u = o}) durch den Punkt mit dem Ortsvektor b ist b + v , w, wobei v , w ∈ u⊥ und {u, v } linear unabhängig ist. Zur Berechnung des Lotfußpunkts löst man die Gleichung a +ru = b+sv +tw, welche eindeutig lösbar ist, weil {u, v , w} linear unabhängig ist.


75

Es sei U ein echter Unterraum von IRn und {b1 , b2 , . . . , bk } eine Basis des Lotraums U⊥ . F¨ ur alle x ∈ a + U gilt dann (x − a; bi ) = 0 f¨ ur i = 1, 2, . . . , k. Dies ist ein LGS mit k Gleichungen f¨ ur die n Variablen x1 , x2 , . . . , xn . Die lineare Mannigfaltigkeit a + U kann also als Lösungsmannigfaltigkeit eines LGS gedeutet werden, wie wir schon fr¨ uher gesehen haben. Im Fall n = 2 (also in der Ebene) hat die Gerade a + u die Gleichung (x − a; n) = 0 mit n ⊥ u, n = o. Im Fall n = 3 (also im Raum) hat die Ebene a + u, v ebenfalls die Gleichung (x − a; n) = 0 mit n ⊥ u, n ⊥ v , n = o. Man nennt n einen Normalenvektor von u bzw. von u, v und diese Gleichung eine Normalengleichung der Geraden bzw. der Ebene. Hat der Normalenvektor dabei den Betrag 1, dann spricht man von der hesseschen Normalenform der Geraden- bzw. der Ebenengleichung (nach Ludwig Otto Hesse, 1811–1874). Ist eine Gerade in der Ebene zunächst durch die Gleichung a1 x1 + a2 x2 = b bzw. a1 x1 + a2 x2 − b = 0 gegeben, dann lautet ihre Gleichung in der hesseschen Normalenform a1 a2 b x1 + x2 − = 0. 2 2 2 2 2 a1 + a2 a1 + a2 a1 + a22 Entsprechend lautet die a1 x1 + a2 x2 + a3 x3 = b

a21

a1 +

a22

+

a23

hessesche

Normalenform

der

Ebenengleichung

a2 a3 b x1 + x2 + x3 − = 0. 2 2 2 2 2 2 2 a1 + a2 + a3 a1 + a2 + a3 a1 + a22 + a23

Satz 1: Ist (x − a; n) = 0 die hessesche Normalenform einer Geraden- oder einer Ebenengleichung, dann hat der Punkt mit dem Ortsvektor p von der Geraden bzw. von der Ebene den Abstand d = |(p − a; n)|. Beweis (vgl. Fig. 5): Ist d der gesuchte Abstand, dann ist p −a ±dn orthogonal zu n, es ist also 0 = (p − a ± dn; n) = (p − a; n) ± d(n; n) = (p − a; n) ± d, wobei das Vorzeichen von d von der Richtung von n abhängt. 2

p − a

tP CO n C d C C......q.... ................. ............ ................C..

........... .................. . . . . . t . . . . . . . . . . . . ................ A

Fig. 5: Abstandsberechnung


76

Setzt man also in der hesseschen Normalenform die Koordinaten eines Punktes ein, der nicht zur Geraden bzw. zur Ebene gehört, dann ergibt sich auf der rechten Seite nicht 0, sondern der Abstand (positiv oder negativ) dieses Punktes von der Geraden bzw. der Ebene. Eine Gerade in der Ebene mit der Steigung m und dem x2 -Achsenabschnitt c hat c die Gleichung x2 = mx1 + c. Ihr Abstand von O ist ± √ . Diese Gerade ist 2 1+m

also genau dann eine Tangente an den Kreis um O mit dem Radius r, wenn r diesen Wert hat, wenn also die Gleichung c2 = r2 (1 + m2 ) gilt. Diese Gleichung heißt Tangentenbedingung (f¨ ur eine Gerade und einen Ursprungskreis). Bei der allgemeiner Geradengleichung a1 x1 + a2 x2 − c = 0 lautet diese Tangentenbedingung c2 = r2 (a21 + a22 ). Entsprechend ist c2 = r2 (a21 + a22 + a23 ) die Bedingung daf¨ ur, dass die Ebene mit der Gleichung a1 x1 + a2 x2 + a3 x3 − c = 0 die Kugel um O mit dem Radius r ber¨ uhrt. Im Folgenden wollen wir das Skalarprodukt eines Vektors mit sich selbst als Quadrat schreiben, also x 2 = (x; x) = |x|2 . Es soll also vor¨ ubergehend x 2 dasselbe T bedeuten wie x x. Die Gleichung

(x − m) 2 = r2

ist in der Ebene die Gleichung eines Kreises und im Raum die Gleichung einer Kugel mit dem Mittelpunkt M (Ortsvektor m) und dem Radius r. Satz 2: Die Tangente bzw. die Tangentialebene an einen Kreis bzw. an eine Kugel um M (Ortsvektor m) mit dem Radius r im Punkt P (Ortsvektor p) hat die Gleichung ..... (x − m; p − m) = r2 . ..... ..... X .....t ..... Beweis (vgl. Fig. 6): F¨ ur den Ortsvektor x ei..... nes Punktes der Tangente bzw. der Tangen...................................... . . . . . . . .. P ... tialebene im Punkt P gilt (x − p; p − m) = 0. .... q..........t.. .... ... . . . . .. . ............ Dies ist bereits eine Gleichung f¨ ur die Tan... .... .. ..... . . . . ... ...... . gente bzw. die Tangentialebene, man formt . ..... .t.... .... ... .. sie aber in der Regel noch mit Hilfe der Kreis. M ... . ... bzw. Kugelgleichung um: ... .... . . .. ...... ..... ......... ............................. 0 = ((x − m) − (p − m); p − m) = (x − m; p − m) − (p − m) 2 = (x − m; p − m) − r2

2

Fig. 6: Tangente an Kreis


77

Liegt der Punkt P außerhalb des Kreises um M mit dem Radius r, ist also |p − m| > r, dann gibt es zwei Kreistangenten durch P (Fig. 7). F¨ ur deren 2 Ber¨ uhrpunkte bzw. ihre Ortsvektoren b1 und b2 gilt (bi − m; p − m) = r (i = 1, 2), sie liegen also auf der Geraden mit der Gleichung (x − m; p − m) = r2 . Liegt der Punkt P außerhalb der Kugel um M mit dem Radius r, ist also |p − m| > r, dann bilden die Kugeltangenten durch P den Tangentialkegel mit der Spitze P (Fig. 8). F¨ ur die Ber¨ uhrpunkte bzw. ihre Ortsvektoren b gilt 2 (b − m; p − m) = r , sie liegen also in der Ebene mit der Gleichung (x − m; p − m) = r2 . ... .. .........................u ..... ......... ................................................... ..... ..................u............ ... .... . ..... ... ... ..... ........ . ... ... ....... P . . . . . . .... . p .... .. .... ... ... .. ............ ... . ... ......... .... .. .u... ....... ................................. . .... .... ....... ...... Fig. 7: Pol und Polare

....... ....... ..... . . . . . ... . ....... p .... ......... ... ...................... . . . . . . . . . . . . . . . . . . . . . . . ....... . .. ........... ... ....................................................................................................................................................u................................. ... ... .. ................................. .... . ... .. .. .. .. ................... ........ ..... P ... ............................................ ................................. ... .. ........... .. ........ .................. .. ........... . . ........ ... ..... ........................ ............... ..... ....... . ... .... ..... ......... .................................................. .. . ...... ....... ....... ........

Fig. 8: Pol und Polarebene

Definition 2: Es sei ein Kreis bzw. eine Kugel mit der Gleichung (x − m) 2 = r2 gegeben. Es sei P ein Punkt mit dem Ortsvektor p und p die Gerade bzw. die Ebene mit der Gleichung (x − m; p − m) = r2 . Dann heißt p die Polare bzw. die Polarebene zu P und P der Pol zu p. Liegt dabei P außerhalb des Kreises bzw. der Kugel, dann schneidet p den Kreis bzw. die Kugel. Liegt P auf dem Kreis bzw. der Kugel, dann ist p die Tangente bzw. die Tangentialebene in P . Liegt P innerhalb des Kreises oder der Kugel, dann verläuft p ganz außerhalb des Kreises bzw. der Kugel. Ist P = M , dann existiert p nicht, weil (x − m; o) = 0 = r2 ist. Satz 3 (Fig 9): Es sei ein Kreis bzw. eine Kugel gegeben. Liegt der Punkt Q auf der Polaren bzw. Polarebene p von P , dann liegt der Punkt P auf der Polaren bzw. Polarebene q von Q. Geht die Gerade bzw. die Ebene q durch den Pol P von p, dann geht die Gerade p durch den Pol Q von q. Beweis: Aus der Polarengleichung folgt, dass alle Voraussetzungen und Behauptungen im Satz dasselbe bedeuten, nämlich (p − m; q − m) = r2 . 2


78

.... ... .... .... .... p ... ....... .. ... ............ .......................... . . . . ... . .. ..............q.................. .. . . . ..... . . . . . . . . . . . . r.... .... ... ............. .... . . . ... . . . . ... .. ... . .................................t....................t...q...........................................t........... . . ... M P .... ... ........ .... P ... ... . . . . .... ... ....... ..... ... ......... ........ ... ............................ ... .. .. ... . . . .. .. p ....

.... ...Q. .....u.. . . .. ............................ .. .......................................................................... .. .. .. .... ................................................... .. .. ...... .... . . . . . . . . . ... . ........u.................. ... ...... .... .. q ....... ... ... .... ... . . . . ... P . . . . . . . . . . . . . . . . . . p ... . ...... ... .... ... .. ..... .... ... .... ... ....... ... .... ..... ...... ........ . .... . . . ....................... .... . . . . .. .. .. ... Fig. 9: Pol-Polare-Beziehung

Fig. 10: Lagebeziehung von Pol und Polare

Unmittelbar aus dem Kathetensatz ergibt sich eine interessante Lagebeziehung zwischen Pol und Polare bzw. Polarebene (Fig. 10): Ist p die Polare oder die Polarebene zu P bez¨ uglich eines Kreises bzw. einer Kugel und ist P der Schnittpunkt von p mit der Geraden durch M und P , dann gilt M P · M P = r2 .

Aufgaben 1. Zwei Geraden im Raum heißen windschief, wenn sie nicht parallel sind und

sich nicht schneiden. Man zeige: Sind p + u und q + v zwei windschiefe Geraden, dann ist ihr Abstand d = |(q − p; n)|, wobei n ∈ u, v ⊥ und |n| = 1.

2. Unter welcher Bedingung ist x21 + x22 + x33 + a1 x + a2 x + a3 x + c = 0 die Gleichung einer Kugel ?

3. Man zeige, dass A

2 1 2 , , 3 3 3

und B

3 6 2 , , 7 7 7

auf der Einheitskugel liegen

und berechne die Länge des (k¨ urzeren) Großkreisbogens durch A und B.

4. Welcher Kreis mit dem Mittelpunkt M (15, 5) berührt die Gerade mit der Gleichung 7x1 + 24x2 = 100 ?

5. Man bestimme die Steigungen der vier gemeinsamen Tangenten der Kreise mit den Gleichungen x2 = 4 und x −

6 9

2

= 9.

6. Die Ebene mit der Gleichung 4x1 + 7x2 + 4x3 = 20 schneidet die Kugel mit dem Mittelpunkt M (5, 2, 1) und dem Radius 7 in einem Kreis. Man bestimme den Mittelpunkt M und den Radius r des Schnittkreises.

7. Es sei k1 die Kugel um M1 (−1, 3, 1) mit dem Radius r1 = 6, ferner k2 die Kugel um M2 (3, 9, 7) mit dem Radius r2 = 5. In welcher Ebene liegt der Schnittkreis der Kugeln? Welchen Radius hat er?


79

8. Wie bestimmt man die gemeinsamen Tangentialebenen von drei Kugeln? 9. Es seien p, q die Polaren zu den Punkten P, Q bezüglich eines Kreises. Man zeige: Liegt der Punkt R auf der Geraden durch P und Q, dann geht die Polare r zu R durch den Schnittpunkt von p und q.

10. Legt man von einem Punkt der Schnittkreisebene zweier sich schneidender Kugeln jeweils eine Tangente an jede der Kugeln, dann sind die Tangentenabschnitte gleich lang. Man beweise dies.

11. Man zeige, dass für je zwei Kreise mit verschiedenen Mittelpunkten M1 und M2 die Punkte, von denen aus die Tangentenabschnitte an die beiden Kreise gleich lang sind, auf einer zu M1 M2 orthogonalen Geraden liegen (Fig. 11).

12. Die Tangenten von einem Punkt P aus an eine Kugel um M mit dem Radius r bilden den Tangentialkegel mit der Spitze P an die Kugel, falls P außerhalb der Kugel liegt. Der Ber¨ uhrkreis liegt in der Polarebene zum Pol P . a) Wie bestimmt man den Mittelpunkt M und des Radius r des Ber¨ uhrkreises, wenn man die Spitze P des Tangentialkegels kennt? b) Wie bestimmt man die Spitze P des Tangentialkegels, wenn man den Mittelpunkt M des Ber¨ uhrkreises kennt? c) Wie bestimmt man die Spitze P des Tangentialkegels, wenn man den Radius r und die Ebene des Ber¨ uhrkreises kennt? d) Unter welcher Bedingung haben zwei Kugeln keinen, genau einen oder genau zwei gemeinsame Tangentialkegel? Wie bestimmt man die Kegelspitzen? (Man betrachte zunächst ein Schnittbild.)

... ...uX . . ............... . . . . . . . . . . . ..... .. ......... ..... .................. . . . . . . ....... ... . ...... ... ................. ....... ..... ... ........ .................. ......u.................... . . . . . . . ..... ... .... ......u..... ........... . .. .. ... .. ..........r..... ..... ......... .... ........ ...... ....r2 .... . . . . . .. . ... .. 1 ....u... . ... ... .... . . .. . . . .. .. .. ....u ... .... M1 .......u .... .......u.... .. M2 ... ........ ....... .. ....... ... .......... ... ..... .......... ............. .. ........... ... .. Fig. 11: Zu Aufgabe 11

P ....v . .. ...... . . ... .. ... ... ... .... . . ... . .. ... .... ..... . . .. .... ... ... .. ... . . . . ... ... ..................... . .. . . . . . . . . . . . . . . . . . . . . ........... ..... .......... . . . . ..... .. . . .... ...... ...M .... .. ....v....... .. ..r.. . . v . . . . . . .. .... .. .. ... .. .. .. .. .... . . . . . . . . . ..............v r ..... .. d .. .. . . . . ... . . . . . v . ........ .. .. .. .... ....... ... . M . .. ... .. .... ... . . .... ... . ...... ..... . ........ . . . . . .............................. Fig. 12: Tangentialkegel


80

III.4 Vektorprodukt und Spatprodukt Möchte man die Ebene p + a, b aus IR3 als Lösungsmenge eines LGS uT x = c schreiben, dann benötigt man dazu einen Vektor u ∈ a, b⊥ . Im Vektorraum IR3 kann man also nach einem Vektor x fragen, der zu zwei gegebenen linear unabhängigen Vektoren a, b bez¨ uglich des Standardskalarprodukts orthogonal ist.

Es muss dann das homogene LGS a1 x1 + a2 x2 = −a3 x3 | · b2 b1 x1 + b2 x2 = −b3 x3 | · (−a2 ) (a1 b2 − a2 b1 )x1 = (a2 b3 − a3 b2 )x3

a1 x1 + a2 x2 + a3 x3 b1 x1 + b2 x2 + b3 x3

+

= =

0 0

gelöst werden:

a1 x1 + a2 x2 = −a3 x3 | · (−b1 ) b1 x1 + b2 x2 = −b3 x3 | · a1

+

(a1 b2 − a2 b1 )x2 = (a3 b1 − a1 b3 )x3

Eine Lösung ist (x1 , x2 , x3 ) = (a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 ). ⎛

⎞ ⎛ ⎞ a1 b1 ⎝ ⎠ ⎝ Definition 1: F¨ ur a = a2 , b = b2 ⎠ ∈ IR3 nennt man den Vektor a3 b3 ⎛ ⎞ ⎛ ⎞ ⎞ ⎛

a2 b3 − a3 b2

⎜ ⎟ ⎝ a3 b1 − a1 b3 ⎠

a1 b2 − a2 b1

das Vektorprodukt oder das äußere Produkt von a und b. Man schreibt daf¨ ur a × b (lies a kreuz b“). ”

a1

⎜ ⎟ ⎜ ⎝ a2 ⎠H ⎝ HH a3 H ⎞ ⎛ HH⎛ a1 H ⎟ H⎜ ⎜ ⎝ a2 ⎠ H⎝

a3

b1 b2 b3 b1 b2 b3

⎟ ⎠

⎞ ⎟ ⎠

⎛

⎞

x1 + − ⎟ ⎜ ⎝ x2 ⎠ H HH x3

Fig. 1: Vektorprodukt

Zur Berechnung des Vektorprodukts kann man das Schema in Fig. 1 benutzen. ur Vektoren Das Vektorprodukt ist nur f¨ ur Vektoren aus IR3 definiert, nicht f¨ 2 4 5 aus IR oder IR , IR , . . . Das Vektorprodukt ist wieder ein Vektor; darin unterscheidet es sich wesentlich vom Skalarprodukt. Das Vektorprodukt hat folgende Eigenschaften, welche leicht nachzurechnen sind: (1) Genau dann ist a × b = o, wenn {a, b} linear abhängig ist. (2) b × a = −a × b f¨ ur alle a, b ∈ IR3 . (3) a × (b + c) = (a × b) + (a × c) f¨ ur alle a, b, c ∈ IR3 . (4) a × (rb) = r(a × b) f¨ ur alle a, b ∈ IR3 und alle r ∈ IR. (5) (a × b; a) = 0 und (a × b; b) = 0 f¨ ur alle a, b ∈ IR3 . Das Vektorprodukt ist nicht kommutativ, stattdessen gilt Regel (2). Es gilt auch nicht das Assoziativgesetz, i. Allg. ist a × (b × c) = (a × b) × c.

III.4 Vektorprodukt und Spatprodukt

81

Satz 1: Schließen a, b ∈ IR3 den Winkel ϕ (0o ≤ ϕ ≤ 180o ) ein, dann gilt: |a × b| =

(a; a)(b; b) − (a; b)2 = |a| · |b| · sin ϕ

Beweis: Es gilt (a × b; a × b) = (a2 b3 − a3 b2 )2 + (a1 b3 − a3 b1 )2 + (a1 b2 − a2 b1 )2 = (a21 + a22 + a23 )(b21 + b22 + b23 ) − (a1 b1 + a2 b2 + a3 b3 )2 = (a, a)(b, b) − (a, b)2 = |a|2 · |b|2 · (1 − cos2 ϕ) = |a|2 · |b|2 · sin2 ϕ Wegen |a × b | = |a | · |b | · sin < ) (a, b) ist |a × b | der Flächeninhalt des von a und b aufgespannten Parallelogramms (Fig. 2). Sind die Vektoren a, b, c paarweise orthogonal, dann ist |(a × b; c)| = |a| · |b| · |c|. Dies ist das Volumen des von a, b, c aufgespannten Quaders. Satz 2: Der von den Vektoren a, b, c im Raum aufgespannte Spat (Fig. 3) hat das Volumen V = |(a × b; c) |. Beweis: Ist ϕ der Winkel zwischen a × b und c, dann hat der Spat den Grundflächeninhalt |a × b | und die Höhe ||c | · cos ϕ|. Es ist also

2

C C b C |b| · sin ϕ C C : C ϕ C a

Fig. 2: Zum Vektorprodukt

a × b 6

c h 3 ϕ b -

a

V = |a × b | · |c | · | cos ϕ| = |(a × b; c) |. 2

Fig. 3: Zum Spatprodukt

Definition 2: F¨ ur drei Vektoren a, b, c ∈ IR3 nennt man die Zahl (a × b; c) das Spatprodukt dieser Vektoren. Genau dann ist (a × b; c) = 0, wenn {a, b, c} linear abhängig ist. Satz 3: Bei Vertauschung der Vektoren a¨ndert ein Spatprodukt höchstens sein Vorzeichen, nicht aber seinen Betrag. F¨ ur alle a, b, c ∈ IR3 gilt (a ×b; c) = (b × c; a) = (c × a; b). Bei zyklischer Vertauschung der Vektoren ändert sich also das Vorzeichen nicht. Bei jeder anderen Vertauschung ändert der Term sein Vorzeichen.


82

Beweis: Die Aussage des Satzes bestätigt man sofort an dem Term (a × b; c) = a1 b2 c3 + a2 b3 c1 + a3 b1 c2 − a3 b2 c1 − a1 b3 c2 − a2 b1 c3 .

2

Man schreibt diesen Term aus Satz 3 f¨ ur das Vektorprodukt auch in der Form a 1 a2 a3

b1 c1 b2 c2 b3 c 3

⎛

⎞

a1 b1 c1 ⎟ oder det ⎜ a, b, c) ⎝ a2 b2 c2 ⎠ = det ( a3 b3 c3

und nennt ihn die Determinante der Vektoren a, b, c. (Mit Determinanten beschäftigen wir uns allgemeiner in Kapitel IV.) Zur Berechnung obiger Determinante dient das Schema in Fig. 4 (Regel von Sarrus, nach P. F. Sarrus, 1798–1861). Determinanten kann man zum Lösen eines LGS mit drei Variablen und drei Gleichungen verwenden: Das LGS

@ @ @ @ @ a@ @ c @ a b1 1 @ 1 @ b1 @ 1 @ @ @ @ a2@ b2@ c2@ a@ b2 2 @ @ @ @ @ @ @ a3 b@ 3 @ c 3 @ a3 @ b 3 @ @ @ @ @ − @ +@ +@+ − − @ @ @

a1 x1 + b1 x2 + c1 x3 = d1 a2 x1 + b2 x2 + c2 x3 = d2 a3 x1 + b3 x2 + c3 x3 = d3

Fig. 4: Regel von Sarrus

⎛

⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ a1 b1 c1 d1 kann man mit a = ⎝ a2 ⎠, b = ⎝ b2 ⎠, c = ⎝ c2 ⎠, d = ⎝ d2 ⎠ in der Form a3 b3 c3 d3

x1a + x2b + x3c = d schreiben. Das LGS und damit diese Vektorgleichung sind eindeutig lösbar, wenn {a, b, c} linear unabhängig ist, wenn also (a × b; c) = 0 gilt. Bildet man in der Vektorgleichung der Reihe nach das Skalarprodukt mit b × c, c × a, a × b, dann ergeben sich die Gleichungen x1 · (b × c; a) = (b × c; d), x2 · (c × a; b) = (c × a; d), x3 · (a × b; c) = (a × b; d). Wegen der zyklischen Vertauschbarkeit der Vektoren im Spatprodukt folgt x1 =

(d × b; c) (a × b; c)

x2 =

(a × d; c) (a × b; c)

x3 =

(a × b; d) . (a × b; c)

Schreibt man die Spatprodukte als Determinanten, so ergibt sich die u ¨bliche Form der cramerschen Regel (nach Gabriel Cramer, 1704–1752):

III.4 Vektorprodukt und Spatprodukt

83

Satz 4: Ist {a, b, c} linear unabhängig, dann ist das LGS x1a + x2b + x3c = d eindeutig lösbar und die Lösung lautet x1 =

det(d, b, c) , det(a, b, c)

x2 =

det(a, d, c) , det(a, b, c)

x3 =

det(a, b, d) . det(a, b, c)

Ist c1 = c2 = a3 = b3 = d3 = 0 und c3 = 1, so ergibt sich die cramersche Regel f¨ ur ein lineares Gleichungssystem mit zwei Gleichungen und zwei Variablen: Ist a1 x1 + b1 x1 = d1 a1 b2 − a2 b1 = 0, dann ist eindeutig lösbar und hat die a2 x1 + b2 x2 = d2 Lösung d b a d 1 1 1 1 a b d2 b 2 a2 d2 1 , x2 = mit 1 = a1 b2 − a2 b1 usw. x1 = a b a2 b 2 a1 b 1 1 1 a2 b 2 a2 b2 Die folgenden Eigenschaften der Determinante ergeben sich aus ihrer Darstellung als Spatprodukt (Aufgabe 4): uglich a2 , a3 (λ ∈ IR); (1) det(λ a1 , a2 , a3 ) = λ det(a1 , a2 , a3 ) und ebenso bez¨ ersetzt man also eine Spalte durch das λ-fache, dann ändert sich auch die Determinante um das λ-fache. (2) det (a1 + a2 , a2 , a3 ) = det (a1 , a2 , a3 ) usw.; die Determinante ändert sich also nicht, wenn man eine Spalte zu einer anderen addiert. (3) det (s1 , s2 , s3 ) = 1 f¨ ur die Standardbasis {s1 , s2 , s3 }. Aus diesen Eigenschaften oder direkt aus der Darstellung als Spatprodukt gewinnt man noch die folgenden Eigenschaften: (4) Genau dann ist det (a1 , a2 , a3 ) = 0, wenn {a1 , a2 , a3 } linear abhängig ist. (5) det (u + v , a2 , a3 ) = det (u, a2 , a3 ) + det (v , a2 , a3 ) usw. (6) Die Determinante ändert ihren Wert nicht, wenn man zu einer Spalte eine Linearkombination der anderen Spalten addiert. ⎛

a11 Berechnet man die Determinante von A = ⎝ a21 a31 Sarrus (Fig. 4), dann ergibt sich

a12 a22 a32

⎞ a13 a23 ⎠ nach der Regel von a33

detA = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a11 a23 a32 − a12 a21 a33 . Die Summanden sind von der Form (−1)σ a1i a2j a3k , wobei σ = 1, falls das Tripel (i, j, k) durch eine gerade Anzahl von Nachbar-Vertauschungen (Transpositionen) aus (1, 2, 3) hervorgeht, andernfalls σ = −1. Hieran erkennt man u.a., dass det AT = det A. (Vgl. hierzu IV.3.)


84

Aufgaben 1. Ein Dreieck auf einer Kugel heißt

....................... ................................C........................... . . . . . . ......t....... ... .... ...............t....... ............ .................. ........... ............... ....... . . . . ... .. ......... ...A ... ..... ........t....B.. .. ............ ... ...... .. ...... ...... . ... .. ... ... ... ... ...... .. ...... . .... .. ...... .... . ...... ....... ......t ....... ......... . ..... . ...... O ........ . . .. ..... ... ... . ... . . . . . . . . . . ... ... . ..... .. ... ....... ... ..... .. ... ..... . ..... .... ....... . . . . ..... ............. ...... .......... ..................... ........ .................................................... .............. ..........................................

ein sphärisches Dreieck (Fig. 5). Seine Seiten sind Großkreisbögen, liegen also auf einem Kreis, der von einer Ebene durch den Mittelpunkt aus der Kugel ausgeschnitten wird. Die Winkel in einem solchen Dreieck sind die Winkel zwischen den Normalenvektoren der Großkreisebenen, in Fig. 5: Sph¨ arisches Dreieck denen die Seiten liegen. Sind a, b, c die Ortsvektoren eines sphärischen Dreiecks ABC, dann ist der Winkel α bei A der Winkel, den die Normalenvektoren der Ebenen durch O, A, B und durch O, A, C einschließen. Wie berechnet man diesen Winkel?

2. a) Man zeige, dass (a × b) × c eine Linearkombination von a und b ist. als Linearkombination von a, b und als b) Man stelle (a × b) × (c × d) Linearkombination von c, d dar und leite daraus die Lösungsformel f¨ ur ein 3,3-LGS her.

3. Man berechne das Volumen der Dreieckspyramide mit den Ecken A(1, 1, 0), B(2, −4, 5), C(−2, 1, 4), D(3, 1, 2). Man beachte dabei, dass ein Spat in sechs volumengleiche Dreieckspyramiden zerlegt werden kann.

4. Man beweise die angegebenen Determinanteneigenschaften (1) bis (6). a b = ad − bc. Man zeige, dass c d ⎞ a13 a22 a23 a12 a23 ⎠ = a11 det − a21 det a32 a33 a32 a33

5. a) Es sei det ⎛

a11 ⎝ a21 a31

a12 a22 a32

a13 a33

+ a31 det

a12 a22

a13 . a23

b) Man pr¨ Determinante, f¨ ur welche Werte von a die ⎛ufe mit ⎞ ⎛Hilfe ⎞ einer ⎛ ⎞ 1

4

2

a2

a

a

Vektoren ⎝ a ⎠ , ⎝ 1 ⎠ , ⎝ 7 ⎠ linear unabhängig sind. c) Unter welcher Voraussetzung u ¨ber a, b, c hat das folgende homogene LGS nur die triviale Lösung? x1 + ax2 + a2 x3 = 0 x1 + bx2 + b2 x3 = 0 x1 + cx2 + c2 x3 = 0

IV Determinanten IV.1 Die Determinante einer Matrix Definition 1: Es sei det eine Funktion auf der Menge aller n-Tupel von Vektoren aus K n mit Werten in K (also det: (K n )n −→ K) mit folgenden Eigenschaften: (1) det (a1 , a2 , . . . , an ) geht u ¨ber in r det (a1 , a2 , . . . , an ), wenn ein Vektor ai ersetzt wird durch rai (r ∈ K); (2) det (a1 , a2 , . . . , an ) ändert sich nicht, wenn ein Vektor ai ersetzt wird durch ai + ak mit k = i; (3) det (e1 , e2 , . . . , en ) = 1 ({e1 , e2 , . . . , en } Standardbasis von K n ). Dann nennt man det (a1 , a2 , . . . , an ) eine Determinante von (a1 , a2 , . . . , an ). Aus (1) und (2) ergeben sich unmittelbar weitere Eigenschaften der Determinante: (4) det(a1 , a2 , . . . , an ) a¨ndert sich nicht nicht, wenn man zu einem der Vektoren eine Linearkombination der anderen addiert; (5) det (a1 , a2 , . . . , an ) = 0, wenn einer der Vektoren der Nullvektor ist. (6) det (a1 , a2 , . . . , an ) = 0, wenn {a1 , a2 , . . . , an } linear abhängig ist. Wir werden später sehen, dass eine Funktion det: (K n )n −→ K mit den Eigenschaften (1) bis (3) existiert und durch (1) bis (3) eindeutig bestimmt ist. Zunächst wollen wir aber noch weitere Folgerungen aus (1) bis (3) ziehen. Satz 1: Vertauscht man in det (a1 , a2 , . . . , an ) zwei Vektoren, dann ändert sich das Vorzeichen der Determinante. Beweis: Die Vertauschung von ai und ak mit i = k kann man in folgenden Schritten vornehmen: ai zu ak addieren; an der k-ten Stelle steht jetzt ak + ai ; ak + ai von ai subtrahieren; an der i-ten Stelle steht jetzt −ak ; ai von ak + ai subtrahieren; an der k-ten Stelle steht jetzt ai . Jetzt sind ai und ak vertauscht und auf der i-ten Stelle ist ein Minuszeichen aufgetaucht. 2 Satz 2 (Additionstheorem): Ersetzt man einen der Vektoren in det (a1 , a2 , . . . , an ) durch eine Linearkombination beliebiger Vektoren aus K n , dann ergibt sich die entsprechende Summe von Determinanten: det (a1 , . . . , ai−1 , m j=1

m j=1

rjbj , ai+1 , . . . an ) =

rj det (a1 , . . . , ai−1 , bj , ai+1 , . . . an )

IV Determinanten

86 Beweis: Es gen¨ ugt der Nachweis, dass f¨ ur alle v , w ∈ K n gilt:

det (v + w, a2 , . . . , an ) = det (v , a2 , . . . , an ) + det (w, a2 , . . . , an ) Wegen (6) kann man sich auf den Fall beschränken, dass {a2 , a3 , . . . , an } linear unabhängig ist. Diese Menge ergänze man zu einer Basis {b, a2 , a3 , . . . , an } von K n . Dann ist v = rb + c und v = sb + d mit r, s ∈ K und c, d ∈ a2 , a3 , . . . , an . Wegen (4) gilt dann det (v , a2 , . . . , an ) = r det (b, a2 , . . . , an ), det (w, a2 , . . . , an ) = s det (b, a2 , . . . , an ) und det (v + w, a2 , . . . , an ) = (r + s) det(b, a2 , . . . , an ).

2

Satz 3: Ist det (a1 , a2 , . . . , an ) = 0 und {b1 , b2 , . . . , bn } ⊆ a1 , a2 , . . . , an , dann ist auch det (b1 , b2 , . . . , bn ) = 0. Beweis: Ersetzt man die bi durch Linearkombinationen aus {a1 , a2 , . . . , an }, dann ist nach Satz 2 die Determinante det (b1 , b2 , . . . , bn ) eine Summe von Determinanten, deren Spaltenvektoren aus {a1 , a2 , . . . , an } stammen. 2 Satz 4: Ist {a1 , a2 , . . . , an } linear unabhängig, dann ist det(a1 , a2 , . . . , an ) = 0. Beweis: Die Vektoren der Standarbasis lassen sich als Linearkombinationen der 2 Vektoren a1 , a2 , . . . , an schreiben. Aus (3) und Satz 3 folgt daher Satz 4. Eigenschaft (6) und Satz 4 besagen also zusammen, dass {a1 , a2 , . . . , an } genau dann linear unabhängig ist, wenn det (a1 , a2 , . . . , an ) = 0. Satz 5: Die Determinante (also die Abbildung det: (K n )n −→ K) ist durch die Eigenschaften (1), (2) und (3) eindeutig bestimmt. Beweis: Besitzen det1 und det2 beide die Eigenschaften (1) und (2), dann besitzt auch f = det1 − det2 die Eigenschaften (1) und (2). Nach (3) gilt f (e1 , e2 , . . . , en ) = 0. Nach Satz 3 ist also f (a1 , a2 , . . . , an ) = 0 f¨ ur alle a1 , a2 , . . . , an ∈ K n und daher ur alle a1 , a2 , . . . , an ∈ K n . det1 (a1 , a2 , . . . , an ) = det2 (a1 , a2 , . . . , an ) f¨

2

Die Existenz der Abbildung det: (K n )n −→ K mit (1), (2) und (3) ist nun leicht einzusehen, da man mit (1), (2) und (3) und den weiteren daraus hergeleiteten Eigenschaften den Wert von det (a1 , a2 , . . . , an ) f¨ ur alle a1 , a2 , . . . , an berechnen kann. Analog zu den elementaren Umformungen eines LGS kann man Umformungen mit den Vektoren der Determinante ausf¨ uhren, bei denen sich die Determinante nicht ändert oder nur ihr Vorzeichen wechselt. Diesen im Folgenden dargestellten Prozess benutzt man (in modifizierter Form) auch in der Praxis eher als die systematischen Verfahren zur Berechnung der Determinanten, die wir im nächsten Abschnitt vorstellen werden:

IV.1 Die Determinante einer Matrix

87

• Ist die 1. Koordinate des 1. Vektors 0, dann vertausche man ihn gegen einen Vektor, dessen 1. Koordinate nicht 0 ist, falls ein solcher existiert. Durch Subtraktion eines Vielfachen des 1. Vektors vom 2., 3., . . . n. Vektor erreicht man dann, dass diese die erste Koordinate 0 haben. • Ist die 2. Koordinate des 2. Vektors 0, dann vertausche man ihn gegen einen vom 1. verschiedenen Vektor, dessen 2. Koordinate nicht 0 ist, falls ein solcher existiert. Durch Subtraktion eines Vielfachen des 2. Vektors vom 3., 4.,. . . ,n. Vektor erreicht man dann, dass diese die 2. Koordinate 0 haben. • Ist die 3. Koordinate des 3. Vektors 0, dann vertausche man ihn gegen einen vom 1. und 2. verschiedenen Vektor, dessen 3. Koordinate nicht 0 ist, falls ein solcher existiert. Durch Subtraktion eines Vielfachen des 3. Vektors vom 4., 5.,. . . ,n. Vektor erreicht man dann, dass diese die 3. Koordinate 0 haben. • So fortfahrend erhält man eine Determinante aus Vektoren, bei denen die ersten i − 1 Koordinaten des i. Vektors 0 sind; diese Determinante unterscheidet sich von der Ausgangsdeterminante wegen der Vertauschungen möglicherweise durch das Vorzeichen. Ist die i. Koordinate des i. Vektors 0, dann sind die letzten n − i + 1 Vektoren linear abhängig und der Wert der Determinante ist 0. • Ist die i. Koordinate des i. Vektors von 0 verschieden, dann kann man durch Subtraktion eines Vielfachen des i. Vektors von allen vorangehenden erreichen, dass diese die i. Koordinate 0 haben (i = 2, 3, . . . n). Ist nun aii die i. Koordinate des i. Vektors (also seine einzige von 0 verschiedene Koordinate), dann hat die Determinante den Wert a11 a22 · . . . · ann · det (e1 , e2 , . . . , en ) = a11 a22 · . . . · ann . ⎛⎛

Beispiel 1: ⎛⎛

1

det⎝⎝ 0 0

⎞ ⎛ ⎞ ⎛ ⎞⎞ ⎛⎛ ⎞ ⎛ 1 5 2 1 0 det⎝⎝ 2 ⎠ , ⎝ 7 ⎠ , ⎝ 4 ⎠⎠= det⎝⎝ 2 ⎠ , ⎝ −3 1 2 1 1 −3 ⎞ ⎛ ⎞ ⎛ ⎞⎞ ⎛⎛ ⎞ ⎛ 1 0 0 ⎠ , ⎝ −3 ⎠ , ⎝ 0 ⎠⎠= (−3)(−1) det⎝⎝ 0 ⎠ , ⎝ 0 −1 0

⎞ ⎛

⎞⎞ 0 ⎠ , ⎝ 0 ⎠⎠= −1 ⎞ ⎛ ⎞⎞ 0 0 ⎠ ⎝ 1 0 ⎠⎠ = 3 , 0 1

Unter der Determinante der Matrix A ∈ K n,n versteht man die Determinante aus ihren Spaltenvektoren, versteht A also als Element aus (K n )n , und verwendet daf¨ ur verschiedene Schreibweisen: ⎛ ⎜ ⎜ det ⎜ ⎝

a11 a21 .. .

a12 a22 .. .

... ...

a1n a2n .. .

an1

an2

...

ann

⎞ a11 ⎟ a21 ⎟ = ⎟ .. ⎠ . an1

a12 a22 .. .

... ...

a1n a2n .. .

an2

...

ann

⎛ ⎞⎞ ⎛⎛ ⎞ ⎛ ⎞ a12 a1n a11 ⎜a2n⎟⎟ ⎜⎜a21 ⎟ ⎜a22 ⎟ ⎜ ⎟⎟ ⎜⎜ ⎟ ⎜ ⎟ = det ⎜⎜ .. ⎟ , ⎜ .. ⎟ , . . . , ⎜ .. ⎟⎟ ⎝ . ⎠⎠ ⎝⎝ . ⎠ ⎝ . ⎠ an1 an2 ann

IV Determinanten

88

1 oT Satz 6: Die Matrix A = ∈ K n+1,n+1 entsteht aus A ∈ K n,n o A durch Hinzuf¨ ugen einer ersten Zeile und einer ersten Spalte mit den Elementen 1, 0, 0, . . . , 0. Dann gilt detA = detA.

Beweis: detA hat in Abhängigkeit von den Spaltenvektoren von A die gleichen Eigenschaften (1), (2), (3) wie detA, so dass die Behauptung aus Satz 5 folgt.2 Steht in Satz 6 in der ersten Zeile von A statt oT ein beliebiger Vektor aus K n , dann gilt ebenfalls detA = detA, denn man kann diese erste Zeile mit Hilfe der ersten Spalte in 1, 0, 0, . . . , 0 verwandeln. Analoges gilt f¨ ur den Fall, dass in der ersten Spalte von A statt o ein beliebiger Vektor steht. Beispiel 2: =

a11 = 0 0 0 a21 a11 0 0 a22 a23 − 0 0 a32 a33 0 a a a23 = a11 22 − a21 12 a32 a33 a32 a11 a21 a31

a12 a22 a32

a13 a23 a33

a12 a22 a32

0 + a21 0 0 a31 a13 + 0 a33 0 + a31 a12 a22 a13 a23 a33

0 a12 a32 a13 a33

a12 a22 a32 0 a12 a22

0 + 0 a31 0 a13 a23

a13 a23 a33

a12 a22 a32

a13 a23 a33

a13 (vgl. Satz 6) a23

= a11 (a22 a32 − a23 a32 ) − a21 (a12 a33 − a13 a32 ) + a31 (a12 a23 − a13 a22 ) = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a12 a21 a33 − a13 a22 a31 − a11 a23 a32 Hier stehen alle Produkte a1i a2j a3k , und zwar mit dem Minuszeichen, wenn das Tripel (i, j, k) aus (1, 2, 3) durch eine einzige Nachbarvertauschung hervorgeht, und mit dem Pluszeichen, wenn es durch keine oder eine zweifache Vertauschung aus (1, 2, 3) hervorgeht. Der folgende Satz besagt, dass die Determinante eines Produktes zweier Matrizen gleich dem Produkt der einzelnen Determinanten ist. Satz 7 (Multiplikationstheorem): F¨ ur zwei Matrizen A, B ∈ K n,n gilt det AB = det A · det B. Beweis: Ist det B = 0, dann ist der Rang von B kleiner als n, das LGS Bx = o hat also eine nichttriviale Lösung. Dann hat auch das LGS (AB)x = o wegen (AB)x = A(Bx) eine nichttriviale Lösung, also ist der Rang von AB kleiner als n und somit det AB = 0. Ist det B = 0, dann betrachten wir den Ausdruck D(A) =

det (AB) det(B)

bei festem B in Abhängigkeit von den Spaltenvektoren von A. Er hat dann die Eigenschaften (1), (2) und (3), nach Satz 5 gilt also D(A) = det (A).

2

IV.1 Die Determinante einer Matrix

89

Die Matrix A ∈ K n,n ist genau dann invertierbar, wenn det(A) = 0, denn genau dann sind ihre Spaltenvektoren linear unabhängig. In diesem Fall gilt det(A−1 ) = (det A)−1 , wie unmittelbar aus Satz 7 folgt. Satz 8: F¨ ur A ∈ K n,n hat die transponierte Matrix AT die gleiche Determinante wie A, es gilt also det AT = det A f¨ ur alle A ∈ K n,n . Beweis: Aufgrund von Satz 5 muss man nur zeigen, dass die Eigenschaften (1), (2) und (3) auch f¨ ur die Zeilenvektoren einer Matrix gelten. Bei (3) ist dies unmittelbar klar. (1) Die Multiplikation der i. Zeile einer Matrix aus K n,n mit r ∈ K bewerkstelligt man durch linksseitige Multiplikation mit der Diagonalmatrix ur j = i und dii = r sowie dij = 0 sonst. D = (dij ) mit djj = 1 f¨ Es gilt det D = r, wegen Satz 7 geht det A also in r det A u ¨ber, wenn man einen Zeilenvektor durch sein r-faches ersetzt. (2) Die Addition der k. Zeile zur i. Zeile (k = i) bewerkstelligt man durch linksseitige Multiplikation mit der Matrix M = (mij ) mit mjj = 1 und mik = 1 sowie mij = 0 sonst. Wegen det M = 1 ist det M A = det A, der Wert von det A ändert sich also nicht, wenn man eine Zeile zu einer anderen addiert (Fig. 1). 2 ⎛ ⎜ ⎜ ⎜ ⎜ D=⎜ ⎜ ⎜ ⎜ ⎝

1 0 0 0 0 0

0 1 0 0 0 0

0 0 r 0 0 0 ↑ i

0 0 0 1 0 0

0 0 0 0 1 0

0 0 0 0 0 1

⎞

⎛

⎟ ⎟ ⎟ ⎟← i ⎟ ⎟ ⎟ ⎟ ⎠

⎜ ⎜ ⎜ ⎜ M =⎜ ⎜ ⎜ ⎜ ⎝

1 0 0 0 0 0

0 1 0 0 0 0

0 0 1 0 0 0

0 0 0 1 0 0

0 1 0 0 1 0 ↑ k

0 0 0 0 0 1

⎞ ⎟← i ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠

Fig. 1: Zum Beweis von Satz 8

Zum Berechnen einer Determinante können wir also sowohl Spaltenumformungen als auch Zeilenumformungen benutzen. Beispiel 3 (Zur¨ uckf¨ uhrung einer vierreihigen auf eine dreireihige Determinante):

1 2 7 2

1 5 6 6

1 9 1 8

1 3 9 1

=

1 0 0 0

1 3 −1 4

1 1 7 1 −6 2 6 −1

=

1 0 0 0

0 3 −1 4

0 0 7 1 −6 2 6 −1

3 = −1 4

7 1 −6 2 6 −1

IV Determinanten

90

Beispiel 4:

2 7 −1

5 9 2

3 5 1

1 4 = (−1) 5 3

2 9 5

−1 7 2

1 = 0 0

2 −1 −1

−1 12 5

(zwei Zeilenvertauschungen und zwei Spaltenvertauschungen, 5-faches der ersten Zeile von der zweiten subtrahieren, 3-faches der ersten Zeile von der dritten Zeile subtrahieren)

1 = − 0 0

0 1 1

0 12 5

1 = − 0 0

0 1 1

0 0 −7

1 = 7 0 0

0 1 1

0 0 1

1 = 7 0 0

0 1 0

0 0 1

=7

(2-faches der ersten Spalte von zweiter subtrahieren, erste Spalte zu dritter Spalte addieren, aus zweiter Spalte Faktor −1 herausziehen, 12-faches der zweiten Spalte von der dritten subtrahieren, Faktor −7 aus der dritten Spalte herausziehen, dritte Spalte von zweiter subtrahieren)

Mit Hilfe von Determinanten kann man die Lösung eines eindeutig lösbaren LGS mit n Gleichungen f¨ ur n Variable sehr einfach allgemein angeben. F¨ ur die Praxis ist dies von geringer Bedeutung, da das Berechnen von Determinanten in der Regel sehr aufwändig ist: Satz 9 (cramersche Regel, nach Gabriel Cramer, 1709–1752): Es sei {a1 , a2 , . . . , an } eine linear unabhängige Teilmenge von K n . Dann hat die Vektorgleichung bzw. das LGS x1a1 + x2a2 + . . . + xnan = b die (eindeutige) Lösung xj =

det (a1 , a2 , . . . , aj−1 , b, aj+1 , . . . , an ) det (a1 , a2 , . . . , aj−1 , aj , aj+1 , . . . , an )

(j = 1, 2, . . . , n).

Beweis: Man ersetze in det (a1 , a2 , . . . , aj−1 , b, aj+1 , . . . , an ) den Vektor b durch die Linearkombination

n

j=1

xjaj und wende Satz 2 an.

2

Aufgaben 1. Man zeige, dass für eine Matrix aus IR2,2 mit den Spaltenvektoren a1 , a2 die Gleichung |a1 |2 |a2 |2 sin2 α = (det A)2 gilt, wobei α der Winkel zwischen a1 und a2 ist. (Dabei sind a1 , a2 als Verschiebungsvektoren in einem kartesischen Koordinatensystem gedeutet.)

IV.2 Explizite Darstellung und Berechnung

91

2. Eine Matrix aus IRn,n heißt Orthonormalmatrix, wenn ihre Spaltenvektoren bez¨ uglich des Standardskalarprodukts paarweise orthogonale Einheitsvektoren sind. Warum kann die Determinante einer Orthonormalmatrix nur die Werte 1 oder −1 annehmen?

3. Es sei A = (ij−1 )n,n . Man zeige, dass det A = 0!1!2! · . . . · (n − 1)!, wobei 0! = 1 und k! = 1 · 2 · 3 · . . . · k ( k Fakultät“) f¨ ur k ∈ IN. ” 4. Man zeige, dass

a1 a2 a3 a4 a5

1 1 1 1 1

a21 a22 a23 a24 a25

a31 a32 a33 a34 a35

a41 a42 a43 a44 a45

= (a2 − a1 )(a3 − a1 )(a3 − a2 )(a4 − a1 )(a4 − a2 )· ·(a4 − a3 )(a5 − a1 )(a5 − a2 )(a5 − a3 )(a5 − a4 )

5. Aus einer Matrix A ∈ Rk,k und einer Matrix B ∈ IRm,m bilde man die Matrix

M=

A Ok,m Om,k B

aus IRn mit n = k + m, wobei Om,k bzw. Ok,m die Nullmatrix aus IRm,k bzw. aus IRk,m ist. Man zeige, dass det M = det A · det B ist. Man zeige ferner, dass diese Beziehung auch gilt, wenn man Om,k durch eine beliebige Matrix aus IRm,k ersetzt.

IV.2 Explizite Darstellung und Berechnung Zur Vorbereitung des nächsten Satzes (explizite Darstellung der Determinante) beschäftigen wir uns zunächst mit Permutationen. Eine Permutation der Menge {1, 2, . . . , n} ist eine bijektive Abbildung dieser Menge auf sich; wird dabei k auf ak abgebildet (k = 1, 2, . . . , n), so schreibt man diese Permutation in der Form

1 2 3 ... n a1 a2 a3 . . . an

oder einfacher (a1 a2 a3 . . . an ).

Die Anzahl der Permutationen von {1, 2, . . . , n} ist n! = 1 · 2 · . . . · n (n Fakultät), denn f¨ ur den 1. Platz gibt es n Möglichkeiten, f¨ ur den 2. Platz noch n − 1 Möglichkeiten, f¨ ur den 3. Platz dann noch n − 2 Möglichkeiten usw. In einer gegebenen Permutation nennt man ein Paar (i, j) eine Inversion, wenn i<j

und ai > aj .

Eine Permutation heißt gerade oder ungerade, je nachdem, ob sie eine gerade oder eine ungerade Anzahl von Inversionen enthält.

IV Determinanten

92

Es gibt gleich viele gerade wie ungerade Permutationen, denn vertauscht man in einer Permutation zwei Elemente, dann ergibt sich aus einer geraden eine ungerade Permutation und umgekehrt, wie man folgendermaßen einsieht: Vertauscht man zwei benachbarte Elemente in (a1 a2 a3 . . . an ), dann ändert sich die Anzahl der Inversionen um ±1. Möchte man in (a1 a2 . . . ar . . . as . . . an ) mit r + 1 < s die Zahlen ar und as vertauschen, so erhält man zunächst durch s − r Nachbarvertauschungen (Transpositionen) (a1 a2 . . . ar+1 . . . as ar . . . an ), so dass jetzt ar an der fr¨ uheren Stelle von as steht und as unmittelbar davor. Durch weitere s − r − 1 Vertauschungen benachbarter Elemente kommt as schließlich an die fr¨ uhere Stelle von ar . Man hat also 2(s − r) − 1 Nachbarvertauschungen vorgenommen, und dies ist eine ungerade Zahl. Eine Permutation ist also gerade oder ungerade, je nachdem ob sie aus (1 2 3 . . . n) durch eine gerade oder eine ungerade Anzahl von Nachbarvertauschungen (Transpositionen) hervorgeht. Satz 1 (Explizite Darstellung der Determinante): Es gilt a11 a21 . . . an1

a12 . . . a1n a22 . . . a2n σ(π) · a1π(1) a2π(2) . . . anπ(n) , .. .. = . . π an2 . . . ann

wobei u ¨ber alle n! Permutationen π von (1, 2, . . . , n) summiert wird und σ(π) = +1, falls die Permutation π gerade ist, und σ(π) = −1, falls sie ungerade ist. Beweis: F¨ ur i = 1, 2, . . . , n sei ai der i-te Spaltenvektor. Es ist also ai = wobei {e1 , e2 , . . . , en } die Standardbasis von K n ist: ⎛

det (a1 , a2 , . . . , an ) = det ⎝

n

j=1

aj1ej ,

n j=1

aj2ej , . . . ,

n j=1

n j=1

ajiej ,

⎞

ajnej ⎠

Auflösung der Determinante nach den Regeln und Sätzen aus IV.1 liefert Summanden der Form det (aj1 1ej1 , aj2 2ej2 , . . . , ajn nejn ) = aj1 1 aj2 2 · . . . · ajn n det (ej1 , ej2 , . . . , ejn ), wobei (j1 j2 . . . jn ) eine Permutation π von (1 2 . . . n) ist. Die Matrix (ej1 , ej2 , . . . , ejn ) entsteht aus der Einheitsmatrix durch die Permutation π, ihre Determinante ist also σ(π). Es ergibt sich die im Satz angegebene Formel, aller¨ dings mit anderer Reihenfolge der Indizes; dies lässt sich aber durch Ubergang zur Umkehrpermutation π −1 beheben, wobei sich wegen σ(π −1 ) = σ(π) nichts 2 ändert.


93

Man könnte die Formel aus Satz 1 auch zur Definition der Determinante verwenden. Die in IV.1 benutzten definierenden Eigenschaften der Determinante muss man dann aus dieser Formel ablesen, was aber kein großes Problem ist. Weitere Eigenschaften wie etwa det AT = det A erkennt man auch sofort an der Formel in Satz 1. Diese Formel ist aber zur Berechnung einer Determinante in der Regel weniger brauchbar als die in IV.1 benutzten Verfahren. F¨ ur n = 3 ergibt Satz 1 die Formel von Sarrus (siehe III.4). Der folgende Satz 3 ist auch zur Berechnung einer Determinante manchmal n¨ utzlich; Satz 2 dient zur Vorbereitung von Satz 3. Satz 2: Die Matrix Aij ∈ K n−1,n−1 entstehe aus der Matrix A ∈ K n,n , indem man die i-te Zeile und j-te Spalte streicht (i, j = 1, 2, . . . , n). Die Matrix A∗ij ∈ K n,n entstehe aus der Matrix A ∈ K n,n , indem man aij durch 1 und alle u ¨brigen Elemente der i-ten Zeile und j-ten Spalte durch 0 ersetzt (i, j = 1, 2, . . . , n): ⎛

A∗ij

⎜ ⎜ ⎜ ⎜ ⎜ ⎜ =⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝

a11 a21 .. .

a12 a22 .. .

... ...

ai−1,1 0 ai+1,1 .. .

ai−1,2 0 ai+1,2 .. .

an1

an2

Dann ist

a1,j−1 a2,j−1 .. .

... ...

. . . ai−1,j−1 ... 0 . . . ai+1,j−1 .. .

0 a1,j+1 0 a2,j+1 .. .. . . 0 ai−1,j+1 1 0 0 ai+1,j+1 .. .. . .

...

0

...

an,j−1

an,j+1

a1n a2n .. .

. . . ai−1,n ... 0 . . . ai+1,n .. .

⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠

ann

det A∗ij = (−1)i+j det Aij .

Beweis: Durch j − 1 Nachbarvertauschungen bringe man die j-te Spalte von A∗ij an die erste Stelle und dann durch i − 1 Nachbarvertauschungen die i-te Zeile an die erste Stelle. Der Wert von detA∗ij hat dadurch (i − 1 + j − 1)-mal das Vorzeichen gewechselt, er hat sich also um den Faktor (−1)i−1+j−1 = (−1)i+j geändert. Nun gilt aufgrund von Satz 6 aus IV.1 allgemein

1 0 0 0 v11 v12 0 v21 v22 .. .. ... . . 0 vk1 vk2

... 0 . . . v1k . . . v2k .. . . . . vkk

v11 v21 = . .. vk1

v12 . . . v1k v22 . . . v2k .. . .. . . vk2 . . . vkk

2

Im folgenden Satz beziehen wir uns auf die oben eingef¨ uhrten Bezeichnungen. Satz 3 (Entwicklungssatz): F¨ ur j = 1, 2, . . . , n gilt det A =

n i=1

(−1)i+j aij det Aij

(Entwicklung nach der j-ten Spalte).

IV Determinanten

94 Beweis: Den j-ten Spaltenvektor aj zerlegen wir in die Standardbasis ist. Dann gilt det A = det (a1 , a2 , . . . , an ) =

n i=1

n i=1

aij ei , wobei {e1 , e2 , . . . , en }

det (a1 , . . . , aj−1 , aij ei , aj+1 , . . . , an ).

Ist aij = 0, dann hat die entsprechende Determinante in der Summe den Wert 0. Ist aij = 0, dann kann man in der entsprechenden Determinante alle anderen Elemente in der i-ten Zeile gleich 0 setzen. Man erhält also det A = woraus mit Satz 2 die Behauptung folgt.

n

i=1

aij det A∗ij , 2

Wegen det AT = det A gilt auch f¨ ur i = 1, 2, . . . , n det A =

n j=1

(−1)i+j aij det Aij

(Entwicklung nach der i-ten Zeile).

Eine Matrix A ∈ K n,n ist genau dann invertierbar, wenn det A = 0 gilt. Der folgende Satz enthält eine Formel zur Berechnung der inversen Matrix A−1 . Satz 4: Ist det A = 0 f¨ ur eine Matrix A ∈ K n,n , dann ist ⎛

A−1 =

⎜

1 ⎜ ⎜ det A ⎜ ⎝

α11 α21 . . . αn1 α12 α22 . . . αn2 .. .. .. . . . α1n α2n . . . αnn

⎞ ⎟ ⎟ ⎟ ⎟ ⎠

mit αji = (−1)j+i det Aji ,

wobei die Aji die in Satz 2 definierten Matrizen sind. Beweis: Die Matrix X = A−1 habe die Spaltenvektoren x1 , x2 , . . . , xn . Die Gleichung AX = E ist gleichbedeutend mit den n Gleichungen Axi = ei (i = 1, 2, . . . , n), wobei {e1 , e2 , . . . , en } die Standardbasis ist. Nach der cramerschen Regel (IV.1) hat Axi = ei die Lösung xTi = (x1i x2i . . . xni ) mit xji =

det (a1 , a2 , . . . , aj−1 , ei , aj+1 , . . . , an ) (−1)i+j det Aji = det (a1 , a2 , . . . , aj−1 , aj , aj+1 , . . . , an ) det A

mit den in Satz 2 definierten Matrizen Aij .

(j = 1, 2, . . . , n) 2

Das Ergebnis in Satz 4 ist zwar von theoretischem Interesse, in der Praxis ist es aber meistens einfacher, die Inverse folgendermaßen zu berechnen: Man löse f¨ ur i = 1, 2, . . . , n die Gleichungen Axi = ei durch elementare Zeilenumformungen, bilde also xi = A−1ei , woraus sich X = A−1 E = A−1 ergibt. Die Lösung obiger Gleichungen kann dabei simultan erfolgen. Ein Beispiel hierf¨ ur haben wir schon


95

in II.2 vorgerechnet, wir betrachten hier ein weiteres Beispiel f¨ ur das genannte Verfahren. ⎛

⎞ 1 −2 0 Beispiel: Es soll die Inverse der Matrix A = ⎝ 3 −4 7 ⎠ berechnet werden. 2 3 4

Dazu nehme man Zeilenumformungen an der um E erweiterten Matrix vor: ⎞ ⎛ 1 0 ⎠ 0 →⎝ 0 1 0 ⎞ ⎛ 1 0 0 1 0 ⎠→⎝ 0 0 2 0 ⎛ ⎞ ⎛ 1 −2 0 1 0 0 ⎝ ⎠ 41 0 0 82 287 −123 → →⎝ 119 −49 14 0 0 −287 ⎛ ⎞ ⎛ 41 −82 0 41 0 0 −8 14 ⎠ → ⎝ 82 0 −4 →⎝ 0 0 0 −287 119 −49 14 ⎛ 41 0 0 37 0 −2 → ⎝ 0 41 0 0 41 −17 ⎛

1 −2 0 1 ⎝ 3 −4 7 0 2 3 4 0 ⎛ 1 −2 0 1 2 7 −3 →⎝ 0 0 14 8 −4

0 1 0

⎞ −2 0 1 0 0 2 7 −3 1 0 ⎠ 7 4 −2 0 1 ⎞ −2 0 1 0 0 1 0 ⎠ 2 7 −3 0 −41 17 −7 2

⎞ 1 −2 0 1 0 0 0 82 0 −4 −8 14 ⎠ 0 0 −287 119 −49 14 ⎞ 41 0 0 37 −8 14 −8 14 ⎠ 0 82 0 −4 0 0 −287 119 −49 14 ⎞ −8 14 −4 7 ⎠ 7 −2

Links steht jetzt 41 E, rechts also das 41-fache von A−1 . Die gesuchte Inverse ist daher ⎛ ⎞ 37 −8 14 1 ⎜ 7 ⎟ A−1 = ⎝ −2 −4 ⎠. 41 −17 7 −2

Aufgaben 1. Man berechne die Determinanten a)

1+a 1 1 1+b 1 1 1 1

1 1 1 1 1+c 1 1 1+d

b)

a −1 0 0

2. Man berechne die Inverse der Matrix ⎛

1 ⎜ 1 ⎜ ⎝ 1 1

1 2 1 1

1 1 3 1

⎞ 1 1 ⎟ ⎟. 1 ⎠ 4

1 0 b 1 −1 c 0 −1

0 0 1 d

IV Determinanten

96

3. Man zeige, dass 1 a 1 1 b1 1 x1

a2 b3 x2

=0

bzw.

1 1 1 1

a1 b1 c1 x1

a2 b3 c2 x2

a3 b3 c3 x3

=0

die Gleichung einer Geraden in der Ebene durch die Punkte A(a1 , a2 ) und B(b1 , b2 ) bzw. die Gleichung einer Ebene im Raum durch die Punkte A(a1 , a2 , a3 ), B(b1 , b2 , b3 ), C(c1 , c2 , c3 ) ist.

4. a) Die Zeilenvektoren der Matrix An ∈ K n,n seien (1 xi x2i . . . xn−1 ) (1 = 1, 2, . . . , n). i Man berechne det An f¨ ur n = 2, 3, 4, 5. Man zeige dann durch vollständige Induktion, dass f¨ ur alle n ∈ IN gilt: det An ist das Produkt aller Terme xi − xj mit j < i. b) Man beweise mit Hilfe einer Determinante, dass ein Polynom vom Grad n durch seine Werte an n + 1 verschiedenen Stellen eindeutig bestimmt ist.

5. Man zeige, dass die Determinante Dn =

a1 1 −1 a2 0 −1 .. .. . . 0 0 0 0

0 1 a3 .. .

... ... ...

0 0 0 .. .

0 0

... ...

an−1 −1

1 an 0 0 0 .. .

der Rekursion Dn = an Dn−1 + Dn−2 gen¨ ugt.

6. a) Man berechne die Determinanten 1 (1) 2

2 1

1 (2) 2 3

2 3 3 1 1 2

(3)

1 2 3 4

2 3 4 1

3 4 1 2

4 1 2 3

b) Man zeige, dass f¨ ur alle n ∈ IN

1 2 .. .

2 3 .. .

3 4 .. .

... ...

n

1

2

...

n(n−1) n(n + 1) nn−2 . = (−1) 2 2 n−1 n 1 .. .

7. Eine Matrix A = (aij ) ∈ K n,n heißt Linksdreiecksmatrix, wenn aij = 0 für i < j; sie heißt Rechtsdreiecksmatrix, wenn aij = 0 f¨ ur i > j. Man zeige, dass die Inverse einer invertierbaren Linksdreiecksmatrix wieder einen solche und dass die Inverse einer invertierbaren Rechtsdreiecksmatrix ebenfalls wieder eine solche ist.

V Affine Abbildungen V.1 Darstellung affiner Abbildungen Definition 1: Eine bijektive (umkehrbare) Abbildung der Ebene oder des Raums auf sich nennt man eine affine Abbildung oder Affinität, wenn sie geradentreu ist, wenn sie also jede Gerade wieder auf eine Gerade abbildet. Satz 1: Jede affine Abbildung ist parallelentreu und teilverhältnistreu. Beweis: Haben die Geraden g, h keinen Punkt gemeinsam, dann gilt dies auch f¨ ur die Bildgeraden g , h , denn wäre P ein gemeinsamer Punkt von g , h , dann wäre der Urbildpunkt P von P ein gemeinsamer Punkt von g und h. Ein Parallelogramm wird daher wie................ A................................................. .... ..... ............................... . . der auf ein solches abgebildet. Al. . . . . . . . . . . . . . . . . . . . . A......................................r....................................B → ..... ........r......................... so wird der Mittelpunkt einer Stre......... ... ................................................. ... B cke AB auf den Mittelpunkt der Bildstrecke A B abgebildet (Fig. 1). Fig. 1: Mitte bleibt Mitte −→

−→

Ist allgemeiner AT = t AB, dann ist −→

−→

auch A T = t A B , wie man mit Hilfe der Strahlensätze sieht (Fig. 2). 2 Nun sei in der Ebene ein kartesisches Koordinatensystem gegeben. Die Bildpunkte von E1 (1, 0), E2 (0, 1) und O(0, 0) bei der affinen Abbildung α seien E1 (a1 , a2 ), E2 (b1 , b2 ) und O (c1 , c2 ).

A ....s . . . . A. .. .... .. ......... . . . s . . . . . . . . . .. . .s..... .. .. .... .... .......c...............s..T.. . . . . . . ... ... .. . .. .. .. ... ... .. .. .. .. .. .. .. .. ...T ... ... ..r......................... .. . . . ... ... .. .. ..... .. . . ... . ...s.. .. .. .. .. ... .. .. ..c.. .... . . . . . .. .. .. .. .. ....... B . ...s B Fig. 2: Teilverh¨ altnistreue

−→ 1 0 und OE2 = werden also auf die Vektoren 0 1 −→ −→ a −c u b −c v O E1 = 1 1 = 1 und O E2 = 1 1 = 1 abgebildet. a2 − c2 u2 b2 − c2 v2 −→

Die beiden Vektoren OE1 =

Wegen der Geradentreue und der Teilverhältnistreue von α wird dann der Punkt X(x1 , x2 ) auf den Punkt X (x1 , x2 ) mit dem Ortsvektor

u1 u2

v1 v2

x1 u1 v1 c1 = x1 + x2 + x2 u2 v2 c2

=

abgebildet (Fig. 3).

x1 c1 + x2 c2

6 AK. . . A ...... .... A .... . .X A .. A E .. .. AK 2 .. . . . . .X . .. A .. A 7. . .. AP P E2 .. P .. O A PP 6 . . . E P 1 qP .. P P P. P O E1 q P −→

−→

−→

−→

Fig. 3: OX =OO +x1 O E1 +x2 O E2

V Affine Abbildungen

98

Das kartesische Koordinatensystem wird dabei auf ein affines Koordinatensystem abgebildet. (Bei einem affinen Koordinatensystem sind die Achsen nicht notwendigerweise rechtwinklig und die Einheiten auf den Achsen nicht notwendigerweise gleich.) Ein Punkt mit den Koordinaten x1 , x2 im kartesischen Koordinatensystem wird auf den Punkt mit denselben Koordinaten x1 , x2 in diesem affinen Koordinatensystem abgebildet: −→

−→

−→

−→

−→

−→

Ist OX= x1 OE1 +x2 OE2 , dann ist O X = x1 O E1 +x2 O E2 . Entsprechendes gilt f¨ ur affine Abbildungen im Raum. Eine affine Abbildung α von IR2 bzw. IR3 auf sich wird also durch die Abbildungsgleichung x = α(x) = Ax + c gegeben, wobei die Matrix A invertierbar sein muss, damit α umkehrbar ist. Durch jede solche Abbildungsgleichung ist auch eine affine Abbildung gegeben, denn das Bild einer Geraden ist wieder eine Gerade: Die lineare Mannigfaltigkeit {a + tb | t ∈ IR} = a + b wird auf die lineare Mannigfaltigkeit {A(a + tb) + c | t ∈ IR} = {(Aa + c) + tAb | t ∈ IR} = (Aa + c) + Ab abgebildet. Damit ist folgender Satz bewiesen: Satz 2: Die affinen Abbildungen von IR2 auf sich bzw. IR3 auf sich sind genau die Abbildungen x → Ax + c mit A ∈ IR2,2 bzw. A ∈ IR3,3 und c ∈ IR2 bzw. c ∈ IR3 , wobei die Matrix A invertierbar ist. uglich der Satz 3: Die affinen Abbildungen von IRi auf sich (i = 2, 3) bilden bez¨ Verkettung eine Gruppe. Beweis: F¨ ur α : x → Ax + c und β : x → Bx + d gilt + c = (AB)x + (Ad + c), α ◦ β : x → A(Bx + d) und AB ist invertierbar, wenn A und B invertierbar sind. Die Umkehrabbildung der affinen Abbildung x → Ax + c ist die affine Abbildung x → A−1x − A−1c. 2 Satz 4: a) Eine affine Abbildung von IR2 auf sich ist durch drei nichtkollineare (nicht auf einer Geraden liegende) Punkte und ihre Bildpunkte eindeutig bestimmt. b) Eine affine Abbildung von IR3 auf sich ist durch vier nichtkomplanare (nicht in einer Ebenen liegende) Punkte und ihre Bildpunkte eindeutig bestimmt. Beweis: a) Die Behauptung lässt sich elementargeometrisch beweisen: Ist P Q R das Bild des Dreiecks P QR, dann liegt das Bild S eines weiteren Punktes S

V.1 Darstellung affiner Abbildungen

99

eindeutig fest: Die Gerade durch P und S schneide die Gerade durch Q und R in einem Punkt T . Aufgrund der Teilverhältnistreue liegt der Bildpunkt T von T auf der Geraden durch Q und S eindeutig fest. Ebenfalls aufgrund der ... Teilverhältnistreue liegt dann auch der Bild... . . R ....t S punkt S von S auf der Geraden durch P . ...t..... ... und T eindeutig fest (Fig. 4). .. . .......t.....T . ... ....... Man kann dies aber auch mit Hilfe ei..... ....... . ner Rechnung beweisen: F¨ ur die linear un. .....t ...t................................... Q −→ −→ P abhängigen Vektoren u =P Q und v =P R und und ihre Bildvektoren u , v ist die Matrix A mit Au = u und Av = v eindeutig bestimmt: Es gilt A = (u v )(u v )−1 ,

R

wobei (u v ) die Matrix mit den Spaltenvektoren u, v bedeutet. Mit

P ...t................. .. . ...........................t ..... ....... Q ...t... .. ...... ........ .. . . . . . . . ..t ... .. .......... T ........ S .. .. ............. ..t..

Fig. 4: Affine Abbildung

c = p − Ap = q − Aq = . . . (p, q, . . . Ortsvektoren von P,Q,. . . ) ist die lineare Abbildung x → Ax +c eindeutig bestimmt. b) Der Beweis f¨ ur affine Abbildungen im Raum verläuft analog. 2 Beispiel 1: Die affine Abbildung der Ebene, welche (0,0), (1,0), (0,1) (in dieser Reihenfolge) auf (1,2), (5,3), (3,9) abbildet, ist

4 2 1 α : x → . x + 1 7 2 Die affine Abbildung der Ebene, welche (0,0), (1,0), (0,1) (in dieser Reihenfolge) auf (3, −5), (11,1), (7, −2) abbildet, ist

8 4 3 x + . β : x → 6 3 −5 Die affine Abbildung der Ebene, welche (1,2), (5,3), (3,9) (in dieser Reihenfolge) auf (3, −5), (11,1), (7, −2) abbildet, ist dann also

β ◦ α−1 : x →

8 4 6 3

−1

4 2 1 7

x −

1 2

+

3 . −5

¨ Definition 2: Eine affine Abbildung heißt eine Ahnlichkeitsabbildung, wenn sie winkeltreu ist, wenn also jeder Winkel auf einen gleichgroßen Winkel abgebildet wird. Sie heißt eine Kongruenzabbildung, wenn sie längentreu ist, wenn also jede Strecke auf eine gleichlange Strecke abgebildet wird.


100

¨ Nat¨ urlich ist eine Kongruenzabbildung ein Sonderfall einer Ahnlichkeitsabbil¨ dung. Aquivalent mit der Winkeltreue ist die Forderung, dass sich alle Längen um ¨ den gleichen Faktor (Ahnlichkeitsfaktor) a¨ndern, wie man elementargeometrisch einsieht. Eine Matrix A ∈ IRn,n haben wir Orthonormalmatrix genannt, wenn AT A = E, wenn also ihre Spaltenvektoren paarweise orthogonale Einheitsvektoren bez¨ uglich des Standardskalarprodukts in IRn sind. Auch die Zeilenvektoren einer Orthonormalmatrix sind paarweise orthogonale Einheitsvektoren, d.h. mit AT A = E gilt auch AAT = E (Aufgabe 2). Im folgenden Satz beachte man, dass mit A auch −A orthogonal bzw. orthonormal ist, der in Satz 5 auftretende Faktor k kann also stets als positiv angenommen werden. ¨ Satz 5: Die Matrix einer Ahnlichkeitsabbildung hat die Form kA, wobei k ∈ IR+ und A eine Orthonormalmatrix ist. Die Matrix einer Kongruenzabbildung ist eine Orthnormalmatrix. Beweis: Die Bilder orthogonaler Einheitsvektoren m¨ ussen orthogonale Vektoren gleicher Länge k sein; im Fall der Kongruenzabbildung ist dabei k = 1. 2 ¨ Satz 6: Jede Ahnlichkeitsabbildung ist die Verkettung einer Kongruenzabbildung mit einer zentrischen Streckung mit dem Zentrum O. Beweis: Ist A eine Orthonormalmatrix, c ∈ IRn und k ∈ IR mit k = 0, dann ist kE die Matrix der zentrischen Streckung an O und kA = (kE)A, also

1 2 ur alle x ∈ IRn . c = A(kEx) + c f¨ k Es werden nun zwei wichtige Beispiele f¨ ur Kongruenzabbildungen vorgestellt. kA x + c = (kE) Ax +

Beispiel 2: Wir betrachten bez¨ uglich eines kartesischen Koordinatensystems die Spiegelung an der Geraden mit der Gleichung x2 = ax1 (Fig. 5). Zwischen einem Punkt P (p1 , p2 ) und seinem Bildpunkt P (p1 , p2 ) bestehen die Beziehungen p2 + p2 p + p1 =a 1 , 2 2 (p1 − p1 ) + a(p2 − p2 ) = 0,

x2

.u..P (p1 , p2 ) ... .......q...... ......... . ..... ......u....... . . . . . . . . . ... ........ ... .......... . . . . ..uP (p , p ) . . . ..... .. . 1 2 . . . . . . . . . a . . . . . . . O............ ϕ ... . . ....... x1 1 6

Fig. 5: Spiegelung an einer Geraden

denn der Mittelpunkt der Strecke P P liegt auf der Spiegelgeraden, und der Vektor −→

P P ist orthogonal zu

1 . Es ergibt sich f¨ ur p1 , p2 das LGS a

ap1 − p2 = −ap1 + p2 p1 + ap2 = p1 + ap2

bzw.

a −1 1 a

p1 = p2

−a 1 1 a

p1 . p2

V.1 Darstellung affiner Abbildungen Also ist

p1 = p2

101

a −1 1 a

−1

−a 1 1 a

p1 . p2

Die Abbildungsmatrix der Spiegelung ist daher

a −1 1 a

−1

−a 1 1 a

1 = 1 + a2

1 = 1 + a2

a 1 −1 a

1 − a2 2a 2a −(1 − a2 )

−a 1 1 a

.

Ist ϕ der Steigungswinkel der Spiegelgeraden, also a = tan ϕ, dann ergibt sich f¨ ur diese Matrix

cos2 ϕ − sin2 ϕ 2 sin ϕ cos ϕ 2 sin ϕ cos ϕ −(cos2 ϕ − sin2 ϕ)

=

cos 2ϕ sin 2ϕ sin 2ϕ − cos 2ϕ

.

Wir haben dabei die trigonometrischen Beziehungen 1 + tan2 ϕ =

1 , cos2 ϕ − sin2 ϕ = cos 2ϕ und 2 sin ϕ cos ϕ = sin 2ϕ cos2 ϕ

benutzt. Eine Spiegelung an einer Ursprungsgeraden hat also die Abbildungsmatrix r s mit r2 + s2 = 1. s −r Die Spiegelung an einer Geraden, die nicht durch O geht, kann dann mit Hilfe einer geeigneten Verschiebung c durch x = A(x −c) +c beschrieben werden: Man verschiebe die Gerade und den zu spiegelnden Punkt so, dass die Gerade durch O geht, spiegele und mache dann die Verschiebung r¨ uckgängig. Beispiel 3: Die Verkettung zweier Spiegelungen an zwei sich schneidenden Geraden ist eine Drehung um den Schnittpunkt der Geraden, wobei der Drehwinkel doppelt so groß ist wie der Schnittwinkel der Geraden. Der Drehsinn hängt dabei von der Reihenfolge der Spiegelungen ab. Das ist elementargeometrisch zu erkennen (Fig. 6). Die Multiplikation zweier Spiegelungsmatrizen ergibt eine Drehmatrix:

r s s −r

u v v −u

=

ru + sv −(su − rv) su − rv ru + sv

Dabei ist ru + sv das Skalarprodukt der beiden Einheitsvektoren

r cos 2ϕ = s sin 2ϕ

und

u cos 2ψ = , v sin 2ψ


102 also gleich dem Kosinus des Winkels zwischen diesen Vektoren, nämlich cos 2(ψ − ϕ). Ferner ist su − rv = sin 2(ψ − ϕ). Die Drehung um O mit dem Winkel δ hat also die Abbildungsmatrix

cos δ − sin δ sin δ cos δ

,

wie schon in II.3 bei der Betrachtung der komplexen Zahlen gezeigt wurde. Die Verkettung zweier Spiegelungen an parallelen Geraden ergibt offensichtlich eine Verschiebung.

. .........P ... .....u......... ..... . .......... . ... ... ..... ...... .........e. . . .. .. ... ... .... ........... ..... ...... ...... ...... .............. . .... .... ...... ........... ........ .......... . . . . ..... ..... ...... . . . .... . . ...... ... ... .......... .......... ..u P .. .. .............ψ......................... .. .. .. .. .. ............. ..................................ϕ .. .. . O..................... .. .. ............. x1 . x2

6

Fig. 6: Drehung als Doppelspiegelung

Auf Grundlage von Satz 4 a) kann man zeigen, dass jede Kongruenzabbildung als Verkettung von drei Spiegelungen geschrieben werden kann (Dreispiegelungssatz). Ein Dreifachspiegelung lässt sich stets als Verkettung einer Spiegelung mit einer Verschiebung parallel zur Spiegelachse (Schubspiegelung) schreiben (Aufgabe 7). Nun werden noch zwei Beispiele f¨ ur affine Abbildungen der Ebene angegeben, ¨ welche i. Allg. keine Ahnlichkeitsabbildungen sind. Beispiel 4: Bei einer Scherung an einer Geraden g liegen ein Punkt P und sein Bildpunkt P auf einer Parallelen zu g. Ist ferner L der Lotfußpunkt von P auf g, dann ist der Winkel ϕ zwischen P L und P L fest gegeben. Die Scherung an der x1 -Geraden mit dem Winkel 1 k ϕ hat die Abbildungsmatrix 0 1 mit k = tan ϕ (Fig. 7). Beispiel 5: Bei einer Parallelstreckung an einer Geraden g parallel zur Geraden h liegen ein Punkt P und sein Bildpunkt P auf einer Parallelen zu h und f¨ ur den Schnittpunkt S von g mit der Geraden durch P und P gilt −→

−→

SP = k SP (Fig. 8). F¨ ur k = −1 liegt eine Schrägspiegelung vor.

x2

6

....p2

kp2 Pt Pt . ... ............................................. . . . . . . . . . . . . . . . . . . . . . . ..................... . . ..... ...... . . . . . . . . . . . . . . . . . .. . ............................. .............. .. ... ......... ............. . ... ... .......................... .............................. . . . . . . ... .. ... ...... ............ .... ................................... .... .........t.. x1 L Fig. 7: Scherung

. .. ..... h... ............................. ....s............. . .. P .. .. .. . . . .... ... . ..... ..... ........ ..... .. . ... ..... ... . ... ..... ........................................... .. . . .. P.....s................. ................. ..... .. ..... .. .... .. . . . S ..s . ... ... x1 ... x2

6

Fig. 8: Parallelstreckung

V.1 Darstellung affiner Abbildungen

103

Die Parallestreckung an der x1 -Achse parallel zur Geraden mit der Gleichung x2 = ax1 und dem Streckfaktor k hat die Abbildungsmatrix

1 m 0 k

mit m =

k−1 , a

denn f¨ ur einen Punkt (p1 , p2 ) und seinen Bildpunkt (p1 , p2 ) gilt x2 − x2 = a und x2 = kx2 . x1 − x1

Aufgaben 1. Man bestimme die affine Abbildung des Raumes, welche die Punkte A(1, 2, 1), B(0, 3, 4), C(5, −1, 0), D(−1, 9, 1) der Reihe nach abbildet auf die Punkte A (7, 9, 6), B (15, 27, 5), C (8, −7, 12), D (5, 20, 14).

2. Man zeige, dass die Determinante einer Orthonormalmatrix die Werte 1 oder −1 hat.

3. Es sei A ∈ K n,n und AT die Transponierte von A.

a) Man zeige, dass AAT symmetrisch ist. b) Man zeige, dass mit AT A = E auch stets AAT = E gilt.

4. Man beweise, dass sich bei einer affinen Abbildung der Ebene mit der Matrix A der Flächeninhalt einer jeden Figur mit dem Faktor |det(A)| ändert.

5. Es seien zwei Punkte A(a1 , a2 ) und B(b1 , b2 ) in der Ebene gegeben. Wie lautet die Abbildungsgleichung der Spiegelung, die A auf B abbildet?

6. Man zeige elementargeometrisch: Sind die Dreiecke ABC und A B C kon¨ gruent (in Ubereinstimmung mit den Eckenbezeichnungen), dann gibt es eine Dreifachspiegelung, welche A auf A , B auf B und C auf C abbildet.

7. Man zeige elementargeometrisch: Jede Dreifachspiegelung lässt sich als Schubspiegelung darstellen. Man betrachte dazu die Bilderfolge in Fig. 9. ... . ....... ... ..g. ....... g ... . . ...... g . . . ... ........ . . ....... E ..... ...h ... .. ....... ..E...... ......t...q .. ... ... . . . . . . . . . . ... .... h. ... ............t........q... . .. ........... . .... . . . . ........ .......................... . ... .. ..... h ................k ........... .............q... k ..... . .............. . . . . . . . . . . . ... . ..... ...t.. k ....t ... ........... D ... ....D . . Fig. 9: Dreifachspiegelung


104

8. Beim Verketten affiner Abbildungen kommt es auf die Reihenfolge an, die Gruppe der affinen Abbildungen (der Ebene oder des Raumes) ist nicht kommutativ. In welchen Fällen sind a) zwei Spiegelungen b) zwei Drehungen c) zwei Verschiebungen d) eine Spiegelung und eine Verschiebung e) eine Drehung und eine Verschiebung miteinander vertauschbar? ¨ 9. Bei einer Ahnlichkeitsabbildung der Ebene werde A(1, 1) auf A (2, −3) und B(−1, 4) auf B (3, 0) abgebildet. Man bestimme den Bildpunkt von C(7, 2).

10. Eine Kongruenzabbildung heißt eine eigentliche Bewegung, wenn sie den Umlaufsinn einer Figur (z.B. eines Dreiecks) erhält; ändert sie den Umlaufsinn, dann heißt sie eine uneigentliche Bewegung. Welchen Wert hat die Determinante der Matrix einer eigentlichen bzw. einer uneigentlichen Bewegung?

11. Es sei A die Matrix einer affinen Abbildung der Ebene. Für welche Abbildungen gilt

a) A = A−1

b) A = AT

c) A−1 = AT

?

12. Die Verkettung einer Verschiebung c mit einer zentrischen Streckung am Zentrum Z mit dem Faktor k (in dieser Reihenfolge) ist eine zentrische Streckung am Zentrum Z ∗ mit demselben Faktor k; man bestimme Z ∗ .

13. Man bestimme die Matrix der Spiegelung im Raum an der Ebene mit der Gleichung x1 + x2 + x3 = 0.

14. Im Raum seien drei Abbildungen α, β, γ gegeben, und zwar sei α die zentrische Streckung an Z(1, 2, −1) mit dem Faktor 3, β die Verschiebung mit dem Vektor (3 7 5)T , γ die Spiegelung an der Ebene mit der Gleichung x2 + x3 = 0. Man bestimme die Abbildungsgleichungen von α ◦ β ◦ γ, α ◦ γ ◦ β, β ◦ α ◦ γ, β ◦ γ ◦ α, γ ◦ α ◦ β und γ ◦ β ◦ α.

15. Man untersuche, ob die affine Abbildung ⎛

des Raums Fixpunkte besitzt.

⎞

⎛

⎞

1 0 3 −1 ⎜ ⎟ 5 0 ⎟ x+⎝ 4 ⎠ ⎠ 1 1 −1 2

α : x → ⎜ ⎝ 2

V.2 Eigenwerte und Eigenräume einer Matrix

105

V.2 Eigenwerte und Eigenr¨ aume einer Matrix Ist α : x → Ax + c eine affine Abbildung von IRi auf sich (i ∈ {2, 3}), sind ferner P, Q Punkte aus IRi mit den Ortsvektoren p, q und P = α(P ), Q = α(Q) −→

(P, Q ∈ IRi ), dann wird der Vektor v =P Q= q − p auf den Vektor −→

α(v ) = α(P Q) = (Aq + c) − (Ap + c) = A(q − p) = Av abgebildet. Wird dabei ein Vektor f = o auf ein Vielfaches von f abgebildet, dann beschreibt er eine Fixrichtung: Jede Gerade mit dem Richtungsvektor f wird auf eine dazu parallele Gerade abgebildet. Die Gleichung Af = λf bzw. (A − λE)f = o mit λ ∈ IR hat nur dann nicht-triviale Lösungen f, wenn det(A − λE) = 0. Dies ist eine algebraische Gleichung f¨ ur λ. Hat man eine reelle Lösung λ gefunden, dann kann man aus (A − λE)f = o einen Vektor f = o berechnen, welcher eine Fixrichtung der affinen Abbildung angibt. Definition 1: F¨ ur A ∈ IRn,n nennt man die algebraische Gleichung det(A − λE) = 0 die charakteristische Gleichung von A; das Polynom det(A − λE) heißt charakteristisches Polynom. Die Lösungen dieser Gleichung nennt man die Eigenwerte von A. Ist λ ein Eigenwert von A, dann nennt man einen Vektor f = o mit (A − λE)f = o bzw. Af = λf einen Eigenvektor von A zum Eigenwert λ. Die Menge aller Eigenvektoren von A zum Eigenwert λ einschließlich o bildet den Eigenraum von A zum Eigenwert λ. Man beachte, dass ein Eigenraum als Lösungsmenge eines homogenen LGS ein Vektorraum ist. Da Eigenvektoren von o verschieden sein sollen, ist ein Eigenraum nie der Nullraum. Eine Matrix A ∈ IRn,n muss f¨ ur gerades n keine reellen Eigenwerte besitzen, denn ein Polynom von geradem Grad besitzt nicht immer reelle Nullstellen. Ist aber n ungerade, dann besitzt A mindestens eine reelle Nullstelle: Ist p(x) = xn + an−1 xn−1 + . . . + a2 x2 + a1 x + a0 ein Polynom u ¨ber IR von ungeradem Grad n, dann hat p(x) f¨ ur negative Werte von x von hinreichend großem Betrag negative Werte, f¨ ur positive Werte von x von hinreichend großem Betrag positive Werte. Weil die Funktion x → p(x) stetig ist, muss sie also an mindestens einer Stelle x den Wert 0 annehmen, wie man in der Analysis lernt.


106

Satz 1: Beschreiben A, B ∈ IRn,n die gleiche lineare Abbildung von IRn in IRn , aber bez¨ uglich verschiedener Basen, dann haben A und B das gleiche charakteristische Polynom, also auch die gleichen Eigenwerte. (In diesem Sinne sagt man, das charakteristische Polynom und damit die Eigenwerte einer Matrix seien invariant gegen¨ uber Basistransformationen.) Beweis: Eine lineare Abbildung von IRn in IRn sei bez¨ uglich der Basis {u1 , u2 , . . . , un } von IRn durch die Matrix A dargestellt, bez¨ uglich der Basis {v1 , v2 , . . . , vn } durch die Matrix B. Die Matrix T bilde nun die erste Basis auf die zweite Basis ab, wobei T ui = vi (i = 1, 2, . . . , n). Dann ist B = T AT −1 (Fig. 1). Es gilt daher aufgrund des Multiplikationssatzes f¨ ur Determinanten det(B − λE) = = = =

det(T AT −1 − λT T −1 ) det(T (A − λE)T −1 ) detT · detT −1 · det(A − λE) det(A − λE). 2

(v1 v2 . . . vn ) ............ ... ... −1 ... T ... ↓ ... .. (u1 u2 . . . un ) ... ... .. T AT −1 A ... ↓ ... A(u1 u2 . . . un ) ..... ... ... ... T ... ↓ . ......... B(v1 v2 . . . vn ) Fig. 1: Basistransformation

Satz 2: Eigenvektoren zu verschiedenen Eigenwerten sind linear unabhängig. Beweis: Es seien f1 , f2 Eigenvektoren von A zu λ1 bzw. λ2 . Ist rf1 + sf2 = o (r, s ∈ IR), dann ist auch A(rf1 + sf2 ) = o, also r(λ1 f1 ) + s(λ2 f2 ) = λ1 (rf1 ) − λ2 (rf1 ) = (λ1 − λ2 )rf1 = o. Wegen λ1 = λ2 und f = o ist daher r = 0 und somit auch s = 0, also sind f1 , f2 linear unabhängig. Es sei f3 ein Eigenvektor zu einem weiteren Eigenwert λ3 . Aus rf1 + sf2 + tf3 = o (r, s, t ∈ IR) folgt A(rf1 + sf2 + tf3 ) = o, also r(λ1 f1 ) + s(λ2 f2 ) + t(λ3 f3 ) = (λ1 − λ3 )rf1 + (λ2 − λ3 )sf2 = o. Wegen λ1 = λ3 und λ2 = λ3 und der linearen Unabhängigkeit von f1 , f2 folgt r = s = 0 und somit auch t = 0. So fortfahrend zeigt man die lineare Unabhängigkeit von Eigenvektoren zu einer beliebigen Anzahl von paarweise verschiedenen Eigenwerten. 2 Die Begriffe aus Definition 1 benötigen wir hier nur f¨ ur Matrizen aus IR2,2 oder 3,3 IR , wir möchten mit ihrer Hilfe nämlich zunächst die affinen Abbildungen der Ebene oder des Raums klassifizieren (Abschnitt V.3), in Kapitel VI benutzen wir diese Begriffe dann zur Klassifikation der Kurven und Flächen zweiter Ordnung.

V.2 Eigenwerte und Eigenräume einer Matrix

107

Aufgaben 1. Man bestimme die reellen Eigenwerte und die zugehörigen Eigenräume der affinen Abbildungen von IR3 in sich mit den Matrizen ⎛

1 A=⎝ 1 −3

−1 2 1

⎞ 1 0 ⎠, −3

⎛

1 B=⎝ 2 3

⎞ 2 −2 ⎠, 0

−1 2 1

⎛

4 C = ⎝ −2 1

⎞ −1 1 3 2 ⎠. 5 3

2. Wie kann man die Eigenwerte einer Diagonalmatrix bzw. einer Dreiecksmatrix sofort an der Matrix ablesen?

3. Man zeige, dass die Drehmatrix

cos α sin α

− sin α cos α

keine reellen Eigenwerte

besitzt. Welche Eigenwerte besitzt die Spiegelmatrix

cos α sin α

sin α − cos α

?

4. Man zeige, dass für die Eigenwerte λ der Matrix ⎛

0 ⎜ 0 ⎜ A=⎝ 0 1

1 0 0 0

0 1 0 0

⎞ 0 0 ⎟ ⎟ 1 ⎠ 0

λ4 = 1 gilt, und dass auch A4 = E gilt.

5. Man bestimme das charakteristische Polynom der Matrix ⎛ ⎜ ⎜

F =⎜ ⎜ ⎝

0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 −a0 −a1 −a2 −a3 −a4

⎞

⎟ ⎟ ⎟. ⎟ ⎠

Man zeige: Ist λ ein Eigenwert von F , dann ist (1 λ λ2 λ3 λ4 )T ein zugehöriger Eigenvektor, und jeder Eigenraum von F hat die Dimension 1.

6. a) Man bestimme die Eigenwerte der Matrix A = (aij ) ∈ IRn,n mit aij = 1 f¨ ur alle i, j = 1, 2 . . . , n. b) Man bestimme die Eigenwerte der Matrix B = (bij ) ∈ IRn,n mit aij = 1 f¨ ur alle i, j = 1, 2 . . . , n mit i = j und aii = 0 f¨ ur i = 1, 2, . . . , n.

7.

⎛ 1 ⎝ Man bestimme f¨ ur A = 2

⎞ 0 −3 6 0 ⎠ eine Matrix T derart, dass 0 1 ⎛ ⎞ 0 λ1 0 T −1 AT = ⎝ 0 λ2 0 ⎠, 0 0 λ3 1 0 −3

wobei λ1 , λ2 , λ3 die Eigenwerte von A sind.


108

V.3 Klassifikation der affinen Abbildungen Eine affine Abbildung x → Ax + c ist die Verkettung der Abbildung x → Ax (mit dem Fixpunkt O) und der Verschiebung x → x + c (in dieser Reihenfolge). F¨ ur A ∈ IR2,2 betrachten wir zunächst nur die Abbildung x → Ax und unterscheiden drei Fälle, je nach Anzahl der reellen Eigenwerte von A. Man beachte dabei, dass wegen det(A) = 0 die Zahl 0 kein Eigenwert sein kann. Fall 1: Die Matrix A hat zwei verschiedene reelle Eigenwerte λ1 , λ2 . Sind f1 , f2 zugehörige Eigenvektoren und wählt man {f1 , f2 } als Basis eines (affinen) Koordinatensystems, dann hat der Punkt mit dem Ortsvektor

x1 = x1 f1 + x2 f2 x = x2 den Bildpunkt mit dem Ortsvektor

x =

x1 λ1 x 1 = A(x1 f1 + x2 f2 ) = λ1 x1 f1 + λ2 x2 f2 = . λ2 x 2 x2

Die Abbildungsmatrix bez¨ uglich des durch {f1 , f2 } gegebenen Koordinatensys tems ist also die Diagonalmatrix

λ1 0 . 0 λ2

In Fig. 1 ist die durch A vermittelte Abbildung durch eine Zeichnung veranschaulicht. Sie besteht aus zwei Parallelstreckungen an den durch die Fixrichtungen gegebenen Geraden. Eine solche affine Abbildung nennt man eine Euler-Affinität (nach Leonhard Euler, 1707–1783).

Streckung an g2 in Richtung g1 g1 mit dem Faktor λ1 = 0, 5 .. ........ ..... ..... P .. Q ................................t........ . ..... . ..... . t . . . . . ... .. . ..... ..... ... ....... .. ..... ..... f1 . ..... ..... .......... . . ..... . . . . . 3 . . . . . . . . . . . . . . . . . d... d.... .. . ..... . HH .... ..... .. .......... . ..... .... ... ........ .... . . HH . . . . t . . . . . . . . . R . O . ..... HH .... ... .... ... . . . . jH . . . . . . . . . . . . . . . . . . . .d .. .. .t................ ....... f2 HH .... . . HH Q ................................................... ........ .. . ........ H HH ........ .........t.....P ..... . . . . HH .. ........... .......... . . . . . ........ ...... Streckung an g1 in Richtung g2 HH ... ........ ..... HH ...... ........ ..... mit dem Faktor λ2 = 3 ........ ...... HH g ........ ..... 2 HH ............. .............. H HH ........ .t. Fig. 1: Euler-Affinit¨ at R

V.3 Klassifikation der affinen Abbildungen Ist ein Eigenwert 1, dann ist die Parallelstreckung in Richtung des entsprechenden Eigenvektors die identische Abbildung und es handelt sich um einen einfache Parallelstreckung in Richtung des anderen Eigenvektors (Fig. 2).

109

. . . . ...s..... . . . . . . . . . . . . .......s.......... ............ . ... ... ............ .... .. ........ . .......... . . . ..s .. ..s . .............s......................................s.............................................................................

-

Fig. 2: Parallelstreckung

Ist ein Eigenwert 1 und der andere Eigenwert −1, dann liegt eine Schrägspiegelung vor (Fig. 3). Die Verkettung zweier Parallelstreckungen mit gleichen Streckfaktoren gehört zunächst nicht zu Fall 1, wo ja verschiedene Eigenwerte vorliegen sollten, sondern zu Fall 2 (s. unten), wird in der Regel aber auch als eine Euler-Affinität betrachtet; es handelt sich dabei um eine zentrische Streckung (Fig. 4). Hier ist der Eigenraum zum (einzigen) Eigenwert zweidimensional, denn jeder Vektor = o aus IR2 ist ein Eigenvektor.

s ................................... ...... .. ........................................s . . . . . . ..... .. ..s......................... ... .. ... s................. . .. .... ....................... .................s. .... . ..... ............................. .. .s......

-

Fig. 3: Schr¨ agspiegelung 1 .......s . . . . . . . . . .. . ..

. . . . ..... . .....s. . . . . . . ..s.......... ... . . . . . . . . .. . . .. .. .. ......... .. .. ..s.........s... .. .. .. . . . . . . . . .......s. . .. . . . .

-

Fig. 4: Zentrische Streckung

Fall 2: Die Matrix A hat genau einen reellen Eigenwert λ. Es sei f ein Eigenvektor zum Eigenwert λ, ferner g ein Vektor so, dass {f, g } eine Basis von IR2 ist. Der Vektor x = x1 f + x2g wird dann durch die Matrix A auf x = λx1 f + x2 Ag abgebildet. Ist Ag = rf + sg , dann ist x = (λx1 + rx2 )f + sx2g ,

λ r . Da die Abbildungsmatrix hat also bez¨ uglich der Basis {f, g } die Gestalt 0

s

außer λ kein weiterer Eigenwert existiert, ist s = λ. Ist der Eigenraum von λ eindimensional, dann kann man f so wählen, dass r = 1 gilt. Ist der Eigenraum von λ zweidimensional, dann ist auch g ein Eigenvektor zu λ, also Ag = λg und somit r = 0. Bez¨ uglich der Basis {f, g } hat die Abbildungsmatrix also die Gestalt

λ 1 0 λ

oder

λ 0 . 0 λ


110 Im ersten Fall liegt eine Streckscherung vor, also die Verkettung einer zentrischen Streckung mit dem Zentrum O und dem Streckfaktor λ und einer Scherung an der Geraden durch O mit dem Richtungsvektor f (Fig. 5).

.................t R P.. ....t................................. ... .... .... ..... ... ... ... . .. ....................................d........................ . . . . . . ..... ......... .... ..d.............................. . . . . ..... ........ .... ................ .. .. ... . .. ................ .. . ........................... .............t Q . . . . . . .. ......d.... ......t . . . ................... .....R .. P ..t............................. ... ........ . . . . . . .. ........................... .. .. .. ..t. Q . .. .. .. . @ .. .. .. @ . . I @ .. .. .. @ . * g@@@ ... ... ... @ .... @ . f @ O@

Im zweiten Fall liegt eine zentrische Streckung mit dem Zentrum O und dem Streckfaktor λ vor. Fall 3: Die Matrix A hat keinen reellen Eigenwert. Mit Hilfe einer Drehung kann man diesen Fall auf einen der Fälle 1 oder 2 zur¨ uckf¨ uhren. Die Drehung um O um

den Winkel ϕ hat die Matrix D =

Mit A =

a11 a21

a12 a22

−v u

mit u = cos ϕ und v = sin ϕ.

a11 u − a21 v a12 u − a22 v . a11 v + a21 u a12 v + a22 u

ist DA =

u v

Fig. 5: Streckscherung

Man wähle ϕ so, dass a11 v + a21 u = 0, also tan ϕ =

v a21 =− u a11

(mit ϕ = 90o im Fall a11 = 0). Dann besitzt DA Eigenwerte und A = D−1 (DA) ist die Matrix einer Verkettung einer Abbildung aus Fall 1 oder 2 mit einer Drehung.

1

−1

hat keinen Eigenwert. Aus tan ϕ = −1 Beispiel 1: Die Matrix A = 1 1 √ 1 1√ 1 √ −1 − 1 folgt ϕ = 135o , also sin ϕ = 2, cos ϕ = − 2 und somit D = 2 . 1 −1 2 2 2 √ 1 0 beschreibt eine zentrische Streckung mit dem Die Matrix DA = − 2 0 1 √ Streckfaktor − 2. Die Matrix A = D−1 (DA) beschreibt also diese zentrische Streckung, gefolgt von einer Drehung um 225o . Eine affine Abbildung der Ebene mit dem Fixpunkt O ist also • eine Euler-Affinität mit den Sonderfällen Parallelstreckung (ein Eigenwert 1) und Schrägspiegelung (Eigenwerte 1 und −1), • eine Streckscherung mit den Sonderfällen Scherung (Eigenwert 1, Eigenraumdimension 1) und zentrische Streckung (Eigenraumdimension 2), • die Verkettung einer Euler-Affinität oder einer Streckscherung mit einer Drehung mit dem Sonderfall einer reinen Drehung.

V.3 Klassifikation der affinen Abbildungen

111

Hat die affine Abbildung x → Ax + c den Fixpunkt mit dem Ortsvektor p, gilt also Ap + c = p, dann kann man die Abbildung nach der Substitution y = x − p bzw. x = y + p wieder als eine Abbildung mit dem Fixpunkt O betrachten: Die Abbildung y + p → A(y + p) + c hat den Fixpunkt O. Existiert ein weiterer Fixpunkt mit dem Ortsvektor q, dann sind alle Punkte der Geraden durch die beiden Fixpunkte ebenfalls Fixpunkte, es gibt also eine Fixpunktgerade; denn es gilt dann f¨ ur α : x → Ax + c α(p + tq) = p + tq f¨ ur alle t ∈ IR. Hat die affine Abbildung x → Ax + c keinen Fixpunkt, ist also die Gleichung (A − E)x + c = o nicht lösbar, dann ist det(A − E) = 0 und somit 1 ein Eigenwert von A. Es handelt sich also um die Verkettung einer Parallelstreckung oder Scherung mit einer Verschiebung. Die Gerade {a + tb | t ∈ IR} ist genau dann eine Fixgerade der affinen Abbildung x → Ax + c, wenn b ein Eigenvektor von A und Aa + c − a ein Vielfaches von b ist. Die letzte Bedingung ist stets erf¨ ullt, wenn der Punkt mit dem Ortsvektor a ein Fixpunkt ist, weil Aa + c − a = o ein Vielfaches von b ist. Eine Gerade durch einen Fixpunkt ist also genau dann eine Fixgerade einer affinen Abbildung, wenn ihr Richtungsvektor ein Eigenvektor der Matrix der affinen Abbildung ist. Dies beachte man im folgenden Beispiel. Beispiel 2: Die affine Abbildung α : x →

F (3, 2), denn das LGS

−4x1 + 6x2 + 0 = 2x2 − 4 =

−3 6 0 hat den Fixpunkt x + 0 3 −4

0 hat die (einzige) Lösung (3, 2). 0

Die Matrix Eigenwerte orige

zugeh¨

sind Eigenvektoren von α hat die 3 und −3, 1 1 1 1 3 3 und . Die Geraden +t | t ∈ IR und +t | t ∈ IR sind 2 2 1 0 1 0 3 0 −3 6 −1 2 also Fixgeraden. Wegen = ist α die Verkettung einer 0 3 0 3 0 1 zentrischen Streckung, einer Schrägspiegelung und einer Verschiebung (Fig. 6). . .... ................................................................................ .... . ........ . . . . .. .. ..... ................. . . . . . . Fixgerade . . . . . . . . .... ..... ........ .... ..... ........... ........ ... .... ... . .... . . . . . . . . . . . . . .. .... .... ............. .... ... .. .... ................ ............. . . . ............................................................................ . . . . . . . . . . . . . . .. . .. .. ... .. .. .. . ... .. ............ ..................... .... ... . .. ...... .. .... .......................................................... . . ... . .. ...................... . ... ........ .. .. ... ... .... ....... ............................. . ... .... ...... ....... ...... ... ................................ . .. . . . .. . .. ........................... ................. ...... ..................................... . . . . . . ....... . . . . 6 ... ... ............. . ... .......... .......................u................................................................................................................................................................................................ .. Fixpunkt Fixgerade -

Fig. 6: Zu Beispiel 3


112

¨ ¨ Als Eigenwerte einer Ahnlichkeitsabbildung mit dem Ahnlichkeitsfaktor k kommen nur die Zahlen k oder −k in Frage, da die Länge von Vektoren um den Faktor k wächst; bei Kongruenzabbildungen können also nur die Eigenwerte 1 oder −1 ¨ auftreten. Sind k und −k beides Eigenwerte der Ahnlichkeitsabbildung mit der Matrix A, dann sind die zugehörigen Eigenvektoren orthogonal: Aus Af1 = k f1 und Af2 = −k f2 folgt f1 T f2 = 0, denn −k 2 (f1 T f2 ) = (Af1 )T (Af2 ) = f1 T (AT A)f2 = k 2 (f1 T f2 ). Beispiel 3: Die Spaltenvektoren der 1 −5 12 Matrix A = sind ortho13

12

5

gonale Einheitsvektoren; man beachte 52 + 122 = 132 . Die Eigenwerte sind 1 und −1, zu2 −3 , . gehörige Eigenvektoren sind 3

2

Die Gerade g durch O und P (2, 3) ist eine Fixpunktgerade, alle zu ihr orthogonalen Geraden sind Fixgeraden. Es handelt sich bei dieser Abbildung um die Spiegelung an der Fixpunktgeraden g (Fig. 7).

x2

6

Fixpunktgerade

.t. .. .. .. . . .. ...... . .. ......t.... .... .... ............. ........... . ....... ..t.. .. ... .. ... . . ... ......... ...... ..t...... . . . ... .. . .... .. .... ... .. ...........t ...... . . ....... . .. ... ....................... . . t. −3 ... ... 2 . . . 2 ...

k Q Q ..... 3 Q...

... . .. . . ...

-

x1

Fig. 7: Spiegelung

Nun betrachten wir affine Abbildungen im Raum. Das charakteristische Polynom der Abbildungsmatrix A hat (unter Ber¨ ucksichtigung der Vielfachheit) drei reelle Nullstellen (Fall 1) oder genau eine reelle Nullstelle (Fall 2). Fall 1 (drei reelle Nullstellen): (1) Hat A drei verschiedene Eigenwerte λ1 , λ2 , λ3 und sind f1 , f2 , f3 zugehörige Eigenvektoren, dann ist die Abbildungsmatrix bez¨ uglich des durch die Eigenvektoren gebildeten Koordinatensystems die Diagonalmatrix mit den Einträgen λ1 , λ2 , λ3 . Es handelt sich bei der Abbildung x → Ax um ein räumliches Analogon einer Euler-Affität, also um die Verkettung von drei Parallelstreckungen. (2) Ist λ1 eine einfache und λ2 eine doppelte Nullstelle des charakteristischen Polynoms und sind ferner f1 , f2 Eigenvektoren zu λ1 , λ2 , dann wähle man einen Vektor g so, dass {f1 , f2 , g } eine Basis von IR3 ist. Mit Ag = rf1 + sf2 + tg ist A(x1 f1 + x2 f2 + x3g ) = (λ1 x1 + rx3 )f1 + (λ2 x2 + sx3 )f2 + tx3g . Die Matrix dieser Abbildung ist

⎛

⎞

λ1 0 r ⎜ ⎟ ⎝ 0 λ2 s ⎠ . 0 0 t


113

Das charakteristische Polynom dieser Matrix hat die Nullstelle t, also ist t = λ2 . Der Eigenraum von λ1 ist eindimensional, denn die Gleichung ⎛

⎞

0 0 r ⎜ ⎟ s x = o ⎝ 0 λ2 − λ 1 ⎠ 0 0 λ 2 − λ1 hat f¨ ur λ1 = λ2 nur die Lösungen (k 0 0)T mit k ∈ IR. Der Eigenraum von λ2 kann ein- oder zweidimensional sein. a) Ist der Eigenraum von λ2 zweidimensional, dann ist auch g ein Eigenvektor zu uglich der Basis {f1 , f2 , g } lautet die λ2 , also Ag = λ2g und ⎛ somit r =⎞s = 0. Bez¨ λ1

Abbildungsmatrix ⎝ 0 0

0 λ2 0

0 0 ⎠ (spezielle Euler-Affinit¨ at). λ2

b) Ist der Eigenraum dann ist s = 0, da andernfalls der ⎛ von λ2 eindimensional, ⎞ Lösungsraum von ⎝

λ1 − λ 2 0 0

0 r 0 s ⎠ x = o zweidimensional wäre. Die Abbildung 0 0

ist die Verkettung zweier Streckscherungen mit einer Parallelstreckung (Fig. 8).

x3

6

O x1

. ...... ........... .. .. ... .... ... ..... .... . .. ..... ....... ...... .................. ... .. ... ...... .........................

........ ................... . . . . . . . . x2 → 3x2 + 2x3 .............. .... 6 .................... ........ . . . . . . . . . . .. .... ................ ............................................. ...................... . x3 → 3x3 . . .................... -

x1 → −4x1 + x3

-

........ .... .... ............... . . . ........ . .... .... . .... ................. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ............................ ... ......... .........

x2

Fig. 8: Verkettung einer Parallelstreckung mit zwei Streckscherungen

In Fig. 8 handelt es sich um die Abbildung mit der Matrix ⎛

⎞

⎛

⎞⎛

⎞⎛

⎞

−4 0 3 −4 0 1 1 0 0 1 0 0 ⎜ ⎟ ⎜ ⎟⎜ ⎟⎜ ⎟ ⎝ 0 3 6 ⎠ = ⎝ 0 1 0 ⎠⎝ 0 3 2 ⎠⎝ 0 1 0 ⎠. 0 0 3 0 0 1 0 0 1 0 0 3 (3) Ist λ dreifache Nullstelle des charakteristischen Polynoms und f ein Eigenvektor zu λ, ferner {f, g , h} eine Basis von IR3 , dann wird x1 f + x2g + x3h durch x → Ax abgebildet auf x1 λf + x2 Ag + x3 Ah, wobei zunächst Ag = rf + sg + th und Ah = uf + vg + wh.


114

a) Ist der Eigenraum von λ dreidimensional, dann ist g = λ g und Ah = λh, ⎛ A ⎞ λ 0 0 die Abbildungsmatrix bez¨ uglich {f, g , h} lautet also ⎝ 0 λ 0 ⎠ und es handelt 0

0

λ

sich um eine zentrische Streckung. b) Ist der Eigenraum von λ zweidimensional, dann kann man g als weiteren Eigenvektor⎛wählen, also g = λg . Die Abbildungsmatrix bez¨ uglich {f, g , h} ⎞ A λ

0

u

0

0

w

lautet also ⎝ 0 λ v ⎠. Es ist dann auch w = λ, die Matrix beschreibt daher eine Streckscherung: ⎛

⎞

⎛

⎞⎛

⎞

λ 0 u λ 0 0 1 0 u ⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎝ 0 λ v ⎠ = ⎝ 0 λ 0 ⎠ ⎝ 0 1 v ⎠ 0 0 λ 0 0 λ 0 0 1

mit u =

u v , v = . λ λ

c) Der Eigenraum von λ sei eindimensional, ein Eigenvektor sei f. Es sei {f, g , h} eine Basis von IR3 und Ag = rf + sg + th sowie Ah = uf + vg + wh. Dann hat die Abbildungsmatrix die Gestalt ⎛

⎞

⎛

⎞⎛

⎞

λ r u λ 0 0 1 r u ⎟ ⎜ ⎟⎜ s v ⎠ = ⎝ 0 s v ⎠⎝ 0 1 0 ⎟ ⎠ 0 t w 0 t w 0 0 1

⎜ ⎝ 0

Dabei muss das charakteristische Polynom von

mit r =

s v t w

r u , u = . λ λ

die doppelte Nullstelle λ

2

haben, esmuss also s + w = 2λ und sw − tv = λ gelten. In diesem Fall ist aber (s − λ)x2 + vx3 = 0 nichttrivial lösbar, so dass rv = (s − λ)u ist. das LGS tx2 + (w − λ)x3 = 0 Fall 2 (genau eine reelle Nullstelle): Der Eigenraum ist eindimensional, sonst läge die Situation a) oder b) aus Fall 1 (3) vor. Die Matrix hat also die Gestalt wie in c) aus Fall 1 (3), wobei aber s v 2 (s+w) < 4(sw −tv) gelten muss, weil das charakteristische Polynom von t w

keine reellen Nullstellen hat. Man kann dabei r = u = 0 erreichen, wenn man g und h um ein geeignetes Vielfaches von f abändert, so dass die Abbildungsmatrix die Gestalt ⎛ ⎞ λ 0 0 ⎜ ⎟ ⎝ 0 s v ⎠ 0 t w erhält: Man ersetze g durch g + xf und h durch h + y f, wobei (x, y) die Lösung des LGS (λ − s)x − ty + r = 0 −vx + (λ − w)y + u = 0


115

ist. Man beachte, dass dieses LGS die Determinante (λ − s)(λ − w) − vt = λ2 − (s + w)λ + (sw − vt) = 0 hat. Mit Ag = rf + sg + th und Ah = uf + vg + wh ist dann nämlich A(g + xf) = (r − sx − ty + xλ)f + s(g + xf) + t(h + y f) = s(g + xf) + t(h + y f), A(h + y f) = (u − vx − wy + yλ)f + v(g + xf) + w(h + y f) = v(g + xf) + w(h + y f).

Aufgaben 1. In V.1 Beispiel 1 haben wir die affine Abbildung betrachtet, welche (1, 2), (5, 3), (3, 9) der Reihe nach auf (3, −5), (11, 1), (7, −2) abbildet. Bestimme die Eigenwerte und die Eigenräume. Von welchem Typ ist diese Abbildung?

2. Eine Euler-Affinität von IR2 habe die Fixgeraden a : x1 + x2 = 1 und b : 3x1 − x2 = 7. Der Streckfaktor bez¨ uglich a sei 2, derjenige bez¨ uglich b sei −3. Welche Gestalt hat die Abbildungsgleichung bez¨ uglich des urspr¨ unglich gegebenen kartesischen Koordinatensystems?

3. Man beschreibe für t ∈ IR die Abbildung α : x →

2t + 1 2t t x + t t+1 0

von IR2 in IR2 .

4. Im kartesischen Koordinatensystem im Raum sei g die Gerade durch A(1, 1, 0) mit dem Richtungsvektor (2 0 1)T . Man bestimme die Abbildungsmatrix f¨ ur die Drehung um g mit einem Winkel von 30o .

5. Bezüglich des kartesischen Koordinatensystems habe eine affine Abbildung ⎛ ⎞ die Matrix A = ⎝

1 −1 1 1 2 0 ⎠. Gibt es eine Basis des Vektoraums IR3 , −3 1 −3

bez¨ uglich welcher die Matrix dieser affinen Abbildung eine Diagonalmatrix ist? (Vgl. Aufgabe 1 in V.2.)

6. Man zeige: Sind alle reellen Eigenwerte von A von 0 verschieden, dann ist A invertierbar und die reellen Eigenwerte von A−1 sind die Kehrwerte der reellen Eigenwerte von A.

VI Kurven und Fl¨ achen zweiter Ordnung VI.1 Die Kegelschnittkurven Die bekannten Kegelschnittkurven in der Ebene haben Gleichungen, in denen die Variablen x1 , x2 quadratisch und linear vorkommen, insbesondere kann das Produkt x1 x2 in einer solchen Gleichung auftreten (Fig. 1). ELLIPSEN

HYPERBELN

x2 6 ...... ..... ....... ... ... ... . .... .. ... .. x1 . ... .... .... .......... 4x21 + x22 = 4

x2

6

-

x1

+

9x22

x2 6 .... .. ..... .... . . . ...... . . ............ .............. .......

− 16x1 − 54x2 = −61

x2 6............. ....... ... . . . . . .... .... ... . ..... . ... x1 . .... .... ............. .......... 29x21 − 42x1 x2 + 29x22 = 100

...x2 6 .. ... . . ... .. ... ... ... ... ... .. x1 .... ..... .......

-

................................ ...... ..... . . . . .... . .. ....

x1

x21 − x22 + 3 = 0

............................. ......... ..... ...... ... . ... s ... .. . ...... . ............. ................. ........ 4x21

PARABELN

x21 − 2x1 − x2 = 1

... x2 6 ... ... ... ... ........ ..................... ......................... x1 ...... ... ... ... ... .

........ ........ . . . . . . . . ...... ..... . . . . .. .... x1 ... ..... ...... ....... ......... ......... .....

x2 6

x21 − 7x2 = 0

x1 x2 = 5

x2 ........ ...... .... .. .. . . ...... .......

6

....... ...... ..... ... .... x1 ...... .......

x21 − x22 + 2x1 = 0

x2 6 ......................... ........ x1 ..... . .... ... ... ... ... ... . x21 + 2x1 x2 + x22 − 3x1 + 3x2 = 0

Fig. 1: Ellipsen, Hyperbeln und Parabeln

Diese Kurven nennt man Kegelschnittkurven oder kurz Kegelschnitte, weil sie als Schnittkurven eines Kegels mit einer Ebene entstehen (Fig. 2). Das wird in VI.2 gezeigt. Einige geometrische Eigenschaften der Kegelschnitte werden in den Aufgaben behandelt.

VI.1 Die Kegelschnittkurven

117

....................................... ......... ... A ............................... A

A

A

A

A A

P P A PP.....................A.. PP .A.. P .P PP ...... PPP..A... .........................P . P . . . . P . ... ..A... ..... PP...P ....... .........

......................

....................................... ......... ... A ............................... A

A A

A A A A A A .... AA A A.... ......AA A ....A ....A. A A .... A ...A. A ....A.........A.......A.A . . . ....... A .... AA ..A.....A.. ...................A.................. A

.............. ... ......... ........ . ... .... ............ . ..... . . . . . . A............C........................... C .... C ... C A.... C ... C A.... C ... C C A.....C.. C

AC C C AC C AC C C C CA C ..C..A...... C C .. C A.. C ....C .........C.. A.... C . . ....... C ... C..A.....C ...............C.. . . . . .......... ..... C C

C

Fig. 2: Kegelschnitte

Definition: Die Punktmenge {(x1 , x2 ) ∈ IR2 | a11 x21 + 2a12 x1 x2 + a22 x22 + a1 x1 + a2 x2 + a = 0} (a11 , a12 , a22 , a, a1 , a2 ∈ IR) nennt man eine Kurve zweiter Ordnung.

Setzt man A =

a11 a12

a x a12 , a = 1 und x = 1 , dann kann man die Gleichung a22 a2 x2

einer Kurve zweiter Ordnung folgendermaßen schreiben: xT A x + aT x + a = 0. F¨ ur die weitere Untersuchung der Kurven zweiter Ordnung (und auch der Flächen zweiter Ordnung in VI.2) wollen wir die Eigenwerte von A betrachten. Die Matrix A ist symmetrisch, d.h. es gilt AT = A. Reelle symmetrische Matrizen haben bez¨ uglich der Eigenwerte und Eigenräume besondere Eigenschaften, welche wir zunächst allgemein untersuchen wollen. Im Folgenden gelten auch die komplexen Nullstellen des charakteristischen Polynoms als Eigenwerte, so dass man zwischen reellen und komplexen Eigenwerten unterscheiden muss. Satz 1: Ist die Matrix A ∈ IRn,n symmetrisch, dann sind alle Eigenwerte von A reell und Eigenvektoren zu verschiedenen Eigenwerten sind orthogonal. Ist dabei λ ein r-facher Eigenwert von A, dann hat der zugehörige Eigenraum die Dimension r und besitzt eine Orthonormalbasis aus Eigenvektoren von A. Beweis: Mit a, a bzw. A bezeichnen wir die zu a ∈ C, a ∈ Cn bzw. A ∈ Cn,n komplex-konjugierten Elemente, wobei das Konjugieren von Vektoren und Matrizen elementweise zu verstehen ist. Der Fundamentalsatz der Algebra besagt, dass eine algebraische Gleichung (Polynomgleichung) vom Grad n im Körper C der komplexen Zahlen genau n Lösungen hat, wenn man mehrfache Lösungen mit ihrer Vielfachheit zählt. Also hat A in C genau n Eigenwerte, wenn man

VI Kurven und Flächen zweiter Ordnung

118

mehrfache Eigenwerte mit ihrer Vielfachheit zählt. Ist λ ein Eigenwert mit dem Eigenvektor u ∈ Cn , so gilt wegen A = A mit Au = λu auch Au = λ u. Also ist λ (u T u) = u T (λu) = u T A u = (A u)T u = (λ u)T u = λ (u T u). 0 ist daher λ = λ, also λ ∈ IR. Sind λ, μ verschiedene Wegen u T u = |u|2 = Eigenwerte und u, v zugehörige Eigenvektoren, dann ist μ(u T v ) = u T (Av ) = u T A v = (A u)T v = λ(u T v ), wegen μ = λ also u T v = 0. Nun sei λ ein r-facher Eigenwert und u1 ein normierter Eigenvektor zu λ, ferner {u1 , v2 , . . . , vn } eine Orthonormalbasis von IRn . Wegen uT1 Au1 = uT1 (λu1 ) = λuT1 u1 = λ und viT Au1 = viT (λu1 ) = λviT u1 = 0 (i = 2, 3, . . . , n) ⎛

ist dann (u1 v2 . . . vn )T A (u1 v2

⎜ . . . vn ) = ⎜ ⎜ ⎝

λ 0 .. .

...

0

A

0

⎞ ⎟ ⎟ ⎟, ⎠

0

wobei A ∈ IRn−1,n−1 wieder symmetrisch ist und eine lineare Abbildung von v2 , . . . , vn in sich beschreibt. Ist E bzw. E die Einheitsmatrix aus IRn,n bzw. IRn−1,n−1 , dann gilt det(A − xE) = (x − λ)det(A − xE ). Ist r > 1, dann ist λ auch ein Eigenwert von A ; ein zugehöriger Eigenvektor u2 ∈ IRn−1 kann als normiert angenommen werden. Durch Hinzuf¨ ugen einer ersten Koordinate 0 ergänzen wir ihn zu einem normierten Vektor u2 ∈ IRn . Wegen u2 ∈ v2 , . . . , vn ist dabei u2 orthogonal zu u1 . Wir ergänzen {u1 , u2 } zu einer Orthonormalbasis {u1 , u2 , w 3 , . . . , wn } von IRn . Es ist dann ⎞ ⎛ 3 . . . w n )T A (u1 u2 w 3 (u1 u2 w

⎜ ⎜ ... w n) = ⎜ ⎜ ⎜ ⎝

λ 0 0 .. .

0 λ 0 .. .

0

0

0 0

... ...

A

0 0 ⎟ ⎟ ⎟ ⎟, ⎟ ⎠

n−2,n−2

wobei A ∈ IR wieder symmetrisch ist. F¨ uhrt man dieses Verfahren r-mal aus, dann ergibt sich det(A − xE) = (x − λ)r det(A(r) − xE (r) ) mit A(r) , E (r) ∈ IRn−r,n−r , wobei A(r) symmetrisch ist. Die r orthonormierten Eigenvektoren spannen den gesamten Eigenraum von λ auf, da die Summe der Dimensionen der Eigenräume nicht größer als n sein kann. 2 Folgerung aus Satz 1: Zu jeder symmetrischen Matrix A ∈ IRn,n gibt es eine Orthonormalmatrix U ∈ IRn,n , so dass ⎛

⎜ U T AU = ⎜ ⎜ ⎝

λ1 0 .. .

0 λ2 .. .

... ...

0 0 .. .

0

0

...

λn

⎞

⎟ ⎟ ⎟. ⎠


119

In dieser Diagonalmatrix sind λ1 , λ2 , . . . , λn die Eigenwerte von A entsprechend ihrer Vielfachheit (also λ1 = λ2 = . . . = λr , falls λ1 Eigenwert der Vielfachheit r ist) und die Spaltenvektoren von U sind zugehörige Eigenvektoren gemäß der Konstruktion im Beweis von Satz 1. Nun kehren wir zur Untersuchung der Kurven zweiter Ordnung zur¨ uck, wobei das Ziel ist, durch eine Koordinatentransformation mit einer Orthonormalmatrix den quadratischen Term x T A x zu vereinfachen, indem man A in eine Diagonalmatrix verwandelt. Die Orthonormalmatrix vermittelt eine Kongruenzabbildung, bildet also die gegebene Kurve auf eine zu ihr kongruente Kurve ab. Besitzt A genau einen (also doppelten) Eigenwert λ, dann hat die Diskriminante der quadratischen Gleichung det(A − xE) = 0 bzw. x2 − (a11 + a22 )x + (a11 a22 − a212 ) = 0 den Wert 0, es ist also (a11 + a22 )2 − 4(a11 a22 − a212 ) = (a11 − a22 )2 + 4a212 = 0, also a12 = 0 und a11 = a22 = λ. Die Kurvengleichung lässt sich im Fall λ = 0 damit umformen zu (x1 − b1 )2 + (x2 − b2 )2 = b. Dabei wurde das Verfahren der quadratischen Ergänzung benutzt, welches auf der binomischen Formel beruht: x2 − 2bx = (x − b)2 − b2 . Diese Umformung wird im Folgenden häufiger verwendet. √ F¨ ur b > 0 ist die Kurve ein Kreis um (b1 , b2 ) mit dem Radius b; f¨ ur b = 0 wird nur der Punkt (b1 , b2 ) dargestellt, f¨ ur b < 0 die leere Menge. Im Fall λ = 0 wird eine Gerade (falls a = o), die leere Menge (falls a = o und a = 0) oder die gesamte Ebene (falls a = o und a = 0) dargestellt. Besitzt A zwei verschiedene Eigenwerte λ1 , λ2 , sind ferner u1 , u2 zugehörige orthonormierte Eigenvektoren und ist U = (u1 u2 ) , dann liefert die Kongruenzabbildung x = U T x bzw. x = Ux (beachte U T U = E)

T

x Ax = x

T

T

U AUx = x

T

λ1 0 2 x = λ1 x2 1 + λ2 x2 . 0 λ2

Die Gleichung der Fläche zweiter Ordnung ist dann

λ1 x21

+

λ2 x22

+ b1 x1 + b2 x2 + a = 0 mit

b1 = U T a, b2

wobei wir zur Vereinfachung wieder x1 , x2 statt x1 , x2 geschrieben haben.


120

Ist ein Eigenwert 0, etwa λ1 = 0, λ2 = 0, dann lautet im Fall b1 = 0 die Gleichung (x2 − c2 )2 = c1 (x1 − c3 ). Diese stellt eine Parabel mit dem Scheitelpunkt (c3 , c2 ) dar, deren Achse parallel zur x1 - Achse ist. Im Fall b1 = 0 lautet die Gleichung (x2 − c2 )2 = c und stellt ein Geradenpaar, eine Gerade oder die leere Menge dar, je nachdem ob c > 0, c = 0 oder c < 0 ist. Sind beide Eigenwerte λ1 , λ2 von 0 verschieden, dann kann man die Gleichung umformen zu λ1 (x1 − c1 )2 + λ2 (x2 − c2 )2 = c. Ist c = 0, dann wird ein Punkt oder ein Geradenpaar dargestellt, je nachdem ob λ1 , λ2 gleiche oder verschiedene Vorzeichen haben. Ist c = 0, dann wird je nach Vorzeichen von λ1 , λ2 und c eine Ellipse, eine Hyperbel oder die leere Menge dargestellt. Abgesehen von den Entartungsfällen (leere Menge, Punkt, Gerade, Geradenpaar, ganze Ebene) ist eine Kurve zweiter Ordnung also eine Kegelschnittkurve (Ellipse, Hyperbel, Parabel). In einem geeigneten Koordinatensystem haben diese Kegelschnittkurven die in Fig. 3 angegebenen Standardgleichungen; die Bedeutung der Parameter a, b bzw. p entnehme man den Zeichnungen. Ist der Mittelpunkt der Ellipse bzw. der Hyperbel und der Scheitel der Parabel nicht (0, 0), sondern (m1 , m2 ), dann ersetze man in den Standardgleichungen x1 durch x1 − m1 und x2 durch x2 − m2 . ELLIPSE

HYPERBEL

PARABEL

x21 x22 + 2 =1 a2 b

x21 x22 − 2 =1 a2 b

x22 = 2px1

x2

6

............................................ ....... b ......... . .... ...... a ..... ....................................... ... ... . x ..... .... 1 . . ......... . . . . ............................

x2 ... . ........... ..... ....... .. .. .. .......6 .... ..... ........ .. .. ............ ..... ... .. .... ..... .... b ..... .... ... ...... .... ..... .. . a ... ................................ ..... ... .... . .. ... ..... . ...... ....... x1 . . . . . . . . . .. .. . .... ..... .. .. .. .. .. .. .............................. ............ ... .

x2

....... ........ . . . . . . 6 .... . .. .......... .... .... p ... .. ... Q k .... Q p ..... 2 ...... ........ ........ .......

-

x1

Fig. 3: Standardgleichungen der Kegelschnitte

Alle Ellipsen, alle Hyperbeln bzw. alle Parabeln sind jeweils zueinander affin: Man setze x1 = ax1 , x2 = bx2 bzw. x1 = px1 , x2 = x2 . Bis auf Affinität lauten die Standardgleichungen der nicht-ausgearteten Kegelschnitte also x21 + x22 = 1,

x21 − x22 = 1,

x22 = 2x1 .

Zur Klassifizierung der Kegelschnitte ist die Theorie der Eigenwerte nicht unbedingt notwendig, es wird eigentlich mit Kanonen auf Spatzen geschossen. Man


121

könnte einfach mit quadratischen Ergänzungen arbeiten: Beispielsweise könnte man f¨ ur a11 = 0 mit der Umformung a11 x21

+ 2a12 x1 x2 +

a22 x22

= a11

a12 x1 + x2 a11

2

a2 + a22 − 12 x22 a11

a

beginnen und dann die neuen Koordinaten x1 = x1 + 12 , x2 = x2 einf¨ uhren usw. a11 Andererseits ist die Verwendung der Eigenwerttheorie als Vorbereitung auf die Untersuchungen im nächsten Abschnitt n¨ utzlich.

Aufgaben 1. Es sei eine affine Abbildung x → Cx der Ebene gegeben. Man bestimme

Vektoren u, v = o mit u ⊥ v und Cu ⊥ Cv . ( Man findet genau ein solches invariantes Rechtwinkelpaar. Wird ein Kreis um O durch die affine Abbildung x → Cx auf eine Ellipse abgebildet, welche kein Kreis ist, dann findet man stets genau zwei orthogonale Kreisdurchmesser, die auf zwei orthogonale Ellipsendurchmesser abgebildet werden; diese Ellipsendurchmesser sind die Hauptachsen der Ellipse. Vgl. hierzu Aufgabe 2.)

2. Eine Ellipse ist das affine Bild eines Kreises. Die Bilder von zwei rechtwinkligen Durchmessern eines Kreises nennt man konjugierte Durchmesser der Ellipse. Fig. 4 zeigt eine Hauptachsenkonstruktion f¨ ur eine Ellipse mit zwei gegebenen konjugierten Durchmessern. Man erläutere diese Konstruktion.

3. Die Ellipse mit dem Mittelpunkt O und den Halbachsenlängen a, b entsteht aus dem Kreis um O mit dem Radius a durch Streckung an der x1 -Achse parb allel zur x2 -Achse mit dem Faktor .

....... ............................ .. ....... ....... ......... ..... ..........r........ .....r... ... .. .. ... .. ... .. .. ... ....... ........ .................................... .... . . .....................................................s.......................................................... . .......... . .. ..... .. .. . . . . . .... ... ... ...... ... ..........r........... ..... ..... .... .................. .r............. . .. . ... .r ... ......... .. ........ .. ......................................................r...r..............................................................r...........................................................r........ . ........ ... ......... ............r............. ... .... ............ ... ............ .. .. . ...........................................................s........................................................ .. ......r.................. ....... .......r......................... ... .................. .. .................... ... ... Fig. 4: Hauptachsenkonstruktion

a

Zwei Ellipsendurchmesser heißen konjugiert, wenn sie als Bilder orthogonaler Kreisdurchmesser entstehen; sie bestimmen konjugierte Richtungen. Man beweise: a) Die Mittelpunkte der Sehnen, welche eine Ellipse aus einer Parallelenschar ausschneidet, liegen auf dem zu ihrer Richtung konjugierten Durchmesser der Ellipse. b) Das Produkt der Steigungen konjugierter Richtungen ist −

2 b . a


122

4. Ellipsen, Hyperbeln und Parabeln lassen sich als Ortskurven definieren. Man zeige: a) Eine Ellipse ist der geometrische Ort aller Punkte, die zu zwei gegebenen Punkten die gleiche Abstandssumme haben (Fig. 5). b) Eine Hyperbel ist der geometrische Ort aller Punkte, die zu zwei gegebenen Punkten die gleiche Abstandsdifferenz haben (Fig. 6). c) Eine Parabel ist der geometrische Ort aller Punkte, die zu einem gegebenen Punkt und einer gegebenen Geraden den gleichen Abstand haben (Fig. 7). P . .. ...... P P ..... .....................................................t............ .... ...t ...................................t.................. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .... ........ ... ............. .. . .... ....... .. .......... ...... ..... ... . .. ...... ........... ........... . ... ..... . . . .t .. . . . . t t . ..... ..t......... . . . F1 . ... F2 l ... ..... ..tF . ...... F . . . . . F .. .... .........1. .. .......... .. ..................................................2.... ..... .......... ... .. .... ........... ...... .. ......... Fig. 5: Ellipse

Fig. 6: Hyperbel

Fig. 7: Parabel

5. Die Tangente an den Kreis um O mit dem Radius a im Kreispunkt P (p1 , p2 )

hat offensichtlich die Gleichung p1 x1 + p2 x2 = a2 . Wieso folgt daraus un-

mittelbar, dass die Tangente an die Ellipse mit der Gleichung p x

p x

x21 x2 + 22 = 1 2 a b

im Ellipsenpunkt P (p1 , p2 ) die Gleichung 1 2 1 + 2 2 2 = 1 hat? Wie lautet a b die Gleichung der Polaren bez¨ uglich obiger Ellipse zum Pol P (p1 , p2 )?

6. Die Punkte F1 , F2 bzw. F der Ellipse, Hyperbel bzw. Parabel in Aufgabe

4 (vgl. Fig. 5, 6, 7) heißen Brennpunkte der betreffenden Kurve. Man zeige: Ein von einem Brennpunkt ausgehender Strahl wird an der Kurve so reflektiert, dass er durch den anderen Brennpunkt bzw. bei der Parabel parallel zur Achse verläuft. ........................................................ . .. ......... .................................................................................. 7. Die Scheitelkrümmungskreise ei........ .... ... ....................... ......... .. . . . . . . . . . ........... ... . ........ .. ... ner Kegelschnittkurve approxi......... ... ............... .................... . . . ............ ... ... .... .......... .....r.. mieren die Kurve in den Scheiteln . . . . . ... ...............................s................................................................................... ..... .. bestmöglich. . . . . ... .. ..... .... ... ... ... ......... ... .... a) Man bestimme diese Kreise . . . . ... .. ... .............. .... .. . f¨ ur die Kegelschnittkurven, wel....... .... .... ................... ...... .... . . . . . . . ........................................................................................... che durch ihre Standardgleichung ..... ..s gegeben sind. b) Man begr¨ unde die Konstruktion der Scheitelkr¨ ummungskreise der Ellipse in Fig. 8.

Fig. 8: Scheitelkr¨ ummungskreise

VI.2 Flächen zweiter Ordnung

123

VI.2 Fl¨ achen zweiter Ordnung Definition 1: Die Punktmenge {(x1 , x2 , x3 ) ∈ IR3 | a11 x21 + a22 x22 + a33 x23 + 2a12 x1 x2 + 2a13 x1 x3 + 2a23 x2 x3 +a1 x1 + a2 x2 + a3 x3 + a = 0} (a11 , a22 , a33 , a12 , a13 , a23 , a1 , a2 , a3 , a ∈ IR) heißt eine Fläche zweiter Ordnung. ⎛

a11 Setzt man A = ⎝ a12 a13

a12 a22 a23

⎞ ⎛ ⎞ ⎛ ⎞ a13 a1 x1 a23 ⎠, a = ⎝ a2 ⎠ und x = ⎝ x2 ⎠, dann kann man a33 a3 x3

die Gleichung einer Fläche zweiter Ordnung folgendermaßen schreiben: xT A x + aT x + a = 0 Da A symmetrisch ist, existiert eine Orthonormalmatrix U mit ⎛

⎞

λ1 0 0 ⎟ U T AU = ⎜ ⎝ 0 λ2 0 ⎠ , 0 0 λ3 wobei λ1 , λ2 , λ3 die Eigenwerte von A und die Spaltenvektoren von U zugehörige Eigenvektoren sind (vgl. Folgerung aus Satz 1 in VI.1). Die Orthonormalmatrix U vermittelt eine Kongruenzabbildung. Mit x = U T x bzw. x = Ux ist 2 2 xT Ax = x T U T AU x = λ1 x2 1 + λ2 x2 + λ3 x3 .

Mit b = U T a lautet die Gleichung der Fläche dann λ1 x21 + λ2 x22 + λ3 x23 + b1 x1 + b2 x2 + b3 x3 + a = 0, wenn man statt x1 , x2 , x3 zur Vereinfachung wieder x1 , x2 , x3 schreibt. Wir klassifizieren nun die Flächen zweiter Ordnung nach der Anzahl der Eigenwerte, welche 0 sind. Sind alle Eigenwerte 0, dann beschreibt die Gleichung eine Ebene (falls b = o), die leere Menge (falls b = o, a = 0) oder den gesamten Raum (falls b = o, a = 0). Sind genau zwei der Eigenwerte 0, etwa λ1 = 0, λ2 = λ3 = 0, dann lässt sich die Gleichung umformen zu (x1 − c1 )2 = c2 x2 + c3 x3 + c. Ist (c2 , c3 ) = (0, 0), dann beschreibt die Gleichung ein Paar paralleler Ebenen (falls c > 0), eine Ebene (falls c = 0) oder die leere Menge (falls c < 0). Ist


124

(c2 , c3 ) = (0, 0), etwa c2 = 0, dann erhält die Gleichung mit der Koordinatenc transformation x1 = x1 − c1 , x2 = x2 + , x3 = x3 (Verschiebung) die Form c2

ur wir wieder ohne Striche x2 1 = d2 x2 + d3 x3 , wof¨

x21 = d2 x2 + d3 x3 schreiben. Die Kongruenzabbildung x → x mit

x1 = x1 ,

x2 1 = x3 d

d2 −d3 d3 d2

x2 x3

mit d =

d22 + d23

(Drehung der x2 x3 -Ebene um die x1 -Achse) ergibt x2 ur wir wieder 1 +dx2 = 0, wof¨

x21 + dx2 = 0 schreiben. Diese Gleichung beschreibt einen parabolischen Zylinder. Ist genau ein Eigenwert 0, etwa λ1 λ2 = 0, λ3 = 0, dann erhält die Gleichung nach einer Verschiebung des Koordinatensystems die Form λ1 x21 + λ2 x22 + c3 x3 + c = 0. Ist c3 = 0, dann beschreibt diese Gleichung • eine Gerade, falls c = 0 und λ1 λ2 > 0, • ein Ebenenpaar, falls c = 0 und λ1 λ2 < 0, • die leere Menge, falls cλ1 > 0 und cλ2 > 0, • einen elliptischen Zylinder, falls cλ1 < 0 und cλ2 < 0 • einen hyperbolischen Zylinder, falls cλ1 · cλ2 < 0. Ist c3 = 0, dann ergibt sich nach einer geeigneten Verschiebung des Koordinatensystems die Gleichung λ1 x21 + λ2 x22 + c3 x3 = 0. Sie beschreibt ein elliptisches Paraboloid (falls λ1 λ2 > 0) oder ein hyperbolisches Paraboloid (falls λ1 λ2 < 0). Ist kein Eigenwert 0, dann ergibt sich nach einer geeigneten Verschiebung die Gleichung λ1 x21 + λ2 x22 + λ3 x23 + c = 0. Ist c = 0, dann beschreibt die Gleichung einen Punkt, falls alle Eigenwerte das gleiche Vorzeichen haben, oder einen Kegel (genauer einen elliptischen Doppelkegel) in den anderen Fällen. Ist c = 0, dann kann man die Gleichung auf die Form μ1 x21 + μ2 x22 + μ3 x23 = 1 bringen. Diese Gleichung beschreibt die leere Menge (falls alle Koeffizienten μ ≤ 0 sind), ein zweischaliges Hyperboloid (falls genau ein Koeffizient μ positiv ist),


125

ein einschaliges Hyperboloid (falls genau zwei Koeffizienten μ positiv sind) oder ein Ellipsoid (falls alle Koeffizienten μ positiv sind). Mit den ausgef¨ uhrten Transformationen des Koordinatensystems hat man erreicht, dass möglichst viele Koordinatenachsen und -ebenen Symmetrieachsen und -ebenen der Flächen zweiter Ordnung werden. Man spricht daher bei diesen Transformationen auch von Hauptachsentransformationen. Eine Fläche zweiter Ordnung nennt man auch eine Quadrik. In Fig. 3 sind die neun interessanten Quadriken bez¨ uglich ihrer Standardgleichungen dargestellt. Das Ellipsoid, die Paraboloide (elliptisch oder hyperbolisch) und die Hyperboloide (einschalig oder zweischalig) nennt man nicht-ausgeartete Quadriken, den Kegel und die Zylinder (elliptisch, parabolisch oder hyperbolisch) nennt man ausgeartete Quadriken. Die ausgearteten Quadriken, aber auch das hyperbolische Paraboloid und das einschalige Hyperboloid enthalten Geradenscharen; man nennt solche Flächen Regelflächen. Vgl. VI.3. Die Schnittkurve einer Ebene mit einer Fläche zweiter Ordnung ist stets eine Kurve zweiter Ordnung: Durch eine geeignete Transformation des Koordinatensystems kann man die Schnittebene stets als die x1 x2 -Ebene ansehen (Gleichung x3 = 0); setzt man in der allgemeinen Gleichung f¨ ur eine Fläche zweiter Ordnung f¨ ur x3 die Zahl 0 ein, dann ergibt sich die Gleichung einer Kurve zweiter Ordnung in der x1 x2 -Ebene. Die Schnittkurven paralleler Ebenen mit einer Quadrik sind ähnlich zueinander (Aufgabe 12). Die Bezeichnungen elliptisch, hyperbolisch, parabolisch kennzeichnen die Art der Schnittkurven der entsprechenden Fläche mit einer Ebene. Die Hyperboloide in Fig. 3 sind beide elliptisch und können zusammen mit dem Doppelkegel als verwandt betrachtet werden (Aufgabe 8). Ellipsen treten auf als Schnittlinien einer Ebene mit einem Ellipsoid, einem elliptischen Paraboloid, einem (einschaligen oder zweischaligen) Hyperboloid, einem Kegel und einem elliptischen Zylinder. Hyperbeln treten auch als Schnittlinien einer Ebene mit einem hyperbolischen Paraboloid, einem (einschaligen oder zweischaligen) Hyperboloid, einem Kegel und einem hyperbolischen Zylinder auf. Parabeln treten auf als Schnittlinien einer Ebene mit einem (elliptischen oder hyperbolischen) Paraboloid, einem Kegel und einem parabolischen Zylinder. Die einzige Quadrik, bei der alle drei Kegelschnitte Ellipse, Parabel und Hyperbel auftreten, ist in der Tat der Kegel. Mit Hilfe einer affinen Abbildung lassen sich die Gleichungen der Quadriken weiter vereinfachen. Bis auf Affinität gibt es also folgende nicht-ausgeartete Quadriken: x21 + x22 + x23 = 1,

x21 + x22 − x23 = 1,

x21 + x22 − x3 = 0,

x21 − x22 − x23 = 1,

x21 − x22 − x3 = 0.


126

Elliptisches Paraboloid

Ellipsoid ... x3 ............................... ...... .............. ................s...... .................... ... . . ... .. . .............s... ........... ......... ....... ... ..... ...... ...... ............................ ........c ..... ........................s............... . . . . . . .... ....................................................................................................................................................... ............s............................ ... .................. ....... ..... .......... ... . ........... a .. . ).. ......... ...... ... ... ......... ...... ... ...b..........................s................ . . . . . . . ..... x1 ............. ... ... ... .....s....... ............ ... .......................... .....s ................ x2 ..

Hyperbolisches Paraboloid

x3 ..................... .....................6 . . ...... . . . . .. ......... ........................ ........................... .... ... .. ... . . ... .. ... ... .... . . ..... .... .....H ....... ... ....H j x2 H x1

... x .... ...... 63 ... ...... ......... .... .. ....... .... ....... . . . . . ... . .. q........... . .. . .. x1 ... .. . .. ....... x2 .................................. .......... ... ......

x21 x22 + 2 − x3 = 0 a2 b

x21 x22 − 2 − x3 = 0 a2 b

Einschaliges Hyperboloid

Zweischaliges Hyperboloid

Doppelkegel

x3 6 ...................................................... ........ .. ..... ..... . .................. . . . . . . . . . . . . . .... ....................... ... ... . .................................. ..... H ..... ....... ..... ... .........H . ......H .. x2 H .. x1 ... ................................................H j . ........H . . . . ..... .. . ...... .......... .... . . . .......................................... . x21 x22 x23 + 2 − 2 =1 a2 b c

x3 6......................... ......... ...... .... .. ... ... ... ... ... .. .. . .................................... . . . . .... ..................... @ ....................... ........... @ .... ..... .. @ .... .. @ R ... x2 ... . .... ... .. ..... . . ...... .. x 1 .................. x21 x22 x23 − 2 − 2 =1 a2 b c

x3 6 ...................................................... ........ ... ....... ..... . .................... . . . . . . . . . . . . . ....... ..................... ...... ....... .. ....... ........... . . . ...... H. ....H ...... .H .......H ... . . . . . x1 .... x2 . H ......................................................H .......j .. ...... ....... .. ...... ..... . ................. . . . . . . . . . . . . .................... x21 x22 x23 + 2 − 2 =0 a2 b c

Elliptischer Zylinder

Parabolischer Zylinder

Hyperbolischer Zylinder

x21 x22 x23 + 2 + 2 =1 a2 b c

x .......3................ ..................6 . . . . . . . ....... . . . ... ... ....... ... .............................................................. ... .. ............................................................... .... .. ..... ......... HHH ........... . . . . . . . . . x2 x1 ................................H H

j H

x21 a2

+

x22 b2

=1

x3 6

........................... ..... ... ... ... ... ... .... .. ... ..................... .... . .. H ...H .... ..... ...H ....... HHx2 x1 j H x21

− 2px2 = 0

x3 6....... ............................... ... ... ... . .. ...................... ... . . . ........... . .. .... ........ ... ... .... ... .. . ... ... ...................... ... .................... ... .... H ......... HH ..... ...... H x2 ... HH x1 j x21 x22 − 2 =1 a2 b

Fig. 1: Quadriken und ihre Standardgleichungen


127

Beispiel 1: Es soll die Fläche mit der Gleichung 4x21 + 2x22 + 3x23 + 4x1 x3 − 4x2 x3 + 12x1 + 30x2 + 36x3 + 2 = 0 untersucht werden. Die Matrix ⎛

⎞

4 0 2 2 −2 ⎟ A=⎜ ⎝ 0 ⎠ 2 −2 3 hat das charakteristische Polynom det(A − xE) = −x3 + 9x2 − 18x mit den Nullstellen λ1 = 0, λ2 = 3, λ3 = 6, dies sind also die Eigenwerte von A. Normierte Eigenvektoren dazu sind ⎛

1 u1 = ⎜ ⎝ 3

⎞

⎛

⎞

⎛

⎞

−1 2 2 1 1 ⎟ ⎟ 2 ⎟ u2 = ⎜ u3 = ⎜ ⎠, ⎝ 2 ⎠, ⎝ −1 ⎠ . 3 3 2 −1 2

Mit der Matrix U = (u1 u2 u3 ) ergibt sich ⎛

⎞

0 0 0 ⎜ ⎟ U T AU = ⎝ 0 3 0 ⎠ 0 0 6

⎛

⎞

⎛

⎞

12 40 ⎜ ⎟ ⎜ ⎟ und U T ⎝ 30 ⎠ = ⎝ 16 ⎠ . 36 22

Es ergibt sich die Gleichung 3x32 + 6x23 + 40x1 + 16x2 + 22x3 + 2 = 0 bzw.

8 2 11 2 79 + 6 x3 + + 40 x1 − = 0. 3 6 80 Bis auf eine Verschiebung des Koordinatensystems handelt es sich also um die Fläche mit der Gleichung 3 x2 +

x22 + 2x23 +

40 x1 = 0. 3

Dies ist die Gleichung eines elliptischen Paraboloids. Die Standardgleichung aus Fig. 1 ergibt sich durch Ersetzung von x1 durch −x1 (Spiegeln an der x2 x3 -Ebene), 40 Division der Gleichung durch , 3 Vertauschung der Variablen (x1 , x2 , x3 ) → (x3 , x1 , x2 ).


128

Aufgaben 1. Man bestimme a, b so, dass 2x21 + 2ax1 x2 + 2y22 − 7x1 + bx2 + 3 = 0 ein Paar paralleler Ebenen darstellt.

2. Beweise, dass das einschalige Hyperboloid aus Fig. 1 die beiden folgenden Geradenscharen enthält:

√ ⎞ ⎛ ⎞ at −a 1 − t2 ⎜ √ ⎟ ⎜ ⎟ gt : x = ⎝ b 1 − t2 ⎠ + r ⎝ bt ⎠ ⎛

c ⎛ ⎞ ⎛ √ ⎞ at a 1 − t2 √ ⎟ ⎜ ⎟ ht : x = ⎜ bt ⎝ −b 1 − t2 ⎠ + r ⎝ ⎠ c 0

(r ∈ IR, −1 ≤ t ≤ 1),

0

(r ∈ IR, −1 ≤ t ≤ 1).

3. Es sei P (p1 , p2 , p3 ) ein Punkt des in Fig. 1 angegebenen hyperbolischen Paraboloids (Sattelfläche). Beweise, dass die Gerade durch P mit dem Richtungsvektor (a2 b ab2 2(bp1 − ap2 ))T auf dieser Sattelfläche liegt.

4. Die Gleichung

x21 x2 x2 + 22 − 23 = 0 beschreibt eine Kegelfl¨ ache (Fig. 1). a2 b c

Welche Geraden liegen auf ihr?

5. Die Gerade durch die Punkte A(0, 2, 0) und B(2, 2, 3) rotiere um die x1 -Achse. Man zeige, dass dadurch ein einschaliges Hyperboloid entsteht.

6. Die Tangentialebene an das Ellipsoid mit der Gleichung im Punkt B(b1 , b2 , b3 ) hat die Gleichung

x21 x2 x2 + 22 + 23 = 1 a2 b c

b1 x1 b2 x2 b3 x3 + 2 + 2 = 1. a2 b c

Beweise dies mit Hilfe einer geeigneten affinen Abbildung des Raumes.

7. a) Unter welchen Bedingungen für die Parameter a, b, c handelt es sich bei den einzelnen Quadriken in Fig. 1 um einen Rotationskörper? b) Man bestimme c so, dass der Kegel mit der Gleichung x21 −2x1 x2 +cx23 = 0 ein Rotationskegel (Kreiskegel) ist, und gebe die Rotationsachse an.

8. Welche Fläche wird durch x21 + x22 − x23 = ε für ε ∈ {−1, 0, 1} dargestellt? 9. Man bestimme den Typ der Quadrik mit der Gleichung a) x21 + x22 + x23 − 2x1 x2 + 2x2 x3 + 2x1 x3 − 1 = 0, b) x21 + x22 + x23 + 2x1 x3 + 2x2 + 1 = 0, c) 3x21 + 3x22 + 3x23 + 2x1 x2 + 2x1 x3 − 2x2 x3 + 2x1 − 2x2 − 2x3 + 3 = 0, d) 7x21 + 6x22 + 5x23 − 4x12 − 4x23 − 6 = 0.

VI.3 Regelflächen

129

10. Welche Gestalt hat die Fläche mit der Gleichung x21 + (2m2 + 1)(x22 + x23 ) − 2x1 x2 − 2x1 x3 − 2x2 x3 = 2m2 − 3m + 1 in Abhängigkeit vom Parameter m ∈ IR ?

11. Die Ebene mit der Gleichung 3x1 +3x2 −x3 = 7 schneidet das hyperbolische Paraboloid mit der Gleichung 2x21 − 5x22 − 10x3 = 0 in einer Kurve zweiter Ordnung. Man beschreibe diese Kurve. (Bestimme zunächst eine Gleichung f¨ ur die Projektion dieser Schnittkurve in die x1 x2 -Ebene.)

12. Man zeige, dass die Schnittkurven paralleler Ebenen mit einer Quadrik zueinander ähnlich sind. Warum gen¨ ugt es, die Schnittebenen parallel zur x1 x2 -Ebene zu betrachten?

VII.3 Regelfl¨ achen Eine von einer Geradenschar (lat. regulus) erzeugte Fläche heißt Regelfläche. Einfache Beispiele daf¨ ur sind die Zylinder und die Kegel. Aber auch die hyperbolischen Paraboloide und die einschaligen Hyperboloide sind Regelflächen, wie wir nun zeigen wollen. Da eine Geradenschar bei einer affinen Abbildung wieder in eine Geradenschar u ¨bergeht und auch eine Fläche zweiter Ordnung wieder in eine solche vom gleichen Typ abgebildet wird, gen¨ ugt es, die Flächengleichungen in ihrer affinen Standardform zu betrachten. (Dass sich der Typ einer Quadrik bei einer affine Abbildung nicht ändert, erkennt man durch Betrachtung der verschiedenen affinen Abbildungen, vgl. VI.) Wir betrachten das hyperbolische Paraboloid (Sattelfläche) mit der Gleichung x21 − x22 − x3 = 0. Die Gerade a + u liegt genau dann auf der Fläche, wenn ur alle t ∈ IR, (a1 + tu1 )2 − (a2 + tu2 )2 − (a3 + tu3 ) = 0 f¨ wenn also a21 − a22 − a3 = 0, 2a1 u1 − 2a2 u2 − u3 = 0, u21 − u22 = 0. (Ein Polynom ist genau dann das Nullpolynom, wenn alle Koeffizienten 0 sind!)


130

Es ist keine Beschränkung der Allgemeinheit, u1 = 1 zu setzen. Dann ist u2 = ±1 und u3 = 2a1 ∓2a2 . Wählt man a1 , a2 als Parameter und setzt a1 = r, a2 = s, a3 = r2 − s2 , dann ergeben sich die beiden Geradenscharen ⎛

⎞ ⎛ ⎞ r 1 ⎝ ⎠ + t⎝ ⎠ (t ∈ IR), s 1 r2 − s2 2(r − s)

bzw.

⎛

⎞

⎛

⎞

1 1 r−s ⎝ s − r ⎠ + t⎝ ⎠ (t ∈ IR), 1 2 0 2(r − s)

⎛

⎞ ⎛ ⎞ r 1 ⎝ ⎠ + t⎝ ⎠ (t ∈ IR) s −1 r2 − s2 2(r + s) ⎛

⎞

⎛

⎞

1 1 r+s ⎝ r + s ⎠ + t⎝ ⎠ (t ∈ IR) −1 2 0 2(r + s)

bzw. mit den neuen Parametern u = r − s und v = r + s ⎛

⎞

⎛

⎞

1 1 u ⎝ −1 ⎠ + t⎝ 1 ⎠ (t ∈ IR), 2 0 2u

⎛

⎞

⎛

⎞

1 v 1 ⎝ 1 ⎠ + t⎝ −1 ⎠ (t ∈ IR). 2 0 2v

Die Parameter u, v durchlaufen dabei die Menge IR. Man kann leicht verifizieren, dass diese Geradenscharen auf der Sattelfläche liegen; beispielsweise ist bei der ersten Schar x1 −x2 = u, x1 +x2 = 2t, x3 = 2ut und damit (x1 −x2 )(x1 +x2 ) = x3 , also x21 − x22 − x3 = 0. Vgl. Aufgabe 4. Je zwei Geraden einer Schar sind windschief, was wir an der ersten der beiden Scharen zeigen: Die Geraden sind f¨ ur u = u∗ nicht parallel. Hätten die Geraden zum Parameter u bzw. zum Parameter u∗ f¨ ur den Wert t bzw. den Wert t∗ einen gemeinsamen Punkt, dann wäre t − t∗ =

u∗ u − 2 2

und t − t∗ =

u u∗ − , 2 2

also u = u∗ .

Jede Gerade der einen Schar schneidet jede Gerade der anderen Schar, denn die Gleichung ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 1 1 u v 1 ⎝ −1 ⎠ + t⎝ 1 ⎠ = ⎝ 1 ⎠ + t∗ ⎝ −1 ⎠ 2 2 0 0 2u 2v hat die Lösung 2t = v, 2t∗ = u. Wir betrachten nun das einschalige Hyperboloid mit einer Gleichung in affiner Standardform, also x21 + x22 − x23 = 1. Die Gerade a + u liegt genau dann auf der Fläche, wenn ur alle t ∈ IR, (a1 + tu1 )2 + (a2 + tu2 )2 − (a3 + tu3 )2 = 1 f¨

VI.3 Regelflächen

131

wenn also

Eine Gerade der Regelschar kann nicht parallel zur x1 x2 -Ebene sein, wir setzen daher u3 = 1 und

x3 ...................... .....................6 . . . . . ......... . . . . . ..... ...... ... .... .. ... .. .... . . . ...... . . ........ ................... ... . ........................................................................................................... ............................................ .......... ........... .............................. .... ........... .............................. ...................... ......................................................... ............ .... .... ............... . .................. ............ .................. ........ ..................................................................................H . ........................... ...... ................................HH . . . . . . . . . . . jx ...................................................................................... H x1 2 ....................................................................................... ........................... . . . . . ..................... ........... .......... .............. ............................ ............................... . . . . . . ............ .... ...... ........ ... ... .... ... .. .. ......... ........................ .................. .... ......... ... ............................ ........ .... ........................... ................................ ........ ........ ....................... ......... ....................... .......... ........................................... ............. ....... ........... ...... ...... ...... ..... ...... ...... ........... ....... ......... .......... ...... ... ... ...... ... ...... ...... ..... ... ...... ..... .......... ................. ... ...... ...... ...... ..... ................. ...............................................

u1 = cos ϕ, u2 = ± sin ϕ (0 ≤ ϕ < 2π).

Fig. 1: Einschaliges Hyperboloid

a21 + a22 − a23 = 1, a1 u1 + a2 u2 − a3 u3 = 0, u21 + u22 − u23 = 0. Jede Gerade einer Regelschar muss durch einen Punkt der x1 x2 -Ebene gehen, und zwar durch einen G¨ urtelpunkt“ des Hyperboloids ” (Fig. 1). Wir setzen daher a3 = 0 und a1 = cos α, a2 = sin α (0 ≤ α < 2π).

Wegen a1 u1 + a2 u2 = 0 gilt dann cos α cos ϕ ± sin α sin ϕ = cos(α ∓ ϕ) = 0, also α ∓ ϕ = ± π2 . Damit ergeben sich zwei Geradenscharen: ⎛

⎞ ⎛ ⎞ sin ϕ cos ϕ ⎝ cos ϕ ⎠ + t⎝ sin ϕ ⎠ 0 1

⎛

(t ∈ IR),

⎞ ⎛ ⎞ sin ϕ cos ϕ ⎝ cos ϕ ⎠ + t⎝ − sin ϕ ⎠ 0 1

(t ∈ IR)

Man beachte dabei cos(ϕ ± π2 ) = ± sin ϕ usw. Diese Geradenscharen werden erzeugt, wenn die beiden Geraden ⎛

⎞ ⎛ ⎞ 1 0 ⎝ 0 ⎠ + t⎝ ±1 ⎠ (t ∈ IR) 0 1

um die x3 -Achse rotieren. Wie bei der Sattelfläche gilt: Zwei Geraden einer Schar sind windschief, zwei Geraden aus verschiedenen Scharen schneiden sich.

Aufgaben 1. Welche Geraden liegen auf dem Doppelkegel mit der Gleichung x21 + x22 − x23 = 0 ? √

√

1 1 2. Es sei g1 die Gerade durch (√ , 3, 0) mit dem Richtungsvektor ( 3 1 2)T 2 2 √

und g1 die Gerade durch ( 12 3, 12 , 0) mit dem Richtungsvektor (1

3 2)T .


132

Man weise nach, dass g1 und g2 zu verschiedenen Regelscharen des im Text behandelten einschaligen Hyperboloids gehören und berechne ihren Schnittpunkt.

⎛

3. Es seien Geraden g :

⎞ ⎞ ⎛ ⎞

⎛ 0 1 0 ⎝ 0 ⎠ und h : ⎝ 1 ⎠ + ⎝ 0 ⎠ gegeben. Diese 1 0 0

sind offensichtlich windschief. Man zeige, dass die Verbindungsgeraden je eines Punktes von g mit dem Punkt von h mit demselben Parameterwert ein hyperbolisches Paraboloid erzeugen.

4. a) Die Gleichung x21 − x22 − x3 = 0 bzw. (x1 + x2 )(x1 − x2 ) = x3 einer Sattelfläche wird jeweils von allen Lösungen der beiden LGS x1 + x2 = rx3 r(x1 − x2 ) = 1

x 1 + x2 = s s(x1 − x2 ) = x3

erf¨ ullt, wobei r, s Parameter sind. Man zeige, dass diese LGS die Regelscharen der Sattelfläche darstellen. b) Man stelle auf a¨hnliche Art die Regelscharen des einschaligen Hyperboloids als Lösungsmengen von Gleichungssystemen dar.

VI.4 Kreisschnittebenen In der Gleichung x21 x22 x23 + 2 + 2 =1 a2 b c

x3 6 ............................. ........ ... ......................... . . . . . . ............ . ......... .. .. ...... ........................ ...... ...... .. . . . . ...... ..... .... . . . . ..... .. ..... ... .... . . ..... ... ..... ...... ......... ... ... ... .. . . . . . . . . . . . . x2 . . . . . . ...... . ... . ... ... ........ ... .................................................. ... ............. .................. .. ................... . ....... ...................................... x1

eines Ellipsoids sei c < a < b. Dann schneidet die Kugel um O mit dem Radius a aus dem Ellipsoid zwei Kreise mit dem Mittelpunkt O und dem Radius a aus (Fig. 1). Die Ebenen, in denen diese Kreise liegen, sind Beispiele Fig. 1: Kreisschnitte des Ellipsoids f¨ ur Kreisschnittebenen des Ellipsoids. Parallele Ebenen schneiden eine Quadrik in zueinander ähnlichen Kurven zweiter Ordnung (vgl. VI.1 Aufgabe 12). Also sind die zu den beiden oben angegebenen Ebenen parallelen Ebenen ebenfalls Kreisschnittebenen des Ellipsoids. Um die Kreisschnittebenen einer Quadrik mit dem Mittelpunkt O (Ellipsoid, einschaliges Hyperboloid, zweischaliges Hyperboloid) zu finden, schneidet man also die Quadrik mit einer Kugel um O mit geeignet zu wählendem Radius r: Quadrik: Ax21 + Bx22 + Cx23 − 1 = 0

VI.4 Kreisschnittebenen

133

Kugel:

x21 + x22 + x23 − r2 = 0

Man betrachtet nun die Gleichung (Ax21 + Bx22 + Cx23 − 1) − μ(x21 + x22 + x23 − r2 ) = 0, welche zunächst wieder eine Quadrik beschreibt. Durch geeignete Wahl von r und μ soll diese in zwei Ebenen (durch O) zerfallen. Es muss also μ ∈ {A, B, C} und μr2 = 1 gelten. Wir nehmen A < B < C an. Mit μ = A oder μ = C und μr2 = 1 ergeben sich die Gleichungen (B − A)x22 + (C − A)x23 = 0 bzw (C − A)x21 + (C − B)x22 = 0, welche nur den Punkt O darstellen. Man muss also μ = B wählen und erhält die Gleichung (B − A)x21 − (C − B)x22 = 0, welche ein Ebenenpaar darstellt:

x1 ± sx3 = 0 mit s =

C −B B−A

Bei den Paraboloiden, die ja keinen Mittelpunkt besitzen, geht man ähnlich vor: Man schneidet das Paraboloid mit der Gleichung Ax21 + Bx22 − 2x3 = 0 mit einer Kugel durch O, deren Mittelpunkt auf der x3 -Achse liegt, welche also die Gleichung x21 + x22 + x23 − 2rx3 = 0 hat. Man untersucht, wann die Quadrik mit der Gleichung (Ax21 + Bx22 − 2x3 ) − μ(x21 + x22 + x23 − 2rx3 ) = 0 in ein Ebenenpaar zerfällt. Dazu muss μ ∈ {A, B} und μr = 1 gelten. F¨ ur das elliptische Paraboloid mit 0 < A < B erhält man mit μ = A das Ebenenpaar mit der Gleichung (B − A)x22 − Ax23 = 0. F¨ ur das hyperbolische Paraboloid mit A < 0 < B gibt es keine Kreisschnittebenen, weil f¨ ur μ ∈ {A, B} und μr = 1 nur ein Punkt dargestellt wird.

Aufgaben 1. Man bestimme die Kreisschnittebenen der Quadrik mit der Gleichung 2x21 + 5x22 − 4x3 = 0.

2. Man bestimme in Fig. 1 die Kreisschnittebenen durch O durch Berechnung der Schnittpunkte von Ellipsoid und Kugel in der x2 x3 -Ebene.

3. Die parallelen Ebenen mit den Gleichungen x2 − 2x3 = c schneiden den

Kegel mit der Gleichung x21 + x22 − x23 = 0 in zueinander ähnlichen Ellipsen. Man bestimme das Achsenverhältnis dieser Ellipsen.

VII Projektive Geometrie VII.1 Homogene Koordinaten Viele Begriffe, Sätze und Beweise der analytischen Geometrie erlauben elegantere Formulierungen, wenn man statt der bekannten affinen Koordinaten die in folgender Definition beschriebenen homogenen“ Koordinaten benutzt. Im Gegensatz ” zur u ¨blichen ( affinen“) Geometrie haben dann je zwei Geraden in der Ebene und ” je zwei Ebenen im Raum auch dann einen Schnittpunkt bzw. eine Schnittgerade, wenn sie als affine Gebilde parallel sind. Die Einf¨ uhrung homogener Koordinaten wird dadurch motiviert, dass in den Grundlagen der Geometrie Punkte und Geraden eine auffallende duale“ Rolle spielen: Zwei verschiedene Punkte inzidieren ” mit genau einer Geraden, und zwei verschiedene Geraden inzidieren mit genau einem Punkt (falls sie nicht parallel sind). Eine Gerade wird bez¨ uglich eines affinen Koordinatensystems durch eine Gleichung der Form a0 +a1 x1 +a2 x2 = 0 beschrieben, also durch ein Tripel (a0 , a1 , a2 ) = (0, 0, 0), wobei ein Vielfaches dieses Tripels die gleiche Gerade beschreibt. Möchten wir nun Punkte in der Ebene ebenfalls durch Zahlentripel beschreiben, so orientieren wir uns an der Beschreibung von Geraden und kommen so auf die Idee der Einf¨ uhrung homogener Koordinaten. Definition: Ist in der Ebene bzw. im Raum ein affines Koordinatensystem gegeben, dann ordnet man dem Tripel (x0 , x1 , x2 ) ∈ IR3 bzw. demQuadrupel

(x0 , x1 , x2 , x3 ) ∈ IR4 den Punkt

x1 x2 , x0 x0

bzw. den Punkt

x1 x2 x3 , , x0 x0 x0

im affinen

Koordinatensystem zu, wobei x0 = 0 sein muss. Wir erweitern die affine Ebene bzw. den affinen Raum um die Punkte mit x0 = 0, nennen diese Punkte uneigentlich oder unendlich fern und sprechen dann von der projektiven Ebene bzw. vom projektiven Raum. Dem Tripel (0, 0, 0) bzw. dem Quadrupel (0, 0, 0, 0) ist jedoch kein Punkt zugeordnet. Die Tripel (x0 , x1 , x2 ) bzw. Quadrupel (x0 , x1 , x2 , x3 ) heißen homogene oder projektive Koordinaten, besser Koordinatentripel“ bzw. ” Koordinatenquadrupel“ des betreffenden Punktes. ” Es ist zweckmäßig, diese Tripel bzw. Quadrupel aus IR3 bzw. IR4 als Vektoren aufzufassen, obwohl sie keinen Vektorraum bilden, da der Nullvektor nicht dazu gehört. Man beachte, dass das Tripel bzw. Quadrupel x denselben Punkt beschreibt wie das Tripel bzw. Quadrupel rx mir r ∈ IR, r = 0. Auch eine Gerade mit einem affinen Koordinatensystem (Skala) lässt sich zu einer projektiven Geraden machen, indem man ihre Punkte durch Paare (x0 , x1 ) mit x x0 = 0 kennzeichnet, diesen Paaren die Skalenpunkte 1 zuordnet und schließlich x0

(0, 1) als einen uneigentlichen Punkt hinzunimmt. Im Folgenden wird die projektive Gerade selten vorkommen, da sie äußerst langweilig ist: Auf ihr lassen sich nur Punkte (keine Geraden usw.) betrachten. Trotzdem ist der Begriff der projektiven Abbildung auf einer projektiven Geraden von Interesse (vgl. VII.2).

VII.1 Homogene Koordinaten

135

Zwei Tripel bzw. Quadrupel definieren den gleichen Punkt der projektiven Ebene bzw. des projektiven Raums, wenn sie sich nur um einen gemeinsamen Faktor unterscheiden, wie wir schon oben festgehalten haben. F¨ ur x ∈ IR3 bzw. x ∈ IR4 mit x = o bezeichnen wir mit [x] den Punkt der projektiven Ebene bzw. des projektiven Raums mit dem homogenen Koordinatenvektor x. (Im Folgenden werden die Koordinaten von x f¨ ur jeden Buchstaben x immer mit x0 , x1 , x2 bzw. mit x0 , x1 , x2 , x3 bezeichnet.) Es gilt [x] = [y ] genau dann, wenn x = ry mit r ∈ IR, r = 0. Die Gleichung einer Geraden in der affinen Ebene bzw. einer Ebene im affinen Raum hat die Form a0 + a1 x1 + a2 x2 = 0 bzw. a0 + a1 x1 + a2 x2 + a3 x3 = 0, wobei (a1 , a2 ) = (0, 0) bzw. (a1 , a2 , a3 ) = (0, 0, 0) ist. Ersetzt man x1 , x2 bzw. x1 , x2 , x3 x x x x x durch 1 , 2 bzw. 1 , 2 , 3 , so lautet die Gleichung in homogenen Koordinaten x0 x0

x0 x0 x0

a0 x0 + a1 x1 + a2 x2 = 0 bzw. a0 x0 + a1 x1 + a2 x2 + a3 x3 = 0. Ist jetzt (a1 , a2 ) = (0, 0) bzw. (a1 , a2 , a3 ) = (0, 0, 0) und a0 = 0, dann definiert diese Gleichung die uneigentliche oder unendlich ferne Gerade bzw. Ebene mit der Gleichung x0 = 0. Auf der projektiven Geraden ist a0 x0 + a1 x1 = 0 nat¨ urlich nur die Gleichung eines einzigen Punktes. F¨ ur a ∈ IR3 bzw. a ∈ IR4 mit a = o sei a die Gerade der projektiven Ebene bzw. die Ebene des projektiven Raums mit dem Koeffizientenvektor a. Es gilt a = b genau dann, wenn a = rb mit r ∈ IR, r = 0. Spitze Klammern haben wir fr¨ uher zur Bezeichnung des Erzeugnisses einer Vektormenge benutzt, a war also die Menge aller Vielfachen des Vektors a. Jetzt hat dieses Symbol eine etwas andere Bedeutung, da jetzt der Nullvektor nicht zu a gehört. Genau dann liegt der Punkt [u] auf der Geraden bzw. der Ebene v , wenn u T v = 0. Wegen u T v = v T u ist dies genau dann der Fall, wenn der Punkt [v ] auf der Geraden bzw. der Ebene u liegt. Gilt a T u = 0 und b T u = 0 und ist a kein Vielfaches von b, dann bedeutet dies in der projektiven Ebene: [u] ist der Schnittpunkt der Geraden a und b, u ist die Verbindungsgerade der Punkte [a] und [b]. Gilt a T u = 0, b T u = 0, c T u = 0 und ist {a, b, c} linear unabhängig, dann bedeutet dies im projektiven Raum: [u] ist der Schnittpunkt der Ebenen a, b, c, u ist die Ebene durch die Punkte [a], [b], [c].

VII Projektive Geometrie

136

In der projektiven Ebene besitzen (im Gegensatz zur affinen Ebene) je zwei verschiedene Geraden einen Schnittpunkt, denn ist {a, b} linear unabhängig, a0 x0 + a1 x1 + a2 x2 = 0 dann besitzt das homogene LGS einen eindimenb 0 x 0 + b 1 x 1 + b2 x 2 = 0 sionalen Lösungsraum. F¨ ur die Lösungen gilt genau dann x0 = 0, wenn auch a1 x1 + a2 x2 = 0 einen eindimensionalen Lösungsraum besitzt, wenn also die b1 x 1 + b 2 x 2 = 0 Geraden parallel sind. Diese und alle anderen dazu parallelen Geraden gehen durch den uneigentlichen Punkt mit den Koordinaten 0, a2 , −a1 . Ein uneigentlicher Punkt kann also durch einen Parallelenschar beschrieben werden (Fig. 1). Die uneigentlichen Punkte zweier nicht paralleler Geraden sind verschieden. a x + a2 x2 = 0

1 1 ........................................................................... . . . . . . . . . . . . . . . ........ ........ ........ ........ ........ ......... ........ ...................................................................................... ............................ . . ⎡⎛ ⎞⎤ . . . . . ... .. ... ... ... ... ... ... 0 ........ ........ ........ ........ ........ .......... ........ ......... ⎢⎜ ⎟⎥ ................................................................................ .......................... * ⎣⎝ a2 ⎠⎦ ... ... ... ... ... ... .......... ........................................................... .................. .. a2 −a1 ........................................................ ........................... −a1 ..... ................... ......... ......... .......................... .............................. ..... ........................ x1 ...... ......

x2

6

Fig. 1: Parallelenschar und ihr uneigentlicher Punkt

Im projektiven Raum m¨ ussen zwei Geraden nicht stets einen Schnittpunkt haben. Zwei Ebenen schneiden sich aber stets in einer Geraden, wobei die Schnittgerade von parallelen Ebenen eine uneigentliche Gerade ist. In der projektiven Ebene bedeutet (falls {a, b} linear unabhängig ist) {[ra + sb] | r, s ∈ IR, (r, s) = (0, 0)} die Menge aller Punkte der Geraden durch [a] und [b], und {ra + sb | r, s ∈ IR, (r, s) = (0, 0)} die Menge aller Geraden durch den Schnittpunkt von a und b. Eine Gerade wird dabei als Punktreihe“ und ein Punkt als Geradenb¨ uschel“ verstanden ” ” (Fig. 2). .. ..... a . . . . . . ............... .. . ........ [b] ..d.......... . ............. ... ... .... ... . . . . . . . . v . . . . ........ .. ....... .. .. .. d......... . . . . . . . . . . . .. d . . . . .... .. .. .. ......................w ........................ .. .. ...... [a] ..........d............d......... . . . . . . . . . . . d . . . . . . . . .. . ..... . .......................... .......... ...v .......d......... ... . . ...... .....b .... . .. . . Gerade durch [a] und [b] .... Schnittpunkt von a und b .... Fig. 2: Gerade als Punktreihe und Punkt als Geradenb¨ uschel


137

Im projektiven Raum bedeutet (falls {a, b, c} linear unabhängig ist) {[ra + sb + tc] | r, s, t ∈ IR, (r, s, t) = (0, 0, 0)} die Menge aller Punkte der Ebene durch [a], [b], [c], und {ra + sb + tc | r, s, t ∈ IR, (r, s, t) = (0, 0, 0)} die Menge aller Ebenen durch den Schnittpunkt von a, b, c (Punkt als Ebe” nenb¨ uschel“). Ferner bedeutet wieder {[ra + sb] | r, s ∈ IR, (r, s) = (0, 0)} die Gerade durch [a] und [b] und {ra + sb | r, s ∈ IR, (r, s) = (0, 0)} die Menge aller Ebenen durch die Schnittgerade von a und b (Gerade als Ebenenb¨ undel“). ” ¨ Diese Uberlegungen zeigen, dass in der projektiven Ebene bzw. im projektiven Raum das folgende Dualitätsprinzip gilt: Ein Satz (eine wahre Aussage) u ¨ber Inzidenzen von Punkten und Geraden in der Ebene geht wieder in einen Satz u ¨ber, wenn man Punkt liegt auf Gerade Gerade geht durch Punkt Geraden schneiden Punkte verbinden

ersetzt durch

Gerade geht durch Punkt Punkt liegt auf Gerade Punkte verbinden Geraden schneiden

Ein Satz (eine wahre Aussage) u ¨ber Inzidenzen von Punkten und Geraden im projektiven Raum geht wieder in einen Satz u ¨ber, wenn man Punkt liegt auf Ebene Ebene geht durch Punkt Punkt liegt auf Gerade Ebene geht durch Gerade Gerade geht durch Punkt Gerade liegt auf Ebene Ebenen schneiden Punkte verbinden

ersetzt durch

Ebene geht durch Punkt Punkt liegt auf Ebene Ebene geht durch Gerade Punkt liegt auf Gerade Gerade liegt auf Ebene Gerade geht durch Punkt Punkte verbinden Ebenen schneiden

Geraden oder Ebenen mit genau einem gemeinsamen Punkt nennt man kopunktal; Punkte, die auf einer gemeinsamen Geraden liegen, nennt man kollinear; Punkte, die in einer gemeinsamen Ebene liegen, heißen komplanar.


138

In der projektiven Ebene gilt: Genau dann sind die Punkte [a], [b], [c] kollinear, wenn die Geraden a, b, c kopunktal sind, und dies ist genau dann der Fall, wenn {a, b, c} linear abhängig ist, also wenn det(a, b, c) = 0. Eine Gleichung f¨ ur die Gerade durch die Punkte [a], [b] ist also det(a, b, x) = 0. Analoges gilt im projektiven Raum: Eine Gleichung f¨ ur die Ebene durch die Punkte [a], [b], [c] ist also det(a, b, c, x) = 0. Die Tangente an den Kreis mit der (projektiven) Gleichung x21 + x22 = r2 x20 im Kreispunkt [b] hat die Gleichung b1 x1 + b2 x2 = r2 b0 x0 , also (−r2 b0 b1 b2 )x = 0. Ist also die Gerade y eine Tangente an den Kreis, dann ist ⎛

y =

⎜ ⎝

⎞

−r2 b0 b1 ⎟ ⎠ , b2

wegen b21 + b22 = r2 b20 also y12 + y22 =

y02 . r2

Man kann daher den Kreis um O mit dem Radius r (und analog jede andere Kurve) einerseits als die Menge aller Punkte [x] betrachten, welche der Gleichung x21 + x22 = r2 x20 gen¨ ugen, andererseits als die Menge aller Geraden y , welche der Gleichung y12 + y22 =

s s s s

y02 gen¨ ugen (Fig. 3). r2

s s s s s s s s s

s

s

s s s s s s

s

s s s s s

.. .. . ... ...................................................................... ........... . . . .. ......... .............. .. .............. ........... . ......... . . . . . . . . ..... .... ..... ... ..... .... .. ..... ..... .......... ........ . ...... ................. ................ . ......... . . . . . . . . ............................................................................. ..... ........ .... .

Fig. 3: Kreis als Punktmenge und Geradenmenge

Aufgaben ⎛

1.

⎞ ⎛ ⎞ 1 0 ⎝ ⎠ ⎝ Es sei a = 0 und b = 1 ⎠. Man bestimme den Schnittpunkt von a 0 0

und b sowie die Verbindungsgerade von [a] und [b].

2. Man zeige, dass folgende Determinantengleichung eine Gerade in der affinen Ebene beschreibt:

1 a 1 1 b1 1 x1

a2 b2 x2

=0


139

3. a) Welche Koordinaten hat der uneigentliche Punkt der Geraden mit der Gleichung 3x0 + x1 − 4x2 = 0 in der projektiven Ebene? b) Bestimme die uneigentliche Gerade im projektiven Raum, welche zu der Ebene mit der Gleichung 2x0 − x1 − x2 + 5x3 = 0 gehört. c) Welche Koordinaten hat der uneigentliche Punkt, der zu den beiden Ebenen mit den Gleichungen x0 + x1 + x2 + 2x3 = 0 und 3x0 − 5x2 + x3 = 0 gehört?

4. Wir betrachten folgende bijektive der Punkte ⎡⎛ Abbildung ⎞⎤ ⎡⎛ auf die ⎞Geraden ⎤ p0

der projektiven Ebene: P = ⎣⎝ p1 ⎠⎦ werde auf p = ⎣⎝ p2

−r2 p0 p1 ⎠⎦ abgep2

bildet, wobei r = 0 (Pol-Polare-Beziehung). Mit großen lateinischen Buchstaben bezeichnen wir Punkte, mit den entsprechenden kleinen Buchstaben die ihnen zugeordneten Geraden. Man zeige: a) Liegt Q auf p, dann liegt P auf q. b) Liegt B auf dem Kreis um O mit dem Radius r, dann ist b die Tangente an den Kreis mit dem Ber¨ uhrpunkt B. c) Sind A, B zwei Punkte auf dem Kreis um O mit dem Radius r und ist P der Schnittpunkt von a und b, dann ist die Polare p zu P die Verbindungsgerade von A und B (Fig. 4).

5. Die folgenden Vektoren a, b, c, d sind linear unabhängig: ⎛

⎞ ⎛ 1 1 ⎜ 1 ⎟ ⎜ 1 ⎜ ⎟ ⎜ ⎝ 1 ⎠, ⎝ 0 0 1

⎞ ⎛

⎞ ⎛ 1 1 ⎟ ⎜ 0 ⎟ ⎜ 1 ⎟, ⎜ ⎟ ⎜ ⎠ ⎝ 1 ⎠, ⎝ 2 1 3

⎞ ⎟ ⎟. ⎠

Man betrachte f¨ ur jedes Paar (r, s) ∈ IR2 mit (r, s) = (0, 0) die Gerade u(ra + sb) + v(rc + sd) und zeige, dass je zwei dieser Geraden windschief sind. Man zeige dann, dass diese Geraden ein hyperbolisches Paraboloid (Sattelfläche) erzeugen (Fig. 5). Vgl. hierzu VI.3.

.. .... ....B .................t................................... b . ...........................t.................. . ... ........ . . . . . . . ... ..... ... .... ... ... ... .... P . ... . ... . ... ... ....... p ... . ... a .... ... ... ... ... ........ ... ... ....... .... ...... ...... ............ ..................t... ....... A Fig. 4: Pol-Polare-Beziehung

... ...s... ... ....s. .. .. .. .... ... ... ....s... .. . .. .. .. ....s. ....... ... ... .... .................. .. .. s .. .. .. ......................... ... ...........s.................... ...........s.. .. ... ..... . .. .............s.......s.................................................................s .............. ... ..........s.....s..s. .................. ... ....s..s ....... .....s. . s ....... .. . . .. .......... .... .s.. Fig. 5: Sattelfl¨ ache


140

VII.2 Projektive Abbildungen Definition 1: Es sei A eine invertierbare Matrix aus IR2,2 , IR3,3 bzw. aus IR4,4 , es sei also det A = 0. Dann nennt man die Abbildung [x] → [Ax] eine projektive Abbildung der projektiven Geraden, der projektiven Ebene bzw. des projektiven Raums auf sich. Zwei Matrizen bestimmen also die gleiche projektive Abbildung, wenn sie sich nur um einen reellen Faktor unterscheiden. Beispiel 1: Die projektive Abbildung der projektiven Geraden 1 2 auf sich mit der Matrix 3 −1

0.. ................................................................................1. ....................... .. ........... ........... . . . .. ................................. .......... ................................................................................ ............................................................................................................................................. 2 3 3

bildet das Intervall [0, 1] auf das 2 , 3 ab, und zwar un3

Intervall

Fig. 1: Projektives Bild einer Strecke

ter Umkehrung der Anordnung (Fig. 1). Denn

1 2 3 −1

r

1 0

+s

1 1

=r

1 3

+s

3 2

f¨ ur r, s ∈ IR.

u −u + 3v aus dem Intervall [0, 1] wird auf die Bruchzahl abgebilv 2u + v 2 det, welche zwischen 3 (f¨ ur u = 0) und (f¨ ur u = v) liegt. 3

Die Bruchzahl

Beispiel 2: Fig. 2 zeigt, auf welches Viereck A B C D das Quadrat ABCD bei der projektiven Abbildung mit der Matrix ⎛

2 ⎝ 0 1

D

⎞

−1 −1 3 1 ⎠ 2 1

D

abgebildet wird. Dabei ist C der uneigentliche Punkt auf der Geraden mit der Gleichung x0 + x1 − x2 = 0.

A A

.. .... ..... . . . .... ... ... C ..... . . .. .. ... 6..... ... . 1 . . ....u...........................................................................uh C = B ... .. .... . ... ...... .... .. . . . . .. . ... .. . .. ....... .... . . . .. .. ...... .....h .... ..... ..1 ...h .. .. ..... . .. ....u........................................................................u B

Fig. 2: Projektives Bild eines Quadrats

Denn ⎛

⎞⎛

⎞

⎛

⎞

2 −1 −1 1 1 1 1 4 2 0 2 ⎜ ⎜ ⎜ ⎟ 3 1 ⎟ 1 1 −1 ⎟ ⎝ 0 ⎠ ⎝ −1 ⎠ = ⎝ −4 2 4 −2 ⎠ , 1 2 1 −1 −1 1 1 −2 2 4 0 die Bildpunkte A , B , C , D sind also der Reihe nach

VII.2 Projektive Abbildungen ⎡⎛

141

⎞⎤ ⎡⎛

⎞⎤ ⎡⎛

⎞⎤ ⎡⎛

⎞⎤

1 1 0 1 ⎢⎜ ⎟⎥ ⎢⎜ ⎟⎥ ⎢⎜ ⎟⎥ ⎢⎜ ⎟⎥ ⎣⎝ −1 ⎠⎦ , ⎣⎝ 1 ⎠⎦ , ⎣⎝ 1 ⎠⎦ , ⎣⎝ −1 ⎠⎦ . 1 −2 1 1 0 In der affinen Ebene bzw. im affinen Raum ist die affine Abbildung, die ein gegebenes Dreieck bzw. Vierflach (allgemeines Tetraeder) auf ein ebenfalls gegebenes Dreieck bzw. Vierflach abbildet, eindeutig bestimmt. Dies gilt f¨ ur eine projektive Abbildung der projektiven Ebene oder des projektiven Raums aber nicht. Dies gilt auch nicht f¨ ur eine projektive Abbildung der projektiven Geraden, wie folgendes Beispiel zeigt. Beispiel 3: Bei einer projektiven Abbildung der projektiven Geraden werde

1 1 1 1 a auf und auf abgebildet. Mit A = 00 0 2 1 4 a10 1 1 A =r 0 2

und

1 1 A =s , 1 4

also

a01 a11

gilt

a00 = r, a01 = s − r, a10 = 2r, a11 = 4s − 2r

mit r, s = 0. Durch geeignete Wahl von r, s findet man zwei Matrizen A, von denen die eine kein Vielfaches der anderen ist, die also zu verschiedenen projektiven Abbidungen gehören:

1 2

F¨ ur r = 1, s = 1 erhält man A =

f¨ ur r = 1, s = 2 erhält man A =

1 2

0 , 2 1 . 7

0 1 =t , 1 3

Kennt man aber einen weiteren Punkt und seinen Bildpunkt, etwa A dann ist A bis auf einen Faktor aus IR eindeutig bestimmt:

r s−r 2r 4s − 2r

0 r−s 1 = =t 1 4r − 2s 3

und damit A=

t 2

1 2

−2 −6

t t liefert r = , s = − 2 2

.

Der folgende Satz 1 wird Hauptsatz der projektiven Geometrie genannt. Er garantiert z. B., dass es genau eine projektive Abbildung der projektiven Ebene von denen je drei nicht kolligibt, welche vier gegebene Punkte [a], [b], [c], [d], near sind, auf vier gegebenen Punkte [a ], [b ], [c ], [d ] abbildet, von denen ebenfalls je drei nicht kollinear sind. Dual dazu gilt nat¨ urlich, dass es genau eine projektive Abbildung der projektiven Ebene gibt, welche vier gegebene Geraden von denen je drei nicht kopunktal sind, auf vier gegebene Geraden a, b, c, d, a , b , c , d abbildet, von denen ebenfalls je drei nicht kopunktal sind. Der Hauptsatz der projektiven Geometrie ist eine allgemeine Aussage u ¨ber linean re Abbildungen in IR und gewinnt erst durch Interpretation der Vektoren als


142

Repräsentanten von Punkten, Geraden oder Ebenen in der projektiven Ebene oder im projektiven Raum eine geometrische Bedeutung. Satz 1 (Hauptsatz der projektiven Geometrie): Sind je n der n + 1 Vektoren x1 , x2 , . . . , xn+1 ∈ IRn linear unabhängig und sind auch je n der n + 1 Vektoren y1 , y2 , . . . , yn+1 ∈ IRn+1 linear unabhängig, dann ist eine Matrix A mit [Axi ] = [yi ] (i = 1, 2, . . . , n + 1) bis auf einen konstanten Faktor eindeutig bestimmt. Dabei bedeutet allgemein [x] die Menge der von o verschiedenen Vielfachen von x. Beweis: Es gibt eindeutig bestimmte Zahlen ri , si = 0, so dass xn+1 = r1x1 + r2x2 + . . . + rnxn

und yn+1 = s1 y1 + s2 y2 + . . . + sn yn .

ur i = 1, 2, . . . , n mit noch unbestimmtem Definiert man λi durch ri λi = si λn+1 f¨ λn+1 , dann ist λn+1 yn+1 = r1 λ1 y1 + r2 λ2 y2 + . . . + rn λnxn . Mit der Matrix A = (λ1 y1 λ2 y2 . . . λn yn )(x1 x2 . . . xn )−1 (und nur mit dieser!) gilt Axi = λi yi (i = 1, 2, . . . , n). Ferner ist λn+1 yn+1 = r1 Ax1 + r2 Ax2 + . . . + rn Axn = A(r1x1 + r2x2 + . . . + rnxn ) = Axn+1 . Die Matrix A ist also bis auf den Faktor λn+1 eindeutig bestimmt.

2

Satz 2: Ist [x] → [Ax] eine projektive Abbildung, dann ist x → (A−1 )T x. Wird also der Punkt [x] auf den Punkt [Ax] abgebildet, dann wird die Gerade bzw. die Ebene x auf die Gerade bzw. die Ebene (A−1 )T x abgebildet. Beweis: Ist x T y = 0, dann ist x T y = x T (A−1 A) y = ((A−1 )T x)T Ay = 0. Liegt also [y ] auf x, dann liegt der Bildpunkt [Ay ] auf der Geraden (A−1 )T x, welche somit die Bildgerade ist. 2 Das nächste Beispiel soll erklären, woher die projektiven Abbildungen“ ihren ” Namen haben. Beispiel 4: Zwei sich in einer Geraden a schneidende Ebenen werden als zwei Exemplare E1 , E2 der projektiven Ebene aufgefasst. Eine Zentralprojektion mit dem Zentrum Z (außerhalb von E1 und E2 ) definiert dann eine projektive Abbildung der projektiven Ebene. Die Gerade g aus dem Exemplar E1 , durch welche die Projektionsstrahlen parallel zu E2 verlaufen, heißt Verschwindungsgerade; sie wird auf die uneigentliche Gerade abgebildet. Die Gerade h aus dem Exemplar E2 ,

VII.2 Projektive Abbildungen

143

durch welche die Projektionsstrahlen parallel zu E1 verlaufen, heißt Fluchtgerade; sie ist das Bild der uneigentlichen Geraden. @ Z R. ..... @ ...t.......*...... ... . . ... . ........ g ...... ..... ........t........... ... .t....... .......a........... h . . . . . . . ..... .... ..... E....2.......... ...E .. ....1

.................................................................................................................... ... .. g.. a.. h.. ... .. .. .. .. ... .. .. Z .. .. ... .. .. t .. .. ... .. .. ... .. ... .. .. . .. . .. .. .. .. .. E ..................................................................................................

Fig. 3: Zentralprojektion

Bringt man die Exemplare E1 und E2 durch Drehen um a zur Deckung, dann liegt eine projektive Abbildung in der projektiven Ebene vor (Fig. 3). Eine solche Abbildung mit Z = [(1 0 0)T ], a = (1 − 1 − 1)T und h = (1 1 1)T ⎛

1 wird durch die Matrix A = ⎝ 0 0

1 2 0

⎞ 1 0 ⎠ beschrieben (Aufgabe 1). 2

Genau dann ist eine projektive Abbildung eine affine Abbildung, wenn uneigentliche Punkte wieder auf uneigentliche Punkte abgebildet werden, wenn also z.B. im Fall der Ebene ⎛

a00 A = ⎝ a10 a20

0 a11 a21

⎞ 0 a12 ⎠ a22

mit a00

a 0 und 11 = a21

a12 a22

= 0.

Beispiel 5: Die projektive Abbildung der projektiven Ebene mit der Matrix ⎛

3 A=⎝ 0 1

0 1 1

⎞ −1 0 ⎠ 1

bildet die affinen Punkte (c, 3) mit c ∈ IR auf die uneigentlichen Punkte [(0 c 4 + c)T ] ab. Die Gerade mit der affinen Gleichung x2 = 3 ist also eine “Verschwindungsgerade“ im Sinn von Beispiel 4, und zwar die einzige. Das Bild der uneigentlichen Geraden ist die Fluchtgerade“ mit der affinen Gleichung ” x2 = x1 + 1, denn ein uneigentlicher Punkt [(0 a b)T ] wird auf den eigentlichen a affinen Punkt (u, u + 1) (mit u = − ) abgebildet. Die Eigenwerte von A sind b 1 und 2, zugehörige Eigenvektoren sind (1 − 1 2)T und (1 0 1)T . Also sind die affinen Punkte (−1, 2) und (0, 1) Fixpunkte. Die Gerade durch diese Fixpunkte hat die affine Gleichung x1 + x2 = 1, also die projektive Gleichung x1 + x2 = x0 . Dies ist eine Fixgerade (aber keine Fixpunktgerade), denn die Matrix ⎛

⎞

1 0 −1 1 (A ) = ⎝ −1 4 −3 ⎠ 4 1 0 3 −1 T


144 1

bildet (1 − 1 − 1)T auf (1 − 1 − 1)T 2 ab. In Fig. 4 sind die Fixgerade, die Verschwindungsgerade und die Fluchtgerade in einem kartesischen Koordinatensystem eingezeichnet. Die Halbgerade V U + der Fixgeraden (von V u ¨ber U , siehe Fig. 4) wird auf die Halbgerade U V + abgebildet, die andere Halbgerade V U − wird auf U V − abgebildet. Das erkennt man alles an der Zuordnung x → Ax bzw.

x2 .... .... 6 .... ... . .... . .. .... ... Verschwindungsgerade .. . . . .. .. .. .. .. .. .. .. .. ...d.... .. .. .. .. ..... .. .. .. ..... .. .. .. .. .. .. .. .. . . . V ..... t .... . . . . F1 .... ... ... . . F2......t... . . x .... .....d. -1 . . . . . . U ..... ... ... .

(1 x 1 − x)T → (2 + x x 2)T .

Fluchtgerade

Fixgerade


Es ist unmittelbar klar, dass alle Aussagen u ¨ber Inzidenzen von Punkten, Geraden und Ebenen bei einer projektiven Abbildung erhalten bleiben: Schneiden sich drei Geraden in einem Punkt, dann gilt das auch f¨ ur die Bildgeraden usw. Die (triviale) Begr¨ undung daf¨ ur folgt aus Satz 1: xT y = xT (A−1 A)y = ((A−1 )T x)T (Ay ) Dies benutzt man beim Beweis geometrischer Sätze, indem man die zu untersuchende Konfiguration zunächst mit einer projektiven Abbildung auf eine einfachere abbildet (in der Regel eine allgemeine auf eine spezielle), wobei man nur beachten muss, dass alle auftretenden Begriffe projektiv invariant“ sind. Dies ist ” ein wichtiges Beweisprinzip der so genannten Abbildungsgeometrie. Wir betrachten ein Beispiel hierf¨ ur: Satz 3 (Satz von Desargues, nach Girard Desargues, 1593–1662): Gegeben seien zwei Dreiecke ABC und A B C . Sind die Geraden durch einander zugeordnete Ecken kopunktal, dann sind die Schnittpunkte der Geraden durch einander zugeordnete Seiten kollinear (Fig. 5). Beweis: Es sei A = [(a0 a1 a2 )T ], B = [(b0 b1 b2 )T ], C = [(c0 c1 c2 )T ]. Es gen¨ ugt, f¨ ur die Punkte A , B , C folgenden Sonderfall zu betrachten: A = [(1 0 0)T ],

B = [(0 1 0)T ],

C = [(0 0 1)T ]

Die Geraden durch einander zugeordnete Ecken haben die Gleichungen a2 x1 − a1 x2 = 0, b 2 x0 − b0 x2 = 0, c 1 x0 − c 0 x1 = 0.


145

....... .... .... ...... .. ... ..... ... ...u...C ...... A ............. ............... ..... . .....u..................................................... . . ..... ... . . . . . . ... ...........................................B .. ..... . .....u........... . . . ... . 0 . .. a2 −a1 ........................ .. ... ....... . . .. ... .... . . . . . 0 −b0 = 0. ...................................................................................................................................................u...................................... D = b2 . . . . . . . . . . . . . . . . . . . . . . . . . . . ........ ... c1 −c0 . 0 ........ .............................................. .... B ....u...... .... ... . . . ........ . ... . Die Geraden durch B C , A C , A ................ ..... ........ . ........ .. ... ..........u... A B haben die Gleichungen C x0 = 0, x1 = 0, x2 = 0. Sie schneiden sich genau dann in einem Punkt, wenn dieses homogene LGS eine nichttriviale Lösung hat, wenn also

Fig. 5: Satz von Desargues

Die Geraden durch BC, AC, AB haben die Gleichungen x 0 x1 x2

b0 c0 b1 c1 = 0, b2 c 2

x 0 x1 x2

x 0 x1 x2

= 0,

x a 0 0 x1 a1 0 a2

a0 c0 a1 c1 = 0, a2 c 2

a0 b0 a1 b1 = 0. a2 b2

F¨ ur die Schnittpunktkoordinaten gilt daher 0 b 0 x 1 b1 x 2 b2

bzw.

c0 c1 c2

= 0,

x a 0 0 0 a1 x2 a2

c0 c1 c2

b0 b1 b2

=0

−(b0 c2 − b2 c0 )x1 + (b0 c1 − b1 c0 )x2 = 0, (c1 a2 − c2 a1 )x0 + (c0 a1 − c1 a0 )x2 = 0, (a1 b2 − a2 b1 )x0 − (a0 b2 − a2 b0 )x1 = 0.

Die Matrix dieses LGS hat bis auf das Vorzeichen dieselbe Determinante Δ wie die Matrix ⎛ ⎞ 0 a2 b1 − a1 b2 c1 a2 − c2 a1 ⎜ 0 b2 c 0 − b0 c 2 ⎟ ⎝ a0 b2 − a2 b0 ⎠, c1 a0 − c0 a1 b0 c1 − b1 c0 0 0 e denn allgemein gilt a 0 c b ⎛

0

⎜ ⎝ a0 b2 − a2 b0

c1 a0 − c0 a1

f g 0

= abf + ceg. Es gilt ⎞ ⎛

⎞⎛

⎞

a2 b1 − a1 b2 c1 a2 − c2 a1 0 a2 −a1 a0 b0 c0 ⎟ ⎜ ⎟⎜ ⎟ 0 b2 c0 − b0 c2 ⎠ = ⎝ b2 0 −b0 ⎠ ⎝ a1 b1 c1 ⎠ . b0 c1 − b1 c0 0 c1 −c0 0 a2 b2 c2

Es existiert ein Schnittpunkt, wenn Δ = 0. Die Behauptung des Satzes folgt nun daraus, dass genau dann D = 0 ist, wenn Δ = 0 ist. 2


146

Der zu Satz 3 duale Satz ist die Umkehrung von Satz 3. Man kann in Satz 3 also dann“ durch genau dann“ ersetzen. Der Satz von Desargues wird durch Fig. 4 ” ” plausibel, wenn man sie als Zentralprojektion einer Ebene auf eine andere deutet. . .. ....s. ... .... .........C .... . . . . . ... .... ... ..... .. .. ....... . . . . ... ...... .. .... .... . . . ... ... A........s.............. .. . ............. ... . . . . .............. ....... ... .. . . . . . . . . .. ... .................s...B ... .... . . . . . . .......s...........................................................................................................s......................................s...... s . ....... ... . . . . . . . . ............. ... ....... .. ......s.................................. ..... .. B . . . . .. .... .. A ... ........... .. .. .. ....... ... ....... .. .... .. ....... ..... .. . ....s ... ... C ... . ..

Der Beweis des Satzes von Desargues mit Methoden der projektiven Geometrie hat gegen¨ uber den Methoden der affinen Geometrie den Vorteil, dass man den Fall, dass die Geraden durch A, A , durch B, B und durch C, C parallel sind, nicht als Sonderfall behandeln muss, dass also mit Satz 3 auch der folgende Satz aus der affinen Geometrie bewiesen ist: Gegeben seien zwei Dreiecke ABC und A B C . Sind die Geraden durch einander zugeordnete Ecken parallel, dann sind die Geraden durch einander zugeordnete Seiten kollinear (Fig. 6).

Fig. 6: Satz von Desargues (Sonderfall)

Definition 2: Auf einer Geraden r1u1 + r2u2 (r1 , r2 ∈ IR) seien vier Punkte A, B, P, Q durch die Vektoren

r1 ∈ r2

a1 b1 p1 q1 , , , a2 b2 p2 q2

(jeweils bis auf einen skalaren Faktor) gegeben. Dann nennt man die Zahl DV(A, B, P, Q) =

p1 p2 p1 p2

a1 a2 b1 b2

a1 a : 2 b1 b2

q1 q2 q1 q2

das Doppelverhältnis des kollinearen Punktequadrupels (A, B, C, D). Diese Bezeichnung wird in dem unten folgenden Satz 6 verständlich. Satz 4: Das Doppelverhältnis in Definition 2 hängt nicht von der Wahl der Grundvektoren u1 , u2 ab. Beweis: Sind v1 , v2 andere Grundvektoren der Geraden r1u1 + r2u2 , dann ist u1 = t11v1 + t12v2 u2 = t21v1 + t22v2

t 11 t21

mit

t12 t22

= 0.

Es folgt r1u1 + r2u2 = (t11 r1 + t21 r2 )v1 + (t21 r1 + t22 r2 )v2 = r1∗v1 + r2∗v2 mit

r1∗ t11 = r2∗ t21

t12 t22

r1 . r2


147

Daher ist r 1 r2

s1 s2

t 11 = t21

t12 t22

r1∗ s∗1 r2∗ s∗2

t 11 = t21

t12 t22

r∗ 1 · ∗ r2

s∗1 s∗2

.

Also multiplizieren sich die Determinanten in der Definition des Doppelverhältnisses alle mit der Determinante von (tij ), was sich aber wieder herausk¨ urzt. 2 Satz 5: Das Doppelverhältnis ist invariant gegen¨ uber projektiven Abbildungen. Beweis: Ist A die Matrix einer projektiven Abbildung und x = r1u1 + r2u2 , dann ist Ax = r1 Au1 + r2 Au2 . Nun sind aber Au1 , Au2 Grundvektoren der Bildgeraden, bez¨ uglich welcher die Bildpunkte die gleichen Koordinatenvektoren wie die Urbildpunkte haben. 2 Satz 6: Sind A, B, P, Q eigentliche kollineare Punkte, dann gilt DV(A, B, P, Q) =

AP AQ : , BP AQ

wobei allgemein U V die Länge der Strecke U V bedeutet. Beweis: Wegen der projektiven Invarianz des Doppelverhältnisses gen¨ ugt es, die Gerade mit den Grundvektoren u1 = (1 0 0)T und u2 = (0 1 0)T zu betrachten. Dann ist r1u1 + r2u2 = (r1 r2 0)T , und im Fall r1 = 0 ist dies der Punkt auf der r x1 -Achse an der Stelle 2 . Es ist also

a1 a2 b1 b2

p1 p2 p1 p2

a1 a : 2 b1 b2

r1 p2 q2 a2 a2 q1 − − a1 p2 − a2 p1 a1 p2 − a2 q1 q2 p1 a1 q1 a1 = : = p : q . b2 b2 2 2 q1 b 1 p 2 − b 2 p 1 b 1 q2 − b 2 q1 − − p1 b1 q1 b1 q2

2

Definition 3: Das Doppelverhältnis von vier kopunktalen Geraden wird definiert durch = DV([a], [b], [c], [d]). DV(a, b, c, d) Auch hierf¨ ur gelten nat¨ urlich die Sätze 4 und 5. Satz 7: Werden vier Geraden eines B¨ uschels in der projektiven Ebene (kopunktale Geraden) von einer nicht zum B¨ uschel gehörenden Geraden geschnitten, dann ist das Doppelverhältnis der Geraden gleich dem Doppelverhältnis der Schnittpunkte. Beweis: Die Gerade r1u1 + r2u2 soll nicht zum B¨ uschel {s1v1 + s2v2 | s1 , s2 ∈ IR, (s1 , s2 ) = (0, 0)}


148

gehören. Die Schnittbedingung (r1u1 + r2u2 )T (s1v1 + s2v2 ) = 0 bzw. r1 (s1uT1 v1 + s2uT1 v2 ) = r2 (−s1uT2 v1 − s2uT2 v2 ) ist erf¨ ullt, wenn der Vektor ⎛ ⎜ ⎝

−s1uT2 v1 − s2uT2 v2

ein Vielfaches von

s1uT1 v1 + s2uT1 v2

⎞ ⎟ ⎠=

−uT2 v1 −uT2 v2 uT1 v1 uT1 v2

s1 s2

r1 ist. Die dabei aufgetretene Matrix M ist das Produkt von r2

−uT2 (v1 v2 ). uT1 Wie im Beweis von Satz 2 folgt daraus, dass sich altnisse vom die Doppelverh¨ r1 s1 u =M Geradenb¨ uschel auf die Schnittgerade vermöge ¨bertragen bzw. zwei Matrizen vom Rang 2 (und somit regulär), nämlich M =

umgekehrt. Satz 7 findet Anwendung bei der Konstruktion von Bildpunkten und Bildgeraden bei einer projektiven Abbildung: Kennt man zu drei von vier kollinearen Punkten die Bildpunkte, dann kann man den vierten Bildpunkt konstruieren. Kennt man zu drei von vier kopunktalen Geraden die Bildgeraden, dann kann man die vierte Bildgerade konstruieren (Fig. 7). Der folgende Satz beinhaltet eine interessante Anwendung des Begriff des Doppelverhälnisses. Satz 8 (Satz von Ceva, nach Giovanni Ceva, 1648–1737): In einem Dreieck ABC seien A1 , A2 bzw. B1 , B2 bzw. C1 , C2 zwei Punkte auf der Geraden durch die dem Punkt A bzw. B bzw. C gegen¨ uberliegende Seite (Fig. 8). Dann folgt aus je zwei der folgenden Aussagen die dritte:

r2

s2

2 s . . ............ ......... .... ..... . ........ . . ...... ...s............s................... . . . .... .s.............. .. .......s.............. ..... ..... . . ......... . . . . . . . . . . . . . ... .. .. ...........s.............. ..... .. ... .. ... .......... ........................s.. .. .....s... . .. .......s... ... . .. .. .. ........s. .. ........s....... ........ ..... .. .. .. ..........s.. . ... .. .... .. .. .. .... ............s........ e ...................... .. .. ............................................................ Hilfsgerade ......... .. .... ......... ...s..................... ......... .... Fig. 7: Anwendung von Satz 7

...... ...... ......t A2 .......... ... ...... t ... ..... B2 C...........t.. ............ . . .. B1....t..... .... ...... ........... . ...... .. ... tA1 ....... . . . . .. ...... .... .......t......... ...... ...... .... .............................. ...... . . . ...... . . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . . . . . ......... ... ........... .. . . . . . t t t . . .. .................................................... .......................................t...... C1 C2 .......... A B . Fig. 8: Zum Satz von Ceva

• Die Transversalen AA1 , BB1 , CC1 sind kopunktal. • Die Punkte A2 , B2 , C2 sind kollinear. • DV(A, B, C1 , C2 ) · DV(B, C, A1 , A2 ) · DV(C, A, B1 , B2 ) = −1.


149

Oft versteht man unter dem Satz von Ceva nur, dass aus der ersten und zweiten die dritte Aussage folgt. Die vorliegende Form des Satzes besagt auch, dass aus jeder der drei Aussagen folgt, dass sich die beiden anderen gegenseitig bedingen. Beweis: Die Punkte A, B, C, A1 , B1 , C2 , A2 , B2 , C2 sollen der Reihe nach folgende Koordinatenvektoren haben: a, b, c, a + λ1b, b + μ1c, c + ν1a, a + λ2b, b + μ2c, c + ν2a Die Punkte A2 , B2 , C2 sind genau dann kollinear, wenn ihre Koordinatenvektoren linear abhängig sind, wenn also die Gleichung x(a + λ2b) + y(b + μ2c) + z(c + ν2a) = (x + ν2 z)a + (λ2 x + y)b + (μ2 y + z)c = o eine nichttriviale Lösung (x, y, z) hat, wenn also (wegen der linearen Unabhängigkeit von a, b, c) gilt: 1 λ2 0

0 ν2 1 0 = 1 + λ2 μ2 ν2 = 0 μ2 1

Wegen der Invarianz des Doppelverhältnisses können wir f¨ ur die weitere Untersuchung die Punkte A, B, C mit den Koordinatenvektoren (1 0 0)T , (1 1 0)T , (1 0 1)T wählen. Dann gilt: Die Gerade durch A und A1 hat den Koordinatenvektor (0 μ1 − 1)T ; die Gerade durch B und B1 hat den Koordinatenvektor (−1 1 1 + ν1 )T ; die Gerade durch C und C1 hat den Koordinatenvektor (−λ1 1 + λ1 λ1 )T . Diese Geraden sind genau dann kopunktal, wenn gilt: 0 μ1 −1

−1 −λ1 1 1 + λ1 1 + ν1 λ1

= 1 − λ1 μ1 ν1 = 0

Wegen λ1 , λ2 μ d2 = DV(B, C, A1 , A2 ) = 1 , μ2 ν1 d3 = DV(C, A, B1 , B2 ) = ν2

d1 = DV(A, B, C1 , C2 ) =

ist λ2 μ2 ν2 = (d1 d2 d3 ) λ1 μ1 ν1 . Also folgt aus zwei der Aussagen • 1 − λ1 μ1 ν1 = 0 stets die dritte.

•

1 + λ2 μ2 ν2 = 0

•

d1 d2 d3 = −1 2


150

Aufgaben 1. Beweise die Behauptung am Ende von Beispiel 4. 2. Das kollineare Punktequadrupel (A, B, C, D) heißt harmonisch, wenn DV(A, B, C, D) = −1. Man bestimme zu

A = [(1 0 2)T ], B = [(1 2 1)T ], C = [(5 4 8)T ] einen Punkt C so, dass (A, B, C, D) harmonisch ist.

3. Man zeige, dass auf der projektiven Geraden die Punkte A = [a], B = [b], C = [a + tb], D = [a − tb] f¨ ur t = 0 ein harmonisches Quadrupel bilden.

4. Bei einer projektiven Abbildung der projektiven Ebene seien die Bilder von [(1 2 1)T ], [(2 3 7)T ], [(1 − 1 0)T ], [(3 1 − 4)T ] der Reihe nach [(0 3 2)T ], [(−1 0 2)T ], [(1 1 1)T ], [(4 7 − 1)T ]. Man bestimme die Matrix der Abbildung.

5. In einem räumlichen kartesischen Koordinatensystem denke man sich die x2 x3 -Ebene durch eine Zentralprojektion mit dem Zentrum Z(−1, 0, 1) auf die x1 x2 -Ebene projiziert. Dann drehe man die x1 x2 -Ebene um die x2 -Achse in die x2 x3 -Ebene, wobei der Punkt (1, 0, 0) auf den Punkt (0, 0, 1) fällt. Auf diese Art ergibt sich eine projektive Abbildung der x2 x3 -Ebene, verstanden als projektive Ebene. Man bestimme die Abbildungsmatrix.

6. Gegeben sei die Abbildung des projektiven Raums auf sich mit der Matrix ⎛

1 ⎜ 2 A=⎜ ⎝ 1 0

⎞ 1 −1 0 0 1 0 ⎟ ⎟. −1 4 0 ⎠ 3 2 1

a) Welche Ebene wird auf die uneigentliche Ebene abgebildet? b) Auf welche Ebene wird die uneigentliche Ebene abgebildet? c) Auf welche Gerade wird die Schnittgerade der Ebenen mit den Gleichungen x0 − 2x1 + x2 − 5x3 = 0 und 2x0 + x1 + 3x2 + 3x3 = 0 abgebildet? d) Welche Geraden werden auf uneigentliche Geraden abgebildet?

7. Zum Beweis des Satzes von Desargues betrachte man drei Punkte und ihre Bildpunkte mit den Koordinatenvektoren a, b, c und a , b , c , ferner einen Punkt mit mit dem Koordinatenvektor z. Es sei z eine Linearkombination von a und a , von b und b und von c und c . Man zeige: Ist u Linearkombination von a, b und von a , b , v Linearkombination von b, c und von b , c , w Linearkombination von c, a und von c , a , dann ist {u, v , w} linear abhängig.

VII.3 Kegelschnitte in der projektiven Ebene

151

VII.3 Kegelschnitte in der projektiven Ebene Die Gleichung einer Kurve zweiter Ordnung in homogenen Koordinaten lautet a00 x20 + a11 x21 + a22 x22 + 2a01 x0 x1 + 2a02 x0 x2 + 2a12 x1 x2 = 0 ⎛

a00 mit A = ⎝ a01 a02

T

bzw. x Ax = 0

⎞ a02 a12 ⎠. a22

a01 a11 a12

Die Matrix A ist dabei symmetrisch, es gilt also AT = A. (Die Koeffizienten a01 , a02 , a03 werden dabei mit einem Faktor 2 notiert, damit die Matrix diese einfache Form erhält.) Die Gleichung des Einheitskreises lautet in homogenen Koordinaten ⎛

−x20

+

x21

+

x22

−1 0 mit K = ⎝ 0 1 0 0

T

= 0 bzw. x Kx

⎞ 0 0 ⎠. 1

Wird durch die reguläre Matrix B ∈ IR3,3 eine projektive Abbildung x → x der Ebene auf sich definiert, ist also x = Bx bzw. x = Cx mit C = B −1 , dann wird der Einheitskreis auf die Kegelschnittkurve mit der Gleichung x T C T KC x = 0 abgebildet. Jeder nicht-ausgeartete Kegelschnitt (Ellipse, Hyperbel, Parabel) ist das Bild des Einheitskreises bei einer geeigneten projektiven Abbildung der Ebene: Die Ellipse erhält man bereits mit einer affinen Abbildung, bei der affinen Normalform der Hyperbel bzw. Parabel mit den Matrizen ⎛

1 A=⎝ 0 0

0 −1 0

⎞ 0 0 ⎠ 1

⎛

bzw.

0 A = ⎝ −1 0

⎞ −1 0 0 0 ⎠ 0 1

(also x20 − x21 + x22 = 0 bzw. x22 − 2x0 x1 = 0) verwende man ⎛

0 C=⎝ 1 0

1 0 0

⎞ 0 0 ⎠ 1

⎛

bzw.

1 1 C=⎝ 1 0 0 1

⎞ 1 1 ⎠. 1

Beispiel 1: Folgende Transformation bildet den Einheitskreis auf die Hyperbel mit der Gleichung 5x21 + 2x1 x2 − 2x2 − 1 = 0 (im kartesischen x1 x2 Koordinatensystem) ab: ⎛

1 ⎝ 0 1

0 2 0

⎞⎛ 0 −1 1 ⎠⎝ 0 1 0

0 1 0

⎞⎛ 0 1 0 ⎠⎝ 0 1 0

0 2 1

⎞ ⎛ 1 1 0 0 ⎠ = ⎝ 0 −5 1 1 −1

⎞ 1 −1 ⎠ 0


152

Die Entstehung der Kegelschnitte als projektive Bilder eines Kreises kann man anschaulich darstellen, wenn man die Mantellinien eines Kreiskegels als Projektionsstrahlen deutet, wobei die Kegelspitze das Projektionszentrum ist und die Schnittebene als Projektionsebene dient. In Fig. 1 sind die Kegelschnitte nochmals als Zentralprojektionen eines Kreises beschrieben. ... H *..H . H

.... ... ...H *........ ........... ....... .... ... .. .... H . . . . .. ... .. .. ... .. ... HH .. ... .. .. j H ......... ..... ... ... .. .. ..* . ..... . . . .. . ... ..... .. . . . .... .. . ........... . .... .... .... ....................... .... ..... .... . ...................... ...... ....... ... Hyperbel ...... . . ........... . Parabel . . . . ... . . . Ellipse . . ......... . . . . . .. . . . ................... .. . . . ....

Fig. 1: Kegelschnitte als Zentralprojektionen eines Kreises

Satz 1: Es sei r1u1 + r2u2 ((r1 , r2 ) = (0, 0)) ein Geradenb¨ uschel und C die Matrix einer projektiven Abbildung der Ebene. Dann bilden die Schnittpunkte jeweils einer B¨ uschelgeraden mit ihrer Bildgeraden eine Kurve zweiter Ordnung. Beweis: Das Bild der Geraden r1u1 + r2u2 ist r1v1 + r2v2 mit vi = (C −1 )T ui . F¨ ur den Schnittpunkt [x] der Geraden und ihrer Bildgeraden gilt r1 (x T u1 ) + r2 (x T u2 ) = 0

r1 (x T v1 ) + r2 (x T v2 ) = 0.

und

Dieses homogene LGS f¨ ur r1 , r2 muss eine von (0, 0) verschiedene Lösung haben, es gilt also (x T u1 )(x T v2 ) − (x T u2 )(x T v1 ) = 0 bzw.

x T (u1v2 T − u2v1 T )x = 0.

Mit der Matrix B = u1v2 T − u2v1 T bilde man A = B + B T . Dann gilt xT A x = 0 mit AT = A.

2

Beispiel 2: Auf das Geradenb¨ uschel r1 (1 1 1)T + r2 (2 − 1 5)T wende man die projektive Abbildung mit der Matrix ⎛

1 C =⎝ 0 1

0 2 3

⎞ 1 −1 ⎠ 0

⎛

bzw.

3 (C −1 )T = ⎝ 3 −2

−1 −1 1

⎞ −2 −3 ⎠ 2

an. Es ist (C −1 )T (1 1 1)T = (0 − 1 1)T und (C −1 )T (2 − 1 5)T = (−3 − 8 5)T . F¨ ur obige Matrix B (siehe Beweis von Satz 1) ergibt sich ⎛

T

T

B = (1 1 1) (−3 − 8 5) − (2 − 1 5) (0 − 1

−1 1) = 3⎝ −1 −1

⎞ −2 1 −3 2 ⎠ −1 0

VII.3 Kegelschnitte in der projektiven Ebene

153

und damit unter Weglassung des Faktors 3 ⎛

A = B + BT

⎞ −2 −3 0 = ⎝ −3 −6 1 ⎠. 0 1 0

Die Gleichung der Kurve lautet x20 +3x21 +3x0 x1 −x1 x2 = 0, in affinen Koordinaten also 3x21 −x1 x2 + 3x1 = −1 bzw. x1 (3x1 −x2 + 3) = −1. Mit der affinen Abbildung x1 = x1 , x2 = −3x1 + x2 − 3 lässt sich dies in x1 x2 = 1 u uhren, es handelt sich also ¨berf¨ um eine Hyperbel. Beispiel 3: In Fig. 2 ist gemäß Satz 1 eine Parabel mit Hilfe zweier Geradenb¨ uschel definiert; vgl. hierzu Aufgabe 3.

..t............. ........t ... .................. ............. ... . . . . . . . . . . . . . . ..... ....t........... ..... ....t ... ............................................................................................................... ...t................... ................................................................. . . ... ......................................................................................................................................t . ......................................................................................................................................................................w P ...w .............................................................................................................................................................................................. P ...t..................................................................................................................................................t. .......t........................................................................................................................................................t... ........................................................................................................................ ...t.................................................................................................t. .....t.............................................................................................t.. ......t.............................................................................t.... . ......t.........................................................t............ .....t............................................t.. ..........g . ...t....t...t.....t..t .... g Fig. 2: Beispiel zu Satz 1

Viele interessante Sätze u ¨ber Kegelschnitte lassen sich sehr einfach beweisen, wenn die im Satz auftretenden Begriffe projektive Invarianten sind (z.B. Schnittpunkt zweier Geraden, Verbindungsgerade zweier Punkte, nicht-ausgeartete Kurve zweiter Ordnung usw.). Satz 2 (Satz von Pascal, nach Blaise Pascal, 1623–1662): F¨ ur ein Sehnensechseck eines nicht-ausgearteten Kegelschnitts gilt (Fig. 3): Die drei Schnittpunkte je zweier Gegenseiten sind kollinear. . .. ...........................t..................................................t.................. ...........s.. . . s . . . . . . . . . . . . . . . .. ....... ............ . .... ......... ..................................... . . . . . . . . . . . . . . . . . . . . . . . ...... .... ............... ...s....... . .. . .....t. .. .... ...... ....s.......... .... . .. ................................. .............................. .... ..... . . .....v . ..... ....s.................. ... ... ... . . . . . . . . . . . . ............................. ... . . . . . . . . ..... .... .....................s .... ...... ... ............ . . . . .............. .... . . . . . . . . . . . . . ....... . .... ... .... . ........ ... .....s..........s. ....... ... . .... . . . . . . . . . . . . . .... . .... ... ..........t.. .... .. ...............t .... .... ... ........ . . . . . . . . . . . . . . ..... .. .... .. . ............ .. .... ... . .............. ... ................. ... .... .. .. . . . . . .......................... .... .. . .. .t. ........ ............ .....s .... .. Fig. 3: Satz von Pascal

Fig. 4: Satz von Brianchon

Satz 3 (Satz von Brianchon, nach Charles Brianchon, 1783–1864): F¨ ur ein Tangentensechseck eines nicht-ausgearteten Kegelschnitts gilt (Fig. 4): Die drei Verbindungsgeraden je zweier Gegenecken sind kopunktal.


154

Da jede Kegelschnittkurve das projektive Bild des Einheitskreises ist, gen¨ ugt es, die beiden Sätze f¨ ur den Einheitskreis zu beweisen. Von diesen beiden Sätzen u ¨ber den Einheitskreis muss nur einer bewiesen werden, da die Sätze zueinander dual sind. Den Satz von Pascal f¨ ur den Einheitskreis kann man nun elementargeometrisch beweisen, wie es Fig. 5 f¨ ur den Fall eines konvexen (nicht-¨ uberschlagenen) Sehnensechsecks zeigt. Mit Hilfe des Satzes u ¨ber das Sehnenviereck im Kreis, wonach sich einander gegen¨ uberliegende Winkel zu 180o ergänzen, weist man nach, dass die Dreiecke S2 U V und S1 A3 A6 paarweise parallele Seiten haben und daher zentrisch ähnlich bez¨ uglich des Streckzentrums S3 sind. Daher liegt S1 auf der Geraden durch S2 und S3 . A6 ....................u........... . . . . . . . . . ....... ......... .... ....... ..... ...... .................. ........ . . . . . . ... ... .. ...... ... ... .. .. .......... ... .. . . ... ... .. A1 .. ........ ... .. ....u...... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... .. . . . . . . . . .... .... .... ......... .. ................................u.....A . . . . .... 5 ... .............................. .. . .... ............. ...... ....u............... . . . . . . . . ... . A2. ................. .. ...............u ...... ... .. .. .....................................................................A ..... ...... . . . . . u......................... . . .... 4 . . . . . . . . . . . . . . . . . . . . ... . . . . . . . . . . . . . . ....... .... A3 ......... . . . . .... . . . . . . . . . . . . . . . .......e.....V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ... ... ... ... ............... .. ...... .............. ... .............. .......... ... .. ...... .. ..u................... . ... ...... ..... ... .. .. ... .. ... .. ............. ...... . ... . S1 . . . . . . . .. . ... . . . . . . . . . . . ........ ... . ..... ... ... ...e...... ... ... .. ...... ..... .. .. .. . .. . .. ... ..... .. . ...... .............. ...... ........ ... ...... ...................... . . . . ... .... U ......... ......u.......... . . . . . . . ... ...... ................... ... ...... .. . . ...... S2 ...... ...... ...... ... ...... ... ...... ... ...... ... ...... ... Fig. 5: Satz von Pascal ........ .u.. S3

Aufgaben

1. Welche projektive Abbildung bildet die Scheitel der Ellipse mit der affinen Gleichung 4x21 +9x22 = 36 auf die Punkte [(1 −1 −1)T ], [(1 1 1)T ], [(0 1 0)T ], [(0 0 1)T ] der Hyperbel mit der affinen Gleichung x1 x2 = 1 ab? Man pr¨ ufe, ob die Ellipse auf die Hyperbel abgebildet wird.

2. Die Geraden durch die Punkte (r, 0, 0) und (0, r, 1) (r ∈ IR) des affinen Raums erzeugen eine Quadrik. Man bestimme ihre Gleichung.

3. In Beispiel 3 soll mit P (−1, 0) und P (1, 0) gemäß Satz 1 die Parabel mit der Gleichung x2 = x21 − 1 im kartesischen Koordinatensystem entstehen. Man bestimme die Matrix C der zugehörigen projektiven Abbildung.

VIII Lineare Optimierung VIII.1 Problemstellung und Grundbegriffe Beispiel 1: Ein Landwirt hat 40 ha Anbaufläche, 12 000,– Kapital und 240 Arbeitstage zur Verf¨ ugung. Er möchte Weizen und Zuckerr¨ uben anbauen. Der Zeitaufwand, der Kapitalaufwand und der Netto-Verkaufserlös pro ha sind in nebenstehender Tabelle angegeben.

Weizen

Zuckerr¨ uben

Kosten/ha

200,–

600,–

Tage/ha

5

10

Erlös/ha

1000,–

1200,–

Wie muss er die Anzahlen x1 und x2 der f¨ ur Weizen bzw. Zuckerr¨ uben zu verwendenden ha festlegen, um einen möglichst großen Gewinn zu erzielen? Zunächst muss ein System von 5 linearen Ungleichungen betrachtet werden: x1 ≥ 0,

x2 ≥ 0,

x1 + x2 ≤ 40,

200x1 + 600x2 ≤ 12 000,

5x1 + 10x2 ≤ 240

Die Lösungsmenge des Ungleichungssystems ist ein F¨ unfeck im x1 x2 Koordinatensystem, das Planungsvieleck der gestellten Aufgabe. Die Ecken des Planungsvielecks ergeben sich als Schnittpunkte der Geraden, welche die durch die Ungleichungen gegebenen Halbebenen begrenzen. Der Verkaufserlös beträgt Z = 1000x1 + 1200x2 . Dies ist die Zielfunktion des Problems. Unter den zu der Geraden mit der Gleichung 1000x1 + 1200x2 = 0 parallelen Geraden, welche mindestens einen Punkt mit dem Planungsvieleck gemeinsam haben, ist diejenige mit dem größten Wert der Zielfunktion zu bestimmen. Dieser optimale Wert wird in der Ecke (32,8) des Planungsvielecks angenommen (Fig. 1) und beträgt Zmax = 1000 · 32 + 1200 · 8 = 41 600. .... x2 .... .... ... 6 ......... .... . . .... .... ............... ... ... .... .... .... ............................ . .... .. ... .... ... ... . ... ............ . .. .... .....u.... .... ... .... .... . ... .......................... .. .... . .... .... . ... ............... .. .... .. . ............ ... . ... .... . ........ .... .................................... ... .... ......................... ... .... . .... ... (32,8) .... .... ... .. . .... .... . . .... ..................... ... ................ .... .. .... . .. . .. . . . . Z = 0.. .... ... ... .... 10............. .... .... .. .... .. .... .... ... ... ..........u.................................. . .... ... .... .... .. .. .... ... .. . ... .... .. .. .... ... . ......................u... . .. .. .... .... . . ... .... . .. .... ... . ...................... .... ... .... .... .. .. .... . ... . . ... .... .. .. .... ... . .... .................. . ... .... .. .. ... ... . . ... .... .. .. .... ... . ..................... . ... .... .. .. .. .... ... . . ... ... .. .. ... ... . ..................... . ... .... .. ... .... ... . . . ... .... .. . .... ... .................... . ... .... x1 ..u...................................................................................................................................u ............ . ... .... .. .. ... .. . . ... .... .. .. .... .. . ... ............. . ... .... . . .. .. 10 . . . .. .. .... .... ... .... . .... ... .... .... . ... .. .... .... .. .... . .... ... ................... .... .... .. .. .... ... . . ... .... .. .. ... .. .. .. .... ... . . . .. .. Fig. 1: Planungsvieleck und Zielfunktion

VIII Lineare Optimierung

156

In diesem einf¨ uhrenden Beispiel ist anschaulich klar, dass die Lösung eine Ecke des Planungsvielecks ist. Es ist nat¨ urlich auch denkbar, dass zwei benachbarte Ecken und damit alle Punkte der Vielecksseite zwischen diesen Ecken Lösungen sind, nämlich dann, wenn die Zielfunktion eine zu eiEcke Z ner Vielecksseite parallele Gerade beschreibt. Ohne Be(0, 0) 0 zug auf die Zeichnung in Fig. 1 zu nehmen kann man (40, 0) 40 000 das Problem lösen, indem man die Ecken berechnet (als (32, 8) 41 600 Schnittpunkte von Geraden), dann die Werte von Z in (24, 12) 38 400 den Ecken bestimmt und pr¨ uft, f¨ ur welche Ecke sich da(0, 20) 24 000 bei der größte Wert ergibt (vgl. nebenstehende Tabelle). Man kann obige Aufgabe durch Einf¨ uhrung weiterer Variabler (Schlupfvariable) so umgestalten, dass außer den Positivitätsbedingungen xi ≥ 0 nur Gleichungen (statt Ungleichungen) auftreten: Setzt man x3 , x4 , x5 f¨ ur die u ¨brigbleibende Fläche, das u ¨brigbleibende Kapital und die u ¨brigbleibende Zeit, dann erhält man abgesehen von den f¨ unf Positivitätsbedingungen drei Gleichungen mit f¨ unf Variablen: x1 + x2 + x 3 = 40 200x1 + 600x2 +x4 = 12 000 5x1 + 10x2 + x5 = 240

(x1 , x2 , x3 , x4 , x5 ≥ 0).

Die Auflösung des LGS nach x1 , x2 , x3 (mit den Parametern x4 , x5 ) ist x1 = 24 +

1 3 x 4 − x5 , 100 5

x2 = 12 −

1 1 x 4 + x5 , 200 5

x3 = 4 −

1 2 x 4 + x5 . 200 5

Damit ergibt sich Z = 4x4 − 360x5 + 38 400. Damit Z möglichst groß wird wähle man x5 = 0 und x4 größtmöglich so, dass x3 ≥ 0 (also x4 ≤ 800) und x2 ≥ 0 (also x4 ≤ 2400) und somit x4 = 800. Damit erhält man x1 = 32, x2 = 8 und Zmax = 3200 + 38 400 = 41 600. Durch Einf¨ uhrung der Schlupfvariablen haben wir (zumindest bei dieser Aufgabe) erreicht, dass wir uns nicht mehr auf geometrische Konzepte (Ecken des Planungsvielecks) st¨ utzen m¨ ussen, sondern rein algebraisch vorgehen können. Trotzdem werden wir weiterhin den Bereich der möglichen Lösungen als Polyeder (Planungspolyeder) auffassen und uns f¨ ur dessen Ecken interessieren. Die Ecken des hier vorliegenden f¨ unfdimensionalen Planungspolyeders ergeben sich, indem man von den acht Gleichungen (einschließlich der Gleichungen x1 = 0, . . . , x5 = 0) der Begrenzungsebe” nen“ des Planungspolyeders f¨ unf auswählt und deren Schnittpunkte mit nichtnegativen Koordinaten berechnet. Es ergeben sich die Ecken in nebenstehender Tabelle, an denen man wieder die oben angegebenen Ecken in der x1 x2 -Ebene erkennt.

(0, 0, 40, 12 000, 240) (40, 0, 0, 4000, 40) (32, 8, 0, 800, 0) (24, 12, 4, 0, 0) (0, 20, 20, 0, 40)

VIII.1 Problemstellung und Grundbegriffe

157

Projiziert man den betrachteten f¨ unfdimensionalen Planungsbereich in die x1 x2 Ebene (indem man die x3 -, x4 - und x5 - Koordinaten gleich 0 setzt), dann ergibt sich der urspr¨ ungliche zweidimensionale Planungsbereich. Beispiel 2: Wir betrachten die Optimierungsaufgabe ⎧ ⎪ ⎨

⎫

x 1 + x2 + x3 ≤ 7 ⎪ ⎬ 2x1 + x2 + x3 ≤ 8 , x1 , x2 , x3 ≥ 0, Z = 2x1 + 3x2 + 5x3 maximal! ⎪ ⎪ ⎩ ⎭ 4x1 + x2 + 2x2 ≤ 12 Die Ungleichungen definieren Halbebenen, welche ein Polyeder mit acht Ecken begrenzen (Fig. 2). Die Ebene mit der Gleichung 2x1 + 3x2 + 5x3 = 0 wird parallel in Richtung wachsender Werte von x1 , x2 , x3 verschoben, bis sie gerade noch einen Punkt mit dem Polyeder gemeinsam hat, und dieser Punkt ist (offenbar?) eine Ecke des Polyeders. In dieser Ecke ist dann 2x1 + 3x2 + 5x3 maximal. Zur Berechnung der Ecken muss man Schnittpunkte ⎧ von Ebenen bestimmen, ⎫ z.B. muss man zur Berechnung der Ecke (1,4,2) das LGS x3

x1

x1 + x2 + x3 = 7 ⎬ 2x1 + x2 + x3 = 8 lösen. ⎭ ⎩ 4x1 + x2 + 2x3 = 12 ⎨

6

Ecke des Maximums von Z .. ... ...... . ................ .r.rrrr.r.rrr ... .... ......r.rrrqqqqqrrv .. rq .. .rr.rrr.r.rrr.r.r m r.r. ... ...rrrrr.qqqqq.. ..rr.r.rr.rrr.v rrrrr.r.rr..r..rr.r.......... .....rrrr..qqq rrr r.rr.r.rr ........ ...rrr ..qqq rrr r.r.rr.rr. ..... .. .. rrr rr.r.rr.r ... .. .. . ......rrrrr.... qqqqqq r.rr.r.r ... . .. . rrr r . rr.r.rr ... rrr .........rrrrr... qqqqqq .rr.rr.r.r ... .. .. .. .. . r rrr r . .. .. . r . r .. ..rrrr.... qqqq . .rr.r.rrr ... rrv .. .. .. .r.rr.rr. ... r q rrr rrrrrrrrr r .. .. r . .... ...rrrrr... qqqqqqqv r r . r r v q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q r r . r r r r r . r r r . r r . r . r rr rrrrrrr.rr.rr.r...... .. . r . qq .. .. .. .. .. .... . . . . . . . . . . . . rrrrrrrrrrrrr.rr.rrr.r.rrrr.r..r.rr.r..r.r.rv . . . . . . . ..... ...rrrrr..q..qqqqqqqqq . . r . r........ ....... .... .. qrq.rq.rrr.rr.rrr.r.rrrr.r.r.rr.r.r.r.rr.r.rr.r.r.rr.r.r.r.r.r.rr.r.r.r.r.r..rr.rr....v . . rrqrv .. ... .... ..... .. ...... .. .. .. ... .. . .. .. .. ........ .. ... .

-

x2

Fig. 2: Planungspolyeder

Wir können aber auch folgendermaßen argumentieren: Mit den Schlupfvariablen x4 , x5 , x6 betrachten wir das Gleichungssystem x1 + x 2 + x 3 + x 4 = 7 2x1 + x2 + x3 + x5 = 8 4x1 + x2 + 2x3 + x6 = 12 mit den Positivitätsbedingungen x1 , x2 , x3 , x4 , x5 , x6 ≥ 0. Die Auflösung des LGS nach x1 , x2 , x3 (mit den Parametern x4 , x5 , x6 ) ist x1 = 1 + x4 − x5 , x2 = 4 − 2x5 + x6 , x3 = 2 − 2x4 + 3x5 − x6 .


158 Damit ergibt sich Z = 24 − 8x4 + 7x5 − 2x6 . Wegen x1 ≥ 0 ist x5 ≤ x4 + 1 und damit Z ≤ 31 − x4 − 2x6 .

Mit x4 = x6 = 0 und damit x5 = 1 ergibt sich Zmax = 31, und zwar in der Ecke (0, 2, 5). ¨ Das sind alles keine sehr systematischen und weittragenden Uberlegungen, sie deuten aber schon den Weg zu einer systematischen Lösung solcher Optimierungsprobleme an. Die Grundaufgabe der linearen Optimierung lautet zunächst: Gegeben sei eine Matrix A = (aij ) ∈ IRm,n , ein Vektor b = (bi ) ∈ IRm und ein Vektor u = (uj ) ∈ IRn . Gesucht sind alle x = (xj ) ∈ IRn mit x1 , x2 , . . . , xn ≥ 0 und a11 x1 + a12 x2 + . . . + a1n xn a21 x1 + a22 x2 + . . . + a2n xn .. .

(≤, =, ≥) b1 , (≤, =, ≥) b2 ,

am1 x1 + am2 x2 + . . . + amn xn (≤, =, ≥) bm , f¨ ur welche die Linearform (Zielfunktion) Z(x) = uT x = u1 x1 + u2 x2 + . . . + un xn einen minimalen oder maximalen Wert annimmt. In den obigen m Gleichungen oder Ungleichungen kann man die Beziehungen ≥ durch ≤ ersetzen, indem man die betreffenden Ungleichungen mit −1 multipliziert. Ferner kann man durch Einf¨ uhrung von m weiteren Variablen xn+1 , xn+2 , . . . xn+m (Schlupfvariable) und Ergänzung der i-ten Gleichung durch +xn+i alle Ungleichungen in Gleichungen verwandeln, wobei die weiteren Positivitätsbedingungen xn+1 , xn+2 , . . . xn+m ≥ 0 gelten sollen. Ferner soll dann stets b1 , b2 , . . . , bm ≥ 0 gelten, was man durch eventuelle Multiplikation einer Gleichung mit −1 erreicht. Statt b1 , b2 , . . . , bm ≥ 0 schreiben wir k¨ unftig kurz b ≥ o. Weiterhin fragen wir immer nach einem Minimum der Zielfunktion Z, was man durch Ersetzung von u durch −u erreichen kann. Die derart standardisierte Grundaufgabe der linearen Optimierung nennt man auch Standardaufgabe der linearen Optimierung. Wir behalten die obigen Bezeichnungen bei (auch wenn es jetzt mehr Variable sind) und formulieren die Standardaufgabe folgendermaßen: Gegeben sei eine Matrix A = (aij ) ∈ IRm,n , ein Vektor b = (bi ) ∈ IRm mit b ≥ o und ein Vektor u = (uj ) ∈ IRn . Gesucht sind alle x = (xj ) ∈ IRn mit Ax = b und x ≥ o,


159

f¨ ur welche die Linearform (Zielfunktion) Z(x) = uT x einen minimalen Wert annimmt. Dabei steht x ≥ o f¨ ur x1 , x2 , . . . , xn ≥ 0. Die Menge

M = {x ∈ IRn | Ax = b, x ≥ o}

heißt die zulässige Menge der Optimierungsaufgabe. Die Elemente von M nennen wir im Folgenden Punkte aus M . Ist M = ∅, dann gibt es nat¨ urlich keine Lösung der Aufgabe. Notwendige Bedingung f¨ ur M = ∅ ist, dass der Rang der Matrix A gleich dem Rang der erweiterten Matrix (A, b) ist. Ist dabei der Rang r von A und (A, b) kleiner als die Anzahl m der Gleichungen, dann kann man m − r Gleichungen weglassen, weil sie Linearkombinationen der u ¨brigen sind. Daher ist es keine Beschränkung der Allgemeinheit, r = m anzunehmen. Im Folgenden ist also stets vorausgesetzt, dass Rang von A = m = Anzahl der Zeilen von A. Nat¨ urlich ist m < n (= Anzahl der Variablen) anzunehmen, weil andernfalls die zulässige Menge aus höchstens einem Punkt bestände. Die Menge M ist offensichtlich konvex, d.h. zu je k Punkten x1 , x2 , . . . , xk und k nichtnegativen Zahlen r1 , r2 , . . . , rk mit nation

k i=1

k

i=1

ri = 1 gehört auch die Konvexkombi-

rixi zu M .

Ist M = ∅ und beschränkt, existiert also ein K ∈ IR mit |x| ≤ K f¨ ur alle x ∈ M , dann existiert auch ein x(0) ∈ M mit Z(x(0) ) = Zmin . Das folgt aus dem bekannten Satz aus der Analysis, dass jede auf einer abgeschlossenen und beschränkten Teilmenge von IRn definierte stetige Funktion dort ein Maximum und ein Minimum annimmt. Ein Punkt aus M , in welchem Z sein Minimum Zmin annimmt, heißt ein Minimalpunkt der Aufgabe. Sind x1 , x2 zwei Minimalpunkte, dann ist auch r1x1 + r2x2 mit r1 , r2 ≥ 0 und r1 + r2 = 1 ein Minimalpunkt, denn A(r1x1 + r2x2 ) = r1 Ax1 + r2 Ax2 = r1b + r2b = b, Z(r1x1 + r2x2 ) = r1 Z(x1 ) + r2 Z(x2 ) = r1 Zmin + r2 Zmin = Zmin . Ebenso folgt f¨ ur jede endliche Menge x1 , x2 , . . . , xk von Minimalpunkten, dass auch jede Konvexkombination k

i=1

rixi (r1 , r2 , . . . , rk ≥ 0, r1 + r2 + . . . + rk = 1)

ein Minimalpunkt ist. Die konvexe H¨ ulle (Menge aller Konvexkombinationen) gegebener Minimalpunkte besteht also aus Minimalpunkten.


160

Von entscheidender Bedeutung f¨ ur ein allgemeines Lösungsverfahren der Optimierungsaufgabe wird sich Satz 5 herausstellen. Dazu benötigt man den Begriff der Ecke der zulässigen Menge M . ............ ......... Eine Punkt aus M heißt eine Ecke von M , wenn ...... .... er keine echte Konvexkombination x1 ..s... ............ ... ....... ... ..u Ecke r1x1 + r2x2 , (r1 , r2 > 0, r1 + r2 = 1) . x2 .s ... M . von zwei verschiedenen Punkten x1 , x2 aus M ......... . . . . . . . . . . . . . .. ist, wenn er also nicht im Inneren einer einer ............... zu M gehörenden Strecke“ liegt (Fig. 3). Der ” Fig. 3: Begriff der Ecke von M Punkt o ist, falls er zu M gehört, stets eine Ecke von M (Aufgabe 5). Die Spaltenvektoren von A bezeichnen wir im Folgenden mit a1 , a2 , . . . , an . F¨ ur (0) x(0) ∈ M mit den Koordinaten xj (j = 1, 2, . . . , n) sei (0)

P (x(0) ) = {j | xj > 0}

und

S(x(0) ) = {aj | j ∈ P (x(0) )}.

Satz 1: Ein Punkt x(0) ∈ M ist genau dann eine Ecke von M , wenn S(x(0) ) linear unabhängig ist. Beweis: 1) Der Punkt x(0) sei eine Ecke von M . Ist x(0) = o, dann ist S(x(0) ) = ∅ und daher definitionsgemäß linear unabhängig. Ist x(0) = o, dann ist p = |P (x(0) )| > 0. Wir wählen die Nummerierung der Spaltenvektoren von A und der Koordinaten von x(0) so, dass (0)

(0)

(0)

(0) x1 > 0, x2 > 0, . . . , x(0) p > 0, xp+1 = 0, . . . , xn = 0.

Dann ist

p

(0)

i=1

xi ai = b. Wäre S(x(0) ) = {a1 , a2 , . . . , ap } linear abhängig, gäbe es

also ein p-Tupel (k1 , k2 , . . . , kp ) = (0, 0, . . . , 0) mit ε ∈ IR mit ε > 0 auch p

i=1

(0)

(xi + εki )ai = b und

p

i=1

p i=1

kiai = o, dann wäre f¨ ur alle

(0)

(xi − εki )ai = b.

Wählt man ε so klein, dass (1)

(0)

(2)

(0)

xi = xi + εki > 0 und xi = xi − εki > 0 f¨ ur i = 1, 2, . . . , p, (0)

was wegen xi > 0 f¨ ur i = 1, 2, . . . , p möglich ist, dann hat man zwei verschiedene 1 1 Punkte x(1) und x(2) aus M gefunden, so dass x(0) = x(1) + x(2) . Dann ist aber 2

2

x(0) keine Ecke. Daher ist die Annahme, {a1 , a2 , . . . , ap } wäre linear abhängig, auf einen Widerspruch gef¨ uhrt.


161

2) S(x(0) ) sei linear unabhängig. Ist x(0) = o, dann ist x(0) eine Ecke. Andernfalls ist p = |P (x(0) )| > 0. Wir wählen die Nummerierung der Spaltenvektoren von A und der Koordinaten von x(0) wieder wie oben. Wäre x(0) keine Ecke, dann gäbe es zwei verschiedene Punkte x1 , x2 ∈ M und r1 , r2 ∈ IR mit x(0) = r1x1 + r2x2 ,

r1 > 0, r2 > 0, r1 + r2 = 1.

Die (p + 1)-te bis n-te Koordinate von x1 und von x2 muss dabei 0 sein (weil sie nicht negativ sein kann). Aus Ax1 = b = Ax2 folgt A(x1 − x2 ) = o, wegen der linearen Unabhängigkeit von S(x(0) ) ergibt sich also x1 = x2 , im Widerspruch zu der Annahme, x(0) wäre keine Ecke. 2 Der Rang von A soll, wie oben vereinbart, gleich der Anzahl m der Gleichungen, also gleich der Anzahl der Zeilen von A sein. Also ist in obigen Bezeichnungen |S(x(0) )| ≤ m f¨ ur alle x(0) ∈ M . Aus Satz 1 folgt daher, dass eine Ecke von M höchstens m positive Koordinaten besitzt. Ist |S(x(0) )| = m, dann ist die Ecke x(0) eindeutig bestimmt, es gibt keine andere Ecke x(∗) mit |S(x(∗) )| = |S(x(0) )|. Beispiel 3: In Beispiel 2 sind z.B. der zweite, dritte und f¨ unfte Spaltenvektor linear unabhängig. Die zugehörige Ecke ergibt sich aus x1 = x4 = x6 = 0 und dem LGS x2 + x 3 = 7 x2 + x 3 + x 5 = 8 x2 + 2x3 = 12 zu (0 2 5 0 1 0)T , man erhält also die in Beispiel 2 berechnete Maximalecke (0,2,5) des Polyeders. Auch (2,4,0) tritt in Beispiel 2 als Ecke des Polyeders auf. Sie entspricht der Lösung (2 4 0 1 0 0)T des Gleichungssystems. Also weiß man aufgrund von Satz 1, dass der erste, zweite und vierte Spaltenvektor linear unabhängig sind (was man nat¨ urlich im Beispiel sofort nachpr¨ ufen kann). Satz 2: Ist die zulässige Menge M nicht leer, dann besitzt sie eine Ecke. Beweis: Gehört o zu M , dann hat M die Ecke o. Es sei nun p > 0 die kleinste Anzahl positiver Koordinaten, die unter den Punkten von M auftritt, und es sei x∗ ein Punkt mit genau p positiven Koordinaten sowie I die Indexmenge dieser Koordinaten. Dann sind die Spaltenvektoren ai f¨ ur i ∈ I linear unabhängig, und ∗ x ist damit nach Satz 1 eine Ecke. Wäre nämlich

i∈I

x∗i , i∈I,ri =0 ri

riai = o und ε = min

dann könnte man einen Punkt x∗∗ ∈ M mit weniger als p positiven Koordinaten ∗ konstruieren: x∗∗ ur i ∈ I und x∗∗ ur i ∈ I. 2 i = xi − εri f¨ i = 0 f¨


162

Satz 3: Die zulässige Menge M besitzt höchstens endlich viele Ecken. Beweis: Aus der Menge der Spaltenvektoren von A wählen wir m linear unabhängige Vektoren aus und nummerieren diese mit a1 , a2 , . . . , am . Das LGS x1a1 + x2a2 + . . . + xmam = b − (xm+1am+1 + . . . + xnan ) mit den Variablen x1 , x2 , . . . , xm und den Parametern xm+1 , . . . , xn besitzt f¨ ur jede Wahl der Parameterwerte, also auch f¨ ur xm+1 = . . . = xn = 0 , genau eine (0) (0) x(0) mit diesen Koordinaten, ergänzt um Lösung (x1 , x2 , . . . , x(0) m ). Der Punkt (0) xi = 0 f¨ ur i = m+1, . . . , n, ist Lösung von Ax = b. Gilt außerdem x(0) ≥ o, dann (0) gehört x zu M und ist nach Satz 1 eine Ecke von M . Jeder linear unabhängigen Menge von m der Spaltenvektoren von A ist also höchstens eine Ecke von M zugeordnet. Jede Ecke x(0) lässt sich aber auch auf diese Art gewinnen: Man ordne ihren positiven Koordinaten die Spaltenvektoren von A mit dem gleichen Index zu, ergänze diese durch weitere Spaltenvektoren von A zu einer Basis von IRm und wende obiges Verfahren zur Gewinnung einer Ecke an. Dabei ergibt sich die Ecke x(0) . Die Anzahl der Ecken von M ist also höchstens gleich der Anzahl der verschiedenen m-Teilmengen der Menge der n Spaltenvektoren von A, also n höchstens gleich dem Binomialkoeffizient . 2 m

Beispiel 4: In Beispiel 2 kann man auf höchstens 20 Arten drei linear unabhängige Spaltenvektoren auswählen, es gibt also höchstens 20 Ecken. Im Folgenden sind einige Fälle durchgerechnet. Ob eine Ecke vorliegt, erkennt man am Vorzeichen der Koordinatenwerte. Ecke? ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 ⎝ 2 4 ⎛ 1 ⎝ 2 4 ⎛ 1 ⎝ 1 1 ⎛ 1 ⎝ 2 4 ⎛ 1 ⎝ 1 2 ⎛ 1 ⎝ 0 0

1 ⎠, ⎝ 1 1 ⎞ ⎛ 1 ⎠, ⎝ 1 1 ⎞ ⎛ 0 ⎠, ⎝ 1 0 ⎞ ⎛ 1 ⎠, ⎝ 0 0 ⎞ ⎛ 0 ⎠, ⎝ 1 0 ⎞ ⎛ 0 ⎠, ⎝ 1 0

1 ⎠, ⎝ 1 2 ⎞ ⎛ 1 ⎠, ⎝ 0 0 ⎞ ⎛ 0 ⎠, ⎝ 0 1 ⎞ ⎛ 0 ⎠, ⎝ 0 1 ⎞ ⎛ 0 ⎠, ⎝ 0 1 ⎞ ⎛ 0 ⎠, ⎝ 0 1

⎠

x4 = x5 = x6 = 0, x1 = 1, x2 = 4, x3 = 2

ja

x3 = x5 = x6 = 0, x1 = 2, x2 = 4, x4 = 1

ja

x1 = x3 = x4 = 0, x2 = 7, x5 = 1, x6 = 5

ja

⎞ ⎠ ⎞ ⎠ ⎞ ⎠

x1 = 4, x4 = 3, x6 = −4

nein

x1 = x2 = x4 = 0, x3 = 7, x5 = 1, x6 = −2

nein

x1 = x2 = x3 = 0, x4 = 7, x5 = 8, x6 = 12

ja

x2 = x3 = x5 = 0,

⎞ ⎠ ⎞ ⎠


163

Die zulässige Menge M in Beispiel 2 ist beschränkt: x1 , x2 , x2 , x4 ≤ 7, x5 ≤ 8, x6 ≤ 12. Die zulässige Menge einer Optimierungsaufgabe muss aber nicht beschränkt sein; beispielsweise gehören bei der Aufgabe mit x 1 − x 2 + x3 = 2 −2x1 + x2 + x4 = 1 alle Quadrupel (t, t, 2, t + 1) mit t ∈ IR, t ≥ 0 zur zulässigen Menge. Satz 4: Ist die zulässige Menge M nicht leer und beschränkt, dann ist sie die konvexe H¨ ulle ihrer Ecken, sie ist also ein Polyeder. Beweis: Da die konvexe H¨ ulle der Menge der Ecken von M offensichtlich zu M gehört, ist nur zu zeigen, dass jeder Punkt von M eine Konvexkombination der (nach Satz 3 höchstens endlich vielen) Ecken ist. Ist m = n, dann besitzt Ax = b genau eine Lösung x(0) , wegen M = ∅ ist also M = {x(0) }, die zulässige Menge besteht also nur aus einer Ecke. Ist m < n und b = o, dann ist die Lösungsmenge von Ax = b bzw. Ax = o ein (n − m)-dimensionaler Unterraum von IRn . Da M beschränkt ist und da mit x auch kx (k ∈ IR) zu M gehören m¨ usste, besteht M nur aus dem Punkt o. Wir nehmen nun m < n und b = o an. Dann ist o ∈ M , jeder Punkt aus M besitzt also mindestens eine positive Koordinate. Es sei x(0) ein Punkt aus M mit genau r positiven Koordinaten (r ≥ 1) und I die Indexmenge dieser positiven Koordinaten. Ist {ai | i ∈ I} linear unabhängig, dann ist x(0) nach Satz 1 eine Ecke von M und als solche eine (triviale) Konvexkombination von Ecken aus M . Sei {ai | i ∈ I} linear abhängig, also

i∈I

kiai = o, wobei mindestens einer der

Koeffizienten ki als positiv angenommen werden kann. Setzt man mit δ ∈ IR (0)

x∗i (δ) = xi + δki f¨ ur i ∈ I

und x∗i (δ) = 0 sonst,

ur jedes δ ∈ IR eine Lösung von Ax = b. Wäre keiner der Koeffidann ist x∗ (δ) f¨ zienten ki negativ, dann wäre x∗ (δ) ∈ M f¨ ur alle δ ∈ IR mit δ > 0 und somit M nicht beschränkt. Daher ist mindestens einer der Koeffizienten ki negativ. Setzt man (0) (0) x(0) x(0) x x δ1 = − min i = − p und δ2 = min i = q , i∈I,ki >0 ki i∈I,ki 0 und x1 = x2 = 0 f¨ Die Punkte x1 , x2 sind Lösungen von Ax = b. Setzen wir ε gleich dem Minimum (i)

aller Werte

xo i mit ki = 0, dann sind x1 , x2 zulässige Punkte. Es gilt ki

Z(x1 ) = Z(x0 ) − ε

p

i=1

ui k i

und Z(x2 ) = Z(x0 ) + ε

p

i=1

u i ki .

ur alle x ∈ M ist Wegen Z(x0 ) ≤ Z(x) f¨ p

i=1

ui ki ≥ 0 und

p

i=1

ui ki ≤ 0,

also

p

i=1

u i ki = 0

und damit Z(x1 ) = Z(x2 ) = Z(x0 ). Demnach sind x1 und x2 Minimalpunkte; von diesen hat mindestens einer aufgrund der Wahl von ε eine positive Koordinate weniger als x0 . Ist x1 ein solcher, dann definiere man S(x1 ) analog zu S(x0 ) und wiederhole die gesamte Argumentation. Schließlich erreicht man den Fall, dass S(xj ) linear unabhängig ist, und zwar spätestens dann, wenn diese Menge leer ist. 2


165

Aufgaben 1. Die Werkstücke A, B durchlaufen die Maschinen M1 , M2 , M3 . Die Bearbeitungszeit von A, B in den einzelnen Maschinen, die wartungsfreie Laufzeit der Maschinen pro Tag und die Gewinne pro Werkst¨ uck (drei Möglichkeiten) entnehme man untenstehender Tabelle. F¨ ur welche St¨ uckzahlen ist der Gesamtgewinn pro Tag jeweils maximal? M1 min/Stck M2 min/Stck M3 min/Stck Gewinn/Stck Gewinn/Stck Gewinn/Stck

A B Laufzeit 2 6 12 h 4 4 10 h 40 m 7 2 12 h 50 m 90,– 30,– ← Fall 1 60,– 60,– ← Fall 2 40,– 80,– ← Fall 3

2. Das Planungspolyeder in Beispiel 2 hat u.a. die Ecken A(2, 4, 0), B(1, 4, 2), C(1, 6, 0). F¨ ur welche Zielfunktionen sind alle Punkte der Strecke AB Maximalpunkte? F¨ ur welche Zielfunktion sind alle Punkte der Dreiecksfläche ABC Maximalpunkte?

3. Das Planungspolyeder in Beispiel 2 ist ein konvexer Körper, d.h. mit je zwei Punkten gehört auch die Verbindungsstrecke zu diesem Körper. Das Planungspolyeder ist die Schnittmenge von Halbräumen, und solche sind konvex. Man zeige allgemein: Die Schnittmenge von konvexen Mengen ist konvex.

4. Man löse das Optimierungsproblem x1 + 2x2 + x3 ≤ 5 x 1 − x2 + x 3 ≤ 4 , x1 + x2 + 3x3 ≤ 6

x1 , x2 , x3 ≥ 0, Z = 6x1 + 4x2 + 2x2 max.

5. Man zeige: Gehört der Nullvektor o zur zulässigen Menge M einer linearen Optimierungaufgabe in Standardform, dann ist er eine Ecke von M .

6. Man betrachte die Standardaufgabe der linearen Optimierung mit ⎛

1 A = ⎝ −2 1

−2 1 1

1 0 0

0 1 0

⎞ 0 0 ⎠, 1

⎛

⎞ 2 b = ⎝ 2 ⎠, 1

u = (2 2 − 3 1 5)T .

a) Man gebe alle Ecken der zulässigen Menge an. b) Man bestimme alle Minimalpunkte von uT x.


166

VIII.2 Das Simplexverfahren Beim Simplexverfahren wird zunächst eine Ecke der zulässigen Menge ermittelt (Startecke, Basislösung) und von dieser ausgehend eine Folge von Ecken mit abnehmenden Werten der Zielfunktion konstruiert. Nach Satz 5 aus VIII.1 nimmt nämlich die Zielfunktion, falls sie ein Minimum besitzt, ihren minimalen Wert in einer Ecke an. Man hat dabei die Vorstellung, Ecken eines mehrdimensionalen Polyeders zu durchwandern. Solche Polyeder kann man sich aus einfachen Polyedern zusammengesetzt denken, welche den Namen Simplex tragen: Ein Simplex der Dimension r im Punktraum IRn ist die Menge aller Punkte, deren Ortsvektoren eine Konvexkombination von r + 1 linear unabhängigen Vektoren des Vektorraums IRn sind. Im IR3 ist ein Punkt ein 0- dimensionaler Simplex, eine Strecke ein 1-dimensionaler Simplex, ein Dreieck ein 2-dimensionaler Simplex und ein Tetraeder ein 3-dimensionaler Simplex. Obwohl wir es im Folgenden nicht mit Simplexen, sondern mit allgemeineren Polyedern zu tun haben, spricht man vom Simplexverfahren. Wir formulieren hier nochmals die Standardaufgabe der linearen Optimierung und wiederholen einige Definitionen und Bezeichnungen: Standardaufgabe: Es sei A = (aij ) ∈ IRm,n eine Matrix vom Rang m mit den Spaltenvektoren aj (j = 1, 2, . . . , n) und b ∈ IRm mit b ≥ o, ferner u ∈ IRn und Z(x) = uT x. Gesucht sind die Punkte aus M = {x | Ax = b, x ≥ o} mit einem minimalen Wert von Z(x). Die Menge M = {x | Ax = b, x ≥ o} heißt zulässige Menge der Standardaufgabe. Eine Punkt x(0) ∈ M heißt eine Ecke von M , wenn er keine echte Konvexkombination von zwei anderen Punkten aus M ist. Zunächst untersuchen wir, wie man eine Startecke (Basislösung) x(0) ermittelt und ob u ¨berhaupt eine solche existiert. Geht man von der Nichtstandardform mit M = {x ∈ IRn | Ax ≤ b, x ≥ o} (A ∈ IRm,n , b ∈ IRm ) durch Einf¨ uhrung von m Schlupfvariablen xn+1 , . . . , xn+m zur Standardform mit M = {x ∈ IRn+m | Ax = b , x ≥ o} (A ∈ IRm,n+m , b ∈ IRm , b ≥ o) u ¨ber, dann ist (0 0 . . . 0 b1 b2 . . . bm )T = (oT bT )T eine Ecke von M , denn die zu den von 0 verschiedenen Koordinaten dieses Punktes gehörenden Spalten ¨ sind Spalten der beim Ubergang von A zu A hinzugef¨ ugten Einheitsmatrix, also linear unabhängig. (Dies ist der in der Praxis am häufigsten auftretende Fall, so dass man sich u ¨ber das Auffinden einer Startecke in der Regel keine Gedanken machen muss.)

VIII.2 Das Simplexverfahren

167

Ist aber die Aufgabe bereits in Standardform (mit A ∈ IRm,n , b ∈ IRm ) gegeben, wobei keineswegs m der Spaltenvektoren von A die verschiedenen Einheitsvektoren sein m¨ ussen, dann geht man folgendermaßen vor: Man f¨ ugt m Schlupfvariable y1 , y2 , . . . , ym mit den Bedingungen yi ≥ 0 hinzu, ergänzt also A um die Spalten der Einheitsmatrix aus IRm zu A = (A E), setzt x = (x1 . . . xn y1 . . . ym )T = (xT y T )T und sucht das Minimum von Z (x ) = y1 + y2 + . . . + ym auf der wie u ¨blich T T T definierten zulässigen Menge M . Der Punkt (o b ) ist eine Ecke von M . Wegen Z(x ) ≥ 0 f¨ ur alle x ∈ M besitzt Z ein Minimum auf M . Zur Bestimmung dieses Minimums kann man (oT bT )T als Startecke verwenden. Es sei (x(0) T y (0) T )T ein Minimalpunkt dieser Aufgabe (den man mit den im Folgenden dargestellten Methoden finden kann). Ist Z ((x(0) T y (0) T )T ) > 0, dann ist die zulässige Menge M des Ausgangsproblems leer: Wäre z ∈ M , dann wäre Az + Eo = b und (zT oT )T ≥ o, also (zT oT )T ∈ M und Z ((zT oT )T ) = 0, das Minimum von Z wäre also nicht positiv. Ist Z ((x(0) T y (0) T )T ) = 0, dann ist y (0) = o und damit x(0) ∈ M. Die zulässige Menge des Ausgangsproblems ist also nicht leer. Da (x(0) T oT )T als Minimalpunkt eine Ecke von M ist, besitzt diese höchstens m positive Koordinaten und die zugehörigen Spaltenvektoren von A sind linear unabhängig. Also ist x(0) eine Ecke von M und damit eine mögliche Startecke des Ausgangsproblems. Im Folgenden können wir also stets davon ausgehen, dass wir eine Startecke x(0) der Standardaufgabe kennen. Wir wollen nun untersuchen, ob und wie man von einer gegebenen Ecke x(0) zu einer Ecke x(1) mit Z(x(1) ) < Z(x(0) ) gelangt. F¨ ur eine Ecke x(0) ∈ M sei (0)

ur welche xj > 0 ist, P (x(0) ) die Menge aller Indizes j, f¨ S(x(0) ) die Menge aller Spaltenvektoren aj von A mit j ∈ P (x(0) ). Man beachte, dass eine Ecke von M höchstens m positive Koordinaten hat, wie wir in VIII.1 gesehen haben, dass also |P (x(0) )| = |S(x(0) )| ≤ m. Definition 1: Eine Ecke x(0) von M heißt entartet, wenn sie weniger als m positive Koordinaten besitzt; andernfalls heißt sie nicht-entartet. Definition 2: Es sei x(0) eine Ecke von M . Eine Menge B von m linear unabhängigen Spaltenvektoren von A mit S(x(0) ) ⊆ B heißt eine Basis von x(0) . Die zu B gehörenden Variablen heißen Basisvariable, die anderen Nichtbasisvariable von x(0) zur Basis B. Die Basis einer nicht-entarteten Ecke x(0) ist eindeutig bestimmt (nämlich als S(x(0) )), eine entartete Ecke hat in der Regel verschiedene Basen.


168 Im Folgenden sei B = {ai1 , ai2 , . . . , aim } eine Basis der Ecke x(0) , I = {i1 , i2 , . . . , im } die zugehörige Indexmenge, I = {1, 2, . . . , n} \ I = {im+1 , im+2 , . . . , in }.

Die Darstellung der Nichtbasisvektoren und des Vektors b in der Basis B sei

b = cikai f¨ ur k ∈ I und ciai (cik , ci ∈ IR). ak = i∈I

i∈I

Dann ist Ax =

i∈I

xiai +

xk

k∈I

i∈I

cikai =

i∈I

⎛ ⎝x i +

⎞

cik xk ⎠ ai .

k∈I

Das Gleichungssystem Ax = b ist daher äquivalent mit

i∈I

⎛ ⎝xi +

⎞

cik xk ⎠ ai =

k∈I

i∈I

ciai .

Wegen der linearen Unabhängigkeit von B gilt also f¨ ur alle x ∈ M xi +

f¨ ur alle i ∈ I.

cik xk = ci

k∈I (0)

ur welche ja xk = 0 f¨ ur k ∈ I gilt, also Dies gilt insbesondere f¨ ur die Ecke x(0) , f¨ (0) (0) ist ci = xi und damit ci ≥ 0 f¨ ur alle i ∈ I. Ferner ist wegen xi = xi − cik xk k∈I

Z(x) =

i∈I

ui x i +

k∈I

Die Koeffizienten fk = uk −

i∈I

uk xk =

i∈I

(0)

ui x i +

(uk −

k∈I

i∈I

ui cik )xk .

ui cik f¨ ur k ∈ I heißen Formkoeffizienten (von x(0)

bez¨ uglich der Basis B). Mit ihnen gilt also Z(x) = Z(x(0) ) +

fk xk .

k∈I

Beispiel 1: Wir betrachten die Aufgabe aus Beispiel 2 in VIII.1: = 7 x1 + x2 + x 3 + x 4 2x1 + x2 + x3 + x5 = 8 4x1 + x2 + 2x3 + x6 = 12 mit den Positivitätsbedingungen x1 , x2 , x3 , x4 , x5 , x6 ≥ 0. Die zu minimierende Zielfunktion sei Z = −2x1 − 3x2 − 5x3 . (In VIII.1 haben wir das Maximum


169

der Zielfunktion Z = 2x1 + 3x2 + 5x3 gesucht.) Eine nicht-entartete Ecke ist (1 4 2 0 0 0)T . Die Spaltenvektoren a1 , a2 , a3 bilden die Basis dieser Ecke. Es ist + 2a3 a4 = −a1 a5 = a1 + 2a2 − 3a3 a6 = −a2 + a3

und b = a1 + 4a2 + 2a3 .

Bezogen auf die Basis {a1 , a2 , a3 } lautet das Gleichungssystem also −

x1 x2 x3

x4 + x 5 = 1 + 2x5 − x6 = 4 . + 2x4 − 3x5 + x6 = 2

Die Zielfunktion ist Z(x) = −2(1 + x4 − x5 ) − 3(4 − 2x5 + x6 ) − 5(2 − 2x4 + 3x5 − x6 ) = −24 + 8x4 − 7x5 + 2x6 F¨ ur die Ecke x(0) = (1 4 2 0 0 0)T ist x4 = x5 = x6 = 0, in dieser Ecke hat die Zielfunktion also den Wert −24. Alle berechneten Daten sind in Tab. 1 zusammengefasst. In der letzten Zeile stehen die Koeffizienten der Zielfunktion ( Formkoeffizienten“) und der ” Wert der Zielfunktion in der betrachteten Ecke.

b x 1 x2 x3 x4 x5 x6 1 0 0 −1 1 0 1 0 1 0 0 2 −1 4 0 0 1 2 −3 1 2 8 −7 2 −24 Zielfunktion Tab. 1

x1 x2 x3 b 1 1 1 7 2 1 1 8 4 1 2 12 −2 −3 −5 0 Zielfunktion

x4 x5 x6 1 0 0 0 1 0 0 0 1

F¨ ur die Ecke x(0) = (0 0 0 7 8 12)T ( triviale“ Ecke) ist x1 = x2 = x3 = ” 0, in dieser Ecke hat die Zielfunktion also den Wert 0 (Tab. 2). Diese Ecke kann man beim Optimierungsverfahren Tab. 2 (Satz 3) als Startecke wählen, wenn man keine g¨ unstigere“ Ecke kennt. ” Zum Auffinden von Tabelle 1 f¨ uhrt man mit dem gegebenen LGS bzw. seiner Koeffizentenmatrix die Zeilenumformungen durch, die man schon beim Lösen eines LGS verwendet hat: ⎛

Aus ⎛

⎞

1 1 1 1 0 0 7 1 1 0 1 0 8 ⎟ ⎠ 4 1 2 0 0 1 12

⎜ ⎝ 2

⎛

folgt

⎞

1 1 1 1 0 0 7 ⎜ ⎟ ⎝ 0 1 1 2 −1 0 6 ⎠ 0 0 1 2 −3 1 2

1

1

1

⎞

1 0 0 7 1 0 −6 ⎟ ⎠, 0 −3 −2 −4 0 1 −16

⎜ ⎝ 0 −1 −1 −2 ⎛

und schließlich

⎞

1 0 0 −1 1 0 1 ⎜ 0 2 −1 4 ⎟ ⎝ 0 1 0 ⎠. 0 0 1 2 −3 1 2


170

Im Folgenden sei x(0) stets eine gegebene Ecke der Standardaufgabe. ur k ∈ I in der Darstellung Satz 1: a) Sind die Formkoeffizienten fk f¨ Z(x) = Z(x(0) ) +

fk xk

k∈I

von Z(x) bez¨ uglich der Basis von x(0) alle positiv, dann ist x(0) der einzige Minimalpunkt. b) Ist kein Formkoeffizient negativ, dann existieren Minimalpunkte. Es sei I0 die Menge der Indizes k ∈ I mit fk = 0. Dann sind die Minimalpunkte genau die Punkte x mit xi ≥ 0 (i = 1, 2, . . . , n) und (0)

xi = xi −

cik xk , falls i ∈ I und xk = 0, falls k ∈ I \ I0 .

k∈I0

F¨ ur die Koordinaten mit Indizes aus I0 sind außer xi ≥ 0 keine Bedingungen festgelegt, sie sind freie Parameter. Beweis: a) Aus der angegebenen Bedingung folgt Z(x) ≥

i∈I

(0)

ui xi = Z(x(0) ) f¨ ur alle x ∈ M. (0)

F¨ ur x = x(0) ist mindestens ein xk mit k ∈ I positiv, sonst wäre xi = xi (0) i ∈ I (wegen xi + cik xk = xi f¨ ur i ∈ I). Also ist Z(x) > Z(x(0) ).

f¨ ur alle

k∈I

b) Wie in a) sieht man, dass x(0) Minimalpunkt ist. Die weitere Behauptung folgt aus obiger Gleichung Z(x) = Z(x(0) ) + fk xk . Ist nämlich fk = 0 (also k ∈ I0 ), k∈I

so kann man xk ≥ 0 beliebig wählen; ist fk > 0 (also k ∈ I \ I0 ), so muss man zur Erreichung eines Minimums xk = 0 setzen. 2 F¨ ur die Minimalpunkte x gilt also nach Satz 1b) xi = 0 f¨ ur i ∈ I \ I0 , xi ≥ 0 beliebig f¨ ur i ∈ I0 , (0)

xi = x i − bzw. x = x(0) −

k∈I0

k∈I0

xk cik f¨ ur i ∈ I

tkck

mit tk ≥ 0,

wobei wir f¨ ur xk die Parameterbezeichnung tk gewählt haben. Die Vektoren ck haben dabei |I \ I0 | Koordinaten 0, und zwar an den Stellen i, an denen (0) xi = 0 und fi > 0 gilt.

.. .. .... . . . . ...... .. .... .... .. ... :.. −c.1. . . * . . ......... . . . . . ..... s..... .. . . .. P x(0) ..P P .. ..P ......... . q P −c2 . .. .. .. .. .. .. .. .. .. . . .. Fig. 1: Kegel mit der Spitze x(0)

Diese Punkte bilden einen r-dimensionalen Kegel mit der Spitze x(0) , wobei r = |I0 | (Fig. 1). Die Menge der Minimalpunkte in Satz 1b) ist die Schnittmenge dieses Kegels mit der Menge {x | x ≥ o}. Die Menge dieser Minimalpunkte kann unbeschränkt sein.


171

⎛

⎞ ⎛ ⎞ 1 −2 1 0 0 2 Beispiel 2: Es sei A = ⎝ −2 1 0 1 0 ⎠, b = ⎝ 2 ⎠ und Z(x) = −x1 +4x2 . 1 1 0 0 −1 1

Der Punkt x(0) = (1 0 0 6 1)T ∈ M ist eine (nicht-entartete) Ecke, denn die zu den positiven Koordinaten gehörenden Spaltenvektoren a1 , a4 , a5 von A sind linear unabhängig. Bezogen auf die Basis {a1 , a4 , a5 } von x(0) lautet das Gleichungssystem x1 − 2x2 + x3 = 2 x4 − x2 + 2x3 = 6 x5 − 3x2 + x3 = 1 und die Zielfunktion Z(x) = −2 + 2x2 + 2x3 . Die Koeffizienten von x2 , x3 in der Zielfunktion sind positiv, also ist nach Satz 1 die Ecke (1 0 0 6 1)T der einzige Minimalpunkt und der minimale Wert von Z ist −2. Beispiel 3: Eine Aufgabe habe mit dem Eckpunkt (0 5 0 0 10 7 3 0 0)T die Werte in der folgenden Tabelle ergeben (vgl. Beispiel 1). Dieser Eckpunkt ist aufgrund der Werte von fk ein Minimalpunkt. x2 x 5 x 6 x 7 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1

x1 x3 x4 x8 x9 1 0 1 3 5 25 3 5 1 −1 7 80 −1 1 0 2 −3 75 2 3 −2 3 0 40 fk = 3 0 11 4 0

Minimalpunkte sind dann nach Satz 1b) alle Punkte der folgenden Form mit nichtnegativen Parameterwerten und nichtnegativen Koordinaten: ⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝

0 25 0 0 80 75 40 0 0

⎞

⎛

⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ − t3 ⎜ ⎟ ⎜ ⎟ ⎜ ⎜ ⎟ ⎟ ⎜ ⎠ ⎝

0 0 −1 0 5 1 3 0 0

⎞

⎛

⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎟ − t9 ⎜ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠

Es gibt unendlich viele Minimalpunkte, denn f¨ ur alle Punkte (t3 , t9 ) aus dem in Fig. 2 dargestellten Viereck ABCD ergibt sich ein Minimalpunkt der gegebenen Aufgabe.

0 5 0 0 7 −3 0 0 −1

⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠

mit

t3 ≥ 0 t9 ≥ 0 25 − 5t9 ≥ 0 80 − 5t3 − 7t9 ≥ 0 75 − t3 + 3t9 ≥ 0 40 − 3t3 ≥ 0

.. ... 40 ..... .......... . . . . D( 120 , ) . u . . . . . . . 11 11 ......... ..... ....... .... ..... .......u 40 40 ............ . . . . . . . . . ..... C( 3 , 21 ) . ...... . . . . . . . . . . ... ..... . . . . . . . . . . ... ...u..................................................................................................................................u - t 3 B( 40 , 0) A(0, 0) 3 t9

6

Fig. 2: Parameterbereich in Beispiel 3


172

Zur Formulierung des nächsten Satzes benötigen wir wieder die obige Darstellung von Ax = b in der Form xi +

(0)

cik xk = xi

f¨ ur i ∈ I,

k∈I

welche sich auf eine Basis einer gegebenen Ecke x(0) bezieht. Den aus den Koeffizienten cik bei festem k gebildeten Vektor aus IRm bezeichnen wir (wie schon oben) mit ck . (Die Vektoren ck bilden die Spalten in der zweiten Abteilung der Tabellen in Beispiel 1 und Beispiel 3.). Satz 2: Gibt es bez¨ uglich einer Basis einer Ecke von M einen negativen Formkoeffizient fh und hat der zugehörige Vektor ch keinen einzigen positiven Koeffizient, dann existiert kein Minimalpunkt. Beweis: F¨ ur die Punkte x mit (0)

xi = xi + |cih |t f¨ ur i ∈ I, xh = t und xk = 0 f¨ ur k ∈ I, k = h mit t ≥ 0 gilt x ≥ o und xi +

k∈I

(0)

(0)

cik xk = xi + |cih |t + cih t = xi

f¨ ur i ∈ I

und damit x ∈ M. F¨ ur diese Punkte gilt Z(x) = Z(x(0) ) +

k∈I

fk xk = Z(x(0) ) − |fh |t.

Da t beliebig große Werte annehmen kann, ist M nicht beschränkt und Z(x) nimmt auf M kein Minimum an. 2 Es verbleibt der Fall, dass ein negativer Formkoeffizient existiert und jeder Vektor ck f¨ ur k ∈ I mindestens eine positive Koordinate besitzt. Hier betrachten wir zunächst den Fall, dass die Startecke x(0) nicht entartet ist, dass x(0) also genau (0) m positive Koordinaten besitzt und damit xi > 0 f¨ ur alle i ∈ I gilt. Ist fh ein negativer Formkoeffizient und wird der Index μ definiert durch (0) x(0) x μ = min i , cih >0 cih cμh

dann gehören alle x mit (0)

ur i ∈ I, xi = xi − cih t f¨ mit 0 ≤ t ≤

(0) xμ

cμh

xh = t,

xk = 0 f¨ ur k ∈ I, k = h

zu M , denn dann ist x ≥ o und

xi +

k∈I

(0)

(0)

cik xk = xi − cih t + cih t = xi

ur t = Es gilt Z(x) = Z(x(0) ) − |fh |t. F¨

(0)

f¨ ur i ∈ I.

xμ ergibt sich der Punkt x(1) mit cμh


173

Z(x(1) ) = Z(x(0) ) − |fh |

(0)

xμ . cμh

Es gilt (0) x(1) μ = xμ − cμh

(0)

xμ (1) = 0 und xh = t > 0; cμh

der Punkt x(1) hat also mindestens eine und höchstens m positive Koordinaten. F¨ ur die Spaltenvektoren von A gilt ah =

i∈I

cihai =

cihai + cμhaμ

mit cμh > 0.

i∈I,i=μ

Nun tauschen wir den Vektor aμ in der Basis B gegen den Vektor ah aus und erhalten wieder eine linear unabhängige Menge B (1) von m Spaltenvektoren. Sie enthält als Teilmenge die Spaltenvektoren, die zu den (höchstens m) positiven Koordinaten von x(1) gehören. Folglich ist x(1) eine Ecke von M mit der Basis B (1) und es gilt Z(x(1) ) < Z(x(0) ). Die beschriebene Austauschung von Basisvektoren hat also, ausgehend von einer Ecke x(0) , eine Ecke x(1) geliefert, f¨ ur welche der Wert der Zielfunktion kleiner ist als f¨ ur die Ausgangsecke. Ist die Ausgangsecke x(0) entartet, hat sie also auch Koordinaten mit dem Wert (0)

0, dann kann es passieren, dass obige Zahl

xμ den Wert 0 hat. In diesem Fall cμh

f¨ uhrt obige Austauschung wieder zu x(0) zur¨ uck. Insgesamt ist damit folgender Satz bewiesen:

Satz 3: Ist mindestens einer der Formkoeffizienten fk negativ und besitzt der zugehörige Vektor ck mindestens eine positive Koordinate, dann f¨ uhrt die oben beschriebene Austauschung von der Ausgangsecke x0 auf eine Ecke x(1) mit Z(x(1) ) < Z (x(0) ), falls x(0) nicht entartet ist. Wenn aber x(0) entartet ist, f¨ uhrt die Austauschung auf eine solche Ecke x(1) oder wieder auf x(0) zur¨ uck. Beispiel 4: Wir betrachten nochmals die Situation in Beispiel 2, es sei also ⎛

⎞

⎛

⎞

1 −2 1 0 0 2 ⎜ ⎟ 1 0 1 0 ⎟ x) = −x1 + 4x2 . ⎠, b = ⎝ 2 ⎠ und Z( 1 1 0 0 −1 1

⎜ A = ⎝ −2

Der Punkt x(0) = (0 1 4 1 0)T ∈ M ist eine (nicht-entartete) Ecke, denn die zu den positiven Koordinaten gehörenden Spaltenvektoren a2 , a3 , a4 von A sind


174

linear unabhängig. Es ist Z(x(0) ) = 4. Bezogen auf die Basis {a2 , a3 , a4 } von x(0) lautet das Gleichungssystem x2 x3 x4

+ x 1 − x5 = 1 + 3x1 − 2x5 = 4 − 3x1 + x5 = 1

und die Zielfunktion Z(x) = −x1 + 4(1 − x1 + x5 ) = 4 − 5x1 + 4x5 . Die Formkoeffizienten sind −5 und 4. Es gibt also einen negativen Formkoeffizient, nämlich f1 = −5. Also ist in obigen Bezeichnungen h = 1 und (0)

(0)

(0)

x2 x3 x4 1 4 1 . = , = , = c21 1 c31 3 c41 −3 Das Minimum unter diesen Werten mit positivem Nenner ist 1, also ist μ = 2. Man tauscht daher in dem neuen Gleichungssystem die Spaltenvektoren zu x1 und x2 aus. Bezogen auf die neue Basis {b1 , b3 , b4 } von x(0) lautet das Gleichungssystem x1 x3 x4

+ x 2 − x5 = 1 − 3x2 + x5 = 1 + 3x2 − 2x5 = 4

und die Zielfunktion Z(x) = 4 − 5(1 − x2 + x5 ) + 4x5 = −1 + 5x2 − x5 . F¨ ur die neue Ecke x(1) = (1 0 1 4 0)T ist Z(x(1) ) = −1, der Wert von Z ist also gesunken. Bez¨ uglich der neuen Basis gibt es wieder einen negativen Formkoeffizienten, nämlich f5 = −1. Also ist in obigen Bezeichnungen h = 5 und (1)

(1)

(1)

x1 1 1 4 x3 x4 = = , = , . c15 −1 c35 1 c45 −2 Das Minimum unter diesen Werten mit positivem Nenner ist 1, also ist μ = 3. Man tauscht daher in dem neuen Gleichungssystem die Spaltenvektoren zu x3 und x5 aus. Bezogen auf die neue Basis von x(1) lautet das Gleichungssystem x1 x5 x4

− 2x2 + x3 = 2 − 3x2 + x3 = 1 − 3x2 + 2x3 = 6

und die Zielfunktion Z(x) = −1 + 5x2 − (1 + 2x2 − x3 ) = −2 + 3x2 + x3 . Jetzt sind alle Formkoeffizienten positiv. Es ergibt sich somit die Lösung der Optimierungsaufgabe: Z nimmt das Minimum −2 in der Ecke (2 0 0 6 1)T (also f¨ ur x1 = 2, x2 = 0) an. ¨ Ein Argernis in Satz 3 ist die Tatsache, dass eine Basis von x(0) erneut auftauchen kann, wenn x(0) entartet ist. Solche Zyklen kann man durch geeignete Zusatzvorschriften vermeiden, worauf wir aber nicht eingehen wollen. Zum Abschluss f¨ uhren wir die Basisaustauschung noch an einem etwas umfangreicheren Beispiel vor.


175

Beispiel 5: Die 6 Artikel eines FertigungssortiM 1 M 2 M3 M4 ments sollen mit den St¨ uckzahlen x1 , x2 , . . . , x6 a 4 9 6 2 hergestellt werden. Der Gewinn pro Artikel bei1 a 8 17 12 5 trägt 2, 4, 1, 5, 4, bzw. 1 (Geldeinheiten). An der i2 ai3 2 5 7 1 Fertigung sind 4 Maschinen beteiligt, die täglich ai4 10 25 12 6 höchstens 8 Stunden laufen. Die Bearbeitungszeit ai5 6 12 7 3 des j-ten Artikels in der i-ten Maschine beträgt aij ai6 4 7 5 1 Sekunden und ist in nebenstehender Tabelle angegeben. Bei welchen St¨ uckzahlen ist der Gewinn maximal? Es ist Z(x) = −(2x1 + 4x2 + x3 + 5x4 + 4x5 + x6 ) zu minimieren, wobei die zulässige Menge durch 4x1 + 8x2 + 2x3 + 10x4 + 6x5 + 4x6 + x7 + x8 9x1 + 17x2 + 5x3 + 25x4 + 12x5 + 7x6 6x1 + 12x2 + 7x3 + 12x4 + 7x5 + 5x6 + x9 + x10 2x1 + 5x2 + x3 + 6x4 + 3x5 + x6

= = = =

a a a a

mit x1 , x2 , . . . , x10 ≥ 0 und a = 28 800 (8 h=28800 s) gegeben ist. Eine Ecke der zulässigen Menge ist (0, 0, 0, 0, 0, 0, a, a, a, a), die zugehörigen Basisvariablen sind x7 , x8 , x9 , x10 . Zum gegebenen LGS gehört folgendes Schema: x7 x8 x9 x10 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1

x1 x2 x3 x 4 x5 x6 4 8 2 10 6 4 9 17 5 25 12 7 6 12 7 12 7 5 2 5 1 6 3 1 −2 −4 −1 −5 −4 −1

a a a a 0

Alle Formkoeffizienten sind negativ und in den zugehörigen Spalten stehen nur positive Zahlen, so dass man eine beliebige der letzten 6 Spalten (x1 bis x6 ) gegen eine geeignete der ersten 4 Spalten (x7 bis x10 ) austauschen kann. Die größte (positive) Zahl der x1 -Spalte steht an der zweiten Stelle, so dass man die x1 -Spalte gegen die x8 -Spalte austauschen muss: x7 x1 x9 x10 x8 x2 x3 1 4 0 0 0 8 2 0 9 0 0 1 17 5 0 6 1 0 0 12 7 0 2 0 1 0 5 1

x4 x 5 x6 10 6 4 25 12 7 12 7 5 6 3 1

a a a a

Multiplikation der ersten, dritten und vierten Zeile mit 9 bzw. 3 liefert x7 9 0 0 0

x1 x9 x10 x8 36 0 0 0 9 0 0 1 18 3 0 0 18 0 9 0

x2 x3 72 18 17 5 36 21 45 9

x4 90 25 36 54

x5 x 6 54 36 9a 12 7 a 21 15 3a 27 9 9a


176

Subtraktion des 4-fachen bzw. 2-fachen der zweiten Zeile von der ersten bzw. dritten und vierten Zeile ergibt x7 x1 x9 x10 x8 x2 x3 x4 x5 x6 9 0 0 0 −4 4 −2 −10 6 8 5a 0 9 0 0 1 17 5 25 12 7 a 0 0 3 0 −2 2 11 −14 −3 1 a 0 0 0 9 −2 11 −1 4 3 −5 7a Mit x1 = (a − x8 − 17x2 − 5x3 − 25x4 − 12x5 − 7x6 ) : 9 ist Z = (−2a − 2x2 + x3 + 5x4 − 12x5 + 5x6 + 2x8 ) : 9. Damit hat sich das Schema x7 x1 x9 x10 9 0 0 0 0 9 0 0 0 0 3 0 0 0 0 9

x8 x2 x3 x4 x5 x6 −4 4 −2 −10 6 8 5a 1 17 5 25 12 7 a −2 2 11 −14 −3 1 a −2 11 −1 4 3 −5 7a 2/9 −2/9 1/9 5/9 −4/3 5/9 −2a/9

ergeben. Jetzt sind nur noch zwei Formkoeffizienten negativ. F¨ ur die neue Ecke x(1) gilt x2 = x3 = x4 = x5 = x6 = x8 = 0 und (1)

1 9

(1)

4 9

(1)

6 9

(1)

2 9

x1 = a, x7 = a − a, x9 = a − a, x10 = a − a, sie ist also

1 5 3 7 a, 0, 0, 0, 0, 0, a, 0, a, a , 9 9 9 9 2 9

und Z hat in dieser Ecke den Wert − a. Nun muss man die x2 -Spalte oder die x5 -Spalte gegen die x1 -Spalte austauschen; wir betrachten die zweite Möglichkeit. Es ergibt sich: x7 x5 x9 x10 x8 x2 x3 x4 x1 x6 18 0 0 0 −9 −11 −9 −45 −9 9 9a 0 12 0 0 1 17 5 25 9 7 a 0 0 12 0 −7 25 49 −31 9 11 5a 0 0 0 36 −9 27 −9 −9 −9 −27 −21a Mit x5 = (a − x8 − 17x2 − 5x3 − 25x4 − 9x1 − 7x6 ) : 12 ist Z = (−3a + 9x1 + 15x2 + 6x3 + 29x4 + 12x6 + 3x8 ) : 9. 1

Jetzt sind alle Formkoeffizienten positiv und wir haben das Minimum − a 3 von Z erreicht. Der maximale Gewinn (vgl. Aufgabenstellung) ist also 9600,–. F¨ ur die Ecke x(2) , in welcher das Minimum von Z angenommen wird, gilt

VIII.2 Das Simplexverfahren (2)

(2)

(2)

177

(2)

(2)

(2)

x1 = x2 = x3 = x4 = x6 = x8 = 0. Man wird also nur Artikel 5 hera stellen, und zwar = 2400 St¨ uck. (Maschine M2 läuft täglich 8 Std, Maschinen 12 M1 , M3 , M4 laufen täglich 4 Std., 4 Std.40 min bzw. 2 Std.) Dieses Resultat hätte man vielleicht auch ohne große Rechnung an der Tabelle bei der Aufgabenstellung ablesen können, es kam hier aber nur darauf an, die Systematik des Eckenaustauschens an einem rechnerisch einfachen Beispiel darzustellen. In der Praxis sind solche Aufgaben in der Regel derart rechenaufwendig, dass man sie sinnvollerweise auf einem elektronischen Rechner programmiert.

Aufgaben 1. a) Man bestimme die Ecken der zulässigen Menge M für ⎛

⎞

⎛

⎞

1 −2 1 0 0 2 ⎜ ⎜ ⎟ 1 0 1 0 ⎟ A = ⎝ −2 ⎠, b = ⎝ 2 ⎠ 1 1 0 0 −1 1 b) Man bestimme in a) die Menge der Minimalpunkte f¨ ur (1) Z = −x1 +4x2

(2) Z = x1 +x2

(3) Z = −x1 +2x2

(4) Z = −x1 +x2 .

2. Man zeige, dass die lineare Optimierungsaufgabe mit ⎛

1 A=⎝ 0 0

0 1 0

0 0 1

−2 −1 1

1 1 0

⎞ ⎛ ⎞ 2 3 ⎠ −2 , b = ⎝ 3 ⎠, −1 0

−x4 + x5 − x6 − 3 minimal!

keine Lösung hat. Man bestimme Z = ax4 + bx5 + cx6 so, dass genau eine bzw. unendlich viele Lösungen existieren.

3. Man behandele die Optimierungsaufgabe ⎧ ⎪ ⎨

⎫

⎪ x1 + x2 + x3 ≤ 7 ⎬ 2x1 + x2 + x3 ≤ 8 , x1 , x2 , x3 ≥ 0, Z = 2x1 + 3x2 + 5x3 maximal! ⎪ ⎪ ⎩ 4x1 + x2 + 2x2 ≤ 12 ⎭

(vgl. Beispiel 2 in VIII.1) jeweils mit den Startecken (1,4,2,0,0,0), (0,2,5,0,1,0), (0,0,6,1,2,0), (0,0,0,7,8,12).

4. Ein Rohstoff (z.B. Heizöl) werde in m Hauptlagern mit den Kapazitäten ai (i = 1, 2, . . . , m) vorgehalten und von n Zwischenlagern mit den Bedarfsmengen bj (j = 1, 2, . . . , n) nachgefragt. Die Transportkosten vom Hauptlager i zum Zwischenlager j betragen cij pro Mengeneinheit. Es ergibt sich die Frage, wie man die vom Hauptlager i zum Zwischenlager j zu transportierenden Mengen xij wählen muss, damit die Gesamttransportkosten minimal sind. Man schreibe dieses lineare Transportproblem in der Standardform einer linearen Optimierungsaufgabe.

Analysis

IX Folgen reeller Zahlen IX.1 Grundlegende Begriffe und Beispiele Wir setzen den Umgang mit reellen Zahlen zunächst als bekannt voraus. Dass der Begriff der reellen Zahl durchaus Probleme birgt, werden wir erst in Abschnitt IX.5 genauer untersuchen. Die Menge der reellen Zahlen bezeichnen wir, wie u ¨blich, mit IR. Die darin enthaltene Menge der rationalen Zahlen (Quotienten aus ganzen Zahlen) bezeichnet man u ¨blicherweise mit Q. Diese enthält die Menge ZZ der ganzen Zahlen {0, 1, −1, 2, −2, . . .} und diese wiederum die Menge IN der nat¨ urlichen Zahlen {1, 2, 3, . . .}. Die Menge IN ∪ {0} = {0, 1, 2, 3, . . .} bezeichnen wir mit IN0 . Eine Abbildung, die jeder Zahl aus IN oder IN0 eine reelle Zahl zuordnet, nennt man eine Folge reeller Zahlen. Man schreibt n → an , wenn der Zahl n aus IN oder aus IN0 die reelle Zahl an zugeordnet ist. Wir wollen die Folge dann kurz in der Form (an )IN bzw. (an )IN0 schreiben, bzw. noch k¨ urzer in der Form (an ), wenn klar oder irrelevant ist, ob der Index n ab 0 oder ab 1 läuft. Die Folgen (an )IN und (an+1 )IN0 muss man nicht unterscheiden, beide beginnen mit a1 , a2 , . . . . Ebenso muss man (an )IN0 und (an−1 )IN nicht unterscheiden, beide beginnen mit a0 , a1 , . . .. Es ist also kein Problem, bei einer Folge vom Anfangsindex 0 zum Anfangsindex 1u ¨berzugehen oder umgekehrt. Eine Beschreibung der Folge durch Angabe der ersten Glieder, also a1 , a2 , a3 , . . . bzw. a0 , a1 , a2 , a3 , . . . ist nat¨ urlich nur möglich, wenn klar oder ohne Bedeutung ist, wie es bei den P¨ unktchen weitergeht“. ” Besonders u ¨bersichtlich sind Folgen (an ), deren Glieder an explizit durch einen Term mit der Variablen n gegeben sind, etwa an = n2 + 1 (n ∈ IN). Sehr oft sind Folgen rekursiv definiert, d.h., ein Glied der Folge wird mit Hilfe der vorangehenden Glieder berechnet, wenn man das erste Glied oder die ersten Glieder kennt. Viele wichtige Folgen können weder durch einen Term noch durch ein Rekursion definiert werden, z. B. die Folge (an ) mit an = nte Primzahl. Die Menge aller Folgen reeller Zahlen bezeichnen wir je nach Anfangsindex mit F oder mit F0 . Beispiel 1: Leonardo von Pisa (etwa 1170–1240), der auch Fibonacci genannt wurde, hat im Jahr 1225 ein Buch mit dem Titel liber quadratorum veröffentlicht, in welchem allerlei interessante Beziehungen zwischen Quadratzahlen untersucht werden. Dabei berechnet er eine Quadratzahl n2 nicht durch Multiplizieren als n mal n“, sondern in der Form 1 + 3 + 5 + 7 + . . . + (2n − 1) = n2 . Er nutzt also ” aus, dass man die n-te Quadratzahl Qn aus der (n − 1)-ten Quadratzahl Qn−1 durch Addition der ungeraden Zahl 2n − 1 gewinnt, also (1)

Qn = Qn−1 + (2n − 1).

Das folgt nat¨ urlich sofort aus der binomischen Formel. Auf diese Art kann man sehr schnell eine Tafel der Quadratzahlen gewinnen, ohne komplizierte Multipli-

IX Folgen reeller Zahlen

182 kationen durchf¨ uhren zu m¨ ussen: - 4

1 +3

- 9

+5

- 16

+7

- 25

+9

- 36

...

+11

Formel (1) beschreibt eine Rekursion f¨ ur die Berechnung der Folge 1, 4, 9, 16, 25, 36, 49, 64, . . . der Quadratzahlen: Kennt man das (n − 1)te Glied dieser Folge, so kann man nach (1) das nte Glied berechnen. Beispiel 2: Ber¨ uhmter als der liber quadratorum ist Fibonaccis liber abbaci aus dem Jahr 1202. Dies ist wohl das großartigste Mathematikbuch des Mittelalters. Die Probleme in den Beispielen 2 und 3 stammen aus diesem Buch. In beiden Aufgaben handelt es sich darum, die Glieder einer Folge rekursiv zu bestimmen. Es geht hier um eine Frage, die in ähnlicher Form schon in Rechenb¨ uchern der Antike gestellt wird: 7 Leute gehen nach Rom. Jeder hat 7 Maultiere, jedes Maultier trägt 7 Säcke, in jedem Sack befinden sich 7 Brote, jedes Brot hat 7 Messer und jedes Messer 7 Scheiden. Gesucht ist die Gesamtzahl an Leuten, Maultieren usw. Man kann nun die Summe 7 + 72 + 73 + 74 + 75 + 76 (= 137 256) durch Addition der Potenzen berechnen, wie es auch Fibonacci zunächst tut. Man kann sie aber auch (mit Fibonacci) folgendermaßen bestimmen, wobei man von rechts nach links rechnet: 7(1 + 7(1 + 7(1 + 7(1 + 7(1 + 7))))). Man rechnet also wie in nebenstehender Tabelle. Die Glieder dieser Folge (bis auf das letzte) ergeben sich nach der Rekursionsvorschrift (2)

an = 7an−1 + 1,

wobei man als Startwert a0 = 1 setzt.

a0 a1 a2 a3 a4 a5 a6

= = = = = = =

1 7a0 + 1 = 7 · 1 + 1 = 8 7a1 + 1 = 7 · 8 + 1 = 57 7a2 + 1 = 7 · 57 + 1 = 400 7a3 + 1 = 7 · 400 + 1 = 2801 7a4 + 1 = 7 · 2801 + 1 = 19 608 7a5 = 7 · 19 608 = 137 256

Beispiel 3: Die zweite Aufgabe aus dem liber abbaci von Fibonacci ist die ber¨ uhmte Kaninchenaufgabe: Wie viele Kaninchenpaare stammen am Ende eines Jahres von einem Kaninchenpaar ab, wenn jedes Paar, beginnend am Ende des zweiten Lebensmonats, jeden Monat ein neues Paar gebiert? Bezeichnen wir zu Ehren Fibonaccis mit Fn die Anzahl der Kaninchenpaare nach n Monaten, so ist F0 = F1 = 1 und (3)

Fn = Fn−1 + Fn−2

f¨ ur n = 2, 3, . . . . Die Rekursion (3) mit den genannten Startwerten beschreibt die Folge der Fibonacci-Zahlen. Hier benötigt man zur Berechnung eines Folgenglieds die beiden vorangehenden Folgenglieder:

IX.1 Grundlegende Begriffe und Beispiele

183

n 0 1 2 3 4 5 6 7 8 9 10 11 12 13 . . . Fn 1 1 2 3 5 8 13 21 34 55 89 144 233 377 . . . Um das Wachstum der Fibonacci-Folge beurteilen zu können, betrachten wir f¨ ur n ≥ 1 die Quotienten aufeinanderfolgender Glieder, also an = Es ist a0 = 1 und

Fn+1 Fn + Fn−1 Fn−1 1 = =1+ =1+ . Fn Fn Fn Fn Fn−1 an = 1 +

(4)

1 an−1

f¨ ur n ater sehen, dass sich diese Zahlen immer mehr der Zahl √ ≥ 1. Wir werden sp¨

1+ 5 nähern, welche als Verhältnis des Goldenen Schnitts eine große Rolle in 2

der Geometrie und in der Kunst spielt.

Beispiel 4: In der √ bekannten wird mit Hilfe des Satzes von Py√ √ Wurzelschnecke √ √ thagoras die Folge 1, 2, 3, 4, 5, . . . konstruiert (Fig. 1). Auch hier liegt eine Rekursion vor; diese könnte man folgendermaßen arithmetisch beschreiben: a1 = 1 und (5) an = a2n−1 + 1 f¨ ur n ≥ 2. Selbstverständlich ist an =

√ n,

die Glieder dieser Folge lassen sich also explizit“ in Abhängigkeit vom Folgenin” dex n angeben. .......................1...........................1 .......... ....1......... ... . . . . . . . ........ .√ .. ....... . . . . . . 1..... ... √ .. 7 ..√ .... ........1. . . . . . ..... . . 8 . . . . . . . .. √ ..... . .... √ ... 6 .. ....9 . . .. ... .......... ... ........ 5 .... . . . . . . . . . . ..... . . .... ..... . . . . . . .... .... ... ... ........ 1... . √.... .1... .... .. √ ....... .... .. .. ...... ............... 10 .............. 4 ...... ... .. . ...... ........... ....... . . . . . . . . . . . . . . ... ................ ..... ... . . ..... ........... ... ............ √ . . . . . . . . . . . . . . . . . . . . . . . . . . . ... 1 √ ................................................................................ 11 1 ..... .. 3.................................... .. ............................................. ... √.................................... .... .......................√ √ ...... ....... . . . . ... . . ...... 12 ...... ..2...... ........ 1 .. ...... ... . . 1 .............................. 1 Fig. 1: Wurzelschnecke


184 Beispiel 5: Bekanntlich ist

√

a

2 keine rationale Zahl, d.h., es existiert kein Bruch b √ √ a (a, b nat¨ urliche Zahlen) mit 2 = . Nun kann man aber versuchen, 2 möglichst b √ √ gut durch Bruchzahlen anzunähern. Wegen ( 2 + 1)( 2 − 1) = 1 ist √

√ 1 1 √ =1+ 2 = 1 + ( 2 − 1) = 1 + √ 2+1 2 + ( 2 − 1) 1 = 1+ =1+ 1 √ 2+ 2+ 2 + ( 2 − 1) 2+

1 1 1 √ 2 + ( 2 − 1)

usw. Die Folge (an ) mit a0 = 1 und der Rekursionsvorschrift an = 1 +

(6)

1 1 + an−1

√ 3 7 17 41 99 , , , . . .. Sie schachtelt die Zahl 2 ein: 2 5 12 29 70

f¨ ur n = 1, 2, 3, . . . beginnt mit 1, , ,

√ 41 17 3 99 7 < < ... 2... < < < . 5 29 70 12 2 √ Der Abstand der Folgenglieder zu 2 kann beliebig klein gemacht werden, wenn man nur in der Folge hinreichend weit geht. Dieses Beispiel lässt schon erkennen, wie man irrationale Zahlen durch Folgen rationaler Zahlen bestimmen kann. √ Beispiel 6: Weitaus komplizierter als bei 2 liegt der Fall bei der Kreiszahl π, ¨ welche den Inhalt eines Kreises vom Radius 1 angibt. Im alten Agypten benutzte 1
1 + nx f¨ ur alle x ∈ IR mit x > −1, x = 0 f¨ ur alle n ∈ IN mit n ≥ 2 gilt. F¨ ur n = 2 ist die Behauptung richtig, denn wegen x = 0 ist x2 > 0 und daher (1 + x)2 = 1 + 2x + x2 > 1 + 2x. Nun folgt der Induktionsschritt: (1 + x)n+1 = > = >

(1 + x)(1 + x)n (1 + x)(1 + nx) 1 + (n + 1)x + nx2 1 + (n + 1)x.

In dieser Rechnung folgt die zweite Zeile aufgrund der Induktionsvoraussetzung (1 + x)n > 1 + nx, weil 1 + x > 0 gilt. Die letzte Ungleichung folgt aus x = 0. Beispiel 3: Wir betrachten die Folge (an ), die rekursiv durch

a1 = 1 und an =

an−1 + 5 f¨ ur n ≥ 2

ur alle n ∈ IN gilt: Es definiert ist. Wir wollen zunächst beweisen, dass an < 3 f¨ ist a1 < 3, und aus an < 3 folgt √ √ √ an+1 = an + 5 < 3 + 5 = 8 < 3. √ ur alle n ∈ IN gilt: Es ist a2 = 1 + 5 = Nun √ wollen wir zeigen, dass an+1 > an f¨ 6 > a1 = 1, und aus an+1 > an folgt

an+2 =

an+1 + 5 >

√

an + 5 = an+1 .

IX.3 Das Prinzip der vollständigen Induktion

193

Beispiel 4: Im Spiel Turm von Hanoi soll ein der Größe nach geordneter Stapel von n paarweise verschieden großen Scheiben mit möglichst wenig Z¨ ugen von einer Stange auf eine andere Stange umgesetzt werden, wobei eine dritte Stange als Zwischenstation benutzt werden darf (Fig. 1).

Fig. 1: Turm von Hanoi

Dabei d¨ urfen die Scheiben nur einzeln umgelegt werden, und nie darf eine größere Scheibe auf eine kleinere gelegt werden. Versuche mit 1, 2 oder 3 Scheiben lassen vermuten, dass f¨ ur die Anzahl an der benötigten Z¨ uge gilt: an = 2n − 1. Wir nehmen an, dies sei f¨ ur n Scheiben richtig (Induktionsvoraussetzung) und wollen nun an+1 bestimmen. Zunächst muss man die oberen n Scheiben auf eine andere Stange umsetzen, um die unterste (größte) Scheibe dann auf die dritte Stange legen zu können. Das erfordert an + 1 Z¨ uge. Dann muss man den Turm aus den n kleineren Scheiben auf diese dritte Stange setzen, was wieder an Z¨ uge erfordert. Es ist also an+1 = 2an + 1 und somit an+1 = 2(2n − 1) + 1 = 2n+1 − 1. Die Induktionsbehauptung ist damit bewiesen, es gilt also an = 2n − 1 f¨ ur alle n ∈ IN. (Dies hätte man auch sofort aus der Rekursion a1 = 1 und an+1 = 2an + 1 gewinnen können.) Beispiel 5: Wir wollen zwei Eigenschaften der Folge (Fn ) der Fibonacci-Zahlen beweisen. Diese ist definiert durch F0 = F1 = 1 und Fn = Fn−1 + Fn−2 f¨ ur n ≥ 2. a) Es gilt Σ(Fn ) = (Fn+2 − 1). Beweis: Es ist F0 = 1 = F2 −1 (Induktionsanfang). Aus F0 +F1 +. . .+Fn = Fn+2 −1 folgt F0 + F1 + . . . + Fn + Fn+1 = Fn+2 − 1 + Fn+1 = Fn+3 − 1. Damit ist die Behauptung induktiv bewiesen. 2 b) F¨ ur alle n ∈ IN0 gilt Fn Fn+2 = Fn+1 + (−1)n . 2 + (−1)n folgt Beweis: Es gilt F0 F2 = 2 = F12 + (−1)0 . Aus Fn Fn+2 = Fn+1 2 Fn+1 Fn+3 = Fn+1 (Fn+2 + Fn+1 ) = Fn+1 Fn+2 + Fn+1 n = Fn+1 Fn+2 + Fn Fn+2 − (−1) = (Fn+1 + Fn )Fn+2 + (−1)n+1 2 = Fn+2 + (−1)n+1 .

Damit ist die Behautung induktiv bewiesen.


194

Aufgaben 1. Man beweise mit vollständiger Induktion: a) F¨ ur alle n ∈ IN mit n ≥ 3 gilt 2n + 1 < 2n . b) F¨ ur alle n ∈ IN mit n ≥ 4 gilt n3 < 3n . c) F¨ ur alle n ∈ IN gilt: 23n − 1 ist durch 7 teilbar. d) F¨ ur alle n ∈ IN gilt: 10n + 3 · 4n+2 + 5 ist durch 9 teilbar. √

2. Man beweise: Für die Folge (an ) mit a0 = 3 und an = an−1 + 5 gilt an > 2 und an+1 < an

f¨ ur alle n ∈ IN0 .

3. Man suche eine explizite Darstellung für (an ) und beweise die Richtigkeit mit vollständiger Induktion: a) a1 = 1, an+1 = an + 4n;

b) a1 = 1, a2 = 3, an+2 = 3an−1 + 2.

4. Man beweise, dass eine Kreisscheibe durch n geradlinige Schnitte in höchs1

tens 1 + n(n + 1) Teile zerlegt werden kann ( Pfannkuchenproblem“). 2 ”

5. In dieser Aufgabe handelt es sich um Folgen aus F. Man beweise einmal mit vollständiger Induktion und einmal mit Hilfe des Operators Δ:

a) Σ

1 (2n − 1)(2n + 1)

2

c) Σ((2n − 1) ) =

=

n ; 2n + 1

n

b) Σ n

1 2

= 2−

n+2 ; 2n

n(4n2 − 1) . 3

6. In dieser Aufgabe handelt es sich um Folgen aus F0 . Man beweise einmal mit vollständiger Induktion und einmal mit Hilfe des Operators Δ: n

a) Σ(q ) =

1 − q n+1 1−q

n

b) Σ(nq ) =

f¨ ur q = 1;

q − (1 + n(1 − q))q n+1 (1 − q)2

f¨ ur q = 1.

7. Man beweise die folgenden Eigenschaften der Folge der Fibonacci-Zahlen: a) ggT(Fn , Fn+1 ) = 1

8. Man zeige, dass durch Fn =

b) Σ(Fn2 ) = (Fn Fn+1 ) 1 √ 5

√ n+1 √ n+1 1− 5 1+ 5 − eine ex2 2

plizite Darstellung der Folge der Fibonacci-Zahlen gegeben ist. (Hinweis: Man zeige, dass die angegebene Folge der Fibonacci-Rekursion gen¨ ugt.)

IX.4 Arithmetische, geometrische und harmonische Folgen

195

IX.4 Arithmetische, geometrische und harmonische Folgen Von besonderem Interesse sind Folgen reeller Zahlen, bei denen sich die einzelnen Glieder als Mittelwert ihrer beiden Nachbarglieder ergeben. Nun benutzt man im täglichen Leben verschiedene Mittelwertbildungen, welche verschiedenen Sachzusammenhängen angepasst sind (mittleres Gewicht, mittlerer Zinsfaktor, mittlere Geschwindigkiet usw.). Am bekanntesten sind das arithmetische, das geometrische und das harmonische Mittel. • Das arithmetische Mittel der Zahlen a, b ist die Zahl A(a, b) =

a+b . 2

• Das geometrische Mittel der positiven Zahlen a, b ist die Zahl G(a, b) =

√

• Das harmonische Mittel der positiven Zahlen a, b ist die Zahl H(a, b) = 1 a

Das harmonische Mittel ist also der Kehrwert des arithmetischen Mittels der Kehrwerte der beiden Zahlen. F¨ ur zwei verschiedene positive Zahlen a, b gilt H(a, b) < G(a, b) < A(a, b), wie man leicht nachrechnet und mit Hilfe des Höhensatzes und des Kathetensatzes veranschaulichen kann (Fig. 1).

H(a, b) H SH

ab . 2 +

1. b

A(a, b)

S H H jS HH HH S G(a, b) HH . S . PP HH .. qSS q P . .. HH S HH ......... S q . H S a - b

Fig. 1: Mittelwerte

Eine Folge heißt eine arithmetische, geometrische bzw. harmonische Folge, wenn jedes Glied außer dem ersten das arithmetische, geometrische bzw. harmonische Mittel seiner beiden Nachbarglieder ist. Bei geometrischen und harmonischen Folgen m¨ ussen dabei die Glieder positiv sein. Ist (an ) eine arithmetische Folge und d = a1 − a0 , dann ist an = an−1 + d und an = a0 + nd f¨ ur alle n ∈ IN. Dies beweist man durch vollständige Induktion. Der Induktionsschritt sieht bei der ersten Behauptung folgendermaßen aus: a + an−1 Wegen n+1 = an und an−1 = an − d gilt an+1 = 2an − (an − d) = an + d. 2 Die zweite Behauptung folgt aus an+1 = an + d = (a0 + nd) + d = a0 + (n + 1)d. Eine arithmetische Folge hat also eine besonders einfache Differenzenfolge: Δ(a0 + nd) = (d). Jetzt sei (gn ) eine geometrische Folge und q =

g1 , also g1 = g0 · q. Dann ist g0

gn = gn−1 · q und gn = g0 · q n f¨ ur alle n ∈ IN (vollständige Induktion). Definiert man die geometrische Folge in dieser Form anstatt mit Hilfe des geometrischen Mittels, dann d¨ urfen g0 und q auch negative Zahlen sein.


196 Ist (hn ) eine harmonische Folge und D =

gilt hn =

1 hn−1

−1

+D

und hn =

eine arithmetische Folge ist.

1 1 − , also h1 = h1 h0 −1

1 + Dn h0

1 +D h0

−1

, dann

. Dies folgt daraus, dass

1 hn

Das einfachste Beispiel einer arithmetischen Folge ist (n), also die Folge der nat¨ urlichen Zahlen selbst. Das einfachste Beispiel einer harmonischen Folge ist 1 . die Folge der Kehrwerte der nat¨ urlichen Zahlen, also n

Die konstante Folge (c) mit c = 0 ist ein Sonderfall einer arithmetischen, geometrischen und harmonischen Folge. Es sei (an ) eine arithmetische Folge, also an = a0 +nd. Ist d > 0, dann u ¨bertreffen S − a0 ist die Folgenglieder jede vorgegebene positive Schranke S, denn f¨ ur n > d a0 + dn > S. Ist d < 0, dann unterschreiten die Folgenglieder jede vorgegebene negative Schranke. Die Glieder der Summenfolge sind einfach zu berechnen:

Σ(an ) = a0 Σ(1) + d Σ(n) = a0 (n + 1) + d

n(n + 1) . 2

Man nennt die Folge Σ(an ) zuweilen auch eine arithmetische Reihe. Ist (gn ) eine geometrische Folge, also gn = g0 · q n , und ist g0 = 0 und |q| > 1, dann wachsen die Zahlen |gn | mit wachsendem Index u ¨ber jede vorgegebene Schranke S > 0 hinaus: log S − log |g0 | |g0 · q n | > S ⇐⇒ n > . log |q| (Wir nehmen an, dass der Leser mit der Logarithmusfunktion vertraut ist; trotzdem wird diese später noch Gegenstand unserer Betrachtungen sein. Wer sich daran stört, dass hier die Basis des Logarithmus nicht angegeben worden ist, beachte, dass sich diese in obigem Zusammenhang herausk¨ urzt: Es gilt loga x = logb x·loga b f¨ ur je zwei Basen a, b.) Ist 0 < |q| < 1, dann nähern sich die Glieder der Folge (gn ) mit wachsendem n immer stärker der Zahl 0, d.h., |gn | wird kleiner als jede (noch so kleine) vorgegebene positive Zahl ε, wenn n hinreichend groß wird: |g0 · q n | < ε ⇐⇒ n >

log ε − log |g0 | . log |q|

(Man beachte dabei, dass log x < 0 f¨ ur 0 < x < 1 gilt.) Zur Berechnung der Glieder der Summenfolge von (gn ) gen¨ ugt es wegen Σ(gn ) = g0 Σ(q n ), die Folge n (q ) zu betrachten. F¨ ur q = 1 ist das Problem trivial, so dass wir q = 1 annehmen. F¨ ur sn = 1 + q + q 2 + . . . + q n gilt qsn = q + q 2 + q 3 . . . + q n+1 = sn − 1 + q n+1 , also (q − 1)sn = q n+1 − 1

und somit

sn =

q n+1 − 1 . q−1

IX.4 Arithmetische, geometrische und harmonische Folgen Wir erhalten also f¨ ur q = 1 das Ergebnis

n

Σ(q ) =

197

q n+1 − 1 . q−1

F¨ ur |q| > 1 wachsen die Glieder dieser Folge betragsmäßig u ¨ber jede Schranke 1 . Man nennt die Folge Σ(gn ) hinaus, f¨ ur |q| < 1 nähern sie sich dem Wert 1−q

zuweilen eine geometrische Reihe.

Nun betrachten wir die die Summenfolge einer harmonischen Folge (hn ), wobei 1 wir uns aber auf den Fall h0 = 0, D = 1 beschränken, also auf den Fall hn = f¨ ur n n ∈ IN. Offensichtlich unterscheiden sich die Glieder mit wachsendem n immer 1 weniger von 0. Interessant ist das Wachstum der Summenfolge Σ . Diese n

spezielle Folge heißt harmonische Reihe. Es gilt 1 1 + 3 4 1 1 1 1 + + + 5 6 7 8 1 1 1 1 1 1 1 1 + + + + + + + 9 10 11 12 13 14 15 16

1 4 1 > 4· 8 1 > 8· 16 > 2·

= = =

1 2 1 2 1 2

und allgemein f¨ ur k ∈ IN 1 1 1 1 1 + + . . . + k+1 > 2k · k+1 = . 2k + 1 2k + 2 2 2 2 Daher gilt f¨ ur k ∈ IN 1+

1 1 1 1 1 k+3 + + . . . + k+1 > 1 + + k · = . 2 3 2 2 2 2

Daran erkennt man, dass die Folge Σ

1 unbeschränkt wächst. n

In obigen Betrachtungen traten häufig Summen von aufeinanderfolgenden Gliedern einer Folge (xn ) auf. Hierf¨ ur wollen wir eine Bezeichnung unter Verwendung des Summenzeichens Σ benutzen: F¨ ur m ≤ k sei k i=m

xi = xm + xm+1 + . . . + xk

(gelesen Summe xi von i = m bis k“). Dann ist ” n (xn )IN0 = xi i=0

Man findet hierf¨ ur auch die Bezeichnung

∞

i=0

.

IN0

xi , diese wollen wir aber hier noch

vermeiden; sie wird später f¨ ur den Grenzwert der Folge

(xn ) benutzt.


198

Aufgaben 1. Man zeige, dass keine nicht-konstante Folge existiert, welche zwei der Eigenschaften arithmetisch, geometrisch, harmonisch besitzt.

2. Man bestimme jeweils eine Funktion f , so dass gilt: 1) 2) 3) 4) 5) 6)

(an ) (an ) (an ) (an ) (an ) (an )

arithmetisch ⇒ (f (an )) geometrisch geometrisch ⇒ (f (an )) arithmetisch arithmetisch ⇒ (f (an )) harmonisch harmonisch ⇒ (f (an )) arithmetisch geometrisch ⇒ (f (an )) harmonisch harmonisch ⇒ (f (an )) geometrisch

3. Man bestimme s ∈ IR, n0 ∈ IN so, dass |s − sn | < 10−6 für alle n > n0 gilt: a) sn =

n i 2 i=0

3

b) sn =

n

12 · 0,95i

i=0

IX.5 Arithmetische Folgen h¨ oherer Ordnung Genau dann ist (an ) eine arithmetische Folge, wenn Δ(an ) eine konstante Folge ist. Bei der Folge (n2 ) der Quadratzahlen ist Δ(n2 ) nicht konstant, aber Δ(Δ(n2 )) ist konstant: Δ(Δ(n2 )) = Δ(2n + 1) = (2). Die k-fache Anwendung des Differenzenoperators schreiben wir abk¨ urzend in der Form Δk ; es also Δ2 (n2 ) = (2). Ist f¨ ur eine Folge (an ) Δk (an ) konstant und k kleinstmöglich mit dieser Eigenschaft, so nennt man (an ) eine arithmetische Folge der Ordnung k . Die Folge der Quadratzahlen ist also eine arithmetische Folge zweiter Ordnung. Die Folge der Kubikzahlen ist eine arithmetische Folge dritter Ordnung, denn Δ3 (n3 ) = Δ2 (3n2 + 3n + 1) = Δ(6n + 6) = (6). Eine konstante Folge können wir als eine arithmetische Folge der Ordnung 0 ansehen. Allgemein gilt f¨ ur jedes k ∈ IN Δk (nk ) = (k!) (und damit Δi (nk ) = (0) f¨ ur i > k.) (Dabei ist k! (gelesen k Fakultät“) das ” Produkt der ersten k nat¨ urlichen Zahlen.) Dies beweist man induktiv. Der Induktionsanfang ist klar. Im Induktionsschritt schließen wir von der G¨ ultigkeit f¨ ur

IX.5 Arithmetische Folgen höherer Ordnung

199

ein k ∈ IN auf die G¨ ultigkeit f¨ ur k + 1: Δk+1 (nk+1 ) = Δk (Δ(nk+1 )) = Δk ((n + 1)k+1 − nk+1 ) = Δk ((k + 1)nk + ck−1 nk−1 + . . . + c2 n2 + c1 n + c0 ) mit ganzen Zahlen c0 , c1 , c2 , . . . , ck−1 . (Mit dem binomischen Lehrsatz, den wir weiter unten betrachten werden, kann man diese Zahlen leicht ausrechnen; das ist hier aber nicht notwendig.) Es folgt k−1

Δk+1 (nk+1 ) = (k + 1)Δk (nk ) + Δk (

j=0

cj nj ) = (k + 1)Δk (nk ) +

k−1 j=0

Δk (cj nj ).

ur j < k folgt Aus Δk (nk ) = (k!) (Induktionsvoraussetzung) und Δk (nj ) = (0) f¨ nun Δk+1 (nk+1 ) = ((k + 1)!) (Induktionsbehauptung). Bei diesem Induktionsbeweis treten zwei Fragen auf: 1) Gilt wirklich allgemein Δk ((an ) + (bn )) = Δk (an ) + Δk (bn ) ? 2) Wie stellt man (n + 1)k als Summe von Potenzen von n dar? Die erste Frage ist zu bejahen: Die Verkettung linearer Abbildungen eines Vektorraums in sich ergibt stets wieder eine solche Abbildung. Die zweite Frage f¨ uhrt auf den binomischen Lehrsatz, zu dessen Vorbereitung wir aber erst den Begriff des Binomialkoeffizienten erklären m¨ ussen. F¨ ur i, m ∈ IN0 mit i ≤ m sei

m = Anzahl der i-elementigen Teilmengen einer m-elementigen Menge. i

Man liest dieses Symbol mu ¨ber i“ und nennt es einen Binomialkoeffizient. als m” m = Offensichtlich ist = 1, denn eine m-elementige Menge M enthält m

0

genau eine 0-elementige Teilmenge (nämlich die leere Menge ∅) und genau eine m-elementige Teilmenge (nämlich die Menge M selbst). F¨ ur 0 < i < m gilt

m m m−1 = , i i i−1

wie man folgendermaßen einsieht: Man betrachte alle i-elementigen Teilmengen A von M und pr¨ ufe jeweils f¨ ur alle x ∈ M , ob x ∈ A gilt. Dabei zähle man, wie oft dies geschieht, auf zwei verschiedene Arten:

m Möglichkeiten, bei jeder solchen gibt es dann i m i Möglichkeiten f¨ ur die Wahl von x; insgesamt gibt es also i · Möglichkeiten. i

(1) F¨ ur die Wahl von A gibt es

(2) F¨ ur die Wahl von x gibt es zunächst m Möglichkeiten, f¨ ur jede solche Wahl m−1 mögliche Ergänzungen zu einer i-elementigen Teilmenge A; insgedann i−1

samt gibt es also m ·

m−1 i−1

Möglichkeiten.


200 Aus i ·

m m−1 =m· ergibt sich die oben behauptete Formel. Aus ihr folgt i i−1

m m−1 m−2 m−i+1 · · · ... · i i−1 i−2 1 m! m(m − 1)(m − 2) · . . . · (m − i + 1) = . = i(i − 1)(i − 2) · . . . · 1 i!(m − i)!

m i

=

Nun wollen wir den Term (a + b)m durch Auflösen der Klammern in eine Summe von Potenzprodukten am−i bi (i = 0, 1, . . . , m) verwandeln. seien a, b (Dabei Variable f¨ ur reelle Zahlen.) Der Summand am−i bi tritt genau

m -mal auf. Denn i

er entsteht, wenn man in dem Produkt (a + b)(a + b) · . . . · (a + b) mit m Faktoren aus i der Klammern den Faktor b und aus den ¨brigen den Faktor a wählt, und u m aus den m Klammern kann man auf genau verschiedene Arten i Klammern i

auswählen. Die Formel

m m m m−1 m m−2 2 m m (a + b) = a + a b+ a b + ... + b 0 1 2 m m

bzw. (a + b)m =

m m

am−i bi

i

i=0

heißt binomischer Lehrsatz . Mit seiner Hilfe können wir nun die Glieder der Differenzenfolge von (nk ) schön beschreiben: k

Δ(n ) =

k k i=1

(nk−i ).

i

Man beachte, dass dabei die Summation erst mit dem Index 1 beginnt. Die Berechnung der Binomi1 alkoeffizienten kann man auch 1 1 im sogenannten pascalschen 2 1 1 Dreieck in Fig. 1 vornehmen 3 3 1 1 (nach Blaise Pascal, 1623– 1662): In der m-ten Zeile (m 4 6 4 1 1 = 0, 1, 2, . . . ) stehen der Reihe 5 10 10 5 1 1 q q q q q q q nach die Binomialkoeffizienten m (i = 0, 1, 2, . . . , m). Diese i

Fig. 1: Pascalsches Dreieck

sind so angeordnet, dass in der Mitte unter

m m m+1 und der Binomialkoeffizient steht. Dieser ist die i i+1 i+1

Summe der beiden dar¨ uberstehenden, denn es gilt allgemein (Aufgabe 3)

m+1 m m = + i+1 i i+1

f¨ ur 0 ≤ i < m.

IX.5 Arithmetische Folgen höherer Ordnung

201

Die 5-te Reihe des pascalschen Dreiecks besagt, dass (a + b)5 = a5 + 5a4 b + 10a3 b2 + 10a2 b3 + 5ab4 + b5 . Die arithmetischen Folgen, deren Ordnung höchstens k ist, bilden mit der Addition und der Vervielfachung mit reellen Zahlen einen Vektorraum Ak , und zwar einen Untervektorraum des Vektorraums F0 aller Folgen, denn es gilt Δk ((an ) + (bn )) = Δk (an ) + Δk (bn ), Δk (c(an )) = cΔk (an ) f¨ ur alle Folgen (an ) und alle Zahlen c. Wegen (ni ) ∈ Ak f¨ ur i ≤ k gehört auch jede Linearkombination dieser Folgen zu Ak , also

k

i=0

ci (ni ) ∈ Ak f¨ ur alle

c0 , c1 , c2 , . . . , cn ∈ IR. Jede arithmetische Folge einer Ordnung ≤ k ist auch von dieser Form. Dies folgt f¨ ur i ≤ k durch i-fache Anwendung des Summenoperators auf Δi (an ) = (c) (c ∈ IR). In der Darstellung einer arithmetischen Folge der Ordnung k als Linearkombination der Folgen (1), (n), (n2 ), . . . , (nk ) sind die Koeffizienten eindeutig durch die Folge bestimmt (Aufgabe 5), diese Folgen bilden also eine Basis des Vektorraums Ak . Beispiel 1: Die Summenformel f¨ ur die Quadratzahlen kann man folgendermaßen gewinnen: Weil (n2 ) eine arithmetische Folge der Ordnung 2 ist, ist Σ(n2 ) eine solche der Ordnung 3. Also ist f¨ ur alle n ∈ IN n

i2 = an3 + bn2 + cn + d

d a+b+c+d 8a + 4b + 2c + d 27a + 9b + 3c + d

i=1

mit gewissen Zahlen a, b, c, d. Diese bestimmt man aus dem nebenstehenden linearen Gleichungssystem, welches man f¨ ur n = 0, 1, 2, 3 erhält. 1

1

= 0 = 1 = 5 = 14

1

Dieses Gleichungssystem hat die Lösung a = , b = , c = , d = 0, womit sich 3 2 6 die bekannte Summenformel ergibt. Beispiel 2: Besonders interessante arithmetische Folgen höherer Ordnung sind die Folgen der Polygonalzahlen (k-Ecks-Zahlen), von denen schon die Philosophen im alten Griechenland fasziniert waren. Polygonalzahlen sind nat¨ urliche Zahlen, die sich durch besonders regelmäßige Punktmuster darstellen lassen (Aufgabe 7). Die Folge (Pn(k) ) der k-Eckszahlen (k = 3, 4, 5, . . .) ist definiert durch (k)

P1

= 1,

(k)

P2

=k

und Δ2 (Pn(k) ) = (k − 2).

Setzt man Pn(k) = an2 + bn + c, dann erhält man f¨ ur n = 0, 1, 2 die Gleichungen k k − 2 . Es c = 0 und a + b = 1, 4a + 2b = k und daraus a = − 1 und b = − ist also

Pn(k)

=

k k − 1 n2 − − 2 n. 2 2

2

2


202

F¨ ur die Pythagoräer (Anhänger der Philosophie des Pythagoras) stellten die Polygonalzahlen ein Bindeglied zwischen Geometrie und Arithmetik dar, und sie machten sie zum Mittelpunkt einer kosmischen Philosophie“, die alle Beziehun” gen durch Zahlen“ ausdr¨ ucken will ( Alles ist Zahl“). Auf Pierre de Fermat ” ” (1601–1665) geht die Vermutung zur¨ uck, dass man jede nat¨ urliche Zahl als Summe von höchstens drei Dreickszahlen, höchstens vier Viereckszahlen, höchstens f¨ unf F¨ unfeckszahlen und allgemein als Summe von höchstens k k-Eckszahlen darstellen kann. Erst Augustin Louis Cauchy (1789–1857) konnte dies beweisen.

Aufgaben 1. Man berechne mit Hilfe des binomischen Lehrsatzes 1034 und 9983 . 2. Man beweise: Jede endliche nichtleere Menge besitzt ebenso viele Teilmengen mit gerader wie mit ungerader Elementeanzahl.

3. Man beweise:

m m = , i m−i

m+1 m m = + i+1 i i+1

f¨ ur i < m.

4. Man zeige, dass die Darstellung einer arithmetischen Folge der Ordnung k als Linearkombination der Folgen (1), (n), (n2 ), . . . , (nk ) eindeutig ist.

5. Es sei (Dn ) die Folge der Dreieckszahlen. Man beweise: Σ(Dn ) = 6. Man beweise, dass für k = 1, 2, 3 gilt: Σk (1) = Man beweise dann mit vollständiger Induktion, dass dies f¨ ur alle k ∈ IN gilt.

7. Fig. 2 zeigt den Anfang der Folge (Dn ) der Dreieckszahlen, Folge (Qn ) der Viereckszahlen, Folge (Fn ) der F¨ unfeckszahlen

(Dn ),

(Qn ),

(Fn )

jeweils eine explizite Darstellung durch einen Term mit der Variablen n an.

n+k k

n+2 . 3

.

u

u u u

u u u u u u

u

u u u u

u u u u u u u u u

u u u u u

u u u u u u u u u u u u

(vgl. Beispiel 2) als Punktmuster. Man gebe f¨ ur die Summenfolgen

u

Fig. 2: 3-, 4- und 5-Ecks-Zahlen

8. Man zeige, dass man die k-Eckszahlen folgendermaßen darstellen kann: Pn(k) = (k − 2)Dn − (k − 3)n =

n ((k − 2)n − k + 4) 2

IX.6 Konvergente Folgen

203

IX.6 Konvergente Folgen Die Definition einer Folge (an ) als eine Abbildung von IN0 in IR ist derart allgemein, dass man nicht sehr viele tiefsinnige Aussagen u ¨ber Folgen machen kann, wenn man nicht Folgen mit besonderen Eigenschaften betrachtet. Solche besonderen Eigenschaften, mit denen wir uns nun beschäftigen wollen, sind die Beschränktheit, die Monotonie und vor allem die Konvergenz. Definition 1: Eine Folge (an ) heißt beschränkt, wenn es eine Zahl R > 0 mit ur alle n ∈ IN0 |an | ≤ R f¨ gibt. Gilt f¨ ur eine Zahl S bzw. f¨ ur eine Zahl T an ≤ S

f¨ ur alle n ∈ IN0

an ≥ T

bzw.

f¨ ur alle n ∈ IN0 ,

so heißt die Folge nach oben beschränkt bzw. nach unten beschränkt. Eine beschränkte Folge ist sowohl nach oben als auch nach unten beschränkt, ur alle n ∈ IN0 folgt −R ≤ an ≤ R f¨ ur alle n ∈ IN0 . denn aus |an | ≤ R f¨ Sind die Folgen (an ) und (bn ) beschränkt, dann gilt dies auch f¨ ur die Folgen (an ) + (bn ), (an ) · (bn ), c(an ) (c ∈IR) (Aufgabe 1). Definition 2: Eine Folge (an ) heißt monoton wachsend bzw. fallend , wenn an ≤ an+1

f¨ ur alle n ∈ IN0

an ≥ an+1

bzw.

f¨ ur alle n ∈ IN0 .

Gilt dabei nie das Gleichheitszeichen, dann heißt die Folge streng monoton wachsend bzw. fallend. n n 4 4 ist beschränkt: Es gilt 0 < N1 folgt a − 1 < an < a + 1 f¨ ur n > N1 , also |an | ≤ max(|a0 |, |a1 |, . . . , |aN1 |, |a| + 1).

hier höchstens endlich viele Glieder @ R @ .......s.......s.......s......s.....s.....s[....s....s....s...s...s..s..s...s..s.ssssssss ......................].....s.....s......s.......s.......s....

a−

6

a

a+

6

hier fast alle Glieder

Fig. 1: Zum Begriff der Konvergenz

Satz 1: Sind die Folgen (an ) und (bn ) konvergent, dann sind auch die Folgen (an ) + (bn ) und (an ) · (bn ) konvergent und es gilt lim((an ) + (bn )) = lim(an ) + lim(bn ), lim((an ) · (bn )) = lim(an ) · lim(bn ). ur jedes ε > 0 existieren also Beweis: Es sei lim(an ) = a und lim(bn ) = b. F¨ nat¨ urliche Zahlen Nε(1) , Nε(2) mit ur n ≥ Nε(1) |an − a| < ε f¨

und |bn − b| < ε f¨ ur n ≥ Nε(2) .

F¨ ur n ≥ max(Nε(1) , Nε(2) ) gilt dann |(an + bn ) − (a + b)| = |(an − a) + (bn − b)| ≤ |an − a| + |bn − b| < ε + ε = 2ε und |an bn − ab| = ≤ = ≤

|an bn − abn + abn − ab| |an bn − abn | + |abn − ab| |bn ||an − a| + |a||bn − b| |bn |ε + |a|ε = (|bn | + |a|)ε ≤ Kε,

wobei K eine obere Schranke f¨ ur |bn | + |a| ist. Da die Zahlen 2ε und Kε mit ε ebenfalls beliebig kleine Werte annehmen können, ergibt sich die Behauptung. 2 Die Menge C der konvergenten Folgen aus F0 bildet bez¨ uglich der Addition und der Multiplikation einen Ring, also einen Teilring von (F0 , +, ·). Wegen lim(c(an )) = c lim(an ) f¨ ur alle c ∈ IR und alle (an ) ∈ C bildet C bez¨ uglich der Addition und der Vervielfachung mit reellen Faktoren einen Vektorraum, also einen Untervektorraum des Vektorraums aller Folgen. Hat kein Glied der Folge (an ) den Wert 0, dann kann man die Kehrfolge

1 an

bilden. Ist dabei die Folge (an ) konvergent und ist a := lim(a n ) = 0, dann gilt lim

1 an

=

1 ; dies ergibt sich sofort aus der Beziehung lim(an )

1 |a − an | 1 a − a = |aa | . n n


206

Beispiel 5: F¨ ur |q| < 1 gilt offensichtlich (vgl. Beispiel 1): lim (q n ) = 0 und

lim

qn =

1 . 1−q

Beispiel 6: Es gilt

(n + 1)(2n + 1) lim n2

Beispiel 7: Die Folge

(−1)n−1 n

1 1 · 2+ n n 1 1 = 1 + lim · 2 + lim n n = (1 + 0) · (2 + 0) = 2. = lim

1+

ist konvergent, was wir aber erst im folgenden

Abschnitt beweisen. Man sieht leicht, dass sie beschränkt ist: F¨ ur n ≥ 2k gilt n (−1)i−1 i=1

i

1 1 1 1 1 − − + + ... + 2 3 4 2k − 1 2k 1 1 1 1 1 1 ≤ 1− + + ... + = 1 − < 1. − − 2 2 3 k−1 k k ≤

1−

Eine Folge mit dem Grenzwert 0 nennt man eine Nullfolge. Die Menge N der Nullfolgen bildet einen Teilring des Rings der konvergenten Folgen und einen Untervektorraum des Vektorraums der konvergenten Folgen. Ferner gilt: Satz 2: Das Produkt einer Nullfolge mit einer beschränkten Folge ist wieder eine Nullfolge. Beweis: Es sei (an ) eine Nullfolge und (bn ) eine beschränkte Folge mit der Schranke S. F¨ ur eine gegebenes positives ε existiert ein Nε ∈ IN mit |an | < ε f¨ ur n ≥ Nε . Dann ist |an bn | < Sε f¨ ur n ≥ Nε . 2 Ist Σ(an ) konvergent, dann ist (an ) eine Nullfolge (Aufgabe 3). Ist jedoch (an ) eine Nullfolge, dann muss Σ(an ) nicht konvergent sein, wie man am Beispiel der harmonischen Reihe Σ

1 n

erkennt (vgl. Beispiel 4).

Ist (an ) konvergent, dann ist auch die Folge der Beträge (also (|an |)) konvergent. F¨ ur Nullfolgen ist dies unmittelbar klar, f¨ ur eine Folge (an ) mit dem Grenzwert a argumentiert man folgendermaßen: Ist a > 0, dann existiert ein N ∈ IN mit a |an − a| < f¨ ur n ≥ N . Die Glieder der Folge sind daher ab dem Index N positiv, 2 also |an | = an f¨ ur n ≥ N. F¨ ur einen negativen Grenzwert argumentiert man analog. Ist aber umgekehrt (|an |) konvergent, dann muss (an ) nicht konvergent sein; ein Beispiel hierf¨ ur ist die Folge ((−1)n ). Aus der Konvergenz n ) folgt nicht die Konvergenz von Σ(|an |). Beispiels von Σ(a weise wird sich Σ

(−1)n−1 n

in Abschnitt IX.7 als konvergent erweisen (vgl. auch


207

1 ist divergent. Umgekehrt folgt aber aus der Konvergenz n

Beispiel 7), aber Σ

von Σ(|an |) diejenige von Σ(an ); dies werden wir in IX.9 beweisen.

Beispiel 8: Die Differenzenfolge Δ(an ) der Folge (an ) aus Beispiel 3 (Quotienten aufeinanderfolgender Fibonacci-Zahlen) ist eine Nullfolge: Es gilt f¨ ur n ≥ 1

und an an−1

1 1 |an − an−1 | |an+1 − an | = − = an an−1 an an−1 1 1 = 1+ · an−1 = an−1 + 1 ≥ 2, also |an+1 − an | ≤ |an − an−1 |. an−1 2

Daraus folgt induktiv

|an+1 − an | ≤ Weil

n

1 2

|a1 − a0 | =

n

1 2

.

n 1 eine Nullfolge ist, gilt dasselbe f¨ ur (an+1 − an ). 2

Die Folge (an ) ist ein Beispiel f¨ ur eine Fundamentalfolge (siehe IX.7), denn f¨ ur jedes ε > 0 gilt |am − an | < ε f¨ ur hinreichend große m, n. F¨ ur m > n gilt nämlich |am − an | = |am − am−1 | + |am−1 − am−2 | + . . . + |an+1 − an | ≤

n

1 2

1+

1 1 + . . . + m−n−1 2 2

≤2·

n

1 2

n−1

=

1 2

.

In Beispiel 8 haben wir zwei Selbstverständlichkeiten benutzt, auf welche wir aber nochmals ausdr¨ ucklich hinweisen wollen: • Ist |an | ≤ |bn | und ist (bn ) eine Nullfolge, dann ist auch (an ) eine Nullfolge. • Die geometrische Folge (q n ) ist f¨ ur |q| < 1 eine Nullfolge. Im nächsten Beispiel werden wir eine weitere Trivialität benutzen: • Das Konvergenzverhalten und der Grenzwert einer Folge a¨ndern sich nicht, wenn man endlich viele ihrer Glieder ändert oder außer Betracht lässt. n eine Nullfolge ist. F¨ ur jedes n ∈ IN 2n k+1 n 2 1 ≤ n < 2k+1 . Damit gilt n < 2k ≤ k . Nun ist 2 2 2

Beispiel 9: Es soll gezeigt werden, dass existiert ein k ∈ IN0 mit 2k

2k − k − 1 ≥ k bzw. 2k ≥ 2k + 1 f¨ ur k ≥ 3, wie man z. B. mit vollständiger n 1 Induktion beweisen kann. Also gilt f¨ ur n ≥ 23 = 8 die Beziehung n < k . Weil

nun

1 2n

eine Nullfolge ist, gilt dasselbe f¨ ur

n . 2n

2

2

In obigen Beispielen 8 und 9 haben wir aus |an | ≤ bn und lim(bn ) = 0 auf lim(an ) = 0 geschlossen. Allgemeiner gilt offensichtlich folgendes Einschließungskriterium: Ist bn ≤ an ≤ bn f¨ ur alle n ∈ IN0 und lim(bn ) = lim(bn ) = b, dann gilt auch lim(an ) = b.


208 Beispiel 10: Wir wollen zeigen, dass

√ lim( n n) = 1

gilt. Dazu untersuchen wir die Folge mit den Gliedern xn := gilt aufgrund des binomischen Lehrsatzes

n = (1 + xn )n = 1 + und daher x2n
1

n n 2 n n n 2 n(n − 1) 2 xn + x + ... + x > x = xn 1 2 n n n 2 n 2

2 . Es folgt 0 < xn < n−1

ßungskriterium lim(xn ) = 0.

2 und daraus nach dem Einschlien−1

Nullfolgen sind aufgrund der folgenden Tatsache von besonderer Bedeutung: Genau dann ist lim(an ) = a, wenn (an − a) eine Nullfolge ist. Hat man also eine Vermutung u ¨ber den Grenzwert einer Folge, so kann man ihre Konvergenz gegen diesen Grenzwert beweisen, indem man von einer anderen Folge nachweist, dass sie eine Nullfolge ist. So sind wir in Beispiel 10 vorgegangen. Ist (an ) eine beliebige Folge und τ eine injektive Abbildung von IN in sich mit τ (i) < τ (j) f¨ ur i < j (i, j ∈ IN), dann nennt man (aτ (n) ) eine Teilfolge von (an ). Genau dann ist eine Folge konvergent, wenn jede ihrer Teilfolgen konvergiert. Dabei konvergiert jede Teilfolge gegen den Grenzwert der gegebenen Folge. Eine nicht-konvergente Folge kann aber konvergente Teilfolgen enthalten. Ist (an ) beschränkt, dann bezeichnet man mit lim inf(an )

bzw.

lim sup(an )

(Limes inferior bzw. Limes superior) die kleinste bzw. die größte Zahl, die Grenzwert einer Teilfolge von (an ) ist. Genau dann ist (an ) konvergent, wenn lim inf(an ) = lim sup(an ) (= lim(an )). √ √ Beispiel 11: Wir betrachten die Folge ( n − [ n]), √ wobei√[x] die kleinste ganze Zahl ≤ x sein soll (Ganzteilfunktion). Es gilt 0 ≤ n − [ n] < 1. Die Teilfolge mit τ (n) = n2 ist konstant 0, konvergiert also gegen 0. Andererseits ergibt sich f¨ ur τ (n) = n2 + 2n eine Folge mit dem Grenzwert 1 (Aufgabe 5). Es ist also √ √ √ √ und lim sup( n − [ n]) = 1. lim inf( n − [ n]) = 0 Satz 3: Die durch (an ) ∼ (bn ) ⇐⇒ (an ) − (bn ) ∈ N ¨ definierte Relation ist eine Aquivalenzrelation in F0 , d.h., es gilt (1) (an ) ∼ (an ) f¨ ur alle (an ) ∈ F0 ; (2) ist (an ) ∼ (bn ), dann ist auch (bn ) ∼ (an ); (3) ist (an ) ∼ (bn ) und (bn ) ∼ (cn ), dann ist auch (an ) ∼ (cn ). Die Relation ∼ ist also (1) reflexiv , (2) symmetrisch und (3) transitiv .


209

Beweis: (1)und (2) verstehen sich von selbst; (3) folgt daraus, dass mit den Folgen (an ) − (bn ) und (bn ) − (cn ) auch deren Summe (an ) − (cn ) eine Nullfolge ist. 2 Ist (an ) eine konvergente Folge mit dem Grenzwert a, dann besteht die Menge aller zu (an ) äquivalenten Folgen aus allen Folgen mit dem Grenzwert a, also aus allen zu der konstanten Folge (a) äquivalenten Folgen. ¨ Wir betrachten nun noch eine andere Aquivalenzrelation in der Menge aller Folgen, welche es insbesondere ermöglicht, unbegrenzt wachsende Folgen miteinander zu vergleichen und ihr Wachstumsverhalten zu beschreiben. Satz 4: In der Menge aller Folgen, deren Glieder alle von 0 verschieden sind, wird durch 1 (an ) ≈ (bn ) ⇐⇒ (an ) · ∼ (1) bn ¨ eine Aquivalenzrelation definiert. Beweis: Die Reflexivität und die Symmetrie der Relation ≈ verstehen sich von 1 1 und (bn ) · selbst. Die Transitivität ergibt sich daraus, dass mit (an ) · auch das Produkt (an ) ·

1 cn

bn

1 3

sowie lim

2

dieser Folgen den Grenzwert 1 hat.

Beispiel 12: Es gilt Σ(n2 ) ≈ (n3 ), denn Σ(n2 ) =

cn

1 3 1 1 n + n2 + n 3 2 6

und

1 3 1 2 1 3 3 1 1 1 n + n + n · 3 =1+ · + · 2 3 2 6 n 2 n 2 n

2 1 1 1 = 0 und lim 2 = lim = 0. n n n

¨ Wie in Beispiel 12 dient die Aquivalenzrelation ≈ dazu, bei divergenten wachsenden Folgen das Wachstum durch Folgen mit u ¨bersichtlichen Termen zu beschreiben. F¨ ur viele Gebiete der Mathematik ist z. B. die folgende Beschreibung des Wachstums der harmonischen Reihe mit Hilfe der Logarithmusfunktion von Bedeutung, welche wir in X.8 begr¨ unden werden: Σ

1 n

≈ (ln n). Dabei ist ln

der Logarithmus zur Basis e und Zahl (vgl. IX.10). F¨ ur die Fol√e die eulersche n n ge der Fakultäten gilt (n!) ≈ 2πn , wie wir in XI.4 beweisen werden e (stirlingsche Formel).

Aufgaben 1. Man zeige, dass Summe und Produkt beschränkter Folgen beschränkt sind. 2. Man beweise die Behauptung u¨ber die Folge der Quotienten der FibonacciZahlen aus Beispiel 3.


210

3. Man zeige: Ist Σ(an ) konvergent, dann ist (an ) eine Nullfolge. √

4. Man beweise: lim( n2 + 2n − n) = 1. 5. Man beweise für k = 1, 2, 3 die Beziehung Σ(nk ) ≈ 6. Es sei lim(an + bn ) = u und lim(an − bn ) = v.

1 (nk+1 ). k+1

1 4

Man zeige, dass die Produktfolge (an bn ) gegen (u2 − v2 ) konvergiert.

7. Es seien (an ), (bn ) Nullfolgen mit positiven Gliedern.

Man zeige, dass dann auch die Folge

8. Es sei lim(an ) = a und An :=

a2n + b2n an + bn

eine Nullfolge ist.

n 1 ai (arithmetisches Mittel der ersten n n i=1

Glieder von (an )). Man zeige, dass dann auch lim(An ) = a gilt.

9. In einem gleichseitigen Dreieck der Seitenlänge 1 denke man sich die mitt1

leren Drittel der Seiten durch zwei Strecken der Länge so ersetzt, dass 3 eine Sternfigur entsteht (Fig. 2). Auf jede der 12 Seiten dieser Sternfigur denke man sich dieselbe Ersetzung angewendet, man ersetze also das mittlere Drittel jeder Seite, wie in Fig. 2 gezeigt, durch zwei Strecken der Länge 1 . Auf die nunmehr 48 Seiten der enstandenen Sternfigur wende man die9 selbe Prozedur an. Diese Ersetzungen denke man sich nun unendlich oft“ ” wiederholt. Es entsteht eine Grenzfigur, die man nat¨ urlich nicht zeichnen .. .... ............... ... ...... . ... ..... . kann. Mn berechne den Um. . . . . . . . . ............. ...... ...... ................ ............... . .... . . ... ....... ... ... fang und den Flächeninhalt die. . .... ......... ... . . . . .. . . . .. . . . . . . . . . . . . ser Grenzfigur. (Solche Grenzfigu.................................... .................. .................. ................. ............... . . . . . . . . . ............. ..... ren einer Figurenfolge betrachtet man in der Geometrie der FrakFig. 2: Zu Aufgabe 9 tale.)

10. Craps ist ein in den Vereinigten Staaten beliebtes Würfelspiel. Man wirft

zwei W¨ urfel und bestimmt die Augensumme S. Bei S ∈ {7, 11} gewinnt man sofort, bei S ∈ {2, 3, 12} verliert man sofort. In den u ¨brigen Fällen wirft man so lange weiter, bis entweder die Augensumme 7 kommt (dann hat man verloren) oder wieder die Augensumme S erscheint (dann hat man gewonnen). Man berechne die Gewinnwahrscheinlichkeit. Die Wahrscheinlichkeiten p der einzelnen Werte von S entnehme man folgender Tabelle: S 2 3 4 5 6 7 8 9 10 11 12 36p 1 2 3 4 5 6 5 4 3 2 1

IX.7 Die reellen Zahlen

211

IX.7 Die reellen Zahlen Eine Zahl heißt rational , wenn sie als Quotient zweier ganzer Zahlen ( Bruch“) ” geschrieben werden kann. Eine reelle Zahl, die nicht rational ist, heißt irrational . √ √ u mit u, v ∈ IN und Beispiel 1: 3 14 ist eine irrationale Zahl: Aus 3 14 = v

ggT(u, v) = 1 ( voll gek¨ urzt“) folgt u3 = 14v 3 . Eine solche Gleichung kann aber ” nicht gelten, weil sie zur Folge hätte, dass u durch 7 und damit u3 durch 73 teilbar wäre, was wiederum die Teilbarkeit von v durch 7 zur Folge hätte, im Widerspruch zur vorausgesetzten Teilerfremdheit von u, v. Den Umgang mit reellen Zahlen haben wir bisher als bekannt vorausgesetzt. Nun wollen wir die Unterschiede zwischen den rationalen Zahlen und den reellen Zahlen näher untersuchen und dabei mehr u ¨ber die Natur der reellen Zahlen erfahren. F¨ ur a, b ∈ IR nennt man [a; b] ]a; b[ [a; b[ ]a; b]

= = = =

{x ∈ IR | a ≤ x ≤ b} ein abgeschlossenes Intervall, {x ∈ IR | a < x < b} ein offenes Intervall, {x ∈ IR | a ≤ x < b} ein halboffenes Intervall, {x ∈ IR | a < x ≤ b} ein halboffenes Intervall.

Wir wollen auch die Mengen ] − ∞; a] = {x ∈ IR | x ≤ a}, ] − ∞; a[ = {x ∈ IR | x < a},

[b; ∞[= {x ∈ IR | x ≥ b}, ]b; ∞[= {x ∈ IR | x > b}

Intervalle nennen; im Gegensatz zu diesen unendlichen Intervallen heißen die zuvor definierten endlich. Schließlich soll auch die Menge IR selbst als ein (unendliches) Intervall verstanden werden. Sind a, b rationale Zahlen mit a < b und ersetzt man in obigen Definitionen IR durch Q, so spricht man von rationalen Intervallen. Im Gegensatz dazu heißen die oben beschriebenen Intervalle reell . Wir erinnern an die Bestimmung einer reellen schen zwei Folgen rationaler Zahlen, etwa √ 1 < √2 < 1, 4 < √2 < 1, 41 < √2 < 2 < 1, 414
S. Alle diese Eigenschaften besitzt auch Q. Da in IR aber außerdem das Vollständigkeitsaxiom gilt, sagt man, der Körper der reellen Zahlen sei ein vollständiger archimedisch angeordneter Körper. Wir wollen nun aus dem Vollständigkeitsaxiom einige Sätze herleiten, welche in IR, nicht aber in Q gelten. Wir betrachten also nun stets Folgen (an ) von reellen Zahlen. Satz 1 (Cauchy-Kriterium): Genau dann ist die Folge (an ) konvergent, wenn zu jedem ε > 0 ein Nε ∈ IN derart existiert, dass ur alle m, n ≥ Nε . |am − an | < ε f¨ Beweis: a) Die Folge (an ) sei konvergent zum Grenzwert a. Dann existiert zu jedem ε > 0 ein Nε ∈ IN mit |an − a| < ε f¨ ur alle n ≥ Nε . F¨ ur m, n ≥ Nε ist dann |am − an | = |(am − a) − (an − a)| ≤ |am − a| + |an − a| < ε + ε = 2ε. Da mit ε auch 2ε beliebig klein gemacht werden kann, folgt die Bedingung des Cauchy-Kriteriums. b) Es gelte die im Satz angegebene Bedingung. Dann existiert f¨ ur alle i ∈ IN ein Index Ni , so dass 1 ur alle n ≥ Ni . |an − aNi | < i f¨ 2 ur n ≥ Ni liegt also an im Dabei können wir N1 < N2 < N3 < . . . annehmen. F¨ Intervall

1 1 Ii := aNi − i ; aNi + i . 2 2 Wegen N2 > N1 liegt aN2 im Innern des Intervalls I1 , so dass I1 ∩I2 ein nichtleeres abgeschlossenes Intervall ist. Wegen N3 > N2 liegt aN3 im Innern von I1 ∩ I2 ∩ I3 ,


214

so dass I1 ∩ I2 ∩ I3 ein nichtleeres abgeschlossenes Intervall ist. So findet man eine Folge von ineinandergeschachtelten nichtleeren abgeschlossenen Intervallen I1 , I1 ∩ I2 , I1 ∩ I2 ∩ I3 , . . . , deren Längen eine Nullfolge bilden, die also eine Intervallschachtelung darstellen. Diese besitzt nach dem Vollständigkeitsaxiom einen Kern a, und es gilt wegen a ∈ I1 ∩ I2 ∩ . . . ∩ Ik ⊆ Ik |an − a| < 2 ·

1 2k

f¨ ur alle n ≥ Nk .

Da dies f¨ ur jedes k ∈ IN gilt, folgt lim(an ) = a.

2

Das Cauchy-Kriterium ist notwendig und hinreichend f¨ ur die Konvergenz einer Folge: Ist die Folge konvergent, dann gilt die Cauchy-Bedingung, gilt die CauchyBedingung, dann ist die Folge konvergent. Das wird in Satz 1 durch die Worte genau dann“ ausgedr¨ uckt. ” Eine Folge, welche das Cauchy-Kriterium erf¨ ullt, heißt eine Cauchy-Folge oder eine Fundamentalfolge. Man kann Satz 1 also folgendermaßen ausdr¨ ucken: Eine Folge ist in IR genau dann konvergent, wenn sie eine Cauchy-Folge ist. Eine Cauchy-Folge rationaler Zahlen muss keinen rationalen Grenzwert haben (wohl aber einen reellen), wie folgende Beispiele zeigen. Beispiel 2: Die Folge (an ) mit a1 := 1 und 1 1 an := an−1 + 2 an−1

f¨ ur n ≥ 2

ist eine Cauchy-Folge (rationaler Zahlen), hat aber keinen Grenzwert in Q. Zunächst klären wir die zweite Behauptung. Wäre a = lim(an ), so w¨ urde aus √ 1 1 2 der Rekursionsformel a = a + , also a = 2 folgen. Weil aber 2 keine rationa2 a le Zahl ist, hat (an ) keinen rationalen Grenzwert. Nun zeigen wir, dass die Folge (a2n ) der Quadrate der Folgenglieder konvergent ist. Es gilt f¨ ur n ≥ 2

a2n

−2=

1 1 an−1 + 2 an−1

2

1 1 − 4 · an−1 · = 2 an−1

also a2n ≥ 2. Ferner gilt a2n ≤ 2 +

1 1 an−1 − 2 an−1

2

≥ 0,

1 (vollständige Induktion). Damit ergibt sich 2n

lim(a2n ) = 2. Nach Satz 1 ist also (a2n ) eine Cauchy-Folge. Daraus wollen wir herleiten, dass auch (an ) eine solche Folge ist: Zu ε > 0 existiert ein Nε ∈ IN mit |a2m − a2n | < ε f¨ ur alle m, n ≥ Nε , also wegen an ≥ 1 f¨ ur alle n ∈ IN auch |am − an | ≤ 2|am − an | ≤ (am + an )|am − an | = |(am + an )(am − an )| = |a2m − a2n | < ε.

IX.7 Die reellen Zahlen

215

Beispiel 3: Die Folge Σ rational: F¨ ur m > n gilt 0
1; man zeige, dass Σ

c) Man zeige, dass Σ

n2 2n

konvergiert.

3. Man bestimme die Häufungspunkte, das Infimum und das Supremum von

a) M =

1 1 + m, n ∈ IN m n

b) M =

m − n m, n ∈ IN m+n

4. Fig. 1 zeigt den Anfang des leibnizschen Dreiecks. Hier steht in der Mitte u ¨ber zwei Zahlen deren Summe; beispielsweise ist 1 1 1 + = . 20 30 12 a) Wie lautet die nächste Zeile? b) In den nach links unten laufenden Schrägen stehen Nullfolgen, und zwar der Reihe nach

1 6

1 5

1 3

1 2

1 1 1 6

1 2

1 3

1 1 1 1 12 1 12 1 4 1 1 20 1 30 1 20 1 5 30 60 60 30 1 4

1 6

Fig. 1: Leibnizsches Dreieck

1 2 1 , , usw. Man bestimme den allgemeinen n n(n + 1) n(n + 1)(n + 2)

Term der Folgenglieder in den beiden nächsten Schräglinien. c) Man untersuche, ob die Summenfolgen der Folgen in den ersten drei Schräglinien konvergieren und berechne im Fall der Konvergenz den Grenzwert.

IX.8 Potenzen mit reellen Exponenten

219

IX.8 Potenzen mit reellen Exponenten F¨ ur eine reelle Zahl x und eine nat¨ urliche Zahl n versteht man unter der Potenz xn das n-fache Produkt x · x · . . . · x mit n Faktoren x. Man kann dies folgendermaßen rekursiv definieren: x1 = x, xn = xn−1 · x f¨ ur n ∈ IN. In der Potenz xn nennt man x die Basis und n den Exponent. Die G¨ ultigkeit der bekannten Potenzregeln xm · xn = xm+n , (xm )n = xmn , xn · y n = (xy)n f¨ ur Potenzen mit nat¨ urlichen Exponenten beweist man dann mit vollständiger Induktion. Nun möchten wir als Exponenten auch andere als nur nat¨ urliche Zahlen zulassen. F¨ ur x = 0 setzen wir x0 = 1. Damit sind obige Potenzregeln auch f¨ ur Exponenten aus IN0 g¨ ultig. Die Basis 0 sollte man dabei aber ausschließen, also 00 weder gleich 0 noch gleich 1 setzen. Der Term 00 ist ein unbestimmter Ausdruck . F¨ ur x = 0 und n ∈ IN setzen wir 1 x−n = n . x Damit haben wir Potenzen f¨ ur ganzzahlige Exponenten (und Basen = 0) definiert. Man kann leicht nachrechnen, dass obige Potenzregeln dabei weiterhin gelten. Nun setzen wir f¨ ur x ≥ 0 und m, n ∈ IN 1 m √ 1 m x n = n x sowie x n = x n . Auch hier sind wieder alle Potenzregeln erf¨ ullt, wobei es aber wichtig ist, dass negative Basen ausgeschlossen sind. Dies zeigt folgendes Beispiel: Geht man von √ 3 −8 = −2 aus, so erhält man bei Anwenden der Potenzregeln den Widerspruch √ 1 2 1 1 −2 = 3 −8 = (−8) 3 = (−8) 6 = ((−8)2 ) 6 = 64 6 = +2. Damit ist f¨ ur x ≥ 0 und alle positiven rationalen Zahlen r die Potenz xr definiert. 1 Ist x = 0, dann erklärt man wieder x−r durch r und rechnet leicht nach, dass x auch hier wieder alle Potenzregeln erf¨ ullt sind. Nun erhebt sich das Problem, f¨ ur einen beliebigen reellen Exponenten a die Potenz xa zu definieren. Wir wollen es mit folgender Definition versuchen: Ist a der Grenzwert der rationalen Zahlenfolge (an ), dann ist xa der Grenzwert von (xan ). Zunächst ist zu beachten, dass jede reelle Zahl Grenzwert einer Folge rationaler Zahlen ist. Wir m¨ ussen nun zeigen, dass mit (an ) auch (xan ) konvergiert, und dass f¨ ur jede andere rationale Folge (bn ) mit dem Grenzwert a die Folgen (xan ) und (xbn ) denselben Grenzwert haben. Es gilt xam − xan = xan (xam −an − 1). Da (an ) eine Cauchy-Folge ist und da (xan ) beschränkt ist, ist auch (xan ) eine Cauchy-Folge und somit konvergent (Aufgabe 1). Da weiterhin (an − bn ) eine Nullfolge ist, gilt lim(xan −bn ) = 1. Es folgt lim(xan − xbn ) = lim(xbn (xan −bn − 1)) = 0.


220 Wir können nun also definieren: xlim(an ) = lim(xan ).

F¨ ur reelle Exponenten gelten wieder die bekannten Potenzregeln, was sich aus den Grenzwertsätzen f¨ ur Folgengrenzwerte ergibt. Ist b > 1, dann nennt man die Lösung x der Gleichung bx = a den Logarithmus von a zur Basis b und schreibt daf¨ ur logb a. Es ist also x = logb a ⇐⇒ bx = a. (Es ist u ussig, Logarithmen zur Basis b mit 0 < b < 1 zu betrachten, denn ¨berfl¨ logb x = − log 1 x.) Es gelten die folgenden Logarithmenregeln, welche man sofort b aus den entsprechenden Potenzregeln gewinnt: logb (a1 · a2 ) = logb a1 + logb a2 ,

logb (ar ) = r logb a (r ∈ IR).

Aus diesen ergeben sich die Sonderfälle √ 1 a logb 1 = logb a1 − logb a2 . logb n a = logb a, n

a2

F¨ ur die Umrechnung eines Logarithmus zur Basis b in einen zur Basis c gilt logc a = logc b · logb a, denn a = clogc a und a = blogb a = (clogc b )logb a . Von besonderer Bedeutung f¨ ur das numerische Rechnen sind die Logarithmen zur Basis 10 (lg-Taste auf dem Taschenrechner). F¨ ur die meisten Gebiete der Mathematik spielt aber der Logarithmus zur Basis e (nat¨ urlicher Logarithmus, ln-Taste auf dem Taschenrechner) die größte Rolle. Dabei ist e die eulersche Zahl (vgl. Abschnitt IX.10).

Aufgaben 1. Es sei x eine positive reelle Zahl und (an ) eine Cauchy-Folge. Man zeige, dass dann auch (xan ) eine Cauchy-Folge ist.

2. Man löse mit Hilfe des lg-Taste des Taschenrechners (Logarithmus zur Basis 10) die Exponentialgleichung 4x+2 = 5x−1 .

3. Man bestimme a, b, c so, dass lg(a + bx + cx2 ) für x = 0, 1, 2 die Werte 0, 1 bzw. 2 annimmt.

4. Man berechne ohne Taschenrechner einen Näherungswert von mit Hilfe der folgenden Werte aus einer Logarithmentafel:

5

2417 · 393 1072

lg 39 = 1,5911; lg 107 = 2,0294; lg 241 = 2,3820; lg 3004=3,4777

IX.9 Unendliche Reihen

221

IX.9 Unendliche Reihen Die Summenfolge Σ(an ) einer Folge (an ) nennen wir aus historischen Gr¨ unden hier eine unendliche Reihe oder auch kurz eine Reihe mit den Gliedern a0 , a1 , a2 , . . . . Existiert der Grenzwert der Summenfolge, so schreiben wir auch ∞ n=0

an

f¨ ur

lim Σ(an )

ur alle n ∈ IN0 , so sprechen und nennen dies den Wert der Reihe. Gilt an > 0 f¨ wir von einer Reihe mit positiven Gliedern. Nach dem Hauptsatz u ¨ber monotone Folgen ist eine Reihe mit positiven Gliedern konvergent, wenn sie beschränkt ist. Sind Σ(an ) und Σ(bn ) Reihen mit positiven Gliedern, wobei an ≤ bn f¨ ur alle n ∈ IN gilt, dann folgt aus der Konvergenz von Σ(bn ) die Konvergenz von Σ(an ) und aus der Divergenz von Σ(an ) diejenige von Σ(bn ) (Vergleichskriterium). Satz 1: Es sei Σ(an ) eine Reihe mit positiven Gliedern, ferner n0 eine feste nat¨ urliche Zahl. a) Quotientenkriterium: Gibt es ein q ∈ IR mit 0 < q < 1 und an+1 ≤ q f¨ ur alle n > n0 , an dann ist die Reihe konvergent. b) Wurzelkriterium: Gibt es ein q ∈ IR mit 0 < q < 1 und √ n an ≤ q f¨ ur alle n > n0 , dann ist die Reihe konvergent. Beweis: Es ist jeweils nur die Beschränktheit der Reihe nachzuweisen. a) Aus der Bedingung folgt f¨ ur i > n0 die Abschätzung ai ≤ an0 · q i−n0 , also f¨ ur n > n0 n0 n0 n 1 − q n−n0 +1 1 ai ≤ ai + an0 · ai + an0 · ≤ . 1−q 1−q i=0 i=0 i=0 ur n > n0 b) Aus der Bedingung folgt f¨ ur i > n0 die Abschätzung ai ≤ q i , also f¨ n i=0

ai ≤

n0 i=0

ai + q n0 +1 ·

n0 1 − q n−n0 1 ai + q n0 +1 · ≤ . 1−q 1−q i=0

a

Gilt im Gegensatz zu den Bedingungen in diesem Satz n+1 ≥ 1 oder an einem gewissen Index, dann ist die Reihe offensichtlich divergent. Beispiel 1: Die Reihe Σ

an+1 an

=

xn n!

ist f¨ ur jedes x ∈ IR konvergent, denn

x n+1

und

lim

x = 0. n+1

2 √ n

an ≥ 1 ab


222

Beispiel 2: Die Reihe Σ(nxn ) ist f¨ ur jedes x mit 0 ≤ x < 1 konvergent, denn √ √ √ n nxn = x · n n und lim( n n) = 1.

1 f¨ ur α > 0 kann man mit Hilfe der α n α √ n = 1 und lim( n n) = 1. Kriterien in Satz 1 nicht feststellen, denn lim n+1

Das Konvergenzverhalten der Reihen Σ

Wir werden in X.8 zeigen, dass diese Reihe f¨ ur α > 1 konvergiert und f¨ ur α ≤ 1 divergiert (vgl. auch Aufgabe 4). Wir wissen dies bereits f¨ ur α = 1. F¨ ur α = 2 haben wir die Konvergenz in IX.6 gezeigt, f¨ ur α = 1, 5 zeigen wir sie im folgenden Beispiel, woraus sich dann die Konvergenz auch f¨ ur alle α ≥ 1, 5 ergibt. Beispiel 3: Es gilt f¨ ur alle n ∈ IN √ √ n n 1 i+1− i 1 1 √ −√ √√ = 1− √ = n+1 i+1 i i i+1 i=1 i=1 n 1 = √ √ i(i + 1)( i + i + 1) i=1 ≥ also

n

1 √ < 3. Da i=1 i i

1 √

n

n 1 1 1 √ −1 , √ > 2 (i + 1) · 2 i + 1 i i i=1 i=1

n n

eine Reihe mit positiven Gliedern ist, folgt aus

ihrer Beschränktheit die Konvergenz.

n

Beispiel 4: Die Reihe ist konver2n gent, denn die Folge der Quotienten aufeinanderfolgender Glieder konvergiert ge1 gen . Argumentiert man wie in neben2 stehender Rechnung, dann ergibt sich der Wert s dieser Reihe zu 2. Eine solche Umordnung der Summanden ist hier erlaubt, weil alle Summanden positiv sind (vgl. den folgenden Satz 2).

s =

1 2 3 4 5 + + + + + ... 2 4 8 16 32

=

1 1 1 1 1 + + + + + ... 2 4 8 16 32 3 4 1 2 + + ... + + + 4 8 16 32

1 = 1+ s 2

Beispiel 5: Christian Huygens (1629–1695) stellte Leibniz die Aufgabe, die Summe“ ” 1 1 1 1 1 + + + + + ... 1 3 6 10 15 zu berechnen, wobei in den Nennern die Folge (Dn ) der Dreieckszahlen auftritt. Wegen Dn n n und lim = =1 Dn+1 n+2 n+2

IX.9 Unendliche Reihen

223

kann man die Konvergenz nicht mit dem√Quotientenkriterium beweisen. Auch das Wurzelkriterium versagt (wegen lim( n n) = 1). Man kann die Konvergenz und den Grenzwert aber sofort folgendermaßen erhalten: 1 2 2 2 = = − Dn n(n + 1) n n+1

Beispiel 6: Die leibnizsche Reihe Σ n (−1)i−1

σk =

=

i

i=1

⇒

⎧ ⎨ σk

lim Σ (−1)n−1 n

1 Dn

1 n

2 = 2. n+1

konvergiert: Es gilt

f¨ ur n = 2k,

⎩ σ + k

= lim 2 −

⎫ ⎬

f¨ ur n = 2k + 1 ⎭

mit

k

1 1 1 1 1 = + + + ... + . 2 12 30 (2k − 1)2k i=1 (2i − 1)2i

1 2 n

Aus der Konvergenz von Σ

Konvergenz von Σ

n−1

(−1) n

folgt die Konvergenz von (σn ) und daraus die

.

Eine Reihe Σ(an ) heißt absolut konvergent, wenn die Reihe Σ(|an |) konvergiert. Eine konvergente Reihe mit positiven Gliedern ist also auch absolut konvergent. Eine absolut konvergente Reihe ist stets auch konvergent (Aufgabe 2). Die Reihe in Beispiel 6 ist konvergent, aber nicht absolut konvergent. Eine Reihe, deren Glieder abwechselnd positiv und negativ sind, heißt alternierend. Satz 2 (Leibniz-Kriterium): Eine alternierende Reihe, bei welcher die Beträge der Glieder eine monotone Nullfolge bilden, konvergiert. Beweis: Es sei (an ) eine monotone Nullfolge mit positiven Gliedern und sn :=

n i=1

(−1)i−1 ai .

Dann ist (s2n ) monoton wachsend und nach oben beschränkt (durch a1 ) und (s2n+1 ) monoton fallend und nach unten beschränkt (durch a1 − a2 ). Diese beiden Folgen sind also konvergent. Wegen s2n+1 − s2n = a2n+1 haben sie den gleichen Grenzwert. 2 Hat eine alternierende Reihe, welche das Leibniz-Kriterium erf¨ ullt, den Reihenwert s, dann gilt in obigen Bezeichnungen |s−sn | ≤ an+1 , wie man leicht einsieht. Die Konvergenz der leibnizschen Reihe in Beispiel 6 folgt aus Satz 2. Dass man in Satz 2 nicht auf die Monotonie der Folge (an ) verzichten kann, wird durch das Beispiel in Aufgabe 3 belegt. In der leibnizschen Reihe (Beispiel 6) kann man durch Umordnung der Glieder jeden beliebigen Wert S als Reihenwert erhalten. Wir zeigen dies f¨ ur S > 0, die


224

Argumentation ist aber analog f¨ ur negative Werte von S: Man summiere zunächst so viele positiveGlieder, bis deren Summe erstmals > S ist, was wegen der 1 Divergenz von Σ möglich ist; dann addiere man so viele negative Glieder 2n + 1

hinzu, bis die Summe erstmals < S ist. Dann addiere man wieder positive Glieder usw. Auf diese Art kann man nat¨ urlich auch erreichen, dass die Reihe divergiert, also unbeschränkt wächst oder fällt. Wie dieses Beispiel zeigt, ist die Umordnung der Glieder einer Reihe nicht immer erlaubt. Dies ist aber der Fall bei absolut konvergenten Reihen. Satz 3 (Umordnungssatz ): Die Reihe Σ(an ) sei absolut konvergent und der Reihenwert sei S; ferner sei γ eine bijektive (umkehrbar eindeutige) Abbildung von IN auf sich. Dann ist auch die Reihe Σ(aγ(n) ) konvergent und besitzt denselben Reihenwert S. Beweis: Da mit Σ(|an |) auch Σ(|aγ(n) |) nach oben beschränkt ist, ergibt sich die Konvergenz aus dem Hauptsatz u ¨ber monotone Folgen. Es bleibt aber die Frage zu beantworten, ob beide Reihen den gleichen Wert besitzen, ob also die Differenz n n

der konvergenten Folgen (sn ) und (tn ) mit sn := ai und tn := aγ(i) eine i=1

i=1

Nullfolge ist: Zu jedem k ∈ IN existiert ein Nk ∈ IN mit γ(n) > k f¨ ur n > Nk . Dann ist |sn − tn | ≤ |ak+1 | + |ak+2 | + . . . + |an | f¨ ur n > Nk . Aus der absoluten Konvergenz von Σ(an ) folgt, dass (sn − tn ) eine Nullfolge ist. 2

Aufgaben 1. Man untersuche die folgenden Reihen mit Hilfe des Quotientenkriteriums, des Wurzelkriteriums oder des Vergleichskriteriums auf Konvergenz: √ 1 2n n! b) Σ c) Σ d) Σ(nα q n ) (α, q > 0) a) Σ √ n! nn n!

2. Man zeige, dass eine absolut konvergente Reihe auch konvergent ist. 3. Man zeige, dass die Reihe Σ((−1)n an+1 ) mit a2i =

1 2 und a2i−1 = nicht i i

konvergiert. Warum ist das Leibniz-Kriterium nicht anwendbar?

4. Man zeige

n

n

1 1 √ √ < 2r + 1 f¨ < 5 und allgemein ur r ∈ IN (vgl. 4 2r i i i=1 i=1 i i

Beispiel 4). Man beweise damit, dass

5. Man zeige, dass

∞ n=1

6. Zeige, dass lim

n2

1 nα

f¨ ur α > 1 konvergiert.

a 1 1 1 = 1 + + + ... + + an 2 3 a

n 1 1 √ √ n i=1 i

= 2.

f¨ ur a ∈ IN.

IX.10 Die eulersche Zahl

225

IX.10 Die eulersche Zahl

Die Reihe Σ

1 n!

konvergiert; ihr Wert liegt zwischen 2,5 und 3, denn 1+1+

Die Zahl

∞ ∞ 1 1 1 = 3. < 1

xn 1 = 1− 2 xn−1 n

n

·

n , n−1

und die bernoullische Ungleichung (Abschnitt IX.2) liefert 1 − insgesamt also

1 n2

n

> 1−n·

1 , n2

1 n xn > 1− · = 1. xn−1 n n−1 Die Folge (xn ) ist daher konvergent. Die Behauptung des Satzes folgt nun aus lim(xn ) ≥

k 1 i=0

i!

f¨ ur jedes k ∈ IN.

2

Satz 2: F¨ ur jedes a ∈ IN gilt

lim

1+

a n

n

= ea = lim Σ

an . n!

Beweis: Zunächst gilt

lim

1+

a n

n

= lim

1+

a an

an

= lim

1+

1 n

n a

.


226

Umformung mit dem binomischen Lehrsatz wie zu Anfang n des Beweises von Satz 1 a ¨ . 2 liefert die Aquivalenz dieses Grenzwerts mit lim Σ n!

Die Aussage von Satz 2 gilt auch f¨ ur beliebige reelle Zahlen a, was wir aber erst später beweisen können. F¨ ur rationale Werte von a ist die Aussage von Satz 2 aber leicht einzusehen (Aufgabe 3).

Aufgaben 1. Man zeige, dass

1 1+ n

n

1 1+ n

,

n+1

eine Intervallschachtelung

f¨ ur die eulersche Zahl e ist.

2. Man bestimme die Grenzwerte der Folgen

1+

1 n

2n−1

,

1+

1 2n

6n

,

1−

1 n

n

,

1−

3. Man zeige, dass für alle rationalen Zahlen a gilt: lim 1 + na 4. Man zeige, dass lim

n

1 n2

n

.

= ea .

n 1 1 + 2 = e. Man zeige dann, dass n n √ n

1+ lim

2 + 3 + 9n2 3n − 1

= e.

Diese Darstellung von e stammt von Thomas Simpson (1710–1761). In X.7 wird gezeigt, wie Simpson dies gefunden hat. Die Glieder dieser Folgen nähern sich dem√Wert e sehr schnell, das erste Glied hat schon den sehr guten Wert 1 + 3 ≈ 2,732. Zum Beweis obiger Grenzwertbeziehung zeige √ 3+9n2 man zunächst, dass 2+3n−1 zwischen 1 + n1 und 1 + n1 + n12 liegt.

IX.11 Unendliche Produkte Zu einer Zahlenfolge (an ) definieren wir die Produktfolge Π(an ) durch wobei

n i=1

n

i=1

ai ,

ai = a1 · a2 · . . . · an das Produkt der ersten n Glieder der Folge (an )

bedeutet. Wir betrachten dabei aber nur Folgen, deren Glieder alle von 0 verschieden sind, weil sonst die Frage nach der Konvergenz der Produktfolge trivial wäre. Ferner wollen wir eine Produktfolge genau dann konvergent nennen, wenn 1 ihr Grenzwert existiert und von 0 verschieden ist. Mit Π(an ) ist dann auch Π konvergent. Im Fall der Konvergenz schreibt man f¨ ur den Grenzwert

∞ i=1

an

ai . Manch-

mal bezeichnet man auch die Produktfolge selbst mit diesem Symbol und nennt

IX.11 Unendliche Produkte

227

dies dann ein unendliches Produkt. Notwendig f¨ ur die Konvergenz von Π(an ) ist offensichtlich lim(an ) = 1. Daher schreibt man die Faktoren einer Produktfolge, f¨ ur deren Konvergenz man sich interessiert, meistens in der Form 1 + un .

1 Beispiel 1: Die Produktfolge Π 1 + n

der ersten n Faktoren ist n + 1.

Beispiel 2: Die Produktfolge Π 1 − n i=2

1−

1 i2

=

n (i − 1)(i + 1)

i2

i=2

ist nicht konvergent, denn das Produkt

1 n2

=

ist konvergent, denn

1 n+1 · , 2 n

also

∞

1−

i=2

1 i2

1 = . 2

Satz 1: Die Produktfolge Π(1 + un ) mit un ≥ 0 f¨ ur alle n ∈ IN ist genau dann konvergent, wenn die Summenfolge Σ(un ) konvergent ist. Beweis: Die Produktfolge ist monoton wachsend. Sie ist genau dann nach oben beschränkt, wenn die genannte Summenfolge beschränkt ist, denn wegen 1 + ui ≤ eui f¨ ur alle i ∈ IN ist (1 + u1 )(1 + u2 ) · . . . · (1 + un ) ≤ eu1 +u2 +...+un . 2 ur alle n ∈ IN ist genau Satz 2: Die Produktfolge Π(1 − un ) mit 0 ≤ un < 1 f¨ dann konvergent, wenn die Summenfolge Σ(un ) konvergent ist. 1 un mit vn = , so dass Satz 2 aus Satz 1 folgt.2 1 + vn 1 − un 1 1 Aus den Sätzen 1 und 2 folgt, dass die Produktfolgen Π 1 + α und Π 1 − α n n

1 genau dann konvergieren, wenn konvergiert, also f¨ ur α > 1 (vgl. XI.3). nα 2n − 1 2n + 1 1 1− 2 = · konvergiert. Ihr GrenzBeispiel 3: Die Folge 4n 2n 2n 2 wert ist , wie wir in Abschnitt XI.4 sehen werden. Es gilt also π

Beweis: Es ist 1 − un =

π 2 2 4 4 6 6 8 8 = · · · · · · · · ... 2 1 3 3 5 5 7 7 9 (wallissches Produkt, nach John Wallis, 1616–1703). also p1 = 2, p2 = 3, p3 = 5, . . .. Beispiel 4: Es sei (pn ) die Folge der Primzahlen, F¨ ur x > 1 ist die Produktfolge n

1 1 − p−x n

konvergent. F¨ ur n ∈ IN gilt

n ∗ 1 1 1 1 = 1 + + + . . . = , −x x 2x x 1 − p p p k i i i i=1 i=1

wobei die Summe ∗ u ¨ber alle k ∈ IN zu erstrecken ist, in deren Primfaktorzerlegung nur die Primzahlen p1 , p2 , . . . , pn vorkommen. Der Grenz¨ ubergang n → ∞ liefert dann die Beziehung


228 ∞

∞ 1 1 . −x = x 1 − p k i i=1 k=1

Beim Grenz¨ ubergang x → 1+ strebt der Ausdruck rechts wegen der Divergenz der harmonischen Reihe gegen unendlich. Folglich kann das Produkt links nicht nur aus endlich vielen Faktoren bestehen. Damit ist bewiesen, dass es unendlich viele Primzahlen gibt. (F¨ ur diese Tatsache existieren nat¨ urlich einfachere Beweise.) Dieser Zusammenhang der riemannschen Zetafunktion (nach Bernhard Riemann, 1826–1866) ζ : x →

∞ 1

mit der Folge der Primzahlen erklärt, warum diese x k=1 k

Funktion f¨ ur die Theorie der Primzahlverteilung von so großer Bedeutung ist.

Aufgaben 1. Man beweise, dass

∞

log 1 +

i=2

1 = log 2. i2 − 1

2. Man zeige, dass folgende Produktfolgen konvergieren:

n3 + 1 a) Π n3 + 2

n

1 b) Π 1 + 2

2n + 1 c) Π 1 + 2 (n − 1)(n + 1)2

n4 + n2 3. Man berechne lim Π 4 . n −1

IX.12 Abz¨ ahlen von unendlichen Mengen Wir werden in diesem Abschnitt sehen, dass man die Menge der rationalen Zahlen in einer Folge anordnen kann, dass man sie also nummerieren kann. Es wird sich zeigen, dass dies bei der Menge der reellen Zahlen nicht möglich ist, dass es also in diesem Sinne sehr viel mehr“ irrationale als rationale Zahlen gibt. ” Eine Abzählung oder Nummerierung einer endlichen Menge M mit genau n Elementen bedeutet, dass jeder der Nummern oder Plätze 1, 2, 3, . . . , n genau ein Element zugeordnet wird und dass verschiedene Elemente verschiedene Nummern erhalten. Die Menge M besitzt dann genau n! = 1 · 2 · 3 · . . . · n verschiedene Nummerierungen. Denn f¨ ur Platz 1 gibt es n Möglichkeiten, f¨ ur Platz 2 gibt es dann noch n − 1 Möglichkeiten, f¨ ur Platz 3 gibt es dann noch n − 2 Möglichkeiten usw., f¨ ur Platz n − 1 gibt es dann noch 2 Möglichkeiten, f¨ ur Platz n gibt es dann nur noch eine Möglichkeit. Eine Nummerierung oder Abzählung der n-elementigen Menge M ist eine bijektive (umkehrbare) Abbildung der Menge {1, 2, 3, . . . , n} auf die Menge M . Die

IX.12 Abzählen von unendlichen Mengen

229

Elemente von M tragen hierbei ihre Nummer als Index. Nun kann man fragen, ob f¨ ur eine vorgelegte unendliche Menge M eine bijektive Abbildung von IN auf M existiert. Dann könnte man nämlich jedem Element von M eine Nummer erteilen, und die Elemente von M wären eindeutig anhand ihrer Nummer zu identifizieren. Dies bedeutet, dass die Elemente von M eine Folge bilden. Beispiel: Wir betrachten die Menge IN2 , also die Menge aller Gitterpunkte im Koordinatensystem, deren Koordinaten nat¨ urliche Zahlen sind. Dann kann man gemäß Fig. 1 eine Nummerierung von IN2 vornehmen, IN2 ist also nummerierbar. 6 r r r r r r r Die Folge der Paare nat¨ urlicher Zahlen be7 ginnt bei dieser Nummerierung mit (1,1), r r r r r r r 6 (2,1), (2,2), (1,2), (1,3), (2,3), (3,3), (3,2), r r r r r r r 5 (3,1), (4,1), . . . r r r r r r r 4 r r r r r r r Mit der Nummerierung von IN2 in Fig. 1 3 r r r r r r r erhält man auch eine Nummerierung der po2 r r r r r r r sitiven rationalen Zahlen, indem man der 1 a Bruchzahl mit ggT(a, b) = 1 das Zahlenb 1 2 3 4 5 6 7 ¨ paar (a, b) zuordnet. Ahnlich kann man auch Fig. 1: Nummerierung von IN2 Q nummerieren (Satz 1). Eine unendliche Menge M heißt abzählbar oder nummerierbar, wenn eine bijektive Abbildung von IN auf M existiert. Satz 1: Die Menge Q der rationalen Zahlen ist abzählbar.

r r r r r r r r

r r r r r r r r

r r r r r r r r

r4 r3 r r r r r r

6 r r r r r r r r r r r r r r r r

r r r r r r r r

r r r r r r r r

r r r r r 4r r r

r r r r r 5r r r

r r r r r6r r r

Beweis: Wir schreiben die rationalen Zahlen als Quotient zweier ganzer Zahlen, wobei der Nenner positiv ist und Zähler und Nenner Fig. 2: Nummerierung von ZZ2 teilerfremd sind. Eine Nummerierung von Q erhält man aus einer Nummerierung von ZZ2 , wie es in Fig. 2 angedeutet ist. 2 Mit P(M ) bezeichnet man allgemein die Menge aller Teilmengen der Menge M und nennt P(M ) die Potenzmenge von M . Insbesondere ist P(IN) die Menge aller Mengen, die aus nat¨ urlichen Zahlen bestehen, zuz¨ uglich der leeren Menge. Satz 2: Die Menge P(IN) ist nicht abzählbar. Beweis: Wir f¨ uhren die Annahme, die Menge aller Teilmengen von IN wäre abzählbar, auf einen Widerspruch zur¨ uck: Gäbe es eine Nummerierung von P(IN), dann gäbe es eine Folge A1 , A2 , A3 , . . . , in der jede Teilmenge von IN vorkommt. Wir betrachten nun die Teilmenge A von IN, die aus allen nat¨ urlichen Zahlen n mit n ∈ An besteht. Dann gilt A = An f¨ ur alle n ∈ IN. Dies widerspricht der Annahme, in der Folge A1 , A2 , A3 , . . . käme jede Teilmenge von IN vor. 2


230

Die Menge der endlichen Teilmengen von IN ist abzählbar (Aufgabe 3), also folgt aus Satz 2, dass schon die Menge der unendlichen Teilmengen von IN nicht abzählbar ist. Dies wollen wir im Beweis des folgenden Satzes verwenden. Satz 3: Die Menge IR der reellen Zahlen ist nicht abzählbar. Beweis: Wir können uns auf den Nachweis beschränken, dass die reellen Zahlen x mit 0 ≤ x < 1 eine nicht-abzählbare Menge bilden, weil dies dann erst recht f¨ ur IR gilt. Jede solche Zahl denken wir uns in ihrer 2-Bruchentwicklung geschrieben, also etwa x = (0, 01101010111101001 . . .)2 , wobei wir der Eindeutigkeit wegen abbrechende 2-Br¨ uche mit der Periode . . . 1 schreiben. Zu jeder solchen Zahl x bilden wir die (unendliche) Menge Ax ∈ P(IN), welche genau dann die Zahl n enthält, wenn auf der n-ten Nachkommastelle von x die Ziffer 1 steht. Damit ist eine bijektive Abbildung von {x ∈ IR | 0 ≤ x < 1} auf die Menge der unendlichen Teilmengen von IN gegeben. Da diese Menge nach der vorangehenden Bemerkung nicht abzählbar ist, ist auch die Menge aller x ∈ IR mit 0 ≤ x < 1 nicht abzählbar. 2

Aufgaben 1. Auf wie viele Arten kann man 8 Türme so auf ein Schachbrett stellen, dass kein Turm einen anderen bedroht“, dass also in jeder Zeile“ und jeder ” ” Spalte“ genau ein Turm steht ? ” 2. Fig. 3 zeigt eine Nummerierung von Nenner 6 IN2 . Diese erzeugt eine Nummerierung r r r r r r r 7 @ der Menge aller positiven rationalen r@ r r r r r r 6 Zahlen. Wie heißt die Zahl mit der @@ 4 r @r @r r r r r 5 Nummer 20? Welche Nummer trägt ? @ @ @ 5 r @r @r @r r r r 4 @ @ @ @ @ 3. Man zeige, dass die Menge der endlir @r @r @r @r r r 3 @ chen Teilmengen von IN abzählbar ist. r@ r@ r@ r@ r@ r r 2 @ @ @ @ @ @ Man beachte dabei, dass jede endliche r @r @ r @ r @ r @ r @ r 1 Teilmenge von IN eine größte nat¨ urliche

Z¨ ahler

Zahl enthält. ¨ 4. Man beweise die Uberabz¨ ahlbarkeit der

-

1 2 3 4 5 6 7 Fig. 3: Nummerierung von IN2

Menge der reellen Zahlen zwischen 0 und 1 anhand ihrer Dezimalbruchdarstellung (vgl. Satz 3).

5. Es sei {M1 , M2 , M3 , . . .} eine abzählbare Menge von Mengen, und jede dieser Mengen Mi sei abzählbar. Man zeige, dass dann auch die Vereinigungsmenge M1 ∪ M2 ∪ M3 ∪ . . . abzählbar ist.

X Differenzial- und Integralrechnung X.1 Stetige Funktionen Folgen reeller Zahlen sind definiert als Abbildungen von IN oder IN0 in IR. Nun wollen wir Abbildungen von IR in IR bzw. von Teilmengen von IR in IR betrachten, die man auch Abbildungen aus IR in IR nennt. Dabei treten völlig neue Fragestel¨ lungen auf. Beispielsweise kann man fragen, wie sich eine geringf¨ ugige Anderung der abzubildenden Zahl auf die Bildzahl auswirkt. Abbildungen aus IR in IR nennt man Funktionen, genauer Funktionen einer reellen Variablen mit reellen Werten. Mit den Methoden der in diesem Kapitel zu behandelnden Differenzialund Integralrechnung werden wir dann in Kapitel XI erneut Folgen und Reihen untersuchen, wobei die Glieder dieser Folgen oder Reihen Funktionen sind. Es sei f eine Abbildung einer Teilmenge Df von IR in IR. Jedem x ∈ Df ist dann eine reelle Zahl zugeordnet, die wir allgemein mit f (x) bezeichnen. Man schreibt f : Df −→ IR

und

f : x → f (x) f¨ ur x ∈ Df .

Ist Df = IN, dann ist f eine Zahlenfolge. Wir richten unser Augenmerk jetzt aber auf solche Abbildungen f , bei denen Df eine beliebige Teilmenge von IR ist, z. B. aus einem Intervall aus IR besteht. Dann heißt f eine Funktion mit der Definitionsmenge Df . Die Menge aller Bildelemente von f , also die Menge {y ∈ IR | es gibt ein x ∈ Df mit y = f (x)}, nennen wir die Bildmenge von f und bezeichnen sie mit f (Df ) oder auch mit Bf . Man nennt f (x) den Funktionsterm von f , die Gleichung y = f (x) zwischen x ∈ Df und dem jeweils zugeordneten Wert y ∈ Bf heißt Funktionsgleichung. Die Funktionen mit einer gemeinsamen Definitionsmenge D bilden bez¨ uglich der Addition (f + g)(x) = f (x) + g(x) und der Vervielfachung (rf )(x) = rf (x) (r ∈ IR) offensichtlich einen Vektorraum. Funktionen auf der Definitionsmenge D kann man auch multiplizieren: (f g)(x) = (x)g(x). Ist f (x) = 0 f¨ ur alle x ∈ Df , f

dann ist die Kehrfunktion von f durch

1 f

(x) =

1 (x ∈ Df ) definiert. f (x)

Diese algebraischen Aussagen u ¨ber Funktionen verallgemeinern die entsprechenden Aussagen u ¨ber Folgen, da Zahlenfolgen ja Funktionen mit einer speziellen Definitionsmenge (nämlich INoder IN0 ) sind. Auch viele weitere bei Folgen n¨ utzliche Begriffsbildungen lassen sich in naheliegender Weise auf Funktionen u ¨bertragen, z. B. Beschränktheit und Monotonie, so dass wir diese Begriffe hier nicht erneut formulieren m¨ ussen. Es seien nun f : Df −→ IR und g : Dg −→ IR zwei Funktionen mit Bg ⊆ Df . Dann kann man die Funktionen f und g hintereinanderschalten bzw. verketten.

X Differenzial- und Integralrechnung

232

Die Verkettung f nach g“ bezeichnet man mit f ◦ g. F¨ ur x ∈ Dg ist also ” (f ◦ g)(x) = f (g(x)). Das Verketten ist assoziativ: Sind f, g, h Funktionen mit Bh ⊆ Dg und Bg◦h ⊆ Df , dann gilt f¨ ur alle x ∈ Dh ((f ◦ g) ◦ h)(x) = (f ◦ g)(h(x)) = f (g(h(x))) = f ((g ◦ h)(x)) = (f ◦ (g ◦ h))(x). Das Verketten ist nicht kommutativ, wie schon das einfache Beispiel f (x) = x + 1, g(x) = x2 mit Df = Dg = IR zeigt: Es ist (f ◦ g)(x) = f (g(x)) = x2 + 1 und (g ◦ f )(x) = g(f (x)) = (x + 1)2 . ur alle x ∈ D die identische F¨ ur D ⊆ IR heißt die Funktion idD mit idD (x) = x f¨ Funktion auf D. Es gilt f ◦ idDf = idBf ◦ f = f f¨ ur jede Funktion f . Sind f, g zwei Funktionen mit Df = Bg und Dg = Bf sowie f ◦ g = idDg

und g ◦ f = idDf ,

dann heißen die Funktionen f und g invers zueinander und man schreibt f = g −1

bzw. g = f −1 .

Die Funktion f heißt dann auf Df umkehrbar, und f −1 heißt die Umkehrfunktion oder inverse Funktion zu f . (Man verwechsele die Umkehrfunktion f −1 nicht 1 mit der oben definierten Kehrfunktion .) Genau dann ist f umkehrbar, wenn f

f : Df −→ Bf bijektiv ist, wenn also zu jedem Element y ∈ Bf genau ein Element x ∈ Df existiert mit y = f (x). Beispiel 1: Die Quadratfunktion f : x → x2 ist nicht umkehrbar auf IR; es existiert nämlich f¨ ur a > 0 nicht genau eine Zahl b mit f (b) = a (also b2 = a); es existieren vielmehr stets zwei solche Zahlen. Schränkt man die Quadratfunktion aber auf die Definitionsmenge IR+ 0 der nichtnegativen reellen Zahlen ein, dann ist sie umkehrbar (Fig. 1). Ihre Umkehrfunktion ist die Quadratwurzelfunktion √ 3 f −1 : x → x mit der Definitionsmenge IR+ 0 . Die Funktion x → x ist√ebenfalls + auf IR0 umkehrbar; ihre Umkehrfunktion ist die Wurzelfunktion x → 3 x. Beispiel 2: Die auf IR \ {1} definierte Funktion x →

1 mit der Bildmenge 1−x

x−1 . Den Funktionsx 1 vertausche term der Umkehrfunktion gewinnt man folgendermaßen: In y = 1−x 1 x−1 man x und y und löse die Gleichung nach y auf: x = ⇒y= . 1−y x

IR\{0} ist umkehrbar (Fig. 2); ihre Umkehrfunktion ist x →

Beispiel 3: Die Funktion f : x →

1 ist auf IR+ 0 umkehrbar (Fig. 3); den 1 + x2

Term der Umkehrfunktion findet man durch Auflösen von x = f (y) nach y:

f −1 : x →

1−x x

mit Df −1 = Bf =]0; 1].

X.1 Stetige Funktionen

233

Beispiel 4: Die Umkehrfunktion der auf ihrer Definitionsmenge IR umkehrbaren Exponentialfunktion x → 2x ist die Logarithmusfunktion x → log2 x (Fig. 4), welche auf IR+ definiert ist. .. ... ...... . ... y = x2 .. ....... . .... .. ..... .. .... ... ......... .. ........ . 1... . . . . . √ .............. . ................ y = x . . . .. .. . .. ..... ... .. ................ ............. .. ......... . x . . 1 .. y6

Fig. 1

. y 6 ... . .... .. 1−x .... . . ..y = . x ...... .. .... .. .... . . . . . . . . . 1 ................ .. ..... ......... .... 1 .. . ....................y = 1 + x2 . . . . .. ................. .... .................. .... ... . . . . ... . . . . . . . . . x 1 .... Fig. 3

..y .. ...... ... . x − 1 .. 6.... .... . . . y= .. ... .... x .. .. .... ........ . . . .. ........................... . .. .... ..................................................................1........................................................................ ... .... ..... . ...x .... ......1 ... ... .... .... . . . . . . . . . . . . . . .. . 1 .... .. .... ... y = .... . . . . . 1 − x . . . . . . .. . .. ... ... .. Fig. 2

... y = 2x .... .... .... . . ... . . .... ... ....... y = log2 x . . ... ... ..... 1.......... ....... .. .... .... .... . . . . . . . . . . ............... ........ .. ... ... . x .... ...1 . . . . ... . . . . . . .... .. y6

Fig. 4

In Fig. 1 bis 4 sind die oben betrachteten Funktionen durch ihren Graph veranschaulicht. Dies ist die Darstellung der Punktmenge {(x, y) | x ∈ Df , y = f (x)} in einem kartesischen Koordinatensystem. In der Regel kann man nur einen Ausschnitt aus diesem Graph zeichnen. Den Graph nennt man auch ein Schaubild der Funktion. Die Graphen von f und f −1 liegen spiegelbildlich bez¨ uglich der Winkelhalbierenden des ersten Quadranten des Koordinatensystems. Satz 1: Eine auf einem Intervall streng monotone Funktion ist dort umkehrbar. Beweis: Die Funktion f sei auf dem Intervall Df = [a; b] streng monoton wachsend. Dann sind verschiedenen Werten aus [a; b] auch verschiedene Funktionswerte zugeordnet, denn aus a ≤ x1 < x2 ≤ b folgt f (a) ≤ f (x1 ) < f (x2 ) ≤ f (b). Die Funktion f : Df −→ Bf ist also bijektiv. (F¨ ur eine streng monoton fallende Funktion verläuft der Beweis analog.) 2 Man erkennt ebenso einfach, dass die Umkehrfunktion einer streng monoton wachsenden (fallenden) Funktion wieder streng monoton wachsend (fallend) ist.


234

Beispiel 5: Auf dem Einheitskreis (Kreis um den Ursprung des Koordinatensystems mit dem Radius 1) sei t die vom Punkt (1,0) aus gemessene Bogenlänge bis zu einem Punkt P des Kreises (Fig. 5). Dann bezeichnet man die Koordinaten des Punktes P mit cos t ( Kosinus t“) und sin t ( Sinus t“). Es ist also ” ” y

P = (cos t, sin t).

6

Zunächst liegt dabei t zwischen 0 und 2π. Wir erweitern die Definition von sin und cos auf alle reellen Zahlen durch die Festsetzung sin(t + z · 2π) = sin t cos(t + z · 2π) = cos t (z ∈ ZZ). Dann sind sin und cos auf IR definierte Funktionen mit der Periode 2π (Fig. 6, 7).

P...u.............................................. ...... t ......... ..... ...... .... .... ..... .... ... ... sin t ....... ..... ... ..... ... ... ... x ..... .. .................................... 1 cos t Fig. 5: Sinus und Kosinus

y

y

6

6

1 ... y = sin x.....................s..................... ... . ..... ... ....... . . . . . .. .... . . . .... sin t .... . . . .. ... x .... ....s . . . . t .... Fig. 6: Sinusfunktion

F¨ ur alle x ∈ IR gilt sin x +

.....1......s.......................y = cos x ...... ...... ...... ..... ..... ..... ..... ..s... . -x ..... -.... t ..... ...cos t ..... .. ...... ... Fig. 7: Kosinusfunktion

π 2

= cos x und cos x + π π

π 2

= − sin x.

Beschränkt man die Sinusfunktion auf das Intervall − ; , dann ist sie dort um2 2 kehrbar, weil sie dort streng monoton wächst; ihre Umkehrfunktion ist die Arkussinusfunktion arcsin, welche auf [−1; 1] definiert ist (Fig. 8). Die Kosinusfunktion ist auf [0; π] streng monoton fallend und daher umkehrbar. Ihre Umkehrfunktion ist die auf [−1; 1] definierte Arkuskosinusfunktion arccos (Fig. 9). Die Tangensfunktion

sin x 1 π | z ∈ ZZ mit Dtan = IR \ z + cos x 2 π π ist auf dem offenen Intervall − ; streng monoton wachsend und daher um2 2 kehrbar (Fig. 10). Ihre Umkehrfunktion auf diesem offenen Intervall ist die auf IR definierte Arkustangensfunktion arctan (Fig. 11). tan : x →


235

y6 ... π2

y 6 ... π .. ... y = arccos x ... ... .... ..... ...... .. π........ . 2 ....... .... ... ... ... ... x .. .−1 1

.. y = arcsin x ... . ... . . ..... ....... . . . . . -x . . −1 .......... 1 . ... .. . .. .. ...− π2 Fig. 8: Arkussinus

.. . .. .. . .. .. .. .. . .. . ... .. ....... . .. ....... ....... − π2 . .. .. .. .. ..

.. .. .. .. .. .. .. .. .. .. .. .. .. ..

Fig. 9: Arkuskosinus

y

. .. y = tan x .... . .. . . 1.. .... . .... ..... . . . . . π ..... 2 .... .. . . . . .... −1 .. ... .. 6

.. . .. .. .. ... .. .. . .. .. .. .. ..

y

.. .. .. .. .. .. .... ..... . . . . . . ... x .... . .. .. ... . .. .. .. ... . ... .. . ..

π 2

6

..... .... .... .... .... . ..... .......... y = arctan x ........... ..... .... . . -x . . −1 ....... 1 ... ....... . . . . . . . . ....... .. ..... ..... ..... ..... ..... − π2

Fig. 10: Tangens

Fig. 11: Arkustangens

Definition 1: Eine Funktion f sei auf dem halboffenen Intervall [a; b[ definiert, und f¨ ur jede Folge (xn ) mit Gliedern aus diesem Intervall und lim(xn ) = b sei lim(f (xn )) = r. Dann schreibt man lim f (x) = r

x→b−

und nennt dies den linksseitigen Grenzwert von f an der Stelle b. Analog definiert man den rechtsseitigen Grenzwert lim+ f (x) an der Stelle b, wenn f auf einem x→b

Intervall ]b; c] definiert ist. Ist die Funktion f auf [a; c] \ {b} definiert, wobei b ∈]a; c[, und gilt lim(f (xn )) = r f¨ ur jede Folge (xn ) aus [a; c] \ {b} mit dem Grenzwert b, dann spricht man vom Grenzwert von f an der Stelle b und schreibt lim f (x) = r.

x→b

(Man beachte, dass dabei b nicht zur Definitionsmenge gehören muss, aber Grenzwert einer Folge aus dieser sein muss.) Existiert der Grenzwert von f an der Stelle b, dann gilt nat¨ urlich lim− f (x) = lim f (x) = lim+ f (x). x→b

x→b

x→b


236

Beispiel 6: Es gilt lim+ xx = 1 : Ist (xn ) eine Folge positiver Zahlen mit dem x→0

Grenzwert 0, dann gibt es zu jedem n ∈ IN ein k ∈ IN mit

k k+1

1

k

·

1

1 k

k

=

1 k+1

1

k

< xxnn
0 die Funktion x → xα auf IR+ 0 streng monoton wächst, und dass √ f¨ ur 0 < β < 1 die Funktion x → β x auf IR+ 0 streng monoton fällt.) Wegen lim( n n) = 1 (vgl. Beispiel 10 in IX.4) folgt die Behauptung. Beispiel 7: Es gilt lim t→0

π sin t = 1. Denn an Fig. 12 erkennt man f¨ ur 0 < t < t 2

cos t sin t < t
0 ist stetig auf IR, wie man wegen bx = bx0 · bx−x0 sofort aus lim bh = 1 ersieht. Die Exponentialfunktionen sind h→0 also stetig auf IR. Damit sind auch die Logarithmusfunktionen stetig auf ihrer Definitionsmenge IR+ . Wegen xα = eα ln x ergibt sich damit auch die Stetigkeit aller Potenzfunktionen x → xα (α ∈ IR) auf IR+ . Die Funktionen, die aus den rationalen Funktionen, der Sinusfunktion, der Exponentialfunktion und ihren Umkehrfunktionen durch Addition, Multiplikation, Division und Verkettung (evtl. mit geeigneter Einschränkung der Definitionsbereiche) gewonnen werden können, nennen wir elementare Funktionen. Die obigen Beispiele besagen also, dass die elementaren Funktionen auf ihren Definitionsmengen stetig sind. (Der Begriff der elementaren Funktion“ ist hier nur sehr ” vage erklärt, eine präzise Definition ist aber sehr kompliziert.)


239

Die Stetigkeit einer Funktion an einer Stelle x0 besagt, dass sich bei einer ge¨ ringf¨ ugigen Anderung des Arguments x auch der Funktionswert f (x) nur geringf¨ ugig a¨ndert: |x − x0 | klein“ =⇒ |f (x) − f (x0 )| klein“. Man kann also ” ” |f (x) − f (x0 )| beliebig klein machen, wenn man nur |x − x0 | hinreichend klein wählt. Zu jedem ε > 0 kann man also ein δ > 0 finden, so dass gilt: |x − x0 | < δ =⇒ |f (x) − f (x0 )| < ε. Dabei hängt die Wahl von δ nat¨ urlich außer von ε noch von f und x0 ab. √ ur ein ε > 0 Beispiel 18: Die Funktion x → x ist an der Stelle 7 stetig. Es gilt f¨ √ √ |x − 7| √ < ε, | x − 7| = √ x+ 7 √ √ wenn |x − 7| < ε · ( x + 7) ist. wir die Funktion nur im Intervall √ Betrachten √ [6; 8], dann können wir δ = ε · ( 8 + 7) wählen. Stetige Funktionen haben zwei wichtige Eigenschaften, die wir in den beiden nun folgenden Sätzen behandeln wollen. Satz 4 (Zwischenwertsatz ): Die Funktion f sei auf dem Intervall I stetig und nehme dort die Werte α und β an. Dann nimmt f auf dem Intervall I auch jedem Wert γ zwischen α und β an. Beweis: Es sei α = f (a) und β = f (b). Es ist keine Beschränkung der Allgemeinheit, a < b und α < β anzunehmen. Wir betrachten die Intervallschachtelung mit [a0 , b0 ] = [a; b] und ⎧ an + bn a +b ⎪ ⎪ ⎪ , falls f n n ≥ γ, ⎨ an ; 2 2 [an+1 ; bn+1 ] = ⎪ a +b ⎪ an + bn ⎪ ; bn , falls f n n < γ. ⎩ 2 2

f¨ ur n ∈ IN0 . Diese Intervallschachtelung besitzt einen Kern c ∈ [a, b]. Es gilt wegen der Stetigkeit von f an der Stelle c lim(f (an )) = f (lim(an )) = f (c) und

lim(f (bn )) = f (lim(bn )) = f (c),

wegen f (an ) ≤ γ ≤ f (bn ) f¨ ur alle n ∈ IN folgt also f (c) = γ.

2

Beispiel 19: Die Gleichung x4 + 2x3 − x2 + 7x = 19 besitzt mindestens eine Lösung zwischen 1 und 2, denn f¨ ur f (x) = x4 + 2x3 − x2 + 7x gilt f (1) = 9 < 19 < 42 = f (2). Satz 5 (Satz vom Minimum und Maximum): Ist f auf dem abgeschlossenen Intervall [a; b] stetig, dann existieren u, v ∈ [a; b] mit f (u) ≤ f (x) ≤ f (v) f¨ ur alle x ∈ [a; b].


240

Beweis: Wir betrachten eine Intervallschachtelung mit [a0 ; b0 ] = [a; b] und ⎧ an + bn ⎪ ⎪ ⎪ a ; , falls ein x ∈ n ⎪ ⎪ 2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ f (x) ≤ f (ξ) ⎨ [an+1 ; bn+1 ] = ⎪ an + bn ⎪ ⎪ ; bn , falls ein x ∈ ⎪ ⎪ ⎪ 2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ f (x) ≤ f (ξ) ⎩

an ;

an + bn 2

existiert mit

f¨ ur alle ξ ∈

an + bn ; bn 2

an + bn ; bn , 2

existiert mit

f¨ ur alle ξ ∈ an ;

an + bn 2

f¨ ur n ∈ IN0 . (Sind dabei beide Bedingungen erf¨ ullt, so entscheide man sich willk¨ urlich f¨ ur eines der Intervalle. Mindestens eine der Bedingungen ist erf¨ ullt, weil abgeschlossene Intervalle vorliegen.) Ist u der Kern dieser Intervallschachtelung, dann gilt aufgrund der Stetigkeit von f (vgl. Beweis von Satz 4) f (u) ≤ f (ξ) f¨ ur alle ξ ∈ [a; b]. Damit ist bewiesen, dass f auf [a; b] ein Minimum annimmt; ebenso zeigt man, dass f auf [a; b] ein Maximum annimmt. 2 Definition 2: Es sei f definiert auf dem offenen Intervall ]a; b[ und a eine Definitionsl¨ ucke von f . Wenn f (x) unbeschränkt wächst, falls x sich der Stelle a von rechts nähert, wenn also zu jedem M ∈ IR ein ε > 0 existiert, so dass f (x) > M f¨ ur alle x mit 0 < x − a < ε, dann schreiben wir lim+ f (x) = +∞ und nennen x→a

die Gerade mit der Gleichung x = a eine (senkrechte) Asymptote von f . Analog ist lim+ f (x) = −∞, lim− f (x) = +∞ und lim+ f (x) = −∞ zu verstehen. x→a

x→b

x→b

Beispiel 20: Die rationale Funktion f mit f (x) =

1 hat Definiti(x − 1)(x − 2)

onsl¨ ucken an den Stellen 1 und 2. Es gilt lim f (x) = +∞,

x→1−

lim f (x) = −∞,

x→1+

lim f (x) = −∞,

x→2−

lim f (x) = +∞.

x→2+

Definition 3: Es sei f definiert auf dem unbeschränkten Intervall ]a; +∞[. Wenn lim f (x) existiert und den Wert c hat, dann nennen wir die Gerade mit der

x→+∞

Gleichung y = c eine (waagerechte) Asymptote von f f¨ ur x → +∞. Analog ist eine waagerechte Asymptote f¨ ur x → −∞ erklärt. 2x2 + 1

Beispiel 21: Die Funktion f mit f (x) = 2 hat sowohl f¨ ur x → +∞ als x +7 auch f¨ ur x → −∞ die Asymptote mit der Gleichung y = 2. Definition 4: Es sei f definiert auf dem unbeschränkten Intervall ]a; +∞[. Existieren u, v ∈ IR mit lim (f (x) − (ux + v)) = 0, dann nenen wir die Gerade mit x→+∞

der Gleichung y = ux + v eine (schräge) Asymptote von f f¨ ur x → +∞. Analog ist eine schräge Asymptote f¨ ur x → −∞ erklärt.


241

Beispiel 22: Die Funktion f mit f (x) =

2x3 + x2 + 3x + 1 hat sowohl f¨ ur x → +∞ x2 + 1

als auch f¨ ur x → −∞ die Asymptote mit der Gleichung y = 2x + 1. Dies erkennt man an der Termumformung

2x3 + x2 + 3x + 1 x = 2x + 1 + 2 . x2 + 1 x +1

Definition 5: Sind f und g auf dem unbeschränkten Intervall ]a; +∞[ definiert und gilt lim (f (x) − g(x)) = 0, dann sagt man, f und g haben f¨ ur x → +∞ das x→+∞ gleiche asymptotische Verhalten bzw. f ist asymptotisch gleich g bzw. umgekehrt. Beispiel 23: Die Funktion f mit f (x) =

x4 + 4x3 + 3x2 verhält sich asymptotisch x+1

f¨ ur x → +∞ wie die Funktion g mit g(x) = x2 + 3x2 . Dies erkennt man an der Termumformung

x4 + 4x3 + 3x2 1 = x3 + 3x2 + . x+1 x+1

Aufgaben 1. a) Die Funktion f sei auf einem Intervall I definiert. Man beweise: Existiert eine Konstante L mit |f (x1 ) − f (x2 )| ≤ L|x1 − x2 | f¨ ur alle x1 , x2 ∈ I, dann ist f auf I stetig. b) Man bestimme eine möglichst kleine Konstante gemäß a): 1 , I = [3; 4] x(x − 2) √ (3) f (x) = x x, I = [1; 2] (1) f (x) =

x2 + 1 , I = [−1; 1] x2 − 2 √ 3 (4) f (x) = x2 , I = [1; 2]

(2) f (x) =

2. Man zeige, dass die Funktion f : x → x5 +4x4 −7x3 −9x2 −5x+7 mindestens eine Nullstelle besitzt. Zeige, dass eine solche zwischen 0 und 1 liegt.

3. Man bestimme die Unstetigkeitsstellen der Funktion f auf dem Intervall I: 1 (1) f (x) = x + 1 , I =]0; 1[ x

(2) f (x) =

5[x2 ] , I = IR+ [x] + 1

√

4. Man bestimme δ > 0 so, dass | x − 1 − 2| < 10−6 für alle x mit |x − 5| < δ.

5. Die Funktion f sei auf IR definiert durch f (x) =

x, falls x ∈ Q, x2 , falls x ∈ Q.

An welchen Stellen ist diese Funktion stetig?

6. Man bestimme die Asymptoten von f : x → tion, die sich asymptotisch wie f verhält.

x4 + 1 und eine Polynomfunkx2 − 1


242

X.2 Die Ableitung einer Funktion Es sei — wie man in Anwendungsbereichen der Mathematik oft sagt — ein funktionaler Zusammenhang y = f (x) zwischen zwei Größen gegeben, f¨ ur deren Werte die Variablen x, y stehen. Ist die Funktion f stetig, so kann man sagen, dass klei¨ ¨ ne Anderungen von x auch nur kleine Anderungen von y bewirken, dass sich y ¨ also nicht sprunghaft“ ändern kann. Nun wollen wir die relative Anderung von ” y bez¨ uglich x an einer Stelle x0 des Definitionsbereichs von f näher untersuchen, also den Quotient y6 y = f (x) f (x) − f (x0 ) f¨ ur x = x0 . .... x − x0 ... . . ... Dieser Differenzenquotient hat, als ... Tangente . . y .. Funktion von x betrachtet, an der Stel ... . . Sekante . . le x0 eine Definitionsl¨ ucke. Wenn nun . . . . .... ................... der Grenzwert ..... f (x) − f (x0 ) ..... . . . . . ........ ......tr. .. y0 f (x) − f (x0 ) ...... ...... x − x0 lim =A x→x0 x − x0 existiert, dann können wir sagen, dass in einer hinreichend kleinen Umgebung von x0 die Näherung f (x) − f (x0 ) ≈ x A · (x − x0 ) bzw. x0 x f (x) ≈ f (x0 ) + A · (x − x0 ) Fig. 1: Definition der Ableitung hinreichend gut ist. Unter einer Umgebung von x0 verstehen wir dabei ein Intervall mit dem Mittelpunkt x0 ; ist die Länge diese Intervalls hinreichend klein“, dann nennen wir ” die Umgebung hinreichend klein“. Am Graph der Funktion f kann man den f (x) −”f (x0 ) Quotient als Steigung der Sekante durch die Punkte (x, f (x)) und x − x0

(x0 , f (x0 )) deuten. Wandert der Punkt (x, f (x)) auf den Punkt (x0 , f (x0 )) zu, dann wird diese Sekante zur Tangente an den Graph im Punkt (x0 , f (x0 )). Die Zahl f (x0 ) ist also die Tangentensteigung an der Stelle x0 (vgl. Fig. 1). Definition 1: Die Funktion f sei in dem offenen Intervall ]a; b[ definiert und es sei x0 ∈ ]a; b[. Existiert der Grenzwert f (x) − f (x0 ) , x − x0 dann nennt man ihn die Ableitung von f an der Stelle x0 und bezeichnet ihn mit f (x0 ). Man nennt dann die Funktion differenzierbar an der Stelle x0 . lim

x→x0

Ist f an der Stelle x0 differenzierbar, so bedeutet dies, dass der Graph von f im Punkt (x0 , f (x0 )) eine Tangente besitzt und dass diese nicht parallel zur y-Achse ist (Steigung unendlich“). ”

X.2 Die Ableitung einer Funktion

243

Existiert nur der rechtsseitige oder nur der linksseitige Grenzwert des Differenzenquotienten an einer Stelle x0 , dann nennt man diese einseitigen Grenzwerte die entsprechenden einseitigen Ableitungen der Funktion an dieser Stelle und spricht von einseitiger Differenzierbarkeit. Ist f an der Stelle x0 differenzierbar, dann ist f dort auch stetig, denn der Grenzf (x) − f (x0 ) f¨ ur x → x0 kann nur existieren, wenn x→x lim f (x) = f (x0 ) wert von x − x0

0

gilt. Die Umkehrung ist falsch: Die Betragsfunktion x → |x| ist an der Stelle 0 stetig, aber nicht differenzierbar: lim+

x→0

|x| − |0| x = lim+ = +1 und x→0 x x−0

lim−

x→0

|x| − |0| −x = lim− = −1. x→0 x−0 x

Definition 2: Das Berechnen der Ableitung oder der Ableitungsfunktion nennt man auch Differenzieren oder Differenziation der Funktion. Man nennt die auf Df \ {x0 } definierte Funktion x →

f (x) − f (x0 ) x − x0

den Differenzenquotient von f an der Stelle x0 und schreibt daf¨ ur x →

Δf (x0 , x). Δx

Die Ableitung f (x0 ) von f an der Stelle x0 — also den Grenzwert des Differenzenquotienten von f an der Stelle x0 — nennt man auch den Differenzialquotient df von f an der Stelle x0 und schreibt f¨ ur diese Zahl auch (x0 ). dx

df

Die lineare Funktion x → (x0 ) · (x − x0 ) nennt man das Differenzial von f an dx der Stelle x0 . Ist die Funktion f an jeder Stelle ihrer Definitionsmenge Df differenzierbar, dann nennt man die Funktion auf Df differenzierbar. Die Funktion x → f (x) nennt man die Ableitungsfunktion von f . Ist die Ableitungsfunktion von f stetig, dann heißt f stetig differenzierbar (an einer Stelle bzw. auf der Definitionsmenge). Beispiel 1: Jede konstante Funktion ist auf IR differenzierbar, ihre Ableitungsfunktion ist die Nullfunktion. Beispiel 2: Die identische Funktion x → x ist u ¨berall auf IR differenzierbar; ihre Ableitungsfunktion ist die konstante Funktion mit dem Wert 1. Beispiel 3: Wir wollen die Ableitung der Sinusfunktion an der Stelle x0 ∈ IR berechnen. Zu diesem Zweck setzen wir x = x0 + h und betrachten in dem Differenzenquotient sin(x0 + h) − sin x0 h den Grenz¨ ubergang h → 0. Wegen sin(x0 + h) = sin x0 cos h + cos x0 sin h lässt cos h − 1 sin h + cos x0 · . Es gilt sich der Differenzenquotient umformen zu sin x0 · h

h


244 1 − cos h

sin h

= 0 und lim = 1 (vgl. X.1). Daher ergibt sich als Ableitung von lim h h→0 h sin an der Stelle x0 der Wert cos x0 . Die Ableitungsfunktion der Sinusfunktion ist somit die Kosinusfunktion. h→0

Beispiel 4: Es soll die Ableitungsfunktion der Exponentialfunktion x → ex bestimmt werden, wobei e die eulersche Zahl sein soll. Dabei wollen wir uns hier mit einer heuristischen Argumentation begn¨ ugen, ein exakter Beweis soll in Aufgabe 9 gef¨ uhrt werden (vgl. auch X.5). Es ist ex+h − ex eh − 1 = ex · . h h

n 1 1 mit einem hinreichend großen n und setzen h = , n n −1 eh − 1 = 1. Dies zeigt, dass lim = 1 ist. Also ist h h→0

Ersetzen wir e durch 1 + dann ist

1+ eh − 1 ≈ h

1 n 1 n

(ex ) = ex , die Exponentialfunktion ist also gleich ihrer Ableitungsfunktion.

Aufgrund der Ableitungsregeln, die wir nun behandeln, können wir die meisten Funktionen, die uns in der Analysis begegnen, mit Hilfe der vier in diesen Beispielen behandelten Funktionen differenzieren. Zur Vereinfachung der Formeln sprechen wir in Satz 1 einfach von der Stelle x“, im Beweis werden wir die ins ” Auge gefasste Stelle aber wieder x0 nennen. Satz 1: Die Funktionen f, g seien an der Stelle x ∈ ]a; b[ ⊆ Df ∩Dg differenzierbar. Dann gelten die folgenden Regeln: Summenregel : f + g ist an der Stelle x differenzierbar, und es ist (f + g) (x) = f (x) + g (x). Produktregel : f · g ist an der Stelle x differenzierbar, und es ist (f · g) (x) = f (x) · g(x) + f (x) · g (x). Kehrwertregel : Ist f (x) = 0, dann ist und es ist

1 ist an der Stelle x differenzierbar f

1 f

(x) = −

f (x) . (f (x))2

Kettenregel : Ist f an der Stelle g(x) ∈ ]c; d[ ⊆ Df differenzierbar, dann ist f ◦ g an der Stelle x differenzierbar und (f ◦ g) (x) = f (g(x)) · g (x). Umkehrregel : Ist f auf ]a; b[ ⊆ Df umkehrbar und f (x) = 0, dann ist f −1 ist an der Stelle f (x) differenzierbar und es ist 1 (f −1 ) (f (x)) = . f (x)


245

Beweis: Die Summenregel folgt aus der entsprechenden Grenzwertregel: lim

x→x0

(f (x) + g(x)) − (f (x0 ) + g(x0 )) f (x) − f (x0 ) g(x) − g(x0 ) = x→x lim + x→x lim . 0 0 x − x0 x − x0 x − x0

Zum Beweis der Produktregel macht man den Ansatz (f (x) − f (x0 ))g(x0 ) + (g(x) − g(x0 )f (x)) f (x)g(x) − f (x0 )g(x0 ) = x − x0 x − x0 f (x) − f (x0 ) g(x) − g(x0 ) = g(x0 ) + f (x), x − x0 x − x0 der durch die Skizze in Fig. 2 nahegelegt wird. Der Grenz¨ ubergang x → x0 liefert aufgrund der Grenzwertregeln die Produktregel. Die Kehrwertregel ergibt sich aus der Umformung 1 1 − f (x) − f (x0 ) f (x) f (x0 ) =− . x − x0 f (x)f (x0 )(x − x0 )

-

g(x)

6 6

f (x)

g(x0 )

-

f (x0 )

? ?

Fig. 2: Herleitung der Produktregel

Dabei muss man beachten, dass eine an der Stelle x0 stetige Funktion mit f (x0 ) = 0 in einem geeigneten offenen Intervall um x0 nicht den Wert 0 annimmt. Der Beweis der Kettenregel beruht auf der Umformung f (g(x)) − f (g(x0 )) f (g(x)) − f (g(x0 )) g(x) − g(x0 ) · = . x − x0 g(x) − g(x0 ) x − x0 Man muss dabei aber voraussetzen, dass ein offenes Intervall um x0 existiert, in welchem g(x) = g(x0 ) gilt; unter dieser Voraussetzung ergibt sich die Kettenregel sofort durch den Grenz¨ ubergang x → x0 . Ist diese Voraussetzung aber nicht erf¨ ullt, dann ist sowohl g (x0 ) = 0 als auch f (g(x0 )) = 0, so dass auch in diesem Fall die Kettenregel gilt. Die Umkehrregel ergibt sich schließlich durch Grenz¨ ubergang in der Formel f −1 (f (x)) − f −1 (f (x0 )) x − x0 1 = = . f (x) − f (x0 ) f (x) − f (x0 ) f (x) − f (x0 ) x − x0 Aus den Regeln in Satz 1 ergeben sich weitere n¨ utzliche Ableitungsregeln: Die Faktorregel (cf ) (x) = cf (x) f¨ ur c ∈ IR folgt aus der Produktregel, ist aber auch unmittelbar einsichtig. Die Quotientenregel

f g

(x) =

f (x)g(x) − f (x)g (x) (g(x))2


246

folgt aus der Produktregel und der Kehrwertregel. In der folgenden Tabelle sind alle Regeln nochmals in Kurzform zusammengestellt.

(f + g) = f + g (f g) = f g + f g (cf ) = cf

1 f

f g

= −

f f2

f g − f g = g2

(f ◦ g) = (f ◦ g) · g (f −1 ) =

f

1 ◦ f −1

Beispiel 5 (Differenziation der rationalen Funktionen ): Die Potenzfunktionen x → xn mit n ∈ IN, n = 1 lassen sich mit Hilfe der Produktregel differenzieren: Aus (xn ) = (xn−1 · x) = (xn−1 ) · x + xn−1 · 1 ergibt sich mit vollständiger Induktion (xn ) = n · xn−1 . Aufgrund der Summenregel und der Faktorregel lässt sich nun jede ganzrationale Funktion (Polynomfunktion) differenzieren: (an xn + . . . + ai xi + . . . a1 x + a0 ) = nan xn−1 + . . . + iai xi−1 + . . . + a1 . Die Quotientenregel erlaubt dann die Differenziation jeder rationalen Funktion, also jeder Funktion, die Quotient zweier ganzrationaler Funktionen ist. Die spe1 zielle rationale Funktion x → n mit n ∈ IN differenziert man mit Hilfe der x Kehrwertregel: nxn−1 n 1 = − n 2 = − n+1 . n x (x ) x Es gilt also (xz ) = z · xz−1

f¨ ur alle z ∈ ZZ.

Beispiel 6 (Differenziation der allgemeinen Potenzfunktion ): Die in Beispiel 5 gewonnene Regel f¨ ur die Differenziation der Potenzfunktionen mit ganzzahligen Exponenten gilt auch f¨ ur reelle Exponenten, wie man mit Hilfe der Kettenregel erkennt: 1 1 (xα ) = (eα ln x ) = eα ln x · α · = α · xα · = α · xα−1 . x x Dabei haben wir die Ableitung der Umkehrfunktion ln von x → ex benutzt, welche man mit Hilfe der Umkehrregel gewinnt: (ln x) =

1 1 = . eln x x


247

Beispiel 7 (Differenziation der trigonometrischen Funktionen ): Die Kosinusfunktion differenziert man mit Hilfe der Sinusfunktion und der Kettenregel:

(cos x) = sin x +

π 2

= cos x +

π 2

= − sin x.

Die Ableitung der Tangensfunktion gewinnt man dann aus der Quotientenregel: (tan x) =

sin x cos x

=

cos x · cos x − (− sin x) · sin x 1 = 2 (cos x) cos2 x

Ferner gilt auf den jeweiligen Definitionsmengen wegen (f −1 ) =

1 f ◦ f −1

1 , denn cos(arcsin x) = 1 − sin2 (arcsin x) 1 − x2 1 , denn − sin(arccos x) = − 1 − cos2 (arccos x) (arccos x) = − √ 1 − x2 1 1 , denn cos2 (arctan x) = (arctan x) = 1 + x2 1 + tan2 (arctan x)

(arcsin x) = √

Ist die Ableitungsfunktion f einer Funktion f selbst wieder differenzierbar, so kann man ihre Ableitungsfunktion (f ) bilden; diese bezeichnet man mit f und nennt sie die zweite Ableitungsfunktion bzw. zweite Ableitung von f . Analog kann man die dritte, vierte, . . . Ableitung definieren. Allgemein bezeichnet man die nte Ableitung von f mit f (n) . Existiert die nte Ableitung einer Funktion, dann nennt man sie n-mal differenzierbar.

Aufgaben 1. Man berechne die Ableitungsfunktion der folgenden Funktionen: x a) x → 1 + x2

b) x →

5

1 1+x

c) x → x7 ex

2

d) x → (x2 +1)x

2 +1

2. a) Man zeige, dass die Funktion

f : x →

x2 x3

f¨ ur x ≥ 0 f¨ ur x < 0

an der Stelle 0 stetig differenzierbar, aber nicht zweimal differenzierbar ist. b) Man konstruiere eine Funktion, die an der Stelle 1 zwar n-mal, aber nicht (n + 1)-mal differenzierbar ist.


248

3. Man zeige, dass die Funktion f : x → ae−x + be−2x für alle a, b ∈ IR der Differenzialgleichung

f + 3f + 2f = 0

gen¨ ugt. Man bestimme Funktionen f , die folgender Differenzialgleichung gen¨ ugen: f − 2f − f + 2f = 0

4. Es seien vier Punkte A(−7, 24), B(2, 6), C(4, −1), D(6, −11) gegeben. Man bestimme eine ganzrationale Funktion f vom Grad 3 so, dass der Graph von f die Strecken AB und CD zwischen B und C glatt verbindet.

5. Beim Straßenbau ist es wichtig, dass sich an den Nahtstellen zweier Kurvenst¨ ucke der Kr¨ ummungsradius nicht unstetig ändert, damit sich die Zentrifugalkräfte nicht unstetig ändern (vgl. Kapitel XII). Sind die Kurvenst¨ ucke Teile von zwei Funktionsgraphen, dann m¨ ussen an der Nahtstelle neben den Funktionswerten und den Werten der Ableitungen auch die Werte der zweiten Ableitungen u ¨bereinstimmen. y 6 Man verbinde die Endpunkte der 1.... .... ....u...................... beiden Halbgeraden .. .. .. .. .. . {(x, y) | x ≤ −1, y = −1}, x −1 .. .. 1 . . . {(x, y) | x ≥ 1, y = 1} . . .........................u.. −1.... in diesem Sinne mit Hilfe einer Polynomfunktion von möglichst kleinem Grad (Fig. 3).

Fig. 3: Zu Aufgabe 5

6. Die Funktionen f, g, h seien auf einem Intervall ]a; b[ differenzierbar und sollen dort keine Nullstelle haben. Man zeige, dass (f gh) f g h = + + f gh f g h auf ]a; b[ gilt. Man verallgemeinere diese Regel.

7. Die Funktionen f und g seien n-mal differenzierbar. Man beweise die leibnizsche Regel

(n)

(f · g)

=

n n i=0

i

· f (i) · g (n−i) .

8. Man bestimme alle Funktionen f auf IR mit a) f (x) · f (x) = x

b)

f (x) = x2 f (x)

c)

f (x) − f (x)

f (x) f (x)

2

= x3


249 h

9. In dieser Aufgabe soll gezeigt werden, dass lim e h→0

−1 = 1. h

n n+1 1 1 <e< 1+ f¨ ur alle n ∈ IN. a) Man zeige, dass 1 + n n 1 1 ur alle n ≥ 2. b) Man zeige, dass n 1 + < 1 + 2 f¨ n n 1 n 1 1 + − 1 = 1. c) Man zeige, dass n→∞ lim n 1 + n n

d) Man beweise die eingangs genannte Grenzwertbeziehung.

10. Die auf IR definierten Funktionen sinh : x →

.. ...6 ... . ... ... .... 1 ... ..... .. .. .. .......... .. ..-x 1 .. ... ... ..... ... ... ... ... .. y

ex − e−x , 2

ex + e−x 2 haben ähnliche Eigenschaften wie die trigonometrischen Funktionen sin und cos. Man nennt sie hyperbolische Funktionen (Sinushyperbolicus, Cosinushyperbolicus), vgl. Fig. 4, 5. Der Graph von cosh heißt Kettenlinie. a) Man zeige, dass cosh : x →

sinh = cosh

und

Fig. 4: Sinushyperbolicus y6 ... .. ... . . . . . ... ... ... .... ... .... ..... ..... ..............

cosh = sinh .

b) Man zeige, dass f¨ ur alle x ∈ IR gilt:

..

cosh2 x − sinh2 x = 1

..

1

..

1

..-x

c) Welche Kurve wird durch

x a cosh t (x, y) | = , t ∈ IR y b sinh t

mit a, b > 0 dargestellt? d) Die Funktion tanh mit tanh =

sinh cosh

heißt Tangenshyperbolicus (Fig. 6). Man bestimme die Ableitungsfunktion.

Fig. 5: Cosinushyperbolicus y

6

1 .... ............................. ....

. ...... .. ......... .. ..... 1 ....... .... ...................... .... .... −1 ..

..-

x

Fig. 6: Tangenshyperbolicus


250

X.3 Die Mittelwerts¨ atze der Differenzialrechnung Wir beweisen nun eine Reihe von Sätzen u ¨ber differenzierbare Funktionen, welche f¨ ur die Anwendungen der Differenzialrechnung von großer Bedeutung sind. Satz 1 (Satz u ¨ber das lokale Extremum): Die Funktion f sei differenzierbar an der Stelle x0 ∈ ]a; b[ ⊆ Df und es gelte ur alle x ∈ ]a; b[ oder f (x) ≥ f (x0 ) f¨ ur alle x ∈ ]a; b[ f (x) ≤ f (x0 ) f¨ (f hat an Stelle x0 ein lokales Maximum oder ein lokales Minimum). Dann gilt f (x0 ) = 0. Beweis: Es gen¨ ugt, den Fall zu betrachten, dass an der Stelle x0 ein lokales Maximum vorliegt, andernfalls untersuche man die Funktion −f . Die Behauptung folgt dann aus 0 ≤ lim

n→∞

f x0 −

1 n

−

− f (x0 )

1 n

f x0 +

= f (x0 ) = lim

n→∞

1 − f (x0 ) n ≤ 0. 1 n

2

Satz 2 (Satz von Rolle (nach Michel Rolle, 1652–1719)): Die Funktion f sei stetig auf dem abgeschlossenen Intervall [a; b] ⊆ Df und differenzierbar auf dem offenen Intervall ]a; b[. Ist f (a) = f (b), dann existiert eine Zahl ξ ∈ ]a; b[ mit f (ξ) = 0. ur alle x ∈ ]a; b[. Andernfalls Beweis: Ist f konstant auf [a; b], dann ist f (x) = 0 f¨ existiert nach Satz 5 aus X.1 eine Stelle ξ ∈ ]a; b[, an welcher f ein Extremum (Maximum, Minimum) annimmt. Nach Satz 1 gilt dann f (ξ) = 0. 2 Satz 3 (1. Mittelwertsatz der Differenzialrechnung): Die Funktion f sei stetig auf [a; b] ⊆ Df und differenzierbar auf ]a; b[. Dann existiert ein ξ ∈ ]a; b[ mit f (b) − f (a) = f (ξ). b−a Beweis: Man wende auf die Funktion

y

f (b) − f (a) · (x − a) x → f (x) − b−a den Satz von Rolle an.

6

2

Der 1. Mittelwertsatz besagt anschaulich, dass zu jeder Sekante eines Funktionsgraphen eine zu ihr parallele Tangente existiert, falls die Funktion im betrachteten Bereich differenzierbar ist (Fig. 1).

...........................y.q....= f (x) ....... . . . q . . . . . .. ..... .. . . . . ... .. .. .q .. -

a

ξ

b

Fig. 1: 1. Mittelwertsatz

x

X.3 Die Mittelwertsätze der Differenzialrechnung

251

Aus dem 1. Mittelwertsatz folgen weitere interessante Sätze u ¨ber differenzierbare Funktionen. Diese sind oft ebenso evident“ wie der Mittelwertsatz selbst. ” Satz 4: Die Funktion f sei stetig auf [a; b] ⊆ Df und differenzierbar auf ]a; b[. Gilt f (x) = 0 f¨ ur alle x ∈ ]a; b[, dann ist f konstant auf [a; b]. Beweis: F¨ ur jedes x0 ∈ ]a; b[ existiert nach Satz 3 ein ξ0 ∈ ]a; x0 [ mit f (x0 ) − f (a) = f (ξ0 ). x0 − a Aus f (ξ0 ) = 0 folgt f (x0 ) = f (a).

2

Satz 5: Die Funktionen f und g seien stetig auf [a; b] ⊆ Df ∩ Dg und differenzierbar auf ]a; b[. Gilt f (x) = g (x) f¨ ur alle x ∈ ]a; b[, dann unterscheiden sich f und g nur durch eine additive Konstante. Beweis: Man wende Satz 4 auf die Funktion f − g an.

2

Satz 6 (Monotoniekriterium): Die Funktion f sei stetig auf [a; b] ⊆ Df und differenzierbar auf ]a; b[. Nimmt f auf ]a; b[ nur positive (nur negative) Werte an, dann ist f auf [a; b] streng monoton wachsend (fallend). Beweis: Wir nehmen an, f habe nur positive Werte auf ]a; b[ (im anderen Fall betrachte man −f ). F¨ ur a ≤ x1 < x2 ≤ b existiert nach dem 1. Mittelwertsatz ein ξ ∈]x1 ; x2 [ mit f (x2 ) − f (x1 ) = f (ξ)(x2 − x1 ), und diese Zahl ist positiv. 2 Satz 7 (2. Mittelwertsatz der Differenzialrechnung): Die Funktionen f und g seien ur stetig auf [a; b] ⊆ Df ∩ Dg und differenzierbar auf ]a; b[. Ist g (x) = 0 f¨ alle x ∈ ]a; b[, dann gibt es ein ξ ∈ ]a; b[ mit f (ξ) f (b) − f (a) = . g(b) − g(a) g (ξ) Beweis: Zunächst beachte man, dass aufgrund des Satzes von Rolle g(a) = g(b). Nun wende man auf die Funktion x → f (x) −

f (b) − f (a) · (g(x) − g(a)) g(b) − g(a) 2

den Satz von Rolle an.

Satz 8 (1. Regel von de L’Hospital): Die Funktionen f und g seien stetig auf ur [a; b] ⊆ Df ∩ Dg und differenzierbar auf ]a; b[, und es sei g (x) = 0 f¨ alle x ∈ ]a; b[. Ist f (b) = g(b) = 0 und existiert der linksseitige Grenzwert von

f (x) an der Stelle b, dann ist g (x)

lim−

x→b

f (x) f (x) = lim− . g(x) x→b g (x)


252

Beweis: F¨ ur x ∈]a; b[ existiert nach dem 2. Mittelwertsatz ein ξ ∈]x; b[ mit f (x) − f (b) f (ξ) f (x) = = . g(x) g(x) − g(b) g (ξ) Aus x < ξ < b folgt die Behauptung Man beachte dabei, dass wegen g(b) = 0 und g (x) = 0 auch g(x) = 0 f¨ ur alle x ∈]a; b[ gilt. 2 Die Regeln in Satz 8 und dem unten folgenden Satz 9 sind benannt nach Marquis Guillaume Francois Antoine de L’Hospital (1661–1704); er verfasste basierend auf Vorlesungen von Johann Bernoulli das erste Lehrbuch zur Differenzialrechnung. Die Regel in Satz 8 gilt nat¨ urlich auch f¨ ur rechtsseitige Grenzwerte und f¨ ur beidseitige Grenzwerte, sofern diese existieren. Ferner gilt sie f¨ ur die Grenz¨ ubergänge x → ∞ und x → −∞ (Aufgabe 5). Beispiel 1:

ex − x − 1 ex − 1 ex 1 = lim = = lim 2 x→0 x→0 x→0 2 x 2x 2 lim

√ ln(1 − x2 ) −2x · 2 −4 x √ √ = lim Beispiel 2: lim = lim =0 x→0 x→0 (1 − x2 ) · 3 x x→0 3(1 − x2 ) x x Satz 9 (2. Regel von de L’Hospital ): Die Funktionen f und g seien auf dem offenen Intervall ]a; b[ ⊆ Df ∩ Dg differenzierbar und es sei f (x), g(x), g (x) = 0 f¨ ur alle x ∈ ]a; b[. Ist dann lim− f (x) = lim− g(x) = ∞ und x→b f (x)

existiert der linksseitige Grenzwert von lim−

x→b

g (x)

x→b

an der Stelle b, dann ist

f (x) f (x) = lim− . g(x) x→b g (x)

Beweis: F¨ ur a < x1 < x < b gibt es nach Satz 7 ein x2 ∈]x1 , x[ mit f (x )

1 f (x) − f (x1 ) f (x) 1 − f (x) f (x2 ) = · . = g(x) − g(x1 ) g(x) 1 − g(x1 ) g (x2 )

g(x)

Bezeichnen wir mit A den linksseitigen Grenzwert von

f (x) an der Stelle b, dann g (x)

können wir x1 zu einem vorgegebenen ε > 0 so wählen, dass f (x) − A < ε g (x)

also

f¨ ur alle x ∈ ]x1 , b[, f (x )

1 f (x) 1 − f (x) · < A + ε. A−ε< g(x) 1 − g(x1 )

g(x)

X.3 Die Mittelwertsätze der Differenzialrechnung Wegen lim− x→b

253

f (x1 ) g(x1 ) = lim− = 0 (bei festem x1 ) gibt es ein x3 ∈ ]x1 , b[ mit f (x) x→b g(x)

A−ε
0 monoton wächst. x

2. a) Man beweise, dass x →

Hinweis: Man benötigt die Ungleichungen aus Aufgabe 1 b).

c) Man bestimme die Grenzwerte von x → 1 +

1 x

x

f¨ ur x → 0 und x → ∞.


254

3. Wie oft ist h : x → 3x2 − x3 sgn x an der Stelle 0 differenzierbar? (Dabei ist sgn x = −1, 0 oder 1 f¨ ur x < 0, x = 0 bzw. x > 0.)

4. Die Funktionen f und g seien auf ]a;b[ differenzierbar und es gelte dort a+b 2

f = g und g = f . Ferner sei f

= 1 und g

a+b 2

= 0.

ur alle x ∈ ]a; b[. Man zeige, dass f 2 (x) − g 2 (x) = 1 f¨

5. Man zeige, dass die Regeln von de l’Hospital auch für den Grenzübergang x → ∞ gelten.

6. Man bestimme folgende Grenzwerte: 3x − 2x x→0 x ln(1 − x2 ) c) lim+ x→0 xr

xx − x x→1 1 − x + ln x

a) lim

b) lim

1

d) lim x 1−x x→1

7. Man berechne mit Hilfe der 1. Regel von de l’Hospital: a) lim

√ 2n

5n

(ln n)10 √ b) lim 10 n

√

n

c) lim

n−1 ln n n

(n ≥ 2)

8. Man berechne ln(1 + x + x2 ) + ln(1 − x + x2 ) x→0 x2 lim

und

lim x2 (ln(1 + x + x4 ) − ln x4 ).

x→∞

X.4 Iterationsverfahren Eine Folge (xn ) reeller Zahlen sei durch einen Startwert x0 und eine Funktion f rekursiv definiert: xn+1 = f (xn ) (n ∈ IN0 ). Wir wollen untersuchen, unter welchen Voraussetzungen u ¨ber x0 und f diese Folge konvergiert. Ist dies der Fall, dann ist es naheliegend, dass sich der Grenzwert x∗ aus der Gleichung x = f (x) ergibt. √ Beispiel 1: Es sei x0 = 1 und xn+1 = 7xn . Diese Folge beginnt also mit 1,

√

7,

√

7 7,

√

7 7 7, . . . .

√ Ihr Grenzwert ergibt sich (vermutlich) aus der Gleichung x = 7x zu x∗ = 7. √ √ √ Dies ist einleuchtend, denn 7 = 7 · 7 = 7 7 · 7 = 7 7 7 · 7 = . . . .

X.4 Iterationsverfahren

255

Beispiel 2: Es sei x0 = 1 und xn+1 = 1,

√

2,

2+

√

√

2 + xn . Diese Folge beginnt mit

2,

2+

2+

√ 2, . . . .

√ Ihr Grenzwert ergibt sich (vermutlich) ausder Gleichung x = 2 + x zu x∗ = 2. √ √ Dies ist einleuchtend, denn 2 = 2 + 2 = 2 + 2 + 2 = . . . . Beispiel 3: Es sei x0 = 1 und xn+1 = 1 +

1 2 + xn = . 1 + xn 1 + xn

Diese Folge ist konvergent (Aufgabe 1). Ihr Grenzwert ergibt sich (vermutlich) √ 2+x bzw. x2 = 2 zu x∗ = 2. aus der Gleichung x = 1+x

Im folgenden Satz soll die Funktion f auf einem abgeschlossenen Intervall differenzierbar sein. Die Differenzierbarkeit auf einem abgeschlossenen Intervall beinhaltet auch die einseitige Differenzierbarkeit an den Intervallgrenzen. Satz 1: Die Funktion f sei differenzierbar auf [a; b], es sei f (x) ∈ [a; b] f¨ ur alle x ∈ [a; b], und es existiere eine positive Konstante L < 1 mit |f (x)| ≤ L f¨ ur alle x ∈ [a; b]. Dann hat x = f (x) genau eine Lösung x∗ in [a; b], und die Folge (xn ) mit xn+1 = f (xn ) (n ∈ IN0 ) konvergiert f¨ ur jeden Startwert x0 ∈ [a; b] gegen x∗ . Beweis: Wegen a ≤ f (x) ≤ b f¨ ur alle x mit a ≤ x ≤ b gilt f¨ ur die Funktion g : x → x − f (x) einerseits g(a) ≤ 0 und andererseits g(b) ≥ 0. Nach dem Zwischenwertsatz existiert also ein s ∈ [a; b] mit g(s) = 0, also s = f (s). Hat die Gleichung x = f (x) die Lösungen s1 , s2 in [a; b], dann folgt nach dem 1. Mittelwertsatz |s1 − s2 | = |f (s1 ) − f (s2 )| = |f (σ) · (s1 − s2 )| ≤ L|s1 − s2 | ur s1 = s2 möglich ist. Also besitzt die (mit s1 ≤ σ ≤ s2 ), was wegen L < 1 nur f¨ Gleichung x = f (x) genau eine Lösung in [a; b], welche wir mit x∗ bezeichnen. F¨ ur alle x1 , x2 ∈ [a; b] gilt nun nach dem 1. Mittelwertsatz |f (x1 ) − f (x2 )| = |f (ξ)||x1 − x2 | ≤ L|x1 − x2 | ur n ∈ IN0 und mit ξ ∈ [a; b]. Also ist |xn+1 − x∗ | = |f (xn ) − f (x∗ )| ≤ L|xn − x∗ | f¨ somit |xn+1 − x∗ | ≤ Ln+1 |x0 − x∗ |. Wegen L < 1 ergibt sich lim(xn ) = x∗ .

2


256 In Beispiel 1 ist f (x) =

√

7x und f (x) ∈ [2; 8] f¨ ur x ∈ [2; 8], ferner

1 7 7 |f (x)| = x0 ≥ a (x − x0 ) · fmin ≤ Fa (x) − Fa (x0 ) ≤ (x − x0 ) · fmax , wobei fmin und fmax das Minimum bzw. das Maximum von f im Intervall [x0 , x] ist. Analoges gilt f¨ ur a ≤ x < x0 . Die Existenz von fmin und fmax wird durch die Stetigkeit von f gesichert (vgl. Satz 5 in Abschnitt X.1). Nun gilt aufgrund der Stetigkeit von f lim fmin = lim fmax = f (x0 ), x→x0

x→x0

also ist

Fa (x) − Fa (x0 ) = f (x0 ). x − x0 Das bedeutet, dass Fa an der Stelle x0 differenzierbar ist und dass lim

x→x0

Fa (x0 ) = f (x0 ) gilt. Dies gilt an jeder Stelle x0 ∈ I, also ist Fa eine auf I differenzierbare Funktion mit der Ableitungsfunktion f . Definition 1: Ist F eine auf dem offenen Intervall I differenzierbare Funktion und gilt F = f , dann nennt man F eine Stammfunktion von f auf I. Die Menge aller Stammfunktionen von f auf einem gegebenen offenen Intervall I bezeichnen wir mit f und nennen diese Menge das unbestimmte Integral von f . Zwei Stammfunktionen von F unterscheiden sich nur um eine additive Konstante: Ist F1 = f und F2 = f , dann ist (F1 − F2 ) = 0 (Nullfunktion), also ist F1 − F2 konstant. Umgekehrt ist mit F auch F + c f¨ ur jedes c ∈ IR eine Stammfunktion von f .

X.5 Stammfunktionen und Flächeninhalte

261

Das Integralzeichen ist ein stilisiertes S“; es ist von Leibniz eingef¨ uhrt worden. ” Eigentlich m¨ usste man noch das Intervall I in die Bezeichnung aufnehmen. Ist Fa die oben betrachtete Flächeninhaltsfunktion von f und F eine beliebige Stammfunktion von f , dann ist Fa = F + c mit einer Konstanten c. Wegen Fa (a) = 0 ist c = −F (a), also Fa (x) = F (x) − F (a). Der Flächeninhalt, der u ¨ber dem Intervall [a; b] von der x-Achse und dem Graph von f eingeschlossen wird, ist also Fa (b) = F (b) − F (a). Diesen Flächeninhalt F (b) − F (a) bezeichnet man traditionsgemäß mit b

f (x) dx a

und nennt dies das bestimmte Integral von f von a bis b. In X.6 wird dieser Begriff etwas allgemeiner definiert. Beispiel 1: Es soll der Flächeninhalt A unter der Parabel mit der Gleichung

y = x2 zwischen den Stellen 1 und 4 berechnet werden. Wegen

1 3 x 3

= x2 ist

1 3

x → x3 eine Stammfunktion von x → x2 . Es gilt also 4

x2 dx =

1

1 3 1 3 · 4 − · 1 = 21. 3 3

Bei obigem bestimmtem Integral darf auch b ≤ a sein, denn man vereinbart a

a

f (x) dx = 0 a

und

f (x) dx = −

b

f (x) dx. a

b

Lässt man nun die Beschränkung auf Funktionen mit nichtnegativen Werten fallen, so vereinbart man, Flächeninhalte unter der x-Achse negativ zu zählen; man benutzt also die Regel b a

(−f (x)) dx = −

b

f (x) dx. a

Diese Vereinbarungen sind verträglich mit der Intervalladditivität des bestimmten Integrals: y . b c c 6 ..... . f (x) dx + f (x) dx = f (x) dx y = x3 .. .. a a .. . b ...+.. . . . . x ..... .............................. . . . . . . . . . . . . . Beispiel 2 (Fig. 2): .. −..... .. ... . .. 1 1 4 1 .... 3 4 x dx = · 1 − · (−1) = 0. ... 4 4 Fig.2: Zu Beispiel 2 −1


262

Auf den Integralbegriff f¨ ur Funktionen, die nicht notwendigerweise stetig sind, gehen wir erst im nächsten Abschnitt ein. Hier wollen wir uns nur noch mit der Frage beschäftigen, wie man zu einer gegebenen stetigen Funktion das unbestimmte Integral bzw. eine Stammfunktion findet. Dazu muss man im Wesentlichen nur die Differenziationsregeln umgekehrt lesen“. Im Folgenden bedeutet ein Rechenzei” chen zwischen zwei unbestimmten Integralen, die ja Mengen von Funktionen sind, dass je ein Element der einen Menge mit je einem Element der anderen Menge verkn¨ upft wird. (In der Algebra nennt man das eine Komplexverkn¨ upfung.) Satz 1: F¨ ur auf einem offenen Intervall I stetige Funktionen f, g gilt dort:

(f + g) =

f+

(cf ) = c

g (c ∈ IR)

f

Sind f und g auf I stetig differenzierbar, dann gilt

(f · g ) = f · g −

(f · g).

Es sei ϕ auf I stetig differenzierbar und f auf ϕ(I) stetig. Dann gilt

(f ◦ ϕ) · ϕ =

f ◦ ϕ.

Ist ferner ϕ (t) = 0 f¨ ur alle t ∈ I (also ϕ auf I umkehrbar), dann gilt

f=

(f ◦ ϕ) · ϕ ◦ ϕ−1 .

Man verifiziert die Behauptungen von Satz 1 durch Differenzieren. Die dritte Formel beinhaltet die partielle Integration oder Produktintegration. Bei den beiden im Fall der Invertierbarkeit von ϕ gleichwertigen letzten Formeln spricht man von der Integration durch Substitution bzw. von den Substitutionsregeln. In Beispielen mit konkreten Funktionstermen f (x) schreibt man auch

f (x) dx Ist F ∈

statt

f.

f , dann schreibt man meistens

f (x) dx = F (x) + const., wir wollen hier aber auf + const.“ verzichten, da diese Schreibweise ohnehin ” interpretationsbed¨ urftig ist.

X.5 Stammfunktionen und Flächeninhalte

263

Beispiel 3 (zur partiellen Integration):

a)

xex dx = xex −

ln x dx =

b)

ex dx = xex − ex

1 · ln x dx = x ln x −

x dx = x ln x − x x

Beispiel 4 (zur Integration durch Substitution):

a)

f (x) dx = ln f (x) f (x)

b)

1 f (x) · f (x) dx = (f (x))2 2

F¨ ur alle α ∈ IR mit α = −1 gilt

xα dx =

1 xα+1 , α+1

wie man sofort durch Differenziation findet. Der Ausnahmefall α = −1 kann benutzt werden, um die nat¨ urliche Logarithmusfunktion ln zu definieren. Man kann damit also einen neuen Zugang zu den Exponential- und Logarithmusfunktionen finden: F¨ ur x > 0 sei x y ... 1 1 6... y = ln x := dt x . ... t ... 1 ln a ... + ... (Fig. 3). Dann ist ln eine auf IR diffe .... ........ renzierbare Funktion mit 1.. ............................... ............... ............................................................ 1 .. . . . . . . . . . . . . . .. (ln x) = > 0, x x a 1 + also ist ln umkehrbar auf IR . Die UmFig. 3: Nat¨ urlicher Logarithmus kehrfunktion von ln nennen wir exp (Fig 4). Ihre Definitionsmenge ist die Bildmenge von ln (also IR, wie wir so. y x .. gleich sehen werden). Nach der Um6 ... y = e ..... kehrregel der Differenziation gilt . .... .. .... . . . e ...................... ... 1 .. ... exp = = exp, ..... .... ..... y = ln x ln ◦ exp . . ... ......... ............. . . . . . 1........................................................................ ...... . . . die Funktion exp stimmt also mit ihrer ... .. ....... .... ........ ... ................ ....... ............ Ableitungsfunktion u ¨berein. . ... . e x . . . . . 1 . . F¨ ur x > 0 und ein festes a > 0 gilt ... . . . . . ln ax = ln a + ln x, denn .. .... .. 1 1 (ln ax) = · a = = (ln x) . Fig. 4: Die Funktionen ln und exp ax x


264

Es ist also ln ax = ln x + c, und die Konstante c ergibt sich f¨ ur x = 1 zu ln a. Es gilt also ln x1 x2 = ln x1 + ln x2 f¨ ur alle x1 , x2 > 0. Aus dieser Beziehung folgt 1 ur alle x > 0. Daraus ergibt sich, dass ln die Bildmenge IR hat. ln = − ln x f¨ x Mit y1 = ln x1 und y2 = ln x2 erhält man exp(y1 + y2 ) = exp(ln x1 x2 ) = x1 x2 = exp y1 · exp y2 . F¨ ur x > 0 und festes a ∈ IR gilt ln xa = a ln x, denn (ln xa ) =

1 a · axa−1 = = (a ln x) , a x x

also ln xa = a ln x + c, wobei sich die Konstante c als 0 ergibt (x = 1 setzen). Dies bedeutet f¨ ur die Funktion exp, dass exp ay = (exp y)a f¨ ur alle a, y ∈ IR gilt. Es folgt f¨ ur alle a ∈ IR exp a = (exp 1)a . Setzen wir e := exp 1, also ln e = 1, dann ergibt sich exp a = ea . Damit haben wir einen völlig neuen Zugang zur Exponentialfunktion gefunden. Die oben definierte Zahl e ist tatsächlich die eulersche Zahl, denn nach obiger Definition der Funktion ln als Integral ist n·

1 1 1 < n ln 1 + 0, so ist also s(x + h) − s(x) ≈

h2 + (f (x + h) − f (x))2 .

(Der Fehler Δ(h) ist dabei so klein, dass lim

h→0

Δ(h) h

= 0; das soll hier aber nicht

näher begr¨ undet werden.) Dividiert man durch h und betrachtet den Grenzwert

X.6 Das Riemann-Integral

271

f¨ ur h → 0, dann ergibt sich s (x) =

y 6

........q........... ... y = f (x)................ ... . . . . . . ... f (x + h) − f (x) ...... ... . . . . ....q .... h .... x

1 + f (x)2 .

Der Hauptsatz der Differenzial- und Integralrechnung liefert dann f¨ ur s(b) den Wert b

Lf (a, b) =

-

x 1 + f (x)2 dx.

x+h

Fig. 3: Berechnung der L¨ ange einer Kurve

a

Beispiel 3 (neilsche Parabel, nach W. Neil, 1637–1670): Der Graph der Funktion √ 3 mit der Gleichung y = x x = x 2 hat u ¨ber dem Intervall [0; a] die Länge a 0

2 4 9 9 1 + x dx = · · 1 + x 4 3 9 4

⎛ ⎞ 3 a 3 2 8 ⎝ 9 2 = 1 + a − 1⎠ . 27 4 0

Die neilsche Parabel ist neben der Kettenlinie (Beispiel 4) eine der wenigen Kurven, deren Längenberechnung auf ein elementar zu berechnendes Integral f¨ uhrt. Beispiel 4 (Kettenlinie, vgl. Aufgabe 9 in X.1): Der Graph der Kosinushyperbolicus-Funktion, also der Graph der Funktion mit der Gleichung 1 y = cosh x = (ex + e−x ), 2 hat u ¨ber dem Intervall [0; a] die Länge a

1+ 0

2

1 x (e − e−x ) 2

a

dx = 0

a 1 x 1 1 (e + e−x ) dx = (ex − e−x ) = (ea − e−a ). 2 2 2 0

Die Längenfunktion des Kosinushyperbolicus ist also der Sinushyperbolicus mit 1 der Gleichung y = sinh x = (ex − e−x ). 2

Um den Schwerpunkt eines Kurvenst¨ ucks zu berechnen, benötigen wir sein Drehmoment ( Kraft mal Kraftarm”) bez¨ uglich der beiden Koordinatenachsen. Wir ” denken uns ein Kurvenst¨ uck K, welches als Graph einer stetig differenzierbaren Funktion f mit positiven Werten u ¨ber dem Intervall [a; b] gegeben ist, homogen mit Masse belegt, so dass das Gewicht eines Kurvenst¨ ucks proportional zu seiner Länge ist. Das Drehmoment des Kurvenst¨ ucks zwischen den Stellen x und x + h mit h > 0 bez¨ uglich der x-Achse liegt dann zwischen min f (t) · (s(x + h) − s(x)) und

x≤t≤x+h

max f (t) · (s(x + h) − s(x))

x≤t≤x+h


272

(vgl. Fig. 4), ist also f (ξ) · (s(x + h) − s(x)) mit x ≤ ξ ≤ x + h. Die DrehmomentFunktion M hat daher an der Stelle x die Ableitung M (x) = lim f (ξ) h→0

s(x + h) − s(x) = f (x)s (x). h

Das gesamte Drehmoment ist somit b

f (x)s (x) dx =

a

b

6Drehmoment

f (x) 1 + (f (x))2 dx.

a

Entsprechend ergibt sich das Drehmoment bez¨ uglich der y-Achse zu b

b

x 1 + (f (x))2 dx.

xs (x) dx = a

x · Δs f (x)......................................................Δs .. ... Drehmoment .. .. f (x) · Δs .. .. .. x Fig. 4: Drehmomente

a

Ist andererseits L die Länge der Kurve u ¨ber [a; b] und (xS , yS ) ihr Schwerpunkt, so ergibt sich f¨ ur dieses Drehmoment yS · L bzw. xS · L. (Dies ist eigentlich die Definition des Schwerpunkts!) Also ist b

yS =

1 f (x) 1 + (f (x))2 dx, La

b

xS =

1 x 1 + (f (x))2 dx. La

Beispiel 5: F¨ ur den Schwerpunkt der Kettenlinie (Beispiel 4) zwischen den Stellen −a und a gilt xS = 0 und a 1 yS = cosh x 1 + sinh2 x dx 2 sinh a −a a

=

1 2 sinh a

−a

cosh h2 x dx =

a 1 1 (1 + cosh 2x) dx 2 sinh a 2 −a

1 a ea + e−a 1 . a + sinh 2a = a + = −a 2 sinh a 2 e −e 4 Um den Schwerpunkt eines Flächenst¨ ucks zu berechnen benötigen wir sein Drehmoment bez¨ uglich der beiden Koordinatenachsen. Wir denken uns ein Flächenst¨ uck mit dem Inhalt A, welches vom Graph einer stetigen Funktion f mit f (x) ≥ 0 u ¨ber dem Intervall [a; b] eingeschlossen wird, homogen mit Masse belegt, so dass das Gewicht eines Flächenst¨ ucks proportional zu seinem Inhalt ist. Das Drehmoment eines homogen mit Masse belegten Streifens vom Gewicht F und der Länge l bez¨ uglich einer zu ihm rechtwinkligen Achse durch seinen 1 Endpunkt ist F · l (Fig. 5). 2


273

Das Drehmoment des Streifens des Flächenst¨ ucks zwischen den Stellen x und x + h mit h > 0 bez¨ uglich der xAchse ist dann 1 f (ξ1 )h · f (ξ2 ) 2 mit geeigneten ξ1 , ξ2 zwischen x und x + h (Fig. 6). Die DrehmomentFunktion M hat also die Ableitung M (x) = lim

h→0

1 1 f (ξ1 )f (ξ2 ) = (f (x))2 . 2 2

Das gesamte Drehmoment ist daher 1 2

b

f (x)2 dx. Entsprechend ergibt sich

a

das Drehmoment des Flächenst¨ ucks b

xf (x) dx

bez¨ uglich der y-Achse zu a

(Fig. 7). Ist A der Inhalt und (xS , yS ) der Schwerpunkt des Flächenst¨ ucks, dann ist also

Achse .......

..... ..... 12 l ..... l ..............................................................................................................................................s......F . . . . . . . . ........... .......................................................................................................................... ..... Schwerpunkt ..... .....

Fig. 5: Drehmoment eines Streifens

y

.............................. y = f (x) ................... 6 .................. . . . ....... ... .. . . ...... ... ................ ......... .. . ........... .. ........v..... f (x) 6 ........... ........... 1 .......... 2 f (x) -....h .............. ? ? x .................................................................................................... x 6

Fig. 6: Drehmoment eines Fl¨ achenst¨ ucks

b

xS =

yS =

1 xf (x) dx, Aa 1 2A

b

f (x)2 dx.

a

Als Anwendung obiger Schwerpunktsberechnungen betrachten wir nun die guldinschen Regeln (nach Paul Guldin, 1577–1643). Diese dienen zur Berechnung des Mantelflächeninhalts und des Volumens von Rotationskörpern.

...6y .. .. .. .. ... .. .. .. .. .. ..

............................... y = f (x) ..................... 6 ................. . . . ....... ... ...... ..... ... .............. ......... .. . . ......... x -.........v...... f (x) ........... .............. ...... -.....h ............. -x ... . . ? x

Fig. 7: Drehmoment eines Fl¨ achenst¨ ucks

Erste guldinsche Regel: Der Mantelflächeninhalt eines Rotationskörpers ist das Produkt aus der Länge der erzeugenden Kurve und der Länge des von ihrem Schwerpunkt zur¨ uckgelegten Weges. Zweite guldinsche Regel: Das Volumen eines Rotationskörpers ist das Produkt aus dem Inhalt der erzeugenden Fläche und der Länge des von ihrem Schwerpunkt zur¨ uckgelegten Weges.


274

Zur Begr¨ undung der ersten guldinschen Regel berechnen wir zunächst die Mantelfläche des Rotationskörpers, der vom Graph der stetig differenzierbaren Funktion f mit f (x) ≥ 0 auf [a; b] bei Rotation um die x-Achse erzeugt wird. Bei Zerlegung des Intervalls in Teilintervalle der Länge h entstehen Scheiben, die an der Stelle x näherungsweise Kegelst¨ umpfe mit dem Mantelflächeninhalt 2πf (x)s (x)h sind (Fig. 8). F¨ ur den Mantelinhalt M als Funktion von x gilt also M (x) = 2πf (x)s (x). Daraus ergibt sich f¨ ur den Mantelinhalt b

M = 2π

y

Δs ΔM ≈ 2πf (x)Δs BB...B.B..... . . . . . 6 .. .. M (x) = 2πf (x)s (x) .. ... f (x) ...... .... ... .. ? ...... .. .. ... ...... @ x @.. ...... I ...... ..@ ...... .. @ ....... .. h ....

6

f (x) 1 + f (x)2 dx.

Fig. 8: Mantelfl¨ acheninhalt

a

Es ist also M = 2πyS · L, wobei yS die y-Koordinate des Schwerpunkts und L die Länge des Kurvenst¨ ucks ist. Vgl. hierzu obige Berechnung der Länge und des Schwerpunkts einer Kurve. Man beachte, dass hier f stetig differenzierbar sein soll, während bei der zweiten guldinschen Regel nur die Stetigkeit von f gefordert wird. Zur Begr¨ undung der zweiten guldinschen Regel berechnen wir das Volumen des Rotationskörpers, der vom Graph der stetigen Funktion f mit f (x) ≥ 0 auf [a; b] bei Rotation um die x-Achse erzeugt wird. Bei Zerlegung des Intervalls in Teilintervalle der Länge h entstehen Scheiy ΔV ≈ π(f (x))2 h 6 . . ben, die an der Stelle x näherungsweise . . . .. .. 2 6 .... ... Kegelst¨ umpfe mit dem Rauminhalt ... ... V (x) = π(f (x)) . . . . ... f (x) .. πf (x)2 h sind. Daraus ergibt sich f¨ ur das ... ... . .. . . . . Volumen ? . . b ...... .. x I @ . . @ 2 . . . . . ..... .@ V = π f (x) dx. ..... .. . a ...... . @ .......... h Es ist also V = πyS · A, wobei yS der Schwerpunkt und A der Inhalt des Fig. 9: Volumen Flächenst¨ ucks ist. Beispiel 6: 1) Wir betrachten den oberen Halbkreis des Kreises um O mit dem Radius r. Bei Rotation um die x-Achse entsteht eine Kugel mit dem Oberflächeninhalt 4πr2 . Die Länge des Halbkreises ist πr. F¨ ur die y-Koordinate yS des 2r Schwerpunkts der Halbkreislinie gilt daher 2πyS · πr = 4πr2 , also yS = . 2) Die in 1) erzeugte Kugel hat das Volumen 1 2

π 4 3 πr ; die erzeugende Halbkreis3

ur die y-Koordinate yS des Schwerpunkts der Halbfläche hat den Inhalt πr2 . F¨ 1 2

4 3

kreisfläche gilt daher 2πyS · πr2 = πr3 , also yS =

4r . 3π


275

Berechnet man in 1) und 2) die Schwerpunktkoordinaten mit den oben angegebenen Integralen, dann kann man auf diese Weise die Formeln f¨ ur den Oberflächeninhalt und das Volumen der Kugel gewinnen. Beispiel 7: Rotiert ein Kreis um eine Achse, welche in derselben Ebene wie der Kreis liegt, dann entsteht ein Torus (Fig. 10). Dabei sei r der Radius des rotierenden Kreises und R mit R > r der Abstand des Kreismittelpunktes von der Rotationsachse. Nach der ersten guldinschen Regel hat der Torus den Oberflächeninhalt

....................... .... . ... r ..... ... .. ... .. . . ..... ........................ R ?

... .... .... ... .. .. .. .. .. .. .. . ... . ... ... ... .... .

M = 2πr · 2πR = 4π 2 rR. Nach der zweiten guldinschen Regel ist sein Volumen

...................... ..... .... ..... ... ... .. ... .. ... ... ... . ... ..... .. ... . .... .... .... .. ... ... ... .. ... .... . . ... .... .. . ... . ... .. ... . . ... .. .... ... ...... . . . ................

Fig. 10: Torus

V = πr2 · 2πR = 2π 2 r2 R.

Nun soll das Volumen eines Körpers berechnet werden, der in ein räumliches kartesisches Koordinatensystem (xyz-Koordinatensystem) eingebettet ist. Die zur yz-Ebene parallele Ebene durch den Punkt (x, 0, 0) schneidet den Körper in einer Fläche. Wir nehmen an, dass f¨ ur jeden Wert von x der Inhalt q(x) dieser Fläche existiert und dass dabei q eine stetige Funktion auf dem Intervall [a; b] ist, ferner sei q(x) = 0 f¨ ur x < a und y > b. Dann gilt f¨ ur das Volumen V des Körpers b

V =

q(x) dx. a

Dies ist eine moderne Fassung des Prinzips von Cavalieri (nach Bonaventura Cavalieri 1598–1647). Entsteht ein Körper durch Rotation des Graphs der stetigen Funktion f u ¨ber dem 2 Intervall [a; b] um die x-Achse, dann ist q(x) = πf (x) . Das Volumen des Rotatib

onskörpers ist also V = π f (x)2 dx, wie wir schon oben bei der Betrachtung der a

zweiten guldinschen Regel gesehen haben. Beispiel 8: Das Volumen einer Kugel vom Radius r ist r

V

= π

2

(r − x ) dx = 2π

−r

=

2

r 0

(r2 − x2 ) dx

r 1 4 1 2π r x − x3 = 2π r3 − r3 = πr3 . 3 3 3 0 2


276

Beispiel 9: Ein allgemeiner Kegel (Kreiskegel, schiefer Kegel, Pyramide, . . . ) mit dem Grundflächeninhalt G und der Höhe h wird im Abstand x von der Grundfläche (0 ≤ x ≤ h) in einer zur Grundfläche parallelen Fläche mit dem Inhalt q(x) geschnitten. 2 h−x ........... ¨ Weil sich bei einer Ahnlich·G q(x) = ... ................... h ... ........ keitsabbildung mit dem Faktor . ... . ........ .. ........ k der Flächeninhalt einer Figur .... G .... ........ . . . .... 2 . . ... mit dem Faktor k andert, gilt .. .................. . . . ... . ........ . q(x) ... ... (Fig. 11) ........ ... ... . ... .. ............................ ........................................... .............. .............................. 2 2 q(x) : G = (h − x) : h . .. .. .. x 0 h Also gilt f¨ ur das Volumen V des Fig. 11: Volumen eines Kegels Kegels h

V =

G·

0

h−x h

2

dx =

h G G 1 1 (h − x)2 dx = 2 · h3 = G h. h2 h 3 3 0

Aufgaben 1. Man berechne

10 1

2. Man zeige, dass

(−1)[x] dx. Dabei bedeutet [ x x

sgn t dt = |x| und

0

x

] die Ganzteilfunktion.

|t| dt = 12 x2 · sgn x.

0

3. Jede reelle Zahl aus [0;1] sei als Dezimalbruch dargestellt, wobei der Eindeutigkeit zuliebe die Periode . . . 9999 . . . nicht vorkommen soll. Ist a(x) die erste von 0 verschiedene Ziffer in der Dezimalbruchdarstellung von x, so setzen 1 wir f (0) := 0 und f (x) = f¨ ur x ∈ ]0; 1]. Man zeige, dass f nur abzählbar a(x)

9

1

f (x) dx =

viele Unstetigkeitsstellen besitzt und dass 0

11 ≈ 0, 314. 9 i=1 i

4. Die Funktion f sei auf [0; 1] definiert durch f (0) = 1, f (x) = 0 für irrationales x und f (x) =

p p , falls x = mit p, q ∈ IN und ggT(p, q) = 1. q q

Man zeige zunächst, dass f stetig an den irrationalen und unstetig an den rationalen Stellen ist. Man zeige dann, dass das Integral von f u ¨ber [0; 1] existiert und den Wert 0 hat.

5. Die Funktion f sei integrierbar auf1 [0;1] und es gelte lim− f (x) = α.

Man zeige, dass dann gilt: n→∞ lim n xn f (x) dx = α. 0

x→1


277

6. Man bestimme die Schwerpunkte √ der Halbkreislinie und der Halbkreisfläche, wenn der Halbkreis durch y =

r2 − x2 mit −r ≤ x ≤ r gegeben ist.

7. Ein Flächenstück im xy-Koordinatensystem werde begrenzt durch die Kurven mit den Gleichungen y = 0, y = x2 + 2, x = 1, x = 2. Man berechne den Flächeninhalt, die Koordinaten des Schwerpunkts und das Volumen der Rotationskörper bei Rotation um die x-Achse und um die y-Achse.

8. Die Gleichung einer Ellipse mit den Halbachsenlängen a und b lautet x2 y2 + 2 = 1. Ihr Fl¨ acheninhalt ist πab (also das geometrische Mittel von 2 a b

πa2 und πb2 ). Warum? Der Umfang der Ellipse ist aber nicht so einfach zu berechnen. Man stelle den Umfang als Integral dar.

9. Der 1. Mittelwertsatz der Integralrechnung besagt (vgl. Fig. 12): Ist f stetig auf [a; b], dann existiert ein ξ ∈ ]a; b[ mit b

y

6

f (x) dx = f (ξ) · (b − a).

a

.......... y = f (x) ... ..... .. . . ......................................................................... .. ............. .. ... ... . ... .. ..f (ξ) ... .. .. ... x .. .. .a ξ b

a) Man beweise diesen Satz mit Hilfe des 1.Mittelwertsatzes der Differenzialrechnung. b) F¨ ur welche ξ ∈ ] − 1, 1[ hat das Integral Fig. 12: 1. Mittelwertsatz von f u ¨ber [−1; 1] den Wert 2f (ξ)? 1 x (1) f (x) = x2 (2) f (x) = (3) f (x) = 2 x+2 x +1

10. In Erweiterung des 1. Mittelwertsatzes der Integralrechnung (s. oben) gilt: Ist f stetig, g integrierbar und g(x) ≥ 0 auf [a; b], dann gibt es ein ξ ∈ [a; b] mit b b f (x)g(x) dx = f (ξ) g(x) dx. a

a

Man beweise dies mit Hilfe des Zwischenwertsatzes. Man zeige zunächst, dass der Quotient

b a

b

f (x)g(x) dx :

a

g(x) dx zwischen dem Minimum und

dem Maximum von f auf [a, b] liegt. Man bestimme dann f¨ ur f (x) = 1 , g(x) = x ein ξ ∈ ]0, 1[, f¨ u r welches das Integral von f ·g u ¨ber 2 x +1

1

[0; 1] den Wert f (ξ) g(x) dx hat. 0

11. Der 2. Mittelwertsatz der Integralrechnung besagt: Ist f monoton und stetig differenzierbar und g stetig auf [a; b], dann existiert ein ξ ∈ ]a; b[ mit

b

a

f (x)g(x) dx = f (a)

ξ

a

g(x) dx + f (b)

ξ

Man beweise dies mit Hilfe des Satzes in Aufgabe 10.

b

g(x) dx.


278

X.7 N¨ aherungsverfahren zur Integration In vielen Fällen lässt sich das Integral einer stetigen Funktion f u ¨ber einem (nicht zu großen) Intervall [a; b] näherungsweise durch (b − a) · η angeben, wobei

f (a) + f (b) η = f (a) oder η = 2

oder η = f

a+b 2

ist. Diese Abschätzung wird wesentlich besser, wenn man das Intervall in n Teilb−a intervalle [xi−1 ; xi ] der Länge h := zerlegt und in jedem dieser Teilintervalle n diese Näherung verwendet. Man gelangt so zu folgenden Regeln: b

f (x) dx hat näherungweise den Wert

Das Integral a

h·

n−1 i=0

oder

h· oder h·

f (xi )

f (a) + f (b) n−1 f (xi ) + 2 i=1

n

f

i=1

xi−1 + xi 2

y = f (x)

................. ................ ... ...... .......... . . . . . . . .............................................................. . . . . . . . ..... .. . .. . .. . .. . .. . .. . .... .. . . . . . . .. .. . . . . . . . . . . . ... f (xi ) .. . . . . . . . . . . . .... .. . . . . . . . . . . . ... . . . . . . . . . . . . ... ................... ................................................................. xi

h

(Rechtecksregel, Fig. 1)

xi+1

Fig. 1: Zur Rechtecksregel

(Trapezregel, Fig. 2)

(Tangentenregel, Fig. 3). y = f (x)

.......................... ..................................... .... ... . . . . . . . . . . . . . ............... . . . .. ........ . . . .. . . . .. ...... ... . . . . . .... . . . . . .... .. . . . . . .. . . . . . .... .. . . . . . .. . . . . . ..f (xi+1 ) f (xi ) .. . . . . . .... . . . . . .... .. . . . . . .. . . . . . ... . . . . . . ... . . . . . ... ................... .................................................................. xi

h

xi+1

Fig. 2: Zur Trapezregel

y = f (x)

.......................... .......................................................................... ... . . . . . . . . . . . . . ....... . . . .. . . . .. .. ..... ... . . . . . .... . . . . . .... .. . . . . . .. . . . . . .... .. . . . . . ... . . . . . .. f (xi ) .. . . . . . .. . . . . . .... .. . . . . . ... . . . . . ... . . . . . . ... . . . . . ... ................... ................................................................. xi

h

xi+1

Fig. 3: Zur Tangentenregel

Die Approximation eines Integrals wird i. Allg. besser, wenn man die Funktion f u ur ¨ber [a; b] durch eine Polynomfunktion p vom Grad 2 (Parabel) annähert, f¨ welche

a+b a+b p(a) = f (a), p =f , p(b) = f (b) 2 2 gilt und dann das Integral u ¨ber f durch das Integral u ¨ber p annähert (Fig. 4). a+b b−a und h := und gehen von Zur Bestimmung von p(x) setzen wir m = 2 2 dem Ansatz p(x) = r + s(x − a) + t(x − a)(x − m) aus. Mit p(a) = f (a), p(m) = f (m), p(b) = f (b) erhält man f¨ ur p(x) den Term

X.7 Näherungsverfahren zur Integration

279

. ....... y = p(x) ............. y = f (x) .......v .......... .... . . . . .... ... . .. ........... . .. . .... . . . ........ . . . .. ............. .. . .. . .. . .... .... . . . . ....... .. ..........v.......... ....... . . . . . . . . . .. ..... ...................................................................v ... . . . . . .... . . . . . . . . . . . . .... .... . . . . . . . . . . . ..... . . . . . . . . . . . . ... ... . . . . . . .... . . . . . . ... a+b a x b

y

6

2

Fig. 4: Zur Simpson-Formel

f (a) +

f (a + 2h) − 2f (a + h) + f (a) f (a + h) − f (a) (x − a)(x − a − h). (x − a) + h 2h2

a+2h

p(x) dx ergibt sich dann

F¨ ur a

f (a) · 2h + Also ist

f (a + h) − f (a) f (a + 2h) − 2f (a + h) + f (a) 2 3 · h. · 2h2 + h 2h2 3 a+2h

f (x) dx ≈

a

h (f (a) + 4f (a + h) + f (a + 2h)). 3

Die damit gewonnene Approximationsformel b

f (x) dx ≈

a

b−a f (a) + 4f 6

heißt Simpson-Formel (nach Thomas Simpson, 1716–1761). Diese Regel heißt auch keplersche Fassregel (nach Johannes Kepler, 1571–1630). Kepler gab den Inhalt eines Fasses der Höhe H mit H (A + 4M + B) 6

an (Fig. 5), wobei A und B die Flächeninhalte des Grund- bzw. Deckkreises sind und M der Inhalt des Schnittkreises in halber Höhe ist.

y

6

a+b + f (b) 2

M ......s............. .. ............................. ........... .. . . . . . . . ........... .... ... ... . B A........ ....s. ......................................................... ..........s...... . . . . . . . . . .............. ........... . . . . . ..... .. ... ................ .. . .. ........... ..... .......... .... ..... ...... ... ........ y = f (x) ...... .. ... .. .... ... ... ......... .... ........ . ............ ... ... ........ .. ... .... ........ .. ....... ......... m ... ...... a .. ......... b ... x . . . ......... ...... ... ......... .. . ...... ... ......... ... ........ ...... ............ .. ............... ............ ... .......................... ........................................................................................................................ H Fig. 5: Keplersche Fassregel


280

Durch Einteilung von [a; b] in eine gerade Anzahl von Teilintervallen und Anwendung der Simpson-Formel auf immer zwei benachbarte Teilintervalle kann man sehr genaue Formeln zur näherungsweisen Integration gewinnen. 2

1 dx mit Hilfe der Simpson-Formel x 1 1 1 1 25 bestimmen. Es ergibt sich 1+4· + = = 0,69¯4. Dies ist eine gute 6 1, 5 2 36

Beispiel 1: Wir wollen den Wert ln 2 =

Näherung f¨ ur ln 2 = 0,693147 . . . ; der relative Fehler beträgt weniger als 0,2%. Beispiel 2: Die Länge des Bogens der Sinusfunktion zwischen 0 und π

L=

2 √

π ist 2

1 + cos2 x dx. Eine Abschätzung mit der Simpson-Formel ergibt

0

L≈

π √ 2 + 4 1, 5 + 1 ≈ 1,9146. 12

π und zweimaliger Anwendung der 4 1 + cos α Simpson-Formel erhält man unter Beachtung der Formel cos2 α = 2 √ √ √ π π

Bei Aufteilung in zwei Intervalle der Länge

L≈

2+2 6+

24

2+

1, 5 +

1, 5 + 2 6 −

24

ex dx ≈

δ −δ e + 4 + eδ . 3

ex dx = eδ − e−δ . Aus eδ − e−δ ≈

δ −δ e + 4 + eδ 3

Beispiel 3: F¨ ur δ > 0 ist nach der Simpson-Formel δ

Andererseits ist

δ

2 + 1 ≈ 1,9101.

−δ

−δ

ergibt sich durch Lösen einer quadratischen Gleichung f¨ ur eδ die Abschätzung eδ ≈

2δ +

√

9 + 3δ 2 1 . Mit δ = erhält man schließlich e ≈ 3−δ n

2+

√

3 + 9n2 3n − 1

n

.

Die Folge mit diesem Term konvergiert in der Tat gegen e (Aufgabe 4 in IX.10).

Aufgaben 1. Man berechne Näherungswerte für 1

π 0

1 sin x 2 dx und f¨ ur ex dx. x 0

dx π 2. Es gilt = arctan 1 = . Man berechne daraus einen Näherungs1 + x2 4 0 wert von π und schätze den relativen Fehler ab.

X.8 Uneigentliche Integrale

281

X.8 Uneigentliche Integrale Das Riemann-Integral ist nur definiert f¨ ur beschränkte Funktionen auf einem beschränkten Integrationsintervall. Machen wir uns von diesen Voraussetzungen frei, dann erhalten wir den Begriff des uneigentlichen Integrals, dem wir uns nun widmen wollen. Die Funktion f sei auf dem halboffenen Intervall [a; b[ definiert und f¨ ur jedes x ∈ [a; b[ auf [a; x] Riemannintegrierbar. Wenn der Grenzwert x

lim−

x→b

f (t) dt a

existiert, dann bezeichnen wir ihn als das uneigentliche Integral von f u ¨ber [a; b] und bezeichnen ihn wie das Riemann-Integral mit b

f (x) dx. a

y

6

. .... ... ..... ... .. .. .......... ....... y = f (x) .................... ............ ......................... . . . . . ................. ........................................... . . . . ....................... ..................................................... . . . . . . . ............................................. .................................................................................... x . a b . 6 ....

Fig. 1: Uneigentliches Integral

Entsprechend definiert man das uneigentliche Integral f¨ ur den Fall, dass f an der Stelle a nicht definiert ist, durch einen rechtsseitigen Grenzwert. Ist die Funktion an einer inneren Stelle von [a; b] nicht definiert, dann erklärt man das uneigentliche Integral als eine Summe eines links- und eines rechtsseitigen Grenzwerts. Ist f auf [a; b] Riemann-integrierbar, dann existieren alle betrachteten Grenzwerte, und das uneigentliche Integral stimmt mit dem Riemann-Integral u ¨berein. Das uneigentliche Integral ist also eine Verallgemeinerung des Riemann-Integrals. Beispiel 1: Die Funktion x → x−α ist f¨ ur α > 0 an der Stelle 0 nicht definiert; in der Umgebung von 0 wächst sie unbeschränkt. F¨ ur α = 1 und ε > 0 ist 1 1 1 (1 − ε1−α ). dx = α x 1 − α ε ur ε → 0+ existiert nicht f¨ ur α > 1; er existiert und ist Der Grenzwert von ε1−α f¨ gleich 0 f¨ ur α < 1. Also gilt 1 1 1 f¨ ur 0 ≤ α < 1. dx = α x 1−α 0

Die Funktion f sei auf [a; ∞[ definiert und f¨ ur jedes x ∈ [a; ∞[ auf [a; x] Riemannintegrierbar. Wenn der Grenzwert


282 x

y

f (t) dt

lim

x→∞

6

.......................... ....................................................... y = f (x) ............................. ....... ..................................................................... ..................................................................................... ................................................................................................................. . . . . . . . . . . . . . . . . . . . . ............ x a

a

existiert (Fig. 2), dann bezeichnen wir ihn als das uneigentliche Integral von f u ¨ber [a; ∞[ und bezeichnen ihn mit ∞

f (x) dx.

Fig. 2: Uneigentliches Integral

a

Entsprechend definiert man das uneigentliche Integral f¨ ur den Fall, dass der Integrationsbereich nach unten unbeschränkt ist, und schließlich definiert man ein uneigentliches Integral u ¨ber den Integrationsbereich IR als Summe zweier uneigentlicher Integrale: Es ist ∞

0

f (x) dx := −∞

∞

f (x) dx + −∞

f (x) dx, 0

falls die beiden rechts stehenden Integrale existieren. ur α > 0 auf [1; ∞[. F¨ ur Beispiel 2: Wir betrachten die Funktion f : x → x−α f¨ α = 1 und K ∈ [1; ∞[ ist K 1

1 1 (K 1−α − 1). dx = xα 1−α

1−α

Der Grenzwert von K f¨ ur K → ∞ existiert nicht f¨ ur α < 1; er existiert und ist gleich 0 f¨ ur α > 1. Also gilt ∞ 1

1 1 dx = α x α−1

f¨ ur α > 1.

Mit Hilfe uneigentlicher Integrale mit dem Integrationsbereich [1; ∞[ kann man das Konvergenzverhalten von Reihen untersuchen. In folgendem Beispiel wird die ∞ ∞ 1 1 Verwandtschaft von und dx ausgenutzt. α α i x i=1 1

Beispiel 3 : Es sei α > 0 und f : x → x Da f streng monoton fällt, gilt i

f (i)
0, so dass die Reihe f¨ ur |x| < r absolut konvergiert und f¨ ur |x| > r divergiert. ur alle x mit Beweis: Ist die Reihe f¨ ur x = x0 = 0 konvergent, dann ist sie auch f¨ |x| < |x0 | absolut konvergent, denn f¨ ur ein solches x ist n x ≤ Kq n ,

|an xn | = |an xn0 | ·

x0

ur wobei K eine Schranke f¨ ur die Glieder |an xn0 | ist und q < 1 gilt. Ist die Reihe f¨ x = x0 divergent, dann ist sie auch f¨ ur jedes x mit |x| > |x0 | divergent, da sie sonst nach obigem f¨ ur x = x0 konvergent sein m¨ usste. Es gilt also Satz 1 mit r := sup{x ∈ IR |

∞ n=0

an xn konvergiert an der Stelle x.}

2

Die in Satz 1 betrachtete Zahl r nennt man den Konvergenzradius der Potenzreihe. Das Intervall ] − r; r[ nennt man das Konvergenzintervall der Potenzreihe. Ist die Reihe nirgends konvergent, dann setzen wir r = 0; ist sie u ¨berall konvergent, dann setzen wir r = ∞. Entsprechend soll die Aussage des folgenden Satzes interpretiert werden. Die Behauptungen dieses Satzes ergeben sich sofort aus dem Quotientenkriterium bzw. aus dem Wurzelkriterium (Abschnitt IX.9). Satz 2: a) F¨ ur den Konvergenzradius r der Potenzreihe

n=0

⎧ ⎪ ⎪ ⎪ ⎪ 0, ⎪ ⎪ ⎪ ⎪ ⎨

r=

⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩

an xn gilt

an+1 ankt wächst, a unbeschr¨ n a 1 , falls lim n+1 = μ > 0, an μ an+1 = 0. ∞, falls lim a

falls

n

b) F¨ ur den Konvergenzradius r der Potenzreihe

r=

∞

⎧ ⎪ ⎪ ⎪ 0, ⎪ ⎪ ⎪ ⎪ ⎨ 1

∞ n=0

an xn gilt

falls ( n |an |) unbeschränkt wächst,

,

falls lim( n |an |) = μ > 0,

⎪ ⎪ μ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ ∞, falls lim( n |an |) = 0.

1 , wobei μ der größte Häufungspunkt (Limes μ a superior) der Glieder der Folge | n+1 | bzw. der Folge ( n |an |) ist. In dieser an

Allgemeiner als in Satz 2 gilt r =

XI.1 Konvergenz von Potenzreihen

291

¨ Allgemeinheit werden wir diesen Satz hier aber nicht benötigen. Uber das Konvergenzverhalten an den Stellen ±r sagen obige Sätze nichts aus. ∞

∞ xn

∞ xn

Beispiel 1: Die Potenzreihen xn , , haben alle den Kon2 n=0 n=0 n n=0 n √ n vergenzradius 1, denn lim( n) = 1. Die erste konvergiert weder an der Stelle −1 noch an der Stelle 1, die zweite konvergiert zwar nicht an der Stelle 1 (harmonische Reihe!), aber an der Stelle −1 (leibnizsche Reihe!), die dritte konvergiert sowohl an der Stelle −1 als auch an der Stelle 1. Satz 3 (abelscher Grenzwertsatz, benannt nach Niels Hendrik Abel, 1802–1829): Gilt f¨ ur die Funktion f auf dem Intervall ] − r; r[ mit r ∈ IR+ f (x) =

∞ n=0

an xn ,

und konvergiert die Reihe noch f¨ ur x = r, dann existiert der linksseitige Grenzwert von f an der Stelle r, und es gilt lim− f (x) =

x→r

∞ n=0

an rn .

Eine entsprechende Aussage gilt f¨ ur die Stelle −r. Beweis: Man kann r = 1 annehmen, andernfalls ersetze man die Koeffizienten an durch an rn . Die Potenzreihe habe also den Konvergenzradius 1, und die Reihe (sn ) := Σ(an ) sei konvergent zum Grenzwert s. Nun gilt f¨ ur |x| < 1 f (x) =

∞ n=0

(sn − sn−1 )xn = (1 − x)

da (sn ) konvergiert. Wegen (1 − x)

∞

∞ n=0

sn x n ,

xn = 1 folgt f¨ ur |x| < 1

n=0

s − f (x) = (1 − x)

∞ n=0

(s − sn )xn .

ur Nun wählen wir zu einem gegebenen ε > 0 ein N0 ∈ IN so, dass |s − sn | < ε f¨ n > N0 . Dann ist f¨ ur 0 ≤ x < 1 N0 ∞ n |s − f (x)| ≤ (1 − x) (s − sn )x + ε(1 − x) xn . n=0 n=N0 +1

Wählen wir K größer als

N0 n=0

|s − sn |, dann folgt |s − f (x)| ≤ K(1 − x) + ε.

Wählt man nun x so, dass 1 − x
0 derart, dass die Potenzreihen ∞ ∞

n=0

an x n

und

n=0

bn xn

f¨ ur |x| < konvergieren und f¨ ur jedes solche x den gleichen Wert haben, dann gilt an = bn f¨ ur alle n ∈ IN0 . Beweis: Wir beweisen diesen Satz mit vollständiger Induktion. Setzt man x = 0, so ergibt sich a0 = b0 . Es sei schon gezeigt, dass ai = bi f¨ ur i = 0, 1, . . . , n. Dann ist f¨ ur x = 0 ∞

i=n+1

ai xi−(n+1) =

∞

i=n+1

bi xi−(n+1) . 2

F¨ ur x = 0 ergibt sich daraus an+1 = bn+1 .

Satz 5: a) Jede Potenzreihe ist in ihrem Konvergenzintervall I stetig und daher integrierbar; eine Stammfunktion gewinnt man durch gliedweises Integrieren: ∞ ∞ an n+1 an xn = x . n +1 n=0 n=0 b) Jede Potenzreihe ist in ihrem Konvergenzintervall I differenzierbar; die Ableitung gewinnt man durch gliedweises Differenzieren:

∞

n=0

an x

n

=

∞ n=1

nan xn−1 .

Beweis: a) Wir setzen f¨ ur x ∈ I und N ∈ IN fN (x) :=

N n=0

an xn

und

f (x) := lim fN (x). N →∞

Die ganzrationale Funktion fN ist stetig. Die Funktion RN := f − fN ist ebenfalls stetig in I. Denn f¨ ur x ∈ I mit |x| ≤ < r ist |RN (x)| ≤

∞ n=N +1

|an |n < ε

f¨ ur ein gegebenes ε > 0, falls N hinreichend groß ist, f¨ ur x, x + h ∈ I also |RN (x + h) − RN (x)| < 2ε.

XI.1 Konvergenz von Potenzreihen Nun setze man

FN (x) :=

x

0

293

fN (t) dt

F (x) :=

und

x

0

f (t) dt.

Zu gegebenem ε > 0 und einem festen x = 0 aus dem Konvergenzintervall existiert ein N0 ∈ IN so, dass ε |f (t) − fN (t)| < |x| ur diese Werte gilt dann f¨ ur alle t mit |t| ≤ |x| und alle N > N0 . F¨

|F (x) − FN (x)| ≤

x 0

|f (t) − fN (t)| dt ≤ ε. x

Also ist

lim FN (x) = F (x) bzw.

N →∞

N →∞

x

fN (t) dt =

lim

0

lim fN (t) dt.

0

N →∞

Die hier erlaubte Vertauschung von Grenzwertbildung und Integration benötigen wir auch im nächsten Beweisschritt. b) Die Behauptung folgt aus a) und aus dem Hauptsatz der Differenzial- und Integralrechung: F (x) − F (0) = = = Beispiel 2: Auf ] − 1; 1[ gilt man die Formel

lim (FN (x) − FN (0))

N →∞

lim

x

N →∞ 0 x

FN (t) dt =

lim fN (t) dt =

0 N →∞ ∞

n=0 ∞

xn =

1 und 1−x

nxn−1 =

n=1

x

lim FN (t) dt

N →∞ 0x 0 ∞

n=0

2

f (t) dt

xn

=

∞ n=1

nxn−1 , woraus

1 (1 − x)2

1 1 1 1 1 gewinnt. F¨ ur x = erhält man 1 + 2 · + 3 · + 4 · + 5 · + . . . = 4 (vgl. IX.9). 2 2 4 8 16 ∞ ∞ xn+1 n Auf ] − 1; 1[ gilt x = , woraus man folgende Formel gewinnt: n=0 n=0 n + 1 ∞ xn n=1

F¨ ur x =

n

= − ln(1 − x)

1 1 1 1 1 1 erhält man + + + + + . . . = ln 2. Satz 3 erlaubt es, oben 2 2 8 24 64 160

x = −1 zu setzen; dies liefert den Wert der leibnizschen Reihe: 1−

1 1 1 1 + − + − + . . . = ln 2. 2 3 4 5

XI Potenzreihen

294 ∞

Beispiel 3: Auf ] − 1; 1[ gilt

1 . 1 + x2

(−1)n x2n =

n=0

Differenziation liefert die Formel

∞

(−1)n−1 2nx2n−1 =

n=1

2x . (1 + x2 )2

1 2 3 4 An der Stelle x = ergibt dies 1 − + − + − . . . = 0,64. 2 4 16 64 ∞

Integration liefert die interessantere Formel

(−1)n

n=0

x2n+1 = arctan x. 2n + 1

Satz 3 erlaubt es, hier x = 1 zu setzen; man erhält (vgl. X.8) π 1 1 1 1 + − + − +... = . 3 5 7 9 4

1−

∞ xn konvergiert u ¨berall auf IR. Differenziation n! n=0

Beispiel 4: Die Potenzreihe

f¨ uhrt diese Reihe in sich selbst u ur die durch diese Reihe dargestellte Funk¨ber. F¨ f tion f gilt also f = f bzw. (ln f ) = = 1. Es folgt ln f (x) = x + c, wegen f

f (0) = 1 also ln f (x) = x bzw. f (x) = ex . Es gilt daher (wie wir schon wissen) ex =

∞ xn n=0

n!

.

Wir wenden uns nun dem Rechnen mit Potenzreihen zu. Selbstverständlich werden Potenzreihen im Innern ihres gemeinsamen Konvergenzintervalls durch gliedweise Addition und Vervielfachung addiert und vervielfacht:

∞

n=0

an x

n

+ c

∞

n=0

∞ n=0

bn x

n

=

an x n

=

∞ n=0 ∞ n=0

(an + bn )xn , can xn .

Die Multiplikation von Potenzreihen ist etwas komplizierter (Satz 6). Man denke dabei an die Multiplikation von Polynomen: (a0 + a1 x + a2 x2 + a3 x3 + . . . + an xn ) · (b0 + b1 x + b2 x2 + b3 x3 + . . . + bn xn ) = a0 b0 + (a0 b1 + a1 b0 )x + (a0 b2 + a1 b1 + a2 b0 )x2 + (a0 b3 + a1 b2 + a2 b1 + a3 b0 )x3 + . . . Satz 6: Zwei Potenzreihen werden im Innern ihrer Konvergenzintervalle folgendermaßen multipliziert:

∞

n=0

an x

n

·

∞

n=0

bn x

n

=

∞ n=0

cn xn

mit cn = a0 bn + a1 bn−1 + . . . + an b0 (n ∈ IN0 ).

XI.1 Konvergenz von Potenzreihen

295

Beweis: Da Potenzreihen im Innern ihrer Konvergenzintervalle absolut konvergieren, können wir annehmen, dass die Summanden der Potenzreihen nichtnegativ sind. F¨ ur N ∈ IN sei AN =

N n=0

an xn ,

BN =

N n=0

bn x n ,

CN =

N n=0

cn xn

mit der oben definierten Folge (cn ). Dann ist 0 ≤ A2N B2N − C2N ≤ A2N (B2N − BN ) + (A2N − AN )B2N . Daraus ergibt sich wegen der Konvergenz der Folgen (An ) und (Bn ) aufgrund des Cauchy-Kriteriums lim C2N = A · B. 2 N →∞

Die oben definierte Folge (cn ) heißt Cauchy-Produkt der Folgen (an ) und (bn ). Beispiel 5: Hat ∞ n=0

an xn ·

∞ n=0

∞

an xn den Konvergenzradius r, dann gilt f¨ ur |x| < min(1, r)

xn =

n=0

∞ n=0

sn x n

∞

bzw.

n=0

an xn = (1 − x)

∞ n=0

sn x n

mit sn = a0 + a1 + a2 + . . . + an (n ∈ IN0 ). Ist etwa an = 1 und damit sn = n + 1 f¨ ur alle n ∈ IN0 , so erhält man die schon oben gefundene Formel ∞

(n + 1)xn =

n=0

Beispiel 6: Die Folge (Bn ) sei rekursiv definiert durch B0 = 1 und n−1 i=0

1 . (1 − x)2

1 + 2B1 1 + 3B1 + 3B2 1 + 4B1 + 6B2 + 4B3 1 + 5B1 + 10B2 + 10B3 + 5B4

n Bi = 0 f¨ ur n > 1 i

(vgl. Tabelle). Dies ist die Folge der

= = = = .. .

0 0 0 0

bernoullischen Zahlen (Jakob Bernoulli, 1654–1705), welche in der Kombinatorik eine große Rolle spielen. F¨ ur alle x ∈ IR gilt ∞ Bn n=0

n!

xn =

ex

x , −1

denn die Koeffizienten cn des Produktes

x

(e − 1)

∞ Bn

n=0

n!

x

n

x B1 x2 B2 2 = x+ + + . . . · B0 + x+ x + ... 2! 3! 1! 2!

sind 1 f¨ ur n = 1 und 0 sonst.

XI Potenzreihen

296 Im nächsten Abschnitt betrachten wir Reihen der Form ∞ i=0

ai (x − x0 )i .

Auch diese heißen Potenzreihen, und zwar Potenzreihen mit der Entwicklungsmitte x0 .

Aufgaben 1. Man zeige, dass die Reihen

∞ n=0

an xn ,

chen Konvergenzradius haben.

∞

∞ an n nan xn den gleix und n=0 n + 1 n=0

2. Man bestimme den Konvergenzradius von

∞ n=0

an xn ; man untersuche in a)

und b) auch die Konvergenz auf dem Rand des Konvergenzintervalls. √ √ √ n! b) an = n + 1 − n c) an = 2n n d) an = n a) an = na n

3. Man bestimme den Konvergenzradius von αn =

∞

αn xn mit n=2 n log n

⎧ ⎪ ⎪ ⎨ +1

f¨ ur

⎪ ⎪ ⎩ −1

f¨ ur 22k+1 ≤ n < 22k+2

22k ≤ n < 22k+1

(k = 0, 1, 2, . . .)

Man zeige, dass die Reihe an beiden Enden des Konvergenzintervalls konvergiert, aber nicht absolut.

4. Man berechne die Bernoulli-Zahlen B1 , B2 , . . . , B10 . Man zeige, dass B2n+1 = 0 f¨ ur n ≥ 1.

5. Es sei C(x) =

∞

(−1)n

n=0

∞ x2n x2n+1 (−1)n und S(x) = . (2n)! (2n + 1)! n=0

Man zeige, dass die beiden Potenzreihen u ¨berall konvergieren, dass C = −S und S = C und dass f¨ ur alle x1 , x2 ∈ IR gilt: C(x1 )C(x2 ) − S(x1 )S(x2 ) = C(x1 + x2 ) ur alle x ∈ IR. Man leite daraus her, dass S(x)2 + C(x)2 = 1 f¨

6. Man erkläre die merkwürdige Formel

2 6 12 20 30 + + + + + . . . = 16. 1 2 4 8 16

XI.2 Taylor-Entwicklung

297

XI.2 Taylor-Entwicklung Möchte man eine (hinreichend oft) differenzierbare Funktion f in einer Umgebung einer Stelle x0 ∈ Df näher untersuchen, so ist es hilfreich, sie durch einfache Funktionen gut zu approximieren. Als einfach“ soll dabei eine Polynomfunktion ” von möglichst kleinem Grad gelten, als gut“ soll die Approximation gelten, wenn ” f und die approximierende Funktion im Wert und in möglichst vielen Ableitungen an der Stelle x0 u ¨bereinstimmen. Die beste konstante Approximation ist p0 : x → f (x0 ), da p0 (x0 ) = f (x0 ). Die beste lineare Approximation ist p1 : x → f (x0 ) + f (x0 )(x − x0 ), da p1 (x0 ) = f (x0 ) und p1 (x0 ) = f (x0 ). Die beste quadratische Approximation ist f (x0 ) (x − x0 )2 , 2 da p2 (x0 ) = f (x0 ), p2 (x0 ) = f (x0 ) und p2 (x0 ) = f (x0 ) (Fig. 1). p2 : x → f (x0 ) + f (x0 )(x − x0 ) +

Man wird also nach Funktionen der Art pn : x →

n i=0

y

ai (x − x0 )i

suchen, welche in den ersten n Ableitungen mit den Ableitungen von f an der Stelle x0 u ¨bereinstimmen. Um die Gestalt der Koeffizienten ai zu finden, betrachten wir zunächst den einfachen Fall einer Polynomfunktion f vom Grad n, also n f (x) =

i=0

ci xi .

Man macht also den Ansatz f (x) =

n i=0

ai (x − x0 )i .

6

p1 . . . . .... ..... ... ... f . . . . . .... ... .. ........................... p2 . . . . . ............... ........... . . . . . ... .... .........................................u.............................................. p0 ..... ...... . . . . . ......... ............. . . . . ... .... ..... .......... x x0 .. .. .... ..

Fig. 1: Approximationspolynome

Setzt man x = x0 , so ergibt sich f (x0 ) = a0 . Differenziert man einmal und setzt dann x = x0 , so ergibt sich f (x0 ) = a1 . Differenziert man i-mal und setzt dann x = x0 , so erhält man f (i) (x0 ) = i!ai . Schreibt man die Koeffizienten ai mit Hilfe dieser Beziehungen, so ist f (x) =

n f (i) (x0 ) i=0

i!

(x − x0 )i .

XI Potenzreihen

298

Diese sehr triviale Umformung gibt nun Anlass zu der Frage, ob man auch andere als nur Polynomfunktionen in dieser Weise darstellen kann, wobei nat¨ urlich anstelle der Summe eine Potenzreihe stehen m¨ usste. Betrachten wir zwei einfache Beispiele mit x0 = 0: Beispiel 1: F¨ ur

1 f (x) = 1−x gilt f (i) (x) =

=

∞

x

i

(x ∈] − 1; 1[)

i=0

i! , also f (i) (0) = i! (1 − x)i+1

und damit f (x) =

∞ f (i) (0) i=0

i!

xi .

Beispiel 2: F¨ ur f (x) = ex gilt f (i) (0) = 1 f¨ ur alle i. Damit ergibt sich die bekannte Reihe f¨ ur die e-Funktion (vgl. X.10 und XI.2): ex =

∞ f (i) (0) i=0

i!

xi =

∞ xi i=0

i!

.

Satz 1 (Taylor-Entwicklung, nach Brook Taylor, 1685–1731): Es sei f eine auf dem Intervall I (n + 1)-mal stetig differenzierbare Funktion und x0 ein innerer Punkt von I. Dann gilt f¨ ur x ∈ I die taylorsche Formel f (x) =

n f (i) (x0 ) i=0

i!

(x − x0 )i + Rn (x, x0 )

mit dem taylorschen Restglied x

Rn (x, x0 ) =

1 (x − t)n f (n+1) (t) dt. n! x 0

Beweis: Wir f¨ uhren den Beweis induktiv. Der Fall n = 0 ist klar, denn es gilt x

f (x) = f (x0 ) +

f (t) dt. Der Induktionsschritt besteht in folgender Umformung

x0

des Restglieds mit Hilfe partieller Integration: x

Rk (x, x0 ) =

1 (x − t)k f (k+1) (t) dt k! x 0

⎛

x

⎞

x

(x − t)k+1 (k+2) 1 ⎝ −(x − t)k+1 (k+1) = (t) + (t) dt⎠ f f k! k+1 k + 1 x0 x 0

x

(x0 ) f 1 = (x − t)k+1 f (k+2) (t) dt. (x − x0 )k+1 + (k + 1)! (k + 1)! x (k+1)

0

2

XI.2 Taylor-Entwicklung

299

Ist f auf I beliebig oft differenzierbar, dann konvergiert die Folge der Taylor-

n f (i) (x ) ∞ f (i) (x ) 0 0 (x − x0 )i auf I gegen die Potenzreihe (x − x0 )i , i! i! i=0 i=0 ∞ f (i) (x ) 0 (x − x0 )i . Dies falls n→∞ lim Rn (x, x0 ) = 0 auf I gilt. Dort ist dann f (x) = i! i=0

Polynome

ist die Taylor-Reihe von f bez¨ uglich der Entwicklungsmitte x0 .

Satz 2 (Hinreichendes Kriterium f¨ ur die Konvergenz der Taylor-Reihe): Die Funktion f sei auf I beliebig oft differenzierbar, ferner seien x, x0 ∈ I. Existieren dann ein K > 0 und ein c > 0 mit |f (i) (t)| ≤ Kci f¨ ur alle t zwischen x und x0 und alle i ∈ IN, dann ist lim(Rn (x, x0 )) = 0, also f (x) =

∞ f (i) (x0 ) i=0

i!

(x − x0 )i .

Beweis: Wir benötigen den folgenden Mittelwertsatz der Integralrechnung, der in XI.6 Aufgabe 10 bewiesen werden sollte, aber auch anschaulich klar ist: Sind f und g stetig auf [a; b], dann gibt es ein ξ ∈]a; b[ mit

b

b

f (x)g(x) dx = f (ξ) g(x) dx. a

Aus diesem Satz folgt, dass eine Zahl θ ∈]0; 1[ existiert mit 1 x Rn (x, x0 ) = (x − t)n f (n+1) (t)dt n! x0 f (n+1) (x0 + θ(x − x0 )) x (x − t)n dt = n! x0 f (n+1) (x0 + θ(x − x0 )) = (x − x0 )n+1 . (n + 1)! Die Behauptung folgt nun aus |Rn (x, x0 )| ≤ K f¨ ur a ∈ IR.

|c(x − x0 )|n und lim n→∞ (n + 1)!

a

an (n + 1)!

=0 2

Beispiel 3: Die Funktion f : x → ex lässt sich an jeder Stelle x0 ∈ IR als Entwicklungsmitte als Taylor-Reihe darstellen. F¨ ur x0 = 0 ist die Darstellung in Beispiel 2 angegeben; hier beachte man, dass |f (i) (t)| ≤ e|x| f¨ ur alle t ≤ |x|. Wegen ex−x0 = ex e−x0 gilt damit ∞ x0 e ur jedes x0 ∈ IR. (x − x0 )i f¨ ex = i! i=0 Beispiel 4 (vgl. Aufgabe 5 in XI.1): F¨ ur die Sinusfunktion f : x → sin x gilt f (2i) (0) = 0 und f (2i+1) (0) = (−1)i f¨ ur alle i ∈ IN0 . Also ist sin x =

∞

(−1)i

i=0

Entsprechend ergibt sich cos x =

∞ i=0

x2i+1 f¨ ur alle x ∈ IR. (2i + 1)! (−1)i

x2i f¨ ur alle x ∈ IR. (2i)!

300

XI Potenzreihen

Beispiel 5: Die Funktion f mit

1 y = e x2 −

y

6

1 − f (x) = e x2

..................................... .... .... .... .... .... ....1.... .... .... .... .... .... .... .................................... ............ ....... ......... .......... . . . . ........ . . . ..... ....... ..................................... -

f¨ ur x = 0 und f (0) = 0 (Fig. 2) x ist zwar u ¨berall unendlich oft differenzierbar, aber nicht als Fig. 2: Zu Beispiel 5 Taylor-Reihe mit der Entwicklungsmitte 0 darstellbar. Es gilt nämlich f (i) (0) = 0 f¨ ur alle i ∈ IN, alle Taylorpolynome sind also das Nullpolynom, und die Funktion stimmt immer mit ihrem Restglied u ¨berein. Beispiel 6: Wir wollen die Funktion f : x → ln(1 + x) mit der Entwicklungsmitte 0 im Intervall ] − 1; 1] betrachten. Es gilt dort f (i) (x) = (−1)i+1 also

(i − 1)! , (1 + x)i

f (0) (0) f (i) (0) (−1)i+1 = 0 und = f¨ ur alle i ∈ IN. 0! i! i

Zur Abschätzung des Restglieds Rn (x, 0) der Taylor-Entwicklung im Intervall ] − 1; 1] ist Satz 2 nicht geeignet, wir verfahren vielmehr folgendermaßen: Der schon oben benutzte Mittelwertsatz der Integralrechnung liefert Rn (x, 0) =

x x x 1 (−1)n n! (t − x)n (θx − x)n (x − t)n dt dt = dt = n! (1 + t)n+1 (1 + t)n+1 (1 + θx)n+1 0

0

0

mit 0 < θ < 1, also gilt f¨ ur |x| < 1 |Rn (x, 0)| = |x|

n+1

(1 − θ)n |x|n+1 < |1 + θx|n+1 1 − |x|

1−θ 1 − θ|x|

n

0, Maximum, falls f (n) (x0 ) < 0. ur f (n) (x0 ) < 0 verläuft der Beweis analog), also Beweis: Es sei f (n) (x0 ) > 0 (f¨ f (n) (x0 ) = lim

x→x0

f (n−1) (x) − f (n−1) (x0 ) > 0. x − x0

Wegen der Stetigkeit von f (n−1) und wegen f (n−1) (x0 ) = 0 existiert ein δ > 0 mit f (n−1) (x) > 0 f¨ ur x0 − δ < x < x0 + δ, x − x0 ur x0 < x < x0 + δ und f (n−1) (x) < 0 f¨ ur x0 − δ < x < x0 . also f (n−1) (x) > 0 f¨ Aus der taylorschen Formel f (x) = f (x0 ) +

f (n−1) (x0 + θ(x − x0 )) (x − x0 )n−1 (n − 1)!

mit 0 < θ < 1 folgt f¨ ur gerades n: ur x0 − δ < x < x0 + δ, f (x) > f (x0 ) f¨ ur ungerades n folgt dagegen f hat also ein lokales Minimum an der Stelle x0 . F¨ ur x0 − δ < x < x0 f (x) < f (x0 ) f¨

und f (x) > f (x0 ) f¨ ur x0 < x < x0 + δ, 2

f hat also kein Extremum an der Stelle x0 .

Da die Extrempunkte der Ableitungsfunktion f die Wendepunkte von f sind, hat man damit auch ein notwendiges und hinreichendes Kriterium f¨ ur die Wendepunkte von f . Hier muss die erste nichtverschwindende Ableitung von f (abgesehen von f (x0 )) von ungerader Ordnung sein. Ist außerdem noch f (x0 ) = 0, dann liegt ein Sattelpunkt vor (Fig. 3).

y ..... y = f (x) 6 ...

... Maximalpunkt ... s .................................................. ... .... .....Sattelpunkt . . s ... . . . ..... ..... Wendepunkt .......................s.................. .................s.................. ....... ..... Minimalpunkt ..... .. x Fig. 3: Extremal- und Wendepunkte

XI Potenzreihen

302

Aufgaben 1. Man bestimme die Taylorreihe für die Funktion mit dem angegebenen Funktionsterm und der angegebenen Entwicklungsmitte. Man untersuche auch die Konvergenz auf dem Rand des Konvergenzintervalls. 1 x 1 1 a) ; x0 = 0 b) ; x0 = ; x0 = 0 c) 1+x 1−x (1 − x)2 2 d)

1 ; x0 = 1 x3

e)

1−x ; x0 = 0 1+x

f) ln

1−x ; x0 = 0 1+x

2. Man beweise, dass eine auf IR definierte Funktion genau dann ganzrational vom Grad ≤ n ist, wenn f (n+1) (x) = 0 f¨ ur alle x ∈ IR gilt.

3. Man bestimme die Extrema der Funktionen mit dem angegebenen Funktionsterm in der jeweils größtmöglichen Definitionsmenge. a) x4 − 3x2 e)

n i=1

ai (x − bi )2

b) x5 − 16x2 2

f) xex +

c) xx 0

x

d)

ax + b cx + d

2

(1 + 4t)et dt

XI.3 Numerische Berechnungen Funktionswerte von nichtrationalen Funktionen, wie es etwa die Wurzelfunktionen, Exponentialfunktionen und trigonometrischen Funktionen sind, berechnet man in der Regel mit Iterationsverfahren (vgl. X.4) oder mit Reihenentwicklungen, also mit Hilfe von elementaren Rechenoperationen. Ebenso geschieht es auch in einem elektronischen Rechner, wenn wir etwa die Wurzeltaste benutzen. Berechnung der eulerschen Zahl: Die Zahl e kann man mit Hilfe der Reihe ∞ 1 n 1 e = berechnen. F¨ ur sn = gilt i=0

i!

sn < e < sn + e − sn < =

1 , denn n!n ∞ 1

i=0

i!

1 (n + 1)! i=0 (n + 1)i n+1 1 1 · = . (n + 1)! n n!n

sn ≈ + + + + + + + + + + +

1,000000000000 1,000000000000 0,500000000000 0,166666666666 0,041666666666 0,008333333333 0,001388888888 0,000198412690 0,000024801587 0,000002755732 0,000000275573 0,000000025052

Ein achtstelliger Taschenrechner liefert e = 2, 7182818. Um diese Genauigkeit aus e ≈ 2,718281826 der Reihendarstellung zu gewinnen, muss ullt. man n so wählen, dass n!n > 5 · 108 ist. Mit n = 11 ist diese Bedingung erf¨ Man erhält damit 2,718281826 < e < 2,718281830 (vgl. obige Tabelle).

XI.3 Numerische Berechnungen

303

Berechnung der Kreiszahl: Zur Berechnung der Zahl π kann man die TaylorEntwicklung von arctan in ] − 1; 1] benutzen. Es ist dort arctan x =

∞

(−1)i

i=0

denn (arctan x) =

x2i+1 , 2i + 1

∞ 1 = (−1)i x2i , 1 + x2 i=0

woraus durch Integration obige Reihendarstellung folgt (vgl. XI.1). F¨ ur x = 1 folgt aufgrund des abelschen Grenzwertsatzes π 1 1 1 = 1 − + − + −... . 4 3 5 7 Diese Reihe konvergiert aber sehr langsam; man m¨ usste mehr als 1000 Glieder aufsummieren, um π auf drei Nachkommastellen genau zu berechnen. Schon etwas 1 besser konvergiert die arctan-Reihe f¨ ur x = √ : 3

π 1 1 1 1 = √ 1− + − + −... . 6 9 45 567 3 1 5

Wesentlich besser ist folgendes Verfahren: Ist α := arctan , dann ist tan 2α =

5 2 tan α = 2 1 − tan α 12

und

Also ist 4α nur geringf¨ ugig größer als tan β =

tan 4α =

2 tan 2α 120 = . 2 1 − tan 2α 119

π π . Wir setzen β := 4α− ; dann ist 4 4

120 −1 tan 4α − tan π4 1 119 = . π = 1 + tan 4α · tan 4 239 1 + 120 119

Jetzt berechnen wir π = 4(4α − β) = 16α − 4β mit Hilfe der arctan-Reihe:

π = 16

1 1 1 1 1 + − +... − 4 + −... . − − 5 3 · 53 5 · 55 239 3 · 2393

Schon die ersten Glieder liefern gute Näherungen; beispielsweise ist

1 1 1184 4 12601 1 − = − =3 = 3,14059693 . . . . −4· 16 5 3 · 53 239 375 239 89625

XI Potenzreihen

304 Berechnung der Logarithmen: Es gilt

ln

1+x 1−x

= (ln(1 + x)) − (ln(1 − x)) =

1 1 + 1+x 1−x

und f¨ ur i ∈ IN

ln

1+x 1−x

(i)

= (−1)i−1

(i − 1)! (i − 1)! + . (1 + x)i (1 − x)i

Damit erhält man in ] − 1; 1[ die Taylor-Entwicklung ln F¨ ur x =

∞ 1+x x2i+1 =2 . 1−x i=0 2i + 1

1 ergibt sich 3

ln 2 = 2

∞

1 . 2i+1 (2i + 1)3 i=0

Bezeichnet man das i-te Glied dieser Reihe mit ai und setzt sn := rn = ln 2 − sn , dann ist

0 < rn < an+1 1 +

n i=0

ai sowie

1 1 1 9 1 + + . . . < an · 2 · = an . 3 9 3 8 8

Summiert man die ersten 8 Glieder auf, so ergibt sich 0,6931471 < ln 2 < 0,6931472. Nun kann man die Werte ln k der Reihe nach f¨ ur k = 3, 4, 5, . . . berechnen, wenn man die Reihe ln(k + 1) = ln k + 2

∞

1 (2i + 1)(2k + 1)2i+1 i=0

benutzt, welche sich aus obiger Taylor-Reihe f¨ ur x = ist wegen ln 10 = ln 2 + ln 5

ln 11 = ln 2 + ln 5 + 2

1 ergibt. Beispielsweise 2k + 1

1 1 1 + + + ... . 21 3 · 213 5 · 215

Bricht man die Summe nach dem dritten Summanden ab, dann ist der Fehler kleiner als 1 1 21 2· · 7 · < 2 · 10−10 . 7 21 20

XI.3 Numerische Berechnungen

305

Berechnung von Wurzeln: Wurzeln kann man mit Hilfe von Iterationsverfahren (vgl. X.4) oder mit Hilfe der Logarithmen berechnen, man kann sie aber auch mit Hilfe von Reihenentwicklungen gewinnen. Dazu benötigen wir die binomische Reihe

∞ α i α (1 + x) = x, i i=0 wobei α eine beliebige reelle Zahl ist und

α α(α − 1)(α − 2) · . . . · (α − i + 1) := i i!

α := 1 vereinbart wird. Der Konvergenzradius der binomischen Reihe 0 ist 1. Man beachte, dass auf ] − 1; 1[ sowie

((1 + x)α )(i) = α(α − 1)(α − 2) · . . . · (α − i + 1)(1 + x)α−i gilt. Wegen

− 12 (−1) i i

=

1 · 3 · 5 · . . . · (2i − 1) 2 · 4 · 6 · . . . · (2i)

ist also f¨ ur |x| < 1 √

15 3 1 1 = 1 + x + x2 + x 3 + . . . . 2 8 48 1−x

Damit kann man Quadratwurzeln berechnen, wenn man sie geschickt mit Hilfe 1 des Terms √ und möglichst kleinem x darstellt. Beispielsweise ist 1−x √ 7 2= · 5 und daher

√

50 7 1 = · 49 5 1−

1 50

7 1 1 15 1 3 1 1+ · + + ... . + · · 5 2 50 8 502 48 503 Schon die vier ersten Summanden liefern den sehr guten Wert 1,4142135; der Taschenrechner liefert dieselben sieben Nachkommastellen. √ Allgemein kann man p n berechnen, indem man dies umformt zu 2=

1

r(1 ± δ)± p mit einer geschickt gewählten rationalen Zahl r und einem möglichst kleinen Wert 1 von δ und die binomische Reihe mit α = ± verwendet. p

XI Potenzreihen

306

Berechnung von Sinuswerten: Grundsätzlich kann man die Werte der Sinusfunktion aus ∞ x2n+1 sin x = (−1)n (2n + 1)! n=0 berechnen, wobei die Qualität der Konvergenz nat¨ urlich von der Größe von x π abhängt. F¨ ur x = α := (= 1o ) ergibt sich bei Abbrechen der Reihe nach dem 180 Summand mit dem Index n ein Fehler, der kleiner als der Betrag des nächsten Gliedes ist, da es sich um eine alternierende Reihe mit monoton fallenden Beträgen der Glieder handelt. Wegen α7 < 2,5 · 10−16 7! α3

α5

ergibt sich f¨ ur sin 1o schon mit α − + ein Wert von höherer Genauigkeit 3! 5! als mit dem Taschenrechner, wenn man π mit einer entsprechenden Genauigkeit einsetzt.

Aufgaben 1. a) Man berechne

10 1 25 4 81 1 = − ln 1 − = − ln 1 − = ln 1 + , ln , ln 9 10 24 100 80 80 möglichst genau, stelle dann ln 2, ln 3, ln 5 als ganzzahlige Linearkombination dieser Zahlen dar und bestimme diese möglichst genau. ¨ b) Beim Ubergang von den briggschen Logarithmen (Zehnerlogarithmen) zu den nat¨ urlichen Logarithmen muss man die briggschen Logarithmen mit einer festen Zahl M multiplizieren. Man bestimme diese Zahl M mit Hilfe der Ergebnisse aus a) möglichst genau. √ 2. a) Man bestimme Näherungen von 2 mit Hilfe des Ansatzes ln

√

1

141 119 − 2 2= 1− . 100 20 000 √ b) Man bestimme Näherungen von 3 mit Hilfe des Ansatzes √

1 732 176 3= 1− 1 000 3 000 000

− 1 2

√

.

3. Man bestimme Näherungen von 3 3 mit Hilfe des Ansatzes √ 3

10 29 3= 1+ 7 1 000

1 3

.

XI.4 Weitere Reihenentwicklungen

307

XI.4 Weitere Reihenentwicklungen Bei der Taylor-Entwicklung in XI.2 haben wir Funktionen betrachtet, die sich — im Fall der Entwicklungsmitte 0 — in einem geeigneten Intervall eindeutig als unendliche Linearkombination“ der Funktionen mit den Termen x0 , x1 , x2 , x3 , . . . ” darstellen lassen. Diese Terme bilden also eine (unendliche) Basis des Vektorraums der betrachteten Funktionen. Sind a0 , a1 , a2 , a3 , . . . die Entwicklungskoeffizien” ∞ ten“ von f , ist also f (x) = ai xi in einem gewissen Intervall, dann kann man i=0

aufgrund des Identitätssatzes f¨ ur Potenzreihen die Funktion f auch eindeutig durch die Folge (an ) kennzeichnen. Eine andere Basis f¨ ur diesen Raum bilden die x0 x1 x2 x3

Funktionen mit den Termen , , , , . . . (Aufgabe 1). Wählt man als Basis 0! 1! 2! 3! die Funktionen mit den Termen x x3 x2 , ,..., , 1 − x 1 − x 2 1 − x3 dann erhält man die sogenannten Lambert-Reihen (nach Johann Heinrich Lambert, 1728–1777). Die Lambert-Reihe ∞ i=1

ai

xi 1 − xi

konvergiert nat¨ urlich nicht f¨ ur |x| = 1. Diese Reihe konvergiert f¨ ur |x| = 1 aber stets dann, wenn Σ(an ) konvergiert. Ist dagegen Σ(an ) nicht konvergent, dann konvergiert die Lambert-Reihe genau dort, wo die Potenzreihe

∞ i=1

ai xi konvergiert,

wobei aber die Stellen ±1 auszuschließen sind. F¨ ur |x| < 1 besteht zwischen Lambert-Reihen und Potenzreihen der Zusammenhang ∞ i=1

ai

∞ xi = Ai x i , i 1−x i=1

ur welche d ein Teiler von n ist (Aufgabe 2). wobei An die Summe aller ad ist, f¨ Von wesentlich anderem Typ sind die Dirichlet-Reihen (nach Peter Gustav Lejeune-Dirichlet, 1805–1859), welche wir nun kurz vorstellen wollen. Die Basis bilden hier die Funktionen mit den Termen 1 1 1 , , , ... . 1x 2x 3x Die Funktion mit der Koeffizientenfolge (1) haben wir schon in X.7 Aufgabe 4 als riemannsche Zetafunktion kennengelernt: ζ(x) =

∞ 1 i=1

ix

XI Potenzreihen

308

Wir wissen, dass diese spezielle Dirichlet-Reihe f¨ ur x > 1 konvergiert und f¨ ur x ≤ 1 divergiert. Der Konvergenzbereich ist also ]1; ∞[. Die Dirichlet-Reihe ∞ (−1)i−1

ix

i=1

ist divergent f¨ ur x ≤ 0, konvergent, aber nicht absolut konvergent f¨ ur 0 < x ≤ 1 und absolut konvergent f¨ ur 1 < x. Dieses Konvergenzverhalten ist typisch f¨ ur Dirichlet-Reihen: Es gibt eine Abszisse x0 , welche den Divergenzbereich vom Konvergenzbereich trennt, und es gibt eine Abszisse x1 , ab welcher absolute Konvergenz herrscht. Dies ist anders als bei Potenzreihen, wo ja der Konvergenzradius gleichzeitig die Grenze der absoluten Konvergenz angibt. Die Abszissen der Konvergenz und der absoluten Konvergenz können zusammenfallen, wie es bei der die Zetafunktion definierenden Reihe der Fall ist; sie können aber auch verschieden sein, wie obiges Beispiel zeigt. Wir werden zeigen, dass sie aber höchstens den Abstand 1 haben können, sofern die Reihe u ¨berhaupt konvergiert. Die Reihe ∞ 1 i=1

∞ i i

bzw.

ii ix

i=1

ix

konvergiert u ¨berall bzw. nirgends. Diese langweiligen Fälle wollen wir im folgenden Satz ausschließen. Satz 1: Die Dirichlet-Reihe

∞ ai i=1

ix

sei weder nirgends noch u ¨berall konvergent. Dann existieren Zahlen λ, l, so dass die Reihe f¨ ur x < λ divergiert, f¨ ur x > λ konvergiert, f¨ ur x < l nicht absolut konvergiert und f¨ ur x > l absolut konvergiert. Dabei gilt 0 ≤ l − λ ≤ 1. Beweis: Die Reihe sei an der Stelle ξ absolut konvergent. Dann ist sie auch an jeder Stelle x > ξ absolut konvergent, denn dann ist n n a a i ≤ i. x ξ i=1

i

i

i=1

Die Menge der Stellen absoluter Konvergenz ist nach unten beschränkt, da die Reihe nicht u ¨berall konvergiert. Setzen wir l gleich dem Infimum dieser Stellen, dann gilt die Behauptung des Satzes f¨ ur l. Nun sei die Reihe an der Stelle η 1 konvergent (nicht notwendig absolut konvergent). F¨ ur x > η ist eine x−η Nullfolge mit positiven Gliedern, so dass mit

∞ ai i=1

∞ ai i=1

ix

=

∞ ai i=1

iη

·

iη

1 ix−η

n

auch


309

konvergiert. Ist λ das Infimum der Konvergenzstellen, dann folgt die Behauptung des Satzes u ¨ber λ. Ist schließlich

∞ ai i=1

ix

konvergent, dann ist

δ > 1 absolut konvergent, woraus l − λ ≤ 1 folgt.

∞ ai f¨ ur jedes x+δ i i=1

2

Periodische Funktionen mit nicht allzu schlimmen“ Unstetigkeiten kann man ” ¨ durch Uberlagerung“ von Sinus- und Kosinuskurven ( Schwingungen“) darstel” ” len. Zunächst wollen wir anhand einer heuristischen Betrachtung herausfinden, ¨ wie eine solche Uberlagerung aussehen könnte. Die Funktion f sei zunächst auf dem Intervall [−π; π] definiert und dann periodisch fortgesetzt mit der Periode 2π. Die Kosinus- und Sinusfunktionen mit den Termen cos nx, sin nx (n ∈ IN) sind periodisch mit der Periode 2π. Wir nehmen an, es gäbe eine Darstellung von f der Form f (x) = c +

∞

n=1

an cos nx + bn sin nx.

Wir nehmen weiterhin an, man d¨ urfe diese Gleichung gliedweise u ¨ber [−π; π] π π cos nx dx = sin nx dx = 0 ergibt sich zunächst integrieren. Wegen π

−π

−π

f (x) dx = 2πc und damit der Wert von c. Multipliziert man obige Gleichung −π

mit cos kx oder sin kx (k ∈ IN0 ) und integriert sie u ¨ber [−π; π], dann ergeben sich wegen π

cos kx sin nx dx = 0 −π

und

π

π

cos kx cos nx dx = −π

sin kx sin nx dx = −π

0 f¨ ur k = n, π f¨ ur k = n

(Produktintegration!) die Koeffizienten π 1 an = f (t) cos nt dt, π −π

π 1 bn = f (t) sin nt dt. π −π

¨ Diese Uberlegungen werden im nun folgenden Satz präzisiert. Den Beweis dieses Satzes wollen wir aber, obwohl er nicht u ¨bermäßig kompliziert ist, hier u ¨bergehen. Die auftretende Reihe nennt man eine Fourier-Reihe (nach Jean Baptiste Joseph Fourier, 1768–1830) und spricht von der Fourier-Entwicklung der Funktion f . Satz 2: Die auf IR definierte Funktion f habe folgende Eigenschaften: • f (x + 2π) = f (x) f¨ ur alle x ∈ IR; • f ist in ] − π; π[ bis auf endlich viele Sprungstellen stetig;

XI Potenzreihen

310 • ist s eine Sprungstelle von f , dann ist 1 f (s) = lim− f (x) + lim+ f (x) ; x→s 2 x→s

• f ist in ] − π; π[ st¨ uckweise stetig differenzierbar, ist also insbesondere nur an endlich viele Stellen in ] − π; π[ nicht differenzierbar. Dann konvergiert die Reihe ∞ a0 + an cos nx + bn sin nx 2 n=1 mit a0 =

π π π 1 1 1 f (t) dt, an = f (t) cos nt dt, bn = f (t) sin nt dt π π π −π

−π

−π

(n ∈ IN) an jeder Stelle x ∈ IR und stellt auf IR die Funktion f dar. In den folgenden Beispielen geben wir stets f (x) in ] − π; π[ an und denken uns dies gemäß den Bedingungen in obigem Satz periodisch fortgesetzt. Ist f eine ungerade Funktion, ist also f (−x) = −f (x), dann sind die Koeffizienten an alle gleich 0, weil dann auch x → f (x) cos nx eine ungerade Funktion ist. Ist f eine gerade Funktion, ist also f (−x) = f (x), dann sind die Koeffizienten bn alle gleich 0, weil dann auch x → f (x) sin nx eine ungerade Funktion ist. Beispiel 1 (Fig. 1): Es sei f (x) = x. Weil diese Funktion f ungerade ist, gilt an = 0 f¨ ur alle n ∈ IN0 . Ferner ist ⎛

⎞

π π 2 1 1 −t cos nt π 1 t sin nt dt = ⎝ − + cos nt dt⎠ = (−1)n+1 . bn = π π n n n −π −π

−π

Es ergibt sich

f (x) = 2 y6 q

−π

sin x sin 2x sin 3x − + − +... . 1 2 3 y

y=x q

π

q -

2π x


In Fig. 2 sind die Graphen der ersten Näherungsfunktionen im Intervall [0; π] skizziert, und zwar

(3) (2).... .......... ..... (1) .. .... .... ................................... ..... . . . . ... .. .... ... .. . ... ... .......... ... ... .. .. ..... ......... ..... .... .... . . ...... .... .. ... ........ ...... ... .. . ............... ...... .. ...... ... .. ............. .... . . .. . ......... ....................... ..... ...... ... -x ................. π 6



311

(2) x → 2 sin x −

(1) x → 2 sin x,

sin 2x 2

,

(3) x → 2 sin x −

sin 2x sin 3x + 2 x

π

Setzt man x = in der Fourier-Entwicklung von f , so ergibt sich die leibnizsche 2 Reihe: π 1 1 = 1 − + − +... 4 3 5 Beispiel 2: Es sei f (x) = x2 . Die Funktion f ist gerade. Es ergibt sich 2 a0 = π 2 , 3 also

π 4 2 2 an = t cos nt dt = (−1)n 2 , π n 0

cos x cos 2x cos 3x π2 f (x) = − + − +... . −4 3 12 22 32

(Aus dieser Reihe ergibt sich durch gliedweise Differenziation die Reihe in Beispiel 1; man m¨ usste aber zunächst klären, ob diese Operation zulässig ist.) In Fig. 3 ist der Graph der Funktion f und der ersten (nicht-konstanten) Approximation x →

π2 − 4 cos x dargestellt. 3

2

y =π3 − 4 cos x .. ....... ....... ....... ....... ....... ... ..... ... ... ..... ... ..... ... ..... ... ..... ... ... .. ... .. ... .. ... .. ... .. ... . ... . x ... . . ... . ... . . ... .. ... .... .. .. ... .. ... .. ... ... ... π ... ...

y = f (x) . y . . . .... .. ........ 6 ........ ........ ........ .. ... ..... ... .... ... ..... .. .... .. ... .. ... .. ... .. . ... . . ... ... .... ... ..... ... .... ... .... .... ... .. ... .. ... .. . .... ... .... .. ....... ....... .. ...... ....... ...... -x π

y6

Fig.3: Zu Beispiel 2

Setzen wir x = 0, so erhalten wir 1 1 1 π2 . − + − + . . . = 12 22 32 12 Addieren wir die (ebenfalls absolut konvergente) Reihe

1 1 1 1 1 1 1 + 2 + 2 + ... = 2 2 + 2 + 2 + ... , 2 2 1 2 3 2 4 6 so erhalten wir das schon fr¨ uher angek¨ undigte Resultat ∞ 1 n=1

n2

=

π2 . 6

.

XI Potenzreihen

312 Beispiel 3: Es sei f (x) = cos αx mit α ∈ ZZ. Wegen π

π

cos αt cos nt dt = 0

1 (cos(α + n)t + cos(α − n)t) dt 2 0

1 sin(α + n)π sin(α − n)π + 2 α+n α−n 1 1 1 α sin απ = = (−1)n 2 sin απ cos nπ − 2 α+n α−n α − n2 =

erhält man cos αx =

2α sin απ π

1 cos 2x cos x + 2 − +... . − 2 2 2 2α α −1 α − 22

An den Stellen ±π ist diese Funktion stetig. Setzt man x = π ein und schreibt dann x f¨ ur α, dann ergibt sich π cot πx −

1 1 1 1 + 2 + 2 + ... . = −2x 2 2 2 x x −n x −2 x − 32

Es ist erlaubt, diese Reihe gliedweise u ¨ber ein Intervall [0; x] mit 0 ≤ x < 1 zu integrieren, wobei auf der linken Seite ein uneigentliches Integral steht; man erhält

∞ sin πx x2 ln = ln 1 − 2 . πx n n=1 ¨ Ubergang zur Exponentialfunktion liefert

∞ sin πx x2 1− 2 . = πx n n=1

An dieser Zerlegung des Sinus in ein unendliches Produkt (vgl. IX.11) erkennt 1 man unmittelbar die Nullstellen der Sinusfunktion. F¨ ur x = erhält man 2

1=

π 2

∞

(2n − 1) · (2n + 1) 2n · 2n n=1

und damit das wallissche Produkt (vgl. Abschnitt IX.11) π 2 2 4 4 6 6 8 8 = · · · · · · · · ... . 2 1 3 3 5 5 7 7 9 Als Anwendung der wallisschen Formel wollen wir nun die stirlingsche Formel (nach James Stirling, 1692–1770) beweisen, welche wir schon in IX.5 erwähnt haben. Dazu untersuchen wir zunächst den Zusammenhang zwischen ln n! =

n i=1

n

ln i

ln x dx.

und 1


313 n

Eine gute Näherung f¨ ur das Integral

ln x dx = n ln n − n + 1 ist

1 n−1 i=1

n 1 1 ln i − ln n, (ln i + ln(i + 1)) = 2 2 i=1

wie man erkennt, wenn man das Integral u ¨ber dem Intervall [i; i + 1] durch den Flächeninhalt eines Trapezes ersetzt. Es ergibt sich also n

ln i = n +

i=1

wobei die Zahlen Rn :=

n−1 i=1

1 ln n − n + 1 − Rn , 2

ri mit i+1

ri := i

1 ln x dx − (ln i + ln(i + 1)) 2

eine konvergente Folge bilden. Denn 1 ri = (i + 1) ln(i + 1) − i ln i − 1 − (ln i + ln(i + 1)) 2 1 1 = i+ ln 1 + −1 2 i 1 1 1 1 1 = i+ − 2 + 3 − 4 + −... − 1 2 i 2i 3i 4i 1 1 1 1 < i+ − 2 + 3 −1 2 i 2i 3i 1 1 = + . 12i2 6i3 ¨ Ubergang zur Exponentialfunktion liefert nun √ n! = nn ne−n e1−Rn . Der Grenzwert

n!en lim e1−Rn β := n→∞ lim √ n = n→∞ nn existiert, weil lim Rn existiert. Um ihn mit der wallisschen Formel zu berechnen, n→∞ formen wir diese zunächst geschickt um: π 2 · 4 · 6 · . . . · (2n − 2) √ 2n = lim n→∞ 3 · 5 · 7 · . . . · (2n − 1) 2 22 42 62 · . . . · (2n − 2)2 √ = lim 2n n→∞ (2n − 1)! 22 42 62 · . . . · (2n)2 √ = lim , n→∞ (2n)! 2n

XI Potenzreihen

314 also

√ (n!)2 22n √ = π. n→∞ (2n)! n lim

Damit ergibt sich √

Also ist β =

√

√ (n!)2 22n 2n en en n2n π = n→∞ lim √ · · √ √ · 2n · n n n (2n)! n n n 2 e √

2 n!en (2n)2n 2n 1 √ √ = n→∞ lim n n n (2n)!e2n 2 β 1 1 = β2 · · √ = √ β 2 2

2π und damit √

n

n e in dem Sinne, dass der Quotient dieser beiden Ausdr¨ ucke f¨ ur n → ∞ den Grenzwert 1 hat. Schon f¨ ur kleine Werte liefert die stirlingsche Formel gute Näherungen; es ergibt sich beispielsweise 10! ≈ 3,6 · 106 mit einem relativen Fehler von weniger als 1%. n! ≈

Aufgaben

1. Reihen mit der Basis multiplizieren:

2πn

xi i ∈ IN0 kann man in ihrem Konvergenzbereich i!

∞ n=0

an

∞ ∞ xn xn xn bn cn . · = n! n=0 n! n! n=0

Wie gewinnt man die Folge (cn ) aus den Folgen (an ) und (bn )? Man beweise die Formel

n = 2n mit Hilfe der Entwicklung von e2x . i=1 i n

2. a) Man beweise: Es sei |x| < 1, ferner (an ) eine Zahlenfolge und An =

d|n

ad

(Summation u ¨ber alle Indizes, die Teiler von n sind). Dann ist ∞ n=1

an

∞ xn = An x n . 1 − xn n=1

b) F¨ ur n ∈ IN sei ϕ(n) die Anzahl der zu n teilerfremden nat¨ urlichen Zahlen zwischen 1 und n (Euler-Funktion). Es gilt ϕ(d) = n f¨ ur alle n ∈ IN. Man zeige, dass

∞

n=1

d|n

ϕ(n)xn f¨ ur |x| < 1 konvergiert und dass ∞ n=1

ϕ(n)

xn x = . n 1−x (1 − x)2


315

3. Innerhalb ihres Bereichs der absoluten Konvergenz kann man DirichletReihen multiplizieren: ∞ an n=1

nx

·

∞ bn n=1

nx

=

∞ cn n=1

nx

.

a) Wie gewinnt man die Folge (cn ) aus den Folgen (an ) und (bn )? b) Welche arithmetische Bedeutung haben die Koeffizienten der DirichletReihe von (ζ(x))2 ?

4. Man bestimme die Fourier-Entwicklung für f (x) = |x| in ] − π; π[. In Fig. 4 ist der Graph von f und der Graph der ersten nicht-konstanten Näherung zu sehen. y

6

......... ........... .... ....... @........... ....... @..@ .... @ ... .... ... ..... . . . . . . . . . @ @..... . . .... .... . . . ... . .... . .... .... @ @ @ ..... .... .... . . .... .@ . . ...... . . . . . . . . . . . . . .................. @ @........ ....... ................ .. .. @ @. @.... x π −π Fig. 4: Zu Aufgabe 4

Man bestimme damit den Wert von

∞

∞ 1 1 und von . 2 2 (2n − 1) n n=1 n=1

5. Man bestimme die Fourier-Entwicklung für f (x) = sgn x in ]−π; π[ (Fig. 5). Man bestimme damit den Wert der leibnizschen Reihe

∞ (−1)n−1 n=1

y

2n − 1

.

6

........... ......... .......... .......... .......... .... .. ... ......... ..... ... ........ ..... ... ... .. .. .. .. .. . .u.. ..u. .u .u .. ... ... .. x . . .. π −π . . . . . . . . .... ......... .. .... ......... .. .... ... ....... ........ ....... ........ ........

Fig. 5: Graph von y =

sin 3x 4 sin x + π 3

6. Man bestimme die Fourier-Entwicklung für f (x) = | sin x| in ] − π; π[. Man zeige damit, dass

∞ π (−1)n−1 1 = + . 4 2 n=1 4n2 − 1

XII Kurven und Fl¨ achen XII.1 Kurvendiskussion Die Differenzialrechnung findet eine wichtige Anwendung in der Diskussion von Kurven, die als Graph einer Funktion x → f (x) gegeben sind. Eine bedeutende Rolle spielen dabei die Extremalpunkte dieser Kurven ( Extremwertaufgaben“). ” Diese geometrischen“ Anwendungen der Differenzialrechnung sollen hier weiter ” ausgebaut werden, wobei ebene Kurven auch anders als durch eine Funktion einer Variablen beschrieben werden können (Abschnitte XII.2 und XII.3). Schließlich werden auch Kurven und Flächen im Raum mit den Mitteln der Analysis untersucht (Abschnitt XII.5). Es sei f eine in einem Intervall I beliebig oft differenzierbare Funktion und x0 ein innerer Punkt von I. Der Wert von f (x0 ) gibt die Steigung von f bzw. des Graphen von f im Punkt (x0 , f (x0 )) an: f (x0 ) < 0 : f ist in einer Umgebung von x0 streng monoton fallend f (x0 ) = 0 : f hat an der Stelle x0 eine waagerechte Tangente f (x0 ) > 0 : f ist in einer Umgebung von x0 streng monoton steigend ummung von f bzw. des Der Wert von f (x0 ) macht eine Aussage u ¨ber die Kr¨ Graphen von f im Punkt (x0 , f (x0 )), denn f (x) gibt als Steigung der Steigung“ ” an, ob die Steigung zunimmt oder abnimmt: f (x0 ) < 0 : f ist in einer Umgebung von x0 eine Rechtskurve f (x0 ) = 0 : f hat an der Stelle x0 eine waagerechte Tangente f (x0 ) > 0 : f ist in einer Umgebung von x0 eine Linkskurve Die anschaulichen Bezeichnungen Rechtskurve“und Linkskurve“ beziehen sich ” ” auf die Durchlaufung des Graphen in Richtung der x-Achse ( von links nach ” rechts“). In einer Rechtskurve verläuft der Graph unterhalb, in einer Linkskurve oberhalb der Tangente (Fig. 1). Man nennt f in einer Rechtskurve konvex , in einer Linkskurve konkav . y6

y6

..................... . . . . . . . . . . . . . . s..... ......... ....

..... y = f (x) . .. .... f (x0 ) < 0: Rechtskurve . .. .....

x0

-

x

Fig. 1: Kr¨ ummungssinn

y = f (x) ........ ... .... . . . . .... ...... .s..... ................ ....... f (x0 ) > 0: Linkskurve x0

-

x

XII.1 Kurvendiskussion

317

Im Fall f (x0 ) = 0 kann zunächst nicht u ¨ber das Steigungsverhalten in der Umgebung von x0 entschieden werden. Ist aber f (x0 ) = 0, dann sind die Verhältnisse klar, dann weiß man nämlich, ob die Steigung in einer Umgebung von x0 zunimmt oder abnimmt: f (x0 ) = 0, f (x0 ) < 0 : f hat an der Stelle x0 ein relatives Maximum f (x0 ) = 0, f (x0 ) > 0 : f hat an der Stelle x0 ein relatives Minimum Ein relatives Maximum ist nämlich dadurch gekennzeichnet, dass an dieser Stelle die Steigung von positiven zu negativen Werten wechselt, an der Stelle eines relativen Minimums wechselt sie von negativen zu positiven Werten. Im Fall f (x0 ) = 0 kann zunächst nicht u ummungsverhalten in der ¨ber das Kr¨ Umgebung von x0 entschieden werden. Ist aber f (x0 ) = 0, dann sind die Verhältnisse klar, dann weiß man nämlich, ob an der Stelle x0 eine Links- in eine Rechtskurve u ¨bergeht oder umgekehrt: f (x0 ) = 0, f (x0 ) < 0 : Linkskurve geht in eine Rechtskurve u ¨ber f (x0 ) = 0, f (x0 ) > 0 : Rechtskurve geht in eine Linkskurve u ¨ber Es handelt sich dann bei (x0 , f (x0 )) um einen Wendepunkt von f . Ist f (x0 ) = f (x0 ) = 0 und f (x0 ) = 0, dann liegt an der Stelle x0 ein Wendepunkt mit waagerechter Tangente vor, ein Sattelpunkt. Das ergibt sich alles aus dem folgenden Resultat, welches wir in XI.2 mit Hilfe der Taylor-Entwicklung erhalten haben: Die erste an der Stelle x0 nicht-verschwindende Ableitung von f sei von der Ordnung n. Ist n gerade, dann besitzt f an der Stelle x0 ein Extremum, und zwar — ein Maximum, wenn f (n) (x0 ) < 0, — ein Minimum, wenn f (n) (x0 ) > 0. Ist n ungerade und n > 1, dann besitzt f an der Stelle x0 einen Sattelpunkt. Wir wollen hier den Begriff der Kr¨ ummung präzisieren, indem wir denjenigen Kreis betrachten, welcher sich der Kurve an der Stelle x0 am besten anschmiegt“, ” der also durch den Punkt (x0 , f (x0 )) geht, dort die Steigung f (x0 ) hat (also die Kurventangente ber¨ uhrt) und — nahe x0 als Funktionsgraph betrachtet — ¨ an der Stelle x0 die zweite Ableitung f (x0 ) hat. Wegen der Ubereinstimmung der Funktionswerte und der beiden ersten Ableitungen spricht man von einer Ber¨ uhrung zweiter Ordnung. Diesen Kreis nennt man den Kr¨ ummungskreis von f an der Stelle x0 . Hat er die Gleichung (x − xM )2 + (y − yM )2 = r2 , dann ist (xM , yM ) der Kr¨ ummungsmittelpunkt und r der Kr¨ ummungsradius von 1 f an der Stelle x0 . Den Wert nennt man die Kr¨ ummung von f an der Stelle x0 . r

XII Kurven und Flächen

318

In einer Umgebung von x0 lässt sich ein Bogen des gesuchten Kreises als Graph einer Funktion mit der Gleichung

y = k(x) = yM +

r2 − (x − xM )2

oder y = k(x) = yM −

r2 − (x − xM )2

darstellen. Zusammen mit der Kreisgleichung ergeben sich dann durch Differenzieren die drei Gleichungen (x − xM )2 + (k(x) − yM )2 = r2 (x − xM ) + (k(x) − yM )k (x) = 0 1 + (k (x))2 + (k(x) − yM )k (x) = 0 Aus den Bedingungen k(x0 ) = f (x0 ), k (x0 ) = f (x0 ), k (x0 ) = f (x0 ) erhält man folgende Gleichungen: (x0 − xM )2 + (f (x0 ) − yM )2 = r2 (x0 − xM ) + (f (x0 ) − yM )f (x0 ) = 0 1 + (f (x0 ))2 + (f (x0 ) − yM )f (x0 ) = 0 Die dritte Gleichung liefert f (x0 ) − yM = −

1 + (f (x0 ))2 . f (x0 )

Damit folgt aus der zweiten Gleichung x0 − xM = f (x0 )

1 + (f (x0 ))2 . f (x0 )

Setzt man dies in die erste Gleichung ein, so folgt r2 =

(1 + (f (x0 ))2 )3 . (f (x0 ))2

¨ Bei diesen Uberlegungen darf nat¨ urlich nicht f (x0 ) = 0 gelten; in diesem Fall wäre die Kr¨ ummung 0, der Kr¨ ummungsradius also unendlich groß. Wir haben damit folgenden Satz bewiesen: Satz 1: Ist f (x0 ) = 0, so existiert ein Kreis mit dem Mittelpunkt (xM , yM ) und dem Radius r, der den Graph von f an der Stelle x0 von zweiter Ordnung ber¨ uhrt (Kr¨ ummungskreis). Dabei ist xM = x0 − f (x0 ) und

1 + (f (x0 ))2 , f (x0 )

yM = f (x0 ) + 3

(1 + (f (x0 ))2 ) 2 . r= |f (x0 )|

1 + (f (x0 ))2 f (x0 )


319

Bei einer Kurvendiskussion versucht man, möglichst viele Informationen u ¨ber den Graph einer Funktion f zu gewinnen, um damit ein möglichst genaues Schaubild anfertigen zu können. Die möglichen Punkte einer solchen Diskussion sind im Folgenden zusammengestellt: • • • • • • • • • • •

Definitionsmenge Stetige Ergänzbarkeit an Definitionsl¨ ucken Asymptotisches Verhalten an L¨ ucken und Rändern der Definitionsmenge Symmetrie (Achsensymmetrie, Punktsymmetrie) Berechnung der ersten, zweiten und dritten Ableitung Nullstellen und Steigung in den Nullstellen Extremalpunkte (Hochpunkte, Tiefpunkte) Wendepunkte und Steigung der Wendetangenten Kr¨ ummungskreise in einigen Punkten, z.B. in den Extremalpunkten Maßstab des Koordinatensystem zur Zeichnung des Schaubilds Zeichnen des Schaubilds

Wenn der Term der zu untersuchenden Funktion nicht sehr einfach ist, kann man nicht alle diese Punkte m¨ uhelos behandeln. Insbesondere kann es sein, dass die Lösungen der Gleichungen f (x) = 0, f (x) = 0 und f (x) = 0 nur näherungsweise mit numerischen Verfahren zu bestimmen sind. Beispiel 1: Der Graph der auf IR definierten Funktion f mit f (x) = x3 − x ist punktsymmetrisch zum Ursprung. Es gilt f (x) = 3x2 − 1, f (x) = 6x, f (x) = 6. Die Nullstellen sind 0 (Steigung −1) und ±1 (Steigung 2). Extremstellen sind 1√ 1√ 2√ 2√ 1√ ± 3. Es ist − 3, 3 Maximalpunkt, 3, − 3 Minimalpunkt. 3

3

9

Der Ursprung ist Wendepunkt (Steigung −1). Der Kr¨ ummungsradius in den Extremalpunkten ist 3 (1 + 02 ) 2 1√ √ r= = 3. 1 6 6· 3 3 In Fig. 2 ist der Graph mit Hilfe der Kr¨ ummungskreise in den Extremalstellen gezeichnet.

3

9

y 6 .. ........................ . . . . . .. . . . . . . . . ..... .. . .... ....... ... 0,2 .............. ................ ... . . . . . ........ . . q . .. ... . x . ... . ... ......... .... . ... . . . . .. . . . . . . q . . −1. ... . . . . . . ....... 1 . . ........ .......... ......... .. . .......... ..... . ....... ..... ........................... ... . Fig. 2: Graph von y = x3 − x


320 Beispiel 2: Die rationale Funktion f mit f (x) =

x2

1 − 10x + 24

hat Definitionsl¨ ucken an den Stellen 5 ± 1, denn dies sind die Nullstellen des Nennerpolynoms. Die Gerade mit der Gleichung x = 5 ist eine Symmetrieachse, denn wegen x2 − 10x + 24 = (x − 5)2 − 1 ist f (10 − x) = f (x) f¨ ur alle x ∈ Df . Wir betrachten also die einfachere (zur y-Achse symmetrische) Funktion g mit g(x) = f (x + 5) =

1 x2 − 1

und der Definitionsmenge IR \ {−1, 1}. Es ist g (x) = −

2x , (x2 − 1)2

g (x) =

6x2 + 2 . (x2 − 1)3

Es gilt lim g(x) = lim+ g(x) = +∞,

x→−1−

x→1

lim g(x) = lim− g(x) = −∞,

x→−1+

x→1

lim g(x) = lim g(x) = 0.

x→−∞

x→+∞

Es gibt keine Nullstellen, einen Maximalpunkt (0, −1) und keine Wendepunkte. Der Kr¨ ummungsradius im 1 Punkt (0, −1) ist . Mit Hilfe der 2 1 5 3 ±2, und ± , 3 4 2

Kurvenpunkte

ist in Fig. 3 das Schaubild von g gezeichnet. Verschiebt man das Koordinatensystem um 5 Einheiten nach links, dann ergibt sich das Schaubild der urspr¨ unglich gegebenen Funktion f .

.. ... .. ... .. .. . . .... .................... −1

y6

... ... ... ... ... ... .... ... .... ....... ................. x 1

................... ... ... ... ... ... .. ... .. ... ... .... ... . ... .... Fig. 3: Graph von y =

1 x2 − 1

¨berall auf IR definiert und beliebig Beispiel 3: Die Funktion f : x → x2 e−x ist u oft differenzierbar. Es ist f (x) = (2x − x2 )e−x , f (x) = (2 − 4x + x2 )e−x , f (x) = (−6 + 6x − x2 )e−x . Einzige Nullstelle ist 0 (Steigung 0). Stellen mit waagerechter Tangente sind 0 und 2 (Lösungen von 2x − x2 = 0). Wegen f (0) = 2 > 0 und f (2) = −2 < 0 ist T (0, 0) ein Tiefpunkt und H(2, 4e−2 ) ein Hochpunkt. Der Kr¨ ummungsradius 1 1 2 im Tiefpunkt ist , im Hochpunkt e . Die Lösungen von f (x) = 0 (also von 2

2


321

√ √ −(2±√2) x2 − 4x + 2 = 0) sind 2 ± 2. An diesen Stellen ist f (x) = ±2 2e = 0, √ √ √ −(2± 2) es liegen also Wendepunkte W1/2 (2 ± 2, (6 ± 4 2)e ) vor. Die Steigungen √ √ dort sind (−2∓2 2)e−(2± 2) . Zum Zeichnen des Graphen benötigt man die Werte √ √ √ √ √ 2 + 2 ≈ 3,41; (6 + 4 2)e−(2+ 2) ≈ 0,38; (−2 − 2 2)e−(2+ 2) ≈ −0,16 √ √ √ √ √ 2 − 2 ≈ 0,59; (6 − 4 2)e−(2− 2) ≈ 0,20; (−2 + 2 2)e−(2− 2) ≈ 0,45 In Fig. 4 sind noch die Kurvenpunkte an den Stellen −0,75 und 5 mit ihren Steigungen eingezeichnet. Ansonsten sind nur die oben berechneten Daten in der Zeichnung eingetragen, aus welchen man den Kurvenverlauf aber schon sehr klar entnehmen kann. Dabei ist die Einheit auf der y-Achse dreimal größer als auf der x-Achse gewählt worden. Die Kr¨ ummungskreise werden dadurch zu Ellipsen. Die unterschiedlichen Einheiten auf den Koordinatenachsen muss man auch beim Eintragen der Steigungen beachten.

... y ... 6 ... ... ... ... y = x2 e−x ... ...u ... ... ..... ..... 1 ... ... .. ... . .. ... .. .. ... .. .. ........................H .. . . .....u......................................... W1 .. .. ...... .... ... .......u.. . ... .......... . ...... .. ... ......................u .. ......u....W2 .................. .. . . . . . .. .. . ................u................. .. . . . .. x T . ... 1 .. . . . . Fig. 4: Zu Beispiel 3

Beispiel 4: Die Funktion f : x → sin x + sin 2x ist periodisch mit der Periode 2π und punktsymmetrisch mit dem Symmetriezentrum O, denn f¨ ur alle x ∈ IR gilt f (−x) = −f (x). Es gen¨ ugt daher, sie f¨ ur 0 ≤ x ≤ π zu untersuchen. Es gilt f (x) f (x) f (x) f (x)

= sin x + sin 2x = cos x + 2 cos 2x = − sin x − 4 sin 2x = − cos x − 8 cos 2x

= sin x(1 + 2 cos x), = 4 cos2 x + cos x − 2, = − sin x(1 + 8 cos x), = −16 cos2 x − cos x + 8.

In [0; π] hat f die Nullstellen 0, arccos (−0,5) ≈ 2,1 und π; die Steigungen sind dort 3 bzw. −1,5 bzw. 1. Stellen mit waagerechter Tangente in [0; π] ergeben sich 1√ 1 aus 4 cos2 x + cos x − 2 = 0 bzw. cos x = − ± 33 zu 8 8 1 1√ 1 1√ arccos − + 33 ≈ 0,94 und arccos − − 33 ≈ 2,57. 8 8 8 8

Wegen f (0,94) < 0 liegt an der der Stelle 0,94 ein Hochpunkt vor, wegen f (2,57) > 0 liegt an der Stelle 2,57 ein Tiefpunkt vor.


322

Zwischen diesen beiden Stellen liegt eine Wendestelle, welche sich aus der Glei1 ≈ 1,7 ergibt. Auch die Nullstellen 0 chung 1 + 8 cos x = 0 zu x = arccos − 8

und π sind Wendestellen. Fig. 5 zeigt eine volle Periode von f . y

y = sin x + sin 2x

6

............ .................v .. ....... ....... ... . ... . . . . . 1 ...... .... .....v ... ........ ... .. . . . . ... ..... .................v ................... . . .... π........ . ... . . . . . . . . . . ..... ... v v v ...v ....v -x ... ....... .... ....................v.................... ... ....... .... −π . ... .v.. .. . ... ... ... . . ... . . .... ... . ...... . ................v ............... Fig. 5: Zu Beispiel 4

Aufgaben 1. a) Man beweise, dass der Graph einer auf IR definierten Funktion f genau dann achsensymmetrisch zu der Geraden mit der Gleichung x = a ist, wenn f (2a − x) = f (x) f¨ ur alle x ∈ D(f ). b) Man beweise, dass der Graph einer auf IR definierten Funktion f genau dann punktsymmetrisch zum Punkt (a, b) ist, wenn f (2a − x) = 2b − f (x)

f¨ ur alle x ∈ D(f ).

2. Man beweise: Jede Parabel dritter Ordnung, also jede Kurve mit der Gleichung y = ax3 + bx2 + cx + d, ist punktsymmetrisch zu ihrem Wendepunkt.

3. Man berechne die Steigung in den Nullstellen und die Krümmungsradien in den Extremalpunkten; man zeichne dann ein Schaubild von f . x4 x x5 − b) f (x) = c) f (x) = (x ln x)2 a) f (x) = 160 64 1 + x2

4. Man diskutiere die durch folgenden Term gegebene Funktion: a) f (x) =

1 4 (x + 15x) 30 1

d) f (x) = e x

x2 − 2x + 1 x2 + 1 1 e) f (x) = x2 sin x b) f (x) =

c) f (x) = x +

1 x2

f) f (x) = ln x · sin x

XII.2 Implizite Differenziation

323

XII.2 Implizite Differenziation In einem kartesichen Koordinatensystem wird durch die Gleichung x2 + y 2 = r2 ein Kreis um den Ursprung mit dem Radius r beschrieben. Der Kreis ist kein Funktionsgraph, da zu jedem x-Wert √ y mit |x| < r zwei verschiedene y-Werte ............... y = r2 − x2 ..............6 . . . . . . . gehören. Wir können den Kreis aber in . . ...... .... .... ¨ .... zwei Aste (Halbkreise) zerlegen, welche ... .... ... . als Graphen der Funktionen ... . . ..√ ... 2 2 .. x f1 : x → r − x , .. . . √ .. .. f2 : x → − r2 − x2 ... ... ... . . . .... .... √ mit der Definitionsmenge [−r; r] anzu.... .... ... ... y = − r 2 − x2 sehen sind (Fig. 1). Auch die Gleichung (x2 + y 2 )3 − 27x2 y 2 = 0

Fig. 1: Kreis mit zwei Funktions¨ asten

beschreibt eine Kurve“ im kartesischen Koordinatensystem, hier ist es aber schon ” ¨ wesentlich schwerer, einzelne Aste zu erkennen, welche als Graph einer Funktion zu deuten sind. Nehmen wir an, es gäbe eine differenzierbare Funktion f derart, dass die Punkte mit y = f (x) obiger Gleichung gen¨ ugen. Dann wäre (x2 + f (x)2 )3 − 27x2 f (x)2 = 0

f¨ ur alle x ∈ Df .

Die Ableitung dieses Terms muss dann ebenfalls auf Df verschwinden; denn gilt T1 (x) = T2 (x) f¨ ur alle x ∈ D ⊆ IR und sind T1 , T2 differenzierbar auf D, dann gilt auch T1 (x) = T2 (x) f¨ ur alle x ∈ D ⊆ IR. Es ist also 3(x2 + f (x)2 )2 · (2x + 2f (x)f (x)) − 27(2xf (x)2 + x2 · 2f (x)f (x)) = 0. Lösen wir dies nach f (x) auf und setzen wieder y f¨ ur f (x), dann ergibt sich f (x) =

x(9y 2 − (x2 + y 2 )2 ) . y((x2 + y 2 )2 − 9x2 )

Kennt man nun einen Punkt der Kurve, dann kann man in ihm die Steigung berechnen. Die Kurve ist offensichtlich symmetrisch zu den Koordinatenachsen und auch symmetrisch zu den Winkelhalbierenden des Koordinatensystems, so dass wir uns zunächst auf den Bereich x ≥ y ≥ 0 beschränken können. F¨ ur x = y ergibt sich außer O(0, 0) der Punkt 3 3 3 3 P , mit der Steigung −1. 2 2 2 2

y

6

@ @ P @.u .... @ ... .@ ..u@

.. Q ... . 1 .... .. .... ... .... . . . . . . ....... ............. ..u................................. .. .. -x 1 2 Fig. 2: Kurvenst¨ uck zu x ≥ y ≥ 0


324 Eine senkrechte Tangente existiert f¨ ur x2 + y 2 = 3x; setzt man dies in die Gleichung der Kurve √ ein, so findet man x = √2 und damit y = 2, also den Punkt Q(2, 2) mit einer senkrechten Tangente. Zwischen P und Q ist die Steigung negativ, nach Durchlaufen von Q (also f¨ ur 0 < x < 2, √ 0 < y < 2) ist sie positiv. Offensichtlich geht die Kurve durch den Ursprung, der Term f¨ ur f (x) ist dort aber nicht definiert. Fig. 2 zeigt das analysierte Kurvenst¨ uck. Weitere Teile der durch obige Gleichung definierten Kurve ergeben sich aufgrund der Symmetrie (Kleeblattkurve, Fig. 3).

y 6 . . . . . . . . . . . . . . . . . . . . ...... ......................... .... ... .... ....... ...@ . ... .. ... @ .. . . ... @ ... . .. . .... . . ...... @ ...... ... ......... @ .. ...... . . . . . . . . ......................@ ................................... .... ....... x .... @ ....... . . . . . . . . .... .. ... .... ........ @ ... .. .. @ .... ... ........ @ .... . .... . . ........... .@ ... ......................... ...........@

Fig. 3: Kleeblattkurve

Die erste Schwierigkeit bei der Analyse der durch eine Gleichung F (x, y) = 0 gegebenen Funktionen ( Funktionsäste“) besteht in der Bestimmung der Defini” tionsmenge dieser Funktionen. Dies ist in der Regel nur dann einfach, wenn die Gleichung F (x, y) = 0 wie die obige Kreisgleichung einfach nach y auflösbar ist. Um hierzu einen allgemeinen Satz zu formulieren, benötigen wir den Begriff der Stetigkeit und der partiellen Ableitungen einer Funktion von zwei Variablen. Ist F eine Abbildung von IR2 in IR, dann beschreibt die Gleichung z = F (x, y) eine Fläche in einem dreidimensionalen kartesischen Koordinatensystem. Die Punkte mit z = 0, also F (x, y) = 0, bilden dann die Schnittkurve dieser Fläche mit der xy-Ebene. Definition 1: Die Funktion F : (x, y) → F (x, y) mit dem Definitionsbereich DF ⊆ IR2 und dem Bildbereich Bf ⊆ IR heißt stetig an der Stelle (x0 , y0 ) ∈ DF , wenn f¨ ur jedes ε > 0 ein δ > 0 derart existiert, dass f¨ ur alle (x, y) ∈ DF mit 2 2 (x − x0 ) + (y − y0 ) < δ gilt: |F (x, y) − F (x0 , y0 )| < ε. Definition 2: Denkt man sich y als Konstante und differenziert den Term F (x, y) nach x, dann nennt man den so erhaltenen Ausdruck die partielle Ableitung von F nach x . Entsprechend ist die partielle Ableitung von F nach y erklärt. Dabei sei vorausgesetzt, dass die Stelle (x, y) im Inneren eines ganz in DF enthaltenen achsenparallelen Rechtecks liegt und die genannten Ableitungen existieren. Man bezeichnet die partiellen Ableitungen mit ∂ ∂ F (x, y) bzw. F (x, y) ∂x ∂y (lies: F partiell nach x (nach y) differenziert“.) F¨ ur die partiellen Ableitungen ” von F benutzt man auch die abk¨ urzenden Schreibweisen Fx , Fy .


325

Beispiel 1: F¨ ur F (x, y) = (x2 + y 2 )3 − 27x2 y 2 ist ∂ F (x, y) = 3(x2 + y 2 )2 · 2x − 27 · 2x · y 2 = 6x((x2 + y 2 )2 − 9y 2 ), ∂x ∂ F (x, y) = 3(x2 + y 2 )2 · 2y − 27 · x2 · 2y = 6y((x2 + y 2 )2 − 9x2 ). Fy (x, y) = ∂y Nochmaliges partielles Differenzieren nach der jeweils anderen Variablen ergibt Fxy (x, y) = Fyx (x, y) = 12xy(x2 + y 2 − 9). (Bei jeder anständigen“ Funktion F ” gilt Fxy = Fyx , das wollen wir hier aber nicht näher untersuchen.) Fx (x, y) =

Besitzt F partielle Ableitungen in einem offenen Rechteck R =]x1 ; x2 [×]y1 ; y2 [⊆ D(F ), dann gilt f¨ ur (x, y), (x0 , y0 ) ∈ R F (x, y) − F (x0 , y0 ) = F (x, y) − F (x0 , y) + F (x0 , y) − F (x0 , y0 ) = Fx (x0 , y)(x − x0 ) + δ1 (x, y) + Fy (x0 , y0 )(y − y0 ) + δ2 (x0 , y) mit

δ1 (x, y) δ2 (x0 , y) = 0 und y→y lim = 0. 0 x − x0 y − y0 Sind die partiellen Ableitungen stetig in R, dann ist also lim

x→x0

F (x, y) = F (x0 , y0 ) + Fx (x0 , y0 )(x − x0 ) + Fy (x0 , y0 )(y − y0 ) + (x, y) mit

(x, y) lim = 0. (x − x0 )2 + (y − y0 )2

x→x0 y→y0

(Bei diesem Grenzwert ist es gleichg¨ ultig, auf welchem Weg sich der Punkt (x, y) dem Punkt (x0 , y0 ) nähert.) Es ergibt sich also wie bei Funktionen von nur einer Variablen eine lineare Approximation an der Stelle (x0 , y0 ). Satz 1: Ist F eine Funktion von zwei Variablen x, y mit stetigen partiellen Ableitungen in einem achsenparallelen Rechteck R, gilt ferner an einer Stelle (x0 , y0 ) ∈ R die Gleichung F (x0 , y0 ) = 0 und ist Fy (x0 , y0 ) = 0, dann existiert ein Intervall I =]a; b[ mit x0 ∈ I, so dass genau eine stetige Funktion f mit F (x, f (x)) = 0 auf I existiert. F¨ ur diese Funktion gilt y0 = f (x0 ). Die Funktion f ist differenzierbar auf I, und es gilt dort f (x) = −

Fx (x, y) Fy (x, y)

mit y = f (x).

Beweis: Es ist keine Beschränkung der Allgemeinheit, die partielle Ableitung Fy (x0 , y0 ) als positiv anzunehmen. Wegen der Stetigkeit von Fy (x, y) existiert


326 dann ein achsenparalleles Rechteck R um den Punkt (x0 , y0 ), in welchem u ¨berall Fy (x, y) > 0 gilt (Fig. 4). Es ist daher

y

β y0

F (x0 , u) < 0 < F (x0 , v) f¨ ur alle u, v mit u < y0 < v und (x0 , u), (x0 , v) ∈ R. Wegen der Stetigkeit von F existiert also ein Rechteck ]a; b[×]α; β[⊆ R mit

6

R

...... ............ . . . . . . t . . . . . . . . . . . ..

α -

a x0

b

x

Fig. 4: Zum Beweis von Satz 1

F (x, α) < 0 < F (x, β)

f¨ ur alle x ∈ [a; b]. Es gibt also nach dem Zwischenwertsatz f¨ ur jedes x ∈]a; b[ genau ein y ∈]α; β[ mit F (x, y) = 0. Die Funktion, die diesem x dieses y zuordnet, nennen wir f . Die Stetigkeit der so konstruierten Funktion f auf ]a; b[ liegt auf der Hand. Die Differenzierbarkeit ergibt sich folgendermaßen: F¨ ur zwei Punkte (x, y), (x + h, y + k) ∈]a; b[×]α; β[ gilt aufgrund der Stetigkeit der partiellen Ableitungen von F F (x + h, y + k) = F (x, y) + hFx + kFy + ε1 h + ε2 k, √ wobei ε1 , ε2 mit h2 + k 2 → 0 gegen 0 streben. Mit F (x, y) = 0, F (x + h, y + k) = 0, y = f (x), y + k = f (x + h) ergibt sich hFx + kFy + ε1 h + ε2 k = 0. Wegen der Stetigkeit von f strebt mit h auch k gegen 0. Aus

ε2 1+ Fy

h Fx ε1 + + =0 k Fy Fy

ergibt sich beim Grenz¨ ubergang h → 0 lim

h→0

f (x + h) − f (x) k Fx = lim = − . h→0 h h Fy

2

Die Differenziationsregel in Satz 1 gewinnt man sofort mit Hilfe der Kettenregel aus F (x, f (x)) = 0, wenn man schon weiß, dass die Funktion f differenzierbar ist. Im Beweis zu Satz 1 musste aber vor allem die Differenzierbarkeit von f nachgewiesen werden.


327

Beispiel 2: Das Folium Cartesii oder descartessche Blatt (nach René Descartes, 1596–1650) ist durch die Gleichung F (x, y) = x3 + y 3 − 3xy = 0 gegeben (Fig. 5). Die Kurve ist wegen F (x, y) = F (y, x) symmetrisch zur Winkelhalbierenden des 1. Quadranten. F¨ ur jeden Funktionsast f gilt f (x) = −

x2 − y . y2 − x

2 falls y 2 = x. Aus y√ = x folgt aber aus der Kurvengleichung (x, y) = (0, 0) √ 3 3 oder (x, y) = ( 4, 2). Im ersten Fall versagt die Ableitungsformel. Weil im Kurvenpunkt (0, 0) die Ableitung nicht eindeutig bestimmt ist, nennt man dies einen singulären Punkt der Kurve. Im zweiten Fall ergibt sich ein Punkt mit √ √ 3 3 einer senkrechten Tangente. Wegen der Symmetrie ist dann ( 2, 4) ein Punkt

3 3 , 2 2

mit einer waagerechten Tangente. Im Punkt

ist die Steigung −1. Die

Gerade mit der Gleichung y = −x − 1 ist eine Asymptote der Kurve. (Setzt man y = −x − 1 in dem Term F (x, y), dann ergibt sich der konstante Wert 1.)

y6 ...........s.....s.s ....... @@ . . . . .. 1 .... .. @ @......... . ... @............ .. ...... @ ...................................... ... -1@ 1 . @ .... . @ .. -1 @...... . @....... .

x − 12

@

Fig. 5: Folium Cartesii

η ... 1 6 ... ... f1 ... ... ... ............................................. ..... .... ..... @ . ξ ...... . . .. . @....... 1 .............. 3 ............ .... @ ....................... 2 . ... f2 .. .. -1 Fig. 6: Folium Cartesii

Weiteren Aufschluss kann man u ¨ber das Folium Cartesii erhalten, wenn man die aufgrund der Symmetrie naheliegende Koordinatentransformation x = ξ−η y = ξ+η

bzw.

ξ = 0,5 · (x + y) η = 0,5 · (−x + y)

ausf¨ uhrt, welche eine Drehstreckung darstellt. Es ergibt sich die Gleichung 1 3 − 2ξ 2ξ 3 + 6ξη 2 − 3ξ 2 + 3η 2 = 0 bzw. η 2 = ξ 2 · 3 1 + 2ξ mit den beiden Funktionsästen

3 − 2ξ 1 f1 : ξ → +√ ξ 1 + 2ξ 3

und

3 − 2ξ 1 −√ ξ f2 : ξ → . 1 + 2ξ 3


328

1 3 2 2

Man erkennt sofort die Definitionsmenge − ;

und die Asymptote mit der

1 Gleichung ξ = − (Fig. 6). Diese geht bei obiger Transformation in die Gerade 2

mit der Gleichung y = −x − 1 u ¨ber.

Beispiel 3: Die Kurve mit der Gleichung F (x, y) = x5 + 5x4 − 16y 2 = 0 ¨ zerfällt in die Aste 1 √ 1 √ f1 : x → + x2 5 + x und f2 : x → − x2 5 + x. 4 4 Es ist aber bequemer, die Kurve in der impliziten anstatt in der expliziten Form zu diskutieren. F¨ ur jeden Funktionsast gilt f (x) = −

5 5x4 + 20x3 x+4 = x3 · . −32y 32 y

Hier erkennt man sofort (−4, ±4) als Punkte mit waagerechten Tangenten und (−5, 0) als einen Punkt mit senkrechter Tangente. An der expliziten Form ist aber andererseits die Definitionsmenge [−5, ∞[ der Funktionsäste leichter zu erkennen. In Fig. 7 ist die Kurve dargestellt.

y6 ......s...... f1. ... .... . ... .. ... ... . . . .... .. ... .... .. .... ...... . . . . −5 ..s ...................... .... ........ ............ . . . ... .... ... .... ... ... ... ... ..... ... ... ... .... .......s.... f2

x -

Fig. 7: x5 + 5x4 − 16y 2 = 0

Beispiel 4: Die Kurve mit der Gleichung (x2 + y 2 )2 − 2a2 (x2 − y 2 ) = 0 (Fig. 8) heißt Lemniskate (von griech. l¯emnikos = wollenes Band). Die Kurve ist symmetrisch zu beiden Koordinatenachsen. Sie geht durch den Ursprung; dort haben beide partiellen Ableitungen den Wert 0, so dass ein singulärer Punkt vorliegt. F¨ ur alle anderen Punkte der Funktionsäste f gilt x(x2 + y 2 ) − a2 x f (x) = − . y(x2 + y 2 ) + a2 y

y6 . . . . .. ... .... .... .... . .. . ... .. . .. ..... r . . . . . . . . ...... . ............... .............r................ .. ... ...... ............ ...... .. .... .... .r ..r ..r ...r - x . . . . .. √ ....... √ ... −a.. . . . . . . a .... a 2 ... ........... −a 2 ..... .. . . . . . . . .................r.......... ...............r............. . ... .. . . .... . . . ... .... .... .... ... . Fig. 8: Lemniskate


329

√ Senkrechte Tangenten liegen in den Punkten (±a 2, 0) vor, waagerechte Tangen a√ a 2 2 2 ten in den Punkten mit x + y = a , also in den vier Punkten ± 3, ± . Die 2 2 Lemniskate ist der geometrische Ort aller Punkte, f¨ ur welche das Produkt der Entfernungen von den Punkten (−a, 0) und (a, 0) den konstanten Wert a2 hat (Aufgabe 3). Beispiel 5: Die Gleichung 2

x a

3

2

+

y b

3

y

= 1 (a, b > 0)

beschreibt eine Asteroide (Fig. 9). Sie ist symmetrisch zu den Koordinatenachsen, weshalb es gen¨ ugt, den Teil der Kurve mit x, y ≥ 0 zu analysieren und damit die in diesem Bereich gegebene Funktion f . Es gilt

.s6 ............b...... . . . . . . . .......... ...... .............. ........... ................sx ..s.................................... ............ .................. a . . . . . . . . . . .......... . ....... ............... ..s. Fig. 9: Asteroide

1

2 x − 3 1 1 · b ay 3 f (x) = − 3 a 1 a = − a bx 2 y − 3 1 · 3 b b

f¨ ur x > 0.

Daran erkennt man sofort, dass die Kurve im Punkt (a, 0) die x-Achse ber¨ uhrt und im Punkt (0, b) die y-Achse ber¨ uhrt, dass in diesen Punkten also Spitzen“ ” vorliegen. Beispiel 6: Die durch die Gleichung (x2 + y 2 − 4x)2 = 16(x2 + y 2 ) gegebene Kurve ist eine Kardioide (Fig. 10). Sie ist symmetrisch zur x-Achse. Hier ¨ ist es ratsam, die Gestalt der Kurve anhand der einzelnen Aste zu untersuchen. Auflösen nach y ergibt √ y = f1/2 (x) = ± −(x2 − 4x − 8) − 8 x + 1 f¨ ur −1 ≤ x ≤ 0, √ y = f3/4 (x) = ± −(x2 − 4x − 8) + 8 x + 1 f¨ ur −1 ≤ x ≤ 8. √ unden Die Graphen von f1/2 gehen durch die Punkte (−1, ± 3)√und (0, 0). Sie m¨ mit einer vertikalen Tangente in die Punkte (−1, ± 3). Bei (linksseitiger) Annäherung an (0, 0) kann man f1/2 (x) wegen der Taylor-Entwicklung √ 1 1 1 1 1 1 + x = 1 + x − x2 + x3 − . . . = 8 + 4x − x2 + x3 − . . . 2 8 24 8 3

1 3

durch ± − x3 abschätzen. Daher m¨ unden die Graphen von f1/2 mit einer waagerechten Tangente in den Punkt (0, 0).


330 Die Graphen von √ f3/4 gehen durch die Punkte (−1, ± 3) (mit vertikaler Tangente), durch die Punkte (0, ±4) mit der Steigung ±1 und durch den Punkt (8, 0) mit einer vertikalen Tangente.

6

................s...................... ...... ............... . . . . ..... ...s . ..... . . .. .... ....... .... .... ... .. ....s ...... ... .... ...... ....s. s . ... ... . . . .... .. ...s .. .... . . ...... ... ...... .... . . . ..... ... ...s... ..... ........... . ............... ................... ... ...s. ......

Genau dann ist f3/4 (x) = 0, wenn

2−x+ √

2 = 0. x+1

Diese Gleichung f¨ uhrt auf (x + 1)(x − 2)2 = 4 mit der einzigen √ reellen Lösung 3. Die Punkte (3, ±3 3) sind Extremalpunkte. Beispiel 7: Fig. 11 zeigt die Kurve mit der Gleichung 5

5

2

F (x, y) = x + y − xy = 0. ¨ Hier ist eine Darstellung einzelner Aste durch eine Funktion nur schwer möglich. Die Kurve ist punktsymmetrisch zum Ursprung, denn mit einem Punkt (x, y) ist auch (−x, −y) ein Kurvenpunkt. Es gen¨ ugt also, x ≥ 0 zu betrachten. Die Gerade mit der Gleichung x + y = 0 ist eine Asymptote. Dieses asymptotische Verhalten kann man folgendermaßen feststellen: F¨ ur hinreichend großes x > 0 ist −x < y < 0. Wir betrachten einen Kury venpunkt (x, y) und setzen = −α, so dass x 0 < α < 1.

Fig. 10: Kardioide

... y ... ... 6 ... ... ... ... ... .. ... . .. ... . . ... .. ... ... ... s .... ... ... ......................s ..... .. . . . . .......... ... .. ....... ....... ......s............. -x ............. ... ........................ .. ... .... . ... ....... ....s..... s.... ... ....... . . ... ..... ... .... ... ... ... .... ... ... ... .... ... . . Fig. 11: x5 + y 5 − xy 2 = 0

α2

Die Kurvengleichung ergibt (1 − α5 )x5 − α2 x3 = 0 und damit x2 = . F¨ ur 1 − α5 x → ∞ strebt α gegen 1 und damit

α2 1−α =α x + y = (1 − α)x = (1 − α) 1 − α5 1 + α + α2 + α3 + α4 gegen 0. Es gilt ferner −

Fx (x, y) 5x4 − y 2 =− 4 . Fy (x, y) 5y − 2xy

XII.3 Parameterdarstellung von Kurven

331

Stellen = 0 mit vertikaler Tangente ergeben sich aus 5y 4 − 2xy = 0. Dies liefert 5 3 zunächst xy 2 = y 5 , damit ergibt die Kurvengleichung x5 = y 5 und damit wie2 2 5 5 1√ 1√ 5 5 3 3 2 derum y − y , also y = 48. F¨ ur diese y-Werte erhält man x2 = 5 108. 2

2

5

5 √ √ 10 48 10 108 . Stellen = 0 mit horizontaler Man findet f¨ ur x > 0 den Punkt V √ , √ 5 5

2 − y = 0 und der Kurvengleichung. F¨ ur x > 0 Tangente ergeben sich aus 5x4 √ √ 5 9 5 81 findet man den Punkt H √ , √ . In O hat die Kurve die Steigungen 0 bzw.

5

5

∞, auf den etwas schwierigen Nachweis wollen wir hier aber verzichten. Denn f¨ ur die Untersuchung derartiger singulärer Punkte“ benötigt man den Begriff der ” Taylor-Entwicklung f¨ ur Funktionen mehrerer Variabler.

Aufgaben 1. Man bestimme die Steigung der Tangente im Punkt (x0 , y0 ) der Ellipse mit der Gleichung

x2 y2 + 2 = 1. 2 a b

2. Man diskutiere die Kurve mit der Gleichung x(x + 1)(x + 2) − y2 = 0. 3. Man beweise die angegebene Kennzeichnung der Lemniskate als Ortskurve. 4. Man diskutiere die durch folgende Gleichung beschriebene Kurve: a) y 2 − x3 (2 − x) = 0

b) x4 + y 4 = 2xy 2

d) x3 − 2x2 − y 2 + x = 0

c) x2 y 2 + y = 1

e) (x2 + y 2 − 2)2 = x2

f) y 3 + xy + x3 = 0

XII.3 Parameterdarstellung von Kurven, Darstellung mit Polarkoordinaten Die Funktionen ϕ, ψ seien stetig auf dem Intervall I. Dann ist die Punktmenge C := {(x, y) | x = ϕ(t), y = ψ(t), t ∈ I} eine Kurve. Um pathologische Fälle von Kurven auszuschließen, verlangt man bei dieser Beschreibung einer Kurve meistens noch, dass die durch ϕ, ψ definierte Abbildung von I auf C bijektiv ist und die Umkehrabbildung ebenfalls stetig ist. Wir schreiben diese Parameterdarstellung der Kurve in der Vektorform

x ϕ(t) = y ψ(t)

(t ∈ I).

Beispielsweise hat der Kreis mit dem Radius r um den eines kartesi Ursprung r cos t x = (t ∈ [0; 2π[). schen Koordinatensystems die Parameterdarstellung y

r sin t


332

Die Gerade durch den Punkt P (a, b) mit dem Richtungsvektor

u hat die Pav

a + tu x = (t ∈ IR). Der Graph der Funktion f u ¨ber dem y b +tv t x = (t ∈ I) beschrieben werden. Intervall I kann durch f (t) y

rameterdarstellung

Wir setzen nun voraus, dass die Funktionen ϕ, ψ in I stetig differenzierbar sind; ¨ ist hier auch — vor allem in der wir bezeichnen die Ableitungen mit ϕ , ψ . (Ublich Physik, wenn der Parameter t die Zeit angibt — die Bezeichnung der Ableitungen ˙ diese Bezeichnung geht auf Newton zur¨ mit ϕ, ˙ ψ; uck.) Ein Tangentenvektor im Kurvenpunkt zum Parameterwert t ist

ϕ (t) . ψ (t)

y 6 .. C ..... ϕ . . . .. ψ ....... .... ... ............ . . .. s ..... s (ϕ, ψ) ...P . P.P P .... PP P ... PP q −ψ .... ...... ϕ

Dies erkennt man anhand der Kettenregel: Ist y = f (x) eine Funktionsdarstellung eines Kurvenst¨ ucks, dann folgt aus ψ(t) = f (ϕ(t)) ψ (t) =

d f (ϕ(t)) · ϕ (t). dx

Ein Normalenvektor im Kurvenpunkt zum Parameterwert t ist dann (Fig. 1)

-

x

Fig. 1: Tangentenvektor, Normalenvektor

−ψ (t) . ϕ (t)

Der Graph einer Funktion f u ¨ber [a; b] sei in einer Parameterdarstellung

ϕ(t) , ψ(t)

(t ∈ [α; β]),

ϕ(α) = a, ϕ(β) = b

gegeben. Dann gilt aufgrund der Substitutionsregel β

b

f (x) dx = a

f (ϕ(t))ϕ (t) dt =

α

β

ψ(t)ϕ (t) dt.

α

Wir betrachten nun eine geschlossene Kurve

ϕ(t) , ψ(t)

(t ∈ [α; β]),

ϕ(α) = ϕ(β), ψ(α) = ψ(β)

und wollen den von ihr eingeschlossenen Flächeninhalt A berechnen. Wir nehmen an, die Kurve lasse sich in zwei Bogen C1 , C2 zerlegen, welche als Graphen von Funktionen f1 , f2 zu deuten sind (Fig. 2):

XII.3 Parameterdarstellung von Kurven C1 : t ∈ [α; γ]; ϕ (t) > 0 auf ]α; γ[;

333 C2 : t ∈ [γ; β]; ϕ (t) < 0 auf ]γ; β].

Dann ist A die Differenz der Flächeninhalte unter den beiden Kurvenst¨ ucken C1 und C2 , also γ

A =

ψ(t)ϕ (t) dt −

γ

α

β

γ

β

=

ψ(t)ϕ (t) dt +

α

β

=

ψ(t)ϕ (t) dt

y6

ψ(t)ϕ (t) dt

γ

ψ(t)ϕ (t) dt.

....................X ......X ....X z ........C ............ ......1.. ...r.. ..... A ..... ... ........ .......X ...r y . ....X . ......X ...........C .....2................ a b

x -

Fig. 2: Inhalt einer geschlossenen Kurve

α

Kann man die geschlossene Kurve in zwei Funktionsgraphen bez¨ uglich der y-Achse zerlegen (x = g1 (y), x = g2 (y)), dann erhält man in gleicher Weise A = −

β

ϕ(t)ψ (t) dt. Das Minuszeichen ergibt sich aus dem Umlaufsinn der

α

Kurve; der obere“ Bogen der Kurve wird nämlich in Richtung abnehmender y” Werte durchlaufen, wenn wir an der eingangs gewählten Durchlaufungsrichtung festhalten. Schließlich kann man A noch als arithmetisches Mittel der beiden f¨ ur A gefundenen Ausdr¨ ucke darstellen. Der Flächeninhalt ergibt sich mit einem Vorzeichen, welches dem Umlaufsinn der Kurve entspricht. Damit erhalten wir folgenden Satz: Satz 1: Ist eine geschlossene Kurve wie oben in Parameterdarstellung gegeben, dann hat die eingeschlossene Fläche den Inhalt β

A=

ψ(t)ϕ (t) dt = −

α

Der Flächeninhalt ergibt sich bei negativem Umlaufsinn der Kurve als negativ, bei positiven Umlaufsinn als positiv (Fig. 3). Der Flächeninhalt ändert sich nicht bei einer Verschiebung des Koordinatensystems, weil die Integrale u ¨ber cϕ und dψ ((c, d ∈ IR)) den Wert 0 haben.

β

β

ϕ(t)ψ (t) dt =

α

y6

1 (ψ(t)ϕ (t) − ϕ(t)ψ (t)) dt. 2α

z .....X ...................X .......... ...... ...... ...... A . .......X y .....X ......................... x

Negativer Umlaufsinn (Uhrzeigersinn): Fl¨ acheninhalt negativ

y6

y X

........................X .......... ...... ...... ...... A .. .........X z .....X ..... ..................x

Positiver Umlaufsinn (Gegenuhrzeigersinn): Fl¨ acheninhalt positiv

Fig. 3: Orientierung des Fl¨ acheninhalts


334 Beispiel 1: Die durch

a cos t (0 ≤ t ≤ 2π) b sin t gegebene Kurve ist eine Ellipse mit den Halbachsenlängen a, b. Die Kurve wird im Gegenuhrzeigersinn durchlaufen, wenn t von 0 bis 2π läuft, der Inhalt ist also negativ. Zur Berechnung des Betrags A des Flächeninhalts ist es g¨ unstig, die dritte der Formeln in Satz 1 zu benutzen: 2π

2π

1 ab ab sin2 t + ab cos2 t dt = sin2 t + cos2 t dt 2 2

A=

0

=

ab 2

0

2π

1 dt = 0

Beispiel 2: Die durch

y

6 ..... b ...... ............... . . . . . . . .......... ....... .............. x ............. ........... .......................................... ........................ . . ............. . . . . . . . . . .......... .... a ........ ............... .......... .

a cos3 t b sin3 t

ab · 2π = πab. 2

(0 ≤ t ≤ 2π)

gegebene Kurve ist eine Asteroide (Fig. 4; vgl. auch Beispiel 5 in XII.2). Die von ihr eingeschlossene Fläche hat den Inhaltsbetrag

Fig. 4: Asteroide

2π

1 A= b sin3 t · 3a cos2 t sin t + a cos3 t · 3b sin2 t cos t dt 2 0

=

3ab 2

2π 0

3ab 8

=

2π

(sin2 t cos2 t)(sin2 t + cos2 t) dt =

0

2π

(sin 2t)2 dt =

0

3ab 16

F¨ ur die Ableitung der Bogenlängenfunktion s(t) einer wie oben in Parameterdarstellung gegebenen Kurve ist offensichtlich s (t) =

3ab (sin t cos t)2 dt 2

(ϕ (t))2 + (ψ (t))2 ,

4π

(sin x)2 dx =

0

y

6

3ab 3 · 2π = a b π. 16 8

Δϕ .... ................................................................................. . . ... ................. Δψ .... .......Δs ............................. . . . . ... .... ........................................... Δs = (Δϕ)2 + (Δψ)2 -

x

(Fig. 5), also gilt:

Fig. 5: Berechnung der Bogenl¨ ange


335

Satz 2: Ist eine Kurve wie oben in Parameterdarstellung gegeben, dann hat sie die Länge β

(ϕ (t))2 + (ψ (t))2 dt,

L= α

falls dieses Integral existiert. Beispiel 3: Die Länge der Ellipse aus Beispiel 1 ist 2π

(−a sin t)2

L=

+

(b cos t)2

π

b2 + (a2 − b2 ) sin2 t dt.

dt = 2

0

0

Außer f¨ ur b = 0 oder a2 − b2 = 0 ist dieses Integral nicht elementar zu berechnen ( elliptisches Integral“). Approximiert man das Integral mit Hilfe der Simpson” Formel aus Abschnitt X.7, dann ergibt sich der Näherungswert L≈2·

π 2a + b · (b + 4a + b) = 2π · . 6 6

Beispiel 4: Die Länge der Asteroiden aus Beispiel 2 ist π

L = 4·

2

(3a cos2 t sin t)2 + (3b sin2 cos t)2 dt

0 π

2

=

3 sin t cos t a2 + (b2 − a2 ) sin2 t dt.

0

Mit der Substitution sin2 t =: u und 2 sin t cos t = L = 4·

1 3 2 a + (b2 − a2 )u du 2 0

=

du ergibt sich dt

1 3 b 3 − a3 a2 + ab + b2 4 (b2 + (b2 − a2 )u) 2

= 4 · 2 =4· . 2 2 2 b −a b −a a+b 0

Den Kr¨ ummungsradius r = r(t) einer in Parameterdarstellung gegebenen Kurve erhalten wir aus der entsprechenden Formel f¨ ur Funktionsgraphen, wenn wir f (x) durch den Quotient ψ (t) : ϕ (t) ersetzen, da die Kurve st¨ uckweise als Funktionsgraph zu deuten ist. Der Kr¨ ummungsmittelpunkt M ist dann gegeben durch

xM (t) ϕ(t) n(t) , = + r(t) · yM (t) ψ(t) |n(t)|

−ψ (t) ein Normalenvektor ist. Es gilt also folgender Satz: ϕ (t)

wobei n(t) =


336

Satz 3: Ist eine Kurve wie oben in Parameterdarstellung gegeben, dann ist ihr Kr¨ ummungsradius an der Stelle t 3

((ϕ )2 + (ψ )2 ) 2 r= , |ϕ ψ − ψ ϕ | und der Kr¨ ummungsmittelpunkt hat die Koordinaten rψ xM = ϕ − , (ϕ )2 + (ψ )2

rϕ yM = ϕ + . (ϕ )2 + (ψ )2

(Wir schreiben dabei r, ϕ, . . . anstelle von r(t), ϕ(t), . . ., damit die Formeln nicht zu un¨ ubersichtlich werden.) Beispiel 5: Als Beispiel zu den Sätzen 1, 2 und 3 betrachten wir eine Zykloide. Eine solche entsteht, wenn ein Kreis vom Radius a auf einer Geraden abrollt; sie ist dabei die Bahn eines Punktes der Kreisperipherie (Fig. 6). Ein Bogen der Zykloide kann durch x = ϕ(t) = a(t − sin t), y = ψ(t) = a(1 − cos t)

y6 ............. . ......................... ....................................................... . . . . ....... ... ......... ..... ... a ...... .... .... ... ... . . ...... .. ....... ... x ........u..... 2aπ

mit 0 ≤ t ≤ 2π beschrieben werden. Man kann den Zykloidenbogen zwischen 0 und aπ auch als Graph einer Funktion (x als Funktion von y) darstellen:

Fig. 6: Zykloide

a−y x = a arccos − (2a − y)y. a

An dieser Gleichung sind aber die Eigenschaften der Zykloide wesentlich schwerer zu erkennen als an der Parameterdarstellung. Der Flächeninhalt des Zykloidenbogens zwischen 0 und 2aπ ist 2

2π

2

2

(1 − cos t) dt = a

A=a

0

2π

(1 − 2 cos t + cos2 t) dt

0

= a2 (2π − 0 + π) = 3a2 π.

Die Länge des Zykloidenbogens ist 2π

2a2 (1

L=

− cos t) dt = 2a

0

2π

sin 0

t dt = 8a. 2

Der Kr¨ ummungsradius an der Stelle t ist 3

√

(2a2 (1 − cos t)) 2 t

sin . r= = 2 2a |1 − cos t| = 4a

a2 (1 − cos t) 2

XII.3 Parameterdarstellung von Kurven Ein Punkt P = O in einem kartesischen Koordinatensystem kann auch eindeutig durch seine Entfernung r vom Ursprung und den Winkel θ zwischen der positiven x-Achse und dem Strahl OP + beschrieben werden, wobei der Winkel im Gegenuhrzeigersinn zu messen ist (Fig. 7). Man nennt (r, θ) die Polarkoordinaten von P . Die Umrechnung zwischen kartesischen Koordinaten und Polarkoordinaten erfolgt nach den Formeln x = r cos θ, y = sin θ bzw. r=

√

y 6 x

tP

r ..r...... . . .. .. θ ... .

y -

x

O x = r cos θ y = r sin θ Fig. 7: Polarkoordinaten

y x

x2 + y 2 , θ = arctan .

Beispiel 6: Die Lemniskate mit der Gleichung (x2 + y 2 )2 − 2a2 (x2 − y 2 ) = 0 (Fig. 8; vgl. auch Beispiel 3 in XII.2) hat in Polarkoordinaten die Gleichung r4 − 2a2 r2 (cos2 θ − sin2 θ) = 0, also

337

2

@

6

...................@ ......................... ....... ...... ....... ... ...... . . . . .... @ . ..... ..... ... . . . .. . @...... .. . . . ... . . . . .. ... @......... ... . . . . . . @ . . . ..... . . . . . .. . .......................... @........................... @ @

2

r = 2a cos 2θ

mit −

π π ≤ θ ≤ 4 4

f¨ ur den rechten Teil

und

3 5 π≤θ≤ π 4 4

f¨ ur den linken Teil.

Fig. 8: Lemniskate

Damit gewinnt man auch eine Parameterdarstellung:

x ϕ(θ) cos θ = = 2a2 cos 2θ y ψ(θ) sin θ

Ist eine Kurve in Polarkoordinaten durch die Gleichung r = r(θ) gegeben, dann hat sie die Parameterdarstellung x = ϕ(θ) = r(θ) cos θ,

y = ψ(θ) = r(θ) sin θ.

F¨ ur ihre Steigung m (= m(θ)) bez¨ uglich des kartesischen Koordinatensystems gilt also wegen m(θ) =

ψ (θ) : ϕ (θ)

m=

r sin θ + r cos θ r tan θ + r = r cos θ − r sin θ r − r tan θ


338

Ebenso ergeben sich die Aussagen in den folgenden Sätzen aus den entsprechenden Aussagen u ¨ber Kurven in Parameterdarstellung. Satz 4: Ist durch r = r(θ) mit einer stetigen Funktion r auf [α; β] eine Kurve C in Polarkoordinaten gegeben, so hat die von den Strahlen OP + mit P ∈ C u ¨berstrichene Fläche den Inhalt β

1 2 A= r dθ. 2α Satz 5: Ist durch r = r(θ) mit einer stetig differenzierbaren Funktion r auf [α; β] eine Kurve C in Polarkoordinaten gegeben, so hat die Kurve die Länge β

r2 + (r )2 dθ.

L= α

Satz 6: Ist durch r = r(θ) mit einer zweimal differenzierbaren Funktion r auf [α; β] eine Kurve C in Polarkoordinaten gegeben, so hat diese an der Stelle θ den Kr¨ ummungsradius = (θ) mit 3

(r2 + (r )2 ) 2 = 2 . r + 2(r )2 − rr Beispiel 7: Die Lemniskate in Beispiel 6 umschließt eine Fläche vom Inhalt π

1 A = 2 · · 2a2 2

2

cos 2θ dθ = 2a2 .

− π4

Diese Kurve hat die Länge π

√ 4 L = 2·a 2 − π4

π

π

√ 4 √ 4 1 1 sin2 2θ √ dθ = 4 2a √ dθ. cos 2θ + dθ = 2 2a cos 2θ cos 2θ cos 2θ π 0 −4

π = 0 steht hier ein uneigentliches Integral. Dieses existiert, denn f¨ ur 2 π 1 4 π 1 π 2 1 √ dt existiert. Es gilt dθ = 0 < x < ist cos x > 1 − x, und 2 π t 4 4 1− θ 0 0 π

Wegen cos

π

1 4 π π 1 π 1 √ dt = . < √ dθ < t cos 2θ 4 4 2 0

0


339

Aufgaben √

1. Man parametrisiere die Kurve mit der Gleichung 2x− y ln y = 0 mit y = t2 (t > 0). Man zeichne f¨ ur t = 1, 2, 3, 4, 5 die Kurvenpunkte mit ihren Tangentenvektoren.

2. Eine Kurve sei in Polarkoordinaten durch die Gleichung r = θ gegeben. n

Man zeichne die Kurvenpunkte einschließlich der Steigungen f¨ ur θ = π 2 (n = 1, 2, 3, 4). Man bestimme auch die Kr¨ ummung in diesen Punkten und zeichne dann die Kurve f¨ ur 0 ≤ θ ≤ 2π.

3. In Fig. 9 ist die Kurve mit der Gleichung (1 − x2 )3 − y 2 = 0 gezeichnet. a) Man zeige, dass die Kurve in Fig. 9 folgende Parameterdarstellung hat: x = cos t, y = sin3 t (0 ≤ t ≤ 2π) b) Man bestimme die Wendepunkte und die Steigungen in diesen. c) Man berechne den Inhalt der eingeschlossenen Fläche. d) Man berechne die Länge der Kurve. e) Man berechne den Radius des Kr¨ ummungskreises in den Kurvenpunkten (0, ±1).

4. In Fig. 10 ist eine Zissoide gezeichnet. Sie hat in Polarkoordinaten die Darstellung r=a

sin2 θ cos θ

π 2

− b > 0 voraussetzen wollen) bzw. der Parameterdarstellung

x a cos t = y b sin t

(t ∈ [0; 2π[)


342 hat die Parameterdarstellung

⎛

⎜ x a cos t a2 sin2 t + b2 cos2 t −b cos t = + =⎜ ⎜ ⎝ y b sin t −a sin t ab

⎞ a2 − b2 cos3 t ⎟ a ⎟ ⎟ ⎠ a2 − b2 3 − sin t b

(t ∈ [0; 2π[). Nach Elimination des Parameters t ergibt sich die Gleichung 2

2

2

(ax) 3 + (by) 3 = (a2 − b2 ) 3 bzw.

2

2

ax 3 by 3 + 2 = 1 mit e2 = a2 − b2 . e2 e

Die Evolute ist also eine Asteroide (vgl. Beispiel 5 in XII.2). Die Spitzen der Asteroiden sind die Mittelpunkte der Scheitelkr¨ ummungskreise der Ellipse. Die geometrische Konstruktion dieser Mittelpunkte ist in Fig. 3 angedeutet. ..u ... . .. .... . . ........................................ .. .. ........................ ............. J . .... . .. ............. . . . . . . . . . . . . . . ..... J .......... .. ... .. .. .... ......................... J . ................ .... .... . .... .. . . . . . . . . . . . ..... .. .. . . ..... ... .. .... .. . .. .. . .. J... r....... .. .... ... .. . . . ...... J ... . .. . . . . . ..... ... .. .. .. ... .. J .... ...... ... ... . ... ...... . . ...... . . . . . . J . . .. . . .. . . . . . . . .... u . ..u..... . . .... J ............... ............. . . .. .. ... ..... . . . . . . . .. . . . . . . . . J . . .. . . . .... ... .. .. . .. .. ... .... . . ... .... J .. . . .. . ... . .. ... ... .... . . . J . .. .... .......... ...... .... .. ... .. . . . . . . . . ............. .... .... .. . J ... . .. ............... . . . . .......... .. . . ... . J .... .......... .. . . . . . . . . . . .. . ............... J .. . ...... . .. . . . . . . . ............J . . . . . . . . . . . . . .. . ...................... .. . . .. J .. ... . J.u Fig. 3: Asteroide als Evolute einer Ellipse

In Fig. 4 ist der Kr¨ ummungsradius M P zum Ellipsenpunkt P eingezeichnet. Er liegt auf der Tangente an die Asteroide im Punkt M . Ist σ die Bogenlänge des Asteroidenst¨ ucks zwischen M und der Spitze A und r der Kr¨ ummungsradius im Nebenscheitel, dann hat der Kr¨ ummungsradius im Punkt P den Betrag = σ + r, was wir im Folgenden näher begr¨ unden werden. Dies gilt auch f¨ ur den Kr¨ ummungsradius R im Hauptscheitel, ein Viertelbogen der Asteroide hat also die Länge R − r =

a2 b2 − . b a

...sB . .............................................. ... ......... ....... ... ..... ... .... ....sM ... ...... .. ......... σ ... .............s r .... ... .. ... A .. ... R . .. .. ... ...... ... ........... ...s... ......... .................................... P Fig. 4: Bogenl¨ ange der Asteroiden

XII.4 Evoluten und Evolventen

343

Man denke sich auf einer Kurve C einen Punkt A gegeben und ordne dem Kurvenpunkt P denjenigen Punkt Q zu, der auf der Tangente an die Kurve in P liegt und dessen Entfernung von P gleich der Länge des Kurvenbogens von P nach A ist (Fig. 5). Die Punkte Q liegen auf einer Kurve, die durch Abwicklung“ aus C ent” steht; diese Kurve nennen wir eine Evolvente von C.

k .... .... .... .... ..Q .. ..Q .. ... Q .t. ... ... ...Q Evolvente .Q . .. A ................. ...t . . . . . . . . A ...... A ........ C A .... .. . . .... A s .. . ... . A s .... A ... A . A .... A .. .. P (x, y) AA...t...... ..

Fig. 5: Evolvente

Das lateinische evolvere kann man etwa mit herauswickeln“ u ¨bersetzen. Man ” beachte, dass zu verschieden gewählten Punkten A auch verschiedene Evolventen von C gehören und dass man die Kurve von A aus in zwei verschiedene Richtungen durchlaufen kann. In obigem Beispiel 2 haben wir als Ausgangspunkt der Evolvente einen Punkt auf der Tangente in A gewählt. In diesem Fall muss man in der Formel in Satz 2 zu s eine Konstante addieren. Satz 2: Ist eine Kurve C in Parameterdarstellung gegeben, etwa

x ϕ(t) = y ψ(t)

(t ∈ [a; b]),

dann hat ihre Evolvente zum Punkt A = (ϕ(t0 ), ψ(t0 )) die Parameterdarstellung

x ϕ ϕ s = − , y ψ (ϕ )2 + (ψ )2 ψ

wobei wir zur Vereinfachung die Variable t unterdr¨ uckt haben, und wobei

s = s(t) =

t

t0

(ϕ (τ ))2 + (ψ (τ ))2 dτ.

Beweis: Wird die Kurve mit wachsendem t von A nach P durchlaufen und ist t −→ der Tangentenvektor in P , dann ist P Q= −s t. 2 Beispiel 3: Die Evolvente der Kettenlinie mit der Gleichung y = cosh x = ex + e−x (Fig. 6) und dem Anfangspunkt A(0, 0) hat die Parameterdarstellung 2 t 1 + sinh2 τ dτ

x y

=

t − cosh t

2

1 sinh t

1 + sinh t sinh t t 1 t − sinh t/ cosh t − = . cosh t 1/ cosh t cosh t sinh t

=

0


344

√ 1 sinh t 1 = y 2 − 1 = 1 − y 2 und damit Es sei t > 0. Mit cosh t = ist dann y cosh t y √ 1 x = cosh−1 − 1 − y 2 , wobei cosh−1 die Umkehrfunktion von cosh auf IR+ 0 ist. y

Die Kurve mit dieser Gleichung nennt man eine Traktrix oder Schleppkurve: Wird ein Massepunkt in (0, a) an einem Faden der Länge a befestigt und das Ende des Fadens dann entlang der x-Achse gezogen, dann bewegt sich der Massepunkt auf einer Schleppkurve mit der Gleichung x = cosh−1

a ± y

a2 − y 2 .

Beispiel 4: Wir wollen die Evolvente des Kreises mit der Parameterdarstellung

x cos t = y sin t

(t ∈ [0; 2π[)

zum Anfangspunkt (1,0) bestimmen. Hier ist s(t) = t, es ergibt sich also als Parameterdarstellung der Evolvente

x cos t + t sin t = . y sin t − t cos t

Die Kreisevolvente ist ein spiralförmiges Kurvenst¨ uck, welches man f¨ ur t ≥ 2π spiralförmig fortsetzen kann (Fig. 7).

... .. y ... ... 6 ... . Kettenlinie . ... .. ... ... .... . . ..... .... ....... ...... . . ........... . . . . . ........................................... ... 1 ............ . . . . . ........ . ......... Traktrix ....... ........ ........... . . . . . . . . . . .................... . . . . . . . . . . ........... ...................... .. x 1 Fig. 6: Traktrix als Evolvente der Kettenlinie

........................................... ......... .. . . . . ..... . ... ......... . ..... ..... . . . . . . . . . . . ..... . .. ................................ ..... ... ..... ............... ....... ... ... .... .. ..... .. . ........ .......u.. ..... . ... . .............................................................................................. . ... ... . . . ... ... π ... ... ... ..... . . . ... . ... . . . ... ... ... . . ... 2π . ... ... . ... . ... . . . . ... ... .... ......... ... .... ...... ... ...... . . . . ....... . ... ...... ........ . ............ ......... .................................................... Fig. 7: Kreisevolvente

Berechnen wir die Evolute der Traktrix in Beispiel 3 oder der Spirale in Beispiel 4, dann ergibt sich wieder die Kettenlinie bzw. die Kreislinie, deren Evolvente die Traktrix bzw. die Spirale ist. Allgemein besteht der im folgenden Satz 3 formulierte Zusammenhang zwischen Evolvente und Evolute, wobei man beachte, dass die Evolute einer Kurve eindeutig bestimmt ist, eine Evolvente aber erst durch Angabe des Anfangspunkts festgelegt ist. Beim Beweis von Satz 3 f¨ uhrt es zur

XII.4 Evoluten und Evolventen

345

Vereinfachung der Rechnungen, wenn man als Parameter t in der Parameterdarstellung der gegebenen Kurve C ihre Bogenlänge s (gemessen ab einem festen Punkt) verwendet. Wegen (ϕ (s))2 + (ψ (s))2 = 1 gilt dann:

x ϕ = +r y ψ

Evolute von C:

−ψ ϕ

x ϕ ϕ = −s y ψ ψ

Evolvente von C:

Hier wurde zur Vereinfachung der Schreibweise statt x(s), ϕ(s), r(s) usw. einfach 1 x, ϕ, r usw. geschrieben. Dabei ist r = der Kr¨ ummungsradius von C. ϕψ −ψ ϕ

2

2

Wegen (ϕ ) + (ψ ) = 1 und damit ϕ ϕ + ψ ψ = 0 ist ϕ ψ − ψ ϕ =

1 1 ψ ϕ 2 2 2 ((ϕ ) ψ − ψ ϕ ϕ ) = ((ϕ ) ψ + ψ (ψ ) ) = = − . ϕ ϕ ϕ ψ

Also ist ϕ = rψ und ψ = −rϕ . Satz 3: Jede Kurve ist eine Evolvente ihrer Evolute und die Evolute jeder ihrer Evolventen. Beweis: Es sei die Kurve C mit der Parameterdarstellung

x ϕ(s) = gegeben, y ψ(s)

wobei der Parameter s die Bogenlänge auf C bedeutet, gemessen ab einem festen Anfangspunkt. Eine Evolvente der Evolute von C hat die Parameterdarstellung

x ϕ − rψ σ = − y ψ + rϕ ((ϕ − rψ ) )2 + ((ψ + rϕ ) )2

(ϕ − rψ ) , (ψ + rϕ )

wenn σ = σ(s) die Bogenlänge auf der Evolute bedeutet und Anfangspunkt und Richtung der Messung von σ zunächst beliebig sind. Nun ist (ϕ − rψ ) = ϕ − r ψ − rψ = −r ψ ,

(ψ + rϕ ) = ψ + r ϕ + rϕ = r ϕ

und damit

x ϕ − rψ σ = − y ψ + rϕ (r )2

Weiterhin ist

−r ψ ϕ − rψ σψ = + . +r ϕ ψ + rϕ −σϕ

(σ )2 = (−r ψ )2 + (r ϕ )2 = (r )2 ,

also σ = ±r und damit σ = ±r+c (c ∈ IR). Wählen wir nun diejenige Evolvente, welche sich f¨ ur σ = r ergibt, so erhält man die Parameterdarstellung von C. Damit ist der erste Teil des Satzes bewiesen.


346

Den zweiten Teil beweist man auf ähnliche Art. Man kann ihn auch anschaulich beg¨ unden: Wird die Kurve an einem Kurvenpunkt P mit dem zugehörigen Evolventenpunkt Q ein kleines St¨ uck weiter abgewickelt, so liegen die zugehörigen Evolventenpunkte näherungsweise auf einem Kreisbogen um P mit dem Radius P Q. Der Kr¨ ummungskreis der Evolvente im Punkt Q hat also den Mittelpunkt P (Fig. 8). 2

.............. ... .......................s. Q ... .. ......s........ ... ... ................s................ . .. .. .. ........ A ... ... ......... . .. .. ....... ........... . ........ .......... .s ..... P ....s .. Fig. 8: Zu Satz 3

Aufgaben 1. Man bestimme ohne Benutzung von Satz 3 die Evolute der Spirale aus Beispiel 4.

2. Man bestimme ohne Benutzung von Satz 3 eine Evolvente der Evolute der Parabel aus Beispiel 1.

3. Durch r = θ (θ ≥ 0) ist eine archimedi-

sche Spirale in Polarkoordinaten gegeben (Fig. 9).

a) Wie lang ist das Kurvenst¨ uck f¨ ur 0 ≤ θ ≤ 2π ? b) Welchen Inhalt hat der Sektor zwischen π π den Radiusvektoren f¨ ur θ = und θ = ? 4

2

c) Man gebe eine Parameterdarstellung an. d) Man bestimme die Evolute.

4. Durch r = eθ mit θ ∈ IR ist eine logarithmi-

sche Spirale in Polarkoordinaten gegeben (Fig. 10). a) Wie lang ist das Kurvenst¨ uck f¨ ur 0 ≤ θ ≤ 2π ?

b) Man gebe eine Parameterdarstellung an. c) Man bestimme die Evolute.

........... ........ ....... ...... ..... .... .... ... ... ... ... .. . . . . . . . . . . . . .. .... ...... . . . . . ..r... .. ... . . .... . 2π . ... ... ... . . ..... ... ....... ..... . . . .......... . . . . ....................... Fig. 9: Archimedische Spirale

......... ........ ....... ....... ...... ..... .... .... ... ... ... ... ... .. . . . . . . . . . . . . . .... . ................ .. . . . . . . . .. ... ........s.1.....s .. ................... .... ... . ... ... .... ... . . ..... . ... ....... ............. ................... .......... Fig. 10: Logarithmische Spirale

XII.5 Kurven und Flächen im Raum

347

XII.5 Kurven und Fl¨ achen im Raum ⎛

⎞ ⎛ ⎞ x p + ta So wie durch ⎝ y ⎠ = ⎝ q + tb ⎠ (t ∈ IR) mit (a, b, c) = (0, 0, 0) eine Gerade im z r + tc ⎛ ⎞ ⎛ ⎞ x ϕ(t) ⎝ ⎠ ⎝ Raum beschrieben wird, ist auch allgemein durch y = ψ(t) ⎠ (t ∈ I) eine z χ(t)

Kurve im Raum gegeben, wenn ϕ, ψ, χ auf dem Intervall I stetige Funktionen sind. Sind diese differenzierbar, dann ist Q ...............u...... . z . . . . . .. . ⎛ ⎞ ...... .... . 6 .... ...... ... ϕ (t) . . . . ... Δχ ⎜ ⎟ .... .... ⎝ ψ (t) ⎠ ⎛ ⎞ ... ... ....... . . Δϕ .. Δs .. −→ .. . χ (t) . . . . . .. ⎟ .. P Q= ⎜ ... .... ⎝Δψ⎠ ... ........ Δψ .. . ein Tangentenvektor an der Stelle t Δχ .. .......................................................... - y (Fig. 1). Ist I = [a; b], dann ist die .................. ....... Δϕ Länge der Raumkurve ....... . u . x . P. . b

(ϕ (t))2 + (ψ (t))2 + (χ (t))2 dt.

Fig. 1: L¨ ange einer Raumkurve

a

⎛ ⎞ ⎞ a cos t x a sin t ⎟(0 ≤ t ≤ 2π) wird in einem kartesischen Beispiel 1: Durch ⎝ y ⎠ = ⎜ ⎝ ⎠ b z t 2π ⎛

Koordinatensystem eine Schraubenlinie mit dem Radius a und der Höhe b beschrieben (Fig. 2). z 6 . . . . . . . . . ........................... . . . . . . . . . . . . . . . . . . ... ...... .. ........ ........ ................................................................................................................. .......... .. .......... 6 ............... .......... ......... ... . . . . . . ................................................................................................ .... . .. ... ............. . ......... ... .... ... .......... ..... ......... ... . . . . . . . ... ... . ... ......... L............ .. b . . ... ... . .. .... b ..... .. . . . . . . ... ..... . ... ... . ...... . .. . . . . . . . . . ... . . . .................................. ..................... .... ...... .. . . . . . . . . ... ....................... . . ...... . . . ................... ......... ? . . . . . . ... ........ .... . ..... ............................................................................................................................... -... .... . . . . .. ....... .. ... . . . . . . . . . y 2πa .................................... ...a............... .........................

+ x

Fig. 2: Schraubenlinie

Fig. 3: L¨ ange der Schraubenlinie b

, wie man auch Der Tangentenvektor hat die Koordinaten −a sin t, a cos t, 2π leicht der Anschauung entnehmen kann. Ebenfalls der Anschauung kann man die Länge L der Schraubenlinie entnehmen (Fig. 3).


348

Beispiel 2: Sind a, b zueinander orthogonale Einheitsvektoren aus IR3 , dann bilden die Punkte mit den Ortsvekoren x = m + r cos t a + r sin t b (0 ≤ t ≤ 2π) einen Kreis auf der Ebene E : x = m + ua + vb (u, v ∈ IR) mit dem Radius r und −→ dem Mittelpunkt M (mit OM = m). Denn wegen |a| = |b| = 1 und a ⊥ b ist |r cos t a + r sin t b|2 = r2 cos2 t|a|2 + r2 sin2 t|b|2 = r2 . Beispiel 3: Wie bei ebenen Kurven f¨ uhrt die Berechnung der Länge einer räumlichen Kurve meistens auf unangenehme Integrale. Wir betrachten als Beispiel die Durchdringungskurve zweier Zylinder, die sich rechtwinklig zentral schneiden (Fig. 4). Der Zylinder mit der Gleichung x2 + z 2 = 1 hat die Parameterdarstellung

z 6 . . ................ .................................. . . . . . . . . . .... ..... .. ......... . . . . . . . .............................................. ............ . ..... ............ .... .. ... . .. .... .. .. ... .. . ...... . .... ........... ........... x ... . ......... ... ....................................................

... .. ... ... ... ... ...

x = cos t, y = u, z = sin t

...... .. ... ... ..... y ... .... .. ... .. .....

Fig. 4: Durchdringung zweier Zylinder

(0 ≤ t ≤ 2π, u ∈ IR). Er wird von dem Zylinder mit der Gleichung x2 + y 2 = 4 geschnitten. Die Durchdringung erfolgt in zwei zueinander symmetrischen geschlossenen Kurven. Wir betrachten nur die Kurve C mit y > 0. Aus cos2 t + u2 = 4 ergibt sich eine Parameterdarstellung von C:

x = cos t, y =

4 − sin2 t, z = sin t (0 ≤ t ≤ 2π).

F¨ ur die Bogenlänge s = s(t) gilt (s (t))2 = 1 +

sin2 t cos2 t 4 − sin4 t = . 4 − sin2 t 4 − sin2 t

Die Länge von C ist also 2π

L= 0

π 2

4 − sin4 t dt = 4 · 4 − sin2 t 0

4 − sin4 t dt. 4 − sin2 t

Das Integral ist nicht elementar auswertbar“. Die Simpson-Regel liefert ” ⎛

⎞

π ⎝ 15 L≈4· + 1⎠ = 1,0234 · 2π. 1+4 12 14


349

Im Raum, der mit einem affinen Koordinatensystem (x, y, z-Achsen) versehen ist, wird durch die Gleichung z = ax+by+c mit (a, b) = (0, 0) eine Ebene beschrieben (welche nicht parallel zur z-Achse ist). Ist nun allgemeiner f eine Funktion von zwei Variablen, dann wird durch z = f (x, y) eine Fläche beschrieben, welche von allen zur z-Achse parallelen Geraden in höchstens einem Punkt geschnitten wird. Allgemeiner ist ax + by + cz + d = 0 mit (a, b, c) = (0, 0, 0) die Gleichung einer Ebene; entsprechend ist F (x, y, z) = 0 die Gleichung einer Fläche, wobei F eine Funktion von drei Variablen ist. (Die z 6 Funktion F muss gewissen Bedingun...v1 gen gen¨ ugen, damit nicht wie z. B. bei ........ . ....... der Gleichung x2 + y 2 + z 2 + 1 = 0 die ..... .............. .v . leere Menge beschrieben wird.) .. . .. ............... .... ... ................................ . . . . .. .... ........................ Beispiel 4: Bei der geschlossenen ............................ . . . ....... . . . . . . . . . . . ..v ........................ . ........................................v Fläche in Fig. 5 entsteht bei jedem .............. .... . . . . . . . . y . . . . . . ... ....... .......... ..... 1 .. ... ........... . .... Schnitt mit einer Ebene, die zu einer ............... ... .. ... ..v .............. ..... Koordinatenebene parallel ist, eine As1 ....... .. teroide mit gleichlangen Achsen. Die ........ x ....... Fläche hat daher die Gleichung ..v 2

2

2

x 3 + y 3 + z 3 = 1.

Fig. 5: Asteroidenk¨ orper

Schließlich⎛kann⎞man⎛eine Ebene auch in Parameterdarstellung angeben, also in ⎞ x

p + ua + vd

z

r + uc + vf

der Form ⎝ y ⎠ = ⎝ q + ub + ve ⎠ (u, v ∈ IR) mit (a, b, c), (d, e, f ) = (0, 0, 0). Dem die ache im Raum durch ⎛ ⎞entspricht ⎛ ⎞ Beschreibung einer beliebigen Fl¨ x ϕ(u, v) ⎝ y ⎠ = ⎝ ψ(u, v) ⎠ (u ∈ I, v ∈ J), wobei I, J Intervalle aus IR und ϕ, ψ, χ z χ(u, v)

auf I × J stetige Funktionen sind.

Wir wollen die Tangentialebene einer in Parameterdarstellung gegebenen Fläche (s. o.) in dem Punkt mit den Parameterwerten (u, v) ∈ I × J bestimmen, wobei wir nat¨ urlich voraussetzen m¨ ussen, dass die partiellen Ableitungen von ϕ, ψ, χ in einer Umgebung von (u, v) existieren. (u, v +...Δv) Dazu betrachten wir zunächst die Ebe..... ......................................... ...... ......... s . . . . . . . ....... ne durch die drei Punkte mit den Pa..... . . . 6 . . s ........... ... . rameterwerten . . ...... * . . . .. .................... ........................................... . . . . . . . ....... (u, v), (u + Δu, v), (u, v + Δv) ∈ I × J ......... .... s .......... (u, v) ......... (u + Δu, v) . (Fig. 6), wobei wir den Grenz¨ ubergang .... ........ ..... Δu, Δv → 0 im Auge haben. Diese Ebene hat die Parameterdarstellung

Fig. 6: Tangentialebene


350 ⎛

⎞

⎛

⎞

⎛

⎞

⎛

⎞

x ϕ(u, v) ϕ(u + Δu, v) − ϕ(u, v) ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ y ⎠ = ⎝ ψ(u, v) ⎠ + r ⎝ ψ(u + Δu, v) − ψ(u, v) ⎠ z χ(u, v) χ(u + Δu, v) − χ(u, v) ϕ(u, v + Δv) − ϕ(u, v) ⎜ ⎟ + s ⎝ ψ(u, v + Δv) − ψ(u, v) ⎠ χ(u, v + Δv) − χ(u, v) Vervielfachen wir den ersten Richtungsvektor mit

(r, s ∈ IR).

1 1 und den zweiten mit , Δu Δv

dann gehen diese Vektoren f¨ ur Δu → 0 bzw. Δv → 0 in Tangentialvektoren u ¨ber. Die Parameterdarstellung der gesuchten Tangentialebene ist also ⎛

x

⎞

⎛

ϕ(u, v)

⎞

⎛

ϕu (u, v)

⎞

⎛

ϕv (u, v)

⎞

⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ y ⎠ = ⎝ ψ(u, v) ⎠ + r ⎝ ψu (u, v) ⎠ + s ⎝ ψv (u, v) ⎠

z

χ(u, v)

χu (u, v)

(r, s ∈ IR),

χv (u, v)

wobei der Index u bzw. v die partielle Ableitung nach u bzw. v angibt. ⎛

⎞ ⎛ ⎞ x a cos u cosh v Beispiel 5: Durch ⎝ y ⎠ = ⎝ b sin u cosh v ⎠ (u ∈ [0, 2π[, v ∈ IR) wird ein z c sinh v

einschaliges Hyperboloid beschrieben, denn x2 y 2 z 2 + 2 − 2 = (cos2 u + sin2 u) cosh2 v − sinh2 v = cosh2 v − sinh2 v = 1. a2 b c 1

1

(Dabei ist sinh x := (ex − e−x ) und cosh x := (ex + e−x ); vgl. XII.1, Bsp. 2). 2 2 Die Tangentialebene im Punkt (x0 , y0 , z0 ) mit den Parameterwerten u0 , v0 hat die Richtungsvektoren ⎛

⎞

⎛

⎞

⎛

⎞

⎛

⎞

−a sin u0 cosh v0 −a2 y0 a cos u0 sinh v0 (tanh v0 ) x0 1 ⎜ 2 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = und = b cos u cosh v b x b sin u sinh v ⎝ ⎝ ⎝ ⎝ (tanh v0 ) y0 ⎠ . 0 0 ⎠ 0 ⎠ 0 0⎠ ab 0 0 c cosh v0 (tanh v0 )−1 z0

Die beiden Richtungsvektoren sind orthogonal zu dem Vektor mit den Koordinax y z ten 20 , 20 , − 20 , wie man durch Berechnen der Skalarprodukte feststellen kann. a b c Daraus ergibt sich die aus der Analytischen Geometrie bekannte Gleichung der Tangentialebene an das Hyperboloid im Punkt (x0 , y0 , z0 ): xx0 yy0 zz0 + 2 − 2 = 1. a2 b c Zur tieferen Untersuchung von Kurven und Flächen im Raum benötigt man weitergehende Methoden der Analysis mehrerer reeller Veränderlicher und Methoden der Differenzialgeometrie.


351

Aufgaben

z

1. Man bestimme eine Parameterdarstellung f¨ ur den Kreis um M (3, 5, 1) mit dem Radius 7, der auf der Ebene mit der Gleichung 2x + y − 3z = 8 liegt.

2. Es sei 0 < a < 1 und h > 0. Durch x = at cos t, y = at sin t, z = h at (t ≥ 0) wird eine Spirale beschrieben, die auf der Kreiskegelfläche mit der z2

Gleichung x2 +y 2 = 2 (z ≥ 0) verläuft h (Fig. 7). Wie lang ist die Spirale?

3. a) Man bestimme die größte Kugel, die in den Asteroidenkörper in Fig. 5 passt. b) Man berechne das Volumen des Asteroidenkörpers in Fig. 5.

4. Man zeige, dass ⎛

⎞

⎛

⎞

x r cos u cos v ⎜ ⎟ ⎜ ⎟ ⎝ y ⎠ = ⎝ r sin u cos v ⎠ z r sin v

π π u ∈ [0, 2π[, v ∈ − ; eine Para2 2

meterdarstellung der Kugel mit dem Mittelpunkt (0, 0) und dem Radius r ist (Fig. 8). Man bestimme dann eine Parameterdarstellung eines Ellipsoids mit dem Mittelpunkt (0,0) und den Halbachsenlängen a, b, c.

5. Man zeige, dass ⎛

⎞

⎛

⎞

x a cosh v ⎜ ⎟ ⎜ ⎟ ⎝ y ⎠ = ⎝ b cos u sinh v ⎠ z c sin u sinh v (u ∈ [0; 2π[, v ∈ IR) ein zweischaliges Hyperboloid beschreibt (Fig. 9). Dabei sind sinh und cosh die hyperbolischen Funktionen aus X.2 Aufgabe 7. Man bestimme eine Parameterdarstellung und eine Gleichung der Tangentialebene in einem gegebenen Punkt.

6

......................................... .............. ...... ....... ... h ....... .. ...............t....... ..................................... ........................................... ... ...... .. . . . ... ................. . . . . . ................... .. .... ......................................... ........................................ ...... .. ... ... .. . ... ... ... ... .. ... . .

y

x

Fig. 7: Spirale auf Kegel

6z

tP

r

.. ... r sin v ... v HH.. . ...... u ...H ... ..................... HH HH x

y

-

r cos v

Fig. 8: Zu Aufgabe 4

. ............ .... ..... . z 6. . ... . .. ... .... .. ... .. .. .. . . . . ......... . .. .... .............. .... .. ... .... .... ..... .. ... -y ... .. ................. .. ... ... . . .... ... .. .... . . .. .. .. x .... .... ... ..... ......... Fig. 9: Zweischaliges Hyperboloid

Lo ¨sungen der Aufgaben Lineare Algebra I.1 1. f (x) = 2x4 − x3 + 3x2 − 5x + 11 I.1 2. (x1 , x2 , x3 , x4 , x5 , x6 , x7 ) = (2, 10, 8, 6, 2, 5, 8) I.1 3. Ansatz x1 + x2 + x3 + x4 = 1, 6x1 + 6x2 + 3x3 + 2x4 = 4, 15x1 + 10x2 + 15x3 + 10x4 = 12. Mit x1 = t ergibt sich x2 = 25 − 34 t, x3 = 25 − t, x4 = 15 + 34 t; dabei muss 0 ≤ t ≤ 25 sein, damit x3 ≥ 0 ist. I.1 4. (x1 , x2 , x3 , x4 , x5 , x6 , x7 ) = (600 − r, −500 + r + s, 600 − r, r, −700 + s, −500 + s, s); wegen x5 ≥ 0 folgt x7 = s ≥ 700 und daraus x6 ≥ 200. G¨ unstigste L¨ osung x5 = 0 (Abschnitt BC sperren) also x7 = s = 700 und somit (x1 , x2 , x3 , x4 , x5 , x6 , x7 ) = (600 − r, 200 + r, 600 − r, r, 0, 200, 700) mit 0 ≤ r ≤ 600.

I.2 1. a) Hat ein LGS die L¨ osungen (u1 , u2 , . . . , un ) und (v1 , v2 , . . . , vn ), dann hat es auch die Lösung (u1 + t(v1 − u1 ), u2 + t(v2 − u2 ), . . . , un + t(vn − un )) mit t ∈ IR. osung, f¨ ur r = b) F¨ ur r = 52 genau eine L¨ Lösungen (s = 6).

5 2

keine L¨ osung (s = 6) oder unendlich viele

I.2 2. x1 + 3x2 = 7, 4x1 + 3x3 = 19; das LGS ist nicht eindeutig bestimmt! I.2 3. Es ist p(1, 3, −1) + q(11, 2, 20) = ( 73 p + 5q)(1, 1, 1) + (− 23 p + 3q)(2, −1, 5), und ebenso kann man r(1, 1, 1) + s(2, −1, 5) als Element der zweiten Menge darstellen. I.2 4. a) r(1, −4, −1, −4, −11) (r ∈ IR) b) Lösen durch genaues Hinsehen“: Es ist 4(x1 + x2 + x3 + x4 + x5 ) = 15, ” 15 15 also x1 = 15 4 − 1, x2 = 4 − 2, . . . , x5 = 4 − 5 I.3 1. Aus r(a+2b)+s(a+b+c)+t(a−b−c) = o folgt (r+s+t)a+(2r+s−t)b+(s−t)c = o, und das LGS r + s + t = 0, 2r + s − t = 0, s − t = 0 hat nur die L¨ osung r = s = t = 0.

I.3 2. Aus

n

i=0

ai (1 + x)i = 0 folgt durch Einsetzen von x = −1 zun¨ achst a0 = 0, K¨ urzen

von (1 + x) und Einsetzen von x = −1 liefert a1 = 0 usw. √ √ √ √ u angig: Aus a + b 2 + c 3 = 0 mit√a, b, c ∈√Q I.3 3. {1, 2, 3} ist ¨ber Q linear√unabh¨ √ folgt a2 = 2b2 + 2bc 6 + 3c2 . Weil 6 irrational ist, muss bc = 0 sein; weil 2 und 3 irrational sind, muss b = c = 0 und damit auch a = 0 sein. I.3 4. a) Vektorraumaxiome verifizieren, insbesondere geh¨ ort o zur Schnittmenge. b) F¨ ur u1 ∈ U1 \ U2 und u2 ∈ U2 \ U1 ist u1 + u2 ∈ U1 und u1 + u2 ∈ U2 , also u1 + u2 ∈ U1 ∪ U2 . (Dabei ist allgemein A \ B die Menge aller Elemente aus A, die nicht zu B gehören.) c) Die Darstellung ist eindeutig, wenn U1 ∩ U2 = {o}. I.3 5. IR-Vektorraum der Dimension 2. I.3 6. Beispiele f¨ ur Basen sind

2 −2 3

2 1 0

−1 4 , 0

2 1 0

−1 1 3

2 1 , 0

−1 4 0

2 1 0

2 −2 3

,

2 0 1

0 1 2

1 2 , 0

1 2 0

0 1 2

2 0 , 1

0 2 1

2 1 0

1 0 2

I.4 1. Axiome nachrechnen; Nullelement U , −(a + U ) = −a + U usw. I.4 2. Beispiel: LGS aus 3x1 + x2 − x3 − x4 = −4, x1 + 2x2 − x4 = −6 anze man zu einer Basis I.4 3. Eine Basis {u1 , u2 , . . . , ur } von U1 ∩ U2 erg¨

Lineare Algebra

353

{u1 , . . . , ur , v1 , . . . , vm } von U1 und zu einer Basis {u1 , . . . , ur , w 1, . . . , w n } von U2 . Dann ist {u1 , . . . , ur , v1 , . . . , vm , w 1, . . . , w n } eine Basis von U1 + U2 und es gilt r + m + n = (r + m) + (r + n) − r. I.4 4. Ist (a + u1 , u2 ) ∩ (b + v1 , v2 ) = ∅, dann hat das homogene LGS osungsraum. x1 u1 + x2 u2 + x3v1 + x4v2 = o einen eindimensionalen L¨ (Zwei Ebenen sind parallel oder schneiden sich in einer Geraden.) I.4 5. Beide Aussagen sind gleichwertig mit a − b ∈ u, v .

I.4 6. Ist b = ta (oder umgekehrt), dann ist b − a = a und daher (a + U1 ) ∨ (b + U2 ) = a + ( a + U1 + U2 ) = a + U1 + U2 .

I.5 1. Die Vektoren mit den Koordinaten 2, 10, 5 bzw. 1, −1, 4 sind linear unabh¨ angig. I.5 2. Beide Bedingungen sind gleichwertig mit p − q ∈ u, v . I.5 3. a) Auf der einen Geraden seien A, B durch p + ra u und p + rb u gegeben, auf der anderen die Punkte C, D durch q + scv und q + sdv . Die Geraden durch A und D bzw. durch B und C schneiden sich genau dann, wenn die Gleichung p + ra u + x((q + sdv ) − ( p + ra u)) = p + rb u + y((q + scv ) − ( p + rb u)) eine Lösung (x, y) besitzt. Die Gleichung l¨ asst sich umformen zu (x − y)(q − p) + ((1 − x)ra − (1 − y)rb )u + (xsd − ysc )v = o. Aus der linearen Unabh¨ angigkeit von q − p, u, v folgt x = y, ra = rb , sc = sd . b) Nein, denn die Geraden durch A, D bzw. B, C sind windschief. I.6 1. Schwerpunkt (Mitte der Strecke, Schnitt der Seitenhalbierenden des Dreiecks, Schnitt der Verbindungen gegen¨ uberliegender Seitenmitten des Vierecks). I.6 2. Es gen¨ ugt, dies am Quadrat mit den Ecken (0,0), (0,1), (1,0), (1,1) zu zeigen. I.6 3. 5x1 + x2 ≤ −4,

x1 + 3x2 ≤ 20,

−x + 6y ≤ 5,

3x + 2y ≤ 25

I.6 4. Die Punktmenge ist beschr¨ ankt (wegen x1 , x2 , x2 ≥ 0 und x1 + x2 + x3 ≤ 12) und 31 12 11 nicht leer. Ecken sind (0, 0, 0), ( 53 , 0, 0), (0, 7, 0), (0, 0, 2), ( 17 4 , 4 , 0), ( 5 , 5 , 0) usw. n } linear unabh¨ angig. II.1 1. Isomorphismus, wenn {w 1, . . . , w

II.1 2. Ist α injektiv oder surjektiv, dann wird eine Basis auf eine Basis abgebildet. II.1 3. Ist λ(v ) =

n

i=1

ai vi und μ(v ) =

n

i=1

bi vi , dann muss f¨ ur ai , aj = 0 und bi , bj = 0

gelten: Aus ai + aj = 0 folgt bi + bj = 0, also

ai aj

=

bi bj .

Weitere F¨ alle klar.

II.1 4. Man wähle den Koeffizientenvektor von α mit lauter Nullen und einer 1 an einer Stelle, an der sich v1 und v2 unterscheiden. II.1 5. Man verwende eine Basis von U und beachte dim A(A(U )) = dim Hom(V, K) − dim A(U ) = dim V − (dim V − dim U ) = dim U ur alle u1 ∈ U1 , u2 ∈ U2 , dann ist auch λ(u1 ) = 0 und II.1 6. Ist λ(u1 + u2 ) = 0 f¨ λ(u2 ) = 0 f¨ ur alle u1 ∈ U1 , u2 ∈ U2 . Ist λ(u) = 0 f¨ ur alle u ∈ U1 ∩ U2 , dann ist λ = λ1 + λ2 mit λ(u1 ) = 0 und λ(u2 ) = 0 und umgekehrt. ur alle A, dann ist E2 E1 = E2 und E2 E1 = E1 , II.2 1. a) Ist AE1 = A und E2 A = A f¨ also E1 = E2 . Ist E1 A = AE1 = A und E2 A = AE2 = A f¨ ur alle A, dann ist E1 E2 = E2 und E1 E2 = E1 , also E1 = E2 . b) Aus B1 A = AB1 = E und B2 A = AB2 = E folgt B1 = B1 E = B1 AB2 = EB2 = B2 . II.2 2. A = 12 (A + AT ) + 12 (A − AT )

Lösungen der Aufgaben

354

II.2 3. Der Rang ist 1. Die Spalten- bzw. Zeilenvektoren sind Vielfache von a bzw. b. II.2 4. Man weise AA−1 = E durch eine einfache Rechnung nach. II.2 5. Der Rang ist jeweils 3. II.2 6. Das Produkt jeder Zeile der ersten mit jeder Spalte der zweiten Matrix muss 0 ergeben. Einfachste Beispiele mit erster Zeile von A: (1,0,0,0,0), zweite Zeile von A: (0, 1 − 1, 1, −1), zwei erste Zeilen von B: (0,0,0). II.2 7. a) Haben die Matrizen A, B beide den Rang n, dann sind sie und damit ihr Produkt invertierbar, dieses hat also Rang n. ur größere Dimensionen. b) A = 10 10 , B = 00 −11 und analog f¨

II.2 8. dim(Bild B)=Rang B, dim(Bild AB)≤ Rang A, dim(Bild AB)≤ dim (Bild B). √ II.3 1. a) Eine primitive 8.te Einheitswurzel ist α = 12 2(1 + i), die anderen 8.ten √ Einheitswurzeln sind Potenzen von α. Der K¨ orper K muss neben die Zahlen 2, i √ √ Q√ und i 2 enthalten. Eine√Basis von K√als Q-Vektorraum ist {1, 2, i, i 2};√lineare Unabhängigkeit: Aus r + s 2 + i(t + u 2) = 0 mit r,√s, t,√u ∈√Q folgt r + s 2 = 0 und √ b) {1, 2, 3, 6} ist eine Basis. t + u 2 = 0, also r = s = t = u = 0. II.3 2. Aus m = a2 + b2 = αα, n = c2 + d2 = ββ folgt mn = ααββ = αβαβ = u2 + v 2 . 5 = 12 + 22 , 13 = 22 + 33 , 65 = 12 + 82 = 42 + 72 . II.3 3. 19 = 11 + 11 + 12 + 42 , 23 = 12 + 22 + 32 + 32 , 31 = 12 + 12 + 22 + 52 , 19 · 23 = 12 + 62 + 122 + 162 , 19 · 23 · 31 = 212 + 212 + 282 + 1092 II.3 4. Allgemein

α β

−β α

−1

=

α β −β α (−1)n + F

1 αα+ββ

2 n+1 = F II.3 5. (1) Fn2 + Fn+1 = Fn−1 Fn+1 + n Fn+2 + (−1) n+(n+1) 2 (2) wie (1) (3) Man benutze Fn = Fn (Fn+1 − Fn−1 ).

II.3 6. xn = Fn−1 , yn = Fn

2 √ II.3 7. x2 − 7y 2 = 1 hat die kleinste L¨ osung (8, 3); es ist 7 ≈ 83 ; mit 83 218 = √ √ 127 336 2 2 ist 7 ≈ 127 osung (10, 3); es ist 11 ≈ 48 . x − 11y = 1 hat die kleinste L¨ 48 127 2 √ 10 33 199 660 10 199 = ist 11 ≈ 60 . 3 ; mit 3 10 60 199

II.3 8. Aus ak+1 =

1 6

+ 34 ak folgt f¨ ur a = lim(ak ) die Gleichung a =

1 6

+ 34 a, also a = 23 .

III.1 1. (x; uy + vz) = u(y ; x) + v(z; x) = u(y ; x) + v(z; x) = u(x; y ) + v(x; z) III.1 2. a) Ist (x, y ) = 0, dann ist (x + y ; x + y ) = (x; x) + (y ; y ). b) Ist y = rx, dann ist |(x, y )| = |(x, rx)| = |r||(x, x)| = |r||x|2 = |x||rx| = |x||y |. Ist |(x, y )| = |x||y | und y = y⊥ + y mit y⊥ ⊥ x und y x, dann ist |(x, y )| = |x, y | ≤ |x||y | ≤ |x||y | nach a), also |y | = |y | und daher y ∈ x . III.1 3. |x| = |(x − y ) + y | ≤ |x − y | + |y |. III.1 4. (1) Spur(B T A)=Spur(AT B), denn AT B = (B T A)T ; (2) Spur(AT A) = Summe der Betragsquadrate der Spaltenvektoren; (3) Spur((rB + sC)T A) = r Spur(B T A) + s Spur(C T A) III.1 5. a) xT Ax = x21 + 2x22 + 6x23 − 2x1 x2 + 2x1 x3 − 6x2 x3 = (x1 −x2 +2x3 )2 +(x2 −x3 )2 +x23 ≥ 0, = 0 nur f¨ ur x1 = x2 = x3 = 0. b) xT AT Ax = (Ax)T Ax ≥ 0; = 0 genau dann, wenn Ax = o, also wenn x = o.

Lineare Algebra

355

c) Man studiere Beispiel 1 und berechne xT Ax f¨ ur xi = r, xj = 1, xk = 0 f¨ ur k = i, j. III.1 6. Der Kern ist der Lotraum von U , vgl. Aufgabe 8. p − u| ≥ |( p − u)⊥ |, also | p − u| III.1 7. Man beachte |x|2 = |x⊥ |2 + |x |2 , dass also | minimal f¨ ur |( p − u) | = 0. Dabei ist u ∈ a + U , also etwa u = a. anze diese zu einer Basis von V . III.1 8. Man wähle eine Basis von U⊥ und erg¨ III.1 9. Die Anwendung des schmidtschen Orthonormierungsverfahrens f¨ uhrt in der Regel auf große rechnerische Schwierigkeiten. Daher sollte man das Erzeugendensystem durch elementare Umformungen vereinfachen. Eine Orthonormalbasis

ist z.B. √1 (1 0 0 1 1)T , √1 (−2 3 − 3 1 1)T , √1 (−2 5 7 3 − 1)T . 3 24 88 √ √ III.2 1. a) E(X) = 2,6; σ(X) = 1,34 ≈ 1,16; E(Y ) = 1,25; σ(Y ) = 0,9875 ≈ 0,994 b) 0,05 bzw. 0; vgl. mit 0,335 bzw. 0,11. III.2 2. (X⊥ ; Y⊥ ) =

1 1 20 · (−0,6) · 1,75 + 5 · (−1,6) · (−1,25) + . . .

= 0,151; (X, Y ) = 0,131.

III.3 1. Man bilde das Skalarprodukt von n und dn = ( p + ru) − (q + sv ). III.3 2. 4c < a21 + a22 + a23 III.3 3. Summe der Koordinatenquadrate 1; f¨ ur Winkel ϕ zwischen den Ortsvektoren von A und B gilt cos ϕ = 16 = 0,7619, also ϕ = 40,33o ; Bogenl¨ ange 40,33 21 180 π = 0,703. III.3 4. M hat von der Geraden den Abstand d =

15 5

−

4 3

1 ; 25

24 −7

= 10.

mit dem III.3 5. Die Gerade x2 = mx1 + c ist genau dann √ Tangente an den Kreis um O √ Radius r, wenn r2 (1 + m2 ) = c2 . Aus c = ±2 1 + m2 und 6m − 4 + c = ±3 1 + m2 eliminiere man c (vier M¨ oglichkeiten). III.3 6. M hat von der Ebene den Abstand d =√2. Der Mittelpunkt des Schnittkreises √ 4 1 49 − 4 = 45. ist M ( 37 9 , 9 , 9 ). Der Schnittkreisradius ist r =

III.3 7. Die Ebene hat die Gleichung 2x1 + 3x√ 2 + 3x3 = c, die Kreismittelpunkte haben von ihr√die Abst¨ ande d1√ , d2 mit d1 + d2 = 88 und d21 − d22 = r12 − r22 = 11, √ also 9 7 88 und d2 = 16 88, woraus c folgt. Der Schnittkreis hat den Radius 38 58. d1 = 16

III.3 8. Die (gesuchte) Ebene mit der Gleichung a1 x1 + a2 x2 + a3 x3 = c hat den Normaleneinheitsvektor n = (a1 a2 a3 )T mit a21 + a22 + a23 = 1. Haben die Ber¨ uhrpunkte i = ±rin, eine gemeinsame Tangentialebene die Ortsvektoren b1 , b2 , b3 , dann gilt bi − m hat also die Gleichung (x − m i ; ±rin) = ri2 , f¨ ur i = 1, 2, 3 muss das also die gleiche Ebene beschreiben. Es folgt (m i ; n) = ±(c − ri ) (i = 1, 2, 3), woraus sich bei jeder Wahl der Vorzeichen, falls die drei Kugeln geeignet liegen, n bis auf einen Faktor aus IR bestimmen lässt. Der Faktor ist dann durch |n| = 1 festgelegt. III.3 9. Die Polare zum Schnittpunkt von p und q geht durch die Punkte P und Q. 1 )2 − r12 , III.3 10. Die Gleichung der Schnittkreisebene ist (x − m 1 )2 − r12 = (x − m denn dieser Gleichung m¨ ussen die gemeinsamen Punkte der beiden Kugeln gen¨ ugen, also auch alle Punkte der Schnittkreisebene. F¨ ur einen solchen Punkt X und die zugeh¨ origen 2 2 Tangentenabschnitte t1 , t2 gilt also t21 = XM1 − r12 = XM2 − r22 = t22 . 2

2

1 )2 − (x − m 2 )2 = r12 − r22 III.3 11. Aus t21 = XM1 − r12 = XM2 − r22 = t22 folgt (x − m 2 2 2 2 2 bzw. (nach Streichung von x ) 2(m 1−m 2 )x = (m 1) − m 2 ) − (r1 − r2 ), und dies ist die Gleichung einer Geraden mit dem Normalenvektor m 1−m 2. III.3 12. a) M ist Durchstoßpunkt der Geraden durch P und M durch die Polarebene


356

p zum Pol P . Ferner ist r2 = r2 − d2 , wobei d der Abstand von M zu p ist. 2 b) d = M M , p = m + rd (m − m); man beachte dabei P M · P M = r2 (Kathetensatz). 2 2 c) Man bestimme d aus d = r − r2 und einen Normaleneinheitsvektor n der Ebene; 2 dann ist p = m ± rd n, wobei das Vorzeichen so zu w¨ ahlen ist, dass (n; m) < 0. d) Es gen¨ ugt, ein Schnittbild zu betrachten, also die gemeinsamen Tangenten an zwei Kreise. F¨ ur einen Normaleneinheitsvektor n einer gemeinsamen ¨ außeren/inneren Tan 2 ) + (r1 − r2 )n; n) = 0 bzw. ((m 1 −m 2 ) + (r1 + r2 )n; n) = 0. Daraus gente gilt ((m 1 −m ergibt sich n. Aus dem Abstand der Mittelpunkte von den Geraden ergibt sich die Geradengleichung, die Schnittpunkte P der Geraden sind die Bilder der Kegelspitzen im ¨ Schnittbild. Ubertragung der L¨ angen P M1 , P M2 in den Raum liefert die Spitzen. III.4 1. (a × b; a × c) = |a × b||a × c| cos α usw.

III.4 2. a) Wegen ((a × b) × c; c) = 0 ist (a × b) × c = ra + sb. = ra + sb = −tc + ud (vgl. a)), also ra + sb + tc = ud. b) (a × b) × (c × d) Bildet man in der letzten Gleichung das Skalarprodukt mit b × c, a × c bzw. a × b, dann ergeben sich r, s, t. 1 −3 2 1 0 0 = 70 III.4 3. Das Volumen ist 6 −5 6

5

4

2

III.4 4. Man benutze die Eigenschaften des Vektorprodukts und des Skalarprodukts. III.4 5. a) Im Spatprodukt ersten Vektor in Komponenten zerlegen. c) Die Determinante ist (b − a)(c − a)(c − b); b) a = 0 und a = 14 . sind a, b, c paarweise verschieden, dann hat das LGS nur die triviale L¨ osung. IV.1 1. Mit a1 =

a11

und a2 =

a12

a22 ist 2 2 2 2 2 |a1 | |a2 | (1 − cos α) = |a1 | |a2 | − (a1 , a2 )2 = (a211 + a221 )(a212 + a222 ) − (a11 a12 + a21 a22 )2 = a211 a222 + a221 a212 − 2a11 a12 a21 a22 = (a11 a22 − a21 a12 )2 IV.1 2. Aus AT A = E folgt (det A)2 = 1. a21

IV.1 3. Erste Zeile von u ¨brigen subtrahieren und Faktoren 1, 2, 3, . . . (n − 1) (aus Zeile 2 bis n) rausziehen ergibt detA = (n−1)!

1 1 .. . 1

2+1 3+1

22 + 2 + 1 32 + 3 + 1

... ...

2n−2 + 2n−3 + . . . + 2 + 1 3n−2 + 3n−3 + . . . + 3 + 1

n+1

n2 + n + 1

...

nn−2 + nn−3 + . . . + n + 1

. Subtraktion der ersten

Spalte von den folgenden, dann der zweiten Spalte von den folgenden usw. ergibt detA = (n − 1)!

22 32

2n−2 3n−2

. Wiederholung dieser Schritte, beginnend mit 1 3 32 . . . 3n−3 2 n−2 n n ... n 1 4 42 . . . 4n−3 Subtraktion der ersten Zeile, liefert detA = (n − 1)!(n − 2)! .. . 2 n−3 1 1 .. . 1

2 3

... ...

1

n

n

...

n

usw.

¨ IV.1 4. Ahnlich wie Aufgabe 3 vorgehen: Subtraktion der ersten Zeile von den u ¨brigen, (a2 −a1 )(a3 −a1 )(a4 −a1 )(a5 −a1 ) rausziehen, dann erste Zeile von u ¨brigen subtrahieren usw., (a3 − a2 )(a4 − a2 )(a5 − a2 ) rausziehen usw. IV.1. 5. Die Behauptung wird durch Satz 5 belegt, den det M und det A · det B haben beide die Eigenschaften (1) bis (3). IV.2 1. a) abcd + abc + abd + acd + bcd

b) abcd + ab + ad + cd + 1

Lineare Algebra

357 ⎛

IV.2 2. Man verwende das Verfahren in Beispiel 1:

1 6

⎝

17 −6 −3 −2

−6 6 0 0

−3 0 3 0

−1 0 0 2

⎞ ⎠.

IV.2 3. Man beachte die Geradengleichung x = ra + sb (r + s = 1) bzw. die Ebenengleichung x = ra + sb + tc (r + s + t = 1). IV.2 4. a) Induktionsschritt: In An+1 letzte Zeile von u ¨brigen subtrahieren, nach erster Spalte entwickeln, dann Faktoren (x1 −xn+1 ), (x2 −xn+1 ), . . . , (xn −xn+1 ) herausziehen, dann 1. Spalte von 2. bis n. Spalte subtrahieren, dann 2. Spalte von 3. bis n. Spalte subtrahieren usw. Es ergibt sich detAn+1 = (−1)n (x1 − xn+1 )(x2 − xn+1 ) · . . . · (xn − xn+1 )Dn = (xn+1 − x1 )(xn+1 − x2 ) · . . . · (xn+1 − xn )Dn . b) Ist p(x) = c0 +c1 x+c2 x2 +. . .+cn xn und sind x1 , x2 , . . . , xn+1 paarweise verschiedene Elemente aus K mit p(xi ) = yi , dann sind die Koeffizienten aus dem LGS p(xi ) = yi (i = 1, . . . , n + 1) zu bestimmen, denn nach a) ist seine Matrix invertierbar. IV.2 5. Entwicklung nach der letzten Zeile. IV.2 6. a) (1) −3 (2) −18 (3) 160 herausziehen, erste Spalte von zweiter bis b) 2. bis letzte Zeile zur ersten addieren, n(n+1) 2 letzter Spalte abziehen, nach n-ter Zeile entwickeln (Vozeichen (−1)n−1 ), erste Zeile von anderen subtrahieren, nach erster Spalte entwickeln: Dreiecksdeterminante mit Produkt der Diagonalelemente = (−n)n−2 . IV.2 7. Man kann mit Berechnungschema aus Beispiel im Text argumentieren.

V.1 1. x =

1 −2 3

0 1 2

3 5 0

x +

3 4 −1

V.1 2. Aus AT A = E und det AT = detA folgt (det A)2 = 1. V.1 3. a) (AAT )T = (AT )T AT = AAT

b) Aus AT A = E folgt AT = A−1 .

V.1 4. Das Einheitsquadrat wird von A = (a1 a2 ) auf ein Parallelogramm mit dem Inhalt |a1 ||a2 | sin(a1a2 ) abgebildet, und es ist (|a1 ||a2 | sin(a1a2 )) = (|a1 ||a2 |)2 (1 − cos2 (a1 , a2 )) = a21a22 − (a1 ; a2 )2 = (detA)2 . V.1 5. Ist M die Matrix der Spiegelung an x2 = mx1 und (a1 − b1 ) + m(a2 − b2 ) = 0 (vgl. Text), dann gibt x = Mx + (E − M ) 0c die Spiegelung an der Geraden mit der Gleichung x2 = mx1 + c an, wobei 2c = (a2 + b2 ) − m(a1 + b1 ). V.1 6. Erste Spiegelachse so, dass A auf A abgebildet wird; zweite Spiegelachse durch A so, dass B auf B abgebildet wird, dritte Spiegelachse Gerade durch A und B . V.1 7. Man interpretiere Fig. 9 im Text. V.1 8. a) b) Spiegelungen an rechtwinkligen Achsen = Drehungen um 180o sind vertauschbar (Punktspiegelungen). c) Verschiebungen (Vektoren!) sind stets vertauschbar. d) Eine Spiegelung ist mit einer Verschiebung vertauschbar, wenn die Verschiebung parallel zur Spiegelachse ist. e) Drehung und Verschiebung sind nicht vertauschbar. oglichkeiten, er liegt auf V.1 9. F¨ ur den Bildpunkt C von C gibt es zwei M¨ dem Kreis 10·37 10·68 um A mit der Radius 13 und auf dem Kreis um B mit den Radius 13 .

V.1 10. Eine Bewegeung ist genau dann uneigentlich, wenn sie aus einer ungeraden Anzahl von Spiegelungen besteht, wenn ihre Determinante also den Wert −1 hat. V.1 11. a) Spiegelung, Drehung um 180o b) zwei verschiedene reelle Eigenwerte (siehe Text)

c) Kongruenzabbildung


358 −→

V.1 12. Ist v der Verschiebungsvektor, dann ist ZZ ∗ = −kv . V.1 13. Man erh¨ alt drei Gleichungen aus folgenden Bedingungen: Der Mittelpunkt der −→

Strecke XX liegt auf der Ebene, der Vektor XX istorthogonalzu zwei Spannvektoren −1 0 0

der Ebene. Es ergibt sich die Abbildungsmatrix − 13

V.1 14. α ◦ β ◦ γ : x → 3 V.1 15. F

− 23 , − 23 , 31

1 0 0

0 0 −1

0 −1 0

x +

7 17 17

2 1 2

2 2 1

.

usw.

.

ort der von V.2 1. A hat die Eigenwerte λ1 = λ2 = 1 und λ3 = −2; zu λ1 = λ2 geh¨ (−1 1 1)T erzeugte Eigenraum, zu λ3 der von (−4 1 13)T erzeugte Eigenraum. origen Eigenr¨ aume werden von B hat die Eigenwerte λ1 = λ2 = 0 und λ3 = 3; die zugeh¨ (−1 3 0)T bzw. (1 0 1) erzeugt. √ origen Eigenr¨ aume werden C hat die Eigenwerte λ1 = 5 und λ2/3 = 52 ± 32 5. Die zugeh¨ √ √ von (3 1 4) bzw. (21 4 8)T + 5(63 12 − 3)T bzw. (21 4 8)T − 5(63 12 − 3)T erzeugt. V.2 2. Eigenwerte sind die Diagonalelemente. osung; (cos α−x)2 −sin2 α = 0: x = cos α±sin α. V.2 3. (cos α−x)2 +sin2 α = 0: keine L¨ V.2 4. Behauptungen nachrechnen. V.2 5. Das charakteristische Polynom ist −(a4 x4 + a3 x3 + a2 x2 + a1 x + a0 ). V.2 6. a) Char. Pol. (−x)n−1 (n − x), Eigenwerte 0 ((n − 1)-fach) und n (einfach). b) Char. Pol. (−1)n−1 (1 + x)n−1 (n − x); Eigenwerte −1 und n.

V.2 7. T = V.3 1. V.3 2. V.3 3. V.3 4. um die x =

1 0 1

0 1 0

1 0 −1

;

T −1 AT

=

−1 0 0

0 3 0

0 0 2

√ √ 7 − 2 1 T hat die Eigenwerte 11 2 ± 2 17 mit den Eigenvektoren (3 ± 17 − 2) . −1 4 x + 14 −31 x = 14 33 −5 11 |2t + 1| < 13 : kein Ew; |2t + 1| = 13 genau ein Ew; |2t + 1| > 13 : zwei Ew’e. 1 0 2 1 bildet die x3 -Achse auf g ab. Ist δ die Drehung α : x → 0 1 0 x + 1 0 0 1 0 −1 x3 -Achsemit Winkel 30o , dann Abbildung dem ist die gesuchte α ◦ δ◦ α , also √ 1 1 3 − 1 0 2 1 0 −2 1 1 2 √2 0 1 1 0 1 0 0 1 0 x − 1 + 1 3 0 2 2 0 0 1 0 0 1 0 0 0 0 1

V.3 5. Nein; vgl. Fall 1(2) der affinen Abbildungen im Raum. V.3 6. Die Spalten von T seien die normierten Eigenvektoren. Dann ist T −1 AT eine Diagonalmatrix D, deren Diagonalelemente die Eigenwerte sind. Es gilt T −1 A−1 T = D−1 . −→

−→

VI.1 1. Es sei u =OU und v =OV . Die Gleichung (Cu)T (Cv ) = 0 bzw. u T (C T C)v = 0 d12 muss gelöst werden. Mit C T C = dd11 ergibt sich c12 u21 − (c11 − c22 )u1 u2 − c12 u22 = 0 12 d22 u1 2 c11 −c22 u1 bzw. i. Allg. ( u2 ) − c12 u2 − 1 = 0. Man erh¨ alt zwei L¨ osungen f¨ ur uu12 , deren Produkt −1 ist, also bis auf einen gemeinsamen Faktor die Ortsvektoren von U, V . VI.1 2. Man stelle sich die Ellipse als Bild des Kreises bei einer Parallelprojektion vor. VI.1 3. a) Mitte bleibt Mitte“ bei einer affinen Abbildung. ”

b) Eine Gerade durch O

Lineare Algebra

359

mit der Steigung m1 wird auf eine solche mit der Steigung m1 = ab m abgebildet, analog mit m2 . Aus m1 m2 = −1 (Orthogonalit¨ atsbedingung) folgt m1 m2 = −( ab )2 .

VI.1 4. a) Mit F1/2 = (±e, 0) folgt aus (x1 + e)2 + x22 + (x1 − e)2 + x22 = 2a und b2 = a2 − e2 (im Fall a > b) die affine Standardform der Ellipsengleichung.

b) Mit F1/2 = (±e, 0) folgt aus | (x1 + e)2 + x22 − (x1 − e)2 + x22 | = 2a und b2 = e2 − a2 (im Fall b> a) die affine Standardform der Hyperbelgleichung. c) Aus x1 + p2 = (x1 − p2 )2 + x22 folgt die affine Standardform der Parabelgleichung. VI.1 5. Stauchung an der x1 -Achse in Richtung der x2 -Achse mit den Faktor Kreistangente anwenden; Polarengleichung lautet ebenso.

b a

auf

VI.1 6. Man zeige z.B. bei der Ellipse: Der Winkel zwischen den Brennstrahlen“ in ” einem Ellipsenpunkt werden von der Normalen der Ellipse in diesem Punkt halbiert. VI.1 7. Ellipse: Der Kreis um (0, −c) mit dem Radius r = b + c geht durch den Scheitel (0, b) der Ellipse; er hat im oberen Teil die Gleichung x2 = −c + r 1 − ( xr1 )2 . Die

Ellipse hat im oberen Teil die Gleichung x2 = b 1 − ( xa1 )2 . Wegen (1 − u2 )2 ≈ 1 − u √ bzw. 1 − u ≈ 1− u2 f¨ ur sehr kleine Werte von u gilt f¨ ur sehr kleine Werte von x1 f¨ ur den x2

x2

Kreis x2 ≈ −c + r(1 + 2r12 ) = und f¨ ur die Ellipse x2 ≈ b(1 − 2a12 ). Diese Approximationen 2 1 also r = ab . Hyperbel, Parabel analog. stimmen u ¨berein, wenn b = r − c und 2ab 2 = 2r VI.2 1. Die Eigenwerte der Koeffizientenmatrix sind 2 ± a, also ist a = 2 oder a = −2. Damit ergibt sich 2(x1 ± x2 )2 − 7(x1 ± x2 ) + (b ∓ 7)x2 + 3 = 0. Es muss nun b = −7 oder

b = 7 sein; die Gleichung lautet dann 2 x1 ± x2 − 25 16 .

7 4

2

7 2 +3− 49 8 = 0 bzw. (x1 ±x2 − 4 ) =

Man erhält dann die Parallelenpaare x1 + x2 = ± 54 und x1 − x2 = √ √ x2 x2 VI.2 2. a21 + b22 − xc23 = (t ∓ r 1 − t2 )2 + (± 1 − t2 + rt)2 − r2 √ √ = t2 ∓ 2rt 1 − t2 + r2 − r2 t2 + 1 − t2 ± 2rt 1 − t2 + r2 t2 = 1 VI.2 3.

(p1 +ra2 b)2 a2

+2rbp1 − 2rap2 +

(p2 +rab2 )2 − (p3 b2 r2 a2 b2 − r2 a2 b2 −

−

7 4

+ 2r(bp1 − ap2 )) = p21 a2

p21 a2

p22 b2

p22 b2

± 54 .

− p3

− p3 = 0 √ VI.2 4. Ursprungsgeraden mit den Richtungsvektoren (au bv c u2 + v 2 )T (u, v ∈ IR). 2rbp1 + 2rap2 =

−

−

7 4

alt man die VI.2 5. Rotiert der Geradenpunkt (2r, 2, 3r) um die x1 -Achse, dann erh¨ √ √ Punkte (2r, 4 + 9r2 cos ϕ, 4 + 9r2 sin ϕ) mit 0 ≤ ϕ < 2π. Es gilt f¨ ur sie also x22 +x23 = 4 + 9r2 = 4 + 94 x21 bzw. −

x21 9 16

+

x22 4

+

x23 4

= 1.

VI.2. 6. Die affine Abbildung (x1 , x2 , x3 ) → ( xa1 , xb2 , xc3 ) bildet das Ellipsoid auf die Einheitskugel mit der Gleichung x21 + x22 + x23 = 1 ab, und die Tangentialebene im Kugelpunkt (p1 , p2 , p3 ) hat die Gleichung p1 x1 + p2 x2 + p3 x3 = 1. VI.2 7. a) Ellipsoid: zwei der Parameter a, b, c gleich; ell. Parabolid, Kegel, Zylinder: a = b; einschaliges Hyperboloid: a = b; zweischaliges Hyperboloid: b = c √

√

√

b) Die Eigenwerte sind c und 1±2 5 . Es muss entweder c = 1+2 5 oder c = 1−2 5 gelten. Die Rotationsachse bez¨ uglich der transformierten Gleichung ist die x1 -Achse oder die x2 -Achse. Bez¨ uglich der √ Ausgangsgleichung sind dies die Geraden in der x3 -Ebene mit den Gleichungen 2x1 − ( 5 ± 1)x2 = 0.


360

VI.2 8. Zweischaliges Hyperboloid, Doppelkegel, einschaliges Hyperboloid. VI.2 9. a) Charakteristisches Polynom x3 + 3x2 − 4; Eigenwerte −1, 2, 2; transformierte Gleichung −x21 + 2x22 + 2x23 = 1; einschaliges Hyperboloid. b) Charakteristisches Polynom −x3 + 3x2 − 2x; Eigenwerte 0, 1, 2; transformierte Gleichung x22 + 2x23 = 0; Gerade (x1 -Achse).

c) Charakteristisches Polynom −x3 + 9x2 − 24x + 16; Eigenwerte 1, 4, 4; transformierte Gleichung x21 + 4x22 + 4x23 = 0; Punkt.

d) Charakteristisches Polynom −x3 + 18x2 − 99x + 162; Eigenwerte 3, 6, 9; transformierte Gleichung 3x21 + 6x22 + 9x23 = 6; Ellipsoid.

2 − (2m2 + 1)x + (2m2 − 2)) VI.2 10. Das charakteristische Polynom (2m2 + 2 − x)(x 2 + 2, λ = 1 (2m2 + 1 + = 2m (2m2 − 1)2 + 8) und λ3 = hat die Nullstellen λ 1 2 2 1 2+1− 2 − 1)2 + 8). Der Typ der Fl¨ (2m (2m a che h¨ a ngt vom Vorzeichen von λ3 und 2 von c = 2m2 − 3m + 1 = (m − 1)(2m − 1) ab. F¨ ur |m| > 1 ist λ3 > 0 und c > 0, es liegt ein Ellipsoid vor; f¨ ur |m| = 1 ist λ3 = 0, es liegt ein elliptischer Zylinder (m = −1) oder nur ein Punkt (m = 1) vor. F¨ ur |m| < 1 ist λ3 < 0; es liegt ein einschaliges Hyperboloid (−1 < m < 12 ), ein Kegel (m = 12 ) oder ein zweischaliges Hyperboloid ( 12 < m < 1) vor.

VI.2 11. Der Schatten“ der Kurve in der x1 x2 -Ebene ist die Hyperbel mit der Glei” 2 235 2 chung 2(x1 − 15 alt man, wenn man u ¨ber 2 ) − 5(x2 + 3) + 4 = 0. Die Raumkurve erh¨ ugt. jedem Kurvenpunkt in der x1 x2 -Ebene den x3 -Wert x3 = 3x1 + 3x2 − 7 hinzuf¨

VI.2 12. Die Schnittkurven der Quadrik mit den Ebenen x3 = c haben die Gleichungen a11 x21 + a22 x22 + 2a12 x1 x2 + a1 x1 + a2 x2 + a = 0. VI.3 1. Gerade durch O mit Richtungsvektor (cos ϕ VI.3 2. S

√

√

1+ 3 1+ 3 2 , 2 ,1

± sin ϕ 1)T (0 ≤ ϕ < 2π).

VI.3 3. F¨ ur die durch (0 0 r )T + t(r 1 − r) dargestellten Geraden gilt x1 = tr, x2 = t, x3 = r − tr. Elimination von t, r liefert x1 x2 + x2 x3 − x1 = 0, und dies ist die Gleichung einer Sattelfl¨ ache. VI.3 4. Man bilde jeweils das Produkt der Gleichungen. VI.4 1. In der Gleichung (2x21 + 5x22 − 4x3 ) − μ(x21 + x22 + x23 − 2rx3 ) = 0 muss μ = 2 und μr =√2 sein. √ Es ergeben sich die Kreisschnittebenen mit der Gleichung 3x22 − 2x23 = 0, also 3x2 ± 2x3 = 0. √ √ VI.4 2. c b2 − a2 ± b b2 − a2 = 0 ur die Rechnung ist es VI.4 3. Wir betrachten den Schnitt mit der x2 x3 -Ebene. F¨ g¨ unstig, c = −6 zu w¨ ahlen. Die Gerade mit der Gleichung x2 − 2x3 + 6 = 0 schneidet die Geraden x2 ± x3 = 0 in den Punkten√(0, −2, 2) und √ (0, 6, 6). Die große Halbachse der Schnittellipse hat also die L¨ ange a = 22 + 42 = 2 5, ihr Mittelpunkt ist (0, 2, 4). Die Schnittpunkte der Ellipse mit dem Kreis √ in der Ebene √ x3 = 3 um (0, 0,√3) mit dem Radius 4 bilden eine Strecke der L¨ ange 2 42 − 22 = 4 3, es ist also b = 2 3. VII.1 1. Schnittpunkt [(0 0 1)T ] (uneigentlicher Punkt aus x2 -Achse), Verbindungsgerade (0 0 1)T (x1 = 0, x2 -Achse). VII.1 2. x = ra + sb mit r + s = 1 ist die Gleichung einer Geraden. VII.1 3. a) [(0 4 1)T ]

b) r(0 1 0 5)T + s(0 0 1 5)T

VII.1 4. a) Beides ist gleichwertig mit p1 q1 + p2 q2 =

r2 p

0 q0 .

c) [(0 − 11 1 5)T ] b) Beachte b21 + b22 = r2 b20

Lineare Algebra

361

c) Liegt P auf a1 x1 + a2 x2 = a0 x0 r2 und auf b1 x1 + b2 x2 = b0 x0 r2 , dann liegen A und B auf p1 x1 + p2 x2 = x0 p0 r2 . alt VII.1 5. Aus (u1 r1 − u2 r2 )a + (u1 s2 − u2 s2 )b + (v1 r1 − v2 r2 )c + (v1 s1 − v2 s2 )d = o erh¨

man zwei homogene LGS f¨ ur u1 , u2 bzw. v1 , v2 , welche nur dann nichtrivial l¨ osbar sind, ankung der Allgemeinheit) und r1 = r2 wenn sr11 = sr22 . Mit s1 = s2 = 1 (keine Beschr¨ folgt (u1 − u2 )a + (u1 − u2 )b + (v1 − v2 )c + (v1 − v2 )d = o, also u1 = u2 und v1 = v2 .

Weiter besser affin rechnen: Aus x1 = 1 + rt, x2 = 1 − r + t + rt, x3 = r + t + 2rt folgt 2r = −x1 − x2 + x3 + 2 und 2t = −x1 + x2 + x3 + 2 und rt = x1 − 1, also (−x1 − x2 + x3 + 2)(−x1 + x2 + x3 + 2) = 4(x1 − 1).

VII.2 1. Die Matzrix bildet Z auf Z, die Gerade a punktweise auf sich und die Gerade h auf die uneigentliche Gerade ab. VII.2 2. sa + tb ergibt den Punkt A f¨ ur s = 1, t = 0, den Punkt B f¨ ur s = 0, t = 1, den

Punkt C f¨ ur s = 3, t = 2. F¨ ur die Werte s, t von D muss 2s = −3t gelten, man erh¨ alt ihn also f¨ ur s = 3, t = −2 zu D = [(1 − 4 4)T ]. VII.2 3. Definition des DV durchrechnen.

VII.2 4. In den Bezeichnungen von Satz 1 ist (r1 , r2 , r2 ) = (3, −1, 2) und (s1 , s2 , s3 ) = (2, −3, 1), mit λ4 = 6 (frei w¨ ahlbar) also (λ1 , λ2 , λ3 ) = (4, 18, 3). Damit ist

A=

0 12 8

−18 0 36

3 3 3

1 2 1

2 3 7

1 −1 0

−1

=

1 16

51 117 53

3 69 5

−3 9 5

.

VII.2 5. A = (ai,j )3,3 mit a11 = a22 = a33 = 1, a13 = −1, aij = 0 sonst. b) (A−1 )T bildet (1 0 0 0)T auf (11 3 − 1 0)T ab. VII.2 6. a) x0 + x1 − x2 = 0 T d) Geraden durch zwei Punkte mit x1 = x2 c) r[(19 29 8 59) ] + s[(−5 5 20 11)T ] VII.2 7. Aus z = λ1a + μ1a = λ2b + μ2b = λ3c + μ3c und (λ1a − λ2b) + (λ2b − λ3c) + (λ3c − λ1a) = o (trivial) folgt (μ2b − μ1a ) + (μ3c − μ2b ) + (μ1a − μ3c ) = o. VII.3 1. Man bestimme die Matrix C, die [(1 −3 0)T ], [(1 3 0)T ], [(1 0 2)T ], [(1 0 −2)T ] der Reihe nach abbildet auf [(1 − 1 − 1)T ], [(1 1 1)T ], [(0 1 0)T ], [(0 0 1)T ]. Man erhält (bis auf einen Faktor) C =

0 6 6

2 0 0

0 3 −3

; Hyperbel ←→ Ellipse.

VII.3 2. Aus x1 = sr, x2 = tr, x3 = t und s + t = 1 eliminiere man die Parameter; man erhält x1 x3 + x2 x3 − x2 = 0. VII.3 3. Die Gerade (a−1

a−1

T −1) wird auf die Gerade (a+1

abgebildet. Dies leistet z.B. (C −1 )T =

2 −1 0

2 −3 0

−8 8 −4

−(a+1)

1)T

, woraus sich C ergibt.

VIII.1 1. Das Planungspolygon hat außer (0,0) die Ecken (0,120), (60,100), (90,70), (110,0). Der Wert von Z1 = 90x1 + 30x2 ist in (90,70) maximal (10 200.–), der Wert von Z2 = 60x1 + 60x2 ist in (60,100), (90,70) und allen Werten dazwischen (x1 + x2 = 160) maximal (9 600.–), der Wert von Z3 = 40x1 + 80x2 ist in (60,100) maximal (10 400.–). VIII.1 2. Die Punkte von AB sind Maximalpunkte f¨ ur Z = 2x1 + ux2 + x3 (u > 0); die Punkte von ABC sind Maximalpunkte f¨ ur Z = 2x1 + x2 + x3 . ur Punkte A, B ∈ M1 und A, B ∈ M2 VIII.1 3. Die Mengen M1 , M2 seien konvex. F¨ (also A, B ∈ M1 ∩ M2 ) gilt AB ⊆ M1 und AB ⊆ M2 , also AB ⊆ M1 ∩ M2 . VIII.1 4. x1 =

13 3 , x2

= 13 , x3 = 0,

Zmax =

82 3 .


362

VIII.1 5. o kann kein Konvexkombination von anderen Punkten a, b ∈ M sein, denn f¨ ur r ≥ 0 und a ≥ o gilt ra ≥ o und ra = o genau dann, wenn r = 0 oder a = 0. VIII.1 6. a) Spalten 1,2,3: x1 = − 13 : keine E.; Spalten 1,2,4: x2 = − 13 : keine E.; Spalten 1,2,5: x2 = −2: keine E.; Spalten 1,3,4: Ecke (1,0,1,4,0); Spalten 1,3,5: x1 = −1: keine E.e; Spalten 1,4,5: x5 = −1: keine E.e; Spalten 2,3,4: Ecke (0,1,4,1,0); Spalten 2,3,5: x5 = −1: keine E.; Spalten 2,4,5: x2 = −1: keine E.e; Spalten 3,4,5: Ecke (0,0,2,2,1). b) Ecke (1,0,1,4,0): uT x = 3; Ecke (0,1,4,1,0): uT x = −9; Ecke (0,0,2,2,1): uT x = 1; Minimalpunkt (0, 1, 4, 1, 0). VIII.2 1. Ecken E1 (1, 0, 1, 4, 0), E2 (0, 1, 4, 1, 0), E3 (2, 0, 0, 6, 1), E4 (0, 2, 6, 0, 1), E5 (0, 0, 2, 2, 1). Z1 , Z3 , Z4 nehmen Minimum in der Ecke E3 an, Z2 in der Ecke E5 . VIII.2 2. Entartete Ecke (3, 3, 0, 0, 0, 0). Formkoeffizienten f4 , f6 negativ; x4 - Spalte mit x3 -Spalte vertauschen und Schema neu berechnen: x1 1 0 0

x2 0 1 0

x3 0 0 1

x4 −2 −1 1 −1

x5 1 1 0 1

x6 2 −2 −1 −1

x1 1 0 0

3 3 0 −3

x2 0 1 0

x4 0 0 1

x3 2 1 1 1

x5 1 1 0 1

x6 0 −3 −1 −2

3 3 0 −3

Jetzt Formkoeffizient f6 negativ und keine Zahl in x6 -Spalte positiv, es gibt also keine osung, wenn a, b, c > 0, Lösung. F¨ ur Z = ax4 + bx5 + cx6 existiert z.B. dann genau eine L¨ und es existieren z.B. dann unendlich viele L¨ osungen, wenn a, c > 0 und b = 0. VIII.2 3. Zun¨ achst in Standardform verwandeln; dann Beispiele im Text beachten. VIII.2 4. Gesucht ist das Minimum von Z = m i=1

xij cij = bj (j = 1, 2, . . . , n) sowie

n j=1

m n

i=1 j=1

xij cij mit xij ≥ 0 f¨ ur alle i, j und

xij cij ≤ ai (i = 1, 2, . . . , m).

Analysis

IX.2 1. 6 ((2n + 1)2 ) = 24 (n2 ) + 24 (n) + 6 (1) = 4(n(n + 1)(2n + 1)) + 12(n(n + 1)) + 6(n + 1) = 2(n + 1)(2n(2n + 1) + 6n + 3) = (2n + 2)((2n + 1)(2n + 3)) IX.2 2. a) an = a + dn

b) an = aq n

IX.2 3. a) an+1 bn+1 − an bn = (an+1 − an )bn+1 + an (bn+1 − bn ) n (bn+1 −bn ) n bn+1 n+1 − abnn = an+1bbnnb−a = (an+1 −an )bbnnb−a b) abn+1 n+1 n+1 IX.2 4. a) an = cn2 + dn + e mit c, d, e ∈ IR b) Δ2 (an bn ) = Δ(Δ(an )(bn+1 ) + (an )Δ(bn )) = Δ2 (an )(bn+2 ) + Δ(an )Δ(bn+1 ) + Δ(an )Δ(bn ) + (an )Δ2 (bn ) 2 = n3 folgt mit D0 = 0 : IX.2 5. Aus (Dn − Dn−1 )(Dn + Dn−1 ) = Dn2 − Dn−1 2 ) = (n3 ). (Dn2 ) = Δ(Dn−1

IX.3 1. a) 2n + 1 < 2n ⇒ 2n + 3 = 2n + 1 + 2 < 2n + 2 < 2n + 2n = 2n+1 b) n3 < 3n ⇒ (n + 1)3 = n3 + 3n2 + 3n + 1 < 3n + 3n + 3n = 3n+1 c) 23(n+1) − 1 = 8 · 23n − 1 = 7 · 23n + (23n − 1) d) 10n+1 + 3 · 4n+3 + 5 = 9 · 10n + 9 · 4n+2 + (10n + 3 · 4n+2 + 5) √ √ √ √ IX.3 2. an > 2 ⇒ an + 5 > 7 > 2; an < an+1 ⇒ an + 5 < an+1 + 5 IX.3 3. a) an = 2n2 − 2n + 1

b) an = 3n−1 − 4

Analysis

363

IX.3 4. Der (n + 1)-te Schnitt zerlegt einen Teil in zwei Teile, wenn er zwei Begrenzungslinien dieses Teils schneidet; er kann aber h¨ ochstens n+2 solcher Linien schneiden, die Anzahl der Teile w¨ achst also h¨ ochstens um n + 1. 1 (2n+1)(2n+3)

IX.3 5. a)

n+1 2n+3

=

n 2n+1

−

b) (n + 1)

n+1 1 2

n+2 2n

=

−

n+3 2n+1

2 (n+1)(4(n+1)2 −1) − n(4n3 −1) 3 n+2 1−q n+1 q n+1 = 1−q 1−q − 1−q

c) (2n + 1)2 = IX.3 6. a)

q−(1+(n+1)(1−q))q n+2 (1−q)2

b) (n + 1)q n+1 =

−

q−(1+n(1−q))q n+1 (1−q)2

IX.3 7. a) ggT(Fn , Fn+1 ) = ggT(Fn , Fn + Fn−1 ) =ggT(Fn , Fn−1 ) = ggT(Fn−1 , Fn ) 2 ) = (F b) (Fn+1 n+1 (Fn+2 − Fn )) = (Fn+1 Fn+2 − Fn Fn+1 )

IX.3 8. Man beachte

an−1 +an+1 2

IX.4 1. Aus

√ 2 1± 5 2

√

=

√ 1± 5 2

=

+ 1.

an−1 an+1 folgt durch Quadrieren (an−1 − an+1 )2 = 0.

IX.4 2. Der Reihe nach f (x) = 10x ,

lg x,

1/x,

1/ log x,

1/x,

101/x

IX.4 3. a) s = 3; n > (6 + lg 3)/ lg 1,5 − 1 ≈ 35,8, also n0 ≥ 36. b) s = 240; n > (6 + lg 240)/(− lg 0,95) ≈ 377,2, also n0 ≥ 378. IX.5 1. (100 + 3)4 = 112 550 881;

(1000 − 2)3 = 994 011 992

IX.5 2. Die Anzahl der geradanzahligen bzw. ungeradanzahligen Teilmengen einer nn

Menge ist die Summe aller

mit geradem bzw. ungeradem i. Aus

i

(n > 0) folgt die Behauptung. IX.5 3.

m! i!(m−i)!

m! (i+1)!(m−i−1)!

+

m! i!(m−i−1)!

=

·

n

i=0

(−1)i

n i

m+1 (i+1)(m−i) .

= 0

IX.5 4. Zwei Polynome in der nat¨ urlichen Variablen n liefern genau dann f¨ ur jedes n denselben Wert, wenn ihre Koeffizienten gleich sind: Setzt man n = 0 in der Gleichung a0 + a1 n + a2 n2 + . . . + ak nk = b0 + b1 n + b2 n2 + . . . + ak nk , dann folgt a0 = b0 . Streicht urzt n, dann liefert dasselbe Argument a1 = b1 usw. man a0 , b0 und k¨ IX.5 5. Δ(

n+2 3

)=

n+3

IX.5 6. Man beachte IX.5 7.

(Dn ) =

(k)

IX.5 8. Pn

=

k 2

3 n

−

n+2

n+k

3

=

k i=0 n(n+1)(n+2) ; 6

=

n+2 2

n+k+1 k+1

.

− 1 (n2 + n) −

(Qn ) =

k 2

n(n+1)(2n+1) 6

−1 n−

k 2

;

(Fn ) =

n(n+1)2 4

− 2 n = (k − 2)Dn − (k − 3)n

IX.6 1. Aus |an | ≤ K, |bn | ≤ L folgt |an + bn | ≤ |an | + |bn | ≤ K + L und |an bn | = |an ||bn | ≤ KL. IX.6 2. Aus a2n−2 < a2n folgt a2n+2 = 1 + IX.6 3. F¨ ur n ∈ IN gilt mit s := lim

IX.6 4. IX.6 5.

√

(an )

1 1 >1+ = a2n . 1 1 + a12n 1 + a2n−2

n n−1 n n−1 ai − s − ai ≤ s − ai + s − ai . |an | = s − i=0

n2 + 2n − n =

n(n+1) 2

≈

√

1 2 2 (n ),

2n n2 +2n+n

i=0 2 2 1+ n +1

=

n(n+1)(2n+1) 6

≈

1 3 3 (n ),

i=0

n(n+1) 2 2

i=0

≈ 14 (n4 ).


364 IX.6 6. 4(an bn ) = (an + bn )2 − (an − bn )2 IX.6 7. F¨ ur 0 < an , bn < ε gilt

a2n + b2n an ε + bn ε < a n + bn a n + bn

= ε.

n 1 IX.6 8. Ist |an − a| < ε f¨ ur n > Nε , dann gilt f¨ ur diese n: n ai − a ≤ i=0 N ε 1

n. i=1 i=1 i=m+1 i=m+1 i=1 i=1

IX.9 3.

2n i=1

(−1)i−1 ai =

n i=1

(−1)i−1 i

+

n i=1

1 2i−1

>

n i=1

1 2i−1

>

1 2

n i=2

1 i;

(an ) nicht monoton.

Analysis

365

IX.9 4. F¨ ur n > 1 gilt:

√ √ √ √ n 4i+1− 4i n i+1− i 1 √ √ √ = = √ √ √ 4 4 4 4 n + 1 i=1 4 i 4 i + 1 i) i=1 i i + 1( i + 1 + n n 1 1 √ > √ √ √ √ = √ √ √ √ √ 4 4 4 4 i)( i + 1 + i) i=1 4 i 4 i + 1 · 2 4 i + 1 · 2 i + 1 i=1 i i + 1( i + 1 + n n n 1 1 1 1 1 1 √ √ √ > −1 und > = 4 4 4 4 i=1 (i + 1) i 4 i=1 (i + 1) i + 1 4 i=1 i i √ √ r r n 2 i+1− 2 i 1 √ 2√ = ... 1 > 1 − 2√ = r r 2r n + 1 i=1 i i+1 n 1 = √ √ 2√ √ √ √ √ √ r r−1 r r r−1 2r i=1 i i + 1( 2 i + 1 + 2 i)( 2 i+1+ 2 i) . . . ( i + 1 + i) n n 1 1 1 1 √ > r √ −1 > 2r 2r r 2 i=1 (i + 1) i 2 i=1 i i

1>1− √ 4

Ist 1 < α ≤ 1, 5, dann gibt es ein r ∈ IN mit 1 < α < 1 + IX.9 5. F¨ ur n > a ist

n i=1

a i2 +ai

=

n

a i(i+a)

i=1

=

n 1

−

i

i=1

1 i+a

1 2r ,

=

n √ n n √ 1 √ √ 1 √ , ( i + 1 − i) = − IX.9 6. Es ist i i=1 i=1 i+1+ i i=1 n √ √ √ 2 ( i + 1 − i) = 2( n + 1 − 1).

1 nα

also a i=1

√

1 i

≤

−

2 √ i+1+ i

1 √ . r n2 n

a

i=1

1 n+i .

konvergent und

i=1

IX.10 1. Die Folge (xn ) mit xn = (1 + n1 )n+1 ist monoton fallend: IX.10 2.

xn−1 xn = e2 , e3 ,

1+

e−1 ,

1 n2 −1

n

n n+1

1.

IX.10 3. F¨ ur r ∈ ZZ, s ∈ IN gilt 1 +

IX.10 4. 1 +

1 n

+

Benutze dann 3n <

IX.11 1. exp

n i=2

1 n2

√

n

: 1+

1 n

n

r n sn

=

i2 −1

=

=

n+1

1 3 + 9n2 < 3n + . n n 1

log 1 +

n n2 −1

> 1+

i=2

s

1+

1+

n n+1

1+

=

r sn n→∞ −→ sn

1 n(n+1)

1 i2 −1

=

IX.11 2. Die Faktoren haben die Form 1 + an , wobei IX.11 3.

n

i=1

i4 +i2 i4 −1

=

n

i=2

i2 i2 −1

=2·

n n+1 ,

n3 +n2 −n n3 +n2 −n−1

n(n+1)

n i=2

√ s

> 1. er .

n→∞

−→ 1.

i2 (i−1)(i+1)

=

2n n+1

→ 2.

(an ) konvergiert.

der Grenzwert ist 2.

IX.12 1. 8! = 40 320.

IX.12 2. Nr. 20 ist 5/3. Die Zahl 4/5 hat die Nummer 25. IX.12 3. Man nummeriere der Reihe nach die (endlichen) Mengen mit dem gr¨ oßten Element 1 bzw. 2 bzw. 3 usw. IX.12 4. Schon die Teilmenge der Dezimalbr¨ uche, die nur zwei verschiedene Ziffern enthalten, ist u ahlbar (vgl. Satz 3). ¨berabz¨ IX.12 5. Das j-te Element in der Menge Mi ist eindeutig (bijektiv) durch das Paar (i, j) gekennzeichnet, und die Menge IN2 ist abzählbar. X.1 1. a) F¨ ur |x − x0 |
0 > −9 = f (1).

√ X.1 3. (1) 12 , 13 , 14 , . . . (2) { n | n ∈ IN} √ X.1 4. | x − 1 − 2| < 10−6 gilt f¨ ur |x − 5| < 4 · 10−6 . X.1 5. Genau an den Stellen 0 und 1 ist die Funktion stetig. X.1 6. Senkrechte Asymptoten bei ±1, asymptotisches Verhalten wie g : x → x2 + 2. 1−x2 (1+x2 )2

X.2 1. a)

b) − 15

5

6

1 1+x

c) (7x6 +2x8 )ex

2

2 +1

d) 2x(ln(x2 +1)+1)(x2 +1)x

X.2 2. a) An der Stelle 0 ist die linksseitige Ableitung gleich der rechtsseitigen Ableitung ur x < 0 und f (x) = 2x f¨ ur x ≥ 0. An der Stelle 0 ist f (= 0); es gilt f (x) = 3x2 f¨ nicht differenzierbar: die linksseitige Ableitung von f ist 0, die rechtsseitige 2. ur x < 1, f (x) = (x − 1)n+1 f¨ ur x > 1. b) f (1) = 0, f (x) = (x − 1)n+2 f¨ X.2 3. f (x) = ae−x + bex + ce2x mit a, b, c ∈ IR. X.2 4. f (2) = 6, f (2) = −2, f (4) = −1, f (4) = −5; f (x) = − 34 x2 + x + 7

X.2 5. Mit f (x) = a1 x + a3 x2 + a5 x5 liefern die Bedingungen f (1) = 1, f (1) = 0, f (1) = 0 ( Punktsymmetrie zu O!) das LGS mit den Gleichungen a1 + a2 + a3 = 1, 5 3 a1 + 3a3 + 5a5 = 0, 3a3 + 10a5 = 0 mit der L¨ osung (a1 , a3 , a5 ) = 15 8 , −4, 8 .

X.2 6.

n

i=1

fi

:

n

i=1

fi =

n f i i=1 fi

z.B. mit vollst¨ andiger Induktion beweisen. n n

X.2 7. Induktionsschritt: (f · g)(n+1) = = f (0) g (n+1)

n+1

n j−1

+

ni=0

i

(f (i+1) g (n−i) + f (i) g (n−i+1) )

f (j) g (n+1−j) =

j

n+1

n+1 (j) (n+1−j) g j f

j=1 j=0 √ X.2 8. a) (f 2 (x)) = 2x liefert f 2 (x) = 2x2 + c, also f (x) = ± x2 + c mit c ∈ IR.

b) c)

1 f (x) f f

1 f (x)

= x2 liefert 1 f

=

=

x3 3

+ c, also f (x) =

= x3 liefert f (x) =

X.2 9. a) Vgl. IX.10 Aufgabe 1. c) Folgenterm > 1 und < 1 + X.2 10. b) Hyperbel

x2

−

y2

1 n

+

20 x5 +cx+d

= 1; daher

mit c, d ∈ IR.

mit c, d ∈ IR. 1 n2

n

n

1 1 1 n2 + . . . > 1 + n 1 1 d) Man betrachte n+1 < h ≤ n . 1 der Name! c) (tanh) = cosh 2

b) 1 + 1 . n2

3 x3 +d

=1+

X.3 1. Es gilt f (x) = xf (ξ) > 0 mit 0 < ξ < x f¨ ur a) f (x) = ex − (1 + x) und f (x) = 1 − (1 − x)ex b) f (x) = ln(1 + x) − X.3 2. a) b)

1+

1 x

x−1 x ln x x

x 1+x

und f (x) = x − ln(1 + x)

x = − x−1−ln und x − 1 > ln x f¨ ur x > 1 (vgl. Aufg. 1 b)). (x ln x)2

= 1+

1 x

x

ln 1 +

1 x

−

1 1+x

> 0 (Aufg. 1 b)).

c) 1 bzw. e

Analysis

367

X.3 3. f ist an der Stelle 0 genau dreimal differenzierbar; f (x) = −6 sgnx. X.3 4. f 2 − g 2 ist konstant; Einsetzen der Stelle f ( 1t ) 1 + t→0 g( t )

X.3 5. lim

f ( 1t )(−

1 ) t2 ( 1 )(− 1 ) g + 2 t→0 t t

= lim

f ( 1t ) 1 + t→0 g ( t )

a+b 2

liefert f 2 − g 2 = 1.

= lim

X.3 6. a) ln 3 − ln 2 b) -2 c) 0 f¨ ur r < 2, −1 f¨ ur r = 2, existiert nicht f¨ ur r > 2 d) e−1 X.3 7. a) 0

b) 0

c) 1

X.3 8. Der erste Grenzwert ist 1; der Z¨ ahler l¨ asst sich umformen zu ln(x4 + x2 + 1). Der zweite Grenzwert ist 3; man betrachte die Variable t = x1 . X.4 1. F¨ ur n ≥ 1 ist 1 + 13 ≤ xn ≤ 1 + 12 (Induktion); also ist |xm −xn | 9 ≤ 16 |xm − xn |. |xm+1 − xn+1 | = (1+x m )(1+xn ) X.4 2. a) 0,6823. . . X.4 3. a) xn+1 = b) xn+1 =

b) 0,8767. . .

1+xn 1+lg xn ;

x2n −(xn −1)exn 2xn −exn

x0 = 3;

x = 2,506 . . .

x0 = −0,5;

;

1+xn c) xn+1 = 3+ln x0 = 0,7; xn ; x2n −10 X.4 4. xn+1 = 2xn −7 → 2 bzw.

x1 = −0,722; x2 = −0,704

x1 = 0,643; x2 = 0,642 → 5 f¨ ur x0 = 1 bzw. x0 = 7.

X.4 5. 0; 1; 0,25; 0,183; . . .

b) 13 (x + 1)3

X.5 1. a) ln(x − 1) e)

1 8

ln x −

1 64

· x8

X.5 2. a) X.5 3. a)

2(e2

−2

1 ln 23

·

2x 3x+1

b)

− e)

2(ln 2)3

b)

ee

√

d)

f) (x4 − 4x3 + 12x2 − 24x + 24) · ex

h) −x2 cos x + 2x sin x + 2 cos x 2e2

c)

g)

2x+1 ln 3

x2 ln 2

−

−

1 (ln 3)2

2x (ln 2)2

+

√

·3

2 (ln 2)3

2x+1

· 2x

i) ln(cos x) − 6(ln 2)2 + 12 ln 2 − 6

−e

c) 12 (ln 2)2

X.5 4. a) In = 2n e2 − nIn−1 und I0 = e2 − 1

c) 2 ln 2 − 1

b) In = e − nIn−1 und I0 = e − 1

c) In = 14 e4 − n4 In−1 und I0 = 14 (e4 − 1) X.5 5. Mit u = 1 − x in a) bzw. u = 1·3·5·7·9 63 X.6 1. 2 ln 2·4·6·8·10 = 2 ln 256 ≈ −2,8

1 in b) geht das erste in das zweite Integral u ¨ber. x

X.6 2. Man betrachte die F¨ alle x < 0, x = 0 und x> 0. ∞ i 1 X.6 3. Unstetigkeitsstellen: 10zn (z ∈ IN); Integral: 1 + 12 + . . . + 19 10 . i=1

X.6 4. a) Ist x0 irrational, dann gibt es zu jedem n ∈ IN zwei aufeinanderfolgende Br¨ uche mit dem Nenner n, so dass x0 dazwischen liegt. F¨ ur jedes x zwischen diesen Br¨ uchen gilt |f (x) − f (x0 )| = |f (x)| < n1 . Ist x0 rational, dann liegt in jeder Umgebung b) Nummeriere die rationalen Stellen und schließe die von x0 eine irrationale Zahl. ∞ ε n-te Stelle in ein Intervall der L¨ ange 2εn ein. Damit ist ≤ n 2 = ε. n=1

X.6 5. Zerlege das Integral durch 0 < rn < 1 so, dass die Folge (rnn ) gegen 0 konvergiert, etwa rn = 1 − √1n . Ferner sei K eine Schranke von f (x) in [0; 1] und αn das Infimum

rn n nrn n −→ 0. und βn das Supremum von f (x) in [0; rn ]. Damit gilt n x f (x) dx ≤ K n−1 0 1 n nβn nαn n+1 n+1

Nun beachte man: n

rn

x f (x) dx liegt zwischen

n+1 (1

− rn

) und

n+1 (1

− rn

).


368

X.6 6. Halbkreislinie: S 0 X.6 7. a) A = 16/3

2r π

Halbkreisfl¨ ache: S 0

;

b) xS = 105/64, yS = 169/80

4r 3π

c) Vx = (338/15)π; Vy = (27/2)π b a

X.6 8. Bei einer axialen Streckung an einem Durchmesser mit dem Faktor 2 Kreis mit dem Inhalt ¨ber. πa in eine Ellipse mit dem Inhalt πab u Der Umfang ist 4

a

a2 (a2 −x2 )+b2 x2 a2 (a2 −x2 ) x

0

geht der

dx. Dies ist ein uneigentliches Integral, vgl. X.8.

X.6 9. a) F¨ ur F (x) = f (t) dt gibt es ein ξ ∈]a; b[ mit F (b) − F (a) = F (ξ)(b − a). a (2) ξ = ln23 − 2 (3) ξ = 0 b) (1) ξ = ± √13

X.6 10. Es sei m das Minimum und M das Maximum von f auf [a; b]. Aus mg(x) ≤ b

b

a

a

f (x)g(x) ≤ M g(x) f¨ ur alle x ∈ [a; b] folgt m g(x) dx ≤ Ist

b a

g(x) dx = 0, dann ist auch

ξ ∈ [a; b]. F¨ ur

b a

b a

f (x)g(x) dx ≤ M

b a

g(x) dx.

f (x)g(x) dx = 0, die Behauptung gilt also f¨ ur jedes b

b

a

a

g(x) dx > 0 betrachte man μ = ( f (x)g(x) dx) : ( g(x) dx). Wegen

m ≤ μ ≤ M existiert nach dem Zwischenwertsatz ein ξ ∈ [a; b] mit f (ξ) = μ. Nun sei g stetig. Im Falle m < μ < M existiert nach dem Zwischenwertsatz ein ξ ∈]a; b[ mit b

f (ξ) = μ. Ist m = μ, dann folgt aus (f (x) − μ)g(x) dx = 0 und (f (x) − μ)g(x) ≥ 0 a

aufgrund der Stetigkeit (f (x) − μ)g(x) = 0 auf [a; b]. Aufgrund der Stetigkeit von g gibt es ein x0 ∈]a; b[ mit g(x0 ) > 0, also gilt f (x0 ) = μ. Mit ξ = x0 ist demnach μ = f (ξ). (F¨ ur μ = M wird entsprechend argumentiert). Im Beispiel ergibt sich ξ = X.6 11. Man kann f (a) < f (b) und damit

x a

g(t) dt gilt

b a

b

b a

1 ln 2

−1

≥ 0 auf ]a; b[ annehmen. Mit G(x) =

g(x)g(x) dx = f (b)G(b) − G(x)f (x) dx. Nach dem Satz in Aufgabe 10

existiert ein ξ ∈]a; b[ mit ergibt sich

f (x)

b a

a

b

G(x)f (x) dx = G(ξ) f (x) dx = G(ξ)(f (b) − f (a)). Damit a

f (x)g(x) = f (a)G(ξ) + f (b)(G(b) − G(ξ)).

X.7 1. 4/3 bzw. 1,48 ¯ ¯ X.7 2. π ≈ 47 15 = 3,13; (π − 3,13) : π ≈ 0,00263 (weniger als 0,3%!) √ X.8 1. Das Integral u agt 2 1 − ε. ¨ber [ε; 1] mit ε > 0 betr¨ X.8 2. Man benutze die Substitution x = sin t. Das Integral hat den Wert π. X.8 3. a) −1 < α < β − 1

b) α > 0

X.8 4. Vergleich mit dem Integral X.8 5. Die Reihe l¨ asst sich durch X.8 6. Schätze

n i=1

1 i

durch

n dx 1

x

∞

e ∞ 1

c) α < 1 < β

dx x(ln x)α

t−x dt =

=

∞ 1

1 x−1

t−α dt liefert Konvergenz f¨ ur α > 1. absch¨ atzen; Grenzwert 1.

= ln n ab; beachte ln(n + 1) − ln n
1 etwa wie die neilsche Parabel y 2 = x3 . 2 2 ¨ mit y 2 = 2 + x − x2 sind definiert auf e) Umformung zu y = 2 ± x − x . Die zwei Aste

[−1; 2] und bilden zusammen einen Kreis mit dem Mittelpunkt 12 , 0 und dem Radius 3 2 ¨ x2 sind definiert auf [−2; 1] und bilden zusammen 2 , die zwei Aste mit y = 2 − x − einen Kreis mit dem Mittelpunkt − 12 , 0 und dem Radius 32 .

f) Definitionsberech IR, weil eine algebraischen Gleichung dritten Grades stets eine reelle Lösung hat. Die Kurve ist symmetrisch zur Winkelhalbierenden y = x, weil mit (u, v) auch (v, u) ein Kurvenpunkt ist; das Produkt der Steigungen in symmetrisch 2 +y gelegenen Punkten ist 1. Ableitung y = − 3x ; f¨ ur y = −3x2 ist x = 0 oder x = 3y 2 +x √ √ √ √ √ 3 3 3 − 13 2. Im Punkt − 13 2, − 13 4 waagerechte Tangente, im Punkt − 13 3 4, − 13 3 2

also senkrechte Tangente. Im Punkt − 12 , − 12 Tangente mit der Steigung −1. Außer (0,0) keine Schnittpunkte mit den Achsen, an dieser Stelle durchkreuzt sich die Kurve (mit den Steigungen 0 bzw ∞). F¨ ur große Werte von |x| ist y ≈ −x, die Kurve n¨ ahert sich asymptotisch der Geraden mit der Gleichung y = −x (von oben“); vgl. Fig. 5,6. ” t XII.3 1. x = t ln t, y = t2 ; Tangentenvektor 1+ln . 2t XII.3 2. Es handelt sich um eine Spirale; der Kr¨ ummungskreis den Radius XII.3 3. a) F¨ ur x = cos t ergibt sich

y2

6

3

3

(θ2 +1) 2 θ2 +2 3

.

= sin t, also y = ± sin t; f¨ ur y = + sin t wird


372

die Kurve im Gegenuhrzeigersinn durchlaufen, wenn t von 0 bis 2π l¨ auft. ur 0 ≤ x ≤ 1 b) Es ist am g¨ unstigsten, die explizite Darstellung y = f (x) = (1 − x2 )1,5 f¨ (x) = −3x(1 − x2 )0,5 und (Kurvenast im ersten Quadrant) zu untersuchen. Es ist f √ f (x) = 3x2 (1−x2 )−0,5 −3(1−x2 )0,5 . Es ist f 12 2 = 0; die Steigung im Wendepunkt √ √ 1 1 3 ur die anderen Kurven¨ aste. 2 2, 4 2 ist − 2 . Analoges gilt f¨ 2π

1 √ sin2 t + 9 sin4 t cos2 t dt = 4 1 + 9x2 − 9x4 dx 0 0 0 √ nur näherungsweise zu berechnen, etwa A ≈ 4 · 16 1 + 43 + 1 ≈ 5,7

c) 3

2π

sin2 t cos2 t dt = 34 π

d)

e) Der Kr¨ ummungsradius ist 1/3. XII.3 4. a) x = r(θ) cos θ, y = r(θ) sin θ; F (x, y) = x(x2 + y 2 ) − ay 2 b) Aus F (x, y) = 0 und y ≥ 0 folgt y = x1,5 · Integral

a 0

x1,5 ·

1 a−x

dx existiert und ist ≤ a1,5

1 a−x a o

f¨ ur 0 ≤ x < a. Das uneigentliche 1 a−x

2

c) Ist B = (x, y), also AB = x2 + y 2 , dann ist C = 2

also CD =

ay 2 x2 +y 2

2

+

ay 3 x(x2 +y 2 )

2

dx = a2 .

ax2 , axy x2 +y 2 x2 +y 2

und D = a, ay x ,

2

, mit ay 2 = x(x2 + y 2 ) also CD = x2 + y 2 .

XII.4 1. Es ergibt sich eine Parameterdarstellung des Kreises: x = cos t, y = sin t. XII.4 2.

−4t2 1 +3t2 2

XII.4 3. a) L = L=

1 4

a 0

b) A =

−

3 1 (4t2 +1) 2 12 √ t 4t2 +1

2π √ 0

−12t2 6t

=

t t2

(e2t + 2 + e−2t ) dt mit a = ln(2π + π

1 2

2 π 4

θ2 dθ =

1 6

et −e−t 2

θ2 + 1 dθ; mit der Substitution θ =

π 3 2

c) x = t cos t, y = t sin t XII.4 4. a) 2(e2π − 1)

−

π 3

d)

4

=

√

ergibt sich

4π 2 + 1), also L = 18 (e2a + 4a − e−2a ).

7 3 384 π

t cos t

b) x =

1+t2 − sin t−t cos t t sin t + 2+t2 cos t−t sin t et cos t, y = et sin t c) x

= −et sin t, y = et cos t

XII.5 1. Zwei orthogonale und zum Normalenvektor der Ebene orthogonale Vektoren der Länge 7 sind z.B. a =

√7 5

1 −2 0

und b =

√7 70

6 3 5

. Ist m der Ortsvektor von M ,

dann ist x = m + cos t a + sin t b eine Parameterdarstellung des Kreises. XII.5 2. L =

1 + h2 + (ln a)2

XII.5 3. Ein Ber¨ uhrpunkt der Kugel auf der Fl¨ ache ergibt sich f¨ ur x = y = z; der Kugelradius ist dann 13 .

XII.5 4. Es gilt x2 + y 2 + z 2 = r2 . XII.5 5.

x y z

=

x2 2

a

− x0 y0 z0

y2 b2

−

z2 c2

+r

Ellipsoid:

x y z

=

a cos u cos v b sin u cos v c sin v

= 1; Tangentialebene in (x0 , y0 , z0 ) zu Parametern u0 , v0 :

0 −b sin u sinh v c cos u sinh v

+s

a sinh v b cos ucoshv c sin u cosh v

;

x0 x a2

−

y0 y b2

−

z0 z c2

=1

Index Abel 289 abelscher Grenzwertsatz 289 abgeschlossenes Intervall 211 Ableitung 242 Ableitungsfunktion 243 Ableitungsregeln 244 Abschätzung von Integralen 278 absolut konvergent 223 Abstandsberechnung 75 abzählbar 229 Abzählung 228 Additionstheorem f¨ ur Determinanten 85 Addition 9, 12, 37, 188, 231 affine Abbildung 97, 143 affines Koordinatensystem 98 Affinität 97 ¨ Ahnlichkeitsabbildung 99 alternierende Reihe 223 Annihilator A(U ) 38 a¨quivalente Folgen 209 ¨ Aquivalenzklasse 212 ¨ Aquivalenzrelation 208, 209, 212 ¨ Aquivalenzumformungen eines LGS 7 Archimedes 184 archimedisch angeordnet 213 archimedische Spirale 346 Arkuskosinusfunktion arccos 235 Arkussinusfunktion arcsin 235 Arkustangensfunktion arctan 235, 264 arithmetische Folge 190, 195, 196 arithmetisches Mittel 195 Assoziativgesetz 43, 188 Asteroide 329, 334, 342, 349 Asymptote 240 asymptotisches Verhalten 241 ausgeartete Quadrik 125 äußeres Produkt 80 Austauschsatz 16 Basis 16, 167, 219, 220 Basiswechsel 34 Berechnung der Determinante 87, 90 Berechnung der Inversen 45, 95 Bernoulli, Jakob 295

Bernoulli, Johann 192, 252 bernoullische Ungleichung 192 bernoullische Zahlen 295 beschr¨ ankt 203, 217 bestimmtes Integral 261 Betrag eines Vektors 66 Betragsfunktion 237 Beweis durch vollst¨ andige Induktion 191 bijektive Abbildung 34, 232 Bild A 49 Bildmenge 231 Binomialkoeffizient 198 binomische Reihe 305 binomischer Lehrsatz 200 Bogenl¨ ange 270, 334 Bolzano 217 Brennpunkt 122 Brianchon 153 cartesisches Blatt 327 Cauchy 67, 202 Cauchy-Folge 207, 214 Cauchy-Kriterium 213 Cauchy-Produkt 295 Cauchy-Schwarzsche Ungleichung 66 Cavalieri 275 cavalierisches Prinzip 275 Ceva 148 charakteristische Gleichung 105 charakteristisches Polynom 105 Cosinushyperbolicus cosh 249 Cramer 82 cramersche Regel 82, 90 Definitionsl¨ ucke 238 Definitionsmenge 231 Desargues 144 Descartes 327 Determinante det 52, 53, 82, 85 Determinantenmultiplikationssatz 53 Diagonalmatrix 47 Differenzenfolge 188, 191 Differenzenoperator 59 Differenzenquotient 242, 243

374 Differenzial 243 Differenzialgleichung 248 Differenzialquotient 243 Differenziation 243 differenzierbar 242, 326 Dimension dim 17 Dirichlet 307 Dirichlet-Reihe 307 Distributivgesetz 43, 188 divergente Folge 204 Doppelverhältnis 146 Drehung 101 Dreiecksfläche 29 Dreiecksmatrix 96 Dreiecksungleichung 66, 204 Dreieckszahlen 202 Dreispiegelungssatz 102 duale Basis 38 dualer Vektorraum 37 Dualitätsprinzip 137 Durchstoßpunkt 27

Erwartungswert 70 erweiterte Koeffizientenmatrix 9 Erzeugendensystem 14 Erzeugnis 14 euklidischer Vektorraum 64 Euler 54,108, 225 Euler-Affinit¨ at 108 Euler-Mascheroni-Konstante 284 eulersche Gammafunktion 286 eulersche Zahl e 215, 225, 302 Evolute 340 Evolvente 343 Existenz der Determinante 86 explizite Darstellung der Determinante 92 Exponentialfunktion 233, 263 Extrempunkte 301, 317

Faktorregel 245 Fakult¨ at n! 198, 228, 286 Fermat 202 Fibonacci 53, 181, 182 Fibonacci-Zahlen 53, 63, 183, 191, 204 Fixgerade 111 Ebenenb¨ undel 137 Fixpunktgerade 111 Ebenenb¨ uschel 137 Fixrichtung 105 Ebenengleichung 26 Fl¨ acheninhaltsfunktion 260 eigentliche Bewegung 104 Fl¨ ache zweiter Ordnung 123 Eigenraum 105 Fluchtgerade 143, 144 Eigenvektor 105 Folge 181 Eigenwert 105 Folgengrenzwert 204 Einheitsmatrix 43 einschaliges Hyperboloid 125, 126, 130, Fourier 309 Fourier-Reihe 309 350 Fraktale 210 Einschließungskriterium 207 Fundamentalfolge 207, 214 einseitige Differenzierbarkeit 242 Fundamentalsatz der Algebra 117 elementare Funktion 239, 265 F¨ unfeckszahlen 202 elementare Spaltenumformungen 46 Funktion 231 elementare Zeilenumformungen 46 Funktionsgleichung 231 elementar integrierbar 265 Funktionsterm 231 Ellipse 116 Ellipsoid 125, 126 Gammafunktion 286 elliptischer Doppelkegel 124, 126 ganze Zahlen 181 elliptischer Zylinder 124, 126 ganzrationale Funktion 238 elliptisches Paraboloid 124, 126 Ganzteilfunktion 208, 237 endlich erzeugter Vektorraum 16 Gauß 8 endliches Intervall 211 Gauß-Verfahren 6 Entwicklungssatz f¨ ur Determinanten 93

375 Gegenvektor 12 geometrische Folge 190, 195 geometrische Reihe 197 geometrisches Mittel 195 Geradenb¨ uschel 136 Geradengleichung 26, 135 Geradenspiegelung 100, 112 geradentreu 97 gliedweise Differenziation/Integration 292 goldener Schnitt 183 Graph 234 Grenzwert einer Folge 186, 204 Grenzwert einer Funktion 236 größte untere Schranke 217 Grundaufgabe der lin. Optimierung 158 Gruppe der affinen Abbildungen 98 Guldin 273 guldinsche Regeln 273 halboffenes Intervall 211 harmonische Folge 195 harmonische Reihe 197 harmonisches Mittel 195 Häufungspunkt 217 Hauptachsen 121 Hauptachsentransformation 125 Hauptsatz der Analysis 268 Hauptsatz der projektiven Geometrie 142 Hauptsatz u ¨ber monotone Folgen 217 hebbare Definitionsl¨ ucke 238 Heron 258 heronsches Verfahren 258 Hesse 75 hessesche Normalenform 75 hinreichendes Kriterium 214, 215 höhere Ableitungen 247 homogene Koordinaten 134 homogenes LGS 11 Homomorphismus 32 Hom(V, W ) 36 Huygens 222 Hyperbel 116 hyperbolische Funktionen 249 hyperbolischer Zylinder 124, 126 hyperbolisches Paraboloid 124, 126, 139 Hyperboloid 124

identische Funktion id 232 Identit¨ atssatz f¨ ur Potenzreihen 292 implizite Differenziation 323 Induktion 191 Infimum 217 inhomogenes LGS 11 injektive Abbildung 34 inneres Produkt 64 Integral 260, 267, 268 Integralzeichen 261 Integrationsregeln 262, 267 integrierbar 267 Intervall 211 Intervalladditivit¨ at 261, 267 Intervallschachtelung 211 inverse Funktion 232 inverse Matrix 44, 45, 94 Invertierbarkeit 43, 44 irrationale Zahl 211 Irrationalit¨ at von e 215 Isomorphismus 32 Iteration 254 Kardioide 329 Kegel 124, 126, 276 Kegelschnitt 116, 151 Kehrfunktion 231 Kehrwertregel 244 Kepler 279 keplersche Fassregel 279 Kern einer Intervallschachtelung 212 Kern einer linearen Abbildung 35 Kettenlinie 244, 271 Kettenregel 244 Kleeblattkurve 324 kleinste obere Schranke 217 Koeffizientenmatrix eines LGS 9 kollinear 137 Kommutativgesetz 43, 188 komplanar 137 komplexe Zahlen 50 Komponente 16, 34 Kongruenzabbildung 99 konjugierte Durchmesser 121 konjugiert komplexe Zahl 51 konvergente Folge 204

376 Konvergenzradius 289 konvex 29, 159, 316 konvexe H¨ ulle 30, 159 Konvexkombination 30, 159 Koordinate 16, 34 Koordinatenvektor 16, 33 kopunktal 137 Körper der rationalen Zahlen 213 Körper der reellen Zahlen 213 Kosinusfunktion cos 234 Kosinussatz 73 Kreis 138 Kreisschnittebenen 132 Kreiszahl π 184, 303 Kr¨ ummung 317 Kr¨ ummungskreis 317 Kr¨ ummungsradius 317, 335 Kurvendiskussion 319 Kurve zweiter Ordnung 117 K-Vektorraum 12 Lambert 307 Lambert-Reihe 307 Länge einer Kurve 270 Länge eines Vektors 66, 73 Leibniz 189, 222, 261 Leibniz-Kriterium 223 leibnizsche Regel 248 leibnizsche Reihe 223, 285, 300, 311 leibnizsches Dreieck 218 Lemniskate 328, 337 LGS 3 L’Hospital 252 lim 204, 236 Limes 204 Limes inferior liminf 208 Limes superior limsup 208 linear abhängig, unabh¨ angig 14 lineare Abbildung 32 lineare Approximation 325 lineare Gleichung 3 lineare H¨ ulle 24 lineare Mannigfaltigkeit 21 lineare Optimierung 155 lineares Funktional 37 lineares Gleichungssystem 3

Linearform 38 Linearkombination 14 linksseitiger Grenzwert 236 Logarithmenregeln 220 logarithmische Spirale 346 Logarithmus 220, 304 Logarithmusfunktion 233, 263 lokales Extremum 250 L¨ osungsmenge eines LGS 11 L¨ osungsraum eines homogenen LGS 39 L¨ osungsverfahren f¨ ur LGS 7 Lotebene 74 Lotfußpunkt 74 Lotgerade 74 Lotmannigfaltigkeit 74 Lotraum 68 Mantelinhalt 273 Mascheroni-Konstante 284 Matrix 12 Matrizenmultiplikation 32, 41 Minimalpunkt 159 Mittelwerts¨ atze 250, 251, 277 monoton fallend/wachsend 203 Monotoniekriterium 251 Multiplikationstheorem f¨ ur Det. 88 Multiplikation 32, 41, 188, 231 nach oben/unten beschr¨ ankt 203, 217 N¨ aherungsverfahren 257, 278 n¨ aherungsweise L¨ osung 257 nat¨ urlicher Logarithmus 220, 263 nat¨ urliche Zahlen 179 Neil 271 neilsche Parabel 271 neutrales Element 43, 188 Newton 257 Newton-Verfahren 257 nicht-ausgeartete Quadrik 125 nichtkollinear 98 nichtkomplanar 98 Normalengleichung 75 Normalenvektor 75, 332 Norm eines Vektors 66 notwendiges Kriterium 214 Nullfolge 206

377 Nullmatrix 43 Nullteiler 44, 188 Nullvektor 12 nummerierbar 229 Nummerierung 228 obere/untere Grenze 217 obere/untere Schranke 217 Obersummen 267 offenes Intervall 211 Optimierung 155 Orthogonalbasis 67 orthogonale Vektoren 67 Orthonormalbasis 67 Orthonormalmatrix 91, 100 Orthonormierungsverfahren 68 Ortskurve 122 Ortsvektor 26, 74 Parabel 116 parabolischer Zylinder 124, 126 Paraboloid 124 parallelentreu 97 Parallelstreckung 97, 109 Parameterdarstellung 331 partielle Ableitung 324 partielle Integration 272 Pascal 153, 200 pascalsches Dreieck 200 Pell 54 pellsche Gleichungen 54 Permutation 91 Pol 77 Polare 77 Polarebene 77 Polarkoordinaten 337 Pol-Polare-Beziehung 78, 139 Polygonalzahlen 201, 202 Polynomfunktion 238 positiv definite Matrix 69 Potenzen 219 Potenzfunktion 246 Potenzmenge 229 Potenzregeln 219 Potenzreihe 289 Prinzip der vollst¨ andigen Induktion 191

Prinzip von Cavalieri 275 Produktfolge 226 Produktintegration 262 Produktregel 244 Produkt 188, 231 projektive Abbildung 140 projektive Ebene 134 projektive Geometrie 134 projektive Gerade 134 projektive Koordinaten 134 projektiver Raum 134 Punktreihe 136 Pyramidenvolumen 185 quadratische Erg¨ anzung 119 quadratische Matrix 42 Quadratzahlen 181, 202 Quadrik 125 Quaternionen 52 Quotientenkriterium 221 Quotientenraum 23, 35 Quotientenregel 245 Rang A 49 Rang einer Matrix, eines LGS 39, 45 rationale Funktion 238, 246 rationales Intervall 211 rationale Zahlen 181, 211 Rechtecksregel 278 rechtsseitiger Grenzwert 236 reelle Zahlen 181, 211, 212 reflexiv 208 Regelfl¨ ache 125, 129 Regeln von de l’Hospital 251, 252 Regel von Cramer 82, 90 Regel von Sarrus 82 Regula falsi 259 Rekursion 182 rekursiv definierte Folge 181 relatives Extremum 317 Richtungsvektor 26 Riemann 228 Riemann-Integral 267 Riemann-integrierbar 267 riemannsche Zetafunktion 228, 288, 289 Ring 188

378 Ring der quadratischen Matrizen 43 Ring mit Einselement 43, 188 Rolle 250 Rotationskörper 273 Sarrus 82 sarrussche Regel 82 Sattelfläche 129, 139 Sattelpunkt 301, 317 Satz vom Minimum und Maximum 240 Satz von Bolzano-Weierstraß 217 Satz von Brianchon 153 Satz von Ceva 148 Satz von der oberen Grenze 217 Satz von Desargues 144 Satz von Pascal 153 Satz von Rolle 250 Schaubild 234 Scheitelkr¨ ummumgskreis 122 Scherung 102 schiefsymmetrische Matrix 49 Schleppkurve 344 Schlupfvariable 156, 159 Schluss von n auf n + 1 191 Schmidt 68 schmidtsches Orthonormierungsverf. 68 Schnittgerade 27 Schrägspiegelung 102, 109 Schraubenlinie 347 Schubspiegelung 102 Schwarz 67 Schwerpunkt 271 Signumfunktion sgn 237 Simplex 30, 166 Simplexverfahren 166 Simpson 226, 279 Simpson-Regel 279 singulärer Punkt 327 Sinusfunktion sin 234, 306 Sinushyperbolicus sinh 249 Skalar 12 Skalarprodukt 64 Spaltenrang 45 Spaltenumformungen 89 Spaltenvektor 47 Spannvektoren 26

Spatprodukt 81 sph¨ arisches Dreieck 84 Spiegelung an einer Geraden 100, 112 Spur einer Matrix 69 Stammfunktion 260 Standardaufgabe der lin. Optimierung 158 Standardbasis 18 Standardgleichung eines Kegelschnitts 120 Standardgleichung einer Quadrik 125, 126 Standardskalarprodukt 64 Startecke 166 Statistik 70 Steigung 242, 316 stetig 237, 324 stetig differenzierbar 243 stetig hebbare Definitionsl¨ ucke 238 Stirling 312 stirlingsche Formel 312 Streckscherung 110, 113, 114 streng monoton 203 Strukturs¨ atze der Stetigkeit 238 Strukturs¨ atze f¨ ur Grenzwerte 237 Stufenform 7, 10, 46 Substitutionsregel 262 Summenfolge 188 Summenoperator 59 Summenregel 244 Summenzeichen 33, 197 Supremum 217 surjektive Abbildung 34 symmetrische Relation 208 symmetrische Matrix 49, 117 Tangensfunktion tan 235 Tangenshyperbolicus tanh 249 Tangente 75 Tangentenbedingung 76 Tangentenregel 278 Tangentensteigung 242 Tangentenvektor 332 Tangentialebene 75 Tangentialkegel 77, 79 Taylor 298 Taylor-Entwicklung 298 Taylor-Polynom, –reihe 299 taylorsche Formel 298

379 taylorsches Restglied 298 Teilfolge 208 teilverhältnistreu 97 Torus 275 Traktrix 344 transitiv 208 Transponieren 47, 48 transponierte Matrix 48 transponierter Vektor 47 Transportproblem 177 Trapezregel 278 trigonometrische Funktionen 247, 264 Tschebyscheff 71 tschebyscheffsche Ungleichung 71 Turm von Hanoi 193 Umgebung 242 umkehrbare Abbildung 34 Umkehrfunktion 232 Umkehrregel 244 Umordnungssatz 224 unbestimmter Ausdruck 219 unbestimmtes Integral 260 uneigentlich (Punkt, Gerade) 134, 135 uneigentliches Integral 281, 282 unendliche Reihe 221 unendliches Produkt 227 unendlich fern 134, 135 unitärer Vektorraum 64 Untersummen 267 Untervektorraum, Unterraum 13

Vektor 12, 13, 26 Vektorprodukt 80 Vektorraum 12 Vergleichskriterium 221 Verkettung 40, 232 Verschwindungsgerade 142, 144 Vervielfachung 9, 12, 37, 188, 231 vollst¨ andig angeordneter K¨ orper 213 vollst¨ andige Induktion 191 Vollst¨ andigkeitsaxiom 213 Volumen 185, 274, 275 Wallis 227 wallissches Produkt 227, 312 Weierstraß 217 Wendepunkt 301, 317 windschief 28, 78 Wurzelberechnung 258, 305 Wurzelkriterium 221 Wurzelschnecke 183 Zeilenrang 39, 45 Zeilenumformungen 89 zentrische Streckung 100, 104, 109, 114 Zetafunktion 228, 288, 289 Zissoide 339 zweischaliges Hyperboloid 124, 126, 351 Zwischenwertsatz 240 Zykloide 336 Zylinder 124

Elemente der Linearen Algebra und der Analysis (German Edition)

Elemente der Arithmetik und Algebra 001

Dekalog der Elemente

Die Elemente der Magie

Dekalog der Elemente

Die Elemente der Magie

Dekalog der Elemente

Dekalog der Elemente

Mathematik fur Okonomen: Okonomische Anwendungen der linearen Algebra und Analysis mit Scilab (Springer-Lehrbuch)

Dekalog der Elemente

Finite Elemente in der Statik und Dynamik

Der Fremde (German Edition)

Der Atem (German Edition)

Softwarepraktikum - Analysis und Lineare Algebra German

Elemente der Stochastik

Tomy und der Planet der Lüge GERMAN

Der logische Aufbau der Welt (German Edition)

Russlands Außenpolitik (Elemente der Politik)

Recht Und Praxis Der Gema: Handbuch Und Kommentar (German Edition)

Finite Elemente in der Baustatik

Finite Elemente in der Strukturmechanik

Wörterbuch der Psychotherapie (German Edition)

Messtechnik der Akustik (German Edition)

Der erste Thort (German Edition)

Finite Elemente in der Strukturmechanik

Die Analyse der astrologischen Elemente

Finite-Elemente-Methode: Rechnergestützte Einführung (German Edition)

Gruppen Von Linearen Transformationen - Ergebnisse Der Mathematik Und Ihrer Grenzegebiete

Hierarchische Matrizen: Algorithmen und Analysis (German Edition)

Lernen aus Musterlösungen zur Analysis und Linearen Algebra: Ein Arbeits- und Übungsbuch

Übungsbuch zur Linearen Algebra und analytischen Geometrie: Aufgaben mit Lösungen

Elemente der Linearen Algebra und der Analysis (German Edition)

Elemente der Arithmetik und Algebra 001

Dekalog der Elemente

Die Elemente der Magie

Dekalog der Elemente

Die Elemente der Magie

Dekalog der Elemente

Dekalog der Elemente

Mathematik fur Okonomen: Okonomische Anwendungen der linearen Algebra und Analysis mit Scilab (Springer-Lehrbuch)

Dekalog der Elemente

Finite Elemente in der Statik und Dynamik

Der Fremde (German Edition)

Der Atem (German Edition)

Softwarepraktikum - Analysis und Lineare Algebra German

Elemente der Stochastik

Tomy und der Planet der Lüge GERMAN

Der logische Aufbau der Welt (German Edition)

Russlands Außenpolitik (Elemente der Politik)

Recht Und Praxis Der Gema: Handbuch Und Kommentar (German Edition)

Finite Elemente in der Baustatik

Finite Elemente in der Strukturmechanik

Wörterbuch der Psychotherapie (German Edition)

Messtechnik der Akustik (German Edition)

Der erste Thort (German Edition)

Finite Elemente in der Strukturmechanik

Die Analyse der astrologischen Elemente

Finite-Elemente-Methode: Rechnergestützte Einführung (German Edition)

Gruppen Von Linearen Transformationen - Ergebnisse Der Mathematik Und Ihrer Grenzegebiete

Hierarchische Matrizen: Algorithmen und Analysis (German Edition)

Lernen aus Musterlösungen zur Analysis und Linearen Algebra: Ein Arbeits- und Übungsbuch

Übungsbuch zur Linearen Algebra und analytischen Geometrie: Aufgaben mit Lösungen

Recommend Documents