Mathematik für Naturwissenschaftler
Norbert Herrmann
Mathematik für Naturwissenschaftler Was Sie im Bachelor wirklic...
81 downloads
1215 Views
2MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Mathematik für Naturwissenschaftler
Norbert Herrmann
Mathematik für Naturwissenschaftler Was Sie im Bachelor wirklich brauchen und in der Schule nicht lernen
Autor Dr. Dr. h.c. Norbert Herrmann Leibniz Universität Hannover www.mathematikistueberall.de www.ifam.uni-hannover.de/~herrmann Weitere Informationen zum Buch finden Sie unter www.spektrum-verlag.de/978-3-8274-2866-0
Wichtiger Hinweis für den Benutzer Der Verlag und der Autor haben alle Sorgfalt walten lassen, um vollständige und akkurate Informationen in diesem Buch zu publizieren. Der Verlag übernimmt weder Garantie noch die juristische Verantwortung oder irgendeine Haftung für die Nutzung dieser Informationen, für deren Wirtschaftlichkeit oder fehlerfreie Funktion für einen bestimmten Zweck. Der Verlag übernimmt keine Gewähr dafür, dass die beschriebenen Verfahren, Programme usw. frei von Schutzrechten Dritter sind. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Buch berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag hat sich bemüht, sämtliche Rechteinhaber von Abbildungen zu ermitteln. Sollte dem Verlag gegenüber dennoch der Nachweis der Rechtsinhaberschaft geführt werden, wird das branchenübliche Honorar gezahlt.
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
Springer ist ein Unternehmen von Springer Science+Business Media springer.de © Spektrum Akademischer Verlag Heidelberg 2012 Spektrum Akademischer Verlag ist ein Imprint von Springer
11 12 13
14
15
5 4 3 2 1
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen.
Planung und Lektorat: Andreas Rüdinger, Martina Mechler Satz: Autorensatz Herstellung: Crest Premedia Solutions (P) Ltd, Pune, Maharashtra, India Umschlaggestaltung: SpieszDesign, Neu-Ulm Titelbild: © Panthermedia Zeichnungen: Thomas Epp und der Autor ISBN 978-3-8274-2866-0
Vorwort A ’ ρχ` η η‘´μισυ παντ o´ς Aristoteles
Der Anfang ist die H¨ alfte vom Ganzen. So sagte es schon Aristoteles und forderte damit seine Zuh¨ orer auf, doch bitte auf jeden Fall erst einmal anzufangen. Liebe Leserinnen und Leser, Sie stehen an einem neuen Lebensabschnitt. Das Studium beginnt, und es warten viele neue Herausforderungen. Gerade wenn Sie sich den Naturwissenschaften verschrieben haben, wird es Sie u ¨berraschen, wieviel Mathematik Sie dazu lernen m¨ ussen. Ohne fundierte mathematische Grundkenntnisse ist die Welt von heute aber nicht mehr zu beschreiben und zu begreifen. Wir wollen mit diesem Buch einen Beitrag leisten, Ihnen diesen Anfang etwas leichter zu machen. Dieses Buch entstand als Ausarbeitung einer Vorlesung, die der Autor im WS 2006 und SS 2007 an der Leibniz Universit¨ at Hannover f¨ ur Studierende der Chemie, Biologie, Life Science, Geowissenschaften und Biochemie gehalten hat. Er beschritt damals Neuland. Denn bislang war die Philosophie stets: Die Studierenden haben zwar Abitur, aber von Mathematik keine Ahnung. Wir m¨ ussen also bei Null anfangen, um in dem ersten Studienjahr wenigstens die Grundbegriffe der Mathematik vermitteln zu k¨ onnen. Da der Autor mehrere Jahre lang selbst an einer Schule unterrichtet hat und weil seine Frau als Mathematik- und Physiklehrerin ihm stets direkten Einblick in den Schulalltag geben konnte, lag ein anderes, ja neues Vorgehen hier auf der Hand. Wir gehen daher in diesem Buch davon aus, dass alle Abiturientinnen und Abiturienten etwas vom Differenzieren und Integrieren verstehen und auch schon kleine lineare Gleichungssysteme gel¨ ost haben. Wir beginnen im ersten und zweiten Kapitel damit, einige Grundbegriffe der Linearen Algebra vorzustellen, soweit wir sie sp¨ ater ben¨ otigen. Da ist zum einen ein gutes effektives Verfahren zum L¨ osen von großen linearen Gleichungssystemen. Wir berichten u ¨ber das L-R-Verfahren mit Pivotisierung, wie es in vielen kommerziellen Rechenprogrammen verwendet wird. Dann brauchen wir sp¨ ater bei der Rotation und der Hessematrix etwas von Determinanten. Im dritten Kapitel kommen wir zur Analysis. Hier bauen wir auf den Schulkenntnissen auf und beginnen gleich mit der Analysis im Mehrdimensionalen.
vi
Dadurch gewinnen wir viel Zeit, die wir zur ausf¨ uhrlichen Erl¨ auterung der komplizierten Fachtermini verwenden k¨ onnen. Die eindimensionale Analysis aus der Schule wird aber immer wieder mal als Beispiel herangezogen. Viele vollst¨ andig durchgerechnete Beispiele sollen gerade den Erstsemestlern helfen, die abstrakten Begriffe zu verstehen. Auf die Weise gelingt es uns, schon im ersten Semester mehrdimensionale Integrale und die ber¨ uhmten S¨ atze von Gauß und Stokes zu erkl¨ aren. Das ist echtes Neuland. Die Splinefunktionen im Kapitel 11 sind ausgesprochen wichtige Hilfsmittel f¨ ur Anwender. In Experimenten erhalten wir manchmal sehr viele Werte, die dann durch eine Kurve verbunden werden m¨ ochten. Polynome waren lange Zeit Standard, um solche Aufgaben zu l¨ osen. Wer aber jemals versucht hat, 100 Messpunte durch ein Polynom darzustellen, wird diesen Versuch nie wieder wagen. Hier sind Splines ein sehr probates Hilfsmittel, die sich auch sehr leicht in Computerprogramme einbeziehen lassen. Kapitel 12 und 13 sind den Differentialgleichungen gewidmet. Sie als Naturwissenschaftlerinnen und -wissenschaftler werden sehr schnell in Ihrem weiteren Studium erkennen, dass diese neuen Gleichungen fast die ganze Natur zu beherrschen scheinen. Wir werden nicht viel Zeit darauf verwenden, die theoretischen Grundlagen und L¨ osungsm¨ oglichkeiten zu erkl¨ aren, sondern wollen uns der Praxis zuwenden. Gerade heute mit Einsatz großer Computer sind numerische Methoden sehr gefragt und lassen sich hocheffizient einsetzen. Wir k¨ onnen allerdings nur die ersten Anf¨ ange schildern. Das Kapitel 14 enth¨ alt eine kurze Einleitung in die Wahrscheinlichkeitsrechnung, ebenfalls ein mathematisches Teilgebiet, das in sehr vielen Anwendungsbereichen anzutreffen ist. Vielen Dank m¨ ochte ich meinem Lektor, Dr. Andreas R¨ udinger, vom SpektrumVerlag sagen, der das ganze Manuskript mit großer Akribie gelesen hat und mir mit vielen Fragen und Anregungen sehr geholfen hat. Auch seiner Kollegin, Martina Mechler, sei herzlich gedankt. Sie hat sich vor allem um die Graphiken gek¨ ummert. Ein besonders großer Dank gilt meiner lieben Frau. Viele sch¨ one Nachmittag hat sie ohne mich zubringen m¨ ussen, weil ich ja noch etliche Seiten Manuskript zu schreiben hatte. Nun w¨ unsche ich Ihnen, dass dieser Anfang f¨ ur Sie mit großem Erfolg gemeistert wird. Es ist sehr wichtig, etwas anzupacken und aktiv zu gestalten. Hat man das geschafft, so ist ja bereits die H¨ alfte erreicht, sagt Aristoteles. Ich w¨ urde mich u uckmeldungen zu diesem Buch sehr freuen. Vielleicht ¨ber R¨ ¨ helfen Ihnen die gel¨ osten Ubungsaufgaben, die der Verlag im Internet zum Herunterladen bereitstellen wird. In diesem Sinne: Packen wir’s an. Viel Erfolg! Norbert Herrmann
Inhaltsverzeichnis 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7
Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Erkl¨ arungen und Bezeichnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rechnen mit Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rang einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Quadratische Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Inverse Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Orthogonale Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 1 2 5 10 15 18 19
2 2.1 2.2
Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Erste einfache Erkl¨ arungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Elementare Umformungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23 23 26
3 3.1 3.2 3.3 3.4
Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bezeichnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Existenz und Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Determinantenkriterium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . L-R-Zerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Die Grundaufgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.2 Existenz der L-R-Zerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.3 L-R-Zerlegung und lineare Gleichungssysteme . . . . . . . . . . . . . . . Pivotisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.1 L-R-Zerlegung, Pivotisierung und lineare Gleichungssysteme . . . 3.5.2 L-R-Zerlegung, Pivotisierung und inverse Matrix . . . . . . . . . . . . .
31 31 32 36 36 36 41 43 45 50 52
4 4.1 4.2 4.3 4.4
Funktionen mehrerer Ver¨ anderlicher – Stetigkeit . . . . . . . . . . . Erste Erkl¨ arungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Beschr¨ anktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grenzwert einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55 55 59 61 64
5 5.1 5.2 5.3 5.4 5.5 5.6
Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit . . Partielle Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H¨ ohere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Totale Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Richtungsableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Relative Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wichtige S¨ atze der Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69 69 75 77 84 90 97
6 6.1 6.2 6.3
Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kurvenst¨ ucke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kurvenintegral 1. Art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kurvenintegral 2. Art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
103 104 105 113
3.5
viii
Inhaltsverzeichnis
6.4
Kurvenhauptsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
7 7.1 7.2 7.3
Doppelintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Berechnung des Doppelintegrals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Transformation der Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
129 129 134 137
8 8.1 8.2 8.3 8.4
Dreifachintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Berechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Transformation der Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kugel- und Zylinderkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
141 142 143 144 144
9 9.1 9.2
Ober߬ achenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Ober߬ achenintegrale 1. Art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Ober߬ achenintergale 2. Art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
10 10.1 10.2 10.3
Integrals¨ atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Divergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Divergenzsatz von Gauß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Satz von Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
161 161 162 164
11 11.1 11.2 11.3 11.4 11.5
Interpolation mit Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einf¨ uhrendes Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Existenz und Eindeutigkeit der Polynominterpolation . . . . . . . . . . . . . Interpolation mit linearen Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Interpolation mit Hermite-Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Interpolation mit kubischen Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
171 172 173 176 183 189
12 12.1 12.2 12.3 12.4 12.5 12.6 12.7 12.8
Gew¨ ohnliche Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . Diese Mathematiker immer mit Existenz und Eindeutigkeit . . . . . . . . Existenz und Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Numerische Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Euler-Polygonzug-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zur Konvergenz des Euler-Verfahrens . . . . . . . . . . . . . . . . . . . . . . . . . . . Runge-Kutta-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zur Konvergenz des Runge-Kutta-Verfahrens . . . . . . . . . . . . . . . . . . . . Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
195 196 196 200 201 204 208 210 211
13 Partielle Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.1 Typeinteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.2 Laplace- und Poisson-Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.2.1 Eindeutigkeit und Stabilit¨ at . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.2.2 Zur Existenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.2.3 Differenzenverfahren f¨ ur die Poissongleichung . . . . . . . . . . . . 13.2.4 Zur Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
213 213 215 216 217 217 222
Inhaltsverzeichnis
ix
13.3 Die W¨ armeleitungsgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.3.1 Eindeutigkeit und Stabilit¨ at . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.3.2 Zur Existenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.3.3 Differenzenverfahren f¨ ur die W¨ armeleitungsgleichung . . . . . 13.3.4 Stabilit¨ at des Differenzenverfahrens . . . . . . . . . . . . . . . . . . . . 13.4 Die Wellengleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.4.1 Eindeutigkeit und Stabilit¨ at . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.4.2 Zur Existenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.4.3 Differenzenverfahren f¨ ur die Wellengleichung . . . . . . . . . . . . 13.4.4 Stabilit¨ at des Differenzenverfahrens . . . . . . . . . . . . . . . . . . . .
225 226 226 228 232 235 237 238 238 242
14 Kurze Einf¨ uhrung in die Wahrscheinlichkeitsrechnung . . . . . 14.1 Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.1.1 Permutationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.1.2 Variationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.1.3 Kombinationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.1.4 Ein Sitz- und ein ungel¨ ostes Problem . . . . . . . . . . . . . . . . . . . 14.2 Wahrscheinlichkeitsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.1 Definitionsversuch nach Laplace und von Mises . . . . . . . . . . 14.2.2 Axiomatische Wahrscheinlichkeitstheorie . . . . . . . . . . . . . . . . 14.2.3 Einige elementare S¨ atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.4 Bedingte Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.5 Zufallsvariable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.6 Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.7 Erwartungswert und Streuung . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.8 Tschebyscheffsche Ungleichung . . . . . . . . . . . . . . . . . . . . . . . . 14.2.9 Gesetz der großen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.10 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.11 Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.12 Gauß- oder Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.13 Grenzwerts¨ atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
245 245 245 247 250 252 256 256 261 263 264 270 271 274 276 277 278 280 281 282
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285 Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
1 Matrizen
¨ Ubersicht 1.1 1.2 1.3 1.4 1.5 1.6 1.7
1.1
Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Erkl¨ arungen und Bezeichnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rechnen mit Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rang einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Quadratische Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Inverse Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Orthogonale Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 2 5 10 15 18 19
Einleitung
In der Schule haben wir im Mathematikunterricht viele Zahlen kennen gelernt. 1. Da waren zuerst nat¨ urliche Zahlen N = 1, 2, 3, 4, 5, . . . . Der große Mathematiker Leopold Kronecker hat erkl¨ art, dass diese Zahlen der liebe Gott gemacht hat. Also werden wir uns auch nicht weiter um eine Erkl¨ arung bem¨ uhen. In manchen B¨ uchern nimmt man auch die Null zu den nat¨ urlichen Zahlen hinzu. Ein Kollege von mir begann seine Vorlesung stets mit dem Paragraphen −1, f¨ ur ihn geh¨ orte wohl auch diese Zahl zu den nat¨ urlichen. Das kann man halten wie Frau Nolte – die machte es, wie sie wollte. 2. Dann kamen ganze Zahlen Z = . . . , −4, −3, −2, −1, 0, 1, 2, 3, 4, . . . . Das sind also die positiven und negativen Zahlen im umgangssprachlichen Sinn, und die Zahl 0 bitte nicht zu vergessen. 3. Das n¨ achste sind rationale Zahlen Q =
p , q = 0. q
N. Herrmann, Mathematik für Naturwissenschaftler, DOI 10.1007/978-3-8274-2867-7_1, © Spektrum Akademischer Verlag Heidelberg 2012
2
1 Matrizen
Das sind also alle Br¨ uche, echt oder unecht ist egal. Nur durch 0 teilen wollen wir nicht, sonst kommen wir in die H¨ olle. Zugleich k¨ onnen wir diese Zahlen darstellen als endlichen oder periodischen Dezimalbruch. 4. Danach stehen auf dem Plan reelle Zahlen R. Sie mathematisch korrekt zu beschreiben f¨ allt ziemlich schwer. Daher nur eine vage Andeutung: Es sind alle Zahlen, die sich als Dezimalbruch schreiben lassen, also als Zahl a, a1 a2 a3 a4 . . . Der kann unendlich lang sein, ohne periodisch zu werden. 5. Dann bleiben noch komplexe Zahlen C = a + i · b, a, b ∈ R Die werden wir in einem Extraabschnitt sp¨ ater vorstellen. F¨ ur uns interessant ist, dass wir mit all diesen Zahlen rechnen gelernt haben. Dabei haben wir bestimmte Gesetzm¨ aßigkeiten eingehalten. Wie gesagt, das war alles in der Schule ausf¨ uhrlich dran.
1.2
Erkl¨ arungen und Bezeichnungen
Hier wollen wir eine v¨ ollig neue Welt kennen lernen, n¨ amlich die Welt der Matrizen. Das sind zu Beginn etwas eigent¨ umliche Gebilde, mit denen wir dann so umgehen m¨ ochten wie mit Zahlen. Wir wollen also mit ihnen rechnen. Bitte fragen Sie jetzt nicht nach dem Sinn dieser Gebilde. Wir werden sp¨ ater sehen, wo wir sie mit großem Gewinn einsetzen k¨ onnen. Wir beginnen mit der Definition: Definition 1.1 (Matrix) Unter einer (m, n)-Matrix A ∈ Rm×n verstehen wir ein rechteckiges Zahlenschema, das aus m Zeilen und n Spalten besteht. Die Eintr¨ age sind i.a. reelle Zahlen:
⎛
a11 . . . a1n
⎜ ⎜ a21 . . . a2n ⎜ A=⎜ . .. .. ⎜ .. . . ⎝ am1 . . . amn
⎞ ⎟ ⎟ ⎟ ⎟ = (aij ) 1≤i≤m 1≤j≤n ⎟ ⎠
(1.1)
1.2 Erkl¨ arungen und Bezeichnungen
3
Wir nennen also ein solches Schema eine Matrix. Der Plural heißt dann Matrizen. Beachten Sie bitte den Unterschied zu Matrizen, die man in der Druckerei findet. Deren Singular lautet die Matrize. Und verwechseln Sie bitte den Begriff nicht mit den Matratzen in Ihren Betten. Beispiel 1.1 Wir betrachten folgende Beispiele, auf die wir sp¨ ater Bezug nehmen wollen:
⎛
1.
1 −1
⎜ A=⎜ ⎝
⎞
⎟ 3⎟ ⎠. 5
2 −4
Das ist eine (3, 2)-Matrix, A ∈ R3×2 mit z.B. a22 = 3, a31 = −4.
2. B=
1 −1 2
Das ist eine (1, 3)-Matrix, also eine einzeilige und dreispaltige Matrix. In diesem Sinne sind dann auch die Vektoren, die wir aus der Schule kennen, als Matrizen aufzufassen. H¨ aufig trennt man bei Vektoren, wenn man sie als Zeilenvektoren schreibt, die Komponenten durch Kommas, also
a = (1, −1, 2).
3. C=
2 3
−1 5
Dies ist eine zweizeilige und zweispaltige Matrix. Wir nennen solche Matrizen mit gleich vielen Zeilen und Spalten auch quadratisch.
⎛
4.
⎞ 1
3
0
⎜ ⎟ ⎟ D=⎜ ⎝ 3 −2 −4 ⎠ 0 −4 0 Diese Matrix D ist wieder quadratisch, außerdem ist sie symmetrisch, wenn wir uns einen Spiegel von links oben nach rechts unten gestellt denken. Definition 1.2 (Symmetrische Matrix) Eine n × n-Matrix A = (aij ) 1≤i≤n heißt 1≤j≤n
symmetrisch
⇐⇒
aij = aji f¨ ur 1 ≤ i, j ≤ n.
(1.2)
4
1 Matrizen
Definition 1.3 (Nullmatrix) Eine n × n-Matrix A = (aij ) 1≤i≤n mit 1≤j≤n
aij = 0 f¨ ur 1 ≤ i, j ≤ n
(1.3)
heißt Nullmatrix O. Dies ist z.B. eine quadratische 3 × 3-Null-Matrix:
⎛
⎞ 0 0 0
⎜ ⎟ ⎟ O=⎜ ⎝0 0 0⎠ 0 0 0 Noch ein weiterer Name sei hier angef¨ ugt. Definition 1.4 (Transponierte Matrix) Sei A eine m × n-Matrix A = (aij ) 1≤i≤m . Dann heißt 1≤j≤n
A := (aji ), 1 ≤ j ≤ n, 1 ≤ i ≤ m transponiert zu A.
(1.4)
alt man also, indem man Zeilen und Spalten Die transponierte Matrix A erh¨ in A vertauscht. Der folgende Satz ist sofort einsichtig. Satz 1.1 Es gilt f¨ ur alle (m × n) Matrizen A, B (A ) = A.
(A + B)
(1.5)
= A +B
(1.6)
Zur Veranschaulichung betrachten wir obige Beispiele und bilden ihre Transponierten. Es ist
A
=
⎛
⎞ 1
⎜ ⎟ ,B = ⎜ −1 ⎟ ⎝ ⎠, C = −1 3 5 2 ⎛ ⎞ 1 3 0 ⎜ ⎟ ⎟ D = ⎜ O = O ⎝ 3 −2 4 ⎠ , 0 −4 0 1 2 −4
2 −1 3
5
Das sind also alles ziemlich einfache Begriffe, die wir nur als Abk¨ urzung benutzen.
1.3 Rechnen mit Matrizen
1.3
5
Rechnen mit Matrizen
Hier wollen wir lernen, wie wir mit diesen neuen Gebilden umgehen m¨ ussen. Rechnen heißt vor allem addieren, subtrahieren und multiplizieren. Zum Dividieren werden wir sp¨ ater ausf¨ uhrlicher Stellung nehmen. Nat¨ urlich k¨ onnen wir nur gleichartige Matrizen addieren oder subtrahieren. Definition 1.5 (Rechenregeln) Seien A = (aij ), B = (bij ) ∈ Rm×n zwei Matrizen mit gleich vielen Zeilen und Spalten und sei x ∈ R eine reelle Zahl. Dann sei A = B : ⇐⇒ aij = bij f¨ ur i = 1, . . . , m, j = 1, . . . , n.
(1.7)
c·A
:=
(c · aij ).
(1.8)
A+B
:=
(aij + bij )
(1.9)
Wir multiplizieren also eine Matrix mit einer Zahl, indem wir einfach alle Eintr¨ age mit dieser Zahl multiplizieren. Addieren geht ebenfalls so, wie gedacht, ¨ n¨ amlich elementweise. Eine kleine Rechenaufgabe dazu sollten Sie zur Ubung bew¨ altigen: Beispiel 1.2 Sei
A=
1 −2 3 0
,
B=
2 1
0 1 −1 2 0
.
3
Berechnen Sie bitte C = 2 · A − 3 · B + A + 2 · B.
C = 2·
+
=
1 −2 3 0
2 1
1 −2 3 0
−3·
2 1
3 −7 10 −2
6
+2·
0 1 −1 2 0
3
0 1 −1 2 0
3
0
Wie wir unschwer sehen, ist das Ergebnis gleich C = 3 · A − B. Das h¨ atten wir auch vorher schon sehen k¨ onnen, denn wir halten fest, dass f¨ ur diese Addition und die Multiplikation mit einer reellen Zahl das Assoziativ-, das Kommutativund das Distributivgesetz gelten, wie man ja auch sofort sieht.
6
1 Matrizen
Wir wollen jetzt versuchen, Matrizen miteinander zu multiplizieren; aber dabei m¨ ussen wir sehr vorsichtig vorgehen. Leider ist es hier so wie auch an anderen Stellen in der Mathematik: das leichte ist leider nicht verwertbar. Wir starten mit dem simplen Vorschlag, die Multiplikation analog zur Addition ¨ zu erkl¨ aren, n¨ amlich elementweise. Um nicht die Ubersicht zu verlieren, zeigen wir die Idee nur an kleinen Matrizen. Wir probieren folgende Festlegung:
a11 a12 a21 a22
·
b11 b12 b21 b22
=
a11 · b11 a12 · b12
a21 · b21 a22 · b22
Der Grund, warum wir diese einfache Version nicht w¨ ahlen, liegt etwas tiefer. Tats¨ achlich wollen wir so weit auch gar nicht in die Mathematik einsteigen. Sie sollten aber, liebe Freunde, im Blick behalten, dass Mathematiker nichts ohne Grund definieren. Wir wollen Ihnen daher den wirklich guten Grund kurz erz¨ ahlen. Man kann Matrizen benutzen, um lineare Abbildungen zu beschreiben. Das sind Drehungen, Spiegelungen usw. Zu jeder solchen Abbildung geh¨ ort eine Matrix, nennen wir sie A und B. Nat¨ urlich m¨ ochte man solche Abbildungen auch miteinander verkn¨ upfen. Und tats¨ achlich geh¨ ort zu einer solchen Hintereinanderausf¨ uhrung wieder eine Matrix, die sich auf komplizierte Weise berechnen l¨ asst. Genau die so entstehende Matrix definieren wir als Produktmatrix der beiden Matrizen A und B. So, jetzt wissen Sie es. Aber wir werden darauf nicht mehr zur¨ uckkommen, sondern erkl¨ aren jetzt die richtige Multiplikation. Die folgende Definition sieht sehr formal aus, kurz danach aber werden wir ein wundervolles Schema von Sigurd Falk angeben, nach dem sich diese Multiplikation sehr einfach ausf¨ uhren l¨ asst. Definition 1.6 (Matrizenmultiplikation) Sei A = (aij ) ∈ Rm×n eine m × n-Matrix und B = (bjk ) ∈ Rn×r eine n × rMatrix. Beachten Sie bitte, dass die Anzahl der Spalten von A gleich der Anzahl der Zeilen von B vorausgesetzt wird. Dann sei C := A · B = (cik ) die m × r-Matrix mit n aij · bjk , i = 1, . . . , m, k = 1, . . . , r cik :=
(1.10) (1.11)
j=1
Das sieht furchterregend aus, oder? Aber nicht verzagen, Falk wird es richten. Er hatte n¨ amlich die Maik¨ aferidee. Wie das? Betrachten wir das ganze am Beispiel. Dazu seien
A=
1 −1 2 3 −2 4
⎛
⎞ 1 2 11 4
,
⎜ B=⎜ ⎝ −2 3 3 1
⎟ 6 2⎟ ⎠ 4 0
1.3 Rechnen mit Matrizen
7
A hat also 3 Spalten und B hat 3 Zeilen, das passt zusammen. Wir werden am Schema diese Bedingung direkt ablesen k¨ onnen, m¨ ussen also unseren Kopf damit nicht belasten. Wir schreiben jetzt die beiden Matrizen in einer etwas eigenwilligen Form auf, n¨ amlich in einem Dreiecksschema.
B
A 1
-1
2
3
-2
4
1
2
11
4
-2
3
6
2
3
1
4
0
13 19
A·B Abb. 1.1
Das Falk-Schema zur Multiplikation von Matrizen.
Wir wollen das Produkt A · B berechnen. Dazu schreiben wir A links etwas nach unten versetzt und B nach oben rechts. Jetzt der Maik¨ afertrick: So wie zwei Maik¨ afer aufeinander zu krabbeln, krabbeln wir von links nach rechts und zugleich von oben nach unten. Dabei werden die getroffenen Zahlen miteinander multipliziert und die Produkte dann aufsummiert. Wir haben zwei Beispiele eingezeichnet. Da krabbeln wir die erste Zeile der linken Matrix von links nach rechts und die dritte Spalte der oberen Matrix von oben nach unten. Dabei rechnen wir 1 · 11 + (−1) · 6 + 2 · 4 = 13. Genau an den Kreuzungspunkt der beiden Krabbellinien schreiben wir diese 13 hin. Als zweites krabbeln wir die zweite Zeile der linken Matrix von links nach rechts und zugleich die erste Spalte der oberen von oben nach unten mit der Rechnung 3 · 1 + (−2) · (−2) + 4 · 3 = 19 und der 19 am entsprechenden Kreuzungspunkt. Es ist nicht verboten, hier mit den eigenen Fingern die Zeilen und Spalten zu durchlaufen. Wenn Sie das dreimal gemacht haben, wird es richtig einfach, ja und dann macht es sogar Spaß. Hier das vollst¨ andige Ergebnis:
8
1 Matrizen
B
A
1
2
11
4
-2
3
6
2
3
1
4
0
1
-1
2
9
1
13
2
3
-2
4
19
4
37
8
A·B Abb. 1.2 Das Ergebnis der Multiplikation der beiden Matrizen A und B
Wir erhalten
A·B =
9 1 13 2
.
19 4 37 8
Jetzt verrate ich Ihnen auch noch, wie man an dem Schema direkt sieht, ob die Multiplikation u uhrbar ist. Erinnern Sie sich, ¨berhaupt erlaubt und durchf¨ dass wir in der Definition gefordert haben, dass die Anzahl der Spalten von A gleich der Anzahl der Zeilen von B ist? Wer will sich denn so einen Satz merken? Siehste da, m¨ ussen wir auch gar nicht, ergibt sich n¨ amlich ganz von selbst. Schauen Sie nur genau hin.
Abb. 1.3 Der von links krabbelnde Maik¨ afer trifft auf sechs Spalten, also muss der von oben herunter krabbelnde genau sechs Zeilen haben. Und die Produktmatrix hat genau so viele Zeilen wie A und genau so viele Spalten wie B. Sieht man doch, oder?
Bilden Sie sich doch bitte selbst weitere M¨ oglichkeiten, um zu sehen, ob die Multi-Tour geht oder nicht.
1.3 Rechnen mit Matrizen
9
Wie sich das f¨ ur ein gutes Rechnen geh¨ ort, kommen wir jetzt mit sehr ver¨ unftigen Rechenregeln. Zun¨ achst setzen wir fest: Definition 1.7 (Einheitsmatrix) Die Matrix
⎛
1 0
··· 0
⎞
⎜ ⎟ ⎜ 0 1 ··· 0 ⎟ ⎜ ⎟ E=⎜ . . . ⎟ ⎜ .. .. . . ... ⎟ ⎝ ⎠ 0 ··· 0 1
(1.12)
heißt Einheitsmatrix. Satz 1.2 (Rechenregeln) Wir setzen voraus, dass alle folgenden Operationen f¨ ur die beteiligten Matrizen A, B, . . . durchf¨ uhrbar sind. Dann gilt: Assoziativgesetz: (A + B) + C = A + (B + C) Kommutativgesetz: A + B = B + A Neutrales Element f¨ ur Addition: A + O = O + A = A Assoziativgesetz: A · (B · C) = (A · B) · C Neutrales Element f¨ ur Mult.: A · E = E · A = A, die Einheitsmatrix E verh¨ alt sich also bei Multiplikation neutral. 6. Distributivgesetz: A · (B + C) = A · B + A · C 7. Transponierte: (A · B) = B · A
1. 2. 3. 4. 5.
Das m¨ ussen wir noch etwas kommentieren. 1. Die Gesetze 1. bis 4. und 6. sind sehr nat¨ urlich und leicht einsichtig. 2. Dass die Einheitsmatrix beim Multiplizieren nichts ver¨ andert, sollten wir mal kurz nachrechnen, damit auch das einsichtig wird. Wenn wir das f¨ ur eine (3 × 3)-Matrix vorf¨ uhren, glauben Sie mir das wohl auch f¨ ur eine (5 × 5)Matrix. F¨ ur eine (99 × 99)-Matrix mag rechnen, wer will, aber wir sind doch nicht bl¨ od.
⎛
⎞ 1 2 3
⎛
⎞ 1 0 0
⎜ ⎟ ⎜0 1 0⎟ ⎝ ⎠ 0 0 1
⎜ ⎜4 ⎝ 7 ⎛ 1 ⎜ ⎜4 ⎝ 7
⎟ 5 6⎟ ⎠ 8 9 ⎞ 2 3 ⎟ 5 6⎟ ⎠ 8 9
10
1 Matrizen
3. Das Gesetz 7. u ollig u ¨ber die Transponierte ist dagegen v¨ ¨berraschend, und viele Anf¨ anger wollen es einfach nicht glauben. Aber man muss es akzeptieren, dass sich die Reihenfolge beim Transponieren eines Produktes umkehrt. Wir pr¨ ufen das einfach mal an einem Beispiel nach.
Sei A =
2 −1 0
,
B=
3
1 1
.
0 1
Dann ist (bitte, bitte nachrechnen)
(A · B)
=
2 0 1 3
,A · B
=
2 0
, aber B
2 3
·A
=
2 0
1 3
4. Es sollte Ihnen auffallen, das wir kein Kommutativgesetz f¨ ur die Multiplikation behauptet haben. Und tats¨ achlich, dieses Gesetz ist nicht erf¨ ullt. Wie sicher ist uns doch die Regel daher gelaufen, dass immer und u ¨berall 5 · 8 dasselbe ergibt wie 8 · 5. Hier begegnet uns zum ersten Mal ein Rechenbereich, wo dieses Gesetz nicht gilt. Bitte merken Sie sich das ganz fest. Es ist wirklich sehr wichtig, und ein Fehler bei dieser Rechnung kann sich bitter r¨ achen. Selbst bei quadratischen Matrizen A und B, wo ja sowohl A · B als auch B · A als Produkt erkl¨ art ist, kommt in der Regel nicht das gleiche heraus. Also auch hierf¨ ur ein Beispiel: Mit obigen Matrizen A und B haben wir
A·B =
2 1 0 3
, aber B · A =
2 2
.
0 3
Es ist also im allgemeinen A · B = B · A. Wir sollten nicht vers¨ aumen zu sagen, dass f¨ ur die Widerlegung des Kommutativgesetzes ein Gegenbeispiel ausreicht. Auch dass (A · B) = A · B ist, kann mit einem einzigen Beispiel gezeigt werden. Dass aber immer (A·B) = B ·A ist, m¨ usste mit einem allgemeinen Beweis begr¨ undet werden, den wir uns hier ersparen.
1.4
Rang einer Matrix
Jetzt kommen wir zu einem sehr wichtigen Begriff, den wir sp¨ ater bei der L¨ osung von linearen Gleichungssystemen wunderbar gebrauchen k¨ onnen. Von der Schule
1.4 Rang einer Matrix
11
her kennen wir den Begriff linear unabh¨ angig‘ bei Vektoren. Jetzt fassen wir ’ die Zeilen bzw. Spalten einer Matrix als Vektoren auf und erkl¨ aren: Definition 1.8 (Zeilenrang, Spaltenrang) Der Zeilenrang bzw. Spaltenrang einer Matrix A ist die maximale Anzahl linear unabh¨ angiger Zeilen- bzw. Spaltenvektoren. Der folgende Satz ist v¨ ollig u ¨berraschend, auch wenn er so leicht zu formulieren ist: Satz 1.3 Es ist f¨ ur alle Matrizen A ∈ Rm×n Zeilenrang = Spaltenrang. Wieso ist das u ¨berraschend? Betrachten Sie bitte mal die Matrix
⎛
2 3 −1
⎜ A=⎜ ⎝ −2 2 −1 10 0
⎞ 4
1
⎟ 2⎟ ⎠. 1 −1 −4 3
Sie hat drei Zeilen und f¨ unf Spalten. Offensichtlich sind die erste und zweite Zeile linear unabh¨ angig. Wenn wir aber die erste Zeile mit 2 und die zweite Zeile mit −3 multiplizieren und dann beide addieren, so erhalten wir die dritte Zeile: 2 · (2, 3, −1, 4, 1) + (−3) · (−2, 2, −1, 3, 2) = (10, 0, 1, −1, −4). Die dritte Zeile ist also ein Vielfaches der ersten und der zweiten Zeile, also von ihnen linear abh¨ angig. Damit ist der Zeilenrang gleich 2. Und jetzt sollte nach unserem Satz auch der Spaltenrang genau gleich zwei sein, also nur zwei Spalten linear unabh¨ angig und alle anderen von diesen linear abh¨ angig sein? Das ist doch v¨ ollig unglaubw¨ urdig. Diese Aufgabe habe ich mal unangek¨ undigt in einer Klausur gestellt. Tats¨ achlich haben 90 % der Studierenden den Zeilenrang richtig mit zwei angegeben, den Spaltenrang dann aber mit f¨ unf. Hier muss man die erste Spalte mit 1/10 und die zweite Spalte mit −4/10 multiplizieren und dann beide addieren, um die dritte Spalte zu erhalten. Analog lassen sich die Spalten vier und f¨ unf aus den Spalten eins und zwei kombinieren. In der Tat ist dies einer der u atze der Anf¨ angermathematik, ¨berraschendsten S¨ und Sie sollten ihn schon verbl¨ ufft zur Kenntnis nehmen.
12
1 Matrizen
Interessant ist vielleicht folgende Bemerkung. Im Beweis dieses Satzes f¨ ur reelle Matrizen, der u ¨brigens nicht so schwer ist, wird mitten drin irgendwo das Kommutativgesetz der Multiplikation reeller Zahlen gebraucht, also a · b = b · a. In Bereichen, wo dieses Gesetz nicht gilt, haben wir daher auch evtl. die Ranggleichheit nicht. Einen solchen Bereich haben wir gerade bei den Matrizen kennen gelernt. Wenn wir also Matrizen betrachten, deren Eintr¨ age kleine (2×2)-Matrizen sind, so kann dort der Zeilenrang verschieden vom Spaltenrang sein. Hier noch drei leichte Beispiele zum Rang einer Matrix:
⎛ ⎜ ⎜ A=⎜ ⎜ ⎝
−2 0 0 0
⎞
⎟ 0 3 0 2⎟ ⎟, ⎟ 0 0 0 1⎠ 0 0 0 0
⎛
⎞ 1 2 3 4
⎜ ⎟ ⎟ B=⎜ ⎝ 0 0 1 2 ⎠, 0 0 0 1
⎛
⎞ 1 2 1
⎜ ⎟ ⎟ C=⎜ ⎝0 1 1⎠ 0 2 2
Wir wissen ja, dass der Nullvektor stets von jedem anderen Vektor linear abh¨ angig ist. Damit erhalten wir rg(A) = 3,
rg(B) = 3,
rg(C) = 2.
Um bei komplizierteren Matrizen den Rang bestimmen zu k¨ onnen, aber nicht nur aus diesem Grund betrachten wir einige Rechenoperationen: Definition 1.9 (Elementare Umformungen) Folgende Zeilen- bzw. Spaltenumformungen heißen elementare Umformungen: 1. Vertauschen von zwei Zeilen bzw. Spalten, 2. Multiplikation einer Zeile bzw. Spalte mit einer Zahl c = 0, 3. Addition eines Vielfachen einer Zeile bzw. Spalte zu einer anderen Zeile bzw. Spalte. Der n¨ achste Satz erkl¨ art uns den Sinn dieser Operationen: Satz 1.4 Durch diese elementaren Umformungen wird der Rang einer Matrix nicht ver¨ andert. Das ist doch klasse, jetzt k¨ onnen wir manipulieren und dadurch leichter den Rang bestimmen. Betrachten wir ein Beispiel.
⎛ ⎜ A=⎜ ⎝
1 −2 1 −1
⎞ 2
⎟ 1⎟ ⎠. 1 −3 0
1.4 Rang einer Matrix
13
In das Manipulieren wollen wir jetzt eine strenge Ordnung bringen. Man k¨ onnte ja die elementaren Umformungen beliebig auf die Matrix los lassen, zeilen- oder ¨ spaltenweise oder gemischt, aber dann verliert man schnell den Uberblick. Wir arbeiten daher nur mit Zeilenumformungen und lassen stets die erste Zeile, wenn m¨ oglich, v¨ ollig ungeschoren. Sonderf¨ alle kommen sp¨ ater. Dann multiplizieren wir die erste Zeile mit solch einer Zahl, dass bei Addition der ersten Zeile zur zweiten Zeile dort das erste Element a21 verschwindet. In der Matrix A oben m¨ ussen wir dazu die erste Zeile mit −1 multiplizieren. Wenn wir sie dann zur zweiten Zeile addieren, erhalten wir a21 = 0, fein. Genau so manipulieren wir die dritte Zeile, indem wir einfach die erste Zeile zu ihr addieren, also mit 1 multiplizieren und dann addieren, wenn Sie so wollen:
⎛ ⎜ A=⎜ ⎝
1 −2 1 −1
⎞ 2
⎟ 1⎟ ⎠ 1 −3
⎛
·(−1) ·1 −→
←
0
←
1 −2
⎞ 2
⎜ ⎟ ⎜ 0 2 −1 ⎟ ⎝ ⎠ 0 −1 −1
So haben wir locker zwei Nullen in die erste Spalte unterhalb des Diagonalelementes erzeugt. Das war der erste Streich. Jetzt arbeiten wir weiter mit der zweiten Spalte, um wieder unterhalb des Diagonalelementes a22 Nullen zu erzeugen usw., bis wir am Ende eine obere Dreiecksmatrix haben, in der also unterhalb der Diagonalen nur Nullen stehen. Der Rang einer solchen Matrix ist dann leicht abzulesen. Satz 1.5 Jede (m × n)-Matrix A l¨ asst sich durch elementare Umformungen, also ohne ihren Rang zu ¨ andern, in die Zeilenstufenform
⎛
⎜ ⎜0 A=⎜ ⎜ ⎝0 0 0
⎞ ⎟ ⎟ ⎟, ⎟ ⎠
(1.13)
0 0 0 0 u uhren. Ihr Rang ist dann gleich der Anzahl der Stufen. Sie sind hier mit ¨berf¨ gekennzeichnet. Die mit gekennzeichneten Pl¨ atze sind dabei Zahlen = 0, unter den Stufen stehen nur Nullen. Sonst k¨ onnen beliebige Zahlen auftreten. Jetzt erleichtern wir uns die Schreiberei noch etwas. Die erzeugten Nullen m¨ ussen wir doch gar nicht aufschreiben. Wir machen ja unter das Diagonalelement einen Strich, darunter stehen nach richtiger Rechnung nur Nullen. Diese Pl¨ atze benutzen wir jetzt dazu, unsere Faktoren, die wir oben rechts an die Matrix geklemmt haben, hineinzuschreiben. Wir werden ihnen sp¨ ater (vgl. S. 39) einen eigenen Namen geben. Ihr Eintrag unterhalb der Stufen wird uns dann zu einer leichten L¨ osungsmethode bei linearen Gleichungssystemen f¨ uhren.
14
1 Matrizen
Obige Matrix lautet dann:
⎛
⎞
1 −2
⎜ A=⎜ ⎝
⎛
2
⎟ 1⎟ ⎠ 1 −3
1 −1
2
⎜ ⎟ ⎜ −1 2 −1 ⎟ ⎝ ⎠ 1 −1 −1
−→
0
⎞
1 −2
Ich hoffe, Sie verstehen auch sofort den zweiten Schritt:
⎛ ⎜ A=⎜ ⎝
⎞
1 −2 1 −1
⎛
⎞
1 −2
2
⎛
2
1
−2
⎞ 2
⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 2 −1 ⎟ 1⎟ ⎠ → ⎝ −1 2 −1 ⎠ → ⎝ −1 ⎠ 1 −1/2 −1/2 1 −1 −1 1 −3 0
Jetzt ist unsere Matrix in Zeilenstufenform, und wir sehen, dass ihr Rang 3 ist. Betrachten wir noch ein Beispiel, um das Gelernte zu festigen.
⎛
−1
⎜ ⎜ B=⎜ ⎜ ⎝
2
5
⎞
0
⎟ 4⎟ ⎟ ⎟ 1 −3 −7 −1 ⎠ 2
0 −2
3
1 −1
7
Das sieht doch nach einer ganz gew¨ ohnlichen Matrix aus, man k¨ onnte vermuten, dass ihr Rang 4 ist. Mal sehen. Wir schreiben nur die verk¨ urzte Form auf, Sie werden es hoffentlich verstehen.
⎛ ⎜ ⎜ B→⎜ ⎜ ⎝
−1
2
5
2
4
8
0
⎞
⎛
−1
2
⎟ ⎜ ⎜ 4⎟ ⎟→⎜ 2 ⎟ ⎜ 1 −1 −2 −1 ⎠ ⎝ 1 7 14
3
7
3
4 1/4
5 0
⎞
⎟ 8 4⎟ ⎟ ⎟ 0 0⎠
−7/4 0 0
Wer h¨ atte das vorher erkannt? Diese Matrix hat man gerade den Rang 2, nur die ersten zwei Zeilenvektoren sind linear unabh¨ angig. Also bitte nicht t¨ auschen lassen. Hier noch ein kleines Beispiel, das uns lehrt, mit dem Begriff Rang nicht so ganz sorglos umzugehen.
A=
1
2
−2 −4
,
B=
2 −4 −1
2
Dann ist
rg(A) = rg
1
2
−2 −4
= rg
1 2 2 0
=1
1.5 Quadratische Matrizen
15
und
rg(B) = rg
2 −4 −1
2 −4
= rg
2
1/2
= 1,
0
aber es ist
1
2
−2 −4
2
−4
−1 2
0 0
.
0 0
Damit ist der Rang des Produktes rg(A · B) = 0. Beweisen k¨ onnen wir nur folgende recht schwache Aussage: Satz 1.6 Sind A und B zwei Matrizen mit jeweils m Zeilen und n Spalten, so gilt: rg(A · B) ≤ min(rg(A), rg(B)).
1.5
(1.14)
Quadratische Matrizen
Definition 1.10 (Quadratische Matrix) Eine (m × n)-Matrix heißt quadratisch, wenn m = n ist, wenn also die Anzahl der Zeilen gleich der Anzahl der Spalten ist. Die Zahlenreihe a11 , a22 , . . . , ann heißt die Hauptdiagonale von A. Die Summe der Hauptdiagonalelemente sp (A) := a11 + a22 + · · · + ann heißt die Spur von A. Ein Beispiel gef¨ allig?
⎛ ⎜ A=⎜ ⎝
−1 2 −3
⎞
⎟ 2 1 −1 ⎟ ⎠ =⇒ sp (A) = −1 + 1 + 3 = 3. 1 0 3
Definition 1.11 (Diagonalmatrix) Eine quadratische Matrix A heißt Diagonalmatrix, wenn außerhalb der Hauptdiagonalen nur Nullen stehen.
16
1 Matrizen
Definition 1.12 (Symmetrische Matrix) Eine quadratische Matrix A heißt symmetrisch, wenn gilt: A = A .
(1.15)
Eine quadratische Matrix A heißt schiefsymmetrisch , wenn gilt: A = −A .
(1.16)
Auch diese Begriffe sind sehr anschaulich. Spiegeln Sie die Matrix A an ihrer ¨ Hauptdiagonalen. Entsteht dann dieselbe Matrix, so ist sie symmetrisch. Andern sich alle Vorzeichen bei sonst gleichen Zahlen, so ist sie schiefsymmetrisch. Klar, dass eine schiefsymmetrische Matrix nur Nullen auf der Hauptdiagonalen haben darf. Der folgende Satz l¨ asst sich manchmal bei physikalischen Problemen sinnvoll anwenden, weil symmetrische Matrizen leichter zu handhaben sind. Satz 1.7 Jede quadratische Matrix A l¨ asst sich in die Summe aus einer symmetrischen und einer schiefsymmetrischen Marix zerlegen, n¨ amlich A=
1 · (A + A ) 2
symmetrisch
+
1 · (A − A ) 2
schiefsymmetrisch
.
(1.17)
1.5 Quadratische Matrizen
17
¨ Ubung 1 1. Gegeben seien die beiden Matrizen
⎛
⎞
6 3
⎜ ⎟ ⎟ A=⎜ ⎝ 4 2 ⎠, 2 1
B=
3 −2 −5 −2
1
4
Berechnen Sie A · B,
(A · B) ,
B · A,
(B · A)
2. Gegeben seien die Matrix
A=
0 −1 1
0
und das Polynom p(x) = 2 · x4 − 3 · x2 + x + 4. Berechnen Sie die Potenzen A2 , A3 3. Bestimmen Sie f¨ ur die Matrix ⎛ 1 −2 ⎜ ⎜ A=⎝1 1 2 a−1
und A4 und die Matrix p(A).
−2 0
⎞
⎟ 2⎟ ⎠, −2 2 a
a∈R
den Rang in Abh¨ angigkeit vom Parameter a ∈ R. 4. Stellen Sie die Matrix
A=
1 2
3 4 als Summe aus einer symmetrischen und einer schiefsymmetrischen Matrix dar.
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
18
1.6
1 Matrizen
Inverse Matrizen
Wir hatten ja oben bereits festgestellt, dass wir das Kommutativgesetz f¨ ur die Multiplikation bei Matrizen nicht haben. Jetzt kommt noch ein zweiter Punkt, wo es Einschr¨ ankungen bei Matrizen gibt, das sind die bezgl. der Multiplikation inversen Elemente. Durch reelle Zahlen, die nicht Null sind, k¨ onnen wir ja teilen und dadurch Gleichungen aufl¨ osen. Das geht hier leider auch nur in Sonderf¨ allen. Diese beschreiben wir in der folgenden Definition. Definition 1.13 (Inverse Matrix) Seien A, B zwei reelle quadratische (n × n)-Matrizen. Ist A · B = E,
(1.18)
so heißen A und B invers zueinander. Wir schreiben B = A−1 .
(1.19)
Existiert f¨ ur eine Matrix A die inverse Matrix A−1 , so nennen wir A invertierbar oder regul¨ ar, sonst heißt sie singul¨ ar. Leider wird der Begriff regul¨ ar‘ in der Mathematik an sehr vielen Stellen in ’ unterschiedlichster Bedeutung benutzt. Im Zusammenhang mit quadratischen Matrizen aber ist er klar definiert: A heißt regul¨ ar, wenn die inverse Matrix zu A existiert. Satz 1.8 Sei A eine (n × n)-Matrix, also quadratisch. Dann existiert die inverse Matrix A−1 genau dann, wenn rg(A) = n ist, wenn also alle Zeilenvektoren oder Spaltenvektoren linear unabh¨ angig sind. Das ist doch mal ein sehr konkreter Satz und wir wissen jetzt, warum wir uns oben mit dem abstrakten Begriff Rang‘ rumschlagen mussten. Schnell ein Bei’ spiel, damit die Begriffe klarer werden. Seien
A=
3 1
,
B=
5 2
2 −1 −5
Dann ist
2 −1 −5
3
3 1 5 2 1 0 0 1
,
3
.
1.7 Orthogonale Matrizen
19
also
1 0
A·B =
,
0 1
B ist also invers zu A. Die Matrix
C=
1
2
−2 −4
hat dagegen keine inverse, da rg(C) = 1 ist.
1.7
Orthogonale Matrizen
Diese Matrizen beschreiben wir hier nur der Vollst¨ andigkeit wegen. Orthogonale Matrizen werden Ihnen sp¨ ater vielleicht recht h¨ aufig begegnen. Sie spielen eine große Rolle in der Physik und den angewandten Wissenschaften. Definition 1.14 (Orthogonale Matrix) Eine quadratische Matrix A ∈ Rn×n heißt orthogonal, wenn die Zeilenvektoren paarweise senkrecht aufeinander stehen und normiert sind. In der Schule habe wir gelernt, dass zwei Vektoren genau dann aufeinander senkrecht stehen, wenn ihr inneres Produkt verschwindet. F¨ ur die Zeilenvektoren
a1 = (a11 , a12 . . . . , a1n ), . . . , an = (an1 , an2 . . . . , ann ) der Matrix A bedeutet das z.B. a1 · a2 = a11 · a12 + · · · + a1n · a2n = 0, oder allgemein
ai · aj = 0
i, j = 1, . . . , n, i = j.
f¨ ur
Ein Vektor heißt normiert, wenn seine L¨ ange gleich 1 ist, oder gleichbedeutend, sein inneres Produkt mit sich selbst ist gleich 1, also a1 · a1 = 1, oder allgemein
ai · ai = 1, i = 1, . . . , n. Damit wir noch sicherer werden, ein kleines Beispiel. Sei
A=
1 2 1 2
·
√ 3
− 12 ·
√ 3
1 2
Wir zeigen, dass A eine orthogonale Matrix ist.
.
20
1 Matrizen
1 2 1 = 2 1 = 4 1 = 2
a1 · a2 =
a1 · a1
a2 · a2
1 √ 1 1 √ · 3 − · 3 · = 0, 2 2 2 1 1 √ 1 √ · + (− · 3) · (− · 3), 2 2 2 3 + = 1, 4 √ 1 √ 1 1 · 3 · · 3 + · = 1. 2 2 2 ·
Wir stellen einge Aussagen u ¨ber orthogonale Marizen zusammen. Satz 1.9 Sei A eine quadratische Matrix. Dann gilt: 1. 2. 3. 4. 5.
Ist A orthogonal, so ist A regul¨ ar. A ist genau dann orthogonal, wenn A · A = E, also wenn A = A−1 ist. A ist genau dann orthogonal, wenn A · A = E. Ist A orthogonal, so sind auch A−1 und A ortogonal. Sind A, B ∈ Rn×n orthogonal, so ist auch A · B orthogonal.
Die Ergebnisse sind teilweise so u ¨berraschend, dass wir uns die Beweise anschauen wollen. Zu 1. Wenn die Zeilen paarweise aufeinander senkrecht stehen, so sind sie auf jeden Fall linear unabh¨ angig. Diese Aussage ist also klar. ¨ Ubrigens, paarweise bedeutet, dass man sich beliebig Paare greifen kann. Diese m¨ ochten bitte immer senkrecht aufeinander stehen. Ohne diese Voraussetzung k¨ onnte es doch passieren, dass der erste Vektor senkrecht auf dem zweiten steht, der zweite senkrecht auf dem dritten, aber dieser dritte muss dann nicht senkrecht auf dem ersten stehen. Der dritte Vektor k¨ onnte ja z.B. wieder der erste sein. Zu 2. Schauen wir uns dazu das Falk-Schema mit A und A an: A A A · A Wir haben also links die Matrix A und rechts oben die Matrix A . Die hat ja als Spalten gerade die Zeilen von A. Jetzt lassen wir die K¨ aferchen laufen; dadurch bilden wir genau innere Produkte der Zeilen von A (links) mit den Spalten von A , also den Zeilen von A (rechts oben). Unsere Orthogonalit¨ atsbedingung besagt, dass hier bei gleichen Zeilen 1, sonst 0 herauskommt, und das ergibt genau die Einheitsmatrix. Haben wir umgekehrt A · A = E, so sind nach diesem Schema die Zeilen aufeinander senkrecht bzw. normiert.
1.7 Orthogonale Matrizen
21
Zu 3. Diese Aussage ist ganz u asst sich aber sehr leicht herlei¨berraschend, l¨ ten. Sei A orthogonal, also A · A = E. Diese Gleichung multiplizieren wir von links mit A−1 . Diese Matrix existiert ja nach 1. −1 −1 −1 −1 A
· A ·A = A · E = A , also folgt A = A . E
Jetzt multiplizieren wir diese letzte Gleichung von rechts mit A und erhalten: A · A = A−1 · A = E, und das haben wir behauptet. Aber was bedeutet diese schlichte Zeile? Schauen Sie einfach weder auf das Falk-Schema: A
A
E
Links krabbeln wir die Zeilen lang, aber in A , das sind also die Spalten von A, oben krabbeln wir auch die Spalten runter, und es ergibt sich E. Also stehen die Spalten aufeinander senkrecht. Das h¨ atte man doch kaum erwartet: Wenn in einer quadratischen Matrix die Zeilen paarweise aufeinander senkrecht stehen und normiert sind, so gilt genau das gleiche auch f¨ ur die Spalten. Zu 4 Sei A orthogonal. Dann existiert A−1 und es gilt (A−1 ) = (A ) = A = (A−1 )−1 =⇒ A−1 ist orthogonal. Zu 5. (A · B) = B · A = B −1 · A−1 = (A · B)−1 =⇒ A · B ist orthogonal. Hier noch zwei Beisiele orthogonaler Matrizen.
A=
1 2 1 2
·
√
− 12 ·
√ 3
1 2
3
,
B=
cos α − sin α sin α
.
cosα
Bitte rechnen Sie doch kurz nach, dass wirklich A · A = E gilt. B · B = E folgt wegen cos2 α + sin2 α = 1. Bequem ist es, f¨ ur orthogonale Matrizen ihre inverse Matrix auszurechnen. Die muss man n¨ amlich gar nicht lange suchen, sondern es ist ja A−1 = A f¨ ur orthogonale Matrizen. Hier folgt also
A
−1
=
1 2
− 12 ·
√ 3
1 2
·
√ 3
1 2
,
B
−1
=
cos α
sin α
− sin α cosα
.
22
1 Matrizen
¨ Ubung 2 1. Gegeben seien die beiden Matrizen
A=
1 −1 2 3 −2 4
⎛
⎞ 1 2 11 4
⎜ B=⎜ ⎝ −2 3 3 1
,
⎟ 0 2⎟ ⎠ 4 0
¨ Uberpr¨ ufen Sie mit diesen Matrizen die Aussage von Satz 1.6: rg(A · B) =≤ min(rg(A), rg(B)) 2. Zeigen Sie (vgl. Satz 1.7), dass sich jede quadratische Matrix A ∈ Rn×n in die Summe A=
1 1 · (A + A ) + · (A − A ) 2 2
zerlegen l¨ asst, wobei 12 · (A + A ) symmetrisch und metrisch ist. 3. Zeigen Sie, dass die Matrizen
⎛ ⎜ A=⎜ ⎝
1 −2 1 −1
⎞
⎟ 1⎟ ⎠ 1 −3
· (A − A ) schiefsym-
⎛
2
0
1 2
⎞ 1
und
B=
4
2
⎟ 1 ⎜ ·⎜ −2 1 −1 ⎟ ⎝ ⎠ 3 −1 −1 −2
invers zueinander sind. 4. Zeigen Sie, dass die Matrix
⎛
⎞ 1 0 2
⎜ ⎟ ⎟ A=⎜ ⎝ −1 1 0 ⎠ 1 1 4 keine inverse Marix besitzt.
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
2 Determinanten
¨ Ubersicht 2.1 2.2
Erste einfache Erkl¨ arungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Elementare Umformungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23 26
In diesem Kapitel stellen wir einen Begriff vor, der uns gar nicht oft begegnen wird, der aber trotzdem seine Bedeutung hat. Wir kommen in Kapitel Diffe’ renzierbarkeit‘ darauf zur¨ uck. Weil wir aber mit diesem Begriff nur sehr eingeschr¨ ankt arbeiten werden, stellen wir ihn auch nur in einer sehr abgespeckten Form vor. Wenn Sie mehr u ¨ber dieses Gebiet erfahren wollen, schlagen Sie bitte in guten Mathematikb¨ uchern nach.
2.1
Erste einfache Erkl¨ arungen
Jeder quadratischen Matrix und nur diesen wird auf raffinierte Weise eine Zahl, ihre Determinante zugeordnet. Nur f¨ ur (2 × 2)- und (3 × 3)-Matrizen wollen wir etwas genauer darauf eingehen. Definition 2.1 (Determinante einer (2 × 2)-Matrix) Sei
A=
a11 a12
a21 a22
∈ R2×2 .
(2.1)
= a11 · a22 − a12 · a21
(2.2)
Dann heißt die reelle Zahl
det(A) = |A| = det
a11 a12 a21 a22
die Determinante von A. Dazu ein Beispiel.
N. Herrmann, Mathematik für Naturwissenschaftler, DOI 10.1007/978-3-8274-2867-7_2, © Spektrum Akademischer Verlag Heidelberg 2012
24
2 Determinanten
A =
B =
−2
3
=⇒ det(A) = (−2) · (−1) − 3 · (−2) = 8
−2 −1
1 −2 −1
=⇒ det(B) = 1 · 2 − (−2) · (−1) = 0
2
Eine ¨ ahnlich einfache Regel gibt es f¨ ur (3 × 3)-Matrizen, und nur f¨ ur solche. Sie ist nicht f¨ ur gr¨ oßere Matrizen u ¨bertragbar. Definition 2.2 (Determinante einer (3 × 3)-Matrix) Sei A eine reelle (3 × 3)-Matrix:
⎛
⎞ a11 a12 a13
⎜ ⎟ ⎟ A=⎜ ⎝ a21 a22 a23 ⎠ . a31 a32 a33 Dann heißt det(A) = |A|
(2.3)
a11 · a22 · a33 + a21 · a32 · a13 + a31 · a12 · a23
=
−a13 · a22 · a31 − a23 · a32 · a11 − a33 · a12 · a21 die Determinante von A. Das sieht schrecklich aus, aber daf¨ ur haben wir ja Sarrus, der uns eine einfache Merkregel spendiert hat. Satz 2.1 (Regel von Sarrus f¨ ur (3 × 3)-Matrizen)
a11
a12
a13
a21
a22
a23
a+ 31 + a11
a32
j a33
a12
s a13
a21
a22
ja23
Abb. 2.1 Die Regel von Sarrus
Wir schreiben die ersten beiden Zeilen unter die Matrix darunter. Dann folgen wir den Pfeilen. Jeder Pfeil trifft drei Eintr¨ age der Matrix. Diese werden jeweils miteinander multipliziert. Dann werden die Produkte, die zu Pfeilen von links oben nach rechts unten geh¨ oren, addiert; die Produkte zu Pfeilen von rechts oben nach links unten werden subtrahiert.
Vergleichen Sie das Ergebnis bitte mit der Definition (2.4), es ergibt sich genau dieser Ausdruck. Wir sollten noch einmal betonen, dass diese wundersch¨ one Regel nur f¨ ur (3 × 3-Matrizen verwendet werden kann. Sie l¨ asst sich nicht auf gr¨ oßere Matrizen verallgemeinern. Das bitte unbedingt im Ged¨ achtnis behalten.
2.1 Erste einfache Erkl¨ arungen
25
Mit einem Beispiel wird es noch leichter. Sei dazu
⎛
⎞ 1 2 3
⎜ ⎟ ⎟ A=⎜ 4 5 6 ⎝ ⎠ 7 8 9 Dann rechnen wir mit Herrn Sarrus: 1
2
3
4
5
6
8 2
j9 s3
5
j6
+ 7 + 1 4
det(A) = 1 · 5 · 9 + 4 · 8 · 3 + 7 · 2 · 6 −3 · 5 · 7 − 6 · 8 · 1 − 9 · 2 · 4 = 45 + 96 + 84 − 105 − 48 − 72 = 225 − 225 = 0
Abb. 2.2 Beispiel zur Regel von Sarrus
Beim folgenden Beispiel lassen wir schon mal die Pfeile weg, damit das Bild einfacher ausschaut. Wenn Sie viel ge¨ ubt haben, m¨ ussen Sie auch die beiden Zeilen nicht mehr darunter schreiben. Dann geht alles im Kopf.
⎛ ⎜ A= ⎜ ⎝
−2 1
⎞ 0
⎟ 2⎟ ⎠ 0 0 −4 0 3
−2
1
0
0
3
2
det(A) = (−2) · 3 · (−4) + 0 + 0 −0 − 0 − 0 = 24
Dieses Beispiel gibt uns gleich einen Hinweis f¨ ur spezielle Matrizen, der sehr n¨ utzlich sein wird. Satz 2.2 Ist A ∈ Rn×n eine obere (oder untere) Dreiecksmatrix, so ist det(A) das Produkt der Diagonalelemente.
26
2.2
2 Determinanten
Elementare Umformungen
Diese Umformungen, die uns schon bei der Berechnung des Ranges einer Matrix geholfen haben, sind genau so gute Hilfsmittel zur Berechnung von Determinanten, aber Achtung, es gibt kleine Unterschiede. Satz 2.3 Sei A ∈ Rn×n eine quadratische Matrix. Dann gilt: 1. Vertauscht man zwei Zeilen oder zwei Spalten in A, so wird die Determinante mit −1 multipliziert, sie ¨ andert also ihr Vorzeichen. 2. Multipliziert man eine Zeile oder eine Spalte mit a ∈ R, so wird die Determinante mit dieser Zahl multipliziert. Wird die gesamte Matrix mit einer Zahl a ∈ R multipliziert, so werden ja n Zeilen oder Spalten mit dieser Zahl multipliziert, und es ergibt sich: det(a · A) = an · det(A)
(2.4)
3. Addiert man das Vielfache einer Zeile bzw. Spalte zu einer anderen Zeile bzw. Spalte, so ¨ andert sich die Determinante nicht. Gerade dieser 3. Punkt ist es, der sich prima verwenden l¨ asst. Wir werden mit dieser Regel versuchen, eine gegebene Matrix auf Dreiecksgestalt zu u uhren ¨berf¨ und dann mit Satz 2.2 ihre Determinante berechnen.
⎛
1
2 3
0
⎞
⎛
⎜ ⎟ ⎜ ⎜ 0 1 2 −2 ⎟ ⎜ ⎜ ⎟ ⎜ A := ⎜ ⎟→⎜ ⎝ −1 −1 3 2 ⎠ ⎝ 1
⎛ ⎜ ⎜ → ⎜ ⎜ ⎝
1
1 2 2 3
0 0
⎞
⎟ ⎜ ⎜ 1 2 −2 ⎟ ⎟→⎜ ⎟ ⎜ 1 −1 4 4 ⎠ ⎝ 0
1 1 −2 ⎞ 1 2 3 0 ⎜ ⎟ ⎜ 0 1 2 −2 ⎟ ⎜ ⎟ =: B → ⎜ ⎟ ⎝0 0 4 4⎠
⎛
⎛
−1
1
2
3
0
0
1
1
1
−1 −1 −1
0
1
2
0
1
1 −1 −1
⎞
⎟ 2 −2 ⎟ ⎟ ⎟ 6 2⎠ 3
0
⎞
⎟ 2 −2 ⎟ ⎟ ⎟ 4 4⎠
1 −1/4 −3
0 0 0 −3 Diese elementaren Umformungen, die wir oben durch Pfeile → angedeutet haben, a ¨ndern die Determinante nicht. Daher erhalten wir:
2.2 Elementare Umformungen
27
det(A) = det(B) = 1 · 1 · 4 · (−3) = −12. Damit haben wir ein wirklich praktikables Verfahren zur Berechnung von Determinanten auch gr¨ oßerer Matrizen kennen gelernt. Aber aufpassen, wirklich nur die Operation 3. durchf¨ uhren, nicht zwischendurch mal, weil uns die Vorzeichen nicht passen, schnell mit (−1) multiplizieren oder zwei Zeilen vertauschen. Der folgende Satz enth¨ alt einige Rechenregeln, die wertvolle Hilfen zur Berechnung von Determinanten liefern. Satz 2.4 Seien A, B ∈ Rn×n . Dann gilt: 1. Determinantenmultiplikationssatz: det(A · B) = det(A) · det(B),
(2.5)
2. det(A ) = det(A),
det(E) = 1,
(2.6)
3. det(A) = 0 ⇐⇒ rg(A) = n,
(2.7)
die Zeilen bzw. Spalten bilden also ein linear unabh¨ angiges System, 4. det A = 0 =⇒ det(A−1 ) =
1 . det(A)
(2.8)
¨ In Ubung 3, S. 22 haben wir nachgerechnet, dass die beiden Matrizen
⎛ ⎜ A=⎜ ⎝
1 −2 1 −1
⎞
⎟ 1⎟ ⎠ 1 −3 0
⎛
2
⎞ 1
und
B=
4
2
⎟ 1 ⎜ ·⎜ −2 1 −1 ⎟ ⎝ ⎠ 3 −1 −1 −2
invers zueinander sind, dass also A · B = E ist. Wir berechnen jetzt det A und det B und pr¨ ufen den Determinantenmultiplikationssatz (2.5). Mit Sarrus erhalten wir: ⎛ ⎞ 1 −2 2 ⎜ ⎟ ⎜ 1 0 1⎟ ⎝ ⎠ → det(A) = 1 · 0 · (−3) + 1 · 1 · 2 + (−1) · (−2) · 1 −1 1 −3 −2 · 0 · (−1) − 1 · 1 · 1 − (−3) · (−2) · 1 1 −2 2 = 0 + 2 + 2 − 0 − 1 − 6 = −3 1 0 1
28
2 Determinanten
⎛
1 ⎜ 3 ⎜ −2 ⎝ 3 − 13 1 3 − 23
4 3 1 3 − 13 4 3 1 3
⎞
2 3 ⎟ − 13 ⎟ ⎠ − 23 2 3 − 13
2 2 1 2 1 1 · · (− ) + (− ) · (− ) · 3 3 3 3 3 3 1 4 1 2 1 1 +(− ) · ( ) · (− ) − · · (− ) 3 3 3 3 3 3 1 1 1 2 4 2 −(− ) · (− ) · − (− ) · ( ) · (− ) 3 3 3 3 3 3 9 1 · [−2 + 4 + 4 + 2 − 1 − 16] = − = 27 27
→ det(B) =
Es folgt also det(A) · det(B) = (−3) · (−
9 27 )= = 1 = det(A · B) = det(E) = 1 27 27
¨ in guter Ubereinstimmung mit dem Determinantenmultiplikationssatz. Zum Schluss dieser ersten Erkl¨ arungen hier noch der Hinweis, dass man in Mathematikb¨ uchern selbstverst¨ andlich eine sehr allgemeine Definition der Determinante einer (n × n)-Matrix findet. Dabei wird von den Permutationen der Zahlen 1, . . . , n Gebrauch gemacht. Wir wollen nur bemerken, dass es bekanntlich n! viele Permutationen dieser Zahlen gibt. Das ist eine rasant ansteigende Zahl. Man wird also schon f¨ ur n = 10 M¨ uhe haben, nach dieser Definition eine Determinante auszurechnen. F¨ ur n = 100 braucht man schon einen sehr großen Computer, und selbst die gr¨ oßten Computer werden streiken, wenn wir Matrizen f¨ ur n = 1000 vor uns haben. Solche Dinger sind aber Anwendern heutzutage allgegenw¨ artig. Determinanten kann man da einfach vergessen. Wir merken uns: Eine Determinante ist eine schlichte reelle Zahl, die auf komplizierte Weise einer quadratischen Matrix zugeordnet wird.
2.2 Elementare Umformungen
29
¨ Ubung 3 1. Berechnen Sie von folgenden Matrizen jeweils ihre Determinante:
A=
1 −1 3 −2
⎛
⎞
⎛
1 2 11
⎜ B=⎜ ⎝ −2 3 3 1
,
⎞ 1 0 0
⎟ 0⎟ ⎠, 4
⎜ ⎟ ⎟ C=⎜ ⎝ 2 3 0⎠ 11 4 4
2. Berechnen Sie mit elementaren Umformungen die Determinante folgender Matrix:
⎛
1 −3
5
−2
1 −1
2
−3
⎞
⎜ ⎟ ⎜ −2 6 −10 4⎟ ⎜ ⎟ A=⎜ ⎟ 3 −1 3 −10 ⎝ ⎠ 3. Verifizieren Sie an Hand der Matrix
⎛
⎞ 1 2 11
⎜ A=⎜ ⎝ −2 3 3 1
⎟ 0⎟ ⎠ 4
die Aussage det (A) = det (A ). 4. Verifizieren Sie an Hand der beiden Matrizen
A=
1 −1 3 −2
,
B=
1 2
−2 3
den Determinantenmultipliktionssatz. 5. Zeigen Sie, dass f¨ ur eine regul¨ are n × n-Matrix A gilt: det(A−1 ) =
1 det(A)
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
3 Lineare Gleichungssysteme
¨ Ubersicht 3.1 3.2 3.3 3.4 3.5
Bezeichnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Existenz und Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Determinantenkriterium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . L-R-Zerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pivotisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31 32 36 36 45
Lineare Gleichungssysteme sind uns ja von der Schule her wohlvertraut. Schon in der 9. Klasse haben wir gelernt, 3 Gleichungen mit 3 Unbekannten zu l¨ osen. Daher werden wir in diesem Kapitel gleich ziemlich allgemein an die Sache herangehen.
3.1
Bezeichnungen
Wir starten mit der Definition des allgemeinsten Falles. Definition 3.1 (Lineares Gleichungssystem) Gegeben seien eine Matrix A und ein Vektor b
⎛
⎞ a11 · · · a1n ⎜ . .. ⎟ ⎟ . A=⎜ . ⎠, ⎝ . am1 · · · amn
⎛
⎞ b1 ⎜ ⎟
b = ⎜ .. ⎟ . ⎝ . ⎠ bm
Gesucht wird ein Vektor
⎛
⎞ x1 ⎜ . ⎟ . ⎟
x = ⎜ ⎝ . ⎠, xn
N. Herrmann, Mathematik für Naturwissenschaftler, DOI 10.1007/978-3-8274-2867-7_3, © Spektrum Akademischer Verlag Heidelberg 2012
32
3 Lineare Gleichungssysteme
ost: der das folgende System von m Gleichungen mit n Unbekannten x1 , . . . , xn l¨ a11 · x1 + a12 · x2 + · · · + a1n · xn = b1 a21 · x1 + a22 · x2 + · · · + a2n · xn = b2 .. .. . .
(3.1)
am1 · x1 + am2 · x2 + · · · + amn · xn = bm Ein solches System heißt lineares Gleichungssystem (LGS). Wir schreiben es auch k¨ urzer als A · x = b.
(3.2)
Bitte machen Sie sich an Hand der Matrizenmultiplikation klar, dass die Kurzschreibweise (3.2) genau zu dem Gleichungssystem (3.1) f¨ uhrt. Aus diesem Schema kann man auch sofort erkennen, dass der Vektor x genau n Komponenten hat, w¨ ahrend der Vektor der rechten Seite b dann m Komponenten haben muss, weil sonst das Schema nicht passen w¨ urde. Man muss sich das also nicht extra merken. ¨ Ubrigens hat sich in der Mathematik kein eigener Name f¨ ur den Vektor b eingeb¨ urgert. Manchmal taucht bei Studierenden der Name L¨ osungsvektor“ auf, ” das ist aber ganz schlecht und geht gar nicht. Der L¨ osungsvektor ist eindeutig der gesuchte Vektor x und keiner sonst. Wir werden b also Vektor der rechten ’ Seite‘ nennen. A heißt die Koeffizientenmatrix.
3.2
Existenz und Eindeutigkeit
Der gleich folgende Satz enth¨ alt die zentrale Aussage f¨ ur LGS. Er gibt uns u ¨ber alles Auskunft. Und das Sch¨ onste dran ist, dass er sehr leicht einsichtig ist, wenn wir nur einen klitze kleinen Trick verwenden. Der Trick sieht so aus: Wir schreiben die Spalten der Koeffizientenmatrix A als Vektoren, also
⎛
⎞ ⎛ a11 an1 ⎜ . ⎟ ⎜ . ⎜ . . ⎟
a1 = ⎜ ⎝ . ⎠ , · · · , an = ⎝ . am1
⎞ ⎟ ⎟. ⎠
anm
Das kommt uns so harmlos als Abk¨ urzung daher, aber jetzt aufgemerkt. Wir schreiben das LGS (3.1) in der Form x1 · a1 + x2 · a2 + · · · + xn · an = b
3.2 Existenz und Eindeutigkeit
33
Ganz ruhig und gelassen hinschauen, dann sehen Sie es, ja, so kann man das schreiben. Scheint auch noch nicht viel gewonnen. Aber diese neue Schreibweise gibt uns eine andere Sicht auf das LGS. Wir haben doch eine Summe von Vektoren, mit Zahlen xi multipliziert, die den Vektor b ergeben m¨ ochten. Das
heißt doch, dass wir den Vektor b als Linearkombination der Spaltenvektoren
a1 , · · · , an darstellen m¨ ussen. Das bedeutet wiederum, wir m¨ ussen x1 , · · · , xn suchen, so dass mit diesen Zahlen der Vektor b von den Spaltenvektoren linear abh¨ angig ist. Das kann nat¨ urlich nur gelingen, wenn b in dem von den Spalten ¨ aufgespannten Vektorraum liegt. Mit dieser Uberlegung haben wir also sofort unsere Bedingung, wann ein LGS u osbar ist. Wir dr¨ ucken das im ¨berhaupt l¨ folgenden Satz mit Hilfe des Ranges aus. Satz 3.1 (Alternativsatz f¨ ur LGS) m×n m Seien A ∈ R , b ∈ R . Dann gilt f¨ ur das lineare Gleichungssystem (3.2) die Alternative (i) Ist rg A < rg (A| b), so ist die Aufgabe nicht l¨ osbar.
x = b (ii)Ist rg A = rg (A|b), so ist die Aufgabe l¨ osbar, es gibt also x ∈ Rn mit A · Im Fall (ii) gilt die zus¨ atzliche Alternative: 1. Ist rg A = n = Anzahl der Unbekannten, so gibt es genau eine L¨ osung der Gleichung (3.2). 2. Ist rg A < n, so gibt es unendlich viele L¨ osungen mit n − rg A Parametern. Eine meiner Lieblingsaufgaben lautet: Suchen Sie doch mal nach einem reellen Gleichungssystem, das genau zwei L¨ osungen hat. Es w¨ urde mir ein sehr kleines System, also vielleicht zwei Gleichungen mit drei ¨ Unbekannten oder so ausreichen. In manchen Ubungsstunden habe ich sogar schon mal einen Kasten Bier ausgelobt. Aber ich bin ja geizig. So etwas setze ich nicht einer leichtfertigen Wette aus. Unser obiger Satz sagt uns ja auch ganz klar, dass es ein solches LGS nicht geben kann. Entweder hat es gar keine L¨ osung oder genau eine oder unendlich viele. Genau zwei geht nicht. Aber jetzt kommt die hinterh¨ altige Frage. Wenn wir denn also schon zwei verschiedene L¨ osungen, nennen wir sie x1 und x2 , haben und dann wissen, dass es unendlich viele weitere gibt, dann m¨ ochten wir doch schnell auch eine dritte angeben k¨ onnen, oder? Also, wie heißt eine dritte L¨ osung x3 ? Die Erkenntnis, die wir aus dieser einfachen Frage gewinnen werden, ist sehr, sehr wichtig. Darum streuen wir ein leichtes Beispiel ein.
34
3 Lineare Gleichungssysteme
x −
y = 4
2·x − 2·y = 8 Ich verrate Ihnen zwei L¨ osungen:
x1 = (5, 1) ,
x2 = (3, −1) .
x2 als L¨ osungen Der erste Verdacht f¨ ur eine dritte L¨ osung ist: Klar, mit x1 und osung. Das riecht man doch geradezu. Aber ist nat¨ urlich auch x1 + x2 eine L¨ Achtung, unbedingt verinnerlichen: Diese Aussage ist falsch, falsch, falsch und nochmals falsch. Probieren Sie es:
x3 = x1 + x2 = (5, 1) + (3, −1) = (8, 0) , setzen Sie aber jetzt x3 = (8, 0) in das LGS ein, so erhalten Sie als rechte Seite (8, 16) = (4, 8) . Also bitte unbedingt ins Langzeitged¨ achtnis aufnehmen: Die Summe zweier L¨ osungen ist nicht unbedingt eine L¨ osung. Wir schr¨ anken diese Aussage bewusst etwas ein: nicht unbedingt‘; denn schauen ’ wir genau hin. Unser Problem lag ja darin, dass wir f¨ ur jede L¨ osung rechts den Vektor b erhalten, f¨ ur die Summe also den Vektor 2 · b. Der ist aber i.a. verschieden von b. Wenn die rechte Seite aber der Nullvektor w¨ are, b = 0, so bliebe auch bei der Summe wegen 0 + 0 = 0 die rechte Seite unge¨ andert, die Summe w¨ are also eine L¨ osung. Das gilt aber nur, wenn b = 0 ist. So ein LGS nennen wir homogen. Nun sind wir erst ein kleines St¨ uckchen weiter mit unserer Frage nach einer dritten L¨ osung: Die Summe tut’s normalerweise nicht. Wenn wir jetzt aber diesen Faden weiter spinnen, so w¨ urde doch ein Vektor, der uns auf der rechten Seite 0 erbr¨ achte, nicht weiter st¨ oren, den k¨ onnten wir gefahrlos hinzuaddieren. Und da f¨ allt uns doch gleich ein Vektor ein. x1 bringt
b und x2 bringt auch b, ihre Differenz x2 − x1 ergibt also 0. Aber halt, wenn wir x1 + ( x2 − x1 ) = x2 , jetzt zu x1 den Vektor x2 − x1 hinzuaddieren ergibt sich und das ist nicht Neues. Nachdenken . . . Klackerts? Wegen 2 · 0 = 0 k¨ onnen wir doch einfach den Vektor x3 = x1 + 2 · ( x2 − x1 ) = 2 · x2 − x1 verwenden:
3.2 Existenz und Eindeutigkeit
35
A · x3 = A · ( x1 + 2 · ( x2 − x1 )) = b + 2 · 0 = b. osung des LGS und sicher verschieden von x1 und x2 .
x3 ist also L¨ Jetzt setzen wir nur noch einen drauf, um unendlich viele weitere L¨ osungsvektoren zu finden. Wir bilden
xk = x1 + k · ( x2 − x1 ), k ∈ R. k kann also eine beliebige reelle Zahl sein, immer ergibt sich rechts b, so haben wir locker unendlich viele neue L¨ osungen gefunden. ¨ Gerade der letzte Teil obiger Uberlegung zeigt ein allgemeines Prinzip f¨ ur die L¨ osungsgesamtheit. Stets ist sie so aufgebaut, dass man eine spezielle L¨ osung des nicht homogenen LGS finden muss, hier ist es x1 , und daran h¨ angt man die allgemeine L¨ osung des homogenen LGS. Mathematisch zeigt sich, dass die L¨ osungen des homogene LGS einen Vektorraum der Dimension n−rg (A) bilden mit den Bezeichnungen des Satzes 3.1. Man kann also (n − rg (A))-viele linear unabh¨ angige L¨ osungsvektoren finden, die wir dann als Linearkombination an die spezielle L¨ osung additiv dranh¨ angen. Schauen Sie bitte noch einmal auf den Satz 3.1. Wichtig f¨ ur die Existenz einer L¨ osung ist es, ob die rechte Seite aus den Spaltenvektoren kombinierbar ist. Die L¨ osung selbst h¨ angt dann von n, also der Zahl der Unbekannten oder, was dasselbe ist, der Zahl der Spalten ab. Haben wir irgendwo von den Zeilen geredet? Nur die Zahl der Unbekannten bzw. Spalten ist interessant, die Zahl der Gleichungen bzw. Zeilen ist v¨ ollig uninteressant. Lediglich u ¨ber die Aussage, dass Zeilenrang gleich Spaltenrang ist, k¨ onnte man einen Zusammenhang zu den Zeilen herstellen. Nehmen wir noch einmal unser Beispiel von oben: x − x −
y = 4
y = 4
2·x − 2·y = 8
2·x − 2·y = 8
2·x − 2·y = 8 2·x − 2·y = 8
Das linke System hat, wie wir oben gesehen haben, unendlich viele L¨ osungen. Beim rechten haben wir deswegen noch zwei Zeilen hinzugef¨ ugt, aber in Wirklichkeit doch gar nichts ge¨ andert, weil wir nur die zweite Zeile noch zweimal darunter geschrieben haben. Das ¨ andert an der L¨ osbarkeit keinen Deut. Das rechte System hat jetzt vier Gleichungen f¨ ur zwei Unbekannte, ist also scheinbar sehr u osungen. ¨berbestimmt, hat aber immer noch unendlich viele L¨ Die Zahl der Gleichungen spielt keine Rolle bei der Frage nach der L¨ osbarkeit eines LGS.
36
3 Lineare Gleichungssysteme
Wenn also in Zukunft irgend jemand Ihnen daher kommt und anhebt, dass ein LGS l¨ osbar ist, wenn die Zahl der Gleichungen . . . , dann unterbrechen Sie ihn und sagen Sie ihm, dass er keine Ahnung hat. Also vielleicht dr¨ ucken Sie es etwas diplomatischer aus, aber im Kern genau das sagen.
3.3
Determinantenkriterium
Der folgende Satz z¨ ahlt zu den Lieblingen vieler Studierender. Aber wenn man genau hinsieht, hat er das wirklich nicht verdient: Korollar 3.1 Ist A ∈ Rn×n eine quadratische Matrix mit det A = 0, so hat das LGS (3.2) genau eine L¨ osung. Sie brauchen f¨ ur diese Eindeutigkeitsaussage zwei sehr wesentliche Voraussetzungen. 1. Zum einen muss es ein quadratisches System sein, es muss also genau so viele Gleichungen wie Unbekannte haben. 2. Dann muss außerdem die Determinante, die ja nur f¨ ur quadratische Matrizen definiert ist, ungleich 0 sein. Wenn Sie aber jetzt ein System mit zehn Gleichungen und zehn Unbekannten haben, so m¨ ochte ich mal sehen, wie Sie die Determinante ausrechnen. In der Praxis werden heute aber locker Gleichungen mit einer Million Unbekannten gerechnet. Na dann, viel Spaß. Das geht gar nicht. Fazit: Dieses Korollar geht nur in Anf¨ anger¨ ubungsgruppen.
3.4
L-R-Zerlegung
Nun steuern wir mit großen Schritten auf das L¨ osen linearer Gleichungssysteme zu. Eine probate Methode ist dabei das Zerlegen der vorgegebenen Systemmatrix in eine einfachere Struktur. Wir schildern hier eine Variante des Gaußalgorithmus, bekannt als die L-R-Zerlegung oder Links-Rechts-Zerlegung.
3.4.1
Die Grundaufgabe
Um uns nicht mit zu vielen Formalien befassen zu m¨ ussen, beschr¨ anken wir uns auf quadratische Matrizen. Das Verfahren ist aber im Prinzip auch f¨ ur beliebige Matrizen durchf¨ uhrbar.
3.4 L-R-Zerlegung
37
Die Berechnung der Zerlegung lehnt sich eng an die Gaußelimination an. Im Prinzip macht man gar nichts Neues, sondern w¨ ahlt lediglich eine andere Form. Am Ende einer erfolgreichen Elimination hat man ja eine obere Dreiecksmatrix erreicht. Diese genau ist schon die gesuchte Matrix R. Die Matrix L steht ebenfalls fast schon da, aber Achtung, eine Kleinigkeit ist anders. Definition 3.2 (L-R-Zerlegung) Gegeben sei eine quadratische Matrix A ∈ Rn×n . Dann verstehen wir unter einer L-R-Zerlegung der Matrix A eine multiplikative Zerlegung der Matrix A in A=L·R
(3.3)
mit einer linken Dreiecksmatrix L und einer rechten Dreiecksmatrix R, wobei L nur Einsen in der Hauptdiagonalen besitzt; also ( steht f¨ ur eine beliebige Zahl)
⎛
··· ⎜ ⎜ .. .. ⎜ . . L=⎜ ⎜. . ⎜ .. . . . . . ⎝ ··· 1
0
⎞
⎛
0 .. .
··· ··· . 0 .. .. . . . . . . .
⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟, R = ⎜ ⎟ ⎜ ⎜ 0⎟ ⎠ ⎝ 0 ··· 1
0
⎞ .. . .. .
⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
(3.4)
agen geEinmal kurz nachgedacht: Wir haben die Matrix A mit n · n = n2 Eintr¨ geben. In der Matrix R haben wir wegen der vollst¨ andig ausgef¨ ullten Diagonalen schon mehr als die H¨ alfte der gesuchten Zahlen eingetragen. Daher k¨ onnen wir es uns hoffentlich leisten, in der Matrix L die Diagonale mit Einsen vorzugeben, damit die ganze Aufgabe nicht u ¨berbestimmt wird. Damit haben wir erst mal ein Grundger¨ ust. Ob das dann so geht, m¨ ussen wir noch u achst ¨berlegen. Zun¨ erkl¨ aren wir, wie wir das L finden. Dazu schidern wir das allgemeine Vorgehen. Dabei erinnern wir daran, dass dieses Verfahren zwar auch f¨ ur kleine LGS mit (3 × 3)-Matrizen seine Berechtigung hat, aber erst wirklich wichtig wird bei großen Aufgaben. Daher schildern wir alles so, wie wir es zum Programmieren eines Rechners ben¨ otigen. Zun¨ achst beschreiben wir eine Version ohne Zeilentausch. Wir geben sp¨ ater Bedingungen an, wann diese Variante durchf¨ uhrbar ist. Von unseren elementaren Umformungen werden wir also nur die erste benutzen, n¨ amlich das Vielfache einer Zeile zu einer anderen zu addieren 1. Erster Schritt: Wir wollen in der ersten Spalte unterhalb des Diagonalelementes a11 Nullen erzeugen. Dazu w¨ ahlen wir den Faktor −
a21 . a11
38
3 Lineare Gleichungssysteme
Mit diesem multiplizieren wir die erste Zeile und addieren das Ergebnis zur zweiten Zeile. Wir machen uns schnell klar, wie wir diesen Faktor gefunden haben. Wenn wir (im Kopf) die erste Zeile durch a11 dividieren, entsteht an der ersten Stelle eine 1. Multiplizieren wir dann diese Zeile mit −a21 , so entsteht genau die negative Zahl, die an der Stelle a21 steht. Durch unsere Addition zur zweiten Zeile erhalten wir also dort eine Null. Bitte machen Sie sich diesen Weg noch einmal ganz langsam klar; denn dann werden alle folgenden Schritte leicht. Das Spiel geht in der ersten Spalte weiter mit dem Element a31 . Dazu multiplizieren wir die erste Zeile mit −
a31 a11
und addieren sie zur dritten Zeile. Dann entsteht an der Stelle a31 eine Null. Das geht weiter, bis die ganze erste Spalte unterhalb der Diagonalen nur noch Nullen enth¨ alt. Beachten Sie bitte, dass es dem Computer egal ist, ob bereits a11 = 1 ist und eine Division daher u ussig w¨ are. Diese Pr¨ ufung w¨ urde zus¨ atzlich Zeit ¨berfl¨ kosten und h¨ atte kaum Bedeutung. Auch die Abfrage, ob bereits a21 = 0 ist, bringt nur zus¨ atzlichen Zeitaufwand f¨ ur den Computer. 2. Zweiter Schritt: Durch den ersten Schritt sind jetzt nat¨ urlich die Eintr¨ age in der Matrix A ge¨ andert worden. Wir verzichten aber auf eine Umbenennung ¨ mit˜oder Ahnlichem, um nicht zuviel Verwirrung herzustellen. Wir wollen in der zweiten Spalte unterhalb des Diagonalelementes a22 Nullen erzeugen. Dazu w¨ ahlen wir den Faktor −
a32 , a22
mit dem wir die zweite Zeile multiplizieren und das Ergebnis zur dritten Zeile addieren. Sollen wir noch einmal diesen Faktor erl¨ autern? Die Division durch a22 f¨ uhrt zu einer 1 an der Stelle a22 . Die Multiplikation mit −a32 ergibt dann genau das Negative der Zahl a32 . Wenn wir die so ge¨ anderte zweite Zeile also zur dritten addieren, erhalten wir a32 = 0. Das geht dann die ganze zweite Spalte munter so weiter, bis alle Eintr¨ age unterhalb des Diagonalelementes a22 gleich Null sind. 3. im dritten Schritt machen wir die Eintr¨ age unterhalb von a33 zu Null, im vierten Schritt, na usw, bis, ja bis zur n − 1-ten Spalte. Die n-te Spalte hat ja nichts mehr unter sich stehen, das Element ann steht ja schon in der Ecke. Also beim Programmieren aufpassen, diese Schleife darf nur bis n − 1 laufen. Wir multiplizieren mit ziemlich charakteristischen Faktoren. Diese verdienen daher einen Namen:
3.4 L-R-Zerlegung
39
Definition 3.3 (Gauß-Faktoren) Die Faktoren, mit denen wir zwischendurch Zeilen multiplizieren und zu darunter stehenden Zeilen addieren, heißen Gauß-Faktoren: bik = −
aik , akk
i.k = 1, . . . , n − 1.
(3.5)
Jetzt kommen wir noch mit einer kleinen Abwandlung. Wir haben ja in der Ausgangsmatrix A unterhalb der Diagonalen Nullen erzeugt. Diese Nullen sind sch¨ on, aber wir brauchen sie doch gar nicht weiter. Also werden wir sie mit den jeweiligen Gaußfaktoren u ¨berschreiben. So entsteht die Matrix:
⎛ ⎜ ⎜ ⎜ ⎜ A→⎜ ⎜ ⎜ ⎜ ⎝
r11 r12 · · ·
· · · r1n
⎞
⎟ · · · r2n ⎟ ⎟ ⎟ r33 · · · r3n ⎟ ⎟ .. .. ⎟ . . ⎟ ⎠ · · · bnn−1 rnn
b21 r22 · · · b31 b32 .. .. . . bn1 bn2
Wie wir oben schon gesagt haben, sehen wir oberhalb der Stufen unsere gesuchte Matrix R:
⎛ ⎜ ⎜ ⎜ ⎜ R=⎜ ⎜ ⎜ ⎜ ⎝
r11 r12 · · · · · · r1n
⎞
0 .. . .. .
⎟ r22 r23 · · · r2n ⎟ ⎟ ⎟ .. . . . ⎟ . .. . ⎟ ⎟ .. . .. . . . ⎟ . ⎠
0
···
0 rnn
Unterhalb steht fast schon L, aber nicht ganz:
⎛
1
0
···
···
⎜ ⎜ −b21 1 0 ··· ⎜ ⎜ L=⎜ ⎜ −b31 −b32 1 ⎜ . .. ⎜ . . 1 ⎝ . −bn1 −bn2 · · · −bnn−1
0
⎞
⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ 0⎠ 1 0 .. .
Sehen Sie bitte genau hin, L entnehmen wir aus der Gaußumformung, indem wir s¨ amtliche Vorzeichen unterhalb der Stufenform umkehren. Das ist aber doch dann wiederum ganz simpel, oder? Wenn Sie jetzt wissen wollen, warum man f¨ ur das korrekte L alle Vorzeichen unterhalb der Diagonalen umkehren muss, so bin ich richtig stolz auf Sie. Toll, dass Sie sich daf¨ ur interessieren. Kennen Sie das Lied der Sesamstraße? Dort heißt es:
40
3 Lineare Gleichungssysteme
Wieso, weshalb, warum? Wer nicht fragt, bleibt dumm! Genau das beherzigen Sie, wenn Sie mir diese Frage stellen. Habe ich vielleicht doch schon etwas bewirkt? Leider komme ich jetzt aber mit einer h¨ asslichen Nachricht. Diese Vorzeichenumkehr zu erkl¨ aren, erfordert einen ziemlichen Aufwand. Es ist also u ¨berhaupt nicht trivial, wie Mathematiker gerne solche Fragen abb¨ ugeln. Wenn ich mal etwas andeuten darf, man benutzt sogenannte Frobeniusmatrizen. Deren Inverse l¨ asst sich ganz leicht mittels Vorzeichenumkehr hinschreiben. Bitte schauen Sie, wenn es Sie wirklich interessiert, in das Buch (11), dort ist es ausf¨ uhrlich erkl¨ art. Beispiel 3.1 Gegeben sei die Matrix
⎛
⎞ 2 3 1
⎜ ⎟ ⎟ A=⎜ ⎝ 0 1 3 ⎠, 3 2 a
a ∈ R.
Berechnen Sie ihre L-R-Zerlegung, und zeigen Sie, dass A f¨ ur a = −6 regul¨ ar ist. Da a21 = 0 schon gegeben ist, muss nur a31 im 1. Schritt bearbeitet werden. Dazu muss die erste Zeile mit −3/2 multipliziert werden, um durch Addition zur letzten Zeile a31 = 0 zu erreichen.
⎛
⎞ 2
⎜ A→⎜ ⎝0
3
1
1
3
0 − 52 − 32 + a
⎟ ⎟. ⎠
Zur Ersparnis von Schreibarbeit und beim Einsatz eines Rechners von Speicherplatz ist es empfehlenswert, die geliebten, aber jetzt nutzlosen Nullen, die man unterhalb der Diagonalen erzeugt hat, durch die Faktoren zu ersetzen, die wir berechnen, um an dieser Stelle eine Null zu erzeugen. Das passt gerade zusammen:
⎛ ⎜ =⎜ A→A ⎝
⎞ 2
3
1
0
1
3
− 32 − 52 − 32 + a
⎟ ⎟. ⎠
Im 2. Schritt, der auch schon der letzte ist, wird die 2. Zeile mit 5/2 multipliziert und zur 3. Zeile addiert. Man erh¨ alt
⎛ ⎜ →⎜ A ⎝
⎞ 2 3
1
0 1
3
− 32
5 2
6+a
⎟ ⎟. ⎠
3.4 L-R-Zerlegung
41
Daraus lesen wir sofort die gesuchten Matrizen L und R ab. ⎛ ⎞ 1 0 0 ⎜ ⎟ L = ⎜ 1 0⎟ ⎝ 0 ⎠, 3 5 2 −2 1 ⎛ ⎞ 2 3 1 ⎜ ⎟ ⎟ R = ⎜ ⎝ 0 1 3 ⎠. 0 0 6+a Um die Regularit¨ at von A zu pr¨ ufen, denken wir an den Determinantenmultiplikationssatz A = L · R ⇒ det A = det L · det R. Offensichtlich ist L stets eine regul¨ are Matrix, da in der Hauptdiagonalen nur Einsen stehen. F¨ ur eine Dreiecksmatrix ist aber das Produkt der Hauptdiagonalelemente gerade ihre Determinante. Die Regularit¨ at von A entscheidet sich also in R. Hier ist das Produkt der Hauptdiagonalelemente genau dann ungleich Null, wenn a = −6 ist. Das sollte gerade gezeigt werden.
3.4.2
Existenz der L-R-Zerlegung
Leider ist die L-R-Zerlegung schon in einfachen F¨ allen nicht durchf¨ uhrbar. Betrachten wir z. B. die Matrix
A=
0 1
.
(3.6)
1 0 Offensichtlich scheitert schon der erste Eliminationsschritt, da das Element ar ist, also vollen Rang besitzt. a11 = 0 ist, obwohl die Matrix doch sogar regul¨ Der folgende Satz zeigt uns, wann eine solche Zerlegung durchgef¨ uhrt werden kann. Dazu m¨ ussen wir, nur um diesen Satz zu verstehen, eine Bezeichnung einf¨ uhren, die Sie also anschließend getrost wieder vergessen k¨ onnen: Definition 3.4 (Hauptminoren) Bei einer quadratischen Matrix A ∈ Rn×n verstehen wir unter den Hauptminoren die Determinanten folgender Untermatrizen:
42
3 Lineare Gleichungssysteme
⎛
∗ ∗ ∗ ∗ ∗
⎜ ⎜∗ ∗ ∗ ⎜ ⎜ ⎜∗ ∗ ∗ ⎜ ⎜∗ ∗ ∗ ⎝ ∗ ∗ ∗
⎞
⎟ ∗ ∗⎟ ⎟ ⎟ ∗ ∗⎟ ⎟ ∗ ∗⎟ ⎠ ∗ ∗
Wir haben, um Platz zu sparen, nur eine (5 × 5)-Matrix hingeschrieben. Von einer Matrix A = (aij ) betrachten wir also die Untermatrizen
A1 = (a11 ),
A2 =
a11 a12
⎛
⎞ a11 a12 a13
,
a21 a22
⎜ ⎟ ⎟ A3 = ⎜ ⎝ a21 a22 a23 ⎠ , a31 a32 a33
···
Die Determinanten dieser Untermatrizen sind dann die Hauptminoren von A. Das Wort Hauptminor erkl¨ art sich mehr, wenn wir bedenken, dass wir auch noch ganz andere Untermatrizen bilden k¨ onnen, z.B. die Matrix
a11 a41
.
a14 a44 Das Haupt‘ bezieht sich also auf die Symmetrie zur Hauptdiagonalen. ’ Mit diesem Begriff k¨ onnen wir jetzt den Satz angeben: Satz 3.2 Sei A eine regul¨ are (n × n)-Matrix. A besitzt dann und nur dann eine L-RZerlegung, wenn s¨ amtliche Hauptminoren von A ungleich Null sind. Doch dieser Satz hilft in der Praxis u ¨berhaupt nicht. Hauptminoren sind schließlich Determinanten. Und die zu berechnen, erfordert einen Riesenaufwand. Der folgende Satz hat dagegen in speziellen F¨ allen schon mehr Bedeutung. Satz 3.3 Sei A eine regul¨ are (n × n)-Matrix mit der Eigenschaft n
|aik | ≤ |aii |,
1 ≤ i ≤ n,
k=1
k=i
dann ist die L-R-Zerlegung durchf¨ uhrbar. Dieses Kriterium k¨ onnte man also tats¨ achlich vor einer langwierigen Berechnung mal kurz anwenden. Aber meistens wird man die Zerlegung einfach probieren.
3.4 L-R-Zerlegung
3.4.3
43
L-R-Zerlegung und lineare Gleichungssysteme
Wie benutzt man nun diese L-R-Zerlegung, um ein lineares Gleichungssystem zu l¨ osen? ¨ Betrachten wir, damit wir keinen Arger mit der L¨ osbarkeit haben, ein lineares Gleichungssystem mit einer regul¨ aren (n × n)-Matrix A. Dann gehen wir nach folgendem Algorithmus vor: Gleichungssysteme und L-R-Zerlegung Gegeben sei ein lineares Gleichungssystem mit regul¨ arer Matrix A A · x = b. 1. Man berechne, falls m¨ oglich, die L-R-Zerlegung von A, bestimme also eine untere Dreiecksmatrix L und eine obere Dreiecksmatrix R mit A x = L · R · x = b.
(3.7)
y := R · x
(3.8)
(Vorw¨ artselimination)
(3.9)
2. Man setze
und berechne y aus L· y = b
3. Man berechne das gesuchte x aus R · x = y
(R¨ uckw¨ artselimination)
(3.10)
Wie Sie sehen, muss man zwar mit diesem Algorithmus zwei lineare Systeme bearbeiten, der Vorteil der L-R-Zerlegung liegt aber darin, dass man es jeweils nur mit einem Dreieckssystem zu tun hat. Einfaches Aufrollen von oben nach unten (Vorw¨ artselimination) bei (3.9) bzw. von unten nach oben (R¨ uckw¨ artselimination) bei (3.10) liefert die L¨ osung. Wir sollten nicht unerw¨ ahnt lassen, dass man die Vorw¨ artselimination direkt in die Berechnung der Zerlegung einbauen kann. Dazu schreibt man die rechte Seite
b des Systems als zus¨ atzliche Spalte an die Matrix A heran und unterwirft sie den gleichen Umformungen wie die Matrix A. Dann geht b direkt u ¨ber in den oben eingef¨ uhrten Vektor y , und wir k¨ onnen sofort mit der R¨ uckw¨ artselimination beginnen.
44
3 Lineare Gleichungssysteme
Beispiel 3.2 L¨ osen Sie folgendes lineare Gleichungssystem mittels L-R-Zerlegung. −4x1 − 11x2 = −1 2x1 +
4x2 = −1
.
Die zum System geh¨ orige Matrix lautet
−4 −11 . A= 2 4 Unser Gauß sagt, dass wir die erste Zeile mit 1/2 multiplizieren und zur zweiten Zeile addieren m¨ ussen, um in der ersten Spalte unterhalb der Diagonalen eine Null zu erzeugen:
−4 −11 A→ . 1 − 32 2 Bei dieser kleinen Aufgabe sind wir schon mit der Zerlegung fertig. Die gesuchten Matrizen L und R lauten
L=
1 0
− 12 1
,
R=
−4 −11
.
0 − 32
So, nun m¨ ussen wir zwei Gleichungssysteme l¨ osen. Zun¨ achst berechnen wir den Hilfsvektor y aus dem System
L y = b ⇐⇒
1 0
− 12 1
y1
=
−1
−1
y2
.
Nun ja, aus der ersten Zeile liest man die L¨ osung f¨ ur y1 direkt ab, und ein wenig Kopfrechnen schafft schon die ganze L¨ osung herbei: y1 = −1, y2 = −3/2. Das n¨ achste System enth¨ alt den gesuchten Vektor x und lautet
R x= y ⇐⇒
−4 −11 0 − 32
x1
x2
=
−1 −3/2
.
Hier fangen wir unten an gem¨ aß der R¨ uckw¨ artselimination und erhalten aus der zweiten Zeile direkt und dann aus der ersten, wenn wir noch einmal unseren Kopf bem¨ uhen: x2 = 1, x1 = −5/2.
3.5 Pivotisierung
3.5
45
Pivotisierung
Wenn man ein Gleichungssystem vor Augen hat mit der Matrix (3.6) von Seite 41 als Systemmatrix, bei der wir die Gaußelimination nicht durchf¨ uhren k¨ onnen, so hat man nat¨ urlich sofort die Abhilfe parat. Wir tauschen einfach die beiden Zeilen, was das Gleichungssystem v¨ ollig unge¨ andert l¨ asst. Das ist der Weg, den wir jetzt beschreiten werden. Definition 3.5 (Transpositionsmatrix) Eine (n × n)-Matrix T heißt Transpositionsmatrix, wenn sie aus der Einheitsmatrix durch Tausch zweier Zeilen hervorgeht. Mit Tij bezeichnen wir dann die Transpositionsmatrix, die durch Tausch der i-ten mit der j-ten Zeile entstanden ist:
⎛
Tij
⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ =⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
1 0
.. .
0
···
0
⎞ 0
⎟ 0⎟ ⎟ ⎟ .. .. .. ⎟ . . . ⎟ ⎟ ⎟ 0 1 ⎟ .. ⎟ .. .. ⎟ . . . ⎟ ⎟ ⎟ . ⎟ 1 · · · 0 .. ⎟ ⎟ .. .. . . 0⎟ ⎠ 0 1 1
0
···
Ich hoffe, Sie verstehen dieses kurze Schema. In der i-ten und j-ten Zeile stehen also jetzt in der Diagonalen jeweils eine 0, die beiden 1 sind daf¨ ur etwas rausgerutscht. Zur Not verfolgen Sie den Vorgang mit Ihren Fingerchen. Hier einige Eigenschaften dieser Matrizen. Satz 3.4 Transpositionsmatrizen sind regul¨ ar, symmetrisch und orthogonal. Das ist ziemlich leicht zu sehen. Die Einheitsmatrix ist nat¨ urlich regul¨ ar mit Determinante 1. Eine Transpositionsmatrix entsteht durch Tausch zweier Zeilen, also ist ihre Determinante −1. Sie ist somit auf jeden Fall regul¨ ar. Die Symmetrie sieht man sofort. Um ihre Orthogonalit¨ at zu pr¨ ufen, m¨ ussen wir zeigen, dass Tij · Tij = E ist. Wegen der Symmetrie m¨ ussen wir zeigen, dass Tij · Tij = E ist. Nun, Tij vertauscht die i-te mit der j-ten Zeile, wenn man von links ranmultipliziert. Wenn wir dann Tij noch mal von links ranmultiplizieren, vertauschen wir dieselben Zeilen noch mal, kommen also zur Ausgangsmatrix zur¨ uck. Daher ist
46
3 Lineare Gleichungssysteme
Tij · Tij = E,
was wir zeigen wollten. Diese Transpositionsmatrizen helfen uns nun beim Zeilentausch. Satz 3.5 Multiplikation einer Matrix A von links mit einer Transpositionsmatrix Tij vertauscht die i-te mit der j-ten Zeile. Multiplikation von rechts vertauscht die i-te mit der j-ten Spalte. Wir schauen uns das nur an einem Beispiel an, aber das ist so einsichtig, dass wir auf einen allgemeinen Beweis leicht verzichten k¨ onnen. Beispiel 3.3 Sei f¨ ur n = 3
⎛
⎞ 1 0 0
⎜ ⎟ ⎟ T23 = ⎜ ⎝ 0 0 1 ⎠, 0 1 0
⎛
⎞ 1 1 1
⎜ ⎟ ⎟ A=⎜ ⎝ 2 2 2 ⎠. 3 3 3
Dann rechnen wir Tij · A nach dem Falk-Schema aus:
⎛
⎞ 1 1 1
⎛
⎞ 1 0 0
⎜ ⎟ ⎜0 0 1⎟ ⎝ ⎠ 0 1 0
⎜ ⎜2 ⎝ 3 ⎛ 1 ⎜ ⎜3 ⎝ 2
⎟ 2 2⎟ ⎠ 3 3 ⎞, 1 1 ⎟ 3 3⎟ ⎠ 2 2
was Sie bitte mit Ihren Fingern nachrechnen m¨ ogen. Sie sehen, die zweite und die dritte Zeile habe ihre Pl¨ atze getauscht. Die Aussage f¨ ur die Spaltenvertauschung bei Multiplikation von rechts, glauben Sie mir hoffentlich. Oder wieder die Finger? Definition 3.6 (Permutationsmatrix) Eine Matrix P ∈ Rn×n heißt Permutationsmatrix, wenn sie das Produkt von Transpositionsmatrizen ist. Satz 3.6 Permutationsmatrizen P sind regul¨ ar und orthogonal, es gilt also P −1 = P . Das folgt sofort aus der 5. Aussage von Satz 1.9, Seite 20.
(3.11)
3.5 Pivotisierung
47
Bemerkung 3.1 Aber Achtung, Permutationsmatrizen sind i.a. nicht symmetrisch. Denken Sie an die Aussage 7. von Satz 1.2, Seite 9. Mit diesen Begriffen k¨ onnen wir jetzt erkl¨ aren, wann eine L-R-Zerlegung einer Matrix A durchf¨ uhrbar ist. Satz 3.7 Sei A eine regul¨ are (n × n)-Matrix. Dann gibt es eine Permutationsmatrix P , so dass die folgende L-R-Zerlegung durchf¨ uhrbar ist: P · A = L · R.
(3.12)
Man kann also bei einer regul¨ aren Matrix stets durch Zeilentausch, was ja durch die Linksmultiplikation mit einer Permutationsmatrix darstellbar ist, die L-RZerlegung zu Ende f¨ uhren. Nun packen wir noch tiefer in die Kiste der Numerik. Aus Gr¨ unden der Stabilit¨ at empfiehlt sich n¨ amlich stets ein solcher Zeilentausch, wie wir am folgenden Beispiel zeigen werden. Beispiel 3.4 Gegeben sei das lineare Gleichungssystem
⎛ ⎜ ⎜ ⎝
⎞⎛ 0.729 0.81 0.9
⎞ x1
⎛
⎞ 0.6867
⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 1 ⎟ ⎠ ⎝ x2 ⎠ = ⎝ 0.8338 ⎠ . x3 1.331 1.21 1.1 1 1
1
Berechnung der exakten L¨ osung, auf vier Stellen gerundet, liefert x1 = 0.2245, x2 = 0.2814, x3 = 0.3279. Stellen wir uns vor, dass wir mit einer Rechenmaschine arbeiten wollen, die nur vier Stellen bei Gleitkommarechnung zul¨ asst. Das ist nat¨ urlich reichlich akademisch, aber das Beispiel hat ja auch nur eine (3 × 3)-Matrix zur Grundlage. Genauso k¨ onnten wir eine Maschine mit 20 Nachkommastellen bem¨ uhen, wenn wir daf¨ ur das Beispiel entsprechend h¨ oher dimensionieren. Solche Beispiele liefert das Leben sp¨ ater zur Gen¨ uge. Belassen wir es also bei diesem einfachen Vorgehen, um die Probleme nicht durch zu viel Rechnung zu verschleiern. Wenden wir den einfachen Gauß ohne großes Nachdenken an, so m¨ ussen wir die erste Zeile mit −1/0.729 = −1.372 multiplizieren und zur zweiten Zeile addieren, damit wir unterhalb der Diagonalen eine Null erzeugen. Zur Erzeugung der n¨ achsten 0 m¨ ussen wir die erste Zeile mit −1.331/0.729 = −1.826 multiplizieren und zur dritten Zeile addieren. Wir schreiben jetzt s¨ amtliche Zahlen mit vier signifikanten Stellen und erhalten das System
48
3 Lineare Gleichungssysteme
⎛
⎞ 0.7290
0.8100
0.9000
0.6867
⎜ ⎟ ⎜ −1.372 −0.1110 −0.2350 −0.1082 ⎟ . ⎝ ⎠ −1.826 −0.2690 −0.5430 −0.2540 ussen wir die zweite Zeile mit Um an der Stelle a32 eine Null zu erzeugen, m¨ −(−0.2690/ − 0.1110) = −2.423 multiplizieren und erhalten
⎛
⎞ 0.7290
0.8100
0.9000
0.6867
⎜ ⎟ ⎜ −1.372 −0.1110 −0.2350 −0.1082 ⎟ ⎝ ⎠. −1.826 2.423 −0.026506 0.008300 Hieraus berechnet man durch Aufrollen von unten die auf vier Stellen gerundete L¨ osung x 3 = 0.3132, x 2 = 0.3117, x 1 = 0.2089. Zur Bewertung dieser L¨ osung bilden wir die Differenz zur exakten L¨ osung |x1 − x 1 | = 0.0156, |x2 − x 2 | = 0.0303, |x3 − x 3 | = 0.0147. Hierauf nehmen wir sp¨ ater Bezug. Zur Erzeugung der Nullen mussten wir zwischendurch ganze Zeilen mit Faktoren multiplizieren, die gr¨ oßer als 1 waren. Dabei werden automatisch auch die durch Rundung unvermeidlichen Fehler mit diesen Zahlen multipliziert und dadurch vergr¨ oßert. Als Abhilfe empfiehlt sich ein Vorgehen, das man Pivotisierung‘ nennt. Das ’ Wort Pivot‘ kommt dabei aus dem Englischen oder dem Franz¨ osischen. Die ’ Aussprache ist zwar verschieden, aber es bedeutet stets das gleiche: Zapfen oder Angelpunkt. Definition 3.7 (Spaltenpivotisierung) Unter Spaltenpivotisierung verstehen wir eine Zeilenvertauschung so, dass das betragsgr¨ oßte Element der Spalte in der Diagonalen steht. Wir suchen also nur in der jeweils aktuellen Spalte nach dem betraglich gr¨ oßten Element. Dieses bringen wir dann durch Tausch der beiden beteiligten Zeilen in die Diagonale, was dem Gleichungssystem v¨ ollig wurscht ist. In unserem obigen Beispiel m¨ ussen wir also zuerst die erste mit der dritten Zeile vertauschen, weil nun mal 1.331 die betraglich gr¨ oßte Zahl in der ersten Spalte ist:
⎛ ⎜ ⎜ ⎝
⎞⎛ 1.331 1.21 1.1
⎞ x1
⎛
⎞ 1
⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 1 ⎟ ⎠ ⎝ x2 ⎠ = ⎝ 0.8338 ⎠ . 0.729 0.81 0.9 0.6867 x3 1
1
3.5 Pivotisierung
49
Nun kommt der Eliminationsvorgang wie fr¨ uher, allerdings multiplizieren wir immer nur mit Zahlen, die kleiner als 1 sind, das war ja der Trick unserer Tauscherei:
⎛
⎞ 1.331
1.2100 1.1000
1.0000
⎜ ⎟ ⎜ −0.7513 0.09090 0.1736 0.08250 ⎟ . ⎝ ⎠ −0.5477 0.1473 0.2975 0.1390 Das Spiel wiederholt sich jetzt mit dem um die erste Zeile und erste Spalte reduzierten (2×2)-System, in dem wir erkennen, dass 0.1473 > 0.09090 ist. Also m¨ ussen wir die zweite mit der dritten Zeile vertauschen. Da die Faktoren links von dem senkrechten Strich jeweils zu ihrer Zeile geh¨ oren, werden sie nat¨ urlich mit vertauscht.
⎛
⎞ 1.331
1.2100 1.1000
1.0000
⎜ ⎟ ⎜ −0.5477 0.1473 0.2975 0.1390 ⎟ . ⎝ ⎠ −0.7513 0.09090 0.1736 0.08250 ussen wir die zweite Zeile mit Um nun an der Stelle a32 eine Null zu erzeugen, m¨ −0.0909/0.1473 = −0.6171 multiplizieren und erhalten
⎛
⎞ 1.331
1.2100
1.1000
1.0000
⎜ ⎟ ⎜ −0.7513 0.1473 0.2975 0.1390 ⎟ ⎝ ⎠. −0.5477 −0.6171 −0.01000 −0.003280 Wiederum durch Aufrollen von unten erhalten wir die L¨ osung x 3 = 0.3280, x 2 = 0.2812, x 1 = 0.2246. Bilden wir auch hier die Differenz zur exakten L¨ osung |x1 − x 1 | = 0.0001, |x2 − x 2 | = 0.0002, |x3 − x 3 | = 0.0001. Dies Ergebnis ist also deutlich besser! Wo liegt das Problem? Im ersten Fall haben wir mit Zahlen gr¨ oßer als 1 multipliziert, dadurch wurden auch die Rundungsfehler vergr¨ oßert. Im zweiten Fall haben wir nur mit Zahlen kleiner als 1 multipliziert, was auch die Fehler nicht vergr¨ oßerte. Wir m¨ ussen also das System so umformen, dass wir nur mit kleinen Zahlen zu multiplizieren haben. Genau das schafft die Pivotisierung, denn dann steht das betraglich gr¨ oßte Element in der Diagonalen, und Gauß sagt dann, dass wir nur mit einer Zahl kleiner oder gleich 1 zu multiplizieren haben, um die Nullen zu erzeugen.
50
3 Lineare Gleichungssysteme
Aus den Unterabschnitten 3.4.1 und 3.5 lernen wir also, dass zur L¨ osung von linearen Gleichungssystemen eine Pivotisierung aus zwei Gr¨ unden notwendig ist. Spaltenpivotisierung ist notwendig, weil 1. selbst bei regul¨ arer Matrix Nullen in der Diagonalen auftreten k¨ onnen und Gaußumformungen verhindern, 2. wegen Rundungsfehlern sonst v¨ ollig unakzeptable L¨ osungen entstehen k¨ onnen.
3.5.1
L-R-Zerlegung, Pivotisierung und lineare Gleichungssysteme
Jetzt packen wir zu unserer oben vorgestellten L¨ osungsmethode mit der L-RZerlegung noch die Spaltenpivotisierung hinzu und schreiben den nur wenig ge¨ anderten Algorithmus auf: Gleichungssysteme und L-R-Zerlegung mit Pivotisierung Gegeben sei ein lineares Gleichungssystem mit regul¨ arer Matrix A A · x = b. 1. Man berechne die L-R-Zerlegung von A unter Einschluß von Spaltenpivotisierung, bestimme also eine untere Dreiecksmatrix L, eine obere Dreiecksmatrix R und eine Permutationsmatrix P mit P · A x = L · R · x = P b.
(3.13)
y := R · x
(3.14)
2. Man setze
und berechne y aus L· y = P · b
(Vorw¨ artselimination)
(3.15)
3. Man berechne das gesuchte x aus R · x = y
(R¨ uckw¨ artselimination)
(3.16)
3.5 Pivotisierung
51
Beispiel 3.5 L¨ osen Sie folgendes lineare Gleichungssystem mittels L-R-Zerlegung unter Einschluss der Spaltenpivotisierung. 2x1 +
4x2 = −1
−4x1 − 11x2 = −1
.
Die zum System geh¨ orige Matrix lautet
2 4 A= . −4 −11 Offensichtlich ist in der ersten Spalte das betraglich gr¨ oßte Element −4 nicht in der Diagonalen, also tauschen wir flugs die beiden Zeilen mit Hilfe der Transpositionsmatrix
0 1 −4 −11 = P12 · A = ⇒A . P12 = 1 0 2 4
die Eliminationstechnik an. Wir m¨ Dann wenden wir auf die neue Matrix A ussen die erste Zeile mit 1/2 multiplizieren und zur zweiten Zeile addieren, um in der ersten Spalte unterhalb der Diagonalen eine Null zu erzeugen:
−4 −11 . P12 · A → 1 − 32 2 Bei dieser kleinen Aufgabe sind wir schon mit der Zerlegung fertig. Die gesuchten Matrizen L und R lauten
1 0 −4 −11 , R= . L= − 12 1 0 − 32 So, nun m¨ ussen wir zwei Gleichungssysteme l¨ osen. Zun¨ achst berechnen wir den Hilfsvektor y aus dem System
1 0 y1 −1
= . L y = P12 b ⇐⇒ y2 − 12 1 −1 Nun ja, aus der ersten Zeile liest man die L¨ osung f¨ ur y1 direkt ab, und ein wenig Kopfrechnen schafft schon die ganze L¨ osung herbei y1 = −1, y2 = −3/2. Das n¨ achste System enth¨ alt den gesuchten Vektor x und lautet
−4 −11 x1 −1 = . R x= y ⇐⇒ 0 − 32 −3/2 x2
52
3 Lineare Gleichungssysteme
Hier fangen wir unten an gem¨ aß der R¨ uckw¨ artselimination und erhalten aus der zweiten Zeile direkt und dann aus der ersten, wenn wir noch einmal unseren Kopf bem¨ uhen: x2 = 1, x1 = −5/2.
3.5.2
L-R-Zerlegung, Pivotisierung und inverse Matrix
Der wahre Vorteil des Verfahrens zeigt sich, wenn man Systeme mit mehreren rechten Seiten zu bearbeiten hat. Dann muss man einmal die Zerlegung berechnen, kann sich aber anschließend beruhigt zur¨ uck lehnen; denn nun l¨ auft die L¨ osung fast von selbst. Das wird z. B. benutzt bei der Bestimmung der inversen Matrix, wie wir es jetzt zeigen wollen. Inverse Matrizen zu berechnen, ist stets eine unangenehme Aufgabe. Zum Gl¨ uck wird das in der Praxis nicht oft verlangt. Eine auch numerisch brauchbare Methode liefert wieder die oben geschilderte L-R-Zerlegung. Bestimmung der inversen Matrix Gegeben sei eine regul¨ are Matrix A. Gesucht ist die zu A inverse Matrix A−1 , also eine Matrix X(= A−1 ) mit A·X =E
(3.17)
Dies ist ein lineares Gleichungssystem mit einer Matrix als Unbekannter und der Einheitsmatrix E als rechter Seite. Man berechne die L-R-Zerlegung von A unter Einschluß von Spaltenpivotisierung, bestimme also eine untere Dreiecksmatrix L, eine obere Dreiecksmatrix R und eine Permutationsmatrix P mit P · A · X = L · R · X = P · E.
(3.18)
Y := R · X
(3.19)
Man setze
und berechne Y aus L·Y =P ·E
(Vorw¨ artselimination).
(3.20)
Man berechne das gesuchte X aus R·X =Y
(R¨ uckw¨ artselimination).
(3.21)
3.5 Pivotisierung
53
Auch hier sind die beiden zu l¨ osenden Systeme (3.20) und (3.21) harmlose Dreieckssysteme. Auf ihre Aufl¨ osung freut sich jeder Rechner. Beispiel 3.6 Als Beispiel berechnen wir die Inverse der Matrix aus Beispiel 3.5 von Seite 50. Gegeben sei also
2 4 A= . −4 −11 Gesucht ist eine Matrix X mit A · X = E. In Beispiel 3.5 haben wir bereits die L-R-Zerlegung von A mit Spaltenpivotisierung berechnet und erhielten:
−4 −11 1 0 −4 −11 A = P12 · A = =L·R= · . 2 4 − 12 1 0 − 32 So k¨ onnen wir gleich in die Aufl¨ osung der beiden Gleichungsysteme einsteigen. Beginnen wir mit (3.20). Aus
1 0 y11 y12 0 1 · = =P ·E L·Y = − 12 1 1 0 y21 y22 berechnet man fast durch Hinschauen
Y =
0 1 1
1 2
.
Bleibt das System (3.21):
−4 −11 x11 x12 0 1 · = = Y, R·X = x21 x22 0 − 32 1 12 ur die beiden anderen aus dem man direkt die Werte x21 und x22 abliest. F¨ Werte muss man vielleicht eine Zwischenzeile hinschreiben. Als Ergebnis erh¨ alt man
11 4 1 X= . 6 −4 −2 So leicht geht das, wenn man die L-R-Zerlegung erst mal hat. Eine letzte Bemerkung: Manchmal scheint es sich anzubieten, auch Spalten zu vertauschen. Das k¨ onnte man ja ebenfalls mit Permutationsmatrizen schaffen, wenn man sie nur von rechts her an die Matrix A heranmultipliziert. Aber Achtung, Tausch von Spalten bedeutet Tausch der Variablen. Wenn Sie Spalte 5 mit Spalte 8 tauschen, so werden auch x5 und x8 getauscht. Das muss man unbedingt dem Rechner mitteilen, w¨ ahrend Zeilentausch ohne weitere Auswirkungen bleibt. Daher raten wir vom Spaltentausch ab. Das ganze Verfahren ist ja auch ohne Spaltentausch stets f¨ ur regul¨ are Matrizen durchf¨ uhrbar.
54
3 Lineare Gleichungssysteme
¨ Ubung 4 1. Gegeben sei das lineare Gleichungssystem
2x1 + x3 = 0 2x2 + x4 = 1 x1 + 2x3 = 0 x2 + 2x4 = 1 a) Berechnen Sie die L-R-Zerlegung der Systemmatrix A. b) Zeigen Sie an Hand dieser L-R-Zerlegung, dass das LGS genau eine L¨ osung besitzt. c) Berechnen Sie diese L¨ osung mit der L-R-Zerlegung. 2. Gegeben sei die Matrix
⎛
4
2 −2 −4
⎞
⎜ ⎟ ⎜ 2 2 −1 −5 ⎟ ⎜ ⎟. A=⎜ ⎟ −2 −1 5 4 ⎝ ⎠ −4 −5
4 23
a) Berechnen Sie mit Spaltenpivotisierung die L-R-Zerlegung von A. b) Begr¨ unden Sie mit der L-R-Zerlegung aus (a), daß A regul¨ ar ist. 3. Von einer Matrix A sei folgende L-R-Zerlegung bekannt:
A=L·R
⎛ ⎞ 1 0 0 0 ⎜ ⎟ ⎜0 1 0 0⎟ ⎟, mit L = ⎜ ⎜ ⎟ ⎝1 3 1 0⎠ 0 1 2 1
⎛ ⎞ 2 3 −2 0 ⎜ ⎟ ⎜0 −1 2 1⎟ ⎟ R=⎜ ⎜ ⎟ ⎝0 0 2 2⎠ 0
0
0
1
a) Begr¨ unden Sie ohne explizite Berechnung von A, daß A regul¨ ar ist. b) Berechnen Sie ohne explizite Berechnung von A die Inverse A−1 .
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
4 Funktionen mehrerer Ver¨ anderlicher – Stetigkeit
¨ Ubersicht 4.1 4.2 4.3 4.4
Erste Erkl¨ arungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Beschr¨ anktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grenzwert einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55 59 61 64
In diesem Kapitel wollen wir Ernst machen mit der Ank¨ undigung im Vorwort, dass wir n¨ amlich auf Ihren Vorkenntnissen, liebe Leserin, lieber Leser, die Sie aus der Schule von der Analysis besitzen, aufbauen wollen. Inzwischen ist es Standard an unseren Gymnasien, dass alle, die Abitur gemacht haben, wissen, wie man Funktionen ableitet, wie man dieses Wissen zur Berechnung von Extremwerten benutzt, und alle haben etwas vom Integral geh¨ ort. Wohlgemerkt, 1 das alles im R . Wir wollen daher hier gleich mit der Analysis im Rn beginnen. Dabei werden uckkommen und so Ihr wir immer wieder an kleinen Beispielen auf den R1 zur¨ Vorwissen wieder auffrischen, soweit das n¨ otig ist. Da der Unterschied vom R1 2 zum R ziemlich gewaltig ist, dann aber der Weg zum R3 und allgemein zum Rn , n > 3 kaum noch Steine enth¨alt, beschr¨anken wir uns in der Darstellung und f¨ ur m¨ ogliche Veranschaulichungen auf den R2 . Bitte folgen Sie mir in die Welt der h¨ oher dimensonalen Analysis.
4.1
Erste Erkl¨ arungen
Zuerst erkl¨ aren wir, mit welchen Objekten wir uns ab sofort befassen wollen:
N. Herrmann, Mathematik für Naturwissenschaftler, DOI 10.1007/978-3-8274-2867-7_4, © Spektrum Akademischer Verlag Heidelberg 2012
56
4 Funktionen mehrerer Ver¨ anderlicher – Stetigkeit
Definition 4.1 (Funktion zweier Ver¨ anderlicher) Eine reellwertige Funktion von zwei Ver¨ anderlichen x und y ist eine Abbildung f : R2 → R
(4.1)
z = f (x, y).
(4.2)
mit der Funktionsgleichung
x, y heißen unabh¨ angige Ver¨ anderliche. Anschaulich bedeutet dies, dass wir jedem Punkt (x, y) in der Ebene einen Wert zuordnen. Nehmen Sie also die Tischplatte vor sich. Nach rechts an der vorderen Kante gehe die positive x-Achse, senkrecht von Ihnen weg l¨ auft die positive yAchse. Denken Sie sich einen Punkt (x, y) aus, also legen Sie Einheiten fest und w¨ ahlen Sie dann den Punkt (2, 3), der hoffentlich auf Ihrer Tischplatte liegt. Dann stellen Sie ihren Bleistift oder Kugelschreiber senkrecht auf diesen Punkt. Die L¨ ange des Stiftes ist der Wert z. Den k¨ onnen wir uns als nach oben, oder wenn der der Wert negativ ist, nach unten zeigenden Vektor vorstellen. Lassen Sie jetzt den Stift u ¨ber den Tisch wandern und denken Sie sich, dass der Stift dabei k¨ urzer oder l¨ anger, ja auch negativ wird, so wie gerade die Funktionsgleichung das hergibt. Die oberen Endpunkte des Stiftes beschreiben dann eine Fl¨ ache, vielleicht hat sie ja auch Abbruchkanten, das h¨ angt von der Funktion ab. Vielleicht nehmen Sie sich ein Blatt Papier und halten es u ¨ber die Tischebene. Dann sehen Sie eine m¨ ogliche Funktion vor sich. Kleine, aber wichtige Bemerkung: Zu jedem Punkt u ¨ber der Tischebene, also der (x, y)-Ebene darf es nur genau einen Bildpunkt geben. Wenn Sie also Ihr Blatt Papier zu einer R¨ ohre drehen und u ¨ber die Tischplatte halten, so ist dieses Gebilde nicht der Graph einer Funktion. Auch gefaltetes Papier usw. ergibt keine Fl¨ ache einer Funktion. Das ist genau wie in der Schule. Ein Kreis u ¨ber der x-Achse ist ja auch kein Funktionsgraph. Den m¨ ussen Sie sch¨ on brav in zwei Teilkreise aufspalten, den oberen und den unteren Halbkreis. Beispiel 4.1 Wir betrachten die Funktion f : R2 → R,
f (x, y) := |x|.
Beschreiben Sie den Graphen dieser Funktion. Dazu erinnern wir uns an die einfache Betragsfunktion f (x) = |x|: Jetzt haben wir es mit der Funktion f (x, y) = |x| zu tun. Wir wollen also jedem Punkt (x, y) der Ebene den Absolutwert seiner x-Koordinate zuordnen. Die y-Koordinate spielt keine Rolle f¨ ur den Graphen. Wir k¨ onnen also y beliebig vorgeben und dann den Graphen betrachten. Nehmen wir y = 0, so sind wir
4.1 Erste Erkl¨ arungen
57 y 6
@ @ @
@
@
@
@
1
@
x
@ 1
Abb. 4.1
Der Graph der Funktion f (x) = |x|, wie wir ihn aus der Schule kennen.
oben bei der Funktion im R1 . F¨ ur jedes andere y ergibt sich derselbe Graph wegen der Unabh¨ angigkeit von y. Stellen Sie jetzt zwei Bleistifte vor sich auf die Tischplatte, jeweils im Winkel von 45◦ gegen die Senkrechte geneigt. Diese beiden Stifte verschieben Sie dann auf der y-Achse nach hinten. Oder halten Sie zwei DIN-A 4 Bl¨ atter jeweils 45◦ geneigt vor sich. Oder schauen Sie sich unten die Abbildung an. Ich hoffe, jetzt sehen Sie den Graphen der Funktion. Definition 4.2 (H¨ ohenlinie) Unter einer H¨ ohenlinie oder Niveaulinie einer Funktion verstehen wir alle Punkte im Definitionsgebiet, u ¨ber denen die Funktion den gleichen Wert annimmt. In der Regel ist es tats¨ achlich eine Linie, es kann aber auch ein ganzer Bereich sein. F¨ ur eine konstante Funktion ist es ja sogar die ganze Ebene. Wir betrachten dazu ein weiteres Beispiel, auch um alte Begriffe zu wiederholen. Beispiel 4.2 Sei z
5 6 3 4 1 2 -1 0 1 2 -2 3 4 -4 -3 5 -6 -5
Abb. 4.2
y 6
x
Der Graph der Funktion f (x, y) = |x| liegt wie ein Buch vor uns.
58
4 Funktionen mehrerer Ver¨ anderlicher – Stetigkeit
z = f (x, y) =
1 . x2 + y 2
Beschreiben Sie diese Funktion an Hand ihrer H¨ ohenlinien. Gehen wir erst mal etwas rechnerisch vor. Wir suchen die H¨ ohenlinien. Wie sieht die H¨ ohenlinie z.B. f¨ ur z = 1 aus? z = 1 also
1 = 1 =⇒ x2 + y 2 = 1 x2 + y 2
Das ist also der Einheitskreis in der (x, y)-Ebene. z=
1 1 1 also 2 = =⇒ x2 + y 2 = 2. 2 x + y2 2
Das ist ein Kreis mit Radius, na, nicht falsch machen, richtig, mit Radius z=
√ 2.
1 1 1 , also 2 = =⇒ x2 + y 2 = 4. 2 4 x +y 4
Und das ist ein Kreis mit Radius 2. Alles klar? Stets sind die H¨ ohenlinien Kreise um den Nullpunkt. Betrachten wir allgemein die H¨ ohenlinie zum Wert z = c = const., so folgt 1 1 = c =⇒ x2 + y2 = . 2 +y c 1 Das sind Kreise um (0, 0) mit Radius c. Hier liegt es nahe, mit anderen Koordinaten zu arbeiten. Wir nehmen die Polarkoordinaten z = c also
x2
x = r · cos ϕ,
y = r · sin ϕ.
Damit schreibt sich unsere Funktionsgleichung
f (x, y) = f (r, ϕ) =
1 1 = 2 , wegen sin2 ϕ + cos2 ϕ = 1. r r2 · (cos2 ϕ + sin2 ϕ)
Hier sieht man sehr deutlich, dass die Niveaulinien unabh¨ angig vom Winkel ϕ sind. Also sind diese Linien rotationssymmetrisch. Ein Bild ist auf der n¨ achsten Seite.
4.2 Beschr¨ anktheit
59 z
y
x
Abb. 4.3 Graph der Funktion f (x, y) =
4.2
1 x2 +y2
Beschr¨ anktheit
Beschr¨ anktheit ist, mal abgesehen von der umgangssprachlichen Bedeutung, eigentlich ein ziemlich einfacher Begriff. Eine Funktion ist beschr¨ ankt, wenn halt eine Schranke da ist, u ¨ber die die Funktion nicht hinausgelangt. So einfach m¨ ochte man das haben, aber wir m¨ ussen aufpassen. Mathematik ist gnadenlos, wenn Sie etwas u ¨bersehen. Soll die Schranke oben oder unten sein? Muss die Funktion an die Schranke heranreichen? Wenn 10 eine obere Schranke ist, ist dann auch 20 eine obere Schranke? Also was jetzt? Hier die exakte Definition, die uns zuerst abschreckt, aber wir werden schon alles erkl¨ aren. Definition 4.3 (Beschr¨ ankte Funktion) Eine Funktion f : R2 → R heißt (auf ihrem Definitionsbereich E) nach oben (unten) beschr¨ ankt, wenn die Menge der Funktionswerte {f (x, y) mit (x, y) ∈ E} in R nach oben (unten) beschr¨ ankt ist.
60
4 Funktionen mehrerer Ver¨ anderlicher – Stetigkeit
f heißt auf dem Definitionsbereich E beschr¨ ankt, wenn f auf dem Definitionsbereich E nach oben und nach unten beschr¨ ankt ist. Ist f nach oben (unten) beschr¨ ankt, so heißt die obere (untere) Grenze von M := {f (x, y) mit (x, y) ∈ E} Supremum (Infimum) auf E, in Zeichen: sup f (x, y) bzw. inf f (x, y). (x,y)
(x,y)
Geh¨ ort das Supremum (Infimum) von f auf E zu M , so heißt es Maximum (Minimum), in Zeichen: max f (x, y) (x,y)
bzw.
min f (x, y).
(x,y)
Ja, das klingt ganz furchtbar. Ist es aber nicht wirklich. Schranke ist klar. Umgangssprachlich sagen wir, dass eine Schranke f¨ ur die L¨ ange der Menschen sicher 3 m ist. Dabei vergessen wir ganz die Schranke nach unten: 0 m. Mathematiker d¨ urfen so etwas nicht vergessen. Daher ist f¨ ur uns eine Funktion erst beschr¨ ankt, wenn sie nach oben und nach unten beschr¨ ankt ist. Nun, das lernen wir leicht. Schlimmer ist es mit den Begriffen Infimum‘ und Minimum‘. Ist das nicht ’ ’ dasselbe? Oh, nein, ganz und gar nicht. Dazu ein Beispiel. Beispiel 4.3 z = f (x, y) = x2 + y 2 . Ist diese Funktion beschr¨ ankt? Was k¨ onnen wir u ¨ber Minima und Maxima aussagen? Zur Veranschaulichung betrachten wir wieder die H¨ ohenlinien. x2 + y 2 = c = const. Das sind Kreise um den Punkt (0, 0) mit Radius r = Schnittbilder mit der (x, z)-Ebene:
√
c. Betrachten wir die
y = 0 =⇒ x2 = z. Das ist eine nach oben ge¨ offnete Parabel. Ebenfalls ist das Schnittbild mit der (y, z)-Ebene x = 0 =⇒ y 2 = z
4.3 Grenzwert einer Funktion
61 z
y x
Abb. 4.4 Wir sehen das nach oben ge¨ offnete Paraboloid f (x, y) = x2 + y2 . Es ist nach unten, aber nicht nach oben beschr¨ ankt.
eine nach oben ge¨ offnete Parabel. Genau wie oben mit Polarkoordinaten k¨ onnen wir sehen, dass die ganze Fl¨ ache rotationssymmetrisch ist. Bei diesem Beispiel sehen wir, dass die Funktionsfl¨ ache nach unten durch die (x, y)-Ebene beschr¨ ankt ist, nach oben ist sie nicht beschr¨ ankt. Also ist sie insgesamt nicht beschr¨ ankt. Da im Nullpunkt (0, 0) der Wert 0 angenommen wird und dieser Wert als Funktionswert im Nullpunkt angenommen wird (f (0, 0) = 0), ist das Infimum 0 zugleich das Minimum 0.
4.3
Grenzwert einer Funktion
Mein Schwiegervater hatte sich angeboten, als guter 10-Finger-Schreibmaschinenakrobat die Examensarbeit meiner Frau zu tippen. Es dauerte zwei Seiten, dann kam er entnervt zu mir und gestand, dass er sich stets unter einem Grenzwert etwas Bestimmtes vorgestellt habe, aber was die Mathematik damit will, sei ihm r¨ atselhaft. Er hat dann die Arbeit zu Ende getippt, ohne ein weiteres Wort zu verstehen. Nun, der Begriff Grenzwert‘ hat es auch wirklich in sich. Also bitte nicht ver’ zagen, wenn es zu Beginn im Geb¨ alk der grauen Zellen knirscht. Definition 4.4 (Grenzwert einer Funktion) Wir sagen, eine Funktion f : R2 → R hat bei (x, y) ∈ R2 einen Grenzwert a ∈ R, in Zeichen lim
(x,y)→(x0 ,y0 )
f (x, y) = a,
(4.3)
62
4 Funktionen mehrerer Ver¨ anderlicher – Stetigkeit
wenn f¨ ur jedes ε > 0 ein δ > 0 existiert, so dass aus |(x, y) − (x0 , y0 )| < δ folgt |f (x, y) − a| < ε.
Betrag in R
(4.4)
Dabei ist |(x2 , y2 ) − (x1 , y1 )| :=
(x2 − x1 )2 + (y2 − y1 )2
(4.5)
der Euklidische Abstand von (x1 , y1 ) und (x2 , y2 ). Das ist so eine schreckliche Definition mit ε und δ, wie man sie den Mathematikern von Seiten der Anwender als v¨ ollig unverst¨ andlich um die Ohren haut. Wir k¨ onnten uns daran machen, Ihnen den Horror vor solchen Definitionen zu nehmen, indem wir die Einfachheit der Formel zeigen, aber es gibt eine viel leichter einsichtige Formel, die wir jetzt hier angeben. Warum sollen wir uns mit diesen ε-δ-Fragen herumqu¨ alen? Sie ist nur der Vollst¨ andigkeit wegen hier aufgef¨ uhrt und um meinen Schwiegervater zu entlasten. Satz 4.1 Eine Funktion f : R2 → R sei in einer Umgebung von (x0 , y0 ) erkl¨ art, in (x0 , y0 ) eventuell nicht. f hat in ur alle Folgen von Punkten (xi , yi ) (x0 , y0 ) dann den Grenzwert a ∈ R, wenn f¨ aus dem Definitionsgebiet mit lim (xi , yi ) = (x0 , y0 ) folgt lim f (xi , yi ) = a. i→∞
i→∞
(4.6)
Wir mussten nur eine kleine Einschr¨ ankung vorweg schicken: Eine Funktion f sei in einer Umgebung von (x0 , y0 ) erkl¨ art,. . . Wenn wir also einen isolierten Punkt betrachten, der so ganz allein da herumsteht, so kann dort zwar die Funktion erkl¨ art sein, aber mit obigem Satz k¨ onnen wir dort nicht pr¨ ufen, ob ein Grenzwert vorliegt. Wir k¨ onnen dort keine Folge betrachten, die zu diesem Punkt hinl¨ auft. So etwas gibt es ja bei einem isolierten Punkt nicht. Dort hilft nur obige Definition 4.4. Isolierte Punkte sind aber f¨ ur die Praxis ziemlich uninteressant. Beispiel 4.4 Betrachten wir die Funktion f (x, y) := Wir fragen: Existiert der Limes
x·y . −1
ex2
4.3 Grenzwert einer Funktion
63
lim
(x,y)→(0,0)
f (x, y) = ?
W¨ ahlen wir eine Folge auf der x-Achse, also mit y = 0, so folgt: f (x, 0) =
0 = 0, ex2
also ist auch der Grenzwert einer solchen Folge, wenn wir uns dem Punkt (0, 0) auf der x-Achse n¨ ahern, gleich 0: lim
(x,0)→(0,0)
f (x, 0) = 0
W¨ ahlen wir jetzt aber eine Folge, die sich auf der ersten Winkelhalbierenden (x = y) dem Punkt (0, 0) n¨ ahert, so erhalten wir f (x, x) =
x2 . ex2
F¨ ur x → 0 geht das gegen einen Ausdruck 00 . So etwas nennen wir einen unbestimmten Ausdruck, weil man ja durch 0 nicht dividieren darf. F¨ ur solche F¨ alle kennen wir ein probates Hilfsmittel: Lemma 4.1 (Regel von l’Hospital) Sind f und g als Funktionen von R → R in einer Umgebung von x0 differenzierbar, ist g(x) dort nicht Null und ist limx→x0 dort ein unbestimmter Ausdruck wie lim
0 ∞ f (x) = oder , g(x) 0 ∞
lim
f (x) f (x) = lim , x→x0 g (x) g(x)
x→x0
so gilt
x→x0
falls dieser Term existiert. Wir sollten nicht vergessen zu bemerken, dass Johann Bernoulli, ein hervorragender, aber nicht mit G¨ utern gesegneter Mathematiker, Herrn Marquis de l’Hospital diese Idee verkauft hat. Eigentlich ist es also die Regel von Bernoulli. Außerdem gibt es heute noch Nachfahren im Elsass, die sich Lospital‘ sprechen, ’ also mit dem gesprochenen s‘, im Gegensatz zu unserer Schulweisheit. Und sie ’ sagen, dass sich auch ihr ber¨ uhmter Vorfahre so gesprochen h¨ atte. 2 Zur¨ uck zu unserem Beispiel. Den oben aufgetretenen Ausdruck exx2 , der ja f¨ ur x → 0 unbestimmt wurde, k¨ onnen wir jetzt mit Marquis de l’Hospital bearbeiten, indem wir sowohl im Z¨ ahler als auch im Nenner einfach die Ableitungen bilden:
64
4 Funktionen mehrerer Ver¨ anderlicher – Stetigkeit
2x 1 x2 → = x2 ex2 2xex2 e Dieser letzte Ausdruck geht jetzt f¨ ur x → 0 gegen 11 = 1, also existiert der Grenzwert auch f¨ ur den unbestimmten Ausdruck und stimmt mit diesem hier u ¨berein, ist also gleich 1. Fassen wir zusammen: Wir haben zwei Folgen betrachtet, die sich beide dem Nullpunkt (0, 0) n¨ ahern. Die auf der x-Achse hatte den Grenzwert 0, die auf der ersten Winkelhalbierenden aber den Grenzwert 1. Damit haben nicht alle Folgen denselben Grenzwert. Damit existiert ein solcher (einheitlicher) Grenzwert nicht. Wichtige Bemerkung: Wir haben mit zwei Beispielen die Existenz des Grenzwertes widerlegt. Das ist erlaubt. Es ist aber nat¨ urlich nicht richtig, mit zwei Beispielen die Existenz nachzuweisen. Es heißt im Satz 4.1: wenn f¨ ur alle Folgen‘. Da reichen nicht zwei und nicht ’ hundert zum Nachweis.
4.4
Stetigkeit
Wir beginnen mit dem Begriff stetig‘, der in der Schule h¨ aufig aus verst¨ andlichen ’ Gr¨ unden u ater an verschiedenen Stellen auf ¨bergangen wird. Wir werden aber sp¨ diese wichtige Eigenschaft mancher Funktionen zur¨ uck kommen. Eingedenk, dass Sie, liebe Leserinnen und Leser, nicht zu den eingefleischten Freaks der Mathematik werden wollen, sondern die Mathematik als Hilfsmittel betrachten, wollen wir hier einen leicht verst¨ andlichen Begriff stetig‘ einf¨ uhren, ’ der den kleinen Nachteil hat, dass es Ausnahmepunkte gibt, wo dieser Begriff nicht anwendbar ist. Es sind echte Seltenheitspunkte, die Sie wohl nie interessieren werden. Wir sagen unten etwas dazu. Erst mal die Definition. Definition 4.5 (Stetigkeit) Eine Funktion f : R2 → R heißt im Punkt (x0 , y0 ) stetig, wenn gilt: lim
(x,y)→(x0 ,y0 )
= f (x0 , y0 ).
f heißt in einem Bereich B ⊆ R2 stetig, wenn f in jedem Punkt aus B stetig ist. Diese Definition ist anschaulich und erkl¨ art den Begriff stetig‘ hinreichend. Sie ’ ist mit der in Mathematikb¨ uchern vorgeschlagenen ε-δ-Definition gleichbedeu-
4.4 Stetigkeit
65
tend in allen Punkten, die H¨ aufungspunkte eines Bereiches sind. In isolierten Punkten, Punkten also, die eine Umgebung haben, in denen kein weiterer Punkt des Bereiches liegt, kann man keine Folgen betrachten, die sich diesem Punkt n¨ ahern. Dort ist unsere anschauliche Definition also nicht anwendbar. Als Anwender werden Sie solche Punkte aber wohl kaum in Betracht ziehen wollen, oder? Satz 4.2 (Eigenschaften stetiger Funktionen) 1. Ist f in (x0 , y0 ) stetig und gilt f (x0 , y0 ) > 0, dann gibt es eine ganze Umgebung von (x0 , y0 ) mit f (x, y) > 0 f¨ ur alle (x, y) aus dieser Umgebung. 2. Ist f auf einer abgeschlossenen und beschr¨ ankten Menge E stetig, so ist f auf E beschr¨ ankt. 3. [Satz von Weierstraß] Ist f auf einer abgeschlossenen und beschr¨ ankten Menge E stetig, so besitzt f auf E Minimum und Maximum. Der folgende Satz l¨ asst sich ziemlich leicht anschaulich deuten. Im R1 kann man eine Funktion betrachten, die an einer Stelle x1 negativ ist, an einer anderen Stelle, sagen wir x2 > x1 ist sie positiv. Dann muss sie dazwischen mal die xAchse geschnitten haben. Sie nimmt also den Zwischenwert y = 0 an. Da muss man allerdings zwei Einschr¨ ankungen beachten. Die erste ist recht einsichtig, bei der zweiten muss man etwas nachdenken, was wir lieben. 1. Die Funktion darf keine Spr¨ unge machen, klar, sonst k¨ onnte sie ja einfach die x-Achse aussparen und von y = −3 nach y = +5 h¨ upfen, ohne die x-Achse zu schneiden. Dazu brauchen wir also unbedingt die Stetigkeit der Funktion. 2. Wir brauchen noch eine ganz wichtige Eigenschaft, n¨ amlich, dass wir in den reellen Zahlen arbeiten. Diese Zahlen sind vollst¨ andig. Da gibt es kei√ ne L¨ ucken mehr. Dagegen sind die rationalen Zahlen nicht vollst¨ andig. 2 geh¨ ort nicht zu den rationalen Zahlen, π auch nicht. Auch wenn die rationalen Zahlen sehr dicht aussehen, gibt es L¨ ucken. Betrachten Sie z.B. die Funktion f (x) = x2 − 2,
√ √ so sehen wir, dass ihre Nullstellen bei x1 = − 2 und bei x2 = 2 liegen. Beide Zahlen geh¨ oren nicht zu den rationalen Zahlen. Wenn wir f also nur auf den rationalen Zahlen betrachten, so haben wir zwar f¨ ur x = 0 den Wert f (0) = −2 < 0 und f¨ ur x = 2 den Wert f (2) = 2 > 0, aber es gibt keinen rationalen Punkt x0 ∈ [0, 2] mit f (x0 ) = 0.
66
4 Funktionen mehrerer Ver¨ anderlicher – Stetigkeit
Satz 4.3 (Zwischenwertesatz) Ist f in einem Gebiet E ⊆ R2 stetig und gilt f¨ ur (x1 , y1 ), (x2 , y2 ) ∈ E f (x1 , y1 ) = a,
f (x2 , y2 ) = b mit a < b,
so gibt es f¨ ur jedes c ∈ (a, b) einen Punkt (x, y) ∈ E mit f (x, y) = c.
4.4 Stetigkeit
67
¨ Ubung 5 1. Betrachten Sie die durch z=
y 1 + x2
gegebene Fl¨ ache. a) b) c) d)
Zeichnen Sie die H¨ ohenlinien in ein Koordinatensystem. Veranschaulichen Sie sich das Schnittbild mit der Ebene x = const Veranschaulichen Sie sich das Schnittbild mit der Ebene y = const Skizzieren Sie ein Blockbild.
2. Untersuchen Sie die Funktion f (x, y) =
x2 − y 2 x2 + y 2
im Punkt (0, 0) auf die folgenden drei Grenzwerte: a) b) c)
f (x, y) lim B = lim lim f (x, y) x→0 y→0 C = lim lim f (x, y) A=
(x,y)→(0,0)
y→0
x→0
3. Untersuchen Sie die Funktion x2 − y 2 f (x, y) = . x2 + y 2 + 1 − 1 im Punkt (0, 0) auf die drei Grenzwerte von Aufgabe 2. 4. Zeigen Sie mit Hilfe von Polarkoordinaten, dass die Funktion
f (x, y) =
x3 −y 3 x2 +y 2
f¨ ur (x, y) = (0, 0)
0
f¨ ur (x, y) = (0, 0)
u ¨berall stetig ist. 5. Zeigen Sie, dass die Funktion f (x, y) =
sin(x3 + y 3 ) x2 + y 2
im Nullpunkt (0, 0) stetig erg¨ anzbar ist. Durch welchen Wert?
68
4 Funktionen mehrerer Ver¨ anderlicher – Stetigkeit
6. Zeigen Sie, dass die Funktion
⎧ ⎨
xy 2 + y2 x f (x, y) = ⎩ 0
f¨ ur (x, y) = (0, 0) f¨ ur (x, y) = (0, 0)
im Nullpunkt nicht stetig ist.
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
¨ Ubersicht 5.1 5.2 5.3 5.4 5.5 5.6
Partielle Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . H¨ ohere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Totale Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Richtungsableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Relative Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wichtige S¨ atze der Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69 75 77 84 90 97
In diesem Kapitel werden wir alles, was Sie in der Schule u ¨ber das Differenzieren gelernt haben, in’s Mehrdimensionale u urlich nicht eins ¨bertragen. Das geht nat¨ zu eins, aber immer wieder werden Sie die Schule durchblicken sehen. Ziel der Differentialrechnung damals war die Untersuchung von Funktionen, vor allem ihre Minima und Maxima zu bestimmen. Das wird auch hier unser Ziel sein. Dazu werden wir ganz ¨ ahnlich notwendige und hinreichende Bedingungen aufbauen. Allerdings kann man bei Funktionen mehrerer Ver¨ anderlicher auf verschiedene Weisen Ableitungen definieren. Da m¨ ussen wir sorgf¨ altig unterscheiden lernen. Das ist sicherlich etwas gew¨ ohnungsbed¨ urftig. Ich hoffe, dass die vielen Beispiele Ihnen den Weg ebnen. Also nur Mut und nicht verzagt.
5.1
Partielle Ableitung
Wir beginnen gleich mit einem neuen Begriff, der sich aber nur als leichte Verallgemeinerung aus der Schule herausstellt.
N. Herrmann, Mathematik für Naturwissenschaftler, DOI 10.1007/978-3-8274-2867-7_5, © Spektrum Akademischer Verlag Heidelberg 2012
70
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
Definition 5.1 (Partielle Ableitung) Eine Funktion z = f (x, y) → R heißt bei (x0 , y0 ) aus dem Definitionsbereich partiell nach x bzw. nach y differenzierbar, wenn die Funktion F (x) := f (x, y0 )
bzw.
F (y) := f (x0 , y)
bei x0 bzw. bei y0 (im gew¨ ohnlichen Sinn) differenzierbar ist. Wir schreiben ∂f (x0 , y0 ) = fy (x0 , y0 ) := F (y) ∂y (5.1) und nennen diese Terme partielle Ableitungen von f an der Stelle (x0 , y0 ) nach x bzw. nach y. ∂f (x0 , y0 ) = fx (x0 , y0 ) := F (x) ∂x
bzw.
Ich hoffe, Sie verstehen das bzw.‘ und ordnen jeweils richtig zu. Eigentlich ’ h¨ atten wir alles zweimal aufschreiben m¨ ussen. Betrachten wir die partielle Ableitung nach x. Um sie zu berechnen, setzen wir y = y0 , d.h. wir setzen y fest, lassen es also nicht mehr als Variable frei herumschwirren. Dann ist die Funktion f (x, y) nicht mehr von y abh¨ angig, sondern eine gew¨ ohnliche Funktion einer Variablen. Wenn wir sp¨ ater von den Richtungsableitungen erz¨ ahlen, werden wir hierauf zur¨ uck kommen und zeigen, dass diese partielle Ableitung die Richtungsableitung der Funktion f (x, y) im Punkt (x0 , y0 ) in Richtung der x-Achse ist. Hier haben wir den Wassertopftrick angewendet. Kennen Sie nicht? Also, ein Physiker soll einen Topf mit Wasser heiß machen. Dazu hat er einen leeren Topf, einen Wasserhahn und eine Kochplatte. Er f¨ ullt den Topf mit Wasser, stellt ihn auf den Kocher und wartet zehn Minuten, bis der Topf heiß ist. Anschließend erh¨ alt der Mathematiker eine etwas leichtere Voraussetzung, der Topf ist schon mit kaltem Wasser gef¨ ullt. Nun, der Mathematiker gießt das Wasser aus dem Topf und sagt, er sei fertig, denn diese Aufgabe sei ja schon von dem Physiker gel¨ ost worden. Sie glauben gar nicht, wie wenig witzig das f¨ ur Mathematiker ist; denn so verhalten wir uns st¨ andig. Wir f¨ uhren neue Aufgaben auf bereits gel¨ oste zur¨ uck. Genau das haben wir mit dem partiellen Differenzieren gemacht. Die beiden Funktionen F (x) bzw. F (y) sind ja gew¨ ohnliche Funktionen einer Variablen. F¨ ur die haben wir das Differenzieren in der Schule gelernt. Das nutzen wir jetzt aus. In der Schule lernten wir: Die Ableitung einer Funktion f (x) im Punkt x0 ist der Limes
5.1 Partielle Ableitung
71
f (x0 ) = lim
x→x0
f (x) − f (x0 ) . x − x0
In unserer Funktion f (x, y) halten wir jetzt das y0 fest und schreiben dieselbe Ableitung hin, einfach immer nur hinten dran das y0 setzen: f (x, y0 ) − f (x0 , y0 ) ∂f (x0 , y0 ) = lim . x→x0 ∂x x − x0
(5.2)
Jetzt kommt die noch sch¨ onere Nachricht. So wie in der Schule sind auch hier alle Gesetze und Kenntnisse u ultig. Wir m¨ ussen ¨ber Ableitungen von Funktionen g¨ unser K¨ opfchen also kaum mit Neuem belasten, es bleibt fast alles beim Alten. Wir zeigen das gleich am Beispiel. Sp¨ ater werden wir sehen, dass die partiellen Ableitungen einer Funktion in einem Punkt, zusammengefasst als Vektor, eine wunderbare Bedeutung besitzen. Dieser Vektor verdient daher einen eigenen Namen. Definition 5.2 (Gradient) Der Vektor grad f (x, y) := (fx (x, y), fy (x, y))
(5.3)
heißt Gradient von f im Punkt (x, y). Hier sei bereits eine ganz wichtige Bemerkung angef¨ ugt: Der Gradient einer Funktion von zwei Variablen ist ein Vektor mit zwei Komponenten, er liegt also in der Ebene, wo auch unsere Funktion ihren Definitionsbereich hat. Wir kommen sp¨ ater darauf zur¨ uck. Beispiel 5.1 Sei f (x, y) := x2 y 3 + x y 2 + 2 y. Wir berechnen zun¨ achst allgemein die partiellen Ableitungen und dann den Gradienten im Punkt (x0 , y0 ) = (0, 1). Dazu halten wir y0 fest und schauen uns die Funktion F (x) an: F (x) = f (x, y0 ) = x2 y03 + x y02 + 2 y0 . Ihre Ableitung lautet (Hallo, Schule!) dF (x0 ) ∂f (x0 , y0 ) = 2 · x0 y03 + 1 · y02 + 0 = fx (x0 , y0 ) = . dx ∂x Das macht doch Spaß, also ran an die partielle Ableitung nach y. Wir halten jetzt x0 fest und betrachten die Funktion F (y): F (x0 ) =
72
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
F (y) = x20 y 3 + x0 y 2 + 2 y. Ihre Ableitung lautet F (y0 ) =
dF (y0 ) ∂f (x0 , y0 ) = x20 · 3 · y02 + x0 · 2 · y0 + 2 = fy (x0 , y0 ) = . dy ∂y
Damit k¨ onnen wir sofort den Gradienten aufstellen: grad f (x0 , y0 ) = (2 x0 y03 + 1 y02 , x20 3 y02 + x0 2 y0 + 2) Damit berechnet sich der Gradient im Punkt (x0 , y0 ) = (0, 1) zu grad f (0, 1) = (2 · 0 · 13 + 12 , 02 · 3 · 12 + 0 · 2 · 1 + 2) = (1, 2). Das heißt also, der Gradient der Funktion f (x, y) im Punkt (0, 1) ist der Vektor (1, 2). Definition 5.3 (differenzierbar) Eine Funktion f heißt im Bereich E aus dem Definitionsgebiet differenzierbar, wenn f in jedem Punkt von E nach allen Variablen partiell differenzierbar ist. Definition 5.4 (stetig differenzierbar) Eine Funktion f heißt im Punkt (x0 , y0 ) aus dem Definitionsgebiet stetig differenzierbar, falls f in einer Umgebung von (x0 , y0 ) differenzierbar ist und alle partiellen Ableitungen in (x0 , y0 ) stetig sind. Eine im Bereich E aus dem Definitionsgebiet differenzierbare Funktion f heißt in E stetig differenzierbar, wenn alle partiellen Ableitungen in E stetig sind. Mit diesem Begriff stetig differenzierbar‘ darf man nicht ins Stottern kommen. ’ Wir meinen nicht stetig und differenzierbar‘, sondern wirklich, dass die Funk’ tion differenzierbar sei und alle Ableitungen noch stetig sind. Das ist also eine weitere Eigenschaft der Ableitungen, die gefordert wird. Leider ist dieser Begriff differenzierbar‘ nicht so gebrauchsfertig, wie wir ihn ’ vom R1 her kennen. Dort galt ja z.B. f : R → R differenzierbar =⇒ f stetig. Wir werden jetzt ein Beispiel vorf¨ uhren, wo genau diese Folgerung hier nicht zutrifft. Beispiel 5.2 Wir betrachten die Funktion
⎧ ⎨ f (x, y) =
xy x2 + y 2 ⎩ 0
f¨ ur (x, y) = (0, 0) f¨ ur (x, y) = (0, 0)
.
5.1 Partielle Ableitung
73
Wir zeigen an Hand dieses Gegenbeispiels, dass aus partiell differenzierbar leider nicht unbedingt stetig folgt. Wie Sie sehen, ist ein Problem nur im Punkt (0, 0) zu erwarten; dort entsteht ein Ausdruck der Form 00 , also etwas Unbestimmtes. Darum haben wir ja an dieser Stelle den Wert der Funktion extra festgelegt. Das bedeutet, diese Funktion ist auf jeden Fall u ¨berall in der ganzen Ebene bis auf den Punkt (0, 0) stetig, differenzierbar, alle partiellen Ableitungen existieren usw. Nur der Nullpunkt macht uns Kummer. Dort m¨ ussen wir pr¨ ufen. Haben Sie sich mit der Aufgabe 6 im letzten Kapitel (S. 68) besch¨ aftigt? Dort haben Sie hoffentlich nachweisen k¨ onnen, dass diese Funktion im Nullpunkt leider nicht stetig ist. Wir zeigen jetzt, dass f¨ ur diese Funktion auch im Nullpunkt beide partiellen Ableitungen existieren. Weil das nicht so ganz einsichtig ist, werden wir uns an die Erkl¨ arung in Gleichung (5.2) halten. Es ist x·0 f (x, 0) − f (0, 0) x2 +0 − 0 = = 0. (5.4) x−0 x−0 Rechts ergibt sich 0, also ist der Ausdruck links auch gleich Null, damit existiert auch sein Grenzwert und ist ebenfalls einfach gleich Null. x·0 2 2 − 0 f (x, 0) − f (0, 0) = lim x +0 = lim 0 = 0. x→0 x→0 x→0 x−0 x−0 Die partielle Ableitung nach x existiert also. Nun, genau so geht das mit der partiellen Ableitung nach y:
fx (0, 0) = lim
0·y f (0, y) − f (0, 0) 02 +y 2 − 0 = lim y → 0 = lim 0 = 0. y→0 y→0 y−0 y−0 Beide partiellen Ableitungen existieren also. Nach unserer Definition ist damit die Funktion f auch im Nullpunkt differenzierbar, aber leider ist sie ja dort nicht stetig. Das ist also ein schlechter Differenzierbarkeitsbegriff, und wir m¨ ussen uns etwas Besseres, leider damit auch etwas Komplizierteres einfallen lassen. Noch eine Bemerkung. Zum Nachweis des Grenzwertes in der partiellen Ableitung nach x haben wir zuerst alles ohne lim‘ hingeschrieben und ausgerechnet. ’ Erst als wir gesehen haben, dass hier alles glatt ging, es ergab sich ja 0, durften wir auch den Limes davorschreiben. An der Tafel schreibe ich die Zeile (5.4) mit jeweils kleinen L¨ ucken nach jedem Gleichheitszeichen hin. Dann sehe ich, dass ganz rechts vor die 0 das Limeszeichen geschrieben werden kann, weil ja limx→0 0 = 0 ist. Dann kann man wegen der Gleichheit das Zeichen lim‘ auch ’ vor die beiden Terme vorher in der Zeile setzen. Und dann erst darf man auch die partielle Ableitung ganz vorne hinschreiben. Manchmal schreibe ich diese Zeile an der Tafel dann noch mal hin, damit die Logik, wie wir den Grenzwert nachweisen, ganz klar wird. Bitte lesen Sie sich die zehn Zeilen hier also noch mal durch. Das entspricht meiner Wiederholung an der Tafel.
fy (0, 0) = lim
74
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
¨ Ubung 6 1. Bestimmen Sie f¨ ur die Funktion f (x, y) = |y|
R = {(x, y) ∈ R2 : −1 < x < 1, −1 < y < 1}
in
Supremum und Infimum auf R. Sind das auch Maximum und Minimum? 2. Betrachten Sie die Funktion f (x, y) = x2 + y 2
in
Q = {(x, y) ∈ R2 : −2 < x < 2, −2 < y < 2}.
Veranschaulichen Sie sich an einer Skizze die partiellen Ableitungen fx und fy in verschiedenen Punkten von Q. 3. Berechnen Sie f¨ ur folgende Funktionen die partiellen Ableitungen fx und fy jeweils im Definitionsbereich: f (x, y) = x2 + 3xy + y 2 x y f (x, y) = 2 − 2 y x c) f (x, y) = sin 3x · cos 4y y d) f (x, y) = arctan x 4. Zeigen Sie, dass f¨ ur x2 + y 2 gilt: x · fx + y · fy = f , a) f (x, y) = b) f (x, y) = ln x2 + y 2 gilt: x · fx + y · fy = 1, a) b)
5. Zeigen Sie, dass die Funktion
⎧ ⎨ f (x, y) =
⎩
x2 y + y2 0
x4
f¨ ur (x, y) = (0, 0) f¨ ur (x, y) = (0, 0)
im Punkt (0, 0) partiell differenzierbar, aber dort nicht stetig ist [Hinweis: Betrachten Sie die Koordinatenachsen und die Parabel y = x2 ].
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
5.2 H¨ ohere Ableitungen
5.2
75
H¨ ohere Ableitungen
Genau so wie im R1 l¨ asst sich auch hier der Ableitungsbegriff auf h¨ ohere Ableitungen verallgemeinern. Definition 5.5 Die Funktion f : R2 → R sei in der Menge E ⊆ R2 partiell nach x bzw. partiell nach y differenzierbar. Dann sind fx und fy beides wieder Funktionen mit dem Definitionsbereich E. f heißt in (x0 , y0 ) ⊆ E zweimal nach x bzw. nach y partiell differenzierbar, falls fx bzw. fy partiell nach x bzw. nach y differenzierbar ist. Bezeichnung: ∂2f ∂2f (x0 , y0 ) (x0 , y0 ), fxy (x0 , y0 ) = 2 ∂x ∂y∂x ∂2f ∂2f fyx (x0 , y0 ) = (x0 , y0 ), fyy (x0 , y0 ) = (x0 , y0 ) ∂x∂y ∂y2
fxx (x0 , y0 ) =
(5.5)
Analog kann man dann noch h¨ ohere Ableitungen definieren, also so etwas wie fxxyxyyx (x0 , y0 ), aber das k¨ onnen Sie sicher alleine weiter treiben. Eine wichtige Frage bleibt zu kl¨ aren, wenn wir fxy und fyx betrachten. ochten bitte zuerst nach y und dann Beachten Sie bitte, dass fxy bedeutet, wir m¨ nach x ableiten. Manche Autoren definieren das anders. Aber jetzt kommen wir mit einem sehr interessanten Satz, der uns sagt, dass wir diese Regel gar nicht so genau beachten m¨ ussen. In den meisten F¨ allen, die bei den Anwendungen vorkommen, ist es schlicht egal, in welcher Reihenfolge wir ableiten. Satz 5.1 (Hermann Amandus Schwarz) Die Funktion f sei in einer Umgebung von (x0 , y0 ) stetig. Existieren die partiellen Ableitungen fx fy und fxy in dieser Umgebung und sind diese in (x0 , y0 ) stetig, so existiert auch die partielle Ableitung fyx und es gilt fxy (x0 , y0 ) = fyx (x0 , y0 ). Damit folgern wir z.B.: fxxyxyyx (x0 , y0 ) = fxxxxyyy (x0 , y0 ) = fyyyxxxx (x0 , y0 ) Das ist doch mal eine gute Nachricht.
(5.6)
76
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
¨ Ubung 7 1. Berechnen Sie f¨ ur die Funktionen a) b)
2
f (x, y) := x3 y + ex y , f (x, y) := x cos x − y sin x
alle zweiten partiellen Ableitungen. 2. Betrachten Sie die Funktion
⎧ 2 2 ⎨ xy x − y x2 + y 2 f (x, y) := ⎩ 0
f¨ ur (x, y) = (0, 0) f¨ ur (x, y) = (0, 0)
a) Berechnen Sie die ersten partiellen Ableitungen. b) Zeigen Sie mittels Polarkoordinaten, dass die ersten partiellen Ableitungen in (0, 0) stetig sind. c) Zeigen Sie, dass die gemischten zweiten partiellen Ableitungen im Punkt (0, 0) nicht gleich sind: fyx (0, 0) = fxy (0, 0) ur die Funktion 3. F¨ ur welches a ∈ R ist f¨ f (x, y) := x3 + a x y2 die Gleichung fxx (x, y) + fyy (x, y) = 0 ullt? f¨ ur alle (x, y) ∈ R2 erf¨
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
5.3 Totale Ableitung
5.3
77
Totale Ableitung
Nun aber zu dem neuen Ableitungsbegriff, der uns alle W¨ unsche erf¨ ullt. Definition 5.6 Es sei D ⊆ R2 eine offene Menge und (x0 , y0 ) ∈ D. Die Funktion f : D → R heißt im Punkt (x0 , y0 ) total differenzierbar, wenn gilt
lim
(x,y)→(x0 ,y0 )
f (x, y)−f (x0 , y0 )−fx (x0 , y0 ) · (x − x0 )−fy (x0 , y0 ) · (y − y0 ) = 0. |(x, y) − (x0 , y0 )| (5.7)
Der Term df (x0 , y0 ) = fx (x0 , y0 ) · (x − x0 ) + fy (x0 , y0 ) · (y − y0 )
(5.8)
heißt totales Differential der Funktion f im Punkt (x0 , y0 ). Der Graph der Funktion f(x, y) := f (x0 , y0 ) + fx (x0 , y0 ) · (x − x0 ) + fy (x0 , y0 ) · (y − y0 )
(5.9)
heißt Tangentialebene an f im Punkt (x0 , y0 , f (x0 , y0 )). Die n¨ achste gute Nachricht lautet, dass wir alle aus der Schule bekannten Regeln f¨ ur das Ableiten hierher u onnen. ¨bernehmen k¨ Satz 5.2 (Ableitungsregeln) Die Differentiationsregeln f¨ ur Summen, Differenzen, Produkte und Quotienten u bertragen sich sinngem¨ a ß aus dem R1 . ¨ Bevor wir alles an einem Beispiel u achst mal der Satz, der uns sagt, ¨ben, zun¨ dass mit diesem Begriff alles paletti ist. Satz 5.3 Ist die Funktion f in (x0 , y0 ) total differenzierbar, so ist f in (x0 , y0 ) stetig und differenzierbar. Ist f in (x0 , y0 ) stetig differenzierbar, so ist f in (x0 , y0 ) total differenzierbar. Beispiel 5.3 Bestimmen Sie f¨ ur f (x, y) := das totale Differential bei (x0 , y0 ).
1 ln(x2 + y2 ) 2
78
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
Wir benutzen dieses Beispiel, um uns eine kleine Merkregel f¨ ur das totale Differential zu erarbeiten. Es ist ja nach Definition df (x0 , y0 ) = fx (x0 , y0 ) · (x − x0 ) + fy (x0 , y0 ) · (y − y0 ). Setzen wir jetzt wie in der Schule dx := x − x0 ,
dy := y − y0 ,
und beachten wir grad f := (fx , fy ), so schreibt sich das totale Differential
df (x0 , y0 ) = fx (x0 , y0 ) · (x − x0 ) + fy (x0 , y0 ) · (y − y0 ) = fx (x0 , y0 ) · dx + fy (x0 , y0 ) · dy = grad f (x0 , y0 ) · (dx, dy). Das kann man sich doch leicht merken, oder? Hier heißt das: fx (x0 , y0 ) =
x2
x , + y2
fy (x0 , y0 ) =
x2
y , + y2
also
grad f (x0 , y0 ) =
y x , x2 + y 2 x2 + y 2
,
und damit lautet das totale Differential df (x0 , y0 ) =
x y · dx + 2 · dy. x2 + y 2 x + y2
Beispiel 5.4 Bestimmen Sie die Tangentialebene an f (x, y) :=
y in (x0 , y0 ) = (1, 2). 1 + x2
Die Tangentialebene ist der Graph der Funktion f(x, y) := f (x0 , y0 ) + fx (x0 , y0 ) · (x − x0 ) + fy (x0 , y0 ) · (y − y0 ). Wir rechnen also:
5.3 Totale Ableitung
79
y0 2 ⇒ f (1, 2) = = 1, 1 + 12 1 + x20
f (x0 , y0 ) =
y0 · 2 · x ⇒ fx (1, 2) = −1, (1 + x20 )2 1 1 ⇒ fy (1, 2) = . fy (x0 , y0 ) = 2 1 + x20
fx (x0 , y0 ) = −
Damit folgt
grad f (x0 , y0 ) =
−
2 · x0 · y0 1 , (1 + x20 )2 1 + x2
,
also
grad f (1, 2) =
−1,
1 2
.
Als Tangentialebene erhalten wir damit 1 f(x0 , y0 ) = 1 + (−1) · (x0 − 1) + (y − 2) 2 y0 = 1 − x0 + . 2 Wir setzen jetzt z := f(x, y), um damit die Tangentialebene im R3 darzustellen, und erhalten in Koordinatenform: z =1−x+
y =⇒ 2 x − y + 2 z = 2. 2
Das ist, wie wir von fr¨ uher wissen, eine Ebene im R3 . Ist das nicht toll, wie hier pl¨ otzlich die analytische Geometrie ins Spiel kommt? Ebenengleichung, hatten wir doch in der 12. Ein ziemliches Wesensmerkmal in der Mathematik, dass man nichts vergessen darf, alles kommt irgendwann mal wieder. Solch einen neuen Begriff wie total differenzierbar hat man erst vollst¨ andig verstanden, wenn man auch Funktionen kennen gelernt hat, die diese Eigenschaft nicht besitzen. Darum folgt jetzt ein Beispiel einer Funktion, die u ¨berall, auch im Punkt (0, 0) stetig ist, dort sogar alle partiellen Ableitungen besitzt, also in unserer Nomenklatur differenzierbar ist, aber dort nicht total differenzierbar ist. Beispiel 5.5 Wir zeigen, dass die Funktion
f (x, y) :=
x2 y x2 +y 2
f¨ ur (x, y) = (0, 0)
0
f¨ ur (x, y) = (0, 0)
80
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
im Punkt (0, 0) stetig und differenzierbar, aber nicht total differenzierbar ist. Wir sehen nat¨ urlich sofort, dass in allen anderen Punkten kein Problem zu erwarten ist. Nur die Nulldividiererei macht ja Kummer. Wir zeigen, dass 1. f (x, y) im ganzen R2 stetig ist, 2. f (x, y) auch im Punkt (0, 0) alle partiellen Ableitungen besitzt, 3. dass f (x, y) aber im Nullpunkt (0, 0) nicht total differenzierbar ist. Zu 1. Wir untersuchen den Punkt (x, y) = (0, 0) mit Polarkoordinaten: x = r cos ϕ,
y = r sin ϕ.
Sei zun¨ achst (x, y) = (0, 0). Dann ist r2 cos2 ϕ r sin ϕ r 2 cos2 ϕ + r2 sin2 ϕ r3 cos2 ϕ sin ϕ = r2 2 = r cos ϕ sin ϕ,
f (x, y) =
weil ja stets sin2 ϕ + cos2 ϕ = 1 ist. Jetzt betrachten wir den Grenz¨ ubergang r → 0, n¨ ahern uns also dem Nullpunkt. Wie wir an der letzten Zeile sehen, gibt es kein Problem mehr, da wird nirgends mehr durch 0 geteilt. Also existiert der Grenzwert und er ist gleich null. Also ist f stetig im Punkt (0, 0). Das war mit dem Trick der Polarkoordinaten einfach. Wir sollten dazu sagen, dass wir im Prinzip nat¨ urlich alle Wege, wirklich alle betrachten m¨ ussen, die sich auf den Nullpunkt zu bewegen. Aber durch den Grenz¨ ubergang r → 0 haben wir die alle erfasst. Zu 2. Wir bilden die partiellen Ableitungen zun¨ achst wieder f¨ ur (x0 , y0 ) = (0, 0):
fx (x0 , y0 ) = = fy (x0 , y0 ) =
2 x0 y0 (x20 + y02 ) − x20 y0 · 2 · x0 (x20 + y02 )2 2 x0 y03 (x20 + y02 )2
x20 (x20 − y02 ) (x20 + y02 )2
Hier haben wir etwas Kummer. Das Problem, durch Null zu dividieren, hat sich nicht ge¨ andert. Wir kommen also so nicht weiter. Wir werden daher f¨ ur den Punkt (0, 0) direkt die partiellen Ableitungen aus der urspr¨ unglichen Definition berechnen. Es ist
5.3 Totale Ableitung
81
f (x, 0) − f (0, 0) 0−0 = = 0. x−0 x Dann gilt auch f¨ ur den Limes fx (0, 0) = lim
x→0
f (x, 0) − f (0, 0) 0−0 = lim = lim 0 = 0. x→0 x→0 x−0 x
Ganz analog geht das mit der partiellen Ableitung nach y, auch die existiert und es ist fy (0, 0) = 0. Also ist f in (0, 0) differenzierbar, beide partiellen Ableitungen existieren. Wir bemerken noch schnell, dass aber die partiellen Ableitungen nicht stetig im Punkt (0, 0) sind; denn betrachte die 1. Winkelhalbierende x = y mit zun¨ achst x = 0. fx (x0 , x0 ) =
2 x0 x30 1 = . 2 (x20 + x20 )2
Das ist also ein konstanter Wert. Damit ist auch lim fx (x0 , x0 ) =
x0 →0
1 = 0. 2
Zu 3. Wir zeigen jetzt, dass f im Punkt (0, 0) nicht total differenzierbar ist. Wir m¨ ussten lt. Definition zeigen (vgl. Formel (5.7)): lim
(x,y)→(0,0)
. . . = 0.
Wieder w¨ ahlen wir zur Widerlegung die 1. Winkelhalbierende. Sei also x = y > 0. Dann folgt f (x, x) − f (0, 0) − fx (0, 0) · (x − 0) − fy (0, 0) · (x − 0) |(x, x) − (0, 0)| =
x3 2 x2
−0−0−0 √ 2 x2
x √ 2x 1 = √ 2 2 = const.
=
2
Und das geht nicht gegen 0, da es ja konstant ist. Mit diesem Beispiel haben wir zugleich gezeigt, dass wir wirklich einen neuen Ableitungsbegriff definiert haben. Wir wollen noch einmal zusammenfassen, wie wir eine Funktion auf totale Differenzierbarkeit untersuchen m¨ ussen.
82
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
Untersuchung auf totale Differenzierbarkeit in (x0 , y0 ) f stetig?
neinf nicht total diff’bar
ja
? f partiell diff’bar?
neinf nicht total diff’bar
ja
? part. Abl. stetig?
ja -
f total diff’bar
nein ? Ex. Grenzwert in (5.7)? ja
? f total diff’bar
neinf nicht total diff’bar
5.3 Totale Ableitung
83
¨ Ubung 8 1. Zeigen Sie, dass die Funktion
⎧ ⎨ f (x, y) :=
⎩
x3 y + y2 0
x2
f¨ ur (x, y) = (0, 0) f¨ ur (x, y) = (0, 0)
u ¨berall im R2 total differenzierbar ist. 2. Untersuchen Sie, ob die Funktion ⎧ 2 2 ⎨ x y f¨ ur (x, y) = (0, 0) x2 + y 2 f (x, y) := ⎩ 0 f¨ ur (x, y) = (0, 0) im R2 total differenzierbar ist. 3. Berechnen Sie f¨ ur die Funktion f (x, y) :=
1 ln(x2 + y2 ) 2
das totale Differential. 4. Berechnen Sie f¨ ur die Funktion f (x, y) := x2 y − 3 y a) die Tangentialebene im Punkt (x0 , y0 ) = (4, 3), b) das totale Differential im Punkt (x1 , y1 ) = (3.99, 3.02), c) eine N¨ aherung mit Hilfe des totalen Differentials f¨ ur f (5.12, 6.85).
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
84
5.4
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
Richtungsableitung
In diesem Abschnitt wollen wir den Begriff der partiellen Ableitung erweitern und daraus einige interessante Folgerungen ziehen. Definition 5.7 (Richtungsableitung) Sei f (x, y) in einer Umgebung des Punktes (x0 , y0 ) ∈ R2 definiert und sei m
:= 2 ange 1, also mit (m1 , m2 ) ein Vektor des R der L¨ |m|
:=
m21 + m22 = 1.
Dann heißt der Grenzwert, falls er existiert, ∂f (x0 , y0 ) f (x0 + k · m1 , y0 + k · m2 ) − f (x0 , y0 ) := lim k→0 ∂m k
(5.10)
Richtungsableitung von f (x, y) im Punkt (x0 , y0 ) in Richtung von m. Schauen wir uns das genau an, so erkennen wir, dass wir uns vom Punkt (x0 , y0 ) ein kleines St¨ uck zum Punkt f (x0 +k·m1 , y0 +k·m2 ) entfernen und dann mit dem Limes auf den Punkt (x0 , y0 ) zulaufen, indem wir nur k ver¨ andern. Wir laufen
und betrachten dort also auf der Geraden durch (x0 , y0 ) in Richtung von m genau so einen Differenzenquotienten wie im R1 und davon den Limes. Jetzt wird der Begriff Richtungsableitung‘ hoffentlich klar, es ist die gew¨ ohnliche ’ Ableitung von f (x, y), eingeschr¨ ankt auf die Gerade durch (x0 , y0 ) in Richtung m.
Schnell ein Beispiel, damit wir sehen, wie einfach dieser Begriff ist. Beispiel 5.6 F¨ ur die Funktion f (x, y) := x2 + y 2 berechnen wir die Richtungsableitung im Nullpunkt (x0 , y0 ) = (0, 0) in Richtung der ersten Winkelhalbierenden. Vom Nullpunkt in Richtung der ersten Winkelhalbierenden geht es mit dem Vektor (1, 1). Aber Achtung, dieser Vektor hat nicht die L¨ ange 1. Pythagoras sagt uns doch, dass |(1, 1)| =
√ 12 + 12 = 2.
Wir m¨ ussen also den Vektor 1 m
:= √ · (1, 1) = 2
1 1 √ ,√ 2 2
5.4 Richtungsableitung
85
als Richtungsvektor nehmen. Dann rechnen wir mal schnell den Grenzwert aus. Es ist f ( √k2 , √k2 ) − f (0, 0) f (x0 + k · m1 , y0 + k · m2 ) − f (x0 , y0 ) = k k k2 k2 + − 0 2 = 2 k = k. Hier darf man nat¨ urlich den Limes limk→0 anwenden, und es ergibt sich ∂f (x0 , y0 ) = 0. ∂m Nehmen wir jetzt den Richtungsvektor m
= (1, 0), also die Richtung der xAchse, so folgt ∂f (x0 , y0 ) f (x0 + k, 0) − f (0, 0) k2 = lim = lim = lim k = 0. k→0 k→0 k k→0 ∂m k Das ist genau die partielle Ableitung in x-Richtung. Vergleichen Sie nur die Definition in (5.2). Analog ergibt sich f¨ ur den Vektor m
= (0, 1) die partielle Ableitung in y-Richtung. Die partiellen Ableitungen sind also die Richtungsableitungen in Richtung der Koordinatenachsen. Im folgenden Satz zeigen wir, wie man die Richtungsableitung sehr leicht ausrechnen kann, ohne immer diesen Grenzwert zu betrachten. Satz 5.4 Ist f (x, y) in einer Umgebung von (x0 , y0 ) definiert und in (x0 , y0 ) stetig, so existiert die Richtungsableitung von f (x, y) in (x0 , y0 ) in Richtung jedes Einheitsvektors m,
und es gilt ∂f (x0 , y0 ) = grad f (x0 , y0 ) · m
∂m
(5.11)
Wir berechnen also den Gradienten von f und bilden das innere Produkt mit dem Richtungsvektor m,
vorher diesen bitte auf L¨ ange 1 zurecht stutzen. Als n¨ achstes haben wir zwei wundersch¨ one S¨ atze vor uns, die uns die Untersuchung solcher Funktionen so anschaulich machen. Dazu betrachten wir die H¨ ohenlinien einer Funktion f (x, y). Gehen Sie dazu wieder ganz an den Anfang zur¨ uck und denken Sie noch mal an das Gebirge, das die Funktion bildet, also der Graph dieser Funktion, sagen wir, u ohenlinien ¨ber der Tischplatte vor Ihnen. H¨ erhalten wir dadurch, dass wir ein Blatt Papier parallel zur Tischplatte in einem gewissen Abstand mit dem Gebirge zum Schnitt bringen. Aber jetzt nichts falsch machen. Die H¨ ohenlinien sind nicht diese Schnittlinien, sndern ihre Projektion auf die Tischplatte. Die H¨ ohenlinien liegen in der Tischebene. Es sind
86
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
die Linien im Definitionsgebiet, auf denen die Funktion f (x, y) denselben Wert annimmt. Das ist ganz wichtig und wird von vielen Anf¨ angern falsch gemacht. Wir suchen also die Punkte (x, y) ∈ R2 , mit f (x, y) = const. ¨ Uber einer solchen Linie hat unsere Funktion also immer die gleiche H¨ ohe. Wenn wir in Richtung einer solchen Linien fortschreiten, so ¨ andert sich unsere Steigung nicht, d.h. die Richtungsableitung in eine solche Richtung m
ist gleich ∂f (x0 ,y0 ) null: = 0. Jetzt werfen Sie bitte einen kleinen Blick auf den Satz 5.4, ∂m und Sie erkennen, weil das innere Produkt nur f¨ ur senkrecht stehende Vektoren verschwindet, falls diese beiden ungleich dem Nullvektor sind: Satz 5.5 (Gradient und H¨ ohenlinien) Der Gradient steht senkrecht auf den H¨ ohenlinien. Wir suchen uns also auf der Tischplatte durch einen beliebigen Punkt die zugeh¨ orige H¨ ohenlinie und wissen sogleich, wohin der Gradient zeigt, n¨ amlich senkrecht zu dieser Linie. Wir wissen ja noch von fr¨ uher, dass auch der Gradient ein Vektor in der Tischplattenebene ist. F¨ ur den n¨ achsten Satz m¨ ussen wir zur¨ uckgreifen auf das innere Produkt zweier Vektoren. Erinnern wir uns?
a · b = | a| · | b| · cos ∠( a, b). Man multipliziert die L¨ ange des ersten Vektors mit der L¨ ange des zweiten und noch mit dem Cosinus des eingeschlossenen Winkels. F¨ ur die Richtungsableitung galt ∂f (x0 , y0 ) = grad f (x0 , y0 ) · m
∂m
· cos ∠(grad f (x0 , y0 ), m).
= |grad f (x0 , y0 )| · |m| Der Richtungsvektor m
hat immer die L¨ ange 1. An einem bestimmten Punkt (x0 , y0 ) ist der Gradient festgelegt, hat also auch eine feste L¨ ange, an der nicht gedreht wird. Einzig der Cosinus ¨ andert sich, wenn wir m
¨ andern. Der Cosinus hat Werte zwischen −1 und 1. Sein gr¨ oßter Wert wird f¨ ur den Winkel 0◦ erreicht, n¨ amlich 1. Wenn wir also m
in dieselbe Richtung wie den Gradienten legen, so hat die Richtungsableitung ihren gr¨ oßten Wert. Wir schließen: Satz 5.6 Der Gradient zeigt in Richtung des st¨ arksten Anstiegs.
5.4 Richtungsableitung
87
Aber halt, hier sind sehr viele Irrt¨ umer im Umlauf. Wir erinnern uns, dass der Gradient in der (Tisch-)Ebene liegt, der Vektor m
ebenfalls. Wenn wir also jetzt den gr¨ oßten Anstieg unserer Fl¨ ache in einem Punkt (x0 , y0 ) suchen, so rechnen wir an diesem Punkt den Gradienten aus. Der zeigt in der Tischebene in eine Richtung. Oben auf der Fl¨ ache geht es in dieser Richtung am steilsten bergauf. Viele meinen, der Gradient l¨ age oben auf der Fl¨ ache und zeige so tangential in die steilste Richtung. Aber der Gradient ist kein Tangentenvektor. Er liegt in der Ebene unten. Nie wieder falsch machen! Einen Tangentenvektor k¨ onnen wir trotzdem leicht bestimmen: Satz 5.7 F¨ ur z = f (x, y) ist mit m
= (m1 , m2 ) der Vektor
t := (m1 , m2 , grad f (x0 , y0 ) · m)
ein Tangentenvektor an den Graph der Fl¨ ache z (x0 , y0 , f (x0 , y0 )) in Richtung m.
(5.12) = f (x, y) im Punkt
Jetzt m¨ ussen wir aber dringend u ¨ben. Beispiel 5.7 Wir betrachten die Funktion
f (x, y) :=
x3 −x y 2 x2 +y2
(x, y) = (0, 0)
0
(x, y) = (0, 0)
und zeigen, dass f (x, y) 1. auch im Nullpunkt stetig ist, 2. auch im Nullpunkt eine Richtungsableitung in jede Richtung besitzt, 3. im Nullpunkt aber nicht total differenzierbar ist. Zu 1. Wir zeigen, dass gilt: lim
(x,y)→(0,0)
f (x, y) = f (0, 0)
Dazu benutzen wir Polarkoordinaten x = r cos ϕ, y = r sin ϕ. F¨ ur (x, y) = (0, 0) ist
lim
(x,y)→(0,0)
r3 cos3 ϕ − r3 cos ϕ sin2 ϕ r→0 r2 (cos2 ϕ + sin2 ϕ)
= lim
= lim r cos ϕ (cos2 ϕ − sin2 ϕ) r→0
= 0 = f (0, 0); denn sin und cos sind beschr¨ ankte Funktionen.
88
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
Zu 2. Wir zeigen, dass f (x, y) in 0, 0) in jede Richtung differenzierbar ist. Wieder helfen uns dabei die Polarkoordinaten. Als Ableitungsrichtung w¨ ahlen wir m
= (cos ϕ, sin ϕ), 0 ≤ ϕ < 2 π, und erhalten f¨ ur ein beliebiges k ∈ R, indem wir bei der Richtungsableitung zun¨ achst den lim weglassen, f ((0, 0) + k(cos ϕ, sin ϕ)) − f (0, 0) k3 (cos3 ϕ − cos ϕ sin ϕ) = k k3 3 = cos ϕ − cos ϕ sin2 ϕ = cos ϕ cos(2 ϕ). Unser Adlerauge sieht sofort, dass hier kein r mehr drinsteckt, der ganze letzte Term aber beschr¨ ankt ist, weil der cos so lieb ist. Also k¨ onnen wir getrost den Grenzwert r → 0 betrachten, der letzte Wert bleibt einfach unber¨ uhrt vom r und h¨ angt nur von der Richtung ϕ ab. Damit folgt ∂f (0, 0) = cos ϕ cos(2 ϕ). ∂m Also existiert in jede Richtung die Richtungsableitung. Zu 3. Um zu zeigen, dass f nicht total differenzierbar ist, rechnen wir drei verschiedene Tangentenvektoren im Punkt (0, 0) aus. Dann sehen wir das Palaver schon. Als Tangentenvektor haben wir im Satz 5.7 die Gleichung angegeben
t := (m1 , m2 , grad f (x0 , y0 ) · m).
Die erste und zweite Komponente w¨ ahlen wir frei, die dritte Komponente haben wir gerade in 2. ausgerechnet. Dann geht das ganz leicht. Wir w¨ ahlen zuerst die Richtung der x-Achse, also m
1 = (1, 0). Wegen ϕ = 0 erhalten wir
t1 = (1, 0, 1). Dann w¨ ahlen wir die Richtung der y-Achse, also m
2 = (0, 1). Wegen ϕ = 90◦ ist unser Tangentenvektor
t2 = (0, 1, 0). Als drittes w¨ a hlen wir die Richtung der ersten Winkelhalbierenden, also √ √ m
3 = 22 , 22 und erhalten wegen ϕ = 45◦
√ √ √ √ 2 2 2 2 , , ·0 = · (1, 1, 0). 2 2 2 2 Schauen Sie sich bitte diese drei Tangentenvektoren an. Sie liegen nicht in einer Ebene, wie Sie vielleicht mit drei Bleistiften sehen k¨ onnen. Also kann es im Nullpunkt keine Tangentialebene geben, und damit ist die Funktion im Punkt (0, 0) auch nicht total differenzierbar.
t3 =
5.4 Richtungsableitung
89
¨ Ubung 9 1. Bestimmen Sie f¨ ur die Funktion f (x, y) :=
y 1 + x2
a) die Richtungsableitung im Punkt (1, 2) in die Richtungen (3, 4) und (−1, 1), b) die Richtungen im Punkt (1, 2), f¨ ur die die Steigung maximal, minimal, gleich Null ist c) die Tangentialebene im Punkt (1, 2) sowie die Tangente im Punkt (1, 2) in Richtung (3, 4). 2. Gegeben sei die Funktion f (x, y) := x2 + 3 x + y 2 + 2 y − 15. a) Ist f (x, y) an der Stelle (x0 , y0 ) = (1, 3) total differenzierbar? b) Berechnen Sie die Gleichung der Tangentialebene an die Funktion f (x, y) im Punkt (1, 3, f (1, 3)). c) Bestimmen Sie das totale Differential bei (x0 , y0 ) = (1, 3). d) Bestimmen Sie die Richtung des st¨ arksten Anstiegs von f (x, y) im Punkt (1, 3) und die Richtungsableitung in diese Richtung. 3. Berechnen Sie die Richtungsableitung der Funktion f (x, y) := x sin y in Richtung m
:=
π π (1, 2) im Punkt (xo , yo ) = , . |(1, 2)| 2 4
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
90
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
5.5
Relative Extrema
Auch in diesem Abschnitt werden wir erstaunlich viele Parallelen zur Schulmathematik kennen lernen. Auf die Weise k¨ onnen wir unser Schulwissen reaktivieren und in einen gr¨ oßeren Zusammenhang einordnen. Definition 5.8 (Relative Extrema) Die Funktion f (x, y) sei im Gebiet G ⊆ R2 definert. Der Punkt (x0 , y0 ) ∈ G heißt relatives Maximum von f in G, wenn es eine Umgebung U (x0 , y0 ) ⊆ G gibt mit f (x, y) < f (x0 , y0 )
f¨ ur alle (x, y) ∈ U (x0 , y0 )\{(x0 , y0 )}.
(5.13)
Er heißt relatives Minimum von f in G, wenn es eine Umgebung U (x0 , y0 ) ⊆ G gibt mit f (x, y) > f (x0 , y0 )
f¨ ur alle (x, y) ∈ U (x0 , y0 )\{(x0 , y0 )}.
(5.14)
Das sieht nur gruselig aus. Gemeint ist, dass f¨ ur ein Maximum in einer Umgebung von (x0 , y0 ) alle Werte von f (x, y) kleiner sind als der Wert bei (x0 , y0 ). Also ganz anschaulich, was wir unter Maximum so verstehen. Minimum analog. Ein Wort zum Begriff relativ‘. Wir meinen hier nicht so etwas wie in der Wet’ tervorhersage, dass es morgen relativ kalt wird. Das Gegenteil von relativ‘ ist ’ f¨ ur uns absolut‘. Da sehen wir schon, worum es geht. Betrachten Sie folgende ’ Funktion:
25 20 15 10
5
0
-5 -10 -15
-1
0
1
2
3
4
5
Abb. 5.1 f : [−1, 5] → R mit f (x) := x3 − 6x2 + 9x + 1.
Das sieht wie ein Graph mit einem Maximum bei x = 1 und einem Minimum bei x = 3 aus. Tats¨ achlich haben wir die Funktion genau so gew¨ ahlt. Aber halt,
5.5 Relative Extrema
91
wenn wir das ganze Intervall [−1, 5] betrachten, so ist doch bei x = −1, also am linken Rand das Minimum und bei x = 5 das Maximum. Nur in einer kleinen Umgebung, die wir durch einen kleinen Kreis um das vermeintliche Maximum angedeutet haben, gibt es keine gr¨ oßeren Werte. Solch einen Punkt nennen wir relatives Maximum‘ bzw. relatives Minimum‘. Die beiden Randextrema sind ’ ’ absolute Extrema. Genau so halten wir es auch im R2 . Und genau so wie im R1 hilft uns auch hier die Differentialrechnung bei der Suche nach relativen Extrema. Satz 5.8 (Notwendige Bedingung) Ist in (x0 , y0 ) ein relatives Extremum von f (x, y), so ist dort fx (x0 , y0 ) = fy (x0 , y0 ) = 0, also grad f (x0 , y0 ) = (0, 0).
(5.15)
Hier u ¨bernimmt also der Gradient die Stelle der ersten Ableitung im R1 . Beachten Sie bitte genau die Reihenfolge der Aussagen. In relativen Extrema haben wir einen verschwindenden Gradienten. Es ist keineswegs umgekehrt auch richtig, dass in allen Punkten mit verschwindendem Gradienten ein relatives Extremum vorliegt. Wir kommen gleich mit Beispielen. Die Bedingung mit dem Gradienten ist daher nicht hinreichend f¨ ur ein relatives Extremum, aber notwendig ist sie schon. Nur solche Punkte k¨ onnen u ¨berhaupt als relative Extrema in Frage kommen. Alle anderen k¨ onnen wir aus unserer Suche nach relativen Extrema ausscheiden. Das ist doch immerhin schon eine Einschr¨ ankung f¨ ur unsere Suche. Definition 5.9 (Station¨ are Punkte) Punkte (x, y) des R2 mit grad f (x, y) = (0, 0) heißen station¨ are Punkte von f . Beispiel 5.8 Betrachten wir die Funktion f (x, y) = x2 + y 2 . Wir sehen, dass im Nullpunkt (0, 0) die partiellen Ableitungen sowohl nach x als auch nach y verschwinden. Dort hat die Fl¨ ache auch ein Minimum.
92
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit z
y x 2
2
Abb. 5.2 Der Graph der Funktion z = f (x, y) = x + y , ein nach oben offenes Paraboloid oder anschaulich eine Sch¨ ussel
Beispiel 5.9 Betrachten wir die Funktion f (x, y) = x y. Unten ist eine graphische Darstellung dieser Funktion. Es handelt sich anschaulich um eine Sattelfl¨ ache, mathematisch nennen wir diese Fl¨ ache ein hyperbolisches Paraboloid. z
-6
-5
-4
-3
-2
-1
5 0 1 12 2 3 4 3 4 5 6
y
6
x
Abb. 5.3 Der Graph der Funktion z = f (x, y) = x y, ein hyperbolisches Paraboloid oder anschaulich eine Sattel߬ ache
5.5 Relative Extrema
93
Im Nullpunkt (0, 0) sind die partiellen Ableitungen sowohl nach x als auch nach y gleich 0, aber trotzdem ist dort keine relative Extremstelle, weder Minimum noch Maximum, weil die Fl¨ ache nach vorne und nach hinten abf¨ allt, nach rechts und nach links aber ansteigt. Die Bedingung mit dem verschwindenden Gradienten reicht also auf keinen Fall aus, um sicher auf ein relatives Extremum zu schließen. Ganz genau wie im R1 haben wir aber auch hier eine hinreichende Bedingung, die nat¨ urlich etwas 2 komplizierter ausf¨ allt, um alle M¨ oglichkeiten des R zu erfassen: Satz 5.9 (Hinreichende Bedingung) Die Funktion z = f (x, y) sei in ihrem Definitionsgebiet G zweimal stetig differenzierbar, d.h. ihre zweiten partiellen Ableitungen seien noch stetig. Es sei in (x0 , y0 ) ∈ G grad f (x0 , y0 ) = 0.
(5.16)
Ist dann 2 fxx (x0 , y0 ) · fyy (x0 , y0 ) − fxy (x0 , y0 ) > 0 und fxx (x0 , y0 ) < 0,
(5.17)
so besitzt f in (x0 , y0 ) ein relatives Maximum. Ist 2 fxx (x0 , y0 ) · fyy (x0 , y0 ) − fxy (x0 , y0 ) > 0 und fxx (x0 , y0 ) > 0,
(5.18)
so besitzt f in (x0 , y0 ) ein relatives Minimum. Ist 2 fxx (x0 , y0 ) · fyy (x0 , y0 ) − fxy (x0 , y0 ) < 0,
(5.19)
so liegt kein relatives Extremum vor, sondern f hat in (x0 , y0 ) einen Sattelpunkt. Aufmerksame Leserinnen und Leser sehen vielleicht, dass hier der Fall 2 (x0 , y0 ) = 0 fxx (x0 , y0 ) · fyy (x0 , y0 ) − fxy
(5.20)
in der Aufz¨ ahlung fehlt. Tats¨ achlich muss man in dem Fall zur Untersuchung der Funktion im Punkt (x0 , y0 ) h¨ ohere Ableitungen heranziehen. Dies wollen wir hier nicht weiter betrachten. Das ist ein langer Satz, der uns aber ziemlich ersch¨ opfend Auskunft u ¨ber relative Extrema gibt. F¨ ur die erste Bedingung in (5.17) bzw. in (5.18) gibt es eine einfache Merkregel. Wir schreiben die zweiten partiellen Ableitungen in eine Matrix nach folgender Anordnung:
H(x0 , y0 ) :=
fxx (x0 , y0 ) fxy (x0 , y0 ) fyx (x0 , y0 ) fyy (x0 , y0 )
.
(5.21)
94
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
Die Determinante dieser sog. Hesse-Matrix ist genau der Audruck oben, wenn Sie bitte noch mal die Definition der Determinante einer (2 × 2)-Matrix S. 23 nachschlagen. Zwei Beispiele m¨ ogen das verdeutlichen. Beispiel 5.10 Es sei 1 x2 − 4 x y + 9 y 2 + 3 x − 14 y + . 2 2 Wir untersuchen diese Funktion auf relative Extrema. f (x, y) :=
Wir rechnen: fx (x, y) = x − 4y + 3,
fy (x, y) = −4x + 18y − 14.
Zur Findung von station¨ aren Punkten setzen wir diese beiden partiellen Ableitungen jeweils gleich 0. Daraus entstehen zwei lineare Gleichungen mit zwei Unbekannten, also etwas Einfaches: 4x − 16y + 12 = 0 −4x + 18y − 14 = 0 Ich glaube, diese kleine Rechnung k¨ onnen wir uns ersparen und Ihnen miteilen, dass x = y = 1 die einzige L¨ osung dieses LGS ist. Also haben wir nur einen ufen wir jetzt weiter. station¨ aren Punkt P0 = (x0 , y0 ) = (1, 1) gefunden. Den pr¨ Es ist fxx (x, y) = 1,
fyy (x, y) = 18,
fxy (x, y) = fyx (x, y) = −4.
Damit erhalten wir als Determinante der Hesse-Matrix 2 fxx (1, 1) · fyy (1, 1) − fxy (1, 1) = 1 · 18 − (−4)2 = 2 > 0.
Also liegt auf jeden Fall ein relatives Extremum im Punkt P0 = (1, 1). Wegen fxx (1, 1) = 1 > 0 handelt es sich um ein relatives Minimum. Der Wert der Funktion in diesem Punkt ist f (1, 1) =
1 1 − 4 + 9 + 3 − 14 − = −5. 2 2
Beispiel 5.11 Gegeben sei die Funktion f (x, y) := (y − x2 ) · (y − 2 x2 ). Wieder versuchen wir, ihre relativen Extremstellen zu finden.
5.5 Relative Extrema
95
fx (x, y) = 2x(3y − 4x2 ),
fy (x, y) = 2y − 3x2 .
Beide Ableitungen gleich 0 setzen, ergibt als einzigen station¨ aren Punkt P0 = (0, 0). fx x(x, y) = −6y + 24x3 ,
fyy (x, y) = 2,
fxy (x, y) = fyx (x, y) = −6x.
2 (0, 0) = 0. H(0, 0) = fxx (0, 0) · fyy (0, 0) − fxy
Leider m¨ ussen wir hier die Segel streichen. F¨ ur diesen Fall k¨ onnen wir aus dem Kriterium keine weiteren Aussagen herleiten und m¨ ussten h¨ ohere Ableitungen betrachten. Wir fassen das ganze Vorgehen noch einmal zusammen: Bestimmung der relativen Extrema von z = f (x, y) 1. Berechne die station¨ aren Punkte von f (x, y), also die Punkte (x, y) mit grad f (x, y) = 0. 2. Berechne f¨ ur diese Punkte
det H := det
fxx fxy
fyx fyy
2 = fxx · fyy − fxy .
3. Ist det H > 0 und fxx < 0 =⇒ relatives Maximum, Ist det H > 0 und fxx > 0 =⇒ relatives Minimum, Ist det H < 0 =⇒ Sattelpunkt, Ist det H = 0 =⇒ extra untersuchen. 4. Berechne f (x, y) an den Extremstellen und Sattelpunkten. Zwei Bemerkungen wollen wir noch anf¨ ugen. 1. Unser Vorgehen oben sieht nicht vollst¨ andig aus. Wir haben den Fall det H > 2 0 und fxx = 0 nicht behandelt. Nun, es ist ja stets −fxy (x0 , y0 ) ≤ 0. Damit ist dann, falls det H > 0, stets fxx (x0 , y0 ) · fyy (x0 , y0 ) > 0. Also kann fxx (x0 , y0 ) nicht gleich 0 sein. Ebenso ist, falls det H > 0, stets fyy (x0 , y0 ) = 0. Daher ist der Fall doch vollst¨ andig. 2. Wegen fxx · fyy > 0 folgt aus fxx < 0 sofort auch fyy < 0, und aus fxx > 0 onnte also statt fxx auch fyy in die Fallunterfolgt sofort fyy > 0. Man k¨ scheidung einbauen.
96
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
¨ Ubung 10 1. Bestimmen Sie die relativen Extrema von a) f (x, y) := x2 + 3 x + y2 + 2 y − 15, b) f (x, y) :=
x3 + 4 x y − 2 y2 , 3
c) ur a > 0. f (x, y) := ex y + x2 + a y 2 f¨ 2. Untersuchen Sie die Funktion f (x, y) := (y − x2 ) · (y − 2 · x2 ) auf relative Extrema.
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
5.6 Wichtige S¨ atze der Analysis
5.6
97
Wichtige S¨ atze der Analysis
In diesem Abschnitt wollen wir einige wichtige, ja zentrale S¨ atze der Analysis vorstellen. Der erste, die Kettenregel, hilft uns in der Praxis ungemein. Er zeigt uns, wie man bei zusammengesetzten Funktionen die Ableitung ausrechnet. Der anschließende Satz von Taylor und sein Ableger, der Mittelwertsatz, haben dagegen keine große Bedeutung; denn sie sind nicht konstruktiv, d.h. es sind Existenzaussagen, die aber keine Konstruktionsvorschriften mitliefern. Wegen ihrer großen Bedeutung innerhalb der Analysis seien sie aber hier erw¨ ahnt. Schließlich kann der Autor seine mathematischen Wurzeln nicht ablegen. Der erste Satz ist die Kettenregel. Satz 5.10 (Kettenregel) Die Funktion f (x, y), definiert in D ⊆ R2 , sei in (x0 , y0 ) total differenzierbar, x = ϕ(t) und y = ψ(t) seien in (a, b) definiert und in t0 ∈ (a, b) differenzierbare Funktionen mit x0 = ϕ(t0 ), y0 = ψ(t0 ). Dann ist die aus f (x, y) und ϕ(t) und ψ(t) zusammengesetzte Funktion F (t) := f (ϕ(t), ψ(t))
(5.22)
in t0 differenzierbar, und es gilt dF (t) ∂f (x0 , y0 ) dϕ(t) ∂f (x0 , y0 ) dψ(t) = · · + dt ∂x dt ∂y dt
ϕ (t)
ψ (t)
= grad f (ϕ(t), ψ(t)) · (ϕ (t), ψ (t)) . Wir f¨ uhren diese Regel an einem Beispiel vor. Beispiel 5.12 Betrachten Sie die Funktion f (x, y) := x2 + 3 x + y 2 + 2 y − 15. Es sei x(t) = ϕ(t) = t2 + 1,
y(t) = ψ(t) = et .
Wir berechnen die Ableitung der zusammengesetzten Funktion F (t) = f (ϕ(t), ψ(t)). Es ist
(5.23)
(5.24)
98
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
F (t) = f (ϕ(t), ψ(t)) = (t2 + 1)2 + 3 (t2 + 1) + (et )2 + 2 et − 15. Dann folgt fx (x0 , y0 ) = 2 x0 + 3, fy (x0 , y0 ) = 2 y0 + 2, ϕ (t) = 2 t, ψ (t) = et , und damit dF (t0 ) = (2 x0 + 3) cdot2 t0 + (2 y0 + 2) et0 dt = (2 (t20 + 1) + 3) 2 t0 + (2 et0 + 2) et0 = (2 t20 + 5) 2 t0 + 2 et0 et0 + 2 et0 . Wenn Sie sich jetzt das Vergn¨ ugen g¨ onnen, die obige Funktion F (t) mit herk¨ ommlichen Schulmitteln abzuleiten, werden Sie dasselbe Ergebnis erhalten. Beispiel 5.13 Betrachten Sie die Funktion z = f (x, y) mit x = r cos t, y = r sin t, also Polarkoordinaten. Wie berechnet sich hier die Ableitung nach t? Es ist F (t) = f (r cos t, r sin t), also F (t) = fx (r cos t, r sin t) (−r sin t) + fy (r cos t, r sin t) r cos t. Damit folgt F (t) = −r fx (r cos t, r sin t) sin t + r fy (r cos t, r sin t) cos t. Auf diese Formel kommen wir sp¨ ater zur¨ uck, Sie werden sie bestimmt auch in Ihren Anwendungen gebrauchen k¨ onnen, also merken. Jetzt folgt ein Satz, der es in sich hat. Normale Menschen haben richtig Grauen vor solchen Unget¨ umen. Ich hoffe, dass er nach unseren Erl¨ auterungen etwas von seinem Schrecken verliert.
5.6 Wichtige S¨ atze der Analysis
99
Satz 5.11 (von Taylor) Die Funktion f (x, y), definiert in D ⊆ R2 , sei in D (r + 1)-mal stetig differenzierbar. Dann gilt f¨ ur alle (x, y) ∈ D
f (x, y) =
r
(x −
∂ x0 ) ∂x
+ (y −
∂ y0 ) ∂y
k f (x0 , y0 ) + Rr (x, y)
k!
k=0
(5.25)
mit
∂ ∂ (x − x0 ) ∂x + (y − y0 ) ∂y
r+1 f (x0 + ϑ(x − x0 ), y0 + ϑ(y − y0 ))
Rr (x, y) =
,
(r + 1)! (5.26)
wobei ϑ ∈ (0, 1) eine Zahl ist und wir zur Abk¨ urzung gesetzt haben
∂ ∂ + (y − y0 ) (x − x0 ) ∂x ∂y
k
k k ∂k f f := (x − x0 )i (y − y0 )k−i i k−i . ∂x ∂y i i=0
Rr (x, y) heißt (Lagrangesches) Restglied der Taylorentwicklung von f (x, y). Ja, ja, ich h¨ ore Sie schon st¨ ohnen: Solch ein Satz, und was soll das ganze bloß? Oh, Sie werden es nicht glauben, aber dieser Satz sagt uns eigentlich etwas Wunderbares. Wir m¨ ussen es nur erkennen. Wir haben da eine beliebige Funktion, die nat¨ urlich sch¨ on sein m¨ oge, also gen¨ ugend oft stetig differenzierbar. Dann k¨ onnen wir diese Funktion anders schreiben. Jetzt m¨ ussen wir uns diese Formel (5.25) mal ganz genau ansehen. Sie ist n¨ amlich gar nicht so furchtbar. Da ist zuerst das Restglied. Es gibt verschiedene Restglieder, wir bitten Sie daf¨ ur aber, in die Literatur zu schauen. Falls wir irgendwie Kenntnis haben, dass dieses Restglied Rr wirklich nur einen Rest darstellt, also immer kleiner wird, wenn sich der Punkt (x, y) dem sog. Entwicklungspunkt (x0 , y0 ) n¨ ahert, so k¨ onnen wir den ersten Teil, die endliche Summe, perfekt interpretieren. Wir sehen zun¨ achst die partiellen Ableitungen, gebildet an der festen Stelle (x0 , y0 ), das sind also feste Faktoren. Dann stehen da versteckt mitten drin das x und das y. Außen an der geschweiften Klammer steht eine Hochzahl. Das ist so ein binomischer Ausdruck. Wenn wir diesen ausrechnen, entsteht nichts anderes als ein Polynom in den zwei Variablen x und y. Der Satz sagt uns also, dass wir unter gewissen Voraussetzungen die Funktion f zumindest in einer kleinen Umgebung von (x0 , y0 ), wenn sich also (x, y) dem Punkt (x0 , y0 ) n¨ ahert, als Polynom auffassen k¨ onnen. Mit denen hantieren wir aber liebend gerne. Die kennen wir doch schon von der Schule. Wir lieben Polynome! Allerdings ist die Einschr¨ ankung mit der
100
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
kleinen Umgebung, die man nicht einmal genau angeben kann, doch etwas happig. Wir werden sp¨ ater im Kapitel 11 Interpolation mit Splines‘ eine andere ’ Methode kennen lernen, um komplizierte Funktionen leichter darzustellen. Beispiel 5.14 Der Satz von Taylor spielt in der Praxis kaum eine Rolle, weil man die unbekannte Zahl ϑ ∈ (0, 1) nicht angeben kann. In vielen Anwendungen benutzt man aber die Reihe (5.25) in einer abgespeckten Form als N¨ aherungsformel, indem man schon nach wenigen Gliedern abbricht. Um Ihnen hier, liebe Leserin, lieber Leser, die Arbeit zu erleichtern, schreiben wir die endliche Reihe f¨ ur r = 2 auf.
f (x, y) =
2
(x −
k=0
=
∂ x0 ) ∂x
+ (y −
∂ y0 ) ∂y
k f (x0 , y0 ) + R2 (x, y)
k!
f (x0 , y0 ) (x − x0 )fx (x0 , y0 ) + (y − y0 )fy (x0 , y0 ) + 0! 1!
k=0
(5.27)
k=1
(x − x0 )2 fxx + 2(x − x0 )(y − y0 )fxy + (y − y0 )2 fyy + 2!
k=2
+R2 (x, y) ¨ Um die Ubersicht nicht zu verlieren, haben wir in der vorletzten Zeile bei den zweiten partiellen Ableitungen das Argument (x0 , y0 ) weggelassen. Sie werden es aber bitte nicht vergessen. Diese N¨ aherung werden wir sp¨ ater bei der Herleitung der Differenzenverfahren f¨ ur partielle Differentialgleichungen benutzen. Wir betrachten noch den Sonderfall r = 0. Hier erinnern wir zuerst an den zentralen Satz der Analysis im R1 , den Mittelwertsatz. Korollar 5.1 (Mittelwertsatz im R1 ) Sei f : R → R eine Funktion, die im Intervall [a, b] stetig und im Intervall (a, b) differenzierbar ist. Dann gibt es eine Zahl ξ ∈ (a, b) mit f (b) − f (a) = f (ξ). b−a
(5.28)
Dieser Satz l¨ asst sich sehr leicht veranschaulichen. Betrachten Sie dazu folgende Skizze. Die linke Seite in Gleichung (5.28) ist ein Differenzenquotient. Die Gerade durch die beiden Punkte (a, f (a)) und (b, f (b)) hat genau diese Steigung. Dann gibt es einen Punkt ξ, wo die Tangente dieselbe Steigung hat. Sieht man, oder?
5.6 Wichtige S¨ atze der Analysis
101
6f (x)
a
b
ξ
x
Abb. 5.4 Veranschaulichung zum Mittelwertsatz im R1
Um diesen Satz jetzt hierhin zu transferieren, m¨ ussen wir die Bezeichnungen ein klein wenig ¨ andern. Statt a schreiben wir x0 , statt b schreiben wir x und statt ξ schreiben wir x0 + ϑ(x − x0 ). Diese letzte Zahl liegt im Intervall (x0 , x), wenn 0 < ϑ < 1 ist. Einfach mal hinmalen. Dann l¨ osen wir die Gleichung (5.28) etwas anders auf: f (x) = f (x0 ) + (x − x0 ) · f (x0 + ϑ(x − x0 )) Jetzt schreiben wir den Taylorsatz f¨ ur r = 0 auf: Korollar 5.2 (Mittelwertsatz) Die Funktion f (x, y), definiert in D ⊆ R2 , sei in D einmal stetig differenzierbar. Dann gilt f¨ ur alle (x, y) ∈ D
f (x, y) = f (x0 , y0 ) + (x − x0 ) · fx (x0 + ϑ(x − x0 ), y0 + ϑ(y − y0 )) +(y − y0 ) · fy (x0 + ϑ(x − x0 ), y0 + ϑ(y − y0 )).
(5.29)
Ich hoffe, Sie sehen die Parallelit¨ at zum R1 . An der Tafel w¨ urde ich beide S¨ atze nebeneinander schreiben und mit den H¨ anden auf die vergleichbaren Stellen deuten. Niemand hindert Sie, das jetzt auf einem Blatt Papier ebenfalls zu machen. Der folgende Satz hat ebenfalls einen direkten Verwandten im R1 . Daher sei er nur zitiert. Korollar 5.3 Ist f (x, y) in D ⊆ R2 stetig differenzierbar und gilt f¨ ur alle (x, y) ∈ D fx (x, y) = fy (x, y) = 0, also dann ist f (x, y) eine konstante Funktion.
gradf (x, y) = (0, 0),
102
5 Funktionen mehrerer Ver¨ anderlicher – Differenzierbarkeit
¨ Ubung 11 1. Gegeben sei die Funktion f (x, y) := ex−2 y und es sei x = sin t, y = t3 . Durch Einsetzen entsteht die Funktion F (t). dF (t) auf zweierlei Art. Berechnen Sie dt 2. Berechnen Sie das Taylorpolynom 2. Grades (vgl. Formel (5.27), Seite 100) f¨ ur die Funktionen a) f (x, y) := cos(x y) + x ey−1 an der Stelle (x0 , y0 ) = (π, 1), b) f (x, y) := cos x sin y an der Stelle (x0 , y0 ) = (0, 0).
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
6 Kurvenintegrale
¨ Ubersicht 6.1 6.2 6.3 6.4
Kurvenst¨ ucke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kurvenintegral 1. Art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kurvenintegral 2. Art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kurvenhauptsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
104 105 113 119
Aus der Schule kennen wir gew¨ ohnliche Integrale. Dort haben wir gelernt, wie vorteilhaft wir sie einsetzen k¨ onnen, wenn wir Fl¨ acheninhalte von krummlinig begrenzten Fl¨ achen bestimmen wollen. Dabei war es aber wichtig, dass wir die zu betrachtende Fl¨ ache als Graph einer Funktion f : [a, b] → R vorliegen hatten. Zugrunde lag also ein Intervall [a, b] der x-Achse, u ¨ber der wir die Funktion f gegeben hatten.
y
a
b
x
Abb. 6.1 Integral u ache des Graphen ¨ber eine Kurve, also Berechnung der Fl¨
In diesem Kapitel wollen wir eine wesentliche Verallgemeinerung betrachten. Die Grundkurve sei nun nicht mehr ein Teil der geraden x-Achse, sondern sei eine beliebige Kurve in der Ebene oder gar im Raum. Darauf sei eine Funktion
N. Herrmann, Mathematik für Naturwissenschaftler, DOI 10.1007/978-3-8274-2867-7_6, © Spektrum Akademischer Verlag Heidelberg 2012
104
6 Kurvenintegrale
gegeben. Und wir wollen uns u ¨berlegen, wie wir die u ¨ber dieser krummen Kurve liegende Fl¨ ache berechnen k¨ onnen.
6.1
Kurvenst¨ ucke
Zun¨ achst wollen wir uns einigen, was wir unter einem glatten Kurvenst¨ uck verstehen wollen. Definition 6.1 (Kurvenst¨ uck) Ein ebenes Kurvenst¨ uck, gegeben durch x = ϕ(t), y = ψ(t),
t 0 ≤ t ≤ t1 ,
(6.1)
heißt glatt, wenn 1. verschiedene t-Werte verschiedene Punkte der Kurve ergeben und 2. wenn die Ableitungen von ϕ(t) und ψ(t) stetig sind und 3. wenn ∀t ∈ [t0 , t1 ] ϕ2 (t) + ψ 2 (t) > 0 ist. Der Punkt (x0 , y0 ) = (ϕ(t0 ), ψ(t0 )) heißt Anfangspunkt. Der Punkt (x1 , y1 ) = (ϕ(t1 ), ψ(t1 )) heißt Endpunkt. Die Kurve heißt st¨ uckweise glatt, wenn sie sich in endlich viele glatte Kurvenst¨ ucke zerlegen l¨ asst. Bemerkung 6.1 Alles u agt sich analog auf Raumkurven ¨bertr¨ x = ϕ(t), y = ψ(t), z = χ(t),
t0 ≤ t ≤ t1 ,
Halt, das sieht nur so aus, als ob es schwer sei, in echt ist es ganz einfach zu verstehen. Gleichung (6.1) nennen wir eine Parameterdarstellung einer Kurve; dabei heißt t der Parameter. 1. bedeutet, dass sich die Kurve nicht u ¨berschneidet, es gibt also keine Kreuzungspunkte. Wenn solch eine Kurve mit Kreuzungspunkt vor uns l¨ age, w¨ ussten wir ja nicht, ob wir geradeaus u ¨ber die Kreuzung laufen oder nach rechts oder links abbiegen sollen. Liegt doch mal so ein Weg vor uns, so werden wir ihn einfach in zwei Teilwege aufspalten, die dann kreuzungsfrei sind. 2. sichert uns, dass die Kurve keine Knicke hat. Genau hier steckt der Begriff glatt‘. ’
6.2 Kurvenintegral 1. Art
105
Mit 3. legen wir fest, dass der Tangentenvektor immer h¨ ubsch positiv ist; denn dort steht ja gerade das Quadrat seiner L¨ ange. Sollte er doch mal verschwinden, so bleibt als Abhilfe wieder die Zerlegung in mehrere Kurvenb¨ ogen. Das ist also auch keine wirkliche Einschr¨ ankung f¨ ur uns als Anwender. Beispiele bekommen wir noch zu Hauf. Gleich im n¨ achsten Abschnitt werden wir Kurvenintegrale handfest berechnen. Das geht immer nur mit solchen Parameterdarstellungen. Die haben wir also bald im Blut.
6.2
Kurvenintegral 1. Art
Bei Kurvenintegralen unterscheiden wir zwischen 1. und 2. Art. Die Typen 1. Art lassen sich prima veranschaulichen. F¨ ur die 2. Art werden wir auf die Physik zur¨ uckgreifen. Definition 6.2 (Kurvenintegral 1. Art) Sei f : R2 → R und κ := {(ϕ(t), ψ(t)) ∈ R2 : a ≤ t ≤ b} ein Kurvenst¨ uck. Dann heißt
!
!
b
f (x, y) ds := κ
f (ϕ(t), ψ(t)) · |(ϕ (t), ψ (t))| dt
a
Kurvenintegral 1. Art von f (x, y) u ¨ber κ. ds := |(ϕ (t), ψ (t))| dt heißt skalares Bogenelement. Dabei muss a < b sein.
(6.2)
106
6 Kurvenintegrale
Was haben wir da erkl¨ art? Ein merkw¨ urdiges Gebilde, dieses Integral u ¨ber einer Kurve κ, m¨ ochte man meinen. Aber schauen wir uns folgende Skizze an.
z 6
y
Y
L¨ armschutzwand
i Kurve κ
x Abb. 6.2 In der x-y-Ebene haben wir einen Weg skizziert, an dessen Rand, also der Kurve κ, ein L¨ armschutzzaun aufgebaut ist. Das Kurvenintegral 1. Art fragt nach dem Fl¨ acheninhalt dieses Zaunes.
In Verallgemeinerung des gew¨ ohnlichen Integrals fragen wir also hier nach dem Fl¨ acheninhalt u ¨ber einer krummen Kurve κ. Wenn die Funktion negative Werte ausspuckt, so verschwindet halt der Zaun unter der Erde, was die Analogie etwas tr¨ ubt. Die Berechnungsvorschrift in (6.2) zeigt uns den Trick: Wir haben das komplizierte Kurvenintegral zur¨ uckgef¨ uhrt auf die Berechnung eines gew¨ ohnlichen Integrals. Das kennen wir ja schon lange. ange der Tangente im jeweiligen Der Anteil |(ϕ (t), ψ (t))| ist im Prinzip die L¨ Punkt. Als L¨ ange ist hier die euklidische L¨ ange des Vektors (ϕ (t), ψ (t)) gemeint, also die Wurzel aus den Quadraten der Komponenten, also |(ϕ (t), ψ (t))| =
ϕ2 (t) + ψ 2 (t).
Das sieht alles kompliziert aus. Wie einfach es wirklich ist, zeigen wir jetzt am Beispiel.
6.2 Kurvenintegral 1. Art
107
Beispiel 6.1
Gegeben sei der Dreiecksweg κ vom Nullpunkt (0, 0) zum Punkt A = (1, 0), dann weiter zum Punkt B = (0, 1) und wieder zur¨ uck zum Nullpunkt (0, 0), den wir rechts in der Skizze angedeutet haben, und auf diesem die Funktion f (x, y) = x2 + y2 . Wir wollen das Kurvenintegral
f (x, y)
6
B = (0, 1)
(0, 0) κ x /
!
y
A = (1, 0)
f (x, y) ds κ
u ¨ber diesem Dreiecksweg κ berechnen.
Abb. 6.3
Ein Dreiecksweg
Wir zerlegen den Weg in drei Teilwege: (α) Weg von (0, 0) nach A = (1, 0). (β) Weg von B = (0, 1) nach (0, 0). (γ) Weg von A = (1, 0) nach B = (0, 1). zu (α) Der Weg (0, 0) nach A = (1, 0) ist Teil der x-Achse, dort ist also y = 0. Wir m¨ ussen also berechnen: ! x2 ds. (0,0)→A
Wir w¨ ahlen hier als Parameter t = x, also folgt dt = dx und 0 ≤ t ≤ 1. Damit erhalten wir:
!
x2 ds =
(0,0)→A
!
1
t2 dt =
0
1 . 3
F¨ ur diese Berechnung haben wir unser Schulwissen ausgenutzt. Das war doch schon sehr einfach. zu (β) Hier betrachten wir den Weg von B nach (0, 0). Dieser ist Teilweg der y-Achse, also ist hier x = ϕ(t) = 0. Den Weg wollen wir vom Punkt B zum Nullpunkt hin durchlaufen, also die y-Achse r¨ uckw¨ arts. Daher w¨ ahlen wir als Parameter t = y − 1, erhalten also y = ψ(t) = 1 − t. Daraus ergibt sich
108
6 Kurvenintegrale
t = 0 =⇒ y = 1,
t = 1 =⇒ y = 0.
Das setzen wir in das Integral ein und erhalten
!
!
y 2 ds =
1
0
B→(0,0)
!
1
= 0
!
1
= 0
(1 − t)2 · |(0, −1)| dt (1 − t)2 ·
02 + (−1)2 dt
" #1 t3 2t2 + (1 − 2t + t2 ) dt = t − 2 3 0
1 = . 3 Auch hier bitte nicht erschrecken lassen durch die simple Schulrechnung. zu (γ) Jetzt zum Weg von A nach B. Als Parameter w¨ ahlen wir hier y = ψ(t) = t,
x = φ(t) = 1 − t, 0 ≤ t ≤ 1.
Dann erhalten wir t = 0 =⇒ (1, 0) = A,
t = 1 =⇒ (0, 1) = B,
wir laufen also richtig. Dann folgt, jetzt wieder einsetzen und rechnen, wie in der Schule gelernt,
!
!
1
f (x, y) ds = A→B
0
$ %√ (1 − t)2 + t2 2 dt
" #1 √ 2t3 2t2 + (1 − 2t + 2t ) 2 dt = 2 t − = 2 3 0 0 " # √ 2 2√ = 2 1−1+ = 2. 3 3 !
1
2
√
Damit ist dann insgesamt
!
! f (x, y) ds = κ
!
!
f (x, y) ds + (0,0)→A
1 2√ 4+9 1 2+ = + = 3 3 3 6 So weit das Beispiel.
f (x, y) ds + B→(0,0)
√
2
= 2.787987.
f (x, y) ds A→B
6.2 Kurvenintegral 1. Art
109
Wir leisten uns jetzt mal den Spaß, das Integral in (β) durch Umkehrung des Weges zu berechnen. Wir wollen also von (0, 0) → B laufen. Kommt da dasselbe heraus? Wir m¨ ussen mit dem Parameter spielen. Wir w¨ ahlen jetzt x = ϕ(t) = 0, y = ψ(t) = t, 0 ≤ t ≤ 1. F¨ ur t = 0 geht es also von (0, 0) los bis t = 1, also zum Punkt (0, 1) = B. Dann erhalten wir
!
!
1
f (x, y) ds = 0
(0,0)→B
!
2
t |(0, 1)| dt =
1 0
&1 t3 && 1 t dt = & = . 3 0 3 2
Wir erhalten also dasselbe. Das riecht nach Methode. Tats¨ achlich k¨ onnen wir beweisen: Satz 6.1 Das Kurvenintegral 1. Art h¨ angt nicht vom Durchlaufungssinn der Kurve ab:
!
! f (x, y) ds = A→B
f (x, y) ds.
(6.3)
B→A
Sonderfall Ist die ebene Kurve (also im R2 ) gegeben als Graph einer Funktion, also in der Darstellung y = y(x),
a ≤ x ≤ b,
so gilt
!
!
b
f (x, y) ds = κ
f (x, y(x)) ·
1 + y 2 (x) dx.
(6.4)
a
Wiederum muss dabei a < b sein. Diese Formel findet man in vielen B¨ uchern. Wir wollen schnell an einem Beispiel u ¨ben, wie man damit umgeht. Gleichzeitig verlieren wir dabei die Angst vor der Parametrisierung. Beispiel 6.2 Wir berechnen
! x y ds, κ
wenn κ der Viertelkreisbogen, Radius r = 2 im 1. Quartal ist. Zuerst wenden wir die u ¨bliche Formel an. Den Kreis vom Radius 2 parametrisieren wir durch x = ϕ(t) = 2 cos(t),
y = ψ(t) = 2 sin(t), 0 ≤ t ≤
π . 2
110
6 Kurvenintegrale
Dann haben wir ϕ (t) = −2 sin(t), ψ (t) = 2 cos(t), also |(ϕ (t), ψ (t))| =
(−2 sin(t))2 + (2 cos t)2 = 2.
Damit folgt
!
!
π/2
x cot y ds = 0
κ
!
2 · cos t) · 2 · sin t · 2 dt
π/2
= 8 0
&π/2 & 1 2 & sin t cos t dt = 8 · · sin t& = 4. 2 0
Jetzt w¨ ahlen wir zur Berechnung die gerade im Sonderfall vorgestellte Idee. Wir erkennen n¨ amlich, dass sich der Viertelkreis mit Radius 2 darstellen l¨ asst als x2 + y 2 = 4
also
y=
4 − x2 .
Der Graph dieser Funktion ist der Viertelkreis, wissen wir doch, oder? Jetzt rechnen wir ein wenig. y (x) =
2·
−2x −x √ = √ , 4 − x2 4 − x2
0 ≤ x ≤ 2.
Dann folgt mit obiger Formel (6.4):
!
!
2
x y ds =
x 0
κ
!
2
' 4−
x2
1+
'
x2 dx 4 − x2
4 − x2 + x2 dx 4 − x2 0 √ ! 2 4 x 4 − x2 √ dx = 4 − x2 0 &2 ! 2 2 · x2 && = 2 x dx = = 4, 2 &
=
x
0
4 − x2
0
und das ist doch wunderbar u ¨bereinstimmend mit obigem Ergebnis, wenn wir noch mal einen Blick zur¨ uck riskieren.
Kurvenl¨ ange Wenn wir bei einem gew¨ ohnlichen Integral als Integranden die Funktion f (x) = 1 verwenden, so erhalten wir ja
6.2 Kurvenintegral 1. Art
111
!
b
1 dx = b − a,
a
also die L¨ ange des Integrationsintervalls. Genau dasselbe geschieht jetzt hier beim Kurvenintegral 1. Art mit dem kleinen, aber feinen Unterschied, dass wir die L¨ ange der Kurve κ erhalten. Das ist doch prima. Satz 6.2 W¨ ahlen wir im Kurvenintegral 1. Art u ¨ber der Kurve κ als Funktion f (x, y) = 1, so ergibt sich die L¨ ange der Kurve κ. Dazu ein Beispiel. Beispiel 6.3 y 6 κ
Wir berechnen die L¨ ange L des Parabelbogens 2
y=x ,
0
−1 ≤ x ≤ 1.
Abb. 6.4
1
x
Parabelbogen
Locker erkennen wir, dass dieser Bogen voll symmetrisch zur y-Achse ist. Also werden wir uns doch klug anstellen und nur die L¨ ange des halben Bogens κ , wie eingezeichnet, berechnen und das Ergebnis verdoppeln. Das f¨ uhrt zu
!
! 1 ds = 2 ·
! 1 ds = 2 ·
1
1 + (2x)2 dx ! 1 ! 1' 1 + x2 dx 1 + 4x2 dx = 2 · 2 · = 2 4 0 0 ( ' )1 1 1 1 = 4· · x· + x2 + · arsh 2x 2 4 4 0 (' ) √ arsh 2 arsh 2 5 + ≈ 2.96. = 2 = 5+ 4 4 2
L =
κ
κ e
0
Das ist doch eine h¨ ubsche Formel, mit der wir leicht und einfach L¨ angen von irgendwelchen Kurven ausrechnen k¨ onnen. Erschrecken Sie bitte in obiger Berechnung nicht u ¨ber den Areasinus hyperbolicus arsh. So eine Stammfunktion kennt niemand auswendig, daf¨ ur gibt es gute Formelsammlungen.
112
6 Kurvenintegrale
¨ Ubung 12 1. Sei k der obere Halbkreis mit dem Radius r um (0, 0), und sei f (x, y) := y. Berechnen Sie
! f (x, y) ds. k
2. Berechnen Sie das Kurvenintegral
!
y e−x ds,
k
wenn k der Bogen der Kurve x = ϕ(t) := ln(1 + t2 ),
y = ψ(t) := 2 arctan t − t + 3
zwischen t = 0 und t = 1 ist. 3. Berechnen Sie das Kurvenintegral
! ' k
b 2 x2 a2 y 2 + 2 ds, 2 b a
wenn k die Ellipse ist mit der Gleichung x2 y2 + = 1. a2 b2 4. Berechnen Sie den Umfang U des Kreises um (0, 0) mit dem Radius r > 0, indem Sie das Kurvenintegral ! 1 ds 4 k
betrachten, wenn k der Viertelkreisbogen mit Radius r > 0 ist.
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
6.3 Kurvenintegral 2. Art
6.3
113
Kurvenintegral 2. Art
Kurvenintegrale 2. Art sind nicht so leicht zu veranschaulichen wie die L¨ armschutzwand einer Autobahn f¨ ur ein Kurvenintegral 1. Art. Wir werden sp¨ ater durch R¨ uckgriff auf die Physik aber eine gute Veranschaulichung angeben. Hier erst mal die Definition. Definition 6.3 Eine Funktion
f : Rn → R f : Rn → Rm
heißt skalare Funktion oder Skalarfeld, heißt vektorwertige Funktion oder Vektorfeld.
Wir schreiben dann auch f ( x) = f (x, y) = (f1 (x, y), f2 (x, y)), k¨ urzen also noch ab x = (x, y). Kurz ein Beispiel: Die Funktion f (x, y) = x2 + y2 ist ein Skalarfeld f : R2 → R. Die Funktion f (x, y) = (x2 + y3 , |x|) ist ein Vektorfeld f : R2 → R2 . Hier ist dann f1 (x, y) = x2 + y2 und f2 (x, y) = |x|. Definition 6.4 Ist f ( x) ein Vektorfeld und κ = { x(t), a ≤ t ≤ b} ein Kurvenst¨ uck, so heißt
!
! f ( x) · d x := κ
b
f ( x(t)) · x˙ dt
(6.5)
a
mit
x(t) := (x(t), y(t)) = (ϕ(t), ψ(t)) und
x˙ (t) := (x(t), ˙ y(t)) ˙ = (ϕ (t), ψ (t)) Kurvenintegral 2. Art. Im Gegensatz zum Kurvenintegral 1. Art steckt hier also ein Vektorfeld im Integral. Dieses wird multipliziert mit dem Tangentenvektor x˙ (t). Aber Achtung, das ist ein inneres Produkt. Schließlich stehen ja hier zwei Vektoren. Bei der 1. Art hatten wir mit dem Betrag dieses Vektors, also mit einer reellen Zahl multipliziert. Hier also inneres Produkt. Das hat interessante Auswirkungen. Zeigen wir zun¨ achst ein paar Rechenregeln:
114
6 Kurvenintegrale
Satz 6.3 (Rechenregeln) 1. !
! c · f ( x) · d x=c·
κ
2.
(6.6)
! ! !
f ( x) + g ( x) · d f ( x) · d x + g ( x= x) · d x κ
3.
f ( x) · d x κ
κ
!
(6.7)
κ
! f ( x) · d x=−
κ
−κ
f ( x) · d x
(6.8)
Die 3. Aussage im obigen Satz wird ziemlich einsichtig, wenn wir sp¨ ater das Kurvenintegral 2. Art als Arbeitsintegral interpretieren. Wenn wir einen Koffer drei Stockwerke hinauf geschafft haben, ergibt sich beim Heruntertragen genau die umgekehrte Arbeit, bis auf Reibungsverluste mit unseren Schuhen oder in unseren Gelenken. So erkl¨ art sich das negative Vorzeichen. Damit uns diese Integrale nicht zu unheimlich werden, schnell ein Beispiel. Dann sehen wir auch, wie die ganze Rechnung auf die Berechnung von gew¨ ohnlichen Integralen zur¨ uckl¨ auft. Beispiel 6.4 Wir berechnen
! f (x, y) d x κ
f¨ ur f (x, y) := (x, x y), d x = (dx, dy) und drei verschiedene Wege
6 (0,1)
(1,1)
κ1
: direkte Strecke von (0, 0) nach (1, 1), κ2 Parabelbogen von (0, 0) nach (1, 1), κ3 Strecke auf der x-Achse von (0, 0) nach (1, 0), dann Parallele zur yAchse von (1, 0) nach (1, 1).
κ1
κ3 κ2
(0,0) κ3 Abb. 6.5
(1,0)
Drei Wege zum Ziel
Weg κ1 : Wir gehen auf der Diagonalen. Zu jedem Schritt in x-Richtung f¨ ugen wir gleich einen Schritt in y-Richtung hinzu. Daher liegt folgende Parametrisierung nahe:
6.3 Kurvenintegral 2. Art
x = ϕ(t) = t,
115
y = ψ(t) = t,
ϕ (t) = ψ (t) = 1, 0 ≤ t ≤ 1.
Dann ist f ( x(t)) = (ϕ(t), ϕ(t) · ψ(t)) = (t, t2 ) und
x˙ (t) = (ϕ (t), ψ (t) = (1, 1). Damit folgt
!
! f ( x(t) · d x =
κ1
!
1 0 1
=
(t, t2 ) · (1, 1) dt (t + t2 ) dt =
"
0
t3 t2 + 2 3
#1 = 0
1 5 1 + = . 2 3 6
Weg κ2 : F¨ ur die Parabel w¨ ahlen wir die Parametrisierung:
x = ϕ(t) = t,
y = ψ(t) = t2 ,
ϕ (t) = 1, ψ (t) = 2t,
0 ≤ t ≤ 1.
Damit folgt
!
! f ( x(t) · d x =
κ1
!
1 0 1
=
(t, t3 ) · (1, 2t) dt (t + 2t4 ) dt =
"
0
2t5 t2 + 2 5
#1 = 0
2 9 1 + = . 2 5 10
Ups, das ist ja ein anderes Ergebnis als oben? Haben wir uns verrechnet? Passiert ja leicht bei diesen Integralen. Aber seien Sie beruhigt, alles ist genau so richtig. Wir lernen: Anderer Weg, anderes Ergebnis! Weg κ3 : Wir probieren es noch ein drittes Mal, wieder auf einem anderen Weg. Diesen Weg teilen wir in zwei Teilwege: κ3 = κ31 + κ32 . Dabei ist κ31 der Weg auf der x-Achse von (0,0) nach (1,0) und κ32 der anschließende Weg auf der Parallelen zur y-Achse, also von (1,0) nach (1,1). F¨ ur beide Wege m¨ ussen wir das Integral sch¨ on nacheinander ausrechnen, also
!
! ··· = κ3
Weg κ31 :
! ··· +
κ31
··· . κ32
Hier f¨ allt uns die Parametrisierung in den Schoß. Wir setzen x = ϕ(t) = t, y = ψ(t) = 0.
116
6 Kurvenintegrale
Dann ist f (x(t), y(t))(t, t · 0) = (t, 0),
0 ≤ t ≤ 1,
und (ϕ (t), ψ (t)) = (1, 0). Das ergibt
!
! f ( x(t)) · d x = κ31
1
0
!
(t, 0) · (0, 1) dt
1
t dt =
= 0
&1 t2 && 1 = . 2 &0 2
Das ging ja puppig leicht, also schnell noch den zweiten Teilweg: Weg κ32 : Auch hier ist die Parametrisierung sofort zu sehen. Wir setzen x = ϕ(t) = 1, y = ψ(t) = t. Dann ist f (x(t), y(t)) = (1, t),
(ϕ (t), ψ (t)) = (0, 1),
0 ≤ t ≤ 1.
Das ergibt
!
! f ( x(t)) · d x =
κ32
!
1 0 1
= 0
(1, t) · (0, 1) dt
&1 t2 && 1 t dt = & = 2 0 2
Als Gesamtwert f¨ ur den dritten Weg κ3 erhalten wir also
!
1 1 f ( x(t)) · d x = + = 1. 2 2 κ3
Wir lernen an diesem Beispiel, dass ein solches Kurvenintegral 2. Art nicht unabh¨ angig vom Weg ist, u ¨ber den wir integrieren. Das erstaunt uns vielleicht, aber jetzt komme ich mit der Physik. In der Physik weiß man, dass Arbeit gleich Kraft mal Weg ist, eine 3.000,- Euro Frage in einem Fernsehquizz, und die Kandidaten patzten. Ich finde, sie gingen zurecht mit 0 Euro nach Hause. Das sollte wirklich zum Allgemeingut geh¨ oren so wie H¨ anschen klein‘. ’
6.3 Kurvenintegral 2. Art
117
Die Kraft h¨ angt nat¨ urlich vom jeweiligen Ort ab und auch von der Richtung, in die sie ausge¨ ubt wird. Sie ist also ein Vektor. Der Ort, an dem die Kraft ausge¨ ubt wird, liegt irgendwo in der Welt, also hat er drei Koordinaten, ist also auch ein Vektor. Das Produkt dieser beiden Vektoren finden wir im Integral 2. Art, hier allerdings auf sehr kleine Wege, richtiger infinitesimale Wege d x beschr¨ ankt, u ¨ber die dann anschließend aufsummiert wird. Wie das halt so beim Integral gemacht wird. Dieses Kurvenintegral 2. Art berechnet also schlicht die Arbeit, die man bei bestimmter Kraft f (x, y) leisten muss, um den Weg κ zur¨ uckzulegen. Nat¨ urlich h¨ angt das vom Weg ab, werden Sie mir zugeben. Gehe ich einen sehr langen Weg, muss ich mehr arbeiten. So zeigt es ja auch unser Beispiel 6.4 oben. Aber halt, nicht so schnell. Tats¨ achlich ist manchmal das Kurvenintegral 2. Art vom Wege unabh¨ angig. Im n¨ achsten Abschnitt werden wir ein recht einfach handhabbares Kriterium daf¨ ur angeben, wann das passiert.
118
6 Kurvenintegrale
¨ Ubung 13 1. Gegeben sei das folgende Vektorfeld
v ( x) := (x y, x2 , x − z). Berechnen Sie das Kurvenintegral !
v ( x) · d x k
vom Nullpunkt zum Punkt (1, 2, 4), wobei (a) k die gerade Verbindung beider Punkte ist, (b) k die Kurve gegeben durch die folgende Parametrisierung ist: x = t2 , y = 2t3 , z = 4t. (c)Vergleichen Sie das Ergebnis von (a) und (b), und begr¨ unden Sie es. 2. Berechnen Sie das Integral ! " k
# x −y dx + dy , x2 + y 2 x2 + y 2
wobei k eine Kurve im Kreis K : (x − 2)2 + y 2 ≤ 1 ist, die den Punkt (1, 0) mit einem beliebigen Punkt (x, y) in K verbindet. 3. Gegeben sei das Vektorfeld f (x, y, z) := (x + y z, y + x z, z + x y). Berechnen Sie das Kurvenintegral
! f (x, y, z) · d x, k
wenn (a) k die Strecke von (0, 0, 0) nach (1, 1, 1) ist, (b) k die Kurve mit der Parametrisierung x = t, y = t2 , z = t3 mit 0 ≤ t ≤ 1 ist, (c) k die drei Strecken von (0, 0, 0) nach (1, 0, 0), dann von (1, 0, 0) nach (1, 1, 0) und abschließend von (1, 1, 0) nach (1, 1, 1) durchl¨ auft.
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
6.4 Kurvenhauptsatz
6.4
119
Kurvenhauptsatz
Immer ist es ein Bestreben der Mathematik, solch st¨ orende Eigenschaften wie die Wegabh¨ angigkeit eines Integrals genau zu durchschauen und ein Kriterium zu finden, das uns diese Eigenschaft im Vorhinein erkennen l¨ asst. Das ist ja eigentlich ziemlich verwegen. Wie sollen wir das dem Integral ansehen, ohne es auszurechnen? Aber tats¨ achlich, wir sind dazu in der Lage. Dazu m¨ ussen wir einen neuen Begriff einf¨ uhren, der aber ziemlich leicht zu handhaben ist. Definition 6.5 Gegeben sei ein differenzierbares Vektorfeld
f ( x) = f1 (x, y, z), f2 (x, y, z), f3 (x, y, z) .
(6.9)
Unter der Rotation dieses Feldes, in Zeichen rot f ( x), verstehen wir den Vektor
rot f ( x) :=
∂f3 ( x) ∂f2 ( ∂f1 ( ∂f3 ( x) ∂f2 ( x) ∂f1 ( x) x) x) − , − , − ∂y ∂z ∂z ∂x ∂x ∂y
. (6.10)
Die Formel sieht im ersten Moment ziemlich un¨ ubersichtlich aus. Sie hat aber eine starke innere Gesetzm¨ aßigkeit, die wir sofort erkennen, wenn wir statt (x, y, z) die Variablen (x1 , x2 , x3 ) verwenden:
rot f ( x) :=
∂f2 ( x) ∂f1 ( x) ∂f3 ( ∂f1 ( ∂f3 ( x) x) ∂f2 ( x) x) − , − , − ∂x2 ∂x3 ∂x3 ∂x1 ∂x1 ∂x2
(6.11)
Bitte nur genau hinschauen. In jeder Komponente sind die Z¨ ahlerindizes und die Nennerindizes miteinander gekoppelt. Nehmen Sie die Zahlen 1,2,3 und tauschen Sie diese zyklisch durch, also 1 → 2 → 3 → 1 → 2 → ... und vergleichen Sie mit der Formel (6.11). Sie m¨ ussen sich also nur den Anfang merken, dann geht es automatisch weiter. Das ist zwar nicht gar so ein Br¨ uller, aber zumindest hilft es uns, dass wir einen Fehler vermeiden k¨ onnen. Manche erinnern sich vielleicht noch an das Kreuzprodukt zweier Vektoren des R3 . Nur f¨ ur diese Dimension ist es erkl¨ art. Es lautete:
Sei a = (a1 , a2 , a3 ) und sei b = (b1 , b2 , b3 ). Dann ist
a × b := (a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 ). Schauen Sie sich auch hier die Indizes an, und Sie sehen die Analogie.
120
6 Kurvenintegrale
Beispiel 6.5 Wir berechnen die Rotation des Vektorfeldes
f ( x) := x2 · y, −2 · x · z, 2 · y · z . Einfaches Ausrechnen, bei dem man aber unbedingt auf die Indizes achten muss, ergibt
2z − (−2x), 0 − 0, −2x − x2 = 2z + 2x, 0, −2x − x2 .
rot f ( x) =
Hier folgen einfache Rechenregeln, die uns sagen, dass der Operator rot ein linearer Operator ist. Da es sich ja um das Differenzieren handelt, kann man das auch erwarten. Satz 6.4 Es gilt f¨ ur alle differenzierbaren Vektorfelder f , g und alle reellen Zahlen α ∈ R
rot f ( x) + g ( x) = rot f ( x) + rot g ( x) rot α · f ( x) = α · rot f ( x)
(6.12) (6.13)
Mit dem Begriff Rotation‘ verbinden wir eine spezielle Vorstellung. Da dreht ’ sich etwas. Richtig, und genau das zeigen wir jetzt f¨ ur den Operator rot, womit dieser dann sehr anschaulich wird. Zur Erkl¨ arung des Namens Rotation‘ betrachten wir das Vektorfeld ’
v ( r) := ω
× r, wobei ω
ein konstanter Vektor und r der Radiusvektor vom Nullpunkt zum Punkt (x, y, 0) in der Ebene sei. Denken Sie wieder an die vor sich liegende Tischebene. Irgendwo ist der Nullpunkt. Von dort geht der Vektor r zu einem Punkt (x, y, 0), bitte lassen Sie ihn rechts vom Nullpunkt liegen. Sonst m¨ ussen Sie gleich Ihre Hand furchtbar verdrehen. Wir lassen den Vektor ω
nach oben in Richtung der z-Achse zeigen. Um das Vektorfeld v ( r) zu sehen, erinnern wir uns an das Kreuzprodukt und die Rechte-Hand-Regel. Der erste Vektor ist der Daumen der rechten Hand, der zweite Vektor ist der Zeigefinger. Wir halten also den Daumen nach oben und den Zeigefinger nach rechts. Dann zeigt der senkrecht zu Daumen und Zeigefinger ausgestreckte Mittelfinger in Richtung des Kreuzproduktvektors, also in Richtung von v ( r). In unserem Tischbeispiel zeigt er vom K¨ orper weg, bleibt aber in der Tischebene. Das gilt f¨ ur jeden Punkt der Tischebene. In jedem Punkt entsteht der Kreuzproduktvektor, der senkrecht zum Radiusvektor r steht. Deutet man ihn als Bewegungsvektor, so sieht man, dass sich die Tischebene dreht, von oben gesehen gegen den Uhrzeiger.
6.4 Kurvenhauptsatz
121
Wir zeigen jetzt, dass die Rotation dieses Vektorfeldes, also der Vektor rot v ( r) gleich 2 · ω
ist. Der Vektor ω
aus unserem Vektorfeld ist also der Drehachsenvektor und (bis auf den Fakor 2) der rot-Vektor: F¨ ur das Vektorfeld erhalten wir mit r = (x, y, z) und ω
= (ω1 , ω2 , ω3 ) aus dem Kreuzprodukt
v ( r) = ω
× r = (ω2 · z − ω3 · y, ω3 · x − ω1 · z, ω1 · y − ω2 · x). Dann folgt
∂(ω1 · y − ω2 · x) ∂(ω2 · x − ω1 · z) − , ∂y ∂z ∂(ω1 · y − ω2 · x) ∂(ω2 · z − ω3 · y) − , ∂z ∂y ∂(ω2 · z − ω3 · y) ∂(ω3 · x − ω1 · z) − ∂x ∂y = ω1 − (−ω1 ), ω2 − (−ω2 ), ω3 − (−ω3 )
rot v ( r) =
= 2 · (ω1 , ω2 , ω3 ) = 2 · ω
. Wie wir es angek¨ undigt haben, ist die Rotation rot v ( r) bis auf den Faktor 2 der Drehvektor des Vektorfeldes. So k¨ onnen wir uns den Namen Rotation‘ erkl¨ aren. ’ Schauen Sie sich folgendes Bild an, wo wir versucht haben, diese Drehung anschaulich darzustellen. z y
v (r) = ω × r
ω r x
Abb. 6.6
Die Rotation des Vektorfeldes v = ω
× r
Diese Rotation, recht einfach nachzurechnen, hilft uns nun bei der Beantwortung der Frage nach der Wegabh¨ angigkeit eines Kurvenintegrals 2. Art. Allerdings m¨ ussen wir eine kleine Vorsichtsmaßnahme einbauen. Diese Einschr¨ ankung an die beteiligten Gebiete ist sehr anschaulich.
122
6 Kurvenintegrale
Definition 6.6 (Einfacher Zusammenhang) Ein Gebiet G ∈ R2 heißt einfach zusammenh¨ angend, wenn sich jeder geschlossene Weg in G auf einen Punkt zusammenziehen l¨ asst, ohne das Gebiet zu verlassen. Stellen Sie sich also ein Gebiet vor, in das Sie ein Gummiband als geschlossenen Ring hineinlegen. Kann man dieses Band auf einen Punkt zusammenziehen, ohne dass das Band das Gebiet verl¨ asst, so ist das Gebiet einfach zusammenh¨ angend. Doch sehr anschaulich, oder? Wir zeigen im untenstehenden Bild einige Gebiete, die einfach zusammenh¨ angen oder es nicht tun.
&
%
Abb. 6.7 Drei Bilder, links der Kreis ist einfach zusammenh¨ angend, in der Mitte das Gebiet ebenfalls, rechts das Gebiet mit zwei Augen ist es nicht.
Ein typisch extremes Beispiel ist ein Kreis, dem nur der Mittelpunkt fehlt. Der ist ebenfalls nicht einfach zusammenh¨ angend. Im R3 muss man sehr aufpassen. Eine Kugel mit einem fehlenden Mittelpunkt oder eine Hohlkugel sind einfach zusammenh¨ angende Gebiete. Nehmen Sie Ihr Gummiband, das klappt. Satz 6.5 (Kurvenhauptsatz) Sei G ein Gebiet und f ein stetiges Vektorfeld in G. Dann sind folgende Aussagen ¨ aquivalent: 1. f besitzt ein Potential, d.h. es gibt eine Skalarfunktion g mit f (x, y) = grad g(x, y).
(6.14)
2. Das Kurvenintegral von f in G ist unabh¨ angig vom Weg.
3. Das Kurvenintegral von f in G u ¨ber jeden in G verlaufenden geschlossenen Weg verschwindet. Ist G dar¨ uber hinaus einfach zusammenh¨ angend und f ein stetig differenzierbares Vektorfeld, so ist zus¨ atzlich ¨ aquivalent: 4. rot f = 0.
(6.15)
6.4 Kurvenhauptsatz
123
Diese letzte Bedingung reduziert sich, falls f ein Vektorfeld im R2 ist, auf ∂f1 ∂f2 = . ∂y ∂x
(6.16)
Beispiel 6.6 Wir berechnen das Integral
! (xy, y − x) · d x, κ
wobei κ das St¨ uck der Parabel y = x2 mit Anfangspunkt (0, 0) und Endpunkt (1, 1) ist. Dir Normalparabel kennen wir gut, m¨ ussen also kein Bildchen malen. Wir parametrisieren den Weg: y = ψ(t) = t2 , 0 ≤ t ≤ 1.
x = ϕ(t) = t, Dann ist
(ϕ (t), ψ (t)) = (1, 2t). Damit folgt
!
! (xy, y − x) · d x = κ
1
0
!
1
= 0
! =
" =
0
1
(t3 , t2 − t) · (1, 2t) dt (t3 + 2t3 − 2t2 ) dt (3t3 − 2t2 ) dt
3 4 2 3 t − t 4 3
#1 = 0
3 2 1 − = . 4 3 12
Haben Sie gesehen, wie wir gleich in der ersten Zeile rechts nur noch ein gew¨ ohnliches Integral aus der 12. Klasse stehen hatten? Die Parametrisierung hat uns sofort dahin gebracht. Beispiel 6.7 Gegeben sei die Kraft
( x) := (y + z, x + z, x + y). F Wir berechnen die Arbeit, wenn ein Teilchen vom Nullpunkt (0, 0, 0) zum Punkt (1, 1, 1) bewegt wird.
124
6 Kurvenintegrale
Sofort f¨ allt uns auf, dass in dieser Aufgabenstellung nichts u ¨ber den Weg gesagt ist, den wir bitte zur¨ uck legen sollen. Ist das ein Fehler der Aufgabenstellung oder ist es egal, auf welchem Weg wir die Arbeit verrichten? Um das zu pr¨ ufen, w¨ ahlen wir zwei verschiedene Wege und rechnen mal. 1. Wir w¨ ahlen zun¨ achst die direkte Strecke vom Punkt (0, 0, 0) zum Punkt (1, 1, 1) und nehmen die Parametrisierung x = ϕ(t) = t, y = ψ(t) = t, z = χ(t) = t, 0 ≤ t ≤ 1. Dann folgt (ϕ (t), ψ (t), χ (t)) = (1, 1, 1). Wir erhalten
!
!
( x) · d F x = κ
!
1 0
(t + t, t + t, t + t) · (1, 1, 1) dt
1
6t dt =
= 0
& 6 2 &1 t & = 3. 2 0
2. Als zweiten Weg gehen wir entlang der Kurve, die wir folgendermaßen parametrisieren: x = ϕ(t) = t, y = ψ(t) = t2 , z = χ(t) = t3 , 0 ≤ t ≤ 1. Dann folgt (ϕ (t), ψ (t), χ (t)) = (1, 2t, 3t2 ). Wir erhalten
!
!
( x) · d F x =
κ
0
!
1
1
= 0
!
1
(t2 + t3 , t + t3 , t + t2 ) · (1, 2t, 3t2 ) dt (t2 + t3 + 2t2 + 2t4 + 3t3 + 3t4 ) dt
(3t2 + 4t3 + 5t4 ) dt & 3 3 4 4 5 5 &1 t + t + t & = 3 4 5 0 = 1+1+1=3 =
0
6.4 Kurvenhauptsatz
125
Aha, beide Male ergibt sich das Gleiche. Das sieht nach Methode aus. Wir vermuten also, dass dieses Integral wegunabh¨ angig ist. Da unser Gebiet, n¨ amlich der ganze R3 , kein Loch hat, ist es also einfach zusammenh¨ angend und wir k¨ onnen das Kriterium mit der Rotation anwenden. Wir rechnen f¨ ur
( x) = (F1 (x, y, z), F2 (x, y, z), F3 (x, y, z) = (y + z, x + z, x + y) F die Rotation aus:
( x) = (1 − 1, 1 − 1, 1 − 1) = (0, 0, 0) rot F Also ist das Integral nach Teil 4. unseres Kurvenhauptsatzes 6.5 wegunabh¨ angig. Beispiel 6.8 Dieses Beispiel sieht nach einem Gegenbeispiel zum Kurvenhauptsatz aus. Wir geben ein rotationsfreies Vektorfeld und einen geschlossenen Weg an, auf dem das Kurvenintegral nicht verschwindet. Gegeben sei das Vektorfeld x −y , , z
v (x, y, z) = x2 + y 2 x2 + y 2 und der Torus D, den man dadurch erh¨ alt, dass der Kreis (x − 2)2 + z 2 ≤ 1, y = 0 um die z-Achse rotiert. Wir zeigen, dass in D zwar rot v = 0, aber das Kurvenintegral
*
v d x = 0 k
ist, wobei k der Kreis x2 + y2 = 4, z = 0 ist. Berechnen wir zun¨ achst rot v : ⎛
⎜ ⎜ rot v = det ⎜ ⎝ =
e1
e2
∂ ∂x
∂ ∂y
−y x2 +y 2
x x2 +y 2
∂ 0, 0, ∂x
x x2 + y 2
e3
⎞
⎟ ∂ ⎟ ⎟ ∂z ⎠ z ∂ − ∂y
−y x2 + y 2
x2 + y2 − 2x2 + x2 + y 2 − 2y 2 = 0, 0, (x2 + y 2 )2 = (0, 0, 0).
126
6 Kurvenintegrale
Zur Berechnung des Kurvenintegrals f¨ uhren wir Polarkoordinaten ein: x = 2 cos ϕ, y = 2 sin ϕ,
0 ≤ ϕ ≤ 2π.
Damit folgt: dx = −2 sin ϕ dϕ, dy = 2 cos ϕ dϕ, also d x = (−2 sin ϕ dϕ, 2 cos ϕ dϕ). Weil der Kreis k in der (x, y)-Ebene liegt, reduziert sich v zu:
v =
1 x 1 −y sin ϕ, cos ϕ, 0 , , 0 = − . x2 + y 2 x2 + y 2 2 2
Dann folgt f¨ ur das Integral: * ! 2π 1 1
v · d x = − sin ϕ, cos ϕ · (−2 sin ϕ, 2 cos ϕ) dϕ 2 2 k 0 ! 2π = (sin2 ϕ + cos2 ϕ) dϕ
!
0
2π
dϕ
= 0
= 2π. Trotzdem ist das kein Gegenbeispiel zu unserem Satz, dass Kurvenintegrale genau dann wegunabh¨ angig sind, Kurvenintegrale u ¨ber geschlossenen Wegen also verschwinden, wenn das Vektorfeld rotationsfrei ist. Dieser Satz gilt n¨ amlich nur in einfach zusammenh¨ angenden Gebieten. Das Vektorfeld v ist aber auf der gesamten z-Achse nicht definiert. Wir m¨ ussen also ein Gebiet w¨ ahlen, das keinen Punkt der z-Achse enth¨ alt. Der Torus erf¨ ullt dies, bildet aber kein einfach zusammenh¨ angendes Gebiet. So ist also der oben zitierte Satz nicht anwendbar, und die Aufgabe gibt ein sch¨ ones Beispiel daf¨ ur, dass auf die Voraussetzung des einfachen Zusammenhangs nicht verzichtet werden kann.
6.4 Kurvenhauptsatz
127
¨ Ubung 14 1. Bestimmen Sie f¨ ur das Vektorfeld f (x, y, z) := (x y 2 , 2 x2 y z, −3 y z 2 ) die Rotation rot f (x, y, z). 2. Gegeben sei ein Skalarfeld f (x, y, z), das partielle Ableitungen mindestens bis zur 2. Ordnung besitzt. Zeigen Sie, dass dann stets gilt rot (grad f (x, y, z)) = 0. 3. Betrachten Sie einen Torus D, also einen Autoreifen, dessen Mittelebene in der (x, y)-Ebene liegt und der sich um die z-Achse herumwindet. Der Kreis x2 + y 2 = 4, z = 0 liege ganz im Innern des Torus. (Man erh¨ alt den Torus z.B. dadurch, dass der Kreis (x − 2)2 + z 2 ≤ 1, y = 0 um die z-Achse rotiert.) Gegeben sei in D das Vektorfeld
v (x, y, z) :=
x −y , ,z . x2 + y 2 x2 + y 2
a) Zeigen Sie, dass in D gilt: rot ( v (x, y, z)) = 0. b) Berechnen Sie
!
v (x, y, z) · d x, k
wobei k der geschlossenen Kreis x2 + y2 = 4, z = 0 ist.
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
7 Doppelintegrale
¨ Ubersicht 7.1 7.2 7.3
Berechnung des Doppelintegrals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 Transformation der Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
Die jetzt zu beschreibenden Doppelintegrale sind die nat¨ urliche Verallgemeinerung des aus der Schule bekanten gew¨ ohnlichen Integrals. Wir erinnern uns mit folgender Skizze: f6(x)
+
a
− b
x
Abb. 7.1 Integral als Fl¨ acheninhalt
Auf dem Intervall [a, b] ∈ R ist also die Funktion f : R → R gegeben. Ihr Graph schließt mit der x-Achse eine Fl¨ ache ein, wir haben sie gestrichelt. Das Integral berechnet diese Fl¨ ache. Dabei sind Anteile oberhalb der x-Achse positiv, unterhalb der x-Achse negativ zu werten.
7.1
Berechnung des Doppelintegrals
Dieses gew¨ ohnliche Integral u ¨bertragen wir nun in den R2 . Gegeben sei ein 2 Bereich B ∈ R , also ein Bereich der (x, y)-Ebene. Dort sei eine Funktion f : B → R gegeben.
N. Herrmann, Mathematik für Naturwissenschaftler, DOI 10.1007/978-3-8274-2867-7_7, © Spektrum Akademischer Verlag Heidelberg 2012
130
7 Doppelintegrale
z
y
B
x Abb. 7.2 Doppelintegral als Volumen des Zylinders u ¨ber B
Gesucht wird jetzt das Volumen des Zylinders u ache vom ¨ber B, dessen Deckfl¨ Graphen der Funktion f gebildet wird. Sie erkennen hoffentlich die Parallelit¨ at zum gew¨ ohnlichen Integral u ¨ber einem Intervall [a, b]. Um das Integral berechnen zu k¨ onnen, muss uns irgendwie der Bereich B vorgegeben sein. F¨ ur zwei Spezialf¨ alle, die den meisten F¨ allen der Praxis entsprechen, wollen wir eine Berechnungsmethode angeben. Manchmal hilft es, wenn man den Bereich B in Teilbereiche zerlegt, wie wir das bei den Rechenregeln in Satz 7.3 angeben werden.
Erste Berechnungsmethode Ist B gegeben durch zwei Funktionen y1 und y2 mit a ≤ x ≤ b, y1 (x) ≤ y ≤ y2 (x),
(7.1)
so gilt
!!
!
b
(!
y2 (x)
f (x, y) dB = B
) f (x, y) dy dx,
a
y1 (x)
(7.2)
7.1 Berechnung des Doppelintegrals
131
d.h., das Doppelintegral kann dadurch, dass wir zwei gew¨ ohnliche Integrale hintereinander ausf¨ uhren, berechnet werden. Dabei wird zuerst die innere eckige Klammer berechnet, wobei genau wie bei der partiellen Differentiation die Variable x vor¨ ubergehend als konstant angesehen wird. H¨ aufig werden die eckigen Klammen weggelassen, denn die Zuordnungen sind mit der Reihenfolge dy dx gekl¨ art. Manche Autoren benutzen andere Festlegungen.
6y y2 (x) B y1 (x)
x
b
a
Abb. 7.3 Berechnung des Doppelintegrals, wenn f¨ ur B die Funktionen y1 (x) und y2 (x) gegeben sind.
Beispiel 7.1 B sei der Bereich zwischen den Kurven y1 (x) = x2 , y2 (x) =
√ x, 0 ≤ x ≤ 1,
und sei f (x, y) := x y. Wir berechnen das Integral
!! f (x, y) dB. B
Nach unserer Vorschrift rechnen wir
!!
!
1
(!
√ y2 (x)= x
f (x, y) dB = B
) x y dx.
0
y1 (x)=x2
132
7 Doppelintegrale
6
(1, 1)
√ y2 (x) = x B
y1 (x) = x2
-
(0, 0) Abb. 7.4 Berechnung des Doppelintegrals, wenn f¨ ur B die Funktionen y1 (x) = x2 und √ y2 (x) = x gegeben sind.
Befassen wir uns zun¨ achst mit der inneren eckigen Klammer. Integration nach dy meint, dass wir die Variable x vor¨ ubergehend als konstant annehmen. Dann folgt durch schlichte Schulrechnung ) √ !! ! (! 1
y2 (x)=
x
f (x, y) dB =
x y dy dx y1 (x)=x2
0
B
!
1
= 0
!
" #y (x)=√x 1 2 2 x y dx 2 y1 (x)=x2
1 x x − x4 dx 0 2 & 1 1 3 1 6 &1 x − x & = 2 3 6 0 1 1 1 − = −0 2 3 6 1 = . 12 1
=
Zweite Berechnungsmethode Ist B gegeben durch zwei Funktionen x1 und x2 mit c ≤ y ≤ d, x1 (y) ≤ x ≤ x2 (y),
(7.3)
so gilt
!!
!
d
(!
x2 (y)
f (x, y) dB = B
) f (x, y) dx dy.
c
(7.4)
x1 (y)
Auch hier kann das Doppelintegral dadurch, dass wir zwei gew¨ ohnliche Integrale hintereinander ausf¨ uhren, berechnet werden. Dabei wird zuerst die innere ecki-
7.1 Berechnung des Doppelintegrals
133
ge Klammer berechnet, wobei jetzt die Variable y vor¨ ubergehend als konstant angesehen wird. Man muss sich das so vorstellen, dass wir f¨ ur diese Berechnungsmethode das Blatt Papier mit dem Gebiet B um 90◦ gegen den Uhrzeiger drehen und dann hoffen, dass wir die obere und untere Kante, die ja vorher linke und rechte Kante waren, als Graphen zweier Funktionen ansehen k¨ onnen. Wir nehmen unser Beispiel von oben noch mal auf und berechnen das Doppelintegral mit der zweiten Methode. Beispiel 7.2 Sei wieder B der Bereich zwischen den Kurven c = 0, d = 1, x1 (y) = y 2 , x2 (y) =
√ y, 0 ≤ y ≤ 1,
und sei f (x, y) := x y. Wir berechnen das Integral
!! f (x, y) dB. B
Nach unserer Vorschrift rechnen wir, wobei wir im ersten Schritt ja diesmal nach x integrieren und deshalb f¨ ur diesen Schritt y als konstant ansehen:
!!
!
1
(!
f (x, y) dB = B
)
√ x2 (x)= y
x y dx dy
!
0 1
=
!
0 1
= 0
"
x1 (x)=y 2
1 y · · x2 2
#x2 (y)=√y dy x1 (y)=y 2
1 y y − y 4 dy 2
1 . = 12 Nat¨ urlich ergibt sich dasselbe wie oben. Der Satz, dass jede stetige Funktion f : R1 → R1 integrierbar ist, u agt sich ¨bertr¨ hierher und l¨ asst sich sogar noch verallgemeinern. Satz 7.1 1. Jede in B stetige Funktion ist auch u ¨ber B integrierbar. 2. Jede Funktion, die in B stetig ist mit Ausnahme von Punkten auf endlich vielen glatten Kurven, ist auch u ¨ber B integrierbar.
134
7 Doppelintegrale
Solche Kurven sind ja in der (x, y)-Ebene eindimensional, haben also fl¨ achenm¨ aßig keine Ausdehnung. Dort kann man die Funktion sogar beliebig ab¨ andern, ohne den Integralwert zu ¨ andern. Mathematisch sagt man, sie seien vom Maß Null. Solche Nullmengen ignoriert das Integral. Wir betrachten das folgende Beispiel, das wir es gleich anschließend noch einmal bearbeiten werden. Beispiel 7.3 Wir berechnen das Doppelintegral
!! x y dB B
u ¨ber dem Viertelkreis B := {(x, y) : x2 + y 2 ≤ R2 , x ≥ 0, y ≥ 0, R ∈ R}. Wir nehmen die x-Achse als Basis und betrachten dar¨ uber den Viertelkreis: B:
a = 0, b = 1, y1 (x) = 0, y2 (x) =
R2 − x2 .
Dann folgt
!!
!
R
(!
x y dB = B
!
) x · y dy dx
&√ 1 2 & R2 −x2 x· ·y & dx = 2 0 0 ! R ! R 2 x3 x 2 R 2 (R − x ) dx = x− dx = 2 2 2 0 0 =
7.2
0
0
√ R2 −x2
R
R2 2 R4 R4 R − = . 4 8 8
Transformation der Variablen
Ein wichtiges Hilfsmittel besteht darin, das zugrunde liegende Gebiet zu transformieren, so dass es vielleicht f¨ ur die Berechnung leichter zug¨ anglich ist. Der Satz greift auf unsere Kenntnis der Determinante im Kapitel Determinanten‘ ’ S. 23 zur¨ uck. Betrachten Sie folgendes Bild: in der (x , y)-Ebene, rechts der Bereich B in der (x, y)Links ist der Bereich B Ebene. Die Funktionen (ϕ, ψ) stellen die eineindeutige Abbildung dieser beiden durch eine Abbildung Bereiche her. K¨ onnen wir diesen Gedanken, den Bereich B zu vereinfachen, f¨ ur unsere Doppelintegrale ausnutzen?
7.2 Transformation der Variablen
6y
B
135
y 6
ϕ ψ
s
B
x
x Abb. 7.5 Zur Transformationsformel
Satz 7.2 (Transformationsregel) Durch die Funktionen x = ϕ(x , y), y = ψ(x , y)
der (x , y)-Ebene mit st¨ uckweise glattem Rand eineindeutig werde der Bereich B auf den Bereich B der (x, y)-Ebene abgebildet. Die Funktionen x = ϕ(x , y) und , y) und ihre partiellen Ableitungen erster Ordnung seien stetig in B. y = ψ(x ur die Funktionaldeterminante Im Innern von B gelte f¨
det
ϕxe (x , y) ϕye(x , y)
ψxe (x , y) ψye(x , y)
= 0.
(7.5)
Ist dann die Funktion f (x, y) in B stetig, so gilt:
!! f (x, y) dB = B
!! e B
f (ϕ(x , y), ψ(x , y) · det
ϕxe ϕye
dB.
(7.6)
ψxe ψye
Das ist ja mal ein richtig großer Satz. Tats¨ achlich ist er sehr wichtig f¨ ur die Anwendungen. Wir berechnen gleich ein Beispiel. Aber zuvor eine kleine Bemerkung zum Begriff eineindeutig‘. Nein, nein, da haben wir nicht gestottert. ’ Bei Abbildungen meint eindeutig‘, dass jedem Urbild genau ein Bild zugeord’ net wird. Eineindeutig‘ verlangt dar¨ uber hinaus, dass verschiedenen Urbildern ’ auch verschiedene Bilder zugeordnet werden. Machen Sie sich bitte klar, dass das zwei verschiedene Bedingungen sind. Die Nullabbildung, die also jedem Urbild die Null zuordnet, ist eindeutig. Jedes Urbild bekommt genau ein Bild, n¨ amlich die Null. Aber verschiedene Urbilder erhalten nicht verschiedenen Bilder, alles klar? Diese Bedingung brauchen wir nat¨ urlich f¨ ur unsere Transformation. Falls Sie z.B. die Ebene ein paar mal falten, kann das nat¨ urlich nicht klappen mit der Formel (7.6). auf den Achten Sie bitte genau auf die Reihenfolge. Wir haben den Bereich B Bereich B abgebildet und k¨ onnen dann das Integral u ¨ber B auf das Integral u uckf¨ uhren. ¨ber B zur¨
136
7 Doppelintegrale
Beispiel 7.4 Wir betrachten noch mal das Beispiel von oben, also berechnen das Doppelintegral
!! x y dB B
u ¨ber dem Viertelkreis B := {(x, y) : x2 + y 2 ≤ R2 , x ≥ 0, y ≥ 0, R ∈ R}. Jetzt nehmen wir eine ganz geschickte Transformation vor. π 2
y R6
α 6
B
B
r R
r
*
α
R x
e nach B Abb. 7.6 Transformation von B
ist also das Rechteck, B der Viertelkreis. Als Transformation nehmen wir B x = r cos α, y = r sin α, 0 ≤ r ≤ R, 0 ≤ α ≤
π . 2
haben auch verDiese Zuordnung ist eineindeutig: verschiedene Urbilder in B schiedene Bilder in B. Die beiden Funktionen , y) = ϕ(r, α) = r cos α, y = ψ(x , y) = ψ(r, α) = r sin α x = ϕ(x sind stetig, ihre partiellen Ableitungen
ϕr = cos α, ϕα = −r sin α ψr = sin α, ψα = r cos α sind ebenfalls stetig. Die Funktionaldeterminante
det
ϕxe ϕye
= det
cos α −r sin α sin α
ψxe ψye 2
r cos α
= r cos α − (−r sin2 α) = r (cos2 α + sin2 α) = r
7.3 Rechenregeln
137
ungleich ist – ganz wichtig unsere Einschr¨ ankung im Satz – im Innern von B Null; nur im Punkt (0, 0), also f¨ ur r = 0 ist sie gleich Null. Der Punkt liegt aber im Rand des Viertelkreises. Unser Transformationssatz ist also anwendbar. Wir erhalten !!
!! x y dB =
B
! e B
!
r
3
"
0
=
1 2
!
(!
π/2
r cos α r sin α r dB =
R
=
R
R
− cos 2α 4
r3 dr =
0
0
#π/2
) r3 cos α sin α dα dr
0
dr 0
R4 . 8
So haben wir es auch schon oben erhalten Wir haben dieses Beispiel zweimal vorgerechnet, um die Alternativen aufzuzeigen. Es ist sicher Geschmacksache, welche dieser beiden Rechnungen leichter oder bequemer ist.
7.3
Rechenregeln
Satz 7.3 (Rechenregeln) 1. Additivit¨ at bezgl. des Integranden: Sind f und G zwei integrierbare Funktionen, so gilt
!!
!! [f (x, y) + g(x, y)] dB =
B
!! f (x, y) dB +
g(x, y) dB.
B
(7.7)
B
2. Additivit¨ at bezgl. des Bereiches: Sind B1 und B2 zwei Bereiche ohne gemeinsame innere Punkte, so gilt !! !! !! f (x, y) dB = f (x, y) dB + f (x, y) dB. (7.8) B1 ∪B2
B1
B2
3. Konstanter Faktor: Ist k eine reelle Zahl, so gilt
!!
!! k · f (x, y) dB = k ·
f (x, y) dB.
B
(7.9)
B
4. Monotonie: Ist f¨ ur jeden Punkt (x, y) ∈ B : f (x, y) ≤ g(x, y), so gilt
!!
!! f (x, y) dB ≤
B
g(x, y) dB.
5. Absch¨ atzung: Ist f u ¨ber B integrierbar, so auch |f |, und es gilt &! ! & !! & & & f (x, y) dB && ≤ |f (x, y)| dB. & B
(7.10)
B
B
(7.11)
138
7 Doppelintegrale
6. Eingrenzung: Ist m die untere, M die obere Grenze von f in B (m ≤ f (x, y) ≤ M ) und ist |B| der Fl¨ acheninhalt von B, so gilt
!! m · |B| ≤
f (x, y) dB ≤ M · |B|.
(7.12)
B
7. Mittelwertsatz: Wenn f auf B stetig ist, so existiert auf B mindestens eine Stelle (ξ, η) mit !! f (x, y) dB = f (ξ, η) · |B|. (7.13) B
++ 8. Fl¨ acheninhalt: Ist f (x, y) ≡ 1, so ist B dB das Volumen eines Zylinders mit der Deckfl¨ ache z = f (x, y) = 1 und daher ist !! dB = |B| = Fl¨ acheninhalt von B. B
(7.14)
7.3 Rechenregeln
139
¨ Ubung 15 1. Es sei f (x, y) := x y,
B : x ≥ 0, y ≥ 0, x2 + y 2 ≤ 2, y ≤ x2 .
Berechnen Sie
!! f (x, y) dB. B
2. Sei B : x ≥ 0, y ≥ 0, x2 + y 2 ≤ R2 und sei f (x, y) := x2 + y 2 .
!!
Berechnen Sie
(x2 + y 2 ) dB.
B
[Hinweis: Polarkoordinaten] 3. Bestimmen Sie die Fl¨ ache, die begrenzt ist durch die Parabeln y2 = 4 − x
und
y 2 = 4 − 4x.
4. Berechnen Sie das Integral
!!
e−(x
2
+y2 )
dB,
B
wobei B der Kreis in der (x, y)-Ebene sei: x2 + y2 ≤ a2 , a ∈ R, a > 0. 5. Berechnen Sie das Volumen V der Kugel vom Radius R. 6. Berechnen Sie auf zwei verschiedenen Wegen den Fl¨ acheninhalt der Fl¨ ache B, die im 1. Quadranten liegt und durch die (halb-kubische) Parabel
y 2 = x3
und die Gerade
y=x
begrenzt wird. 7. Wie lautet die Funktionaldeterminante bei Doppelintegralen f¨ ur eine Transformation mittels verallgemeinerter Polarkoordinaten? x = a r cos α,
y = b r sin α,
a, b ∈ R, a, b > 0
140
7 Doppelintegrale 2
8. F¨ ur die Funktion y = ex ist keine elementare Stammfunktion bekannt. Daher kann das Integral
!
1 0
!
3
2
ex dx dy
3y
in der Form nicht berechnet werden. Berechnen Sie es durch Umkehrung der Integrationsreihenfolge.
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
8 Dreifachintegrale
¨ Ubersicht 8.1 8.2 8.3 8.4
Berechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Transformation der Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kugel- und Zylinderkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
142 143 144 144
In diesem Kapitel stellen wir eine weitere Verallgemeinerung des gew¨ ohnlichen 1 Integrals vor. Erinnern wir uns, dass im R eine Funktion jedem Punkt z.B. eines Intervalls Werte zuordnete. Das gew¨ ohnliche Integral berechnete dann den Fl¨ acheninhalt unter dem Graphen, berechnete also einen Fl¨ acheninhalt. Ein Doppelintegral berechnete in Verallgemeinerung dann ein Volumen. Was macht jetzt ein dreifaches Integral? Nun wir betrachten ein Gebilde im R3 , z.B. ¨ einen W¨ urfel, eine Kugel oder Ahnliches. Auf diesem Gebilde sei eine reellwertige Funktion gegeben. Da k¨ onnte man sich die Temperaturverteilung oder die Windst¨ arke in jedem Punkt des Gebildes vorstellen. Das Dreifachintegral berechnet dann das Volumen‘ dieses vierdimensionalen Gebildes, was sich unserer ’ Vorstellung entzieht, weil wir als dreidimensionale Wesen nicht vierdimensional schauen k¨ onnen. Wir k¨ onnen aber auch etwas anders herangehen. Denken Sie sich die Funktion als Dichtefunktion des betrachteten K¨ orpers, also mit Dichte gleich Masse pro Volumen. Dann k¨ onnen wir ein Dreifachintegral benutzen, um die Gesamtmasse eines K¨ orpers zu bestimmen. Genauso helfen uns die Dreifachintegrale, wenn wir einen geladenen K¨ orper vor uns haben und seine Gesamtladung suchen. Wir integrieren u ¨ber die Raumladungsdichte und erhalten das Ergebnis. So also nicht verzagen, Dreifachintegrale sind ungemein n¨ utzliche Wesen. Wichtig ist, dass sich diese Dreifachintegrale recht leicht berechnen lassen, wir werden das vorf¨ uhren. Wiederbegegnen werden sie uns dann sp¨ ater im ber¨ uhmten Divergenzsatz von C.F. Gauß. Und dort helfen sie uns wirklich sehr. Aber dat krieje mer sp¨ ater!
N. Herrmann, Mathematik für Naturwissenschaftler, DOI 10.1007/978-3-8274-2867-7_8, © Spektrum Akademischer Verlag Heidelberg 2012
142
8.1
8 Dreifachintegrale
Berechnung
Der folgende Spezialfall, f¨ ur den wir die Berechnung des Dreifachintegrals angeben, ist gar nicht so speziell; denn viele andere Gebiete lassen sich in diese Form bringen. Vielleicht muss man auch Gebiete zertrennen, um auf diese Form zu kommen. Es sei V ein Zylinder u ache ¨ber einem Bereich B der (x, y)-Ebene mit der Grundfl¨ z = z1 (x, y) und der Deckfl¨ ache z = z2 (x, y). Dann gilt
! ! (!
!!! f (x, y, z) dV = V
)
z2 (x,y)
f (x, y, z) dz dB. B
(8.1)
z1 (x,y)
Erkennen Sie unseren Wassertopftrick (vgl. S. 70)? Wir haben das unbekannte Dreifachintegral auf ein gew¨ ohnliches inneres Integral und anschließend auf das bekannte Doppelintegral zur¨ uckgef¨ uhrt. Ein typisches Vorgehen in der Mathematik. Und gar nicht witzig! Wir zeigen das mal an einem Beispiel. Beispiel 8.1 Gegeben sei auf dem Bereich V , der im ersten Quadranten liegt und begrenzt wird durch die Ebenen y = 0, z = 0, x + y = 2, x + 2y = 6 und den Zylinder y2 +z 2 = 4. Außerdem sei die Funktion f (x, y, z) = z gegeben. B sei das Viereck in der (x, y)-Ebene, das von den begrenzenden Ebenen dort gebildet wird. z
y
x
Abb. 8.1 Der Bereich V
Schauen wir uns das Bild genau an. B liegt, wie gesagt, in der (x, y)-Ebene. Dar¨ uber w¨ olbt sich der Zylinder. So erhalten wir unsere beiden Deckfl¨ achen z1 (x, y) = 0 ≤ z ≤ z2 (x, y) =
4 − y2 .
8.2 Rechenregeln
143
z2 (x, y) folgt also oben aus der Zylindergleichung y 2 + z 2 = 4. Dann rechnen wir einfach los. √
! ! (!
!!!
z=
f (x, y, z) dV = V
)
4−y 2
z dz dB B
!! =
B
!! =
B
0
& √ z 2 &z= 4−y2 dB & 2 z=0 4 − y2 dB. 2
Dies ist jetzt ein Doppelintegral wie im vorigen Kapitel. Mit 0 ≤ y ≤ 2 und 2 − y ≤ x ≤ 6 − 2y folgt weiter
!
2
= 0
!
2
= 0
!
!
6−2y
4 − y2 dx dy 2 2−y &x=6−2y 4 − y2 & · x& dy 2 x=2−y
2
4 − y2 · [(6 − 2y) − (2 − y)] dy 2 0 ! 2 ! 1 1 2 2 = (4 − y ) · (4 − y) dy = (16 − 4y2 − 4y + y 3 ) dy 2 0 2 0 " # 4·4 16 4·8 1 − − 32 − = 2 3 2 4 1 32 26 . = 28 − = 2 3 3 =
8.2
Rechenregeln
Auch hier k¨ onnen wir angeben, welche Funktionen auf jeden Fall integrierbar sind. Satz 8.1 1. Jede in V stetige Funktion ist auch u ¨ber V integrierbar. 2. Jede Funktion, die in V stetig ist mit Ausnahme von Punkten, die auf einer endlichen Anzahl von glatten Fl¨ achen liegen, ist auch u ¨ber V integrierbar. Der Satz 7.3 mit den Rechenregeln f¨ ur Doppelintegrale (vgl. S. 137) u agt ¨bertr¨ sich vollst¨ andig.
144
8 Dreifachintegrale
8.3
Transformation der Variablen
Auch haben wir hier eine Transformationsregel, die nat¨ urlich wegen der h¨ oheren Dimension etwas komplizierter ausf¨ allt, im Wesentlichen aber das Gleiche aussagt. Satz 8.2 Die Voraussetzungen seien hier f¨ ur die Transformationsfunktionen x = ϕ(x , y, z), y = ψ(x , y, z), z = χ(x , y, z) dieselben wie im Satz 7.2. Ist dann im Innern des Bereiches V die Funktionaldeterminante
⎛ ⎜ det ⎜ ⎝
∂ϕ ∂x e ∂ϕ ∂y e ∂ϕ ∂z e
∂ψ ∂x e ∂ψ ∂y e ∂ψ ∂z e
∂χ ∂x e ∂χ ∂y e ∂χ ∂z e
⎞ ⎟ ⎟ = 0, ⎠
(8.2)
so gilt f¨ ur jede stetige Funktion f (x, y, z)
!!!
!!! f (x, y, z) dV =
V
e V
f (ϕ(x , y, z), ψ(x , y, z), χ(x , y, z)) · det
···
dV . (8.3)
8.4
Kugel- und Zylinderkoordinaten
Als Anwendung betrachten wir Kugelkoordinaten r, α, β und berechnen die Funktionaldeterminante f¨ ur
x = ϕ(r, α, β) = r cos α sin β, y = ψ(r, α, β) = r sin α sin β,
(8.4)
z = χ(r, α, β) = r cos β. Damit erhalten wir
⎛
⎞ cos α sin β
sin α sin β
⎜ det ⎜ ⎝ −r sin α sin β r cos α sin β
cos β 0
r cos α cos β r sin α cos β −r sin β
⎟ ⎟ = r 2 sin β. ⎠
8.4 Kugel- und Zylinderkoordinaten
145
Hier haben wir zweimal ausgenutzt, dass sin2 α + cos2 α = 1 ist. Rechnen Sie es bitte nach, so wiederholen Sie die Regel von Sarrus und festigen Ihr Wissen u ¨ber Kugelkoordinaten. In vielen Anwendungen braucht man Zylinderkoordinaten; also rechnen wir auch daf¨ ur die Funktionaldeterminante aus. Mit x = r cos α, y = r sin α, z = z
(8.5)
erhalten wir
⎛
⎞ cos α
sin α
0
⎜ ⎟ ⎟ det ⎜ ⎝ −r sin α r cos α 0 ⎠ = r. 0 0 1 Eine interessante Anwendung finden wir in den Physikb¨ uchern. Wenn wir irgend einen dreidimensionalen K¨ orper V betrachten, so fragt man manchmal nach
:= (S1 , S2 , S3 ) seine Koordinaten dessen Schwerpunkt. Bezeichnen wir mit S und ist der Bereich V mit der Massendichte (x, y, z) belegt, so gilt
= S
+++ +++ +++ x · (x, y, z) dV y · (x, y, z) dV z · (x, y, z) dV V V V +++ +++ +++ , , . (x, y, z) (x, y, z) (x, y, z) V V V (8.6)
Beispiel 8.2 ¨ Zur Ubung mit Kugelkoordinaten berechnen wir hier das Volumen V einer Kugel vom Radius R > 0. Aus der Schule kennen wir V = 43 · πR3 . Mal sehen, ob wir das ausrechnen k¨ onnen. F¨ ur eine Kugel kennen wir die Koordinatendarstellung K = {(x, y, z) ∈ R3 : x2 + y2 + z 2 ≤ R2 }. Mit den Kugelkoordinaten r, α, β und der Einschr¨ ankung 0 ≤ r ≤ R, 0 ≤ α ≤ 2π, 0 ≤ β ≤ π sowie mit der Funktion f (x, y, z) ≡ 1 erhalten wir
146
8 Dreifachintegrale z
β α y x
Abb. 8.2 Berechnung des Volumens einer Kugel vom Radius R. Hier ist eine Halbkugel dargestellt mit den entsprechenden Kugelkoordinaten.
!!!
!
|V | =
R
!
2π
!
π
dV = V
!
R
!
2π
=
!
0
!
0
R
!
0
!
0
R
2π
=
$
0
0
− r2 cos β
%π
dα dr
0
[−r 2 (−1) − (−r2 )] dα dr
2π
!
2
R
2 r dα dr =
=
!
0
0
R
= 0
r2 sin β dβ dα dr
0
&2π & 2 r2 α& dr 0
0
& 4π 3 &R 4π 3 r & = R . 2 r2 2 π dr = 3 3 0
Manchmal hilft der folgende Satz bei der Berechnung von Dreifachintegralen. Satz 8.3 (Dreifachintegral als Produkt von Einfachintegralen) Hat das Dreifachintegral feste Grenzen und l¨ asst sich der Integrand f (x, y, z) schreiben als f (x, y, z) = f1 (x) · f2 (y) · f3 (z), so gilt
!!!
!
x1
!
y1
!
z1
f (x, y, z) dV = V
f (x, y, z) dz dy dx x0
!
y0
z0
f1 (x) dx ·
= x0
!
y1
y0
! f2 (y) dy ·
z1
f3 (z) dz. z0
(8.7)
8.4 Kugel- und Zylinderkoordinaten
147
F¨ ur unsere Kugel ist dieser Satz anwendbar, denn als Integranden haben wir ja lediglich die Funktion f (x, y, z) = r 2 sin β. Wir k¨ onnen also auch so rechnen:
!!! |V | =
R
dV = V
=
! 0
2
r dr ·
!
2π 0
! dα ·
π
sin β dβ 0
, -π 4πR3 2πR3 R3 · 2π · − cos β = [1 − (−1)] = . 3 3 3 0
¨ Und so hatten wir es auch oben in Ubereinstimmung mit der Schule berechnet.
148
8 Dreifachintegrale
¨ Ubung 16 1. Berechnen Sie folgende Dreifachintegrale: a)
!
1
!
1−x
!
2−x
x y z dz dy dx, 0
0
0
b)
!
pi 2
0
!
1
!
0
2
z r2 sin α dz dr dα.
0
2. a) V sei der von den Koordinatenebenen und der Ebene E:
x+y+z =1
begrenzte K¨ orper. Skizzieren Sie diesen K¨ orper. b) Berechnen Sie das Dreifachintegral !!! (2 x + y + z) dV. V
3. a) V sei der von den Koordinatenebenen und der Ebene E:
x+y+z =1
begrenzte K¨ orper. Skizzieren Sie diesen K¨ orper. b) Berechnen Sie das Dreifachintegral
!!! (2 x + y + z) dV. V
4. Berechnen Sie den Schwerpunk S = (S1 , S2 , S3 ) der Halbkugel H vom Radius R > 0 bei konstanter Massendichte = 1. 5. Berechnen Sie das Dreifachintegral !!! x y z dV, V
wo V die Einheitskugel ist.
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
9 Ober߬ achenintegrale
¨ Ubersicht 9.1 9.2
Ober߬ achenintegrale 1. Art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Ober߬ achenintergale 2. Art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
In diesem Kapitel schildern wir die Verallgemeinerung der Kurvenintegrale f¨ ur 2 den R . Und genau wie dort gibt es auch hier zwei verschiedene M¨ oglichkeiten. Wir nennen sie Oberfl¨ achenintegrale 1. Art und 2. Art. Bei den Kurvenintegralen hatten wir als Ausgangsmenge eine Kurve im R2 oder im R3 . Hier betrachten wir jetzt eine Fl¨ ache im R3 . F¨ ur den R2 macht das keinen Sinn mehr. Auf dieser Fl¨ ache sei ein Skalarfeld oder ein Vektorfeld gegeben, darin unterscheiden sich die beiden Integrale.
9.1
Ober߬ achenintegrale 1. Art
Wir schauen zur¨ uck auf unsere Kurven. Die hatten wir definiert als Abbildung uck bl¨ attern wollen. Hier eines Intervalls [a, b] ∈ R1 , wenn Sie bitte noch mal zur¨ werden wir jetzt alles um eine Dimension erh¨ ohen, geben uns also einen Bereich B ∈ R2 statt des Intervalls vor und betrachten eine Abbildung dieses Bereiches. Definition 9.1 Wir betrachten ein Fl¨ achenst¨ uck F ∈ R3 , gegeben durch F ∈ R3 := {(x, y, z) ∈ R3 : (x = x(u, v), y = y(u, v), z = z(u, v)), (u, v) ∈ B}. (9.1) B heißt der Parameterbereich, u und v sind die Parameter,
x := (x(u, v), y(u, v), z(u, v)).
N. Herrmann, Mathematik für Naturwissenschaftler, DOI 10.1007/978-3-8274-2867-7_9, © Spektrum Akademischer Verlag Heidelberg 2012
150
9 Ober߬ achenintegrale
6y
6z j F
* y
B
b
a Abb. 9.1
x
x
Ein Fl¨ achenst¨ uck im R3 als Abbildung eines Rechtecks im R2
Definition 9.2 Auf F sei eine Funktion f ( x) gegeben. Dann nennen wir
!!
!! f ( x(u, v)) · | xu (u, v) × xv (u, v)| dB
f ( x) dF := F
(9.2)
B
Oberfl¨ achenintegral 1. Art. Beachten Sie bitte wieder unseren Wassertopftrick. Rechts in Formel (9.2) steht ein Doppelintegral, wie wir es fr¨ uher schon eingef¨ uhrt haben. xu (u, v) und
xv (u, v) sind die Tangentenvektoren. Der Betrag ihres Kreuzproduktes ist, wie wir uns aus der Schule erinnern, die Fl¨ ache des von diesen beiden Vektoren aufgespannten Parallelogramms. Sehen Sie die Analogie zum Kurvenintegral 1. Art? Dort hatten wir mit der L¨ ange des Tangentenvektors multipliziert. Beispiel 9.1 Sei F der Zylindermantel F := {(x, y, z) ∈ R3 : x2 + y 2 = 1 mit 0 ≤ z ≤ 1.} F¨ ur die Funktion f : F → R mit f (x, y, z) = x2 z berechnen wir das Oberfl¨ achenintegral 1. Art u ¨ber F. z
v 1
y 2π
u x
Abb. 9.2
3
Ein Zylindermantel als Fl¨ achenst¨ uck im R
Nat¨ urlich bieten sich hier geradezu die Zylinderkoordinaten an:
9.1 Ober߬ achenintegrale 1. Art
151
x(u, v) = (cos u, sin u, v), 0 ≤ u ≤ 2π, 0 ≤ v ≤ 1. Mit
xu = (− sin u, cos u, 0), xv = (0, 0, 1) berechnen wir das Kreuzprodukt mit Hilfe der Formel
⎛
⎞
e1 e2 e3
⎜ ⎟ ⎟
a × b = det ⎜ a a a 1 2 3 ⎝ ⎠ b1 b2 b3 und dann der Sarrusregel. F¨ ur unsere beiden Tangentenvektoren xu und xv ergibt sich
⎛
⎞
e1
e2
e3
⎜ ⎟ ⎟ = cos u e1 + sin u e2 = (cos u, sin u, 0).
xu × xv = det ⎜ − sin u cos u 0 ⎝ ⎠ 0 0 1 Damit erhalten wir dann
!!
!!
2
v cos2 u dB
x z dF = F
!
B 2π
!
1
!
2π
v cos u dv du =
=
"
0
u 2 2π = 2 =
2
0
sin 2u 4 1 π · = . 2 2
+
#2π " 2 #1 v · 2 0 0
2
!
1
cos u du 0
v dv 0
Haben Sie gesehen, wo wir das Oberfl¨ achenintegral in ein einfacheres Doppelintegral und dieses dann in zwei sehr einfache gew¨ ohnliche Integrale umgewandelt haben? So simpel ist das.
152
9 Ober߬ achenintegrale
¨ Ubung 17 1. Sei F die Oberfl¨ ache der Einheitskugel F := {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1.} Berechnen Sie f¨ ur f (x, y, z) := a, a ∈ R, a = const. das Oberfl¨ achenintegral
!! f (x, y, z) dF. F
2. Sei F ein Fl¨ achenst¨ uck, gegeben als Graph einer Funktion u ¨ber der (x,y)Ebene: F := {(x, y, z) ∈ R3 : z = g(x, y).} Berechnen Sie mit der sich auf nat¨ urliche Weise ergebenden Parametrisierung | xu × xv | 3. Berechnen Sie das Oberfl¨ achenintegral von f (x, y, z) := x
!!
!! f (x, y, z) dF =
F
x dF, F
wobei F die Fl¨ ache z = x2 + y mit 0 ≤ x ≤ 1, −1 ≤ y ≤ 1 ist. 4. Sei F die Halbkugelfl¨ ache F := {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1, z > 0.} achenintegral Sei f (x, y, z) := x2 y 2 z. Berechnen Sie das Oberfl¨ !! f (x, y, z) dF. F
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
9.2 Ober߬ achenintergale 2. Art
9.2
153
Ober߬ achenintergale 2. Art
Analog zum Kurvenintegral 2. Art betrachten wir jetzt Integrale u ¨ber Fl¨ achenst¨ ucken, bei denen der Integrand ein Vektorfeld ist. Nat¨ urlich muss dann das Differential d x ebenfalls verktorwertig sein. Eine wichtige Bemerkung m¨ ussen wir vorweg schicken. Wenn wir so eine Fl¨ ache 3 im R betrachten, so wollen wir voraussetzen, dass wir sie orientieren k¨ onnen. Wir m¨ ochten also festlegen k¨ onnen, wo außen und innen ist. Bei einer geschlossenen Kugelfl¨ ache ist das klar, aber auch bei einem Blatt Papier wollen wir das festlegen. Wir k¨ onnen auch oben und unten sagen. Wir wollen also, mathematisch ausgedr¨ uckt, den Normalenvektor der Fl¨ ache festlegen. Er ergibt sich aus dem Kreuzprodukt der Tangentenvektoren in einem Punkt. Wenn wir die Reihenfolge der Tangentenvektoren umkehren, zeigt der Normalenvektor r¨ uckw¨ arts. Die Orientierung k¨ onnen wir also mit der Reihenfolge der Parameter u und v andern. Wir wollen diese Parameter so w¨ ahlen, dass ihr Kreuzprodukt mit der ¨ von uns gew¨ ahlten Normalenrichtung u ¨bereinstimmt. Zur Not muss man also die beiden Parameter vertauschen, das f¨ allt uns auch nicht schwer. Betrachten wir dagegen ein sog. M¨ obiusband. Zur Herstellung nehmen Sie einfach einen Streifen Papier, halten jedes Ende mit einer Hand fest, verdrehen ein Ende des Bandes um 180◦ und kleben ihn dann zu einem Ring zusammen. Das entstehende Gebilde ist ein M¨ obiusband. Wenn Sie auf diesem mit dem Finger langfahren, kommen Sie nach zwei Uml¨ aufen wieder am Ausgangspunkt an, haben aber den Rand nicht u berquert. Sie k¨ onnen auch am Rand langfahren ¨ und kommen ebenfalls nach zwei Uml¨ aufen wieder am Ausgangspunkt an. Das Band hat also merkw¨ urdigerweise nur eine Seite und nur einen Rand. Daher ist es nicht orientierbar. Wenn wir einen Normalenvektor irgendwo auf das Band stellen und lassen ihn das Band ablaufen, so kommen wir nach einem Umlauf genau auf die Gegenseite und unser Normalenvektor zeigt genau in die entgegengesetzte Richtung. Wir k¨ onnen solch ein Band daher nicht orientieren. Falls Sie meinen, dass Sie solch ein Band noch nicht gesehen haben, so schauen Sie doch mal bei sich rum. H¨ aufig hat man da Schl¨ usselb¨ ander oder Umh¨ angeb¨ ander bei Kongressen. Wenn Sie sich den Fortsatz, wo der Schl¨ ussel oder Ihre Visitenkarte dranh¨ angt, abgeschnitten denken, so ist der Rest ein M¨ obiusband. Wenn Sie ein solches Band um den Hals h¨ angen, dann verkn¨ ault es sich nicht so. Ihre Visitenkarte bleibt immer sch¨ on lesbar. Nun, so etwas wollen wir nicht betrachten. Falls Ihnen doch mal so ein Gebiet unterkommt, m¨ ussen Sie es in Teilgebiete unterteilen und die Teile einzeln betrachten. Geht doch auch, oder?
154
9 Ober߬ achenintegrale
Definition 9.3 Sei F ein orientierbares Fl¨ achenst¨ uck, gegeben durch F := {(x, y, z) ∈ R3 : (x = x(u, v), y = y(u, v), z = z(u, v)), (u, v) ∈ B}. (9.3) Dann sei auf F eine Funktion f ( x) gegeben. Dann nennen wir
!!
!!
:= f ( x) dF
xv (u, v)) dB f ( x) · ( xu (u, v) ×
F
(9.4)
B
Oberfl¨ achenintegral 2. Art. Dabei sind xu und xv die Tangentenvektoren, xu (u, v) × xv (u, v) der Normalenvektor, nach außen gerichtet. Dieses Integral beschreibt den Fluss einer str¨ omenden Fl¨ ussigkeit durch die Fl¨ ache F. Ist also f ( x) das Geschwindigkeitsfeld der Fl¨ ussigkeit, so gibt ++
f ( x) dF die durch F hindurchtretende Fl¨ ussigkeitsmenge an. Schon aus F der Anschauung erkennen wir: Wenn das Vektorfeld f ( x) senkrecht zum Normalenvektor xu (u, v)× xv (u, v) str¨ omt, also in Richtung der Tangentenvektoren, so ergibt sich Null oder n¨ uscht, wie die Sachsen sagen; denn dann ist das innere Produkt in (9.4) null. Beispiel 9.2 Wir berechnen den Fluss des Vektorfeldes f ( x) := (z, y, z + 1) durch die Oberfl¨ ache des Kegels K := {(x, y, z) : 0 ≤ z ≤ 2 −
x2 + y 2 }.
Dabei werde der Fluss von innen nach außen gemessen, wir m¨ ussen also w¨ ahrend der Rechnung stets die Richtung von n im Auge behalten.
x2 + y2 = 2 − z =⇒ x2 + y 2 = (2 − z)2 .
Das ist offensichtlich f¨ ur jedes z mit 0 ≤ z ≤ 2 ein Kreis mit dem Radius z − 2. Wenn wir von der (x, y)-Ebene, wo z = 0 ist, hochsteigen bis z = 2, wird dieser Radius immer kleiner. Ich hoffe, Sie sehen jetzt mit mir den Kegelmantel vor sich. Unser Bild zeigt ihn. Wir wollen die ganze Oberfl¨ ache dieses Kegels bedenken, dazu geh¨ ort auch der Kreis K in der (x, y)-Ebene als Grundkreis. Das bedeutet, die ganze Oberfl¨ ache besteht aus Oberfl¨ ache = Kegelmantel M + Grundkreis K.
9.2 Ober߬ achenintergale 2. Art
155 z
In der Aufgabenstellung haben wir bereits von einem Kegel gesprochen. K¨ onnen wir uns den vorstellen? Was ist also die Menge {(x, y, z) : z = 2− x2 + y 2 }? Mit dem Gleichheitszeichen betrachten wir nur den Mantel der Fl¨ ache. F¨ ur x = y = 0 ergibt sich z = 2. ¨ Uber dem Nullpunkt in der (x, y)-Ebene haben wir also den Wert z = 2. F¨ ur beliebiges x und y erhalten wir
2
2
2
Abb. 9.3
Der Kegel
Mit
x = (x, y, z) = (r cos α, r sin α, 2 − r) folgt
xr = (cos α, sin α, −1), xα = (−r sin α, r cos α, 0). Damit erhalten wir den Normalenvektor
⎛ ⎜
xr × xα = det ⎜ ⎝
⎞
e1
e2
cos α
sin α
e3
⎟ −1 ⎟ ⎠ −r sin α r cos α 0
= r cos2 α e3 + r sin α e2 + r sin2 α e3 + r cos α e1 = r cos α e1 + r sin α e2 + r e3 = (r cos α, r sin α, r). Mit diesen Polarkoordinaten gehen wir jetzt in den Integranden:
f ( x(r, α)) · ( xr × xα ) = (2 − r, r sin α, 2 − r + 1) (r cos α, r sin α, r) = r((2 − r) cos α + r sin2 α + 3 − r) = (2r − r2 ) cos α + r2 sin2 α + 3r − r2 . Damit folgt f¨ ur den Fluss durch den Mantel:
y
x
156
9 Oberfl¨ achenintegrale α 6 2π
Betrachten wir zun¨ achst den Kegelmantel M . Wir w¨ ahlen etwas ver¨ anderte Zylinderkoordinaten: x = r cos α,
B
y = r sin α, z = 2 − r, 0 ≤ r ≤ 2, 0 ≤ α ≤ 2π. Damit ist unser Parameterbereich das rechts stehende Rechteck. Abb. 9.4
!!
!
!
2
= f ( x) dM 0
M
2π
0
r
2
Parameterbereich B
[(2r − r2 ) cos α + r2 sin2 α + 3r − r2 ] dα dr
mit den festen Grenzen k¨ onnen wir Produkte bilden ! 2 ! 2π ! 2 ! 2π (2r − r 2 ) dr · cos α dα + r2 dr · sin2 α dα = 0
!
2
+
" =
0 2
0
(3r − r 2 ) dr ·
r3 2r − 2 3
!
#2
+
1 dα
#2π &2π " 3 # " sin 2α r α & − · sin α& + · 3 2 4 0 0 0
# 3 2
&2π r 3r 2 & − · α& 2 3 0 0
8− 83
=
0
0
0
"
0
2π
8 3
π
2π
28π . 3
Dieses war der erste Streich, jetzt kommt der zweite, n¨ amlich das Integral u ¨ber den Grundkreis K. Den parametrisieren wir wieder mit Polarkoordinaten, das bietet sich bei Kreisen geradezu an.
x = (r cos α, r sin α, 0), 0 ≤ r ≤ 2, 0 ≤ α ≤ 2π. Wir erhalten
9.2 Ober߬ achenintergale 2. Art
157
⎛
⎞
e1
e2
⎜
xr × xα = det ⎜ ⎝ cos α
e3
⎟ 0 ⎟ ⎠ = (0, 0, r). −r sin α r cos α 0 sin α
Aber Achtung, dieser Vektor zeigt vom Nullpunkt senkrecht nach oben, also ins Innere des Kegels. Wir hatten aber verabredet, dass Normalenvektoren bitte nach außen zu zeigen haben. Also werden wir das Vorzeichen ¨ andern und − xr ×
xα = (0, 0, −r) betrachten. Damit folgt f ( x)(r, α) · (− xr × xα ) = (0, r sin α, 1) · (0, 0, −r) = −r. Wir erhalten
!!
!
=− f ( x) dK
K
2 0
!
2π 0
r dα dr = −4π.
Damit ist der Gesamtfluss
!!
= 28π − 4π = 16π . f ( x) dF 3 3 F
158
9 Ober߬ achenintegrale
Zusammenstellung der Integrale gew¨ ohnliches Integral ! b f (x) dx a
vgl. Schule Doppelintegral ) ! b (! y2 (x) f (x, y) dB = f (x, y) dy dx
!!
a
B
y1 (x)
vgl. (7.2) S. 130 Dreifachintegral ) ! ! (! z2 (x,y) f (x, y, z) dV = f (x, y, z) dz dB
!!! V
B
z1 (x,y)
vgl. (8.1) S. 142 Kurvenintegral 1. Art ! b f ( x) ds := f (ϕ(t), ψ(t)) · |(ϕ (t), ψ (t))| dt
! κ
a
vgl. (6.2) S. 105 Kurvenintegral 2. Art ! b f ( x) · d x := f (ϕ(t), ψ(t)) · (ϕ (t), ψ (t)) dt
! κ
a
vgl. (6.5) S. 113
!! F
Oberfl¨ ! ! achenintegral 1. Art f ( x) dF := f ( x(u, v)) · | xu (u, v) × xv (u, v)| dB B
vgl. (9.2) S. 150
!! F
Ober߬ !a!chenintegral 2. Art
:= xv (u, v)) dB f ( x) dF f ( x) · ( xu (u, v) × B
vgl. (9.4) S. 154
9.2 Ober߬ achenintergale 2. Art
159
¨ Ubung 18 1. Sei F die Oberfl¨ ache der Einheitskugel F := {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1.} Sei f (x, y, z) := x2 + y2 + z 2 ,
n der Normaleneinheitsvektor an F.
Berechnen Sie das Integral !! F
grad f (x, y, z) · n dF.
2. Sei F die Oberfl¨ ache der Kugel vom Radius a > 0: F := {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = a2 ,
a > 0.}
Sei
v (x, y, z) := (x, y, z). Berechnen Sie den Fluss von v durch die Fl¨ ache F .
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
10 Integrals¨ atze
¨ Ubersicht 10.1 Divergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 10.2 Der Divergenzsatz von Gauß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 10.3 Der Satz von Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
In diesem Kapitel stellen wir Ihnen ganz großartige S¨ atze vor, die dazu auch noch enorme Bedeutung in der Praxis haben. Es sind S¨ atze, die Mathematikern ein Glitzern in die Augen treiben und Naturwissenschaftler zum Strahlen bringen. Lassen Sie sich u ¨berraschen.
10.1
Divergenz
Diesen Begriff werden wir erst nach dem ber¨ uhmten Satz von Gauß kommentieren. Hier erst mal die Definition. Definition 10.1 Sei f eine vektorwertige Funktion f ( x) = (f1 (x, y, z), f2 (x, y, z), f3 (x, y, z)). Dann verstehen wir unter der Divergenz von f den Ausdruck ∂f1 (x, y, z) ∂f2 (x, y, z) ∂f3 (x, y, z) div f ( x) = + + . ∂x ∂y ∂z Das ist zwar recht einfach, trotzdem hilft immer ein Beispiel. Beispiel 10.1 Sei √ f ( x) := (xy, x2 z, x z). Wir berechnen die Divergenz von f .
N. Herrmann, Mathematik für Naturwissenschaftler, DOI 10.1007/978-3-8274-2867-7_10, © Spektrum Akademischer Verlag Heidelberg 2012
(10.1)
162
10 Integrals¨ atze
x x div f ( x) = y + 0 + √ = √ + y. 2 z 2 z
10.2
Der Divergenzsatz von Gauß
Dieser Begriff Divergenz‘ spielt die zentrale Rolle im Satz von Gauß. ’ Satz 10.1 (Divergenzsatz von Gauß) anktes Gebiet mit st¨ uckweise glatter und orientierbarer Sei V ∈ R3 ein beschr¨
Randfl¨ ache ∂V . Sei f stetig differenzierbar. n sei der nach außen gerichtete Normaleneinheitsvektor auf F = ∂V . Dann gilt
!!!
!! div f ( x) dV = F
V
f ( x) · n dF.
(10.2)
Das ist also der große Divergenzsatz. Rechts das Integral beschreibt den Fluss durch die Oberfl¨ ache ∂V des K¨ orpers V . Wenn jetzt links im Integral die Divergenz positiv ist, so ist auch das Integral rechts positiv, es fließt also etwas aus der Fl¨ ache heraus. Ist dagegen die Divergenz links negativ, so wird Fl¨ ussigkeit verschluckt. Im ersten Fall ist also innerhalb V eine Quelle, im zweiten Fall nennt man es eine Senke. Die Divergenz beschreibt also, ob Quellen oder Senken in einem Gebiet liegen. Die Voraussetzungen des Satzes sollten uns nicht so sehr unruhig machen. Mit der Divergenz wollen wir ja partielle Ableitungen bilden, also m¨ ussen wir den Integranden als stetig differenzierbar voraussetzen. Damit wir rechts das Oberfl¨ achenintegral u onnen, darf diese Oberfl¨ ache nur st¨ uckweise nicht ¨berall bilden k¨ glatt sein. Mit diesen Voraussetzungen k¨ onnen wir dann die schwierige Berechnung eines Oberfl¨ achenintegrals auf die hoffentlich leichtere Aufgabe der Berechnung eines Volumenintegrals zur¨ uckf¨ uhren. Am besten ist dazu ein Beispiel. Beispiel 10.2 F¨ ur das Vektorfeld f (x, y, z) := (xy, yz, x) und den Rand F des Gebietes G := {(x, y, z) ∈ R3 : x2 + y 2 < z, 0 < z < 1} m¨ ochten wir gerne das Integral
!! F
berechnen.
f (x, y, z) · n dF
10.2 Der Divergenzsatz von Gauß
163
Zur Veranschaulichung des Gebietes G betrachten wir die Menge {(x, y, z) ∈ R3 : x2 + y 2 = z, 0 < z < 1}. F¨ ur jedes z ∈ (0, 1) ist das ein schlichter Kreis parallel zur x-y-Ebene mit Radius √ z. Setzen wir x = 0 und betrachten z = y 2 , so ist das eine Parabel, analog ist f¨ ur y = 0 auch z = x2 eine Parabel. Das Ganze ist also ein nach oben offenes Paraboloid. Ein Bildchen finden Sie auf Seite 61. Das gesuchte Oberfl¨ achenintegral 2. Art ist schwierig zu berechnen. Wegen des hervorragenden Satzes von Gauß k¨ onnen wir uns aber auf die Berechnung des Volumenintegrals u anken. Dazu brauchen wir die ¨ber das ganze Gebiet G beschr¨ Divergenz des Vektorfeldes. div f (x, y, z) = y + z + 0 = y + z. Zur Berechnung des Volumenintegrals benutzen wir unsere guten alten Polarkoordinaten x = r cos α, y = r sin α, z = z, 0 ≤ α ≤ 2π.
!! F
! f · n dF =
1
!! (y + z) dx dy dz
0
!
1
!
x2 +y 2 ≤z √ 2π ! z
= 0
0
0
(r sin α + z) · r dr dα dz
hier ist r die Funktionaldet. der Polarkoord.√ ! 1 ! 2π ! √z ! 1 ! 2π ! z = r2 sin α dr dα dz + r · z dr dα dz 0
! = = =
= =
0
!
0 3
0
0
0
! 1 ! 2π &√z &√ r2 & z r & sin α& , dα dz + z · & , dα dz 3 2 0 0 0 0 0 0 ! 1 ! 2π √ 3 ! 1 ! 2π z z·z sin α dα dz + dα dz 3 2 0 0 0 0 ! 1√ 3 ! 1 2 &2π z z & (− cos α)& dz + · 2π dz 3 2 0 0 0
=0
also =0 & z 3 &1 π & 3 0 π . 3 1
2π
Zum Schluss der Hinweis, dass echte Typen diesen Satz nat¨ urlich auswendig kennen. Der Autor hat ihn seinerzeit w¨ ahrend der Expo in Hannover im deutschen Pavillon an eine dort f¨ ur Bemerkungen (Ohh, wie toll hier!) aufgeh¨ angte
164
10 Integrals¨ atze
Tafel geschrieben. Tats¨ achlich ist mir, ich weiß nicht mehr, wann, auf der Straße eine junge Frau entgegen gekommen, die hatte die Formel (10.2) auf ihrem T-Shirt stehen. Mir ist fast die Spucke weg geblieben. Hier ein kleiner Hinweis, wie man sich die Formel merken kann. Da steht links ein dreifaches Integral, nat¨ urlich u ¨ber einem Volumen V , und rechts ein Oberfl¨ achenintegral, nat¨ urlich u origen Oberfl¨ ache ∂V . Gleichheit u ¨ber der zugeh¨ ¨ber verschiedene Dimensionen ist ungew¨ ohnlich. Aber bei dem Volumenintegral steht der Ableitungsoperator div. So quasi wird damit ein Integral aufgehoben. Und so macht das Ganze Sinn. Merke: dreifaches Integral aufheben mit div. Dass rechts noch der Normalenvektor steht, ist nicht verwunderlich, denn dieses Integral gibt ja den Fluss durch die Oberfl¨ ache an, da braucht man schon die Richtung des Flusses.
10.3
Der Satz von Stokes
Hier schildern wir Ihnen den zweiten ber¨ uhmten Integralsatz, den Satz von Stokes. Er sieht sehr analog zum Gaußschen Divergenzsatz aus, aber kleine Unterschiede sind zu beachten. Satz 10.2 (Satz von Stokes) Sei F ∈ R3 ein st¨ uckweise glattes orientierbares Fl¨ achenst¨ uck im R3 mit st¨ uckweise glatter orientierbarer Randkurve κ. Sei f eine vektorwertige stetig alt, und sei n differenzierbare Funktion auf einem Gebiet G ∈ R3 , das F enth¨ der Normaleneinheitsvektor auf F . Seine Richtung kann frei gew¨ ahlt werden. Die Orientierung der Randkurve κ, gegeben durch die Tangente t, von F ist nach Festlegung von n so zu w¨ ahlen, dass ein Mensch, dessen K¨ orper in Richtung von
n auf κ steht, beim Vorw¨ artsschreiten in Richtung von t das Fl¨ achenst¨ uck zur Linken hat. Dann gilt
!!
!
F
= rot f (x, y, z) · dF
f (x, y, z) · d x
(10.3)
f (x, y, z) · t ds.
(10.4)
κ
bzw.
!! F
! rot f (x, y, z) · n dF = κ
Wir sehen, dass auch hier ein Dimensionssprung stattfindet. Links ein (zweidimensionales) Oberfl¨ achenintegral, rechts ein (eindimensionales) Kurvenintegral. Und auch hier die kleine Merkregel, dass ja der Operator rot ein Differentialoperator ist und quasi eine Integration aufhebt. Darum steht er links. Und klar, beim Oberfl¨ achenintegral steht die Normale, beim Kurvenintegral die Tangente.
10.3 Der Satz von Stokes
165
Zum besseren Verst¨ andnis wieder ein Beispiel. Wir w¨ ahlen es so, dass wir den Satz von Stokes u ufen, d.h. wir geben uns alle Einzelheiten vor und rechnen ¨berpr¨ dann beide Seiten der Formel aus, um zu verifizieren, dass der Satz zumindest in diesem Beispiel stimmt. Das ist nat¨ urlich kein Beweis. Wir wollen lediglich u ¨ben. Beispiel 10.3 Sei f (x, y, z) := (4y, −4x, 3) und F die Kreisscheibe mit Radius 1 und Mittelpunkt (0, 0, 1) in der Ebene z = 1. Wir verifizieren den Satz von Stokes. Wir berechnen die linke Seite von Gleichung (10.4):
⎛ ⎜ rot f (x, y, z) = det ⎜ ⎝
⎞
e1
e2
e3
∂ ∂x
∂ ∂y
∂ ∂z
⎟ ⎟ ⎠
4y −4x 3 = 0 · e1 − 4 · e3 + 0 · e2 − 4 · e3 + 0 e1 + 0 · e2 = (0, 0, −8). Den Normaleneinheitsvektor entnehmen wir der Anschauung. Die Kreisscheibe liegt in der Ebene z = 1, ist also parallel zur x-y-Ebene. Senkrecht dazu steht der Vektor
n = (0, 0, 1)
= (0, 0, −1) w¨ahlen k¨onnen. Wir und ist normiert. Wir h¨ atten auch den Vektor n m¨ ussen jetzt nur bei der Randkurve aufpassen, dass wir sie passend orientieren. Dann ist rot f · n = (0, 0, −8) · (0, 0, 1) = −8. Damit folgt
!! F
!! rot f · n dF = −8 ·
F
dF = −8 π,
weil die Kreisfl¨ ache den Inhalt π · r2 hat und r = 1 ist. Das war es schon. Jetzt flugs zur rechten Seite. Die Randkurve κ ist ja die Kreislinie. Zur Integration greifen wir wieder auf die Polarkoordinaten zur¨ uck: x = cos t, y = sin t, z = 1, 0 ≤ t ≤ 2π.
166
10 Integrals¨ atze
Wie ist das mit der Orientierung? Wir starten f¨ ur t = 0 mit dem Punkt (1, 0, 1). Wenn wir jetzt von oben auf die Kreisscheibe in der Ebene z = 1 herabschauen, so sehen wir, dass wir mit wachsendem t die Kreislinie im Gegenuhrzeigersinn umlaufen. Stellen wir uns auf den Anfangspunkt in Richtung der von uns gew¨ ahlten Normalen n und laufen im Gegenuhrzeigersinn um den Kreis herum, so bleibt dieser immer links von uns. Das passt zusammen. Jetzt nur noch rechnen.
f (x, y, z) = (4 sin t, −4 cos t, 3)
!
d x = (− sin t dt, cos t dt, 0) ! 2π [4 sin t (− sin t) − 4 cos t cos t] dt f · d x = 0
κ
!
2π
= 0
= −4
−4(sin2 t + cos2 t) dt
!
2π 0
dt = −8 π.
Und das stimmt genau mit der linken Seite u ar’ ja auch noch sch¨ oner! ¨berein. W¨ Gestatten Sie mir noch zwei kleine Bemerkungen zu den Integrals¨ atzen. 1. Wir fassen noch einmal kurz die wesentlichen Inhalte beider Integrals¨ atze zusammen. a) Gauß betrachtet ein Volumen, also einen K¨ orper oder so etwas, und dessen Oberfl¨ ache. Dann liefert uns der Satz einen Zusammenhang zwischen dem Dreifachintegral u orper und dem Oberfl¨ achenintegral u ¨ber dem K¨ ¨ber die gesamte Oberfl¨ ache. Benutzt wird er vor allem dazu, das komplizierte Oberfl¨ achenintegral mittels des leichter zu berechnenden Raumintegrals auszuwerten. Man muss ja nur die Divergenz des Vektorfeldes berechnen. b) Stokes bietet eine andere Welt. Betrachtet wird ein Fl¨ achenst¨ uck und seine Randkurve. Dieser Satz liefert den Zusammenhang zwischen dem Oberfl¨ achenintegral u ache und dem Kurvenintegral u ¨ber die Fl¨ ¨ber die Randkurve. H¨ aufig l¨ asst sich so das komplizierte Oberfl¨ achenintegral mit dem leichter zu berechnenden Randintegral knacken. 2. Das folgende Beispiel sei als Warnung angef¨ ugt. Es sieht aus wie ein Gegenbeispiel zum Satz von Stokes. Beispiel 10.4 Gegeben sei das Vektorfeld
v (x, y, z) =
−y x , 2 ,z 2 2 x + y x + y2
10.3 Der Satz von Stokes
167 z
y
x
Abb. 10.1
Der Torus mit ganz im Innern verlaufendem Band
und der Torus D, den man dadurch erh¨ alt, dass der Kreis (x − 2)2 + z 2 ≤ 1, y = 0 um die z-Achse rotiert. In Beispiel 6.8 (vgl. S. 125) hatten wir gesehen, dass in D gilt: rot v = 0, aber
*
v d x = 0, k
asst sich daraus kein wobei k der Kreis x2 + y 2 = 4, z = 0 ist. Warum l¨ Gegenbeispiel zum Satz von Stokes konstruieren? Die Aufgabe liefert nat¨ urlich kein Gegenbeispiel zum Satz von Stokes, wo das Fl¨ achenintegral u ¨ber die Rotation des Vektorfeldes ja wegen der Rotationsfreiheit den Wert Null lieferte, wohingegen das Kurvenintegral einen Wert ungleich Null hat. Der erste Gedanke k¨ onnte sein, dass unser betrachtetes Gebiet, der Torus, wahrlich nicht einfach zusammenh¨ angt. Aber Vorsicht, so einfache Gedanken haben manchmal einen Haken. Im Satz von Stokes haben wir nirgendwo verlangt, dass unser Gebiet einfach zusammenh¨ angen m¨ oge. War das ein Fehler? Das k¨ onnten Sie mir aber schrecklich vorwerfen – und ich w¨ urde mich sch¨ amen. Nein, so einfach ist das nicht! Dieser Satz setzt ein Integral u achenst¨ uck in Beziehung zu einem ¨ber ein Fl¨ Integral u achenst¨ ucks. Hier kneift die Sa¨ber die gesamte Randkurve des Fl¨ che. Als Fl¨ achenst¨ uck im Torus bietet sich ein geschlossenes Band an, das ganz im Torus verl¨ auft. Dieses hat aber neben der betrachteten Kurve k noch eine zweite Randkurve. Zur Anwendung des Stokesschen Satzes muss
168
10 Integrals¨ atze
also noch ein zweites Randintegral betrachtet werden. Wegen der Orientierungsvorschrift ist diese Randkurve entgegengesetzt zur ersten Randkurve zu orientieren. Somit erg¨ abe das Integral u ¨ber diese Randkurve den negativen Wert zum ersten Integral, die Summe w¨ urde also verschwinden in guter ¨ Ubereinstimmung mit der Rotationsfreiheit und dem Satz von Stokes. Ein Fl¨ achenst¨ uck, das nur den in der Aufgabe erw¨ ahnten Kreis als Randkurve besitzt, w¨ are zum Beispiel eine Halbkugel. Wegen der Singularit¨ at der gesamten z-Achse f¨ ur das betrachtete Vektorfeld mussten wir aber den Torus betrachten. Eine Halbkugel, bei der die Symmetrieachse die z-Achse ist, kann nicht in den Torus eingebracht werden. Bitte packen Sie in Ihr Ged¨ achtnis, dass das Gebiet im Satz von Stokes nicht einfach zusammen h¨ angen muss.
10.3 Der Satz von Stokes
169
¨ Ubung 19 1. Sei V ∈ R3 der Einheitsw¨ urfel V := {(x, y, z) ∈ R3 : 0 ≤ x, y, z ≤ 1.} Verifizieren Sie f¨ ur
v (x, y, z) := (4xz, −y 2 , yz) den Gaußschen Divergenzsatz. 2. Verifizieren Sie den Divergenzsatz von Gauß f¨ ur folgende Funktion:
v (x, y, z) := (4x, −2y 2 , z 2 ) auf V := {(x, y, z) ∈ R3 : x2 + y 2 ≤ 4, 0 ≤ z ≤ 3.} 3. Verifizieren Sie den Satz von Stokes f¨ ur die Funktion f (x, y, z) := (2 x − y, −y z 2 , −y 2 z. Dabei sei F die obere Halbkugelfl¨ ache mit Radius R > 0 um den Nullpunkt und n der nach außen gerichtete Normaleneinheitsvektor. Außen seien dabei alle Punkte des R3 mit z > 0, deren Abstand von (0, 0, 0) gr¨ oßer als R ist. [Hinweis: Die Berechnung des Oberfl¨ achenintegrals muss nicht zu Ende gef¨ uhrt werden.] 4. Berechnen Sie unter geschickter Ausnutzung des Satzes von Stokes das Oberfl¨ achenintegral !! rot f (x, y, z) · n dF. F
Dabei sei f (x, y, z) := (3 y, −x z, y z 2 ) und F das nach oben ge¨ offnete Paraboloid F := {(x, y, z) ∈ R3 : 2z = x2 + y 2 , beschr¨ ankt durch Z = 2} und n sei der nach außen gerichtete Normaleneinheitsvektor.
Ausf¨ uhrliche L¨ osungen: www.spektrum-verlag.de/978-3-8274-2866-0
11 Interpolation mit Splines
¨ Ubersicht 11.1 11.2 11.3 11.4 11.5
Einf¨ uhrendes Existenz und Interpolation Interpolation Interpolation
Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eindeutigkeit der Polynominterpolation . . . . . . . . . . . . . mit linearen Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . mit Hermite-Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . mit kubischen Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
172 173 176 183 189
Oft schon sind Studierende zu mir gekommen mit dem Problem: Sie haben durch ein Experiment viele, manchmal wirklich sehr viele Daten erhalten und sollen diese nun auswerten. Am besten geht das, wenn man statt der Daten eine Kurve vorliegen hat. Aber woher die Kurve nehmen? Schließlich liegen nur furchtbar viele Punkte vor uns. Eine einfach zu beschreibende Idee haben wir schon in der Schule kennen gelernt. Wir legen durch zwei Punte eine Gerade, durch drei Punkte eine Parabel usw. Allgemein suchen wir ein Polynom n-ten Grades, das durch n+1 Punkte hindurchgeht. Diese Aufgabe heißt Interpolation mit Polynomen. Wir werden uns aber schnell u ur ¨berlegen, dass diese Methode f¨ die Praxis g¨ anzlich ungeeignet ist. In diesem Kapitel wollen wir eine Methode zur Interpolation kennenlernen, die aus dem Schiffbau stammt. Dort wurden schon in alten Zeiten feststehende Pfl¨ ocke benutzt, um Seitenw¨ ande f¨ ur Boote zu bauen. Die einzuspannenden Latten heißen Straklatten, englisch Splines. Daran orientieren wir uns, der Name Strakfunktion, urspr¨ unglich mal vorgeschlagen, hat sich nicht durchgesetzt. Heute sprechen wir von einer Spline-Funktion oder kurz einem Spline.
N. Herrmann, Mathematik für Naturwissenschaftler, DOI 10.1007/978-3-8274-2867-7_11, © Spektrum Akademischer Verlag Heidelberg 2012
172
11.1
11 Interpolation mit Splines
Einf¨ uhrendes Beispiel
Hier sehen wir ein Blatt, auf dem die Daten eines sozusagen jungfr¨ aulichen Magneten aufgezeichnet sind. Magnetisches Material zeigt im Urzustand keine magnetische Außenwirkung. Die sogenannten Elementarmagnete liegen fr¨ ohlich durcheinander. Erst wenn man ein ¨ außeres Magnetfeld anlegt, richten sich die Weißschen Bezirke nacheinander in Richtung des ¨ außeren Feldes und es entsteht die magnetische Wirkung.
Unten am Rand stehen die Messdaten der sog. Neukurve. Diese Neukurve ist f¨ ur die Herstellung wichtig. Ein Student, der mir diese Daten brachte, hatte sich viel M¨ uhe gegeben, hier eine Kurve zu erkennen. Er versuchte es mit einer Arctan-Funktion. Viel Versuche hat es ihn gekostet, bis er mit dieser Funktion ankam: f (x) = 1.14296 · arctan 1.91714x + 0.0126213x. Wir zeigen das Ergebnis an den folgenden Bildern.
11.2 Existenz und Eindeutigkeit der Polynominterpolation
173
3 2.5 2 •• • • • •• 1 • •
••
•
•
•
•
•
1.5
0.5 • • • • 0 0
10
20
30
40
50
60
Abb. 11.1 Die Messpunkte der Neukurve und Versuch mit der Arctan-Funktion f (x) = 1.14296 · arctan 1.91714x + 0.0126213x
Gerade im Bereich um 50 herum sehen wir, dass die Arctan-Funktion weiter ansteigt, w¨ ahrend die Messdaten sich abflachen. Ein weiterer Unterschied zeigt sich, wenn wir uns die Daten um Null herum genauer anschauen. Schauen Sie sich das Zoom-Bild auf der n¨ achsten Seite an. Die Neukurve macht gerade am Anfang einen Schlenker nach rechts und dann weiter nach oben, die Arctan-Funktion steigt gleich direkt nach oben. Besonders dieser Anfang war f¨ ur den Studenten sehr wichtig. Da half also Arctan nicht wirklich. Am besten w¨ are eine Interpolation der Punkte, aber mit Polynomen kann das hier nicht klappen. Wir werden am Schluss dieses Kapitels die L¨ osung verraten.
11.2
Existenz und Eindeutigkeit der Polynominterpolation
Bei der Differenzierbarkeit hatten wir schon einmal das Problem, eine vorgegebene Funktion durch ein Polynom zu ersetzen. Damals half uns die Taylorentwicklung. Half sie uns wirklich? Nur in einer kleinen Umgebung konnten wir zu einer unendlich oft differenzierbaren Funktion ein approximierendes Polynom angeben. Das hilft nicht wirklich. Approximieren ist schon nicht unser Ziel und
174
11 Interpolation mit Splines
2
1.5
• •
•
1
••
•
•
•
•
4
5
•
•
0.5
0
• •
0
•
•
1
2
3
Abb. 11.2 Eine Vergr¨ oßerung, also ein Zoom in der N¨ ahe des Nullpunktes. Hier sieht man, dass die Arctan-Funktion nicht optimal approximiert
in einer kleinen Umgebung erst recht nicht. Und das Ganze nur f¨ ur unendlich oft differenzierbare Funktionen, das geht in der Praxis gar nicht. Unser erstes Ziel ist zu interpolieren. Das haben wir in der Schule ge¨ ubt und ging so. Beispiel 11.1 Wir betrachten die Punkte (0, 0) und (1, 1) in der Ebene und suchen eine m¨ oglichst einfache Funktion, die durch diese beiden Punkte hindurch geht. Klar, das ist die Gerade y(x) = x, also die erste Winkelhalbierende. Das formulieren wir allgemeiner. Definition 11.1 (Interpolationsaufgabe) Gegeben seien im R2 die Punkte P0 = (x0 , y0 ), P1 = (x1 , y1 ), . . . , PN = (xN , yN ), x0 < x1 < · · · < xN . Gesucht ist ein Polynom p(x) mit grad p(x) ≤ N , das diese Punkte interpoliert, f¨ ur das also gilt: p(xi ) = yi , i = 0, 1, . . . , N. Beachten Sie bitte zwei Kleinigkeiten in dieser Definition.
11.2 Existenz und Eindeutigkeit der Polynominterpolation
175
1. Wir benennen den letzten Punkt mit N , damit wir nicht mit n durcheinander kommen; denn n wird in fast allen B¨ uchern als Dimension des zugrunde liegenden Raums verwendet, hier also in der Ebene ist n = 2. 2. Wir beginnen bei der Nummerierung der Punkte mit 0. Dadurch haben wir, bitte z¨ ahlen Sie das nach, N + 1 Punkte gegeben. Achtung jetzt, bei zwei gegebenen Punkten reicht eine Gerade, also Polynom vom Grad ≤ 1, bei drei Punkten eine Parabel, also Polynom vom Grad ≤ 2, usw. Bei N + 1 gegebenen Punkten suchen wir deshalb ein Polynom vom Grad ≤ N . Das ist so sch¨ on einfach. Wenn Sie stattdessen die Z¨ ahlerei bei 1 beg¨ annen, h¨ atten Sie nur N Punkte und m¨ ussten ein Polynom vom Grad ≤ N − 1 suchen, wie unangenehm. Der folgende Satz ist so h¨ ubsch einfach zu beweisen, dass wir das unbedingt vorf¨ uhren wollen. Satz 11.1 (Eindeutigkeit) Es gibt h¨ ochstens ein Polynom mit grad ≤ N , das obige Interpolationsaufgabe l¨ ost. Beweis: Nehmen wir an, wir h¨ atten zwei Polynome p(x) und q(x), beide vom grad ≤ N , die die Aufgabe l¨ osen, also mit p(xi ) = yi ,
q(xi ) = yi , 0 ≤ i ≤ N.
(11.1)
Dann kommen wir mit einem Trick, wir betrachten die Differenz r(x) := p(x) − q(x). Als Differenz zweier Polynome mit grad ≤ N ist r(x) nat¨ urlich wieder ein Polynom mit grad r(x) ≤ N . Beachten Sie das ≤‘. Das m¨ ussen wir sehr ernst ’ nehmen. Wegen (11.1) haben wir dann aber r(x0 ) = r(x1 ) = · · · = r(xN ) = 0.
(11.2)
Das sind N + 1 Nullstellen f¨ ur das Polynom r(x), das aber nur einen Grad ≤ N hat. Als Folgerung aus dem Fundamentalsatz der Algebra ergibt sich aber, dass ein Polynom mit grad ≤ N h¨ ochstens N Nullstellen haben kann. Widerspruch? Nein, denn im Fundamentalsatz gibt es die Einschr¨ ankung, dass wir nur Polynome vom Grad ≥ 1 betrachten. Die einzige Chance, nicht zu einem Widerspruch zu kommen: r(x) muss das Nullpolynom sein. Das hat n¨ amlich unendlich viele Nullstellen. Aus r(x) = 0 f¨ ur alle x folgt aber p(x) = q(x) f¨ ur alle x. Es gibt also h¨ ochstens ein solches Polynom.
176
11 Interpolation mit Splines
¨ Mit dieser niedlichen Uberlegung haben wir also die Eindeutigkeit. Die Existenz k¨ onnten wir im Prinzip jetzt dadurch beweisen, dass wir einfach f¨ ur beliebige N + 1 Punkte ein solches Polynom angeben. Dazu haben sich ber¨ uhmte Leute wie Lagrange, Newton, Hermite u.a. viele Verfahren einfallen lassen. Mit ihrer Hilfe w¨ are also leicht ein Existenznachweis konstruktiv zu f¨ uhren. Wir lassen das lieber, weil es in der Praxis sowieso nicht funktioniert, wie wir gleich unten erl¨ autern, zitieren aber den zugeh¨ origen Satz, wobei wir eine kleine Einschr¨ ankung an die St¨ utzstellen beachten m¨ ussen. Satz 11.2 (Existenz) Zu vorgegebenen Punkten P0 = (x0 , y0 ), P1 = (x1 , y1 ), . . . , PN = (xN , yN ) mit xi = xj , i, j = 1, . . . , N, i = j gibt es stets ein Polynom p(x) mit grad p(x) ≤ N , das die Interpolationsaufgabe aus Definition 11.1 l¨ ost. Diese Bedingung xi = xj bedeutet, dass zwei Punkte nicht u ¨bereinander liegen d¨ urfen. Na, das h¨ atten wir sowieso nicht gewollt. Nach dieser im Prinzip guten Nachricht kommt jetzt aber der Pferdefuß. Wenn Sie schon mal tausend Punkte gegeben haben, wollen Sie doch nicht ernsthaft mit einem Polynom mit grad ≤ 999 arbeiten, oder? Sie k¨ onnen sich sicher vorstellen, was das f¨ ur ein Unget¨ um w¨ are. V¨ ollig ausgeschlossen. Ganz abgesehen davon, dass dieses Ding vielleicht 999 Nullstellen haben k¨ onnte. Das schwingt dann hin und her, total unbrauchbar. Zum Gl¨ uck k¨ onnen wir das viel besser.
11.3
Interpolation mit linearen Splines
Die erste Idee klingt geradezu primitiv. Wir verbinden die gegebenen Punkte einfach durch Geradenst¨ ucke. Viele, vor allem a ¨ltere Plot-Programm nutzen diese Idee. Wenn wir solch einen Plot nur etwas vergr¨ oßern, sehen wir, dass dort die Kurve‘ im wesentlichen aus kleinen Geradenst¨ ucken besteht. ’ Wir betrachten eine fest vorgegebene St¨ utzstellenmenge x 0 < x1 < · · · < x N ,
(11.3)
auf die wir im weiteren unsere Aussagen beziehen, ohne dies jedesmal ausdr¨ ucklich zu erw¨ ahnen. Definition 11.2 Unter dem Vektorraum der linearen Splines verstehen wir die Menge S10 := {L ∈ C[x0 , xN ] : L|[xi ,xi+1 ] ∈ P1 , i = 0, . . . , N − 1} Hier m¨ ussen wir einige Erl¨ auterungen hinzuf¨ ugen.
(11.4)
11.3 Interpolation mit linearen Splines
177
1. Dass es sich bei dieser Menge um einen Vektorraum handelt, ist nicht schwer zu erkennen. Da es uns hier nicht weiter f¨ uhrt, verweisen wir auf weitere Literatur, z.B. (11). 2. Die Definition besteht im wesentlichen aus zwei Bedingungen. a) Globale Bedingung: Die Funktionen L ∈ C[x0 , xN ] sind im ganzen Inter¯ vall [x0 , xN ] stetig. Das ist also eine globale Eigenschaft, die wir verlangen. Stetige Funktionen auf einem Intervall (a, b) bezeichnen wir ja mit C(a, b) oder zur Unterscheidung von den Funktionen C 1 (a, b), deren erste Ableitung noch stetig sein m¨ oge, mit C 0 (a, b); daher kommt also die 0 hochgestellte 0 in S1 . b) Lokale Bedingung: In jedem der Teilintervalle seien die Funktionen L ∈ P1 , also Polynome mit grad L ≤ 1; dort sind es also lineare Funktionen oder Geraden. Und das ergibt den unteren Index 1 in S10 . Wir fassen das wegen der Wichtigkeit und wegen vieler Fehler, die der Autor in Pr¨ ufungen immer wieder geh¨ ort hat, zusammen: Lineare Splines sind (bei vorgegebenen St¨ utzstellen) Funktionen, die auf dem gesamten Intervall stetig und in jedem Teilintervall Polynome h¨ ochstens ersten Grades sind. Splines sind also keine Polynome. Man darf h¨ ochstens sagen, dass es st¨ uckweise Polynome sind. Das Wort st¨ uckweise‘ ist dabei sehr ’ wichtig. Dies ist das typische Verhalten der Splines. Global, also im Gesamtintervall [x0 , xN ], geh¨ oren sie zu einer Stetigkeitsklasse. Das ist nur interessant an den inneren St¨ utzstellen, wo zwei Teile der Funktion zusammenkommen. Lokal sind es Polynome von einem gewissen Grad. Dieser Grad ist festgew¨ ahlt und steigt nicht mit der Zahl der St¨ utzstellen an, wie es ja bei der Polynominterpolation so schrecklich passiert. Er kann nat¨ urlich bei geeigneten St¨ utzstellen kleiner werden. Wenn zwei Punkte gleichen y-Wert haben, ist das verbindende Geradenst¨ uck nat¨ urlich parallel zur x-Achse, also ein Polynom mit grad 0. Definition 11.3 (Interpolationsaufgabe mit linearen Splines) Gegeben seien die St¨ utzstellen x0 < x1 < · · · < xN ,
(11.5)
und an jeder Stelle ein Wert yi , i = 0, . . . , N , der vielleicht der Funktionswert einer gesuchten Funktion ist. Gesucht ist dann eine lineare Spline-Funktion L(x) ∈ S10 , die diese Werte interpoliert, f¨ ur die also gilt: L(xi ) = yi ,
i = 0, . . . , N
(11.6)
178
11 Interpolation mit Splines
In jedem Teilintervall sind damit zwei Werte vorgegeben. Allein schon die Anschauung sagt uns, dass damit die Aufgabe genau eine L¨ osung hat. Wir halten dieses einfache Ergebnis in einem Satz fest, um den Aufbau dieses Abschnittes in den n¨ achsten Abschnitten u onnen. ¨bernehmen zu k¨ Satz 11.3 Die Aufgabe 11.3 hat genau eine L¨ osung. Mit der aus der 8. Klasse bekannten Zwei-Punkte-Form ist diese Aussage sofort einsichtig. Da eine Gerade zwei Unbekannte besitzt, f¨ uhrt diese Zwei-PunkteForm in jedem Intervall zu einem kleinen linearen (2 ×2)-Gleichungssystem. Um uns die Arbeit zu vereinfachen, w¨ ahlen wir einen etwas geschickteren Ansatz, so dass wir ohne LGS auskommen. Das werden wir in den n¨ achsten Abschnitten sogar noch verbessern k¨ onnen. Konstruktion linearer Splines Die Konstruktion der interpolierenden linearen Splines L(x) geschieht u ¨ber den Ansatz ⎧ ⎪ a0 + b0 (x − x0 ) f¨ ur x ∈ [x0 , x1 ) ⎪ ⎪ ⎪ ⎪ ⎨ f¨ ur x ∈ [x1 , x2 ) a1 + b1 (x − x1 ) L(x) = (11.7) .. .. . ⎪ .. ⎪ . . ⎪ ⎪ ⎪ ⎩ ur x ∈ [xN −1 , xN ) aN −1 + bN −1 (x − xN −1 ) f¨ Man sieht unmittelbar ai = y i ,
i = 0, . . . , N − 1.
(11.8)
Die anderen Koeffizienten erh¨ alt man dann aus ai + bi (xi+1 − xi ) = yi+1 ,
i = 0, . . . , N − 1.
(11.9)
Wir k¨ onnen also die unbekannten ai und bi sofort aus den Vorgabedaten ausrechnen. Um es genau zu durchschauen, betrachten wir ein kleines Beispiel. Beispiel 11.2 Wir suchen einen linearen Spline L(x), der die Punkte P0 (x0 , y0 ) = (1, 1), P1 (x1 , y1 ) = (2, 4), P2 (x2 , y2 ) = (4, −1) interpoliert. Wir w¨ ahlen den Ansatz
11.3 Interpolation mit linearen Splines
L(x) =
179
a0 + b0 (x − x0 ) f¨ ur x ∈ [1, 2) ur x ∈ [2, 4) a1 + b1 (x − x1 ) f¨
Jetzt berechnen wir in jedem der beiden Teilintervalle die Gerade. 4−1 0 In [1, 2) ist a0 = y0 = 1, b0 = xy11 −y −x0 = 2−1 = 3. y2 −y1 5 In [2, 3) ist a1 = y1 = 4, b1 = x2 −x1 = −1−4 4−2 = − 2 . Also ist
L(x) =
1 + 3(x − 1) f¨ ur x ∈ [1, 2) ur x ∈ [2, 4) 4 − 52 (x − 2) f¨
Hier sehen wir die typische Antwort, wenn wir nach einem interpolierenden Spline fragen. F¨ ur jedes der beteiligten Teilintervalle erhalten wir ein eigenes Polynom. Klar, bei tausend gegebenen Punkten ist das eine lange Liste. Niemand will so etwas mit Hand auswerten, aber daf¨ ur haben wr ja unsere Knechte, die Computer, die das leicht f¨ ur uns erledigen. Machen wir noch schnell die Probe: L(1) = 1, L(2) = 4, L(4) = −1. Sieht alles gut und richtig aus. Die zugeh¨ orige st¨ uckweise lineare Funktion, die diese Werte interpoliert, haben wir unten dargestellt. y 6
P1 = (2, 4) ×
4 3 2 1
× P0 = (1, 1)
1
2
4
3
× P2 = (4, −1) Abb. 11.3 Drei Vorgabepunkte und linearer Spline
x
180
11 Interpolation mit Splines
Wie gut sind die linearen Splines? Dieser Abschnitt bringt uns eine ganz erstaunliche Sicht auf die so simplen linearen Splines. Wir denken uns eine gewisse Funktion f gegeben, von der wir aber leider nur ein paar St¨ utzstellen kennen, und berechnen f¨ ur diese unseren linearen Spline. Den Abstand der St¨ utzstellen nennen wir h. Wenn nicht alle Abst¨ ande gleich sind, nennen wir den gr¨ oßten Abstand h. Jetzt verkleinern wir diesen Abstand z.B. durch Halbieren. Dadurch verdoppeln wir quasi die Anzahl der St¨ utzstellen. Und wieder betrachten wir den zugeh¨ origen Spline. Ist er n¨ aher an der f¨ ur uns unbekannten Funktion dran? Wir halbieren vielleicht noch ein weiteres Mal und betrachten den zugeh¨ origen Spline. Und das geht immer weiter, immer h verkleinern und den zugeh¨ origen Spline betrachten. So erzeugen wir im Prinzip eine unendliche Folge von Splines. Dann macht es Sinn zu fragen, ob diese unendliche Folge sich der vorgegebenen Funktion n¨ ahert. Diese kennen wir aber normalerweise nicht; sonst w¨ urden wir ja nicht interpolieren. Jetzt kommt das Unglaubliche. Obwohl wir die Funktion f nicht kennen, k¨ onnen wir doch angeben, wie genau sich die interpolierenden Splines ihr n¨ ahern. Fast mag man das nicht glauben. Aber der folgende Satz sagt uns genau das. Wenn wir den Abstand der St¨ utzstellen immer weiter verfeinern und jedesmal den zugeh¨ origen Spline berechnen, so erhalten wir eine Folge von solchen Splines, und diese Folge n¨ ahert sich unter recht schwachen Voraussetzungen dieser unbekannte Funktion f . Von der Funktion f wird dabei lediglich zweimalige stetige Differenzierbarkeit vorausgesetzt. ¨ F¨ ur die ganze Uberlegung betrachten wir ein fest vorgegebenes Intervall [a, b]. Dort sei die unbekannte Funktion erkl¨ art, und in diesem m¨ ogen alle St¨ utzstellen liegen, auch wenn wir verfeinern und verfeinern. Satz 11.4 F¨ ur die St¨ utzstellen (11.3) sei h := max |xi+1 − xi |. 0≤i